Оглавление Задача 1..................................................................................................................... 3 Задача 2..................................................................................................................... 8 Задача 3................................................................................................................... 17 Задача 4................................................................................................................... 21 Задача 1. По территориям региона приводятся данные за 199X г. (см. таблицу своего варианта). Требуется: 1. Построить линейное уравнение парной регрессии y от x . 2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации. 3. Оценить статистическую значимость параметров регрессии и корреляции с помощью F -критерия Фишера и t -критерия Стьюдента. 4. Выполнить прогноз заработной платы y при прогнозном значении среднедушевого прожиточного минимума x , составляющем 107% от среднего уровня. 5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал. 6. На одном графике построить исходные данные и теоретическую прямую. Номер региона 1 2 3 4 5 6 7 8 9 10 11 12 Среднедушевой прожиточный минимум в день одного трудоспособного, руб., x 75 78 81 93 86 77 83 94 88 99 80 112 Среднедневная заработная плата, руб., y 133 125 129 153 140 135 141 152 133 156 124 156 3 1. Для расчета параметров уравнения линейной регрессии строим расчетную таблицу D.2. Таблица D.2 1 2 3 4 5 6 7 8 9 10 11 12 Итого Среднее значение 2 x y yx x2 y2 yˆ x y yˆ x Ai 75 78 81 93 86 77 83 94 88 99 80 112 1046 133 125 129 153 140 135 141 152 133 156 124 156 1677 9975 9750 10449 14229 12040 10395 11703 14288 11704 15444 9920 17472 147369 5625 6084 6561 8649 7396 5929 6889 8836 7744 9801 6400 12544 92458 17689 15625 16641 23409 19600 18225 19881 23104 17689 24336 15376 24336 235911 128,45 131,24 134,02 145,17 138,67 130,31 135,88 146,1 140,52 150,74 133,09 162,82 1677 4,55 -6,24 -5,02 7,83 1,33 4,69 5,12 5,9 -7,52 5,26 -9,09 -6,82 0 12,0 2,7 17,2 2,6 1,9 10,8 0,0 0,0 5,3 3,1 7,5 5,8 68,9 87,17 139,75 12280,75 7704,83 19659,25 – – 5,7 10,34 106,81 11,37 129,19 – – – – – – – – – – – – b yx yx x2 x 2 12280,75 87,17 139,75 0,929 ; 7704,83 87,17 2 a y b x 139,75 0,929 87,17 58,78 . Получено уравнение регрессии: y 58,78 0,929 x . С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,93 руб. 2. Тесноту линейной связи оценит коэффициент корреляции: rxy b x 10,335 0,93 0,845 ; y 11,366 rxy2 0,71 . Это означает, что 71% вариации заработной платы ( y ) объясняется вариацией фактора x – среднедушевого прожиточного минимума. Качество модели определяет средняя ошибка аппроксимации: 4 A 1 0,5 A i 12 4,17% . n Качество построенной модели оценивается как хорошее, так как A не превышает 8-10%. 3. Оценку значимости уравнения регрессии в целом проведем с помощью F -критерия Фишера. Фактическое значение F -критерия: Fфакт rxy2 1 rxy2 n 2 0,71 10 24,88 . 1 0,71 Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1 1 и k2 12 2 10 составляет Fтабл 4,96 . Так как Fфакт 10,41 Fтабл 4,96 , то уравнение регрессии признается статистически значимым. Оценку статистической значимости параметров регрессии проведем с помощью t -статистики Стьюдента и путем расчета доверительного интервала каждого из показателей. Табличное значение t -критерия для числа степеней свободы df n 2 12 2 10 и 0,05 составит tтабл 2, 23 . Определим случайные ошибки ma , mb , mrxy : ma Sост mb mrxy x 2 n x Sост x n 1 rxy2 n2 6,67 92458 16,35 ; 12 10,335 6, 67 0,19; 10,335 12 1 0,845 0,124 . 12 2 Тогда 5 ta a 58,78 3,6 ; ma 16,35 tb b 0, 93 4, 99; mb 0,19 trxy rxy mrxy 0,845 6,79 . 0,124 Фактические значения t -статистики превосходят табличное значение: ta 3, 6 tтабл 2,3; tb 4,99 tтабл 2,3; trxy 6, 79 tтабл 2,3, поэтому параметры a , b и rxy не случайно отличаются от нуля, а статистически значимы. Рассчитаем доверительные интервалы для параметров регрессии a и (b tкрит mb ; b tкрит mb ) 0,93 2, 228 0,19; 0,514;1,344 0,93 2, 228 0,19 С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале. a t крит ma ; a tкрит ma 58, 784 2, 228 16,35; 22,366;95, 201 58, 784 2, 228 16,35 Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью p 1 0,95 параметры a и b , находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля. 4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит: x p x 1,07 86,17 1,07 93,27 руб., тогда 6 прогнозное значение заработной платы составит: y p 58,78 0,929 93,27 145,42 руб. 5. Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит: 2 1 xp x 1 87,17 93,27 1 2,228 6,667 1 15,67 n x x 2 12 12 1281,672 2 yˆ p Sост tкрит . Доверительный интервал прогноза: yˆ p yˆ p yˆ p 145,42 15,67; yˆ p 145,43 15,67 129,75 руб.; min yˆ p 145,43 15,67 161,08 руб. max Выполненный прогноз среднемесячной заработной платы является надежным ( p 1 1 0,05 0,95 ) и находится в пределах от 129,75 руб. до 161,08 руб. 6. В заключение решения задачи построим на одном графике исходные данные и теоретическую прямую (рис. D.1): 180 160 140 120 100 80 60 40 20 0 65 75 85 95 105 115 Рис. D.1. 7 Задача 2 По 20 предприятиям региона изучается зависимость выработки продукции на одного работника y (тыс. руб.) от ввода в действие новых основных фондов x1 ( % от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих x2 ( % ). Номер y x1 x2 1 7 3,8 11 2 7 3,8 3 7 4 Номер y x1 x2 11 10 6,8 21 12 12 11 7,4 23 3,9 16 13 11 7,8 24 7 4,1 17 14 12 7,5 26 5 7 4,6 18 15 12 7,9 28 6 8 4,5 18 16 12 8,1 30 7 8 5,3 19 17 13 8,4 31 8 9 5,5 20 18 13 8,7 32 9 9 6,1 20 19 13 9,5 33 10 10 6,8 21 20 14 9,7 35 предприятия предприятия Требуется: 1. Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат. 2. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их. 3. Найти детерминации. скорректированный Сравнить его с коэффициент множественной нескорректированным (общим) коэффициентом детерминации. 8 4. С помощью F -критерия Фишера оценить статистическую 2 надежность уравнения регрессии и коэффициента детерминации Ryx1x2 . 5. С помощью частных Фишера F -критериев оценить целесообразность включения в уравнение множественной регрессии фактора x1 после x2 и фактора x2 после x1 . 6. Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор. Решение Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу: № y x1 x2 yx1 yx2 x1 x2 x12 x22 y2 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Сумма Ср. знач. 2 7 7 7 7 7 8 8 9 9 10 10 11 11 12 12 12 13 13 13 14 200 3 3,8 3,8 3,9 4,1 4,6 4,5 5,3 5,5 6,1 6,8 6,8 7,4 7,8 7,5 7,9 8,1 8,4 8,7 9,5 9,7 130,2 4 11 12 16 17 18 18 19 20 20 21 21 23 24 26 28 30 31 32 33 35 455 5 26,6 26,6 27,3 28,7 32,2 36 42,4 49,5 54,9 68 68 81,4 85,8 90 94,8 97,2 109,2 113,1 123,5 135,8 1391 6 77 84 112 119 126 144 152 180 180 210 210 253 264 312 336 360 403 416 429 490 4857 7 41,8 45,6 62,4 69,7 82,8 81 100,7 110 122 142,8 142,8 170,2 187,2 195 221,2 243 260,4 278,4 313,5 339,5 3210 8 14,44 14,44 15,21 16,81 21,16 20,25 28,09 30,25 37,21 46,24 46,24 54,76 60,84 56,25 62,41 65,61 70,56 75,69 90,25 94,09 920,8 9 121 144 256 289 324 324 361 400 400 441 441 529 576 676 784 900 961 1024 1089 1225 11265 10 49 49 49 49 49 64 64 81 81 100 100 121 121 144 144 144 169 169 169 196 2112 10 6,51 22,75 69,55 242,85 160,5 46,04 563,25 105,6 Найдем средние квадратические отклонения признаков: 9 y y 2 y 2 105,6 102 2,366 ; x1 x12 x12 46,04 6,512 1,913 ; x2 x22 x22 563,25 22,752 6,759 . 1. Вычисление параметров линейного уравнения множественной регрессии. Для нахождения параметров линейного уравнения множественной регрессии y a b1 x1 b2 x2 необходимо решить следующую систему линейных уравнений относительно неизвестных параметров a , b1 , b2 : na b1 x1 b2 x2 y; 2 a x1 b1 x1 b2 x1 x2 yx1 ; 2 a x2 b1 x1 x2 b2 x2 yx2 либо воспользоваться готовыми формулами: y ryx1 ryx2 rx1x2 ; b1 x1 1 rx21x2 y ryx2 ryx1 rx1x2 ; b2 x2 1 rx21x2 a y b1 x1 b2 x2 . Рассчитаем сначала парные коэффициенты корреляции: ryx1 cov y, x1 y x1 69,55 6,51 10 0,983 ; 1,91 2,37 10 ryx2 rx1x2 cov y, x2 y x2 242,85 22,75 10 0,96 ; 6,76 2,37 cov x1 , x2 160,5 22,75 6,51 0,959 . x1 x2 6,76 1,91 Находим b1 2,366 0,983 0,96 0,959 0,96 ; 1,913 1 0,9592 b2 2,366 0,96 0,983 0,959 0,075 ; 6,759 1 0,9592 a 10 0,96 6,51 0,075 22,75 2,03 . Таким образом, получили следующее уравнение множественной регрессии: y 2,03 0,96 х1 0,0748 х2 . Коэффициенты 1 и 2 стандартизованного уравнения регрессии t y 1t x1 2t x2 , находятся по формулам: 1 b1 x1 1,913 0,96 0,778 ; y 2,366 2 b2 x2 6,759 0,075 0,214 . y 2,366 Т.е. уравнение будет выглядеть следующим образом: t y 0,778 t x1 0, 214 t x2 . 11 Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что ввод в действие новых основных фондов оказывает большее влияние на выработку продукции, чем удельный вес рабочих высокой квалификации. Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности: Эi bi xi . y xi Вычисляем: Э1 0,96 6,51 22,75 0,63 ; Э2 0,075 0,17 . 10 10 Т.е. увеличение только основных фондов (от своего среднего значения) или только удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,63% или 0,17% соответственно. Таким образом, подтверждается большее влияние на результат y фактора x1 , чем фактора x2 . 2. Коэффициенты парной корреляции мы уже нашли: ryx1 0,983 ; ryx2 0,96 ; rx1x2 0,959 . Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы x1 и x2 явно коллинеарны, т.к. rx1x2 0,959 0,7 ). При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения. Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии. 12 При двух факторах частные коэффициенты корреляции рассчитываются следующим образом: ryx1x2 ryx2 x1 ryx1 ryx2 rx1x2 1 r 1 r 2 yx2 1 r 1 r 2 yx1 2 x1x2 1 0,96 1 0,959 2 2 x1x2 ryx2 ryx1 rx1x2 0,983 0,96 0,959 0,787 ; 2 0,96 0,983 0,959 1 0,983 1 0,959 2 0,33 . 2 Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи. Коэффициент множественной корреляции определить через матрицу парных коэффициентов корреляции: Ryx1x2 1 r , r11 где 1 ryx1 ryx2 r ryx1 1 rx1x2 rx2 x1 1 ryx2 – определитель матрицы парных коэффициентов корреляции; r11 1 rx1x2 rx2 x1 1 13 – определитель матрицы межфакторной корреляции. 1 0,983 0,96 r 0,983 1 0,959 0,00243 ; 0,96 0,959 1 r11 1 0,959 0,959 1 0,0808 . Коэффициент множественной корреляции Ryx1x2 1 0,00243 0,985 . 0,0808 Аналогичный результат получим при использовании других формул: Ryx1x2 2 ост 0,305 1 2 1 0,985 ; y 5,74 Ryx1x2 r i yxi 0,983 0,778 0,214 0,96 0,985 ; . 1 1 0,983 1 0,33 0,985 Ryx1x2 ... xm 1 1 ryx2 1 1 ryx2 2 x1 2 2 Коэффициент множественной корреляции показывает на весьма сильную связь всего набора факторов с результатом. 3. Нескорректированный коэффициент множественной детерминации Ryx1x2 0,97 оценивает долю вариации результата за счет 2 представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 97% и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом. Скорректированный коэффициент множественной детерминации 14 R 1 1 R 2 2 n 1 n m 1 1 1 0,97 20 1 0,966 20 2 1 определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более 94% ) детерминированность результата y в модели факторами x1 и x2 . 4. Оценку надежности уравнения регрессии в целом и показателя тесноты связи Ryx1x2 дает F -критерий Фишера: R2 n m 1 . F 1 R2 m В нашем случае фактическое значение F -критерия Фишера: Fфакт 0,97 2 20 2 1 273,89 . 2 1 0,97 2 Получили, что Fфакт Fтабл 3,49 (при n 20 ), т.е. вероятность случайно получить такое значение F -критерия не превышает допустимый уровень значимости 5% . Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя 2 тесноты связи Ryx1x2 . 15 5. С помощью частных F -критериев Фишера оценим целесообразность включения в уравнение множественной регрессии фактора x1 после x2 и фактора x2 после x1 при помощи формул: Fчаст, x1 Fчаст, x2 2 Ryx2 1x2 Ryx2 2 n m 1 1 Ryx2 1 m ; Ryx2 1x2 Ryx2 1 n m 1 1 Ryx2 2 m . 2 Найдем Ryx1 и Ryx2 . Ryx2 1 ryx21 0,9832 0,966 Ryx2 2 ryx2 2 0,962 0,922 ; . Имеем Fчаст, x1 0,97 0,922 20 2 1 12 ; 1 0,966 2 Fчаст, x2 0,97 0,966 20 2 1 0, 436 . 1 0,922 2 Получили, что Fчаст, x2 Fтабл 3, 49 . Следовательно, включение в модель фактора x2 после того, как в модель включен фактор x1 статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака x2 оказывается незначительным, несущественным; фактор x2 включать в уравнение после фактора x1 не следует. Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения x1 после x2 , то результат расчета частного 16 F -критерия для x1 будет иным. Fчаст, x1 Fтабл 3, 49 , т.е. вероятность его случайного формирования меньше принятого стандарта 0,05 5% . Следовательно, значение частного F -критерия для дополнительно включенного фактора x1 не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора x1 является существенным. Фактор x1 должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора x2 . 6. Общий вывод состоит в том, что множественная модель с факторами x1 и x2 с Ryx1x2 0,97 содержит неинформативный фактор x2 . 2 Если исключить фактор x2 , то можно ограничиться уравнением парной регрессии: yˆ x 0 1 x 2,085 1, 216 x , ryx2 0,983. Задача 3 Даны системы эконометрических уравнений. Требуется 1. Применив необходимое и достаточное условие идентификации, определите, идентифицируемо ли каждое из уравнений модели. 2. Определите метод оценки параметров модели. 3. Запишите в общем виде приведенную форму модели. Макроэкономическая модель: Ct a1 b11 Dt 1 , I a b Y b Y , t 2 22 t 23 t 1 2 Yt Dt Tt , Dt Ct I t Gt , 17 где C – расходы на потребление; Y – чистый национальный продукт; D – чистый национальный доход; I – инвестиции; T – косвенные налоги; G – государственные расходы; t – текущий период; t 1 – предыдущий период. Решение 1.В данном случае мы имеем дело со структурной формой модели. Модель содержит 4 эндогенные переменные предопределенные (экзогенные) переменные Ct , It , Yt , Dt Yt 1 ,Tt , Gt .Проверим и 3 каждое уравнение системы на необходимое условие идентификации. Уравнение №1. Это уравнение включает 2 эндогенные переменные Ct , Dt , т.е. G = 2 и 0 предопределенных переменных, т.е. m 0, D 3 0 3 . D G 1, то уравнение сверхидентифицируемо (при выполнении достаточных условий идентификации). Уравнение №2. Это уравнение включает 2 эндогенные переменные It , Yt , т.е. G = 2 и 1 предопределенную переменную Yt 1 , т.е. m 1, D 3 1 2 . D G 1 , то уравнение сверхидентифицируемо (при выполнении достаточных условий идентификации). Уравнение №3. Это уравнение включает 2 эндогенные переменные Yt , Dt , т.е. G = 2 и 1 предопределенную переменную Tt , т.е. m 1, D 3 1 2 . D G 1, то уравнение сверхидентифицируемо (при выполнении достаточных условий идентификации). Уравнение №4. Это уравнение включает 3 эндогенные переменные Ct , It , Dt , т.е. G = 3 и 1 предопределенную переменную Gt , т.е. m 1, D 3 1 2 . 18 D G 1, то уравнение точно идентифицируемо (при выполнении достаточных условий идентификации). Матрица коэффициентов при переменных модели. Уравнение №1 Уравнение №2 Уравнение №3 Уравнение №4 Ct -1 0 0 1 It 0 -1 0 1 Yt 0 b22 -1 0 Dt b11 0 1 -1 Yt-1 0 b23 0 0 Tt 0 0 1 0 Gt 0 0 0 1 Достаточное условие идентификации. Уравнение №1. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид: -1 b22 b23 0 -1 0 1 0 0 Ее ранг равен 2, следовательно, detA ≠ 0. Достаточное условие идентификации 0 1 0 для 0 0 1 уравнения №1 не выполняется. Уравнение №2. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид: 1 b11 0 0 0 1 1 1 0 1 0 1 Ее ранг равен 3, следовательно, detA ≠ 0. Достаточное условие идентификации для уравнения №2 выполняется. Уравнение №3. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид: 19 1 0 0 1 1 b23 0 1 0 1 0 0 Ее ранг равен 2, следовательно, detA ≠ 0. Достаточное условие идентификации для уравнения №3 не выполняется. Уравнение №4. Матрица коэффициентов при переменных, не входящих в уравнение, имеет вид: 0 0 0 b22 b23 1 0 0 1 В матрице B 1-ая строка нулевая, следовательно, вычеркиваем ее. Это равносильно вычеркиванию 1-го уравнения системы. 11 12 0 1 0 0 Ее ранг равен 2, следовательно, detA ≠ 0. Достаточное условие идентификации для уравнения №4 не выполняется. Поскольку система в целом неидентифицируема, для оценки ее параметров целесообразно применять двухшаговый МНК. Приведенная форма модели – это система линейных функций эндогенных переменных от предопределенных. Ct A1 11Tt 12 Kt 1 u1 , I A T K u , t 2 21 t 22 t 1 2 Yt A3 31Tt 32 Kt 1 u3 , Yt A4 41Tt 42 Kt 1 u4 20 Задача 4 Имеются условные данные об объемах потребления электроэнергии yt жителями региона за 16 кварталов. Требуется: Построить автокорреляционную функцию и сделать вывод о 1. наличии сезонных колебаний. Построить аддитивную модель временного ряда (для нечетных 2. вариантов) или мультипликативную модель временного ряда (для четных вариантов). Сделать прогноз на 2 квартала вперед. 3. Решение t yt t yt 1 2 3 4 5 6 7 8 5,5 4,8 5,1 9,0 7,1 4,9 6,1 10,0 9 10 11 12 13 14 15 16 8,3 5,4 6,4 10,9 9,0 6,6 7,5 11,2 Решение 1. Построим поле корреляции: 12 10 8 6 4 2 0 0 5 10 15 20 21 Рассчитаем несколько последовательных коэффициентов автокорреляции. Формула для расчета коэффициента автокорреляции первого порядка: n r1 y t 2 n t y1 yt 1 y2 yt y1 t 2 2 , где n y t 2 t 1 y2 2 y1 1 n yt , n 1 t 2 y2 1 n yt 1. n 1 t 2 Составим вспомогательную таблицу Следует заметить, что среднее значение получается путем деления не на 16, а на 15, т.к. у нас теперь на одно наблюдение меньше. Теперь вычисляем коэффициент автокорреляции первого порядка: r1 11, 421333 0, 29533 65, 22859375 52,98933333 Коэффициент автокорреляции второго порядка определяется по формуле: 22 n r2 y t 3 n t y3 yt 2 y4 yt y3 t 3 Составляем 2 n y t 2 t 3 новую y4 2 1 n , где y3 yt , n 2 t 3 расчетную таблицу и 1 n y4 yt 2 . n 2 t 3 вычисляем коэффициент автокорреляции второго порядка: r2 29,50642857 0,53649 57, 26357143 52,82357143 Аналогично находим коэффициенты автокорреляции более высоких порядков, а все полученные значения заносим в сводную таблицу. Лаг 1 2 3 4 5 6 Коэффициент автокорреляции 0,29533 -0,53649 0,14271 0,977197 0,140488 -0,68234 23 Анализ автокорреляционной функции и графика исходных уровней временного ряда позволяет сделать вывод о наличии в изучаемом временном ряде сезонных колебаний периодичностью в четыре квартала (наиболее значительным оказался коэффициент автокорреляции 4-го порядка). 2. Аддитивная модель имеет вид 𝑌 = 𝑇 + 𝑆 + 𝐸. Каждый уровень временного ряда формируется из трендовой (𝑇), циклической (𝑆) и случайной (𝐸) компонент. Построение аддитивной модели сводится к расчету значений 𝑇, 𝑆 и 𝐸 для каждого уровня ряда. Построение модели включает следующие шаги: 1) Выравнивание исходного ряда методом скользящей средней; 2) Расчет значений сезонной компоненты 𝑆; 3) Устранение сезонной компоненты из исходных уровней ряда и получение выровненных данных в аддитивной (𝑇 + 𝐸) модели; 4) Аналитическое выравнивание уровней (𝑇 + 𝐸) и расчет значений 𝑇 с использованием полученного уравнения тренда; 5) Расчет полученных по модели значений (𝑇 + 𝑆); 6) Расчет абсолютных и/или относительных ошибок. Шаг 1. Проведем выравнивание исходного ряда методом скользящей средней. Для этого: 1.1. Просуммируем уровни ряда последовательно за каждые четыре квартала со сдвигом на один момент времени и определим условные годовые объемы потребления электроэнергии. 1.2. Разделив полученные суммы на 4, найдем скользящие средние. Полученные таким образом выровненные значения уже не содержат сезонной компоненты. 1.3. Приведем эти значения в соответствие с фактическими моментами времени, для чего найдем средние значения из двух 24 последовательных скользящих средних – центрированные скользящие средние. Шаг 2. Найдем оценки сезонной компоненты как разность между фактическими уровнями ряда и центрированными скользящими средними. Используем эти оценки для расчета значений сезонной компоненты 𝑆𝑖 . Для этого найдем средние за каждый квартал (по всем годам) оценки сезонной компоненты 𝑆𝑖 . В моделях с сезонной компонентой обычно предполагается, что сезонные воздействия за период взаимопогашаются. В аддитивной модели это выражается в том, что сумма значений сезонной компоненты по всем кварталам должна быть равна нулю. Для данной модели имеем: 0,633 -2,06 -1,238 + 2,642 = 0,931 Корректирующий коэффициент: k 0,931/ 4 0, 233 25 Рассчитываем скорректированные значения сезонной компоненты 𝑆𝑖 = 𝑆𝑖̅ − 𝑘 и заносим полученные данные в таблицу. Шаг 3. Исключим влияние сезонной компоненты, вычитая ее значение из каждого уровня исходного временного ряда. Получим величины 𝑇 + 𝐸 = 𝑌 − 𝑆. Эти значения рассчитываются за каждый момент времени и содержат только тенденцию и случайную компоненту. Исключим влияние сезонной компоненты, вычитая ее значение из каждого уровня исходного временного ряда. Получим величины T + E = Y - S (гр. 4 табл.). Эти значения рассчитываются за каждый момент времени и содержат только тенденцию и случайную компоненту. Находим параметры уравнения методом наименьших квадратов. Система уравнений МНК: a0 n a1 t y 2 a0 t a1 t yt Для наших данных система уравнений имеет вид: 16a0 136a1 117,8 136a0 1496a1 1073, 21 Из первого уравнения выражаем а0 и подставим во второе уравнение Получаем a1 0, 21; a0 5,56 Среднее значения: 26 y y t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 136 i n 117,8 7,36 16 y 5,1 6,14 6,57 6,59 6,7 6,24 7,57 7,59 7,9 6,74 7,87 8,49 8,6 7,94 8,97 8,79 117,8 t2 y2 ty ŷ yi y 1 4 9 16 25 36 49 64 81 100 121 144 169 196 225 256 1496 26 37,69 43,17 43,44 44,88 38,93 57,31 57,63 62,4 45,41 61,94 72,1 73,95 63,03 80,47 77,28 885,64 5,1 12,28 19,71 26,36 33,5 37,43 52,99 60,73 71,1 67,39 86,57 101,89 111,79 111,15 134,55 140,66 1073,21 5,78 5,99 6,2 6,41 6,62 6,83 7,05 7,26 7,47 7,68 7,89 8,1 8,31 8,53 8,74 8,95 117,8 5,12 1,5 0,63 0,59 0,44 1,26 0,0432 0,0523 0,29 0,39 0,26 1,27 1,53 0,33 2,59 2,04 18,34 2 y yˆ 2 0,46 0,0229 0,14 0,0326 0,00597 0,35 0,28 0,11 0,19 0,88 0,000439 0,15 0,0813 0,34 0,0543 0,0249 3,13 Определим компоненту T данной модели. Для этого проведем аналитическое выравнивание ряда (T + E) с помощью линейного тренда. Результаты аналитического выравнивания следующие: T 5,565 0, 212t Подставляя в это уравнение значения t = 1,...,16, найдем уровни T для каждого момента времени (гр. 5 табл.). t 1 2 3 4 5 6 7 8 9 10 yt 5,5 4,8 5,1 9 7,1 4,9 6,1 10 8,3 5,4 Si 0,4 -1,34 -1,47 2,41 0,4 -1,34 -1,47 2,41 0,4 -1,34 yt – Si 5,1 6,14 6,57 6,59 6,7 6,24 7,57 7,59 7,9 6,74 T 5,78 5,99 6,2 6,41 6,62 6,83 7,05 7,26 7,47 7,68 T + Si 6,18 4,65 4,73 8,82 7,02 5,49 5,57 9,67 7,87 6,34 E = yt – (T + Si) -0,68 0,15 0,37 0,18 0,0773 -0,59 0,53 0,33 0,43 -0,94 E2 0,46 0,0229 0,14 0,0326 0,00597 0,35 0,28 0,11 0,19 0,88 27 t 11 12 13 14 15 16 yt 6,4 10,9 9 6,6 7,5 11,2 yt – Si 7,87 8,49 8,6 7,94 8,97 8,79 Si -1,47 2,41 0,4 -1,34 -1,47 2,41 T 7,89 8,1 8,31 8,53 8,74 8,95 T + Si 6,42 10,51 8,71 7,19 7,27 11,36 E = yt – (T + Si) -0,021 0,39 0,29 -0,59 0,23 -0,16 E2 0,000439 0,15 0,0813 0,34 0,0543 0,0249 3,13 Найдем значения уровней ряда, полученные по аддитивной модели. Для этого прибавим к уровням T значения сезонной компоненты для соответствующих кварталов (гр. 6 табл.). Для оценки качества построенной модели применим сумму квадратов полученных абсолютных ошибок. t y 1 5,5 2 4,8 3 5,1 4 9 5 7,1 6 4,9 7 6,1 8 10 9 8,3 10 5,4 11 6,4 12 10,9 13 9 14 6,6 15 7,5 16 11,2 136 117,8 Коэффициент детерминации: R2 1 E y t 2 y 2 1 yi y 2 3,47 6,57 5,12 2,68 0,0689 6,06 1,59 6,96 0,88 3,85 0,93 12,51 2,68 0,58 0,0189 14,73 68,698 3,125 0,95 68, 698 Следовательно, можно сказать, что аддитивная модель объясняет 95% общей вариации уровней временного ряда. Проверка адекватности модели данным наблюдения. 28 F R2 n m 1 0,952 16 1 1 293,75 1 R2 m 1 0,952 1 где m – количество факторов в уравнении тренда (m=1). Fkp 4, 6 Поскольку F Fkp , то уравнение статистически значимо. Прогнозирование по аддитивной модели. Прогнозное значение Ft уровня временного ряда в аддитивной модели есть сумма трендовой и сезонной компонент. Для определения трендовой компоненты воспользуемся уравнением тренда: T = 5,565 + 0,212t Прогноз на 1 период: T17 = 5,565 + 0,212∙17 = 9.16 Значение сезонного компонента за соответствующий период равно: S1 = 0.401. Таким образом, F17 = T17 + S1 = 9.16 + 0.401 = 9.561. Прогноз на 2 период: T18 = 5,565 + 0,212∙18 = 9,372 Значение сезонного компонента за соответствующий период равно: S2 = -1,339. Таким образом, F18 = T18 + S2 = 9,372 -1,339 = 8,033 29