Загрузил Ольга Яковская

Задачи по эконометрике

реклама
Оглавление
Задача 1..................................................................................................................... 3
Задача 2..................................................................................................................... 8
Задача 3................................................................................................................... 17
Задача 4................................................................................................................... 21
Задача 1.
По территориям региона приводятся данные за 199X г. (см. таблицу
своего варианта).
Требуется:
1.
Построить линейное уравнение парной регрессии y от x .
2.
Рассчитать
линейный
коэффициент парной
корреляции
и
среднюю ошибку аппроксимации.
3.
Оценить статистическую значимость параметров регрессии и
корреляции с помощью F -критерия Фишера и t -критерия Стьюдента.
4.
Выполнить прогноз заработной платы
y при прогнозном
значении среднедушевого прожиточного минимума x , составляющем 107%
от среднего уровня.
5.
Оценить точность прогноза, рассчитав ошибку прогноза и его
доверительный интервал.
6.
На одном графике построить исходные данные и теоретическую
прямую.
Номер
региона
1
2
3
4
5
6
7
8
9
10
11
12
Среднедушевой прожиточный
минимум в день одного
трудоспособного, руб., x
75
78
81
93
86
77
83
94
88
99
80
112
Среднедневная заработная
плата, руб., y
133
125
129
153
140
135
141
152
133
156
124
156
3
1.
Для расчета параметров уравнения линейной регрессии строим
расчетную таблицу D.2.
Таблица D.2
1
2
3
4
5
6
7
8
9
10
11
12
Итого
Среднее
значение

2
x
y
yx
x2
y2
yˆ x
y  yˆ x
Ai
75
78
81
93
86
77
83
94
88
99
80
112
1046
133
125
129
153
140
135
141
152
133
156
124
156
1677
9975
9750
10449
14229
12040
10395
11703
14288
11704
15444
9920
17472
147369
5625
6084
6561
8649
7396
5929
6889
8836
7744
9801
6400
12544
92458
17689
15625
16641
23409
19600
18225
19881
23104
17689
24336
15376
24336
235911
128,45
131,24
134,02
145,17
138,67
130,31
135,88
146,1
140,52
150,74
133,09
162,82
1677
4,55
-6,24
-5,02
7,83
1,33
4,69
5,12
5,9
-7,52
5,26
-9,09
-6,82
0
12,0
2,7
17,2
2,6
1,9
10,8
0,0
0,0
5,3
3,1
7,5
5,8
68,9
87,17
139,75
12280,75
7704,83
19659,25
–
–
5,7
10,34
106,81
11,37
129,19
–
–
–
–
–
–
–
–
–
–
–
–
b
yx yx
x2  x 2

12280,75  87,17  139,75
 0,929 ;
7704,83  87,17 2
a  y  b  x  139,75  0,929  87,17  58,78 .
Получено уравнение регрессии:
y  58,78  0,929  x .
С увеличением среднедушевого прожиточного минимума на 1 руб.
среднедневная заработная плата возрастает в среднем на 0,93 руб.
2.
Тесноту линейной связи оценит коэффициент корреляции:
rxy  b 
x
10,335
 0,93 
 0,845 ;
y
11,366
rxy2  0,71 .
Это означает, что 71% вариации заработной платы ( y ) объясняется
вариацией фактора x – среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
4
A
1
0,5
A

 i 12  4,17% .
n
Качество построенной модели оценивается как хорошее, так как A не
превышает 8-10%.
3.
Оценку значимости уравнения регрессии в целом проведем с
помощью F -критерия Фишера. Фактическое значение F -критерия:
Fфакт 
rxy2
1  rxy2
  n  2 
0,71
10  24,88 .
1  0,71
Табличное значение критерия при пятипроцентном уровне значимости
и степенях свободы k1  1 и k2  12  2  10 составляет Fтабл  4,96 . Так
как
Fфакт  10,41  Fтабл  4,96 , то уравнение регрессии признается
статистически значимым.
Оценку статистической значимости параметров регрессии проведем с
помощью
t -статистики Стьюдента и путем расчета доверительного
интервала каждого из показателей.
Табличное
значение
t -критерия для числа степеней свободы
df  n  2  12  2  10 и   0,05 составит tтабл  2, 23 .
Определим случайные ошибки ma , mb , mrxy :
ma  Sост 
mb 
mrxy 
x
2
n  x
Sост
x  n
1  rxy2
n2


 6,67 
92458
 16,35 ;
12 10,335
6, 67
 0,19;
10,335  12
1  0,845
 0,124 .
12  2
Тогда
5
ta 
a 58,78

 3,6 ;
ma 16,35
tb 
b
0, 93

 4, 99;
mb 0,19
trxy 
rxy
mrxy

0,845
 6,79 .
0,124
Фактические значения t -статистики превосходят табличное значение:
ta  3, 6  tтабл  2,3; tb  4,99  tтабл  2,3;
trxy  6, 79  tтабл  2,3,
поэтому параметры a , b и rxy не случайно отличаются от нуля, а
статистически значимы.
Рассчитаем доверительные интервалы для параметров регрессии a и
(b  tкрит mb ; b  tкрит mb )
 0,93  2, 228  0,19;
 0,514;1,344 
0,93  2, 228  0,19 
С вероятностью 95% можно утверждать, что значение данного
параметра будут лежать в найденном интервале.
a  t
крит
ma ; a  tкрит ma 
 58, 784  2, 228 16,35;
 22,366;95, 201
58, 784  2, 228 16,35 
Анализ верхней и нижней границ доверительных интервалов приводит
к выводу о том, что с вероятностью p  1    0,95 параметры a и b ,
находясь в указанных границах, не принимают нулевых значений, т.е. не
являются статистически незначимыми и существенно отличны от нуля.
4.
Полученные
оценки
уравнения
регрессии
позволяют
использовать его для прогноза. Если прогнозное значение прожиточного
минимума
составит:
x p  x 1,07  86,17 1,07  93,27
руб.,
тогда
6
прогнозное
значение
заработной
платы
составит:
y p  58,78  0,929  93,27  145,42 руб.
5.
Предельная ошибка прогноза, которая в 95% случаев не будет
превышена, составит:
2
1  xp  x 
1  87,17  93,27 
1 
 2,228  6,667  1  
 15,67
n   x  x 2
12
12 1281,672
2
 yˆ p  Sост  tкрит
.
Доверительный интервал прогноза:
 yˆ p  yˆ p   yˆ p  145,42  15,67;
 yˆ p
 145,43  15,67  129,75 руб.;
min
 yˆ p
 145,43  15,67  161,08 руб.
max
Выполненный прогноз среднемесячной заработной платы является
надежным ( p  1    1  0,05  0,95 ) и находится в пределах от 129,75
руб. до 161,08 руб.
6.
В заключение решения задачи построим на одном графике
исходные данные и теоретическую прямую (рис. D.1):
180
160
140
120
100
80
60
40
20
0
65
75
85
95
105
115
Рис. D.1.
7
Задача 2
По 20 предприятиям региона изучается зависимость выработки
продукции на одного работника y (тыс. руб.) от ввода в действие новых
основных фондов x1 ( % от стоимости фондов на конец года) и от удельного
веса рабочих высокой квалификации в общей численности рабочих x2 ( % ).
Номер
y
x1
x2
1
7
3,8
11
2
7
3,8
3
7
4
Номер
y
x1
x2
11
10
6,8
21
12
12
11
7,4
23
3,9
16
13
11
7,8
24
7
4,1
17
14
12
7,5
26
5
7
4,6
18
15
12
7,9
28
6
8
4,5
18
16
12
8,1
30
7
8
5,3
19
17
13
8,4
31
8
9
5,5
20
18
13
8,7
32
9
9
6,1
20
19
13
9,5
33
10
10
6,8
21
20
14
9,7
35
предприятия
предприятия
Требуется:
1.
Построить линейную модель множественной регрессии. Записать
стандартизованное
уравнение
множественной
регрессии.
На
основе
стандартизованных коэффициентов регрессии и средних коэффициентов
эластичности ранжировать факторы по степени их влияния на результат.
2.
Найти
коэффициенты
парной,
частной
и
множественной
корреляции. Проанализировать их.
3.
Найти
детерминации.
скорректированный
Сравнить
его
с
коэффициент
множественной
нескорректированным
(общим)
коэффициентом детерминации.
8
4.
С помощью
F -критерия Фишера оценить статистическую
2
надежность уравнения регрессии и коэффициента детерминации Ryx1x2 .
5.
С
помощью
частных
Фишера
F -критериев
оценить
целесообразность включения в уравнение множественной регрессии фактора
x1 после x2 и фактора x2 после x1 .
6.
Составить уравнение линейной парной регрессии, оставив лишь
один значащий фактор.
Решение
Для
удобства
проведения
расчетов
поместим
результаты
промежуточных расчетов в таблицу:
№
y
x1
x2
yx1
yx2
x1 x2
x12
x22
y2
1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Сумма
Ср.
знач.
2
7
7
7
7
7
8
8
9
9
10
10
11
11
12
12
12
13
13
13
14
200
3
3,8
3,8
3,9
4,1
4,6
4,5
5,3
5,5
6,1
6,8
6,8
7,4
7,8
7,5
7,9
8,1
8,4
8,7
9,5
9,7
130,2
4
11
12
16
17
18
18
19
20
20
21
21
23
24
26
28
30
31
32
33
35
455
5
26,6
26,6
27,3
28,7
32,2
36
42,4
49,5
54,9
68
68
81,4
85,8
90
94,8
97,2
109,2
113,1
123,5
135,8
1391
6
77
84
112
119
126
144
152
180
180
210
210
253
264
312
336
360
403
416
429
490
4857
7
41,8
45,6
62,4
69,7
82,8
81
100,7
110
122
142,8
142,8
170,2
187,2
195
221,2
243
260,4
278,4
313,5
339,5
3210
8
14,44
14,44
15,21
16,81
21,16
20,25
28,09
30,25
37,21
46,24
46,24
54,76
60,84
56,25
62,41
65,61
70,56
75,69
90,25
94,09
920,8
9
121
144
256
289
324
324
361
400
400
441
441
529
576
676
784
900
961
1024
1089
1225
11265
10
49
49
49
49
49
64
64
81
81
100
100
121
121
144
144
144
169
169
169
196
2112
10
6,51
22,75
69,55
242,85
160,5
46,04
563,25
105,6
Найдем средние квадратические отклонения признаков:
9
 y  y 2  y 2  105,6  102  2,366 ;
 x1  x12  x12  46,04  6,512  1,913 ;
 x2  x22  x22  563,25  22,752  6,759 .
1.
Вычисление параметров линейного уравнения множественной
регрессии.
Для нахождения параметров линейного уравнения множественной
регрессии
y  a  b1 x1  b2 x2
необходимо решить следующую систему линейных уравнений относительно
неизвестных параметров a , b1 , b2 :
na  b1  x1  b2  x2   y;

2
a  x1  b1  x1  b2  x1 x2   yx1 ;

2
a  x2  b1  x1 x2  b2  x2   yx2
либо воспользоваться готовыми формулами:
 y ryx1  ryx2 rx1x2
;
b1 

 x1
1  rx21x2
 y ryx2  ryx1 rx1x2
;
b2 

 x2
1  rx21x2
a  y  b1 x1  b2 x2 .
Рассчитаем сначала парные коэффициенты корреляции:
ryx1 
cov  y, x1 
 y   x1

69,55  6,51  10
 0,983 ;
1,91  2,37
10
ryx2 
rx1x2 
cov  y, x2 
 y   x2

242,85  22,75 10
 0,96 ;
6,76  2,37
cov  x1 , x2  160,5  22,75  6,51

 0,959 .
 x1   x2
6,76 1,91
Находим
b1 
2,366 0,983  0,96  0,959

 0,96 ;
1,913
1  0,9592
b2 
2,366 0,96  0,983  0,959

 0,075 ;
6,759
1  0,9592
a  10  0,96  6,51  0,075  22,75  2,03 .
Таким образом, получили следующее уравнение множественной
регрессии:
y  2,03  0,96 х1  0,0748 х2 .
Коэффициенты
1 и  2 стандартизованного уравнения регрессии
t y  1t x1   2t x2   , находятся по формулам:
1  b1
 x1
1,913
 0,96 
 0,778 ;
y
2,366
 2  b2
 x2
6,759
 0,075 
 0,214 .
y
2,366
Т.е. уравнение будет выглядеть следующим образом:
t y  0,778  t x1  0, 214  t x2 .
11
Так
как
стандартизованные
коэффициенты
регрессии
можно
сравнивать между собой, то можно сказать, что ввод в действие новых
основных фондов оказывает большее влияние на выработку продукции, чем
удельный вес рабочих высокой квалификации.
Сравнивать влияние факторов на результат можно также при помощи
средних коэффициентов эластичности:
Эi  bi 
xi .
y xi
Вычисляем:
Э1  0,96 
6,51
22,75
 0,63 ; Э2  0,075 
 0,17 .
10
10
Т.е. увеличение только основных фондов (от своего среднего значения)
или только удельного веса рабочих высокой квалификации на 1%
увеличивает в среднем выработку продукции на 0,63% или 0,17%
соответственно. Таким образом, подтверждается большее влияние на
результат y фактора x1 , чем фактора x2 .
2.
Коэффициенты парной корреляции мы уже нашли:
ryx1  0,983 ;
ryx2  0,96 ;
rx1x2  0,959 .
Они указывают на весьма сильную связь каждого фактора с
результатом, а также высокую межфакторную зависимость (факторы x1 и x2
явно
коллинеарны,
т.к.
rx1x2  0,959  0,7 ).
При
такой
сильной
межфакторной зависимости рекомендуется один из факторов исключить из
рассмотрения.
Частные коэффициенты корреляции характеризуют тесноту связи
между результатом и соответствующим фактором при элиминировании
(устранении влияния) других факторов, включенных в уравнение регрессии.
12
При
двух
факторах
частные
коэффициенты
корреляции
рассчитываются следующим образом:
ryx1x2 
ryx2 x1 
ryx1  ryx2  rx1x2
1  r   1  r 
2
yx2

1  r   1  r 
2
yx1
2
x1x2
1  0,96   1  0,959 
2
2
x1x2
ryx2  ryx1  rx1x2
0,983  0,96  0,959

 0,787 ;
2
0,96  0,983  0,959
1  0,983   1  0,959 
2
 0,33 .
2
Если сравнить коэффициенты парной и частной корреляции, то можно
увидеть, что из-за высокой межфакторной зависимости коэффициенты
парной корреляции дают завышенные оценки тесноты связи. Именно по этой
причине рекомендуется при наличии сильной коллинеарности (взаимосвязи)
факторов исключать из исследования тот фактор, у которого теснота парной
зависимости меньше, чем теснота межфакторной связи.
Коэффициент множественной корреляции определить через матрицу
парных коэффициентов корреляции:
Ryx1x2  1 
r
,
 r11
где
1
ryx1
ryx2
 r  ryx1
1
rx1x2
rx2 x1
1
ryx2
– определитель матрицы парных коэффициентов корреляции;
 r11 
1
rx1x2
rx2 x1
1
13
– определитель матрицы межфакторной корреляции.
1
0,983 0,96
 r  0,983
1
0,959  0,00243 ;
0,96 0,959
1
 r11 
1
0,959
0,959
1
 0,0808 .
Коэффициент множественной корреляции
Ryx1x2  1 
0,00243
 0,985 .
0,0808
Аналогичный результат получим при использовании других формул:
Ryx1x2
2
 ост
0,305
 1 2  1
 0,985 ;
y
5,74
Ryx1x2 
  r
i
yxi
 0,983  0,778  0,214  0,96  0,985 ;



.
1  1  0,983   1  0,33   0,985
Ryx1x2 ... xm  1  1  ryx2 1  1  ryx2 2 x1 

2
2
Коэффициент множественной корреляции показывает на весьма
сильную связь всего набора факторов с результатом.
3.
Нескорректированный
коэффициент
множественной
детерминации Ryx1x2  0,97 оценивает долю вариации результата за счет
2
представленных в уравнении факторов в общей вариации результата. Здесь
эта доля составляет 97% и указывает на весьма высокую степень
обусловленности вариации результата вариацией факторов, иными словами –
на весьма тесную связь факторов с результатом.
Скорректированный коэффициент множественной детерминации
14
R  1  1  R 2 
2
 n  1
 n  m  1
 1  1  0,97 
20  1
 0,966
20  2  1
определяет тесноту связи с учетом степеней свободы общей и остаточной
дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа
факторов и поэтому может сравниваться по разным моделям с разным
числом факторов. Оба коэффициента указывают на весьма высокую (более
94% ) детерминированность результата y в модели факторами x1 и x2 .
4.
Оценку надежности уравнения регрессии в целом и показателя
тесноты связи Ryx1x2 дает F -критерий Фишера:
R2 n  m  1
.
F

1  R2
m
В нашем случае фактическое значение F -критерия Фишера:
Fфакт
0,97 2 20  2  1


 273,89 .
2
1  0,97
2
Получили, что
Fфакт  Fтабл  3,49 (при
n  20 ), т.е. вероятность
случайно получить такое значение F -критерия не превышает допустимый
уровень значимости 5% . Следовательно, полученное значение не случайно,
оно
сформировалось
под
влиянием
существенных
факторов,
т.е.
подтверждается статистическая значимость всего уравнения и показателя
2
тесноты связи Ryx1x2 .
15
5.
С
помощью
частных
F -критериев
Фишера
оценим
целесообразность включения в уравнение множественной регрессии фактора
x1 после x2 и фактора x2 после x1 при помощи формул:
Fчаст, x1
Fчаст, x2
2
Ryx2 1x2  Ryx2 2 n  m  1


1  Ryx2 1
m
;
Ryx2 1x2  Ryx2 1 n  m  1


1  Ryx2 2
m
.
2
Найдем Ryx1 и Ryx2 .
Ryx2 1  ryx21  0,9832  0,966
Ryx2 2  ryx2 2  0,962  0,922
;
.
Имеем
Fчаст, x1 
0,97  0,922 20  2  1

 12 ;
1  0,966
2
Fчаст, x2 
0,97  0,966 20  2  1

 0, 436 .
1  0,922
2
Получили, что Fчаст, x2  Fтабл  3, 49 . Следовательно, включение в
модель фактора
x2 после того, как в модель включен фактор x1
статистически нецелесообразно: прирост факторной дисперсии за счет
дополнительного
признака
x2
оказывается
незначительным,
несущественным; фактор x2 включать в уравнение после фактора x1 не
следует.
Если поменять первоначальный порядок включения факторов в модель
и рассмотреть вариант включения x1 после x2 , то результат расчета частного
16
F -критерия для x1 будет иным. Fчаст, x1  Fтабл  3, 49 , т.е. вероятность его
случайного формирования меньше принятого стандарта   0,05  5%  .
Следовательно,
значение
частного
F -критерия
для
дополнительно
включенного фактора x1 не случайно, является статистически значимым,
надежным,
достоверным:
прирост
факторной
дисперсии
за
счет
дополнительного фактора x1 является существенным. Фактор x1 должен
присутствовать в уравнении, в том числе в варианте, когда он дополнительно
включается после фактора x2 .
6.
Общий вывод состоит в том, что множественная модель с
факторами x1 и x2 с Ryx1x2  0,97 содержит неинформативный фактор x2 .
2
Если исключить фактор x2 , то можно ограничиться уравнением парной
регрессии:
yˆ x   0  1 x  2,085  1, 216  x , ryx2  0,983.
Задача 3
Даны системы эконометрических уравнений.
Требуется
1.
Применив необходимое и достаточное условие идентификации,
определите, идентифицируемо ли каждое из уравнений модели.
2.
Определите метод оценки параметров модели.
3.
Запишите в общем виде приведенную форму модели.
Макроэкономическая модель:
Ct  a1  b11 Dt  1 ,
I  a  b Y  b Y   ,
 t
2
22 t
23 t 1
2

Yt  Dt  Tt ,
 Dt  Ct  I t  Gt ,
17
где C – расходы на потребление; Y – чистый национальный продукт;
D – чистый национальный доход; I – инвестиции; T – косвенные
налоги; G – государственные расходы; t – текущий период; t  1 –
предыдущий период.
Решение
1.В данном случае мы имеем дело со структурной формой модели.
Модель
содержит
4
эндогенные
переменные
предопределенные (экзогенные) переменные
Ct , It , Yt , Dt 
Yt 1 ,Tt , Gt  .Проверим
и
3
каждое
уравнение системы на необходимое условие идентификации.
Уравнение №1.
Это уравнение включает 2 эндогенные переменные Ct , Dt  , т.е. G = 2 и
0 предопределенных переменных, т.е. m  0, D  3  0  3 .
D  G 1,
то уравнение сверхидентифицируемо (при выполнении
достаточных условий идентификации).
Уравнение №2.
Это уравнение включает 2 эндогенные переменные  It , Yt  , т.е. G = 2 и
1 предопределенную переменную Yt 1  , т.е. m  1, D  3  1  2 .
D  G  1 , то уравнение сверхидентифицируемо (при выполнении
достаточных условий идентификации).
Уравнение №3.
Это уравнение включает 2 эндогенные переменные Yt , Dt  , т.е. G = 2 и
1 предопределенную переменную Tt  , т.е. m  1, D  3  1  2 .
D  G 1,
то уравнение сверхидентифицируемо (при выполнении
достаточных условий идентификации).
Уравнение №4.
Это уравнение включает 3 эндогенные переменные  Ct , It , Dt  , т.е. G =
3 и 1 предопределенную переменную  Gt  , т.е. m  1, D  3  1  2 .
18
D  G 1, то уравнение точно идентифицируемо (при выполнении
достаточных условий идентификации).
Матрица коэффициентов при переменных модели.
Уравнение №1
Уравнение №2
Уравнение №3
Уравнение №4
Ct
-1
0
0
1
It
0
-1
0
1
Yt
0
b22
-1
0
Dt
b11
0
1
-1
Yt-1
0
b23
0
0
Tt
0
0
1
0
Gt
0
0
0
1
Достаточное условие идентификации.
Уравнение №1.
Матрица коэффициентов при переменных, не входящих в уравнение,
имеет вид:
-1
b22
b23
0
-1
0
1
0
0
Ее ранг равен 2, следовательно, detA ≠ 0.
Достаточное
условие
идентификации
0
1
0
для
0
0
1
уравнения
№1
не
выполняется.
Уравнение №2.
Матрица коэффициентов при переменных, не входящих в уравнение,
имеет вид:
1 b11 0 0
0
1
1 1 0
1 0 1
Ее ранг равен 3, следовательно, detA ≠ 0.
Достаточное условие идентификации для уравнения №2 выполняется.
Уравнение №3.
Матрица коэффициентов при переменных, не входящих в уравнение,
имеет вид:
19
1
0
0
1
1 b23 0
1 0 1
0
0
Ее ранг равен 2, следовательно, detA ≠ 0.
Достаточное
условие
идентификации
для
уравнения
№3
не
выполняется.
Уравнение №4.
Матрица коэффициентов при переменных, не входящих в уравнение,
имеет вид:
0
0
0
b22 b23
1 0
0
1
В матрице B 1-ая строка нулевая, следовательно, вычеркиваем ее. Это
равносильно вычеркиванию 1-го уравнения системы.
11 12 0
1 0 0
Ее ранг равен 2, следовательно, detA ≠ 0.
Достаточное
условие
идентификации
для
уравнения
№4
не
выполняется.
Поскольку система в целом неидентифицируема, для оценки ее
параметров целесообразно применять двухшаговый МНК.
Приведенная форма модели – это система линейных функций
эндогенных переменных от предопределенных.
Ct  A1  11Tt  12 Kt 1  u1 ,
I  A   T   K  u ,
 t
2
21 t
22 t 1
2

Yt  A3   31Tt   32 Kt 1  u3 ,
Yt  A4   41Tt   42 Kt 1  u4
20
Задача 4
Имеются условные данные об объемах потребления электроэнергии
 yt  жителями региона за 16 кварталов.
Требуется:
Построить автокорреляционную функцию и сделать вывод о
1.
наличии сезонных колебаний.
Построить аддитивную модель временного ряда (для нечетных
2.
вариантов) или мультипликативную модель временного ряда (для четных
вариантов).
Сделать прогноз на 2 квартала вперед.
3.
Решение
t
yt
t
yt
1
2
3
4
5
6
7
8
5,5
4,8
5,1
9,0
7,1
4,9
6,1
10,0
9
10
11
12
13
14
15
16
8,3
5,4
6,4
10,9
9,0
6,6
7,5
11,2
Решение
1. Построим поле корреляции:
12
10
8
6
4
2
0
0
5
10
15
20
21
Рассчитаем
несколько
последовательных
коэффициентов
автокорреляции. Формула для расчета коэффициента автокорреляции
первого порядка:
n
r1 
 y
t 2
n
t
 y1  yt 1  y2 
  yt  y1 
t 2
2
, где
n
 y
t 2
t 1
 y2 
2
y1 
1 n
 yt ,
n  1 t 2
y2 
1 n
 yt 1.
n  1 t 2
Составим вспомогательную таблицу
Следует заметить, что среднее значение получается путем деления не
на 16, а на 15, т.к. у нас теперь на одно наблюдение меньше.
Теперь вычисляем коэффициент автокорреляции первого порядка:
r1 
11, 421333
 0, 29533
65, 22859375  52,98933333
Коэффициент автокорреляции второго порядка определяется по
формуле:
22
n
r2 
 y
t 3
n
t
 y3  yt 2  y4 
  yt  y3 
t 3
Составляем
2
n
 y
t 2
t 3
новую
 y4 
2
1 n
, где y3 
 yt ,
n  2 t 3
расчетную
таблицу
и
1 n
y4 
 yt 2 .
n  2 t 3
вычисляем
коэффициент
автокорреляции второго порядка:
r2 
29,50642857
 0,53649
57, 26357143  52,82357143
Аналогично находим коэффициенты автокорреляции более высоких
порядков, а все полученные значения заносим в сводную таблицу.
Лаг
1
2
3
4
5
6
Коэффициент автокорреляции
0,29533
-0,53649
0,14271
0,977197
0,140488
-0,68234
23
Анализ автокорреляционной функции и графика исходных уровней
временного ряда позволяет сделать вывод о наличии в изучаемом временном
ряде сезонных колебаний периодичностью в четыре квартала (наиболее
значительным оказался коэффициент автокорреляции 4-го порядка).
2.
Аддитивная модель имеет вид 𝑌 = 𝑇 + 𝑆 + 𝐸.
Каждый уровень временного ряда формируется из трендовой
(𝑇),
циклической (𝑆) и случайной (𝐸) компонент. Построение аддитивной
модели сводится к расчету значений 𝑇, 𝑆 и 𝐸 для каждого уровня ряда.
Построение модели включает следующие шаги:
1)
Выравнивание исходного ряда методом скользящей средней;
2)
Расчет значений сезонной компоненты 𝑆;
3)
Устранение сезонной компоненты из исходных уровней ряда и
получение выровненных данных в аддитивной (𝑇 + 𝐸) модели;
4)
Аналитическое выравнивание уровней (𝑇 + 𝐸) и расчет значений
𝑇 с использованием полученного уравнения тренда;
5)
Расчет полученных по модели значений (𝑇 + 𝑆);
6)
Расчет абсолютных и/или относительных ошибок.
Шаг 1. Проведем выравнивание исходного ряда методом скользящей
средней. Для этого:
1.1.
Просуммируем уровни ряда последовательно за каждые четыре
квартала со сдвигом на один момент времени и определим условные
годовые объемы потребления электроэнергии.
1.2.
Разделив полученные суммы на 4, найдем скользящие средние.
Полученные таким образом выровненные значения уже не содержат
сезонной компоненты.
1.3.
Приведем
эти
значения
в
соответствие
с
фактическими
моментами времени, для чего найдем средние значения из двух
24
последовательных скользящих средних – центрированные скользящие
средние.
Шаг 2. Найдем оценки сезонной компоненты как разность между
фактическими уровнями ряда и центрированными скользящими средними.
Используем эти оценки для расчета значений сезонной компоненты 𝑆𝑖 . Для
этого найдем средние за каждый квартал (по всем годам) оценки сезонной
компоненты 𝑆𝑖 .
В моделях с сезонной компонентой обычно предполагается, что
сезонные воздействия за период взаимопогашаются. В аддитивной модели
это выражается в том, что сумма значений сезонной компоненты по всем
кварталам должна быть равна нулю.
Для данной модели имеем: 0,633 -2,06 -1,238 + 2,642 = 0,931
Корректирующий коэффициент: k  0,931/ 4  0, 233
25
Рассчитываем скорректированные значения сезонной компоненты 𝑆𝑖 =
𝑆𝑖̅ − 𝑘 и заносим полученные данные в таблицу.
Шаг 3. Исключим влияние сезонной компоненты, вычитая ее значение
из каждого уровня исходного временного ряда. Получим величины 𝑇 + 𝐸 =
𝑌 − 𝑆. Эти значения рассчитываются за каждый момент времени и содержат
только тенденцию и случайную компоненту.
Исключим влияние сезонной компоненты, вычитая ее значение из
каждого уровня исходного временного ряда. Получим величины T + E = Y - S
(гр. 4 табл.). Эти значения рассчитываются за каждый момент времени и
содержат только тенденцию и случайную компоненту.
Находим параметры уравнения методом наименьших квадратов.
Система уравнений МНК:
a0 n  a1  t   y

2
a0  t  a1  t   yt
Для наших данных система уравнений имеет вид:
16a0  136a1  117,8

136a0  1496a1  1073, 21
Из первого уравнения выражаем а0 и подставим во второе уравнение
Получаем a1  0, 21; a0  5,56
Среднее значения:
26
y
y
t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
136
i
n

117,8
 7,36
16
y
5,1
6,14
6,57
6,59
6,7
6,24
7,57
7,59
7,9
6,74
7,87
8,49
8,6
7,94
8,97
8,79
117,8
t2
y2
ty
ŷ
 yi  y 
1
4
9
16
25
36
49
64
81
100
121
144
169
196
225
256
1496
26
37,69
43,17
43,44
44,88
38,93
57,31
57,63
62,4
45,41
61,94
72,1
73,95
63,03
80,47
77,28
885,64
5,1
12,28
19,71
26,36
33,5
37,43
52,99
60,73
71,1
67,39
86,57
101,89
111,79
111,15
134,55
140,66
1073,21
5,78
5,99
6,2
6,41
6,62
6,83
7,05
7,26
7,47
7,68
7,89
8,1
8,31
8,53
8,74
8,95
117,8
5,12
1,5
0,63
0,59
0,44
1,26
0,0432
0,0523
0,29
0,39
0,26
1,27
1,53
0,33
2,59
2,04
18,34
2
 y  yˆ 
2
0,46
0,0229
0,14
0,0326
0,00597
0,35
0,28
0,11
0,19
0,88
0,000439
0,15
0,0813
0,34
0,0543
0,0249
3,13
Определим компоненту T данной модели. Для этого проведем
аналитическое выравнивание ряда (T + E) с помощью линейного тренда.
Результаты аналитического выравнивания следующие: T  5,565  0, 212t
Подставляя в это уравнение значения t = 1,...,16, найдем уровни T для
каждого момента времени (гр. 5 табл.).
t
1
2
3
4
5
6
7
8
9
10
yt
5,5
4,8
5,1
9
7,1
4,9
6,1
10
8,3
5,4
Si
0,4
-1,34
-1,47
2,41
0,4
-1,34
-1,47
2,41
0,4
-1,34
yt – Si
5,1
6,14
6,57
6,59
6,7
6,24
7,57
7,59
7,9
6,74
T
5,78
5,99
6,2
6,41
6,62
6,83
7,05
7,26
7,47
7,68
T + Si
6,18
4,65
4,73
8,82
7,02
5,49
5,57
9,67
7,87
6,34
E = yt – (T + Si)
-0,68
0,15
0,37
0,18
0,0773
-0,59
0,53
0,33
0,43
-0,94
E2
0,46
0,0229
0,14
0,0326
0,00597
0,35
0,28
0,11
0,19
0,88
27
t
11
12
13
14
15
16
yt
6,4
10,9
9
6,6
7,5
11,2
yt – Si
7,87
8,49
8,6
7,94
8,97
8,79
Si
-1,47
2,41
0,4
-1,34
-1,47
2,41
T
7,89
8,1
8,31
8,53
8,74
8,95
T + Si
6,42
10,51
8,71
7,19
7,27
11,36
E = yt – (T + Si)
-0,021
0,39
0,29
-0,59
0,23
-0,16
E2
0,000439
0,15
0,0813
0,34
0,0543
0,0249
3,13
Найдем значения уровней ряда, полученные по аддитивной модели.
Для этого прибавим к уровням T значения сезонной компоненты для
соответствующих кварталов (гр. 6 табл.).
Для оценки качества построенной модели применим сумму квадратов
полученных абсолютных ошибок.
t
y
1
5,5
2
4,8
3
5,1
4
9
5
7,1
6
4,9
7
6,1
8
10
9
8,3
10
5,4
11
6,4
12
10,9
13
9
14
6,6
15
7,5
16
11,2
136
117,8
Коэффициент детерминации:
R2  1 
E
 y
t
2
 y
2
 1
 yi  y 
2
3,47
6,57
5,12
2,68
0,0689
6,06
1,59
6,96
0,88
3,85
0,93
12,51
2,68
0,58
0,0189
14,73
68,698
3,125
 0,95
68, 698
Следовательно, можно сказать, что аддитивная модель объясняет 95%
общей вариации уровней временного ряда.
Проверка адекватности модели данным наблюдения.
28
F
R2 n  m  1
0,952 16  1  1



 293,75
1  R2
m
1  0,952
1
где m – количество факторов в уравнении тренда (m=1).
Fkp  4, 6
Поскольку F  Fkp , то уравнение статистически значимо.
Прогнозирование по
аддитивной
модели.
Прогнозное
значение
Ft уровня временного ряда в аддитивной модели есть сумма трендовой и
сезонной компонент. Для определения трендовой компоненты воспользуемся
уравнением тренда: T = 5,565 + 0,212t
Прогноз на 1 период:
T17 = 5,565 + 0,212∙17 = 9.16
Значение сезонного компонента за соответствующий период равно:
S1 = 0.401.
Таким образом, F17 = T17 + S1 = 9.16 + 0.401 = 9.561.
Прогноз на 2 период:
T18 = 5,565 + 0,212∙18 = 9,372
Значение сезонного компонента за соответствующий период равно:
S2 = -1,339.
Таким образом, F18 = T18 + S2 = 9,372 -1,339 = 8,033
29
Скачать