Введение в анализ панельных данных.

реклама
Модели панельных данных
�
Панельными
называют
данные,
которые
содержат
статистическую
информацию об одном и том же множестве объектов за ряд последовательных
периодов времени
�
�
С точки зрения регрессионного анализа использование панельных данных
увеличивает объем рассматриваемой выборки, что обеспечивает большую
эффективность оценивания параметров регрессионной модели
Yi t i  1, N t  1, T  объем выборки N  T
�
компенсирует «минусы» использования пространственных и временных
данных, связанные с некоторой «потерей информации»: как минимум,
появляются инструменты контроля и учета неоднородности объектов выборки
и возможность идентифицировать индивидуальные эффекты для этих объектов
�
Панели бывают сбалансированные, когда имеются наблюдения для всех
объектов в каждый рассматриваемый момент времени, т.е. за весь период, и
несбалансированные, когда, другими словами, имеются пропущенные в панели
данные
Объекты
Время
(год)
Переменные модели
Y=”Экспорт из
X1=”ВВП страны i” X2=”ВВП страны j” X3=”расстояние
страны i в страну j”
между столицами
(страна) 1
(страна) 2
Объект
Объект
стран i и j”
2007
411
335085
30772,4
2183
2008
479
345006
35430,5
2183
2009
315
339162
35043,1
2183
2007
2637
335085
127330,5
911
2008
3000
345006
147879,3
911
2009
2379
339162
137161,5
911
�
При отсутствии значимых различий (неоднородности) между объектами
выборки, возможно построение регрессии по объединенной выборке (pooled
regression)
�
Предположим, что рассматриваемая совокупность объектов содержит в
себе некоторую неоднородность, что связано, в том числе, с теми факторами,
которые не учтены в модели, при этом ненаблюдаемые факторы возможно
коррелируют с регрессорами модели
�
Панельные данные позволяют учесть эту неоднородность рассмотрением
так называемых индивидуальных эффектов (фиксированных) для объектов панели,
которые отражают воздействие всех переменных, как наблюдаемых, так и
ненаблюдаемых, принимающих различные значения для объектов выборки, но не
изменяющихся во времени
�
Модели панельных данных с фиксированными эффектами (cross-section FE
– cross-section fixed effects): подход, основанный на введении в рассмотрение
индивидуальных эффектов, что позволяет избавиться от влияния ненаблюдаемой
переменной (постоянной во времени) и получить несмещенные оценки параметров
Модель с FE предполагает введение фиктивных переменных для объектов
выборки, коэффициенты при фиктивных переменных будут давать оценки
индивидуальных эффектов
Аналогичный результат можно получить, используя переход к первым разностям
наблюдаемых переменных
�
Так же при оценке параметров эконометрической модели панельных
данных используют, т.н., within-оценки или внутригрупповые оценки, которые
можно получить, построив модель по отклонениям от групповых средних, и
between-оценки или межгрупповые оценки, построив модель по групповым
средним.
�
Если необходимо учесть в модели ненаблюдаемые факторы, принимающие
различные значения для каждого момента времени, но одинаковые для всех
объектов совокупности, фиктивные переменные, определяющие фиксированные
эффекты – вводятся для момента времени (period FE – period fixed effects)
�
Модель с фиксированными эффектами обеспечивает гарантированное
получение несмещенных и состоятельных оценок.
В случае, если ненаблюдаемые факторы не коррелируют с регрессорами, для
получения более эффективных оценок возможно рассмотрение модели панельных
данных со случайными эффектами (RE – random effects): полагается, что
пропущенные переменные являются одной из составляющих ошибок
�
Как в случае модели с фиксированными эффектами, случайные эффекты
могут быть рассмотрены как для объектов совокупности (cross-section RE), так и для
моментов времени (period RE)
�
При выборе между использованием фиксированных и случайных эффектов,
можно использовать как тестирование гипотезы о некоррелированности между
регрессорами случайными эффектами, так и основываться на особенностях
формирования совокупности данных и характеристик входящих в нее объектов
�
для моделей предприятий, регионов и стран наиболее часто используются
модель с FE, поскольку каждый из объектов такой выборки обладает своими
индивидуальными особенностями, а целью построения модели является в
частности получения прогноза для конкретного объекта выборки;
�
при анализа случайной выборки большого объема, например, если речь про
данные
по
исследованию
ДХ
(людей),
когда
интересует
поведение
совокупности в целом, а не отдельных объектов, предпочтение отдается
модели с RE;
�
при этом, получить не только несмещенные и состоятельные, но и
эффективные оценки, возможно в модели с RE.
�
Pooled regression vs. Fixed Effects => F-test / LR-test
Сравнение общего качества модели по объединенной выборке и модели с
учетом FE , т.е. введенными в модель фиктивными переменными объектов.
�
Random Effects vs. Fixed Effects => Hausman test
Фиксированные эффекты
(FE effects model)
Случайные эффекты
(RE effects model)
Н0
Оценки FE
Н1
Оценки FE
состоятельны
состоятельны
Оценки RE
Оценки RE
состоятельны и
несостоятельны
эффективны
Таким образом, для принятия модели с фиксированными эффектами, нулевая
гипотеза должна отклоняться как в F-тесте (есть панельная структура), так и в
тесте Хаусмана (только оценки модели с фиксированными эффектами являются
состоятельными, а оценки модели со случайными эффектами несостоятельны).
Скачать