Модели панельных данных � Панельными называют данные, которые содержат статистическую информацию об одном и том же множестве объектов за ряд последовательных периодов времени � � С точки зрения регрессионного анализа использование панельных данных увеличивает объем рассматриваемой выборки, что обеспечивает большую эффективность оценивания параметров регрессионной модели Yi t i 1, N t 1, T объем выборки N T � компенсирует «минусы» использования пространственных и временных данных, связанные с некоторой «потерей информации»: как минимум, появляются инструменты контроля и учета неоднородности объектов выборки и возможность идентифицировать индивидуальные эффекты для этих объектов � Панели бывают сбалансированные, когда имеются наблюдения для всех объектов в каждый рассматриваемый момент времени, т.е. за весь период, и несбалансированные, когда, другими словами, имеются пропущенные в панели данные Объекты Время (год) Переменные модели Y=”Экспорт из X1=”ВВП страны i” X2=”ВВП страны j” X3=”расстояние страны i в страну j” между столицами (страна) 1 (страна) 2 Объект Объект стран i и j” 2007 411 335085 30772,4 2183 2008 479 345006 35430,5 2183 2009 315 339162 35043,1 2183 2007 2637 335085 127330,5 911 2008 3000 345006 147879,3 911 2009 2379 339162 137161,5 911 � При отсутствии значимых различий (неоднородности) между объектами выборки, возможно построение регрессии по объединенной выборке (pooled regression) � Предположим, что рассматриваемая совокупность объектов содержит в себе некоторую неоднородность, что связано, в том числе, с теми факторами, которые не учтены в модели, при этом ненаблюдаемые факторы возможно коррелируют с регрессорами модели � Панельные данные позволяют учесть эту неоднородность рассмотрением так называемых индивидуальных эффектов (фиксированных) для объектов панели, которые отражают воздействие всех переменных, как наблюдаемых, так и ненаблюдаемых, принимающих различные значения для объектов выборки, но не изменяющихся во времени � Модели панельных данных с фиксированными эффектами (cross-section FE – cross-section fixed effects): подход, основанный на введении в рассмотрение индивидуальных эффектов, что позволяет избавиться от влияния ненаблюдаемой переменной (постоянной во времени) и получить несмещенные оценки параметров Модель с FE предполагает введение фиктивных переменных для объектов выборки, коэффициенты при фиктивных переменных будут давать оценки индивидуальных эффектов Аналогичный результат можно получить, используя переход к первым разностям наблюдаемых переменных � Так же при оценке параметров эконометрической модели панельных данных используют, т.н., within-оценки или внутригрупповые оценки, которые можно получить, построив модель по отклонениям от групповых средних, и between-оценки или межгрупповые оценки, построив модель по групповым средним. � Если необходимо учесть в модели ненаблюдаемые факторы, принимающие различные значения для каждого момента времени, но одинаковые для всех объектов совокупности, фиктивные переменные, определяющие фиксированные эффекты – вводятся для момента времени (period FE – period fixed effects) � Модель с фиксированными эффектами обеспечивает гарантированное получение несмещенных и состоятельных оценок. В случае, если ненаблюдаемые факторы не коррелируют с регрессорами, для получения более эффективных оценок возможно рассмотрение модели панельных данных со случайными эффектами (RE – random effects): полагается, что пропущенные переменные являются одной из составляющих ошибок � Как в случае модели с фиксированными эффектами, случайные эффекты могут быть рассмотрены как для объектов совокупности (cross-section RE), так и для моментов времени (period RE) � При выборе между использованием фиксированных и случайных эффектов, можно использовать как тестирование гипотезы о некоррелированности между регрессорами случайными эффектами, так и основываться на особенностях формирования совокупности данных и характеристик входящих в нее объектов � для моделей предприятий, регионов и стран наиболее часто используются модель с FE, поскольку каждый из объектов такой выборки обладает своими индивидуальными особенностями, а целью построения модели является в частности получения прогноза для конкретного объекта выборки; � при анализа случайной выборки большого объема, например, если речь про данные по исследованию ДХ (людей), когда интересует поведение совокупности в целом, а не отдельных объектов, предпочтение отдается модели с RE; � при этом, получить не только несмещенные и состоятельные, но и эффективные оценки, возможно в модели с RE. � Pooled regression vs. Fixed Effects => F-test / LR-test Сравнение общего качества модели по объединенной выборке и модели с учетом FE , т.е. введенными в модель фиктивными переменными объектов. � Random Effects vs. Fixed Effects => Hausman test Фиксированные эффекты (FE effects model) Случайные эффекты (RE effects model) Н0 Оценки FE Н1 Оценки FE состоятельны состоятельны Оценки RE Оценки RE состоятельны и несостоятельны эффективны Таким образом, для принятия модели с фиксированными эффектами, нулевая гипотеза должна отклоняться как в F-тесте (есть панельная структура), так и в тесте Хаусмана (только оценки модели с фиксированными эффектами являются состоятельными, а оценки модели со случайными эффектами несостоятельны).