Эконометрический анализ факторов, влияющих на уровень счастья россиян Ткаченко Андрей Email:tkachenko.av.87@gmail.com Национальный Исследовательский Университет Высшая Школа Экономики Введение 1) Актуальность проблемы в России и других странах. 2) Проблемы при оценке счастья: • Субъективность оценки • Не поддается измерениям • Сильная изменчивость за короткий промежуток времени • Зависимость от других скрытых неизмеряемых факторов Цель работы: наиболее точное объяснение показателя уровня счастья через иные внешние факторы, поддающиеся оценке. Структура работы • • • • • • • Введение Обзор литературы Описание данных и переменных Предварительный анализ факторов Системы уравнений, объясняющие уровень счастья Упорядоченные модели множественного выбора Порядковые модели, описывающие уровень счастья в разрезе финансового положения • Заключение Обзор литературы Иностранные публикации: • Истерлин Ричард. 1970 - средний уровень счастья не сильно меняется в зависимости от среднего дохода на душу населения, по крайней мере для тех стран, где уровень дохода позволяет человеку обеспечить себя самым необходимым. • Винховен и Хагерти 2003 - пришли к выводу, что парадокса Истерлина нет • Стивенсон и Волферс 2008 - показана взаимосвязь между счастьем и логарифмом дохода • Истерлин Р. 2010 – подтверждает результаты работы за 1970 г. Отечественные работы • Л.Б. Косовой 1993 - отсутствие материального благополучия определяет недовольство жизнью сильнее, чем что-либо другое, но не является достаточным основанием ощущения удовлетворенности. При материальном благополучии удовлетворенность жизнью определяется социальными факторами: положением в обществе, отношением в семье, кругом общения • Гуриев и Журавская - во всех странах c развитой экономикой уровень счастья с возрастом сначала падает – до 38-40 лет – после чего начинает расти. А вот в переходных экономиках и, в частности в России, уровень счастья монотонно падает с возрастом. Данные и переменные В данной работе в качестве входных данных была выбраны базы данных РМЭЗ - Российского мониторинга экономического положения и здоровья населения за 2008 г. Объясняемая переменная. Одним из пунктов этого опросника является следующий: «Насколько Вы удовлетворены своей жизнью в целом в настоящее время?», где респондент выбирал один из пяти возможных вариантов: 1 - Полностью удовлетворен, 2 - Скорее удовлетворен, 3 И да, и нет, 4 - Не очень удовлетворен, 5 - Совсем не удовлетворен. Эту переменную мы и выбираем в качестве объясняемой. Объясняющие переменные. В модели были включены переменные, характеризующие: • гендерную принадлежность и возраст • финансовую удовлетворенность респондента • наличие работы и её показатели • обеспокоенность не обеспечить себя самым необходимым или потерять работу (при её наличии) • факторы, описывающие уровень образования респондента, такие как: количество лет образования, наличие школьного аттестата и ВУЗ-овского диплома • факторы семейного положения: наличие супруга, наличие и количество детей, время, проводимое с семьей • самооценку показателя здоровья, измеряемую от очень хорошей (значение соответствующей переменной равно 1) до очень плохой (значение соответствующей переменной равно 5) • тип населенного пункта, в котором проживает респондент, и другие региональные признаки: валовый региональный продукт, средний доход по региону, стоимость потребительской корзины, уровень безработицы и т.д. Выборки Невозможно использовать полный объем данных (14028 наблюдений) по причинам: • по некоторым вопросам не было ответов, либо ответы были неадекватны • в базе в том числе содержатся данные по людям, возраст которых не превышает 5-и лет Выделены две выборки: • В первую выборку вошли все респонденты, возраст которых более 14 лет, имеющие ненулевое количество лет школьного образования. При таких ограничениях получили выборку объемом 11314 наблюдений. • Вторая выборка обладает теми же ограничениями, что и первая с добавлением дополнительного условия, что респондент имеет работу и поэтому в выборку включаются переменные, описывающие некоторые её характеристики, такие как: удовлетворенность работой, доход, обеспокоенность потерять её. В эту выборку попало 5788 наблюдений. Вторая выборка является подмножеством первой. Необходимость использования двух выборок заключается в том, что в первую из них попали те респонденты, которые могли не иметь работы и, соответственно, удовлетворенность работой, заработная плата и другие факторы, связанные с работой, для таких респондентов были пропущены. Однако, при оценке удовлетворенности жизнью, такие люди также представляют интерес. Предварительный анализ Ранговая корреляция Спирмена факторов: • удовлетворенность фин. положением (1 – полностью удовл., 5 – полностью не удовл.) • оценка здоровья (1 – очень хорошее, 5 – очень плохое), • обеспокоенность не обеспечить себя необходимы (1 – максимальная, 5 – минимальная) life_satisf -------------+----------life_satisf | 1.0000 fin_satisf | 0.5325* health_estim | 0.2818* nerv_nes | -0.2976* status age gender educ diploma sch_certif marit1 marit2 marit3 child_num have_child life_satisf -----------| 0.0496* | 0.1898* | -0.0586* | -0.1327* | -0.0888* | -0.0520* | -0.0765* | -0.0663* | 0.1549* | 0.0783* | 0.0821* home_time care_time empl unempl potr_bas have_job job_satisf nerv_job inc_bas exper life_satisf ----------| 0.0133 | -0.0720* | -0.0331* | 0.0611* | -0.0114 | -0.1409* | 0.3375* | -0.1102* | -0.2078* | 0.0171 В целом, все указанные факторы могут рассматриваться как регрессоры, объясняющие уровень счастья. Наиболее весомый вклад, который мы будем рассчитывать как предельный эффект каждой переменной для всех категорий life_satisf, могут оказать финансовая удовлетворенность и оценка здоровья. Системы уравнений Поскольку факторы финансовой удовлетворенности и обеспокоенности не обеспечить себя необходимым, которые мы хотим использовать в качестве регрессоров моделей, в свою очередь сами могут быть зависимы от других переменных, то их использование может привести к смещенным оценкам. Поэтому рассматривается система уравнений для бинарных переменных: • ls (удовлетворенность жизнью), • fs (удовлетворенность финансовым положением) , • nn (обеспокоенность не обеспечить себя самым необходимым). Общий вид системы Y1=1, если Y1*>0 и 0 в противном случае. Y2=1, если Y2*>0 и 0 в противном случае. Здесь Y1* ,Y2* - латентные переменные, X1, X2 – матрицы регрессоров, α, β1, β2, ρ – оцениваемые параметры, где ρ – коэффициент корреляции ошибок ε1 и ε2, таких что (ε1, ε2) ~ N(0,0,1,1, ρ). Результаты оценивания системы уравнений (ls и fs) samp1==1 ---------------------------------------------Variable | m1 m2 -------------+-------------------------------ls | age | .06139912*** .04106097*** age2 | -.00062059*** -.00038026*** gender | -.03517062 -.02504953 educ | -.03300758*** -.02901426*** have_job | -.33331784*** -.22341335*** marit2 | -.22902763*** -.2050772*** have_child | -.04450669 -.08140641* he1 | -.23211479*** -.26202643*** he3 | .33643978*** .37844161*** fs | 1.2510631*** _cons | -.94909213*** -1.5358667*** -------------+-------------------------------fs | age | .06219331*** .0617335*** age2 | -.00069082*** -.00068278*** gender | -.04090582 -.04069078 educ | -.01889817*** -.0177001*** have_job | -.3574336*** -.34470389*** marit2 | -.12845249*** -.13272225*** have_child | .05129198 .05281184 inc_reg | 1.624e-06 -4.362e-06 st1 | -.01744355 -.03760513 _cons | -.46826778*** -.39567517*** -------------+-------------------------------atrho21 | _cons | .67409154*** -.00262584 ---------------------------------------------- samp2==1 ---------------------------------------------Variable | m3 m4 -------------+-------------------------------ls | age | .04554688*** .02310417** age2 | -.00047854*** -.00019459 gender | -.11221403*** -.09393761** educ | -.05573502*** -.03902588*** marit2 | -.25180456*** -.18255061*** have_child | .0184991 -.04098474 he1 | -.28961739*** -.24783549*** he3 | .26674676*** .19793824** fs | 1.63775*** _cons | -.59378379*** -1.4516845*** -------------+-------------------------------fs | age | .05825374*** .05912113*** age2 | -.00068929*** -.00069816*** gender | .09930812*** .11961537*** educ | -.0106272 -.00181577 marit2 | -.1567593*** -.15391289*** have_child | .11691572** .12839543** inc_bas | -.00002854*** -.00003372*** nj1 | .17216268*** .2090194*** nj3 | -.001805 -.00132366 js1 | -.30596367*** -.36960888*** js3 | .23528916*** .42943928*** _cons | -.38451303* -.49167819** -------------+-------------------------------atrho21 | _cons | .52467197*** -.32048594*** ---------------------------------------------- Результаты оценивания системы уравнений (ls и nn) samp1==1 ---------------------------------------------Variable | m1 m2 -------------+-------------------------------ls | age | .06204588*** .05823727*** age2 | -.00064012*** -.00059967*** gender | -.02745813 -.00835353 educ | -.03223097*** -.03010775*** have_job | -.32731205*** -.3276593*** marit2 | -.23433046*** -.24651838*** have_child | -.04994455 -.06779472* he1 | -.30141703*** -.30643378*** he3 | .42701681*** .43015798*** nn | -.44611314*** _cons | -.93473632*** -.7927005*** -------------+-------------------------------nn | age | -.03864497*** -.03828824*** age2 | .00039661*** .00039028*** gender | .18044354*** .17993449*** educ | .01280427*** .01223835*** have_job | .02971831 .02175651 marit2 | -.04591911 -.04596797 have_child | -.12667622*** -.12556056*** inc_reg | .00001463*** .00001707*** st1 | .24178972*** .24731988*** _cons | -.49523101*** -.52236999*** -------------+-------------------------------atrho21 | _cons | -.25991463*** -.04791858 ---------------------------------------------- samp2==1 ---------------------------------------------Variable | m3 m4 -------------+-------------------------------ls | age | .04505189*** .03572444*** age2 | -.00048158*** -.00036823*** gender | -.10172745*** -.06112766 educ | -.05599951*** -.04932063*** marit2 | -.25675564*** -.27648464*** have_child | .01744386 -.01230082 he1 | -.35187659*** -.32821751*** he3 | .3327496*** .30373515*** nn | -.76341845*** _cons | -.54879334** -.30388597 -------------+-------------------------------nn | age | -.0291329*** -.02966041*** age2 | .00034656*** .00035478*** gender | .14746024*** .13794017*** educ | .01947953** .01436626* marit2 | -.0937549* -.09998775** have_child | -.11629774* -.12279929** inc_bas | 7.881e-06*** 9.893e-06*** nj1 | -.40143412*** -.42200361*** nj3 | .95528264*** .92919052*** js1 | .31297959*** .34701295*** js3 | -.05254222 -.16059425** _cons | -1.0774312*** -1.0010311*** -------------+-------------------------------atrho21 | _cons | -.1470278*** .22527215*** Упорядоченные модели множественного выбора Общий вид уравнения Yi* = XiT β + ui, i=1,…,n. Yi = j, если Cj-1 ≤ Yi* ≤ Cj, j=1,…,5; где Xi - регрессоры, Yi* - латентная переменная, Cj – границы для Yi*, при переходе через которые происходит соответствующий скачок Yi, C0=-∞, C5=+∞. Предполагается, ошибка ui имеет логистическое распределение F(u)=eu/(1+ eu). Полученные результаты • • • • • Возраст входит в модель нелинейно, точка экстремума age*=55.4 факторы хорошего благосостояния, хорошего здоровья, хорошего образования, наличия супруга и детей делают человека более удовлетворенным жизнью Количество детей входит в модель нелинейно, точка экстремума child*=4.1 факторы наличия работы, удовлетворенности ею и низкой обеспокоенности потерять её повышают вероятность человека принадлежать категории счастливых людей региональные признаки: валовый региональный продукт на душу населения, средний доход на душу населения по региону, уровень безработицы и занятости значимы. Порядковые модели в разрезе финансового положения Всего выделяются три категории удовлетворенности финансовым положением: • удовлетворенные материальным положением (модель m1) • неудовлетворенные материальным положением (модель m3) • промежуточная категория (модель m2) Результаты оценивания -------------------------------------------------------------Variable | m1 m2 m3 -------------+-----------------------------------------------life_satisf | age | .04360563*** .0643146*** .06651861*** age2 | -.00034032** -.00058599*** -.00058789*** gender | .13891581 -.01481 .00909493 educ | -.0075192 -.04277152*** -.03528787*** marit1 | -.34035391* -.16410137 .24608882 marit2 | -.26340678* -.37700173*** -.41540893*** have_child | -.35347252** -.20214264** -.01995613 have_job | -.0853867 -.22869388*** -.31275671*** he1 | -.2538819*** -.55396054*** -.33400663*** he3 | 1.078039*** .53899955*** .39941541*** nn1 | .00817933 .34404909*** .71228999*** nn3 | -.52901195*** -.35608035*** -.34861855** st1 | 1.0182085*** .34995473 -.0893959 st2 | 1.1734075*** .23851067 -.12025736 st4 | 1.1300412*** .21257976* -.10316292 inc_reg | -.00002048 -.00004228*** -.00004675*** empl | .00619528 .00813253 .01422418 unempl | -.03053039 .00640294 .01189535 -------------+------------------------------------------------ Порядковые модели, в разрезе финансового положения Интерпретация результатов • Возраст входит нелинейно. Экстремумы age1*=66.9, age2*=55.3, age3*=56.1 для моделей m1, m2, m3 соответственно. • Образование значимо только в m2 и m3. • Фактор наличия супруга(и) значим в m2 и m3. • Наличие детей значимо в m1 и m2. • Здоровье значимо во всех группах. • Наличие работы значимо лишь в m2 и m3. • Из региональных признаков значимы тип населенного пункта для группы m1 и среднедушевой доход населения в группах m2 и m3 Заключение Основные значимые факторы • • • • удовлетворенность респондента финансовым состоянием оценка его здоровья обеспокоенность не обеспечить себя самым необходимым возраст, который входит в модели нелинейно. Точка экстремума в среднем 56, а для финансово удовлетворенных 67. • семейное положение и внутренняя структура семьи. Наиболее сбалансированы те семьи, финансовая удовлетворенность которых не высока, но и не низка. Количество детей входит в модели нелинейно, точка экстремума равна 4. • Уровень образования значим для всех людей, кроме финансово удовлетворенных • Региональные признаки также значимы для всех респондентов. . Благодарю за внимание!