МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE Методические рекомендации по выполнению контрольных работ СОДЕРЖАНИЕ Введение .......................................................................................... 2 Практикум по теме 1 ........................................................................ 3 Методические указания по выполнению практикума ................. 3 Решение типовых задач .............................................................. 3 Задания практикума ..................................................................... 5 Лабораторная работа 1.1. «Парная линейная регрессия» .... 7 Практикум по теме 2 ...................................................................... 10 Методические указания по выполнению практикума ............... 10 Решение типовых задач ............................................................ 10 Задания практикума ................................................................... 13 Лабораторная работа 2.1. «Множественная линейная регрессия» ....................................................................................... 15 Лабораторная работа 2.2. «Мультиколлинеарность и множественная линейная регрессия» ............................................ 19 Лабораторная работа 2.3. «Процедура отбора переменных в модели множественной линейной регрессии» .............................. 21 Практикум по теме 3 ...................................................................... 21 Методические указания по выполнению практикума ............... 21 Решение типовых задач ............................................................ 21 Задания практикума ................................................................... 22 Лабораторная работа 3.1. «Метод Гольдфельда-Квандта проверки гипотезы гомоскедастичности»....................................... 23 Лабораторная работа 3.2. «Критерий Дарбина-Уотсона» .... 24 Практикум по теме 4 ...................................................................... 25 Методические указания по выполнению практикума ............... 25 Решение типовых задач ............................................................ 25 Задания практикума ................................................................... 27 Лабораторная работа «Нелинейная регрессия» .................. 28 Практикум по теме 5 ...................................................................... 32 Методические указания по выполнению практикума ............... 32 Задания практикума ................................................................... 32 Лабораторная работа 5.1. «Макроэкономическая модель Кейнса» ............................................................................................ 32 Практикум по теме 6 ...................................................................... 34 Методические указания по выполнению практикума ............... 34 Решение типовых задач ............................................................ 34 Задания практикума. .................................................................. 36 1 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE Лабораторная работа 6.1. «Проверка случайности ряда наблюдений» ................................................................................... 38 Лабораторная работа 6.2. «Сглаживание временного ряда» .......................................................................................................... 40 Лабораторная работа 6.3. «Оценка тренда и периодической составляющей»................................................................................ 41 Лабораторная работа 6.4. «Экспоненциальное сглаживание» .......................................................................................................... 42 Введение Целью выполнения контрольных заданий является более глубокое усвоение материала курса эконометрики, развитие навыков практического анализа, эконометрического исследования взаимосвязей экономических показателей. Характерной особенностью эконометрического исследования является необходимость анализа достаточно большого объема эмпирических данных, выполнение многочисленных и порой громоздких вычислений, поэтому основные задания предполагают использование Microsoft Excel. Практикум содержит как достаточно абстрактные задачи, целью которых в первую очередь являет закрепление теоретического материала, так и лабораторные работы, демонстрирующие практические методики прикладного эконометрического исследования. В то же время, лабораторные работы включают в себя задания (например, вычисление непосредственно по формулам) целью которых является выяснение студентами сути используемых теоретических приемов и формул. Такие задания отмечены в тексте звездочкой. Практические задания и лабораторные работы выполняются с использованием Microsoft Excel. Практикум не содержит систематического описания статистических функций Excel — в тексте описано их использование в рамках рассматриваемых задач. Отчет по лабораторной работе может быть представлен в виде файла Excel, содержащего расчеты, формулы и необходимые пояснения. Исходные данные, необходимые для выполнения работы, в практикуме не приведены и предоставляются преподавателем, ведущим практические занятия. Перед выполнением заданий практикума рекомендуется внимательно изучить материал контента, ответить на содержащиеся в нем вопросы для самостоятельного изучения, провести самостоятельный анализ всех разобранных примеров. 2 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE Практикум по теме 1 Методические указания по выполнению практикума Целью практикума является более глубокое усвоение темы, а также развитие следующих навыков: Обоснование выбора парной линейной модели; Построение модели выборочной парной линейной регрессии; Оценка адекватности построенной модели, статистической значимости коэффициентов, построение доверительных интервалов, построение прогнозов; Проверка основных предположений регрессионного анализа. Решение типовых задач ТЗ 1.1. Вычислите для парной линейной регрессии значения коэффициентов детерминации R 2 и корреляции rxy если известно, что n 30 , 100 ei2 103 627,8 , x 10,6 , y 406,7 , i 1 n (x x ) i 1 i 2 547,2 , 100 ( y y) i i 1 S y 120 . S x 4,34 , Проверьте 2 417 700,5 , значимость rxy . Вычислите коэффициенты выборочной парной линейной регрессии. Проверьте статистическую значимость коэффициента b . Постройте для него доверительный интервал. Постройте прогноз для значения x p 17 и доверительные интервалы прогноза. Решение. Для вычисления коэффициента детерминации воспользуемся определением: 30 R2 1 ( y y ) i 1 30 i ( y y) i 1 2 i 1 2 103627,8 0,7519 . 417700,5 i Так как R 2 rxy2 , то rxy 0,7519 0,8671 . Для проверки статистической значимости t -статистики корреляции вычислим значение корреляции: 3 коэффициента коэффициента МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE 0,8671 tr 28 9,21. 1- 0,86712 По таблице распределения Стьюдента с 28 степенями свободы и для уровня значимости 5% определяем критическое (табличное) значение: tтабл 2,0484 . Так как tr tтабл , то гипотезу H 0 : yx 0 следует отклонить и, следовательно, признать коэффициент rxy статистически значимым. Для нахождения коэффициентов выборочной парной линейной регрессии воспользуемся формулами связи коэффициентов с выборочными характеристиками: s 120 b y rxy 0,8671 23,9752 sx 4,34 и s a y y rxy x 406,7 23,9752 0,8671 152,7969 . sx Для того, чтобы проверить статистическую значимость коэффициента регрессии, прежде всего, необходимо вычислить значение выборочного остаточного среднего квадратического отклонения: n e 2 i 103627,8 60,8358 n2 28 Теперь можно определить стандартную ошибку коэффициента: S 60,8358 mb ост 2,6007 , sx n 4,35 30 с помощью которой находим соответствующую t -статистику b 23,9752 tb 9,21 . mb 2,6007 Sост i 1 Так как tb tтабл (значение tтабл , как и раньше, взято из таблицы распределения Стьюдента при 28 степенях свободы и уровне значимости 5%), то гипотезу H 0 : 0 следует отклонить и, следовательно, признать коэффициент b статистически значимым. Левая граница доверительного интервала для этого коэффициента, соответствующего уровню значимости 5%, имеет значение b mbtтабл 18,63 , правая граница — b mbtтабл 29,28 . Прогноз для значения x p 17 вычисляется непосредственной подстановкой этого значения в уравнение регрессии: 4 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE y p 152,7969 23,9752 17 560,07 . Стандартная ошибка прогноза функции регрессии (среднего значения) ( x p x )2 1 1 (17 10,6) 2 mEx ( y ) Sост 60,8358 20,01, 30 30 30 547,2 2 ( xi x ) i 1 а стандартная ошибка прогноза индивидуально значения ( x p x )2 1 1 (17 10,6)2 my p Sост 1 60,8358 1 64,04 . 30 30 30 547,2 2 ( xi x ) i 1 Тогда доверительный интервал прогноза среднего значения, соответствующий 5% уровню значимости, имеет левую границу, равную и правую границу — y p mEx ( y ) tтабл 519,09 y p mEx ( y ) tтабл 601,06 . Левая граница доверительного интервала прогноза индивидуального значения y p my p tтабл 428,89 , правая граница — y p my p tтабл 691,26 . Задания практикума 1.1. По выборке объемом 10 наблюдений получены следующие результаты: S 34,49 , 2 x 10 xi2 12000 , i 1 S 66,93 , 2 y 10 x i 1 10 y i 1 2 i i 100 , 10 y i 1 i 200 , 10 x y i 1 i 21000 , i 45000 . Оцените коэффициент корреляции rxy . Проверьте его значимость. 1.2. Вычислите коэффициент корреляции, проверьте его статистическую значимость X 1 2 3 4 5 Y 0 2 3 5 6 1.3 По выборке объемом 10 наблюдений получены следующие результаты: 10 x i 1 10 y i 1 2 i 45000 . i 100 , Оцените 10 y i 1 по i 200 , 10 x y i 1 методу i i 21000 наименьших коэффициенты парной линейной регрессии y на x . 5 10 x i 1 2 i 12000 квадратов МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE 1.4. Вычислите коэффициенты выборочной парной линейной регрессии, если известно, что Sост 26,5 , x 21, y 112,45 , S x2 64 , SY2 225 , rxy 0,8 . 1.5. По имеющимся данным оцените параметры парной линейной регрессионной зависимости y t . t 1 3 6 y 4 5 8 1.6. Вычислите для парной линейной регрессии значения коэффициентов детерминации R 2 и корреляции rxy если известно, что n 100 , 100 ei2 1100 , y 470 , i 1 100 ( y y) i i 1 2 22500 , S x2 115 , S y2 225 . Проверьте значимость rxy . 1.7. Вычислите для парной линейной регрессии значения коэффициентов детерминации R 2 и корреляции rxy если известно, что n 100 , 100 , ( yi y ) 10000 , 2 y 470 , i 1 100 ( y y) i 1 i 2 22500 , S x2 121 , S 225 .Проверьте значимость rxy . 1.8. Проверьте значимость выборочного коэффициента корреляции если известно, что rxy 0,92 n 27, Sост 120000, x 171, y 28 . 1.9. Проверьте значимость и постройте доверительные интервалы для коэффициентов парной линейной регрессии (в таблице приведены результаты расчета с помощью функции ЛИНЕЙН): 23,677 14 09724 7,0581 2,4164 28, 18105 23179 0,7742 57, 10261 90167 96,009 17851 28 32188 93 0,6662 872,89 1.10. Постройте доверительный интервал прогноза условного математического ожидания (функции регрессии) если известно, что x p 20 , x 10,83 , S x2 19,8, (в таблице приведены результаты расчета с помощью функции ЛИНЕЙН): 2 y 6 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE 23,677 14 09724 7,0581 2,4164 28, 18105 23179 0,7742 57, 10261 90167 96,009 17851 28 32188 93 0,6662 872,89 1.11. Постройте доверительный интервал прогноза индивидуального значения, если известно, что x p 20 , x 10,83 , S x2 19,8, (в таблице приведены результаты расчета с помощью функции ЛИНЕЙН): 23,677 14 09724 7,0581 2,4164 28, 18105 23179 0,7742 57, 10261 90167 96,009 17851 28 32188 93 0,6662 872,89 Лабораторная работа 1.1. «Парная линейная регрессия» Задание По выборке необходимо построить эмпирическую парную линейную регрессию, проверить ее статистическую значимость и построить прогноз. 1. Для заданных исходных данных постройте поле корреляции — диаграмму зависимости показателя y от фактора x . При построении выберите тип диаграммы «Точечная» (без отрезков, соединяющих точки). 2*. Вычислите выборочные характеристики: — выборочные средние x и y (функция СРЗНАЧ); — выборочные дисперсии S x2 и S y2 (функция ДИСПР); 7 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE — выборочное среднее квадратические отклонения S x и S y (функция СТАНДОТКЛОНП); — выборочный коэффициент корреляции rxy (функция ПИРСОН или КОРРЕЛ). 3. Вычислите коэффициенты выборочной линейной регрессии. Для вычисления коэффициентов регрессии воспользуйтесь встроенной функцией ЛИНЕЙН (функция находится в категории «Статистические»), обратите внимание, что эта функция является функцией массива, поэтому ее использование подразумевает выполнение следующих шагов: 1) В свободном месте рабочего листа выделите область ячеек размером 5 строк и 2 столбца для вывода результатов; 2) В Мастере функций (категория «Статистические») выберите функцию ЛИНЕЙН. 3) Заполните поля аргументов функции: Известные_значения_y — адреса ячеек, содержащих значения признака y ; Известные_значения_x — адреса ячеек, содержащих значения фактора x ; Константа — значение (логическое), указывающее на наличие свободного члена в уравнении регрессии: укажите в поле Константа значение 1, тогда свободный член рассчитывается обычным образом (если значение поля Константа равно 0, то свободный член полагается равным 0); Статистика — значение (логическое), которое указывает на то, следует ли выводить дополнительную информацию по регрессионному анализу или нет: укажите в поле Статистика значение равное 1, тогда будет выводиться дополнительная регрессионная информация (если Статистика=0, то выводятся только оценки коэфициентов уравнения регрессии); 4) После того, как будут заполнены все аргументы функции, нажмите комбинацию клавиш <CTRL>+<SHIFT>+<ENTER>. Результаты расчета параметров регрессионной модели будут выведены в виде следующей таблицы: Значение коэффициента b Значение коэффициента a Стандартная ошибка mb Стандартная ошибка ma коэффициента b коэффициента a Стандартное отклонение Коэффициент детерминации 2 остатков S ост R Число степеней свободы, Значение F -статистики равное n 2 8 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE Регрессионная сумма квадратов Остаточная сумма квадратов n n ( yi y )2 e i 1 i 1 2 i 4*. Проверьте полученные значения коэффициентов a , b непосредственным вычислением по формулам. 5. Запишите найденной уравнение эмпирической регрессии. Дайте интерпретацию коэффициенту b . Вычислите по уравнению эмпирической регрессии значения yi a bxi , i 1, n . 6. Постройте на корреляционном поле прямую выборочной линейной регрессии по точкам yi a bxi , i 1, n . 7. Вычислите остатки ei yi yi . 8. Постройте график остатков (тип диаграммы — «Точечная»). 9. Найдите величину средней ошибки аппроксимации 1 n yi yi A 100% . n i 1 yi 10*. Вычислите коэффициент детерминации R 2 непосредственно по формуле. Дайте интерпретацию. Сравните полученное значение коэффициента детерминации с вычисленным ранее с помощью функции КОРЕЛЛ выборочным коэффициентом корреляции. 11*. Рассчитайте значение S ост , стандартные ошибки параметров линейной регрессии и коэффициента корреляции непосредственно по формулам. 12. Вычислите значения t -статистик коэффициентов выборочной регрессии. Проверьте статистическую значимость полученных значений коэффициентов регрессии и коэффициента корреляции. Табличные значения определите с помощью функции СТЬЮДРАСПОБР. Аргументы этой функции: Вероятность — уровень значимости (можно принять равным 0,05, т.е. 5%); Степени_свободы — число степеней свободы, для парной линейной регрессии равно n 2 , где n — число наблюдений. 13. Проверьте значимость в целом полученного уравнения регрессии по критерию Фишера. Значение Fтабл определите с помощью функции FРАСПОБР. Аргументы этой функции: Вероятность — уровень значимости (можно принять равным 0,05, т.е. 5%); Степени_свободы1 — число степеней свободы числителя, для парной регрессии равно 1 (т.к. один фактор); Степени_свободы2 — число степеней свободы знаменателя, для парной регрессии равно n 2 , где n — число наблюдений. 9 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE 14. Вычислите доверительные интервалы параметров линейной регрессии. Дайте им интерпретацию. 15. Постройте прогноз y p при значении фактора x на 30% превышающего его среднее значение. 16. Вычислите стандартные ошибки прогноза функции регрессии (среднего значения) и индивидуального значения, постройте доверительные интервалы полученных прогнозов. Дайте им интерпретации. 17. Получите результаты регрессионного анализа с помощью средства Регрессия из Пакета Анализа (Сервис/Анализ данных/Регрессия). Пакет анализа, при необходимости, может быть активирован в пункте Надстройки меню Сервис. В бланке запроса этой процедуры поля Входной интервал y, Входной интервал x, Константа имеют тот же смысл, что и для функции ЛИНЕЙН. В поле Метки поставьте флажок, если первая строка в указанном диапазоне данных содержит названия столбцов. Поставьте флажок в полях Остатки, График остатков, График подбора для того, чтобы получить соответствующую дополнительную информацию. Практикум по теме 2 Методические указания по выполнению практикума Целью практикума является более глубокое усвоение темы, а также развитие следующих навыков: Обоснование выбора линейной модели с несколькими факторами; Построение модели выборочной множественной линейной регрессии; Оценка адекватности построенной модели, статистической значимости коэффициентов, построение доверительных интервалов, построение прогнозов; Проверка основных предположений регрессионного анализа. Решение типовых задач ТЗ 2.1. Результаты расчетов параметров выборочной множественной регрессии с помощью функции ЛИНЕЙН приведены в таблице: 26,87 17,33 88,65 10 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE 8,07 0,84 70,82 349186 Известно также матрица 2,82 49,65 27 66568 29,90 #Н/Д #Н/Д #Н/Д 0,36 -0,01 -0,06 (X X ) -0,01 0,00 -0,01 -0,06 -0,01 0,03 и матрица выборочных парных коэффициентов корреляции 1 0,88 0,78 Q 0,88 1 0,68 0,78 0,68 1 Проверьте значимость коэффициентов выборочной регрессии и всего уравнения в целом. Постройте доверительные интервалы коэффициентов. Вычислите частные коэффициенты корреляции между y и объясняющими переменными, проверьте их значимость. Постройте прогноз для значений объясняющих переменных x1 10,83, x2 4,73 . Постройте доверительные интервалы прогноза функции регрессии и индивидуального значения. Решение. Для проверки значимости коэффициентов регрессии вычислим соответствующие значения t -статистик: b 17,33 b 26,87 tb1 1 6,15 , tb2 2 3,3 . mb1 2,82 mb2 8,07 Для уровня значимости 5% по таблице распределения Стьюдента с 27 степенями свободы находим критическое значение tтабл 2,0518 . Так как tb1 tтабл и tb2 tтабл , то гипотезы H 0 : 1 0 и H 0 : 2 0 отклоняются и коэффициенты признаются статистически значимыми. Из таблицы функции ЛИНЕЙН видно, что значение F -статистики равно 70,82. По таблице распределения Фишера, для уровня значимости 5%, степеням свободы 1 2 и 1 27 , находим критическое значение Fтабл 3,1277 . Так как F Fтабл , то гипотезу H 0 : 1 2 k 0 следует отклонить и, следовательно, признать построенное уравнение линейной регрессии статистически значимым. b1 , Доверительный интервал для коэффициента соответствующий уровню значимости 5% имеет левую границу, равную b1 mb1tтабл 11,55 и правую границу, равную b1 mb1tтабл 23,11 . T 1 11 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE Аналогичный доверительный интервал для коэффициента b2 имеет границы b2 mb2 tтабл 10,3 и b2 mb2 tтабл 43,44 . Для того чтобы вычислить частные коэффициенты корреляции найдем, прежде всего, матрицу, обратную к матрице выборочных коэффициентов корреляции: 6,09 -3,96 -2,06 1 Q -3,96 4,43 0,07 -2,06 0,07 2,55 С помощью этой матрицы вычислим частные коэффициенты корреляции: 3,96 2,06 ryx1|x2 0,76 , ryx2 |x1 0,52 . 6,09 4,43 6,09 2,55 Для того, чтобы проверить статистическую значимость частных коэффициентов корреляции вычислим их t -статистики: 0,76 0,52 tryx |x 29 33,91 , tryx |x 29 17,65 . 1 2 2 1 1 0,762 1 0,522 Критическое значение определим по таблице распределения Стьюдента для уровня значимости 5% и 29 степеней свободы: tтабл 2,05 . Так как оба значения t -статистик больше критического значения, то оба частных коэффициента корреляции признаются статистически значимыми. Точечный прогноз, соответствующий значениям объясняющих x1 10,83, x2 4,73 переменных вычислим непосредственной подстановкой этих значений в уравнение регрессии y p 88,65 17,33 10,83 26,87 4,73 403,41. Для построения доверительных интервалов прогноза вычислим стандартные ошибки прогнозов функции регрессии и индивидуального значения mEX ( y ) Sост x p ( XT X)1 xTp 49,65 0,033 9,07 , my p Sост 1 x p ( XT X)1 xTp 50,47 . Тогда доверительный интервал прогноза среднего значения, соответствующий 5% уровню значимости, имеет левую границу, равную и правую границу — y p mEx ( y ) tтабл 384,87 y p mEx ( y ) tтабл 421,95 . прогноза Левая индивидуального граница значения граница — y p my p tтабл 506,64 . 12 доверительного интервала y p m y p tтабл 300,18 , правая МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE Задания практикума 2.1. Вычислите стандартную ошибку выборочной множественной регрессии S ост , если известно, что y 178 , x 15 , S x 4,85 , n 50 , k 2 , ei2 750 . 2.2. Проверьте значимость коэффициентов выборочной множественной регрессии, постройте для них доверительные интервалы. В таблице приведены результаты вычислений с помощью функции ЛИНЕЙН: 0,012529 0,277187 0,070162888 72,81473 0,284479 0,12873 0,129283079 18,75412 0,290445 9,046342 #Н/Д #Н/Д 3,547553 26 #Н/Д #Н/Д 870,956 2127,744 #Н/Д #Н/Д 2.3. Вычислите стандартные ошибки коэффициентов множественной выборочной регрессии, проверьте статистическую значимость коэффициентов, если известно, что: 0,786 0,009 -0,101 -0,123 0,009 0,004 -0,008 -0,004 ( X T X )1 -0,101 -0,008 0,032 0,012 -0,123 -0,004 0,012 0,036 В таблице приведены результаты вычислений с помощью функции ЛИНЕЙН: 19,72891 40,90148929 12,87525 14,1564391 0,876987 44,37601667 #Н/Д #Н/Д 61,7864 26 #Н/Д #Н/Д 365015,1 51200,00225 #Н/Д #Н/Д 2.4. Проверьте значимость уравнения выборочной множественной регрессии в целом. Вычислите скорректированный коэффициент детерминации. В таблице приведены результаты вычислений с помощью функции ЛИНЕЙН: 0,012529 0,277187 0,070162888 72,81473 0,284479 0,12873 0,129283079 18,75412 0,290445 9,046342 #Н/Д #Н/Д 3,547553 26 #Н/Д #Н/Д 870,956 2127,744 #Н/Д #Н/Д 2.5. По ежемесячным данным за 6 лет построена выборочная множественная регрессия y 12,23 0,91x1 2,1x2 . Зависимый признак — объем потребления (в сотнях руб.), первый фактор — располагаемый доход (в тыс. руб.), второй фактор — процент банковской ставки по вкладам. Известны значения t -статистик 13 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE коэффициентов: tb1 123,7 , tb2 3,2 и коэффициента детерминации R2 0,976 . Дайте интерпретацию коэффициентам. Проверьте статистическую значимость коэффициентов. Найдите стандартные ошибки коэффициентов. Проверьте статистическую значимость коэффициента детерминации (значимость уравнения в целом по критерию Фишера). 2.6. Для выборочной множественной регрессии y 73,52 1,62 x1 2,25 x2 , отражающей зависимость среднего душевого дохода (в руб.) от средней заработной платы в день (в руб.) и среднего возраста (в годах), построенной по 30 наблюдениям известны выборочные коэффициенты корреляции ryx1 0,84 , ryx2 0,21 , rx1x2 0,116 . Дайте интерпретацию коэффициентам. Вычислите частные коэффициенты корреляции, сравните их с парными. 2.7. Вычислите частные коэффициенты корреляции между y и факторами, проверьте их значимость, если известна матрица выборочных коэффициентов корреляции: x1 x2 y y 1 0,87 0,84 x1 0,87 1 0,71 x2 0,84 0,71 1 2.8. По выборке объемом 50 наблюдений значений x1 , x2 , x3 вычислена следующая матрица выборочных коэффициентов корреляции: x1 x2 x3 x1 1 0,45 -0,35 x2 0,45 1 0,52 x3 -0,35 0,52 1 Найдите частные коэффициенты корреляции r12|3 , r23|1 , r13|2 , проверьте их статистическую значимость. 2.9. Для выборочной множественной регрессии y 73,52 1,62 x1 2,25 x2 , являющейся эмпирической оценкой зависимости среднего душевого дохода (в руб.) от средней заработной платы в день (в руб.) и среднего возраста (лет), вычислите средние коэффициенты эластичности и дайте им интерпретацию, если известно: Среднее значение Среднее квадратическое отклонение 14 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE Доход 86,8 11,44 Зарплата 54,9 5,86 Возраст 33,5 0,58 2.10. Для выборочной множественной регрессии y 73,52 1,62 x1 2,25 x2 , являющейся эмпирической оценкой зависимости среднего душевого дохода (в руб.) от средней заработной платы в день (в руб.) и среднего возраста (лет), построенной по 30 наблюдениям, вычислены выборочные парные коэффициенты корреляции ryx1 0,84 , ryx2 0,21 , rx1x2 0,116 и коэффициент детерминации R2 0,72 . Проверьте статистическую значимость уравнения в целом по критерию Фишера. По частному проверьте F -критерию целесообразность включения в уравнение фактора x2 после фактора x1 и наоборот — фактора x1 после фактора x2 . Лабораторная работа 2.1. «Множественная линейная регрессия» Задание По выборке построить эмпирическую множественную регрессию, поверить наличие мультиколлинеарности, статистическую значимость коэффициентов и всего уравнения в целом, построить прогноз. 1. Исследуется зависимость ежемесячного дохода y от затрат на рекламу x1 и числа торговых представителей x2 . Исходные данные представлены выборкой объема n . Постройте выборочные парные линейные регрессии — оценки зависимости результативного признака y от каждого из факторов, взятого по отдельности. В каждом случае постройте поле корреляции, определите коэффициенты уравнения выборочной линейной регрессии, коэффициент детерминации, коэффициент корреляции. Для вычислений можно воспользоваться функцией ЛИНЕЙН. 2. Перед построением множественной регрессии проверьте мультиколлинеарность факторов. Чем сильнее мультиколлинеарность факторов, тем менее надежны оценки. Для проверки мультиколлинерности (в случае двух факторов) можно вычислить определитель X T X — если этот определитель существенно отличен от 0, то проблемы мультиколлинеарности нет и можно найти коэффициенты уравнения множественной регрессии. 15 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE Для вычисления указанного определителя прежде всего 1 x11 x12 необходимо построить матрицу X , затем построить 1 x x n1 n 2 транспонированную к ней матрицу X T . После этого следует перемножить полученные матрицу, т.е. вычислить матрицу X T X и вычислить ее определитель. Для построения матрицы X T следует воспользоваться функцией ТРАНСП (категория «Ссылки и массивы»). Можно также скопировать в буфер обмена матрицу X , затем перейти на свободное место рабочего листа и выполнить команду Правка/Специальная вставка … Транспонировать. Произведение матриц вычисляется с помощью функции МУМНОЖ, аргументами которой являются адреса ячеек, в которых записаны перемножаемые матрицы. Перемножаемые матрицы должны удовлетворять условию соответствия размеров: матрица размера m n может быть умножена справа на матрицу размера n k , в результате получится матрица размера m k . В случае множественной регрессии с двумя факторами матрица X будет иметь размер n 3 , матрица X T — размер 3 n , а их произведение — размер 3 3 . Обратите внимание на то, что функция МУМНОЖ является функцией массива! Поэтому перед использованием функции МУМНОЖ необходимо 1) сначала выделить область размером m k , в которой будет записан результат вычислений. 2) затем с помощью Мастера Функций вставить функцию МУМНОЖ и заполнить поля ее аргументов. После этого в левой верхней ячейке выделенной области появится первый элемент результирующей матрицы. 3) Для вывода всей матрицы нажмите комбинацию клавиш <CTRL>+<SHIFT>+<ENTER>. Для вычисления определителя матрицы необходимо воспользоваться функцией МОПРЕД, единственным аргументом которой является массив (матрица), определитель которой надо вычислить. 3. Постройте матрицу Q , состоящую из выборочных коэффициентов корреляции (значенияэлементов этой матрицы можно получить с помощью функции КОРЕЛЛ или средства КОРЕЛЯЦИЯ из Пакета Анализа): 16 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE rx1xk 1 rx1x2 r 1 r x2 xk xx Q 2 1 . rx x rx x 1 k 2 k1 Присутствие в этой матрице значений больших 0,8 обычно свидетельствует наличии проблемы мультиколлинеаности. 4*. Для нахождения коэффициентов выборочной множественной регрессии непосредственно по формуле необходимо прежде всегонайти обратную матрицу X T X 1 с помощью функции МОБР. Функция МОБР является функцией массива и используется аналогично функции МУМНОЖ: 1) сначала необходимо выделить область ячеек, в которой будет записана обратная матрица, 2) затем вставить функцию МОБР, заполнить поле ее аргумента — единственным аргументом этой функции являются адреса ячеек, в которых находится обращаемая матрица. 3) Для вывода всей матрицы нажмите комбинацию клавиш <CTRL>+<SHIFT>+<ENTER>. Коэффициенты уравнения множественной регрессии вычисляются в матричном виде по формуле (a, b1 , , bk )T X T X X T y 1 — для этого необходимо (последовательно) 1) умножить матрицу X T X 1 на матрицу X T , 2) затем полученную матрицу необходимо умножить на вектор y . Запишите уравнение регрессии в развернутой форме, дайте интерпретацию коэффициентам. 5. Вычислите значения коэффициентов регрессии с помощью функции ЛИНЕЙН. Для того чтобы использовать эту функцию в случае множественной регрессии необходимо: 1) Сначала выделить на рабочем листе область размером 5 (k 1) , где k — число объясняющих переменных. 2) Затем заполнить поля аргументов этой функции, которые имеют тот же смысл, что и в случае парной регрессии: Известные_значения_y — адреса ячеек, содержащих значения признака y ; Известные_значения_x — адреса ячеек, содержащих значения всех объясняющих перменых. Обратите внимание: выборочные значения факторов должны располагаться рядом друг с другом (в смежной области), причем предполагается, что в первом столбце 17 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE (строке) содержатся значения первой объясняющей переменной, во втором столбце — второй и т.д. Константа — значение (логическое), указывающее на наличие свободного члена в уравнении регрессии: укажите в поле Константа значение 1, тогда свободный член рассчитывается обычным образом (если значение поля Константа равно 0, то свободный член полагается равным 0); Статистика — значение (логическое), которое указывает на то, следует ли выводить дополнительную информацию по регрессионному анализу или нет: укажите в поле Статистика значение равное 1, тогда будет выводиться дополнительная регрессионная информация (если Статистика=0, то выводятся только оценки коэффициентов уравнения регрессии); В случае двух объясняющих переменных ( k 2 ) результаты расчета параметров регрессии будут выведены в виде следующей таблицы: Значение Значение Значение коэффициента b2 коэффициента b1 коэффициента a Стандартная ошибка Стандартная ошибка Стандартная ошибка mb1 коэфф. b1 mb2 коэфф. b2 ma коэфф. a Оценка стандартного Коэффициент отклонения остатков н/д детерминации R 2 S ост Значение F Число степеней н/д свободы n k 1 статистики Ост. сумма квадратов Регр. сумма n н/д квадратов ( y y ) ( yi yi )2 n 2 i 1 i i 1 6*. Вычислите непосредственно по формуле множественный коэффициент детерминации R 2 и скорректированный коэффициент детерминации R 2 . Сравните полученные значения с коэффициентами детерминации парных линейных регрессий, полученных в п. 1. 7. Вычислите по найденному уравнению выборочной множественной регрессии значения yi yi ( x1 , x2 ) . 8. Вычислите остатки ei yi yi . 9. Найдите величину средней ошибки аппроксимации A . 10*. Вычислите значение F статистики непосредственно по формуле. Проверьте значимость уравнения регрессии в целом используя F -тест. 18 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE 11*. Вычислите стандартные ошибки коэффициентов регрессии: ma , mb1 , mb2 непосредственно по формулам. Проверьте значимость коэффициентов регрессии с помощью критерия Стьюдента. 12. Постройте доверительные интервалы для коэффициентов регрессии. 13. Постройте матрицу Q , состоящую из выборочных коэффициентов корреляции: ryxk ryxk 1 ryx1 ryx2 1 ryx1 ryx2 r r 1 r r yx 1 x1x2 x1 xk yx1 r Q ryx2 rx2 x1 1 rx2 xk yx2 . r r r r 1 yx yxk xk x1 xk x2 k Вычислите частные коэффициенты корреляции ryx1|x2 и ryx2 |x1 — Q вычисления удобнее проводить с помощью матрицы Q 1 . Сравните их с парными коэффициентами корреляции, полученными в п. 1. 14. Вычислите стандартизованные коэффициенты регрессии и частные коэффициенты эластичности. 15. Постройте прогноз y p для значений переменных на 30% превышающих их средние значения. 16. Вычислите стандартные ошибки прогноза функции регрессии (среднего значения) и индивидуального значения, постройте доверительные интервалы полученных прогнозов. Дайте им интерпретации. 17. Получите результаты регрессионного анализа с помощью Пакета Анализа (Сервис/Анализ данных … Регрессия). Использование этой процедуры аналогично случаю парной линейной регрессии, только при указании параметра Входной интервал_x следует указать все столбцы, содержащие значения всех факторов. Лабораторная работа 2.2. «Мультиколлинеарность и множественная линейная регрессия» Задание Исследовать случай мультиколлинеарности переменных, методы ее устранения. 19 объясняющих МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE 1. С помощью функции КОРЕЛЛ или средства РЕГРЕССИЯ из Пакета Анализа постройте матрицу выборочных коэффициентов корреляции: ryxk ryxk 1 ryx1 ryx2 1 ryx1 ryx2 1 rx1x2 rx1xk ryx1 ryx1 Q ryx2 rx2 x1 1 rx2 xk ryx2 . ryxk r r r 1 yx x x x x k 1 k 2 k Проанализируйте полученную матрицу: сделайте предположения о наличии или отсутствии проблемы мультиколлинеарности и о наличии зависимой переменной. 2. Вычислите определитель | XT X | . Подтверждает ли его значение Ваши предположения о мультиколлинеарности? 3. Вычислите коэффициенты выборочной множественной регрессии y на x1 , x2 и x3 с помощью функции ЛИНЕЙН или Пакета Анализа. 4. Проверьте статистическую значимость коэффициентов и всего уравнения регрессии в целом. 5. Сделайте вывод о необходимости исключения объясняющей переменной. Для проверки своего предположения постройте регрессию исключаемой переменной на остальные и проверьте ее значимость. 6. Постройте регрессию показателя на факторы, оставшиеся после исключения. Проверьте статистическую значимость коэффициентов и всего уравнения регрессии в целом. Исчезла ли проблема мультиколлинеарности? 7. Сравните значения коэффициента детерминации и скорректированного коэффициента детерминации для «длинной» регрессии с полным набором факторов и «короткой» регрессии с факторами, оставшимися после исключения. 8. Вычислите частные коэффициенты корреляции между показателем y и каждым фактором, а также между факторами. Для упрощения расчетов следует предварительно найти обратные матрицы Q 1 и Q 1 . 9*. Вычислите коэффициенты регрессии вручную по формуле. Сравните с результатами расчетов с помощью ЛИНЕЙН. Q 20 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE Лабораторная работа 2.3. «Процедура отбора переменных в модели множественной линейной регрессии» Задание Изучить процедуру пошагового отбора наиболее существенных переменных в случае множественной линейной регрессии. 1. Составьте корреляционную матрицу Q — сделайте предположения о мультиколлинеарности переменных, предложите список существенных переменных. 2. Постройте регрессии показателя на каждый фактор по отдельности — в каждом случае вычислите скорректированный коэффициент детерминации, проверьте значимость уравнения. На основании этого выберите наиболее существенный фактор. 3. Исследуйте целесообразность включения следующего фактора — определите фактор, который в паре с фактором, уже включенным на предыдущем шаге, дает наибольшее значение скорректированного коэффициента детерминации. Проверьте оправданность включения этого фактора по частному F -критерию. Проверьте статистическую значимость нового уравнения регрессии в целом каждого коэффициента по отдельности. 4. Исследуйте по F -критерию целесообразность включения в регрессию еще одного фактора из списка факторов, еще на включенных в уравнение. Проверьте значимость получаемого уравнения в целом и каждого коэффициента по отдельности. 5. Повторите эту процедуру до тех пор, пока не будет исчерпан список всех факторов. Запишите полученное уравнение множественной регрессии. Практикум по теме 3 Методические указания по выполнению практикума Целью практикума является более глубокое усвоение темы, а также развитие следующих навыков: Практическая проверка предположения регрессионного анализа о гомоскедастичности наблюдений. Практическая проверка предположения регрессионного анализа об отсутствии автокорреляции возмущений. Решение типовых задач 21 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE ТЗ 2.1. Проверьте гипотезу гомоскедастичности. Выборка объемом n 30 упорядочена по возрастанию значений объясняющей переменной и разбита на три части, результаты расчетов с помощью функции ЛИНЕЙН для первой и третьей частей приведены в таблицах. Первая часть: 3,05 2,12 0,12 1,63 0,99 2,52 642,28 9,00 4093,83 57,37 Третья часть: 2,37 30,48 0,64 32,44 0,60 13,50 13,61 9,00 2480,93 1640,24 Решение. Для проверки Голдфельда-Квандта квадратов: гипотезы гомоскедастичности по методу вычислим отношение остаточных сумм 11 F ( y y ) 2 (y y ) 2 i 1 30 i 20 i i i 2 Sост 1640,24 2 1 28,59 . Sост 2 57,37 i По таблице распределения Фишера определяем критическое значение, соответствующее доверительной вероятности 5%, число степеней свободы числителя и знаменателя равно 9 — Fтабл 3,18 . Так как F Fтабл , то гипотеза об отсутствии гетероскедастичности отклоняется. Задания практикума 3.1. Проверьте гипотезу гомоскедастичности. Выборка объемом n 30 упорядочена по возрастанию значений объясняющей переменной и разбита на три части, результаты расчетов с помощью функции ЛИНЕЙН для первой и третьей частей приведены в таблицах. Первая часть: 3,09 1,44 0,04 0,55 22 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE 1,00 5721,0 7 4205,0 0 0,86 9,00 6,62 Третья часть: 2,47 26,57 0,70 35,36 0,58 14,72 12,42 9,00 2690,72 1949,22 3.2. Проверьте гипотезу гомоскедастичности. Выборка объемом n 30 упорядочена по возрастанию значений объясняющей переменной и разбита на три части, результаты расчетов с помощью функции ЛИНЕЙН для первой и третьей частей приведены в таблицах. Первая часть: 2,16 3,66 0,28 1,53 0,88 1,91 61,48 8,00 223,72 29,11 Третья часть: 2,47 0,70 0,58 12,42 2690,72 26,57 35,36 14,72 9,00 1949,22 Лабораторная работа 3.1. «Метод Гольдфельда-Квандта проверки гипотезы гомоскедастичности» Задание 1. Постройте диаграмму корреляционного поля. Постройте выборочную линейную регрессию и диаграмму остатков (квадратов остатков) для исходной выборки — сделайте предположения о наличии гетероскедастичности. 2. Упорядочьте выборку по возрастанию значений объясняющей переменной. 23 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE 3. Полученная упорядоченная выборка разбивается на три части: первая и последняя содержат по l наблюдений, средняя — m n 2l наблюдений. Далее рассматриваются только две части: l первых наблюдений (с небольшими значениями объясняющей переменной, i 1,2, , l ) и l последних наблюдений (с большими значениями объясняющей переменной, i n l 1, , n ) наблюдений, а m центральных наблюдений исключаются из рассмотрения. При этом должно быть выполнено условие (n m) / 2 2 , например, если m 8 , то в этом случае можно взять l 11 , при этом из рассмотрения исключаются наблюдения ( x12 , y12 ), ,( x19 , y19 ) . Таким образом, наблюдения ( x1 , y1 ), ,( x11 , y11 ) составляют первую часть, а ( x20 , y20 ), ,( x30 , y30 ) — вторую часть. 4. По каждой части постройте свое уравнение выборочной парной регрессии. Для построения парных регрессий можно использовать функцию ЛИНЕЙН. 5*. Вычислите остаточные суммы квадратов для каждой части: l S 2 ост1 ( yi yi )2 — для первой части, 2 Sост 2 i 1 n i n l 1 ( yi yi )2 — для второй части. n 6. Вычислите отношение F i n l 1 l ( yi yi ) 2 ( y y ) i 1 i 2 2 Sост 2 2 и сравните с Sост1 i табличным значением Fтабл. . Значение Fтабл. определяется по таблице nm nm 2 2, 2 2 2 Значение Fтабл можно распределения Фишера со степенями свободы 1 на 5% уровне значимости ( 1 2 l 2 ). получить с помощью функции FРАСПОБР. Аргументы этой функции: Вероятность — уровень значимости , можно принять равным 0,05 (т.е. 5%); Степени_свободы1 — число степеней свободы числителя 2 ; Степени_свободы2 — число степеней свободы знаменателя 1 . 7.Сделайте вывод о принятии или отклонении гипотезы гомоскедастичности наблюдений. Лабораторная работа 3.2. «Критерий Дарбина-Уотсона» Задание 24 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE Проверить отсутствие автокорелляции первого порядка. 1. Постройте поле корреляции. 2. Используя функцию ЛИНЕЙН, найдите коэффициенты выборочной парной линейной регрессии. Проверьте статистическую значимость построенной регрессии. 3. Вычислите остатки и постройте график остатков в зависимости от значений фактора (тип диаграммы — Точечная, для наглядности можно выбрать вид с отрезками, соединяющими точки). 4. Вычислите статистику Дарбина–Уотсона по формуле n d (e e i 1 i i 2 )2 . n e i 1 2 i 5. Используя таблицу критических значений критерия Дарбина– Уотсона, сделайте вывод о наличии или отсутствии значимой автокорреляции в остатках. Наличие автокорреляции означает неадекватность построенной парной регрессии истинной зависимости и недостаточность построенной парной регрессии для прогнозирования. 6. Вычислите коэффициент автокорреляции первого порядка n r1 e e i 2 n i i 1 e i 1 , 2 i сравните его со значением критерия Дарбина–Уотсона: должно быть выполнено соотношение d 2(1 r1 ) . Практикум по теме 4 Методические указания по выполнению практикума Целью практикума является более глубокое усвоение темы, а также развитие следующих навыков: Оценка параметров нелинейных регрессий; Оценка качества построенной модели, выбор наиболее адекватной модели. Решение типовых задач ТЗ 4.1. По имеющимся данным оцените параметры следующей регрессионной зависимости y t 25 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE t 1 4 16 y 3,5 11 29 ln y 1,25 2,4 3,37 0 0,69 1,1 ln t Проверьте статистическую значимость линеаризованной формы. Вычислите индекс детерминации непосредственно по формуле. Вычислите среднюю абсолютную ошибку аппроксимации и среднее абсолютное отклонение. Решение. Прологарифмировав уравнение регрессионной зависимости, получаем: ln y ln ln t ln . Обозначив через y ln y, x ln x, ln , ln , получаем модель линейной регрессии y x . Оценки параметров этой модели с помощью МНК: a 1,21 , b 1,9 . С помощью обратного преобразования получаем, что оценка параметра : a ea e1,21 3,35 . Оценка параметра : b b 1,9 . Таким образом, оценкой нелинейной регрессионной модели является выборочная нелинейная регрессия y 3,35 t1,9 . Коэффициент детерминации линеаризованной формы 2 R 0,9896 , а значение F -статистики равно 95,26. Сравнивая это значение с критическим значением, полученным по таблице распределения Фишера для уровня значимости 5% и степеней свободы числителя и знаменателя равными 1, имеем: F Fтабл 161,45 . Таким образом, найденная регрессия (линейная форма) должна быть признана статистически незначимой. Вычислим значения согласно уравнению выборочной регрессии: y1 3,35 , y2 12,5 , y2 27,01 . Выборочная средняя значений y равна 14,5. Теперь можно вычислить индекс детерминации непосредственно по формуле 3 R2 1 ( y y ) i 1 3 i ( y y) i 1 2 i 0,9819 . 2 i Средняя абсолютная ошибка аппроксимации составляет 1 3 yi yi A 100% 8,3% . 3 i 1 yi Среднее абсолютное отклонение 26 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE MAD 1 3 yi yi 1,21. 3 i 1 Задания практикума 4.1. По имеющимся данным оцените параметры следующей регрессионной зависимости y e t t 1 2 3 y 0,85 0,45 0,4 ln y -0,16 -0,8 -0,92 0 1,39 2,77 ln t Проверьте статистическую значимость линеаризованной формы. Вычислите индекс детерминации непосредственно по формуле. Вычислите среднюю абсолютную ошибку аппроксимации и среднее абсолютное отклонение. 4.2. По имеющимся данным оцените параметры следующей регрессионной зависимости y t 27 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE t 1 4 16 y 2 6 10 ln y 0,69 1,79 2,3 0 1,39 2,77 ln t Проверьте статистическую значимость линеаризованной формы. Вычислите индекс детерминации непосредственно по формуле. Вычислите среднюю абсолютную ошибку аппроксимации и среднее абсолютное отклонение. 4.3. По имеющимся данным оцените параметры следующей 1 регрессионной зависимости yi i x 2 3 4 x y 3,6 2,8 2,5 Проверьте статистическую значимость линеаризованной формы. Вычислите индекс детерминации непосредственно по формуле. Вычислите среднюю абсолютную ошибку аппроксимации и среднее абсолютное отклонение. Лабораторная работа «Нелинейная регрессия» Задание В этой работе для одних и тех же исходных данных, представляющих собой парную выборку, необходимо построить различные регрессии. В каждом случае необходимо вычислить коэффициенты выборочной регрессии, построить линию выборочной регрессии на корреляционном поле (на одном и том же!), проверить статистическую значимость линеаризованной формы и показатели, позволяющие сделать вывод об адекватности модели — среднюю абсолютную 1 n yi yi 100% , среднее абсолютное ошибку аппроксимации A n i 1 yi отклонение MAD 1 n yi yi , n i 1 стандартную Sост i 1 n k 1 регрессии n n ( yi yi )2 ошибку , индекс детерминации R 2 1 (y y ) i 1 n i 2 i ( y y) i 1 28 i . 2 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE 1. Постройте поле корреляции. Сделайте предположения о форме зависимости показателя от фактора. 2. Найдите оценки коэффициентов парной линейной регрессии y на x . Вычислите значения yi , постройте на корреляционном поле прямую парной линейной регрессии. Проверьте статистическую значимость регрессии. Вычислите среднюю ошибку аппроксимации A , среднее абсолютное отклонение Sост , стандартную ошибку регрессии коэффициент MAD , детерминации. 3. Найдите оценки коэффициентов квадратичной регрессии yi 1 xi 2 xi2 i . Оценки коэффициентов a, b1 , b2 найдите с помощью МНК для множественной линейной регрессии yi 1 xi 2 zi i , которая получается из исходной с помощью замены zi xi 2 . Проверьте статистическую значимость линеаризованной формы. Вычислите значения yi a b1xi b2 xi2 , по найденным значениям постройте на поле корреляции параболу квадратичной регрессии. Вычислите непосредственно по формулам среднюю ошибку аппроксимации MAD , A , среднее абсолютное отклонение стандартную ошибку регрессии Sост , индекс детерминации. Сравните значение индекса детерминации, вычисленного непосредственно по формуле, с коэффициентом детерминации для линеаризованной формы и квадратом коэффициента парной корреляции rxy2 . 4. Найдите оценки гиперболической (обратной) регрессии 1 yi i . Оценки найдите с помощью МНК для парной линейной x регрессии yi zi i , которая получается из исходной заменой 1 zi . Проверьте статистическую значимость линеаризованной xi формы. 1 Вычислите значения yi a b , по найденным значениям xi постройте на поле корреляции линию регрессии. Вычислите непосредственно по формулам среднюю ошибку аппроксимации MAD , A , среднее абсолютное отклонение стандартную ошибку регрессии Sост , индекс детерминации. Сравните значение индекса детерминации, вычисленного непосредственно по 29 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE формуле, с коэффициентом детерминации для линеаризованной формы и квадратом коэффициента парной корреляции rxy2 . 5. Найдите оценки степенной регрессии yi xi i . Оценки найдите с помощью обратного преобразования оценок a, b МНК для парной линейной регрессии yi zi i , которая получается из исходной логарифмированием и заменой yi ln yi , zi ln xi , ln , i ln i . Проверьте статистическую значимость линеаризованной формы. Вычислите значения yi AxiB , где A ea , B b . По найденным значениям постройте на поле корреляции линию регрессии. Вычислите непосредственно по формулам среднюю ошибку аппроксимации MAD , A , среднее абсолютное отклонение стандартную ошибку регрессии Sост , индекс детерминации. Сравните значение индекса детерминации, вычисленного непосредственно по формуле, с коэффициентом детерминации для линеаризованной формы и квадратом коэффициента парной корреляции rxy2 . 6. Найдите оценки показательной регрессии yi i i . Оценки найдите с помощью обратного преобразования оценок a, b МНК для парной линейной регрессии yi xi i , которая получается из исходной регрессии логарифмированием и заменой yi ln yi , ln , ln , i ln i . Проверьте статистическую значимость линеаризованной формы. x Вычислите значения yi AB i , где A ea , B eb . По найденным значениям постройте на поле корреляции линию регрессии. Вычислите непосредственно по формулам среднюю ошибку аппроксимации MAD , A , среднее абсолютное отклонение стандартную ошибку регрессии Sост , индекс детерминации. Сравните значение индекса детерминации, вычисленного непосредственно по формуле, с коэффициентом детерминации для линеаризованной формы и квадратом коэффициента парной корреляции rxy2 . x 7. Найдите оценки экспоненциальной регрессии yi e xi i . Оценки найдите с помощью обратного преобразования оценок a, b МНК для парной линейной регрессии yi xi i , которая получается из исходной логарифмированием и заменой yi ln yi , ln , i ln i . Проверьте статистическую значимость линеаризованной формы. 30 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE Вычислите значения yi Ae Bxi , где A ea , B b . По найденным значениям постройте на поле корреляции линию регрессии. Вычислите непосредственно по формулам среднюю ошибку аппроксимации MAD , A , среднее абсолютное отклонение стандартную ошибку регрессии Sост , индекс детерминации. Сравните значение индекса детерминации, вычисленного непосредственно по формуле, с коэффициентом детерминации для линеаризованной формы и квадратом коэффициента парной корреляции rxy2 . 8. Найдите оценки логарифмической регрессии yi ln xi i . Оценки найдите с помощью МНК для парной линейной регрессии yi zi i , которая получается из исходной заменой zi ln xi . Проверьте статистическую значимость линеаризованной формы. Вычислите значения yi a b ln xi . По найденным значениям постройте на поле корреляции линию регрессии. Вычислите непосредственно по формулам среднюю ошибку аппроксимации MAD , A , среднее абсолютное отклонение стандартную ошибку регрессии Sост , индекс детерминации. Сравните значение индекса детерминации, вычисленного непосредственно по формуле, с коэффициентом детерминации для линеаризованной формы и квадратом коэффициента парной корреляции rxy2 . 9. Сравните построенные регрессии — какая кажется Вам наиболее подходящей (наилучшей)? 10. Использование стандартных средств Excel. Для подбора и оценки адекватности регрессии (в особенности нелинейной) в Excel имеется встроенное средство построения основных видов регрессий, использование которого основано на графическом представлении выборки. Для того чтобы воспользоваться этим средством постройте еще раз (лучше на отдельном листе) поле корреляции. Для того чтобы добавить в построенную диаграмму линию регрессии, выберите в главном меню Диаграмма пункт Добавить линию тренда (или, выделив ряд данных щелкните правой кнопкой и в контекстном меню выберите Добавить линию тренда). В появившемся диалоговом окне Линия тренда, прежде всего, необходимо на вкладке Тип указать тип тренда. На вкладке Параметры этого окна необходимо указать дополнительные параметры: необходимость вывод уравнения регрессии и значения индекса детерминации R 2 на диаграмме. 31 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE Постройте с помощью этого средства на одной диаграмме линии линейной, квадратичной, степенной, экспоненциальной и логарифмической регрессий. Практикум по теме 5 Методические указания по выполнению практикума Целью практикума является более глубокое усвоение темы, а также развитие следующих навыков: Использование косвенного метода наименьших квадратов для решения системы одновременных уравнений; Проверка идентифицируемости системы. Задания практикума Лабораторная работа 5.1. «Макроэкономическая модель Кейнса» Задание. Рассматривается классическая макроэкономическая модель Кейнса для экономики страны, которая имеет следующий вид: C Y , (1) Y C X, где C — личное потребление в постоянных ценах; Y — национальный доход в постоянных ценах; X — инвестиции в основной капитал и в запасы экспорта и импорта; — случайная составляющая ( N (0, 2 ) ); , — параметры (неизвестные) линейной зависимости потребления C от Y . В этой модели C и Y — эндогенные переменные, X — экзогенная переменная. Система уравнений (1) задает структурную форму модели. Для построения оценок a и b параметров , используется косвенный метод наименьших квадратов (КМНК). Для его применения строится система приведенных уравнений, в которой эндогенные переменные C и Y выражаются через экзогенную переменную X : C A1 B1 X u, (2) Y A2 B2 X u. Здесь A1 , A2 , B1 , B2 ( A1 A2 ) — параметры, определяемые через структурные коэффициенты и ; случайная составляющая u определяется через случайную составляющую и структурный коэффициент . 32 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE Далее по известным данным xi , yi , ci , i 1, n , строятся оценки A1 , A2 , B1 , B2 коэффициентов выборочных парных линейных регрессий C A1 B1 X , (3) Y A2 B2 X , после чего необходимо выразить из второго уравнения X через Y и подставить в первое уравнение. В результате получаем эмпирическую оценку функции (4) C a bY , где a и b — оценки структурных параметров и соответственно. Задание 1*. Постройте приведенную форму (2) модели Кейнса. Для этого получите аналитические выражение коэффициентов A1 , A2 , B1 , B2 через коэффициенты и структурной формы модели (1), а также выражение случайной составляющей u через . 2. Исходная выборка представляет собой n наблюдений ( X i , Yi , Ci ) . Для того, чтобы оценить преимущества косвенного методы наименьших квадратов смоделируйте выборку из n наблюдений ( X i , Yi , Ci ) . Для этого: а) задайте произвольно n значений экзогенной переменной X i ; б) значения случайной составляющей i , возьмите из нормального распределения N (0, 2 ) ; при построении значений i можно воспользоваться функциями СЛЧИС и НОРМОБР или возможностями пакета Анализ данных; в) значения и задайте произвольно; г) по полученным ранее значениям X i , i , с помощью системы приведенных уравнений (2) и выражения коэффициентов A1 , A2 , B1 , B2 через коэффициенты и найдите соответствующие значения Yi , Ci , i 1, n . 3. По выборке найдите коэффициенты A1 , A2 , B1 , B2 двух парных линейных регрессий (3). Для нахождения коэффициентов выборочных регрессий воспользуйтесь функцией ЛИНЕЙН. Проверьте статистическую значимость построенных регрессий. 4. Используя полученные в п. 3 оценки коэффициентов парных регрессий (3), найдите зависимость (4) значений C от Y , т.е. получите явное аналитическое выражение коэффициентов a и b , которые, в свою очередь, являются, оценками структурных коэффициентов и (сравните эти значения). Вычислите непосредственно по формуле 33 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE значение коэффициента детерминации для полученной регрессии. Проверьте ее статистическую значимость. 5. Для того чтобы убедиться в преимуществе подобного метода построения оценок структурных коэффициентов, сравните полученные оценки с оценками, определяемыми при построении «прямых» регрессий. Для этого, с помощью значений Yi , Ci , i 1, n постройте парную регрессию C на Y обычным методом наименьших квадратов с помощью функции ЛИНЕЙН: C a1 b1Y . Проверьте ее статистическую значимость. 6. Сравните оценку b , найденную в п. 4, и оценку b1 , полученную в п. 5 со значением . Практикум по теме 6 Методические указания по выполнению практикума Целью практикума является более глубокое усвоение темы, а также развитие следующих навыков: Оценка тренда и сезонной компоненты временного ряда; Сглаживание временных рядов; Оценка адекватности построенной модели. Решение типовых задач ТЗ 6.1. Рассматривается аддитивная модель временного ряда, содержащая тренд и сезонную компоненту. По 20 квартальным наблюдениям, образующим временной ряд, был оценен линейный тренд: 1,48 40,40 0,02 0,29 1,00 0,54 5066,53 18,00 1466,26 5,21 В таблице приведены остатки тренда — разности между уровнями временного ряда и значениями тренда ettr 11,48 -4,46 -8,45 2,71 6,90 0,87 34 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE -10,16 1,43 8,56 -5,22 -5,77 0,13 9,25 -0,17 -10,20 3,63 8,39 -5,65 -8,70 5,28 Оцените сезонную компоненту с периодом 4, постройте прогноз на следующие четыре квартала. Решение. Воспользуемся формулой для вычисления сезонных компонент 1 m1 St ( yt jT ut jT ), t 1,2, , T , m j 0 в которой число периодов m 5 , длина периода T 4 . Для того, чтобы вычислить оценку первой сезонной компоненты необходимо найти среднее значение остатков e1tr , e5tr , e9tr , e13tr и e17tr : 1 S1 (11,48 6,9 8,56 9,25 8,39) 8,92 . 5 Вычисляя аналогично, получаем 1 S2 (4,46 0,87 5,22 0,17 5,65) 2,93 , 5 1 S3 (8,45 10,16 5,77 10,20 8,7) 8,66 , 5 1 S4 (2,71 1,43 0,13 3,63 5,28) 2,64 . 5 Прогноз на следующие четыре квартала представляет собой сумму значений тренда и соответствующих сезонных компонент: y21 40,4 1,48 21 8,92 80,5 , y22 40,4 1,48 22 2,93 70,14 , y23 40,4 1,48 23 8,66 69,9 , y24 40,4 1,48 24 2,64 78,68 . 35 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE Задания практикума. 6.1. Рассматривается аддитивная модель временного ряда, содержащая тренд и сезонную компоненту. По 20 квартальным наблюдениям, образующим временной ряд, был оценен линейный тренд: 1,58 39,50 0,21 3,04 0,71 7,21 55,18 22,00 2867,40 1143,19 В таблице приведены остатки тренда — разности между уровнями временного ряда и значениями тренда ettr 12,1 1 3,94 8,02 3,05 7,15 1,03 10,11 1,39 8,43 5,45 6,09 0,29 8,74 0,77 10,89 2,84 7,50 6,63 36 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE 9,77 4,12 Оцените сезонную компоненту с периодом 4, постройте прогноз на следующие четыре квартала. 6.2. Рассматривается аддитивная модель временного ряда, содержащая тренд и сезонную компоненту. По 20 квартальным наблюдениям, образующим временной ряд, был оценен линейный тренд: 1,58 66,57 0,02 0,25 1,00 0,54 5771,91 18,00 1670,40 5,21 В таблице приведены остатки тренда — разности между уровнями временного ряда и значениями тренда ettr 8,31 7,63 11,62 0,46 3,73 2,30 13,33 1,74 5,39 8,39 8,94 3,04 6,08 37 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE 3,34 13,37 0,46 5,22 8,82 11,87 2,11 Оцените сезонную компоненту с периодом 4, постройте прогноз на следующие четыре квартала. Лабораторная работа 6.1. «Проверка случайности ряда наблюдений» Задание Проверить независимость и стационарность ряда наблюдений по двум критериям. Гипотеза проверяется с целью обнаружения детерминированной составляющей во временном ряду. Для того чтобы правильно проанализировать серии, можно воспользоваться условным форматированием Формат\Условное форматирование. Задав условия на значения исходного ряда на сравнение с медианой или с предыдущим значением, необходимо определить формат ячейки, например, цвет шрифта или заливку ячейки, что облегчит подсчет и анализ серий. Можно воспользоваться функцией ЕСЛИ, которая позволяет сформировать дополнительный ряд значений в зависимости от значения текущих ячеек. Например, в этом ряду будет стоять 1, если значение текущей ячейки меньше медианы, 0 — если равно медиане, и –1 — если больше медианы. 1. Постройте диаграмму временного ряда. А). Критерий серий, основанный на медиане выборки. 1. Определите медиану временного ряда. Для этого можно воспользоваться функцией МЕДИАНА, аргументом которой является диапазон ячеек, содержащий ряд данных. При использовании этой функции нет необходимости предварительно ранжировать исходный ряд. Если для исходного ряда предварительно построить ранжированный ряд (т. е. ряд, элементы которого располагаются в 38 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE порядке возрастания, т. н. вариационный ряд y(1) y(2) y( n) ), то медиана определяется по формуле y( m1) , если n 2m 1 med y( m ) y( m1) . , если n 2m 2 2. Сравнивая значения исходного ряда yi , i 1, , n с медианой, составьте последовательность d1 , d 2 , , d n по формуле , если yi med di 0, если yi med . , если y med i В дальнейшем рассматриваются только плюсы и минусы, нули не участвуют в анализе. 3. Определите число серий (n) в последовательности di , i 1, , n . Под серией понимается последовательность подряд идущих плюсов или минусов. Один отдельно стоящий плюс или минус тоже считается серией. 4) Найдите max (n) — протяженность самой длинной серии. 5) Сделайте вывод об отсутствии или наличии тенденции: При условии случайности ряда y1 , y2 , yn (т.е. при отсутствии тенденции) протяженность самой длинной серии не должна быть слишком большой, а общее число серий — слишком маленьким. Поэтому, если нарушается хотя бы одно из следующих неравенств, то гипотеза о случайности отвергается для приблизительно 5% уровня значимости: (n) [ 12 (n 1 1,96 n 1] , max (n) [3,3lg(n 1)] здесь с помощью квадратных скобок A обозначена целая часть числа A . Для нахождения целой части используется функция ЦЕЛОЕ. Если оба неравенства выполнены, то гипотеза случайности принимается. Б) Критерий «восходящих и нисходящих» серий. 1) Для исходного ряда y1 , y2 , yn составьте последовательность знаков d1 , d 2 , , d n1 по следующему правилу: , если yi 1 yi 0 di 0, если yi 1 yi 0 , , если y y 0 i 1 i 39 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE В дальнейшем рассматриваются только плюсы и минусы, нули не участвуют в анализе. 2. Определите (n) — число серий в последовательности di , i 1, , n 1 . Под серией понимается последовательность подряд идущих плюсов или минусов. Один отдельно стоящий плюс или минус тоже считается серией. 3. Найдите max (n) — протяженность самой длинной серии. 4. Сделайте вывод об отсутствии или наличии тенденции: В условиях случайности число серий не должно быть слишком маленьким, а протяженность самой длинной серии — слишком большой. Если нарушается хотя бы одно из следующих двух неравенств, то гипотеза случайности отвергается для приблизительно 5% уровня значимости: 16n 29 ], (n) [ 13 (2n 1) 1,96 90 (n) (n) 0 max где 5, n 26 0 (n) 6, 26 n 153 . 7, 153 n 1170 Если оба неравенства выполнены, то гипотеза случайности принимается. Лабораторная работа 6.2. «Сглаживание временного ряда» Задание Провести сглаживание временного ряда с помощью простой скользящей средней и взвешенной скользящей средней. 1. Постройте диаграмму временного ряда. 2. Проведите сглаживание временного ряда с помощью простой скользящей средней, используя три интервала сглаживания: y yt yt 1 g 3 , yt t 1 , t 2, , n 1 , 3 y yt 1 yt yt 1 yt 2 g 5 , yt t 2 , t 3, , n 2 , 5 1y y y y 1y t 2 t 1 t t 1 2 t 2 , t 3, , n 2 . g 4 , yt 2 4 40 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE 3. Проведите сглаживание временного ряда с помощью взвешенной скользящей средней: 1 g 5 , yt (3 yt 2 12 yt 1 17 yt 12 yt 1 3 yt 2 ), t 3, , n 2 . 35 4. Постройте на одной диаграмме графики исходных и сглаженных временных рядов. 5. Для каждого сглаженного ряда вычислите остатки, проверьте отсутствие тенденции и авокорреляции, постройте диаграмму остатков. Лабораторная работа 6.3. «Оценка тренда и периодической составляющей» Задание Исследуется аддитивная модель временного ряда, включающая тренд и сезонную компоненту. Необходимо оценить тренд и сезонную составляющую, построить модель временного ряда, проверить ее адекватность, построить прогноз. 1. Постройте диаграмму временного ряда. 2. Оценить тренд и периодическую составляющую ряда можно с помощью следующего метода. По двумерной выборке (1, y1 ),(2, y2 ), ,(n, yn ) постройте с помощью функции ЛИНЕЙН парную регрессию показателя y на фактор t : yˆttr trt a bt , которая и будет рассматриваться как оценка тренда. Перед построением регрессии можно провести сглаживание временного ряда с помощью простой скользящей средней — интервал сглаживания обычно выбирают равным периоду сезонных колебаний. В этом случае тренд строится по сглаженным данным. 3. Устраните этот тренд из исходного временного ряда, для этого вычислите остатки тренда (разности между исходным значением временного ряда и трендом) ettr yt trt , t 1, , n . Постройте диаграмму остатков тренда. 4. Оцените по диаграмме остатков тренда число периодов и длину периода временного ряда — убедитесь, что в n наблюдениях n содержится целое число периодов m , где T — длина периода. T 41 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE 5. По остаткам тренда найдите оценку периодической составляющей: для каждого из моментов времени, входящего в период вычислите 1 m1 1 m1 St ettr jT ( yt jT trt jT ), t 1,2, , T m j 0 m j 0 Постройте график периодической составляющей на диаграмме остатков тренда (где St St T St 2T St ( m1)T для t 1, ,T ). 6. Вычислите значения, представляющие собой эмпирическую модель временного ряда yˆt trt St , t 1, , n . Постройте график эмпирической модели ряда на диаграмме временного ряда. 7. Вычислите остатки модели: et yt yˆt yt (trt St ), t 1, , n , где St St T St 2T St ( m1)T для t 1, ,T . 8. Постройте график остатков модели. 9. Рассчитайте прогнозные значения показателя на два периода вперед по формуле из п. 6. Прогноз представляет собой сумму значения тренда trt (который вычисляется с помощью прямой подстановки значений t в уравнение тренда) и значения сезонной компоненты St , соответствующей рассматриваемому моменту времени (при вычислении сезонной составляющей необходимо определить соответствующее значение номера сезона внутри периода). 10. Исследуйте остатки et : проверьте гипотезу случайности остатков (например, по критерию серий, основанному на медиане выборки) и наличие автокорреляции по критерию Дарбина-Уотсона. 11. Вычислите среднюю абсолютную ошибку аппроксимации. Сделайте вывод об адекватности построенной модели. Лабораторная работа 6.4. «Экспоненциальное сглаживание» Задание Провести экспоненциальное сглаживание временного ряда, изучить влияние значения константы сглаживания. 1. Постройте диаграмму временного ряда. 2. Постройте сглаживающую кривую методом экспоненциального сглаживания при значении константы сглаживания 0,3 : 42 МЕЖДУНАРОДНЫЙ БАНКОВСКИЙ ИНСТИТУТ INTERNATIONAL BANKING INSTITUTE St St 1 ( yt St 1 ) , t 1,2, .n В качестве начального значения возьмите среднее значение y y2 y3 первых трех уровней ряда: S0 1 . 3 3. Изучите, как влияет на кривую экспоненциального сглаживание значение константы сглаживания — постройте сглаживающие кривые для 0,1, 0,01, 0,9 . 4. Для каждого сглаженного ряда вычислите остатки и постройте графики остатков. Проверьте автокоррелированность и наличие тенденции в остатках. 43