Вариант 9 Задача 1 По 10 однотипным предприятиям имеются данные о реализованной продукции (х, тыс. руб.) и накладных расходах по реализации этой продукции (у, тыс. руб.): x y 11,0 12,0 15,4 17,5 0,462 0,506 0,765 0,804 18,8 0,872 20,8 0,939 23,4 0,998 26,1 1,002 29,0 1,108 35,6 1,368 1) Найти линейный коэффициент корреляции. Сделать вывод. 2) Найти коэффициент детерминации. Сделать вывод. 3) Найти МНК-оценки параметров уравнения парной линейной регрессии вида y 0 1 x . Пояснить экономический смысл полученных результатов. 4) Проверить значимость коэффициента детерминации при уровне значимости 0,05. Сделать вывод. 5) Проверить значимость оценок параметров уравнения регрессии при уровне значимости 0,05. Сделать вывод. 6) Найти предсказание для x 23,4 при доверительной вероятности 0,95 и определить остаток e7 . Сделать вывод. 7) Найти доверительные интервалы для условного среднего M [Y / x ] и индивидуального значения зависимой переменной y x для x 9,0 . Сделать вывод. 2 Решение В соответствии с требованием использовать пакеты вычислительных и статистических программ выбираем MS Excel. Проводим регрессионный анализ. Выбираем «Данные» «Анализ данных» «Регрессия»: Рис. 1. Построение регрессионной модели Получаем: Рис. 2. Результаты регрессионного анализа 3 1) Найти линейный коэффициент корреляции. Сделать вывод Данные о накладных расходах по реализации этой продукции (у, тыс. руб.) Строим поле корреляции: 1,6 1,4 1,2 1 0,8 0,6 0,4 0,2 0 0 5 10 15 20 25 30 35 40 Данные реализованной продукции (х, тыс. руб.) Рис. 3. Поле корреляции По графическому представлению данных можно утверждать, что между факторной и результативной переменными существует прямая зависимость. Из результатов регрессионного анализа видно, что значение коэффициента корреляции rxy 0,9746 . Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока: 0,1 rxy 0,3 0,3 rxy 0,5 0,5 rxy 0, 7 0, 7 rxy 0,9 0,9 rxy 1 Слабая Умеренная Заметная Высокая весьма высокая В нашем случае связь между объемом реализованной продукции и накладными расходами весьма высокая и прямая. 2) Найти коэффициент детерминации. Сделать вывод. Коэффициент детерминации равен R 2 0,97462 0,9499 В 94,99% случаев изменения объема реализованной продукции приводят к изменению накладных расходов. Другими словами – точность подбора уравнения регрессии – высокая. Остальные 5,01% изменения накладных расходов объясняются факторами, не учтенными в модели (а также ошибками спецификации). 4 3) Найти МНК-оценки параметров уравнения парной линейной регрессии вида y 0 1 x . Пояснить экономический смысл полученных результатов. Из результатов регрессионного анализа значения коэффициентов модели будут равны: у х 0,169323051 0,034020847 Тогда уравнение регрессии будет иметь вид: уˆ 0,1693 0, 034 х 4) Проверить значимость коэффициента детерминации при уровне значимости 0,05. Сделать вывод. Значимость коэффициента детерминации проверим при помощи критерия Фишера. Fнабл R2 n m 1 0,9499 10 1 1 151,6851 2 1 R m 1 0,9499 1 Табличное значение критерия со степенями свободы k1 1 и k2 8 , находим с помощью статистической функции MS Excel F.ОБР.ПХ(0,05;1;8): Fтабл 5,3177 . Поскольку фактическое значение Fнабл Fтабл , то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна). 5) Проверить значимость оценок параметров уравнения регрессии при уровне значимости 0,05. Сделать вывод. Проверяем значимость при помощи t-статистик, значения которых берем из результатов регрессионного анализа: 0 1 Коэффициенты 0,169323051 0,034020847 t-статистика 2,760244699 12,31604936 Критическое значение tкрит при уровне значимости 0,05 и числе степеней свободы k n–2 находим с помощью статистической функции MS Excel СТЬЮДЕНТ.ОБР.2Х(0,05;8): tкрит 2,306 Проверяем значимость коэффициента 0 – поскольку 2, 76024 2,306 , то его статистическая значимость подтверждается. Проверяем значимость коэффициента 1 – поскольку 12,32 2,306 , то его статистическая значимость подтверждается. 5 6) Найти предсказание для x 23,4 при доверительной вероятности 0,95 и определить остаток e7 . Сделать вывод. Находим предсказанное значение для x7 23, 4 по полученному уравнению регрессии: уˆ7 0,034 23, 4 0,1693 0,9649 . Отсюда остаток будет равен е7 0,998 0,9649 0,0331 . Значение остатка существенно мало. Это говорит о небольшом расхождении предсказанного значения накладных расходов от фактического. 7) Найти доверительные интервалы для условного среднего M [Y / x ] и индивидуального значения зависимой переменной y x для x 9,0 . Сделать вывод. Находим значение y x для x 9,0 : y*х 0, 034 9 0,169 0, 476 Найдем предельную ошибку для условного математического ожидания: 1 х хр 1 20,96 9 р tкрит 2,306 0, 0641 0, 2116 2 п n ˆ x 10 10 7,3376 2 2 Значение 0, 0641 находим из результата регрессионного анализа (Стандартная ошибка). Значение ˆ х2 53,8404 находим с помощью статистической функции MS Excel ДИСП.Г. Тогда доверительный интервал для среднего значения на уровне значимости α=0,05 будет иметь вид: 0, 476 0, 2116;0, 476 0, 2116 или 0, 2644;0,6876 Таким образом, накладные расходы при объеме реализованной продукции 9 тыс. руб. с вероятностью 0,95 будет находиться в интервале (0,2644; 0,6876) тыс. руб. Находим доверительный интервал индивидуального значения зависимой переменной y x для x 9,0 Рассчитаем границы интервала, в котором будет сосредоточено не менее 95% накладных расходов при объеме реализованной продукции x p 9 тыс. руб., т.е. доверительный интервал для индивидуального значения y*х 0, 476 . Найдем предельную ошибку для индивидуального значения: 2 х хр 1 1 20,96 9 tкрит 1 2,306 0, 0641 1 0,1727 п xi x 2 10 538, 404 2 6 Тогда интервал, в котором будут находиться, по крайней мере, 95% накладных расходов при объеме реализованной продукции x p 9 тыс. руб., имеет вид: 0, 476 0,1727;0, 476 0,1727 или 0,3033;0,6487 Задача 2. В табл. представлены результаты наблюдений за x1 , x2 и y : x1 3101 3543 3237 3330 3808 2415 3295 3504 3056 3007 2844 2861 x 2 68 77,2 77,2 77,2 75,7 62,6 78 78,2 79 67,6 69,8 68,4 y 0,763 0,923 0,918 0,906 0,905 0,545 0,894 0,9 0,932 0,74 0,701 0,744 1) Найти МНК-оценки параметров уравнения множественной линейной регрессии вида y 0 1 x1 2 x2 . Пояснить смысл полученных результатов. Используем матричный метод. Записываем значения факторных и результативных показателей в виде матриц Х и Y: Матрицу Х транспонируем: 7 Находим необходимые матрицы: Значения коэффициентов регрессии находим по формуле: i X T X X TY : 1 Проверим полученные результаты при помощи надстройки «Пакет анализа». Выбираем «Данные» «Анализ данных» «Регрессия»: Рис. 4. Построение множественной регрессионной модели 8 Получаем: Рис. 5. Результаты регрессионного анализа Уравнение регрессии имеет вид: у 0,6699 0,0000879 х1 0,0166 х2 Увеличение х1 на 1 ед. изм. приводит к увеличению у в среднем на 0,000879 ед. изм.; увеличение х2 на 1 ед. изм. приводит к увеличению у в среднем на 0,0166 ед. изм. 2) Проверить значимость оценок параметров уравнения регрессии при уровне значимости 0,05. Сделать выводы. Проверяем значимость при помощи t-статистик, значения которых берем из результатов регрессионного анализа: 0 1 2 Коэффициенты -0,669886121 8,78644E-05 0,016578335 t-статистика -5,571371281 2,335606083 6,604448132 Критическое значение tкрит при уровне значимости 0,05 и числе степеней свободы k n – т 1 находим с помощью статистической функции MS Excel СТЬЮДЕНТ.ОБР.2Х(0,05;8): tкрит 2, 2622 Проверяем значимость коэффициента 0 – поскольку 5,57137 2, 2622 , то его статистическая значимость подтверждается. Проверяем значимость коэффициента 1 – поскольку 2,33561 2, 2622 , то его статистическая значимость подтверждается. Проверяем значимость коэффициента 2 – поскольку 6, 60445 2, 2622 , то его статистическая значимость подтверждается. 9 3) Найти доверительные интервалы для параметров уравнения регрессии при доверительной вероятности 0,95. Пояснить смысл полученных результатов. Доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими: tкрит i ; i tкрит i i Значения i находим из таблицы регрессионного анализа: Стандартная ошибка 0 0,120237207 1 3,76195E-05 2 0,002510177 Доверительный интервал для коэффициента 0 : 0,6699 2, 2622 0,12024; 0,6699 2, 2622 0,12024 или 0,9419; 0,3979 Доверительный интервал для коэффициента 1 : 0,0000879 2, 2622 0,0000376;0,0000879 2, 2622 0,0000376 или 0,00000284;0,000173 Доверительный интервал для коэффициента 2 : 0,0166 2, 2622 0,00251;0,0166 2, 262 0,00251 или 0,0109;0,0223 С вероятностью 95% можно утверждать, что значения данных параметров i будут лежать в найденных интервалах. 4) Найти коэффициент детерминации. Сделать вывод. Коэффициент детерминации находим из результатов регрессионного анализа R2 0,9516 . Следовательно, в исследуемой ситуации 95,16% общей вариабельности у объясняется изменением факторов х j . 5) Проверить значимость уравнения регрессии (коэффициента детерминации) при уровне значимости 0,05. Сделать вывод. Значимость коэффициента детерминации проверим при помощи критерия Фишера. Fнабл R2 n m 1 0,9516 12 2 1 88, 43138 2 1 R m 1 0,9516 2 10 Табличное значение критерия со степенями свободы k1 2 и k2 12 2 1 9 , находим с помощью статистической функции MS Excel F.ОБР.ПХ(0,05;2;9): Fтабл 4, 2565 . Поскольку фактическое значение Fнабл Fтабл , то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна). 6) Проверить наличие гомоскедастичности при уровне значимости 0,05 (с помощью теста ранговой корреляции Спирмена). Сделать вывод. Для определения гетероскедастичности используем тест ранговой корреляции Спирмена. При использовании данного теста предполагается, что дисперсия отклонений будет либо увеличиваться, либо уменьшаться с увеличением значений х. Поэтому для регрессии, построенной по МНК, абсолютные величины отклонений ei и значения xi будут коррелированы. Определим коэффициент ранговой корреляции по формуле: di2 rx, e 1 6 nn 2 1 , где d i – разность между рангами xi и ei , n – число наблюдений. Находим остатки из результатов регрессионного анализа, а ранги с помощью формулы РАНГ(). Таблица 1 Исходные данные для определения наличия гетероскедастичности х1 х2 Остатки (e) Ранг х1 Ранг х2 Ранг е (Рх1-Ре)2 (Рх2-Ре)2 3101 3543 3237 3330 3808 2415 3295 3504 3056 3007 2844 2861 68 77,2 77,2 77,2 75,7 62,6 78 78,2 79 67,6 69,8 68,4 0,033092 0,001735 0,023622 0,00345 -0,01468 -0,03511 -0,01874 -0,03442 0,023684 0,024982 -0,03617 0,028548 6 11 7 9 12 1 8 10 5 4 2 3 3 7 7 7 6 1 10 11 12 2 5 4 12 6 8 7 5 2 4 3 9 10 1 11 Сумма 36 25 1 4 49 1 16 49 16 36 1 64 298 81 1 1 0 1 1 36 64 9 64 16 49 323 11 Определим коэффициент ранговой корреляции по формуле: di2 rx, e 1 6 nn 2 1 , где di - разность между рангами xi и |ei|, n – число наблюдений. И далее найдем tнабл по формуле: t rx, e n 2 1 rx2, e Результаты представим в таблице: Таблица 2 tнабл -0,041958042 -0,132799926 -0,129370629 -0,412572987 tкрит (0, 05;10) 2,2281 2,2281 r Имеем распределение Стьюдента с числом степеней свободы n 2 , =0,05. tкрит 0,05;10 2, 2281 , tнабл для x1 0,1328 , для x2 0, 4126 . Результаты показывают, что как для x1 , так и для x2 tнабл tкрит , следовательно, гипотеза об отсутствии гетероскедастичности принимается. 7) Проверить наличие автокорреляции при уровне значимости 0,05 (с помощью теста Дарбина-Уотсона). Сделать вывод. Наблюдение 1 2 3 4 5 6 7 8 9 10 11 12 Сумма Предсказанное у 0,729908145 0,921264889 0,894378382 0,902549772 0,919681454 0,580110158 0,912737185 0,934416512 0,908315927 0,715017557 0,737167996 0,715452022 Остатки 0,033091855 0,001735111 0,023621618 0,003450228 -0,014681454 -0,035110158 -0,018737185 -0,034416512 0,023684073 0,024982443 -0,036167996 0,028547978 e2 0,001095 3,01E-06 0,000558 1,19E-05 0,000216 0,001233 0,000351 0,001184 0,000561 0,000624 0,001308 0,000815 0,00796 (ei-ei-1)2 0,000983 0,000479 0,000407 0,000329 0,000417 0,000268 0,000246 0,003376 1,69E-06 0,003739 0,004188 0,014434 12 Для анализа коррелированности отклонений используют статистику ДарбинаУотсона: e e DW e i 1 i 2 i 2 0, 014434 1,813327 0, 00796 Критические значения d1 и d2 определяются на основе специальных таблиц для требуемого уровня значимости α, числа наблюдений n = 12 и количества объясняющих переменных m=2. Автокорреляция отсутствует, если выполняется следующее условие: d1 DW и d2 DW 4 d 2 . Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1,5 DW 2,5 . Поскольку 1,5 1,813327 2,5 , то автокорреляция остатков отсутствует. 13 Список использованных источников 1. Ежова Л.Н. Основы эконометрики. Учебное пособие. Иркутск, 2010. – 395 с. 2. Кремер Н.Ш. Эконометрика. / Н.Ш. Кремер, Б.А.Путко. — М., ЮНИТИ, 2011. – 456 с. 3. Катышев П.К. Сборник задач к начальному курсу эконометрики / П.К. Катышев, А.А. Пересецкий – М.: Дело, 2009. – 72 с. 4. Магнус Я.Р. Эконометрика. Начальный курс / Я.Р. Магнус, П.К. Катышев, А.А. Пересецкий – М.: Дело, 2010. – 400 с. 5. Практикум по эконометрике: учеб. пособие / под ред. И. И. Елисеевой. – М.: Финансы и статистика, 2011. – 192 с. 6. Эконометрика: учебное пособие / под ред. И. И. Елисеевой. – М.: Финансы и статистика, 2011. – 245 с. 14