Овсянникова М М Эконометрика

advertisement
МИНОБРНАУКИ РОССИИ
ГЛАЗОВСКИЙ ИНЖЕНЕРНО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
(филиал) государственного образовательного учреждения
высшего профессионального образования
«Ижевский государственный технический университет»
М.М. Овсянникова
КОМПЬЮТЕРНЫЙ ПРАКТИКУМ
ПО ЭКОНОМЕТРИКЕ
Глазов 2011
ББК 65в6я73
О34
Утверждено на заседании кафедры «Естественнонаучных
и гуманитарных дисциплин» ГИЭИ (филиала) ГОУ ВПО
ИжГТУ (протокол № )
Овсянникова М.М. Компьютерный практикум по эконометрике: Для студентов специальности
080109 «Бухгалтерский учет, анализ и аудит», 080105 «Финансы и кредит». – Глазов: Глазовский
инженерно-экономический институт, 2011. – 64 с.
Рецензент – профессор каф. «Финансы и кредит» ГОУ ВПО ИжГТУ А.С. Тонких
© ГИЭИ (филиал) ИжГТУ, 2011
2
Предисловие
Данный практикум представляет собой учебное пособие, ориентированное на специфику преподавания начального курса эконометрики в технических вузах.
Изучение этой дисциплины предполагает приобретение студентами следующих
умений: построение эконометрических моделей, принятие решений о спецификации и
идентификации модели, выбор метода оценки параметров модели, интерпретация результатов, получение прогнозных оценок. Студенты должны также научиться давать статистическую оценку значимости таких искажающих эффектов, как гетероскедастичность
остатков зависимой переменной, автокорреляция. В связи с этим курс эконометрики обязательно включает решение задач.
Базовыми учебниками, структура и содержание которых взяты за основу данной
брошюры, послужили:
1. Елисеева И.И. Эконометрика: Учебник. – М.: Проспект, 2011.
2. Елисеева И.И. Практикум по эконометрике. – М.: Проспект, 2011.
3. Кремер Н.Ш., Путко Б.А. Эконометрика. – М.: Юнити-дана, 2010.
4. Доугерти К. Введение в эконометрику. – М.: Инфра-М, 2009.
Данный практикум состоит из 5 разделов и посвящен изучению парного регрессионного анализа, множественного регрессионного анализа и исследованию этих моделей.
Каждый раздел содержит методические указания и типовые эконометрические задачи,
выполненные с помощью прикладной программы Excel (версии 2003 или 2007).
Также в данном практикуме содержится набор данных (20 вариантов), чтобы обеспечить индивидуальную работу студента. В них предусмотрена возможность различных
комбинаций объясняющих переменных, выбор различной объясняемой переменной,
предлагаются дифференцированные задания. Такая гибкость позволяет преподавателю
охватить большее количество студентов, выполняющих самостоятельную работу.
В приложениях к практикуму приведены основные статистико-математические таблицы, необходимые для решения задач.
3
Раздел 1
ПАРНЫЙ ЛИНЕЙНЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ
Методические указания
Парная регрессия – уравнение зависимости двух переменных х и у:
ŷ = f(x),
где у – зависимая переменная, или объясненная;
х – независимая, или объясняющая, переменная.
Рассмотрим случай, когда f(x) – линейная функция: у = α + β x+е.
Построение уравнения регрессии сводится к оценке ее параметров α , β . Для оценки этих параметров используют метод наименьших квадратов (МНК). Этот метод позволяет получить такие
оценки параметров, при которых сумма квадратов отклонений фактических значений переменной у
от теоретических у̂ минимальна, т.е.
∑ ( у − уˆ )
2
= ∑ e 2 → min.
Метод МНК дает следующие оценки a и b параметров α , β соответственно, которые вычисляются по формулам:
Cov( x, y )
b=
, a = y −b x ,
Var ( x)
где Cov( x, y ) =
∑ ( x − x )( y − y ) =  1
n

 ∑ xy  − x ⋅ y = xy − x ⋅ y ;
n


Var ( x) = x 2 − ( x ) 2 = sx2 , Var ( y ) = y 2 − ( y ) 2 = s 2y .
Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции:
Cov( x, y )
Cov( x, y ) xy − x ⋅ y
Cov( x, y )
rxy =
=
=
; rxy =
.
1/
2
(Var ( x)Var ( y ))
sx s y
sx s y
Var ( x)Var ( y )
Коэффициент корреляции принимает значения: −1 ≤ rxy ≤ 1.
Проверку значимости коэффициента корреляции проводят по статистическому критерию: находят tфакт = rxy
n − k −1
и сравнивают с tтабл – числом, которое находят по таблице значений Стью1 − rxy2
дента на пересечении параметров γ = 0,95 ( α = 0,05 ) и n – k – 1.
Если tфакт > tтабл , то коэффициент корреляции значим (нулевая гипотеза о равенстве его нулю
отвергается).
Оценку качества построенной модели даст коэффициент детерминации и коэффициент аппроксимации:
Var ( yˆ )
Var (e)
1
y − yˆ
R2 =
, или R 2 = 1 −
; A= ∑
⋅ 100% .
Var ( y )
Var ( y )
n
y
Допустимый предел значений A – не более 8–10 %.
F-тест – оценивание качества уравнения регрессии, состоит в проверке гипотезы Н0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется
сравнение фактического Fфакт и табличного Fтабл значений F-критерия Фишера.
2
Rxy
Находим статистический критерий Fфакт =
(n − k − 1) и сравниваем его с Fтабл , которое
2
1 − Rxy
находим по таблице Фишера–Снедекора на пересечении чисел k1 = k и k2 = n − k − 1 , где k – число
переменных Х в задаче.
Если Fфакт > Fтабл , то уравнение значимо в целом, нулевая гипотеза отвергается.
4
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза
Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью t-критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки. Сначала высчитываем стандартную ошибку
или стандартное отклонение каждого коэффициента:
c.o.( a ) = sa = se
∑ x2
n∑ ( x − x ) 2
= se
. .(b) = sb = se
co
где se =
∑ e2
n − k −1
x2
x2
= se
;
Var ( x) ⋅ n
∑ ( x − x )2
1
,
∑ (x − x )2
.
a
a
b
b
=
, tфакт (b) =
=
– и сравc.o.(a )
sa
c.o.(b)
sb
ниваем с tтабл , которое находится по таблице Стьюдента на пересечении параметров α = 0,05 и
n – k – 1.
Если tфакт > tтабл , то параметр (коэффициент) значим (нулевая гипотеза отвергается).
Затем находим отношения: tфакт (a ) =
Для расчета доверительного интервала определяем предельную ошибку ∆ для каждого показателя:
∆ a = tтабл ⋅ с.о.( а ) , ∆ b = tтабл ⋅ с.о.(b) .
Формулы для расчета доверительных интервалов имеют следующий вид:
γ a = a ± ∆ a , γ b = b ± ∆b .
Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательна, а
верхняя положительна, то оцениваемый параметр принимается нулевым.
Прогнозное значение yp определяется путем подстановки в уравнение регрессии, например линейное: ŷ = a + bx , соответствующего прогнозного значения xp. Вычисляется средняя стандартная
ошибка прогноза с.о.( yˆ p ):
 Var (e)   1 ( x p − x ) 2 
с.о.( yˆ p ) = 

 1 + +
Var ( x) 
 n − k −1  n
и строится доверительный интервал прогноза:
γ yˆ p = yˆ p ± ∆ yˆ p ,
где ∆ yˆ p = tтабл ⋅с.о.( yˆ p ) .
Решение типовых задач
Задача 1. Торговое предприятие имеет сеть, состоящую из 12 магазинов, информация о деятельности которых представлена в таблице:
№ магазина
1
2
3
4
5
6
Годовой товарооборот, млн. руб.
(переменная Y)
19,76
38,09
40,95
41,08
56,29
68,51
Торговая площадь, тыс. м2
(переменная Х)
0,24
0,31
0,55
0,48
0,78
0,98
№ магазина
7
8
9
10
11
12
Годовой товарооборот, млн. руб.
(переменная Y)
75,01
89,05
91,13
91,26
99,84
108,55
Торговая площадь, тыс. м2
(переменная Х)
0,94
1,21
1,29
1,12
1,29
1,49
5
Требуется:
1) рассчитать параметры линейной регрессии;
2) дать экономическую интерпретацию коэффициентов уравнения регрессии;
3) оценить модель через коэффициенты корреляции, аппроксимации, детерминации;
4) оценить статистическую значимость параметров регрессии и корреляции;
5) вычислить доверительные интервалы для коэффициентов регрессии;
6) выполнить прогноз годового товарооборота для строящегося нового магазина площадью
1 тыс. м2. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал;
7) построить поле корреляции и линию регрессии.
Решение
Для решения задачи используем ППП Excel. Выполним пункт 1 по шагам.
1.1. Рассчитать параметры линейной регрессии.
1.1.1. Создать новый файл и ввести анализируемые данные (рис. 1).
Заливкой выделены ячейки, в которых считается сумма по столбцам (ячейки А14 и В14) и их
среднее (ячейки А15 и В15).
1.1.2. Поставить курсор в ячейку А18. Выделить область 5 х 2 (5 строк, 2 столбца) для вывода
результатов регрессионного анализа.
1.1.3. Находясь в левом верхнем углу области, активизировать Мастер функций. Это можно
сделать следующими способами:
– для EXCEL 2003:
а) в главном меню выберите Вставка → Функция;
б) в подменю щелкните по значку f(x) . Если значок отсутствует в подменю, то для дальнейшего
пользования вставьте его, щелкнув правой кнопкой мыши по любому разделу главного меню, и в
появившемся окне, выбрав Настройка → Команды → Вставка → Функция и удерживая левой
кнопкой мыши значок Функция, перетащите его в подглавное меню;
– для EXCEL 2007 значок f(x) – мастер функций – есть обязательно под главным меню.
Рис. 1
6
Рис. 2
В появившемся окне Мастера функций выберите в разделе Категория строку статистические, а в разделе Функция строку ЛИНЕЙН (рис. 2). Щелкните по кнопке ОК.
1.1.4. В появившемся окне (рис. 3) заполните данные по переменным х и у:
известные значения у – координату первой ячейки значений у, двоеточие, координату последней ячейки значений у (А2:А13);
известные значения х – координату первой ячейки значений х, двоеточие, координату последней ячейки х (В2:В13);
константа – логическое значение, которое указывает на наличие или отсутствие свободного
члена в уравнении регрессии. Если Константа = 1, то он присутствует, если 0, то отсутствует;
Статистика – логическое значение, которое указывает, выводить дополнительную информацию по анализу (1) или нет (0).
Щелкните по кнопке ОК.
В выделенной области появится первое значение итоговой таблицы. Чтобы раскрыть всю таблицу нажмите клавишу F2, а затем одновременно три клавиши CTRL, SHIFT, ENTER.
Появятся десять значений в таблице (рис. 4).
Рис. 3
7
Рис. 4
Дополнительная регрессионная статистика будет выводиться по следующей схеме:
Значение коэффициента b
с. о. (b)
R2
F-статистика
Значение коэффициента а
с. о. (а)
Среднеквадратичное отклонение у
Число степеней свободы
∑ е2
Следовательно, в нашем уравнении регрессии коэффициент а = 7,87377, а коэффициент
b = 67,88714, т.е. искомое уравнение регрессии имеет вид: ŷ = 7,87377 + 67,88714х.
1.2. Дать экономическую интерпретацию коэффициентов уравнения регрессии.
Дадим интерпретацию найденным коэффициентам: оценка коэффициента b = 67,88714 показывает, что с увеличением торговой площади на 1 тыс. м2 годовой товарооборот увеличится в среднем
на 67,88714 млн. руб. Оценка коэффициента а = 7,87377, формально говоря, показывает прогнозируемый уровень переменной у, когда х = 0, т.е. площадь магазина 0 м2, а годовой товарооборот
7,87377 млн. руб. Можно сказать, что реального смысла в данной задаче этот коэффициент не имеет.
1.3. Оценить модель через коэффициенты корреляции, аппроксимации, детерминации.
1.3.1. Возвращаемся к нашим первоначальным данным и добавляем столбец ŷ = a + bx . После
вычисления столбца ŷ добавляем столбец e = y – ŷ (в дальнейшем он нам понадобится для проверки на гетероскедастичность и автокорреляцию) и столбец е2 (рис. 5).
8
Рис. 5
1.3.2. После того как все столбцы посчитаны, нужно знать некоторые значения, такие как:
а) ∑ e2 . У нас это число в ячейке Е14 (это значение должно совпасть с нижним правым значением таблицы 5 х 2 (ячейка В22). Если не совпало, то ищите ошибку в вычислениях столбцов ŷ и е);
б) коэффициент детерминации. Берется из таблицы 5 х 2 и равен R2 ≈ 0,97, т. е. зависимая переменная у на 97 % зависит от значений переменной х и только на 3 % от случайной составляющей;
в) коэффициент корреляции r = R 2 . В нашей задаче r = 0,98.
Проверим значимость уравнения в целом: Fфакт = 311,0799 (ячейка А21). Это больше табличного значения функции Фишера–Снедекора Fтабл = 4,96, находящегося на пересечении чисел k1 = 1 и
k2 = 10, при α = 0,05. Следовательно, уравнение сформировалось не под воздействием случайных
факторов.
1.4. Оценить статистическую значимость параметров регрессии и корреляции.
1.5. Вычислить доверительные интервалы для коэффициентов регрессии.
4 и 5 пункты задачи можно рассчитать вручную с помощью формул из методических указаний
раздела 1, а можно опять же с помощью ППП Excel, для этого нужно:
1) проверить доступ к пакету анализа:
– для EXCEL 2003: в главном меню последовательно выберите Сервис → Надстройки. Установите флажок в строке Пакет анализа → ОК (рис. 6).
9
– для EXCEL 2007:
а) щелкните левой кнопкой мыши значок Кнопка Microsoft Office
, в появившемся окне в самом низу щелкните Параметры Excel;
б) перейдите на вкладку Надстройки, а затем в
поле Управление выберите Надстройки Excel;
в) нажмите кнопку Перейти;
г) в поле Доступные надстройки установите
флажок Пакет анализа, а затем нажмите кнопку
ОК.
Совет. Если надстройка Пакет анализа отсутствует в списке поля Доступные надстройки, нажмите кнопку Обзор и найдите ее самостоятельно.
Если выводится сообщение о том, что пакет анализа
не установлен на компьютере, нажмите кнопку Да
для его установки.
Далее для доступа к пакету анализа нажмите
кнопку Анализ данных в группе Анализ на вкладке
Данные;
Рис. 6
2) в главном меню (EXCEL 2003) выберите Сервис → Анализ данных → Регрессия. Щелкните по ОК (рис. 7).
В главном меню (EXCEL 2007) выберите Данные → Анализ данных → Регрессия. Щелкните по
ОК (рис. 7);
Рис. 7
3) заполните окно ввода данных и параметров вывода (рис. 8):
Входной интервал Y – координата первой ячейки столбца переменных у (взять на одну ячейку
выше, т.е. с названием переменной. Это понадобится для названия переменной в таблице вывода),
двоеточие, координата последней ячейки столбца у;
Входной интервал X – координата первой ячейки столбца переменных х (взять на одну ячейку
выше. Это понадобится для названия переменной в таблице вывода), двоеточие, координата последней ячейки столбца х;
Метки – установить флажок, так как входные интервалы содержат названия строк;
Константа – ноль – наличие флажка указывает, что в уравнении регрессии отсутствует свободный член;
Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона;
Новый рабочий лист – можно задать произвольное имя нового листа.
Если необходимо получить информацию и графики остатков, установите соответствующие
флажки в окне.
Щелкните по кнопке ОК.
На вашем рабочем листе начиная с ячейки А25 появится таблица результатов регрессионного
анализа (рис. 9). Теперь давайте разбираться с этой таблицей.
10
Рис. 8
Рис. 9
11
Раздел Регрессионная статистика:
Множественный R – коэффициент корреляции;
R-квадрат – коэффициент детерминации;
Нормированный R-квадрат – скорректированный коэффициент детерминации (понадобится
для МРА);
Стандартная ошибка;
Наблюдения – количество наблюдений в задаче (если это количество в таблице не совпадает с
количеством наблюдений в задаче, то вы неправильно ввели входные интервалы Х и Y или не установили флажок в разделе Метки).
В принципе все эти данные мы уже знаем.
Раздел Дисперсионный анализ
Задача дисперсионного анализа состоит в проверке нулевой гипотезы Н0 о статистической незначимости уравнения регрессии в целом и показателя тесноты связи.
Данные в таблице дисперсионного анализа располагаются следующим образом:
Регрессия
df
Количество
объясняющих
переменных
(k1 = 1)
Остаток
k2 = n– k – 1
Итого
Число степеней
свободы (n – 1)
SS
∑ ( ŷ − y )
MS
2
∑ ( ŷ − y )
2
F
k1
Fфакт =
2
Rxy
2
1 − Rxy
×( n − k − 1)
∑ ( y − yˆ )
2
∑( y − y )
∑ ( ŷ − y )
2
×
F-значимость
Вероятность
того, что Fфакт
сформировалось
случайным образом
k2
Из этой таблицы мы видим, что Fфакт > Fтабл (Fтабл для данной задачи равно 4,96). Следовательно, найденное уравнение регрессии сформировалось не случайно.
Раздел без названия (идет сразу после Дисперсионного анализа)
Столбец Коэффициенты:
– в строке с названием «Y-пересечение» дан коэффициент а уравнения регрессии;
– в строке с названием «х» дан коэффициент b уравнения регрессии.
Столбец Стандартные ошибки:
– в строке с названием «Y-пересечение» дана с.о.(а);
– в строке с названием «х» дана с.о.(b).
Столбец t-статистика:
– в строке с названием «Y-пересечение» дано tфакт(а);
– в строке с названием «х» дано tфакт(b).
Столбец Р-значение:
– в строке с названием «Y-пересечение» дана вероятность того, что параметр а сформировался
случайно;
– в строке с названием «х» дана вероятность того, что параметр b сформировался случайно.
Столбец Верхние 95 %:
– в строке с названием «Y-пересечение» дана верхняя граница 95 % доверительного интервала
параметра а;
– в строке с названием «х» дана верхняя граница 95 % доверительного интервала параметра b.
Столбец Нижние 95 %:
– в строке с названием «Y-пересечение» дана нижняя граница доверительного интервала параметра а;
– в строке с названием «х» дана нижняя граница доверительного интервала параметра b.
(Если ноль находится внутри доверительного интервала, то данный параметр незначим.)
Из этой таблицы нам опять же известны некоторые данные, такие как: параметры а и b, стандартные ошибки найденных параметров, которые мы нашли в таблице 5 х 2.
Раздел Вывод остатка
Здесь три столбца:
1) нумерация наблюдений;
12
2) Предсказанное у – теоретические значения переменной Y, т.е. ŷ -значения в этом столбце
должны совпадать со значениями, которые мы посчитали в столбце С (ячейки С2:С13);
3) Остатки – столбец остатков, равный разности между фактическими и теоретическими значениями переменной Y, e = y − yˆ -значения в этом столбце должны совпадать со значениями, которые мы посчитали в столбце D (ячейки D2:D13).
А вот доверительные интервалы мы еще не находили, поэтому возьмем их из этой таблицы:
γ a = ( −0,49;16, 23) ,
γ b = (59,31;76, 46) .
Так как доверительный интервал параметра а содержит нуль, то он незначим, т. е. не имеет реального смысла.
1.6. Выполнить прогноз годового товарооборота для строящегося нового магазина площадью
1 тыс. м2. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
Найдем прогнозное значение yˆ p = 7,87377 + 67,88714 x p , где x p = 1 . Следовательно, yˆ p ≈ 75,76 .
Вычислим среднюю стандартную ошибку прогноза с.о.( yˆ p ):
2
1 (1 − 0,89 ) 
 Var (e)   1 ( x p − x ) 2 
 25,6  
 ≈1,7 .
ˆ
c.o.( y p ) = 
= 
 1 + +
 1+ +
0,17 
 n − 2   n Var ( x) 
 10   12

Как найти Var(x) и Var(e) с помощью EXCEL 2007:
а) поставить курсор в ячейку D18. Ввести Var (x)= ;
б) поставить курсор в ячейку Е18. Ввести знак «=», зайти в мастер функции f(x) , выбрать категорию Статистические, выбрать функцию ДИСП, нажать ОК (рис. 10).
В появившемся новом окне, где запрашивается число 1, ввести диапазон значений переменной
Х, ячейки В2:В13, нажать ОК (рис. 11).
В ячейке Е18 появится число, равное дисперсии переменной Х= Var(x).
Аналогично проделать с вычислением дисперсии значений столбика е (рис. 12).
Строим доверительный интервал (tтабл для данной задачи находим по таблице Стьюдента на пересечении чисел γ = 0,95 (или α = 0,05) и k = 12 – 1 – 1 = 10), у нас это будет число tтабл = 2,23.
yˆ p ≈ 75,76;
∆ yˆ p = tтабл ⋅⋅с.о.( yˆ p ) = 2, 23 ⋅1,7 = 3,791;
γ yˆ p = (71,96; 79,55).
Эти результаты говорят о том, что в новом строящемся магазине площадью 1 тыс. м2 годовой
товарооборот предположительно будет находиться в пределах от 71,96 млн. руб. до 79,55 млн. руб.
Рис. 10
13
Рис. 11
Рис. 12
14
1.7. Построить поле корреляции и линию регрессии.
Построим поле корреляции и линию регрессии. Делать это будем все на том же листе Excel, после таблицы Вывод итогов регрессионной статистики или на свободном пространстве после основной таблицы.
Для EXCEL 2003:
1.7.1. В главном меню выбрать Мастер диаграмм (если его нет, то вставить: правой кнопкой
мыши нажать по любому разделу главного меню. Выбрать Настройка → Вставка → Диаграмма и,
держа левую кнопку мыши, перетащить диаграмму в главное меню).
1.7.2. В появившемся окне в разделе Стандартные выбрать тип диаграммы Точечная и нажать
кнопку Далее (рис. 13).
1.7.3. В появившемся окне (рис. 14) выбрать раздел Ряд. Щелкнуть по кнопке Добавить, и в
строку Имя ввести название первого ряда, в строку Значения Х ввести координаты столбца Х
(В2:В13), в строку Значения Y ввести координаты столбца Y (А2:А13).
Рис. 13
Рис. 14
1.7.4. Затем на получившееся поле корреляции можно добавить линию регрессии. Для этого
снова щелкните по кнопке Добавить и в освободившиеся три строки введите новые данные: в строку Имя название нового ряда – ŷ , в строку Значения Х – координаты столбца Х (B2:B13), в строку
Значения Y – координаты столбца ŷ (C2:C13). На этом же поле корреляции появятся точки, принадлежащие линии регрессии, они будут розового цвета (рис. 15). Чтобы соединить их в линию, надо щелкнуть по любой точке прямой дважды и в появившемся окне Формат ряда данных в разделе
Вид поставить метку того, что линия обычная. Щелкнуть по кнопке ОК (рис. 16).
Для EXCEL 2007:
а) поставить курсор на любое свободное поле;
б) в главном меню выбрать Вставка;
в) раскрывшихся окнах выбрать Точечную диаграмму;
г) на листе появится белое поле для диаграммы, в верхнем меню появятся новые окна по работе
с диаграммой. Выбираем пункт Выбрать данные. Появится окно (рис. 17);
15
Рис. 15
Рис. 16
16
Рис. 17
д) щелкнуть курсором по кнопке Добавить,
в появившемся окне заполнить данные:
– в строку Имя ряда ввести у;
– в строку Значения Х ввести данные столбца Х;
– в строку Значения Y ввести данные столбца Y.
Если в появившейся диаграмме точки соединены между собой ломаной, то нужно в верхнем
меню нажать на Изменить тип диаграммы и
выбрать Точечную → ОК.
Рис. 18
1.7.5. На рабочем листе появится окончательное поле корреляции с линией регрессии (рис. 20). Его можно перемещать в любое удобное место.
Чтобы добавить в поле корреляции линию регрессии, нужно правой кнопки мыши щелкнуть по полю диаграммы и в появившемся окне выбрать Выбрать данные. Снова появится окно Выбор источника данных. В нем снова щелкаем по Добавить. В появившемся окне (рис. 19) заполнить строки:
– в строку Имя ряда ввести значения столбика ( yˆ );
– в строку Значения Х ввести данные столбца (х);
– в строку Значения Y ввести данные столбца ( yˆ ).
В поле корреляции между нашими фактическими данными (синие точки) появятся теоретические данные по нашей выборке.
Чтобы соединить красные точки между собой
в прямую, нужно подвести курсор к любой красной точке, щелкнуть по ней правой кнопкой мыши, в появившемся окне выбрать Изменить тип
диаграммы для ряда, в появившемся окне выбрать тип диаграммы Точечная с гладкими кривыми → ОК (рис. 21). На нашем поле корреляции
появится прямая, проходящая между фактичеРис. 19
скими наблюдениями (рис. 22).
17
Рис. 20
Рис. 21
18
Рис. 22
19
Раздел 2
ПАРНЫЙ НЕЛИНЕЙНЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ
Методические указания
Рассмотрим случай, когда f(x) – нелинейная функция. Нелинейные регрессии делятся на два
класса: 1) регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но
линейные по оцениваемым параметрам, и 2) регрессии, нелинейные по оцениваемым параметрам.
Рассмотрим наиболее часто встречающиеся.
Регрессии, нелинейные по объясняющим переменным:
а) полиномы разных степеней f ( x) = α + β1 x + β 2 x 2 + e ;
б) равносторонняя гипербола f ( x) = α +
β
+e.
x
Регрессии, нелинейные по оцениваемым параметрам:
в) степенная f ( x) = α ⋅ x β ⋅ e ;
г) показательная f ( x) = α ⋅ β x ⋅ e и др.
Построение таких уравнений регрессии начинается с их линеаризации.
а) обозначим новые переменные z1 = x, z2 = x2, тогда новое уравнение будет линейным относительно переменных z1, z2: f ( x) = α + β1 z1 + β 2 z2 + e . Для нахождения оценок параметров α , β1 , β 2 в
данном уравнении используется множественный регрессионный анализ (МРА). Мы его рассмотрим
позже;
1
б) обозначим новую переменную z = , тогда новое уравнение примет вид: f ( x) = α + β z + e и
x
для нахождения оценок параметров α , β применим парный регрессионный анализ (см. раздел 1).
Найдем уравнение ŷ = a + bz и вернемся к первоначальной переменной ŷ = a + b / x;
в) для линеаризации данной модели применим метод логарифмирования: lg y = lg(α ⋅ x β ⋅ e) .
Используя свойства логарифмов, приведем наше уравнение к следующему виду:
lg y = lg α + β lg x + lg e.
Введем новые переменные y′ = lg y , α ′ = lg α , x′ = lg x , e′ = lg e . Тогда уравнение примет вид
y′ = α ′ + β x′ + e′ , оно уже линейно, и для нахождения оценок α ′, β снова применим линейный регрессионный анализ. В найденном уравнении yˆ = a '+ bx для найденных коэффициентов a′, b выполним потенцирование: a = 10a′ , b = b. Следовательно, степенное уравнение регрессии будет выглядеть так: yˆ = 10a′ ⋅ xb ;
г) снова применим метод логарифмирования: lg y = lg(α ⋅ x β ⋅ e) и, используя свойства логарифмов, приведем его к виду lg y = lg α + β lg x + lg e.
Введем новые переменные y′ = lg y , α ′ = lg α , x′ = lg x , e′ = lg e . Тогда наше уравнение примет
вид: y′ = α ′ + xβ ′ + e′ . Оно линейное, применим линейный регрессионный анализ и в полученном
уравнении yˆ = a '+ b′x для коэффициентов a′, b′ выполним потенцирование, найдя тем самым коэффициенты a, b: a = 10a′ , b = 10b′ для уравнения ŷ = 10a′ ⋅10b′x .
Формулы аппроксимации, детерминации, проверка статистической значимости коэффициентов
уравнения нелинейной регрессии, вычисление прогноза и установка доверительных интервалов проходит по тем же формулам, что и для линейного анализа.
Решение типовых задач
Задача 2. Используя данные задачи 1, требуется:
1) рассчитать параметры степенной регрессии;
2) дать экономическую интерпретацию коэффициентов уравнения регрессии;
3) оценить модель через коэффициенты корреляции, аппроксимации, детерминации;
20
4) оценить статистическую значимость параметров регрессии и корреляции;
5) вычислить доверительные интервалы для коэффициентов регрессии;
6) выполнить прогноз годового товарооборота для строящегося нового магазина площадью
1 тыс. м2. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал;
7) построить поле корреляции и линию степенной регрессии.
Решение
2.1. Рассчитать параметры степенной регрессии.
2.1.1. Открыть новый лист в том же файле, где мы рассчитывали линейную регрессию, переименовать его в Степенная и скопировать исходные данные Х и Y c первого листа.
2.1.2. Построению степенной модели y = axb предшествует линеаризация переменных. Производится это путем логарифмирования обеих частей уравнения: lg y = lg(axb ) ; lg y = lg a + b lg x . Введя новые переменные, получим линейное уравнение y′ = a′ + bx′ .
2.1.3. Теперь рядом с столбцами Х и Y введем столбцы y′ = lg y , x′ = lg x (рис. 23).
Для вычисления десятичного логарифма по переменной у встаньте в ячейку С2, далее нужно
зайти в мастер функций, выбрать категорию Математические и найти там функцию LOG10. В
появившемся окне сослаться на ячейку с первым значением столбика у, а именно ячейку А2, ОК.
Далее вернуться в ячейку С2 и, потянув эту ячейку вниз за маркер в правом нижнем углу, скопировать данные этой ячейки на все 12 наблюдений. Аналогично посчитать десятичные логарифмы для
столбца Х.
2.1.4. Затем ниже под таблицей снова выделим область 5 х 2 и проведем процедуру нахождения
коэффициентов a′, b как для линейной функции, но между столбцами y′, x′ (рис. 23).
Т.е. в появившемся окне Аргументы функции в строку Значения у вводим данные столбца y′
(С2:С13), а в строку Значения х вводим данные столбца x′ (D2:D13). Строки Константа и Стат
соответственно равны 1. Щелкнуть по ОК. В выделенной области появится первое значение итоговой таблицы. Чтобы раскрыть всю таблицу, нажмите клавишу F2, а затем одновременно три клавиши CTRL, SHIFT, ENTER. В этой таблице нас будут интересовать только строки коэффициентов,
их стандартных ошибок и коэффициент детерминации.
Из таблицы 5 х 2 видим, что коэффициенты a′ = 1,88143, b = 0,83753 , т.е. линейное уравнение
выглядит так: y′ = 1,88143 + 0,83753 x′ , но нам нужно степенное уравнение, поэтому пропотенцируем
его: yˆ = 101,88143 ⋅ x 0,83753 = 76,1x 0,84 .
2.2. Дать экономическую интерпретацию коэффициентов уравнения регрессии.
2.2.1. Из полученного степенного уравнения yˆ = 76,1x0,84 видим, что с увеличением торговой
площади на 1 % годовой товарооборот увеличивается в среднем на 0,84 %.
2.3. Оценить модель через коэффициенты корреляции, аппроксимации, детерминации.
2.3.1. Далее добавляем к основной таблице столбец ŷ и вводим в него данные, затем составляем
столбцы e, e2.
2.3.2. Как видим,
а) ∑ e2 = 309,36 (в отличие от линейной функции это значение не должно совпасть с нижней
правой ячейкой таблицы 2 × 5 );
б) R2 = 0,95.
Результаты чуть ухудшились по сравнению с линейной регрессией.
2.4. Оценить статистическую значимость параметров регрессии и корреляции.
2.4.1. Оценим статистическую значимость найденных параметров.
Из таблицы 5 х 2 вычислим ∆ a′ , ∆ b , используя методические указания раздела 1.
tфакт (a′) = 1,88143 0,01687 = 111, 488 , tфакт (b) = 0,83753 0,06203 = 13,501 , tтабл = 2,23 .
tфакт (a′) > tтабл , tфакт (b) > tтабл . Следовательно, оба параметра значимы.
21
Рис. 23
22
2.5. Вычислить доверительные интервалы для коэффициентов регрессии.
2.5.1. Для расчета доверительных интервалов для найденных коэффициентов уравнения регрессии вычислим:
∆ a′ = 2, 23 ⋅ 0,01687 = 0,038 , ∆ b = 2, 23 ⋅ 0,06203 = 0,1383 ;
γ a′ = (1,84; 1,91) ,
γ b = (0,69; 0,97) ;
γ a = (101,84 ; 101,91 ) ,
γ a = (69,18; 81,28) .
2.6. Выполнить прогноз годового товарооборота для строящегося нового магазина площадью
1 тыс. м2. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
2.6.1. В полученное уравнение yˆ = 76,1x0,84 вместо х подставим значение хp = 1 тыс.м2. Получим
yˆ p = 76,1 млн. руб. Т.е. в новом строящемся магазине площадью 1 тыс. м2 предполагается годовой
товарооборот в 76,1 млн. руб.
2.6.2. Найдем доверительные интервалы для прогноза.
Вычислим среднюю стандартную ошибку прогноза с.о.( yˆ p ):
2
1 (1 − 0,89 ) 
 Var (e)   1 ( x p − x ) 2 
 27,99  
 ≈ 1,8.
ˆ
c.o.( y p ) = 
= 
 1 + +
 1+ +
0,17 
 n − 2   n Var ( x) 
 10   12

Значение Var(x) = 0,17 для данной задачи такое же, как и для линейной функции. Var(e) нужно
считать. Var(e) = 27,99.
Далее строится доверительный интервал: ∆ yˆ p = tтабл ⋅ c.o.( yˆ p ) = 2, 23 ⋅ 1,8 = 4 , γ yˆ p = (72,1; 80,1) .
Эти результаты говорят о том, что в новом строящемся магазине площадью 1 тыс. м2 годовой
товарооборот предположительно будет находиться в пределах от 72,1 млн. руб. до 80,1 млн. руб.
Как видим, по сравнению с линейной регрессией доверительный интервал стал шире.
2.7. Построить поле корреляции и линию степенной регрессии.
Процедура построения поля корреляции и кривой степенной функции проходит так же, как и в
линейной регрессии.
Задача 3. Используя данные задания 1, требуется:
1) рассчитать параметры гиперболической регрессии;
2) дать экономическую интерпретацию коэффициентов уравнения регрессии;
3) оценить модель через коэффициенты корреляции, детерминации;
4) оценить статистическую значимость параметров регрессии и корреляции;
5) вычислить доверительные интервалы для коэффициентов регрессии;
6) выполнить прогноз годового товарооборота для строящегося нового магазина площадью
1 тыс. м2. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал;
7) построить поле корреляции и линию гиперболической регрессии.
Решение
3.1. Рассчитать параметры гиперболической регрессии.
3.1.1. Открыть новый лист в том же файле, где мы рассчитывали линейную и степенную регрессии, переименовать его в Гипербола и скопировать исходные данные Х и Y c первого листа.
b
3.1.2. Построению гиперболической модели yˆ = a + предшествует линеаризация переменных.
x
Производится это путем введения новой переменной z = 1 / x, получим линейное уравнение
ŷ = a + bz .
3.1.3. Теперь рядом с столбцами Х и Y введем столбец z = 1 / x, затем ниже под таблицей снова
выделим область 5 х 2 и проведем процедуру нахождения коэффициентов a, b как для линейной
функции, но между столбцами y, z . Т.е. в появившемся окне Аргументы функции в строку
Изв_значения_у вводим данные столбца y (B3:B14), а в строку Изв_значения_х вводим данные
столбца z (С2:С13), строки Константа и Стат соответственно равны 1. Щелкнуть по ОК. В выде23
ленной области появится первое значение итоговой таблицы. Чтобы раскрыть всю таблицу, нажмите
клавишу F2, а затем одновременно три клавиши CTRL, SHIFT, ENTER.
Дополнительная регрессионная статистика будет выводиться по такой же схеме, как у линейной
регрессии (рис. 24).
Следовательно, в нашем уравнении регрессии коэффициент а = 103,4973, а коэффициент
b = –22,7109, т.е. уравнение регрессии имеет вид: yˆ = 103, 4973 − 22,7109 x .
Рис. 24
3.2. Дать экономическую интерпретацию коэффициентов уравнения регрессии.
3.2.1. Дадим интерпретацию найденным коэффициентам: оценка коэффициента b = –22,7109
показывает, что с увеличением торговой площади на х тыс. м2 годовой товарооборот увеличится в
среднем на 22,71091/x млн. руб. Оценка коэффициента а = 103,49735 показывает прогнозируемый
уровень переменной у, когда х → ∞ , т.е. площадь магазина можно бесконечно увеличивать, а годовой товарооборот не превысит 103,4975 млн. руб.
3.3. Оценить модель через коэффициенты корреляции, детерминации.
3.3.1. Возвращаемся к нашим первоначальным данным и добавляем столбец yˆ = a + b / x . После
вычисления столбца ŷ добавляем столбец e = y – ŷ и столбец е2.
3.3.2. После того как все столбцы посчитаны, нужно знать некоторые значения, такие как:
а) ∑ e2 . Это значение должно совпасть с нижним правым значением таблицы 5 х 2 – ячейкой
В22. Если не совпало, то ищите ошибку в вычислениях столбцов ŷ и е;
б) коэффициент детерминации берется из таблицы 5 х 2 и равен R2 ≈ 0,77, т. е. зависимая переменная у на 77 % зависит от значений переменной х и только на 23 % от случайной составляющей.
Это тоже говорит, что данная модель является наихудшей из первых двух.
Пункты 4 и 5, как и в линейном регрессионном анализе, можно рассчитать с помощью специальной таблицы Вывод итогов (рис. 25). Как ее получить, смотрите задачу 1.
24
Рис. 25
Используя данные таблицы, видим, что коэффициенты a, b значимы: tфакт (a ) = 14,1 > tтабл ,
tфакт (b) = −5,81 > tтабл , tтабл = 2, 23 .
Все уравнение в целом тоже значимо: Fфакт = 33,83 > Fтабл , Fтабл = 4,96 .
Доверительные интервалы для коэффициентов a, b следующие:
γ b = ( −31, 41; − 14,01) .
γ a = (87,15; 119,84 ) ,
3.6. Выполнить прогноз годового товарооборота для строящегося нового магазина площадью
1 тыс. м2. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
Так как коэффициент детерминации низкий, то прогноз в данной модели будет неэффективным.
3.7. Построить поле корреляции и линию гиперболической регрессии.
Поле корреляции и кривая гиперболы строятся так же, как и в предыдущих моделях.
Задача 4. Используя данные задачи 1, требуется:
1) рассчитать параметры показательной регрессии;
2) дать экономическую интерпретацию коэффициентов уравнения регрессии;
3) оценить модель через коэффициенты корреляции, детерминации;
4) оценить статистическую значимость параметров регрессии и корреляции;
5) вычислить доверительные интервалы для коэффициентов регрессии;
25
6) выполнить прогноз годового товарооборота для строящегося нового магазина площадью
1 тыс. м2. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал;
7) построить поле корреляции и линию показательной регрессии.
Решение
4.1. Рассчитать параметры показательной регрессии.
4.1.1. Открыть новый лист в том же файле, где мы рассчитывали линейную, степенную и гиперболическую регрессии. Переименовать его в Показательная и скопировать исходные данные Х иY c
первого листа.
4.1.2. Построению показательной функции yˆ = ab x предшествует линеаризация переменных.
Для этого, как и для степенной модели, применим метод логарифмирования: lg yˆ = lg(ab x ) ;
lg yˆ = lg a + x lg b .
Теперь введем новые переменные: y′ = lg y , a′ = lg a , b′ = lg b . Тогда наше уравнение примет
вид: y′ = a′ + b′x , и для него можно применить процедуру поиска оценок так же, как и в предыдущих
моделях, но можно иначе.
4.1.3. Для поиска оценок a, b показательного уравнения регрессии существует специальная
функция.
Выделить область 5 х 2 (2 столбца, 5 строк) для вывода результатов регрессионного анализа.
Находясь в левом верхнем углу области, активизировать Мастер функций f(x) .
В появившемся окне Мастера функций выберите в разделе Категория строку статистические, а в разделе Функция строку ЛГРФПРИБЛ. Щелкните по кнопке ОК.
В новое окно в строку Изв_знач_у вводим данные столбца y (B3:B14), а в строку Изв_знач_х
вводим данные столбца х (C3:C14), строки Константа и Стат соответственно равны 1. Щелкнуть
по ОК.
В выделенной области появится первое значение итоговой таблицы. Чтобы раскрыть всю таблицу, нажмите клавишу F2, а затем одновременно три клавиши CTRL, SHIFT, ENTER (рис. 26). В
этой таблице нам понадобятся только значения оценок a, b показательного уравнения, их стандартные ошибки и коэффициент детерминации.
Используя данные полученной таблицы, строим уравнение показательной регрессии:
yˆ = 21,4488 ⋅ 3, 26723x , с.о.(а) = 0,11, с.о.(b) = 0,11, R 2 = 0,91.
4.2. Дать экономическую интерпретацию коэффициентов уравнения регрессии.
Дадим интерпретацию найденным коэффициентам.
Если х = 0 (т.е. магазина нет), то годовой товарооборот составит 21,45 млн. руб. (реального
смысла не имеет). Коэффициент b сам по себе в отдельности ничего не показывает (важен при расчете эластичности), только вместе с коэффициентом а он показывает, что при увеличении торговой
площади на х тыс. м2 годовой товарооборот увеличивается на 21,45 ⋅3,27 х млн. руб.
4.3. Оценить модель через коэффициенты корреляции, детерминации.
4.3.1. Возвращаемся к нашим первоначальным данным и добавляем столбец yˆ = ab х . После вычисления столбца ŷ добавляем столбец e = y – ŷ и столбец е2.
4.3.2. После того как все столбцы посчитаны, нужно знать некоторые значения, такие как:
а) ∑ e2 =684,4;
б) коэффициент детерминации берется из таблицы 5 х 2 и равен R2 ≈ 0,91, т. е. зависимая переменная у на 91 % зависит от значений переменной х и только на 9 % от случайной составляющей.
Это тоже говорит, что данная модель является наихудшей из первых двух.
4.4. Оценить статистическую значимость параметров регрессии и корреляции.
Оценим статистическую значимость найденных параметров.
Из таблицы 5 х 2 вычислим ∆ a , ∆ b , используя методические указания раздела 1:
tфакт (b) = 3, 2672 0,1139 = 28,68, tфакт (a ) = 21,4488 0,111 = 193,12, tтабл = 2, 23 ;
tфакт (a′) > tтабл , tфакт (b) > tтабл . Следовательно, оба параметра значимы.
26
Рис. 26
4.5. Вычислить доверительные интервалы для коэффициентов регрессии.
Для расчета доверительных интервалов вычислим:
∆ a = 2,23 ⋅ 0,1139 = 0, 24 , ∆ b = 2, 23 ⋅ 0,111 = 0, 24 ;
γ a = (21, 45 ± 0, 24),
γ b = (3, 27 ± 0, 24);
γ a = (21, 2; 21,7) ,
γ b = (3,02; 3,52) .
4.6. Выполнить прогноз годового товарооборота для строящегося нового магазина площадью
1 тыс. м2. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
4.6.1. В полученное уравнение yˆ = 21,45 ⋅ 3, 27 х вместо х подставим значение хp =1 тыс.м2. Получим yˆ p = 70,08 млн. руб. Т.е. используя показательное уравнение регрессии, мы пришли к выводу,
что в новом строящемся магазине площадью 1 тыс. м2 предполагается годовой товарооборот в
70,1 млн. руб.
4.6.2. Найдем доверительные интервалы для прогноза.
Вычислим среднюю стандартную ошибку прогноза с.о.( yˆ p ):
2
1 (1 − 0,89 ) 
 Var (e)   1 ( x p − x ) 2 
 62.22  
 ≈ 2,67 .
с.о.( yˆ p ) = 
1
+
+
=
1
+
+




0,17 
 n − 2   n Var ( x) 
 10   12

и построим доверительный интервал: ∆ yˆ p = tтабл , с.о.( yˆ p ) = 2,23 ⋅ 2,67 = 6, γ yˆ p = (64,08; 76,08).
Эти результаты говорят о том, что в новом строящемся магазине площадью 1 тыс. м2 годовой
товарооборот предположительно будет находиться в пределах от 64,08 млн. руб. до 76,08 млн. руб.
27
Как видим, по сравнению с линейной и степенной регрессиями доверительный интервал сместился влево.
4.7. Построить поле корреляции и линию показательной регрессии.
Процедура построения поля корреляции и кривой показательной функции проходит так же, как
и в линейной регрессии.
Подведем итог по решенным четырем заданиям. Откроем новый лист и назовем его ИТОГ.
Составим таблицу, в которую внесем найденные данные: коэффициенты детерминации, Fфакт,
2 (рис. 27).
e
∑
Рис. 27
Для выбора наилучшей модели сравниваем эти показатели и делаем вывод, что линейная функция является наиболее эффективной для вычисления прогноза: коэффициент детерминации самый
высокий, сумма квадратов остатков наименьшая, F-значимость самая высокая. Поэтому руководитель предприятия, которое строит новый магазин площадью 1 тыс. м2, может предположить, что годовой товарооборот в новом тринадцатом магазине будет зависеть от площади магазина по линейной функции, и товарооборот в нем будет лежать в интервале γ yˆ p = (71,96; 79,55).
Пока остановимся на этом прогнозе и будем считать его наилучшим. Но вот будет ли это совпадать с действительностью в будущем, мы пока сказать не можем, так как не проверяли модели на
гетероскедастичность и автокорреляцию, а их существование делает прогноз неэффективным. Эту
проблему мы будем решать в следующем разделе нашей брошюры.
28
Раздел 3
ГЕТЕРОСКЕДАСТИЧНОСТЬ
Методические указания
Для того чтобы регрессионный анализ, основанный на обычном МНК, давал наилучшие из всех
возможных результаты, случайный член должен удовлетворять четырем условиям, известным как
условия Гаусса–Маркова:
1) математическое ожидание случайного члена в любом наблюдении должно быть равно нулю,
т.е. M(ei) = 0, ∀ i;
2) дисперсия случайного члена должна быть постоянна для всех наблюдений, т.е.
M( ei 2 ) = σ e 2 , ∀i (величина σ e чаще всего неизвестна, и одной из задач регрессионного анализа является оценка стандартного отклонения случайного члена);
3) случайные члены должны быть абсолютно независимы друг от друга, т.е. M( ei ⋅ e j ) = 0, i ≠ j ;
4) случайный член должен быть распределен независимо от объясняющих переменных, т.е.
M( xi ⋅ ei ) = 0, ∀i .
Рассмотрим более подробно второе условие. Если оно выполняется, то говорят, что модель гомоскедастична, если же σ e2i ≠ σ e2j ≠ σ e2 , i ≠ j, то имеет место гетероскедастичность.
Почему гетероскедастичность имеет существенное значение? Это можно объяснить по крайней
мере двумя причинами. Первая – при отсутствии гетероскедастичности обычные коэффициенты
регрессии имеют наиболее низкую дисперсию среди всех несмещенных оценок, являющихся линейными функциями от наблюдений у. Если имеет место гетероскедастичность, то оценки МНК неэффективны, и можно найти другие, которые имеют меньшую дисперсию и тем не менее являются несмещенными. Вторая причина заключается в том, что сделанные оценки стандартных ошибок коэффициентов регрессии будут неверны, соответственно и предполагаемый прогноз будет неверным.
Как же обнаружить гетероскедастичность? Для этого существует много способов, рассмотрим
самые распространенные из них.
1. Тест ранговой корреляции Спирмена
При выполнении теста ранговой корреляции Спирмена предполагается, что дисперсия случайного члена будет либо увеличиваться, либо уменьшаться по мере увеличения х, и поэтому в регрессии, оцениваемой с помощью МНК, абсолютные величины остатков и значения х будут коррелированны.
Алгоритм теста:
1. Данные по х упорядочиваются по возрастанию, каждому значению х присваивается ранг (rang x).
2. По данным столбца остатков е строится вспомогательный столбец |е| (модуль е) и также каждому значению этого столбца присваивается ранг (rang |e|).
3. Считается коэффициент ранговой корреляции:
6∑ Di 2
rxe = 1 −
,
n( n 2 − 1)
где Di – разность между рангом хi и рангом ei , т.е. Di = rang x − rang e ,
n – количество наблюдений в выборке.
4. Затем найденный коэффициент ранговой корреляции проверяется на значимость. Для этого
rxe
вычисляется статистический критерий tфакт =
⋅ n − k − 1 и сравнивается с tтабл, которое бе1 − rxe2
рется из специальной таблицы «распределение Стьюдента» и находится на пересечении чисел
γ = 0,95 или α = 0,05 и (n – k – 1), где k – число объясняющих переменных в задаче.
Если tфакт > tтабл, то коэффициент корреляции значим, и в исследуемой модели присутствует гетероскедастичность, и наоборот.
29
2. Тест Голдфельда–Кванта
При проверке по этому критерию предполагается, что стандартное отклонение σ i распределения вероятностей ei пропорционально значению х в этом наблюдении. Предполагается также, что
случайный член распределен нормально и не подвержен автокорреляции.
Алгоритм теста:
1. Все n наблюдений в выборке упорядочиваются по величине х, после чего оцениваются отдельные регрессии для первых n′ и для последних n′ наблюдений; средние n − 2n′ наблюдений отбрасываются. Если предположение относительно природы гетероскедастичности верно, то дисперсия е в последних n′ наблюдениях будет значительно больше или меньше, чем в первых n′ , и это
будет отражено в сумме квадратов остатков в двух указанных «частных» регрессиях. Обозначая
суммы квадратов остатков в регрессиях для первых n′ и последних n′ наблюдений через Sбол и Sмал,
S
рассчитаем отношение Fфакт = бол , которое имеет F-распределение (распределение Фишера: при
S мал
α = 0,05 , k1 = k2 = n′ − k − 1 , где k – число объясняющих переменных в регрессионном уравнении).
Найденное Fфакт сравниваем с Fтабл. Если Fфакт > Fтабл, то в исследуемой модели присутствует гетероскедастичность, и наоборот.
3. Тесты Уайта и Глейзера
Тест ранговой корреляции Спирмена и тест Голдфельда–Кванта позволяют обнаружить лишь
само наличие гетероскедастичности, но они не дают возможности проследить количественный характер зависимости дисперсий остатков регрессии от значений факторов и, следовательно, не представляют каких-либо способов устранения гетероскедастичности.
Наиболее простой и часто употребляемый тест на гетероскедастичность – тест Уайта.
При использовании этого теста предполагается, что дисперсии ошибок регрессии представляют
собой одну и ту же функцию от наблюдаемых значений переменной х, т.е. σ i2 = f ( xi ) .
Идея теста Уйата заключается в оценке функции σ i2 = f ( xi ) с помощью соответствующего
уравнения регрессии для квадратов остатков: ei2 = f ( xi ) = ui , где u – случайный член.
Тест Глейзера аналогичен тесту Уайта, только в качестве зависимой переменной для изучения
гетероскедастичности выбирается не квадрат остатков, а их абсолютная величина, т.е. осуществляется регрессия ei = α + β xiγ .
Алгоритм теста:
1. Чтобы использовать данный метод, следует оценить регрессионную зависимость у от х с помощью обычного МНК, а затем вычислить квадраты остатков е2 (для теста Уайта) и абсолютные величины остатков ei (для теста Глейзера).
2. Далее строим вспомогательные столбцы xγ для разных значений γ (чаще всего берут γ = 2,
γ = 1/2, γ = 3/2, γ = –1, γ = –2).
3. С помощью метода МНК (таблицы 5 х 2) строим всевозможные регрессии:
ei2 = a + bxiγ для теста Уайта;
ei = a + bxi γ для теста Глейзера.
Далее полученные уравнения регрессии проверяются на значимость. Для этого Fфакт по каждой
модели сравнивается с Fтабл (α = 0,05, k1 = 1 , k2 = n − k − 1 ), которое берется из таблицы распределения Фишера. Если Fфакт > Fтабл, то в исследуемой модели присутствует гетероскедастичность, и наоборот.
Решение типовых задач
Задача 5. Используя данные задач 1–4, проверить на гетероскедастичность по тесту ранговой
корреляции Спирмена:
1) линейную регрессию;
2) степенную регрессию;
3) гиперболическую регрессию;
4) показательную регрессию.
30
Решение
5.1.1. Открыть в нашем файле лист Линейная, к имеющимся столбцам добавить столбцы e .
(Чтобы применить функцию модуль, нужно в мастере функций f(x) выбрать категорию МАТЕМАТИЧЕСКИЕ, функцию ABS.)
5.1.2. Добавить новый столбец с названием rang x. В этом столбце проранжировать значения
столбца с переменными х по возрастанию, т.е. самому маленькому значению х присвоить ранг 1 и
т.д., самому большому значению х присвоить ранг 12.
Добавить новый столбец с названием rang |e|. В этом столбце проранжировать значения столбца
с переменными е по возрастанию, т.е. самому маленькому значению |е| присвоить ранг 1 и т.д., самому большому значению |e| присвоить ранг 12 (рис. 28).
5.1.3. Для вычисления столбца rang x, rang |e| можно воспользоваться специальной функцией.
Для этого нужно в главном меню выбрать Мастер функции f(x) → категория Статистические
→ функция Ранг (рис. 29).
В появившемся окне (рис. 30) в строке число указать номер ячейки, которую будем ранжировать; в строке ссылка указать данные массива, среди которого будет ранжироваться число; в строке
порядок поставить 1.
Далее вернуться в ячейку G2 и функцию скопировать на другие ячейки столбца. Для этого зафиксируем значения в строке ссылка через знаки «доллары».
5.1.4. Столбец I (переменная D) составим как разность столбцов G и H, столбец D2 как квадрат
столбца I, и в этом столбце нас будет интересовать его сумма. Как видим, она равна 371 (рис. 31).
Рис. 28
31
Рис. 29
Рис. 30
Рис. 31
32
5.1.5. Найденную
rxe = 0,29.
Для
∑ D 2 = 371 подставляем в формулу rxe = 1 −
проверки
значимости
данного
6∑ Di 2
n( n 2 − 1)
коэффициента
и получаем, что
корреляции
находим
rxe
⋅ n − k − 1 = 0,98 и сравниваем его с tтабл = 2,23. Так как 0,98 < 2,23, то гетероскеда1 − rxe2
стичность отсутствует.
Пункты 2, 3, 4 рассчитываются аналогично. Для степенной модели будет следующая картина
(см. рис. 32), для показательной – см. рис. 33, для гиперболической модели – см. рис. 34.
Как видим, все модели гомоскедастичны.
tфакт =
Рис. 32
Рис. 33
33
Рис. 34
Задача 6. По данным о государственных расходах на образование, валовому внутреннему продукту разных стран составлена
следующая таблица (рис. 35).
По методу Голдфельда–Кванта проверить модель на гетероскедастичность.
Решение
Наши данные уже упорядочены по переменной х, поэтому
сразу будем искать частные уравнения регрессии для первых 12
стран с наименьшим ВВП и для 12 стран с наибольшим ВВП. Это
делается по примеру задачи 1.
Выделим цветом первые 12 и последние 12 наблюдений. Наблюдения, попавшие в середину, просто отбрасываются. Построим таблицы 5 х 2 для первых 12 и для последних 12 наблюдений
(рис. 36).
Для нахождения Fфакт возьмем числа в последней строке второго столбца: Fфакт = Sбол S мал . Большая сумма квадратов остатков
получилась у регрессии по последним 12 наблюдениям, поэтому
будем делить ее на меньшую сумму квадратов остатков по первой
регрессии.
Fфакт = 144,674, Fтабл = 2,98 (находится по таблице Фишера
на пересечении чисел k1 = 10 и k2 = 10).
Как видим, Fфакт > Fтабл. Следовательно, в данной выборке
присутствует гетероскедастичность.
Рис. 35
34
Рис. 36
Задача 7. Пользуясь данными задач 1–4, установить характер гетероскедастичности по методу
Уайта и Глейзера.
Решение
Тест Голдфельда–Кванта позволяет только выявить наличие гетероскедастичности, поэтому если возникает необходимость найти точную функциональную форму зависимости между параметром
х и остатками е, то применяют тест Уайта или Глейзера.
Предположим, что эта зависимость представлена в виде: σ i = α + β xiγ и для каждого значения
1 1 3 

2 2 2 

2
сии между столбцами е (тест Уайта) или столбцом е (тест Глейзера) и новым введенным столбцом
хγ .
Открываем новый лист, называем его «ТЕСТ У. и Г. ЛИН». Вводим в него данные по нашим
12 магазинам, строим таблицу 5 х 2 для линейной функции. Строим дополнительные столбцы y, ŷ ,
e, e2, |e|.
Например, по данным задачи 1 (линейная функция), см. рис. 37.
1
Далее вводим вспомогательные столбцы, где переменная х возводится в различные степени: ,
х
1
x,
, x 3 , x2.
x
Все эти столбцы закрасим разными цветами, чтобы в дальнейшем не было путаницы при вычислениях (рис. 38).
γ , которое обычно берут за числа из множества 1, −1, , − , , 2  , составляется уравнение регрес-
35
Рис. 37
Рис. 38
36
Построим уравнения регрессии (различные таблицы 5 х 2) для γ = −1 ,
1 1 3
, – , , 1, 2 (рис. 39).
2 2 2
Для теста Уайта ищем зависимости:
1
1
e2 = a + b , e2 = a + b x , e2 = a + b
, e2 = a + b x3 , e2 = a + bx , e2 = a + bx 2 .
x
x
Для теста Глейзера ищем зависимости:
1
1
е = a+b , е = a+b x , e = a+b
, e = a + b x3 , е = a + bx , е = a + bx 2 .
x
x
Из полученных таблиц 5 х 2, соответствующих различным значениям γ , составим общую таблицу:
Тест
Уайта
Глейзера
Значение
Fфакт для
зависимости
e2 = a + bx
1,33
1,2
Значение
Fфакт для зависимости
1
e2 = a + b
x
1,32
1,02
Значение Fфакт
для зависимости
1
2
e = a+b
x
1,38
1,06
Значение
Fфакт для
зависимости
Значение
Fфакт для зависимости
e2 = a + b x
e2 = a + b x3
Значение
Fфакт для
зависимости
e2 = a + bx 2
1,37
1,14
1,3
1,28
1,28
1,38
Fтабл = 4,96 (находим по таблице Фишера для γ = 0,95 (α = 0,05) на пересечении чисел k1 = 1 и
k2 = 10). Как видим, все значения Fфакт из таблицы не превышают Fтабл. Следовательно, гетероскедастичности в модели нет.
Если бы обнаружился хотя бы один показатель Fфакт > Fтабл, то в модели присутствовала бы гетероскедастичность, и выражалась бы она той зависимостью, в которой обнаружен этот наибольший
Fфакт.
Рис. 39
37
Раздел 4
АВТОКОРРЕЛЯЦИЯ
Методические указания
Рассмотрим более подробно третье условие теоремы Гаусса–Маркова: случайные члены должны быть абсолютно независимы друг от друга, т.е. M( ei ⋅ e j ) = 0, i ≠ j . Если оно не выполняется, то
говорят, что модель подвержена автокорреляции.
Как правило, автокорреляция присутствует при использовании временных рядов, и чаще всего
наибольшее влияние на последующее наблюдение оказывает результат предыдущего наблюдения,
тогда говорят об автокорреляции первого порядка.
Ситуация, когда на значении е наблюдения уt оказывает основное влияние не результат уt–1, а
более ранние значения, является достаточно редкой. Чаще всего при этом влияние носит сезонный
(циклический) характер. Например, на значение уt оказывает наибольшее влияние уt–7, если наблюдения осуществляются ежедневно и имеют недельный цикл (например, сбор в кинотеатре). В этом
случае можно составить ряды наблюдений отдельно по субботам, воскресеньям и т.д., после чего
сильная корреляция будет наблюдаться между соседними членами. Таким образом, отсутствие корреляции между соседними членами служит хорошим основанием считать, что корреляция отсутствует в целом, и обычный метод МНК дает адекватные и эффективные результаты.
Виды автокорреляции:
1. Положительная – характеризуется чередованием зон, где наблюдаемые значения оказываются выше объясненных, и зон, где наблюдаемые значения ниже (рис. 40).
Рис. 40
2. Отрицательная – характеризуется тем, что за положительным значением в одном наблюдении идет отрицательное в следующем.
Рис. 41
Как обнаружить автокорреляцию?
Для обнаружения автокорреляции первого порядка существует критерий Дарбина- Уотсона, и
определяется он следующим образом:
T
d факт =
∑ ( et − et −1 )
t =2
,
T
∑ et
2
2
t =1
где всевозможные значения dфакт будут принадлежать интервалу (0; 4).
Тест Дарбина–Уотсона имеет один существенный недостаток – распределение статистики d зависит не только от числа наблюдений, но и от значений объясняющих переменных xi . Это означает,
что данный тест не представляет собой статистический критерий в том смысле, что нельзя указать
38
критическую область, которая позволяла бы отвергнуть гипотезу об отсутствии корреляции, если бы
оказалось, что в эту область попало наблюдаемое значение статистики d.
Однако существуют два пороговых значения d в и d н , зависящие только от числа наблюдений,
числа xi , уровня значимости. Для этих значений существует специальная таблица.
Для дальнейшего исследования на автокорреляцию интервал (0; 4) разбивают на зоны, зависящие от d в и d н , и смотрят, куда попало значение d.
Зона попадания d
(0, d н )
Наличие автокорреляции
Положительная автокорреляция
( dн , dв )
Зона неопределенности
( d в ,4 – d в )
Отсутствие автокорреляции
(4 – d в ,4 – d н )
Зона неопределенности
(4 – d н ,4)
Отрицательная автокорреляция
Так же, как и при гетероскедастичности, автокорреляционную модель нельзя использовать для
дальнейших вычислений, поэтому автокорреляцию необходимо ликвидировать.
Возможно, это удастся сделать путем определения ответственного за нее фактора или факторов
и соответствующего расширения уравнения регрессии, т.е. применить множественный регрессионный анализ (МРА). Как это сделать, рассмотрим позже.
Статистика Дарбина–Уотсона, безусловно, является наиболее важным индикатором наличия автокорреляции. Однако, как уже отмечалось, тест обладает и определенными недостатками. Это и
наличие зоны неопределенности, и ограниченность результата (выявляется лишь корреляция между
соседними членами). Ничего нельзя сказать и о характере автокорреляции. Это приводит к необходимости использовать также и другие тесты на наличие автокорреляции. Во всех тестах в качестве
основной гипотезы Н0 фигурирует гипотеза об отсутствии автокорреляции. Например, тест Бреуша–
Годфри.
Тест основан на следующей идее: если имеется корреляция между соседними наблюдениями, то
естественно ожидать, что в уравнении et = ρ et −1 + vt (где et – остатки регрессии, полученные обычным методом МНК) коэффициент ρ окажется значимо отличным от нуля.
Решение типовых задач
Задача 8. Используя данные задач 1–4, исследовать модель на автокорреляцию первого порядка.
Решение
8.1. Тест Дарбина–Уотсона
Откроем новый лист, назовем его АВТОКОР ЛИН и скопируем в него данные по переменным
х и у с листа ЛИНЕЙНАЯ (рис. 42). Затем по методу МНК оценим линейную регрессию между этими переменными и построим столбцы у̂ и еt , et −1 .
Столбец et −1 строим смещением столбца et на одну ячейку вниз. Т.е. встаньте в ячейку Е3 и
скопируйте в нее значение ячейки D2, далее скопируйте ячейку E3 вниз на весь столбец до заливки.
Применив формулу Дарбина–Уотсона, вычислим d факт (для этого построим дополнительные
столбцы et −1 , (et − et −1 ) 2 , et2 .
12
Значение d факт = d =
∑ ( et − et −1 )
t =2
12
2
=2,49.
∑ et 2
t =1
По таблице Дарбина–Уотсона найдем d н = 1,08 , а d в = 1,36 . Составим зоны для статистки Дарбина–Уотсона:
39
Зона попадания d
(0: 1,08)
(1,08: 1,36)
(1,36: 2,64)
(2,64: 2,92)
(2,92: 4)
Наличие автокорреляции
Положительная автокорреляция
Зона неопределенности
Отсутствие автокорреляции
Зона неопределенности
Отрицательная автокорреляция
Видим, что наше d факт = 2, 49 попало в зону отсутствия автокорреляции.
Аналогично для степенной, гиперболической, показательной функций откроем новые листы и
сделаем проверку на автокорреляцию для этих функций по критерию Дарбина–Уотсона. Получим:
– для степенной функции (см. рис. 43) видим, что наше d факт = 2,16 попало в зону отсутствия
автокорреляции;
– для гиперболической функции (см. рис. 44) видим, что наше d факт = 0,56 попало в зону положительной автокорреляции;
– для показательной функции (см. рис. 45) видим, что наше d факт = 1,9 попало зону отсутствия
автокорреляции.
Рис. 42
40
Рис. 43
Рис. 44
41
Рис. 45
8.2. Сделаем проверку по тесту Бреуша.
Откроем новый лист, назовем его АВТОКОР БРЕУШ. Скопируем с листа ЛИНЕЙНАЯ данные по переменной х и у.
Построим столбцы у̂ и еt , et −1 . С помощью метода МНК (таблица 5 х 2) построим регрессию
между столбцами еt , et −1 . Т.е. в запрашиваемый диапазон переменной у введем значения столбца еt,
а в запрашиваемый диапазон переменной х введем данные столбца et −1 . Причем вводим, начиная
только со второго значения (рис. 46).
Уравнение et = ρ et −1 + vt для теста Бреуша по нашим вычислениям выглядит следующим образом: et = −0, 28et −1 + 0,41 . Проверим значимость коэффициента ρ.
Для этого составим статистический критерий: tтабл = 2,23.
Так как tфакт < tтабл, то коэффициент ρ незначим, и, следовательно, между рядами еt , et −1 нет
связи, т.е. автокорреляция отсутствует. Этот результат совпал с тестом Дарбина–Уостона.
Аналогично можно проверить по тесту Бреуша показательную, степенную и гиперболические
функции. Также по этому тесту можно проверять автокорреляцию более высоких порядков.
42
Рис. 46
43
Раздел 5
МНОЖЕСТВЕННЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ (МРА)
Методические указания
Множественная регрессия – уравнение связи с несколькими независимыми переменными:
y = f ( x1 , x2 , ..., xk ) , где у – зависимая переменная; x1 , x2 , ..., xk – независимые переменные.
Для построения уравнения множественной регрессии чаще используются следующие функции:
а) линейная y = α + β1 x1 + β 2 x2 + ... + β n xn + ε ;
б) степенная y = α x1β1 ⋅ x2 β 2 ⋅ ... ⋅ xn β n ⋅ ε ;
в) показательная y = a β1 x1 +...+ β n xn +ε .
Можно использовать и другие функции, приводимые к линейному виду.
Для оценки параметров уравнения множественной регрессии применяют уже известный нам метод МНК. Для линейных уравнений и нелинейных уравнений, приводимых к линейным, строится
следующая система нормальных уравнений, решение которой позволяет получить оценки параметров регрессии:

∑ y = na + b1 ∑ x1 + b2 ∑ x2 + ... + bk ∑ xk

 ∑ yx1 = a ∑ x1 + b1 ∑ x12 + b2 ∑ x1 x2 + ... + bk ∑ x1 xk

 ...................................................................................
∑ yxk = a ∑ xk + b1 ∑ x1 xk + b2 ∑ x2 xk + ... + bk ∑ xk 2

Эта система из n + 1 уравнений с n + 1 неизвестными. Для ее решения может быть применен метод определителей (Крамера):
∆b
∆b
∆b
∆a
а=
, b1 = 1 , b2 = 2 , …, bk = k ,
∆
∆
∆
∆
n
∑ x1 ∑ x2 ... ∑ xk
∑ x1 ∑ x1 x1 ∑ x2 x1 ... ∑ xk x1
где ∆ = ∑ x2 ∑ x1 x2 ∑ x2 x2 ... ∑ xk x2 ;
......
.........
......... ... ..........
∑ xk ∑ x1xk ∑ x2 xk ... ∑ xk xk
∆a, ∆b1 , ..., ∆bn − частные определители, которые получаются путем замены соответствующего
столбца матрицы системы данными левой части системы.
В частности, для двух объясняющих переменных х1 и х2 оценки a, b1, b2 находят по формулам:
a = y − b1 x1 − b2 x2

Cov( xi , y ) ⋅ Var ( x j ) − Cov( x j , y ) ⋅ Cov( x1 , x2 )

b
=
i

Var ( x1 ) ⋅ Var ( x2 ) − Cov 2 ( x1 , x2 )

где если i = 1 , тогда j = 2 , и наоборот.
Или найти оценки коэффициентов уравнения регрессии можно с помощью матричной алгебры,
для этого вводят следующие обозначения:
Y = ( y1 , y2 ,... yn ) – матрица-столбец n × 1 значений зависимой переменной в n наблюдениях;
Т
1

1
Х =1

 ...
1

44
x11
x21 ...
x12
x13
x22 ...
x23 ...
...
x1n
... ...
x2 n ...
xk1 

xk 2 
xk 3  – матрица n× (k + 1) значений объясняющих переменных;

... 
xkn 
α 
 
β
β =  1  – матрица-столбец (k + 1) × 1 параметров;
 .. 
 
 βk 
 ε1 
 
ε
ε =  2  – матрица-столбец (n + 1) ×1 остатков.
 .. 
 
εn 
Тогда в матричной форме эконометрическая модель задачи множественной регрессии примет
вид: Y = X β + ε , а оценкой этой модели будет уравнение: Y = XB + E , где В = (a, b1, b2, …, bk)T,
E = (e1, e2, …, en), и матрицу В находят из следующего равенства: В = (XTX)–1XTY.
Стандартные ошибки коэффициентов bi находят по формулам:
E T E  T −1 
c.o.(bi ) =
⋅ (X X )
,
 i +1,i +1
n − k −1 
где [ ( X T X ) −1 ]i ,i – диагональный элемент аii матрицы (ХТХ)–1.
Для оценки статистической значимости коэффициентов регрессии рассчитываются t–критерий
Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка значимости коэффициентов
регрессии и корреляции с помощью t-критерия Стьюдента проводится путем сопоставления их знаbi
a
чений с величиной случайной ошибки: tфакт (bi ) =
, tфакт (a ) =
.
c.o.(bi )
c.o.( a )
Если tфакт > tтабл, то гипотеза Н0 о случайной природе оцениваемых параметров отклоняется, и
признается их статистическая значимость, и наоборот.
Для расчета доверительного интервала определяем предельную ошибку ∆ для каждого показателя: ∆ a = tтабл ⋅ с.о.( а ) , ∆ b = tтабл ⋅ с.о.(bi ) .
i
Формулы для расчета доверительных интервалов имеют следующий вид: γ a = a ± ∆ a ,
γ bi = bi ± ∆bi .
Прогнозное значение yp определяется путем подстановки в уравнение регрессии
ˆy = a + b1 x1 + ... + bk xk соответствующего прогнозного значения Xp = (1, x1p, x2p, …, xkp)T. Здесь второй
индекс р означает первую букву слова «прогноз».
Вычисляется средняя стандартная ошибка прогноза c.o.( yˆ p ) :
(
 ET E 
T
T
−1
c.o.( yˆ p ) = 
 1+ X p (X X ) X p
 n − k −1 
и строится доверительный интервал прогноза:
γ yˆ p = yˆ p ± ∆ yˆ p ,
)
где ∆ yˆ p = tтабл ⋅с.о.( yˆ p ) .
Данная процедура очень трудоемка, поэтому найти оценки, а также сразу их стандартные ошибки, коэффициент детерминации и доверительные интервалы и значимость всего уравнения в целом
можно с помощью ППП Excel, Mathcad. Как это сделать, рассмотрим в примерах.
На практике часто бывает необходимо сравнение влияния на зависимую переменную различных
объясняющих переменных, когда последние выражаются в различных единицах. В этом случае используют стандартизированные коэффициенты регрессии и коэффициенты эластичности:
x
Э yxi = bi i .
y
45
Тесноту совместного влияния факторов на результат оценивает коэффициент детерминации:
RSS
Var ( yˆ )
Var (e)
R 2YX1... Xk = 1 −
= R2 =
, или R 2 = 1 −
.
TSS
Var ( y )
Var ( y )
Значение коэффициента детерминации лежит в пределах от 0 до 1 и должно быть больше или
равно максимальному парному коэффициенту корреляции: R 2 yx1... xn ≥ ryxi (i = 1...n).
При добавлении объясняющей переменной к уравнению регрессии коэффициент детерминации
R 2 никогда не уменьшается, а обычно увеличивается, поэтому вводят скорректированный коэффициент детерминации R̂ 2 , обеспечивающий компенсацию для такого автоматического сдвига вверх
путем наложения «штрафа» за увеличение числа объясняющих переменных:
n −1
Rˆ 2 = 1 −
(1 − R 2 ) ,
n − k −1
где k – число объясняющих переменных.
В МРА может случиться так, что коррелирующими окажутся не только х и у, но и x1 , x2 или
x2 , x3 и т.д. В связи с этим возникает необходимость исследовать частную корреляцию между переменными при исключении влияния одной или нескольких переменных.
Частные коэффициенты корреляции, измеряющие влияние на у фактора xi при неизменном
уровне других факторов, можно определить по формуле:
1 − R 2 yx x ... x ... x
1 2
i
p
ryxi ⋅ x1x2 ... xi −1 xi +1... x p = 1 −
,
2
1 − R yx1x2 ... xi −1 xi +1 ... x p
2
где Ryx
x
1 2 ... x p
2
Ryx
x
– коэффициент детерминации всего комплекса k факторов с результатом,
1 2 ... xi −1 xi +1 ... x p
– коэффициент детерминации, но без введения в модель фактора xi.
Порядок частного коэффициента корреляции определяется количеством факторов, влияние которых исключается. Например, ryx1 ⋅x2 – коэффициент корреляции первого порядка. Коэффициенты
частной корреляции более высоких порядков можно определить через коэффициенты частной корреляции более низких порядков по формуле:
ryx ⋅x x ... x − ryx p ⋅ x1x2 ... x p −1 ⋅ rxi x p ⋅ x1 x2 ... x p −1
ryxi ⋅ x1x2 ... x p = i 1 2 p −1
.
1 − ryx2 ⋅ x x ... x
⋅ 1 − rx2x ⋅ x x ... x
(
p
1 2
p −1
)(
i p
1 2
p −1
)
Или частную корреляцию можно считать по рекуррентной формуле, для которой сначала составляется корреляционная матрица:
 1 r12 ... r1 p 


 r21 1 ... r2 p 
,
qp = 
.... .... ... .... 


 rp1 rp 2 ... 1 


где р = 1 + k, т.е. количество всех переменных, участвующих в задаче. Обычно за i = 1 принимают
переменную у, за i = 2 переменную х1 и т.д., т. е. коэффициент корреляции r12 – это коэффициент
корреляции между переменными у и х1.
Тогда частный коэффициент корреляции вычисляется так:
qij
rij⋅1,2,... p \ij = −
,
qii q jj
где qij , qii , q jj – алгебраические дополнения элементов rij , rii , r jj в корреляционной матрице.
В частности, для трех переменных (одной зависимой и двух объясняющих) имеем:
 1 r12 r13 


q3 =  r21 1 r23  .
r

 31 r32 1 
46
q11 = 1 − r32 r23
q12 = −(r21 − r31r23)
Тогда q22 = 1 − r31r13
q21 = −(r12 − r13r32)
q33 = 1 − r21r12
q32 = −( r23 − r21r13)
q13 = r21r32 − r31
q23 = −( r32 − r31rr12) и rij⋅k =
q31 = r13 − r12 r23
rij − rik r jk
(1 − rik 2 )(1 − r jk 2 )
.
Решение типовых задач
Задача 9. Добавив новую переменную Х2 в задачу 1 (из раздела «Парный регрессионный анализ»), которая равна среднему числу посетителей в каждом магазине в день:
1) cоставить уравнение МРА и проверить эффективность (рациональность) введения этой новой
переменной, исследовав модель по таким критериям, как коэффициент детерминации, значимость
уравнения, наличие гетероскедастичности;
2) посчитать прогноз (доверительный интервал) среднегодового товарооборота для нового
строящегося магазина площадью 1 тыс. м2 и предполагаемым средним числом посетителей в день,
равным 110 % от среднего числа посетителей остальных магазинов.
№ магазина
Годовой товарооборот,
млн. руб. (Y)
Торговая площадь,
тыс. м2 (X1)
Среднее число посетителей в
день, тыс. чел. (X2)
1
2
3
4
5
6
7
8
9
10
11
12
19,76
38,09
40,95
41,08
56,29
68,51
75,01
89,05
91,13
91,26
99,84
108,55
0,24
0,31
0,55
0,48
0,78
0,98
0,94
1,21
1,29
1,12
1,29
1,49
8,25
10,24
9,31
11,01
8,54
7,51
12,36
10,81
9,89
13,72
12,27
13,92
Решение
Откроем новый лист и назовем его МРА (множественный регрессионный анализ). Скопируем с листа ЛИНЕЙНАЯ данные
столбцов х и y. Переменную х теперь переименуем в переменную
х1. Новую переменную – численность посетителей в магазине –
обозначим как переменную х2 и введем ее в новый третий столбец
(рис. 47).
Для нахождения коэффициентов регрессии используем пакет
анализа данных. Для этого в главном меню выбираем:
– для EXCEL 2003: Сервис → Анализ данных → Регрессия.
Щелкните по ОК.
– для EXCEL 2007: Данные → Анализ данных → Регрессия.
Щелкните по ОК
В появившемся окне Регрессия (рис. 48) в строку Входной
интервал Y вводим значения столбца со значениями переменной
у, в строку Входной интервал Х вводим значения столбцов Х1 и
Х2 как один массив. Напротив окна Метки ставится галочка, если
значения вводились с названиями переменных. Если в уравнении
предполагается наличие свободного члена, то окно Константа –
ноль оставляем без галочки. Если же нужно составить уравнение
регрессии без свободного члена (часто такие уравнения нужны в
задачах на устранение гетероскедастичности), то в данном окне
ставим галочку. Строку уровень надежности оставляем равным
95 %. В подокне Параметры вывода удобнее использовать Вы-
Рис. 47
47
ходной интервал, т.е. напротив этой строки ставим метку, а в саму строку вводятся данные только
одной единственной ячейки, начиная с которой будут выводиться результаты. Например, ячейку
А20. Также удобно будет поставить галочку напротив строки Остатки, тогда в итоговой таблице
будут рассчитаны значения столбцов ŷ , e (рис. 49). Нажать ОК.
Рис. 48
Рис. 49
48
Как видим, с ячейки А20 выведена
таблица Вывод итогов. Что она означает, можно вспомнить из раздела «Парный регрессионный анализ».
Итак, уравнение МРА имеет вид:
yˆ = −10,82 + 61,66 X1 + 2,27 X 2 , R2 = 0,99 ,
Rˆ 2 = 0,98 , Fфакт = 384,18.
Сравним полученные данные с результатами МРА. Для этого вспомним
основные параметры моделей парного
регрессионного анализа. Откроем лист
ИТОГ и добавим в него данные по
функции МРА.
Как видим, результаты сильно
улучшились (вырос скорректированный
коэффициент детерминации, уменьшиРис. 50
лась сумма квадратов остатков, Fзначимость выросла).
Проверим на гетероскедастичность функцию МРА. Это можно будет сделать по тесту Голдфельда–Кванта (при условии, что переменные х1 и х2 расположены в ранжированном порядке) или
по тесту ранговой корреляции Спирмена (для каждой переменной в отдельности). В нашем примере
переменные не ранжированы, поэтому тест Голдфельда–Кванта не подойдет.
Применим тест Спирмена для каждой переменной.
Построим новые столбцы ŷ , e, |e|, используя данные из таблицы ВЫВОД ИТОГОВ (с ячейки
А20), рис. 51.
Как видно из таблицы (рис. 51), tфакт < tтабл для каждой переменной. Следовательно, гетероскедастичность в данной модели МРА отсутствует.
Рис. 51
49
Рис. 52
Проверим наличие автокорреляции для множественной регрессии. Для этого применим тест
Дарбина–Уотсона.
Откроем новый лист, назовем его АВТОКОР МРА. Скопируем в него с листа МРА данные
столбцов: y, x1, x2, et. Построим новый столбец et–1. Далее все проделаем по тесту Дарбина–Уотсона
(рис. 52).
Получим коэффициент Дарбина dфакт = 2,5.
Построим зоны для коэффициента d. Для этого по таблице Дарбина найдем границы для зон dн и dв.
Эти числа будут на пересечении чисел k = 2 (так как в задаче уже две объясняющие переменные) и n = 12. Это числа dн = 0,95 и dв = 1,54.
Зона попадания d
(0: 0,95)
(0,95: 1,54)
(1,54: 2,46)
(2,46: 3,05)
(3,05: 4)
Наличие автокорреляции
Положительная автокорреляция
Зона неопределенности
Отсутствие автокорреляции
Зона неопределенности
Отрицательная автокорреляция
Наш коэффициент Дарбина попал в зону неопределенности, поэтому сказать о наличии автокорреляции по тесту Дарбина–Уотсона нельзя. Применим тест Бреуша.
Построим регрессию et = ρ et −1 + vt . Для теста Бреуша по нашим вычислениям результат выглядит следующим образом: et = −0, 48et −1 + 0, 45 (рис. 53).
50
Рис. 53
Рис. 54
Проверим значимость коэффициента ρ = –0,48.
Для этого составим статистический критерий: tтабл = 2,23. Так как tфакт < tтабл, то коэффициент ρ
незначим и, следовательно, между рядами еt , et −1 нет связи, т.е. автокорреляция отсутствует.
Вернемся теперь на лист ИТОГ и продолжим нашу итоговую таблицу, поставив «есть» и
«нет» в столбце наличия гетероскедастичности и автокорреляции (рис. 54).
На этом же листе делаем вывод, что наилучшей функцией для вычисления прогноза является
функция МРА. У нее наивысший коэффициент детерминации, наибольший критерий Fфакт и наименьшая сумма квадратов остатков, отсутствует гетероскедастичность и автокорреляция.
2. Для вычисления доверительного интервала нам придется воспользоваться ППП MathCAD,
чтобы вычислить X Tp ( X T X )−1 X p . Для этого откройте новый файл в MathCAD и с помощью панелей
инструментов Арифметика, Математика, Матрицы выполните соответствующие действия.
Также нужно знать х2 р . По условию задания это 110 % процентов от среднего значения и равно
11,72. Прогнозное значение переменной х1, как и в парном регрессионном анализе, равно 1 тыс. м2,
 1 
т.е. х1р = 1 , поэтому матрица Х р =  1  (рис. 55):
11,72 


51
Рис. 55
Как видим, X Tp ( X T X ) −1 X p = 0,1 . Теперь подставим это значение в формулу стандартной ошибки уˆ р , учитывая, что ЕТЕ = ∑ е2 = 104,67, n = 12, k = 2.
(
)
 ET E 
T
T
−1
Итак: c.o.( yˆ p ) = 
 1 + X p ( X X ) X p = 3,36,
n
k
−
−
1


yˆ р = −10,82 + 61,66 + 2, 27 ⋅11,72 = 77, 44, ∆ уˆ р = 2,26 ⋅ 3,6 = 8.
Следовательно, γ yˆ p = yˆ p ± ∆ yˆ p = (69, 44; 85,44) , т.е. с уверенностью в 95 % можно считать, что
годовой товарооборот нового магазина будет лежать в этом интервале.
52
ПРИЛОЖЕНИЕ А
Наборы данных для зачетной работы
(Данные в столбце «доход» – это данные переменной Х, данные в остальных столбцах – данные по переменным Y, называемой в дальнейшем «товар»).
Личные потребительские расходы населения США(млрд. долл, в ценах 72 года)
год
доход
1
2
3
4
5
6
7
питание
одежда
бензин
мот.
масло
табак
космет
лекарст
жилье
5,2
10,7
3,5
60,9
3,1
8
Вариант
10
11
9
газ
вода
телеф
12
местн
транст
13
14
воз.
тран.
мед
усл.
4,7
3,9
0,9
15
8,8
16
17
18
19
20
стомат
отдых
ч.
образ
кух.
обор
посуда
юв.
изд
3,2
9,6
5,6
1959
479,7
99,7
36,3
13,7
3,9
2
4,2
2,6
2,2
1960
489,7
100,9
36,6
14,2
5
10,9
3,5
3,9
1961
503,8
102,5
37,3
14,3
4,7
11,2
3,9
4,3
64
4,1
2,2
5
3,9
0,9
9
3,2
10
6
4,2
2,5
2,2
67
4,3
2,3
5,4
3,6
1
9,1
3,3
10,4
6,3
4,2
2,5
2,2
1962
524,9
103,5
38,9
14,9
4,7
11,2
4,2
4,7
70,7
4,7
2,5
5,7
3,6
1,1
9,8
3,5
10,9
6,6
4,4
2,6
2,3
1963
542,3
104,6
39,6
15,3
4,9
11,4
4,5
4,9
1964
580,8
108,8
42,6
16
5,2
11,3
4,8
5,1
74
4,9
2,7
6,1
3,5
1,2
10,2
3,4
11,3
7
4,6
2,5
2,5
77,4
5,1
2,8
6,6
3,4
1,4
11,9
3,9
11,6
7,4
5,1
2,8
2,6
1965
616,3
113,7
44,2
16,8
5,5
11,6
5,3
5,3
1966
646,8
116,6
46,9
17,8
5,6
11,7
5,9
5,5
81,6
5,3
2,9
7,3
3,3
1,6
12,1
4
11,9
8,1
5,2
3,1
2,9
85,3
5,4
3
8,1
3,3
1,7
12,1
4,1
12,4
8,8
5,8
3,5
3,6
1967
673,5
118,6
46,9
18,4
5,6
11,8
6,3
5,8
89,1
5,7
3
8,7
3,2
2,1
12,5
1968
701,3
123,4
49
19,9
5,3
11,7
6,6
6,4
93,5
5,9
3,1
9,5
3,3
2,4
12,8
4,3
12,7
9,3
6
3,7
3,9
4,4
13,4
10
6,6
3,8
4,1
1969
722,5
125,9
50
21,4
5
11,4
6,8
7
98,4
6,2
3,3
10,4
3,5
2,8
13,6
4,8
14,1
10,6
7
3,8
4,1
1970
751,6
129,4
49,4
22,9
4,7
11,7
7
7,7
102
6,3
3,5
11,2
3,4
2,7
1971
779,2
130
51,8
24,2
4,6
11,8
7,1
8
106,4
6,4
3,6
11,7
3,4
2,8
14,4
5,1
14,6
10,9
7,3
3,7
4,1
14,8
5,1
15,1
11,2
7,9
3,8
1972
810,3
132,4
55,4
25,4
5
12,2
7,4
8,7
112,5
6,6
3,9
12,4
3,4
3,1
4,3
15,7
5,3
15,8
11,7
8,9
4
4,6
1973
865,3
129,4
59,3
26,2
5,4
12,8
7,9
9,3
118,2
6,4
4,1
13,7
3,4
3,4
16,9
6,1
16,9
11,9
9,9
4,2
5,2
1974
858,4
128,1
58,7
24,8
4,2
13
7,8
9,8
124,2
6,5
4,3
14,4
3,5
3,7
17,2
6,2
17,6
11,7
9,9
4,1
5,4
1975
875,8
132,3
60,9
25,6
4,2
12,9
7,4
9,7
128,3
6,6
4,4
15,9
3,5
3,6
17,8
6,4
17,9
12,1
9,3
3,7
5,5
1976
906,8
139,7
63,8
26,8
4,6
13,7
7,5
10
134,9
6,7
4,3
17,1
3,6
4
18
6,9
19,1
12,2
9,7
3,9
6,1
1977
942,9
145,2
67,5
27,7
4,4
13,1
7,8
10,2
141,3
6,5
4,4
18,3
3,6
4,3
19,2
7,2
20,4
12,2
10,5
4,1
6,3
1978
988,8
146,1
72,6
28,3
4,7
13,5
8,1
10,4
148,5
6,7
4,5
20
3,7
4,7
18,6
8,1
21,8
12,7
11,1
4,3
6,8
1979
1016
149,3
76,7
27,4
4,7
13,7
8,4
10,8
154,8
6,6
4,8
21,6
3,8
5,1
20,1
7,9
22,2
13,1
11,9
4,5
6,7
1980
1022
153,2
77,9
25,1
3,9
13,6
8,3
10,7
159,8
6,6
5,1
22,7
3,5
4,6
21,5
8,1
23,4
13,3
12,1
4,4
6,3
1981
1049
153
82,6
25,1
3,6
14
8,3
10,6
164,8
6,3
5,1
23,3
3,2
4,1
22
8,5
26,1
13,7
12,4
4,4
6,6
1982
1058
154,6
84,2
25,3
3,6
13,7
8,1
10,3
167,5
6,4
5,1
24,1
3,2
3,7
22,4
8,6
27,7
13,6
11,9
4,3
6,7
1983
1095
161,2
88,5
26,1
4
13
8,1
10,2
171,3
6
5,1
24,2
3,1
3,8
23,3
8,5
29,8
13,7
12,7
4,7
7
53
Индексы реальных цен (дефляторы)
Для расчета данных переменной Х2 нужно значения столбца «товар» поделить на значения столбца «расходы» и умножить на 100.
Получится столбец с данными Х2 для вашего варианта.
Расходы
54
1
питание
2
одежда
3
бензин
4
мот
масло
5
6
7
8
9
10
табак
космет
лекар
жилье
газ
вода
11
телефон
12
мест
тр
13
возд.
трансп
14
мед
усл
15
стоматол
16
отдых
17
частн.
обр
18
кух
обор
19
20
посуда
юв изд
70,6
69
72
82,2
77,7
61
84,6
98,8
73,8
74,9
58,4
88,3
51,1
69
56,1
60,9
61,1
61,5
103,6
68,2
86,5
71,9
69,8
72,9
84,5
76,2
63,2
84,5
98,9
75,1
79,8
60,2
89,6
52,6
74
57,6
62,1
63,7
62,8
102,2
70,3
86,4
72,6
70,6
73,4
83,9
79,3
63,8
84,3
97,8
76,3
80,9
61,8
89,9
54,7
78
59,1
62,4
65,8
63,8
10,1
71,1
86,5
73,7
71,4
73,7
84,5
79,3
64,4
85,1
96,2
77,4
80,8
63,4
89,9
57,1
82
60,8
64
67,5
65,3
97,8
72,9
86,5
74,8
72,4
74,5
84,5
81
65,8
85,4
95,4
78,4
80,8
65,4
90
58,5
76
62,2
65,9
69,4
66,9
95,9
75,3
86,9
75,9
73,7
75
84,4
79,1
67,1
85,5
95,2
79,3
81,8
66,5
90,1
60,3
76
63,7
67,5
71,8
68,5
94,9
76,6
92,2
77,2
75,5
75,8
87,5
80,8
69,8
85,1
94,8
80,3
81,4
68
88,9
61,7
77
65,8
69,6
73,9
70,5
92,6
76,5
89,6
79,2
79,4
78
89,5
83
72,9
84,1
95,1
81,5
81,9
70,5
87
64,5
77
69,9
72
76,6
73,6
91,1
78,1
85,4
81,4
80
81,4
92,4
85,6
75,5
85,5
94,7
83,2
81,7
72,2
88
69
77
74,8
75,6
79,6
76,8
91,2
80,3
86,5
84,6
83,1
86
93,8
88,3
80,3
88,1
94,9
85,4
82,5
75,6
88,1
73,3
78
78,9
79,7
84,4
80,3
93,1
85,8
89,2
88,4
87,5
91
97
90,2
85,6
92,1
95,9
88,4
84
80,7
89,2
78,3
84
84,4
85,4
88,6
85,1
95,1
90,4
94,2
92,5
92,5
94,8
97,9
93,6
92
94,4
98
92,1
88,6
87
90,3
88,6
91
90,7
90,2
93,1
90,6
97,5
93,2
95,8
96,5
94,9
97,8
98,7
99,5
95,7
97,4
99,7
96,5
95
96,3
94,7
95,2
98
97
96
97,5
95,3
99,5
95,8
97,7
100
100
100
100
100
100
100
100
100
100
100
100
100
100
100
100
100
100
100
100
100
105,7
114,3
103,6
109,4
114,8
102,8
102,7
100,3
104,8
105
105
102,6
101,2
104
103,1
103
103,3
107
100,1
105,7
103,6
116,3
130,8
110,5
147,7
182,4
107,8
113,9
103,8
110,6
118
11,5
107
104,6
113
112,5
110,9
109,8
120
105,2
118,6
109,5
125,2
140,1
114,5
157,7
197,4
115,5
128,3
112,5
116,8
141
122
110,4
112,7
123
126,4
122,3
117,2
131
116,9
139,5
117,4
131,7
143,4
117,9
164,3
212
120,4
135,6
119,3
123,4
165
136
114,3
122,7
133
140,6
130,2
122,4
140
123,4
148,3
121,2
139,3
149,6
122,5
173,7
239,9
126,2
143,3
127
131,6
196
151
115,6
129,3
141
153,6
139,9
127,6
149
127,8
154,5
123
149,1
164,9
125,5
181,3
252,7
133
151,1
135,9
141,2
215
167
117
134,9
148
166,2
149,7
134,2
161
134,4
163,8
129,5
162,5
182,4
129,2
243,2
340,2
141
161,5
145,7
152,5
249
175
116,6
143,6
159
181,6
162,3
142,6
177
141,7
177,3
141,5
179
196,6
134,3
337,9
470,8
152
176,2
159,1
166,5
297
186
118,7
166,3
217
205
181,6
153,1
198
148,8
195,7
176,7
194,5
213,3
138,4
376,4
571,7
164,2
194,4
176,6
183,2
337
208
130,1
196,1
274
222,5
198,9
163,4
218
157,4
215,3
183,7
206
222,1
141
356,6
565,3
187,7
210,5
194,7
199,3
404
233
143,5
215
302
243,5
214,3
171,8
232
167
224,4
179,5
213,6
226,5
143,6
344,9
531,2
218,4
222,9
211,4
212,1
473
253
152,6
220,3
320
262,4
228,7
178,8
242
171,9
228,6
182,4
ПРИЛОЖЕНИЕ Б
Статистические таблицы
Таблица 1
Значения функции Лапласа Ф( x ) =
Целые
и десятые
доли х
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4,0
1
2π
x
−t 2
∫ e 2 dt
0
Сотые доли х
0
0,00000
0,03985
0,07925
0,11790
0,15540
0,19145
0,22575
0,25805
0,28815
0,31595
0,34135
0,36435
0,38495
0,40320
0,41925
0,43320
0,44520
0,45545
0,46405
0,47130
0,47725
0,48215
0,48610
0,48930
0,49180
0,49380
0,49535
0,49655
0,49745
0,49815
0,49865
0,49905
0,49930
0,49950
0,49965
0,49980
0,49985
0,49990
0,49995
0,49995
0,49995
1
0,00400
0,04380
0,08165
0,12170
0,15910
0,19495
0,22905
0,26115
0,29105
0,31860
0,34375
0,36650
0,38685
0,40490
0,42075
0,43450
0,44630
0,45635
0,46485
0,47195
0,47780
0,48255
0,48645
0,48955
0,49205
0,49395
0,49550
0,49665
0,49755
0,49820
0,49870
0,49905
0,49935
0,49955
0,49970
0,49980
0,49985
0,49990
0,49995
0,49995
0,49995
2
0,00800
0,04775
0,08705
0,12550
0,16275
0,19845
0,23235
0,26425
0,29390
0,32120
0,34615
0,36865
0,38875
0,40660
0,42220
0,43575
0,44740
0,45730
0,46560
0,47255
0,47830
0,48300
0,48680
0,48985
0,49225
0,49415
0,49560
0,49675
0,49760
0,49825
0,49875
0,49910
0,49935
0,49970
0,49970
0,49980
0,49985
0,49990
0,49995
0,49995
0,49995
3
0,01195
0,05170
0,09095
0,12930
0,16640
0,20195
0,23565
0,26730
0,29675
0,32380
0,34850
0,37075
0,39065
0,40825
0,42365
0,43700
0,44845
0,45820
0,46635
0,47320
0,47880
0,48340
0,48715
0,49010
0,49245
0,49430
0,49575
0,49685
0,49765
0,49830
0,49880
0,49915
0,49940
0,49955
0,49970
0,49980
0,49985
0,49990
0,49995
0,49995
0,49995
4
0,01595
0,05565
0,09485
0,13305
0,17005
0,20540
0,23890
0,27035
0,29955
0,32640
0,35085
0,37285
0,39250
0,40990
0,42505
0,43820
0,44950
0,45905
0,46710
0,47380
0,47930
0,48380
0,48745
0,49035
0,49265
0,49445
0,49585
0,49695
0,49775
0,49835
0,49880
0,49915
0,49940
0,49960
0,49970
0,49980
0,49985
0,49990
0,49995
0,49995
0,49995
5
0,01995
0,05960
0,09870
0,13685
0,17365
0,20885
0,24215
0,27335
0,30235
0,32895
0,35315
0,37495
0,39435
0,41150
0,42645
0,43945
0,45055
0,45995
0,46785
0,47440
0,47980
0,48420
0,48780
0,49060
0,49285
0,49460
0,49600
0,49700
0,49780
0,49840
0,49885
0,49920
0,49945
0,49960
0,49970
0,49980
0,49985
0,49990
0,49995
0,49995
0,49995
6
0,02390
0,06355
0,10255
0,14060
0,17725
0,21225
0,24535
0,27635
0,30510
0,33145
0,35545
0,37700
0,39615
0,41310
0,42785
0,44060
0,45155
0,46080
0,46855
0,47500
0,48030
0,48460
0,48810
0,49085
0,49305
0,49475
0,49610
0,49710
0,49790
0,49845
0,49890
0,49920
0,49945
0,49960
0,49975
0,49980
0,49985
0,49990
0,49995
0,49995
0,49995
7
0,02790
0,06750
0,10640
0,14430
0,18080
0,21565
0,24855
0,27935
0,30785
0,33395
0,35770
0,37900
0,39795
0,41465
0,42920
0,44180
0,45255
0,46165
0,46925
0,47560
0,48080
0,48500
0,48840
0,49110
0,49325
0,49490
0,49620
0,49720
0,49795
0,49850
0,49895
0,49925
0,49945
0,49960
0,49975
0,49980
0,49990
0,49990
0,49995
0,49995
0,49995
8
0,03190
0,07140
0,11025
0,14800
0,18430
0,21905
0,25175
0,28230
0,31055
0,33645
0,35995
0,38100
0,39920
0,41620
0,43055
0,44295
0,45350
0,46245
0,46960
0,47615
0,48125
0,48535
0,48870
0,49135
0,49345
0,49505
0,49630
0,49730
0,49800
0,49855
0,49895
0,49925
0,49950
0,49965
0,49975
0,49985
0,49990
0,49990
0,49995
0,49995
0,49995
9
0,03585
0,07535
0,11410
0,15175
0,18795
0,22240
0,25490
0,28525
0,31325
0,33890
0,36215
0,38300
0,40145
0,41775
0,43440
0,44410
0,45450
0,46325
0,47060
0,47665
0,48170
0,48575
0,48900
0,49160
0,49360
0,49520
0,49640
0,49735
0,49805
0,49860
0,49900
0,49930
0,49950
0,49965
0,49975
0,49985
0,49990
0,49990
0,49995
0,49995
0,49995
55
Таблица 2
Значения t-критерия Стьюдента
Число
степеней
свободы k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
∞
56
Вероятность γ
0,1
0,16
0,14
0,14
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,13
0,2
0,32
0,29
0,28
0,27
0,27
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,26
0,25
0,25
0,25
0,25
0,3
0,51
0,44
0,42
0,41
0,41
0,40
0,40
0,40
0,40
0,40
0,40
0,39
0,39
0,39
0,39
0,39
0,39
0,39
0,39
0,39
0,39
0,39
0,39
0,39
0,39
0,39
0,39
0,39
0,39
0,39
0,39
0,39
0,39
0,38
0,4
0,73
0,62
0,58
0,57
0,56
0,55
0,55
0,55
0,54
0,54
0,54
0,54
0,54
0,54
0,54
0,53
0,53
0,53
0,53
0,53
0,53
0,53
0,53
0,53
0,53
0,53
0,53
0,53
0,53
0,53
0,53
0,53
0,53
0,52
0,5
1,00
0,82
0,76
0,74
0,73
1,72
1,71
1,70
1,70
1,70
0,70
0,69
0,69
0,69
0,69
0,69
0,69
0,69
0,69
0,69
0,69
0,69
0,68
0,68
0,68
0,68
0,68
0,68
0,68
0,68
0,68
0,68
0,68
0,67
0,6
1,38
1,06
0,98
0,94
0,92
1,91
1,90
1,89
1,88
1,88
0,88
0,87
0,87
0,87
0,87
0,86
0,86
0,86
0,86
0,86
0,86
0,86
0,86
0,86
0,86
0,86
0,85
0,85
0,85
0,85
0,85
0,85
0,84
0,84
0,7
1,96
1,34
1,25
1,19
1,16
1,13
1,12
1,11
1,10
1,09
1,09
1,08
1,08
1,08
1,07
1,07
1,07
1,07
1,07
1,06
1,06
1,06
1,06
1,06
1,06
1,06
1,06
1,06
1,05
1,05
1,05
1,05
1,04
1,04
0,8
3,08
1,89
1,64
1,53
1,48
1,44
1,41
1,40
1,38
1,37
1,36
1,36
1,35
1,34
1,34
1,34
1,33
1,33
1,33
1,32
1,32
1,32
1,32
1,32
1,32
1,31
1,31
1,31
1,31
1,31
1,30
1,30
1,29
1,28
0,9
6,31
2,92
2,35
2,13
2,01
1,94
1,89
1,86
1,83
1,81
1,80
1,78
1,77
1,76
1,75
1,75
1,74
1,73
1,73
1,72
1,72
1,72
1,71
1,71
1,71
1,71
1,70
1,70
1,70
1,70
1,68
1,67
1,66
1,64
0,95
12,71
4,30
3,18
2,78
2,57
2,45
2,36
2,31
2,26
2,23
2,20
2,18
2,16
2,14
2,13
2,12
2,11
2,10
2,09
2,09
2,08
2,07
2,07
2,06
2,06
2,06
2,05
2,05
2,04
2,04
2,02
2,00
1,98
1,96
0,98
31,82
6,96
4,54
3,75
3,36
3,14
3,00
2,90
2,82
2,76
2,72
2,68
2,65
2,62
2,60
2,58
2,57
2,55
2,54
2,53
2,52
2,51
2,50
2,49
2,48
2,48
2,47
2,47
2,46
2,46
2,42
2,39
2,36
2,33
0,99
63,66
9,92
5,84
4,60
4,03
3,71
3,50
3,35
3,25
3,17
3,11
3,05
3,01
2,98
2,95
2,92
2,90
2,88
2,86
2,84
2,83
2,82
2,81
2,80
2,79
2,78
2,77
2,76
2,76
2,75
2,70
2,66
2,62
2,58
Таблица 3
Значения χ 2 -критерия Пирсона
Число
степеней
свободы k
0,99
0,98
0,95
0,90
0,80
0,70
0,50
0,30
0,20
0,10
0,05
0,02
0,01
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
0,00
0,02
0,11
0,30
0,55
0,87
1,24
1,65
2,09
2,56
3,05
3,57
4,11
4,66
5,23
5,81
6,41
7,02
7,63
8,26
8,90
9,54
10,2
10,9
11,5
12,2
12,9
13,6
14,3
14,9
0,00
0,04
0,18
0,43
0,75
1,13
1,56
2,03
2,53
3,06
3,61
4,18
4,76
5,37
5,98
6,61
7,26
7,91
8,57
9,24
9,92
10,6
11,3
12,0
12,7
13,4
14,1
14,8
15,6
16,3
0,00
0,10
0,35
0,71
1,14
1,63
2,17
2,73
3,32
3,94
4,58
5,23
5,89
6,57
7,26
7,96
8,67
9,39
10,1
10,8
11,6
12,3
13,1
13,8
14,6
15,4
16,1
16,9
17,7
18,5
0,02
0,21
0,58
1,06
1,61
2,20
2,83
3,49
4,17
4,86
5,58
6,30
7,04
7,79
8,55
9,31
10,1
10,9
11,6
12,4
13,2
14,0
14,8
15,7
16,5
17,3
18,1
18,9
19,8
20,6
0,06
0,45
1,00
1,65
2,34
3,07
3,82
4,59
5,38
6,18
6,99
7,81
8,63
9,47
10,3
11,1
12,0
12,9
13,7
14,6
15,4
16,3
17,2
18,1
18,9
19,8
20,7
21,6
22,5
23,4
0,15
0,71
1,42
2,20
3,00
3,83
4,67
5,53
6,39
7,27
8,15
9,03
9,93
10,8
11,7
12,6
13,5
14,4
15,3
16,3
17,2
18,1
19,0
19,9
20,9
21,8
22,7
23,6
24,6
25,5
0,45
1,39
2,37
3,36
4,35
5,35
6,35
7,34
8,34
9,34
10,3
11,3
12,3
13,3
14,3
15,3
16,3
17,3
18,3
19,3
20,3
21,3
22,3
23,3
24,3
25,3
26,3
27,3
28,3
29,3
1,07
2,41
3,66
4,88
6,06
7,23
8,38
9,52
10,7
11,8
12,9
14,0
15,1
16,2
17,3
18,4
19,5
20,6
21,7
22,8
23,9
24,9
26,0
27,1
28,2
29,2
30,3
31,4
32,5
33,5
1,64
3,22
4,64
5,99
7,29
8,56
9,80
11,0
12,2
13,4
14,6
15,8
17,0
18,1
19,3
20,5
21,6
22,8
23,9
25,0
26,2
27,3
28,4
29,6
30,7
31,8
32,9
34,0
35,1
36,2
2,71
4,60
6,25
7,78
9,24
10,6
12,0
13,4
14,7
16,0
17,3
18,5
19,8
21,1
22,3
23,5
24,8
26,0
27,2
28,4
29,6
30,8
32,0
33,2
34,4
35,6
36,7
37,9
39,1
40,3
3,84
5,99
7,82
9,49
11,1
12,6
14,1
15,5
16,9
18,3
19,7
21,0
22,4
23,7
25,0
26,3
27,6
28,9
30,1
31,4
32,7
33,9
35,2
36,4
37,7
38,9
40,1
41,3
42,6
43,8
5,41
7,82
9,84
11,7
13,4
15,0
16,6
18,2
19,7
21,2
22,6
24,1
25,5
26,9
28,3
29,6
31,0
32,3
33,7
35,0
36,3
37,7
39,0
40,3
41,7
42,9
44,1
45,4
46,7
48,0
6,64
9,21
11,3
13,3
15,1
16,8
18,5
20,1
21,7
23,2
24,7
26,2
27,7
29,1
30,6
32,0
33,4
34,8
36,2
37,6
38,9
40,3
41,6
43,0
44,3
45,6
47,0
48,3
49,6
50,9
Вероятность а
57
Таблица 4
Значения F-критерия Фишера–Снедекора
k 1,
k2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
∞
α = 0,05
1
161
18,5
10,1
7,71
6,61
5,99
5,59
5,32
5,12
4,96
4,84
4,75
4,67
4,60
4,54
4,49
4,45
4,41
4,38
4,35
4,32
4,30
4,28
4,26
4,24
4,23
4,21
4,20
4,18
4,17
4,08
4,00
3,92
3,84
2
200
19,0
9,55
6,94
5,79
5,14
4,74
4,46
4,26
4,10
3,98
3,89
3,81
3,74
3,68
3,63
3,59
3,55
3,52
3,49
3,47
3,44
3,42
3,40
3,39
3,37
3,35
3,34
3,33
3,32
3,23
3,15
3,07
3,00
3
216
19,2
9,28
6,59
5,41
4,76
4,35
4,07
3,86
3,71
3,59
3,49
3,41
3,34
3,29
3,24
3,20
3,16
3,13
3,10
3,07
3,05
3,03
3,01
2,99
2,98
2,96
2,95
2,93
2,92
2,84
2,76
2,68
3,60
4
225
19,2
9,12
6,39
5,19
4,53
4,12
3,84
3,63
3,48
3,36
3,26
3,18
3,11
3,06
3,01
2,96
2,93
2,90
2,87
2,84
2,82
2,80
2,78
2,76
2,74
2,73
2,71
2,70
2,69
2,61
2,53
2,45
2,37
5
230
19,3
9,01
6,26
5,05
4,39
3,97
3,69
3,48
3,33
3,20
3,11
3,03
2,96
2,90
2,85
2,81
2,77
2,74
2,71
2,68
2,66
2,64
2,62
2,60
2,59
2,57
2,56
2,55
2,53
2,45
2,37
2,29
2,21
6
234
19,3
8,94
6,16
4,95
4,28
3,87
3,58
3,37
3,22
3,09
3,00
2,92
2,85
2,79
2,74
2,70
2,66
2,63
2,60
2,57
2,55
2,53
2,51
4 49
2,47
2,46
2,45
2,43
2,42
2,34
2,25
2,17
2,10
7
237
19,3
8,89
6,09
4,88
4,21
3,79
3,50
3,29
3,14
3,01
2,91
2,83
2,76
2,71
2,66
2,61
2,58
2,54
2,51
2,49
2,46
2,44
2,42
2,40
2,39
2,37
2,36
2,35
2,33
2,25
2,17
2,09
2,01
8
239
19,4
8,85
6,04
4,82
4,15
3,73
3,44
3,23
3,07
2,95
2,85
2,77
2,70
2,64
2,59
2,55
2,51
2,48
2,45
2,42
2,40
2,37
2,36
2,34
2,32
2,31
2,29
2,28
2,27
2,18
2,10
2,02
1,94
9
240
19,4
8,81
6,00
4,77
4,10
3,68
3,39
3,18
3,02
2,90
2,80
2,71
2,65
2,59
2,54
2,49
2,46
2,42
2,39
2,37
2,34
2,32
2,30
2,28
2,27
2,25
2,24
2,22
2,21
2,12
2,04
1,96
1,83
10
242
19,4
8,79
5,96
4,74
4,06
3,64
3,35
3,14
2,98
2,85
2,75
2,67
2,60
2,54
2,49
2,45
2,41
2,38
2,35
2,32
2,30
2,27
2,25
2,24
2,22
2,20
2,19
2,18
2,16
2,08
1,99
1,91
1,83
12
244
19,4
8,74
5,91
4,68
4,00
3,57
3,28
3,07
2,91
2,79
2,69
2,60
2,53
2,48
2,42
2,38
2,34
2,31
2,28
2,25
2,23
2,20
2,18
2,16
2,15
2,13
2,12
2,10
2,09
2,00
1,92
1,83
1,75
15
246
19,4
8,70
5,86
4,62
3,94
3,51
3,22
3,01
2,85
2,72
2,62
2,53
2,46
2,40
2,35
2,31
2,27
2,23
2,20
2,18
2,15
2,13
2,11
2,09
2,07
2,06
2,04
2,03
2,01
1,92
1,84
1, 75
1,67
20
248
19,4
8,66
5,80
4,56
3,87
3,44
3,15
2,94
2,77
2,65
2,54
2,46
2,39
2,33
2,28
2,23
2,19
2,16
2,12
2,10
2,07
2,05
2,03
2,01
1,99
1,97
1.96
1.94
1,93
1,84
1,75
0,66
1,57
24
249
19,4
8,64
5,77
4,53
3,84
3,41
3,12
2,90
2,74
2,61
2,51
2,42
2,35
2,29
2,24
2,19
2,15
2,11
2,08
2,05
2,03
2,01
1,98
1,96
1,95
1,93
1,91
1,90
1,89
1,79
1,70
1,61
1,52
30
250
19,5
8,62
5,75
4,50
3,81
3,38
3,08
2,86
2,70
2,57
2,47
2,38
2,31
2,25
2,19
2,15
2,11
2,07
2,04
2,01
1,98
1,96
1,94
1,92
1,90
1,88
1,87
1,85
1,84
1,74
1,65
1,55
1,46
40
251
19,5
8,59
5,72
4,46
3,77
3,34
3,04
2,83
2,66
2,53
2,43
2,34
2,27
2,20
2,15
2,10
2,06
2,03
1,99
1,96
1,94
1,91
1,89
1,87
1,85
1,84
1,82
1,81
1,79
1,69
1,59
1,50
1,39
60
252
19,5
8,57
5,69
4,43
3,74
3,30
3,01
2,79
2,62
2,49
2,38
2,30
2,22
2,16
2,11
2,06
2,02
1,98
1,95
1,92
1,89
1,86
1,84
1,82
1,80
1,79
1,77
1,75
1,74
1,64
1,53
1,43
1,32
k1 – число степеней свободы для большой дисперсии, k2 – для меньшей дисперсии.
58
120
253
19,5
8,55
5,66
4,40
3,70
3,27
2,97
2,75
2,58
2,45
2,34
2,25
2,18
2,11
2,06
2,01
1,97
1,93
1,90
1,87
1,84
1,81
1,79
1.77
1,75
1,73
1,71
1,70
1,68
1,58
1,47
1,35
1,22
∞
254
19,5
8,53
5,63
4,36
3,67
3,23
2,93
2,71
2,54
2,40
2,30
2,21
2,13
2,07
2,01
1,96
1,92
1,88
1,84
1,81
1,78
1,76
1,73
1,71
1,69
1,67
1,65
1,64
1,62
1,51
1,39
1,25
1,00
Окончание табл. 4
k 1,
k2
1
1 4052
2 98,5
0
3 34,1
2
4 21,2
0
5 16,2
6
6 13,7
5
7 12,2
5
8 11,2
6
9 10,5
6
10 10,0
4
11 9,65
12 9,33
13 9,07
14 8,86
15 8,68
16 8,53
17 8,40
18 8,29
19 8,18
20 8,10
21 8,02
22 7,95
23 7,88
24 7,82
25 7,77
26 7,72
27 7,68
28 7,64
29 7,60
30 7,56
40 7,31
60 7,08
120 6,85
∞ 6,63
α = 0,01
2
4999
,5
99,0
0
30,8
2
18,0
0
13,2
7
10,9
2
9,55
8,65
8,02
7,56
7,21
6,93
6,70
6,51
6,36
6,23
6,11
6,01
5,93
5,85
5,78
5,72
5,66
5,61
5,57
5,53
5,49
5,45
5,42
5,39
5,18
4,98
4,79
4,61
3
5403
99,1
7
29,4
6
16,6
9
12,0
6
9,78
4
5625
99,2
5
28,7
1
15,9
8
11,3
9
9,15
5
5764
99,3
0
28,2
4
15,5
2
10,9
7
8,75
6
5859
99,3
3
27,9
1
15,2
1
10,6
7
8,47
7
5928
99,3
6
27,6
7
14,9
8
10,4
6
8,26
8
5982
99,3
7
27,4
9
14,8
0
10,2
9
8,10
9
6022
99,3
9
27,3
5
14,6
6
10,1
6
7,98
10
6056
99,4
0
27,2
3
14,5
5
10,0
5
7,87
8,45
7,59
6,99
6,55
6,22
5,95
5,74
5,56
5,42
5,29
5,18
5,09
5,01
4,94
4,87
4,82
4,76
4,72
4,68
4,64
4,60
4,57
4,54
4,51
4,31
4,13
3,95
3,78
7,85
7,01
6,42
5,99
5,67
5,41
5,21
5,04
4,89
4,77
4,67
4,58
4,50
4,43
4,37
4,31
4,26
4,22
4,18
4,14
4,11
4,07
4,04
4,02
3,83
3,65
3,48
3,32
7,46
6,63
6,06
5,64
5,32
5,06
4,86
4,69
4,56
4,44
4,34
4,25
4,17
4,10
4,04
3,99
3,94
3,90
3,85
3,82
3,78
3,75
3,73
3,70
3,51
3,34
3,17
3,02
7,19
6,37
5,80
5,39
5,07
4,82
4,62
4,46
4,32
4,20
4,10
4,01
3,94
3,87
3,81
3,76
3,71
3,67
3,63
3,59
3,56
3,53
3,50
3,47
3,29
3,12
2,96
2,80
6,99
6,18
5,61
5,20
4,89
4,64
4,44
4,28
4,14
4,03
3,93
3,84
3,77
3,70
3,64
3,59
3,54
3,50
3,46
3,42
3,39
3,36
3,33
3,30
3,12
2,95
2,79
2,64
6,84
6,03
5,47
5,06
4,74
4,50
4,30
4,14
4,00
3,89
3,79
3,71
3,63
3,56
3,51
3,45
3,41
3,36
3,32
3,29
3,26
3,23
3,20
3,17
2,99
2,82
2,66
2,51
6,72
5,91
5,35
4,94
4,63
4,39
4,19
4,03
3,89
3,78
3,68
3,60
3,52
3,46
3,40
3,35
3,30
3,26
3,22
3,18
3,15
3,12
3,09
3,07
2,89
2,72
2,56
2,41
6,62
5,81
5,26
4,85
4,54
4,30
4,10
3,94
3,80
3,69
3,59
3,51
3,43
3,37
3,31
3,26
3,21
3,17
3,13
3,09
3,06
3,03
3,00
2,98
2,80
2,63
2,47
2,32
∞
12
6106
99,4
2
27,0
5
14,3
7
9,89
15
6157
99,4
3
26,8
7
14,2
0
9,72
20
6209
99,4
5
26,6
9
14,0
2
9,55
24
6235
99,4
6
26,6
0
13,9
3
9,47
30
6261
99,4
7
26,5
0
13,8
4
9,38
40
6287
99,4
7
26,4
1
13,7
5
9,29
60
6313
99,4
8
26,3
2
13,6
5
9,20
120
6339
99,4
9
26,2
2
13,5
6
9,11
6366
99,5
0
26,1
3
13,4
6
9,02
7,72
6,47
5,67
5,11
4,71
4,40
4,16
3,96
3,80
3,67
3,55
3,46
3,37
3,30
3,23
3,17
3,12
3,07
3,03
2,99
2,96
2,93
2,90
2,87
2,84
2,66
2,50
2,34
2,18
7,56
6,31
5,52
4,96
4,56
4,25
4,01
3,82
3,66
3,52
3,41
3,31
3,23
3,15
3,09
3,03
2,98
2,93
2,89
2,85
2,81
2,78
2,75
2,73
2,70
2,52
2,35
2,19
2,04
7,40
6,16
5,36
4,81
4,41
4,10
3,86
3,66
3,51
3,37
3,26
3,16
3,08
3,00
2,94
2,88
2,83
2,78
2,74
2,70
2,66
2,63
2,60
2,57
2,55
2,37
2,20
2,03
1,88
7,31
6,07
5,28
4,73
4,33
4,02
3,78
3,59
3,43
3,29
3,18
3,08
3,00
2,92
2,86
2,80
2,75
2,70
2,66
2,62
2,58
2,55
2,52
2,49
2,47
2,29
2,12
1,95
1,79
7,23
5,99
5,20
4,65
4,25
3,94
3,70
3,51
3,35
3,21
3,10
3,00
2,92
2,84
2,78
2,72
2,67
2,62
2,58
2,54
2,50
2,47
2,44
2,41
2,39
2,20
2,03
1,86
1,70
7,14
5,91
5,12
4,57
4,17
3,86
3,62
3,43
3,27
3,13
3,02
2,92
2,84
2,76
2,69
2,64
2,58
2,54
2,49
2,45
2,42
2,38
2,35
2,33
2,30
2,11
1,94
1,76
1,59
7,06
5,82
5,03
4,48
4,08
3,78
3,54
3,34
3,18
3,05
2,93
2,83
2,75
2,67
2,61
2,55
2,50
2,45
2,40
2,36
2,33
2,29
2,26
2,23
2,21
2,02
1,84
1,66
1,47
6,97
5,74
4,95
4,40
4,00
3,69
3,45
3,25
3,09
2,96
2,84
2,75
2,66
2,58
2,52
2,46
2,40
2,35
2,31
2,27
2,23
2,20
2,17
2,14
2,11
1,92
1,73
1,53
1,32
6,88
5,65
4,86
4,31
3,91
3,60
3,36
3,17
3,00
2,87
2,75
2,65
2,57
2,49
2,42
2,36
2,31
2,26
2,21
2,17
2,13
2,10
2,06
2,03
2,01
1,80
1,60
1,38
1,00
59
Таблица 5
Значения dн и dв критерия Дарбина–Уотсона на уровне значимости α = 0,05
п
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
45
50
55
60
65
70
75
80
85
90
95
100
р=1
dH
1,08
1,10
1,13
1,16
1,18
1,20
1,22
1,24
1,26
1,27
1,29
1,30
1,32
1,33
1,34
1,35
1,36
1,37
1,38
1,39
1,40
1,41
1,42
1,43
1,43
1,44
1,48
1,50
1,53
1,55
1,57
1,58
1,60
1,61
1,62
1,63
1,64
1,65
р=2
dB
1,36
1,37
1,38
1,39
1,40
1,41
1,42
1,43
1,44
1,45
1,45
1,46
1,47
1,48
1,48
1,49
1,50
1,50
1,51
1,51
1,52
1,52
1,53
1,54
1,54
1,54
1,57
1,59
1,60
1,62
1,63
1,64
1,65
1,66
1,67
1,68
1,69
1,69
dH
0,95
0,98
1,02
1,05
1,08
1,10
1,13
1,15
1,17
1,19
1,21
1,22
1,24
1,26
1,27
1,28
1,30
1,31
1,32
1,33
1,34
1,35
1,36
1,37
1,38
1,39
1,43
1,46
1,49
1,51
1,54
1,55
1,57
1,59
1,60
1,61
1,62
1,63
dB
1,54
1,54
1,54
1,53
1,53
1,54
1,54
1,54
1,54
1,55
1,55
1,55
1,56
1,56
1,56
1,57
1,57
1,57
1,58
1,58
1,58
1,59
1,59
1,59
1,60
1,60
1,62
1,63
1,64
1,65
1,66
1,67
1,68
1,69
1,70
1,70
1,71
1,72
р=3
dH
0,82
0,86
0,90
0,93
0,97
1,00
1,03
1,05
1,08
1,10
1,12
1,14
1,16
1,18
1,20
1,21
1,23
1,34
1,26
1,27
1,28
1,29
1,31
1,32
1,33
1,34
1,38
1,42
1,45
1,58
1,50
1,52
1,54
1,56
1,57
1,59
1,60
1,61
dB
1,75
1,73
1,71
1,69
1,68
1,68
1,67
1,66
1,66
1,66
1,66
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,66
1,66
1,66
1,66
1,67
1,67
1,68
1,69
1,70
1,70
1,71
1,72
1,72
1,73
1,73
1,74
n – число наблюдений, р – число объясняющих переменных.
60
р=4
dH
0,69
0,74
1,78
0,82
0,85
0,90
0,93
0,96
0,99
1,01
1,04
1,06
1,08
1,10
1,12
1,14
1,16
1,18
1,19
1,21
1,22
1,24
1,25
1,26
1,27
1,29
1,34
1,38
1,41
1,44
1,47
1,49
1,51
1,53
1,55
1,57
1,58
1,59
dB
1,97
1,93
1,90
1,87
1,85
1,83
1,81
1,80
1,79
1,78
1,77
1,76
1,76
1,75
1,74
1,74
1,74
1,73
1,73
1,73
1,73
1,73
1,72
1,72
1,72
1,72
1,72
1,72
1,72
1,73
1,73
1,74
1,74
1,74
1,75
1,75
1,75
1,76
р=5
dH
dB
0,56
2,21
0,62
2,15
0,67
2,10
0,71
2,06
0,75
2,02
0,79
1,99
0,83
1,96
0,86
1,94
0,90
1,92
0,93
1,99
0,95
1,89
0,98
1,88
1,01
1,86
1,03
1,85
1,05
1,84
1,07
1,83
1,09
1,83
1,11
1,82
1,13
1,81
1,15
1,81
1,16
1,80
1,18
1,80
1,19
1,80
1,21
1,79
1,22
1,79
1,23
1,79
1,29
1,78
1,34
1,77
1,38
1,77
1,41
1,77
1,44
1,77
1,46
1,77
1,49
1,77
1,51
1,77
1,52
1,77
1,54
1,78
1,56
1,78
1,57
1,78
ПРИЛОЖЕНИЕ В
Наиболее часто употребляемые функции в EXCEL
Действие
Вычисление квадратного
корня
Модуль числа
Десятичный логарифм
Вычисление дисперсии
Вычисление корреляции
Ранжирование
математические
Функция
в EXCEL 2007
КОРЕНЬ
Функция
в EXCEL 2003
SQRT
математические
математические
статистические
статистические
статистические
ABS
LOG10
ДИСП
КОРРЕЛ
РАНГ
ABS
LOG10
VAR
CORREL
RANK
Категория
Рекомендуемая литература
1. Елисеева И.И. Эконометрика: Учебник. – М.: Проспект, 2011.
2. Елисеева И.И. Практикум по эконометрике. – М.: Проспект, 2011.
3. Кремер Н.Ш., Путко Б.А, Эконометрика. – М.: Юнити-дана, 2010.
4. Доугерти К. Введение в эконометрику. – М.: Инфра-М, 2009.
5. Эконометрика в определениях и тесты / Сост. М.М. Овсянникова. – Глазов: ГИЭИ, 2011.
61
Оглавление
Предисловие .........................................................................................................................................3
1. Парный линейный регрессионный анализ ...............................................................................4
Методические указания .......................................................................................................................4
Решение типовых задач .......................................................................................................................5
2. Парный нелинейный регрессионный анализ .........................................................................20
Методические указания .....................................................................................................................20
Решение типовых задач .....................................................................................................................20
3. Гетероскедастичность .................................................................................................................29
Методические указания .....................................................................................................................29
Решение типовых задач .....................................................................................................................30
4. Автокорреляция ...........................................................................................................................38
Методические указания .....................................................................................................................38
Решение типовых задач .....................................................................................................................39
5. Множественный регрессионный анализ .................................................................................44
Методические указания .....................................................................................................................44
Решение типовых задач .....................................................................................................................47
Приложение А. Набор данных для самостоятельной работы........................................................53
Приложение Б. Статистические таблицы ........................................................................................55
Приложение В. Наиболее часто употребляемые функции в EXCEL............................................61
Рекомендуемая литература................................................................................................................61
62
Марина Михайловна Овсянникова
КОМПЬЮТЕРНЫЙ ПРАКТИКУМ ПО ЭКОНОМЕТРИКЕ
Оригинал-макет: М.В. Пермякова
Редактор – М.В. Пермякова
Подписано в печать 14.04.2011. Напечатано на ризографе. Формат 60х84 1/8.
Усл. печ. л. 7,44. Уч.-изд. л. 6,85. Тираж 30 экз. Заказ № 38-2011.
Глазовский инженерно-экономический институт
427622, УР, г. Глазов, ул. Кирова, 36
63
Download