Проверка гипотез на примере уравнения регрессии Проверка гипотез на примере уравнения регрессии Проверка гипотез и соответствующие статистические выводы являются одними из центральных задач математической и прикладной статистики. В частности, проверка гипотез используется при оценке значимости воздействия факторных признаков на результативный. Проверка гипотез на примере уравнения регрессии Проверка гипотез и соответствующие статистические выводы являются одними из центральных задач математической и прикладной статистики. В частности, проверка гипотез используется при оценке значимости воздействия факторных признаков на результативный. Например, мы нашли уравнение регрессии вида: y aˆ bˆx a b Вычислили стандартные ошибки для a, b. Проверка гипотез на примере уравнения регрессии Проверка гипотез и соответствующие статистические выводы являются одними из центральных задач математической и прикладной статистики. В частности, проверка гипотез используется при оценке значимости воздействия факторных признаков на результативный. Например, мы нашли уравнение регрессии вида: y aˆ bˆx a b Вычислили стандартные ошибки для a, b. Теперь мы хотим узнать, воздействует ли параметр x на y. Сначала выдвигаем гипотезу. Проверка гипотез на примере уравнения регрессии Гипотеза - это предположение, которое можно принять или опровергнуть. Затем гипотезу проверяем. Проверка гипотез на примере уравнения регрессии Гипотеза - это предположение, которое можно принять или опровергнуть. Затем гипотезу проверяем. Итак, мы хотим узнать, воздействует ли параметр x на y, для этого составляем нулевую и альтернативную гипотезы: Проверка гипотез на примере уравнения регрессии Гипотеза - это предположение, которое можно принять или опровергнуть. Затем гипотезу проверяем. Итак, мы хотим узнать, воздействует ли параметр x на y, для этого составляем нулевую и альтернативную гипотезы: 1. Нулевая гипотеза обозначается H0 и обычно формулируется как b=0. Иными словами, гипотеза о том, что x имеет нулевой эффект на y (x не влияет на y). 2. Альтернативная гипотеза обозначается H1 и обычно формулируется как b0. Иными словами, гипотеза о том, что x имеет ненулевой эффект на y (x существенно влияет на y). Проверка гипотез на примере уравнения регрессии Статистический тест Статистическим тестом или просто тестом называется любая процедура, основанная на наблюдениях (x1, … ,xn), результатом которой является одно из двух возможных решений: Проверка гипотез на примере уравнения регрессии Статистический тест Статистическим тестом или просто тестом называется любая процедура, основанная на наблюдениях (x1, … ,xn), результатом которой является одно из двух возможных решений: 1. не отвергать (принять) нулевую гипотезу H0; 2. отвергнуть нулевую гипотезу H0 в пользу альтернативной гипотезы H1. Проверка гипотез на примере уравнения регрессии Ошибки 1-го и 2-го рода Поскольку тест основан на наблюдениях, т.е. использует случайную выборку, то, естественно, могут возникать ошибочные решения. Проверка гипотез на примере уравнения регрессии Ошибки 1-го и 2-го рода Поскольку тест основан на наблюдениях, т.е. использует случайную выборку, то, естественно, могут возникать ошибочные решения. В связи с этим иногда возникают две ошибки теста: - ошибка 1-го рода: отвергается верная гипотеза. - ошибка 2-го рода: принимается ошибочная гипотеза. Проверка гипотез на примере уравнения регрессии Ошибки 1-го и 2-го рода в повседневной жизни Проблема ошибок 1-го и 2-го рода известна всем. Типичным примером этого является расследование уголовного преступления. Проверка гипотез на примере уравнения регрессии Ошибки 1-го и 2-го рода в повседневной жизни Проблема ошибок 1-го и 2-го рода известна всем. Типичным примером этого является расследование уголовного преступления. Если за нулевую гипотезу принять вариант, что подсудимый невиновен, то ошибка 1-го рода происходит, когда суд присяжных признает его виновным. Проверка гипотез на примере уравнения регрессии Ошибки 1-го и 2-го рода в повседневной жизни Проблема ошибок 1-го и 2-го рода известна всем. Типичным примером этого является расследование уголовного преступления. Если за нулевую гипотезу принять вариант, что подсудимый невиновен, то ошибка 1-го рода происходит, когда суд присяжных признает его виновным. Ошибка 2-го рода имеет место в том случае, когда суд присяжных ошибочно оправдывает виновного подсудимого. Проверка гипотез на примере уравнения регрессии Проверка нулевой гипотезы Мы знаем оценку коэффициента b , которая равна b̂ , и его стандартное отклонение - σb. Истинное значение b неизвестно. Проверка гипотез на примере уравнения регрессии Проверка нулевой гипотезы Мы знаем оценку коэффициента b , которая равна b̂ , и его стандартное отклонение - σb. Истинное значение b неизвестно. Проверка гипотезы всегда производится для заданного уровня значимости . Проверка гипотез на примере уравнения регрессии Проверка нулевой гипотезы Мы знаем оценку коэффициента b , которая равна b̂ , и его стандартное отклонение - σb. Истинное значение b неизвестно. Проверка гипотезы всегда производится для заданного уровня значимости . Найдем доверительный интервал для b: bˆ t * b b bˆ t * b Проверка гипотез на примере уравнения регрессии Проверка нулевой гипотезы Мы знаем оценку коэффициента b , которая равна b̂ , и его стандартное отклонение - σb. Истинное значение b неизвестно. Проверка гипотезы всегда производится для заданного уровня значимости . Найдем доверительный интервал для b: bˆ t * b b bˆ t * b t - квантиль распределения Стьюдента при уровне значимости . Проверка гипотез на примере уравнения регрессии Проверка нулевой гипотезы Мы знаем оценку коэффициента b , которая равна b̂ , и его стандартное отклонение - σb. Истинное значение b неизвестно. Проверка гипотезы всегда производится для заданного уровня значимости . Найдем доверительный интервал для b: bˆ t * b b bˆ t * b t - квантиль распределения Стьюдента при уровне значимости . b - истинное значение коэффициента. Проверка гипотез на примере уравнения регрессии Проверка нулевой гипотезы Доверительный интервал для b: bˆ t * b b bˆ t * b Проверка гипотез на примере уравнения регрессии Проверка нулевой гипотезы Доверительный интервал для b: bˆ t * b b bˆ t * b Для больших выборок справедлив закон трех сигм. Если мы имеем доверительную вероятность: Проверка гипотез на примере уравнения регрессии Проверка нулевой гипотезы Доверительный интервал для b: bˆ t * b b bˆ t * b Для больших выборок справедлив закон трех сигм. Если мы имеем доверительную вероятность: p = 99,7%, то t 3 (три сигмы), Проверка гипотез на примере уравнения регрессии Проверка нулевой гипотезы Доверительный интервал для b: bˆ t * b b bˆ t * b Для больших выборок справедлив закон трех сигм. Если мы имеем доверительную вероятность: p = 99,7%, то t 3 (три сигмы), p = 95%, то t 2 (две сигмы), Проверка гипотез на примере уравнения регрессии Проверка нулевой гипотезы Доверительный интервал для b: bˆ t * b b bˆ t * b Для больших выборок справедлив закон трех сигм. Если мы имеем доверительную вероятность: p = 99,7%, то t 3 (три сигмы), p = 95%, то t 2 (две сигмы), p = 68%, то t 1 (одна сигма); Проверка гипотез на примере уравнения регрессии Проверка нулевой гипотезы Доверительный интервал для b: bˆ t * b b bˆ t * b Проверка гипотез на примере уравнения регрессии Проверка нулевой гипотезы Доверительный интервал для b: bˆ t * b b bˆ t * b 1. Если ноль попадает в доверительный интервал, то принимаем нулевую гипотезу, и делаем вывод, что x имеет незначительное воздействие на y, и его можно убрать из уравнения. Проверка гипотез на примере уравнения регрессии Проверка нулевой гипотезы Доверительный интервал для b: bˆ t * b b bˆ t * b 1. Если ноль попадает в доверительный интервал, то принимаем нулевую гипотезу, и делаем вывод, что x имеет незначительное воздействие на y, и его можно убрать из уравнения. 2. Если же ноль не попадает, то мы отвергаем нулевую гипотезу и принимаем альтернативную, т.е. b значимо отличается от 0. Делаем вывод, что x воздействует на y, и его надо оставить в составе уравнения регрессии. Проверка гипотез на примере уравнения регрессии Проверка значимости уравнения регрессии Проверка значимости уравнения регрессии в целом делается с помощью коэффициента детерминации R2. Проверка гипотез на примере уравнения регрессии Проверка значимости уравнения регрессии Проверка значимости уравнения регрессии в целом делается с помощью коэффициента детерминации R2. R2 - это показатель влияния факторных признаков на результативный. Он показывает, какая доля вариации результативного признака объясняется влиянием факторных признаков: Проверка гипотез на примере уравнения регрессии Проверка значимости уравнения регрессии Проверка значимости уравнения регрессии в целом делается с помощью коэффициента детерминации R2. R2 - это показатель влияния факторных признаков на результативный. Он показывает, какая доля вариации результативного признака объясняется влиянием факторных признаков: 2 объясненна я 2 R , 2 полная где Проверка гипотез на примере уравнения регрессии Проверка значимости уравнения регрессии Проверка значимости уравнения регрессии в целом делается с помощью коэффициента детерминации R2. R2 - это показатель влияния факторных признаков на результативный. Он показывает, какая доля вариации результативного признака объясняется влиянием факторных признаков: 2 2 объясненна я 2 R , 2 полная где объясненная - характеризует вариацию результативного признака у, вызванную изменением факторного признака х в соответствии с уравнением регрессии; Проверка гипотез на примере уравнения регрессии Проверка значимости уравнения регрессии Проверка значимости уравнения регрессии в целом делается с помощью коэффициента детерминации R2. R2 - это показатель влияния факторных признаков на результативный. Он показывает, какая доля вариации результативного признака объясняется влиянием факторных признаков: 2 2 объясненна я 2 R , 2 полная где объясненная - характеризует вариацию результативного признака у, вызванную изменением факторного признака х в соответствии с уравнением регрессии; 2полная - дисперсия у. Проверка гипотез на примере уравнения регрессии Проверка значимости уравнения регрессии 2 объясненная 2 R ; 2 полная Проверка гипотез на примере уравнения регрессии Проверка значимости уравнения регрессии y 2 объясненная 2 R ; 2 полная y 0 x На графике заштрихованная часть относится к полной дисперсии (2полная) y - среднее значение y. Проверка гипотез на примере уравнения регрессии Проверка значимости уравнения регрессии y y 2 объясненная 2 R ; 2 полная линия регрессии y y 0 x 0 x На графике заштрихованная часть На графике заштрихованная часть относится к полной дисперсии относится к объясненной дисперсии (2полная) (2объясненная) y - среднее значение y. Проверка гипотез на примере уравнения регрессии Проверка значимости уравнения регрессии 2 2 находим По значению R объясненная 2 R ; фактическое значение 2 полная F-статистики. 2 Fфактич. R m 2 1 R n m 1 Проверка гипотез на примере уравнения регрессии Проверка значимости уравнения регрессии 2 2 находим По значению R объясненная 2 R ; фактическое значение 2 полная F-статистики. 2 Fфактич. R m , 2 1 R n m 1 m – число параметров уравнения регрессии; где Проверка гипотез на примере уравнения регрессии Проверка значимости уравнения регрессии 2 2 находим По значению R объясненная 2 R ; фактическое значение 2 полная F-статистики. 2 Fфактич. R m , 2 1 R n m 1 m – число параметров уравнения регрессии; n – объем выборки или число значений xi и yi. где Проверка гипотез на примере уравнения регрессии Проверка значимости уравнения регрессии 2 2 находим По значению R объясненная 2 R ; фактическое значение 2 полная F-статистики. 2 Fфактич. R m 2 1 R n m 1 Затем по таблице распределения Фишера определяется критическое значение Fкритич. для заданного уровня значимости , числа степеней свободы m, n-m-1. Проверка гипотез на примере уравнения регрессии Проверка значимости уравнения регрессии 2 2 находим По значению R объясненная 2 R ; фактическое значение 2 полная F-статистики. 2 Fфактич. R m 2 1 R n m 1 Затем по таблице распределения Фишера определяется критическое значение Fкритич. для заданного уровня значимости , числа степеней свободы m, n-m-1. Теперь, если Fфактич. > Fкритич., то H0 - отклоняется, т.е. уравнение регрессии статистически значимо. Проверка гипотез на примере уравнения регрессии Проверка значимости уравнения регрессии 2 2 находим По значению R объясненная 2 R ; фактическое значение 2 полная F-статистики. 2 Fфактич. R m 2 1 R n m 1 Затем по таблице распределения Фишера определяется критическое значение Fкритич. для заданного уровня значимости , числа степеней свободы m, n-m-1. Теперь, если Fфактич. > Fкритич., то H0 - отклоняется, т.е. уравнение регрессии статистически значимо. В противном случае - уравнение статистически незначимо. СПАСИБО ЗА ВНИМАНИЕ