Выборочное уравнение прямой линии регрессии.

advertisement
Выборочное
уравнение
прямой линии
регрессии.
Y на X (X на Y)
Зависимость между двумя признаками X и У
выражается таблицей.
x1 x2 … xn
Х
y1 y2 … y n
У
Требуется выразить эту зависимость аналитически, т.е.
дать формулу, связывающую Х и У.
Y  ax  b
Y  ax  bx  c
2
-изменение удоя с возрастом;
биохимический анализ крови.
b
Y a
x
Y  ab x
Y  a sin( bx) -численность популяции по сезонам года.
Задача сводится к определению параметров а и b,
входящих в уравнение.
Вид функции Y  f (x)
выбирается таким
образом, чтобы график функции по возможности
близко напоминал расположение данных наблюдений.
Рассмотрим простейший пример, когда опытные данные
расположены на плоскости около прямой.
У
y1
y2
0
x1 x2
Х
Отклонения будут встречаться как
положительные, так и отрицательные.
Использовав метод наименьших квадратов мы
уже вывели зависимость между а и b.
 n 2
a  xi  b  xi   xi yi
:n
 t 1
a
x

b

n

y


i
i

x
2
i
n
x
2
x

,
i
n
2

a x  bx  xy


ax  b  y
x
b  y  ax
 2
a x  ( y  ax )  x  xy
b  y  ax
b  y  ax
 2
 2
2
a x  x  y  ax  xya ( x  x 2 )  xy
b  y  ax


xy  x  y
xy  x  y
,b  y 
x
a  2
2
2
2
x x
x x

Тогда Y  aX  b имеет вид:
Y
xy  x  y
x x
2
2
Х  y
xy  x  y
x x
2
2
x
Приведем к виду y  y1  k ( x  x1 )
Y  y 
Y / X 
xy  x  y
x x
2
2
xy  x  y
x x
2
2
 ( Х  х)
-коэффициент регрессии y на x
Def:
Регрессия – это определение зависимости
одного признака от изменений другого.
Сила взаимосвязи выражается в степени
концентрации точек вокруг линии регрессии.
При независимости точки широко разбросаны и
контур их совокупности приближается к кругу.
x+y
Аналогично уравнение прямой линии регрессии Х на У
имеет вид:
X x 
и
 X /Y 
xy  x  y
y y
2
2
xy  x  y
,т.е.
y y
2
2
(Y  y )
Y  y  Y / X ( X  x )
X  x   X / Y (Y  y )
При увеличении признака Х на единицу измерения признак У
увеличивается в среднем на ρ единиц измерения Y.
Уточним
Yx
-Y есть функция Х
X y -Х есть функция Y
Окончательно уравнения записываются:
Yx  y  Y / X ( X  x ) - Уравнение прямой линии
регрессии Y на Х
X y  x   X / Y (Y  y ) - Уравнение прямой линии
регрессии X на Y
Связь с коэффициентом корреляции
Если перемножить части
уравнений:
Y / X   X / Y  r
или
2
xy
Y / X
SY
 rxy 
SX
 X /Y
SX
 rxy 
SY
rxy  Y / X   X / Y
Download