Корреляционная таблица. Коэффициент линейной

advertisement
Корреляционная таблица.
Коэффициент линейной
кор-ии Пирсона.
Статистической называется
зависимость, при которой изменение
одной из величин влечет изменение
распределения другой.
В частности, статистическая
зависимость проявляется в том, что
при изменение одной из величин
изменяется среднее значение другой;
в этом случае статистическую
зависимость называют
корреляционной.
Статистическая обработка зависимости массы тела
соболя (кг) и длины тела соболя (см)
Объем выборки, n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Масса тела соболя, кг.
X
0,6 min
0,7
0,7
0,7
0,7
0,8
0,8
0,8
0,8
0,8
0,8
0,8
0,9
1,0
1,1
1,1
1,1
1,1
1,1
1,1
1,1
1,1
1,1
1,2
1,2 max
Длина тела соболя, см
Y
37
33 min
39
41
41
39
40
40
42
42
42
43
38
43
43
43
43
43
44
45
45
46
48 max
41
47
34,4
38,5
31,7- 37,1-39,8
37,1
Y
41,2
39,8-42,5
43,9
42,5-45,2
47,9
45,2-50,6
n
x
n
x

x


y

X
0,66
0,56-0,75
0,80
0,75-0,85
0,95
0,85-1,05
45,4
||
25,4
|2
54,4
1
||
30.8
|
2
164,8
1
|||||
35,1
5
36,6
|
1
|
1,1
1,05-1,15

y
41,7
1
105,4
||
49,4
|
y
n x y
1
338,0
|||||||
7
1,2
1,15-1,25
n
|

2
57,5
1
|
1
2
3
8
9
3
45,4
92,8
268,6
414,8
168,9
5
125,2
7
230,7
2
78,3
9
443,4
2
106,9
∑=25
984,5
∑=984,5
∑ n xy
x


y

В первой строке корреляц-й
таблицы указаны наблюдаемые
значения признака Y, а в первом
столбце – значения признака X.
На пересечении строк и столбцов
находится частота n xy
наблюдаемых значений
признаков. В столбце n x записаны
суммы частот строк. В строке n y
записаны суммы частот столбцов.
В клетке на пересечении n x и n y помещена
сумма всех частот (общее число всех
наблюдаемых n).
Очевидно, ∑ n x = ∑ n y= n
В нижнем правом углу подсчитывается
∑n x y
которая входит в формулу для подсчета
коэффициента корреляции(выборочный)
r
в

n

x 
*
xy
y
*
n x y
nSxSy

xy

*
x ,y
*
-срединные значения
признаков на каждом интервале.
S x, S y - выборочные средние
квадратичные отклонения;
x, y - выборочные средние.
Если величины X и Y независимы,
то  0 ; если  1 ,то X и Y связаны
линейной функциональной
зависимостью. Отсюда следует, что r
измеряет силу (тесноту) линейной
связи между X и Y.
r
r
Если при увеличении одной
переменной увеличивается
другая, это указывает на
положительную связь между
величинами, а когда
увеличение одной переменной
сопровождается уменьшением
значений другой, это указывает
на отрицательную связь.
Эмпирический коэффициент
корреляции, как и любой другой
выборочный показатель, служит
оценкой своего генерального, и как
величина случайная сопровождается
ошибкой.
mr
в

1  rв
n2
Download