ОПРЕДЕЛЕНИЕ ВЫБОРОЧНОЙ КОВАРИАЦИИ XY E( X X )(Y Y ) 1 Cov( X,Y ) ( X 1 X )(Y1 Y ) ... ( X n X )(Yn Y ) n 1 n = ( X i X )(Yi Y ) n i 1 1 ПРИМЕР КОВАРИАЦИИ 45 40 Y (часовая зарплата, $) 35 30 25 20 15 10 5 0 0 2 4 6 8 10 12 14 16 18 20 S (продолжительность обучения) 4 ПРИМЕР ВЫЧИСЛЕНИЯ КОВАРИАЦИИ Observation 1 2 3 4 5 6 7 8 9 10 ... ... 19 20 Итого Среднее S 15 16 8 6 15 12 12 18 12 20 ... ... 12 14 265 13.25 Y S -S Y -Y (S - S)(Y - Y) 17.24 15.00 14.91 4.50 18.00 6.29 19.23 18.69 7.21 42.06 ... ... 7.50 8.00 284.49 14.225 5 ПРОСТАЯ КОВАРИАЦИЯ 45 40 Y (часовая зарплата, $) 35 30 25 20 15 10 5 0 0 2 4 6 8 10 12 14 16 18 20 S (продолжительность обучения) 6 ПРОСТАЯ КОВАРИАЦИЯ Выборка 1 2 3 4 5 6 7 8 9 10 ... ... 19 20 Итого Среднее S 15 16 8 6 15 12 12 18 12 20 ... ... 12 14 265 13.25 Y 17.24 15.00 14.91 4.50 18.00 6.29 19.23 18.69 7.21 42.06 ... ... 7.50 8.00 284.49 14.225 S- S Y- Y (S - S ) (Y - Y ) 1.75 2.75 -5.25 -7.25 1.75 -1.25 -1.25 4.75 -1.25 6.75 ... ... -1.25 0.75 3.016 0.776 0.686 -9.725 3.776 -7.935 5.006 4.466 -7.015 27.836 ... ... -6.725 -6.225 5.277 2.133 -3.599 70.503 6.607 9.918 -6.257 21.211 8.768 187.890 ... ... 8.406 -4.668 305.888 15.294 Положительное значение ковариации свидетельствует о наличии положительной связи между S и Y 13 Выборочная ковариация 45 наблюдение 10 40 35 Y ( $) 30 25 20 D A C B 15 10 5 0 0 2 4 6 8 10 12 14 16 18 20 S Личность 10 – два высших образования: биология и медицина 14 ПРОСТАЯ КОВАРИАЦИЯ 45 40 35 Y ($) 30 25 D A C B 20 15 10 Наблюдение 20 5 0 0 2 4 6 8 10 12 14 16 18 20 S Личность 20 - незаконченное высшее медицинское образование. Работает Менеджером. 16 ПРОСТАЯ КОВАРИАЦИЯ 45 40 35 Y ($) 30 25 D A C B 20 15 10 Наблюдение 4 5 0 0 2 4 6 8 10 12 14 16 18 20 S Личность 4, мексиканец с 6 классами образования, подсобный рабочий. 18 SAMPLE COVARIANCE: EXAMPLE CALCULATION 45 40 35 Y ($) 30 25 D A 20 наблюдение 3 15 C 10 B 5 0 0 2 4 6 8 10 12 14 16 18 20 S Личность 3. Начальное образование, строительный рабочий. 20 СВОЙСТВА ВЫБОРОЧНОЙ КОВАРИАЦИИ 1. Если Y = V + W, Cov(X, Y) = Cov(X, V) + Cov(X, W) 2. Если Y = bZ, где b - константа, Cov(X, Y) = Cov(X, bZ) = bCov(X, Z) Пример: Cov(X, 3Z) = 3Cov(X, Z) 3. Если Y = b, где b - константа, Cov(X, Y) = Cov(X, b) = 0 Пример: Cov(X, 10) = 0 5 ПРАВИЛА КОВАРИАЦИИ Пример: пусть Y = b1 + b2Z Cov(X, Y) = Cov(X, [b1 + b2Z]) = Cov(X, b1) + Cov(X, b2Z) = 0 + Cov(X, b2Z) = b2Cov(X, Z) 9 ПРАВИЛА КОВАРИАЦИИ 1. Если Y = V + W, Cov(X, Y) = Cov(X, V) + Cov(X, W) 1 n Cov( X , Y ) ( X i X )(Yi Y ) n i 1 1 n ( X i X )([Vi Wi ] [V W ]) n i 1 1 n ( X i X )([Vi V ] [Wi W ]) n i 1 1 n 1 n ( X i X )(Vi V ) ( X i X )(Wi W ) n i 1 n i 1 Cov( X ,V ) Cov( X ,W ) 16 ПРАВИЛА КОВАРИАЦИИ 2. Если Y = bZ, где b - константа, Cov(X, Y) = Cov(X, bZ) = bCov(X, Z) n 1 Cov( X , Y ) ( X i X )(Yi Y ) n i 1 1 n ( X i X )(bZ i bZ ) n i 1 1 n b ( X i X )( Z i Z ) n i 1 bCov( X , Z ) 20 ПРАВИЛА КОВАРИАЦИИ 3. Если Y = b, где b – константа, Cov(X, Y) = Cov(X, b) = 0 1 n Cov( X , Y ) ( X i X )(Yi Y ) n i 1 1 n ( X i X )(b b ) n i 1 1 n ( X i X )(b b ) n i 1 0 24 АЛЬТЕРНАТИВНОЕ ВЫРАЖЕНИЕ ВЫБОРОЧНОЙ КОВАРИАЦИИ 1 n Cov ( X , Y ) ( X i X )(Yi Y ) n i 1 1 n ( X iYi X iY XYi XY ) n i 1 1 X 1Y1 X 1Y XY1 XY n ... X nYn X nY XYn XY n n 1 n X iYi X iY XYi nXY n i 1 i 1 i 1 9 АЛЬТЕРНАТИВНОЕ ВЫРАЖЕНИЕ ВЫБОРОЧНОЙ КОВАРИАЦИИ n n 1 n Cov ( X , Y ) X iYi X iY XYi nXY n i 1 i 1 i 1 1 n 1 n 1 n X iYi X iY XYi XY n i 1 n i 1 n i 1 1 n 1 n 1 n X iYi Y X i X Yi XY n i 1 n i 1 n i 1 1 n X iYi Y X XY XY n i 1 1 n X iYi XY n i 1 16 ВЫБОРОЧНАЯ ДИСПЕРСИЯ Определение выборочной дисперсии: n 1 2 Var( X ) ( X i X ) n i 1 n 1 ( X i X )( X i X ) n i 1 Cov( X , X ) 3 ВЫБОРОЧНАЯ ДИСПЕРСИЯ Правило 1: Если Y = V + W, Var(Y) = Var(V) + Var(W) + 2Cov(V, W) Вывод: Var(Y) = Cov(Y, Y) = Cov(Y, [V + W]) = Cov(Y, V) + Cov(Y, W) = Cov([V + W], V) + Cov([V + W], W) = Cov(V, V) + Cov(W, V) + Cov(V, W) + +Cov(W, W) = Var(V) + Var(W) + 2Cov(V, W) 11 ВЫБОРОЧНАЯ ДИСПЕРСИЯ Правило 2: Если Y = bZ, где b - константа, Var(Y) = b2Var(Z) Вывод: Var(Y) = Cov(Y, Y) = Cov(Y, bZ) = bCov(Y, Z) = bCov(bZ, Z) = b2Cov(Z, Z) = b2Var(Z) 16 ВЫБОРОЧНАЯ ДИСПЕРСИЯ Правило 3: Если Y = b, где b - константа, Var(Y) = 0 Вывод: Var(Y) = Cov(Y, Y) = Cov(b, b) =0 18 ВЫБОРОЧНАЯ ДИСПЕРСИЯ Правило 4: Если Y = V + b, где b - константа, Var(Y) = Var(V) Вывод: Var(Y) = Var(V + b) = Var(V) + Var(b) + 2Cov(V, b) = Var(V) 0 V 0 V+b 25 СМЕЩЕННОСТЬ ВЫБОРОЧНОЙ ДИСПЕРСИИ n 1 2 E Var( X ) X n n 1 2 s ( xi X ) n 1 i 1 2 n s Var( X ) n 1 2 X Es 2 X 2 X 28 ТЕОРЕТИЧЕСКАЯ КОВАРИАЦИЯ XY E( X X )(Y Y ) n 1 E Cov( X ,Y ) XY n Если X и Y независимы, то XY = 0 E ( X X )(Y Y ) E ( X X )E (Y Y ) E ( X ) E ( X )E (Y ) E ( Y ) X X Y Y 0 0 0 6 ТЕОРЕТИЧЕСКАЯ ДИСПЕРСИЯ Если X и Y - независимы, то 2 X Y 2 X Y 2 X 2 Y 2 XY 2 X 2 Y 2 Y 2 X 2 ТЕОРЕТИЧЕСКАЯ ДИСПЕРСИЯ ВЫБОРОЧНОГО СРЕДНЕГО 2 1 X 1 ... X n n 1 2 2 X1 ... X n n 1 2 2 2 X1 ... X n n 2 1 2 1 X 2 2 2 X ... X 2 n X n n n 2 X 8 ЗАВИСИМОСТЬ ОТКЛОНЕНИЯ ОТ ВЕЛИЧИНЫ ВЫБОРКИ функция плотности вероятности N=100 N=50 X 13 КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ Теоретический коэффициент корреляции XY XY 2 2 X Y Выборочный коэффициент корреляции rXY n Cov( X ,Y ) Cov( X ,Y ) n-1 n n Var( X ) Var(Y ) Var( X ) Var(Y ) n-1 n-1 4 КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ 45 40 35 Y ($) 30 25 20 15 10 5 0 0 2 4 6 8 10 12 14 16 18 20 S 5 КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ Выб S Y S -S Y -Y 1 2 3 4 5 6 7 8 9 10 ... ... 19 20 15 16 8 6 15 12 12 18 12 20 ... ... 12 14 17.24 15.00 14.91 4.50 18.00 6.29 19.23 18.69 7.21 42.06 ... ... 7.50 8.00 1.75 2.75 -5.25 -7.25 1.75 -1.25 -1.25 4.75 -1.25 6.75 ... ... -1.25 0.75 3.016 0.776 0.686 -9.725 3.776 -7.935 5.006 4.466 -7.015 27.836 ... ... -6.725 -6.225 Итого 265 Средн. 13.25 284.49 14.225 (S -S )(Y -Y ) (S - S )2 (Y -Y )2 5.277 2.133 -3.599 70.503 6.607 9.918 -6.257 21.211 8.768 187.890 ... ... 8.406 -4.668 3.063 7.563 27.563 52.563 3.063 1.563 1.563 22.563 1.563 45.563 ... ... 1.563 0.563 9.093 0.601 0.470 94.566 14.254 62.956 25.055 19.941 49.203 187.890 ... ... 45.219 38.744 305.888 15.294 Cov(S,Y) 217.760 10.888 Var(S) 1542.160 77.108 Var(Y) 10 КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ Cov(S ,Y ) 15.294 Var (S ) 10.888 Var (Y ) 77.108 rSY Cov(S,Y ) 15.294 15.294 0.55 Var(S )Var(Y ) 10.888 77.108 28.975 12