Uploaded by Катя Филина

Практическая работа 10 материал по занятию 1

advertisement
Практическая работа 10
Основы корреляционного анализа
Задание 1. Ответьте на вопросы:
1.Какие зависимости называются стохастическими?
2. Что такое корреляционное поле?
3. Какие зависимости называются корреляционными?
1
Практические работы «Математические основы обработки информации»
4. Каким образом можно оценить силу (тесноту) линейной корреляционной
зависимости между изучаемыми свойствами X и Y?
Силу(тесноту) линейной корреляционной зависимости между изучаемыми свойствами Х и
Y можно оценить с помощью:
- коэффициента линейной корреляции Пирсона (в случае если обе шкалы являются
количественными (метрическими);
- коэффициента ранговой корреляции Спирмена или Кендалла (если хотя бы она из шкал
является порядковой).
! Корреляционная связь не изучается при наличии величины, измеренной в номинальной
шкале.
Формулы для вычисления коэффициента линейной корреляции Пирсона
Формулы для вычисления коэффициента линейной корреляции Спирмена
2
Практические работы «Математические основы обработки информации»
5. При каких значениях коэффициента корреляции связь между свойствами
X и Y положительная (прямая), отрицательная (обратная). При каких
значениях существует строгая зависимость (функциональная линейная)?
3
Практические работы «Математические основы обработки информации»
6. Каким образом можно оценить качественную характеристику силы
(тесноты) линейной корреляционной зависимости между изучаемыми
свойствами?
Задача 1. (на коэффициент
количественных (метрических) шкал)
линейной
корреляции
Пирсона,
для
Оценить силу и направление линейной связи между временем пробегания
(преодоления) дистанции в 50 м учащимися спортивного кружка (номер испытуемого –
первая строчка) в утренние часы (время в сек – вторая строчка) и в вечерние в часы (время
в сек – третья строчка).
Решение.
Составьте вспомогательную таблицу для расчетов по формуле парных сравнений.
Таблица для работы (заполнить только первые три строчки и последнюю строчку
расчетной таблицы):
4
Практические работы «Математические основы обработки информации»
Значение
времени
в
утренние
часы (в сек)
Значение
времени
в
вечерние
часы (в сек)
(𝑥𝑖 − 𝑥̅ )
(𝑥𝑖 − 𝑦̅)
(𝑥𝑖 − 𝑥̅ )2
(𝑦𝑖 − 𝑦̅)2
(𝑥𝑖 − 𝑥̅ )(𝑥𝑖 − 𝑦̅)
Данные по №4-20
Последняя строка:
𝑥̅ =
𝑦̅ =
0
0
20
20
2
20
2
∑(𝑥𝑖 − 𝑥̅ ) =
∑(𝑦𝑖 − 𝑦̅) =
∑(𝑥𝑖 − 𝑥̅ )(𝑥𝑖 − 𝑦̅) =
𝑖=1
𝑖=1
𝑖=1
Указание: воспользуйтесь формулой коэффициента линейной корреляции Пирсона для
парных сравнений.
Сделайте вывод: между представленными значениями существует линейная связь по силе
– _______________, по направлению - ________________(чем меньше время на
преодоление дистанции утром, тем _______________ время на преодоление дистанции
вечером.
Задача 2. (на коэффициент ранговой корреляции Спирмена)
Исследуйте силу линейной связи между изучаемыми свойствами:
X – балл за прохождение теоретического теста по определенной теме по дисциплине
«Математика» (0-5),
Y – время решения задачи по той же теме (в сек.)
№
1
2
3
4
5
6
7
8
9
10 11 12
испытуемого
Значения Х
4,7 4,5 4,4 3,8 3,7 4,6 4
4,2 4,1 3,6 3,5 4,8
Значения Y
122 105 100 145 130 90 162 172 120 150 170 112
Решение.
5
Практические работы «Математические основы обработки информации»
Свойство Х измерено в порядковой шкале (баллы), поэтому для исследования силы связи
между переменными используем коэффициент ранговой корреляции Спирмена. Для его
расчета составим вспомогательную таблицу (дополним данную в условии таблицу
строками: ранги, разности рангов, квадраты разностей рангов):
№
1
2
3
4
5
6
7
8
9
10 11 12
испытуемого
Значения Х
4,7 4,5 4,4 3,8 3,7 4,6 4
4,2 4,1 3,6 3,5 4,8
Значения Y
122 105 100 145 130 90 162 172 120 150 170 112
Ранг Х
Ранг Y
Указание: воспользуйтесь формулой для расчета коэффициента линейной корреляции
Спирмена (учитываем, что связных рангов нет).
Сделайте вывод:
между изучаемыми величинами Х и У:
- _______ _________(по силе связи);
- _________________(по направлению), т. е. чем ниже балл по теоретическому тесту по
теме, тем больше времени он тратит на решение задачи.
Задача 3. (на коэффициент ранговой корреляции Кендалла)
Исследуйте силу связи уровня IQ и времени решения серии логических заданий на выборке
14 учащихся одного класса.
№ учащегося
Уровень
IQ,
баллы
Время решения
задач, сек
1
100
2
118
3
112
4
97
5
99
6
103
7
102
8
132
9
122
10
121
11
115
12
117
13
109
14
111
154
123
120
213
200
187
155
100
114
115
107
176
143
111
Составьте вспомогательную таблицу (проранжируйте свойство Х «Уровень IQ по
возрастанию):
Уровень IQ, баллы
Время решения задач, сек
Ранг времени решения
Число следующих рангов,
больших данного
Число следующих рангов,
меньших данного
Воспользуйтесь формулой для вычисления коэффициента ранговой корреляции Кендалла.
6
Практические работы «Математические основы обработки информации»
Сделайте вывод: Связь___________(по тесноте), ____________(по направлению), т.е. чем
выше IQ, тем ________________решает логические задачи.
Задание (отчёт) Отсканируйте решения задач и сдайте на поверку в раздел
ЗАДАНИЯ.
Решение рекомендуем выполнить в Excel.
7
Практические работы «Математические основы обработки информации»
Download