МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Московский гуманитарно-экономический институт Воронежский филиал С.И. Моисеев Математические методы в психологии методические указания по изучению дисциплины Воронеж, 2006 PDF created with pdfFactory Pro trial version www.pdffactory.com УДК 519+338 ББК М 36 Моисеев С.И. Математические методы в психологии. Методические указания по изучению дисциплины. Воронеж, ВФ МГЭИ, 2006.- 46 с. Методические указания предназначены для организации самостоятельной работы по дисциплине «Математические методы в психологии» для студентов специальности «Психология» Воронежского филиала Московского гуманитарно-экономического института. Они являются руководством к выполнению контрольной работы по дисциплине для студентов заочной формы обучения. Их также можно рекомендовать для организации самостоятельной работы студентам очной и очно-заочной форм обучения. Методическая разработка содержит основные разделы, предусмотренные учебной программой дисциплины. В методических указаниях кратко приведены основные определения, методы и формулы, разобраны примеры решения типовых заданий, приведены задания для самостоятельного решения. Для некоторых заданий, выполнение которых требует значительных вычислений, приведены примеры решения их с помощью ЭВМ. Печатается по решению учебно-методического совета Гуманитарного факультета Воронежского филиала Московского гуманитарно-экономического института. Рецензент: Морозов Ю.Г., к.ф.-м.н., доцент. С.И. Моисеев, ВФ МГЭИ, 2006 г. 2 PDF created with pdfFactory Pro trial version www.pdffactory.com ВВЕДЕНИЕ Данная методическая разработка предназначена для организации самостоятельной работы по дисциплине «Математические методы в психологии» для студентов специальности «Психология» Воронежского филиала Московского гуманитарно-экономического института. Методические указания являются руководством к выполнению контрольной работы по дисциплине для студентов заочной формы обучения. Их также можно рекомендовать для организации самостоятельной работы студентам очной и очно-заочной форм обучения. Методические указания содержат основные разделы, предусмотренные учебной программой дисциплины: статистические методы обработки измерений, оценивание выборочных параметров, проверка статистических гипотез, элементы корреляционного и регрессионного анализа и другие. В методических указаниях кратко приведены основные определения, методы и формулы, разобраны примеры решения типовых заданий, приведены задания для самостоятельного решения, которые являются заданиями на контрольную работу для студентов заочной формы обучения. Для некоторых заданий, выполнение которых требует значительных вычислений, приведены примеры решения их с помощью ЭВМ с использованием пакета прикладных программ MS EXCEL. Для более глубокого изучения материала студентам может понадобиться дополнительная литература, библиографический список которой также приведен в данной методической разработке. Кроме того, в приложении содержатся основные статистические таблицы, которые понадобятся студентам при решении задач. 3 PDF created with pdfFactory Pro trial version www.pdffactory.com 1. СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ РЕЗУЛЬТАТОВ НАБЛЮДЕНИЙ В практической психологии очень часто приходится проводить исследования, основанные на результатах наблюдений за некоторой группой людей (респондентов). Исследователь, наблюдая за респондентами, получает некоторую совокупность данных какого-либо показателя, и из анализа которых делаются выводы об основных свойствах этого показателя. 1.1. Основные сведения и формулы Основным объектом исследования в математических методах практической психологии является выборка. Выборкой объема n называются числа x1 , x2 , …, xn, получаемые на практике при n – кратном наблюдении за некоторым показателем в неизменных условиях. Вариационным рядом выборки x1 , x2 , …, xn называется способ ее записи, при котором элементы упорядочиваются по величине, т.е. записываются в виде последовательности x(1), x(2), …, x(n), где x(1) ≤ x(2) ≤ … ≤ x(n). Разность между максимальным и минимальным элементами выборки x(n) – x(1) = ω называется размахом выборки. При большом объеме выборки ее элементы объединяют в группы (разряды), представляя результаты опытов в виде статистического ряда. Для этого интервал, содержащий все элементы выборки, разбиваются на k непересекающихся интервалов. Вычисления значительно упрощаются, если эти интервалы имеют одинаковую длину b ≈ ω/k . Каждый интервал соответствует определенному уровню исследуемого показателя. Например, разбив диапазон значений на 5 интервалов группировки, можно им присвоить значения «Очень низкий», «Низкий», «Средний», «Высокий», «Очень высокий». Данные категории являются условными и выбираются исследователем исходя из конкретной задачи. После того как частичные интервалы выбраны, определяют частоты – количество ni элементов выборки, попавших в i-й интервал (элемент, совпадающий с верхней границей интервала, относится к последующему интервалу). Получающийся статистический ряд в верхней строке содержит середины zi интервалов группировки, а в нижней – частоты ni (i=1, 2, …, k). Наряду с частотами одновременно подсчитываются также накопленные частоты Σni = i ∑n j =1 j , относи- 4 PDF created with pdfFactory Pro trial version www.pdffactory.com тельные частоты ωi=ni/n и накопленные относительные частоты i Σω i = ∑ j =1 nj n . Полученные результаты сводятся в таблицу, называемую статистическим рядом. Для наглядности представления данных, по статистическому ряду строят графики и диаграммы. Рассмотрим основные из них. Полигоном частот называется ломаная линия с вершинами в точках (zi , ni ), i =1, 2, …, k, а полигоном относительных частот – ломаная с вершинами в точках (zi , ω i = ni/nb), i = 1, 2, …, k. Таким образом, полигон относительных частот получается из полигона частот сжатием по оси Оy в n раз. Гистограммой частот называется ступенчатая функция, состоящая из прямоугольников, основания которых опираются на интервалы группировки либо серединами на элементы выборки, а высоты равны или пропорциональны частотам ni. Кумулятивной кривой (кумулятой) частот называется ломаная линия, соединяющая точки с координатами точках (zi ,Σ ni ), i =1, 2, …, k. Если вместо накопленных частот ,Σ ni взять относительные накопленные частоты ,Σ ωi , то получим кумулятивную кривую накопленных частот, которая является приближением функции распределения генеральной совокупности. Пусть x1, x2, …, xn – выборка объема n из некоторого распределения, называемого генеральной совокупностью, с функцией распределения F(x). Рассмотрим методы нахождения оценок параметров этого распределения. Числовые характеристики этого выборочного распределения называются выборочными (эмпирическими) числовыми характеристиками. Оценками математического ожидания и дисперсии могут служить выборочное среднее x и выборочная дисперсия S 2 , которые рассчитываются по формулам: 1 n x = ∑ xj ; n j =1 S2 = 1 n 1 n 2 2 (x j − x)2 = ∑x j −n(x) . ∑ n −1 j=1 n −1 j=1 (1) (2) В случае группированного статистического ряда эти формулы имеют вид: 5 PDF created with pdfFactory Pro trial version www.pdffactory.com x= 1 k ∑ z i ni ; n i =1 k ni xi2 − n( x ) ∑ k 1 . S2 = ni ( xi − x) 2 = i =1 ∑ n − 1 i =1 n −1 * Выборочной модой d X называется элемент выборки, встре2 чающийся с наибольшей частотой. * Выборочной медианой называется число h X , которое делит вариационный ряд на две части, содержащие равное число элементов. Если объем выборки n – нечетное число (т. е. n = 2l = 1), то h *X = x (l +1) , то есть является элементом вариационного ряда со средним номером. Если же n = 2l – четное, то медиана равна среднеарифметическому двух средних элементов 1 h = ( x (l ) + x ( l +1) ). (3) 2 Рассмотрим основные методы обработки полученных данных на примере. 1.2. Примеры решения задач ЗАДАНИЕ. Были измерены показатели вербальной агрессии в группе из 30 человек. По выборке построить статистический ряд, полигон, гистограмму и кумулятивную кривую. Вычислить основные числовые характеристики: выборочное среднее, выборочную дисперсию, среднеквадратическое отклонение, медиану и моду. Показатели агрессии группы представлены в таблице: 55 59 71 63 66 68 74 65 71 65 70 81 68 69 76 64 75 57 73 58 65 68 75 70 73 71 70 71 67 71 РЕШЕНИЕ. Рассмотрим решение приведенного примера. Объем выборки n = 30. Размах выборки ω= 81-55 = 26. Построим статистический ряд: 6 PDF created with pdfFactory Pro trial version www.pdffactory.com Интервал [55;59) [59;63) [63;67) [67;71) [71;75) [75;79) [79;83) * 57 61 65 69 73 77 81 xi ni ωi ∑n ∑ω 3 0,1 1 0,03 6 0,2 8 0,27 8 0,27 3 0,1 1 0,03 3 4 10 18 26 29 30 0,1 0,14 0,34 0,6 0,87 0,97 1 i i По статистическому ряду строим графики полигон: 10 8 6 4 2 0 57 61 65 69 73 77 81 гистограмму: 9 8 7 6 5 4 3 2 1 0 [55;59) [59;63) [63;67) [67;71) [71;75) [75;79) [79;83) . 7 PDF created with pdfFactory Pro trial version www.pdffactory.com кумулятивную кривую: 35 30 25 20 15 10 5 0 57 61 65 69 73 77 81 Рассчитаем основные числовые характеристики по формулам (1)-(3). Выборочное среднее: x= x= 1 (x1+x2+…+xn) n 1 (55+71+66+74+71+70+68+76+75+73+65+75+73+70+67+59+ 30 +63+68+65+65+81+69+64+57+58+68+70+71+71+71) = 68,3. Выборочная дисперсия: 1 ( x12 + x22 + ... + xn2 − n ⋅ ( x ) 2 ) S2 = n −1 1 S2 = (552+712+662+742+712+702+682+762+752+732+652+752+ 30 − 1 +732+702+672+592+632+682+652+652+812+692+642+572+582+682+ +702+712+712+712-30(68,3)2) = 176,5. Среднеквадратическое отклонение: S = S 2 , S = 176,5 ≈ 13,28 . Для расчета медианы согласно формуле (3) расположим все элементы выборки по возрастанию их значений и найдем полусумму двух средних элементов (т.к. объем выборки четное число): 55 57 58 59 63 64 65 65 66 67 68 68 68 69 70 70 70 71 71 71 71 71 73 73 70 + 70 = 70 . 73 74 75 75 76 81, h = 2 Мода: d1 = 71. 8 PDF created with pdfFactory Pro trial version www.pdffactory.com 1.3. Статистические методы обработки данных с использованием ЭВМ Рассмотрим решение рассмотренной ранее задачи на ЭВМ с использованием программы EXCEL, входящий в пакет прикладных программ MS OFFICE. Построим статистический ряд и гистограмму. Откроем книгу программы EXCEL. Введем в первый столбец (ячейки А1-А30) исходные данные. Определим область чисел, на которой лежат данные. Для этого найдем максимальный и минимальный элементы выборки. Введем в ячейку В1 подпись «Максимум», а в В2 подпись «Минимум», а в соседних ячейках С1 и С2 определим функции «МАХ» и «MIN». Для этого переводим курсор в ячейку С1, вызываем функция, нажимая на кнопку панели инструментов fx , выбираем категорию «Статистические» и в ней функцию МАХ и в качестве аргументов (в графе «число») обведем область данных (ячейки А1-А30). Аналогично в С2 вводим функцию МИН. Результатом будут 55 и 81. Видно, что все данные укладываются на отрезке [55;83]. Разделим его на семь (выбирается произвольно от 5 до 10) интервалов по 4 единицы каждый: [55;59) , [59;63) , [63;67) , [67;71) , [71;75) , [75;79) , [79;83) . В ячейки D1-D7 вводим верхние границы интервалов группировки, так, как сами границы в интервал попадать не должны, а элементы выборки – целые числа, то вводим число, чуть меньшее (например, на 0.1) чем сама граница, то есть числа 58.9, 62.9, 66.9, 70.9, 74.9, 78.9, 82.9. Для вычисления частот ni используют функцию ЧАСТОТА, находящуюся в категории «Статистические». Ставим курсор в ячейку Е1. Нажимаем на кнопку вызова функции fx . Выбираем категорию «Статистические». В окне функций выбираем функцию «Частота». В строке «Массив данных» введем диапазон выборки (ячейки А1-А30). В строке «Двоичный массив» введем диапазон верхних границ интервалов группировки (ячейки D1-D7). Результат функции является массивом и выводится в ячейках Е1-Е7. Для полного вывода (не только первого числа в Е1) нужно выделить ячейки Е1-Е7, обведя их мышью, и нажать F2, а далее одновременно CTRL+SHIFT+ENTER. Результат – частоты интервалов 3,1,6,8,8,3,1. Для построения гистограммы нужно выбрать ВСТАВКА/ДИАГРАММА или нажать на соответствующий значок на основной панели (при этом курсор должен стоять в свободной ячейке). Далее выбрать тип: ГИСТОГРАММА, вид по выбору, нажать «ДАЛЕЕ», в строке «ДИАПАЗОН» обвести частоты Е1-Е7, перейти на вкладку «РЯД», в строке « ПОДПИСИ ОСИ Х» ввести интервалы в ячейках D1-D7, нажать «ДАЛЕЕ» ввести название 9 PDF created with pdfFactory Pro trial version www.pdffactory.com «ГИСТОГРАММА», подписи осей «ИНТЕРВАЛЫ» и «ЧАСТОТА», нажать «ГОТОВО». Для построения полигона выполняем все те же действия, которые описаны в предыдущем абзаце, только выбирается тип: ГРАФИК вместо типа ГИСТОГРАММА. Для построения кумулятивной кривой рассчитываем накопленные частоты. Для этого вводим в ячейку F1 формулу «=Е1» (кавычки не вводить!), а в ячейку F2 формулу «=F1+E2». Автозаполняем результат на ячейки F2-F7, перемещая мышкой прямоугольник в нижнем правом углу ячейки. Результат – накопленные частоты 3,4,10,18,26,29,30. Обводим эти числа мышью, выделяя их и вызываем мастер диаграмм кнопкой , выбираем «ГРАФИК», а все остальные действия такие же как и для построения полигона. Находим основные числовые характеристики выборки. Для этого ставим курсор в свободную ячейку (например D11). Затем вызываем в меню «Сервис» подменю «Анализ данных». Если в меню «Сервис» отсутствует этот пункт, то в меню «Сервис» нужно выбрать пункт «Надстройки» и в нем поставить флажок напротив пункта «Пакет анализа». После этого в меню «Сервис» появится «Анализ данных». В окне «Анализ данных» нужно выбрать пункт «Описательная статистика». В появившемся окне в поле «Входной интервал» делаем ссылку на выборку А1-А30. Оставляем группирование «По столбцам» В разделе «Параметры вывода» ставим флажок на «Выходной интервал» и в соседнем поле задаем ссылку на верхнюю левую ячейку области вывода (например D11), ставим флажок напротив «Описательная статистика», нажимаем «ОК». Результат – основные характеристики выборки (сделайте шире столбец D, переместив его границу в заголовке). 2. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ Методы проверки статистических гипотез являются центральными в математических исследованиях психологии. Данные методы широко используются при решении задач, связанных с выявлением различия между двумя или несколькими показателями. 2.1. Основные сведения и формулы Статистической гипотезой называется некоторое предположение, которое принимается или отвергается на основании результатов наблюдений. Основная проверяемая статистическая гипотеза обознача10 PDF created with pdfFactory Pro trial version www.pdffactory.com ется Н0, если она отвергается, то принимается альтернативная гипотеза, которая обозначается Н1. При проверке гипотез исследователем задается некоторая маленькая вероятность α, называемая уровнем значимости. Он имеет смысл вероятности совершить ошибку, заключающуюся в принятии альтернативной гипотезы Н1, в то время, когда истинна основная Н0. Вместо α иногда задают величину р=1-α, называемую доверительной вероятностью. Ее можно интерпретировать как вероятность, с которой можно доверять полученному результату. На практике обычно выбирают α=0.1, 0.05 или 0.01. Способ проверки статистической гипотезы называется статистическим критерием. Все критерии заключаются в вычислении по выборочным данным некоторого числа Z, называемого статистикой критерия, и сравнения этого числа с критическим значением Zкр, который выбирается из статистических таблиц. Рассмотрим гипотезу об однородности (равенстве) средних характеристик некоторого показателя. Предположим, что имеются две выборки, характеризующие показатель Х в разных условиях. Например, показатель измеряется в двух различных группах и требуется доказать, что он в них в среднем различается. Или показатель измеряется в одной и той же группе, но в разных условиях, например, до и после тренинга и нужно доказать, что тренинг привел к изменению показателя. Выборки, по которым проверяется гипотеза, называются связанными, если каждому значению одной выборки xi соответствует элемент yi из другой выборки характеризующие показатели для одного и того же тестируемого, но в различных условиях. Несвязанные выборки как правило характеризуют различные группы респондентов, например экспериментальную группу сравнивают с контрольной. Простейшим критерием для связанных выборок является критерий знаков. 2.1.1. Критерий знаков Он применяется для проверки гипотезы H0 об однородности рассматриваемого показателя по попарно связанным выборкам. Для его применения выписывают пары значений первой и второй выборок ( xi , yi ), i = 1,2,..., n , затем находят разности между элементами первой и второй выборок в каждой паре xi − yi и считают число положительных разностей r. При этом l – число ненулевых разностей. Если предполагается, что средний показатель первой выборки больше чем у второй, то это предположение можно считать справедливым, если выполняется неравенство: 11 PDF created with pdfFactory Pro trial version www.pdffactory.com r ≥ F1−α (k1 , k 2 ) , l − r +1 (4) где k1=2(l-r+1), k2=2r, Если же предполагается, что средний показатель выше у второй выборке, то это читается справедливым, если выполняется неравенство l−r ≥ F1−α (k1 , k 2 ) , (5) r +1 где k1=2(r+1), k2=2(l-r). Здесь Fp (k1 , k 2 ) - обратное распределение Фишера, его значения находят по специальным статистическим таблицам (см. табл. 2 ПРИЛОЖЕНИЯ). Если оба неравенства (4)-(5) не выполняются, то значения показателя в обеих выборках в среднем равны. Если выборки являются независимыми и не связаны, то существует несколько критериев решения данной задачи. Рассмотрим основные из них. 2.1.2. Параметрический критерий Стьюдента Это наиболее мощный критерий сравнения средних для связанных и несвязанных выборок объема n и m, однако, он применяется для случаев, когда показатели, представленные выборками имеют закон распределения близкий к нормальному [4,5,7,12]. В основе критерия лежит сравнение основных выборочных параметров (средних и дисперсий), поэтому он называется параметрическим. Рассмотрим случай когда выборки независимы и несвязны. Рассмотрим выборки ( x1 , x2 ,..., xn ), ( y1 , y2 ,..., ym ) . На первом этапе по выборкам вычисляются выборочные средние и дисперсии (1) - (2): 2 1 1 ( x12 + x22 + ... + xn2 − n ⋅ ( x ) 2 ) , x = (x1+x2+…+xn), S x = n n −1 2 1 1 ( y12 + y22 + ... + ym2 − m ⋅ ( y ) 2 ) . y = (y1+y2+…+ym), S y = m m −1 На втором этапе сравниваются дисперсии. Для этого вычисляетmax(S x2 ; S y2 ) ся F = , равное отношению большей дисперсии к меньmin(S x2 ; S y2 ) шей. Это число сравнивается с критическим значением 12 PDF created with pdfFactory Pro trial version www.pdffactory.com Fkr = F1−α (k1 , k 2 ) , взятым из табл. 2 ПРИЛОЖЕНИЯ. При этом k1 = n − 1, k 2 = m − 1 , если S x2 > S y2 и k1 = m − 1, k 2 = n − 1 , если S x2 < S y2 . Если F ≤ Fkr , то дисперсии можно считать равными, если F > Fkr , то дисперсии различны. На третьем этапе вычисляется статистика критерия Стьюдента: t= x− y S 1 n +1 m если дисперсии равны и , где S = t= (n − 1)S x2 + (m − 1)S y2 n+m−2 , (6) x− y S x2 n + S y2 m , (7) если дисперсии различные. По таблице обратного распределения Стьюдента (табл. 1 ПРИЛОЖЕНИЯ) находят критическое значение статистики t kr = t1−α (n + m − 2) . Если t ≤ t kr , то средние значения показателей для выборок не различаются. 2.1.3. Ранговый критерий Вилкоксона Ранговый критерий Вилкоксона, (который в литературе встречается еще под названием критерия Манна и Уитни), является аналогом критерия Стьюдента, однако он менее мощный и точный. Но его можно применять для всех выборок и он более простой с точки зрения вычислений. В основе критерия лежат вычисления рангов выборок, поэтому критерий называется ранговым. Рассмотрим две независимые выборки объема n и m: ( x1 , x2 ,..., xn ), ( y1 , y2 ,..., ym ) . Статистика W критерия определяется следующим образом. Расположим n+m значений обоих выборок в порядке возрастания, т. е. в виде общего вариационного ряда. При этом необходимо отмечать принадлежности элементов к той или иной выборке, например, выделяя элементы первой выборки. Каждому элементу ряда поставим в соответствие его номер в ряду – ранг. Если несколько элементов ряда совпадают по величине, то каждому из них присваивается ранг, равный среднему арифметическому их номеров. Пусть R1 – сумма рангов первой выборки, R2 - сумма рангов второй выборки. Вычислим значения ω1 и ω2 : 13 PDF created with pdfFactory Pro trial version www.pdffactory.com n(n + 1) − R1 , 2 m(m + 1) ω2 = nm + − R2 . 2 Правильность вычислений проверяется по формуле ω1 + ω2 = nm . Выборочное значение статистики W критерия есть наименьшее из чисел ω1 и ω2 : W = min(ω1 , ω2 ) . Данное число на заданном уровне значимости α сравнивается с критическим значением Wkr . Таблица критических значений критерия Вилкоксона Wkr для уровня значимости α=0,05 приведена в ПРИЛОЖЕНИИ (табл. 4). В ней по вертикале указывается объем выборки с большим числом элементов n, а по горизонтали – объем выборки с меньшим числом элементов m. Если W > Wkr , то можно считать, что средние показатели не различаются. Если объем каждой из выборок больше 8, то проверку гипотезы можно проводить, используя приближенный метод. Для него статистика критерия равна: 1 nm − W 2 . (8) Z= 1 nm(n + m + 1) 12 Критическое значение критерия в зависимости от уровня значимости α выбирают из таблицы: 0,2 0,1 0,05 0,025 0,01 0,005 α 0,842 1,282 1,645 1,960 2,326 2,576 Z kr ω1 = nm + Если Z < Z kr , то можно считать, что средние значения показателя для двух групп не различаются. Рассмотрим решение таких задач на примерах. 2.2. Примеры решения задач ЗАДАНИЕ № 1. Психолог разработал методику, позволяющую, по его мнению, увеличить внимательности у старшеклассников. Для проверки этого предположения были измерены уровни внимательности у 14 старшеклассников до x и после y проведения методики. Можно ли с вероятностью 0,95 говорить о том, что методика действи- 14 PDF created with pdfFactory Pro trial version www.pdffactory.com тельно приводит к увеличению уровня внимательности, используя критерий знаков. x 73 76 77 76 76 75 74 72 75 79 76 78 71 75 y 70 71 83 76 79 71 74 66 80 81 78 69 73 85 РЕШЕНИЕ. Используем критерий знаков. Присвоим каждой паре значений обоих выборок знаки по следующему правилу: если xi > yi знак «+», если xi < yi знак «-», если xi = yi знак «0». xi 73 76 77 76 76 75 74 72 75 79 76 78 71 75 yi 70 71 83 76 79 71 74 66 80 81 78 69 73 85 Знаки + + 0 + 0 + + l = 12 (число ненулевых разностей); r = 5 (число разностей со знаком «+»); доверительная вероятность р=0,95, следовательно уровень значимости α=1-0,95=0,05. Так как предполагается, что средний показатель второй выборки выше, чем средний показатель у первой, то вычисляется левая часть неравенства (5) по формуле: l − r 12 − 5 F= = 1,17 . = r +1 5 +1 Правая часть этого неравенства вычисляется по табл. 2 ПРИЛОЖЕНИЯ: Fkr = F1−α (2(r + 1), 2(l − r ) ) = F0,95 (12,14) = 2,55 , Видно, что F < Fkr , то есть можно считать, что средние показатели для выборок из обеих групп статистически не различаются, т.е. методика не привела к увеличению уровня внимательности. ЗАДАНИЕ № 2. Ставится задача проверить предположение о том, что агрессивность в среднем у мужчин и женщин различна. Для проверки этого предположения тестированием были получены показатели агрессивности у 14 женщин и 12 мужчин. Можно ли по опытным данным с доверительной вероятностью 0,95 говорит о том, что показатели агрессивности у мужчин и женщин различны? а) Использовать параметрический критерий Стьюдента. б) Использовать ранговый критерий Вилкоксона. 15 PDF created with pdfFactory Pro trial version www.pdffactory.com 23 25 23 16 27 29 Агрессивность у женщин 22 23 24 28 16 18 23 Агрессивность у мужчин 24 17 24 30 33 23 26 29 26 20 34 31 19 РЕШЕНИЕ. а) Решим сначала задачу, используя критерий Стьюдента. Первый этап. Объемы выборок равны n = 14; m = 12. Вычисляем выборочные средние и дисперсии. x x = = 1 (x1+x2+…+xn); n 1 (23+25+23+22+23+24+28+16+18+23+29+26+31+19) = 23,5; 14 S x2 = 1 ( x12 + x22 + ... + xn2 − n ⋅ ( x ) 2 ) , n −1 2 S x = 1 (232+252+232+222+232+242+282+162+182+ 14 − 1 +232+292+262+312+192- 14(23,5)2) = 20,96, y = 1 (y1+y2+…+ym), n 1 (6+27+29+24+17+24+30+33+23+26+20+34) = 25,2 , 12 S y2 = 1 ( y12 + y22 + ... + ym2 − m ⋅ ( y )2 ) , n −1 S y2 = 1 (162+272+292+242+172+242+302+332+232+ 12 − 1 +262+202+342- 12(25,2)2) = 36,04. Второй этап. Проверяем, можно ли считать средние равными: max(S x2 ; S y2 ) 36,04 F= = = 1,7, 20,96 min(S x2 ; S y2 ) y = По табл. 2 ПРИЛОЖЕНИЯ находим Fкр = F (11; 13) = 2,65. Видно, что F < Fкр (т.к. 1,7 < 2,65), то есть дисперсии можно считать равными. Исходя из этого на третьем этапе применяем формулу (6). 16 PDF created with pdfFactory Pro trial version www.pdffactory.com Третий этап. Вычисляем статистику критерия: x−y 1 t= ⋅ = 1 1 S x2 (n − 1) + S y2 (m − 1) + n m n+m−2 = 23,5 − 25,2 20,96(14 − 1) + 36,04(12 − 1) 14 + 12 − 2 ⋅ 1 1 1 + 14 12 = 0,838 . По табл. 1 ПРИЛОЖЕНИЯ находим критическое значение критерия: tкр = t1-α (n+m-2)=t0,95(24)=1,711 Видно, что t < tкр (т.к. 0,838 < 1,711), следовательно для выборок средние показатели различаются и можно говорить, что для данных выборок показатели агрессивности у мужчин и женщин можно считать статистически равными, а предположение о том, что агрессивность в среднем у мужчин и женщин в данных группах различна отвергается по выборочным данным. б) Решим теперь задачу используя ранговый критерий Вилкоксона. Для этого объединим обе выборки в один вариационный ряд, расположив элементы обоих выборок по возрастанию значений. При этом будем выделять элементы второй выборки. Над элементами укажем их ранги: 1,5 1, 5 3 4 5 7 6 10 10 10 10 10 14 14 14 16 17 ,5 16 16 17 18 19 20 22 23 23 23 23 23 24 24 24 25 26 17 ,5 19 20 21, 5 21, 5 23 24 25 26 26 27 28 29 29 30 31 33 34 Вычисляем суммы рангов обеих выборок и их статистики: R1 = 1,5+4+5+7+10+10+10+10+14+16+17,5+20+21,5+24 = 170,5 , R2 = 1,5+3+6+10+14+14+17,5+19+21,5+23+25+26 = 180,5 , 14 + 1 ω1 = 14 ⋅ 12 + 14 − 170,5 = 102,5 , 2 12 + 1 ω2 = 14 ⋅ 12 + 12 − 180,5 = 65,5. 2 Проверка: ω1 + ω2 = n1 ⋅ n2 , 168 = 168 - верно. W = min(ω1; ω2 ) = ω2 = 65,5 . 17 PDF created with pdfFactory Pro trial version www.pdffactory.com Из табл. 4 ПРИЛОЖЕНИЯ находим критическое значение критерия для n = 14, m = 12 : Wkr = 51 . Видно, что W > Wkr , следовательно исследуемый показатель в обеих группах можно считать статистически одинаковым, значит предположение о том, что агрессивность у мужчин и женщин в данных группах различна отвергается. Рассмотрим теперь для примера второй приближенный метод решения задачи. По формуле (8) вычисляем статистику критерия: 14 ⋅12 nm − 65,5 −W 2 2 = = 0,95 Z= 14 ⋅12 nm ⋅ (14 + 12 + 1) ⋅ (n + m + 1) 12 12 По таблице, при p=0,95, α=0,05 находим Zкр = 1,645. Видно, что Z < Zкр (т.к. 0,95 < 1,645), отсюда можно сделать вывод, что агрессивность в обеих группах можно считать статистически одинаковой, значит предположение о том, что агрессивность у мужчин и женщин в данных группах различна отвергается. 2.3. Проверка статистических гипотез по критерию Стьюдента с использованием ЭВМ Критерий Стьюдента является самым точным, однако он требует достаточно громоздких вычислений и для его применения часто используют ЭВМ. Для этих целей также можно применить программу EXCEL. Существует три разновидности критерия: один – для связанных выборок, и два для несвязанных выборок (с одинаковыми и разными дисперсиями). Если выборки не связаны, то предварительно нужно проверить гипотезу о равенстве дисперсий, чтобы определить, какой из критериев использовать. Способы решения задач рассмотрим на примерах. ЗАДАНИЕ № 1. Психолог Петров разработал методику тренинга для снятия усталостной раздражительности сотрудников организации. Для подтверждения эффективности методики, Петров на экспериментальной группе сотрудников с помощью специально разработанных тестов, измерил раздражительность до и после проведения методики. Результаты оказались следующими: Сотрудник 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. перед мето45 49 33 38 41 47 44 38 36 41 42 дикой после мето44 46 34 32 40 45 42 39 33 40 42 дики 18 PDF created with pdfFactory Pro trial version www.pdffactory.com Можно ли с вероятностью 0,95 (и с уровнем значимости α=1-р= =1-0,95=0,05) утверждать, что методика приводит к среднему снижению показателя раздражительности? РЕШЕНИЕ. Данные выборки являются связанными. Для решения задачи используем надстройку «Анализ данных». Открываем электронный лист программы EXCEL. Вводим исходные данные в электронную таблицу, как показано на рисунке: Выбираем пункт меню СЕРВИС/АНАЛИЗ ДАННЫХ. Если данный пункт отсутствует в меню СЕРВИС, то вызываем СЕРВИС/НАДСТРОЙКИ и ставим галочку напротив пункта ПАКЕТ АНАЛИЗА. Для связанных выборок выбираем «Парный двухвыборочный t-тест для средних». В открывшемся окне в полях «Интервал переменной 1» и «Интервал переменной 2» вводят ссылки на данные (А2-L2 и А3-L3, соответственно), ставим флажок у надписи «Метки». Далее вводят уровень значимости в поле «Альфа» - 0,05. Поле «Гипотетическая средняя разность» оставляют пустым. В разделе «Параметры вывода» ставят метку около «Выходной интервал» и поместив курсор в появившееся поле напротив надписи, щелкают левой кнопкой в ячейке В7. Вывод результата будет осуществляться начиная с этой ячейки. Нажав на «ОК» появляется таблица результата. Сдвиньте границу между столбцами В и С, С и D, D и Е, увеличив ширину столбцов В, С и D так, чтобы умещались все надписи. Процедура выводит основные характеристики выборок, t-статистику, критические значения этих статистик и критические уровни значимости «P(T<=t) одностороннее» и «P(T<=t) двухстороннее». Если по модулю t-статистика меньше критического одностороннего, то средние показатели с заданной вероятностью равны. Если по модулю t-статистика больше критического одностороннего, то средние показатели с заданной вероятностью различаются. В нашем случае |2,539861| > 1,812462, следовательно, средние значения показателя раздражительности улучшились при проведении психологического тренинга Петрова. ЗАДАНИЕ № 2. Имеются данные о показателях запоминаемости образов в двух группах младших классов, в первой из которых проводилась методика, которая, по мнению ее автора, должна повысить уровень запоминаемости, вторая группа по основным характеристикам ничем не отличается от первой, за исключением того, что в ней такая методика не проводилась. Можно ли с вероятностью 0,98 гово19 PDF created with pdfFactory Pro trial version www.pdffactory.com рить о том, что опытные данные подтверждают предположение о том, что раздражительность после проведения методики автора в среднем уменьшилась Раздражительность с 16 19 14 15 17 16 19 16 19 14 15 19 13 применением методики Раздражительность без 18 19 21 15 19 18 15 20 17 16 21 15 методики РЕШЕНИЕ. По условию р=0,98, α=0,02, выборки не связаны, критерий односторонний, т.к. нужно показать, что средние показателя, представленного второй выборкой, больше чем у первой. Вводим в ячейки А1-М1 и А2-L2 исходные данные. Т.к. выборки несвязанны (даже различные их объемы), то выбирается в меню СЕРВИС/АНАЛИЗ ДАННЫХ либо «Двухвыборочный t-тест с одинаковыми дисперсиями», либо «Двухвыборочный t-тест с разными дисперсиями». Чтобы выбрать нужный тест, необходимо предварительно сравнить дисперсии. Для этого в меню СЕРВИС/АНАЛИЗ ДАННЫХ выбираем «Двухвыборочный F-тест для дисперсий». В появившемся окне ставим курсор в поле «Интервал переменной 1» и обводим мышью ячейки А1-М1, делая на них ссылку. Аналогично, в ячейку «Интервал переменной 2» делаем ссылку на А2-L2. В поле «Альфа» вводим уровень значимости 0,02, нажимаем «ОК». На новом листе отобразятся результаты теста. Видно, что F-статистика (0,902) ближе к единице, чем F-критическое (0,283). Следовательно, дисперсии равны и нужно вызываеть t-тест с одинаковыми дисперсиями. Переходим на ЛИСТ1 с данными, выбираем в меню СЕРВИС/АНАЛИЗ ДАННЫХ «Двухвыборочный t-тест с одинаковыми дисперсиями». В открывшемся окне в полях «Интервал переменной 1» и «Интервал переменной 2» вводят ссылки на данные (А1-М1 и А2-L2, соответственно), если имеются подписи данных, то ставят флажок у надписи «Метки» (у нас их нет, поэтому флажок не ставится). Далее вводят уровень значимости в поле «Альфа» - 0,02. Поле «Гипотетическая средняя разность» оставляют пустым. В разделе «Параметры вывода» ставят метку около «Выходной интервал» и поместив курсор в появившееся поле напротив надписи, щелкают левой кнопкой в ячейке В7. Вывод результата будет осуществляться начиная с этой ячейки. Нажав на «ОК» появляется таблица результата. Сдвиньте границу между столбцами В и С, С и D, D и Е, увеличив ширину столбцов В, С и D так, чтобы умещались все надписи. Процедура выводит основные характеристики выборок, t-статистику, критические значения этих статистик и критические уровни значимости «P(T<=t) одностороннее» и «P(T<=t) двухстороннее». Если по модулю t-статистика меньше крити20 PDF created with pdfFactory Pro trial version www.pdffactory.com ческого одностороннего, то средние показатели с заданной вероятностью равны. В нашем случае |-1,7392| < 2,1769, следовательно, запоминаемость образов значимо не увеличилась. 3. ВЫЯВЛЕНИЕ ЗАВИСИМОСТЕЙ МЕЖДУ ПОКАЗАТЕЛЯМИ Наряду с задачами выявления различия между несколькими показателями не менее важными являются задачи определения связей между факторами, влияния одного фактора на другой. Такие задачи изучаются разделами прикладной математики и статистики – в регрессионном и корреляционном анализе. 3.1. Основные сведения и формулы Рассмотрим два показателя Х и Y. Предположим, что они зависимы, то есть изменение одного из них влечет за собой изменение другого. Если при этом, зная точно значение одного показателя можно точно определить значение другого, то связь между показателями называется функциональной. Однако на практике в подавляющем большинстве встречаются зависимости иного вида, когда изменение одного показателя лишь в среднем приводит к изменению другого. Такие зависимости называются статистическими. При них, зная значение Х, нельзя точно определить Y , так как на Y кроме Х влияет еще множество неучтенных факторов. Поэтому, зная Х можно лишь в среднем оценить значение Y. Примеры таких зависимостей в психологии: зависимости между уровнями раздражительности и возбудимости, степенями внимательности и усталости, темпераментом и степенью эмоциональности и т.д. Характер статистической зависимости изучается в регрессионном анализе, а сила статистической связи – в корреляционном анализе. 3.1.1. Элементы регрессионного анализа Предположим, что психологу необходимо исследовать зависимость между показателями Х и Y. Для этого он измеряет для одних и тех же респондентов значения показателя Х и одновременно значения Y, получая выборки пар значений ( x1 , y1 ), ( x2 , y2 ), ..., ( xn , yn ) . Необходимо определить характер статистической зависимости между Х и Y, то есть уравнение вида y = f (x) , которое позволяет по значению переменной x оценить в среднем значение y, спрогнозировав его. Это уравнение называется уравнением регрессии. Рассмотрим простейший 21 PDF created with pdfFactory Pro trial version www.pdffactory.com случай уравнения регрессии – линейную регрессию, когда уравнение регрессии имеет вид прямой линии: y = ax + b . Можно показать, что в соответствии с методом наименьших квадратов [4,5,7] для нахождения неизвестных параметров а и b нужно использовать следующие формулы: xy − x ⋅ y , b = y − a⋅ x , (9) a= x 2 − (x ) 2 где 1 1 x = (x1+x2+…+xn), y = (y1+y2+…+yn), n n 1 2 2 (x1 +x2 +…+xn2), n 1 (x1y1+x2y2+…+xnyn). (10) n Для проверки полученных результатов можно построить график, на который наносятся исходные точки и линия регрессии (см. пример). x2 = xy = 3.1.2. Элементы корреляционного анализа Рассмотрим теперь вопрос оценки качества статистической связи. Мерой оценки силы статистической зависимости между показателями Х и Y служит коэффициент корреляции r . Существует несколько способов расчета коэффициентов корреляции, рассмотрим два из них. а) Коэффициент парной корреляции Пирсона rx, y . Он вычисляется по формуле: xy − x ⋅ y rxy = , 2 2 2 2 ( x − ( x ) )( y − ( y ) ) (11) 1 2 2 (y1 +y2 +…+yn2), остальные параметры вычисляются по n формулам (10). б) Коэффициент ранговой корреляции Спирмена rs . Для его вычисления каждому элементу xi выборки показателя Х присваивается ранг – порядковый номер этого элемента в вариационном ряду (выборке, записанной по возрастанию значений элементов). Если несколько соседних элементов вариационного ряда равны по величине, то их ранг равен среднеарифметическому их порядковых где y2 = 22 PDF created with pdfFactory Pro trial version www.pdffactory.com номеров. Пусть ~ xi - ранг элемента xi . Аналогично вычисляются ранги ~y элементов y второй выборки показателя Y. Тогда, коэффициент i i корреляции Спирмена вычисляется по формуле: n rs = 1 − 6∑ ( ~ xi − ~ yi ) 2 i =1 . (12) n(n 2 − 1) Коэффициент корреляции r (как Пирсона так и Спирмена) обладает следующими свойствами: 1. Коэффициент корреляции изменяется в пределах −1 ≤ r ≤ 1 . 2. Модуль коэффициента корреляции характеризует силу статистической связи, чем больше | r | , тем сильнее связь, в частности если r = ±1 , то связь функциональная, если r близок к нулю, то связь слабая или отсутствует. 3. Знак коэффициента корреляции характеризует направление статистической связи, если r > 0 , то с ростом Х показатель Y также растет, если r < 0 , то с ростом Х показатель Y убывает. 4. Величина R = r 2 называется коэффициентом детерминации, его можно интерпретировать как среднюю долю влияния показателя Х на Y. Для ответа на вопрос: можно ли считать связь между показателями достаточно сильной, чтобы считать Х и Y зависимыми и уравнение их регрессии имеет смысл, используется методика проверки значимости коэффициента корреляции. Для нее вычисляется статистика n−2 (13) 1− r2 и по табл. 1 ПРИЛОЖЕНИЯ определяется критическое значение t kr = t1− α (n − 2) . Если t > t kr , то можно считать, что коэффициент корреляции значим, показатели Х и Y зависимы, уравнение регрессии можно использовать для прогнозов и оценок. Если t ≤ t kr , то коэффициент корреляции незначим, показатели Х и Y независимы, уравнение регрессии теряет смысл. t= r ⋅ 3.1.3. Зависимость между показателями, заданными атрибутивно В рассмотренных ранее примерах показатели Х и Y измерялись численно. Однако часто в психологических исследованиях показатели задаются атрибутивно (например, темперамент имеет четыре атрибу23 PDF created with pdfFactory Pro trial version www.pdffactory.com тивных признака: сангвиник, меланхолик, флегматик и холерик), либо уровнями или диапазонами значений (например: слабый, средний, сильный и т.д.). В таких случаях, для определения зависимости между показателями используют методику, называемую критерием хиквадрат. Рассмотрим показатели X и Y, которые принимают соответственно атрибутивные значения x1, x2, … ,xk и y1,y2, …,yl. Предположим, что проведено n измерений показателей Х и Y, при которых nij раз показатель X принимает значение xi а показатель Y значение yj, (i=1,2, l k j =1 i =1 …,k, j=1,2,…,l). Обозначим ni = ∑ nij , n j = ∑ nij , а статистику критерия рассчитаем по формуле: k 1 l nij2 k l nij2 Z = n ⋅ ∑∑ (14) − 1 = n ⋅ ∑ ⋅ ∑ − 1 . n n i =1 j =1 ni n j i j i = 1 j = 1 Критическое значение находим по таблице обратного распределения хи-квадрат (табл. 3 ПРИЛОЖЕНИЯ): Z kr = χ12− α ((k − 1)⋅ (l − 1)) . Если Z > Z kr , то можно считать, что показателей Х и Y статистически зависимыми. 2.2. Примеры решения задач ЗАДАНИЕ № 1. Изучается зависимость между интеллектуальными способностями родителей и интеллектуальными способностями их детей. Для решения задачи был разработан тест (аналог IQ-теста) и протестированы интеллектуальные способности 10 семейных пар. Усредненные значения интеллектуального балла для родителей xi и для их детей yi приведены в таблице: Значения фактора xi 37 48 39 19 28 33 24 43 41 32 Значения фактора yi 32 39 27 21 21 36 26 34 30 34 Необходимо: 1) Найти коэффициент парной корреляции Пирсона, проверить его значимость при p=0,9. 2) Найти коэффициент ранговой корреляции Спирмена. 3) По выборкам данных найти уравнение линейной регрессии y=ax+b. 4) Построить график, нанеся на него опытные данные и линию регрессию. 24 PDF created with pdfFactory Pro trial version www.pdffactory.com РЕШЕНИЕ. 1) Находим коэффициент парной корреляции Пирсона по формуле (11): 1 (37+48+39+19+28+33+24+43+41+32) = 34,4; x = 10 1 y = (32+39+27+21+21+36+26+34+30+34) = 30; 10 1 (372+482+392+192+282+332+242+432+412+322) = 1255,8; x2 = 10 1 y2 = (322+392+272+212+212+362+262+342+302+342) = 934; 10 1 (37 ⋅32 +48 ⋅39 +39 ⋅27 +19 ⋅21 +28 ⋅21 +33 ⋅36 +24 ⋅26 +43 ⋅34 + xy = 10 +41 ⋅30 +32 ⋅34 ) = 1068,8; 1068,8 − 34,4 ⋅ 30 rxy = (1255,8 − (34,4) 2 )(934 − (30) 2 ) = 0,742. Проверяем коэффициент корреляции на значимость при доверительной вероятности p = 0,9 и уровне значимости α = 0,1 . Статистику n−2 сравниваем с критическим значением tкр, полученным 1− r2 из табл. 1 ПРИЛОЖЕНИЯ: 10 − 2 = 3,131; tкр = tp (n-2) = t0,9 (8) =1,397, t = 0,742 ⋅ 1 − (0,742) 2 t > tкр (т.к. 3,131 > 1,397), отсюда можно сделать вывод, что коэффициент корреляции значим и показатели зависимы. Следовательно, между интеллектуальными способностями родителей и интеллектуальными способностями их детей есть зависимость. 2) Находим коэффициент ранговой корреляции Спирмена. Для этого вычисляем ранги элементов обоих выборок: Значение фактора xi 37 48 39 19 28 33 24 43 41 32 6 10 7 1 3 5 2 9 8 4 Ранг фактора ~ xi t= r⋅ Значение фактора yi Ранг фактора ~y i 32 6 39 10 27 4 21 1,5 21 1,5 36 9 26 3 34 7,5 30 5 34 7,5 25 PDF created with pdfFactory Pro trial version www.pdffactory.com По формуле (12) вычисляем коэффициент корреляции: n ∑ ( ~x i i =1 − ~yi ) 2 = 0+0+32+0,52+1,52+42+12+1,52+32+3,52 = 52; rs = 1 − 6 ⋅ 52 10(10 2 − 1) = 0,685. Коэффициент корреляции Спирмена также достаточно высок, что подтверждаем предположение о том, что между интеллектуальными способностями родителей и интеллектуальными способностями их детей существует зависимость. 3) Строим по формулам (9) уравнение линейной регрессии y = ax + b : 1068,8 − 34,4 ⋅ 30 a= 1255,8 − (34,4) 2 = 0,51; b = 30-0,51 ⋅34,4 = 12,5; Отсюда, уравнение линейной регрессии имеет вид: y = 0,51 ⋅ x +12,5. 4) Строим график линии регрессии и опытных данных. Для построения прямой линии находим две произвольные точки уравнения y = 0,51 ⋅ x +12,5: если x1 = 15, то y1 = 20,2; если x2 = 50, то y2 = 38. y 45 40 35 30 25 20 15 10 5 0 x 0 5 10 15 20 25 30 35 40 45 50 55 26 PDF created with pdfFactory Pro trial version www.pdffactory.com ЗАДАНИЕ № 2. Исследуется зависимость между двумя показателями: агрессивностью X и тревожностью Y. Были разработаны тесты, позволяющие выявить уровень агрессивности: А1 – слабая агрессивность, А2 – средняя агрессивность, А3 – высокая агрессивность; и уровни тревожности: Т1 – слабая тревожность, Т2 – средняя тревожность, Т3 – высокая тревожность. Результаты исследования (количество тестируемых, соответствующих каждым уровням агрессивности и тревожности) приведены в таблице. Т1 Т2 Т3 ni А1 58 18 8 84 А2 11 22 22 55 А3 8 4 44 56 nj 77 44 74 195 Проверить на уровне значимости p=0,95 гипотезу о том, что уровень агрессивности не зависит от уровня тревожности. РЕШЕНИЕ: Показатели заданы атрибутивно, поэтому используем методику критерия хи-квадрат. Вычисляем величины ni и nj, которые равны суммам значений показателей в столбцах и строках. Т1 Т2 Т3 ni А1 58 18 8 84 А2 11 22 22 55 А3 8 4 44 56 nj 77 44 74 n=195 Затем по формуле (14) вычисляется статистика критерия: Z = 195⋅ ( 582 182 82 112 22 2 22 2 + + + + + + 77 ⋅ 84 44 ⋅ 84 74 ⋅ 84 77 ⋅ 55 44 ⋅ 55 74 ⋅ 55 82 42 442 + + − 1) = 88,54. 77 ⋅ 56 44 ⋅ 56 74 ⋅ 56 По табл. 3 ПРИЛОЖЕНИЯ находим критическое значение критерия: Z kp = χ 2p ((k − 1) ⋅ (l − 1) ) = χ20,95 ((3 − 1) ⋅ (3 − 1)) = χ02,95 (4) = 9,488 . + Видно, что Z > Zкр (т.к. 88,54 >9,448), отсюда делаем вывод, что опытные данные подтверждают гипотезу о том, что уровень агрессивности зависит от уровня тревожности. 2.3. Примеры решения задач на ЭВМ Построение уравнения линейной регрессии и вычисление коэффициента корреляции Пирсона требует достаточно громоздких вычислений, поэтому рационально для решения таких задач использовать 27 PDF created with pdfFactory Pro trial version www.pdffactory.com ЭВМ. Рассмотрим примеры решения таких задач с использованием пакета прикладных программ EXCEL. ПРИМЕР. Психолог предполагает, что агрессивность человека пропорциональна ситуативной тревожности. Для подтверждения этого предположения в группе из 12 человек были проведены тесты, измеряющие ситуативную тревожность Х и агрессивность Y. Результаты тестирования приведены в таблице. Испы1 2 3 4 5 6 7 8 9 10 11 12 туемый X 12 15 17 19 20 22 25 27 28 30 33 33 Y 34 42 45 49 53 55 61 68 67 71 75 74 Введем вторую и третью строки этой таблицы в ячейки А1-M2 электронной книги Excel. Просмотрим предварительно, как лежат точки на графике и ложатся ли они на линию. Для этого строим график. Вызвав мастер диаграмм (Вставка/Диаграмма) и выбрав тип диаграммы «Точечная» нажимаем «Далее» и поместив курсор в поле «Диапазон» обводим курсором данные Y (ячейки В2-М2). Переходим на закладку «Ряд» и в поле «Значения Х» делаем ссылку на ячейки В1-М1, обводя их курсором. Нажимаем «Готово». Как видно из графика, точки хорошо укладываются на прямую линию, поэтому будем находить уравнение линейной регрессии вида y = ax + b . Для нахождения коэффициентов а и b уравнения регрессии служат функции НАКЛОН и ОТРЕЗОК категории «Статистические». Вводим в А5 подпись «а=» а в соседнюю ячейку В5 вводим функцию НАКЛОН. Для этого вызываем мастер функций fx , выбираем категорию «Статистические», функцию «НАКЛОН», ставим курсор в поле «Изв_знач_у» задаем ссылку на ячейки В2-М2, обводя их мышью. Аналогично в поле «Изв_знач_х» даем ссылку на В1-М1. Результат 1,923921. Найдем теперь коэффициент b. Вводим в А6 подпись «b=», а в В6 функцию ОТРЕЗОК с теми же параметрами, что и у функции НАКЛОН. Результат 12,78151. Следовательно, уравнение линейной регрессии есть y = 1,92 x + 12,78 . Построим график уравнения регрессии. Для этого в третью строчку таблицы введем значения функции регрессии в заданных точках Х (первая строка) - y ( x i ) . Для получения этих значений используется функция ТЕНДЕНЦИЯ категории «Статистические». Вводим в А3 подпись «Y(X)» и, поместив курсор в В3, вызываем мастер функций fx а в ней - функцию ТЕНДЕНЦИЯ. В полях «Изв_знач_у» и «Изв_знач_х» даем ссылку на В2-М2 и В1-М1. В поле «Нов_знач_х» 28 PDF created with pdfFactory Pro trial version www.pdffactory.com вводим также ссылку на В1-М1. В поле «Константа» вводят 1, если уравнение регрессии имеет вид y = ax + b , и 0, если y = ax . В нашем случае вводим единицу. Функция ТЕНДЕНЦИЯ является массивом, поэтому для вывода всех ее значений выделяем область В3-М3 и нажимаем F2 и Ctrl+Shift+Enter. Результат – значения уравнения регрессии в заданных точках. Строим график. Ставим курсор в любую свободную клетку, вызываем мастер диаграмм, выбираем категорию «Точечная», вид графика – линия без точек (в нижнем правом углу), нажимаем «Далее», в поле «Диапазон» вводим ссылку на В3-М3. Переходим на закладку «Ряд» и в поле «Значения Х» вводим ссылку на В1М1, нажимаем «Готово». Результат – прямая линия регрессии. Посмотрим, как различаются графики опытных данных и уравнения регрессии. Для этого ставим курсор в любую свободную ячейку, вызываем мастер диаграмм, категория «График», вид графика – ломаная линия с точками (вторая сверху левая), нажимаем «Далее», в поле «Диапазон» вводим ссылку на вторую и третью строки В2-М3. Переходим на закладку «Ряд» и в поле «Подписи оси Х» вводим ссылку на В1М1, нажимаем «Готово». Результат – две линии (Синяя – исходные данные, красная – уравнение регрессии). Видно, что линии мало различаются между собой. Для вычисления коэффициента корреляции Пирсона rxy служит функция ПИРСОН. Размещаем графики так, чтобы они располагались выше 25 строки, и в А25 делаем подпись «Корреляция», в В25 вызываем функцию мастер функций и в категории «Статистические» функцию ПИРСОН, в полях которой «Массив 1» и «Массив 2» вводим ссылки на исходные данные В1-М1 и В2-М2. Результат 0,993821. Видно, что коэффициент корреляции близок к единице, что говорит об очень сильной связи между факторами. 29 PDF created with pdfFactory Pro trial version www.pdffactory.com ЗАДАНИЯ НА КОНТРОЛЬНУЮ РАБОТУ для студентов специальности «Психология» заочной формы обучения В данном разделе приведены задания для самостоятельного выполнения студентами-заочниками. Формулировка заданий для всех вариантов одинаковая, различаются исходные данные, которые выбираются каждым студентом индивидуально для своего варианта. Вариант задания определяется по номеру зачетной книжки (до дроби, обозначающей год поступления). Определите две последние цифры числа, которое составляют номер вашей зачетной книжки. По этим цифрам NN выберите из таблицы Ваш вариант: NN Вар. NN Вар. NN Вар. NN Вар. NN Вар. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 21 22 23 24 25 26 27 28 29 30 1 2 3 4 5 6 7 8 9 10 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 00 21 22 23 24 25 26 27 28 29 30 1 2 3 4 5 6 7 8 9 10 30 PDF created with pdfFactory Pro trial version www.pdffactory.com Задание № 1 Были измерены показатели уровня тревожности в группе из 30 человек. По выборке построить статистический ряд, полигон, гистограмму и кумулятивную кривую. Вычислить основные числовые характеристики: выборочное среднее, выборочную дисперсию, среднеквадратическое отклонение, медиану и моду. Вариант Выборка 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 18 14 22 24 37 27 46 45 72 75 52 41 44 34 59 63 18 14 65 65 68 70 5 9 15 15 18 20 19 19 23 21 32 32 43 46 74 70 51 54 44 38 60 59 19 19 72 70 63 69 21 13 22 20 13 19 21 16 23 17 29 38 36 47 69 75 46 60 46 42 65 57 21 16 69 66 72 78 16 18 19 16 22 28 18 14 22 19 32 38 44 44 71 71 43 52 45 44 50 65 18 14 68 75 62 73 24 15 18 25 12 23 16 14 21 27 28 32 39 48 73 69 50 52 49 42 55 56 16 14 62 66 58 64 21 15 12 16 8 14 19 22 20 26 32 29 47 46 68 72 50 59 44 35 64 66 19 22 71 74 77 71 20 31 21 24 27 21 18 14 21 25 33 30 41 48 73 69 53 49 47 43 66 59 18 14 74 75 67 69 18 19 24 25 17 19 16 21 18 21 35 39 47 46 77 78 57 51 47 45 63 59 16 21 74 84 67 73 26 14 24 34 17 23 17 18 16 26 30 39 41 51 76 72 48 50 36 39 55 60 17 18 70 87 71 71 25 7 20 37 21 21 18 16 22 19 36 31 50 41 77 67 55 47 37 33 62 61 18 16 67 71 72 71 23 8 17 21 22 21 15 12 18 24 32 30 50 47 76 72 56 49 35 39 60 65 15 12 76 69 75 68 15 18 26 19 25 18 22 19 25 20 28 31 49 51 76 81 45 57 40 45 58 59 22 19 73 67 73 65 25 20 23 17 23 15 18 18 13 18 34 39 41 52 76 75 55 54 35 47 67 50 18 18 79 67 70 66 23 21 29 17 20 16 17 18 23 23 32 29 40 40 64 72 51 54 39 41 58 64 17 18 77 75 66 69 20 21 27 25 16 19 22 15 17 18 32 33 50 47 65 69 55 42 41 45 65 63 22 15 70 60 73 74 17 21 20 10 23 24 31 PDF created with pdfFactory Pro trial version www.pdffactory.com Вариант 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. Выборка 35 39 45 45 48 50 65 69 75 75 78 80 70 56 39 42 15 19 25 25 59 63 40 39 54 46 72 75 46 49 28 30 51 43 52 50 43 49 81 73 82 80 73 79 59 62 41 45 31 23 32 30 60 59 41 41 59 47 74 70 44 44 23 29 46 48 49 46 52 58 76 78 79 76 82 88 57 56 35 39 26 28 29 26 65 57 37 39 55 44 69 75 39 47 32 38 54 45 48 55 42 53 84 75 78 85 72 83 62 57 41 39 34 25 28 35 50 65 37 38 57 52 71 71 46 44 22 33 51 45 42 46 38 44 81 75 72 76 68 74 49 63 42 35 31 25 22 26 55 56 40 44 44 49 73 69 47 44 18 24 50 61 51 54 57 51 80 91 81 84 87 81 63 59 38 41 30 41 31 34 64 66 42 37 42 48 68 72 44 51 37 31 48 49 54 55 47 49 78 79 84 85 77 79 59 55 41 36 28 29 34 35 66 59 39 41 52 56 73 69 44 42 27 29 56 44 54 64 47 53 86 74 84 94 77 83 60 58 41 36 36 24 34 44 63 59 43 42 55 40 77 78 46 39 27 33 55 37 50 67 51 51 85 67 80 97 81 81 57 62 36 39 35 17 30 47 55 60 38 45 49 52 76 72 41 45 31 31 53 38 47 51 52 51 83 68 77 81 82 81 66 61 45 41 33 18 27 31 62 61 41 40 53 46 77 67 45 49 32 31 45 48 56 49 55 48 75 78 86 79 85 78 64 60 40 43 25 28 36 29 60 65 45 43 51 46 76 72 40 44 35 28 55 50 53 47 53 45 85 80 83 77 83 75 57 59 39 40 35 30 33 27 58 59 44 35 50 45 76 81 40 43 33 25 53 51 59 47 50 46 83 81 89 77 80 76 59 59 41 41 33 31 39 27 67 50 48 44 61 52 76 75 41 37 30 26 50 51 57 55 46 49 80 81 87 85 76 79 58 61 41 38 30 31 37 35 58 64 43 44 59 59 64 72 40 45 26 29 47 51 50 40 53 54 77 81 80 70 83 84 59 63 40 44 27 31 30 20 65 63 28 44 53 57 65 69 44 46 33 34 32 PDF created with pdfFactory Pro trial version www.pdffactory.com Задание № 2 Психолог разработал методику, позволяющую, по его мнению, увеличить скорость чтения у старшеклассников. Для проверки этого предположения были измерены скорости чтения у 14 старшеклассников до х и после у проведения методики. Можно ли с доверительной вероятностью p=0,95 говорить о том, что методика действительно приводит к увеличению скорости чтения, используя критерий знаков. Вариант 1. x y 2. x y 3. x y 4. x y 5. x y 6. x y 7. x y 8. x y 9. x y 10. x y 11. x y 12. x y 13. x y 14. x y 21 27 28 31 26 35 42 50 42 35 59 52 46 47 52 44 74 66 21 29 34 38 43 49 65 66 25 16 32 26 28 32 34 31 32 39 32 36 63 71 51 54 51 47 44 53 20 21 36 35 46 58 59 61 23 23 26 35 29 32 28 40 46 52 46 39 54 54 48 45 48 57 46 61 20 21 33 28 44 37 60 67 20 23 34 32 27 29 33 29 39 49 39 39 61 53 45 46 52 54 68 40 17 25 38 29 45 47 57 63 20 29 25 34 28 30 33 40 39 52 39 41 57 45 53 55 54 39 55 59 21 16 37 41 43 40 61 71 23 25 Выборка 33 31 32 33 32 19 27 29 29 31 30 30 26 21 23 31 29 31 37 35 38 49 45 37 37 35 38 48 33 41 52 54 61 59 48 58 51 46 53 51 46 56 50 51 51 65 46 51 41 57 72 37 54 32 22 23 19 23 22 27 36 40 34 41 46 36 46 47 41 36 39 32 66 64 66 66 67 70 17 20 22 21 24 24 28 25 30 29 31 36 35 49 35 35 63 71 48 53 52 58 42 41 25 31 34 29 48 48 62 62 22 17 33 31 30 29 23 33 42 40 42 38 61 61 53 51 52 46 47 69 21 27 37 35 45 46 62 57 19 18 28 25 29 30 27 35 39 45 39 43 56 59 49 49 53 62 60 42 20 22 35 43 49 55 67 67 23 16 34 30 28 30 24 37 40 39 40 36 55 65 58 50 56 52 43 66 17 32 36 33 44 45 63 67 19 20 27 30 29 30 24 36 38 44 38 36 55 74 56 56 51 65 49 43 21 27 38 37 47 37 66 61 19 23 26 28 29 31 29 36 47 24 47 39 55 63 49 56 50 47 47 60 22 22 35 40 48 49 59 60 26 20 33 PDF created with pdfFactory Pro trial version www.pdffactory.com Вариант 15. x y 16. x y 17. x y 18. x y 19. x y 20. x y 21. x y 22. x y 23. x y 24. x y 25. x y 26. x y 27. x y 28. x y 29. x y 30. x y 67 67 31 30 54 60 22 23 46 43 71 83 55 65 71 74 39 64 14 23 53 60 56 66 77 92 73 64 93 90 44 60 69 65 19 28 52 59 20 25 40 61 73 78 45 53 67 87 43 48 18 29 51 65 46 55 89 97 43 53 75 95 39 52 62 71 31 36 55 56 17 27 47 48 73 83 48 49 74 85 46 55 14 26 54 57 51 52 94 86 46 61 77 92 57 56 64 61 23 22 58 63 23 27 42 37 73 72 56 49 75 73 42 47 16 27 54 57 38 65 87 99 68 40 86 89 58 58 70 55 27 27 57 50 19 26 45 42 70 69 39 61 80 79 44 42 21 31 55 58 55 48 85 99 56 59 86 84 58 54 Выборка 59 66 64 67 67 66 24 20 22 28 22 29 58 51 55 66 69 69 16 19 24 32 24 27 48 46 39 39 46 61 70 77 73 67 89 86 37 50 33 53 53 44 81 73 68 66 75 85 44 43 38 44 51 44 22 17 25 28 21 30 54 54 54 67 52 61 37 48 62 67 59 46 83 81 86 90 93 92 41 57 72 37 54 32 87 69 88 91 91 93 49 47 45 45 55 54 67 61 31 32 57 61 23 27 49 45 75 83 37 42 66 90 45 44 20 25 58 58 55 55 76 86 42 41 91 88 47 62 64 67 28 29 53 62 19 30 45 44 70 67 56 44 70 79 47 45 19 21 55 47 40 55 84 99 47 69 90 85 57 44 69 66 25 29 54 64 22 33 43 50 72 69 34 51 68 79 49 50 22 31 55 55 53 52 89 92 60 42 79 95 62 53 66 65 28 27 52 60 22 18 43 63 78 84 45 42 67 84 44 44 24 25 54 60 65 53 96 86 43 66 98 86 54 62 69 72 26 31 51 58 21 31 48 55 74 72 39 44 64 59 40 29 24 24 59 56 56 60 86 88 49 43 90 83 47 52 67 64 27 25 53 63 20 30 46 64 66 70 39 61 73 64 41 58 20 27 57 53 46 58 85 93 47 60 91 98 59 55 34 PDF created with pdfFactory Pro trial version www.pdffactory.com Задание № 3 Психолог выдвинул предположение, что у группы незнакомых девушек старших классов средней школы чувство эмпатии сильнее, чем у их сверстников – юношей. Для проверки этого предположения были отобраны и протестированы две группы школьников: 14 девушек и 12 юношей. Можно ли по опытным данным с доверительной вероятностью 0,95 говорить о том, что показатели эмпатичности у юношей и девушек различны? а) Использовать параметрический критерий Стьюдента. б) Использовать ранговый критерий Вилкоксона. Эмпатичность у женщин (одинаково для всех вариантов) 23 25 23 22 23 24 28 16 18 23 29 26 31 Вариант Эмпатичность у мужчин (по вариантам) 1. 15 13 14 17 15 12 8 22 17 9 19 2. 22 21 15 17 19 18 14 19 20 10 13 3. 11 12 11 21 11 0 32 19 11 24 17 4. 23 21 17 15 12 16 19 22 20 21 15 5. 24 16 6 26 22 20 16 22 23 24 20 6. 24 14 24 14 15 19 18 21 9 20 7 7. 19 7 19 7 20 25 23 37 22 23 23 8. 10 13 15 20 14 22 30 16 10 20 11 9. 12 24 14 11 6 15 25 13 26 19 11 10. 23 17 21 12 20 21 9 22 9 24 14 11. 15 17 29 21 26 16 16 32 15 5 8 12. 18 16 13 12 23 15 16 24 12 20 12 13. 18 23 8 18 29 24 18 18 17 6 10 14. 13 26 16 20 24 11 25 13 15 25 17 15. 13 18 11 28 19 12 19 14 18 19 19 16. 7 23 18 19 14 20 18 15 23 10 26 17. 13 3 18 14 11 30 9 16 20 29 24 18. 22 26 14 17 16 13 14 8 16 19 27 19. 28 10 8 13 17 27 10 17 14 15 11 20. 18 13 25 16 29 18 21 21 16 12 26 21. 11 22 11 15 9 16 18 28 10 29 11 22. 21 24 11 16 15 18 25 17 25 16 20 23. 16 18 18 7 9 15 15 23 15 6 10 24. 32 20 13 19 20 20 25 20 11 17 16 25. 33 21 16 10 22 18 18 19 19 14 19 19 20 21 12 18 20 17 10 19 12 11 19 23 17 15 6 9 14 22 26 20 4 7 19 10 15 35 PDF created with pdfFactory Pro trial version www.pdffactory.com Вариант 26. 27. 28. 29. 30. 15 28 15 22 15 14 14 8 25 19 Эмпатичность у мужчин (по вариантам) 17 17 22 20 20 21 5 31 9 27 14 20 14 15 17 29 18 20 20 26 12 16 19 27 24 16 25 18 18 17 22 22 19 14 12 32 18 12 24 19 11 27 14 11 5 19 13 18 28 18 Задание № 4 Изучается зависимость между показателями вербального и невербального интеллекта у студентов - гуманитариев. Для решения задачи были протестированы интеллектуальные способности 10 студентов. Усредненные значения вербального интеллекта (в баллах) хi и невербального (в баллах) yi приведены в таблице. Необходимо: 1) По выборкам данных найти уравнение линейной регрессии y = ax + b . 2) Построить график, нанеся на него опытные данные и линию регрессию. 3) Найти коэффициент парной корреляции Пирсона, проверить его значимость при уровне значимости p = 0,9 . 4) Найти коэффициент ранговой корреляции Спирмена. Вариант 37 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 79 52 107 136 98 52 37 125 46 107 Значения фактора хi (одинаковое для всех вариантов) 48 39 19 28 33 24 43 41 Значения фактора yi (по вариантам) 86 84 39 59 85 71 86 94 76 59 46 53 48 53 58 70 141 122 50 101 106 72 130 136 173 130 59 109 105 97 140 150 151 110 51 88 113 80 127 124 69 61 30 24 35 44 49 47 53 48 40 22 36 21 56 47 158 124 77 86 108 75 150 146 42 50 14 35 50 21 36 33 152 118 64 76 115 80 145 120 32 74 56 111 108 107 40 46 120 45 102 36 PDF created with pdfFactory Pro trial version www.pdffactory.com Вар. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 112 74 113 87 96 74 37 118 107 71 108 31 46 87 128 62 129 108 39 65 158 101 157 126 115 76 47 157 121 98 120 34 38 99 158 62 146 150 58 106 Значения фактора yi (по вариантам) 106 75 87 106 84 128 78 57 57 79 54 109 140 71 85 100 85 139 104 42 70 76 67 113 94 54 70 61 72 88 79 52 62 62 57 90 55 38 34 54 31 42 141 81 103 98 93 137 106 75 68 89 68 116 74 51 57 76 39 88 112 49 87 103 78 114 42 12 10 20 32 29 27 14 27 28 38 30 89 53 60 85 61 83 123 67 82 124 70 128 57 50 56 45 34 70 134 69 78 117 94 122 115 74 106 93 79 135 50 14 33 29 24 34 84 54 60 66 67 93 124 103 122 115 106 79 34 127 109 88 128 38 36 88 144 64 138 137 32 88 109 61 95 71 88 67 34 97 88 63 94 21 46 58 91 65 113 90 45 60 Задание № 5 Исследуется зависимость между двумя показателями: возбудимость Х и агрессивность Y. Были разработаны тесты, позволяющие выявить уровень возбудимости: В1- слабая возбудимость, В2 – средняя возбудимость, В3 – высокая возбудимость; и уровни агрессивности: А1 – слабая агрессивность, А2 – средняя агрессивность, А3 – высокая агрессивность. Результаты исследования (количество тестируемых, соответствующих каждым уровням возбудимости и агрессивности) приведены в таблице. Проверить на уровне значимости р=0,95 гипотезу о том, что уровень агрессивности не зависит от уровня возбудимости. Вариант 1 А1 А2 А3 В1 75 69 63 В2 54 44 50 В3 44 58 69 Вариант 2 А1 А2 А3 19 10 89 18 10 23 46 93 41 Вариант 3 А1 А2 А3 63 85 19 45 62 55 60 57 25 Вариант 4 А1 А2 А3 60 74 58 58 62 91 49 80 73 37 PDF created with pdfFactory Pro trial version www.pdffactory.com В1 В2 В3 В1 В2 В3 В1 В2 В3 В1 В2 В3 В1 В2 В3 В1 В2 В3 В1 В2 В3 Вариант 5 А1 А2 А3 34 6 4 16 43 33 16 8 28 Вариант 9 А1 А2 А3 55 52 16 11 22 52 12 14 44 Вариант 13 А1 А2 А3 27 2 29 5 11 17 28 12 21 Вариант 17 А1 А2 А3 37 9 7 12 49 39 18 10 32 Вариант 21 А1 А2 А3 53 55 9 16 8 53 3 9 48 Вариант 25 А1 А2 А3 24 6 24 9 18 15 20 17 24 Вариант 29 А1 А2 А3 33 16 14 16 12 17 21 13 14 Вариант 6 А1 А2 А3 21 37 16 24 42 7 8 44 40 Вариант 10 А1 А2 А3 1 11 49 43 21 32 14 23 48 Вариант 14 А1 А2 А3 8 18 1 16 21 19 12 14 18 Вариант 18 А1 А2 А3 18 32 11 22 37 7 2 40 30 Вариант 22 А1 А2 А3 5 17 45 44 28 37 17 23 44 Вариант 26 А1 А2 А3 9 14 6 13 26 14 16 18 16 Вариант 30 А1 А2 А3 5 24 16 19 16 17 13 14 19 Вариант 7 А1 А2 А3 31 6 34 4 12 25 33 46 25 Вариант 11 А1 А2 А3 9 4 19 25 35 49 9 33 18 Вариант 15 А1 А2 А3 7 26 16 1 25 5 3 21 22 Вариант 19 А1 А2 А3 38 9 36 8 19 29 37 45 29 Вариант 23 А1 А2 А3 7 9 14 29 32 45 11 37 12 Вариант 27 А1 А2 А3 8 25 13 6 24 7 12 24 26 Вариант 8 А1 А2 А3 26 1 38 35 6 20 31 44 28 Вариант 12 А1 А2 А3 54 14 4 45 14 32 22 33 6 Вариант 16 А1 А2 А3 1 29 9 20 9 12 3 30 7 Вариант 20 А1 А2 А3 28 3 33 32 7 23 38 48 26 Вариант 24 А1 А2 А3 57 12 7 44 16 35 27 35 8 Вариант 28 А1 А2 А3 6 28 5 21 10 17 6 37 9 38 PDF created with pdfFactory Pro trial version www.pdffactory.com ЛИТЕРАТУРА 1. Абдулгалимов А.М. Статистическое прогнозирование социально-экономических процессов. - Махачкала: Даг. кн. изд-во, 1998. 2. Айвазян C.А., Енюков И.C., Мешалкин Л.Д. Прикладная статистика. Исследование зависимостей. М.: Финансы и статистика, 1985. 3. Бирхгофф Г. Математика и психология. М., Сов. радио, 1977. 4. Бочаров П.П., Печенкин А.В. Теория вероятностей и математическая статистика. - М.: Гардарика, 1998. 5. Вентцель Е.С. Теория вероятностей: Учеб. для вузов.- М.: Высш. шк., 1999. 6. Гласс Дж., Стенли Дж. Статистические методы в психологии / пер. с англ. Под общ. Ред. Ю.П. Адлера. М.: Прогресс, 1976. 7. Гмурман В.Е. Теория вероятностей и математическая статистика. – Изд-во «Высшая школа», 1998. 8. Захаров В. П. применение математических методов в социально-психологических исследованиях. Л.: ЛГУ, 1985. 9. Калинина В.Н., Панкин В.Ф. Математическая статистика. – М.: Высш. шк., 1998. 10. Ковалев В.А., Калинина В.Н. Теория вероятностей и математическая статистика. - М.: ИНФРА-М, 1999 11. Сидоренко Е.В. Методы математической обработки в психологии.- СПб.: ООО «Речь», 2002. 12. Справочник по прикладной статистике. М.: Финансы и статистика, 1990. 13. Суходольский Г.В. Основы математической статистики для психологов. Л. ЛГУ, 1972. 14. Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютерах/Под ред. В.Э. Фигурнова. - М.: ИНФРА-М, 1998. 15. Урбах В.Ю. Статистический анализ в биологических и медицинских исследованиях. М.: Медицина, 1975. 39 PDF created with pdfFactory Pro trial version www.pdffactory.com ПРИЛОЖЕНИЕ Статистические таблицы Таблица 1 Обратное распределение Стьюдента t p (n) p n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 27 30 40 60 120 ∞ 0,8 0,9 0,925 0,95 0,975 0,99 0,995 0,999 1,376 1,061 0,978 0,941 0,920 0,906 0,896 0,889 0,883 0,879 0,876 0,873 0,870 0,868 0,866 0,865 0,863 0,862 0,861 0,860 0,859 0,858 0,858 0,857 0,856 0,855 0,854 0,851 0,848 0,845 0,842 3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,314 1,310 1,303 1,296 1,289 1,282 4,165 2,282 1,924 1,778 1,699 1,650 1,617 1,592 1,574 1,559 1,548 1,538 1,530 1,523 1,517 1,512 1,508 1,504 1,500 1,497 1,494 1,492 1,489 1,487 1,485 1,482 1,477 1,468 1,458 1,449 1,440 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,703 1,697 1,684 1,671 1,658 1,645 12,71 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,052 2,042 2,021 2,000 1,980 1,960 31,82 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,473 2,457 2,423 2,390 2,358 2,326 63,66 318,29 9,925 22,328 5,841 10,214 4,604 7,173 4,032 5,894 3,707 5,208 3,499 4,785 3,355 4,501 3,250 4,297 3,169 4,144 3,106 4,025 3,055 3,930 3,012 3,852 2,977 3,787 2,947 3,733 2,921 3,686 2,898 3,646 2,878 3,610 2,861 3,579 2,845 3,552 2,831 3,527 2,819 3,505 2,807 3,485 2,797 3,467 2,787 3,450 2,771 3,421 2,750 3,385 2,704 3,307 2,660 3,232 2,617 3,160 2,576 3,090 40 PDF created with pdfFactory Pro trial version www.pdffactory.com Таблица 2 Обратное распределение Фишера F0 ,95 ( k 1 , k 2 ) на уровне значимости α = 0,05 k1 k2 1 2 3 4 5 6 7 8 9 10 12 15 1 161,5 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,9 2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 15 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 1,83 1,75 41 PDF created with pdfFactory Pro trial version www.pdffactory.com Таблица 3 Обратное распределение хи-квадрат χ p n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 27 30 40 50 75 100 200 0,7 0,8 0,9 1,074 2,408 3,665 4,878 6,064 7,231 8,383 9,524 10,66 11,78 12,90 14,01 15,12 16,22 17,32 18,42 19,51 20,60 21,69 22,77 23,86 24,94 26,02 27,10 28,17 30,32 33,53 44,16 54,72 80,91 106,9 210,0 1,642 3,219 4,642 5,989 7,289 8,558 9,803 11,03 12,24 13,44 14,63 15,81 16,98 18,15 19,31 20,47 21,61 22,76 23,90 25,04 26,17 27,30 28,43 29,55 30,68 32,91 36,25 47,27 58,16 85,07 111,7 216,6 2,706 4,605 6,251 7,779 9,236 10,64 12,02 13,36 14,68 15,99 17,28 18,55 19,81 21,06 22,31 23,54 24,77 25,99 27,20 28,41 29,62 30,81 32,01 33,20 34,38 36,74 40,26 51,81 63,17 91,06 118,5 226,0 2 p (n ) 0,925 0,95 0,975 0,99 0,995 0,999 3,170 5,181 6,905 8,496 10,01 11,47 12,88 14,27 15,63 16,97 18,29 19,60 20,90 22,18 23,45 24,72 25,97 27,22 28,46 29,69 30,92 32,14 33,36 34,57 35,78 38,18 41,76 53,50 65,03 93,28 121,0 229,5 3,841 5,991 7,815 9,488 11,07 12,59 14,07 15,51 16,92 18,31 19,68 21,03 22,36 23,68 25,00 26,30 27,59 28,87 30,14 31,41 32,67 33,92 35,17 36,42 37,65 40,11 43,77 55,76 67,50 96,22 124,3 234,0 5,024 7,378 9,348 11,14 12,83 14,45 16,01 17,53 19,02 20,48 21,92 23,34 24,74 26,12 27,49 28,85 30,19 31,53 32,85 34,17 35,48 36,78 38,08 39,36 40,65 43,19 46,98 59,34 71,42 100,8 129,6 241,1 6,635 9,210 11,35 13,28 15,09 16,81 18,48 20,09 21,67 23,21 24,73 26,22 27,69 29,14 30,58 32,00 33,41 34,81 36,19 37,57 38,93 40,29 41,64 42,98 44,31 46,96 50,89 63,69 76,15 106,4 135,8 249,4 7,879 10,60 12,84 14,86 16,75 18,55 20,28 21,95 23,59 25,19 26,76 28,30 29,82 31,32 32,80 34,27 35,72 37,16 38,58 40,00 41,40 42,80 44,18 45,56 46,93 49,65 53,67 66,77 79,49 110,3 140,2 255,3 10,83 13,82 16,27 18,47 20,51 22,46 24,32 26,12 27,88 29,59 31,26 32,91 34,53 36,12 37,70 39,25 40,79 42,31 43,82 45,31 46,80 48,27 49,73 51,18 52,62 55,48 59,70 73,40 86,66 118,6 149,4 267,5 42 PDF created with pdfFactory Pro trial version www.pdffactory.com Таблица 4. Критические значения распределения Вилкоксона Wkr при α = 0,05 , n – объем большей выборки, m - меньшей n m 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0 0 0 1 1 1 1 2 2 3 3 3 3 4 4 4 0 0 1 2 2 3 4 4 5 5 6 7 7 8 9 9 10 11 1 2 3 4 5 6 7 8 9 10 11 12 14 15 16 17 18 4 5 6 8 9 11 12 13 15 16 18 19 20 22 23 25 7 8 10 12 14 16 17 19 21 23 25 26 28 30 32 11 13 15 17 19 21 24 26 28 30 33 35 37 39 15 18 20 23 26 28 31 33 36 39 41 44 47 21 24 27 30 33 36 39 42 45 48 51 54 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 n m 4 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 19 20 21 22 23. 24 25 26 27 28 29 30 31 32 33 35 36 37 38 39 5 6 7 8 26 28 29 31 32 33 35 36 38 39 41 42 43 45 46 48 49 51 52 53 34 36 37 39 41 43 45 47 48 50 52 54 56 58 59 61 63 65 67 69 41 44 46 48 50 53 55 57 59 62 64 66 68 71 73 75 77 79 82 84 49 52 55 57 60 62 65 68 70 73 76 78 81 84 86 89 92 94 97 100 27 31 34 37 41 44 48 51 55 58 62 34 38 42 46 50 54 57 61 65 69 42 47 51 55 60 64 68 72 77 51 56 61 65 70 75 80 84 61 66 71 77 82 87 92 72 77 83 88 94 100 83 89 96 95 102 109 101 109 116 123 107 115 123 130 138 9 10 11 12 13 14 15 16 17 18 19 20 21 57 60 63 66 69 72 75 79 82 85 88 91 94 97 100 103 106 109 112 115 65 73 69 77 72 81 75 85 79 89 82 93 86 96 89 100 93 104 96 108 100 112 103 .116 107 120 110 124 114 128 117 132 121 135 124 139 128 143 131 147 81 85 90 94 98 103 107 111 116 120 124 129 133 137 142 146 150 155 159 163 89 94 99 103 108 113 118 122 127 132 137 141 146 151 156 160 165 170 175 179 97 102 107 113 118 123 128 133 139 144 149 154 159 164 170 175 180 185 190 196 105 111 116 122 128 133 139 144 150 156 161 167 173 178 184 189 195 201 206 212 113 119 125 131 137 143 150 156 162 168 174 180 186 192 198 204 210 216 222 228 121 128 134 141 147 154 160 167 173 180 186 193 199 206 212 219 225 232 238 245 130 136 143 150 157 164 171 178 185 192 199 206 213 219 226 233 240 247 254 261 138 145 152 160 167 174 182 189 196 204 211 219 226 233 241 248 255 263 270 278 146 154 161 169 177 185 193 200 208 216 224 232 239 247 255 263 271 278 286 294 154 162 170 179 187 195 203 212 220 228 236 245 253 261 269 278 286 294 302 311 43 PDF created with pdfFactory Pro trial version www.pdffactory.com Продолжение табл. 4 n m 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 n 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 171 180 188 197 206 214 223 232 240 249 258 266 275 284 292 301 310 318 327 189 198 207 216 225 234 243 252 261 271 280 289 298 307 316 325 335 344 207 217 226 236 245 255 265 274 284 293 303 312 322 332 341 351 360 227 237 247 257 267 277 287 297 307 317 327 337 347 357 367 377 247 258 268 278 289 299 310 320 331 341 352 362 373 383 394 268 279 291 290 302 301 313 312 325 323 336 334 347 345 359 356 370 367 381 378 393 388 404 399 416 410 427 m 4 5 6 7 8 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 57 58 59 60 55 56 58 59 61 62 64 65 66 68 69 71 72 74 75 76 78 79 81 87 70 72 74 76 78 80 81 83 85 87 89 91 92 94 96 98 100 102 103 105 86 88 91 93 95 97 100 102 104 106 109 111 113 115 118 120 122 124 127 129 102 105 107 110 113 115 118 121 123 126 129 131 134 137 139 142 145 147 150 153 314 326 337 349 361 373 385 396 408 420 432 444 338 350 362 374 387 399 411 424 436 448 460 363 375 388 401 413 426 439 452 464 477 389 402 415 415 429 428 442 441 456 454 470 467 483 481 497 494 511 443 457 471 485 499 513 527 471 486 501 515 530 544 501 516 531 546 561 531 547 563 562 579 595 578 594 611 628 9 10 11 12 13 14 15 16 17 18 19 20 21 118 121 124 128 131 134 137 140 143 146 149 152 155 158 161 164 167 171 174 177 135 138 142 145 149 152 156 159 163 166 170 173 177 180 184 187 191 194 198 201 151 155 159 163 167 171 175 178 182 186 190 194 198 202 206 210 214 218 222 225 168 172 176 181 185 189 194 198 202 207 211 215 220 224 228 233 237 241 246 250 184 189 194 199 203 208 213 218 222 227 232 237 241 246 251 256 261 265 270 275 201 206 211 216 222 227 232 237 243 248 253 258 263 269 274 279 284 289 295 300 218 223 229 235 240 246 251 257 263 268 274 280 285 291 297 302 308 314 319 325 234 240 247 253 259 265 271 277 283 289 295 301 307 313 319 326 332 338 344 350 251 258 264 271 277 284 290 297 303 310 316 323 329 336 342 349 355 362 369 375 268 275 282 289 296 303 310 317 324 331 338 345 352 359 365 372 379 386 393 400 285 292 300 307 315 322 329 337 344 352 359 366 374 381 389 396 403 411 418 426 302 310 318 325 333 341 349 357 365 372 380 388 396 404 412 420 427 435 443 451 319 327 335 344 352 360 369 377 385 393 402 410 418 427 435 443 451 460 468 476 44 PDF created with pdfFactory Pro trial version www.pdffactory.com Продолжение табл. 4 n m 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 n 336 345 353 362 371 380 388 397 406 414 423 432 441 449 458 467 476 484 493 502 353 362 371 380 390 399 408 417 426 435 445 454 463 472 481 491 500 509 518 527 370 380 389 399 408 418 428 437 447 457 466 476 485 495 505 514 524 534 543 553 387 397 407 417 427 437 447 458 469 478 488 408 508 518 528 538 548 558 568 578 404 415 425 436 446 457 467 478 488 499 509 520 530 541 551 562 572 583 594 604 421 432 443 454 465 476 487 498 509 520 531 542 553 564 575 586 597 608 619 630 438 450 461 473 484 495 507 518 530 541 553 564 575 587 598 610 621 633 644 655 456 467 479 491 503 515 527 539 550 562 574 586 598 610 622 634 645 657 669 681 473 485 497 510 522 534 547 559 571 583 596 608 620 633 645 657 670 682 694 707 490 503 515 528 541 554 566 579 592 605 618 630 643 656 669 681 694 707 720 733 507 520 533 547 560 573 586 600 613 626 639 652 666 679 692 705 719 732 745 758 524 538 552 565 579 593 606 620 634 647 661 675 688 702 716 729 743 757 770 784 541 556 570 584 598 612 626 640 654 669 683 697 711 725 739 753 768 782 796 810 559 573 588 602 617 631 646 661 675 690 704 719 734 748 763 777 792 807 821 836 576 591 606 621 636 651 666 681 696 711 726 741 756 771 786 801 816 832 847 862 593 609 624 640 655 670 686 701 717 732 748 763 779 794 810 825 841 856 872 888 610 626 642 658 674 690 706 722 738 754 770 786 802 818 834 850 865 881 897 913 628 644 660 677 693 709 726 742 759 775 791 808 824 841 857 874 890 906 923 939 645 662 679 695 712 729 746 763 780 796 813 830 847 864 881 898 915 931 948 965 m 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 662 679 697 697 715 733 714 733 751 770 731 750 769 789 808 749 768 788 807 827 846 766 786 806 826 846 866 886 783 804 824 845 865 886 906 927 800 821 842 863 884 905 926 947 968 818 839 861 882 903 925 946 968 989 1010 835 857 879 901 922 944 966 988 101010321054 852 875 897 919 942 964 986 10091031105310761098 870 893 915 938 961 934 1006102710521075 095 11201143 887 910 934 957 980 100310261051107310961119114311661189 901 928 952 975 999 1023104410701091111311411165118912131236 922 946 970 994 101810421067 109 11151139116311871212123412601284 939 964 988 10131037106210871111113611611185121012351259128413091333 956 981 1007103210571082110711321157118212071232125712831308133313581383 974 999 1025105010761101112711521178120412291255128013061331135713831408 991 10171043106910951121114711731199122512511277130313291355138114071433 45 PDF created with pdfFactory Pro trial version www.pdffactory.com СОДЕРЖАНИЕ ВВЕДЕНИЕ ………………………………………………………………..3 1. СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ РЕЗУЛЬТАТОВ НАБЛЮДЕНИЙ ………………………………………4 1.1. Основные сведения и формулы ……………………………..4 1.2. Примеры решения задач …………………………………….6 1.3. Статистические методы обработки данных с использованием ЭВМ ………………………………………...9 2. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ …………………….10 2.1. Основные сведения и формулы …………………………….10 2.1.1. Критерий знаков …………………………………...11 2.1.2. Параметрический критерий Стьюдента ………….12 2.1.3. Ранговый критерий Вилкоксона …………………..13 2.2. Примеры решения задач …………………………………...14 2.3. Проверка статистических гипотез по критерию Стьюдента с использованием ЭВМ ……………………………………...18 3. ВЫЯВЛЕНИЕ ЗАВИСИМОСТЕЙ МЕЖДУ ПОКАЗАТЕЛЯМИ …21 3.1. Основные сведения и формулы ……………………………21 3.1.1. Элементы регрессионного анализа ………………21 3.1.2. Элементы корреляционного анализа ……………..22 3.1.3. Зависимость между показателями, заданными атрибутивно ………………………………………...23 2.2. Примеры решения задач ……………………………………24 2.3. Примеры решения задач на ЭВМ …………………………27 ЗАДАНИЯ НА КОНТРОЛЬНУЮ РАБОТУ ………………………….30 Задание № 1 ……………………………………………………..31 Задание № 2 ……………………………………………………..33 Задание № 3 ……………………………………………………..35 Задание № 4 ……………………………………………………...36 Задание № 5 ……………………………………………………...37 ЛИТЕРАТУРА ………………………………………………………….39 ПРИЛОЖЕНИЕ …………………………………………………………40 46 PDF created with pdfFactory Pro trial version www.pdffactory.com Моисеев Сергей Игоревич МАТЕМАТИЧЕСКИЕ МЕТОДЫ В ПСИХОЛОГИИ Методические указания по изучению дисциплины Лицензия ИД № 00668 от 05.01.2000 г. Компьютерная верстка. Подписано в печать 15.12.2005 г. Формат 60х84/16. Объем 3 п.л. Тираж 100 экз. Отпечатано в типографии ВФ МГЭИ г. Воронеж, Московский проспект, 26 47 PDF created with pdfFactory Pro trial version www.pdffactory.com