СТАТИСТИКА Громова Т.В. ст. преподаватель Кафедра менеджмента ИСГТ 176 - НТБ Тема: Статистическое изучение взаимосвязи социально-экономических явлений • Причинно-следственные отношения – это связь явлений и процессов, при которой изменение одного из них – причины – ведет к изменению другого – следствия. • Признаки по значению для изучения взаимосвязи делятся на два класса. 2 Тема: Статистическое изучение взаимосвязи социально-экономических явлений ПРИЗНАКИ • Признаки, обуславливающие изменения других, связанных с ними признаков, называются факторными (X). • Признаки, изменяющиеся под действием факторных признаков, называются результативными (Y). 3 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Связи между явлениями и их признаками классифицируются по • степени тесноты связи; • направлению; • аналитическому выражению. 4 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Виды и формы связи между явлениями функциональная связь стохастическая связь частный случай – статистическая связь 5 Тема: Статистическое изучение взаимосвязи социально-экономических явлений ФУНКЦИОНАЛЬНАЯ СВЯЗЬ - каждому значению факторного признака соответствует строго определённое одно или несколько значений результативного признака СТАТИСТИЧЕСКАЯ СВЯЗЬ (стохастическая зависимость) - одному и тому же значению факторного признака может соответствовать несколько значений результативного признака. Проявляются только для большого числа единиц совокупности. 6 Тема: Статистическое изучение взаимосвязи социально-экономических явлений • КОРРЕЛЯЦИОННАЯ СВЯЗЬ соответствие одному и тому же значению факторного признака сколько угодно различных значений результативного признака. Связь прослеживается лишь при достаточно большом количестве наблюдений и лишь в форме средней величины. Корреляционная связь отражает зависимость между случайными величинами • РЕГРЕССИОННАЯ СВЯЗЬ отражает зависимость между случайными и неслучайными величинами. 7 Тема: Статистическое изучение взаимосвязи социально-экономических явлений По степени тесноты связи различают количественные критерии оценки тесноты связи: Величина коэффициента корреляции Характер связи До ±0,3 Практически отсутствует ±0,3 - ±0,5 Слабая ±0,5 - ±0,7 Умеренная ±0,7 - ±1,0 Сильная 8 Тема: Статистическое изучение взаимосвязи социально-экономических явлений По направлению связи бывают • прямыми – это когда с увеличением или уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного признака. • обратными– это когда значения результативного признака изменяются в противоположном направлении по сравнению с изменением факторного признака. 9 Тема: Статистическое изучение взаимосвязи социально-экономических явлений По аналитическому выражению связи бывают • Линейными (прямолинейными) – статистическая связь между явлениями приближенно выражена уравнением прямой линии. • Нелинейными (криволинейными)– статистическая связь выражена уравнением какой-либо кривой (параболы, гиперболы). 10 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Основные приемы изучения взаимосвязей Приведения параллельных данных; Балансовый метод; Графический; Аналитических группировок; Дисперсионный и корреляционный; Регрессионный. 11 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Метод приведения параллельных данных • Приводится ряд данных по одному признаку и параллельно с ним по другому признаку, связь с которым предполагается. По вариации признака в первом и втором ряду судят о наличии связи признаков. • Такой метод позволяет вывести только направление связи, но не измерить ее. 12 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Метод приведения параллельных данных Номер студента 1 2 3 4 5 6 7 8 9 Балл в сессию, y 5 3 4 4 3 2 5 4 5 Количество пропущенных занятий, x 1 8 3 5 8 10 2 4 2 X 1 2 2 3 4 5 8 8 10 Y 5 5 5 4 4 4 3 3 2 13 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Балансовый метод состоит в том, что данные взаимосвязанных показателей изображаются в виде таблицы и располагаются таким образом, чтобы итоги между отдельными ее частями были равны, т. е., чтобы был баланс. Балансовый метод используется для характеристики взаимосвязи между производством и распределением продуктов, денежными доходами и расходами населения. 14 Объёмы транспортных потоков между регионами (млн. тонно-км) Регионы отправления Регионы прибытия А Б В Итого отправлено Г А Б 25 100 75 20 80 95 100 30 280 245 В Г 80 70 70 45 30 55 65 35 245 205 275 210 260 230 975 Итого прибыло Тема: Статистическое изучение взаимосвязи социально-экономических явлений Графический метод Положительная корреляция (прямая зависимость) Отрицательная корреляция (обратная зависимость) 16 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Метод аналитических группировок • 1. Группировка единиц совокупности по факторному признаку. • 2. Расчет средней или относительной величины по результативному признаку для каждой группы. • 3.Сопоставление рассчитанных изменений с изменениями факторного признака для выявления характера связи между ними 17 Тема: Статистическое изучение взаимосвязи социально-экономических явлений 1. 2. 3. 4. Дисперсионный анализ Определение вида признакафакторный/результативный Группировка по факторному признаку Расчет среднего значения факторного и результативного признака в группах Выявление взаимосвязи между рассчитанными средними 18 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Анализ включает следующие этапы 1. Определяем, какой признак факторный, какой – результативный. 2. Производим группировку по факторному признаку. 3. Считаем среднее значение факторного и результативного признака в группах. 4. Выясняем взаимосвязь между этими средними. 19 Тема: Статистическое изучение взаимосвязи социально-экономических явлений • Для оценки тесноты связи по результатам факторной группировки используется межгрупповая дисперсия • Для характеристики тесноты корреляционной связи между признаками в аналитических группировках межгрупповую дисперсию сопоставляют с общей. Это сопоставление называется коэффициентом детерминации 20 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Корреляционный метод • Имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи). • Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой. 21 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Корреляционный метод • При корреляционной связи имеет место не изменение функции в зависимости от изменения аргумента, а имеет место вариация результативного признака вокруг его среднего значения в зависимости от изменения факторного признака. Вот почему корреляционная связь является не строгой. • Кроме того, как правило, корреляционные зависимости являются не полными: мы не знаем всех факторов и их воздействия. 22 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Этапы корреляционного анализа 1) предварительный анализ объекта исследования; 2) сбор и первичная обработка информации; 3) построение уравнения регрессии и определение его параметров; 4) проверка адекватности полученной модели. 23 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Регрессионный метод • Заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой или результативным признаком) обусловлено влиянием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения. 24 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Корреляционно-регрессионный анализ КОРРЕЛЯЦИЯ и РЕГРЕССИЯ Тесно связаны между собой: • корреляция оценивает тесноту статистической связи • регрессия исследует ее форму. • Служат для установления соотношения между явлениями, для определения наличия или отсутствия связи. 25 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Корреляционно-регрессионный анализ позволяет решить две задачи: определить форму связи определить тесноту связи 27 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Виды корреляционно-регрессионных связей Прямые/обратные Однофакторные (парная корреляция)/ многофакторные (множественная корреляция) Частичная связь 26 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Виды зависимостей по форме (аналитическая связь) • Линейная регрессия – выражена уравнением прямой y x a0 a1 x • Нелинейная регрессия – выражена уравнением кривых линий 2 y a 0 a1 x a 2 x y a0 a1 x 28 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Метод наименьших квадратов • Нахождение параметров модели ( a 0 , a1 ), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии. 29 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Оценка параметров уравнения регрессии осуществляется на основе метода наименьших квадратов na0 a1 x y 2 a0 x a1 x xy na0 a1 x a2 x 2 y a0 x a1 x 2 a2 x 3 xy a0 x 2 a1 x 3 a2 x 4 yx 2 1 y x 1 1 y a0 a1 2 x x x na0 a1 30 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Параметры уравнения • a 0 - свободный член уравнения, который показывает усредненное влияние на результативный признак неучтенных факторов; • a1 - коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения. 31 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Линейный коэффициент корреляции • Был впервые введен в 90-х годах XIX века. К. Пирсоном, Ф. Эджуортом (Эджвортом), Р. Уелдоном (Велдоном) и характеризует тесноту и направление связи между двумя коррелируемыми признаками в случае наличия между ними линейной зависимости. 32 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Формулы для расчета rxy r n x r xy x y 2 x 2 y n xy x y 2 ( x) n y 2 2 ( y ) 2 y xy x n 2 2 ( x ) ( y ) 2 2 x y n n 29 Оценка линейного коэффициента корреляции Значение линейного коэффициента корреляции r=0 0<r<1 -1 < r < 0 r=1 Характер связи Интерпретация связи Отсутствует Прямая С увеличением x увеличивается y Обратная С увеличением x уменьшается y Функциональная Каждому значению факторного признака строго соответствует одно значение результативного признака. Тема: Статистическое изучение взаимосвязи социально-экономических явлений Шкала Чеддока тесноты связи • • • • • слабая – от 0,1 до 0,3; умеренная – от 0,3 до 0,5; заметная – от 0,5 до 0,7; высокая – от 0,7 до 0,9; весьма высокая (сильная) – от 0,9 до 1,0 35 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Значимость линейного коэффициента корреляции 2 r r tp ( n 2 ) n 2 2 2 1 r 1 r 32 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Множественная корреляция • используется при изучении, измерении связи между результативными признаком, двумя и более факторными 37 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Множественная корреляция определяет форму связи тесноту связи влияние отдельных факторов на общий результат 38 Тема: Статистическое изучение взаимосвязи социально-экономических явлений 1. Определение формы связи • Сводится к нахождению уравнения связи y с факторами x, z ,w,…,v Yxz a0 a1 x a2 z 39 Тема: Статистическое изучение взаимосвязи социально-экономических явлений • Для определения параметров а0, а1 и а2 по способу наименьших квадратов, необходимо решить следующую систему трех нормальных уравнений y na0 a1 x a2 z; 2 yx a0 x a1 x a2 xz; 2 yz a0 z a1 xz a2 z . 40 Тема: Статистическое изучение взаимосвязи социально-экономических явлений 2. Измерение тесноты связи • Производится на основе вариации результативного признака и правила сложения дисперсий: σ общ σ Т σ ост 2 2 41 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Теоретическая дисперсия вариация теоретического признака вокруг общей средней n 2 T (Y i 1 T i y) 2 n 42 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Остаточная дисперсия среднее квадратическое отклонение теоретического признака от фактического y n 2 ост i 1 i Yi n T . 43 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Коэффициент множественной корреляции Ry ; x , z r r 2ryx ryz rxz 2 yx 2 yz 1 r 2 xz , • где rxy, rzy, rxz – парные коэффициенты корреляции 42 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Пределы изменения коэффициента множественной корреляции 0 Ry , x , z 1 45 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Частные коэффициенты корреляции rxy ( z ) rxy rzy rxz (1 r )(1 r ) 2 zy 2 xz . 42 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Методы изучения связей социальных явлений Для количественной характеристики многомерных (многофакторных) связей социальных явлений используется метод корреляционных плеяд - основан на расчете коэффициентов связи, которые носят общее название информативных коэффициентов. 47 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Метод корреляционных плеяд Позволяет сгруппировать взаимосвязанные признаки в так называемые плеяды. Алгоритм построения корреляционных плеяд базируется на выделении максимальных значений информационных коэффициентов в исходной матрице значений. 48 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Коэффициенты оценки связи качественных признаков, представленных двумя градациями При исследовании связи числовой материал располагается в виде таблиц сопряженности. Таблица для вычисления коэффициентов ассоциации и контингенции a b a+b c d c +d a+c b+d a+b+c+d 49 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Формулы для расчета коэффициентов Коэффициент ассоциации ad bc Ka ad bc Коэффициент контингенции ad bc Kk (a b) (b d ) (a c) (c d ) Связь считается подтвержденной, если K a 0,5 или K k 0,3 50 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Непараметрические показатели связи. Ранговые коэффициенты корреляции. • Ранжирование – это процедура упорядочения объектов изучения, которая выполняется на основе предпочтения. • Ранг – это порядковый номер значений признака, расположенных в порядке возрастания или убывания их величин. 51 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Ранговые коэффициенты Спирмена (ρ) и Кендалла (τ) • Эти коэффициенты могут быть использованы для определения тесноты связи как между количественными, так и между качественными признаками при условии, если их значения будут упорядочены или проранжированы по степени убывания или возрастания признака. • 52 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Коэффициент ранговой корреляции Спирмена (ρ) • это непараметрический метод, который используется с целью статистического изучения связи между явлениями 6 d 2 1 d - сумма квадратов разностей рангов, n - число парных наблюдений n(n 2 1) 2 53 Тема: Статистическое изучение взаимосвязи социально-экономических явлений Ранговый коэффициент связи Кендалла (τ) • коэффициент корреляции, определяющий степень соответствия упорядочения всех пар объектов по двум переменным: 2S n(n 1) n - число наблюдений, S - сумма разностей между числом последовательностей и числом инверсий по второму признаку 53