Раздел 1. Теория статистики Практикум 3. Средние и показатели вариации Оглавление Методические указания ......................................................................... 1 Задания................................................................................................... 8 Методические указания Методика расчета средней величины зависят от поставленной цели исследования, от вида и взаимосвязи изучаемых признаков, а также от характера исходных данных. Средние величины делятся на основные две категории: 1. Степенные средние; 2. Структурные средние. В составе степенных средних большое распространение получила средняя арифметическая величина: х1 х 2 ... х n x1 x 2 ... x n n x . Х х1 х 2 ... х n x i ; n n где х – индивидуальные значения признака; n - число единиц совокупности. Приведенная формула есть формула средней арифметической простой (невзвешенной). Расчет по этой формуле проводится в том случае, если индивидуальные значения признака не повторяются или встречаются одинаковое число раз, то есть можно сказать имеют одинаковый вес. Однако в исходных данных, особенно при использовании совокупностей большого объема, одни и те же значения признака повторяются. В этом случае данные представляют в сгруппированном виде, когда для каждого значения осредняемого признака сообщается частота его повторения, то есть предварительно составляется ряд распределения. Допустим, варьирующим признаком является срок функционирование банка, который соответствует периоду времени, прошедшему с момента регистрации в Центральном банке. Таблица 1 Группировка коммерческих банков по количеству лет деятельности Период деятельности банков, лет Число банков Общий период функционирова ния банков, лет хi fi xi f i 6 1 6 10 12 итого 4 2 7 40 24 70 вариантов признака на число единиц, соответствующих этому варианту, т.е. на их частоты: х1 f1 х 2 f 2 ... х n f n . Поскольку должно выполняться равенство: f 1 f 2 ... f n x f1 x1 f 2 x 2 ... f n x n , средняя определяется по формуле средней взвешенной: xi f i x f x 2 f 2 ... x n f n x 1 1 f f ... f f ; 1 2 n i В нашем примере средний срок деятельности банков равен: x x f f i i i 70 10 лет . 7 В отдельных случаях веса могут быть представлены в виде относительных величин структуры (в процентах или долях единицы). Тогда формула средней арифметической взвешенной будет иметь вид: x где d f f xd , d - доля каждой группы в общем числе единиц совокупности (частость). Если частоты выражены в долях (коэффициентах), то d 1 и xi d i . формула средней арифметической упрощается: x Так, в приведенном выше примере количество банков разного срока службы соответственно составляет 14,3% (0,143); 57,1% (0,571); 28,6% (0,286) от их общего числа. Средний срок деятельности банка составит: 6*0,143+10*0,571+12*0,286=10 лет. При помощи средних обобщаются не только абсолютные, но и относительные величины. Отличия в расчете в этом случае отражают особенности построения средних на основе значений первичных признаков и вторичных признаков. Порядок расчета и форма средней зависит от взаимосвязи изучаемых признаков и от того, какими данными для расчета мы располагаем. Средние первичных признаков определяются по формуле простой средней путем деления итогового подсчета по характеризуемому признаку на перечневой подсчет, т.е. числитель такого отношения представляет собой общую сумму значений осредняемого признака у всех единиц совокупности, а знаменатель – общее число единиц изучаемой совокупности. Базой расчета средних значений вторичного признака является исходное соотношение признаков, определяющих логическую формулу осредняемого вторичного признака. Рассмотрим пример. В таблице 2 представлены данные о работе двух организаций: Таблица 2 Выпуск продукции Организации 1 2 По плану, тыс. руб. Фактически, тыс. руб. Процент выполнения плана Ф 6300 9090 В 105,0 101,0 П 6000 9000 Фактическая выработка продукции на одного рабочего тыс.руб. Т 3,9 4,5 Требуется определить средние значения всех представленных в таблице признаков. В рассматриваемом примере единицей совокупности является одно предприятие, поэтому среди представленных в таблице признаков первичными являются плановый и фактический объем выпускаемой продукции. Следовательно, для расчета средней величины каждого из этих признаков требуется применить форму простой средней, а для остальных признаков таблицы используется формула средней взвешенной величины. П 6000 9000 7500тыс. руб. 2 n Фi 6300 9090 7695тыс. руб. Ф n 2 Фi 6300 9090 15390 100 102,6% . В Пi 6000 9000 1500 П i Т Ф Ч i ; i Для определения средней выработки одного рабочего необходимо предварительно вычислить численность рабочих, занятых на каждом предприятии. В соответствии с исходными Фi . Проведя необходимую Тi подстановку, получим следующее выражение искомой средней, которое соответствует форме средней гармонической взвешенной. данными это возможно по формуле Ч i Т Ф Ч i i Ф Ф Т i . i i Подставив в формулу числовые значения получаем: 6300 9090 15390 15390тыс. руб. Т 4,2тыс. руб. 6300 9090 1615 2020 3635чел. 3,9 4,5 Вычисление моды и медианы производится в зависимости от того, имеем ли мы несгруппированные или сгруппированные данные. Рассмотрим определение моды и медианы по несгруппированным данным. Предположим, что 9 строительных организаций имеют следующий объем кредиторской задолженности: 34,4 34,3 34,4 34,5 34,3 34,3 34,6 34,2 34,6. Мода отражает наиболее распространенный вариант значений признака. Так как чаще всего встречается организации с величиной кредиторской задолженности 34,3 тыс. руб., то эта величина и будет модальной. Для определения медианы необходимо построить упорядоченный (ранжированный) ряд: 34,2 34,3 34,3 34,3 34,4 34,4 34,5 34,6 34,6. Медиана делит упорядоченный ряд на две равные по числу единиц части так, что у половины единиц значение признака меньше медианы, а у другой половины - больше ее. При нечетном числе единиц совокупности порядковый номер медианы равен: N me n 1 ; 2 где n - число единиц совокупности. В нашем примере номер медианы равен 5; медиана равна 34,4 тыс. руб. (то есть одна половина организаций имеет дебиторскую задолженность менее 34,4 тыс. руб., а другая - более 34,4 тыс. руб.). Рассмотрим определение моды и медианы по сгруппированным данным (по рядам распределения). Предположим, имеется следующий дискретный ряд распределения. Таблица 3 Группировка предприятий региона по уровню рентабельности активов Рентабельность активов, % 1 Число предприятий 2 Накопленная частота 3 17 18 19 20 21 всего 4 8 17 12 9 50 4 12 29 41 50 - Определение моды по данным дискретного ряда распределения не составляет большого труда – наибольшую частоту (17 предприятий) имеет величина рентабельности 19%, следовательно, она и является модальной. Для определения медианного значения находят номер медианной единицы ряда: N me n 1 ; 2 где n – объем совокупности. В нашем случае номер медианного значения признака 25,5. Полученное дробное значение указывает, что точная середина находится между 25 и 26 предприятиями. Необходимо определить, в какой группе находятся предприятия с этими порядковыми номерами. Это можно сделать, рассчитав накопленные частоты (графа 3 табл. 3). Очевидно, что предприятия с этими номерами находятся в третьей группе (4+8+17=29) и, следовательно, медианой является уровень рентабельности 19 %. В отличие от дискретных рядов распределения определение моды и медианы по интервальным рядам требует проведения дополнительных расчетов. Рассмотрим пример о распределении кредитных организаций по величине активов. Таблица 4 Группировка кредитных организаций региона по величине активов Активы, млн. руб. 105-115 115-125 125-135 135-145 145-155 155-165 165-175 итого Число кредитных организаций 4 9 21 49 28 18 11 140 Накопленная частота 4 13 34 83 111 129 140 - Интервал с границами 135-145 в данном распределении будет модальным, так как он имеет наибольшую частоту. Определим моду: M 0 135 10 491 21 140 .71 млн. руб. 49 21 49 28 Для определения медианного интервала необходимо определять накопленную частоту каждого последующего интервала до тех пор, пока она не превысит ½ суммы накопленных частот. Мы определили, что медианным является интервал с границами 135-145 . Проведем расчет медианы: 140 34 2 М е 135 10 142 .35 млн. руб. 49 Продолжим рассмотренный пример распределения коммерческих банков по объему активов. В таблице 5 представлен расчет данных, которые необходимы для определения показателей степени вариации и характеристик формы распределения. Таблица 5 Активы, млн. руб. 105-115 115-125 125-135 135-145 145-155 155-165 165-175 Итого f x xf xx xx f (x x) 2 f (x x)3 f (x x) 4 f 4 9 21 49 28 18 11 140 110 120 130 140 150 160 170 - 440 1080 2730 6860 4200 2880 1870 20080 33.3 23.3 13.3 3.3 6.7 16.7 26.7 - 133.2 209.7 279.3 161.7 187.6 300.6 293.7 1565.8 4435.58 4886.01 3714.69 533.61 1256.92 5020.02 7841.79 27688.6 147704.1 113844.0 49405.38 1760.91 8421.36 83834.33 209375.80 614345.88 4918570 2652566 657091.5 5811.013 56423.14 1400033.0 5590334 15280829 Как видно из формул, для расчета показателей вариации на основе интервального ряда необходимо использовать середину интервала и предварительно изучаемого признака. определить среднюю величину xf 20080 143,3млн. руб. 140 f x x f 1565.8 11,15 млн. руб. 140 f x d i 2 ( x х ) f i 2 fi . ; 2 27688 .6 197 .77 ; 140 i i ( xi x ) 2 f i f 3 (x x) f 4 (x x) f i As i 3 4 f f 614346 .0 4.39 ; 140 15280829 109 .15 ; 140 3 4,39 / 2780,65 0,0016; 3 As 6(140 1) 0,2; (140 1)(140 3) As As Ex Ex 14,06 млн. руб. i 0,008; 4 3 2,997. 4 24 140(140 2)(140 3) 0,4; (140 1) 2 (140 3)(140 5) | Ex | / Ех 7,493. На основе рассчитанных обобщающих характеристик статистической совокупности коммерческих банков можно сделать следующие выводы: средний объем активов кредитной организации составляет 143,3 млн. рублей, а показатели вариации: среднее линейное отклонение – 11,15 млн. рублей; среднее квадратическое отклонение- 14,06 млн. руб., тогда коэффициент вариации равен 9,81%{ / x 100} , является следовательно, однородной несущественный по изучаемая объему характер, совокупность активов; распределение банков асимметрия имеет является более плосковершинным, чем нормальное, отклонение от нормального распределения по показателю эксцесса является существенным. Для измерения вариации альтернативного признака, которым свойственны лишь два противоположных варианта, рассчитывается так называемая дисперсия доли. Доля единиц (частость), обладающих данным признаком, обычно обозначается p; доля единиц не обладающих данным признаком, обозначается q . Допустим, при обследовании 1000 коммерческих банков 800 из них являются универсальными. Определите дисперсию и среднее квадратическое отклонение доли универсальных банков. Решение: В нашем примере доля единиц, обладающих изучаемым признаком, т.е. доля универсальных банков, равна: p=800:1000=0,8 или 80%. Следовательно, 20% банков не обладали изучаемым признаком. Следовательно, дисперсия доли универсальных банков равна p2 p q 0,8 0,2 0,16 Среднее квадратическое отклонение: p p 2 0,16 0,4. Задания Задача 1 Имеются данные о реализации продукции предприятиями региона за отчетный год. Предприятие №1 Предприятие №2 В %% к уровню прошлого года В %% к запланированном у уровню Всего реализовано за отчетный год, млн. руб. В %% к уровню прошлого года В %% к запланированному уровню Всего реализовано за отчетный год, млн. руб. Вариант 1 2 3 4 130 115 125 140 105 102 103 110 120 112 119 120 135 120 127 142 102 116 120 115 121 130 115 116 5 6 139 141 116 112 118 115 137 140 103 106 126 119 7 8 128 135 120 100 121 110 130 137 110 113 125 131 9 111 115 118 113 130 119 Требуется: По данным Вашего варианта задания определить средние по совокупности предприятий значение всех показателей таблицы. Задача 2 В результате обследования размера каждого пятого вклада от населения в Сбербанке на конец года были получены следующие данные Размер вклада, руб. до 3000 3000 - 5000 5000 - 7000 7000-9000 9000 и выше Число вкладов 60 90 160 50 40 Требуется: 1. Определить .средний размер вклада и показатели вариации. 2. Построить график распределения. 3. Сделать выводы. Задача 3 По субъектам Федерации федерального округа получены следующие данные о структуре банковской системы. Субъект Федерации 1 2 3 4 5 6 7 8 9 10 Количество кредитных организаций Количество филиалов региональных кредитных организаций 4 8 12 2 4 1 6 2 4 43 Количество филиалов кредитных организаций из других регионов 0 11 6 2 2 2 11 2 0 31 27 20 26 40 26 22 29 17 13 86 Требуется: 1. По каждому показателю таблицы определить моду и медиану. 2. Сделать выводы. Задача 4 Распределение муниципальных образований области по вводу в действие жилых домов характеризуется следующими данными: Темп роста за первое полугодие, % Число муниципальны х образований До 60 60-70 70-80 80-90 90 и более 4 2 3 10 9 Требуется: 1. Построить график распределения. 2. Определить моду и медиану. Задача 5 По данным выборочного обследования получено следующее распределение работников по размеру заработной платы. Среднемесячная заработная плата одного работника, рублей Число работников до 2000 16 2000-2300 22 2500 - 3000 30 3000 - 3500 15 3500-4000 9 4000 и выше 8 Итого Рассчитайте: 1. Среднюю заработную плату одного работника. 2. Показатели вариации и формы распределения. 3. Построить график. 100