CIJ/OSI Investigative Journalism – Public Finance School April 2011 Statistics and how to interpret them ЦЖР/ИОО Журналистские расследования - Общественная Школа Финансов, Баку, 14-16 апреля 2011 Статистические модули Инструктор: Эд Суирс-Хеннесси ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Средняя величина или Среднее значение Среднее значение вычисляется путём суммирования значений и деления суммы на количество переменных. В задаче по математике на «множества», количество правильных ответов из 10 были: Значения: 3,4,5,5,4,10,4,10,4,6,4,7,10,3,10,5,4,6,10,5 ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Средняя величина или Среднее значение Сумма 20 значений составляет 119 Среднее количество 119/20 = 5.95 ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Мода (Статистика) Рассортируйте числа в группах, учитывая сколько людей собрали 3 балла, сколько 4 балла и т.д. Это называется распределение чисел. См. Excel пример ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Медиана (Статистика) Сортируйте значения от меньшего к большему. Подсчитайте количество значений. Если у вас нечетное число значений, медианой является среднее значение. Если число значений четное, медиана является средним числом от двух средних значений. See Excel examples ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Сумма Данные переменных потока и запаса Добавьте данные о запасах Будьте осторожны с данными потока – их можно добавить, но будьте осторожны с описанием. ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Население , 2010 Азербайджан Грузия Таджикистан Украина Всего 8,997,400 4,436,400 7,595,000 45,870,700 66,899,500 ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Население, 2010 Процент населения который любит футбол Азербайджан 8,997,400 30.1 Грузия 4,436,400 25.6 Таджикистан 7,595,000 27.6 45,870,700 50.3 66,899,500 Average 33.4 Украина Всего ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Население, 2010 Процент населения который любит футбол Азербайджан 8,997,400 30.1 Грузия 4,436,400 25.6 Таджикистан 7,595,000 27.6 45,870,700 50.3 66,899,500 Среднее (взвешенное) 43.4 Украина Всего ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Вероятность Количество между 0 и 1 0 = невозможное событие 1 = определенное событие 0,5 = событие которое может произойти и непроизойти ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Вероятность 0 = невозможное событие - все мы позавтракали сегодня в Лондоне 1 = определенное событие - все встали с постели сегодня 0,5 = событие может произойти, или не произойти - монета упала на одну из сторон ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Вероятность • Несмещённые кости • Все шесть сторон имеют равную вероятность выподания • Вероятность = 1 / 6 = 0,1666 ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Вероятность Отметим сумму вероятностей всех вариантов = 1 ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Вероятность - возрастнополовая пирамида ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Вероятность - эксперименты типа да / нет ; биномиальное распределение ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Вероятность Невероятные события; распределение Пуассона ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Вероятность - Нормальное распределение, например, для зарплаты на определенном уровне ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Интерпретация данных, полученных с помощью вопросника Не все люди отвечают Цена опроса высока – поэтому рассматриваются образцы опросов с малым количеством респондентов Различные образцы могут давать отличающиеся результаты Результатам присваивают меру надежности - доверительный интервал. ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Интерпретация данных, полученных с помощью вопросника X X X Выборочная оценка X X X X X X X X X X X X X X X X X Реальная стоимость X X ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Интерпретация данных, полученных с помощью вопросника X X X X X Реальная стоимость X Выборочная оценка X X X X ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Интерпретация данных, полученных с помощью вопросника Статистика это среднее арифметическое от всех наблюдений плюс-минус погрешность измерения Для 67% доверия к результату???, средний плюс или минус одно (1х) стандартное отклонение. Для 95% доверия к результату????, средний плюс или минус двукратное (2x) стандартное отклонение. Для 99% доверия к результату, средний плюс или минус трехкратное (3x) стандартное отклонение. ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Интерпретация данных, полученных с помощью вопросника Пример возраста ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Ошибки в данных Примените проверку смысла (sense check) Если вы не уверены, ищите альтернативные источники Существует ли показатель предыдущего года? Является ли изменения по годам допустимым? Правильно ли отображаются единицы измерения? ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Ошибки в данных Два примера, где данные не были проверены 1. Население Таджикистана не составляет 7595 млн. (это больше, чем населения земного шара!) ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Ошибки в данных Два примера, где данные не были проверены 1. Население Таджикистана не составляет 7,595,000,000 (это бол ьше, чем населения земного шара!) 2. Ошибка произошла из-за неправильного применения точки и запятой в дробях ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Ошибки в данных Два примера, где данные не были проверены 1. Население Таджикистана не составляет 7,595,000,000 2. Не так много людей нетрудоспособны. ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Доверительные интервалы - сравнение результатов Год Доля курящего населения Доверительн ый интервал 2009 32.4 ± 1.2 2010 31.6 ± 1.3 33.6 31.2 30.3 32.9 Совпаде ние Поэтому статистически не значительно отличается ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Индекс Используется для описания тенденций в экономике, в частности, в ценах и торговле Полезен для сравнения разрозненных рядов данных. Позволяет сравнивать перемены во времени относительно постоянной точки. ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Население четырех стран- числа ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011 Статистические данные и как их интерпретировать Население четырех стран2006=100