Статистика - Высшая школа экономики

реклама
Программа курса
Математическая и прикладная статистика
(Третий и четвертый семестры)
Лектор
А.А. Пересецкий
Ассистенты
Е. Абрамов, А. Засорин, А. Киселев, Д. Шишкин
Описание дисциплины
Математическая и прикладная статистика  двухсеместровый курс для студентов
второго года обучения МИЭФ. Это - курс для студентов, специализирующихся в области
экономики. Курс преподается на русском и английском языках.
В курсе изучаются базовые понятия статистики: описательные статистики, понятие
генеральной совокупности и выборки, оценивание параметров, статистическая проверка
гипотез и т.п. Кроме того, изучаются разделы теории вероятностей, необходимые для
целостного изложения курса.
Цели курса
Основная цель курса  дать студентам систематические знания в области начальной
статистики. Они должны понимать предмет и освоить основные методы статистического
анализа. Студенты должны научиться проводить разведочный анализ данных (находить
среднее, медиану, среднеквадратичное отклонение и другие описательные статистики),
представлять данные графически (гистограммы, стем-плоты). У них должно сложиться
понимание различия между генеральной совокупностью и выборкой и, соответственно,
между теоретическими и выборочными характеристиками. Статистику, даже начальную,
нецелесообразно преподавать без элементов теории вероятностей, поэтому составной
частью курса является изучение базовых понятий и результатов теории вероятностей.
Студенты должны понимать, что такое вероятностное пространство, случайное события,
вероятность события. Они должны научиться вычислять вероятности сложных событий,
уметь решать простейшие комбинаторные задачи, освоить использование формулы полной
вероятности и формулы Байеса. У студентов должно быть ясное представление о том, что
такое случайная величина и ее распределение.
Студенты должны научиться формулировать и решать традиционные задачи
начальной статистики: оценивание параметров, статистическая проверка гипотез,
корреляционный анализ, анализ вариаций. Одна из целей курса  подготовить студентов к
изучению эконометрики на основе изучения простейших моделей парной и
множественной регрессии.
Курс не является математически строгим. Как следствие, доказательства многих
теорем и даже точная формулировка результатов часто опускаются. Важной частью курса
является решение задач. В основе задач  попытка проиллюстрировать различные
способы применения теории на практике. В процессе обучения студенты также
выполняют компьютерные задания с реальными данными, вырабатывают практические
навыки и интуицию.
По окончании курса студенты должны понимать теорию, лежащую в основе
статистической науки, уметь выполнять необходимые вычисления и применять
стандартные методы на практике.
В конце года студенты должны сдать экзамены Лондонского Университета
«Статистика-1» и «Статистика-2».
Методы:
В курсе используются следующие методы и формы работы:
1
-
Лекции (2 часа в неделю)
Семинары (2 часа в неделю)
Консультации преподавателя
Еженедельные письменные домашние задания
Самостоятельная работа с литературой.
Курс включает 68 часов лекций и 68 часов семинаров.
Основная литература:
Newbold P. Statistics for Business and Economics. Prentice-Hall, (N). 6th edition, 2007.
Elements of Statistics, Study Guide. University of London.
Statistics 2, Study Guide. University of London.
Katyshev P.K., Peresetsky A.А., Problem sets with solutions in Probability and Statistics for
Economists. 3rd edition. МИЭФ, 2010.
Дополнительная литература:
Айвазян С. А., Мхитарян В. С. Теория вероятностей и прикладная статистика. ЮНИТИ.
Москва, 2001.
Гмурман В. Е. (2011). Теория вероятностей и математическая статистика? 10-е издание..
М., ЮРАЙТ.
Гмурман В. Е. (2009). Руководство к решению задач по теории вероятностей и
математической статистике, 9-е издание. М., Высшее образование.
Шведов А. С. (2005). Теория вероятности и математическая статистика? 2-е издание,
ВШЭ.
Hogg R. V. and Tanis E. A. (2010). Probability and Statistical Inference, 8th edt., Prentice Hall.
Johnston A. R. and Bhattacharyya G. K., (2005). Statistics. Principles and Methods. 5th edition,
Wiley, 1996.
Wackberly D. D., Mendenhall III W., and Scheaffer R. L. (2008). Mathematical Statistics with
Applications, 7th edition. Thomson Learning
Internet Resources
http://www.londoninternational.ac.uk/current_students/programme_resources/lse/exam_archive/
exam_papers_2010.shtml
http://www2.gsu.edu/%7Edscbms/ibs/qcontent.html
http://www.math.uah.edu/stat/
http://www.math.yorku.ca/SCS/Gallery/
http://www.bbn-school.org/us/math/ap_stats/applets/applets.html
http://wise.cgu.edu/links/applets.asp
Формы контроля знаний студентов
Домашние задания
(еженедельные; раздаются на лекциях в печатном виде; решения раздаются на лекциях в
печатном виде; две-три задачи из каждого задания оцениваются; домашние задания
2
сдаются перед началом следующей лекции в бумажном виде; нельзя сдавать в
электронном виде, по факсу, ксерокопии; фотокопии).
Квизы (короткие опросы на лекциях)
Midterm 1 (fall)
Exam (winter)
Midterm 2 (spring)
London exams (spring)
Определение итоговой (результирующей) оценки
Итоговая оценка по курсу статистики-2 вычисляется по формуле указанной в
таблице.
компонент
Домашние задания и квизы
Мидтерм 1
Экзамен (зимний)
Мидтерм 2
Max(London Stat-1, London Stat-2)
Дополнительные баллы могут начисляться за
Активность в классе (за каждый балл активности)
Опечатки (за каждую)
*список и коэффициенты могут меняться
вес
0.14
0.14
0.14
0.21
0.37
~0.80*
~0.80*
Однако, если студент получает исключительно низкий балл по мидтерму-2 (< 25%), то он
получает «неуд.» независимо от формулы и результата Лондонского экзамена.
Содержание курса
1. Первичный анализ данных, описательные статистики (N Ch.1, 2)
- Графическое представление одномерных данных. Dotplot. Steamplot. Гистограмма.
- Особенности данных. Выбросы. Кластеры. Форма гистограммы
- Элементарные статистики. Меры среднего: арифметическое среднее, медиана, мода,
среднее геометрическое. Меры разброса: размах, среднеквадратическое отклонение,
interquartile range, среднее абсолютное отклонение, среднее относительное отклонение.
- Преобразование элементарных статистик при линейном преобразовании данных.
- Меры положения наблюдения в выборке: квартили, перцентили, z-score.
- Вычисления с группированными данными.
2. Элементы теории вероятностей (N Ch.3, 4, 5)
- Понятие о вероятности. Пространство элементарных исходов. Алгебра событий.
Независимые события. Несовместные событие. Условные вероятности. Формула
полной вероятности. Формула Байеса
- Дискретные случайные величины. Функция распределения. Математическое
ожидание. Дисперсия. Стандартное отклонение. Биномиальное распределение.
- Непрерывные
случайные
величины.
Функция
распределения.
Плотность
распределения. Равномерное распределение. Нормальное распределение.
- Закон больших чисел. Аппроксимация биномиального распределения нормальным.
- Линейное преобразование случайной величины.
3
-
Две случайных величины. Коэффициент ковариации. Коэффициент корреляции.
Некоррелированность и независимость. Математическое ожидание и дисперсия
линейной комбинации двух случайных величин.
3. Элементы математической статистики (N Ch.69, 11)
- Случайные выборки. Двойственность интерпретации. Понятие об оценивании
параметров распределения. Выборочное среднее и выборочная дисперсия.
Математическое ожидание и дисперсия выборочного среднего. Оценивание
пропорций.
- Точечное оценивание. Свойства оценок: несмещенность, эффективность,
состоятельность. Оценки среднего и дисперсии.
- Метод максимального правдоподобия. Метод моментов.
- Интервальное оценивание. Доверительные интервалы. Оценивание среднего.
Нормальная аппроксимация при больших выборках. Случай малых выборок
(распределение Стьюдента). Разница двух средних. Пропорции.
- Тестирование гипотез. С использованием доверительных интервалов. С
использованием тест-статистик. Двусторонние и односторонние р-значения
- Критерий согласия Пирсона. Таблицы сопряженности
4. Модель парной регрессии (N Ch.12)
- XY график. Подгонка прямой. Метод наименьших квадратов.
- Преобразования, приводящие к линейной модели
- Выбросы.
- Прогнозные значения.
- Остатки и ошибки регрессии.
- Статистические свойства оценок. Тестирование гипотез.
5. Дисперсионный анализ (N Ch.15)
- Однофакторный дисперсионный анализ
- Двухфакторный дисперсионный анализ.
- Доверительные интервалы.
4
Тематический план учебной дисциплины
№
п/п
1.
2.
3.
4.
5.
ВСЕГ
О
(часов)
Наименование
тем и разделов
Первичный анализ данных, описательные
статистики.
Элементы теории вероятностей.
Элементы математической статистики.
Модель парной регрессии.
Дисперсионный анализ.
ИТОГО:
5
26
80
110
28
26
270
Аудиторные занятия
(час)
в том числе
Лекци Практически
и
е занятия
6
20
30
6
6
68
6
20
30
6
6
68
Самост
оятельн
ая
работа
14
40
50
16
14
134
Скачать