Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины «Вероятностные модели» для направления 010400.62 «Прикладная математика и информатика» подготовки бакалавра Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Национальный исследовательский университет «Высшая школа экономики» Факультет Компьютерных наук Кафедра Высшая математика на факультете экономики УТВЕРЖДАЮ Академический руководитель образовательной программы по направлению 010400.62 «Прикладная математика и информатика» А.С. Конушин ______________________ «___» _____________ 2014 г. Программа дисциплины Вероятностные модели Для направления 010400.62 «Прикладная математика и информатика» подготовки бакалавров Автор программы: к. ф.-м. н. Горяинова Е.Р., доцент кафедры Высшая математика на факультете экономики (el-goryainova@mail.ru) Одобрена на заседании Кафедры Высшая математика на ф-те экономики Зав. кафедрой Рекомендована Академическим советом образовательной программы «Прикладная математика и информатика» Менеджер кафедры «___» ______ 2014 г. Ф.Т. Алескеров «___»__________ 2014 г. О.А. Колотвина Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины «Вероятностные модели» для направления 010400.62 «Прикладная математика и информатика» подготовки бакалавра Настоящая программа не может быть использована другими подразделениями университета и другими вузами без разрешения кафедры-разработчика программы. Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины «Вероятностные модели» для направления 010400.62 «Прикладная математика и информатика» подготовки бакалавра 1. Область применения и нормативные ссылки Настоящая программа учебной дисциплины устанавливает минимальные требования к знаниям и умениям студента и определяет содержание и виды учебных занятий и отчетности. Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления подготовки 010400.62 «Прикладная математика и информатика», обучающихся по программе бакалавриата. Программа разработана в соответствии с: Образовательным стандартом государственного образовательного бюджетного учреждения высшего профессионального образования «Государственный университет – Высшая школа экономики», в отношении которого установлена категория «Национальный исследовательский университет»; Рабочим учебным планом университета подготовки бакалавра по направлению 010400.62 «Прикладная математика и информатика», утвержденном в 2014 г. 2. Цели освоения дисциплины Целями освоения дисциплины «Вероятностные модели» являются - сформировать теоретические знания в области теории вероятностей и математической статистики; -обучить студентов применять основные модели и методы математической статистики для обработки реальных социально-экономических данных. 3. Компетенции обучающегося, формируемые в результате освоения дисциплины В результате освоения дисциплины студент должен: знать: -основные методы первичной обработки статистических данных; - основные методы проверки однородности экспериментальных данных; - базовые понятия теории надежности; - принципы сравнения статистических критериев; уметь: – строить математические модели, адекватно описывающие социально-экономические явления; - использовать статистические критерии для проверки гипотез относительно наблюдаемых случайных данных; владеть: -навыками решения типовых задач теории надёжности и математической статистики; - основными определениями, методами и алгоритмами анализа данных, содержащих случайную составляющую; - стандартными инструментариями обработки статистической информации. В результате освоения дисциплины студент осваивает следующие компетенции: Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины «Вероятностные модели» для направления 010400.62 «Прикладная математика и информатика» подготовки бакалавра Код по ФГОС / НИУ Дескрипторы – основные признаки освоения (показатели достижения результата) Формы и методы обучения, способствующие формированию и развитию компетенции ОНК-1 Способность к анализу и синтезу на основе системного подхода Стандартные (лекционно-семинарские) ОНК-2 Способность перейти от проблемной ситуации к проблемам, задачам и лежащим в их основе противоречиям Стандартные (лекционно-семинарские) ОНК-3 Способность использовать методы критического анализа, развития научных теорий, опровержения и фальсификации, оценить качество исследований в некоторой предметной области Стандартные (лекционно-семинарские) ОНК-4 Готовность использовать основные законы естественнонаучных дисциплин в профессиональной деятельности, применять методы математического анализа и моделирования, теоретического и экспериментального исследования при работе в какой-либо предметной области Стандартные (лекционно-семинарские) ОНК-5 Готовность выявить естественнонаучную сущность проблем, возникающих в ходе профессиональной деятельности, привлечь их для решения соответствующий аппарат дисциплины Стандартные (лекционно-семинарские) Общенаучная ОНК-6 Способность приобретать новые знания с использованием научной методологии и современных образовательных и информационных технологий Стандартные (лекционно-семинарские) Общенаучная ОНК-7 Способность порождать новые идеи (креативность) Стандартные (лекционно-семинарские) ИК-2 Умение работать на компьютере, навыки использования основных классов прикладного программного обеспечения, работы в компьютерных сетях, составления баз данных Стандартные (лекционно-семинарские) ПК-1 Способность демонстрации общенаучных базовых знаний естественных наук, математики и информатики, понимание основных фактов, концепций, принципов теорий, связанных с прикладной Стандартные (лекционно-семинарские) Компетенция Общенаучная Общенаучная Общенаучная Общенаучная Общенаучная Инструментальные Профессиональные Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины «Вероятностные модели» для направления 010400.62 «Прикладная математика и информатика» подготовки бакалавра Компетенция Код по ФГОС / НИУ Дескрипторы – основные признаки освоения (показатели достижения результата) Формы и методы обучения, способствующие формированию и развитию компетенции математикой и информатикой Профессиональные Профессиональные Профессиональные ПК-2 Способность понимать и применять в исследовательской и прикладной деятельности современный математический аппарат Стандартные (лекционно-семинарские) ПК-4 способность критически оценивать собственную квалификацию и её востребованность, переосмысливать накопленный практический опыт, изменять при необходимости вид и характер своей профессиональной деятельности Стандартные (лекционно-семинарские) ПК-8 Способность решать задачи производственной и технологической деятельности на профессиональном уровне, включая разработку математических моделей, алгоритмических и программных решений Стандартные (лекционно-семинарские) 4. Место дисциплины в структуре образовательной программы Программа учебной дисциплины «Вероятностные модели» предназначена для подготовки студентов, обучающихся по направлению «Прикладная математика и информатика». Программа составлена в соответствии с Федеральным государственным образовательным стандартом высшего профессионального образования. «Вероятностные модели» является самостоятельной учебной дисциплиной, относится к математическому и естественнонаучному циклу дисциплин. Для специализаций 010400.62 «Прикладная математика и информатика» настоящая дисциплина является дисциплиной по выбору. Изучение данной дисциплины базируется на следующих дисциплинах: Математический анализ; Теория вероятностей; Математическая статистика; Геометрия и алгебра. Для освоения учебной дисциплины, студенты должны владеть следующими знаниями и компетенциями: Знаниями основных определений и теорем перечисленных выше дисциплин; Навыками решения типовых задач этих дисциплин. Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины «Вероятностные модели» для направления 010400.62 «Прикладная математика и информатика» подготовки бакалавра Основные положения дисциплины должны быть использованы в дальнейшем при изучении следующих дисциплин: Стохастическое моделирование; Эконометрика; Анализ данных. 5. Тематический план учебной дисциплины Аудиторные часы № Название раздела Цепи Маркова 1. 2. 3. 4. Марковские случайные функции с дискретным множеством состояний Исследование однородности двух выборок. Анализ статистической взаимосвязи социально-экономических явлений Итого Самостоятельная работа Всего часов Лекции Семинары 26 4 4 18 40 8 8 24 44 8 8 28 52 10 8 34 162 30 28 104 Практические занятия 6. Формы контроля знаний студентов Тип контроля Текущий (неделя) Итоговый Форма контроля Контрольная работа Домашнее задание Экзамен 1 1 год 2 3 Параметры ** 4 2 письменная работа 80 минут 8 э письменная работа 80 минут Критерии оценки знаний, навыков Для прохождения контроля студент должен, как минимум, продемонстрировать знания основных определений и формулировок теорем; умение решать типовые задачи, разобранные на семинарских занятиях и умение выбирать оптимальный метод обработки статистических данных. Оценки по всем формам текущего контроля выставляются по 10-ти балльной шкале. 6.1 Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины «Вероятностные модели» для направления 010400.62 «Прикладная математика и информатика» подготовки бакалавра 6.2 Порядок формирования оценок по дисциплине Накопленная оценка за текущий контроль учитывает результаты студента по текущему контролю следующим образом: Онакопленная= 0.8* Отекущий + 0.2* Оауд где Отекущий рассчитывается как взвешенная сумма всех форм текущего контроля, предусмотренных в РУП Отекущий = 0.6·Ок/р + 0.4·Одз . Результирующая оценка за дисциплину рассчитывается следующим образом: Орезульт = 0.5* Онакопл + 0.5*·Оэкз Способ округления результирующей оценки: если дробная часть результирующей оценки составляет меньше 0.7, то результирующая оценка равна целой части полученного значения; если дробная часть результирующей оценки не менее 0.7, то результирующая оценка равна целой части полученного значения плюс 1. Оценка за итоговый контроль не блокирующая. 7. Содержание дисциплины Раздел I. Цепи Маркова (Л.-4ч., С.-4ч., СРС-18ч.) Вероятностные характеристики цепей Маркова. Классификация состояний цепи Маркова. Эргодические цепи Маркова. Эргодическая теорема. Предельные вероятности состояний цепи Маркова. Задача о разорении игрока. Литература по разделу. Основная:[ 2] с.83-98, [9] глава 8 Раздел 2. Марковские случайные функции с дискретным множеством состояний (Л.-8ч., С.8ч., СРС-24 ч.) Случайные процессы (СП). Задание СП, основные вероятностные характеристики СП. Стационарные СП. Потоки событий. Вероятностное описание марковских случайных функций с дискретным множеством значений. Уравнение Колмогорова- Чепмена. Эргодические свойства однородных марковских СП. Система алгебраических уравнений Колмогорова. Процессы рождения и гибели. Литература по разделу. Основная:[ 2] с. 247-268 Раздел 3. Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины «Вероятностные модели» для направления 010400.62 «Прикладная математика и информатика» подготовки бакалавра Исследование однородности двух выборок (Л.-8ч., С.-8ч., СРС-28 ч.) Понятие о робастных оценках в терминах кривой чувствительности SC(sensitivity curve), B-робастные оценки. Пороговая точка (breakdown point). Исследование свойства Bробастности выборочного среднего и выборочной медианы. Однородные выборки. Непараметрические критерии. Ранги, связки, средние ранги. Ранговые критерии. Выявление неоднородности, связанной со сдвигом (классический критерий Стьюдента, критерий Вилкоксона, Фишера – Йейтса) или масштабом (классический F- критерий, критерий Ансари-Брэдли). Проверка однородности против альтернатив общего вида (критерий Колмогорова – Смирнова, критерий омега-квадрат). Функция мощности критерия. Относительная асимптотическая эффективность (ОАЭ) статистических критериев по Питмену. Сравнительный анализ ОАЭ изученных критериев для различных распределений выборок. Литература по разделу. Основная:[ 1] с. 59-89 Дополнительная: [3], [8], [10], [11], [12], [13] Раздел 4. Анализ статистической взаимосвязи социально-экономических явлений (Л.-10ч., С.8ч., СРС- 34ч.) Шкалы измерений (количественная, порядковая, номинальная). Исследование связи между номинальными переменными (таблица сопряженности признаков, критерий хи-квадрат, меры связи признаков: коэффициенты контингенции, ассоциации, среднеквадратической сопряженности, Пирсона, Крамера). Меры прогноза, λ меры Гутмана. Исследование связи между порядковыми переменными (ранговый коэффициент корреляции Спирмена, коэффициент согласованности Кендалла, коэффициент конкордации). Случайные векторы. Ковариационная матрица. Независимость и некоррелированность компонент случайного вектора. Анализ структуры и тесноты связи между количественными переменными. Выборочный коэффициент корреляции. Исследование независимости компонент гауссовского случайного вектора. Критерий хи-квадрат. Измерение тесноты связи при нелинейной зависимости (индекс корреляции и его оценивание по сгруппированным и несгруппированным данным). Частные коэффициенты корреляции. Множественный коэффициент корреляции, его вычисление и свойства для общих и нормальных моделей. Анализ множественных связей. Литература по разделу. Основная: [1] с. 113-152 Дополнительная: [3], [4], [5], [7], [8], [12] Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины «Вероятностные модели» для направления 010400.62 «Прикладная математика и информатика» подготовки бакалавра 9. Оценочные средства для текущего контроля и аттестации студента 9.1. Тематика заданий текущего контроля Вариант билета контрольной работы 1. Задана матрица переходных вероятностей однородной марковской цепи 0.5 0.5 0 0.5 0 0.5 0 1 0 Является ли цепь эргодической? Найти все стационарные распределения цепи. 2. Дан случайный процесс 𝜉(𝑡) = 𝑉𝑒 −𝑢𝑡 , t>0,где 𝑚𝑉 = 𝑚, 𝐷𝑉 = 𝑑, 𝑢~𝐸(𝛾), 𝑉 и 𝑢 − независимые случайные величины. Найти математическое ожидание, дисперсию и ковариационную функцию случайного процесса 𝜉(𝑡). 3. Дан случайный процесс 1, 𝑡<𝜏 𝜉(𝑡) = { −1, 𝑡≥𝜏 𝑡 ≥ 0, 𝜏~𝐸(𝛼). Найти одно- и двумерные распределения процесса 𝜉(𝑡). 4. Система массового обслуживания состоит из двух одинаковых каналов обслуживания с интенсивностями обслуживания 𝜇. Поток заявок – простейший пуассоновский поток с интенсивностью 𝜆. Требуется: 1)построить стохастический граф процесса обслуживания; 2)выписать уравнения Колмогорова для вычисления вероятностей состояния процесса; 3)найти стационарное распределение процесса; 4)вычислить вероятность простоя и вероятность полной занятости каналов в случае, когда 𝜆 = 2𝜇. Вариант домашней работы 1.Средняя стоимость лечения одного пациента-льготника с диагнозом «дуоденит» составляет (в рублях на ноябрь 2007 года): Дальневосточный фед. округ Амурская обл. 245,61 Еврейская АО 101,45 Камчатская обл. 202,84 Корякский АО 327,63 Магаданская обл. 144,5 Приморский край 458,81 Приволжский фед. округ Кировская обл. 196,27 Оренбургская обл. 309,79 Пензенская обл. 271,76 Пермская обл. 329,58 Башкортостан 233,49 Марий-Эл 298,24 Мордовия 311,6 Татарстан 284,03 Чувашия 405,5 Одинакова ли средняя стоимость лечения льготников в Дальневосточном и Приволжском федеральных округах? 2. Проведен социологический опрос 655 человек. Каждый из опрошенных отвечал на два вопроса. Вопрос А: «Удовлетворены ли Вы своим образом жизни?» (варианты от- Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины «Вероятностные модели» для направления 010400.62 «Прикладная математика и информатика» подготовки бакалавра ветов: да, нет). Вопрос В: «Каково Ваше материальное положение?» (варианты ответов: плохое, ниже среднего, среднее, выше среднего, хорошее. Результаты опроса сведены в следующую таблицу: B A Нет Да плохое 92 22 ниже среднесреднее го 64 48 46 136 выше среднего 23 148 хорошее 3 72 Имеется ли зависимость между материальным положением (признак В) и удовлетворенностью образом жизни (признак А) ? Прокомментируйте характер связи между А и В с помощью коэффициентов Пирсона, Крамера, среднеквадратической сопряженности, мер прогноза Гутмана, мер прогноза Краскела-Гудмана. 3. В таблице представлены данные за 1997 год показателей X (индекс человеческого развития) и Y (суточная калорийность питания населения, ккал на душу) для следующих стран: Австрия, Аргентина, Великобритания, Германия, Египет, Норвегия, Украина, Республика Корея, ЮАР, США. X 0.904 0.827 0.918 0.906 0.616 0.927 0.721 0.852 0.695 0.927 Y 3343 3136 3237 3330 3289 3350 2753 3336 2933 3642 Являются ли показатели X и Y зависимыми? 4.В городе N каждый житель имеет одну из трёх профессий-A,B,C. Дети отцов, имеющих профессии A,B,C сохраняют профессии отцов с вероятностями 3/5, 2/3, 1/4 соответственно. А если не сохраняют, то с равными вероятностями выбирают любую из двух других профессий. Найти: 1)распределение по профессиям в следующем поколении, если в данном поколении профессию А имело 20% жителей, профессию В -30%, профессию С-50%; 2)предельное распределение по профессиям, когда число поколений растёт; 3)распределение по профессиям, не меняющееся при смене поколений. 9.2. Вопросы для оценки качества освоения дисциплины Тема 1. 1. Что такое цепь Маркова? 2. Какая цепь называется однородной? 3. Какие состояния называются существенными, сообщающимися, апериодическими? 4. Сформулируйте эргодическую теорему. 5. Как найти стационарное распределение однородной цепи Маркова, если оно существует? Тема 2. 1. Дайте определение случайного процесса(СП). 2. Что такое конечномерное распределение СП? 3. Каковы основные характеристики СП? 4. Каковы основные свойства ковариационной функции СП? 5. Дайте определение стационарного(в широком и узком смысле) процесса. 6. Какой поток событий называется простейшим пуассоновским потоком? 7. Дайте определение марковского свойства для СП с непрерывным временем и конечным множеством состояний. Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины «Вероятностные модели» для направления 010400.62 «Прикладная математика и информатика» подготовки бакалавра 8. Запишите систему алгебраических уравнений Колмогорова для однородного марковского процесса. Тема 3. 1. Какие выборки называют однородными? 2. Назовите основные типы неоднородности выборок. 3. Опишите условия применимости классических и ранговых критериев для проверки гипотезы об однородности. 4. Какие преимущества и какие недостатки имеют ранговые критерии по сравнению с классическими? 5. Какие критерии применяют для проверки гипотезы об однородности двух выборок? 6. Что такое относительная эффективность по Питмену? 7. Чему равна АОЭ по Питмену критерия Стьюдента по отношению к критерию Вилкоксона, если наблюдения имеют гауссовское распределение? 8. Что такое В-робастная оценка? 9. Приведите пример оценки, которая является В-робастной. 10. Приведите пример оценки, которая не является В-робастной. Тема 4. 1. Опишите основные типы шкал измерений и допустимые преобразования в этих шкалах. 2. Что такое таблица сопряженности признаков? 3. Дайте определение независимости признаков, измеряемых в номинальной шкале. 4. Как проверить гипотезу о независимости признаков в номинальной шкале? 5. Как проверить гипотезу о независимости признаков в порядковой шкале? 6. Назовите основные коэффициенты, измеряющие связь признаков в номинальной шкале. 7. Что такое коэффициент корреляции? Каковы его основные свойства? 8. Как проверить гипотезу о некоррелированности признаков? 9. В каком случае проверка некоррелированности наблюдений эквивалентна проверке независимости? 10. Как измерить тесноту связи двух нелинейно зависимых переменных? 11. Что такое множественный коэффициент корреляции? Каковы его свойства? 9.3. Примеры заданий итогового контроля Вариант экзаменационного билета 1.В результате проведенного исследования было установлено, что у 309 светлоглазых мужчин жены также имеют светлые газа, а у 214 светлоглазых мужчин жены темноглазые. У 119 темноглазых мужчин жены также темноглазые, а у 132 темноглазых мужчин жены светлоглазые. Имеется ли зависимость между цветом глаз мужей и их жен? Исследуйте силу связи между этими показателями с помощью коэффициентов контингенции и ассоциации. 2. По 20 территориям России были изучены следующие данные: X – среднедушевой доход (в тыс. руб.), Y – доля занятых тяжелым физическим трудом в общей численности занятых (%), Z – доля экономически активного населения в численности всего населения (%). По результатам наблюдений были вычислены выборочные коэффициенты корреляции. Для показателей X и Y выборочный коэффициент корреляции равен 0.746, для X и Z равен 0.507, для Y и Z равен 0.432. Вычислите частный коэффициент корреляции показателей X и Y при условии, что показатель Z зафиксирован. Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины «Вероятностные модели» для направления 010400.62 «Прикладная математика и информатика» подготовки бакалавра 3.Три квалифицированных эксперта (A,B и C) оценивают в порядке предпочтения 10 бизнес-проектов. Результаты представлены в таблице: A 1 4 2 5 3 7 6 9 8 10 B 2 1 3 4 5 8 9 10 6 7 C 2 1 4 5 3 7 9 8 6 10 Является ли эта экспертная группа согласованной? 4. В таблице представлены данные за 1995 год показателей X (ВВП в паритетах покупательной способности) и Y (коэффициент детской смертности в %) для следующих стран: Бурунди, Чад, Индия, Египет, Мексика, Бразилия, Республика Корея, Канада, США, Швейцария. X 2.3 2.6 5.2 12.2 23.7 20 42.4 78.3 100 95.9 Y 98 117 68 16 33 44 10 6 8 6 Считая , что наблюдения имеют гауссовское распределение, выясните являются ли признаки X и Y зависимыми и постройте приближенный доверительный интервал уровня надежности 0.95 для коэффициента корреляции X и Y. 5.Уровень гистамина в мокроте у 7 курильщиков, склонных к аллергии, составил (в микрограммах): 102,4; 100,0; 67,6; 65,9; 64,7; 39,6; 31,2, а у курильщиков, несклонных к аллергии: 48,1; 45,5; 41,7; 35,4; 29,1; 18,9; 58,3; 66,8; 71,3; 94,3. Верно ли предположение о том, что уровень гистамина у курильщиков, подверженных аллергии, выше, чем у неаллергенов? Принять уровень значимости равным 0,05. 6. Какие преимущества и какие недостатки имеют ранговые критерии по сравнению с классическими ? 10. Учебно-методическое и информационное обеспечение дисциплины 10.1. Базовый учебник 1. Горяинова Е.Р., Панков А.Р., Платонов Е.Н. Прикладные методы анализа статистических данных. М.: Изд. Дом ВШЭ,2012.- 312 с. 2. Миллер Б.М., Панков А.Р. Теория случайных процессов в примерах и задачах.- М.: Физматлит, 2002.-320с. 10.2. Основная литература 3. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. – М.: Инфра. – М, 2003. 4.Интерпретация и анализ данных в социологических исследованиях (под редакцией В.Г. Андреенкова и Ю.Н.Толстовой). – М.: Наука, 1987. 5. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Исследование зависимостей. Справочное издание под ред. Айвазяна С.А. – М.: Финансы и статистика, 1985. 6. Ивченко Г.И., Медведев Ю.И. Математическая статистика. – М.: Высшая школа, 1992. 7. Кендалл М., Стьюарт А. Статистические выводы и связи.- М.:Наука,1973 8. Холлендер М., Вулф Д. Непараметрические методы статистики. – М.: Финансы и статистика, 1983. 9. Чистяков В.П. Курс теории вероятностей.-4-е издание- М.: Агар,1996.-256с. 10.3. Дополнительная литература 10. Хьюбер П. Робастность в статистике. – М.: Мир, 1984. Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины «Вероятностные модели» для направления 010400.62 «Прикладная математика и информатика» подготовки бакалавра 11. Хампель Ф., Рончетти Э., Рауссей П., Штаэль В. Робастность в статистике. Подход на основе функции влияния. – М.: Мир, 1989. 12. Хеттманспергер Т. Статистические выводы, основанные на рангах. – М.:Финансы и статистика,1987 13. Дэниел К. Применение статистики в промышленном эксперименте. – М.: Мир, 1979. 11. Материально-техническое обеспечение дисциплины Для проведения семинарских занятий требуется компьютерный класс с установленным ППП SPSS.