Статистические методы обработки данных

реклама
УТВЕРЖДАЮ
Проректор-директор ИК
___________Сонькин М.А.
«___»_____________2011 г.
РАБОЧАЯ ПРОГРАММА ДИСЦИПЛИНЫ
СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ ДАННЫХ
НАПРАВЛЕНИЕ ООП 230400 Информационные системы и технологии
ПРОФИЛЬ ПОДГОТОВКИ Геоинформационные системы
КВАЛИФИКАЦИЯ (СТЕПЕНЬ)
магистр
БАЗОВЫЙ УЧЕБНЫЙ ПЛАН ПРИЕМА
2011 г.
КУРС 1 СЕМЕСТР 1
КОЛИЧЕСТВО КРЕДИТОВ
ПРЕРЕКВИЗИТЫ
КОРЕКВИЗИТЫ
М1.Б2.1
4 кредита ECTS
ВИДЫ УЧЕБНОЙ ДЕЯТЕЛЬНОСТИ И ВРЕМЕННОЙ РЕСУРС:
Лекции
27 час.
Лабораторные занятия
27 час.
АУДИТОРНЫЕ ЗАНЯТИЯ
54 час.
САМОСТОЯТЕЛЬНАЯ РАБОТА
108 час.
ИТОГО
162 час.
ФОРМА ОБУЧЕНИЯ
очная
ВИД ПРОМЕЖУТОЧНОЙ АТТЕСТАЦИИ
экзамен
ОБЕСПЕЧИВАЮЩЕЕ ПОДРАЗДЕЛЕНИЕ
кафедра ВТ
ЗАВЕДУЮЩИЙ КАФЕДРОЙ _____________ Марков Н.Г., профессор
РУКОВОДИТЕЛЬ ООП
______________ Марков Н.Г., профессор
ПРЕПОДАВАТЕЛЬ
______________ Кацман Ю.Я., доцент
2011 г.
1. Цели освоения дисциплины
Основными целями дисциплины являются: ознакомление студентов с основными
принципами анализа случайных данных; получение навыков работы и исследований с
применением профессиональных математических пакетов.
При изучении данной дисциплины основное внимание уделяется методам первичной обработки данных (точечное и интервальное оценивание), проверке статистических
гипотез, методам корреляционного и регрессионного анализа. Для специалистов данного
направления особый интерес представляют методы кластерного и факторного анализа,
анализа временных рядов, изучению которых уделяется большое внимание.
Поставленные цели полностью соответствуют целям (Ц1-Ц5) ООП.
2. Место дисциплины в структуре ООП
Дисциплина «Статистические методы обработки данных» (М1.В.3) является дисциплиной вариативной части общенаучного цикла (М1).
Для её успешного усвоения необходимы знания, базовых понятий математического анализа, линейной алгебры и аналитической геометрии, дискретной математики, информатики, программирования, вычислительной математики, теории вероятностей, математической статистики, теории оптимизации, систем искусственного интеллекта, полученные при обучении в бакалавриате.
Кореквизитом является дисциплина «Нейроэволюционные вычисления» (М1.Б2.1).
3. Результаты освоения дисциплины
Планируемыми результатами освоения дисциплины является способность применять
глубокие естественнонаучные знания для решения научных и инженерных задач наукоемкого производства интеллектуальных систем (ГИС) на мировом уровне (Р1).
В результате освоения дисциплины студент должен:
Знать:
- методы получения "хороших оценок"; статистические методы проверки параметрических и непараметрических гипотез; методы регрессионного и дискриминантного анализа (З.1.3.1);
- методы идентифицирования модели, оценки качества и параметров модели
(З.1.3.2);
уметь:
- проводить точечное и интервальное оценивание экспериментальных данных
(У.1.3.1);
- проанализировать исходные данные, выдвигать и проверять гипотезы (параметрические и непараметрические) (З.1.3.2);
владеть:
- статистическими пакетами для обработки и анализа экспериментальных данных, в
том числе пакетом Statistica (В.1.3.1).
В процессе освоения дисциплины у студентов развиваются следующие компетенции:
1.Универсальные (общекультурные) – способность совершенствовать и развивать
свой интеллектуальный и общекультурный уровень (ОК-1 ФГОС);
2. Профессиональные:
- умение разрабатывать новые методы и средства проектирования информационных
систем (ПК-2 ФГОС);
2
умение воспроизводить знания для практической реализации новшеств (ПК-16
ФГОС).
-
4. Структура и содержание дисциплины
4.1 Аннотированное содержание разделов дисциплины:
1. Элементы математической статистики. Основные понятия и задачи статистики. Выборочное оценивание. Требование "хороших" оценок: несмещенность, эффективность и состоятельность.
2. Интервальное оценивание. Доверительные интервалы для выборочного среднего и выборочной дисперсии. Распределения Стьюдента и "хи - квадрат".
3. Проверка статистических гипотез. Ошибки первого и второго рода. Гипотеза о
равенстве двух выборочных средних, двух выборочных дисперсий. Критерий Пирсона.,
Колмогорова, Колмогорова – Смирнова.
4. Обработка данных в рамках линейной регрессионной
модели. Линейный корреляционный анализ. Линейная регрессия, подбор параметров
прямой. Множественная регрессия.
5. Факторный анализ. Факторный анализ методами наименьших квадратов и максимального правдоподобия. Метод минимальных остатков в факторном анализе.
6. Кластерный анализ. Методы иерархической классификации. Многомерное
шкалирование.
7. Анализ временных рядов и прогнозирование. Экспоненциальное сглаживание
и прогнозирование. Спектральный (Фурье) анализ. Анализ распределенных лагов.
4.2
Структура дисциплины по разделам и формам организации обучения
приведена в таблице 1.
Таблица 1.
Структура дисциплины по разделам и формам организации обучения
Название раздела/темы
Аудиторная СРС Колл,
работа (час) (час Контр.
)
Р.
Лек- Лаб.
ции
зан.
Защита
2
2
8
1.Элементы математической статистики
лаб. раб.
№1
2.Интервальное оценивание
3
2
10
3.Проверка статистических гипотез
4
4
15
4.Обработка данных в рамках линейной регрессионной модели
4
6
20
5.Факторный анализ
5
4
20
7.Кластерный анализ
4
64
15
7.Анализ временных рядов и прогнозирование
5
5
20
Итого
27
27
108
3
Итого
12
15
Защита
лаб. раб.
№2
23
30
Защита
лаб. раб.
№3
29
23
Защита
лаб. раб.
№4
30
162
4.3 Распределение компетенций по разделам дисциплины
Таблица 2.
Распределение по разделам дисциплины планируемых результатов обучения
№ Формируемые
компетенции
1.
2.
3.
4.
5.
З.1.3.1
З.1.3.2
У.1.3.1
У.1.3.2
В.1.3.1
1
+
+
Разделы дисциплины
3
4
5
+
+
+
+
2
+
+
+
+
+
+
+
+
+
+
6
7
+
+
+
+
5. Образовательные технологии
При освоении дисциплины используются следующие сочетания видов учебной работы с методами и формами активизации познавательной деятельности магистрантов для
достижения запланированных результатов обучения и формирования компетенций
(табл.3).
Таблица 3.
Методы и формы организации обучения (ФОО)
ФОО
Лекц.
Лаб. раб.
СРС
Методы
IT-методы
+
+
+
Работа в команде
+
+
Case-study
Игра
Методы проблемного обучения.
+
+
Обучение на основе опыта
+
+
Опережающая самостоятельная работа
+
+
+
Проектный метод
+
+
Поисковый метод
+
+
Исследовательский метод
+
+
Другие методы
Для достижения поставленных целей преподавания дисциплины реализуются
следующие средства, способы и организационные мероприятия:
 использование мультимедийного оборудования на лекциях, на лабораторных работах и СРС – компьютерного оборудования;
 самостоятельное изучение теоретического материала дисциплины с использованием Internet-ресурсов, информационных баз, методических разработок, специальной учебной и научной литературы;
 закрепление теоретического материала при проведении лабораторных работ и СРС
с использованием учебного и научного оборудования и приборов, выполнения проблемноориентированных, поисковых, творческих заданий.
6. Организация и учебно-методическое обеспечение
самостоятельной работы студентов
4
6.1 Самостоятельную работу студентов (СРС) можно разделить на текущую и
творческую.
Текущая СРС – работа с лекционными и учебно-методическими
материалами, включая образовательные ресурсы, представленные в сети Internet и Intranet.
Творческая проблемно-ориентированная самостоятельная работа
(ТСР) – заключается в поиске информации (учебники, монографии, интернет ресурсы);
изучении методов статистического анализа и представления данных; проведении
различных компьютерных экспериментов (исследований) в среде математического пакета
Statistica..
6.2 Содержание самостоятельной работы студентов по дисциплине
направлено на углубление и закрепление знаний, развитие практических умений и
навыков и включает:
- подготовку к лабораторным работам;
- изучение теоретических учебно-методических материалов при опережающей
самостоятельной работе;
- работу с литературой (интернет) при изучении тем, вынесенных на самостоятельную
проработку;
- подготовку к защите лабораторных работ;
- подготовку к экзамену.
6.3 Контроль самостоятельной работы
Оценка результатов самостоятельной работы организуется как единство двух форм:
самоконтроль и контроль со стороны преподавателя.
С целью самоконтроля каждая тема (раздел) в учебно-методических материалах завершается набором контрольных вопросов. Аналогичный подход реализован при выдаче
лабораторных (4 работы).
По результатам текущего контроля формируется допуск студента к экзамену. Экзамен проводится в письменной форме и оценивается преподавателем.
6.4 Учебно-методическое обеспечение самостоятельной работы студентов
Для самостоятельной работы студенты в компьютерных классах кафедры обеспечены неограниченным доступом к сетевым ресурсам Internet, учебно-методические и
справочные
материалы
размещены
в
сети
по
адресу:
ftp://ftp.vt.tpu.ru/study/Katsman/public/Statistica/.
7. Средства (ФОС) текущей и итоговой оценки качества
освоения дисциплины
Текущий контроль по каждому разделу дисциплины осуществляется преподавателем, при этом учитывается своевременность и полноту проведенных исследований при
выполнении каждой лабораторной работы. При защите работы обязательно оценивается
исследовательская составляющая и знание теории.
Итоговый контроль осуществляется лишь при успешном выполнении всего объёма
лабораторных заданий:
 итоговый контроль проводится, как правило, в письменном виде;
 результаты контроля оцениваются в баллах на основе рейтинговой системы, принятой в томском политехническом университете, и учитывают баллы, набранные при
текущем контроле.
5
Для подготовки к сдаче итогового контроля (экзамена) предложен набор теоретических вопросов. Каждый билет включает два теоретических вопроса и один практический.
6
8. УЧЕБНО-МЕТОДИЧЕСКОЕ И ИНФОРМАЦИОННОЕ
ОБЕСПЕЧЕНИЕ ДИСЦИПЛИНЫ
1.
2.
3.
4.
5.
6.
7.
8.
9.
Основная
Справочник по прикладной статистике. В 2-х т. Т. 1, 2: Пер. с англ. / Под ред. Э.
Ллойда, У. Ледермана, Ю.Н. Тюрина. М.: Финансы и статистика, 1989, 1990.
Бендат Дж., Пирсол А. Прикладной анализ случайных данных: Пер. с англ. – М.:
Мир, 1989. – 540 с.
Марпл.-мл. С.Л. Цифровой спектральный анализ и его приложения: Пер. с англ. –
М.: Мир, 1990. – 584 с.
Статистические методы для ЭВМ / Под ред. К. Энслейна, Э. Рэлстона, Г.С. Уилфа:
Пер. с англ. – М.: Наука. Гл. ред. физ.-мат. лит.,1986.-464 с.
Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере / Под ред. В.Э. Фигурнова. – М.:ИНФРА – М.: Финансы и статистика, 1995. - 384 с.
В.П. Боровиков, И.П. Боровиков. STATISTICA® - Статистический анализ и обработка данных в среде Windows® - М.: Информационно – издательский дом "Филинъ", 1998.- 608 с.
Боровиков В.П., Ивченко Г.И. Прогнозирование в системе STATISTICA® в среде
Windows. Основы теории и интенсивная практика на компьютере: Учеб. пособие. М.: Финансы и статистика, 1999. - 384 с.
Кремер Н.Ш. Теория вероятностей и математическая статистика: Учебник для вузов.
– М.: ЮНИТИ – ДАНА, 2002. – 543 с.
Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников.- М.: ФИЗМАТЛИТ, 2006,-816 с.
Дополнительная
1.
2.
3.
4.
5.
6.
7.
8.
Айвазян, Мхитарян “Прикладная статистика и основы эконометрики”, М.: Юнити,
1998.
Green “Econometric Analysis”, 3d edition, Prentice Hall, 1997.
Hardle, W. and O. Linton (1994) Applied Nonparametric Methods, in Handbook of Econometrics, Vol. 4, Elsevier Science, North Holland.
Hardle, W. (1990) Applied Nonparametric Regression. Cambridge University Press.
Franses, P. and D. van Dijk (2000) Nonlinear Time Series Models in Empirical Finance,
Chapter 5, Cambridge University Press.
Pagan, A. and A. Ullah (1999) Nonparametric Econometrics, Cambridge University Press.
Mee R.W. Simultaneous tolerance intervals for normal population with common variance
//Technometrics. 1990. V. 32. № 1, P. 83-92.
Prescott P. An approximate test for outlier in linear models//Technometrics, 1975. V. 17,
№1.P. 129-132.
Программное обеспечение и Internet-ресурсы
1.
2.
3.
http://exponenta.ru/
http://www.exponenta.ru
Раздел Statistica.
http://www.nnspu.ru/Exponenta_Ru/educat/systemat/kabanov/main.asp.htm
Проведение регрессионного анализа при помощи модуля Multiple Regressions
4. http://www.cultinfo.ru/fulltext/1/001/008/096/007.htm
5. http://lanserv2.kemsu.ru/faculty/kmc/book/matekon/Chapter9/par9_3.html Линейный регрессионный анализ
6. Используемые языки (среды):
• Statistica 6.1
7
• Borland Delphi 7 (Pascal)
• Microsoft Visual C++ 8
• JAVA 1.6.0
9. Материально-техническое обеспечение дисциплины
При изучении данной дисциплины, самостоятельной работе студентов и выполнении
лабораторных работ в компьютерных классах кафедры используются современные персональные компьютеры, оснащенные лицензионным программным обеспечением и неограниченным доступом в Internet.
Программа составлена на основе Стандарта ООП (МП) ТПУ в соответствии с требованиями ФГОС по направлению 230400 Информационные системы и технологии», профилю подготовки «Геоинформационные системы».
Программа одобрена на заседании кафедры ВТ
(протокол № 14 от « 08 » 09 2011 г.).
Автор
доцент кафедры ВТ Кацман Юлий Янович
Рецензент профессор кафедры ВТ Марков Николай Григорьевич
8
Скачать