РОССИЙСКАЯ ФЕДЕРАЦИЯ МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ Государственное образовательное учреждение высшего профессионального образования ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ «УТВЕРЖДАЮ»: И.о. проректора-начальник управления по научной работе _______________________ Г.Ф. Ромашкина __________ _____________ 2011 г. ОРГАНИЗАЦИЯ НАБЛЮДЕНИЯ ОБЪЕКТА И ОБРАБОТКА ДАНННЫХ. ПОИСК ЗАКОНОМЕРНОСТЕЙ В МАССИВЕ ДАННЫХ Учебно-методический комплекс. Рабочая программа для аспирантов специальности 05.13.18 Математическое моделирование, численные методы и комплексы программ очной и заочной форм обучения «ПОДГОТОВЛЕНО К ИЗДАНИЮ» Автор работы «_03_»_06__2011г. Шапцев В.А Рассмотрено на заседании кафедры ИС «_03_»_06_2011г., протокол № 12. Соответствует требованиям к содержанию, структуре и оформлению. «РЕКОМЕНДОВАНО К ЭЛЕКТРОННОМУ ИЗДАНИЮ» Объем _10_стр. Зав. кафедрой ________________________/А.Г. Ивашко./ «_03_»_06__ 2011 г. Рассмотрено на заседании УМК Института математики, естественных наук и информационных технологий «_28_»_06_2011г., протокол № 4. Соответствует ФГТ к структуре основной профессиональной образовательной программы послевузовского профессионального образования (аспирантура) «СОГЛАСОВАНО» Председатель УМК _____________________/И.Н. Глухих./ «__»________2011г. «СОГЛАСОВАНО»: Начальник отдела аспирантуры и докторантуры_____________М.Р. Сорокина «__»___________2011г. 2011 РОССИЙСКАЯ ФЕДЕРАЦИЯ МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ Государственное образовательное учреждение высшего профессионального образования ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Институт математики естественных наук и информационных технологий Кафедра информационных систем Валерий Алексеевич Шапцев ОРГАНИЗАЦИЯ НАБЛЮДЕНИЯ ОБЪЕКТА И ОБРАБОТКА ДАНННЫХ. ПОИСК ЗАКОНОМЕРНОСТЕЙ В МАССИВЕ ДАННЫХ Учебно-методический комплекс. Рабочая программа для аспирантов специальности 05.13.18 математическое моделирование, численные методы и комплексы программ очной и заочной форм обучения. Тюменский государственный университет 2011 2 Шапцев В.А. Организация наблюдения объекта и обработка данных. Поиск закономерностей в массиве данных. Учебнометодический комплекс. Рабочая программа для аспирантов специальности 05.13.18 математическое моделирование, вычислительные методы и комплексы программ очной и заочной форм обучения. Тюмень, 2011. 10 стр. Рабочая программа составлена в соответствии с ФГТ к структуре основной профессиональной образовательной программы послевузовского профессионального образования (аспирантура). Рабочая программа дисциплины опубликована на сайте ТюмГУ: Организация наблюдения объекта и обработка данных. Поиск закономерностей в массиве данных [электронный ресурс] / Режим доступа: http://www.umk3.utmn.ru., свободный. Рекомендовано к изданию кафедрой информационных систем. Утверждено и.о. проректора-начальника управления по научной работе Тюменского государственного университета. ОТВЕТСТВЕННЫЙ РЕДАКТОР: Шапцев В.А., профессор, д.т.н. © Тюменский государственный университет, 2011. © Шапцев В.А., 2011. 3 1. Пояснительная записка. 1.1. Цели и задачи дисциплины. Целью дисциплины «Организация наблюдения объекта и обработка данных. Поиск закономерностей в массиве данных» является ознакомление аспирантов с современными подходами к организации наблюдения исследуемого объекта, методами информативной обработки данных наблюдений и методами выявления закономерностей в полученных данных. К основным задачам изучения дисциплины относятся: - формирование системного подхода к решению проблемы получения сведений о сложном объекте; - изучение математических методов обработки данных и рядов наблюдений; - изучение методов выявления закономерностей, скрытых в данных. 1.2. Место дисциплины в структуре ООП. «Организация наблюдения объекта и обработка данных. Поиск закономерностей в массиве данных» является дисциплиной факультативного цикла, опирающейся на знания методов математического анализа, линейной алгебры, теории вероятностей и математической статистики, дискретной математики, MS Office. 1.3. Требования к результатам освоения дисциплины. Процесс изучения дисциплины направлен на формирование следующих компетенций. ОК-1 владение культурой мышления, способность к обобщению, анализу, восприятию информации, постановке цели и выбору путей ее достижения, умение логически верно, аргументировано и ясно строить устную и письменную речи. ОК-4 способность научно анализировать социально значимые проблемы и процессы, умение использовать на практике методы гуманитарных, экологических, социальных и экономических наук в различных видах профессиональной и социальной деятельности; 4 ОК-7 умение критически оценивать свои достоинства и недостатки, наметить пути и выбрать средства развития достоинств и устранения недостатков; ОК-10 готовность использовать основные законы естественнонаучных дисциплин в профессиональной деятельности, применять методы математического анализа и моделирования, теоретического и экспериментального исследования; ОК-11 способность к письменной, устной и электронной коммуникации на государственном языке и необходимое знание иностранного языка (хороший английский язык); ОК-16 способен использовать навыки публичной речи, ведения дискуссии и полемики; ПК-31 способность осуществлять поиск, анализировать и систематизировать научную информацию, отечественный и зарубежный опыт по теме исследования. ПК-32 способность определять задачи исследования, проводить эксперименты по заданной методике, обрабатывать полученные данные, анализировать и интерпретировать результаты. ПК-33 способность готовить научные отчеты по результатам выполненных исследований. В результате освоения дисциплины обучающийся должен: знать - основные этапы в процессе организации и осуществления наблюдения объекта, - способы планирования и фиксирования результатов наблюдения; уметь - использовать методы анализа и обработки данных наблюдений, - пользоваться инструментальными средствами обработки данных; владеть - способностью производить эксперименты по заданным методикам с обработкой и анализом их результатов, составлять описание выполненных исследований и подготавливать данные для разработки научных обзоров и публикаций. 2. Трудоемкость дисциплины. 5 Семестр 1. Форма промежуточной аттестации зачет (2 контрольные работы). Общая трудоемкость дисциплины составляет 1 зачетную единицу (36 академических часов: 24 часа самостоятельной работы, 12 часов аудиторных занятий). Реферат. 3. Тематический план. 5 6 6 1 12 2 18 3 36 Формы контроля 4 Из них в интерактивной форме самостоятельная работа* 1 2 1 Планирование наблюдения системы. 2 Описательная статистика данных измерений. 3 Методы анализа данных измерений. 4 Методы оценки зависимостей показателей и параметров объекта Итого: Из них часов в интерактивной форме Практические занятия Тема Виды учебной и самостоятельная работы, час. лекции № Всего часов Таблица 1. Тематический план дисциплины «Организация наблюдения объекта и обработка данных. Поиск закономерностей в массиве данных» 8 4 2 4 2 8 4 КР КР 2 2 8 4 8 4 24 Зачет 8 8 Таблица 2. Планирование самостоятельной работы аспирантов № 1 Темы Планирование наблюдения системы. Виды СРС обязательные дополнительные Работа с литературой, Объем часов 4 6 2 3 4 Описательная статистика данных измерений. Методы анализа данных измерений. Методы оценки зависимостей показателей и параметров объекта ИТОГО: Подготовка к КР. Реферат. Подготовка к КР. Интернетом. Подготовка реферата, его защиты и к контрольным работам. 4 8 8 24 4. Разделы дисциплины и междисциплинарные связи с обеспечиваемыми дисциплинами. Данная дисциплина является основой исследований, связанных с разработкой математических моделей объектов. 5. Содержание дисциплины. Тема 1. Планирование наблюдения системы. Формулирование цели наблюдения. Содержание работ по наблюдению системы. Выбор и шкалирование измеряемых величин. Планы экспериментов. Матрицы активного и пассивного экспериментов. Их цензурирование. Тема 2. Описательная статистика данных измерений. Понятие описательной статистики. Роль средних и среднеквадратичных величин; оценок асимметрии и эксцесса; моды, медианы и других квантилей. Гистограмма. Задачи о проверке гипотез. Тема 3. Методы анализа данных измерений. Кластеризация матрицы эксперимента. Корреляционный анализ матрицы эксперимента. Нормирование данных измерений. Информативные параметры и показатели. Анализ графиков взаимосвязи пар столбцов матрицы эксперимента. Тема 4. Методы оценки зависимостей показателей и параметров объекта. 7 Факторный анализ. Дисперсионный анализ. Регрессионный анализ. Выбор регрессионных моделей. Исследование регрессий. Шаговые методы оценки параметров регрессии. 6. Темы практических занятий. 1. 2. 3. 4. 5. 6. 7. Анализ и исправление матрицы эксперимента . Нормирование значений измеренных величин. Описательная статистика матрицы эксперимента. Проверка гипотез о характере величин столбцов. Корреляционные матрицы Пирсона и Спирмена. Трехфакторная регрессия. Кластеризация данных матрицы эксперимента. 7. Учебно-методическое обеспечение СРС. Оценочные средства. 7.1. Реферат (от лат. refero докладываю, сообщаю), краткое изложение в письменном виде или в форме публичного выступления содержания книги, научной работы, результатов изучения научной проблемы; доклад на определённую тему, включающий обзор соответствующих литературных и других источников. Как правило, Р. имеет научно-информационное назначение. Р., называемые также научными докладами, получили распространение в научноисследовательских учреждениях, высшей школе, в системе политического просвещения, в народных университетах. В общеобразовательной школе и средних специальных учебных заведениях Р. называют специально подготовленные сообщения учащихся на факультативных занятиях и др. Самостоятельная работа аспирантов заключается в углубленном изучении тем, предложенных аспирантам на лекционных и практических занятиях. Контроль самостоятельной работы аспиранта осуществляется в форме защиты реферата по выбранной теме. 7.2. Примерные темы рефератов. Темы рефератов формируются совместно с аспирантом и касаются в основном наблюдений объекта его исследования. 7.3. Примерный перечень вопросов к зачету. 8 1. Понятие наблюдения. 2. Типы задач наблюдения объекта. 3. Этапы наблюдения объекта. 4. Понятие матриц пассивного и активного экспериментов. 5. Цензурирование матрицы эксперимента. 6. Методы исправления матриц экспериментов. 7. Задача планирования эксперимента. 8. Содержание обработки данных в описательной статистике. 9. Формальная постановка задачи о регрессии. 10. Параметры и показатели системы. 11. Критерии принятия решений в обработке данных. 12. Кластеризация данных. 13. Шкалы и размерности наблюдаемых величин. 14. Информативные параметры и показатели. 15. Типы закономерностей, скрытых в массиве данных. 8. Образовательные технологии. Озвучивание материала курса сопровождается мультимедиапрезентацией при связи с Интернетом. Практические занятия проводятся в компьютерном классе, соединенном с Интернетом. Предусмотрены встречи с представителями российских и зарубежных компаний, государственных и общественных организаций, мастер-классы экспертов и специалистов 9. Учебно-методическое и информационное обеспечение дисциплины. 9.1. Основная литература. 1. Лившиц В.Р. Математические методы обработки результатов наблюдений. Часть 1,2. Анализ данных. Учебное пособие. Ч. 1,2 М. Изд-ая группа URSS, 2007. 2. Бакланов А.И. Системы наблюдения и мониторинга. М. Изд-ая группа URSS 2011. 234 с. 3. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. – Новосибирск: Изд-во Ин-та математики СО РАН, 1999. 270с. 9 9.2. Дополнительная литература. 1. Иванов А.В. Опыт применения в медико-биологических исследованиях алгоритма самоорганизующихся карт Кохонена для поиска скрытых закономерностей в массивах данных // Курский научно-практический вестник, 2006. № 2. С.64-69. 2. Монтгомери Д.К. Планирование эксперимента и анализ данных / Пер. с англ. Л.: Судостроение, 1980. 384 с. 9.3. Ресурсы Интернета. 1. ГОСТ 24026-80 Исследовательские испытания. Планирование эксперимента. Термины и определения. http://www.znaytovar.ru/ gost/2/GOST_2402680_Issledovatelskie.html. 2. Васнев С.А. Статистика (учебное пособие) / электронное издание московского государственного университета печати. http://www.hi-edu.ru/e-books/xbook096/01/index.html?part-003.htm. 3. Поиск закономерностей в рядах данных: что есть и чего не хватает? - http://schegloff.livejournal.com/252903.html. 4. Алгебра над алгоритмами и эвристический поиск закономерностей - http://www.machinelearning.ru/wiki/index.php. 5. Современный анализ данных: поиск скрытых закономерностей - http://www.management.com.ua/ims/ims106.html. 9.4. Периодика. 1. Вестник Тюменского государственного университета. Математика. Физика. Информатика. 2. Перспективы науки (ВАК-журнал). 3. Вопросы современной науки и практики. Университет имени В.И.Вернадского. 4. Научно-технические ведомости Санкт-Петербургского государственного политехнического университета. Серия "Наука и образование". 5. Инициативы ХХХI века (ВАК-журнал). 10