УТВЕРЖДАЮ заведующий кафедрой проблем передачи информации ФРТК МФТИ член-корреспондент РАН А.П. Кулешов _________________________ «___» _____________ 2010 г. ДОПОЛНЕНИЕ (задания для домашней самостоятельной работы) к Программе курса доцента, к.ф.-м.н. Мартынова Г.В. «Прикладные пакеты анализа данных» Курс "Пакеты прикладных программ" (для изучения многомерного статистического анализа) предполагает в качестве домашнего задания подготовку отчетов по темам: 1. Многомерные линейные модели, 2. Метод главных компонент, с результатами реализации программ на Матлабе. Структура отчетов: каждый отчет включает 1. Введение. 2. Описание используемых методов. 3. Собственноручно написанную программу на языке «МАТЛАБ», применяющую используемые методы для сгенерированных данных. Студент должен быть в состоянии ответить на вопросы по тексту программы. 4. В отчете должно быть отражена зависимость между задаваемыми параметрами и одним из результатов работы программы. 5. Заключение. Изложить соображения о том, какие трудности могут возникнуть при применении метода к реальным данным. 6. Отчет подается в напечатанном виде. Постановки задач к отчетам: МНОГОМЕРНЫЕ ЛИНЕЙНЫЕ МОДЕЛИ Исследуется модель с размерностью от 5 до 10 (или другой размерностью, по желанию исполнителя). Сначала задаются параметры модели. Затем генерируется матрица объясняющих переменных, вычисляется вектор наблюдений объясняемой переменной с добавлением независимых ошибок измерений с заданной дисперсией. Эти данные используются для оценки параметров модели, дисперсии ошибок и ковариационной матрицы для оценок параметров. Требуется также найти доверительный интервал для какого-либо параметра при известной и неизвестной дисперсии и доверительный интервал для ошибки измерений. Проверить гипотезу адекватности модели данным. В процессе моделирования ввести небольшое отклонение от линейности модели. Определить влияние объема выборки на мощность критерия. Задав несколько значений параметров равными нулю при моделировании данных, требуется провести оценку размерности модели. Вычислить прогноз и его характеристики для каких либо выбранных значений объясняющих переменных. МЕТОД ГЛАВНЫХ КОМПОНЕНТ Выбрать какую-либо ковариационную матрицу размерности не более 10 с заданными собственными значениями, такими, что последние примерно 70% малы по сравнению с первыми. Сгенерировать выборку наблюдений с этой ковариационной матрицей. Оценить ковариационную матрицу и сравнить ее с исходной. Найти собственные значения и собственные векторы оценки ковариационной матрицы. Найти главные компоненты. Обнулить примерно 70% наименьших из них. По новому вектору главных компонент восстановить выборку наблюдений и сравнить с исходной. Исследовать зависимость качества восстановленных наблюдений в зависимости от величины последних малых собственных значений первоначальной ковариационной матрицы. Литература. 1. Лагутин М.Б. Наглядная математическая статистика. «Бином», 2007г. 2. Калинина В.Н., Соловьев В.И. Введение в многомерный статистический анализ. «ГУУ», 2003 (см. В Интернете). 3. Андерсон Т. Введение в многомерный статистический анализ. «Физматгиз», 1963.