статистическая обработка экологических данных

реклама
Федеральное агентство по образованию РФ
Владивостокский государственный университет
экономики и сервиса
_________________________________________________________
СТАТИСТИЧЕСКАЯ ОБРАБОТКА
ЭКОЛОГИЧЕСКИХ ДАННЫХ
Учебная программа дисциплины
по направлению подготовки
020800.62 «Экология и природопользование»
по специальности
020801.65 «Экология»
Владивосток
Издательство ВГУЭС
2009
1
ББК 20
Учебная программа по дисциплине «Статистическая обработка экологических данных» составлена в соответствии с требованиями ГОС
ВПО. Предназначена для студентов направления подготовки 020800.62
«Экология и природопользование», специальности 020801.65 «Экология».
Составитель: М.З. Ермолицкая, канд. биол. наук, доцент кафедры экологии и природопользования.
Утверждена на заседании кафедры экологии и природопользования
28.04.09 г., протокол № 11.
Рекомендуется к изданию учебно-методической комиссией Института информатики, инноваций и бизнес-систем ВГУЭС.
©
2
Издательство Владивостокский
государственный университет
экономики и сервиса, 2009
ВВЕДЕНИЕ
К числу наиболее актуальных проблем современной экологии относится решение задач по исследованию и эксплуатации природных
популяций и экосистем в целом, что связано с обработкой и анализом
больших массивов информации. В связи с этим возникла необходимость
введения учебной дисциплины «Статистическая обработка экологических данных», которая призвана помочь студентам получить базовые
знания по статистике и овладеть навыками применения методов математической статистики для успешного решения поставленных задач.
Изучение данной дисциплины способствует формированию экологического мышления, позволяет приобрести необходимую эрудицию и ключевые компетенции для последующего профессионального изучения
всего комплекса экологических дисциплин.
Дисциплина «Статистическая обработка экологических данных»
читается студентам, обучающимся по специальности «Экология». Она
предназначена для ознакомления учащихся с аппаратом математической статистики для решения различных задач по экологии и природопользованию. Статистический анализ экологических данных является
необходимым этапом при выработке практических рекомендаций для
рационального управления экосистемами и ведения экосистемных научных исследований. Изучение данной дисциплины тесно связано с такими дисциплинами, как «Информатика» и «Высшая математика».
Для понимания и освоения дисциплины «Статистическая обработка
экологических данных» необходимы знания по математике, информатике, теории вероятностей и экологии.
3
1. ОРГАНИЗАЦИОННО-МЕТОДИЧЕСКИЕ УКАЗАНИЯ
1.1. Цель и задачи учебной дисциплины
Целью учебной дисциплины является формирование у студентов
устойчивого положительного отношения к профессии эколога, мотивация к получению профессиональных знаний и созданию «портфеля
компетенций»; а также формирование статистического мышления, необходимого при анализе закономерностей явлений и процессов, происходящих в экологии.
Основные задачи дисциплины – ознакомление студентов с такими
методами анализа экологических данных как дескриптивная обработка,
регрессионный, корреляционный и дисперсионный анализы, многомерные методы. Дисциплина призвана помочь экологам грамотно подходить к анализу имеющейся информации и выбору метода решения конкретных задач в области экологии и природопользования.
1.2. Компетенции, приобретаемые
при изучении данной дисциплины
Изучение данной учебной дисциплины способствует формированию как ключевых, так и профессиональных компетенций, развивающих универсальные готовности, которые востребованы современным
рынком труда.
В результате изучения курса студент овладеет основными понятиями и методами математической статистики, сможет четко формулировать цели и задачи конкретного исследования, проводить статистический анализ данных и анализировать полученные результаты, а также
умело пользоваться статистическим пакетом прикладных программ
Statistica. В процессе изучения данной дисциплины студент получит
навыки работы с библиотечными фондами вуза, включая электронные
базы, для подготовки реферата и самостоятельной работы в целом.
1.3. Основные виды занятий и особенности
их проведения
Дисциплина «Статистическая обработка экологических данных»
общим объемом 176 часов изучается в течение одного семестра. 64 часа
отведено на аудиторные занятия (16 часов – лекции, 48 часов – практические занятия) и 112 часа на самостоятельную работу студентов. Занятия ведутся на основании учебных планов для студентов очной формы
обучения.
4
Основные виды занятий:
Лекции. На лекционных занятиях дается основной систематизированный материал, позволяющий студентам ознакомиться с существующими статистическими методами обработки экологических данных.
Практические занятия. На практических занятиях студент овладевает навыками работы с пакетом статистических программ Satistica,
выполняет ряд контрольных работ по основным темам лекционных занятий.
Самостоятельная работа включает в себя изучение учебной и
научной литературы для закрепления полученных и овладения новыми
знаниями, необходимыми для выполнения практических заданий, контрольных работ и написания реферата.
Взаимосвязь аудиторной и самостоятельной работы студентов заключается в использовании основной и дополнительной литературы, библиотечных электронных баз данных и Интернета при подготовке к аудиторным занятиям и написанию реферата.
1.4. Виды контроля и отчетности по дисциплине
К текущей аттестации относится регулярная проверка знаний у
студентов и степени усвоения учебного материала, т.е. выполнение запланированных контрольных работ и практических заданий на ПЭВМ, а
также предоставление и защита реферата.
Промежуточная аттестация заключается в сдаче экзамена. Экзаменационные требования сводятся к следующему: знание теоретического
материала; умение четко ориентироваться в многообразии методов статистического анализа и целесообразности их применения в конкретном
случае; овладение практическими навыками при работе с пакетом прикладных программ Satistica; способность к использованию дополнительной литературы.
Итоговая оценка по дисциплине формируется на основе результатов текущих и промежуточной аттестаций.
1.5. Техническое и программное обеспечение
дисциплины
Учебная программа дисциплины предполагает выполнение практических заданий на ПЭВМ с использованием пакета статистических программ Satistica, совместимой со средой Windows.
Для эффективного изучения данной дисциплины в библиотеке университета имеется учебная и научная литература по пакету Satistica.
5
2. СОДЕРЖАНИЕ ДИСЦИПЛИНЫ
2.1. Перечень тем лекционных занятий
Тема 1. Обзор компьютерных средств обработки данных
Обзор современных пакетов статистической обработки данных.
Обосновываются преимущества использования некоторых пакетов для
обработки экологической информации на ПЭВМ. Даются основные
принципы записи информации, создание баз данных. Наглядное представление результатов статистического анализа.
Тема 2. Дескриптивные программы обработки данных
Рассматриваются дескриптивные программы обработки экологической информации, включенные в пакет Statistica. В лекциях даются основы статистики одной и нескольких переменных: среднее, медиана,
мода, дисперсия, среднее геометрическое, стандартное отклонение,
асимметрия, эксцесс, размах и др. По нескольким переменным даются
представления о диаграммах рассеивания, ковариации, корреляции. Рассматриваются основные статистические распределения. На конкретных
примерах проводятся практические расчеты описанных выше статистических характеристик.
Тема 3. Регрессионный и корреляционный анализы
Рассматриваются два метода исследования взаимосвязи между
двумя и более непрерывными переменными. Даются теоретические понятия простой и множественной регрессии (линейной и нелинейной),
корреляционной и ковариационной матрицы. На конкретных примерах
приводятся практические расчеты коэффициентов различных видов
регрессии.
Тема 4. Дисперсионный анализ
Даются основы теории общей линейной модели, однофакторный и
многофакторный дисперсионный анализ. На конкретных примерах приводятся расчеты однофакторного и двухфакторного анализа.
Тема 5. Многомерные методы
В лекциях дается описание основных многомерных методов, их
суть и задачи, решаемые с их помощью. Приводятся примеры применения метода главных компонент, кластерного анализа, факторного анализа, дискриминантного анализа, канонического анализа.
6
2.2. Перечень тем практических занятий
(пакет Statistica)
Тема 1. Работа с данными и описательные статистики
Знакомство с пакетом статистических программ Statistica. Рабочее
окно системы. Структура файла данных. Создание файла с исходными
данными. Формирование отчета. Расчет описательных статистик, построение простейших графиков и анализ результатов.
Тема 2. Статистические модули и особенности их работы
Обзор модулей пакета Statistica, структура диалога. Запуск вероятностного калькулятора (модуль Основные статистики и таблицы). На
примерах рассматриваются основные статистические распределения и
игровые задачи. Построение таблицы частот и корреляционной матрицы. Применение t-критерия для зависимых и независимых выборок.
Тема 3. Регрессионный анализ
Запуск модуля «Множественная регрессия», определение коэффициентов корреляции и детерминации, запись уравнения регрессии, анализ остатков. Работа с модулем «Нелинейное оценивание».
Тема 4. Дисперсионный анализ
Решение конкретных задач с помощью дисперсионного анализа,
сравнение средних, анализ таблиц сопряженности и кросстабуляции,
визуализация данных.
Тема 5. Графические возможности системы Statistica
Примеры построения графиков, пользовательские и статистические
графики. Настройка графических установок. Интерактивный графический анализ данных. Связь данных и графиков.
7
3. МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ
ПО ИЗУЧЕНИЮ ДИСЦИПЛИНЫ
В процессе изучения данной дисциплины предполагается, что каждый студент готовит и защищает реферат, выполняет контрольные и
практические работы. Практические работы проводятся для проверки и
закрепления лекционного материала с использованием пакета статистических программ Statistica на ПЭВМ.
Реферат представляет собой самостоятельную и творческую работу
студента, выполняется письменно. Тема реферата выбирается самостоятельно студентом исходя из пройденного материала и основываясь на
проработке рекомендуемой литературы.
Темы рефератов:
1. Обзор компьютерных средств обработки данных.
2. Пакет статистических программ Statgraphics.
3. Пакет статистических программ Statistica.
4. Создание структуры данных для работы со статистическими пакетами. Электронные таблицы с исходными данными.
5. Описательные статистики.
6. Виды случайных величин. Задание дискретной случайной величины.
7. Основные статистические распределения.
8. Нормальное распределение.
9. Распределение Фишера.
10. Показательное распределение.
11. Распределение средней арифметической для выборок из нормальной совокупности. Распределение Стьюдента.
12. Распределение дисперсии выборках их нормальной генеральной
совокупности. Распределение Пирсона.
13. Подбор встроенных распределений: экспоненциальное, логнормальное, Релеевское, Вейбула и др.
14. Проверка статистических гипотез.
15. Проверка на нормальность: тест Шапиро-Уилкса, тесты для малых выборок.
16. Критерий хи-квадрат и его применение.
17. Измерение связи: коэффициенты корреляции, лямбда, неопределенности, R Пирсона, контингенции, V Крамера и другие.
18. Тест Колмогорова-Смирнова, графики квантилей.
19. Множественные ранговые тесты: Тьюки, Шеффе, Бонферони,
Ньюмена-Кеулса, Дункана.
20. Сравнение дисперсий: методы Кокрена, Бартлета, Краскела-Уоллеса.
21. Однофакторный дисперсионный анализ.
8
22. Многофакторный дисперсионный анализ.
23. Дисперсионный анализ с несколькими (но равным количеством)
наблюдениями в каждой ячейке.
24. Дисперсионный анализ с неравным числом наблюдений в ячейке.
25. Корреляционный анализ.
26. Модели простой регрессии: линейная, экспоненциальная, обратная, логарифмическая, логистическая, S-кривая и др.
27. Регрессионный анализ.
28. Множественная регрессия.
29. Метод главных компонент.
30. Кластерный анализ.
31. Факторный анализ.
32. Дискриминантный анализ.
33. Канонический анализ.
3.1.Обзор рекомендованной литературы
В процессе изучения дисциплины «Статистическая обработка экологических данных» студент должен овладеть основами математической статистики. Логически последовательное изложение традиционного курса теории вероятностей и математической статистики, основанное
на исследованиях А.Н.Колмогорова, дается в учебном пособии: Яковлев В.П. Теория вероятностей и математическая статистика: учебное пособие для студентов вузов. М.: Дашков и К*, 2008. Здесь рассмотрены информационные и физические обоснования понятия независимости, проблемы регрессионного подхода и т.д.
При решении статистических задач рекомендуется использовать
учебное пособие: Гмурман В.Е. Руководство к решению задач по
теории вероятностей и математической статистике: учебное пособие для студентов вузов. М.: Высшее образование, 2008. В книге
большое внимание уделено статистическим методам обработки экспериментальных данных. Материал изложен с использованием примеров.
По данной дисциплине предусмотрено проведение практических
занятий с использованием пакета прикладных программ Statistica. Основные разделы этой программы описаны в учебнике: Халафян А.А.
Statistica 6. Статистический анализ данных: учебник. М.: ООО
«Бином-Пресс», 2007. В книге подробно изложены технологии работы
со всеми модулями программы, уделено внимание постановочной части
статистических методов и интерпретации результатов анализа. Рассмотрены процедуры управления данными, графические возможности программы, одномерные и многомерные статистические методы, углубленные методы анализа, временные ряды и прогнозирование, формирование отчета.
9
Для успешного выполнения практических заданий на ПК разработано и издано пособие: Ермолицкая М.З. Статистическая обработка
экологических данных: практикум. Владивосток: Изд-во ВГУЭС,
2006. Книга предназначена для ознакомления студентов на практике с
такими методами анализа данных как дескриптивная обработка, регрессионный, корреляционный и дисперсионный анализы, реализованные с
помощью пакета статистических программ. Для каждого вида анализа
приводится содержательный пример, разработанный на основе экологических данных.
В результате изучения курса студент должен овладеть навыками
математической статистики и умением пользоваться современными пакетами статистической обработки данных.
3.2. Контрольные вопросы
для самостоятельной оценки качества
освоения дисциплины
1. Перечислите наиболее популярные компьютерные средства обработки данных.
2. Дайте краткое описание основных характеристик пакета Statistica.
3. Опишите структуру данных, используемую в статистических
пакетах.
4. Какие программы обработки данных называются дескриптивными?
5. Дайте определения основным понятиям дескриптивной статистики.
6. Объясните в чем различия между дискретной вариацией и непрерывной.
7. Дайте определение понятия «кумулятивная кривая».
8. Перечислите основные свойства дисперсии.
9. Для чего используют первичный анализ данных?
10. Дайте определения следующим понятиям: корреляция, ковариация.
11. Перечислите основные статистические распределения.
12. Каковы особенности нормального распределения.
13. Перечислите встроенные распределения и их особенности.
14. Какие тесты для проверки на нормальность вы знаете?
15. Для чего используются таблицы частот?
16. Какие существуют критерии для проверки гипотезы о законе
распределения?
17. Сформулируйте правило применения критерия хи-квадрат.
18. Перечислите коэффициенты для измерения связи.
10
19. Для чего используют тест Колмогорова-Смирнова?
20. В чем заключается сущность однофакторного дисперсионного
анализа?
21. Для чего используется F-отношение в дисперсионном анализе?
22. Дайте основные характеристики множественным ранговым тестам: Тьюки, Шеффе, Бонферони.
23. Опишите следующие методы для сравнения дисперсий: методы
Кокрена, Бартлета, Краскела-Уоллеса.
24. В чем заключается сущность двухфакторного дисперсионного
анализа?
25. Каковы особенности дисперсионного анализа с несколькими (но
равным количеством) наблюдениями в каждой ячейке?
26. Каковы особенности дисперсионного анализа с неравным числом наблюдений в ячейке?
27. Опишите основные этапы многофакторного дисперсионного
анализа.
28. Какова сущность корреляционного анализа?
29. Перечислите модели простой регрессии.
30. Для чего используется регрессионный анализ?
31. Перечислите этапы проведения регрессионного анализа.
32. Что показывает коэффициент детерминации?
33. Какой метод используется для оценки коэффициентов регрессии?
34. Для чего используется статистика Дурбина-Ватсона?
35. Сформулируйте основную идею множественного регрессионного анализа.
36. Объясните в чем разница между парными, частными и совокупными коэффициентами корреляции.
37. Перечислите многомерные методы статистического анализа.
38. В чем заключается основная идея метода главных компонент?
39. Каковы особенности кластерного анализа?
40. Какие задачи решают с помощью факторного анализа?
41. В чем заключается основная идея дискриминантного анализа?
42. Для каких целей используют канонический анализ?
43. Контрольные вопросы по пакету Statistica
44. Объясните в чем разница между электронными таблицами
Scrollsheet и Spreadsheet.
45. Перечислите способы ввода данных в пакете Statistica.
46. Опишите статистические модули и особенности их работы.
47. С помощью какого модуля можно провести первичную обработку данных, выяснить их структуру и определить зависимость между
данными?
48. Для чего используют Вероятностный калькулятор?
11
49. Что такое отчет?
50. В каком модуле можно построить корреляционную матрицу?
51. Какой модуль позволяет изучить связь между одной зависимой
переменной и несколькими (или одной) независимыми переменными?
52. Какие нелинейные модели можно оценить с помощью модуля
Нелинейное оценивание?
53. Какой модуль используется для оценки степени воздействия
фактора на измеряемые данные?
54. Опишите графические возможности пакета Statistica.
12
4. СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ
4.1. Основная литература
Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике: учебное пособие для студентов вузов. М.: Высшее образование, 2008. – 404 с.
Ермолицкая М.З. Статистическая обработка экологических данных:
Практикум. Владивосток: Изд-во ВГУЭС, 2006. – 48 с.
Халафян А.А. Statistica 6. Статистический анализ данных. Учебник.
М.: ООО «Бином-Пресс», 2007. – 512 с.
Яковлев В.П. Теория вероятностей и математическая статистика:
учебное пособие для студентов вузов. М.: Дашков и К*, 2008. – 184 с.
4.2. Дополнительная литература
Боровиков В.П., Боровиков И.П. Statistica. Статистический анализ и
обработка данных в среде Windows: справочно-учебное пособие. М.:
«Филинь», 1997. – 608 с.
Бородин А.Н. Элементарный курс теории вероятностей и математической статистики: учеб. пособие для вузов. СПб.: Лань, 2002. – 254 с.
Гмурман В.Е. Теория вероятностей и математическая статистика:
учеб. пособие. М.: Высшая школа, 2002. – 480 с.
Горелова Г.В., Кацко И.А. Теория вероятностей и математическая
статистика в примерах и задачах с применением Excel: учеб. пособие
для вузов. Ростов н/Д.: Феникс, 2002. – 400 с.
Громыко Г.Л. Теория статистики: практикум: учеб. пособие для
студентов вузов. – 4-е изд. М.: ИНФРА-М, 2008. – 240 с.
Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ. М.: Мир, 1982. – 488 с.
Боровиков В.П. Популярное введение в программу Statistica. М.:
Компьютер Пресс, 1998. – 267 с.
Боровиков В.П., Боровиков И.П. Statistica: искусство анализа данных на компьютере. Для профессионалов. СПБ: Питер, 2001. – 656 с.
Венецкий И.Г., Венецкая В.И. Основные математико-статистические понятия и формулы в экономическом анализе: справочник. М.:
Статистика, 1979. – 447 с.
Дюк В. Обработка данных на ПК в примерах. СПБ.: Питер, 1997. –
240 с.
Елисеева И.И. Общая теория статистики: учебник для вузов. М.:
Финансы и статистика, 2002. – 479 с.
Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере: учеб. пособие. М.: ИНФРА-М. 1995. – 528 с.
13
СОДЕРЖАНИЕ
ВВЕДЕНИЕ ....................................................................................................1
1. ОРГАНИЗАЦИОННО-МЕТОДИЧЕСКИЕ УКАЗАНИЯ .......................4
2. СОДЕРЖАНИЕ ДИСЦИПЛИНЫ ............................................................6
3. МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ
ПО ИЗУЧЕНИЮ ДИСЦИПЛИНЫ ..........................................................8
4. СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ ..................................13
14
Учебно-методическое издание
Составитель
Ермолицкая Марина Захаровна
СТАТИСТИЧЕСКАЯ ОБРАБОТКА
ЭКОЛОГИЧЕСКИХ ДАННЫХ
Учебная программа дисциплины
по направлению подготовки
020800.62 «Экология и природопользование»
по специальности
020801.65 «Экология»
В авторской редакции
Компьютерная верстка Н.А. Игнатьевой
15
Лицензия на издательскую деятельность ИД № 03816 от 22.01.2001
Подписано в печать 20.11.2009. Формат 60 84/16.
Бумага писчая. Печать офсетная. Усл. печ. л. 1,0.
Уч.-изд. л. 1,0. Тираж 20 экз. Заказ
________________________________________________________
Издательство Владивостокский государственный университет
экономики и сервиса
690600, Владивосток, ул. Гоголя, 41
Отпечатано: множительный участок ВГУЭС
690600, Владивосток, ул. Державина, 57
16
Скачать