Программа дисциплины «Пространственная статистика и анализ географических данных» Лектор: Самсонов Тимофей Евгеньевич, старший научный сотрудник кафедры картографии и геоинформатики Целью дисциплины является приобретение студентами знаний о методах численного анализа пространственных закономерностей размещения географических объектов и явлений, нахождения пространственных связей, построения моделей, автоматизированной статистической графики и построения карт. − − − − − − Задачи дисциплины: Познакомить с основами пространственной статистики, теорией и различными моделями размещения географических объектов, их географическими приложениями. Сформировать представление о стохастических пространственных процессах, методах анализа точечных распределений и пространственной выборки, геостатистики, анализа данных, привязанных к площадным территориальным единицам, дать понятие о кластерности, автокорреляции, соседстве и весах пространственных отношений. Обучить вычислению и анализу основных функций пространственной статистики: G-, F-, B-, K-функции Рипли, I-индекса Морана, индекса и диаграммы Моришита, методам кластеризации точек, методам восстановления поверхностей по точечным и площадным данным, оценке пространственной корреляции и пространственных связей, построению вариограмм, геостатистических моделей, их диагностике, а также получению географических выводов и районирования на их основе. Познакомить с различными методами графического представления статистических показателей, методами классификации и предварительного преобразования данных. Обучить методам работы с табличными и пространственными данными в среде и на языке R, вычисления основных статистических характеристик для пространственных и непространственных данных, автоматизированного построения карт и графиков, формирования и экспорта отчетов. Сформировать представление о приложениях пространственной статистики в экологии, гидрометеорологии, физической географии, социально-экономических исследованиях. В результате освоения дисциплины обучающийся должен: Знать: теорию пространственной статистики, формулы основных функций, методику их расчета на основе пространственных данных, построения графиков на их основе, прогнозирования значений в точках на основе геостатистических расчетов, соответствие полученных значений и географических закономерностей пространственных распределений. Уметь: вычислять и анализировать значения пространственных статистических функций, тестов, давать им географическую интерпретацию, строить фактические и теоретические (модельные) графики для разных типов пространственных распределений, сравнивать их, подготавливать и классифицировать исходные данные для анализа в программной среде, выполнять анализ средствами языка программирования R. Владеть: методами пространственной статистики, методами классификации числовых рядов, языком программирования R и техникой анализа пространственных данных с его применением, статистической графикой, специальной терминологией. Содержание дисциплины Часть 1. Теоретические модели и факторы размещения объектов в географии. Понятия формы, расстояний, близости и соседства. Кластерность и автокорреляция. Граничные эффекты. Пространственные связи и конфигурации местоположений. Географическая интерполяция и экстраполяция. Примеры из социально-экономической географии, гидрометеорологии, экологии, физической географии. Часть 2. Фундаментальные положения пространственной статистики. Основные стохастические процессы. Понятие об абсолютной пространственной случайности. Типы пространственных распределений и их встречаемость в реальном мире. Методы пространственной выборки. Часть 3. Основы языка программирования R для статистических расчетов и его возможности для анализа пространственных данных. Работа с файлами и массивами данных. Импорт, экспорт, визуализация пространственных данных, работа с проекциями. Статистическая графика в R. Методы классификации данных и их реализация средствами R. Часть 4. Анализ точечных распределений. Расстояние до ближайшего соседа, Gфункция и F-функция. Расстояние до границы и B-функция. Хаусдорфово расстояние для оценки расстояния между множествами точек. Кластерность распределения точек, Kфункция Рипли, индекс и диаграмма Моришита. Методы кластеризации К-средних и ISODATA. Вычисление и анализ данных функций средствами языка R.Географическая интерпретация результатов. Часть 5. Анализ данных, привязанных к площадям. Проблема модифицируемой площадной единицы (MAUP). Пространственное соседство и методы его оценки. Графы смежности на основе триангуляции Делоне, сфер влияния, графа Гэбриела. Оценка соседства на основе расстояний. Понятие о весах пространственных связей и методах их оценки. Использование весов для симуляции автокорреляции. Тесты на автокорреляцию. Индекс Морана. Анализ площадных данных средствами R. Географическая интерепретация результатов. Часть 6. Интерполяция и геостатистика. Исследовательский анализ данных. Понятие об автокорреляции и I-индекс Морана. Оценка пространственной корреляции с помощью вариограммы. Предсказание значений в точках. Диагностика моделей и геостатистическая симуляция. Преобразование данных перед интерполяцией. Восстановление непрерывных полей распределения на основе точечных и площадных данных. Геостатистический анализ средствами R. Географическая интерпретация результатов.