АНАЛИЗ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ ИНТЕЛЛЕКТУАЛЬНЫХ МЕТОДОВ К.Б. Корыкбасова Восточно-Казахстанский государственный университет имени С. Аманжолова, г. Усть-Каменогрск, Казахстан В настоящее время информационные технологии широко используются во всех областях жизни человека. Система образования не стала исключением. Годами накапливалось множество информации о студентах, их успеваемости, преподавателях, создавались дистанционные курсы обучения студентов, образовательные форумы, системы тестирования студентов, продолжать можно бесконечно. Таким образом, накопилась масса информации. И в настоящее время крайне актуальным стал вопрос обработки этой информации, возможности извлечения новых знаний из уже представленных в базах данных, хранилищах и т.д. Существует множество задач, в которых методы статистики, машинного обучения и извлечения знаний (data mining) очень полезны как для учащихся, так и для преподавателя и для людей, ответственных за весь образовательный процесс в целом. Анализ данных позволяет лучше понять студентов, узнать какие предметы вызывают большие затруднения, как лучше построить курс, чтобы получить максимально высокие баллы, с какими тестами студенты справляются, какую форму занятий предпочитают, в какой области научных интересов преуспевают и т.д. Эти данные могут быть использованы для принятия эффективных решения по управлению образовательным процессом. Анализ данных – область математики и информатики, занимающаяся построением и исследованием наиболее общих математических методов и вычислительных алгоритмов извлечения знаний из экспериментальных данных; процесс исследования, фильтрации, преобразования и моделирования данных с целью извлечения полезной информации и принятия решений. Анализ данных имеет множество аспектов и подходов, охватывает разные методы в различных областях науки и деятельности. Интеллектуальный анализ данных (DM – data mining) как раз занимается обработкой и анализом данных из образовательного процесса. Это область науки, связанная с разработкой методов для изучения уникальных типов данных, поступающих из образовательной сферы и использование этих методов для лучшего понимания студентов и условий в которых они учатся. Основные направления в данной области - использование анализа анных для поддержки интеллектуальных систем обучения (Intelligence Tutoring Systems), анализ образовательных процессов, визуализация данных и паттернов образовательного процесса. Область Data Mining началась с семинара (англ. workshop), роведѐнного Григорием Пятецким-Шапиро в 1989 году. Ранее, работая в компании GTE Labs, Григорий Пятецкий-Шапиро заинтересовался вопросом: можно ли автоматически находить определѐнные правила, чтобы ускорить некоторые запросы к крупным базам данных. Тогда же было предложено два термина Data Mining («добыча данных») и Knowledge Discovery In Data (который следует переводить как «открытие знаний в базах данных»). Знания, добываемые методами Data mining, принято представлять в виде моделей (рисунок1). Рисунок 1 – Модели представления знаний Data Mining В 1993 году вышла первая рассылка «Knowledge Discovery Nuggets», а в 1994 году был создан один из первых сайтов по Data Mining. Основу методов Data Mining составляют всевозможные методы классификации, моделирования и прогнозирования, основанные на применении деревьев решений, искусственных нейронных сетей, генетических алгоритмов, эволюционного программирования, ассоциативной памяти, нечѐткой логики. К методам Data Mining нередко относят статистические методы (дескриптивный анализ, корреляционный и регрессионный анализ, факторный анализ, дисперсионный анализ, компонентный анализ, дискриминантный анализ, анализ временных рядов, анализ выживаемости, анализ связей). Такие методы, однако, предполагают некоторые априорные представления об анализируемых данных, что несколько расходится с целями Data Mining (обнаружение ранее неизвестных нетривиальных и практически полезных знаний). Одно из важнейших назначений методов Data Mining состоит в наглядном представлении результатов вычислений (визуализация), что позволяет использовать инструментарий Data Mining людьми, не имеющими специальной математической подготовки. В то же время, применение статистических методов анализа данных требует хорошего владения теорией вероятностей и математической статистикой. Разработка информационной системы мониторинга и управления вузом обусловлена высокой стоимостью готовых решений, отсутствием жестко регламентированных функциональных моделей в системе образования и специфическими особенностями вузов. Кроме того, большинство функционирующих в вузах информационных систем носят фрагментарный характер, не ориентированы на информационные потребности студентов, преподавателей, сотрудников вуза и иных заинтересованных лиц, не позволяют осуществлять мониторинг образовательного процесса, не обеспечивают комплексную поддержку принятия управленческих решений. Список литературы 1 Барсегян А.А., Куприянов M.С., Степаненко В.В., Холод И.И. Технологии анализа данных: Data Mining, Visual-Minings Text Mining, OLAP//- 2-е: изд-во.,перераб.и доп.- СИб.: БХВ-Петербург, 2008.-384c.ISBN978-5-94157-991-4. 2 В.А. Дюк, А.В. Флегонтов, И.К. Фомина, Применение технологий интеллектуального анализа данных в естественнонаучных, технических и гуманитарных областях.