РАЗРАБОТКА МЕТОДИКИ МОНИТОРИНГА ИНФОРМАЦИОННЫХ РЕСУРСОВ СЕТИ ИНТЕРНЕТ А.В.Бухановский, А.Б.Дегтярев, А.Б.Подолякин Институт высокопроизводительных вычислений и баз данных Миннауки РФ, СанктПетербург Тел.: (812) 251-00-38, 251-90-92, факс: (812) 251-83-14, e-mail: avb@fn.csa.ru, deg@fn.csa.ru Бурное развитие Интернет в России в последнее время повлекло за собой появление различных информационных ресурсов, в том числе и научного характера. Многие учебные и научные организации, как коммерческие, так и государственные, размещают свои материалы в сети. При этом распространение информации носит, зачастую, неорганизованный и хаотичный характер. Это затрудняет, с одной стороны, поиск интересующих информационных ресурсов, с другой стороны, управление и обеспечение устойчивой и бесперебойной работы серверов различного уровня и назначения. В связи с этим, большое значение приобретает возможность мониторинга ресурсов, построение прогностических моделей, позволяющих эффективно предлагать, как размещать ресурсы и управлять предоставлением их самым широким кругам заинтересованных лиц. Немаловажной проблемой в этой связи представляется выявление, классификация и предупреждение анормальных ситуаций, например, перегрузка канала, распространение большого количества сообщений неинформативного характера, блокирующих работу различных серверов и служб в сети Интернет. Также важно выявлять ресурсы, которые представляют наибольший интерес, определять географию пользователей, которые обращаются к тем или иным сервисам и службам. Для того чтобы обеспечить качественный мониторинг работы сервера, необходимо создать достаточно сложный программный комплекс, позволяющий, с одной стороны, фиксировать и хранить различную информацию об обращениях к серверу, с другой стороны, обладающего эффективными математическими методами для обработки собираемой информации. Выявление закономерностей в работе сервера позволит достаточно точно выявлять причины и частично предупреждать нарушения его функционирования. Существует несколько классов информационных каналов, каждый из которых обладает своими особенностями. Среди них можно выделить: 1. WWW. Особенностью этого канала является сложная структура взаимосвязи отдельных элементов – WWW-серверов. Проблемами работы этого канала являются сложность поиска необходимых ресурсов, перегрузка канала за счет большого количества обращений (в том числе и многократное, к несуществующим ресурсам, что бывает вызвано некорректным поведением некоторых программ) или слишком большого потока передаваемой информации, непропорциональное распределение запросов и обращений к различным частям сервера. 2. Почтовые службы. Для этого класса информационных каналов основной проблемой в последнее время является рассылка большого количества неинформативных сообщений, так называемых информационных бомб. Такие рассылки приводят к блокировке работы как почтовых служб, так и всей сети в целом. 3. Удаленный и распределенный доступ к суперкомпьютерам. Многими научными организациями и отдельными исследователями используются вычислительная мощь современных суперкомпьютеров различной архитектуры. При этом важной проблемой становится неравномерное сочетание между числом пользователей и их задачами и ресурсами суперкомпьютеров. В докладе предложен метод оценки эффективности работы информационных каналов, выделения параметров, характеризующих эту эффективность. В работе намечен подход к построению модели, которая необходима для такого мониторинга. Она должна обладать нескольким свойствами: – многомерность характеристик; – нестационарность и неоднородность; – неопределенность. Прежде всего, при построении модели видятся модели динамической регрессии со случайными коэффициентами. Следует отметить адаптивность модели, т.е. включение локализованных сбоев в обучающую выборку. Построение такой модели позволит создать общую систему мониторинга на единой основе и для WWW, и для почтовых служб, и для доступа к суперкомпьютерам. Данная система будет реализована на серверах Института высокопроизводительных вычислений и баз данных (ИВВиБД). Построение данной модели позволит создать систему поддержки и принятия решений администратора серверов Института.