Информационные системы, ориентированные на представление данных о погоде и климате в сети Интернет А.З. Фазлиев, Н.А. Лаврентьев Институт оптики атмосферы СО РАН ЭЛЕКТРОННЫЕ БИБЛИОТЕКИ: ПЕРСПЕКТИВНЫЕ МЕТОДЫ И ТЕХНОЛОГИИ, ЭЛЕКТРОННЫЕ КОЛЛЕКЦИИ Десятая Всероссийская научная конференция Дубна, 7 - 11 октября 2008 года Содержание • • • • • • • Уровни информационной системы Центры хранения данных Форматы данных для климатических моделей Информационные ресурсы Semantic Web Онтология SWEET Онтология W@DIS Уровни информационных систем 1. Уровень данных и вычислений 2. Информационный уровень 3. Уровень знаний Центры хранения данных •Alaska Synthetic Aperture Radar (SAR) Facility (ASF) •.EROS Data Center (EDC) Land Processes •.Goddard Space Flight Center (GSFC) •.Jet Propulsion Laboratory (JPL) Physical Oceanography •.Langley Research Center (LaRC) •.National Snow and Ice Data Center (NSIDC) •.Oak Ridge National Laboratory (ORNL) •.Socioeconomic Data and Applications Center (SEDAC) at the Consortium for International Earth Science Information Network (CIESIN) •.Global Hydrology Resource Center (GHRC) at Marshall Space Flight Center •.National Climatic Data Center (NCDC) of National Oceanic and Atmospheric Administration (NOAA) •.National Geophysical Data Center (NGDC) of NOAA •.National Oceanographic Data Center (NODC) of NOAA •Satellite Active Archive (SAA) of National Oceanic and Atmospheric Administration (NOAA) Уровень данных и вычислений GRIB GRIB (Gridded Binary) - самый распространенный формат представления метеорологической информации. Он был создан Всемирной метеорологической организацией для хранения и обмена информацией о погоде в бинарной форме. Каждая запись GRIB предназначена для передачи или хранения единственного параметра вместе со значениями. Закодированные GRIB данные представляют собой непрерывный битовый поток, состоящий из последовательности октетов. Запись логически разбивается на состоящие из октетов секции, каждая из которых содержит контрольную информацию или данные. Представление данных в виде последовательности битов делает формат независимым от какого-либо одного машинного представления. Данные в формате GRIB предназначены исключительно для автоматической обработки. Описания данных, содержащихся в GRIB-файле, находится во внешних таблицах параметров. Наиболее распространены таблицы параметров NCAR, NCEP, ECMWF и NOAA FSL. BUFR Формат данных BUFR (Binary Universal Form for the Representation of Meteorological Data) представляет собою бинарный формат для представления в виде непрерывного битового потока метеорологических данных в обособленных точках (в отличие от GRIB, предназначенного для представления пространственно распределённых данных). Тем не менее, сама структура формата не предполагает чего-либо уникального только для метеорологии, и он может применяться к любым численным типам данных. Файлы BUFR состоят из некоторого числа последовательных записей, называемых потоками. Запись BUFR, содержащая некоторые данные наблюдения, также содержит и полное описание этих данных, включая определение наблюдаемого параметра (высота, температура, давление, дата и т.д.), единицы измерения, точность округления, формат сжатия, примененного к данным, а также число бит в значениях содержащихся данных. Описание данных также содержится во внешних таблицах, представляющих собою основную часть BUFR-описания. NetCDF Общий сетевой формат данных NetCDF (Network Common Data Format) был предложен Межуниверситетской кооперацией атмосферных исследований UCAR в качестве формата самоописываемых расширяемых файлов с научными данными. Для достижения прозрачности с сетевой точки зрения и независимости от конкретной архитектуры NetCDF определён в терминах XDR (eXternal Data Representation), протокола кодирования и описания данных, предоставляющего средства для представления данных в виде машинно-независимых битовых последовательностей. Одна из целей формата NetCDF — предоставление эффективного доступа как к небольшим, так и крупным наборам данных, для чего используется прямой, а не последовательный, как в ранее описанных форматах, доступ к данным. Это может быть намного более эффективным в случае, когда данные считываются не в том порядке, в каком были записаны. HDF Формат иерархических данных HDF (Hierarchical Data Format) создан для обмена научными базами данных американским Национальным центром суперкомпьютерных приложений NCSA (National Center for Supercomputing Applications). HDF – самоописываемый формат файлов для переноса различных типов данных между различными компьютерами. В HDF используются метаданные о наборах научных данных SDS (Scientific Data Sets), которые содержат: систему координат, используемой для интерпретации или отображения данных масштабы по каждой оси метки по каждой оси и для всего набора данных в целом единицы измерения по каждой оси и для данных допустимые максимальное и минимальное значение данных информацию о калибровке данных; информацию о дополнительных или отсутствующих значениях Информационные ресурсы, основанные на модeлях MM5 и BOLAM MM5 Department of Atmospheric and Oceanic Science, University of Maryland http://www.atmos.umd.edu/~mm5/ University of Wisconsin - Madison http://helios.aos.wisc.edu/ University of Wisconsin - Milwaukee http://sanders.math.uwm.edu Naval Postgraduate School http://met.nps.edu AMI Environmental. South Asia http://www.vnbaolut.com/ Institute for the Environment, the Hong Kong University of Science and Technology http://envf.ust.hk/dataview/mm5/ BOLAM Centro Funzionale MeteoIdrologico di Protezione Civile della Regione Liguria http://www.meteoliguria.it/map/bolam/bolamin.htm Servizio Agrometeorologico Regionale - Sardegna http://www.sar.sardegna.it/servizi/meteo/ Информационные ресурсы, основанные на модeли WRF National Weather Service Forecast Office http://www.srh.noaa.gov/ NOAA/NSSL http://www.nssl.noaa.gov/ Purdue University http://wxp.eas.purdue.edu/ DTC WRF-NMM http://www.dtcenter.org/wrf-nmm/ NCEP/EMC http://www.nco.ncep.noaa.gov/ NOAA/GSD http://ruc.fsl.noaa.gov/taq.html NCAR WRF-ARW http://www.wrf-model.org/ University of Illinois http://blizzard.atmos.uiuc.edu/rt/ Millersville University, PA http://snowball.millersville.edu The SNU-NCAR Joint Center for High-Impact Weather and Climate Research http://jhwc.snu.ac.kr/weather/ NASA GHCC Real-Time WRF Weather Model System http://www.ghcc.msfc.nasa.gov/ Advanced Operational Aviation Weather System, Taiwan http://aoaws.caa.gov.tw/ Institute of Atmospheric Sciences and Climate (ISAC) of the Italian National Research Council (CNR) http://oracolo.le.isac.cnr.it/mpcf/METEO/wrf.php Weather-It-Is, Israel http://www.weather-it-is-israel.com/ Slovenian Meteorological Amateur Research Team http://www.pro-vreme.net/ LaMMA - CNR IBIMET (Laboratory for Meteorology and Environmental Modeling of Tuscany Region) - WRF NMM http://www.lamma.rete.toscana.it/ Institute of Astronomy and Meteorology of the University of Guadalara, Mexico http://www.udg.mx/wrf/ Meteo Riccione, Italy http://www.meteoriccione.it/ Meteoblue http://www.meteoblue.ch/ The SNU-NCAR Joint Center for High-Impact Weather and Climate Research http://jhwc.snu.ac.kr/weather/ Глобальные проекты и порталы LEAD Portal (WRF) https://portal.leadproject.org/ ATMOS Portal (WRF, MM5, ИВМ РАН) http://atmos.iao.ru Глобальные проекты National Observatory of Athens (3 модели – WRF, MM5, BOLAM) http://cirrus.meteo.noa.gr/ RAP Real-Time Weather (4 модели – WRF, RUC, ETA, GFS) http://www.rap.ucar.edu/weather/model/ NCAR/MMM (2 модели – WRF, MM5) http://www.mmm.ucar.edu/ Meteosim Truewind (2 модели – MASS, GFS) http://www.meteosimtruewind.com/ Bolam Представление результатов Servizio Agrometeorologico Regionale - Sardegna http://www.sar.sardegna.it/servizi/meteo/mappebolam_it.asp MM5 – Представление результатов AMI Environmental. South Asia - http://www.vnbaolut.com/index_en.html MM5 – Представление результатов University of Wisconsin — Madison - http://helios.aos.wisc.edu/ WRF – Представление результатов DTC WRF-NMM - http://www.dtcenter.org/wrf-nmm/users/forecasts.php WRF – Представление результатов LaMMA - CNR IBIMET - http://www.lamma.rete.toscana.it/wrfweb/index.html WRF – Представление результатов Meteoblue - http://www.meteoblue.ch/ WRF – Представление результатов Purdue University - http://wxp.eas.purdue.edu/wrfdata/ Semantic Web Semantic Web for Earth and Environmental Terminology Спасибо за внимание! Как найти определённый источик данных в W@DIS? Semantic Web в действии В мае 2008 г. в системе W@DIS находится 570 информационных источников. Как найти определёный источник или группу источников в W@DIS? Методы поиска Google или Yahoo бесполезны. Большинство ресурсов W@DIS “невидимы” для поисковых агентов. Подход Semantic Web был использован в W@DIS для реализации семантического поиска. Физические сущности в W@DIS Уровни энергии Квантовые числа (Нормальные моды, BT2, Швенке) Неопределённости энергетических уровней Количество переходов Дополнительные сущности Вакуумная частота Коэффициент Эйнштейна Квантовые числа переходов (Нормальные моды, BT2) Вакуумная частота Интенсивность Полуширина Сдвиг Квантовые числа переходов (Нормальные моды, BT2) Неопределённости длины волны, интенсивности, полуширины, ... Метаданные в W@DIS Название источника информации, комментарий, ссылка, введённые данные (URI), метод решения Мин. и макс. значения уровней энергии, число уровней энергии, число уровней с уникальными и неуникальными квантовыми числами, число уровней без квантовых чисел, число энергетических уровней с разрешёнными и неразрешёнными квантовыми числами Мин. и макс. значений длины волны в вакууме, число идентифицированных и неидентифицированных переходов, число разрешённых и запрещённых переходов, число полос, список полос, ... Мин. и макс. значения длины волны в вакууме, тип квантовых чисел, число идентифицированных и неидентифицированных переходов, число разрешённых и запрещённых переходов, число полос, список полос, температура, давление, уширяющее вещество, ... Вещество, атом, молекула, газ, физические состояния, основной источник информации, составной источник информации, входные данные, выходные данные, ... Таксономия молекулярной спектроскопии I Информационная модель молекулярной спектроскопии Логический вывод Taxonomies Individuals Logical Inferences 29 Интерфейс Protégé для семантического поиска информационных ресурсов