Поисковый сервер Российские поисковые системы Поисковый сервер Векова Евгения, ученица 10 класса Новошимкусского представительства ЧГУ им.И.Н.Ульянова Поисковый 2008 г. сервер Цель и задачи проекта Самое сложное в Интернете — это поиск важной информации. Как найти нужную важную информацию –этой проблеме посвящена моя работа. Что мы понимаем под «поисковой системой», какие существуют классификации, какие службы позволяют быстро обнаружить необходимые сведения, что нужно знать для этого, какие ключевые слова используются – вот такие задачи нужно рассмотреть для достижения поставленной цели. 2 Поисковая система в Интернет Это специальный веб-сайт, на котором пользователь по заданному запросу может получить ссылки на сайты, соответствующие этому запросу. Поисковая система состоит из трех компонент: 1- поискового робота; 2- индекса системы; и 3- программы, которая (а) обрабатывает запрос пользователя, (б) находит в индексе документы, отвечающие критериям запроса, и (в) выводит список найденных документов в порядке убывания релевантности 3 Классификация поисковых систем По принципу работы Тематические каталоги (directories) — иерархически упорядоченные по категориям базы документов, информация в которые заносится вручную согласно принятой классификации. Перемещаясь по иерархии от более общих категорий к более конкретным, можно найти нужную информацию. Часто каталоги имеют встроенную систему поиска по запросу для быстрой выборки ссылок на подходящие документы. Поисковые машины (search engine), поисковые (автоматические) индексы — состоят из базы данных (БД) и программного обеспечения для их обработки. Автоматически собирают информацию о содержимом документов Интернета, самостоятельно создавая свои БД (индексы). Поиск осуществляется в БД, по запросу пользователя (автоматически). Гибридные — позволяют воспользоваться индексной базой данных и структурированным тематическим каталогом. Метапоисковые и мультипоисковые системы — облегчают поиск по нескольким СП: не имеют собственной БД и собственных средств поиска; используют возможности «реальных» ПС, позволяя обратиться с одним и тем же вопросом сразу к нескольким ПС (как поисковым машинам, так и тематическим каталогам). 4 Классификация поисковых систем По охвату информационных ресурсов Глобальные — всемирный охват материала, хотя упор на североамериканские ресурсы. Локальные (региональные) — обеспечивают поиск по ограниченному сегменту Интернета: российский Интернет, ресурсы конкретного региона, области, города и т.п. По тематике Универсальные — ищут информацию по любой теме (могут быть как локальными, так и глобальными). Специализированные — ищут информацию по определенному профилю или тематике (преимущественно локальные). 5 Список популярных поисковых систем Российские http://www.yandex.ru/ Яндекс http://www.rambler.ru/ Rambler http://www.aport.ru/ Aport! http://www.google.ru/ Google http://www.mail.list.ru/ Mail.Ru http://www.list.ru/ List.Ru http://www.ru/ Россия-Он-Лайн http://www.weblist.ru Weblist http://www.atrus.ru/ @Rus (бывш. название - "Ау!") http://www.ulitka.ru/ Улитка http://www.susanin.net/ Иван Сусанин http://www.infoart.ru/ ИнфоАрт http://www.km.ru/ KM.RU http://www.metacrawler.ru/ MetaCrawler.ru 6 Список самых популярных поисковых систем Зарубежные (глобальные) http://www.google.com (http://www.google.ru) GOOGLE http://www.altavista.com/ Altavista http://www.yahoo.com/ Yahoo! http://www.webcrawler.com/ WebCrawler http://dmoz.org Open Directory http://www.about.com About http://www.infoseek.com/ Infoseek http://www.hotbot.com/ HotBot http://www.excite.com/ Excite http://www.lycos.com/ Lycos http://onlyfor.org/ Onlyfor.org http://metasearch.com/ METASEARCH 7 RAMBLER http://www.rambler.ru Rambler является первой российской профессиональной поисковой системой. Ныне осуществляет поиск более чем по 15000 серверов в пределах бывшего СССР (более 2500000 страниц). Имеет приемлемые возможности для составления запроса и хороший механизм вывода результатов поиска. К сожалению не столь резв, как хотелось бы. 8 ЯNDEX http://www.yandex.ru Поисковая машина последнего поколения, обладающая весьма развернутой, но и достаточно сложной системой формирования запроса. Обладает способностью выделять один документ в различных кодировках, за счет чего кардинально сокращается дублирование результатов поиска. В настоящее время проиндексировано более 30500 российских (домены RU и SU) и зарубежных русскоязычных серверов. 9 АПОРТ http://www.aport.ru Индексирует боле 11000 российских серверов и делает это весьма основательно. Имеет богатые возможности формирования запроса, в частности, способен выделять сочетания терминов, если они находятся недалеко друг от друга (на расстоянии нескольких слов или предложений). Система способна переводить запрос с русского на английский язык и наоборот. 10 Гугол http://www.google.ru Индексирует боле 11000 российских серверов и делает это весьма основательно. Имеет богатые возможности формирования запроса, в частности, способен выделять сочетания терминов, если они находятся недалеко друг от друга (на расстоянии нескольких слов или предложений). Система способна переводить запрос с русского на английский язык и наоборот. 11 На конец 2007 года Яндекс занимал 45,11% Google - 28,9% Rambler - 14,25% Mail.ru - 6,17% (по статистике Spylog) аудитории пользователей Россйиского Интернета. 12 13 По моим исследованиям 80% 60% 40% 20% 0% yandex google rambler yahoo 2005 65% 12% 23% 2006 64% 15% 17% 4% 2007 59% 23% 15% 3% 14 Рекомендации по организации поиска Единой оптимальной схемы поиска в Интернет не существует. В зависимости от специфики необходимой информации для ее поиска нужно использовать соответствующие ПС. Ответы на один и тот же вопрос в различных поисковых системах не совпадают. Для получения полного ответа на свой вопрос надо провести поиск с помощью нескольких поисковых систем. При первом ознакомлении с интересующей вас темой лучше всего начинать с тематических каталогов. Использование метапоисковых систем позволяет получить представление о широте распространения информация по теме поиска. Специализированные системы можно искать с помощью универсальных ПС. Для поиска по российским ресурсам следует пользоваться как российскими поисковыми системами, так и глобальными. Прежде чем приступить к поиску в некоторой ПС, прочитайте раздел раздел Помощь (Help), который есть на главной странице сайта ПС каждой ПС. 15 Советы по поиску Если поиск не нашел ни одного документа, следует проверить орфографию Если список найденных страниц слишком мал, рекомендуется использовать синонимы. Набирать запрос лучше с маленькой буквы, заглавные следует использовать только в именах собственных. Если один из найденных документов ближе к искомой теме, чем остальные, рекомендуется нажать на ссылку «Найти похожие документы». Запрос можно сделать более точным, если использовать специальные знаки Например, чтобы исключить документы с ненужным словом перед ним следует поставить знак минуса. И наоборот, если слово должно обязательно присутствовать, ставим + (чтобы найти цитату из Гамлета, надо задать запрос «+быть или +не быть» 16 СПАСИБО ЗА ВНИМАНИЕ! 17