МИНОБРНАУКИ РОССИИ Федеральное государственное бюджетное образовательное учреждение высшего образования «Юго-Западный государственный университет» (ЮЗГУ) Кафедра «Программная инженерия» ОТЧЕТ по лабораторной работе №2 по дисциплине «Информационно-поисковые системы» Направление подготовки 02.03.03 «Математическое обеспечение и администрирование информационных систем» Выполнил: студент группы МИ-91б Украинцева Я.О. Проверил: Ефремов.В.В Курск 2022 Таблица 1 - Результаты сравнительного изучения поисковых систем № Оpera Yandex Google 1. 1.1 Параметры Поиск по тексту Логические операторы: конъюнкция Логическое И, ИЛИ, НЕ AND Логическое И, ИЛИ, НЕ Пробел AND + & 1.2 дизъюнкция OR Логическое И, ИЛИ, НЕ & пробел (в пределах предложения) && (в пределах документа) | 1.3 отрицание HOT- Синтагматические операторы: ! * + "" [] () и | фразы (словосочетания, слова рядом) расстояние в словах () и |-Группируют слова при сложных запросах. ~ (в пределах предложения) ~~ (в пределах документа) К базовым операторам относят: ! * + "" [] () и | () и |-Группируют слова при сложных запросах. Оператор /(m n), где m — минимальное расстояние между заданными словами, n — Оператор /(m n), где m — минимальное расстояние между заданными словами, n — 1.4 1.5 OR | HOT- К базовым операторам относят: ! + "" [] () и | * () и |-Группируют слова при сложных запросах. Идентично как и Яндекс Оператор /(m n), где m — минимальное расстояние максимальное расстояние между заданными словами 1.6 расстояние в предложениях 1.7 Морфологическая нормализация 2. 2.1 Поиск по полям по заглавию 2.2 2.3 по полю ключевых слов по комментарию к картинкам 2.4 2.5 Оператор && /n, Где n — максимальное расстояние между предложениями, содержащими слова запроса Идентично Яндексу, использует артефакты сжатия максимальное расстояние между заданными словами между заданными словами, n — максимальное расстояние между заданными словами Оператор && /n, Оператор && /n, Где n — максимальное Где n — максимальное расстояние между расстояние между предложениями, содержащими предложениями, содержащими слова запроса слова запроса Использует артефакты сжатия Google использует несжатую морфологического словаря. морфологию Другими словами Яндекс использует сжатие title (запрос)- отвечает за заголовок страницы keywords=() «filetype:» — оператор, который позволяет найти файлы определенного расширения title (запрос)- отвечает за заголовок страницы keywords=() «filetype:» — оператор, который позволяет найти файлы определенного расширения по тексту гиперссылок anchor (запрос)-отвечает за текст гиперссылки anchor (запрос)-отвечает за текст гиперссылки по адресам ссылок URL=www.url.ru/cat/* — по URL=www.url.ru/cat/* — по title (запрос)- отвечает за заголовок страницы keywords=() Как и веб-поиск, Google Картинки поддерживают определенные операторы, например src: и imagesize: Hyperlink- представляет собой ссылку на данные, по которым пользователь может перейти, щелкнув или нажав. Гиперссылка указывает на весь документ или на конкретный элемент в документе. Гипертекст - это текст с гиперссылками. Текст, на который делается ссылка, называется якорным текстом. https//:www.google.com- по адресу 2.6 по доменному имени сайта (сервера) адресу domain=»домен» адресу host=www.host.ru site:*.net запрос rhost=»ru.url.*» или rhost=»ru.url.www» 2.7 2.8 2.9 по языку по дате по формату lang=»язык» date=»ГГГГ{*|ММ{*|ДД}}» mime=»тип_файла» domain=»домен» lang=»язык» date=»ГГГГ{*|ММ{*|ДД}}» mime=»тип_файла» 2.10 Другие Intext (Пример:IT intext:seo)Ищет страницы с обязательным вхождением слова в тексте site: и mime: (Пример: site:ozon.ru mime:pdf) - Находят указанный тип документа на конкретном сайте host: (Пример: seo host:seranking.ru) - Выдает страницы главного зеркала сайта 3. 3.1 3.2 3.3 3.4 Интерфейс выдачи (форма представления статистика слов из запроса количество найденных + документов количество найденных 8 млн найденных результатов сайтов на запрос по вопросу «синтагматические операторы поисковой системы» количество 1 документов на lang=»язык» "after:ГГГГ/ММ/ДД". Достаточно добавить в конце вашего запроса filetype:doc. Ограничивает результаты файлами определённого формата, например, pdf, docx, txt, ppt и т. д. Примечание: аналогично оператору “ext:”. Пример: apple filetype:pdf / apple ext:pdf +(если более одного слова) - + + 9 млн найденных результатов на запрос по вопросу «синтагматические операторы поисковой системы» 3 9 млн найденных результатов на запрос по вопросу «синтагматические операторы поисковой системы» 0 3.5 3.6 3.7 a) b) c) d) e) f) g) h) i) странице результатов сортировка По релевантности документов на По дате странице выдачи поиск в найденном + Описание документа включает следующие URL (адрес в сети) + размер документа + (объем) дата создания +(но не всегда) кодировка Кириллица аннотация (краткое аннотации —до 350 знаков с содержание) пробелами. указание на другие + релевантные вебстраницы ссылка на рубрику + каталога поиск похожих + документов другое Группирование открытых вкладок. Как и многие другие браузеры Opera позволяет открывать web-страницы на разных вкладках, чтобы потом можно было быстро переключаться между ними. Автозаполнение полей. После первого заполнения формы, будет предложено сохранить По релевантности По дате По дате По релевантности + + + + + + +(но не всегда) Кириллица Аннотации — до 350 знаков с пробелами. + (+ но не всегда) Кириллица Аннотации —от 300-400 знаков с пробелами. + + + + + Яндекс предпочитает короткие тексты, объем которых не превышает 2000 знаков. Гугл отдает предпочтение длинным текстам, в которых общее количество знаков превышает 4000. Система определяет, из какого региона поступил запрос, и выдает ответ в соответствии с геолокацией. При новом запуске браузера поисковик учитывает запросы, заданные в прошлый раз. Быстрее индексирует новые сайты. Ранжирует по методу обратных ссылок. данные, и если ответить согласием, то при следующем посещении сайта заполнить форму можно в один клик.