Загрузил nastysha.kaply

ПР 10. язык поисковых запросов

реклама
Практическая работа №10
Язык поисковых запросов
Цель работы: изучить язык поисковых запросов, научиться решать задачи.
Ход выполнения работы:
1. Изучить теоретический материал;
2. Решить представленные задачи, решение записать в тетрадь;
3. Оформить отчет в тетради по проделанной работе и сделать вывод.
Теоретические сведения
Язык поисковых запросов — это специально разработанный для
поисковых систем программный язык, который помогает пользователям более
точно искать информацию. Учитывая, что всемирная паутина имеет
невероятное количество документов и информации, умение не потеряться в
ней экономит немало времени.
Для управления и использования гибкого поиска в языке поисковых
запросов используются так называемые операторы — это символы и команды,
позволяющие настраивать условия поиска запроса. Сам язык запросов
максимально упрощен, чтобы любой пользователь мог с ним справиться и
выбрать необходимый для его случая оператор.
Поисковые запросы:
1. Операция «И» в поисковом запросе всегда ограничивает поиск
(уменьшает количество страниц в выдаче), т.е., в ответ на запрос яблоко
И груша поисковый сервер выдаст меньше страниц, чем на запрос
яблоко, так как будет искать страницы, на которых присутствуют оба
этих слова. Также эта операции может обозначаться как «&», «*»;
2. Операция «ИЛИ» в поисковом запросе всегда расширяет поиск
(увеличивает количество страниц в выдаче), т.е., в ответ на запрос яблоко
ИЛИ груша поисковик выдаст больше страниц, чем на запрос яблоко, так
как будет искать страницы, на которых присутствует хотя бы одно из
этих слов (или оба сразу). Также эта операции может обозначаться как
«|», «+»;
3. Если в запросе присутствует фраза, заключенная в кавычки, то
поисковик будет искать страницы с точно такой же фразой, а не просто
отдельные слова из этой фразы. Взятие словосочетания в кавычки
ограничивает поиск, то есть, в ответ на запрос «яблоко груша»
поисковик выдаст меньше страниц, чем на запрос яблоко груша, так как
поиск будет осуществляться только среди тех страниц, на которых эти
слова стоят одно за другим.
Большинство задач, связанных с поисковыми запросами, проще решать,
используя круги Эйлера.
Рис.1. Круги Эйлера для разных операций
Рассмотрим примеры решения задач.
Задача 1. В таблице приведены запросы к поисковому серверу. Расположите
номера запросов в порядке возрастания количества страниц, которые найдет
поисковый сервер по каждому запросу.
1
2
3
4
принтеры & сканеры & продажа
принтеры | продажа
принтеры & продажа
принтеры | сканеры | продажа
Решение:
Так как операция «&» («И») уменьшает поиск, а операция «|» («ИЛИ»)
увеличивает, то, чем больше «&», тем меньше страниц, а чем больше «|», тем
больше страниц.
Поэтому правильным расположением номеров в данной задаче будет
1324.
Задача 2. В таблице приведены запросы и количество найденных по ним
страниц некоторого сегмента Интернет.
Запрос
Найдено страниц (в тысячах)
Чацкий & (Молчалин | Фамусов)
440
Чацкий & Молчалин
250
Чацкий & Фамусов
290
Необходимо вычислить количество найденных страниц по запросу:
Чацкий & Молчалин & Фамусов
Решение:
Для упрощения решения задачи воспользуемся кругами Эйлера.
Нарисуем три круга, так как в запросе три слова (Чацкий, Молчалин, Фамусов).
Желтым выделили область, которая обозначает запрос Чацкий & Молчалин &
Фамусов. Количество запросов будем обозначать как Ni, то есть в данном
случае необходимо найти, чему равно N7.
Далее смотрим на таблицу с количеством страниц по каждому из
известных нам запросов.
Разберем первый запрос: Чацкий & (Молчалин | Фамусов).
Сначала, как и по правилам выполнения действий в математике,
определим по кругам Эйлера какие области (Ni) относятся к запросу в скобках,
то есть к (Молчалин | Фамусов). Так как в данном случае используется операция
«|» («ИЛИ»), то все области, которые находятся в кругах Молчалина и
Фамусова будут относиться к этому запросу. Наглядно покажем на кругах
Эйлера ниже.
Далее в первом запросе идет операция «&» (И) слова Чацкий с (Молчалин
| Фамусов). Области на запрос в скобках мы определили выше. Теперь, так как
используется операция «&», необходимо найти те области, которые будут
отвечать за пересечение слова Чацкий с (Молчалин | Фамусов). В данном
случае это получаются следующие области: N4 , N7 , N5. Наглядно покажем на
кругах Эйлера, выделив эти области красным цветом.
Так как количество страниц по этому запросу нам известно, и это значение
равно 440, то можем составить уравнение:
𝑁4 + 𝑁7 + 𝑁5 = 440
Следующие запросы из таблицы подробно расписаны не будут. Покажем
на кругах Эйлера области, которые относятся к каждому из оставшихся
запросов и составим для них уравнение.
Запрос: Чацкий & Молчалин.
Уравнение: 𝑁7 + 𝑁5 = 250
Запрос: Чацкий & Фамусов
Уравнение: 𝑁7 + 𝑁4 = 290
Выпишем все уравнения и получим систему уравнений, которую надо решить,
чтобы найти 𝑁7 :
𝑁4 + 𝑁7 + 𝑁5 = 440
{ 𝑁7 + 𝑁5 = 250
𝑁7 + 𝑁4 = 290
Из второго уравнения можно найти 𝑁5 :
𝑁5 = 250 − 𝑁7
Подставить в первое уравнение полученное 𝑁5 :
𝑁4 + 𝑁7 + 250 − 𝑁7 = 440
Сократив +𝑁7 и − 𝑁7 , получим:
𝑁4 + 250 = 440
И теперь можно вычислить 𝑁4 :
𝑁4 = 440 − 250
𝑁4 = 190
Имея значение 𝑁4 , можно вычислить 𝑁7 в третьем уравнении:
𝑁7 + 190 = 290
𝑁7 = 290 − 190
𝑁7 = 100
То есть, количество найденных страниц по запросу Чацкий & Молчалин &
Фамусов будет равно 100 тысяч. Это и будет ответом на решение данной
задачи.
Задание на практическую работу
Задача 1. В таблице приведены запросы к поисковому серверу. Расположите
номера запросов в порядке, который указан в вашем варианте.
1 пловцы
2 пловцы | гимнасты
3 пловцы & гимнасты & олимпиада & Россия
4 пловцы & гимнасты
5 пловцы & гимнасты & олимпиада
6 пловцы | гимнасты | олимпиада
Порядок расположения номеров по вариантам. Вариант – ваш номер в списке.
Номер варианта
Порядок расположения
нечетное число
убывания
четное число
возрастания
В отчете пишем условие задачи, свой вариант, соответствующий порядок
расположения номеров и ответ.
Задача 2. В таблице приведены запросы и количество найденных по ним
страниц некоторого сегмента сети Интернет. Количество страниц берем из
таблицы с вариантами. Вариант – ваш номер в списке.
Номер варианта
1, 6, 11, 16, 21, 26
Запрос
Толстой & Чехов
(Толстой | Гоголь) & Чехов
Гоголь & Чехов
Кол-во страниц
245
430
280
Толстой & Чехов
278
2, 7, 12, 17, 22, 27
(Толстой | Гоголь) & Чехов
550
Гоголь & Чехов
347
Толстой & Чехов
317
3, 8, 13, 18, 23, 28
(Толстой | Гоголь) & Чехов
615
Гоголь & Чехов
324
Толстой & Чехов
215
4, 9, 14, 19, 24, 29
(Толстой | Гоголь) & Чехов
345
Гоголь & Чехов
198
Толстой & Чехов
159
5, 10, 15, 20, 25, 30 (Толстой | Гоголь) & Чехов
289
Гоголь & Чехов
187
Найти количество страниц, которое будет найдено по запросу: Толстой &
Гоголь & Чехов.
В отчете пишем условие задачи, свой вариант, соответствующий запрос и
решение данной задачи.
Задача 3. В таблице приведены запросы и количество найденных по ним
страниц некоторого сегмента сети Интернет.
Запрос
Найдено страниц (в сотнях тысяч)
Горло
35
Корабль
36
Нос
45
Корабль & Нос
14
Горло & Нос
12
Горло & Корабль
0
В данной задаче у всех один вариант. Необходимо найти количество страниц,
которое будет получено по следующему запросу: Горло | Корабль | Нос.
В отчете пишем условие задачи и решение.
Скачать