(например, только HTML, DOC, RTF, PPT или PDF-файлы).
Многие поисковые машины позволяют ограничить поиск фрагментом страницы. Например, вы можете указать, что фраза поискового запроса должна встречаться только в заголовке страницы или же в основной части, в адресе или в любом месте документа.
Еще одно удобное решение, доступное среди параметров расширенного поиска, – поиск фразы запроса на определенном сайте. Такая возможность на сегодняшний день доступна для всех поисковых машин, она позволяет получить список документов с одного сайта. Например, на сайте с базой данных рефератов вы хотите найти реферат по нужной теме. Можно, конечно, вручную пересмотреть разделы каталога, приблизительно соответствующие вашей теме, но лучше задать запрос и провести поиск на этом веб- ресурсе. Поисковая машина предоставит вам список страниц, на которых находится нужная информация, только данного сайта (рис. 9.3).
Рис. 9.3. Поиск Rambler для определенных сайтов
Поисковые системы Google и «Яндекс» позволяют также получить список сайтов, похожих на заданный. В параметрах расширенного поиска Rambler можно исключить из полученного списка ссылки, в которые входит заданное слово.
Сложный поиск предусматривает возможность использования особенностей специального языка поисковых запросов. Хотя для каждой поисковой системы существует свой, уникальный язык запросов, их возможности похожи.
Язык запросов практически каждой поисковой машины содержит операторы двух типов: логические и операторы расстояния.
• Логические операторы определяют включение/исключение из поиска группы слов.
– AND (и) – поиск документов, содержащих все термины, соединенные данным оператором.
– OR (ИЛИ) – текст должен содержать хотя бы один из терминов, соединенных данным оператором.
– NOT (НЕ) – поиск документов, в тексте которых отсутствуют термины, следующие за оператором.
• Операторы расстояния ограничивают порядок следования и расстояния между словами.
– NEAR – второй термин должен находиться от первого на расстоянии, не превышающем определенного количества слов.
– FOLLOWED BY – термины следуют в заданном порядке.
– ADJ – термины, соединенные оператором, являются смежными.
Наряду с этими, наиболее типичными, в язык поисковых запросов могут входить и другие операторы.
В разных поисковых машинах каждому из этих операторов соответствуют свои обозначения. Обычно детальнее узнать о них можно на странице помощи. Ниже я расскажу о некоторых элементах языка поисковых запросов самых популярных поисковых машин. Работу операторов сложного поиска рассмотрим на примерах решения наиболее типичных задач.
• Найденные ссылки должны содержать точную фразу поискового запроса.
Такую фразу следует заключить в кавычки. Это правило справедливо для всех поисковых машин.
• В найденных документах должно быть несколько слов из поискового запроса.
В этом случае удобно применить логический оператор AND (и), использование которого означает одновременный поиск нескольких слов, вошедших в запрос. В «Яндекс» и Rambler этому оператору соответствует знак &, в Google эту функцию выполняет обычный символ +. Таким образом, запись книжный & магазин в строке поиска «Яндекс» или Rambler будет означать поиск сайтов, страницы которых содержат оба слова поискового запроса. В Google вам для этого нужно будет написать книжный + магазин.
• В документе должно быть хотя бы одно слово поискового запроса.
В этом случае необходимо использовать оператор OR (ИЛИ). В поисковых системах Rambler и «Яндекс» ему соответствует символ |, а в Google следует применять знак ~. Запрос аэроплан |самолет|планер| дирижабль|аэростат|вертолет|пепелац, заданный в «Яндекс» или Rambler, позволит найти страницы, где встречается хоть одно из этих слов. При поиске с помощью Google запрос задается так: аэроплан-самолет- планер.
• Одно слово поискового запроса должно обязательно входить в результирующие ссылки.
При работе с «Яндекс» и Rambler перед такими словами нужно поставить знак +. Обратите внимание, что перед этим символом необходимо ставить пробел, а после него – нет. Например, для поиска известной цитаты из «Гамлета» нужно набрать быть +или +не быть.
• Из итогового списка ссылок необходимо исключить документы с определенными словами.
Для этого следует применить логический оператор NOT (НЕ). В «Яндекс» и Google такие слова помечают символом —, в Rambler для этого предназначен знак!. Данный оператор нужно вводить после ключевого слова через пробел и слитно с необязательным словом. Например, запрос карта Парижа – (агентство | тур) позволит найти карту, а не агентства и туры по Франции.
• Слова поискового запроса должны располагаться на определенном расстоянии друг от друга.
В этом случае синтаксис каждой поисковой машины индивидуален. В некоторых поисковых задачах термины могут идти в разном порядке, причем между ними может быть установлен произвольный интервал. Добавив между словами запроса оператор / (n т), вы получите интересующие вас страницы. Если при работе с Яндекс вы введете запрос справочная / (2 4) литература, то будут найдены документы, в которых слово «справочная» удалено от «литература» на два слова влево и на четыре вправо.
Если вы точно знаете не только расстояние, но и порядок слов запроса, в котором они должны идти в тексте интересующих вас страниц, укажите между символом / и числом-расстоянием символ + для прямого порядка слов или – для обратного.
Если вы хотите найти отчество Тургенева, то введите запрос Иван /+2 Тургенев. Будут найдены страницы, где между словами «Иван» и «Тургенев» есть ровно одно слово.
В поисковой машине Rambler значение ограничения контекста можно изменять конструкцией (число, запрос), где число – любое положительное число. Таким образом, по запросу (2, красная армия) будут найдены только те документы, в которых между словами «красная» и «армия» хотя бы раз не стоит ни одного слова (поскольку лишь в случае их непосредственного соседства разница в порядковых номерах меньше двух, то есть равна единице).
Помните, что при построении сложных запросов вас выручат скобки. Например, если вы ищете описание мумие, но не хотите наталкиваться на прайсы интернет-магазинов, можете задать такой запрос: мумие && (лечение | лечебный | болезни)~~(цена | прайс | рубли доллар | фирма | магазин). Будут найдены все страницы, где есть слово «мумие», а также любое из слов «лечение», «лечебный» или «болезни» и нет ни одного из слов, перечисленных после оператора —.
Все слова, которые вы приводите в запросе, по умолчанию ищутся с учетом морфологии. Чтобы отключить ее, введите оператор! перед словом (без пробела).
Например, на запрос! день будут найдены страницы, где слово день встречается только в такой форме.
Если одна или несколько форм слова совпадает с другими словами, могут найдены лишние страницы. Указав нормальную форму слова с помощью оператора!! вы уберете из списка ненужное.
С подробностями использования поискового движка Google можно ознакомиться по адресу http://www.google.com.ua/intl/uk/help/refines earch.html. Страница помощи «Яндекс» размещена по адресу http://www.yandex.ru/info/index.html, а поисковую помощь системы Rambler вы найдете здесь: http://www.rambler.ru/doc/help.html.
Дополнительной возможностью является поиск среди обнаруженных страниц. Если ссылок найдено слишком много, то всегда можно добавить к запросу еще одно ключевое слово и повторить поиск.
Полезные советы
Приведу некоторые советы, которые, конечно, не являются однозначным рецептом успеха. Однако они возникли в результате долгой работы с Интернетом и поэтому могут помочь вам искать более эффективно.
1. Перед началом поиска выберите основные понятия, описывающие нужную вам информацию.