существует множество недостатков. Например, в них могут отсутствовать некоторые ссылки: из-за того, что редакторы создают каталоги вручную, количество ссылок в них ограничено, более того, самые интересные из них могут не попадать в каталог, так как редакторы не успевают их вносить. Как результат – обновление происходит медленно.

Неоднозначность структуры – это еще один явный минус каталожной организации информации (хотя отчасти он нейтрализуется тем, что в каждом крупном каталоге существует своя система поиска).

Поисковые машины

Если вам необходимо получить подборку материалов по более конкретной и специальной информации, лучше воспользоваться поисковыми машинами. Поисковая машина – это комплекс специальных программ для поиска в Сети. Они лишены недостатков, присущих каталогам, и работают немного по-другому. Поиск с помощью поисковых машин происходит намного быстрее, кроме того, такие системы могут искать среди гораздо большего количества сайтов – область поиска в этом случае практически неограниченна.

Принцип действия поисковых машин заключается в постоянном последовательном исследовании всех веб-страниц. Из-за необходимости постоянного обновления информации время от времени машины возвращаются к просмотренным ранее сайтам, чтобы найти и зарегистрировать возникшие там изменения. Вся прочитанная информация индексируется, то есть создается специальная база данных, в которой сохраняются просмотренные поисковиком веб-страницы. Там и осуществляется поиск. Эту базу данных наполняют специальные программы-роботы, которые, просматривая сайты, обращают внимание на некоторые дополнительные элементы. Например, на частоту употребления слова на странице, на его выделение, а также количество ссылок на данный документ на других сайтах. Поисковые машины проводят поиск по заданному пользователем поисковому запросу – специальной фразе или набору слов, которые выражают суть того, что нужно найти.

Кроме этого, с каждой веб-страницей связан набор ключевых слов. Эти слова лучше всего описывают ее содержимое. При поиске информации такие машины в первую очередь анализируют их совпадение со словами из запроса.

Таким образом, поиск с помощью поисковых машин состоит в просмотре базы данных веб-страниц и розыске тех из них, которые соответствуют запросу.

...

Примечание

Большинство современных поисковых систем совмещают в себе и тематический каталог, и возможности поисковой машины.

Интерфейс всех поисковых систем примерно одинаковый. Пользователю предлагается ввести запрос в специальное поле, а затем запустить поиск щелчком на кнопке Найти или Поиск. Система произведет поиск и выдаст результаты в окне браузера. Однако, несмотря на общие принципы работы и похожий интерфейс, поисковые машины отличаются между собой целым рядом параметров. Среди них – релевантность результатов, величина и частота обновления баз данных, скорость выдачи результатов и удобство работы.

Наряду с этим существуют и другие различия – языки запроса, зоны поиска, глубина поиска внутри документов, методы определения приоритетов, поэтому применение разных поисковых машин дает различные результаты.

Наиболее популярными поисковыми машинами являются: www.yandex.ru, www.maiL.ru, www.rambLer.ru, www.googLe.com, www.aport.ru, www.yahoo.com, www.Lycos.com.

За время существования поисковых машин выработался определенный стандарт предоставления пользователю страницы с результатами поиска. Поэтому, разобравшись в форме выдачи результатов хотя бы одной поисковой машины, можно уверенно пользоваться остальными.

Страница с результатами поиска, полученными с помощью поисковой машины, содержит следующие элементы:

• заголовок найденной страницы;

• цитата из текста страницы, по которой видно, в каком контексте используются слова поискового запроса; искомые слова в цитате, как правило, выделены полужирным шрифтом или отличаются по цвету от основного текста;

• полный адрес страницы;

• размер страницы, дата последнего изменения.

В некоторых случаях в списке ссылок доступна возможность просмотра похожих документов. Отдельные поисковики анализируют содержание найденных по запросу страниц и группируют их по своим особым, внутренним критериям. Например, по близости словарей страниц, по одинаковым заголовкам, по совпадениям фраз, по количеству синонимов.

Кроме того, иногда в результатах поиска можно увидеть рубрику веб-каталога, к которой относится найденный сайт (если последний участвует в каталоге или рейтинге).

Секреты поиска: построение поискового запроса

Поисковая машина генерирует список документов, релевантных запросу пользователя. Если запрос не выражает то, что нужно найти, – соответственно, результаты поиска будут не те, которых вы ожидали.

Поэтому для эффективного поиска, в первую очередь, необходимо правильно сформулировать поисковый запрос. Его составляют так, чтобы область поиска была максимально конкретизирована и сужена. В запрос следует включать несколько ключевых слов, наиболее полно раскрывающих суть предмета, информацию о котором вы ищете.

...

Примечание

Основную смысловую нагрузку в поисковом запросе несут имена существительные, гораздо реже нужны прилагательные, а использовать в поисковом запросе глаголы практически бесполезно.

Если в результате вы получите наиболее релевантные ссылки в верхней части списка, то можно считать, что поиск произведен успешно.

...

Примечание

Не следует составлять слишком сложный запрос, так как в результате может быть не найдено ни одного документа. Оптимальным результатом поиска является 10–20 ссылок, среди которых можно быстро отыскать две-три нужные.

При поступлении запроса от пользователя машина просматривает всю проиндексированную информацию и выдает соответствующий список документов. На первом месте будут расположены документы, которые содержат максимум слов из вашего запроса. Найденные ссылки сортируются в зависимости от местоположения ключевых слов (в заголовке, в начале текста, в первых параграфах) и частоты их появления. Таким образом, в верхней части списка размещены ссылки на сайты, в которых искомые слова встречаются чаще всего. Поэтому основная задача пользователя во время поиска в Интернете – получить список ссылок, максимально соответствующих запросу.

Чрезвычайно важно при поиске информации в Интернете как можно больше сузить область поиска. Найти нужные сайты возможно только в том случае, если пользователь сумел подобрать в поисковом запросе именно те слова, которые действительно несут основную смысловую нагрузку.

Например, набрав запрос реферат на тему «Финансовый анализ в Excel», вы получите несколько ссылок, в которых представлена совсем не та информация, которую вы ищете. Дело в том, что поисковая система будет искать страницы, в которых встречаются все эти слова – и слово «реферат», и «на тему», и «финансовый анализ в Excel». Причем, учитывая особенности построения поисковых запросов, последняя фраза будет искаться в точности так, как она была сформулирована. Запрос финансовый анализ в Excel предоставит вам несколько другие результаты.

Не стоит винить машину в том, что она не нашла нужную информацию, – она всего лишь ответила на ваш запрос. Перефразируя известное выражение, можно сказать: «Каков запрос – таков ответ».

В идеале процесс поиска должен выглядеть так. Сначала лучше сформулировать общий запрос и получить результат, в котором следует выделить описания более-менее подходящих ссылок. Затем необходимо добавить к запросу общие ключевые слова, которые есть в описании нужных веб-страниц, и повторить процесс. Если вы все делаете правильно, то каждый запрос должен приближать вас к нужной информации. Вы должны выступать в виде своеобразной обратной связи, с каждым шагом уменьшая несоответствие между необходимой вам информацией и тем, что выдает поисковая система.

Для лучшего понимания вышесказанного рассмотрим еще один пример – представьте себе, что вам необходимо найти расписание поездов, проходящих через Киев. В качестве общего запроса можно так и «спросить» поисковую систему: расписание всех поездов, проходящих через Киев. Однако по такому запросу, например, «Яндекс» находит лишь расписания поездов, проходящих через Самару, Тернополь, но Киева среди результатов поиска не видно. Это ни в коем случае не означает, что такой информации в базе поисковой системы нет, просто запрос был сформулирован не совсем удачно.

Вы помните, что любая поисковая система старается найти страницы, на которых находится максимальное количество слов из вашего запроса, более того, если эти слова еще следуют друг за другом, то такие страницы будут выведены первыми. Например, если в тексте страницы встречается фраза «расписание всех поездов, проходящих через Самару», то даже при отсутствии фразы «расписание всех поездов, проходящих через Киев» система определит, что они имеют пять общих слов, то есть с большой вероятностью сайт, содержащий эти слова, вам подойдет. Поэтому необходимо откорректировать запрос, убрав из него все ненужное и оставив только то, что точно

Добавить отзыв
ВСЕ ОТЗЫВЫ О КНИГЕ В ИЗБРАННОЕ

0

Вы можете отметить интересные вам фрагменты текста, которые будут доступны по уникальной ссылке в адресной строке браузера.

Отметить Добавить цитату