Поисковые машины интернета
1. Поисковая машина
1.1 Виды систем поиска информации (расширенный, сложный, в зонах, в элементах)
Расширенный поиск. Яндекс позволяет решать сложные поисковые задачи, не пользуясь языком запросов. Для этого воспользуйтесь формой расширенного поиска, где сложные поисковые условия задаются в простой и наглядной форме.
ht=418 src="images/referats/11671/image001.png" hspace=10>
Обратите внимание, что при заполнении нескольких полей Яндекс учтет все заданные вами условия одновременно. Например, указав язык документа как «русский» и введя в поле находятся на сайте адрес какого-либо сайта, вы в результате поиска получите список документов с заданного сайта, написанных на русском языке.
Сложный поиск. Главный недостаток простого поиска - большое количество выдаваемых ссылок.
Для увеличения эффективности (полноты и точности) поиска необходимо использовать сложный поиск с применением логических операторов языка.
При сложном поиске кроме ключевых слов в запрос включаются логические операторы данной поисковой системы. К сожалению общепринятого стандарта логических операторов пока не существует. Ниже приводятся примеры использования основных логических операторов.
Для упрощения задачи формирования сложных запросов используют специальные формы.
Таблица 1.1
Синтаксис |
Что означает оператор |
Пример запроса |
пробел, & |
Логическое И (в пределах предложения) |
автомобили легковые - поиск документов, содержащих оба слова запроса в одном предложении |
| |
Логическое ИЛИ |
фото | фотография | снимок | фотоизображение - поиск документов, содержащих хотя бы одно из слов запроса |
+ |
Обязательное наличие слова в найденном документе (работает также в применении к стоп-словам) |
легковые автомибили +ГАЗ - поиск документов с обязательным присутствием слова 'ГАЗ' |
~ |
Бинарный оператор И НЕ (в пределах предложения) |
легковые автомибили ~импортные - поиск информации по отечественным легковым автомобилям |
() |
Группирование слов |
(технология | изготовление) (сыра | творога) - поиск информации по технологии изготовления сыра и творога |
" ." |
Поиск фразы |
"война и мир" - поиск документов, содержащих данную фразу |
Поиск в зонах. Можно искать информацию в «зонах» — заголовках (имя «зоны»: Title), ссылках (имя «зоны»: Anchor) и адресе (имя «зоны»: Address).
Синтаксис: $имя_зоны (поисковое выражение).
|
Запрос '$title CompTek' ищет в заголовках документов слово 'CompTek'.Запрос '$anchor (CompTek | Dialogic)' находит документы, в cсылках внутри которых есть одно из слов 'CompTek' или 'Dialogic'. |
Поиск в определенных элементах. Можно ограничить поиск информации списком серверов или наоборот исключить сервера из поиска (url). Можно также искать документы, содержащие ссылки на определенные URL (link), и файлы картинок (image). Если вы хотите работать не с конкретным URL (image), а со всеми, начинающимися с данной последовательности символов, используйте «*».
Синтаксис: #имя_элемента="имя_файла (URL)".
|
По запросу 'CompTek ~~ #url="www.comptek.ru*"' будут искаться упоминания компании 'CompTek' везде, кроме ее собственного сервера (www.comptek.ru). А запрос '#link="www.comptek.ru*"' покажет все документы, которые сослались на сервер компании.Запрос ' #image="tort*"' даст ссылки на документы с изображениями тортов (хотя, возможно, найдется и портрет черепахи Тортиллы). |
1.2 Язык поисковых запросов
Язык поисковых запросов — набор метасимволов и правил, в соответствии с которыми строится запрос к поисковой системе. В различных поисковых системах язык может различаться, однако обычно он является некоторым подобием языка регулярных выражений с дополнениями, связанными со спецификой работы той или иной поисковой системы. Знание и правильное применение языка запросов конкретной поисковой машины улучшает и упрощает пользователю процесс поиска информации.
Отличительная особенность Яндекса — возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов[19]. Так, например, для операции исключения можно указать область действия: запрос A ~~ B найдет документы (страницы), в которых присутствует А, но не присутствует В, а запрос А ~ Б -документы, где слово Б не присутствует со словом А в одном предложении. Аналогично, оператор & ищет сочетания ключевых слов в предложении, а && — во всём документе. Оператор ! позволяет отключить морфологию для конкретного слова, а !! позволяет указать нормальную форму, что позволяет обойти некоторые проблемы связанные с омонимией. Например запрос !!Иванов будет находить Иванова и Ивановых, но не Ивана.
1.3 Поиск информации в зонах (элементах)
Поиск в зонах. Можно искать информацию в "зонах": заголовках (имя "зоны": Title), ссылках (имя "зоны": Anchor) и адресе (имя "зоны": Address).
Пример:
Запрос '$title обращения граждан' ищет в заголовках документов слово 'обращения граждан'.
Запрос '$anchor (sf | gov)' находит документы, в cсылках внутри которых есть одно из слов 'sf' или 'gov'.
Поиск в определенных элементах. Поиск информации может быть ограничен списком серверов и исключать сервера из поиска (url). Можно также искать документы, содержащие ссылки на определенные URL (link), и файлы картинок (image). Для работы не с конкретным URL (image), а со всеми, начинающимися с данной последовательности символов, используется "*".
Пример:
По запросу 'Федеральное Собрание ~~ #url="www.president.ru"' будут искаться упоминания о Федеральном Собрании везде, кроме официального сайта Президента РФ (www.president.ru).
Запрос '#link="www.president.ru"' покажет все документы, которые сослались на сайт Президента РФ.