Поиск в Сети
// 26 ноября 2000 годаИщите, да обрящите…
( написано специально для журнала «Домашний Компьютер» )
Люди, склонные к излишнему употреблению красивых метафор, любят сравнивать Сеть с помойкой. Дескать, свалено там все в кучу и сам черт ногу сломит. Дескать, все тут есть, но чтобы это «все» найти, нужно перерыть горы мусора.
Метафора красива. Но неверна. У меня на столе царит, казалось бы, бессмысленное нагромождение ненужных вещей. Однако для меня все на столе подчинено твердой логике самые необходимые вещи, как, например, любимая кружка для чая системы «тазик» водоизмещением чуть больше
Так и в Сети есть своя логика. Зная и используя несколько простых правил, вы можете сделать так, что любая информация в Сети будет находиться на расстоянии вытянутой руки, и чувство, что интернет это помойка, бесследно исчезнет.
Речь пойдет о поисковых системах и правилах поиска в Сети.
Сначала небольшое лирическое отступление, в котором я расскажу, как устроена поисковая система. Так уж случилось, что пользователь видит лишь интерфейс поисковой системы, ее, с позволения сказать, лицо, а внутренности самое главное остаются «за кадром».
Итак, первая часть поисковой системы это «паук», crawler, поисковый робот. Он занимается тем, что путешествует по Сети, просматривает все страницы, посещает все ссылки, не останавливаясь ни на минуту. Путешествует не просто так все, каждую страницу, что он просмотрел, «паук» заносит в индекс поисковой машины в виде встречающихся на странице значащих слов.
Таким образом, индекс поисковой машины это огромнейшая база данных, с помощью которой можно быстро узнать, на какой именно странице в Сети можно встретить данное слово. В качестве информации к размышлению объем индекса поисковой системы Yandex.ru составляет 81,92 Гигабайт. (http://www.yandex.ru/chisla.html). Да, 81, 92 Гигабайт.
Третья часть, после индекса это собственно поисковая машина. Занимается он тем, что ищет нужное слово или слова в индексе. Поисковая система не ищет «по всему интернету» это заблуждение. Представьте, что было бы, если б это действительно было так: К примеру, объем проиндексированной информации на Yandex.ru составляет 258,67 Гб. А это значит, что не будь индекса, после того, как вы ввели запрос на Яндексе, ему пришлось бы загружать и просматривать 258 гигабайт информации. Это нонсенс. Представьте, сколько дней Яндекс отвечал бы на Ваш запрос.
Из того, что поисковая машина не ищет «По всему интернету», а только в своем индексе, следует, как минимум, два вывода. Первый если поисковая машина
Поисковый робот, составляющий индекс, обходит сайты «кругами», посещая их регулярно таким образом, индекс адекватно отражает изменения, происшедшие на сайте. Новые сайты «паук» находит либо сам, придя по ссылке с другого сайта, либо узнает о них от автора сайта в поисковых системах имеется возможность «натравить» «паука» на свой сайт.
Ну и последняя часть поисковой системы это ее
Для «общения» с поисковыми системами существуют специальные правила и специальный язык. Конечно, было бы здорово, если можно было бы просто так взять и спросить: «Где можно найти полный текст „Словаря Дьявола“ Амброза Бирса?» и получить полный и исчерпывающий ответ. В принципе, работы в этом направлении ведутся взять, хотя бы, буржуйский сайт «Ask Jeeves» (www.ask.com) задав вопрос в «литературной» форме только
Для начала нужно вычленить ключевые слова: решить, какие
Отрадно, но факт: из 20 запросов в лучшем случае пять на тему межполовых отношений. Проверьте сами. Но если не брать в расчет запросы, вроде «порнуха бесплатная», то у нас есть прекрасная возможность на примере остальных запросов рассмотреть, как именно искать НЕ СЛЕДУЕТ.
Как правило, большой процент запросов отличается полной неясностью, и неконкретностью: «музыка», «видео», «печи», «mp3». Вроде как «я просил, а ты будь добр, догадайся, что я имел в виду». Так, на запрос «музыка» Яндекс выдает 143791 ссылок. Надо уточнять, что именно вы ищите. Запрос «музыка кантри» дает уже 4443 ссылок, а «музыка кантри +новосибирск» уже всего 49.
Бывают чересчур конкретные запросы, бывают запросы и «совсем не по правилам». Кстати, о правилах…
Если вы набрали слово с маленькой буквы, то будут найдены слова с маленькой и большой буквы; если вы набрали слово с большой то будут найдены слова только с большой буквы. Например, на запрос «лебедь» поисковая система выдаст упоминания о птицах и о генерале. Поэтому правило: не набирайте без особой нужны слово с большой буквы! Иначе вам просто не будут выданы очень много совпадений.
Знаки
-картошка». Тогда будут найдены страницы с разнообразными рецептами пирожков без картошки.
Если вы ввели просто несколько слов, разделенных пробелами, то для поисковика это будет означать, что надо найти страницы, где эти слова входят в одной предложение. Например: «бесплатные программы».
Для поиска документа, содержащего любое из перечисленных слов, надо использовать знак «|». Очень удобно, если к слову имеется много синонимов. Например: «бесплатные | халявные | freeware +программы»
Для поиска устойчивых словосочетаний нужно ввести фразу для поиска в кавычках. (Во всех остальных случаях кавычки не нужны). Очень помогает, когда вам нужно, к примеру, найти слова стихов, а вы помните всего одну строчку. Введите эту строку с кавычками в поисковую систему. Например, помните вы прекрасную фрау «мысль изреченная есть ложь», а кто сказал не помните. Идете на «Яндекс», вводите «мысль изреченная есть ложь» (в кавычках) и сразу же узнаете, что сказал это Тютчев.
Более подробно о языке запросов написано на каждой поисковой системе, например вот тут: http://www.yandex.ru/info/syntax.html
В принципе, существуют
Из зарубежных всем известная AltaVista (www.altavista.com) и Yahoo (www.yahoo.com).
Пользуясь случаем, хотелось бы сказать «спасибо» поисковику «Яндекс». За то, что он есть. На мой взгляд это лучший поисковик в Рунете.
Тем не менее, есть обширный ряд задач, удовлетворить который это поисковики не могут. Давайте вообзарим такую ситуацию вам срочно нужен лучший в городе
Аналогично и с поисковыми системами. «Большие» поисковые системы рассчитаны на то, чтобы обхватить как можно больший объем информации. Когда же вам необходимо найти
О них по порядку.
Поиск по FTP позволяет искать в огромных файловых архивах как на просторах нашей родины (www.filesearch.ru), так и на просторах чужих родин (ftp.lycos.com)
Эти поисковые системы ищут только файлы по имени. И полезным это оказывается во многих случаях. К примеру, вы собрались скачивать
Кроме того, таким образом неплохо ищутся драйвера. Когда у меня потерялся драйвер к старой карточке ESS1868, я зашел на filesearch.ru, ввел «ess1686» и драйвер нашелся.
Хорошо получается таким образом и поиск
Впрочем, для поиска
Моя самая любимая oth.net. (http://www.oth.net). Этот поисковик идеален для иллюстрации понятия «индекс поисковой системы». Oth.net производит поиск
Плюсы: находит больше файлов, чем другие системы. Минусы: файлы надо качать как можно быстрее, потому что они могут исчезнуть.
Примерно также работает и http://music.lycos.com/
Следующая поисковая система
Если вы не нашли песню, которую искали, попробуйте другие поисковики, благо, что их достаточно:
http://www.audiofind.com/
http://www.audiophilez.com/
http://www.2000mp3.com/
Слова к любимым песням тоже находятся без проблем, стоит только поискать вот тут: http://www.lyrics.ch/index.htm, тут: http://songfile.snap.com/ или тут: http://lyrics.lipetsk.ru
Часто бывает ситуация, когда вам нужна программа, которая делает
Для тех, кто не в ладах с английским, могу посоветовать, например, ListSoft (http://www.listsoft.ru/)
Бывает и так вы нашли программу, скачали, поставили, а она просит у вас денег за регистрацию.
Да, может это незаконно и аморально но мы же сейчас говорим о поиске в Сети, а не о морали, верно?
Если вы заядлый игроман и хотите найти описания,
Для поиска в
Информацию о любимом фильме ищите в Internet Movie DataBase (www.imdb.com). Увы, только на английском, но посоветовать
Если вам надо узнать, что обозначает
Если вам надо найти изображение
Счастливого поиска!