Среди довольно большого количества поисковых систем, доступных пользователю Интернета, система Google занимает одно из лидирующих мест. Такого успеха поисковик сумел добиться всего за пять лет - его разработали два студента Стэндфордского университета Сергей Брин и Ларри Пэйдж в 1998 году. А уже два года спустя эту систему, как поставщика результатов поиска, вместо Inktomi выбрал Yahoo!. Действительно ли так хорош Google, как о нем пишут? Как вести поиск с его помощью, и какие возможности он предоставляет своим пользователям? Google - полиглот. Он позволяет вести поиск на многих языках (сейчас в списке их тридцать пять, в том числе русский, японский, корейский и другие, а интерфейс пользователь может выбрать из списка в 83 языка). Интересно, что и поиск на Google по умолчанию ведется среди сайтов, которые своим основным языком считают тот, на котором сделан запрос. Поэтому, если ввести запрос на английском языке в форме русскоязычного интерфейса, поиск будет вестись среди англоязычных сайтов. В то же время можно вести поиск по тем же английским или немецким словам и в российской части Сети, если выбрать такую опцию в поисковой форме. Англоязычные пользователи имеют и дополнительные возможности - автоматический перевод найденных страниц с испанского, французского, немецкого, итальянского и португальского языков на английский. Увы, русский язык пока не поддерживается.
Как искать с помощью Google? По умолчанию вам предлагается простой вариант поиска, в форме которого можно ввести искомые слова. Поиск будет вестись по всем словам, за исключением так называемых "стоп-слов", и в результате будут выданы страницы, на которых находятся все заданные слова. Если же вам необходимо найти точную фразу, ограничьте ее кавычками, вот так - "хочу все знать". Вам будет предложен перечень страниц, содержащих такую фразу. Поисковик не учитывает при поиске помимо стоп слов одиночные цифры и буквы. Для того чтобы они учитывались в запросе, нужно перед ними ставить знак "+" или заключать фразу в кавычки. И наоборот, если вы хотите, чтобы какое-либо слово не учитывалось в запросе, перед ним надо ставить знак "-". При этом не забывайте, что эти знаки нужно писать слитно с последующими за ними словами. Google учитывает склонение слов, поэтому задав для поиска слово "техники", вы не получите страницы, где это слово написано по-иному, например, "техник". Зато регистр букв поисковиком не учитывается.
Поскольку Google ищет на странице все слова, входящие в запрос, для альтернативного поиска используется оператор OR. В этом случае поиск ведется по нахождению на странице любого из слов, объединенных оператором. Google предоставляет возможность поиска не только в Интернете, но и на отдельном сайте (домене). Если вы знаете домен, на котором требуется найти информацию по слову или фразе, то тогда поисковый запрос будет выглядеть так: "хостинг site:www.hoctinfo.ru".
Если выбрать вариант расширенного поиска, то появится возможность установки дополнительных параметров. Здесь можно задать, на каком языке должны быть страницы результата поиска, указать, среди файлов какого формата вести поиск (а таких не-HTML файлов проиндексировано свыше 35 миллионов), ограничить регион поиска - по наличию искомого слова в заголовке страницы или основной части, в адресе или ссылках на данную страницу, ограничить временной интервал последнего обновления. Со страницы расширенных настроек можно искать страницы, похожие на заданную в строке поиска, либо искать страницы, ссылающиеся на заданную.
Теперь можно перейти и к вопросу интерпретации результатов поиска. Найденные ссылки выводятся по их релевантности запросу. Для определения релевантности, наряду с другими показателями, одним из важнейших является "индекс цитирования сайта" ("link popularity"). По формуле, которая не раскрывается, подсчитывается количество и качество ссылок, ведущих на найденный сайт с других сайтов. Данные для расчета берутся как из базы данных самого Google, так и из данных других поисковиков или каталогов.
Google не любит склонений
Но немного подробнее об "индексе цитирования". Его значение рассчитывается не только по общему количеству ссылок, ведущих на сайт. Это количественный показатель. А кроме него, существует еще несколько качественных показателей ссылок. Первый показатель - откуда идет ссылка. Если она расположена на известном сайте - например, в каталоге "Яндекса", - то "вес" ссылки будет существенно выше, нежели ссылки, ведущей с какого-либо рядового сайта. Второй показатель - соответствие надписи на ссылке тематике сайта, на который она ведет. Если они соответствуют друг другу, то "вес" ссылки опять же оказывается выше, чем в ином случае. И, наконец, третий качественный показатель - тематическая принадлежность сайта, откуда идет ссылка. Если тематика сайта соответствует или близка тематике найденного сайта, то "вес" этой ссылки опять же увеличивается. Поэтому для того, чтобы сайт оказывался в списке результатов поиска в первых рядах, выгоднее иметь ссылки на него не небольшом количестве близких "по духу" проектов, чем на большом числе сайтов любой иной тематики.
Каждая найденная ссылка сопровождается дополнительной информацией. Здесь приводятся краткие цитаты со страницы, в которые входят слова запроса, адрес страницы, ее размер, дата последнего обновления. Если сайт зарегистрирован в каталоге Google, то приводится ссылка на категорию, где он размещен. По этой ссылке можно найти и другие, близкие по тематике сайты. Для большинства найденных ссылок приводится ссылка на сохраненную в базе Google страницу. Благодаря этому можно просмотреть проиндексированную страницу даже в том случае, если она уже удалена (мне удалось таким образом прочитать страницы одного онлайнового проекта, которые в самом проекте уже отсутствовали). Если на сайте есть много соответствующих запросу страниц, то Google выводит ссылки и на наиболее подходящие из них. И добавляет ссылку для выборки остальных подходящих результатов с этого сайта.
Но вы можете избежать просмотра перечня результатов поиска, если верите в свою удачу. Для этого стартовать поиск нужно не клавишей "Искать в Интернете", а другой, которая называется "Мне повезет!" (I'm Feeling Lucky). По этой клавише вас перебросит сразу на наиболее близкую к ответу на ваш запрос страницу. А уж как точно вы задали свой вопрос, зависит только от вас.
Индекс цитирования - это популярность сайта
Воспользоваться возможностями поисковика можно и не заходя на его сайт. Достаточно установить в свой браузер специальную инструментальную панель от Google. Она поможет вам вести поиск и не только в Интернете, но и на сайте, который вы просматриваете. Особенно удобен этот инструмент для тех сайтов, которые не имеют собственных средств поиска.
С помощью Google можно вести не только поиск текстовой информации на сайтах. На протяжении всех пяти лет своего существования Google постоянно увеличивает поисковые сервисы. Наиболее известным является поиск изображений. Для этого индексируются и названия изображений, и подписи к ним. Сейчас проиндексировано уже свыше 425 миллионов изображений. Как и для обычного поиска, поиск изображений имеет как обычный вариант создания запросов, так и расширенный. При использовании расширенного варианта поиска можно уточнить запрос - вести поиск по всем словам, с точной фразой, с любым из введенных слов. Можно уточнить, какой формат должны иметь найденные изображения, их цветовую палитру, размер. Также можно указать, на каком сайте или домене вести поиск.
Ищите в Сети с помощью инструментальных средств Google для браузеров
А вот другими поисковыми сервисами пользуются реже. Так, один из них позволяет вести поиск значений слов, выражений и акронимов в словаре Google. Другой сервис позволяет вести поиск на страницах сайтов американских университетов.А если в строке поиска ввести адрес дома любого города США, то Google распознает его и попытается сформировать ссылку на наиболее подходящую карту местности, хранящуюся на одном из наиболее крупных картографических серверов. Аналогично, при вводе в строке поиска имени, фамилии и города проживания гражданина США вам будет выдан список телефонных номеров. Он будет тем меньше, чем больше информации вы введете.
Google имеет свой собственный словарь слов и выражений
И наиболее экзотические виды поиска. Такие, как поиск продуктов через Интернет, специализированный поиск по отдельным направлениям - BSD, Apple, Microsoft, поиск информации о котировках на рынках ценных бумаг и другие виды поиска.
Только дойдя до этого места, я понял, что в одной статье описать все возможности Google невозможно. Как заставить поисковик не хранить ваши страницы в кэше? Как сформировать свой сайт, чтобы он оказался проиндексирован этой системой на максимальную глубину? Как ведется поиск среди групп новостей? Как пользоваться услугами профессиональных исследователей Интернета? Таких "как" еще очень много, и кто знает - может быть, появится еще не одна статья об этой прекрасной поисковой системе.