Странности Гугла
Jul. 24th, 2007 07:53 pmНекоторые думают, что Гугл от Яндекса отличается строгостью соответствий.
Скажем, Яндекс любую мужскую фамилию на -ев воспринимает как деепричастие совершенного вида, раскладывает на все возможные глагольные формы, и любую из них сочтёт релевантной по запросу (например: лебедеть, лебедею, лебедеешь и т.п. — это всё, по версии Яндекса, релевантные находки по запросу "Лебедев", и они будут подсвечены в выдаче, ежели вдруг найдутся; наоборот, Лебедев окажется релевантен запросу "лебедеть"). А Гугл, хоть и продвинулся слегка за последнюю пятилетку в осознании факта, что в русском языке существительные склоняются, глаголы спрягаются, а прилагательные имеют род, всё же этим ценным знанием не злоупотребляет. Поэтому если в Интернете нет слова лужковать, то Гугл честно нам скажет, что его нет, а Яндекс исправно найдёт 670 страниц на 28 серверах, где нет этого слова (но есть родительный падеж фамилии Лужков, склеенный со следующей буквой — например, ЛужковаВ или ЛужковаЮ, что Яндексом однозначно воспринимается как формы соответствующего глагола, и подсвечивается как находка)1. Нельзя сказать, что один поисковик по этой причине ищет лучше другого, просто полезно бывает знать эти особенности, и их учитывать при составлении запросов. В одних ситуациях важней точный ответ (в том числе — отрицательный); в других, наоборот, нечёткое соответствие чревато полезными подсказками.
Но только что я обнаружил в Гугле забавнейший глюк, который идёт вразрез с его привычным поведением.
Оказывается, Гугл считает, что кириллическая буква "ю", как строчная, так и прописная, является полным синонимом мужского имени Юрий. Поиск в Гугле этой буквы выдаёт находки, где имя Юрий подсвечено жирным шрифтом. При этом, когда мы заходим в кэшированную версию найденных страниц, подсветка "Юрия" заканчивается. Кто-нибудь наблюдал другие примеры такой шизофрении в Гугле, когда одно и то же слово одновременно считается и не считается находкой?
Update: разгадка оказалась проста. Это так Гугл сокращения разворачивает.
Пример: http://www.google.com/search?q=ie
При этом вылезли другие глюки: разным пользователям Google.Ru и Google.Com по-разному выдаёт эту подсветку, причём по одной и той же ссылке с моего поста. Причины выясняются.
_________________________________________
1. При этом обоим поисковикам, в силу особенностей работы PageRank, может прийти в голову выдать документ, вообще не содержащий искомого слова, если оно встречалось в ссылках на данный документ. В таких случаях прямо сообщается, что искомое слово найдено в ссылках. These terms only appear in links pointing to this page, — признаётся Гугл, а Яндекс сереньким цветом пишет текст ссылок:
Скажем, Яндекс любую мужскую фамилию на -ев воспринимает как деепричастие совершенного вида, раскладывает на все возможные глагольные формы, и любую из них сочтёт релевантной по запросу (например: лебедеть, лебедею, лебедеешь и т.п. — это всё, по версии Яндекса, релевантные находки по запросу "Лебедев", и они будут подсвечены в выдаче, ежели вдруг найдутся; наоборот, Лебедев окажется релевантен запросу "лебедеть"). А Гугл, хоть и продвинулся слегка за последнюю пятилетку в осознании факта, что в русском языке существительные склоняются, глаголы спрягаются, а прилагательные имеют род, всё же этим ценным знанием не злоупотребляет. Поэтому если в Интернете нет слова лужковать, то Гугл честно нам скажет, что его нет, а Яндекс исправно найдёт 670 страниц на 28 серверах, где нет этого слова (но есть родительный падеж фамилии Лужков, склеенный со следующей буквой — например, ЛужковаВ или ЛужковаЮ, что Яндексом однозначно воспринимается как формы соответствующего глагола, и подсвечивается как находка)1. Нельзя сказать, что один поисковик по этой причине ищет лучше другого, просто полезно бывает знать эти особенности, и их учитывать при составлении запросов. В одних ситуациях важней точный ответ (в том числе — отрицательный); в других, наоборот, нечёткое соответствие чревато полезными подсказками.
Но только что я обнаружил в Гугле забавнейший глюк, который идёт вразрез с его привычным поведением.
Оказывается, Гугл считает, что кириллическая буква "ю", как строчная, так и прописная, является полным синонимом мужского имени Юрий. Поиск в Гугле этой буквы выдаёт находки, где имя Юрий подсвечено жирным шрифтом. При этом, когда мы заходим в кэшированную версию найденных страниц, подсветка "Юрия" заканчивается. Кто-нибудь наблюдал другие примеры такой шизофрении в Гугле, когда одно и то же слово одновременно считается и не считается находкой?
Update: разгадка оказалась проста. Это так Гугл сокращения разворачивает.
Пример: http://www.google.com/search?q=ie
При этом вылезли другие глюки: разным пользователям Google.Ru и Google.Com по-разному выдаёт эту подсветку, причём по одной и той же ссылке с моего поста. Причины выясняются.
_________________________________________
1. При этом обоим поисковикам, в силу особенностей работы PageRank, может прийти в голову выдать документ, вообще не содержащий искомого слова, если оно встречалось в ссылках на данный документ. В таких случаях прямо сообщается, что искомое слово найдено в ссылках. These terms only appear in links pointing to this page, — признаётся Гугл, а Яндекс сереньким цветом пишет текст ссылок:
no subject
Date: 2007-07-24 03:58 pm (UTC)no subject
Date: 2007-07-24 04:05 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2008-10-17 04:50 am (UTC)no subject
Date: 2007-07-24 04:04 pm (UTC)Может, там и находки пофильтрованы как в китайской версии?
(no subject)
From:no subject
Date: 2007-07-24 04:05 pm (UTC)У меня гугель.ком не выделяет Юрия нигде (ни в выдаче, ни в кеше), а гугельру ведет себя в точности как написал Антон.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2007-07-24 04:06 pm (UTC)Уже не считает. Так быстро исправили?
no subject
Date: 2007-07-24 04:07 pm (UTC)http://dolboeb.livejournal.com/996887.html?thread=33322775#t33322775
(no subject)
From:(no subject)
From:no subject
Date: 2007-07-24 04:07 pm (UTC)no subject
Date: 2007-07-24 04:10 pm (UTC)Осталось объяснить, почему она так по-разному реализована в разных ситуациях по одному запросу.
no subject
Date: 2007-07-24 04:14 pm (UTC)Юрьев день
Date: 2007-07-24 04:16 pm (UTC)Re: Юрьев день
Date: 2007-07-24 04:18 pm (UTC)Re: Юрьев день
From:(no subject)
From:(no subject)
From:no subject
Date: 2007-07-24 04:22 pm (UTC)Что делать?
no subject
Date: 2007-07-24 04:32 pm (UTC)У Яндекса процесс исправления ошибок и релизов отвратительно поставлен, и не с последнего времени: я их прошу две существенные ошибки в поиске исправить - одну с мая 2006 г., другую с марта 2007 г. - а они только новые плодят.
(no subject)
From:(no subject)
From:no subject
Date: 2007-07-25 11:33 pm (UTC)А какой у вас браузер? Как именно не работает кнопка?
(no subject)
From:(no subject)
From:no subject
Date: 2007-07-24 04:45 pm (UTC)no subject
Date: 2007-07-24 04:51 pm (UTC)...которые успешно разбиваются об очередные новые "особенности" и баги в алгоритмах.
(no subject)
From:no subject
Date: 2007-07-25 11:53 am (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2007-07-24 05:53 pm (UTC)А популярность яндекса - заслуга исключительно их маркетинга.
(no subject)
From:(no subject)
From:no subject
Date: 2007-07-25 05:48 am (UTC)Я. исправно найдет уже именно эту запись. Уже проиндексировал :)
no subject
Date: 2007-07-25 07:56 am (UTC)no subject
Date: 2007-07-25 08:12 am (UTC)В новом или прежнем окне открываются результаты поиска Гугла — это в чистом виде пользовательская настройка, выставляемая вот здесь:
http://www.google.com/preferences
Я её как выставил 9 лет назад, так и живу.
А ещё есть средняя кнопка мыши, которая и в FireFox, и в MSIE7 любую Вам ссылку откроет в новой вкладке.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2007-07-25 08:58 am (UTC)no subject
Date: 2007-07-26 12:35 pm (UTC)http://wordstat.yandex.ru/advq?rpt=ppc&key=&shw=1&tm=&checkboxes=&text=%EC%E5%E1%E5%EB%FC®ions_text=%C2%F1%E5®ions=
no subject
Date: 2007-07-28 08:57 pm (UTC)