dolboed: (Default)
[personal profile] dolboed
Некоторые думают, что Гугл от Яндекса отличается строгостью соответствий.
Скажем, Яндекс любую мужскую фамилию на -ев воспринимает как деепричастие совершенного вида, раскладывает на все возможные глагольные формы, и любую из них сочтёт релевантной по запросу (например: лебедеть, лебедею, лебедеешь и т.п. — это всё, по версии Яндекса, релевантные находки по запросу "Лебедев", и они будут подсвечены в выдаче, ежели вдруг найдутся; наоборот, Лебедев окажется релевантен запросу "лебедеть"). А Гугл, хоть и продвинулся слегка за последнюю пятилетку в осознании факта, что в русском языке существительные склоняются, глаголы спрягаются, а прилагательные имеют род, всё же этим ценным знанием не злоупотребляет. Поэтому если в Интернете нет слова лужковать, то Гугл честно нам скажет, что его нет, а Яндекс исправно найдёт 670 страниц на 28 серверах, где нет этого слова (но есть родительный падеж фамилии Лужков, склеенный со следующей буквой — например, ЛужковаВ или ЛужковаЮ, что Яндексом однозначно воспринимается как формы соответствующего глагола, и подсвечивается как находка)1. Нельзя сказать, что один поисковик по этой причине ищет лучше другого, просто полезно бывает знать эти особенности, и их учитывать при составлении запросов. В одних ситуациях важней точный ответ (в том числе — отрицательный); в других, наоборот, нечёткое соответствие чревато полезными подсказками.

Но только что я обнаружил в Гугле забавнейший глюк, который идёт вразрез с его привычным поведением.
Оказывается, Гугл считает, что кириллическая буква "ю", как строчная, так и прописная, является полным синонимом мужского имени Юрий. Поиск в Гугле этой буквы выдаёт находки, где имя Юрий подсвечено жирным шрифтом. При этом, когда мы заходим в кэшированную версию найденных страниц, подсветка "Юрия" заканчивается. Кто-нибудь наблюдал другие примеры такой шизофрении в Гугле, когда одно и то же слово одновременно считается и не считается находкой?

Update: разгадка оказалась проста. Это так Гугл сокращения разворачивает.
Пример: http://www.google.com/search?q=ie
При этом вылезли другие глюки: разным пользователям Google.Ru и Google.Com по-разному выдаёт эту подсветку, причём по одной и той же ссылке с моего поста. Причины выясняются.
_________________________________________
1. При этом обоим поисковикам, в силу особенностей работы PageRank, может прийти в голову выдать документ, вообще не содержащий искомого слова, если оно встречалось в ссылках на данный документ. В таких случаях прямо сообщается, что искомое слово найдено в ссылках. These terms only appear in links pointing to this page, — признаётся Гугл, а Яндекс сереньким цветом пишет текст ссылок:

Date: 2007-07-24 03:58 pm (UTC)
From: [identity profile] n0xi0uzz.livejournal.com
Есть мнение, что Яндекс — гавно, а Google — нет, и в этом лишь их единственное отличие.

Date: 2007-07-24 04:05 pm (UTC)
From: [identity profile] dolboeb.livejournal.com
Судя по долям русскоязычного интернет-рынка, это мнение у ищущих по-русски вполне экзотично.

(no subject)

From: [identity profile] exemok.livejournal.com - Date: 2007-07-24 04:14 pm (UTC) - Expand

(no subject)

From: [identity profile] n0xi0uzz.livejournal.com - Date: 2007-07-24 04:21 pm (UTC) - Expand

(no subject)

From: [identity profile] 00000019.livejournal.com - Date: 2007-07-25 07:48 pm (UTC) - Expand

(no subject)

From: [identity profile] kukutz.livejournal.com - Date: 2007-07-25 11:27 pm (UTC) - Expand

(no subject)

From: [identity profile] n0xi0uzz.livejournal.com - Date: 2007-07-24 04:16 pm (UTC) - Expand

(no subject)

From: [identity profile] dolboeb.livejournal.com - Date: 2007-07-24 04:20 pm (UTC) - Expand

(no subject)

From: [identity profile] n0xi0uzz.livejournal.com - Date: 2007-07-24 04:24 pm (UTC) - Expand

(no subject)

From: [identity profile] eterevsky.livejournal.com - Date: 2007-07-24 04:53 pm (UTC) - Expand

(no subject)

From: [identity profile] intwebit.livejournal.com - Date: 2007-07-24 06:51 pm (UTC) - Expand

(no subject)

From: [identity profile] soprut.livejournal.com - Date: 2007-07-24 07:26 pm (UTC) - Expand

(no subject)

From: [identity profile] eterevsky.livejournal.com - Date: 2007-07-25 11:48 am (UTC) - Expand

(no subject)

From: [identity profile] viesel.livejournal.com - Date: 2007-07-24 04:36 pm (UTC) - Expand

(no subject)

From: [identity profile] catscrossing.livejournal.com - Date: 2007-07-24 05:02 pm (UTC) - Expand

(no subject)

From: [identity profile] edwardahirsch.livejournal.com - Date: 2007-07-24 07:52 pm (UTC) - Expand

(no subject)

From: [identity profile] ultraleft.livejournal.com - Date: 2007-07-25 06:14 pm (UTC) - Expand

(no subject)

From: [identity profile] kukutz.livejournal.com - Date: 2007-07-25 11:29 pm (UTC) - Expand

(no subject)

From: [identity profile] ultraleft.livejournal.com - Date: 2007-07-26 08:56 am (UTC) - Expand

(no subject)

From: [identity profile] dolboeb.livejournal.com - Date: 2007-07-26 09:04 am (UTC) - Expand

(no subject)

From: [identity profile] ultraleft.livejournal.com - Date: 2007-07-26 11:14 am (UTC) - Expand

(no subject)

From: [identity profile] dolboeb.livejournal.com - Date: 2007-07-26 11:21 am (UTC) - Expand

(no subject)

From: [identity profile] ultraleft.livejournal.com - Date: 2007-07-26 11:37 am (UTC) - Expand

(no subject)

From: [identity profile] dolboeb.livejournal.com - Date: 2007-07-26 09:10 am (UTC) - Expand

(no subject)

From: [identity profile] born-phoenix.livejournal.com - Date: 2007-07-28 08:51 pm (UTC) - Expand

Date: 2008-10-17 04:50 am (UTC)
From: [identity profile] nathanaelstilm.livejournal.com
а таких ебланов сразу к стенки, они уже предатели, еще войны нет а он сука здался.
(screened comment)

Date: 2007-07-24 04:04 pm (UTC)
From: [identity profile] dolboeb.livejournal.com
А что, у гугелькома сильно отличается движок/алгоритм/база?

Может, там и находки пофильтрованы как в китайской версии?

(no subject)

From: [identity profile] itman.livejournal.com - Date: 2007-07-24 04:14 pm (UTC) - Expand

Date: 2007-07-24 04:05 pm (UTC)
From: [identity profile] liveuser.livejournal.com
> Гугель.ком лажается на русском. гугельру делает все правильно.

У меня гугель.ком не выделяет Юрия нигде (ни в выдаче, ни в кеше), а гугельру ведет себя в точности как написал Антон.

(no subject)

From: [identity profile] dolboeb.livejournal.com - Date: 2007-07-24 04:06 pm (UTC) - Expand

(no subject)

From: [identity profile] edwardahirsch.livejournal.com - Date: 2007-07-24 08:18 pm (UTC) - Expand

(no subject)

From: [identity profile] nebenbei.livejournal.com - Date: 2007-07-25 03:16 pm (UTC) - Expand

(no subject)

From: [identity profile] itman.livejournal.com - Date: 2007-07-24 04:17 pm (UTC) - Expand

(no subject)

From: [identity profile] liveuser.livejournal.com - Date: 2007-07-24 04:23 pm (UTC) - Expand

(no subject)

From: [identity profile] itman.livejournal.com - Date: 2007-07-24 04:29 pm (UTC) - Expand

(no subject)

From: [identity profile] liveuser.livejournal.com - Date: 2007-07-24 04:35 pm (UTC) - Expand

Date: 2007-07-24 04:06 pm (UTC)
From: [identity profile] lingovnist.livejournal.com
...кириллическая буква "ю", как строчная, так и прописная, является полным синонимом мужского имени Юрий

Уже не считает. Так быстро исправили?

Date: 2007-07-24 04:07 pm (UTC)
From: [identity profile] dolboeb.livejournal.com
У разных пользователей Гугельком и Гугельру ведут себя по-разному
http://dolboeb.livejournal.com/996887.html?thread=33322775#t33322775

(no subject)

From: [identity profile] lingovnist.livejournal.com - Date: 2007-07-24 04:13 pm (UTC) - Expand

(no subject)

From: [identity profile] nebenbei.livejournal.com - Date: 2007-07-25 03:18 pm (UTC) - Expand

Date: 2007-07-24 04:07 pm (UTC)
From: [identity profile] ex-ex-zhuzh.livejournal.com
гугль на очень многие аббревиатуры выдает расшифровки этих аббревиатур (поищите ie).

Date: 2007-07-24 04:10 pm (UTC)
From: [identity profile] dolboeb.livejournal.com
А. То есть это фича.

Осталось объяснить, почему она так по-разному реализована в разных ситуациях по одному запросу.

Date: 2007-07-24 04:14 pm (UTC)
From: [identity profile] carpe-diem.livejournal.com
лебедеешь... оч хорошо :))

Юрьев день

Date: 2007-07-24 04:16 pm (UTC)
From: [identity profile] phwizard.livejournal.com
google.co.uk тоже Юриев подсвечивает :)

Re: Юрьев день

Date: 2007-07-24 04:18 pm (UTC)
From: [identity profile] phwizard.livejournal.com
может, "Юрий" это так буква "Ю" в какой-нибудь сербской азбуке называется? )

Re: Юрьев день

From: [identity profile] dolboeb.livejournal.com - Date: 2007-07-24 04:21 pm (UTC) - Expand

(no subject)

From: [identity profile] noahtoensing.livejournal.com - Date: 2008-10-09 04:15 pm (UTC) - Expand

(no subject)

From: [identity profile] vaughnschlichl.livejournal.com - Date: 2008-10-09 04:15 pm (UTC) - Expand

Date: 2007-07-24 04:22 pm (UTC)
From: [identity profile] belenky.livejournal.com
Яндекс в последнее время испортился. Не работает кнопка "вернуться к предыдущему экрану". Это значит, что при поиске нужно каждый раз набирать искомое.
Что делать?

Date: 2007-07-24 04:32 pm (UTC)
From: [identity profile] liveuser.livejournal.com
> Яндекс в последнее время испортился. Не работает...

У Яндекса процесс исправления ошибок и релизов отвратительно поставлен, и не с последнего времени: я их прошу две существенные ошибки в поиске исправить - одну с мая 2006 г., другую с марта 2007 г. - а они только новые плодят.

(no subject)

From: [identity profile] skyer.livejournal.com - Date: 2007-07-24 07:21 pm (UTC) - Expand

(no subject)

From: [identity profile] moorca.livejournal.com - Date: 2007-07-26 08:25 pm (UTC) - Expand

Date: 2007-07-25 11:33 pm (UTC)
From: [identity profile] kukutz.livejournal.com
Кнопка на панели браузера, которая Back?

А какой у вас браузер? Как именно не работает кнопка?

(no subject)

From: [identity profile] belenky.livejournal.com - Date: 2007-07-26 03:19 am (UTC) - Expand

(no subject)

From: [identity profile] kerfoer.livejournal.com - Date: 2007-07-26 10:10 pm (UTC) - Expand

Date: 2007-07-24 04:45 pm (UTC)
From: [identity profile] cherniavska.livejournal.com
Искать надо уметь..И б Гугле и в Яндексе..есть определенные техники поисков..Аспирантский курс по поиску разной информации в Интернете - School of Library and Information Studies..

Date: 2007-07-24 04:51 pm (UTC)
From: [identity profile] liveuser.livejournal.com
> Искать надо уметь..И б Гугле и в Яндексе..есть определенные техники поисков.

...которые успешно разбиваются об очередные новые "особенности" и баги в алгоритмах.

(no subject)

From: [identity profile] cherniavska.livejournal.com - Date: 2007-07-24 05:44 pm (UTC) - Expand

Date: 2007-07-25 11:53 am (UTC)
From: [identity profile] eterevsky.livejournal.com
Забавно. В Гугле учатся понимать пользователя, как бы он не сформулировал свой запрос, а пользователи учатся, как бы сформурировать свой запрос так, чтобы Гугл получше понял. :-)

(no subject)

From: [identity profile] cherniavska.livejournal.com - Date: 2007-07-25 01:32 pm (UTC) - Expand

(no subject)

From: [identity profile] eterevsky.livejournal.com - Date: 2007-07-25 01:44 pm (UTC) - Expand

(no subject)

From: [identity profile] cherniavska.livejournal.com - Date: 2007-07-25 04:34 pm (UTC) - Expand

(no subject)

From: [identity profile] bad-pig.livejournal.com - Date: 2007-07-31 09:11 am (UTC) - Expand

(no subject)

From: [identity profile] cherniavska.livejournal.com - Date: 2007-07-31 01:21 pm (UTC) - Expand

Date: 2007-07-24 05:53 pm (UTC)
From: [identity profile] doctor-puknul.livejournal.com
Вся разница в том, что яндекс - это говно, которое никогда ничего не находит, а гугл находит все и всегда, хоть и не идеален.

А популярность яндекса - заслуга исключительно их маркетинга.
(deleted comment)

(no subject)

From: [identity profile] doctor-puknul.livejournal.com - Date: 2007-07-24 08:17 pm (UTC) - Expand

(no subject)

From: [identity profile] born-phoenix.livejournal.com - Date: 2007-07-28 08:52 pm (UTC) - Expand

Date: 2007-07-25 05:48 am (UTC)
From: [identity profile] karmatsky.livejournal.com
"Яндекс исправно найдёт 670 страниц на 28 серверах, где нет этого слова"
Я. исправно найдет уже именно эту запись. Уже проиндексировал :)

Date: 2007-07-25 07:56 am (UTC)
From: [identity profile] kazarinov.livejournal.com
У Гугла есть просто охренительный "бзик", дело в том, что ссылки на странице выдачи результатов поиска по умолчанию открываются в том же окне, разумеется это не проблема, можно открывать через контекстное меню, но черт возьми, это ведь и ежику понятно, что ссылки в поисковике должны по умолчанию открываться в новом окне!

Date: 2007-07-25 08:12 am (UTC)
From: [identity profile] dolboeb.livejournal.com
Вот Вы смешной.
В новом или прежнем окне открываются результаты поиска Гугла — это в чистом виде пользовательская настройка, выставляемая вот здесь:
http://www.google.com/preferences
Я её как выставил 9 лет назад, так и живу.

А ещё есть средняя кнопка мыши, которая и в FireFox, и в MSIE7 любую Вам ссылку откроет в новой вкладке.

(no subject)

From: [identity profile] kazarinov.livejournal.com - Date: 2007-07-25 08:16 am (UTC) - Expand
(deleted comment)

(no subject)

From: [identity profile] kazarinov.livejournal.com - Date: 2007-07-25 09:55 am (UTC) - Expand

(no subject)

From: [identity profile] born-phoenix.livejournal.com - Date: 2007-07-28 08:55 pm (UTC) - Expand

(no subject)

From: [identity profile] bad-pig.livejournal.com - Date: 2007-07-31 09:09 am (UTC) - Expand

Date: 2007-07-25 08:58 am (UTC)
From: [identity profile] gaius-julius.livejournal.com
видимо у разных людей по разному настроены языковые фичи гугла. либо они из разных стран.

Date: 2007-07-26 12:35 pm (UTC)
From: [identity profile] wintersturme.livejournal.com
А может ли кто-нибудь из поклонников Яндекса объяснить, почему нулевая форма слова "мебель" в переводе на Яндексо-директовский звучит как "мебля"?
http://wordstat.yandex.ru/advq?rpt=ppc&key=&shw=1&tm=&checkboxes=&text=%EC%E5%E1%E5%EB%FC®ions_text=%C2%F1%E5®ions=

Date: 2007-07-28 08:57 pm (UTC)
From: [identity profile] born-phoenix.livejournal.com
Таму што гэтую частку Яндэкса праграмавалі вясёлыя беларускія праграмісты! :)))

Profile

dolboed: (Default)
Anton Nossik

April 2017

S M T W T F S
       1
23 45678
9 10 11 12 13 14 15
16 17 18 19 202122
23 24 25 26 27 2829
30      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Mar. 17th, 2026 10:17 am
Powered by Dreamwidth Studios