dolboed: (Default)
[personal profile] dolboed
Некоторые думают, что Гугл от Яндекса отличается строгостью соответствий.
Скажем, Яндекс любую мужскую фамилию на -ев воспринимает как деепричастие совершенного вида, раскладывает на все возможные глагольные формы, и любую из них сочтёт релевантной по запросу (например: лебедеть, лебедею, лебедеешь и т.п. — это всё, по версии Яндекса, релевантные находки по запросу "Лебедев", и они будут подсвечены в выдаче, ежели вдруг найдутся; наоборот, Лебедев окажется релевантен запросу "лебедеть"). А Гугл, хоть и продвинулся слегка за последнюю пятилетку в осознании факта, что в русском языке существительные склоняются, глаголы спрягаются, а прилагательные имеют род, всё же этим ценным знанием не злоупотребляет. Поэтому если в Интернете нет слова лужковать, то Гугл честно нам скажет, что его нет, а Яндекс исправно найдёт 670 страниц на 28 серверах, где нет этого слова (но есть родительный падеж фамилии Лужков, склеенный со следующей буквой — например, ЛужковаВ или ЛужковаЮ, что Яндексом однозначно воспринимается как формы соответствующего глагола, и подсвечивается как находка)1. Нельзя сказать, что один поисковик по этой причине ищет лучше другого, просто полезно бывает знать эти особенности, и их учитывать при составлении запросов. В одних ситуациях важней точный ответ (в том числе — отрицательный); в других, наоборот, нечёткое соответствие чревато полезными подсказками.

Но только что я обнаружил в Гугле забавнейший глюк, который идёт вразрез с его привычным поведением.
Оказывается, Гугл считает, что кириллическая буква "ю", как строчная, так и прописная, является полным синонимом мужского имени Юрий. Поиск в Гугле этой буквы выдаёт находки, где имя Юрий подсвечено жирным шрифтом. При этом, когда мы заходим в кэшированную версию найденных страниц, подсветка "Юрия" заканчивается. Кто-нибудь наблюдал другие примеры такой шизофрении в Гугле, когда одно и то же слово одновременно считается и не считается находкой?

Update: разгадка оказалась проста. Это так Гугл сокращения разворачивает.
Пример: http://www.google.com/search?q=ie
При этом вылезли другие глюки: разным пользователям Google.Ru и Google.Com по-разному выдаёт эту подсветку, причём по одной и той же ссылке с моего поста. Причины выясняются.
_________________________________________
1. При этом обоим поисковикам, в силу особенностей работы PageRank, может прийти в голову выдать документ, вообще не содержащий искомого слова, если оно встречалось в ссылках на данный документ. В таких случаях прямо сообщается, что искомое слово найдено в ссылках. These terms only appear in links pointing to this page, — признаётся Гугл, а Яндекс сереньким цветом пишет текст ссылок:
Page 1 of 4 << [1] [2] [3] [4] >>

Date: 2007-07-24 03:58 pm (UTC)
From: [identity profile] n0xi0uzz.livejournal.com
Есть мнение, что Яндекс — гавно, а Google — нет, и в этом лишь их единственное отличие.

Date: 2007-07-24 04:04 pm (UTC)
From: [identity profile] dolboeb.livejournal.com
А что, у гугелькома сильно отличается движок/алгоритм/база?

Может, там и находки пофильтрованы как в китайской версии?

Date: 2007-07-24 04:05 pm (UTC)
From: [identity profile] liveuser.livejournal.com
> Гугель.ком лажается на русском. гугельру делает все правильно.

У меня гугель.ком не выделяет Юрия нигде (ни в выдаче, ни в кеше), а гугельру ведет себя в точности как написал Антон.

Date: 2007-07-24 04:05 pm (UTC)
From: [identity profile] dolboeb.livejournal.com
Судя по долям русскоязычного интернет-рынка, это мнение у ищущих по-русски вполне экзотично.

Date: 2007-07-24 04:06 pm (UTC)
From: [identity profile] lingovnist.livejournal.com
...кириллическая буква "ю", как строчная, так и прописная, является полным синонимом мужского имени Юрий

Уже не считает. Так быстро исправили?

Date: 2007-07-24 04:06 pm (UTC)
From: [identity profile] dolboeb.livejournal.com
Прелесть какая. То есть дело либо в языке интерфейса Гугла из настроек поиска, либо в языке ОСи/броузера.

Date: 2007-07-24 04:07 pm (UTC)
From: [identity profile] dolboeb.livejournal.com
У разных пользователей Гугельком и Гугельру ведут себя по-разному
http://dolboeb.livejournal.com/996887.html?thread=33322775#t33322775

Date: 2007-07-24 04:07 pm (UTC)
From: [identity profile] ex-ex-zhuzh.livejournal.com
гугль на очень многие аббревиатуры выдает расшифровки этих аббревиатур (поищите ie).

Date: 2007-07-24 04:10 pm (UTC)
From: [identity profile] dolboeb.livejournal.com
А. То есть это фича.

Осталось объяснить, почему она так по-разному реализована в разных ситуациях по одному запросу.

Date: 2007-07-24 04:13 pm (UTC)
From: [identity profile] lingovnist.livejournal.com
Интересно. ОС у меня русская, но нахожусь я в Германии. Что для него является определяющим в данном случае?

Date: 2007-07-24 04:14 pm (UTC)
From: [identity profile] carpe-diem.livejournal.com
лебедеешь... оч хорошо :))

Date: 2007-07-24 04:14 pm (UTC)
From: [identity profile] exemok.livejournal.com
А какие доли счас? Не встречал что-то нигде цифры...

Date: 2007-07-24 04:14 pm (UTC)
From: [identity profile] itman.livejournal.com
Полагаю, что база не отличается, но русскоязычные запросы обрабатываются и ранжируются по-другому.

Date: 2007-07-24 04:16 pm (UTC)
From: [identity profile] n0xi0uzz.livejournal.com
Ну дык Google в Россию относительно недавно пришел, а Яндекс нас уже чуть ли не десять лет мучает.

Юрьев день

Date: 2007-07-24 04:16 pm (UTC)
From: [identity profile] phwizard.livejournal.com
google.co.uk тоже Юриев подсвечивает :)

Date: 2007-07-24 04:17 pm (UTC)
From: [identity profile] itman.livejournal.com
Ну это, возможно, какие-то локальные глюки с языковыми настройками, помноженные на обработку истории запроса и географический таргетинг. Однако, я уже давно заметил, что гугельком по-русским запросам иногда полную лажу выдает, а гугль.ру ищет нормально. Причем, на разных машинах.

Re: Юрьев день

Date: 2007-07-24 04:18 pm (UTC)
From: [identity profile] phwizard.livejournal.com
может, "Юрий" это так буква "Ю" в какой-нибудь сербской азбуке называется? )

Date: 2007-07-24 04:20 pm (UTC)
From: [identity profile] dolboeb.livejournal.com
В смысле каких-то осмысленных действий, направленных в сторону русского пользователя, Гугл в Россию не пришёл, и, вероятно, не придёт никогда. Он только сделал попытку с негодными средствами адаптировать AdWords и AdSense к российско-советской бухгалтерии, и, судя по выступлению Долгова на КИБе, потерпел сокрушительную неудачу.

Если же говорить о возможности Гуглу завоевать симпатии какой-то элиты РУНЕТа, то мне Тёма Лебедев показал Гугл в 1998 году, когда домен был ещё третьего уровня, и к 1999 году он стал моим default choice, а в 2001 году я с его помощью выиграл Кубок Яндекса по поиску в Интернете. И как раз в те времена, когда незнание английского было в РУНЕТе экзотикой, а Яндекс только становился на ноги, доля Гугла на русском рынке была выше, чем сегодня.

Date: 2007-07-24 04:21 pm (UTC)

Re: Юрьев день

Date: 2007-07-24 04:21 pm (UTC)
From: [identity profile] dolboeb.livejournal.com
Нет, уже разгадали, это расшифровка аббревиатур как стандартная фича Гугла.
http://www.google.com/search?q=ie

Date: 2007-07-24 04:22 pm (UTC)
From: [identity profile] belenky.livejournal.com
Яндекс в последнее время испортился. Не работает кнопка "вернуться к предыдущему экрану". Это значит, что при поиске нужно каждый раз набирать искомое.
Что делать?

Date: 2007-07-24 04:23 pm (UTC)
From: [identity profile] liveuser.livejournal.com
http://www.google.com/search?q=%D1%8E&hl=en
http://www.google.com/search?q=%D1%8E&hl=ru
http://www.google.ru/search?q=%D1%8E&hl=en
http://www.google.ru/search?q=%D1%8E&hl=ru

Четыре разных выдачи.

Date: 2007-07-24 04:24 pm (UTC)
From: [identity profile] n0xi0uzz.livejournal.com
А уменьшение доли Гугла на русском рынке — это следствие деградации среднестатистического пользователя рунета, или самого Гугла?

Date: 2007-07-24 04:29 pm (UTC)
From: [identity profile] itman.livejournal.com
Ну что же, теория того, что Земля стоит на двух слонах оказалась несостоятельной: слонов, как минимум, 4. Кстати, а вот это, наверное, пятый и шестой результат :-)
http://www.google.ru/search?q=%D1%8E&hl=uk
http://www.google.ru/search?q=%D1%8E&hl=it

Date: 2007-07-24 04:32 pm (UTC)
From: [identity profile] liveuser.livejournal.com
> Яндекс в последнее время испортился. Не работает...

У Яндекса процесс исправления ошибок и релизов отвратительно поставлен, и не с последнего времени: я их прошу две существенные ошибки в поиске исправить - одну с мая 2006 г., другую с марта 2007 г. - а они только новые плодят.
Page 1 of 4 << [1] [2] [3] [4] >>

Profile

dolboed: (Default)
Anton Nossik

April 2017

S M T W T F S
       1
23 45678
9 10 11 12 13 14 15
16 17 18 19 202122
23 24 25 26 27 2829
30      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Mar. 17th, 2026 02:39 pm
Powered by Dreamwidth Studios