Причуды рейтинга
Feb. 23rd, 2008 05:41 pmУ меня было сильнейшее предчувствие, что пост в
nytimesinmoscow, собравший за сутки 1408 комментариев и 48 прямых ссылок (в том числе от
drugoi,
nl,
peresedov, автора этих строк, из
ru_politics и других высокорейтинговых блогов), не попадёт ни в пятёрку, ни даже в тридцатку топов Яндекса. Предчувствие меня не обмануло.
Тут, конечно, великое раздолье для конспирологов — задуматься, кто и по какой причине вручную заблокировал в топах запись, которой место в первой строчке по всем официальным яндекс.критериям рейтингования. Но ларчик открывается проще, и не стоит искать злой умысел там, где его нет. Алгоритм как бы автоматического составления списка топовых записей включает столь же автоматические блокировки по разным формальным критериям, не имеющим никакого отношения ни к чему, кроме конкретных условий, когда эти стопперы были добавлены в борьбе с той или иной накруткой. Как антиспамовый фильтр отправляет некоторую часть нужных писем в мусорку, так и стопперы в яндекс.топах регулярно режут именно те записи, которые должны были бы возглавить рейтинг, если б не ошибки алгоритма.
Если яндекс.рейтинг подвергается за это более жёсткой критике, чем антиспамные фильтры, то дело тут не во вселенской несправедливости, а в том всего лишь, что разработчики антиспамов честно и открыто говорят о возможности false positives, и призывают пользователей иногда в спамный ящик заглядывать, или хотя бы искать по нему, если нужное письмо затерялось. А администрация яндекс.рейтинга ни разу на моей памяти не признала существования в нём искажений, ни в принципе, ни по конкретным примерам. Ни разу речь не зашла не только об исправлении этих ошибок при обнаружении, но даже о простом признании их наличия. Думаю, если бы разработчики антиспама заявили, что false positives не существует, на них не меньше бы шишек посыпалось.
Bonus Track: Интересно, что при всей этой героической борьбе со спамом и накрутками Я.ППБ со свистом всосал пиратский ретранслятор dnevn.ru, куда без ссылки на источник чохом высасываются топовые ЖЖ. Теперь в находках ППБ контрафактные копии наших дневников стоят выше оригиналов. И такие же контрафакты с лирушечки тоже почему-то индексируются на ура, хотя, казалось бы, нет ни малейшей проблемы запретить индексирование всего этого мусора одним флажком.
Тут, конечно, великое раздолье для конспирологов — задуматься, кто и по какой причине вручную заблокировал в топах запись, которой место в первой строчке по всем официальным яндекс.критериям рейтингования. Но ларчик открывается проще, и не стоит искать злой умысел там, где его нет. Алгоритм как бы автоматического составления списка топовых записей включает столь же автоматические блокировки по разным формальным критериям, не имеющим никакого отношения ни к чему, кроме конкретных условий, когда эти стопперы были добавлены в борьбе с той или иной накруткой. Как антиспамовый фильтр отправляет некоторую часть нужных писем в мусорку, так и стопперы в яндекс.топах регулярно режут именно те записи, которые должны были бы возглавить рейтинг, если б не ошибки алгоритма.
Если яндекс.рейтинг подвергается за это более жёсткой критике, чем антиспамные фильтры, то дело тут не во вселенской несправедливости, а в том всего лишь, что разработчики антиспамов честно и открыто говорят о возможности false positives, и призывают пользователей иногда в спамный ящик заглядывать, или хотя бы искать по нему, если нужное письмо затерялось. А администрация яндекс.рейтинга ни разу на моей памяти не признала существования в нём искажений, ни в принципе, ни по конкретным примерам. Ни разу речь не зашла не только об исправлении этих ошибок при обнаружении, но даже о простом признании их наличия. Думаю, если бы разработчики антиспама заявили, что false positives не существует, на них не меньше бы шишек посыпалось.
Bonus Track: Интересно, что при всей этой героической борьбе со спамом и накрутками Я.ППБ со свистом всосал пиратский ретранслятор dnevn.ru, куда без ссылки на источник чохом высасываются топовые ЖЖ. Теперь в находках ППБ контрафактные копии наших дневников стоят выше оригиналов. И такие же контрафакты с лирушечки тоже почему-то индексируются на ура, хотя, казалось бы, нет ни малейшей проблемы запретить индексирование всего этого мусора одним флажком.
no subject
Date: 2008-02-23 02:48 pm (UTC)no subject
Date: 2008-02-23 02:50 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2008-02-23 03:01 pm (UTC)http://deep-water.ru/top/info.php?id=171
http://nl.livejournal.com/robots.txt
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2008-02-23 02:56 pm (UTC)результаты вас удивят
Можно подробнее?
From:Re: Можно подробнее?
From:Re: Можно подробнее?
From:Re: Можно подробнее?
From:Re: Можно подробнее?
From:no subject
Date: 2008-02-23 02:57 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2008-02-23 03:06 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2008-02-24 02:48 pm (UTC)no subject
Date: 2008-02-23 02:56 pm (UTC)no subject
Date: 2008-02-23 02:58 pm (UTC)no subject
Date: 2008-02-23 03:07 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2008-02-23 03:21 pm (UTC)Не могут же они и в самом деле признать, что в реальности этот мегаалгоритм представляет собой набор волюнтаристских и меняющихся чуть ли не ежедневно правил и поправок к коэффициентам, усугубленный к тому же периодическим ручным вмешательством.
no subject
Date: 2008-02-23 03:23 pm (UTC)Нормальные люди, читают ЖЖ, пишут в ЖЖ, отвечают на замечания...
Вот, например, выше:
http://dolboeb.livejournal.com/1170423.html?thread=45464311#t45464311
(no subject)
From:(no subject)
From:no subject
Date: 2008-02-23 03:25 pm (UTC)no subject
Date: 2008-02-23 03:35 pm (UTC)Вопрос - а мой ЖЖ почему там оказался? По рейтигам мой блог ведь только в третьей тысяче?
Оказывается, я себя я недооцениваю?
:)
no subject
Date: 2008-02-23 03:52 pm (UTC)И Яндекс, к сожалению, стимулирует её работу.
no subject
Date: 2008-02-23 04:22 pm (UTC)no subject
Date: 2008-02-23 04:27 pm (UTC)no subject
Date: 2008-02-23 04:56 pm (UTC)(no subject)
From:(no subject)
From:no subject
Date: 2008-02-23 05:33 pm (UTC)у него журнал ваще беспантовый, кто ему такой рейтинг нагнал, это наверное русицкие спецслужбы..
no subject
Date: 2008-02-23 06:27 pm (UTC)no subject
Date: 2008-02-23 07:03 pm (UTC)no subject
Date: 2008-02-23 10:38 pm (UTC)да и исходных данных у СУПа побольше будет
no subject
Date: 2008-02-24 12:07 am (UTC)Offtopic
Date: 2008-02-23 11:04 pm (UTC)Только не сочтите, пожалуйста, за рекламу. Я сам только недавно это обнаружил, вот вспомнил про Вас. Дело в том, что все Ваши фотографии будут выкладываться автоматически на определенный Вами хрстинг и/или компьютер.
Зол
Date: 2008-02-23 11:09 pm (UTC)no subject
Date: 2008-02-24 12:25 am (UTC)no subject
Date: 2008-02-24 12:32 am (UTC)(no subject)
From:(no subject)
From:вопрос по статистике LJ
Date: 2008-02-24 08:41 am (UTC)Я уже спрашивал вас про отличии результатов статистики Яндекса и LJ.
Сейчас я понять не могу, откуда у моего журнала (
Спасибо.
Re: вопрос по статистике LJ
Date: 2008-02-24 04:06 pm (UTC)no subject
Date: 2008-02-24 12:33 pm (UTC)no subject
Date: 2008-02-25 06:03 am (UTC)Нажимайте — «фу спам!», коричневую как гавно кнопку.
Не знаю уж, как там связано или нет, но мне каждый день интересно проверять записи по нескольким запросам — так там тоже были спамрезультаты определённое время — и — то ли я, то ли сообщество таких как я — залечили их нахер. Больше не выдаются.
«Фу! Спам!». Коричневая. Как гавно.