Причуды рейтинга
Feb. 23rd, 2008 05:41 pmУ меня было сильнейшее предчувствие, что пост в
nytimesinmoscow, собравший за сутки 1408 комментариев и 48 прямых ссылок (в том числе от
drugoi,
nl,
peresedov, автора этих строк, из
ru_politics и других высокорейтинговых блогов), не попадёт ни в пятёрку, ни даже в тридцатку топов Яндекса. Предчувствие меня не обмануло.
Тут, конечно, великое раздолье для конспирологов — задуматься, кто и по какой причине вручную заблокировал в топах запись, которой место в первой строчке по всем официальным яндекс.критериям рейтингования. Но ларчик открывается проще, и не стоит искать злой умысел там, где его нет. Алгоритм как бы автоматического составления списка топовых записей включает столь же автоматические блокировки по разным формальным критериям, не имеющим никакого отношения ни к чему, кроме конкретных условий, когда эти стопперы были добавлены в борьбе с той или иной накруткой. Как антиспамовый фильтр отправляет некоторую часть нужных писем в мусорку, так и стопперы в яндекс.топах регулярно режут именно те записи, которые должны были бы возглавить рейтинг, если б не ошибки алгоритма.
Если яндекс.рейтинг подвергается за это более жёсткой критике, чем антиспамные фильтры, то дело тут не во вселенской несправедливости, а в том всего лишь, что разработчики антиспамов честно и открыто говорят о возможности false positives, и призывают пользователей иногда в спамный ящик заглядывать, или хотя бы искать по нему, если нужное письмо затерялось. А администрация яндекс.рейтинга ни разу на моей памяти не признала существования в нём искажений, ни в принципе, ни по конкретным примерам. Ни разу речь не зашла не только об исправлении этих ошибок при обнаружении, но даже о простом признании их наличия. Думаю, если бы разработчики антиспама заявили, что false positives не существует, на них не меньше бы шишек посыпалось.
Bonus Track: Интересно, что при всей этой героической борьбе со спамом и накрутками Я.ППБ со свистом всосал пиратский ретранслятор dnevn.ru, куда без ссылки на источник чохом высасываются топовые ЖЖ. Теперь в находках ППБ контрафактные копии наших дневников стоят выше оригиналов. И такие же контрафакты с лирушечки тоже почему-то индексируются на ура, хотя, казалось бы, нет ни малейшей проблемы запретить индексирование всего этого мусора одним флажком.
Тут, конечно, великое раздолье для конспирологов — задуматься, кто и по какой причине вручную заблокировал в топах запись, которой место в первой строчке по всем официальным яндекс.критериям рейтингования. Но ларчик открывается проще, и не стоит искать злой умысел там, где его нет. Алгоритм как бы автоматического составления списка топовых записей включает столь же автоматические блокировки по разным формальным критериям, не имеющим никакого отношения ни к чему, кроме конкретных условий, когда эти стопперы были добавлены в борьбе с той или иной накруткой. Как антиспамовый фильтр отправляет некоторую часть нужных писем в мусорку, так и стопперы в яндекс.топах регулярно режут именно те записи, которые должны были бы возглавить рейтинг, если б не ошибки алгоритма.
Если яндекс.рейтинг подвергается за это более жёсткой критике, чем антиспамные фильтры, то дело тут не во вселенской несправедливости, а в том всего лишь, что разработчики антиспамов честно и открыто говорят о возможности false positives, и призывают пользователей иногда в спамный ящик заглядывать, или хотя бы искать по нему, если нужное письмо затерялось. А администрация яндекс.рейтинга ни разу на моей памяти не признала существования в нём искажений, ни в принципе, ни по конкретным примерам. Ни разу речь не зашла не только об исправлении этих ошибок при обнаружении, но даже о простом признании их наличия. Думаю, если бы разработчики антиспама заявили, что false positives не существует, на них не меньше бы шишек посыпалось.
Bonus Track: Интересно, что при всей этой героической борьбе со спамом и накрутками Я.ППБ со свистом всосал пиратский ретранслятор dnevn.ru, куда без ссылки на источник чохом высасываются топовые ЖЖ. Теперь в находках ППБ контрафактные копии наших дневников стоят выше оригиналов. И такие же контрафакты с лирушечки тоже почему-то индексируются на ура, хотя, казалось бы, нет ни малейшей проблемы запретить индексирование всего этого мусора одним флажком.
no subject
Date: 2008-02-23 03:48 pm (UTC)Вопрос в том, отражает ли Топ Яндекса реальную картину, а не в личных пристрастиях.
no subject
Date: 2008-02-23 04:11 pm (UTC)Ну, например, на карикатуры на пророка Мухаммеда у мусульман тоже очень много комментов.
Означает ли это, что мусульманам они интересны?
Означает ли это, что эти каррикатуры должны висеть на главном мусульманском сайте? :-)
no subject
Date: 2008-02-23 04:17 pm (UTC)Да, это означает, что данная тема мусульманам очень небезразлична.
*Означает ли это, что эти каррикатуры должны висеть на главном мусульманском сайте?*
Право мусульман решать. А работа Яндекса правильно индексировать Топы. Вы похоже считаете, что там должен сидеть человек, которые одни Топы будет пускать, а другие резать. То есть решать за всех остальных, что им интересно, а что нет.
no subject
Date: 2008-02-23 04:25 pm (UTC)no subject
Date: 2008-02-23 04:54 pm (UTC)no subject
Date: 2008-02-23 05:44 pm (UTC)no subject
Date: 2008-02-23 05:48 pm (UTC)no subject
Date: 2008-02-23 05:52 pm (UTC)no subject
Date: 2008-02-23 05:20 pm (UTC)no subject
Date: 2008-02-23 07:58 pm (UTC)no subject
Date: 2008-02-23 05:48 pm (UTC)А на счет не место - то есть предлагаете на Яндексе ввести цензуру и выкидывать "неугодные" темы из Топа, даже если они туда попали? Иначе как трактовать "не место"?
no subject
Date: 2008-02-23 06:05 pm (UTC)no subject
Date: 2008-02-23 07:56 pm (UTC)no subject
Date: 2008-02-23 08:16 pm (UTC)no subject
Date: 2008-02-23 09:58 pm (UTC)no subject
Date: 2008-02-24 08:26 am (UTC)http://drugoi.livejournal.com/2532004.html?thread=114891428
"перед кем Вы оправдывайтесь, это же
очередной хохол, со своим хохляцким
комплексом неполноценности, прискакал"
no subject
Date: 2008-02-24 08:28 am (UTC)no subject
Date: 2008-02-24 08:35 am (UTC)страна - полный пфук, в Европе известны
только своими блядями, в мире - вообще не
известны
реализуют свой комплекс
неполноценности суетясь в комментяриях
и рассказывая самим себе о том, какие же
засранцы эти москали в отличие от
Великих и Могучих американцев"
no subject
Date: 2008-02-23 08:03 pm (UTC)no subject
Date: 2008-02-23 07:36 pm (UTC)