Причуды рейтинга
Feb. 23rd, 2008 05:41 pmУ меня было сильнейшее предчувствие, что пост в
nytimesinmoscow, собравший за сутки 1408 комментариев и 48 прямых ссылок (в том числе от
drugoi,
nl,
peresedov, автора этих строк, из
ru_politics и других высокорейтинговых блогов), не попадёт ни в пятёрку, ни даже в тридцатку топов Яндекса. Предчувствие меня не обмануло.
Тут, конечно, великое раздолье для конспирологов — задуматься, кто и по какой причине вручную заблокировал в топах запись, которой место в первой строчке по всем официальным яндекс.критериям рейтингования. Но ларчик открывается проще, и не стоит искать злой умысел там, где его нет. Алгоритм как бы автоматического составления списка топовых записей включает столь же автоматические блокировки по разным формальным критериям, не имеющим никакого отношения ни к чему, кроме конкретных условий, когда эти стопперы были добавлены в борьбе с той или иной накруткой. Как антиспамовый фильтр отправляет некоторую часть нужных писем в мусорку, так и стопперы в яндекс.топах регулярно режут именно те записи, которые должны были бы возглавить рейтинг, если б не ошибки алгоритма.
Если яндекс.рейтинг подвергается за это более жёсткой критике, чем антиспамные фильтры, то дело тут не во вселенской несправедливости, а в том всего лишь, что разработчики антиспамов честно и открыто говорят о возможности false positives, и призывают пользователей иногда в спамный ящик заглядывать, или хотя бы искать по нему, если нужное письмо затерялось. А администрация яндекс.рейтинга ни разу на моей памяти не признала существования в нём искажений, ни в принципе, ни по конкретным примерам. Ни разу речь не зашла не только об исправлении этих ошибок при обнаружении, но даже о простом признании их наличия. Думаю, если бы разработчики антиспама заявили, что false positives не существует, на них не меньше бы шишек посыпалось.
Bonus Track: Интересно, что при всей этой героической борьбе со спамом и накрутками Я.ППБ со свистом всосал пиратский ретранслятор dnevn.ru, куда без ссылки на источник чохом высасываются топовые ЖЖ. Теперь в находках ППБ контрафактные копии наших дневников стоят выше оригиналов. И такие же контрафакты с лирушечки тоже почему-то индексируются на ура, хотя, казалось бы, нет ни малейшей проблемы запретить индексирование всего этого мусора одним флажком.
Тут, конечно, великое раздолье для конспирологов — задуматься, кто и по какой причине вручную заблокировал в топах запись, которой место в первой строчке по всем официальным яндекс.критериям рейтингования. Но ларчик открывается проще, и не стоит искать злой умысел там, где его нет. Алгоритм как бы автоматического составления списка топовых записей включает столь же автоматические блокировки по разным формальным критериям, не имеющим никакого отношения ни к чему, кроме конкретных условий, когда эти стопперы были добавлены в борьбе с той или иной накруткой. Как антиспамовый фильтр отправляет некоторую часть нужных писем в мусорку, так и стопперы в яндекс.топах регулярно режут именно те записи, которые должны были бы возглавить рейтинг, если б не ошибки алгоритма.
Если яндекс.рейтинг подвергается за это более жёсткой критике, чем антиспамные фильтры, то дело тут не во вселенской несправедливости, а в том всего лишь, что разработчики антиспамов честно и открыто говорят о возможности false positives, и призывают пользователей иногда в спамный ящик заглядывать, или хотя бы искать по нему, если нужное письмо затерялось. А администрация яндекс.рейтинга ни разу на моей памяти не признала существования в нём искажений, ни в принципе, ни по конкретным примерам. Ни разу речь не зашла не только об исправлении этих ошибок при обнаружении, но даже о простом признании их наличия. Думаю, если бы разработчики антиспама заявили, что false positives не существует, на них не меньше бы шишек посыпалось.
Bonus Track: Интересно, что при всей этой героической борьбе со спамом и накрутками Я.ППБ со свистом всосал пиратский ретранслятор dnevn.ru, куда без ссылки на источник чохом высасываются топовые ЖЖ. Теперь в находках ППБ контрафактные копии наших дневников стоят выше оригиналов. И такие же контрафакты с лирушечки тоже почему-то индексируются на ура, хотя, казалось бы, нет ни малейшей проблемы запретить индексирование всего этого мусора одним флажком.
no subject
Date: 2008-02-24 01:25 am (UTC)2) ни один провайдер не гарантирует доставку какой бы то ни было информации до конечной точки (нектороые, весьма купированные гарантии могут даваться лишь во внутренней сети самого провайдера, да и то — не всегда);
3) вы могли пользователься альтернативными средствами обмена информацией (телефон, телеграф, факс, ect.)
no subject
Date: 2008-02-24 09:25 am (UTC)2) эммм, я вкратце расскажу, в простых терминах, что именно. дело в том, что провайдер A "контролирует" только участок своей СПД (системы передачи данных). как только какой-то пакет (из пакетов состоит всё, тысячи их!) покидает зону провайдера — он мчится по оптоволокну (или ещё чему) к другому передающему узлу провайдера B. там за его перенаправление и доставку (на следующий хоп) должен бы отвечать провайдер B, но этого не происходит по причине того, что пакет не его, он просто работает ретранслятором. его внутренние правила маршрутизации могут запретить пакет, дропнуть его и вообще не париться с этим всем никогда-никогда. и чем больше хопов от передающей стороны до принимающей, тем больше вероятность, что этот пакет не дойдёт, например. или дойдёт со значительной задержкой (в маршрутизации есть свои приоритеты и каждый провайдер устанавливает свои правила). а ещё есть проблемы оборудования, форс-мажоры, ленивые сотрудники и пьяные в жопу администраторы. всякое бывает. поэтому обещать непременную доставку какой-то информации вне зоны своего влияния не сможет обещать ни один провайдер. если какой-то обещает такое — знайте, перед вами мошенники.
надеюсь, понятно написал.
no subject
Date: 2008-02-24 09:35 am (UTC)no subject
Date: 2008-02-24 11:53 pm (UTC)