За кулисами Яндекс.рейтинга
Nov. 23rd, 2007 02:36 amНезнакомый мне пользователь
v_ad сочинил новую пузомерку.
Она берёт ваш username в ЖЖ, анализирует профайл, и находит всех тысячнегов в вашем списке Friend of.
На выходе выдаёт код, позволяющий похвастаться результатами этого изыскания.
Иногда это бессмысленная цифра. Потому что, как я уже не раз писал, "тысячнег" от нормального человека ровным счётом ничем не отличается. У него такие же две ноги, две руки, одна голова, и, как правило, нет хвоста.
Но иногда о чём-то эта цифирь всё же свидетельствует. В тех случаях, про которые покойный Георг Вильгельм Фридрих Г. подмечал, что количество перешло в качество. Или не перешло. Чтоб в этом убедиться, полезно взглянуть вот на эту табличку:
Легко догадаться, что составлял я эту табличку наугад. Ориентировался на такие параметры, как популярность по числу френдов, "авторитетность" по Яндексу и офлайновая известность персонажа. Социологические выводы в основном таковы:
1. На долю тысячнегов среди френдов негативно влияет общая популярность: чем больше френдов, тем ниже среди них доля тысячнегов. Высокая доля тысячнегов среди френдов характерна для ЖЖ с камерной аудиторией, владельцы которых широко известны в узких кругах — причём одинаково часто причиной известности может служить личное знакомство (
gosha_o), или профессиональная деятельность персонажа (
cema).
2. На число тысячнегов среди читателей влияют очень разные, никак между собой не связанные факторы, относящиеся и к биографии человека, и к возрасту ЖЖ, и к истории его раскрутки, и к месту работы. Любой рейтинг, построенный на учёте этих параметров в том или ином соотношении, будет больше характеризовать само это соотношение, заданное при выборе формулы оценки, чем какие-либо объективные свойства рейтингуемых блогов. Что, собственно говоря, мы и наблюдаем в рейтинге т.н. "авторитетности" Яндекса. Практически табличка наша и показывает (на примере
doctor_livsy и
stillavinsergei), как именно Яндекс изначально расставлял оценки блогам в ЖЖ. Она же раскрывает секрет изначальной популярности
sholademi. Потом формулку подкрутили, и Самсон просел, а Лукьяненко поднялся. Как выше уже сказано, это изменение описывало изменения не в "авторитетности" блоггера (whatever this means), а в алгоритме расчёта.
PS. Я наверняка упустил какие-то журналы, у которых число читателей-тысячнегов выше и в абсолютном значении, и в процентном отношении. Благодарен буду за наводки, помогающие исправить и дополнить таблицу.
PPS. При составлении таблички наткнулся на неслабую дырищу в яндексовом спайдеринге ЖЖ. У Гришковца, как выше указано, 11620 френдов только в ЖЖ. Яндексу из них известно только 7009 (цифра включает все знакомые Яндексу RSS-подписки извне ЖЖ, а не только Friends of). С учётом того факта, что журнал
e_grishkovets начал прирастать друзьями с июля с.г. (до этого там было 4 записи и считанные десятки френдов), очевидно, что все 11.620 добавивших — это живые люди, логинившиеся в ЖЖ и пополнявшие свою френдленту за последние 4 месяца. Тот факт, что о существовании 40% из них Яндекс не подозревает, невозможно объяснить цифрой про 17% аккаунтов ЖЖ, запретивших себя индексировать. Ведь данные о френдах журнала Яндекс берёт из профайлов тех, кто его зафрендил, и никто не может запретить Яндексу индексировать userinfo своих читателей. Так что единственное логичное объяснение тут — лаг в работе индексирующего ЖЖ спайдера. В принципе, такое запаздывание является совершенно нормальным явлением, ибо никто не вправе требовать от поисковой машины полной синхронизации и добавления вновь возникающих потоков в режиме реального времени (если только сам хостинг не делает всеобъемлющий content push). Однако же лаг в 40% — это некоторая внештатная величина. Которая, кстати, хорошо объясняет, почему Яндекс знает в ЖЖ 628.498 русских авторов, хотя в действительности их тут 1.236.384 по последнему счёту.
Поясню, во избежание кривотолков, что это наблюдение — совершенно не критика в адрес Яндекса, а просто попытка сопоставления тех данных, которые он транслирует, с реальностью. Ответственность за расхождение этих данных с реальностью лежит скорее на самом ЖЖ, чем на индексирующем его поисковике. Единственная претензия к Яндексу — что он использует термины "авторитетность" и "популярность" вне всякой связи с их значением в русском языке, для обозначения параметра, который менее амбициозные сервисы именуют karma. Но это долгий семантический спор, далеко выходящий за рамки моих скромных изысканий.
Она берёт ваш username в ЖЖ, анализирует профайл, и находит всех тысячнегов в вашем списке Friend of.
На выходе выдаёт код, позволяющий похвастаться результатами этого изыскания.
Иногда это бессмысленная цифра. Потому что, как я уже не раз писал, "тысячнег" от нормального человека ровным счётом ничем не отличается. У него такие же две ноги, две руки, одна голова, и, как правило, нет хвоста.
Но иногда о чём-то эта цифирь всё же свидетельствует. В тех случаях, про которые покойный Георг Вильгельм Фридрих Г. подмечал, что количество перешло в качество. Или не перешло. Чтоб в этом убедиться, полезно взглянуть вот на эту табличку:
| Журнал | Френдов | Тысячнегов | Процент |
| 4585 | 134 | 2,92% | |
| 8472 | 123 | 1,45% | |
| 1791 | 123 | 6,87% | |
| 2624 | 121 | 4,61% | |
| 1517 | 121 | 7,98% | |
| 10295 | 116 | 1,13% | |
| 3085 | 116 | 3,76% | |
| 1605 | 114 | 7,10% | |
| 2793 | 110 | 3,94% | |
| 17548 | 107 | 0,60% | |
| 3129 | 103 | 3,29% | |
| 1521 | 103 | 6,77% | |
| 2091 | 102 | 4,88% | |
| 3201 | 100 | 3,12% | |
| 3472 | 97 | 2,79% | |
| 1313 | 97 | 7,39% | |
| 3556 | 96 | 2,70% | |
| 2102 | 95 | 4,52% | |
| 4283 | 90 | 2,10% | |
| 2091 | 90 | 4,30% | |
| 7295 | 86 | 1,18% | |
| 6259 | 86 | 1,37% | |
| 2465 | 85 | 3,45% | |
| 6832 | 84 | 1,23% | |
| 4637 | 84 | 1,81% | |
| 1443 | 84 | 5,82% | |
| 1347 | 84 | 6,24% | |
| 701 | 83 | 11,84% | |
| 4352 | 82 | 1,88% | |
| 2812 | 80 | 2,84% | |
| 1957 | 80 | 4,06% | |
| 5503 | 78 | 1,41% | |
| 6568 | 75 | 1,14% | |
| 5886 | 72 | 1,22% | |
| 3522 | 71 | 2,01% | |
| 3956 | 66 | 1,67% | |
| 1244 | 64 | 5,14% | |
| 2909 | 61 | 2,10% | |
| 2488 | 58 | 2,33% | |
| 1081 | 53 | 4,90% | |
| 3954 | 50 | 1,26% | |
| 17825 | 49 | 0,27% | |
| 11620 | 47 | 0,40% | |
| 7734 | 47 | 0,60% | |
| 11451 | 44 | 0,38% | |
| 498 | 40 | 8,03% | |
| 467 | 37 | 7,92% | |
| 8505 | 32 | 0,38% | |
| 176 | 20 | 11,36% | |
| 17 | 12 | 0,10% | |
| 247 | 12 | 4,86% | |
| 201 | 12 | 5,97% | |
| 1659 | 6 | 0,36% | |
| 91 | 6 | 6,59% |
Легко догадаться, что составлял я эту табличку наугад. Ориентировался на такие параметры, как популярность по числу френдов, "авторитетность" по Яндексу и офлайновая известность персонажа. Социологические выводы в основном таковы:
1. На долю тысячнегов среди френдов негативно влияет общая популярность: чем больше френдов, тем ниже среди них доля тысячнегов. Высокая доля тысячнегов среди френдов характерна для ЖЖ с камерной аудиторией, владельцы которых широко известны в узких кругах — причём одинаково часто причиной известности может служить личное знакомство (
2. На число тысячнегов среди читателей влияют очень разные, никак между собой не связанные факторы, относящиеся и к биографии человека, и к возрасту ЖЖ, и к истории его раскрутки, и к месту работы. Любой рейтинг, построенный на учёте этих параметров в том или ином соотношении, будет больше характеризовать само это соотношение, заданное при выборе формулы оценки, чем какие-либо объективные свойства рейтингуемых блогов. Что, собственно говоря, мы и наблюдаем в рейтинге т.н. "авторитетности" Яндекса. Практически табличка наша и показывает (на примере
PS. Я наверняка упустил какие-то журналы, у которых число читателей-тысячнегов выше и в абсолютном значении, и в процентном отношении. Благодарен буду за наводки, помогающие исправить и дополнить таблицу.
PPS. При составлении таблички наткнулся на неслабую дырищу в яндексовом спайдеринге ЖЖ. У Гришковца, как выше указано, 11620 френдов только в ЖЖ. Яндексу из них известно только 7009 (цифра включает все знакомые Яндексу RSS-подписки извне ЖЖ, а не только Friends of). С учётом того факта, что журнал
Поясню, во избежание кривотолков, что это наблюдение — совершенно не критика в адрес Яндекса, а просто попытка сопоставления тех данных, которые он транслирует, с реальностью. Ответственность за расхождение этих данных с реальностью лежит скорее на самом ЖЖ, чем на индексирующем его поисковике. Единственная претензия к Яндексу — что он использует термины "авторитетность" и "популярность" вне всякой связи с их значением в русском языке, для обозначения параметра, который менее амбициозные сервисы именуют karma. Но это долгий семантический спор, далеко выходящий за рамки моих скромных изысканий.
no subject
Date: 2007-11-22 11:42 pm (UTC)no subject
Date: 2007-11-22 11:47 pm (UTC)(no subject)
From:Почти в точку!
From:no subject
Date: 2007-11-22 11:49 pm (UTC)У меня 34 кажется.
!!!
Date: 2007-11-22 11:53 pm (UTC)Re: !!!
Date: 2007-11-23 12:08 am (UTC)!!!
Date: 2007-11-22 11:53 pm (UTC)Re: !!!
Date: 2007-11-23 12:58 am (UTC)no subject
Date: 2007-11-23 12:04 am (UTC)Угадай
мелодиюкто яТы говоришь мне своих тысячников (свой портрет), а я говорю тебе кто ты такой
Вот, например, портрет юзера
110.
А вот портрет
82.
no subject
Date: 2007-11-23 12:05 am (UTC)А это кто?
67.
(no subject)
From:no subject
Date: 2007-11-23 12:08 am (UTC)no subject
Date: 2007-11-23 12:13 am (UTC)(no subject)
From:no subject
Date: 2007-11-23 12:26 am (UTC)А меня тут нет почему-то! Цензура?)
Date: 2007-11-23 12:47 am (UTC)no subject
Date: 2007-11-23 01:22 am (UTC)no subject
Date: 2007-11-23 02:21 am (UTC)Почему-то разговоры об этом рейтинге всегда встречаются одобрительно любой мужской аудиторией, особенно разогретой небольшим количеством спиртного.
Но когда их просят реально полодить на стол и сравнить, большинство мужчин за редким исключением теряются и тихонько слинивают.
Мне кажется этот показатель гораздо более ценный, чем умение привлечь несколько сотен рыскаюших по сети отаку-леммингов к своему очередному посту
Было бы интересно упорядочить тысяячников по нему. Думаю шоладеми и лабас стояли бы в конце, интеесно кто был бы лидером?
рейтинг членов
Date: 2007-11-30 12:00 pm (UTC)no subject
Date: 2007-11-23 03:31 am (UTC)типа, фдисятке и ниибет.
no subject
Date: 2007-11-23 06:58 am (UTC)(no subject)
From:no subject
Date: 2007-11-23 04:40 am (UTC)no subject
Date: 2007-11-23 05:13 am (UTC)no subject
Date: 2007-11-23 07:39 am (UTC)no subject
Date: 2007-11-23 05:15 am (UTC)no subject
Date: 2007-11-23 05:35 am (UTC)no subject
Date: 2007-11-23 06:11 am (UTC)У меня, кстати, 47 тысячнегов на ~1150 френдов. Как у Гришковца, прям таки. :-)
no subject
Date: 2007-11-23 06:19 am (UTC)-СООТНОШЕНИЕ ОБЩЕГО ЧИСЛА ФРЕНДОВ К ЧИСЛУ ТЫСЯЧНИКОВ.
я думаю, что был бы там лидером ))
------------------------------------
704 зафрендивших меня юзера всего
среди которых
83 тысячника
http://olleke-bolleke.livejournal.com/388421.html
no subject
Date: 2007-11-23 06:29 am (UTC)!!!
Date: 2007-11-23 11:50 am (UTC)no subject
Date: 2007-11-23 06:40 am (UTC)no subject
Date: 2007-11-23 08:01 am (UTC)no subject
Date: 2007-11-23 07:59 am (UTC)А рейтинг - 123, то есть, как я понимаю, сразу за Митричем.
no subject
Date: 2007-11-23 08:25 am (UTC)no subject
Date: 2007-11-23 08:44 am (UTC)no subject
Date: 2007-11-23 11:31 am (UTC)(no subject)
From:А может 25-тысячников?
From:no subject
Date: 2007-11-23 09:35 am (UTC)47 френдов, из них - 6 тысячнекгов.
чо они нашли во мне - до сих пор не пойму.
no subject
Date: 2007-11-23 10:32 am (UTC)no subject
Date: 2007-11-23 11:30 am (UTC)no subject
Date: 2007-11-23 11:55 am (UTC)