Курсор — 800 (против 150 в январе и 400 к началу марта)
Источник: http://yandex.ru/cy/ Disclaimer: я не знаю, по какой формуле вычисляется CY, был бы крайне признателен читающим эти строки специалистам из Яндекса за объяснение алгоритма.
я хоть не из яндекса, но насколько помню по работе с ними, индекс цитирования означает то, сколько раз на вас ссылаются другие веб-сайты, проиндексированные яндексом. Считаются, разумеется не упоминания, а гиперссылки.
Это как раз понятно. Условно говоря, CY=количество ссылающихся уникальных серверов (а не страниц). Проблема в формуле, которая позволяет независимому исследователю получить те же цифры запросом к Яндексу. По состоянию на пару лет назад такой формулы не существовало. Поэтому значение CY прописывается в УРЛе явным образом: &ci=12000. Можно поправить УРЛ, изменится и значение CY, показываемое по ссылке.
Антон Борисыч, на Яндексе как раз 2 недели назад поменялась система ранжирования вообще и система подсчета ИЦ - в частности. По какой формуле он сейчас вычисляется - не знает никто, в том числе и люди Яндекса:-) См. по этому поводу форумы на Серчэнджинс - там до сих пор флеймы не утихают. Вкратце: двукратный прирост после перехода на новую систему - не редкость, равно как и двукратное падение индекса. Но вообще, толстение Курсора после массированной рекламной кампании в СЖ и рамблеровских еще, кажется, сетках - не чюдо;-) И плюс убийство Ясина вы там очень хорошо отработали.
http://yandex.ru/info/ci.html Точный алгоритм никто не скажет, но он учитывает и собственно количество ссылок, и тематическую схожесть ссылающегося и ссылаемого (?) сайта, и тИЦ ссылающегося сайта.
По моим наблюдениям над ИЦ zorich.ru (http://www.zorich.ru) эмпирически получается что-то вроде "число серверов-реферреров" умножить примерно на 5.
Но там, разумеется, все хитрее и вес ссылки колеблется в зависимости от степени родства категорий сервера-реферрера и реферрируемого сайта. Плюс в конечном итоге ИЦ округляется каким-то немыслимым образом до двадцатипятерок (!).
Ща, как же, так и объяснят яндексоиды свои алгоритмы :). Не вдаваясь в особо мелкие детали, тИЦ (нынешняя версия CY, тематический ИЦ) считается как функция от: 1. Количества ссылок на сайт. 2. Тематической близости ссылающихся сайтов исходному сайту. Где-то там еще должен затесаться тИЦ ссылающихся ресурсов, кстати. Но вообще-то, последний апдейт тИЦа отражает больше изменения в работе Яндекса, нежели изменения в самих сайтах.
последний апдейт тИЦа отражает больше изменения в работе Яндекса, нежели изменения в самих сайтах
Это я понял. При предпоследнем апдейте (проведенном, очевидно, по старой методике) CY Курсора составил 850. Так что Курсор от смены алгоритма проиграл, в отличие от всех прочих вышеперечисленных. Газета.Ру по старой методике на 5-6% отставала от Ленты, и обе они примерно на 15-20% отставали от РБК.
толстение Курсора после массированной рекламной кампании в СЖ и рамблеровских еще, кажется, сетках - не чюдо
И в СЖ, и в рамблеровских крутилках УРЛ ссылки выглядит как случайная цифра, так что нет ни малейших шансов, чтобы он вдруг отразился на CY Курсора.
В том-то и состоит фокус CY, что описываются не мои усилия, а чьи-то совершенно посторонние. Прямая, доступная яндеховому учету, ссылка на Курсор с той же Ленты существует года с 2000, и вряд ли от моего инвестирования в Курсор вес ее вырос.
А вот тематическая близость в свою очередь определяется, как установлено эмпирическим путем, через каталог Яндекса. Но точной формулы никто не знает. Даже неизвестно (я пытался узнать, но ответа не нашел), важно ли находиться сайту в одной подкатегории со ссылающимся сайтом, или достаточно быть в разных подкатегориях одной большой категории, чтобы ссылку Яндекс считал "тематической".
При всем прочем - тИЦ в его публичном виде влияет лишь на порядок в каталоге Яндекса. Реальный же тематический показатель цитируемости должен рассчитываться для каждого документа в отдельности. Сейчас это нереально. Слишком дорого по ресурсам. Изящный выход, кстати, пробовал Google - LocalRank. Это когда тематическая цитируемость ресурса по данному запросу определяется по количеству ссылок, ведущих на сайт с первой тысячи сайтов по данному запросу. Так и это дороговато выходит. Это вам не гигабайты под почту раздавать. :).
При всем прочем - тИЦ в его публичном виде влияет лишь на порядок в каталоге Яндекса
Да. Из чего мной был сделан вывод, что гнаться за тИЦем специально не надо.
Реальный же тематический показатель цитируемости должен рассчитываться для каждого документа в отдельности.
Не представляю себе такого даже теоретически. Ведь на конкретные страницы ссылаются ничтожно редко. Все ссылки стоят на главные страницы. Т.е. тогда 90% всех документов даже уважаемых сайтов будут иметь тИЦ равным 0.
Не представляю себе такого даже теоретически. Т.е. тогда 90% всех документов даже уважаемых сайтов будут иметь тИЦ равным 0.
Да что там представлять?! Это все, только без учета тематики, давно реализовано - в PageRank Google и ВИЦе Яндекса.
Ведь на конкретные страницы ссылаются ничтожно редко. Все ссылки стоят на главные страницы.
Нет, это абсолютно не так. Для проверки - идете на Ленту.ру (коль скоро разговор идет в ЖЖ Носика :)), и сравниваете число ссылок внутрь сервера и наружу. Спускаетесь на страницу конкретной новости и повторяете процедуру. Думаю, что не ошибусь, если скажу, что в среднем каждая первая новость, относящаяся не к России, а к миру, имеет хотя бы одну ссылку на западный сайт, причем не на главную страницу.
Да что там представлять?! Это все, только без учета тематики, давно реализовано - в PageRank Google и ВИЦе Яндекса.
В том-то и дело, что без учета тематики. К тому же у Гугла действует правило, что PR передается от ссылающейся страницы на ссылаемые. Мне кажется, что передавать таким образом тематику было бы нелогично.
Думаю, что не ошибусь, если скажу, что в среднем каждая первая новость, относящаяся не к России, а к миру, имеет хотя бы одну ссылку на западный сайт, причем не на главную страницу.
Вот теперь убедили. :-) Тогда тИЦ будет высоким у отдельных страниц-первоисточников (любых, не только новостных), что вполне логично.
...Но все равно тогда тИЦ будет равен 0 у подавляющего большинства документов. Если, конечно, страницы не будут им "делиться" в масштабах одного сайта.
Под "толстением" я все же подразумеваю рост посещаемости - и иного толстения не признаю. А все эти яндексОвые денежки считаю ни на что не влияющей глупостью. Ну право - на что они там влияют? На положение в каталоге? Кто-нибудь вообще в здравом уме пользуется этим самым каталогом Яндекса? На позицию в результатах поиска? Не влияет он ничерта на позицию в результатах. По мне - так и к лучшему, что не влияет;-)
В этом смысле у Рамблера все умнее и правильнее устроено. Чем больше посещаемость - тем выше позиция в ТОП-100. Чем выше позиция в ТОП-100 - тем чаще индексится ресурс. И тем больше на него переходов собственно с рейтинга. Выход на первую страницу рейтинга СМИ дает прирост минимум в 300-400 гавриков ежедневно - ну, "умное избранное", да.
Сайты из первой сотни индексятся Рамблером вообще ежедневно, по ощущениям. Плюс если в описалове ТОПа написано "Курсор - убийство Ясина" и сам сайт сидит в первой сотне - то по запросу "убийство Ясина" через Рамблер он будет с большой долей вероятности сидеть на первом экране.
Больше посещаемость - выше рейтинг - больше релевантность - еще больше посещаемость - еще выше рейтинг и так далее, по спирали. А рост яндекскового ИЦ при этом - закономерный, приятный, но - абсолютно побочный продукт популярности;-)
В той категории, где я (http://www.yandex.ru:80/cy?sort=0&page=1&base=1&oldhost=&id=61):
"Net-культура" (http://www.russ.ru/netcult) Результат поиска: страниц - 14285, тИЦ - 900
"Imperium" - комплекс художественных проектов (http://imperium.lenin.ru) Результат поиска: страниц - 3586, тИЦ - 500 MANIA.RU - интернет-проекты студии Новиков Дизайн (http://mania.ru) Результат поиска: страниц - 283, тИЦ - 450
"Китеж" - традиция в мире постмодерна (http://kitezh.onego.ru) Результат поиска: страниц - 1007, тИЦ - 190
О колоколах и колокольном искусстве (http://www.kolokola.ru) Результат поиска: страниц - 133, тИЦ - 150
Ну по поводу Рамблера вы загнули. От посещаемости сайта в поисковике абсолютно ничего не меняется. И лучший пример Utro.Ru Попробуйте поискать Утро на Рамблере, а потом на Яндексе или Гугле. Разница поразительная
> Кто-нибудь вообще в здравом уме пользуется этим самым каталогом Яндекса? Иногда пользуется. Но и в этом каталоге уже стало много битых ссылок и описаний, которые не соответствуют действительности.
no subject
Date: 2004-04-05 09:12 am (UTC)no subject
Date: 2004-04-05 09:30 am (UTC)Условно говоря, CY=количество ссылающихся уникальных серверов (а не страниц).
Проблема в формуле, которая позволяет независимому исследователю получить те же цифры запросом к Яндексу.
По состоянию на пару лет назад такой формулы не существовало.
Поэтому значение CY прописывается в УРЛе явным образом: &ci=12000. Можно поправить УРЛ, изменится и значение CY, показываемое по ссылке.
no subject
Date: 2004-04-05 09:34 am (UTC)no subject
Date: 2004-04-05 09:35 am (UTC)Точный алгоритм никто не скажет, но он учитывает и собственно количество ссылок, и тематическую схожесть ссылающегося и ссылаемого (?) сайта, и тИЦ ссылающегося сайта.
no subject
Date: 2004-04-05 10:34 am (UTC)Но там, разумеется, все хитрее и вес ссылки колеблется в зависимости от степени родства категорий сервера-реферрера и реферрируемого сайта. Плюс в конечном итоге ИЦ округляется каким-то немыслимым образом до двадцатипятерок (!).
no subject
Date: 2004-04-05 12:47 pm (UTC)Не вдаваясь в особо мелкие детали, тИЦ (нынешняя версия CY, тематический ИЦ) считается как функция от:
1. Количества ссылок на сайт.
2. Тематической близости ссылающихся сайтов исходному сайту.
Где-то там еще должен затесаться тИЦ ссылающихся ресурсов, кстати.
Но вообще-то, последний апдейт тИЦа отражает больше изменения в работе Яндекса, нежели изменения в самих сайтах.
no subject
Date: 2004-04-05 02:22 pm (UTC)Это я понял.
При предпоследнем апдейте (проведенном, очевидно, по старой методике) CY Курсора составил 850. Так что Курсор от смены алгоритма проиграл, в отличие от всех прочих вышеперечисленных. Газета.Ру по старой методике на 5-6% отставала от Ленты, и обе они примерно на 15-20% отставали от РБК.
no subject
Date: 2004-04-05 02:29 pm (UTC)И в СЖ, и в рамблеровских крутилках УРЛ ссылки выглядит как случайная цифра, так что нет ни малейших шансов, чтобы он вдруг отразился на CY Курсора.
В том-то и состоит фокус CY, что описываются не мои усилия, а чьи-то совершенно посторонние.
Прямая, доступная яндеховому учету, ссылка на Курсор с той же Ленты существует года с 2000, и вряд ли от моего инвестирования в Курсор вес ее вырос.
no subject
Date: 2004-04-05 02:33 pm (UTC)no subject
Date: 2004-04-05 03:05 pm (UTC)Изящный выход, кстати, пробовал Google - LocalRank. Это когда тематическая цитируемость ресурса по данному запросу определяется по количеству ссылок, ведущих на сайт с первой тысячи сайтов по данному запросу. Так и это дороговато выходит. Это вам не гигабайты под почту раздавать. :).
no subject
Date: 2004-04-05 03:14 pm (UTC)Яндекса
Да. Из чего мной был сделан вывод, что гнаться за тИЦем специально не надо.
Реальный же тематический показатель цитируемости должен рассчитываться для каждого документа в отдельности.
Не представляю себе такого даже теоретически. Ведь на конкретные страницы ссылаются ничтожно редко. Все ссылки стоят на главные страницы. Т.е. тогда 90% всех документов даже уважаемых сайтов будут иметь тИЦ равным 0.
no subject
Date: 2004-04-05 03:31 pm (UTC)Да что там представлять?! Это все, только без учета тематики, давно реализовано - в PageRank Google и ВИЦе Яндекса.
Нет, это абсолютно не так. Для проверки - идете на Ленту.ру (коль скоро разговор идет в ЖЖ Носика :)), и сравниваете число ссылок внутрь сервера и наружу. Спускаетесь на страницу конкретной новости и повторяете процедуру. Думаю, что не ошибусь, если скажу, что в среднем каждая первая новость, относящаяся не к России, а к миру, имеет хотя бы одну ссылку на западный сайт, причем не на главную страницу.
no subject
Date: 2004-04-05 03:42 pm (UTC)В том-то и дело, что без учета тематики. К тому же у Гугла действует правило, что PR передается от ссылающейся страницы на ссылаемые. Мне кажется, что передавать таким образом тематику было бы нелогично.
Думаю, что не ошибусь, если скажу, что в среднем каждая первая новость, относящаяся не к России, а к миру, имеет хотя бы одну ссылку на западный сайт, причем не на главную страницу.
Вот теперь убедили. :-) Тогда тИЦ будет высоким у отдельных страниц-первоисточников (любых, не только новостных), что вполне логично.
no subject
Date: 2004-04-05 03:47 pm (UTC)Если, конечно, страницы не будут им "делиться" в масштабах одного сайта.
no subject
Date: 2004-04-05 10:07 pm (UTC)В этом смысле у Рамблера все умнее и правильнее устроено. Чем больше посещаемость - тем выше позиция в ТОП-100. Чем выше позиция в ТОП-100 - тем чаще индексится ресурс. И тем больше на него переходов собственно с рейтинга. Выход на первую страницу рейтинга СМИ дает прирост минимум в 300-400 гавриков ежедневно - ну, "умное избранное", да.
Сайты из первой сотни индексятся Рамблером вообще ежедневно, по ощущениям. Плюс если в описалове ТОПа написано "Курсор - убийство Ясина" и сам сайт сидит в первой сотне - то по запросу "убийство Ясина" через Рамблер он будет с большой долей вероятности сидеть на первом экране.
Больше посещаемость - выше рейтинг - больше релевантность - еще больше посещаемость - еще выше рейтинг и так далее, по спирали. А рост яндекскового ИЦ при этом - закономерный, приятный, но - абсолютно побочный продукт популярности;-)
no subject
Date: 2004-04-06 03:36 am (UTC)В той категории, где я (http://www.yandex.ru:80/cy?sort=0&page=1&base=1&oldhost=&id=61):
"Net-культура" (http://www.russ.ru/netcult)
Результат поиска: страниц - 14285, тИЦ - 900
"Imperium" - комплекс художественных проектов (http://imperium.lenin.ru)
Результат поиска: страниц - 3586, тИЦ - 500
MANIA.RU - интернет-проекты студии Новиков Дизайн (http://mania.ru)
Результат поиска: страниц - 283, тИЦ - 450
"Китеж" - традиция в мире постмодерна (http://kitezh.onego.ru)
Результат поиска: страниц - 1007, тИЦ - 190
О колоколах и колокольном искусстве (http://www.kolokola.ru)
Результат поиска: страниц - 133, тИЦ - 150
"MediaArtLab" - современная медиакультура (http://www.danet.ru)
Результат поиска: страниц - 120, тИЦ - 140
Объяснения этому нет никакого по-моему
Такие дела
Миша
no subject
Date: 2004-04-06 03:52 am (UTC)Так не страницы надо брать, а сервера. (Не говорю, что ясности добавится, но все-таки.)
P.S. Да, я не прав насчет кратности 25. Кратность 5 все-таки.
no subject
Date: 2004-04-06 05:12 am (UTC)Попробуйте поискать Утро на Рамблере, а потом на Яндексе или Гугле. Разница поразительная
no subject
Date: 2004-04-15 12:17 am (UTC)Иногда пользуется. Но и в этом каталоге уже стало много битых ссылок и описаний, которые не соответствуют действительности.