Главная
    Русские интернет-кафе
    Смерть в Интернете
    Находки
    Мои книги
    Статьи, Обзоры, Стихи
    Реальная жизнь



    Цитируемость зависит от трафика



    Опубликовано в Рунет.ру в сентябре 2002
    Андрей Травин

С конца сентября 2002 года "Рейтинг цитируемости интернет-ресурсов в Рунете (TOP 10)", осуществляемый автоматизированным методом по технологии WebScan, еженедельно печатается не в "Вестнике Медиа", а в "Вестнике интернет-рекламы". В последнем из названных "Вестников" выйдет и годовой отчет за 2002 год.

Эта новость хоть и не великая, но символичная - исследования, касаемые исключительно Интернета переползают под соответствующую обложку (и, кстати, агентство Promo.ru в том же сентябре символично отказалось от подписки на "Вестник Медиа" в пользу издаваемого ею "Вестника Интернет-рекламы").

Собственно проект "Рейтинг цитируемости интернет-ресурсов в Рунете" начался в январе 2002 года. Ежедневно система WebScan проводит сканирование порядка 100 информационных ресурсов Рунета, отслеживая упоминания 75 ведущих интернет-СМИ. Цитируемость названия интернет-СМИ рассчитывается как доля публикаций, в которых в явном виде присутствует указание на источник (например, "по материалам Рунет.ру" или "как утверждает Runet.Ru") ко всем публикациям, просканированным по этому проекту. То есть если из 100 документов в 30 содержится упоминание Рунет.ру, то его цитируемость составит 30%.

TOP-10 наиболее цитируемых интернет-ресурсов в Рунете за период, к примеру, 13.09.02-20.09.02 выглядит следующим образом (материал предоставлен компанией Pro-Vision Communications):

1. Газета.Ру         14,80%
2. Лента.Ру           14,55%
3. NTVRU.Com     8,40%
4. Полит.Ру            6,86%
5. Утро                    6,38%
6. Правда.Ру         3,38%
7. Страна.Ру         2,51%
8. СМИ.Ру             2,21%
9. Известия          1,74%
10. KMnews          1,56%

Как видим, налицо очень сильная зависимость цитируемости от трафика. С точки зрения спортивной справедливости так быть не должно. Новостные сайты, вторичность информации которых почти уже вошла в поговорку (KMNews, CNews), должны были "болтаться" в конце списка. Но так не получается (и объяснения этой закономерности не просто изложить, никого не обидев).

Что касается технологических причин, то при мониторинге в системе WebScan информация, содержащая ключевые слова, проходит через ряд информационных фильтров с целью отсеять материалы с низкой смысловой нагрузкой. Именно на основе оставшихся материалов и строятся исследовательские проекты.

Вопрос только в том, как конкретно устроены такие фильтры. Авторитета покойной НЭБ, или даже ныне здравствующего Integrum, Webscan пока завоевать не успел. Но его глобальные оценки похожи на верные. Выводы делайте сами.



 



Runetka-интервью:
"Порталу "Смерть в Интернете" исполнилось четыре года"


У меня достаточно оригинальное мировоззрение, которое я ни разу не высказывал ни на более чем 430 страницах "Смерти в Интернете", ни где-либо еще. >>>



Мак-до - Путь Воина

О самом знаменитом из евангелистов Apple Computer Гае Кавасаки писали многие, но создавалось впечатление, словно люди старательно обходили главную метафору, которая являлась как первородным смыслом учения, так и внешней позой жизни этого неординарного человека >>>










 
 Copyright © 1997–2006 - Andrey Travin                                                                                                     Design 2003 - Leeloo