Вебометрика (FyQkbymjntg)
Вебоме́трика (англ. webometrics) — это раздел информатики, в рамках которого исследуются количественные аспекты конструирования и использования информационных ресурсов, структур и технологий применительно к Всемирной паутине[1].
Термин введён Томасом Алминдом (Tomas C. Almind) и Петером Ингверсеном (Peter Ingwersen) в 1997 году в работе Informetric analyses on the World Wide Web: Methodological approaches to «webometrics»[2].
Вебометрика является составляющей инфометрии
.С середины 90-х компания Cybermetrics Lab занимается вебометрическими исследованиями и ранжированием веб-сайтов университетов мира .
Вебометрика включает в себя четыре основных направления исследований:
- Разработка и использование веб-индикаторов (индексы цитирования, наблюдаемость сайтов)
- Анализ социальных феноменов в Веб (социальные сети, сообщества сайтов)
- Сбор данных о Веб (роботы, краулеры, поисковые машины, информационный поиск)
- Анализ гиперссылок (в частности, связи между сайтами вузов и научных организаций)
Вебометрика как составляющая инфометрии
[править | править код]Вебометрика является одной из составляющих инфометрии. Кроме того, вебометрика связана с библиометрией и в определённой степени пересекается с наукометрией[1].
Инфометрия — научная дисциплина, предметом которой являются количественные измерения хранимой и используемой информации[4].
Библиометрия — научная дисциплина, занимающаяся изучением документов на основе количественного анализа первичных и вторичных источников информации с помощью формализованных методов с целью получения данных об эффективности, динамике, структуре и закономерностях развития исследуемых областей[4].
Наукометрия — научная дисциплина, занимающаяся изучением количественных методов развития науки как информационного процесса[5].
Киберметрия — научная дисциплина, занимающаяся количественным анализом новых возможностей по обработке информации, хранимой в электронном виде, и её визуализации[6].
Направления вебометрики
[править | править код]Ранжирование веб-сайтов вузов и научно-исследовательских институтов мира
[править | править код]Испанская лаборатория Cybermetrics Lab разработала методологию ранжирования веб-ресурсов вузов и научно-исследовательских институтов.
В соответствии с данной методологией строится алгоритм ранжирования сайтов на основе четырёх индикаторов[7]:
Индикатор | Аббревиатура | Значение | Поисковые машины |
---|---|---|---|
Visibility | V | Количество ссылок с других сайтов | Google, Yahoo, Live Search и Exalead |
Size | S | Общее количество страниц сайта | Yahoo Search, Live Search и Exalead |
Rich files | R | Количество полноценных текстовых файлов | |
Scholar | Sc | Количество размещенных на сайте статей и их цитирований | Google Scholar |
Алгоритм ранжирования сайтов
[править | править код]Ранжирование сайтов происходит по следующему алгоритму:
- Подсчет значений индикаторов
- Упорядочивание сайтов по убыванию значений соответствующих индикаторов. Для обозначения ранга (или позиции) сайта используются следующие обозначения: RankV для Visibility, RankS для Size, RankR для Rich files, RankSc для Scholar
- Расчет вебометрического ранга (Webometrics Rank — WR)
Критика методологии ранжирования лаборатории Cybermetrics Lab
[править | править код]В работе метода ранжирования веб-сайтов, предложенного лабораторией Cybermetrics Lab, наблюдается ряд недостатоков[7]:
- В методе не учитывается, что учебные учреждения могут поддерживать множество различных доменных областей;
- Не производится учёт веб-ресурсов подразделений учебных учреждений;
- Если на сайте присутствует неакадемическая информация, то она также будет учитываться при составлении индикаторов.
Анализ гиперссылок
[править | править код]Входящие ссылки — количество веб-страниц, ссылающихся на данную веб-страницу или на данный веб-сайт[9]. Данный индикатор используется в качестве показателя значимости некоторой веб-страницы алгоритмами PageRank и HITS. Эти алгоритмы основываются на нахождении страниц релевантных поисковому запросу и на дальнейшим ранжировании полученного списка с учётом входящих ссылок. Страницы с наибольшим количеством входящих ссылок имеют более высокий ранг. Далее происходит упорядочивание списка веб-страниц с учётом их ранга.
Некоторые гиперссылки могут создаваться только с целью навигации между сайтами. Такие гиперссылки должны игнорироваться, так как они не определяют значимость целевой веб-страницы. Кроме того на некоторых сайтах может происходить множественное повторение одних и тех же ссылок. В данном случае следует учитывать только одну входящую ссылку и игнорировать все остальные.
Вебометрика в России
[править | править код]Поскольку методология ранжирования веб-ресурсов, предложенная Cybermetrics Lab, обладает рядом недостатков[7] и к тому же не использует российские поисковые машины (например, Яндекс), в России разрабатываются проекты по созданию собственных вебометрических рейтингов научных учреждений, избавленных от вышеперечисленных недостатков.
Институт прикладных математических исследований КарНЦ РАН
[править | править код]Под руководством Печникова Андрея Анатольевича был создан Вебометрический рейтинг научных учреждений России[10]. В данном проекте задействованы только официальные сайты научных учреждений России. За основу ранжирования взята методология, предложенная Cybermetrics Lab, но учитывающая использование российской поисковой системы Яндекс и краулера BeeCrawler[11]. Используемая методология ранжирования сайтов описана в работе «О рейтинге официальных сайтов научных учреждений Северо-Запада России»[12].
Институт вычислительных технологий СО РАН
[править | править код]Одним из проектов данного института является создание Рейтинга сайтов научных учреждений СО РАН, под руководством Ю. И. Шокина. Для расчета количества внешних ссылок (V) и количества страниц на сайте (S) помимо поисковых систем Google и Яндекс используется также Bing[13]. Для нахождения результирующего значения V и S находится среднее арифметическое. Для нахождения индекса цитирования (Sc) используются системы Google Scholar и Индекс цитирования Яндекса. Используемая методология ранжирования сайтов описана в работе «Рейтинг сайтов научных организаций СО РАН»[14].
Институт научной и педагогической информации РАО
[править | править код]Под руководством, д.т.н А. Б. Антопольского был создан Вебометрический индекс Российских вузов и НИИ. В качестве источников перечня анализируемых web-ресурсов используются официальные перечни учреждений, размещенные на порталах государственных академий и перечень аккредитованных образовательных учреждений[15]. Для формирования индекса используются основные вебометрические показатели[16]. Показатели V, S и R основываются на результатах работы поисковых систем Google и Яндекс, а показатель Sc вычисляется на основе Цитируемости учреждения по РИНЦ. Используемая методология ранжирования сайтов описана в работе «Измерение присутствия в Интернете образовательных учреждений»[17].
Дальневосточный геологический институт
[править | править код]Сервис вебометрических исследований научных сайтов предназначен для анализа сайтов научных организаций Дальневосточного Отделения РАН, Отделения Наук о Земле РАН и других научных сайтов. Сервис был создан под руководством д.г.-м.н. Наумова В. В.. Для расчета основных вебометрических показателей используются поисковые системы Google, Яндекс, Bing и Yahoo[18]. Для расчета вебометрического ранга используется следующая формула:
Используемая методология ранжирования сайтов описана в работе «Информационное пространство Дальневосточного отделения РАН»[19].
Сибирский федеральный университет
[править | править код]Рейтинг сайтов вузов и институтов предоставляет вузам наиболее полные актуальные сведения о состоянии их сайтов с точки зрения вебометрики. Для этого производится еженедельное обновление рейтинга и сохранение истории изменений индикаторов. Методика расчёта рейтинга аналогична методике лаборатории Cybermetrics Lab. Расчет вебометрического ранга производится по следующей формуле[20]:
Сравнение методов построения вебометрического индекса
[править | править код]Вычисление основных вебометрических параметров может основываться на результатах различных поисковых систем. Далее представлена сравнительная таблица использования поисковых систем каждым из приведенных выше институтов и количества обработанных ими веб-ресурсов.
Институт | Visibility | Size | Rich files | Scholar | Кол-во обработанных веб-ресурсов |
---|---|---|---|---|---|
Институт прикладных математических исследований КарНЦ РАН | Google, BeeCrawler | Яндекс, Google, BeeCrawler | Яндекс, Google | Google Scholar | 343 (2013 год)[21] |
Институт вычислительных технологий СО РАН | Яндекс, Google, Bing | Яндекс, Google, Bing | Яндекс, Google | Индекс цитирования Яндекса, Google Scholar | 94 (2013 год)[22] |
Институт научной и педагогической информации РАО | Яндекс, Google | Яндекс, Google | Яндекс, Google | Цитируемость учреждения по РИНЦ | 1843 (2012 год)[23] |
Дальневосточный геологический институт ДВО РАН | Google, Yandex, Bing, Yahoo | Google, Yandex, Bing, Yahoo | Google, Yandex, Bing, Yahoo | Google Scholar | 121 (2013 год)[24] |
Сибирский Федеральный университет СФУ | Majestic SEO | Google Scholar | 657 (2013 год)[25] |
См. также
[править | править код]Примечания
[править | править код]- ↑ 1 2 Webometrics — Ten Years of Expansion, 2006, p. 2.
- ↑ Informetric analyses on the World Wide Web: Methodological approaches to «webometrics», 1997.
- ↑ Webometrics — Ten Years of Expansion, 2006, p. 3.
- ↑ 1 2 Документ. Архив. История. Современность, 2010.
- ↑ Наукометрия, 1969.
- ↑ Визуализация в инфометрии — красота, да и только, 2009.
- ↑ 1 2 3 Рейтинг официальных сайтов, 2008, p. 25.
- ↑ Задача дележа затрат, 2010, p. 189.
- ↑ Webometrics and Social Web Research Methods, 2013, p. 26.
- ↑ Печников А. А. Сравнительный анализ связности веб-графов научных учреждений Архивная копия от 26 февраля 2021 на Wayback Machine // Современные проблемы науки и образования. № 3. 2014.
- ↑ Методика 2013 г. ИПМИ КарНЦ РАН.
- ↑ О рейтинге официальных сайтов, 2009.
- ↑ Методика 2013 г. Институт вычислительных технологий СО РАН.
- ↑ Рейтинг сайтов научных организаций, 2008.
- ↑ list.
- ↑ Методика 2012 г. Институт научной и педагогической информации РАО.
- ↑ Измерение присутствия в Интернете образовательных учреждений, 2012, p. 117.
- ↑ Методика 2013 г. Дальневосточный геологический институт.
- ↑ Информационное пространство Дальневосточного отделения РАН, 2009.
- ↑ Методика 2013 г. Сибирский Федеральный Университет Архивная копия от 2 декабря 2013 на Wayback Machine
- ↑ Вебометрический рейтинг научных учреждений России . Дата обращения: 24 сентября 2018. Архивировано 24 сентября 2018 года.
- ↑ Рейтинг сайтов научных учреждений СО РАН . Дата обращения: 16 ноября 2013. Архивировано 18 декабря 2013 года.
- ↑ Вебометрический индекс Российских вузов и НИИ Архивная копия от 16 ноября 2013 на Wayback Machine
- ↑ Сервис вебометрических исследований научных сайтов Архивная копия от 21 октября 2014 на Wayback Machine
- ↑ Рейтинг сайтов вузов и институтов Архивная копия от 2 декабря 2013 на Wayback Machine
Литература
[править | править код]- Peter Ingwersen. Webometrics — Ten Years of Expansion. — Nancy (France), 2006.
- Tomas C. Almind, Peter Ingwersen. Informetric analyses on the World Wide Web: Methodological approaches to «webometrics» // Journal of documentation. — 1997. — Т. 53, № 4. — С. 404—426.
- А.А. Пронин. Документ. Архив. История. Современность. — 11-е изд. — Екатеринбург: Издательство Уральского университета, 2010. — С. 225—226. — ISBN 978-5-7996-0566-7. (недоступная ссылка)
- В.В. Налимов. Наукометрия. — М.: Наука, 1969. — С. 12.
- Александр Беленький. Визуализация в инфометрии — красота, да и только. — КомпьютерПресс, 2009. — № 4.
- В.В. Мазалов, А.А. Печников, А.В. Чирков, Ю.В. Чуйко. Задача дележа затрат на создание веб-коммуникатора как кооперативная игра // Управление большими системами: сборник трудов. — Москва: Институт проблем управления им. В.А. Трапезникова РАН, 2010. — № 30—1. — С. 187—196. — ISSN 1819-2440.
- А.А. Печников, О.Г. Илюкевич. Рейтинг официальных web-сайтов университетов России и Финляндии: сравнительный анализ (рус.) // Информационные ресурсы России. — Москва: Российское энергетическое агентство Министерства энергетики Российской Федерации, 2008. — № 3. — С. 25—28. — ISSN 0204-3653.
- Mike Thelwall. Webometrics and Social Web Research Methods. — University of Wolverhampton, 2013.
- Мазалов Владимир Викторович, Печников Андрей Анатольевич. О рейтинге официальных сайтов научных учреждений Северо-Запада России // Управление большими системами: сборник трудов. — 2009. — № 24. — С. 130—146.
- Ю.И. Шокин, О.А. Клименко, Е.В. Рычкова, И.В. Шабальников. Рейтинг сайтов научных организаций СО РАН. — 2008.
- А.Б. Антопольский, Ю.Е. Поляк. Измерение присутствия в Интернете образовательных учреждений // Проблемы современного образования. — 2012. — № 4. — С. 117—131. — ISSN 2218-8711.
- А.И. Ханчук, В.В. Наумов. Информационное пространство Дальневосточного отделения РАН // Вестник ДВО РАН. — 2009. — № 4. — С. 122—129. Архивировано 23 октября 2014 года.
Ссылки
[править | править код]- Перечень аккредитованных образовательных учреждений (ноябрь 2013). Дата обращения: 16 ноября 2013. Архивировано из оригинала 10 июня 2015 года.
- Методика 2013 г. ИПМИ КарНЦ РАН (ноябрь 2013).
- Методика 2013 г. Институт вычислительных технологий СО РАН (ноябрь 2013).
- Вебометрический индекс российских вузов и НИИ. Методика 2012 г. Институт научной и педагогической информации РАО. Ноябрь 2013 года.
- Методика 2013 г. Дальневосточный геологический институт (ноябрь 2013). Архивировано из оригинала 21 октября 2014 года.