Модель суммарной оценки сайта в сети Интернет на основе факторов ранжирования
Создание математической модели системы автоматического ранжирования сайтов в поисковых системах в зависимости от запросов пользователей. Исследование сетей в сети Интернет. Совершенствование алгоритмов, на основе которых работают поисковые системы.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 28.07.2017 |
Размер файла | 65,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Модель суммарной оценки сайта в сети Интернет на основе факторов ранжирования
П.В. Пестерев, А.Г. Янишевская
В статье описаны модель идеального сайта с точки зрения поисковой системы на основании поискового запроса. Данная модель учитывает различные факторы ранжирования, к которым относятся поведенческие факторы ранжирования, внешние факторы ранжирования и внутренние факторы ранжирования. Описана модель суммарной оценки сайта в сети Интернет в зависимости от факторов ранжирования.
Ключевые слова: фактор ранжирования, сортировка сайтов, оценка сайта, поисковая система, оптимизация сайта, Интернет.
В настоящее время существует большое количество поисковых систем в сети Интернет, наиболее популярными из которых в России являются Yandex, Google, поиск Mail и т.д. [1]. Данные ресурсы обеспечивают поиск необходимой информации в зависимости от запросов пользователей. При этом необходимо, чтобы поисковой ресурс выводил в начало списка сайты, информация на которых более точно соответствует запросам. К таким сайтам, исходя из исследований [2], относятся сайты, на которых учтено больше групп факторов (особенно более значимых из них) и проведена качественная поисковая оптимизация [3-5]. Сортировка сайтов осуществляется за счет факторов ранжирования: внутренние факторы ранжирования, внешние факторы ранжирования и поведенческие факторы ранжирования [6]. Использование тех или иных факторов имеют определенные преимущества и недостатки. Существует возможность накручивания данных факторов разработчиками сайтов с целью улучшения положения разработанного ресурса в поисковые выдачи. Однако это может привести к санкциям со стороны поисковых систем. Также в последнее время поисковые системы начали учитывать и социальные сети. Исследования социальных сетей проводится достаточно давно [7, 8], но совсем недавно замечено их влияние на позиции сайтов в поисковых системах.
Тем не менее, такой сайт, по крайней мере, какое-то время будет ухудшать поиск. Поэтому необходимо совершенствовать алгоритмы и математические модели, на основе которых работают поисковые системы. Наименее подвержены накручиванию поведенческие факторы ранжирования, т.е. факторы, учитывающие предпочтения реальных посетителей сайтов. Анализ таких факторов, включающий анализ внешней среды, отслеживание ведущих рыночных трендов и рыночной конъюнктуры [9], намного более объективен, т.к. работает с предпочтениями большой целевой аудитории, являясь неотъемлемым элементом эффективного функционирования любого сайта. Поэтому становится актуальным создание алгоритмов, в которых данные факторы занимают основное положение. В то же время происходит постепенный отказ от внешних факторов, которые чаще всего искусственно завышают. Например, одним из интересных нововведений Яндекса должен стать алгоритм ранжирования без учета ссылок, проанонсированный руководителем поисковых систем Яндекса 5 декабря 2014 г. Александром Садовским на конференции IBS Russia [10]. В данной статье описывается предложенная модель суммарной оценки сайта в сети Интернет на основе факторов ранжирования. Данная модель является основой для дальнейшего совершенствования и перехода к модели, в которой планируется отдать основное предпочтение поведенческим факторам ранжирования и уменьшить влияние внешних факторов.
Модель идеального сайта
С точки зрения поисковых систем идеальным сайтом можно назвать сайт, занимающий первую позицию в результатах выдачи в зависимости от поискового запроса. Однако сайта, идеально соответствующего всем поисковым запросам, не существует.
Для построения идеальной модели сайта был проведен подробный анализ факторов ранжирования первых десяти сайтов в результатах поисковой выдачи Yandex и Google по определенным поисковым запросам и выбраны максимальные значения по каждому из факторов.
(1)
где - порядковый номер фактора;
- максимальное значение фактора по выбранному поисковому запросу среди факторов каждого из 10-ти первых сайтов.
Данный подход предполагает то, что сайт, имеющий первую позицию в поисковой системе, не является идеальным, т.к. значения показателей его факторов ранжирования не будут максимальными.
Определение для идеального сайта значений факторов ранжирования необходимо с целью построения модели суммарной оценки сайта, находящегося в зависимости от запросов пользователей на любой позиции в результатах поисковой выдачи.
Модель суммарной оценки сайта в сети Интернет
Суммарную оценку сайта предлагается производить из расчета показателей факторов ранжирования идеального сайта (см. формула 1) и оценки каждого из них по десятибалльной шкале.
Затем с целью оценки факторов ранжирования предполагается произведение сравнения значений факторов анализируемого сайта с соответствующими значениями факторов идеального сайта.
(2)
где - значение фактора анализируемого сайта;
- значение фактора идеального сайта;
10 - предложенный множитель.
Значения показателей для каждого из факторов либо берется из сервисов Яндекс.Метрика и Google Analytics, либо рассчитывается по соответствующим формулам.
Значение фактора скорость загрузки сайта производится по формуле:
(3)
где - время ответа сервера;
- время загрузки HTML документа;
- время загрузки таблицы стилей;
- время загрузки JavaScript.
Определение значения фактора «Google PageRank» производится по формуле:
(4)
где - демпфирующий коэффициент, отображающий «количество авторитетности»;
- количество страниц с установленными обратными ссылками;
- общее количество установленных на странице внешних ссылок;
- номера ссылающихся страниц, .
при условии, если значение фактора анализируемого сайта больше значения фактора идеального сайта.
Значение фактора анализируемого сайта в большинстве случаев не превышает значения фактора идеального сайта, но возможны исключения.
Например, анализ факторов ранжирования первых десяти сайтов в поисковых системах Яндекс по поисковому запросу «Вузы Омска» показывал максимальное значение показателя одного из факторов «тИЦ» (тематический индекс цитирования) меньше значения показателя «тИЦ» сайта ОмГТУ, не входящего в список первых десяти сайтов в поисковой выдачи по заданному поисковому запросу. В этом случае оценка фактора «тИЦ» для сайта ОмГТУ при составлении суммарной оценки составляет десять баллов по десятибальной шкале.
Расчет суммарной оценки сайта производится на основе расчета суммы произведений коэффициентов значимости факторов ранжирования на оценку факторов по десятибалльной шкале:
ранжирование автоматический алгоритм интернет
(5)
где - порядковый номер фактора;
- коэффициент значимости фактора;
- оценка фактора по десятибалльной шкале.
Вычисление суммарной оценки сайта необходимо для анализа сайтов по заданным поисковым запросам, а также с целью прогнозирования позиций анализируемого сайта. Сравнение суммарной оценки анализируемого сайта с суммарной оценкой сайта, расположенного на десятой позиции в поисковой система, возможно, даст оценку вероятности попадания сайта в первые десять в поисковой выдачи. На основании данных результатов можно создать математическую модель системы автоматического ранжирования сайтов в поисковых системах в зависимости от запросов пользователей, более точно учитывающую именно поведенческие факторы ранжирования и снижая значимость внешних факторов.
Анализ страниц с результатами поиска по определенному поисковому запросу показал, что при построении поисковыми системами Яндекс и Google поисковой выдачи используется огромное количество факторов, которые возможно оценить.
С точки зрения поисковых систем идеальным сайтом можно назвать сайт, расположенный на первой позиции в результатах поисковой выдачи. Значения факторов ранжирования для таких сайтов по выбранному поисковому запросу выше. На основании данной информации была предоставлена модель идеального сайта.
Увеличение значений показателей факторов ранжирования анализируемого сайта до значений показателей идеального сайта будет приводить к его высоким позициям в результатах выдачи в поисковой системе. Также необходимо учитывать тот факт, что значения показателей факторов ранжирования сайта, находящегося на первой позиции в результатах поисковой выдачи, не всегда являются максимальными.
Также была описана модель суммарной оценки сайта, анализирующая позицию любого сайта в поисковой системе. Позиция сайта в поисковой системе зависит от суммарной оценки сайта, чем она больше, тем выше сайт располагается. На основании данных результатов, как уже было сказано, можно создать математическую модель системы автоматического ранжирования сайтов в поисковых системах в зависимости от запросов пользователей, более точно учитывающую именно поведенческие факторы ранжирования и снижая значимость внешних факторов, которые больше подвержены искусственному накручиванию.
Литература
1. Блог веб-студии RevolWeb / Самые популярные поисковые системы на 2015 год, 2015. URL: revolweb.ru/prodvizhenie-sajtov/samye-populyarnye-poiskovye-sistemy-na-2015-god.
2. Tober M. Searchmetrics Ranking Factors 2014: Why Quality Content Focuses on Topics, not Keywords // Moz URL: moz.com/blog/searchmetrics-ranking-factors-2014 (date: 2014).
3. Ашманов И.С., Иванов А.А. Оптимизация и продвижение сайтов в поисковых системах. СПб.: Питер, 2011. 464 с.
4. Enge E., Spencer S., Stricchiola J., Fishkin R. The Art of SEO. O'Reilly Media, 2012. 718 p.
5. Этемез Е. Поисковая оптимизация от А до Я. М.: Вильямс, 2008. 598 с.
6. Неелова Н. Sembook. Энциклопедия поискового продвижения Ingate. СПб.: Питер, 2014. 520 с.
7. Pinheiro Carlos A.R. Social Network Analysis in Telecommunications. Hoboken: John Wiley & Sons, 2011. 288 p.
8. Розин М.Д., Свечкарев В.П., Конторович С.Д., Литвинов С.В., Носко В.И. Исследование социальных сетей как площадки социальной коммуникации рунета, используемой в целях предвыборной агитации // Инженерный вестник Дона, 2011, №1 URL: ivdon.ru/ru/magazine/ archive/n1y2011/397.
9. Берёза Н.В. Современные тенденции развития мирового и российского рынка информационных услуг // Инженерный вестник Дона, 2012, №2 URL: ivdon.ru/magazine/archive/n2y2012/758
10. GM site / Тенденция рынка услуг комплексного интернет-маркетинга в 2014 году, 2014. URL: gmsite.ru/about/news/Market+trends/.
References
1. Blog of webstudio RevolWeb. URL: revolweb.ru/prodvizhenie-sajtov/samye-populyarnye-poiskovye-sistemy-na-2015-god.
2. Tober M. Searchmetrics Ranking Factors 2014: Why Quality Content Focuses on Topics, not Keywords. URL: moz.com/blog/searchmetrics-ranking-factors-2014 (date: 2014).
3. Ashmanov I.S., Ivanov A.A. Optimizaciya i prodvizhenie saitov v poiskovih sistemah [Optimization and promotion of website in search engine]. SPb.: Piter, 2011. 464 p.
4. Enge E., Spencer S., Stricchiola J., Fishkin R. The Art of SEO. O'Reilly Media, 2012. 718 p.
5. Etemez E. Poiskovaya optimizaciya ot A do Ya [Search engine optimization from A to Z]. M.: Viliams, 2008. 598 p.
6. Neelova N. Sembook. Enciklopediya poiskovogo prodvizheniya Ingate [Sembook. Encyclopedia of search engine promotion Ingate]. SPb.: Piter, 2014. 520 p.
7. Pinheiro Carlos A.R. Social Network Analysis in Telecommunications. Hoboken: John Wiley & Sons, 2011. 288 p.
8. Rozin M.D., Svechkarev V.P., Kontrovich S.D., Litvinov S.V., Nosko V.I. Inћenernyj vestnik Dona (Rus), 2011, №1 URL: ivdon.ru/ru/magazine/ archive/n1y2011/397.
9. Bereza N.V. Inћenernyj vestnik Dona (Rus), 2012, №2 URL: ivdon.ru/magazine/archive/n2y2012/758.
10. GM site. URL: gmsite.ru/about/news/Market+trends/.
Размещено на Allbest.ru
...Подобные документы
Структура справочно-поисковых систем сети Интернет, работа механизмов поиска. Сравнительный обзор справочно-поисковых систем (Gopher, WAIS, WWW, AltaVista, Yahoo, OpenText, Infoseek). Поисковые роботы, наиболее популярные справочно-поисковые системы.
реферат [28,4 K], добавлен 14.01.2010Понятие системы "Интернет", использование, размер сети, количество абонентов и пользователей. Поисковые системы, подход к сбору информации о ресурсах Интернет. Современные поисковые серверы. Работа с каталогами ресурсов, сохранение информации в Интернете.
реферат [17,6 K], добавлен 02.12.2010Сущность и принцип работы глобальной сети Интернет. Поиск информации по параметрам в системе Google. Специализированные системы поиска информации: "КтоТам", "Tagoo", "Truveo", "Kinopoisk", "Улов-Умов". Целесообразное использование поисковых систем.
презентация [572,6 K], добавлен 16.02.2015Основные протоколы, используемые в Интернет. Инструменты поиска в Интернете. Популярные поисковые системы. Как работают механизмы поиска. Средства поиска и структурирования. Автоматизированная навигация по Сети. Критерии качества работы поисковой машины.
реферат [19,7 K], добавлен 14.02.2012Методы продвижения сайтов. Структура поисковой системы "Яндекс". Факторы ранжирования запросов. Фильтры поисковых систем, "Минусинск". Изменение структуры страниц. Применение внешней оптимизации сайта. Панель вебмастера с отображением внешних ссылок.
курсовая работа [2,0 M], добавлен 14.11.2016Характеристика методов поиска информации в Интернете, а именно - с использованием гипертекстовых ссылок, поисковых машин и специальных средств. Анализ новых интернет ресурсов. История возникновения и описание западных и русскоязычных поисковых систем.
реферат [17,2 K], добавлен 12.05.2010Определение программного и математического обеспечения ИС. Виды запросов к базам данных в СУБД. Поисковые системы Интернет. Описание принципа работы поисковых систем Яндекс, Рамблер, Апорт. Особенности пересылки файлов средствами электронной почты.
контрольная работа [271,7 K], добавлен 22.11.2009Развитие русскоязычного Интернета: гендерные и возрастные аспекты. Социально-психологические аспекты общения пользователей Интернет. Причины обращения к Интернету. Критерии Интернет-зависимости. Мотивация пользователей Интернет.
научная работа [21,8 K], добавлен 14.05.2007Предыстория появления сети интернет. Веб-страницы, сайты, порталы. Основные ресурсы интернет: месторасположение и содержание. Библиотеки, газеты, журналы и другие информационные ресурсы. Поисковые системы, каталоги, архивы. Общение через интернет.
курсовая работа [68,7 K], добавлен 09.05.2012Особенности и значение общения в сети интернет. Феномен и причины интернет-зависимости. Характеристика программ типа Windows-mesedgers. Содержание курса и интерфейс Web-сайта, его физическая структура. Описание реализации наиболее интересной странички.
курсовая работа [82,4 K], добавлен 14.12.2010Выделение подсистем на основе некоторой меры. Выбор типов шкал. Метод логического ранжирования. Построение моделей систем. Динамическая модель системы в виде сети Петри. Элементарные контуры графа системы. Расчет энтропии системы и матрицы приоритетов.
курсовая работа [1,2 M], добавлен 06.08.2013Изучение распределения пользователей Интернета по регионам мира. Анализ российской и мировой статистики динамики проникновения сети в населенные пункты, самых посещаемых сайтов. Характеристика зависимости процентного количества пользователей от возраста.
курсовая работа [1,4 M], добавлен 13.05.2011Средства поиска информации в сети Интернет. Основные требования и методика поиска информации. Структура и характеристика поисковых сервисов. Глобальные поисковые машины WWW (World Wide Web). Планирование поиска и сбора информации в сети Интернет.
реферат [32,2 K], добавлен 02.11.2010Теоретические основы Интернет-технологий и основных служб сети Интернет. Ознакомление с возможностями подключения к сети Интернет. Основные службы сети. Принципы поиска информации в WWW. Обзор современных Интернет браузеров. Программы для общения в сети.
курсовая работа [385,2 K], добавлен 18.06.2010История развития информатизации и компьютеризации общества, понятие информационной системы. Что такое компьютерная сеть и их типы: одноранговые сети и сети на основе сервера. Что такое интернет и интранет. Эталонная модель взаимодействия открытых систем.
реферат [233,4 K], добавлен 23.01.2011Психолого-педагогические основы формирования системно-деятельностного подхода обучения. Обзор существующих конструкторов сайтов, обоснование выбора сервиса Wix. Ознакомление обучающихся с правилами безопасности в сети Интернет. Технологии создания сайтов.
дипломная работа [428,9 K], добавлен 07.09.2017Характеристика предприятия ОАО ААК "Прогресс". История развития глобальной сети интернет. Технологии, используемые при создании сайтов. Статические сайты с интерактивными веб-страницами. Требования к сайту. Технология Microsoft.NET и среда ASP.NET.
дипломная работа [532,1 K], добавлен 24.06.2013Классификация основных структур (баз данных, сетей) по различным признакам. Внутренняя структура поисковых систем. Биржевая, финансовая, экономическая и патентная информация. LexisNexis как cамый крупный поставщик информации на коммерческой основе.
презентация [4,0 M], добавлен 25.07.2014История возникновения глобальной компьютерной сети интернет. Компьютеры-серверы и компьютеры-клиенты. Провайдеры интернет и их сети. Доступ в интернет из локальной сети. Взаимодействие между клиентом и сервером. Приложения-серверы и приложения-клиенты.
реферат [53,5 K], добавлен 13.10.2011Создание сайта в сети Интернет для информирования студентов и преподавателей о проходящих конференциях. Разработка модели "как будет" с учетом внедрения системы автоматизации. Описание сценариев элементарных функций и физической модели базы данных.
курсовая работа [2,4 M], добавлен 19.12.2015