Как работают поисковые системы в интернете

Характеристика и функции поисковой системы - информационной системы с элементами автоматизации, которая осуществляет поиск интернет страниц по запросам пользователя. Принципы работы системы поиска, учитывающей не только текст запроса, но и его окружение.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 28.02.2019
Размер файла 14,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

Как работают поисковые системы в интернете

Бахарев А.Ю.

Поисковая система- это информационная система с элементами автоматизации, которая осуществляет поиск интернет страниц по запросам пользователя. Google - самая популярный поисковик в мире, самый известный поисковик в России - Яндекс, а одним из самых старых поисковиков является Yahoo. В строении поисковой системы выделяют поисковую машину - ядро системы, которое представляет набор программных модулей; индекс или БД, которая хранит информацию обо всех интернет ресурсах, которые известны поисковой; и набор сайтов, являющих собой точки входа пользователей в систему (ru.yahoo.com, www.google.com, www.yandex.ru и т.д.). Всё это построено в виде классических трёх уровней:

логика бизнеса, интерфейс пользователя и конечно же база данных, без которой никак не обойтись.

Своеобразие поиска в интернете

С первого взгляда, можно решить, что поиск какой-либо информации в интернете мало чем может отличаться от обычного поиска информации или какого-нибудь объекта, например как обрабатывается запрос SQL к БД и как реализуется задача поиска файла в компьютере. Такого мнения придерживались и те, кто создавал первые поисковые системы, но вскоре они осознали, что ошибались…

Во-первых(наверное, самое важное отличие), поиск в интернете отличается от обычного поиска тем, что алгоритм поиска по той же базе данных предполагает, что ее структура известна поисковой машине и автору запроса заранее. В интернете, по понятным причинам, это не так. Страницы в интернете составляют собой сеть, а не структуру каталога, это сильно влияет на алгоритмы, применяющиеся для поиска, и к тому же формат данных, которые размещают на интернет ресурсах никем не контролируется.

Во-вторых отличие заключается в том, что запрос представляется не в виде набора критериев поиска, а в виде текста, который писал человек на понятном ему языке. Следовательно, перед поиском информации, нужно чётко понять что нужно автору вопроса(человеку). Замечу, понять не какомуто другому человеку, а только вычислительной машине.

Третье отличие заключается в следующем: в каталоге или базе данных все элементы между собой равны(равноправны). В то же время в интернете имеет место быть конкуренция, а, соответственно, и разделение на ресурсы(страницы) с нужной и актуальной информацией и источников, близких по своему статусу к “информационному мусору”. Такой классификации подвергаются ресурсы и поисковые машины.

Подводя итог хочется дополнить, что область в которой производится поиск - это огромное количество страниц(миллиарды), по несколько килобайт, а то и больше, каждая. Около 10000000 страниц добавляется каждый день и такое же количество страниц обновляется. Всё это реализуют различные цифровые форматы. Очень печально, что даже современные технологии и ресурсы, имеющиеся в распоряжении лидеров рынка услуг поиска в интернете не позволяют им обрабатывать все это многообразие быстро и в полной объёме.

Принципы работы системы поиска

Понятно, что услуги поиска в интернете - это весьма выгодное дело. В детали, за счет чего живут такие компании, как Google и Яндекс можно не вдаваться, потому что основная часть их прибыли - это доходы от рекламы. А так как поиск в интернете есть дело очень выгодное, то и конкуренция среди таких компаний очень немалая. Что же определяет способность конкурировать на рынке интернет поиска? Конечно же качество того, что поисковая система выдаёт. Понятно, что чем выше это качество, тем будет больше пользователей этой системы, и тем ценнее будет контекстная реклама, которую можно размещать на страницах этой системы.

Следовательно, больше денег компания может извлечь из этого дела. Отсюда желание разработчиков выдавать только актуальную информацию без спама. Разработчики направляют много своих сил на очистку результатов своей системы поиска, где был выдан спам или неактуальная информация.

Поисковая машина сканирует весь интернет и ищет новые страницы, либо те, которые обновлены. Потому что старые страницы менее посещаемы и содержат информацию, которая в большинстве случаев является неактуальной.

Поисковая машина систематично обновляет ранжирование ресурсов по их релевантности ключевым запросам, потому что в индексе постоянно происходит появление каких-либо новых страниц. Это называется обновлением поисковой выдачи.

Из-за огромных объемов информации, размещенной в интернете и ограниченности ресурсов самой поисковой системы, поисковая машина старается загружать только самое актуальное и важное(естественно, по её мнению). В ее возможности входят всякие фильтры, которые удаляют мусор уже на этапе индексации или отсеивают спам из индекса по результатам обновления выдачи поиска. поисковый система интернет

Современные поисковые системы учитывают не только текст запроса, но и его окружение: контекст и личные предпочтения пользователя, о которых было сказано ранее, а также дата запроса, регион и другое.

На релевантность и адекватность какой-то конкретной страницы влияют не только структура и содержание, но и внешние параметры, к примеру ссылки на страницу со сторонних сайтов и поведение пользователя при нахождении на странице.

Качество работы поисковых систем постоянно увеличивается. Самая лучшая, быстрая и идеальная работа поисковой системы (для человека) возможна только в том случае, если все решения, касающиеся индексации и ранжирования будет принимать комиссия, которая состоит из большого числа специалистов всех существующих областей деятельности человека. Но это сделать невозможно, поэтому такую комиссию заменяют экспертные системы, эвристические поисковые алгоритмы и некоторые элементы искусственного интеллекта. Может быть работа всех этих подсистем также могла возвращать правильные, верные результаты, если бы имела возможность обрабатывать, к слову, все, имеющиеся в открытом доступе данные, но и это осуществить практически невозможно. Несовершенство искусственного интеллекта и ограниченные ресурсы - две причины того, что пользователи не всегда довольны результатами работы поисковой системы, но время всё решит, ведь прогресс не стоит на месте. На сегодняшний день работа больших поисковых систем вполне удовлетворяет всем потребностям поиска в интернете для людей.

Размещено на Allbest.ru

...

Подобные документы

  • Основные протоколы, используемые в Интернет. Инструменты поиска в Интернете. Популярные поисковые системы. Как работают механизмы поиска. Средства поиска и структурирования. Автоматизированная навигация по Сети. Критерии качества работы поисковой машины.

    реферат [19,7 K], добавлен 14.02.2012

  • Понятие и принципы работы, внутренняя структура и элементы, история формирования и развития поисковой системы "Rambler". Исследование и анализ, а также оценка эффективности данной поисковой системы для поиска экономической информации в интернете.

    курсовая работа [4,0 M], добавлен 10.05.2015

  • Приемы поиска информации в Интернете. Поиск по известному адресу, конструирование адреса пользователем. Специальные информационно-поисковые системы: классификационные (рубрикаторы) и словарные. Поиск информационных ресурсов по различным направлениям.

    реферат [27,1 K], добавлен 03.04.2010

  • Характеристика методов поиска информации в Интернете, а именно - с использованием гипертекстовых ссылок, поисковых машин и специальных средств. Анализ новых интернет ресурсов. История возникновения и описание западных и русскоязычных поисковых систем.

    реферат [17,2 K], добавлен 12.05.2010

  • Сущность и принцип работы глобальной сети Интернет. Поиск информации по параметрам в системе Google. Специализированные системы поиска информации: "КтоТам", "Tagoo", "Truveo", "Kinopoisk", "Улов-Умов". Целесообразное использование поисковых систем.

    презентация [572,6 K], добавлен 16.02.2015

  • Понятие системы "Интернет", использование, размер сети, количество абонентов и пользователей. Поисковые системы, подход к сбору информации о ресурсах Интернет. Современные поисковые серверы. Работа с каталогами ресурсов, сохранение информации в Интернете.

    реферат [17,6 K], добавлен 02.12.2010

  • Развитие информационной среды. Ключевые принципы работы Интернет. Русскоязычные и англоязычные термины Интернет. Расширения веб-страниц. Имена тестовых файлов. URL-адрес в Интернет. Страница поисковой машины Рамблер. Поиск по ключевым словам в Интернет.

    контрольная работа [353,2 K], добавлен 04.10.2011

  • Разработка информационной системы для ведения каталога книг/читателей, поисковой системы, предварительных заказов на приобретение книг. Анализ затрат на разработку системы. Архитектура объектно-ориентированной системы. Диаграмма классов, модули системы.

    курсовая работа [906,1 K], добавлен 24.06.2013

  • Разработка специализированной компьютерной системы, которая максимально упростит процесс выбора фотооборудования, поиск минимальной цены и магазина в Интернете, с возможностью просматривать статьи и обзоры про интересующее пользователя оборудование.

    дипломная работа [3,2 M], добавлен 24.03.2011

  • Особенности поиска информации в Интернет: стратегия и методика. Поисковые машины, каталоги и порталы информационных ресурсов. Подбор и введение ключевых слов. Использование режима "расширенный поиск", который имеет каждая из поисковых систем в Интернете.

    реферат [27,3 K], добавлен 06.08.2014

  • Средства поиска информации в сети Интернет. Основные требования и методика поиска информации. Структура и характеристика поисковых сервисов. Глобальные поисковые машины WWW (World Wide Web). Планирование поиска и сбора информации в сети Интернет.

    реферат [32,2 K], добавлен 02.11.2010

  • Рассмотрение принципов поисковой системы и процедуры проведения поиска по запросам пользователей "Яндекса". Изучение структуры запросов, вспомогательных программ поиска, модулей и этапов их преобразования. Описание дополнительной информации в сниппете.

    реферат [135,6 K], добавлен 27.12.2014

  • Интернет и его возможности. Распространенный и недорогой способ подключения к интернет. Схема передачи информации по протоколу TCP/IP. Характеристики адресов разного класса. Поисковые системы, способы поиска и скачивания информации в глобальной сети.

    курсовая работа [245,6 K], добавлен 25.09.2013

  • Структура справочно-поисковых систем сети Интернет, работа механизмов поиска. Сравнительный обзор справочно-поисковых систем (Gopher, WAIS, WWW, AltaVista, Yahoo, OpenText, Infoseek). Поисковые роботы, наиболее популярные справочно-поисковые системы.

    реферат [28,4 K], добавлен 14.01.2010

  • Обзор понятия и принципов функционирования электронной почты - средства обмена информацией, подготовленной в электронном виде, между людьми, имеющими доступ к компьютерной сети. Информационно-поисковые системы. Параметры эффективности поиска информации.

    презентация [677,8 K], добавлен 12.12.2012

  • Анализ автоматизированных информационных технологий, применяемых в экономике. Особенности экономической информационной системы, предназначенной для поиска, хранения и выдачи информации по запросам пользователей. Поиск информации с помощью баз данных.

    курс лекций [1,4 M], добавлен 27.01.2010

  • Характеристика основных патентных баз данных, используемых при проведении патентно-информационного поиска в Интернете. Стратегия патентного поиска и системы патентной классификации. Использование логических операторов и ключевых слов при поиске.

    презентация [1,9 M], добавлен 15.09.2011

  • Роль информационных процессов в организационно–экономической сфере, технологии и методы обработки информации. Поисковые системы, основные программы для работы в Интернете, средства работы с электронной почтой, системы быстрого обмена сообщениями.

    контрольная работа [230,5 K], добавлен 19.02.2012

  • Определение программного и математического обеспечения ИС. Виды запросов к базам данных в СУБД. Поисковые системы Интернет. Описание принципа работы поисковых систем Яндекс, Рамблер, Апорт. Особенности пересылки файлов средствами электронной почты.

    контрольная работа [271,7 K], добавлен 22.11.2009

  • Требования, предъявляемые к разрабатываемой информационной системе. Подходы к созданию информационной системы Интернет-офиса. Современные информационные системы для автоматизации медицинских учреждений. Технологическая схема ввода и накопления информации.

    дипломная работа [2,6 M], добавлен 22.11.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.