Алгоритм работы поисковой системы
Принцип работы и назначение поисковых систем. Элементы поисковой машины: паук (spider), краулер (crawler), индексатор (indexer), подсистема выдачи результатов. Характеристика самой мощной поисковой системы Google, ее претмущества и набор инструментов.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 28.02.2019 |
Размер файла | 12,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru//
Размещено на http://www.allbest.ru//
Алгоритм работы поисковой системы
Валеева Д.Р.
Интернет - это бесчисленные поток информации, в которой невозможно разобраться самостоятельно. Для того, чтобы решить данную проблему в конце 20 века появились поисковые системы. Поисковые системы или подругому поисковики помогают нам подобрать необходимую информацию, т.е. они хранят и сортируют информацию на сайтах.
На сегодняшний день существует достаточно большое количество поисковых систем, как мировых, так и отечественных: Google, Яндекс, Rambler, Yahoo, Mail.ru, MSN search. Миллионы людей ежедневно пользуются поисковиками, но никто не задумывался о том, как они работают. Давайте попробуем в этом разобраться.
Необходимо понимать, что есть разница, между тем как работает поисковик и тем, как любая другая система, которая ищет информацию в базе данных. Поисковая система формирует ответ на наш запрос, основываясь на своем собственном хранилище данных - индексе. И если возникнут изменения во всемирной сети, то они отразятся только после того, как будут добавлены в индекс.
Обратимся к элементам поисковой машины:
Паук (spider). Их функция достаточно проста. Они копируют страницы на просторах интернета, чтобы в дальнейшем поисковик смог индексировать загруженные страницы для наиболее эффективного поиска.
Краулер (crawler). Данный робот заходит на сайты и по ссылкам переходит на другие ресурсы, либо же проверяет разделы этого сайта. Результатом его работы являются новые страницы, которая также в дальнейшем индексируются.
Индексатор (indexer). Его функция - анализ страницы интернета, т.е. делить страницы на основные части такие, как название странички, ее заголовки, прочие ресурсы и т.п. И если она не удовлетворяет критериям, то страница не проходит индексацию.
Подсистема ранжирования. Данный робот занимается сортировкой страниц по степени соответствия содержания странички запросу. Факторов, по которым происходит ранжирование, существует огромное количество. Есть внешние факторы (например, показатель отказов, время, проведенное на сайте, показатель возвратов) и внутренние (правильные заголовки, ключевые слова). Та страница, которая удовлетворит больше факторов, покажется в первую очередь.
Подсистема выдачи результатов. Данная подсистема переводит запрос пользователя на структурированный запрос индекса и генерирует результаты поиска. В добавок к функциям этого робота относится и персонализированный поиск. Поисковик анализирует ваши предыдущие запросы и результаты следующих будут связаны именно с ними. Безусловно, поисковые системы проверяют ваше местоположения и выдают запросы, ссылаясь на эти данные.
Каждая поисковая система имеет свои собственные алгоритмы для выдачи необходимого результата. Но все - таки общие принципы работы в основном у всех похожие.
Первым делом в ход вступают пауки и краулеры, а затем происходит индексирование. Их работа протекает почти параллельно, ведь каждый день в интернете появляется все больше и больше информации. Задумайтесь, кому нужны уже неактуальные или бесполезные данные? Далее в процесс вступает ранжирование. Алгоритмы поиска информации постоянно совершенствуется. Поисковая машина, которая выдаст наиболее корректный и точный результат, будет набирать популярность среди людей.
Естественно, что здесь не только машинная работа, но и работа людей. Разработчики поисковых систем прикладывают огромные усилия для того, чтобы удовлетворить своих пользователей. Они могут сами корректировать релевантность выдачи результатов на запросы и оценивать сайты.
На сегодня по статистикам самой мощной поисковой системой является Google. База индексов обновляется очень часто, можно сказать, что почти каждый день, поэтому на наши запросы мы получаем актуальную и нужную информацию. Но не стоит забывать и про отечественную поисковую систему Яндекс. Безусловно Google выдаст нам информацию лучше на уровне всего мира, но если нам нужна информация регионального характера, то актуальнее результаты будут у Яндекса. Набор инструментов у данных поисковых машин почти одинаковый. Поэтому можно сделать вывод о том, что нельзя определенно сказать, что лучше и хуже, необходимо ориентироваться на собственные запросы и выбирать подходящую поисковую систему. поисковый система crawler google
Всемирная паутина является самым необходимым источником информации на сегодняшний день и невозможно представить нашу жизнь без поисковых систем, намного облегчающую нам жизнь. Зная, как работает поисковая система, мы можем правильно строить запросы и получать качественную и самую свежую информацию.
Размещено на Allbest.ru
...Подобные документы
Понятие информационно-поисковых систем, их сущность и особенности, история возникновения и развития, роль на современном этапе. Внутреннее устройство и элементы поисковой системы. Принцип работы поисковой машины Рамблер, прядок обработки запроса.
научная работа [222,0 K], добавлен 29.01.2009Понятие и классификация поисковых систем, история их развития и структурные элементы. Характеристика существующих моделей поиска, анализ его качества. Особенности обработки запроса поисковой системой, подготовки базы данных и процесса выдачи результатов.
курсовая работа [2,6 M], добавлен 15.04.2014Обеспечение высокой релевантности поиска с помощью поисковой системы Google. Быстрота и надежность работы, большее количество ссылок в русскоязычном секторе Интернета. Службы, отсутствующие у других поисковых систем. Google как законодатель моды.
презентация [1,5 M], добавлен 10.03.2015Описание и классификация современных информационно–поисковых систем. Гипертекстовые документы. Обзор и рейтинги основных мировых поисковых систем. Разработка информационно–поисковой системы, демонстрирующей механизм поиска информации в сети Интернет.
дипломная работа [1,3 M], добавлен 16.06.2015Понятие и принципы работы, внутренняя структура и элементы, история формирования и развития поисковой системы "Rambler". Исследование и анализ, а также оценка эффективности данной поисковой системы для поиска экономической информации в интернете.
курсовая работа [4,0 M], добавлен 10.05.2015Идеи по использованию сервисов поисковой системы Google для совместной работы с учащимися в блоге "Учимся с Google". Организация коллективной деятельности с помощью сервисов Google. Характеристика функций основных сервисов, их достоинства и недостатки.
реферат [24,5 K], добавлен 27.11.2012Разнообразие сервисов и инструментов от компании Google - крупнейшей поисковой системы сети Internet: Web-интерфейс почтовой службы Gmail, картографический сервис Google Maps, универсальность переводчика Google Translate, видеохостинг от YouTube.
доклад [15,9 K], добавлен 21.05.2012Анализ существующих поисковых систем и используемых ими алгоритмов поиска документов. Разработка информационно-поисковой системы словарного типа, способной осуществлять релевантный поиск документов, особенности ее структуры и информационно-поисковой базы.
дипломная работа [942,1 K], добавлен 19.05.2011Совместимость и преобразование типов данных. Создание информационно-поисковой системы на языке программирования Паскаль. Описание интерфейса, каждого блока программы "Картотека больных". Рассмотрение результатов работы программы, сортирования данных.
курсовая работа [368,9 K], добавлен 18.05.2015Изучение языка поисковых запросов. Принципы действия регистров, скобок, метасимволов. Методы управления индексированием сайта, использования файлов robots.txt. Группы инструкций для отдельных роботов: User-agent. Принципы работы поисковой машины Рамблер.
реферат [105,0 K], добавлен 19.12.2010Анализ возможностей поисковых систем Яндекс и Google, их сравнение с точки зрения полезности. История создания поисковых систем, характеристика их интерфейса, поисковых инструментов и алгоритмов. Формирование вопроса и критерий к ответу на него.
реферат [30,0 K], добавлен 07.05.2011Контекстная реклама как основная статья дохода поисковых систем-лидеров. Понятие цены клика. Формирование цены на основе частот запросов (на примере поисковой системы Рамблер). Основные поисковые системы на российском рынке, перспективы их развития.
творческая работа [373,4 K], добавлен 07.04.2009Возможность составления собственного персонального информационно-правового банка по свои индивидуальным предпочтениям - одно из важнейших преимуществ поисковой системы "Гарант". Основные элементы интерфейса информационного комплекса "Консультант".
курсовая работа [534,5 K], добавлен 14.11.2017Основные методы объектно-ориентированного программирования поисковой системы. Выбор языка программирования и среды разработки приложения. Реализация паттерна, использование принципа сохраняемости. Описание пользовательского интерфейса поисковой системы.
курсовая работа [781,4 K], добавлен 29.04.2015Ранжирование сайтов поисковыми системами. Поисковые машины, алгоритм работы. Описание процесса изменения рейтинга сайта, математическая модель. Главные функциональные возможности скрипта, описание подпрограмм, алгоритмов и принципа работы программы.
курсовая работа [66,1 K], добавлен 12.07.2012Анализ информационно-поисковых систем автоматизации производства. Построение инфологической и логической модели базы данных технологического оборудования для сборочно-монтажных работ. Выбор языка программирования приложения БД. Алгоритм работы программы.
дипломная работа [2,5 M], добавлен 18.12.2013Основные понятия и определения web-технологии. Направления ее развития. Применение интернет-технологий в информационных системах, образовательной сфере, туризме. Инструменты деятельности поисковой системы Google и функции ее пользовательского интерфейса.
реферат [25,3 K], добавлен 04.04.2015Примеры применения интернет-сервисов для реализации функций управления. Торговые интернет-площадки: понятие и виды. Выгоды и риски продавцов и покупателей. Возможности и виды шифрования информации. Изучение инструментов поисковой системы Google.
контрольная работа [3,3 M], добавлен 04.06.2015Построение структурной схемы модели системы, укрупненной схемы моделирующего алгоритма. Проект математической модели информационно-поисковой библиографической системы, построенной на базе двух ЭВМ и имеющей один терминал для ввода и вывода информации.
курсовая работа [598,2 K], добавлен 21.06.2011Назначение и классификация методов поисковой оптимизации. Эффективность поискового метода. Методы поиска нулевого порядка: исходные данные, условия, недостатки и применение. Структура градиентного метода поиска. Основная идея метода наискорейшего спуска.
лекция [137,8 K], добавлен 04.03.2009