Поисковые системы в интернете
Поисковая система как программное обеспечение, которое предоставляет доступ к огромной коллекции слабоструктурированной информации. Алгоритмы индексирования ресурсов. Дубликат - один и тот же текст, зависящий, например, от способа навигации по сайту.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | творческая работа |
Язык | русский |
Дата добавления | 13.02.2014 |
Размер файла | 24,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Поисковые системы в интернете
Большая часть пользователей сети Интернет сообщества начинают свой рабочие будни с поисковых систем, в которых стараются найти столь необходимую им информацию и далее решить свои насущные проблемы. К сожалению, не всегда поисковые системы способны правильно и справедливо толковать ресурсы. Как результат, на начальных этапах поиска часто оказываются сайты "далеки" от истины решаемого вопроса. При этом ресурсы, которые представляю реальную пользу оказываются "за бортом" поиска. поисковый система программный алгоритм
Причина такой расстановки проста и скрывается в технологии получения, представления результатов данными поисковыми системами. Следует не забывать, что основная проблема заключается в отсутствии четких, определенных правил, которые доступны и открыты для всех желающих. Чем больше неточности, неопределенности в алгоритмах формирования поисковых индексов (черный ящик), тем меньше поисковые системы отражают механизм поиска реальной информации.
И следовательно, тем меньше будет уровень доверия к результатам поиска определенных поисковых систем. Как бы это не звучало парадоксально, это вина не поисковых систем, так как они обязаны скрывать правила построения поисковых индексов. Вина заключается в технологии которая скрывается в организации поиска.
По своей натуре технология поисковых систем определена («нацелена») на пассивного пользователя. Необходимо зарегистрировать всего лишь сайт, далее все сделает сам поисковый робот. Он произведет сканирование ресурса страницы за страницей, пытаясь определить содержание каждой из них. Трудоемкость пользователя очень минимальна, что позволяет воспользоваться разными методиками по "обману" поисковых роботов при достаточно низких затратах средств и сил. По подобной схеме работы поисковым системам надо изменять правила и алгоритмы индексирования ресурсов и построения поискового индекса.
Несомненно, множество пользователей пользовались, пользуются, и конечно же будут пользоваться известными классическими поисковиками. Это достаточно просто, удобно и на данном этапе распространено. Это словно привычка пользоваться поисковиками.
Поисковая система это программное обеспечение, которое предоставляет доступ к огромной коллекции слабоструктурированной информации. Ориентация на слабоструктурированные данные, то есть данные, которые нельзя представить в форме реляционной таблицы, отличает поисковую систему от СУБД.
В определении поисковой системы подразумевается информация различного рода, то есть аудио, текст, видео, изображения и так далее. Следует отметить, что именно текстовые данные являются самыми подходящими для описания функциональности поисковой системы, так как алгоритмы поиска мультимедийной информации, в свое время , основываются на алгоритмах именно поиска текста.
Главная задача поисковой системы это минимизировать время, которое затрачивается пользователем на поиск релевантной запросу информации. Релевантность это одно из самых запутанных и субъективных понятий в науке информационного поиска. Часто говорят о релевантности с точки зрения пользователя, и следовательно ``релевантная запросу информация'' и ``нужная пользователю информация'' - одни и те же понятия. Именно о подобной релевантности мы и обговариваем в данном разделе нашей работы. Другой вопрос заключается в том, именно какую информацию пользователь глобальной сети Интернет посчитает нужной? В некоторых случаях релевантной информацией можно посчитать как всю информацию базы данных, которая имеет отношение к запросу. Например, если пользователю необходимо узнать все о какой-либо конкретной фирме, то следовательно он заинтересован в поиске всех документов, в которых отображается упоминание об этой фирме. В других случаях релевантная информация это именно та информация, которая достаточна для выполнения конкретной задачи пользователя, к примеру, поиска нужного ответа на конкретный вопрос. Если в данном случае в результатах поиска будет много избыточных данных, то есть данных, которые имеют непосредственно отношение к запросу, но не нужны для выполнения данной задачи, то выборка нужной информации займет у пользователя дополнительное время.
Следовательно, традиционно к поисковой системе относят две главные характеристики, а именно: полнота и точность, а вернее, их взаимосвязь. Всегда, когда пользователь задает данной системе какой-либо запрос, инициализируя поиск, все документы в полученной коллекции поисковой системы разделяются на четыре части. Точность обусловливает один аспект поиска, а именно, насколько хорошо поисковая система способна уменьшить время, которое затрачивается пользователем на поиск информации, релевантной данному запросу. В свою очередь полнота определяет совершенно другой аспект, а именно: насколько хорошо система способна найти информацию, релевантную данному запросу. Можно подобрать достаточно оптимальный запрос(ы), при котором каждый найденный документ будет релевантным, и каждый релевантный документ будет найден.
Поисковые системы при применении Интернет играют очень большую роль. В Интернете находится такое огромное количество информации, что поиск превращается в отдельную задачу и отнимает достаточно много времени. Поисковые серверы выдают нам на запрос множество ссылок вместо нескольких страниц, в которых действительно содержится необходимая информация. Пользователи всемирной паутины, осознавая преимущества, которые предоставляются возможностью анализа пространственных данных, нуждаются в определенном инструменте, который позволяет осуществлять удобный и быстрый поиск и доступ к цифровым фотоснимкам местности и какой-то другой пространственной информации, которая сосредоточена во многих коммерческих и академических организациях.
Рассмотрим самые популярные поисковые системы.
Поисковая система Yandex.
Яндекс ежедневно просматривает сотни тысяч Web-страниц в поисках изменений или новых ссылок. Владельцы ресурсов могут самостоятельно добавить свой сайт, заполнив форму AddURL. Яндекс ежедневно просматривает сотни тысяч Web-страниц в поисках изменений или новых ссылок. Владельцы ресурсов могут самостоятельно добавить свой сайт, заполнив форму AddURL.
Яндекс индексирует российскую сеть, поэтому в поисковую машину вносятся сервера в доменах su, ru, am, az, by, ge, kg, kz, md, ua, uz. Остальные сервера вносятся, только если на них найден текст на русском языке, или если владельцы ресурсов убедят администрацию поисковой машины в том, что их сервер интересен пользователям русскоязычного Интернета (это обычно делается письмом на addurl@yandex.ru).
Обычно страницы появляются в основе поиска в течение недели после их появления или изменения. Новые страницы ввели основу посредством AddURL, будет казаться более быстрым (если они будут в Русскоязычной части сети и не потребуют ручную проверку).
Поисковая система Yandex - полный текст, который является к его индексу, добирается (и станьте доступными поиску), только те слова, которые написаны на страницах мест.
В списке результатов поиска после адреса страницы текст, который состоит из заголовка (признак названия), описания (meta бейдж = содержание "Описания" ="") или начала документа (если этот признак не присутствует) и контексты - произведены фрагменты текста starnitsa, содержа слова запроса
Когда Yandex находит новую или измененную страницу, он вносит его в указатель. В ходе него концы страницы в элементы, которые содержание принесено в индексе. Когда Yandex находит новую или измененную страницу, он вносит его в указатель. В ходе него концы страницы в элементы (текст, заголовки, подписи к картинам, ссылки и так далее), какое содержание принесено в индексе. Положения слов, который является их ситуацией в документе или его элементе, таким образом рассматривают. Документ не хранится в базе.
Яндекс индексирует страницы по их истинным адресам. Это значит, что, если на странице стоит redirect, робот воспримет его как ссылку на новый адрес и внесет ее в очередь на индексирование.
Как стандарт протокола HTTP, Яндекс требует, получив в информации о заголовке ответа, что этот URL - переадресовывание (кодексы 3xx), добавит в списке адресов для раунда URL на который поведения переадресовывание. Если переадресовывание было постоянным (код 301), или на странице направляющий метаосвежительный напиток, встреченный, старый URL будет исключен из круглого списка.
Робот Яндекс хранит дату когда бы произведен последний обход каждой страницы, дату ее изменения (присланную Web-сервером) и дату внесения последних изменений в базу поиска (дату индексации). Это оптимизирует раунд Сети так, чтобы чаще посетить изменяемые серверы. Робот Yandex работает автоматически и обычно переиндексация, это происходит в течении двух трёх недель. Изменения уже проиндексированных страниц робот Яндекс отслеживает самостоятельно при следующем заходе на сайт. У робота свой график работы и изменить его невозможно.
Yandex вносит документ в указатель полностью: текст, заголовок, подписи к картинам, описанию (описание), ключевые слова и некоторая другая информация.
Робот Yandex обходит "динамические" страницы и рассматривает их в точности так же как "статичный". Робот поиска Yandex кроме стандартного HTML, индексов: PDF, ДОКТОР, RTF и форматы Вспышки файлов.
Дубликат - это один и тот же текст, под десятком разных адресов, зависящих, например, от способа навигации по сайту. Сайты с большим числом дубликатов время от времени подвергаются безжалостной чистке.
Поисковая система Rambler.
Когда кто-либо делает ряд последовательных запросов в поисковике Рамблер, эти слова и фразы становятся связанными между собой - Rambler ассоциациями. Механизм ассоциаций Rambler доступен пользователям поисковой системы Rambler. Ассоциации Rambler - он (тематически ассоциативно), связанные запросы с начальным запросом пользователя. Когда кто-то делает много последовательных запросов в Rambler искателя, эти слова и фразы становятся связанными между собой. И такая последовательность создает ассоциации Rambler. Фактически, это понятие " У нас также ищут".
С одной стороны, посредством механизма ассоциаций Rambler пользователь может быстро определить или расширить запрос. С другой стороны, сеть типичных ассоциаций показывает недостатки начального запроса, его двусмысленности, "размытости". В результате посетитель искателя Rambler учится спрашивать правильно, не проводя ни для чего время, то есть, фактически, обращения к помощи "коллективной причины".
Механизм ассоциаций "У нас также ищут" привлекателен любому, кто хочет посмотреть, о чем думают тысячи и тысячи посетителей сети. Это инструмент для поиска, равно как и источник ценной информации для лингвистов и web-мастеров/
Возможно ограничить индексацию страниц ресурсов поисковой системой Rambler через robots.txt или Роботы признак META. Робот Rambler искателя "StackRambler" называют. Это загружает документы, выставленные в Интернете, находит в них ссылки на другие документы, загрузки снова, и т.д. робот StackRambler анализирует robots.txt файл и ограничивает просмотр ресурса, согласно его инструкциям. Через robots.txt это возможно запретить доступ к определенным каталогам и/или файлам.
Ограничить просмотр страниц ресурса роботом Rambler поисковой системы, поскольку это возможно через Роботы признак META. Признак управляет индексацией конкретной веб-страницы. При этом роботам можно запретить не только индексацию самого документа, но и проход по имеющимся в нем ссылкам.
Поисковая система Google.
Данная поисковая система со временем становится все лучше и популярнее, но она уступает вышеперечисленным поисковым системам. Согласно опросам, данными Google обеспечивает приблизительно 10% всех запросов поиска Runet. На регистрации Google принимает места любой области, которая является им, не ограничен только зональным рутением. Это, конечно, очень большое преимущество перед конкурентами (в России). Но Google больше не имеет никаких преимуществ и не может выделить в результатах поиска слова вообще, которые являются синонимами запроса. Таким образом, если мы установим в запросе поиска Google "шутку", то Google будет искать это слово, в то время как Yandex, Rambler и по левую сторону судна кроме того, слова рассмотрят на территориях и синонимах слов, например, "шутках" на территориях, и Google его не может сделать.
Мы в нашем современном обществе не можем представить жизни без глобальной сети Интернет, с помощью его мы приобретаем разнообразные товары, общаемся, знакомимся, слушаем музыку, работаем, смотрим фильмы и так далее. Возможности системы Интернет безграничны, надежными помощниками в виртуальных лабиринтах выступают поисковые системы. Нет ничего проще, как написать в строке определенного поисковика нужный запрос, и данная поисковая система выделяет большое количество предложений по внесенным в поисковую строку словам, фразе. До недавнего времени об это даже не мечтали.
Таким образом: наиболее популярны поисковые системы: Яндекс, Google и Rambler.
Поиск, осуществляемый с применением поисковых машин, является самым распространенным методом поиска конкретной информации в сети Интернет.
Хотя остальные методы ничем не хуже, только они применяются очень редко и только в таких случаях, если при помощи поисковой машины ничего нельзя найти.
Пользоваться поисковыми машинами удобно и легко.
Список использованных интернет-ресурсов
№ п/п |
Наименование интернет-ресурса |
Ссылка на конкретную используемую страницу интернет-ресурса |
|
1 |
Поисковые системы |
http://simbiont-club.webzone.ru/search.htm |
|
2 |
Лента новостей |
http://newsmir.ucoz.ru/load/1-1-0-9 |
|
3 |
Интернет в профессиональной информационной деятельности |
http://textbook.vadimstepanov.ru/index.html |
Размещено на Allbest.ru
...Подобные документы
Приемы поиска информации в Интернете. Поиск по известному адресу, конструирование адреса пользователем. Специальные информационно-поисковые системы: классификационные (рубрикаторы) и словарные. Поиск информационных ресурсов по различным направлениям.
реферат [27,1 K], добавлен 03.04.2010Основные источники информации, представленные в Интернете. Каталог - поисковая система с классифицированным по темам списком аннотаций со ссылками на web-ресурсы. Особенности поисковой и метапоисковой машины. Архитектура современных ИПС для WWW.
реферат [51,7 K], добавлен 27.03.2010Понятие системы "Интернет", использование, размер сети, количество абонентов и пользователей. Поисковые системы, подход к сбору информации о ресурсах Интернет. Современные поисковые серверы. Работа с каталогами ресурсов, сохранение информации в Интернете.
реферат [17,6 K], добавлен 02.12.2010Яндекс как крупнейшая российская поисковая система и интернет-портал, история появления. Поиск системы: охват форматов, язык запросов. Мультимедийно-поисковые, рыночно-поисковые, справочно-информационные, рекламные и персонализированные веб-сервисы.
курсовая работа [105,3 K], добавлен 21.05.2013Компоненты документальной информационно-поисковой системы. Результаты индексирования документов и запросов. Иерархическая, фасетная и эмпирическая классификационные схемы. Дескрипторные информационно-поисковые языки. Примеры дескрипторной статьи.
презентация [59,2 K], добавлен 14.10.2013Сущность и компоненты поисковой системы. Популярные поисковые системы, их виды. Язык программирования Java и JavaScript, их структурные элементы и функциональные возможности. Основные требования к школьному сайту. Дизайн, хостинг и продвижение сайта.
презентация [4,2 M], добавлен 17.12.2011Определение программного и математического обеспечения ИС. Виды запросов к базам данных в СУБД. Поисковые системы Интернет. Описание принципа работы поисковых систем Яндекс, Рамблер, Апорт. Особенности пересылки файлов средствами электронной почты.
контрольная работа [271,7 K], добавлен 22.11.2009Информационная поисковая система Яндекс; характеристика услуг и сервисов портала: каталог, новости, города, энциклопедии. Полезные ссылки главной страницы. Формирование и активизация поискового запроса: морфология, контекст, порядок слов, результат.
презентация [2,6 M], добавлен 10.03.2015Организация хранения данных. Система управления базами данных. Поиск информации, обзор существующих поисковых систем. Особенности работы поискового движка. Использование индексов в поисковых системах. Особенности поиска различных видов информации.
курсовая работа [4,6 M], добавлен 14.05.2014Классификация программного обеспечения, его особенности, назначение. Программное обеспечение для работы с текстом, изображением, прикладное, офисное, для работы в Интернете. Системы программирования, специфика программного обеспечения, что такое вирусы.
презентация [1,2 M], добавлен 25.02.2010Прикладное программное обеспечение, его использование при проведении сложных математических вычислений. Менеджер загрузок. Офисные средства обработки информации. Система автоматизации проектных работ. Основы использования функций Excel, их аргументы.
контрольная работа [227,6 K], добавлен 01.03.2009Обзор понятия и принципов функционирования электронной почты - средства обмена информацией, подготовленной в электронном виде, между людьми, имеющими доступ к компьютерной сети. Информационно-поисковые системы. Параметры эффективности поиска информации.
презентация [677,8 K], добавлен 12.12.2012Операционная система: назначение и классификация. Общая характеристика и основные механизмы операционной системы Windows. Средства подготовки текстовых документов в Windows. Понятие самораспаковывающегося и многотомного архивов, файловой системы.
реферат [20,0 K], добавлен 05.10.2011История поисковых систем. Классификация информационных систем по степени автоматизации. Три основных способа поиска информации в Интернете. Отличие поисковых систем от каталогов. Назначение и типы информационных систем государственных учреждений.
курсовая работа [368,5 K], добавлен 13.05.2015Программное обеспечение как совокупность программ системы обработки информации и программных документов, необходимых для эксплуатации этих программ. Системное ПО (программы общего пользования), прикладное и инструментальное (системы программирования).
реферат [73,1 K], добавлен 04.06.2010Анализ возможностей поисковых систем Яндекс и Google, их сравнение с точки зрения полезности. История создания поисковых систем, характеристика их интерфейса, поисковых инструментов и алгоритмов. Формирование вопроса и критерий к ответу на него.
реферат [30,0 K], добавлен 07.05.2011Характеристика методов поиска информации в Интернете, а именно - с использованием гипертекстовых ссылок, поисковых машин и специальных средств. Анализ новых интернет ресурсов. История возникновения и описание западных и русскоязычных поисковых систем.
реферат [17,2 K], добавлен 12.05.2010Структура справочно-поисковых систем сети Интернет, работа механизмов поиска. Сравнительный обзор справочно-поисковых систем (Gopher, WAIS, WWW, AltaVista, Yahoo, OpenText, Infoseek). Поисковые роботы, наиболее популярные справочно-поисковые системы.
реферат [28,4 K], добавлен 14.01.2010Основные протоколы, используемые в Интернет. Инструменты поиска в Интернете. Популярные поисковые системы. Как работают механизмы поиска. Средства поиска и структурирования. Автоматизированная навигация по Сети. Критерии качества работы поисковой машины.
реферат [19,7 K], добавлен 14.02.2012Характеристика программного обеспечения персонального компьютера, которое делиться на три класса: системное, прикладное ПО, инструментарий программирования. Особенности работы компьютерной сети - системы связи компьютеров или компьютерного оборудования.
контрольная работа [22,9 K], добавлен 10.06.2010