Поисковые системы
Понятие информационных систем, элементы их функционирования. Критерии классификации и особенности поисковых систем. Этапы работы поискового указателя. Службы, инструменты Яндекса и сервисы Google. Сравнительный анализ поисковых систем "Яндекс" и "Google".
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 01.06.2016 |
Размер файла | 795,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Содержание
- Введение
- Глава 1. Теоретическая часть. Информационные системы и поисковые машины
- 1.1 Понятие информационных систем
- 1.2 Классификация информационных систем
- 1.3 Понятие информационных поисковых систем
- 1.4 Структура работы поисковых систем
- 1.5 Поисковая система «Яндекс»
- 1.6 Поиск Яндекс
- 1.7 Поисковая система Google
- 1.8 Поиск Google
- Глава 2. Аналитическая часть. Сравнение поисковых машин «Яндекс» и «Google»
- 2.1 Сравнение «Яндекс» и «Google» в период с 2012-2014 годов
- 2.2 Основные отличия
- 2.3 Преимущества и недостатки
- 2.4 Сравнительный анализ работы поисковых систем
- Заключение
- Список используемых источников
Введение
Мы в нашем современном мире не можем представить жизни без Интернета, с его помощью мы покупаем разнообразные товары, знакомимся, общаемся, работаем, слушаем музыку, смотрим фильмы и т.д.
На сегодняшний день львиную долю всего, что может нам, предоставить интернет занимают различные развлекательные ресурсы «Сайты». Вместе это все можно назвать «информационными системами для WEB». Среди всего этого множества я хотел бы выделить особую часть информационных систем, без которой комфортное нахождение в Рунете было бы не возможным, такую как поисковые машины.
Интернет - всемирная компьютерная сеть, представляющая собой единую информационную среду и позволяющая получить информацию в любое время. Здесь храниться очень много полезной информации, но для поиска её требуется затрачивать много времени. Эта проблема послужила поводом к появлению поисковых машин.
Российские граждане о возможностях Интернета узнали всего лишь несколько лет назад, несмотря на такой короткий срок, в настоящее время Всемирная Паутина становится доступной даже в отдаленных уголках нашей большой страны. Например, среди жителей Москвы девяносто процентов молодежи до 30 лет являются активными пользователями Интернета. С каждым днем по всей стране их количество стремительно возрастает, значительно увеличивается и скоростная способность каналов.
Пользователи Рунета, число которых неустанно растет, используют для поиска в сети поисковые системы. Умение использовать возможности поиска в интернете является информационной компетентностью любого современного человека.
Мало кто может сейчас поспорить о том, что в Рунете главными поставщиками трафика (потока посетителей) для сайтов на сегодняшний день являются две поисковые системы - это Яндекс и Google.
В данной курсовой работе будут рассмотрены общие понятия информационных систем, а так же такие поисковые машины, такие как Google и Яндекс.
Объектом курсовой работы является рассмотрение общих понятий информационных систем, а так же поисковые машины в целом, описание алгоритма работы и особенностей синтаксиса поиска. Предметом изучения будут два популярных поисковика в России - это «Яндекс» и «Google».
Цель данной работы выявить основные преимущества и недостатки данных поисковых систем.
Задачи для достижения цели:
- рассмотреть особенности каждой поисковой системы;
- выявить основные достоинства и недостатки;
- сравнить их способность находить именно нужный материал в сети internet;
- сделать вывод.
Глава 1. Теоретическая часть. Информационные системы и поисковые машины
1.1 Понятие информационных систем
Под информационной системой понимается организованная совокупность программно-технических и других вспомогательных средств, технологических процессов. Они обеспечивают сбор, представление и накопление информационных ресурсов в определённой предметной области, поиск и выдачу сведений необходимых для удовлетворения информационных потребностей пользователей. Информационных системы являются основным средством, инструментарием, решения задач информационного обеспечения различных видов деятельности и наиболее бурно развивающейся отраслью индустрии информационных технологий.
Рисунок 1.Структура информационной системы
Структура информационной системы.
В составе информационной системы можно выделить три подсистемы (Рисунок 1):
- организационно технологическая подсистема сбора информации обеспечивает информационную систему и включает совокупность источников информации, организационно - технологической цепочки отбора информации для накопления в системе. Без правильного организованной подсистемы сбора информации невозможна эффективная организация функционирования все информационной системы в целом;
- подсистема предоставления и обработки информации составляет ядро информационной системы и является отражением представления разработчиками и абонентами системы структуры и картины предметной области, сведения о которой должна отражать информационная система. Подсистема представления и обработки информации является одним из наиболее сложных компонентов при разработке информационной системы:
- нормативно функциональная подсистема выдачи информации определяет пользователей, или иначе абонентов системы, реализует целевой аспект назначения и выполнения задач информационной системы;
Основой всех поисковых систем составляют базы данных - совокупность данных организованных по предельным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, независимо от прикладных программ.
Можно выделить следующие элементы функционирования информационных систем:
- сбор информации - организованный в специальном порядке процесс сбора и отображения информации:
- получение информации;
- оценка относимости информации;
- порядок отбора и фиксации информации.
- комплектование - процесс сложения информации из множества частей в единое целое и доведения её до пользователя;
- поиск и выдача информации - установление специального технологического порядка, удовлетворения информационных потребностей абонентов информационной системы в управленческой деятельности и технологических процессах;.
- поддержание целостности и сохранения информации - пересмотр, ревизия и отсеивание утратившей актуальность информации являются неотъемлемой функцией информационных подразделений. Сохранность информации осуществляется с помощью нормативно - инструктивных документов.
1.2 Классификация информационных систем
Классификация по характеру предоставления логической организации хранимой информации разделяются на: фактографические, документальные и геоинформационные.
Фактографические накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов. Каждый из таких экземпляров структурных элементов или некоторая их совокупность отражают сведения, по какому - либо факту, событию. Структура каждого типа информационного объекта состоит из конечного набора реквизитов, отражающих основные аспекты и характеристики сведений для объектов данной предметной области.
В документальных единичным элементом информации является нерасчлененный на более мелкие элементы документ и информация при вводе, как правило, не структурируются, или структурируются в ограниченном виде. Для вводимого документа могут устанавливаться некоторые формализованные позиции - дата изготовления, исполнитель, тематика. Некоторые виды документальных информационных систем обеспечивают установление логической взаимосвязи вводимых документов - соподчиненность по смысловому содержанию.
В геоинформационных данные организованы в виде отдельных информационных объектов привязанных к общей электронной топографической основе. Геоинформационные системы применяются для информационного обеспечения в тех предметных областях, структура информационных объектов и процессов в которых имеется географический компонент.
Другим критерием классификации поисковых систем являются функции или решаемые задачи.
Справочные являются наиболее распространенным типом функций информационных систем, и заключается в предоставлении абонентам системы возможностей получения установочных данных на определённые классы объектов.
Поисковые являются наиболее распространённым классом информационных систем. В общем, виде можно рассматривать как некое информационное пространство, задаваемое в терминах информационно - логического описания предметной области.
Расчетные заключается в обработке информации , находящейся в системе , по определённым расчётным алгоритмам для различных целей.
Технологические функции информационных систем заключаются в автоматизации всего технологического цикла или отдельных его компонентов, производственной или организационной структуры.
1.3 Понятие информационных поисковых систем
Автоматизированная поисковая система - система, состоящая из персонала и комплекса средств автоматизации его деятельности, реализующая информационную технологию выполнения установленных функций.
Опыт и практика создания систем в различных сферах деятельности позволяет дать более широкое и универсальное определение, которое полнее отражает все аспекты их сущности.
Под информационной системой в дальнейшем понимается - организованная совокупность программно-технических и других вспомогательных средств, технологических процессов и функционально - определённых групп работников, обеспечивающих сбор, представление и накопление информационных ресурсов в определённой предметной области, поиск и выдачу сведений, необходимых для удовлетворения информационных потребностей установленного контингента пользователей - абонентов системы.
Особенности поисковых систем.
В работе поисковый процесс представлен четырьмя стадиями: формулировка (происходит до начала поиска); действие (начинающийся поиск); обзор результатов (результат, который пользователь видит после поиска); и усовершенствование (после обзора результатов и перед возвращением к поиску с иной формулировкой той же потребности). Более удобная нелинейная схема поиска информации состоит из следующих этапов:
- фиксация информационной потребности на естественном языке;
- выбор поисковых сервисов сети и формализация записи информационной потребности на конкретных информационно-поисковых языках (ИПЯ);
- выполнение созданных запросов;
- предварительная обработка полученных списков ссылок на документы;
- обращение по выбранным адресам за искомыми документами;
- предварительный просмотр содержимого найденных документов;
- сохранение релевантных документов для последующего изучения;
- извлечение из релевантных документов ссылок для расширения запроса;
- изучение всего массива сохраненных документов;
- если информационная потребность не полностью удовлетворена, то возврат к первому этапу.
Процесс поиска имеет чрезвычайно глубокий дидактический аспект - так, установлено что применение диалоговых информационных систем приводит к формированию у рядовых пользователей такого стиля информационно-поисковой деятельности, который обычно свойственен наиболее выдающимся ученым.
В большинстве случаев информационная потребность возникает после изучения какой-либо новой информации, полученной пользователем. Часто возникает ситуация, когда пользователь уже обладает некоторым массивом документов по искомой тематике. Предлагается использовать эти документы для автоматизированного составления поискового запроса с помощью специализированной системы управления документами (СУД) (система находится в стадии разработки).
Система должна осуществлять индексацию всех документов пользователя. В процессе индексации все слова, содержащиеся в документах, разбиваются по следующим семантическим классам: стоп-слова; наиболее частотные слова бытового (разговорного) языка; общекультурная терминология; общенаучная терминология; известные системе термины предметной области; неизвестные слова. Разбиение осуществляется на основе соответствующих словарей, которые должны быть составной частью системы. К неизвестным словам будут отнесены в первую очередь многие специальные слова предметной области. Туда же попадут новообразованные термины и слова, содержащие ошибки.
На основе индекса осуществляется построение векторного представления документов, после чего СУД производит иерархическую кластеризацию множества документов, в результате чего получается разбиение этого множества на тематические группы. В ходе диалога с пользователем происходит выбор одного или нескольких наиболее релевантных кластеров документов и задание характеристик поискового процесса.
Поисковый запрос следует строить на основе вектора центроида выбранного кластера. Оптимальный размер запроса составляет от 8-12 до 25-30 терминов. Последняя подготовительная операция, осуществляемая СУД заключается в записи запроса на ИПЯ.
1.4 Структура работы поисковых систем
Работа поискового указателя происходит в три этапа, из которых два первых являются подготовительными и незаметны для пользователя. Сначала поисковый указатель собирает информацию из World Wide Web. Для этого используют специальные программы, аналогичные браузеры. Они способны скопировать заданную Web-страницу на сервер поискового указателя. Просмотреть ее, найти все гиперссылки, которые на ней имеются и т. д. Подобные программы называют червяками, пауками, гусеницами, краулерами, спайдерами и другими подобными именами. Каждый поисковый указатель эксплуатирует для этой цели свою уникальную программу, которую нередко сам и разрабатывает. Многие современные поисковые системы родились из экспериментальных проектов, связанных с разработкой и внедрением автоматических программ, занимающихся мониторингом Сети. Теоретически, при удачном входе спайдер способен прочесать все Web-пространство за одно погружение, но на это надо очень много времени, а ему еще необходимо периодически возвращаться к ранее посещенным ресурсам, чтобы контролировать происходящие там изменения и выявлять «мертвые» ссылки, потерявшие актуальность.
После копирования разысканных Web-ресурсов на сервер поисковой системы начинается второй этап работы - индексация. В ходе индексации создаются специальные базы данных, с помощью которых можно установить, где и когда в Интернете встречалось, то или иное слово. Считайте, что индексированная база данных - это своего рода словарь. Она необходима для того, чтобы поисковая система могла очень быстро отвечать на запросы пользователей. Современные системы способны выдавать ответы за доли секунды, но если не подготовить индексы заранее, то обработка одного запроса будет продолжаться часами.
На третьем этапе происходит обработка запроса клиента и выдача ему результатов поиска в виде списка гиперссылок. Допустим, клиент хочет узнать, где в Интернете имеются Web-страницы, на которых упоминается известный голландский механик, оптик и математик Христиан Гюйгенс. Он вводит слово Гюйгенс в поле набора ключевых слов и нажимает кнопку. Найти (Search). По своим базам указателей поисковая система в доли секунды разыскивает подходящие Web-ресурсы и формирует страницу результатов поиска, на которой рекомендации представлены в виде гиперссылок. Далее клиент может пользоваться этими ссылками для перехода к интересующим его ресурсам.
Рисунок 2. Упрощенный алгоритм работы поискового робота
Все это выглядит достаточно просто (Рисунок 2), но на самом деле здесь есть проблемы. Основная проблема современного Интернета связана с изобилием Web-страниц. Достаточно ввести в поле поиска такое простое слово, как, например, футбол, и российская поисковая система выдаст несколько тысяч ссылок, сгруппировав их по 10-20 штук на отображаемой странице.
Несколько тысяч - это еще не так много, потому что зарубежная поисковая система в аналогичной ситуации выдала бы сотни тысяч ссылок. Попробуйте найти среди них нужную! Впрочем, для рядового потребителя совершенно все равно, выдадут ему тысячу результатов поиска или миллион. Как правило, клиенты просматривают не более 50 ссылок, стоящих первыми, и что там делается дальше, мало кого беспокоит. Однако клиентов очень и очень беспокоит качество самых первых ссылок. Клиенты не любят, когда в первом десятке встречаются ссылки, утратившие актуальность, их раздражает, когда подряд идут ссылки на соседние файлы одного и того же сервера. Самый же плохой вариант - когда подряд идут несколько ссылок, ведущих к одному и тому же ресурсу, но находящемуся на разных серверах.
Клиент вправе ожидать, что самыми первыми будут стоять наиболее полезные ссылки. Вот здесь и возникает проблема. Человек легко отличает полезный ресурс от бесполезного, но как объяснить это программе?! Поэтому лучшие поисковые системы проявляют чудеса искусственного интеллекта в попытке отсортировать найденные ссылки по качественности их ресурсов. И делать это они должны быстро - клиент не любит ждать.
Строго говоря, все поисковые системы черпают исходную информацию из одного и того же Web-пространства, поэтому исходные базы данных у них могут быть относительно похожи. И лишь на третьем этапе, при выдаче результатов поиска, каждая поисковая система начинает проявлять свои лучшие (или худшие) индивидуальные черты. Операция сортировки полученных результатов называется ранжированием. Каждой найденной Web-странице система присваивает какой-то рейтинг, который должен отражать качество материала. Но качество - понятие субъективное, а программе нужны объективные критерии, которые можно выразить числами, пригодными для сравнения.
Высокие рейтинги получают Web-страницы, у которых ключевое слово, использованное в, запросе, входит в заголовок. Уровень рейтинга повышается, если это слово встречается на Web-странице несколько раз, но не слишком часто. Благоприятно влияет на рейтинг вхождение нужного слова в первые 5-6 абзацев текста - они считаются самыми важными при индексации. По этой причине опытные Web-мастера избегают давать в начале своих страниц таблицы. Для поисковой системы каждая ячейка таблицы выглядит, как абзац, и потому содержательный основной текст как бы далеко отодвигается назад (хотя на экране это и не заметно) и перестает играть решающую роль для поисковой системы.
Очень хорошо, если ключевые слова, использованные в запросе, входят в альтернативный текст, сопровождающий иллюстрации. Для поисковой системы это верный признак того, что данная страница точно соответствует запросу. Еще одним признаком качества Web-страницы является тот факт, что на нее есть ссылки с каких-то других Web-страниц. Чем их больше, тем лучше. Значит, эта Web-страница популярна и обладает высоким показателем цитирования. Самые совершенные поисковые системы следят за уровнем цитирования зарегистрированных ими Web-страниц и учитывают его при ранжировании.
Создатели Web-страниц всегда заинтересованы в том, чтобы их просматривало больше людей, поэтому они специально готовят страницы так, чтобы поисковые системы давали им высокий рейтинг. Хорошая, грамотная работа Web-мастера способна значительно поднять посещаемость Web-страницы, однако есть и такие «мастера», которые пытаются обмануть поисковые системы и придать своим Web-страницам значимость, которой в них на самом деле нет. Они многократно повторяют на Web-странице какие-то слова или группы слов, а для того чтобы те не попадались на глаза читателю, либо делают их исключительно мелким шрифтом, либо применяют цвет текста, совпадающий с цветом фона. За такие «хитрости» поисковая система может и наказать Web-страницу, присвоив ей штрафной отрицательный рейтинг.
В последние годы сложилась и практика коммерческого рейтингования. Технически они оснащены самыми современными средствами, соответствующими уровню 2014 года, а общий размер Рунета (российского сектора Интернета) сегодня примерно таков, каким был западный сектор в 1998-2003 года. Поэтому сегодня в России особых проблем с поиском информации нет, и в ближайшее время они не предвидятся
Из поисковых указателей в России сегодня действуют два «кита». Это Яндекс и Google.
Исторически наиболее популярной поисковой системой в России является «Яндекс». Она начала работать раньше других, и долгое время лидировала по размеру поискового указателя и качеству услуг поиска. Самый большой указатель лежит в основе системы примерно 27 миллионов Web-страниц, но дело не только в размере. Это не просто указатель на ресурсы, а указатель на самые актуальные ресурсы. По уровню актуальности «Яндекс» сегодня - безусловный лидер
Система «Google» Появилась в России немногим позже чем «Яндекс». Она не стремится к созданию самого большого указателя автоматическими средствами, а вместо этого широко использует информацию из каталога @Com, проходящую ручную обработку. Поэтому система выдает не так много результатов, как ее ближайшие конкуренты, но зато эти результаты, как правило, точны и наглядно представлены.
поисковый информационный яндекс google
1.5 Поисковая система «Яндекс»
Рисунок 3. Логотип компании
«Яндекс» - российская ИТ-компания, владеющая одноимённой системой поиска в Сети и интернет-порталом. Поисковая система «Яндекс» является четвёртой среди поисковых систем мира по количеству обработанных поисковых запросов (свыше 6,3 млрд. в месяц на начало 2014 года). По состоянию на 5 июля 2015 года, согласно рейтингу Alexa.com, сайт Яндекс.ru по популярности занимает 19-е место в мире и первое место в России.
Поисковая система Яндекс.ru была официально анонсирована 23 сентября 1997 года, и первое время развивалась в рамках компании CompTek International. Как отдельная компания «Яндекс» образовалась в 2000 году. В мае 2011 года Яндекс провёл первичное размещение акций, заработав на этом больше, чем какая-либо из Интернет-компаний со времён IPO поисковика Google в 2004 году.
Приоритетным направлением компании является разработка поискового механизма, но за годы работы «Яндекс» стал мультипорталом. В 2013 году «Яндекс» предоставляет более 50 сервисов. Некоторые из них - Яндекс.Поиск, Яндекс.Карты, Яндекс.Маркет, Поиск по блогам, Яндекс.Пробки - доминируют на рынке.
1.6 Поиск Яндекс
Рисунок 4. Поиск Яндекс
Поиск Яндекса позволяет искать документы на русском, татарском, украинском, белорусском, казахском, турецком, английском, немецком и французском языках с учётом морфологии этих языков и близости слов в предложении.
Охват форматов.
Помимо веб-страниц в формате HTML, Яндекс индексирует документы в форматах PDF (Adobe Acrobat), Rich Text Format (RTF), двоичных форматах Word (.doc), Excel(.xls), PowerPoint (.ppt), RSS (блоги и форумы).
Язык поисковых запросов
Отличительная особенность Яндекса - возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов. Так, например, для операции исключения можно указать область действия: запрос A ~~ B найдёт документы (страницы), в которых присутствует А, но не присутствует В, а запрос А ~ Б - документы, где слово Б не присутствует со словом А в одном предложении. Аналогично, оператор & ищет сочетания ключевых слов в предложении, а && - во всём документе.
Оператор ! позволяет отключить морфологию для конкретного слова. Если одна или несколько форм слова совпадает с другими словами, поиск может находить лишние страницы. Указав нормальную форму слова с помощью оператора !!, можно убрать многие из ненужных страниц.
Качество поиска.
Время от времени алгоритмы Яндекса, отвечающие за релевантность выдачи, меняются, что приводит к изменениям в результатах поисковых запросов. Такие изменения, официально объявленные, происходили, например, в марте 2004 год, августе 2005 год и январе 2007 год; по неофициальным сведениям, их значительно больше (например, в августе-сентябре 2007 года). Крупное изменение произошло в ноябре 2009 года, когда была выложена обновлённая версия поисковой программы «Снежинск». Последнее подобное изменение произошло в декабре 2010-го, когда Яндекс внедрил новую поисковую технологию «Спектр» (версия «Краснодар»). Она позволяет учитывать потребности пользователей, которые не были явно сформулированы в запросе. Например, по запросу [бетховен] пользователям покажут результаты и про биографию композитора, и его произведения, и фильм «Бетховен». В декабре 2012 года Яндекс представил новую поисковую платформу «Калининград», которая осуществляет персональный поиск с учётом личных интересов пользователя.
Сайты, которые «Яндекс» не индексирует или ограничивает ранжирование:
- копирующие или переписывающие информацию с других ресурсов и не создающие оригинального контента;
- единственной целью которых является перенаправление пользователя на другой ресурс, автоматически (редирект) или добровольно;
- с автоматически сгенерированным (бессмысленным) текстом;
- с каталогами (статей, программ, предприятий и т. п.), если они являются только агрегаторами контента, не создают тексты и описания самостоятельно и не предоставляют никакого уникального сервиса;
- с невидимым или слабовидимым текстом или ссылками;
- отдающие разный контент пользователям и роботам поисковых систем (клоакинг);
- предоставляющие товары или информацию по партнёрским программам, но не представляющие никакой ценности для пользователя;
- использующие обманные техники (например, вредоносный код, скрипты, настройки серверов), перенаправляющие пользователей на сторонние ресурсы или меняющие окно результатов поиска на страницы других ресурсов при переходе из поисковых систем;
- содержащие списки поисковых запросов (многократное повторение и перечисление ключевых слов), предназначенные исключительно для обмана поисковой системы и манипулирования результатами её работы, в том числе использование элементов страниц, скрывающих ключевые слова, например, посредством скроллинга или других технических приёмов;
- группы сайтов одного владельца/компании, предоставляющие пользователю одни и те же товары или услуги, созданные с целью заполнения нескольких позиций в результатах поиска и сбора трафика;
- немодерируемые форумы, доски объявлений, содержащие большое количество ссылочного спама;
- ставящие внешние ссылки исключительно для обмана поисковых систем и «накачивания» релевантности и не являющиеся рекомендацией автора посетить ресурс;
- сайты или группы сайтов, интенсивно ссылающиеся друг на друга (линкфармы);
- страницы сайта с результатами поиска;
- с 2009 года на качество поиска также влияет фильтр АГС.
Сервисы «Яндекс»
Рисунок 5. Сервисы Яндекс
Помимо поисковых услуг, Яндекс предлагает ряд служб и инструментов для различных нужд пользователей (рисунок 5).
Большинство из них -- веб-приложения, требующие от пользователя только наличия браузера, в котором они работают, и интернет-подключения. Это позволяет использовать данные в любой точке планеты и не быть привязанным к одному компьютеру. Некоторые из служб нуждаются в установке дополнительных программ (проигрывателя «флэш»-графики иликлиента для мгновенных сообщений), кроме того, для комфортной работы необходимо высокоскоростное подключение (от 512 КБ/с для Яндекс.Видео, от 256 КБ/с для Яндекс.Карт).
Преимущества служб и инструментов «Яндекса» -- наличие централизованного хранилища данных и продуманный интерфейс.
Целый ряд служб -- Яндекс.Поиск, Яндекс.Карты, Яндекс.Маркет, Поиск по блогам, Народ.ру, Яндекс.Пробки -- лидируют на рынке. Одними из крупнейших в своих областях являются Яндекс.Деньги, Почта Яндекса, Яндекс.Новости.
1.7 Поисковая система Google
Рисунок 6. Логотип компании
Google - крупнейшая поисковая система интернета, принадлежащая корпорации Google Inc.
Первая по популярности система (77,05 %), обрабатывает 41 млрд. 345 млн запросов в месяц (доля рынка 62,4 %), индексирует более 25 миллиардов веб-страниц на закрытой конференции в начале мая 2014 представитель Google упомянул, что на данный момент проиндексировано 60 триллионов документов, и как можно заметить, в результате тестов, счетчик в поиске Google ограничен числом 25 270 000 000, также на это число при выдаче влияют фильтры, встроенные в алгоритм ранжирования выдачи).
Поисковая система Google была создана в качестве учебного проекта студентов Стэнфордского университета Ларри Пейджа и Сергея Брина. Они в 1996 году работали над поисковой системой BackRub, а в 1998 году на её основе создали новую поисковую систему Google. С первого же года существования в Google стали применять метод прозрачного управления OKR, который определил подход к планированию развития компании и способ корпоративного управления.
Хотя корпорация была основана 2 сентября 1998 года, а домен Google.com зарегистрирован 15 сентября 1997 года, поисковик (с 2000 года) иногда отмечает свой день рождения и в другой день: как 7, так и 27 сентября.
Слово Google произошло от искажённого googol (гугол) - названия числа десять в сотой степени (10100)
1.8 Поиск Google
Рисунок 7. Google поиск
Синтаксис запросов.
Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и так далее. Например, поиск «intitle:Google site:wikipedia.org» выведет все статьи Википедии на всех языках, в заголовке которых встречается слово Google.
Мощный язык запросов в руках хакеров может быть использован для исследования веб-сайтов на уязвимости.
Поиск в найденном.
Для результатов поиска Google ранее предоставлял возможность повторного поиска, что позволяло производить поиск более детально. Для более детального поиска пользователям необходимо было указывать дополнительные параметры, по которым происходил отбор результатов, что позволяло сразу отобразить не только запрос, но и контекст, где он применяется. Данная возможность упрощала процедуру поиска, исключив необходимость в открытии каждого результата.
Википоиск.
Поисковая технология, позволяющая пользователю настраивать результаты выдачи по поисковым запросам. Пользователь может удалять результаты из списка и поднимать вверх списка. Технология была запущена компанией Google весной 2009 года и проработала до осени. В настройках поиска осталась настройка для включения «википоиска», но в выдаче соответствующие элементы управления отсутствуют. Другие поисковые системы подобной функциональности пока не предоставляли.
Голосовой поиск.
Рисунок 8. Голосовой поиск
22 сентября 2010 года компания запустила голосовой поиск в России. Чтобы осуществить поиск, необходимо нажать в телефоне кнопку рядом со строкой поиска и произнести свой запрос, телефон отправит ваш голос на сервер, и браузер выдаст строку с распознанным вашим запросом и результатами поиска по нему. С 2014 года доступна активация голосового поиска без прикосновения к экрану. На телефонах с установленным Android не ниже версии 4.3 достаточно сказать «окей, Гугл», чтобы активировать функцию.
Индексация сайтов.
Поисковый робот Google имеет User Agent - Googlebot (Поисковый робот), который является основным роботом, сканирующим содержание страницы для поискового индекса. Помимо него существуют ещё несколько специализированных роботов:
- Googlebot-Mobile - робот, индексирующий сайты для мобильных устройств,
- Google Search Appliance (Google) gsa-crawler[15] - поисковый робот нового аппаратно-программного комплекса Search Appliance,
- Googlebot-Image - робот, сканирующий страницы для индекса картинок,
- Mediapartners-Google - робот, сканирующий контент страницы для определения содержания AdSense,
- Adsbot-Google - робот, сканирующий контент для оценки качества целевых страниц AdWords.
Поддерживает поиск в документах форматов PDF, RTF, PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint и других.
Сервисы «Google»
Рисунок 9. Сервисы Google
Кроме обычного поиска, Google предлагает ряд сервисов и инструментов для различных нужд.
Большинство из них - веб-приложения, требующие от пользователя только наличия браузера, в котором они работают, и интернет-подключения. Это позволяет использовать данные в любой точке планеты и не быть привязанным к одному компьютеру. Некоторые из сервисов нуждаются в установке дополнительных программ (проигрывателя Flash-графики или клиента для мгновенных сообщений), кроме того, для комфортной работы необходимо высокоскоростное подключение (от 512 КБ/с для Google Video, от 256 КБ/с для Google Earth).
Преимущества сервисов и инструментов Google - наличие централизованного хранилища данных и продуманный интерфейс. Вот некоторые из них:
- «Вопросы и ответы» (ранее Google Answers) - сервис для коллективного получения ответов на возникающие вопросы. Доступен только для чтения с 23 июня 2014.
- Google Alerts - отправление на почту результатов поиска с заданной периодичностью.
- Google Analytics - бесплатный сервис, предоставляющий детальную статистику по трафику веб-сайта.
- Google App Engine - платформа для создания и хостинга масштабируемых веб-приложений на серверах компании Google.
- Google Cloud Print - технология, с помощью которой принтер подключается к интернету, что позволяет ряду пользователей распечатывать документы удаленно.
- Google Correlate - сервис позволяет узнать, какие запросы часто делают вместе с заданным.
- Google Custom Search - позволяет веб-разработчикам интегрировать поиск Google в их веб-приложения.
- Сейчас заменен на Google Drive.
- Google Drive - облачное хранилище от Google с возможностью онлайн (в браузере) просмотра содержимого множества типов файлов ( в том числе и файлов фотошопа). Документы также можно редактировать и создавать как в Google Docs. Предлагается 15 Гб свободного места.
- Google Public Data Explorer - публичные данные и прогнозы от ряда международных организаций и научных учреждений.
- Google Webmasters - инструменты для вебмастеров.
- YouTube - видеохостинг.
- Google+ - Социальная сеть.
- Google Building Maker - создание трехмерных (3D) моделей.
Глава 2. Аналитическая часть. Сравнение поисковых машин «Яндекс» и «Google»
2.1 Сравнение «Яндекс» и «Google» в период с 2012-2014 годов
(2012 год)
Поисковые системы призваны давать ответ пользователю на анализа сайтов. Они не стоят на месте, постоянно совершенствую поисковый алгоритм так, чтобы ответ на запрос пользователя был наиболее полным, точным, актуальным. Также поисковики Яндекс и Гугл дополняют поисковую выдачу разными полезными сервисами типа карт, конвертеров и т.п. что сводит поисковой процесс к минимуму.
Обновления в Яндекс 2012 -- ввод персонального поиска, с декабря кооперация со Сбербанком -- улучшение работы в Яндекс.Деньгах, запуск Яндекс. Браузера, открытие Яндекс.диска для всех пользователей, запуск выдачи цифр и фактов в поисковых подсказках, смена алгоритма выдачи свежеопубликованной информации, ввод индексации контента социальных сетей.
Google 2012 после Панд-2011, выход алгоритма Пингвин. Персонализация и локализация поиска, синхронизация с профилями в соц. сетях (в первую очередь Гугл+). Понижение в выдаче доменов с прямым вхождением ключа, понижение в выдаче сайтов с избыточной рекламой. Изменение в оформлении страницы выдачи -- появление “базы знаний”.
( 2013 год)
Яндекс
На вопрос «Кто лучше, Google или Яндекс?» однозначного ответа нет. Последнее слово конечно за пользователем.
Так в 2013 году Яндекс продолжил развивать тему персонализации и социального поиска. В мае поисковик представил новую платформу Дублин. На ее базе был запущен новый персональный поиск, который учитывает сиюминутные запросы пользователя, возникающие и гаснущие в течение дня.
Другое важное событие, произошедшее в мае - анонсирование совершенно новой платформы Острова. Главным ее отличием будет возможность не только быстро находить ответы, но и решать задачи/совершать транзакции прямо на странице поисковой выдачи с помощью интерактивной формы в сниппете сайта.
Осенью Яндекс анонсировал новую технологическую платформу «Атом», позволяющую сайтам адаптироваться под интересы каждого конкретного пользователя. С ее помощью вебмастера смогут создавать сервисы, которые будут предлагать посетителю информацию, отвечающую именно его запросам и желаниям.
Что касается алгоритмических обновлений, то в ноябре многие сайты пострадали от запуска АГС-40, направленного на ограничение присутствия в выдаче некачественных сайтов, ориентированных в первую очередь на продажу ссылок.
Google.
Что касается Google то он продолжал борьбу со ссылочным спамом. Новая волна мер была направлена не только против отдельных сайтов покупающих и продающих ссылки. Google объявил войну ссылочным биржам. Многие сайты, закупающие ссылки на крупных биржах, в том числе популярных российских, потеряли свои позиции, либо вообще были заблокированы.
Более того, Google призвал вебмастеров жаловаться на спамные сайты, которые Пингвин случайно пропустил в выдачу, создав для этого специальную форму.
Мэтт Каттс, бессменный инженер Google по борьбе с поисковым спамом, неустанно призывал вебмастеров отказываться от «плохих ссылок», а также делился планами и результатами проделанной компанией работы в отношении борьбы с платными ссылками, биржами ссылок и сайтами с низкокачественным контентом.
Анонсы апдейтов Google Panda до версии 24 (22 января 2013 года) и до 25 версии (15 марта 2013 года) стали заключительными в привычном понимании. Google окончательно интегрировал алгоритм Панда (предназначенный для борьбы с низкокачественным контентом) в общий алгоритм ранжирования.
23 мая Google запустил обещанное значительное обновление алгоритма Penguin 2.0, который затронул 2,3% запросов на разных языках. Причем действует Пингвин для разных языков по-разному - чем больше спама, тем сильнее алгоритм повлияет на выдачу.
В начале июня Google запустил новый алгоритм, направленный против «спамных запросов», PayDay Loan. Это принципиально новая система анализа ссылок нацелена на удаление из выдачи заспамленных результатов по таким запросам, как [кредитование], [краткосрочные займы], [порно] и т.д.
В сентябре Google продолжил расширять свой «зоопарк». 27 сентября поисковик представил новый алгоритм Hummingbird (Колибри), главные характеристики которого - быстрота и точность. Hummingbird пришел на смену основного алгоритма Google Caffeine и затрагивает 90% запросов. Алгоритм направлен на работу со сложными запросами - он учится воспринимать вопросы не как отдельные слова, а как единую фразу, и отвечать на них соответствующим образом.
4 октября вебмастеров ждало новое обновление алгоритма Пингвин версии 2.1, который направлен на агрессивное понижение сайтов, качество которых не соответствует предъявляемым требованиям Google к ресурсам.
А в ноябре у Google появилась новая санкция под названием «Несоответствие изображения» (Image Mismatch). Ручное наказание накладывается на сайт, если картинка с него не соответствует тому, что индексирует Google и отображает в результатах поиска.
Что касается изменений в ранжировании мобильных сайтов, то Google объявил, что будет понижать в мобильной выдаче сайты с низкой скоростью загрузки.
(2014 год).
Google 2014 -- С вероятностью около 90% можно утверждать, что у поисковика изменится формат контекстной рекламы. Реклама может практически слиться с органическим поиском. Она больше не будет выделяться специальным сероватым фоном, вместо этого появится особый значок рядом с каждым объявлением. Дополнительно в Гугл планируется изменить отображение сайтов в топе. Лидер поисковой выдачи будет выглядеть иначе, чем другие ресурсы.
Такой сайт в будущем, возможно, будет отображаться более подробно. Под основной ссылкой появится несколько быстроссылок в таблице. В мобильном поиске такие ссылки будут располагаться в столбик. Кстати, на поисковик в наибольшей мере повлияет именно мобильный трафик. Ведь сегодня пользователи заходят на сайты через смартфоны в 70% случаев. А в 2014 году число таких людей может дойти до 90%. Поэтому в Гугл обязательно будут проводить тестирование новый программы для мобильного трафика.
В следующем году в Гугл продолжится работа над Графом Знаний. Сейчас эта система пока что проработана плохо, в ней не так много информации. Но со временем Граф Знаний может стать универсальной энциклопедией. Ранее уже говорилось, что в поисковике появятся большие объявления. Их появление может вызвать перемены в интерфейсе поисковой системы. Количество ссылок в органическом поиске уменьшится. На первой странице расположатся только лучшие результаты. Также Гугл перестанет отображать количество найденных ответов. Рекламных объявлений станет больше.
Яндекс 2014 - Предстоящее изменение алгоритмов «Яндекса» перестанет рассматривать внешние ссылки как фактор для ранжирования сайтов в поисковой выдаче.
Согласно обещанию Руководитель отдела веб-поиска «Яндекса» , в начале 2014 г. в результате запуска нового алгоритма «Яндекс» прекратит учитывать в ранжировании поисковой выдачи внешние ссылки.
Изменение коснется только коммерческих запросов и поначалу будет реализовано только в Москве и Московской области, хотя со временем распространится и на остальные регионы страны.
Информационные запросы, результатом которых становится поиск СМИ и блогов, отмена учета внешних ссылок не коснется.
Абсолютное большинство поисковых машин, включая Google и «Яндекс», при назначении сайтам позиции в своей поисковой выдаче (то есть при ранжировании) до сих пор принимало во внимание имеющиеся в Сети внешние ссылки на эти сайты.
Поэтому недорогая технология искусственной простановки внешних ссылок на заинтересованные в продвижении ресурсы стала одним из важнейших и популярнейших инструментов поисковой оптимизации (SEO, Search Engine Optimization).
Заявление Александра Садовского успело поляризовать блогосферу на два лагеря: резко критикующих идею «Яндекса» исключить внешние ссылки из факторов ранжирования и активно приветствующих этот шаг.
Главный аргумент критиков состоит в том, что отныне малобюджетным проектам и разработчикам-одиночкам (фрилансерам) будет трудно улучшить свое положение в поисковой выдаче «Яндекса».
Сторонники нововведения подчеркивают два его главных плюса: скорое уменьшение числа «мусорных ссылок» в Сети и укрепление рыночных позиций квалифицированных и дорогих оптимизаторов.
Три крупных и известных SEO-компании, к которым обратился CNews, отказались по горячим следам комментировать заявление Садовского, заявив, что изучают ситуацию.
Сам глава отдела веб-поиска «Яндекса» рассказал CNews, что «ссылочная реформа» началась, когда коммерческие ссылки утратили свое значение «как сигнал для определения релевантности».
Из примерно 800 используемых в алгоритме «Яндекса» факторов ранжирования , по словам Александра Садовского, лишь около 50 основано на внешних ссылках.
Для выявления наиболее релевантных ответов на запрос пользователя, «Яндекс» пробует извлекать сигнал из каждого вида данных, однако, «когда источник данных сильно зашумлен из-за постоянного спама, сигнал теряется, и данные становятся бесполезны», говорит Садовский. «Яндекс» уже проводил эксперимент по отказу от их учета и нашел, что «качество поиска осталось по-прежнему высоким».
Глава поиска «Яндекса» признает, что реакция в соцсетях и блогах на нововведение оказалась «бурной и неоднозначной», однако, замечает, что так бывает при любых изменениях в ранжировании.
Садовский дает понять, что у SEO-сообщества были все шансы подготовиться к отказу «Яндекса» от учета ссылок. По его словам, эта тенденция была очевидна, а вес ссылок в ранжировании постоянно снижался: «Мы говорили об этом на конференциях, в интервью на протяжении последних трех лет. Речь идет просто о закономерном постепенном схлопывании неэффективного для продвижения в «Яндексе» инструмента, которое, наконец, все заметили».
В долгосрочной перспективе, по мнению Садовского, «ссылочная реформа» переориентирует рынок с «махровой оптимизации» в сторону интернет-маркетинга: оказанию услуг по улучшению юзабилити, повышению конверсии посетителей в покупателей и т.д.
После публикации этого материала одна из крупнейших российских SEO-компаний SeoPult обнародовала заявление, где выразила уверенность, «что качественные сайты, которые продвигаются комплексно, не потеряют своих позиций и трафика из поисковой системы «Яндекс» после внедрения нового алгоритма, а ссылочное ранжирование будет продолжать учитываться для абсолютного большинства запросов».
Как мы видим, алгоритмы поисковых систем не стоят на месте, более того изменения алгоритмов постоянно “подталкивает” нас к мысли об использовании контекстной рекламы как одного из источников целевого трафика.
2.2 Основные отличия
Отличительная особенность Яндекс - интуитивный поиск во всех словоформах. Уникальная разработка под особенности русского языка.
Отличие - в широте охвата. Яндекс - поисковик чисто рунетовский, в то время как Гугл интересуется всей информацией, которая имеется в интернете, независимо от зоны. Соответственно, его база гораздо объемнее и шансов найти нужный материал больше.
Обе поисковые системы очень негативно относятся к не уникальности информации сайта. Но Яндекс относится к плагиату намного жестче. Так, если сайт с не уникальным контентом может находиться в индексе Google, то в Яндексе его может не быть.
Говоря о статистике Яндекс -- это главный конкурент Google в СНГ. Например, согласно ресурсу http://www.liveinternet.ru, в январе 2013 года в России Яндексом пользовались 51,6% интернет-пользователей. Доля Google в статистике скромнее -- 34,9%. Многие объясняют это тем, что Яндекс даёт русским пользователям более релевантную для них поисковую выдачу благодаря хитроумному поисковому алгоритму.
2.3 Преимущества и недостатки
«Яндекс».
Преимущества:
- постоянное развитие системы;
- качество выдачи растет, все больше удобных сервисов предлагает компания: каталог, карты, новости, прогноз погоды, почта;
- глубокий морфологический анализ обрабатываемых терминов;
- обладает хорошим механизмом распознавания одного документа в нескольких кодировках или на зеркальных серверах;
- оригинально сконструированный механизм выдачи результатов;
- огромная индексная база.
Недостатки:
- разница в выдаче при наборе слова с большой (маленькой) буквы (иногда выдача меняется, иногда нет);
- частое выпадение секторов поисковой базы - когда исчезают части сайтов из выдачи и восстанавливаются через 2-5 дней;
- обновление индексов поисковой базы происходит недостаточно часто и регулярно;
«Google»
Преимущества:
- очень мощная поисковая система, которая находится в постоянном развитии;
- база индексов этой системы обновляется раз в два дня, качество выдачи очень высокое, найти необходимый документ или информацию довольно легко;
- система ориентирована в основном на ссылки, причем учитываются как входящие, так и исходящие ссылки с ресурса;
- способна выдавать результаты на запросы по семантике языка программирования (исходный код поиска).
Недостатки:
- нередко встречаются ссылки на сайты с уже устаревшей информацией;
- случается, что ссылки, которые находятся в результатах поиска, ведут на сайт, находящийся в стадии разработки.
- на запрос «фильм» и «фильмы» результаты поиска будут отличаться;
- отсутствие возможности указать конкретную грамматическую форму слова, либо ударение также значительно усложняет процесс поиска информации.
2.4 Сравнительный анализ работы поисковых систем
Задачи:
- сформулировать тему поиска;
- создать поисковый запрос (одинаковый для всех поисковых систем);
- результаты поиска (количество ссылок) поместил в таблицу;
- проанализировала10 первых найденных ссылок на предмет релевантности;
- сделал вывод о качестве поиска каждой поисковой системой и поставил оценки по пятибалльной шкале.
Все результаты полученные в результате данного анализа будут записаны в (таблицу 1).
Таблица 1. Анализ работы поисковой системы
Название |
Яндекс |
|
|
Содержание запроса |
Статистика поисковых запросов Яндекса, Google. |
Статистика поисковых запросов Яндекса, Google. |
|
Результаты поиска |
2мл ссылок |
445 000 ссылок |
|
Релевантная ссылка |
По данному запросу нужная мне ссылка была 2-й на первой странице |
По данному запросу нужная мне ссылка была 7-й на первой странице |
|
Оценка |
5 |
4 |
Рисунок 10. Использование поисковых машин
Вывод: Яндекс лучше приспособлен к запросам на русском языке, но выдает много ссылок, что влияет на скорость обработки запроса. С большой скоростью обмена данными это практически не заметно, но с низкой запрос будет обрабатываться значительно дольше. Гугл же напротив выдал меньше кол-во ссылок, показав результаты поиска быстрее, чем Яндекс, хотя и нужная ссылка попалась мне немногим позже.
Заключение
Мы, в нашем современном мире не можем представить жизни без Интернета, с его помощью мы покупаем разнообразные товары, знакомимся, общаемся, работаем, слушаем музыку, смотрим фильмы и так далее. Возможности Всемирной Паутины безграничны, надежными помощниками в виртуальных лабиринтах выступают поисковые системы. Нет ничего проще, чем написать в строке поисковика нужный запрос, и поисковая система выдаст огромное количество предложений по внесенным словам или фразе. Еще совсем недавно о подобном даже не мечтали.
В данной курсовой работе было рассказано вам об информационных системах в целом, а также выделил 2 наиболее нужные и популярные. Это «Яндекс» и «Google». Также провел их сравнительный анализ. Обе системы высокотехнологичны и продвинуты. Они отвечают всем требованиям современного общества. Они помогут найти дорогу, если вы заблудились в городе. Если вдруг станет скучно, помогут найти интересное видео либо фильм, помогут при покупке товаров и заказов услуг.
Список используемых источников
1. Денис Кустов, Илья Панфилов и Евгений Сопов «Модели и алгоритмы адаптивного поиска информации» 2014год.
2. А.Я. Смирнова Построение автоматизированных фактографических информационно-поисковых систем 2012год.
3. Анатолий Кулик Информационные сети и языковая совместимость дескрипторных информационно-поисковых систем 2015год.
4. Ф. У. Ланкастер Информационно-поисковые системы: характеристики, испытание и оценка 2013год.
5. Г. Куликов, Г. Старцев, А. Бармин, О. Бармина Методика интеграции информационно-поисковых и корпоративных информационных систем на основе системных моделей бизнес-процессов 2014год.
6. Джесси Рассел Поисковая система 2015год.
7. Игорь Карцан Многоагентная система для поиска и обработки информации 2012год.
Размещено на Allbest.ru
...Подобные документы
Анализ возможностей поисковых систем Яндекс и Google, их сравнение с точки зрения полезности. История создания поисковых систем, характеристика их интерфейса, поисковых инструментов и алгоритмов. Формирование вопроса и критерий к ответу на него.
реферат [30,0 K], добавлен 07.05.2011Рассмотрение поисковых систем интернета как программно-аппаратного комплекса с веб-интерфейсом, предоставляющего возможность поиска информации. Виды поисковых систем: Archie, Wandex, Aliweb, WebCrawler, AltaVista, Yahoo!, Google, Яндекс, Bing и Rambler.
реферат [24,3 K], добавлен 10.05.2013Понятие, структура и классификация информационных систем. Информационно поисковые системы. Исторические предпосылки развития поисковых систем. Понятие поисковых систем. Особенности поисковых систем: структура сети, структура работы поисковых систем.
курсовая работа [81,9 K], добавлен 28.03.2005История развития поисковых систем, особенности механизма поиска. Сравнительный обзор справочно-поисковых систем Интернета. Понятие поисковых роботов. Наиболее популярные поисковики для русскоязычного пользователя. Перспективы развития поисковых систем.
реферат [64,0 K], добавлен 20.12.2012Обеспечение высокой релевантности поиска с помощью поисковой системы Google. Быстрота и надежность работы, большее количество ссылок в русскоязычном секторе Интернета. Службы, отсутствующие у других поисковых систем. Google как законодатель моды.
презентация [1,5 M], добавлен 10.03.2015Краткая история развития поисковых систем. Обзор мировых и российских поисковых систем: Google, Yahoo, Baidu, Yandex, Rambler, Апорт, Mail.ru. Текстовый процессор Microsoft Word. Табличный редактор Excel. Организация рабочего места оператора ЭВМ.
курсовая работа [66,3 K], добавлен 20.12.2008Основные принципы построения информационно-поисковых систем. Архитектура современных информационно-поисковых систем WWW. Принцип работы поисковых систем. Процесс поиска, информационный язык, перевод, дескриптор, критерий соответствия, индексирование.
курсовая работа [70,2 K], добавлен 10.06.2014Поисковые системы. Описание и сравнение сервисов поисковых систем, предоставляемых пользователям. Сравнительный анализ интерфейсов. Риски использования поисковых систем. Блокировка вирусных сайтов. Загруженность главной страницы новостями и рекламой.
презентация [198,3 K], добавлен 17.01.2014Структура справочно-поисковых систем сети Интернет, работа механизмов поиска. Сравнительный обзор справочно-поисковых систем (Gopher, WAIS, WWW, AltaVista, Yahoo, OpenText, Infoseek). Поисковые роботы, наиболее популярные справочно-поисковые системы.
реферат [28,4 K], добавлен 14.01.2010Идеи по использованию сервисов поисковой системы Google для совместной работы с учащимися в блоге "Учимся с Google". Организация коллективной деятельности с помощью сервисов Google. Характеристика функций основных сервисов, их достоинства и недостатки.
реферат [24,5 K], добавлен 27.11.2012История поисковых систем. Классификация информационных систем по степени автоматизации. Три основных способа поиска информации в Интернете. Отличие поисковых систем от каталогов. Назначение и типы информационных систем государственных учреждений.
курсовая работа [368,5 K], добавлен 13.05.2015Организация хранения данных. Система управления базами данных. Поиск информации, обзор существующих поисковых систем. Особенности работы поискового движка. Использование индексов в поисковых системах. Особенности поиска различных видов информации.
курсовая работа [4,6 M], добавлен 14.05.2014Хранение данных в сети Internet. Гипертекстовые документы, виды файлов. Графические файлы, их виды и особенности. Поисковые системы и правила поиска информации. Обзор поисковых систем сети Internet. Все о поисковых системах Yandex, Google, Rambler.
курсовая работа [918,3 K], добавлен 26.03.2011Структура и принципы построения сети Интернет, поиск и сохранение информации в ней. История появления и классификация информационно-поисковых систем. Принцип работы и характеристики поисковых систем Google, Yandex, Rambler, Yahoo. Поиск по адресам URL.
курсовая работа [3,6 M], добавлен 29.03.2013Понятие информационно-поисковых систем. История возникновения сети Internet. Основные алгоритмы работы современных словарных информационно-поисковых систем. Быстрый поиск в базе данных и быстрое реагирование системы. Ранжирование результатов поиска.
курсовая работа [101,1 K], добавлен 01.06.2012Изучение классификации поисковых средств по В.В. Дудихину. Поиск информации с помощью поисковых ресурсов. Формирование запросов. Использование ключевых слов. Индексация документов, размещенных на различных серверах. Зарубежные лидеры поисковых систем.
презентация [775,3 K], добавлен 10.03.2015Определение программного и математического обеспечения ИС. Виды запросов к базам данных в СУБД. Поисковые системы Интернет. Описание принципа работы поисковых систем Яндекс, Рамблер, Апорт. Особенности пересылки файлов средствами электронной почты.
контрольная работа [271,7 K], добавлен 22.11.2009Разнообразие сервисов и инструментов от компании Google - крупнейшей поисковой системы сети Internet: Web-интерфейс почтовой службы Gmail, картографический сервис Google Maps, универсальность переводчика Google Translate, видеохостинг от YouTube.
доклад [15,9 K], добавлен 21.05.2012Понятие и классификация поисковых систем, история их развития и структурные элементы. Характеристика существующих моделей поиска, анализ его качества. Особенности обработки запроса поисковой системой, подготовки базы данных и процесса выдачи результатов.
курсовая работа [2,6 M], добавлен 15.04.2014Понятие информационно-поисковых систем, их сущность и особенности, история возникновения и развития, роль на современном этапе. Внутреннее устройство и элементы поисковой системы. Принцип работы поисковой машины Рамблер, прядок обработки запроса.
научная работа [222,0 K], добавлен 29.01.2009