Сущность метапоисковых систем
Понятие и основные задачи метапоисковых систем. Особенность расширения возможностей поиска с помощью данной программы. Анализ интегрированных и объединенных результатов поисковой информации. Проблема унификации критериев вычисления релевантности.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | реферат |
Язык | русский |
Дата добавления | 22.03.2015 |
Размер файла | 16,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
МИНОБРНАУКИ РОССИИ
федеральное государственное бюджетное образовательное учреждение высшего образования
«Санкт-Петербургский государственный экономический университет»
Факультет «Экономика и управление предприятиями сервиса»
Кафедра «Бухгалтерский учет и аудит»
РЕФЕРАТ
по дисциплине «Информационные технологии»
на тему «Метапоисковые системы»
Санкт-Петербург - 2014 г
Введение
Во Всемирной Сети, содержится постоянно растущий огромный объем динамически изменяющейся информации, для того, чтобы как-то упорядочить этот непрерывный поток данных, были созданы поисковые системы (ПС). К сожалению, пока ни одна из подобных систем не может в одиночку охватить все бесконечные ресурсы интернета, тем более даже алгоритмы поиска в уже проиндексированных документах у различных ПС существенно различаются. Для решения данной проблемы и расширения возможностей поиска за счет агрегирования результатов поиска лучших ПС были созданы системы, названные метапоисковыми.
Метапоисковая система - это поисковый инструмент, посылающий ваш запрос одновременно на несколько поисковых систем, каталогов и иногда, в так называемую невидимую (скрытую) паутину - собрание онлайновой информации, не проиндексированной традиционными поисковыми системами. Собрав результаты, метапоисковая система удаляет дублированные ссылки и, в соответствии со своим алгоритмом, объединяет/ранжирует результаты в общем списке.
Каждая поисковая система имеет только свое собственное, ограниченное ее ресурсами, множество документов, которые доступны для поиска. Ни одна из подобных систем не сможет охватить всех ресурсов Интернета, поэтому в любой момент может возникнуть ситуация, когда информационные потребности пользователя не смогут быть удовлетворены. Как правило, в этом случае пользователь пытается воспользоваться другой поисковой системой, третьей, четвертой и т. д.
Для решения данной проблемы и расширения возможностей поиска, были созданы системы, называемые метапоисковыми (metasearch engines). Они не имеют собственных поисковых баз данных, не содержат никаких индексов и при поиске используют ресурсы других поисковых систем. За счет этого вероятность нахождения нужной информации возрастает.
При проектировании метапоисковой системы необходимо решить ряд проблем. метапоисковый программа интегрированный информация
Во-первых, к каким ИПС будет переадресовываться запрос пользователя? Этот список может быть фиксирован жестко или же право выбора нужных систем из списка может быть предоставлено пользователю. Такой подход позволяет уменьшить используемые вычислительные ресурсы метапоискового сервера, не перегружая его слишком большим объемом ненужной информации. В любой системе метапоиска наиболее узким местом в основном является пропускная способность канала передачи данных, так как обработка страниц с результатами поиска, полученными от нескольких десятков поисковых серверов не является слишком трудоемкой операцией, потому что затраты времени на обработку информации на порядки меньше времени прихода страниц, запрошенных у разных поисковых серверов. Как примеры систем, имеющих подобную организацию, можно назвать Internet Sleuth, Profusion, Ixquick, SawySearch, MetaPing38. Также проектируются ИПС с возможностью автоматического выбора тех поисковых систем, в которых следует проводить поиск.
В некоторых метапоисковых системах существует возможность выбора категории интересующей информации с последующим выбором поисковых систем по заданной категории. Иными словами, система помогает отыскать лучшие по профилю поисковые системы. Этот режим позволяет избежать неудачных попыток обращения к тем системам, которые не располагают полезными сведениями.
Следует упомянуть, что существуют особо «дружелюбные» пользователю метапоисковые системы, которые сами предлагают поисковый HTML-код, который можно скопировать и вставить на свою веб-страницу для выполнения метапоиска прямо с нее.
Во-вторых, в каком виде будут предоставляться результаты поиска? Здесь различают два основных типа систем: синтегрированными результатами поиска и с объединенными результатами. В первом случае пользователь получает единую сводную выдачу (иногда, с возможностью сортировки по тому или иному критерию -- так, система MetaCrawler упорядочивает результаты поиска или по релевантности, или по сайтам, или по системам, от которых получены результаты). Подобно MetaCrawler, Profusion, метапоисковая система Канзасского университета, позволяет вести поиск через несколько крупных поисковых систем (из которых можно выбрать только интересующие пользователя), результаты поиска также объединяются, устраняются повторы и подсчитывается коэффициент релевантности. Дополнительная возможность данного сайта - персонализованная служба поиска, в которой можно зарегистрировать свои регулярно повторяющиеся запросы с тем, чтобы Profusion периодически производила по ним поиск и сообщала, если будут получены новые результаты.
В 2001 г. обратила на себя внимание система Vivissimo, которая классифицирует документы, найденные одной из девяти поисковых систем (среди них Alta Vista, Google, Fast, Lycos, каталог Open Directory и новостные сайты Altavista News и CNN). Найденные результаты (можно задать ограничение объема выдачи в 100,200 или 300 документов) раскладываются по каталогам (папкам), которые видны на левой панели окна броузера. В правой части показываются адреса найденных документов. Раскрыв нужную папку, мы увидим новые папки или отдельные документы. Выбранный документ будет показан в правой части экрана.
Второй тип систем выдает результаты отдельно по каждой системе, с помощью которой они были получены (например, All4One, SuperSearch).
Далее, существует проблема унификации критериев вычисления релевантности. Как правило, критерии смыслового соответствия и способы вычисления релевантности отличаются в разных системах. В большинстве метапоисковых систем анализ полученных описаний документов не производится, что может поставить нерелевантные документы, идущие первыми в одной поисковой системе, выше релевантных в другой, что существенно понизит качество самого поиска.
Еще одна проблема -- возможности языков запросов метапоисковых систем. Обычно они предельно упрощены. Но в этом случае возможности промежуточных систем с развитыми языками запросов будут использоваться плохо. С другой стороны, усложнение языка запросов метапоисковых систем не позволит адекватно транслировать запрос в разные системы.
При всей привлекательности пользования метапоисковыми системами следует помнить и об их недостатках. Отсутствие единого для всех поисковых систем стандарта языка запросов не позволяет несовершенным пока еще метапоисковым системам добиваться от поисковых систем, включенных в их список, такого же результата, какого может добиться опытный пользователь при работе с каждой системой по отдельности. Иными словами, пользователь, который работает, например, с ИПС Google, теоретически может получить документы из всего объема базы данных этой системы, пользователь же, который работает с метасистемой, передающей запросы в Google, не располагает всеми возможностями доступа к документам Google, и чем проще язык метасистемы, тем ниже возможности получить максимальный объем информации. «К сожалению, для предметного и тонкого поиска метасистемы пока еще плохо применимы. Проблема заключается в том, что язык запросов меташлюза располагает лишь самыми общими для большинства ИПС и поэтому крайне скромными возможностями. Появление проекта стандарта поисковых систем SESP в этом отношении откроет новые перспективы в развитии метасистем, поскольку стандартизация ИПС существенно расширит возможности шлюзования».
Чаще всего, работая с несколькими ИПС, метапоисковые системы оказываются неспособными правильно обработать полученные результаты. Общий или разделенный массив документов может содержать одни и те же источники, одни и те же ссылки; на первое место могут выдвинуться отнюдь не релевантные документы, нужные же вполне рискуют оказаться отодвинутыми на задний план и остаться не прочтенными пользователем. Правда, эти недостатки встречаются и у обычных вербальных ИПС.
Заключение
Количество существующих метапоисковиков просто огромно -- на данный момент их количество превышает несколько сотен. Индивидуальный выбор часто диктуется во многом субъективными факторами, такими как удачная расцветка или наличие максимально удобного интерфейса. Пользуясь случаем, напоследок предлагаем несколько отечественных систем, использовать которые не столько даже патриотично, сколько действительно очень удобно.
Список литературы
1. Э.А. Якубайтис «Информатика-электроника-сети». М., «Финансы и статистика», 1989.
2. А. В. Гаврилов "Локальные сети ЭВМ", Москва, Изд-во "Мир", 1990.
3. Н.А. Гайдамакин «Автоматизированные информационные системы, базы и банки данных», М.: «Гелиос», 2002.
Размещено на Allbest.ru
...Подобные документы
Понятие и принципы работы, внутренняя структура и элементы, история формирования и развития поисковой системы "Rambler". Исследование и анализ, а также оценка эффективности данной поисковой системы для поиска экономической информации в интернете.
курсовая работа [4,0 M], добавлен 10.05.2015Обеспечение высокой релевантности поиска с помощью поисковой системы Google. Быстрота и надежность работы, большее количество ссылок в русскоязычном секторе Интернета. Службы, отсутствующие у других поисковых систем. Google как законодатель моды.
презентация [1,5 M], добавлен 10.03.2015Понятие и классификация поисковых систем, история их развития и структурные элементы. Характеристика существующих моделей поиска, анализ его качества. Особенности обработки запроса поисковой системой, подготовки базы данных и процесса выдачи результатов.
курсовая работа [2,6 M], добавлен 15.04.2014Описание и классификация современных информационно–поисковых систем. Гипертекстовые документы. Обзор и рейтинги основных мировых поисковых систем. Разработка информационно–поисковой системы, демонстрирующей механизм поиска информации в сети Интернет.
дипломная работа [1,3 M], добавлен 16.06.2015Понятие информационно-поисковых систем, их сущность и особенности, история возникновения и развития, роль на современном этапе. Внутреннее устройство и элементы поисковой системы. Принцип работы поисковой машины Рамблер, прядок обработки запроса.
научная работа [222,0 K], добавлен 29.01.2009Появление поисковых систем. Применение семантических сетей для анализа текста. Определение релевантности, ранжирование и индексация. Особенности программы Balabolka. Системы анализа речи. Современные особенности поиска. Развитие сервисов поисковых систем.
реферат [3,2 M], добавлен 22.04.2015Особенности моделирования биологических систем с использованием программы "AnyLogic". Влияние различных факторов на популяции жертв и хищников. Принципы имитационного моделирования и его общий алгоритм с помощью ЭВМ. Анализ результатов моделирования.
курсовая работа [922,2 K], добавлен 30.01.2016Анализ существующих поисковых систем и используемых ими алгоритмов поиска документов. Разработка информационно-поисковой системы словарного типа, способной осуществлять релевантный поиск документов, особенности ее структуры и информационно-поисковой базы.
дипломная работа [942,1 K], добавлен 19.05.2011Методы и инструментарий хранения данных во Всемирной сети. Понятие и разновидности гипертекстовых документов и графических файлов. Принципы работы поисковых систем и правила поиска нужной информации. Характеристика некоторых поисковых систем Сети.
курсовая работа [30,9 K], добавлен 18.04.2010Основные определения информации и информационного процесса. Цели, задачи и виды информационных систем. Понятие внешних (взаимодействие предприятия с клиентами и конкурентами) и внутренних (описание отношений в коллективе сотрудников) потоков информации.
контрольная работа [15,1 K], добавлен 23.05.2009История поисковых систем. Классификация информационных систем по степени автоматизации. Три основных способа поиска информации в Интернете. Отличие поисковых систем от каталогов. Назначение и типы информационных систем государственных учреждений.
курсовая работа [368,5 K], добавлен 13.05.2015Периферийные устройства для вывода визуальной информации: принтер, проектор, монитор и графопостроитель. Вывод звуковой информации с помощью динамиков, акустических систем и наушников. Основные виды акустических систем: однополосные и многополосные.
презентация [62,9 K], добавлен 19.02.2011Рассмотрение и анализ моделей и алгоритмов семантического поиска в мультиагентной системе поддержки пользователей. Ознакомление с интерфейсом чата с ботом. Изучение и характеристика экспериментальных оценок релевантности и пертинентности запросов.
дипломная работа [3,0 M], добавлен 13.10.2017Понятие информационно-поисковых систем. История возникновения сети Internet. Основные алгоритмы работы современных словарных информационно-поисковых систем. Быстрый поиск в базе данных и быстрое реагирование системы. Ранжирование результатов поиска.
курсовая работа [101,1 K], добавлен 01.06.2012Общее представление о поисковых службах. Характеристика видов информационно-поисковых систем, анализ их преимуществ и недостатков. Приемы простого поиска с помощью ключевых слов. Сохранение информации на компьютере для ее последующего использования.
учебное пособие [313,9 K], добавлен 10.10.2011История появления интегрированных математических программных систем для научно-технических расчетов: Eureka, PC MatLAB, MathCAD, Maple, Mathematica. Интерфейс и возможности интегрированных систем для автоматизации математических расчетов класса MathCAD.
курсовая работа [906,1 K], добавлен 04.06.2019Определение назначения и характеристика видов систем защиты информации. Описание структур систем по защите накапливаемой, обрабатываемой и хранимой информации, предупреждение и обнаружение угроз. Государственное регулирование защиты информационных сетей.
реферат [43,6 K], добавлен 22.05.2013Разработка web-приложения для оперирования данными с помощью базы данных и web-браузера в качестве клиента пользователя. Основные преимущества языка программирования Java. Осуществление редактирования, добавления информации и поиска по архивам данных.
дипломная работа [2,1 M], добавлен 30.09.2016Повышение эффективности (снижение времени, увеличение релевантности документов) поиска данных в больших массивах неструктурированной текстовой информации с помощью поисково-информационных и поисково-справочных машин. Классификация сайтов. Языки запроса.
дипломная работа [523,2 K], добавлен 07.07.2015Понятие информационной системы как системы сбора, хранения, накопления, поиска и передачи информации, применяемая в процессе управления или принятия решений. Классификация и структура информационных систем. Разнообразие задач, решаемых с помощью ИС.
контрольная работа [160,6 K], добавлен 18.01.2010