Критерии выбора ключевых слов при формировании поискового запроса
Поисковый запрос как текст, полностью состоящий из ключевых слов. Особенности выбора ключевых слов продуцентом поискового запроса. Методика анализа поискового запроса в коммуникативном аспекте. Методы семантического и коммуникативного анализа текста.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 30.07.2017 |
Размер файла | 26,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Критерии выбора ключевых слов при формировании поискового запроса
Термин «ключевые слова» активно используется в филологической теории и практике. Исследованию данного понятия посвящены работы Т.В. Матвеевой [3], Т.В. Шмелевой [11], А.П. Романенко [5], Л.Я. Аверьянова [2]. В отечественной лингвистике традиционно под ключевыми словами понимаются наиболее важные для интерпретации текста слова, без которых невозможно его существование, т.е. составляющие основу авторского замысла [3].
При анализе ключевых слов с точки зрения лингвистического и коммуникативного аспекта возникает вопрос о принципах, на основании которых то или иное слово оказывается в позиции ключевого. В качестве признаков ключевых слов, позволяющих выделить их из контекста, Т.В. Шмелева называет частотность употребления, «выдвинутость» в текстовом пространстве (начало, конец, центр, основные смысловые швы текста), расширение грамматического, синтагматического и парадигматического потенциала слова, употребление в предложениях дефиниционного типа, а также активизацию в качестве объекта языковой игры и языковой рефлексии [11]. При этом открытым остается вопрос о критериях выбора ключевых слов в процессе создания текста. В данной статье указанный вопрос рассматривается на материале текстов поисковых запросов системы Яндекс (по данным wordstat.yandex.ru [7]).
Поисковый запрос представляет собой сложный вербальный комплекс, полностью состоящий из ключевых слов [6]. Анализируя состав и структуру поискового запроса, необходимо учитывать, что каждый входящий в него компонент является ключевым словом и осознается в качестве такового продуцентом запроса.
Выбор продуцентом тех или иных слов при формировании запроса может быть обусловлен их семантикой (т.е. всем комплексом реальных и потенциальных значений, коннотаций и ассоциаций, связанных со словом в сознании продуцента запроса), сочетаемостью, грамматическими характеристиками, частотностью употребления, общеизвестностью, а также способностью наиболее полно и кратко репрезентовать его коммуникативное намерение и прагматическую установку. Кроме того, следует учитывать ряд экстралингвистических факторов: конкретную ситуацию, связанную с формированием запроса, характер искомой информации, уровень речевых и коммуникативных навыков продуцента, его предыдущие знания и опыт, ментальные и речевые стереотипы современного общества, а также иные аспекты: культурные, личностные, национальные, социальные и т.д.
Несмотря на разнообразие поисковых запросов с точки зрения содержания и состава анализ наиболее частотных из них позволяет выделить некоторые общие критерии выбора ключевых слов для их формирования.
1. Критерий конситуативной обусловленности
поисковый запрос слово коммуникативный
Формирование поискового запроса репрезентует потребность продуцента в получении информации, характер и содержание которой обусловлены конкретной ситуацией. Данная ситуация существует в сознании продуцента запроса в виде отдельных компонентов, условно их можно разделить на две группы:
1) связанные с предыдущими знаниями и опытом;
2) связанные с желанием расширить имеющиеся знания и получить новый опыт.
Действительно, потребность в получении нового знания и опыта базируется на предыдущих знаниях и опыте и обусловлена осознанием их недостаточности. Например, желание продуцента запроса узнать, как сделать кормушку для птиц, предполагает, что ему известно о птицах, кормушках для них, о том, что их можно сделать, а также о том, что для этого существуют какие-то способы. Перечисленные компоненты приведенной ситуации относятся к области уже имеющихся знаний и опыта (первая группа). При этом продуцент запроса не знает или знает недостаточно о том, каким образом может быть сделана кормушка для птиц, и хочет получить информацию об этом (компоненты второй группы). Рассмотрим еще одну ситуацию: продуцент запроса хочет определить частеречную принадлежность слова вдруг. В качестве компонентов первой группы выделяются следующие: общее представление о части речи как характеристике слова, существование слова вдруг, возможность отнесения слова вдруг к одной из частей речи. Компоненты второй группы: незнание и желание узнать частеречную принадлежность слова вдруг.
Каждый компонент ситуации, обусловившей формирование запроса, может быть вербализован:
1) кормушка для птиц как сделать;
2) вдруг какая часть речи.
Количество слов, подходящих для этого с точки зрения продуцента, варьируется в широких пределах:
1) кормушка для птиц как сделать;
2) кормушка для птиц своими руками;
3) кормушка для птиц оригинальные идеи фото;
4) кормушка для птиц из чего;
5) вдруг часть речи;
6) вдруг частеречная принадлежность;
7) вдруг это наречие.
Выбор того или иного ключевого слова может свидетельствовать об актуальности какого-либо компонента ситуации для продуцента запроса. Например, запрос кормушка для птиц как сделать свидетельствует о желании узнать, какими способами может быть изготовлена кормушка; запрос кормушка для птиц своими руками подчеркивает, что интерес представляют непроизводственные способы; запрос кормушка для птиц оригинальные идеи фото указывает на необходимость нестандартного решения проблемы и его визуализации; в запросе кормушка для птиц из чего продуцента интересуют материалы, из которых может быть изготовлена кормушка. Запросы вдруг какая часть речи, вдруг часть речи, вдруг частеречная принадлежность в этом плане характеризуются как синонимичные (т.е. выбор одного из них обусловлен каким-либо иным принципом). Запрос вдруг это наречие свидетельствует о желании продуцента подтвердить предположение о частеречной принадлежности слова вдруг.
Аналогичным образом строятся запросы для поиска информации по приблизительному описанию:
1) книга про вампиров и оборотней;
2) фильмы где девушка превращается в красавицу;
3) блюда из тыквы.
В приведенных примерах выбор периферийных ключевых слов про вампиров и оборотней, где девушка превращается в красавицу, из тыквы свидетельствует об актуальности вербализованных ими компонентов ситуации для продуцента запроса.
В ситуациях, когда продуцент запроса не знает/не помнит какого-либо факта действительности или наиболее релевантного конкретной речевой ситуации слова, он заменяет его описанием на основе других, известных ему, фактов или слов. Как, например, в запросах:
1) рассказ где муж продал часы а жена волосы;
2) картина где девушку выдают замуж за старика.
Подразумевая рассказ «Дары волхвов» О. Генри, картину «Неравный брак» В.В. Пукирева, но не зная/не помня названий, продуцент использует ключевые слова, позволяющие репрезентовать уже имеющиеся знания и опыт.
Конситуативно обусловленным может быть выбор одного из семантических синонимов. Например, в запросах:
1) пурпурная помада кому идет;
2) алая помада кому идет;
3) малиновая помада кому идет;
слова пурпурная, алая, малиновая также представляют собой семантические синонимы [1], для продуцента запроса их противопоставление оказывается существенным, поскольку в каждом из приведенных примеров указывается конкретный оттенок красного.
Степень абстрактности/конкретности содержания искомой информации, опять-таки обусловленная ситуацией формирования поискового запроса, влияет на выбор одного из членов родовидовой пары. Например, в запросе розы купить саратов под словом розы подразумевается цветок растения [8], данный лексико-семантический вариант входит в родовидовую пару розы -- цветы. Выбор гипонима розы вместо возможного гиперонима цветы, также соответствующего ситуации формирования запроса, позволяет конкретизировать прагматическую установку продуцента.
Использование гиперонима цветы вместо одного из гипонимов (например, розы, орхидеи, лилии и т.д.) в запросе цветы купить саратов расширяет содержание запроса, что может соответствовать прагматической установке продуцента в следующих случаях:
1) интерес представляет информация о возможности купить несколько видов цветов (например, оптом);
2) для продуцента важно наличие ассортимента, в таком случае гипероним цветы свидетельствует о желании получить возможность выбора;
3) продуцент запроса намеренно не уточняет, какие именно цветы имеет в виду, поскольку данный критерий для него менее актуален (более актуальными, в таком случае могут оказаться следующие критерии: внешний вид, запах, свежесть, цена и т.д.).
Выбор гиперонима (с целью обобщить содержание запроса) или гипонима (с целью его конкретизировать) определяется прагматической установкой продуцента запроса и является конситуативно обусловленным.
Таким образом, выбор каждого ключевого слова при формулировке поискового запроса оказывается обусловленным порождающей его ситуацией. При этом учитываются как собственно лингвистические факторы, так и экстралингвистические. К собственно лингвистическим относится соответствие семантики слова содержанию запроса, способность слова репрезентовать прагматическую установку. К экстралингвистическим -- ситуация формирования запроса, характер искомой информации, предыдущие знания и опыт продуцента. Критерий конситуативной обусловленности является не только обязательным, но и основным. Остальные рассматриваются как факультативные и варьирующиеся.
2. Ассоциативный критерий
При выборе ключевых слов для создания поискового запроса существенным регулярно оказывается ассоциативный критерий. Устойчивые вербальные ассоциации, закрепленные в сознании продуцента запроса (а также большинства носителей языка), позволяют сжато отобразить прагматическую установку. Например, слово танк имеет следующее значение: «Боевая бронемашина на гусеничном ходу, обладающая большой проходимостью и вооруженная пушками и пулеметами, установленными во вращающейся орудийной башне» [9].
Однако, по данным статистики ключевых слов Яндекса, наиболее устойчиво и регулярно слово танки ассоциируется с компьютерной игрой “World of Tanks”, что обусловлено ее популярностью среди пользователей сети Интернет. Данный факт можно проиллюстрировать следующими примерами (ниже в таблице 1 приведены шесть наиболее частотных запросов Яндекса, включающих слово танки):
Таблица 1 - Частотность поисковых запросов со словом танки
Поисковые запросы, включающие слово танки |
Количество запросов в месяц |
|
танки онлайн |
3 320 007 |
|
ворлд танк |
857 587 |
|
ворлд оф танк |
849 243 |
|
игры танки |
531 587 |
|
скачать танки |
496 967 |
|
танки сервер |
451 448 |
Таким образом, продуцент запроса может использовать ключевое слово танки для обозначения компьютерной игры “World of Tanks” благодаря существующим устойчивым ассоциациям.
Наличие устойчивых ассоциаций в ряде случаев затрудняет поиск информации, представляющей интерес для продуцента запроса. В качестве примера можно также привести слово ассасин. В «Малом энциклопедическом словаре данное слово определяется следующим образом: «Ассасины (Assassini и Assissini). -- Так называются в средневековых хрониках принадлежавшие к шиитской секте, впоследствии персидские и сирийские исмаилиты, которые сначала занимались, по всей вероятности, изготовлением из разных трав опьяняющего напитка, по-арабски называемого гашишем» [12].
Однако, как показывает статистика, в большинстве случаев продуценты поисковых запросов подразумевают под этим словом название компьютерной игры «Assassin's Creed» или одноименный фильм (см. таблицу 2).
Таблица 2 - Частотность поисковых запросов со словом ассасин в значении: игра/фильм
Поисковые запросы, включающие слово ассасин |
Количество запросов в месяц |
|
ассасин крид |
671 804 |
|
скачать ассасин |
309 948 |
|
скачать ассасин крид |
222 383 |
|
ассасин фильм |
127 642 |
|
игра ассасин |
124 048 |
|
ассасин 3 |
111 509 |
Если продуцент запроса имеет в виду энциклопедическое значение слова ассасин, а не наиболее употребительное, необходимы уточняющие ключевые слова (см. таблицу 3).
Таблица 3 - Частотность поисковых запросов со словом ассасин не в значении: игра/фильм
Поисковые запросы, включающие слово ассасин |
Количество запросов в месяц |
|
орден ассасинов |
1 240 |
|
ассасины в реальной жизни |
1 110 |
|
братство ассасинов |
932 |
|
существовали ли ассасины |
723 |
В случае, когда продуцент не знает/не помнит какой-либо фактической информации, он может составить запрос, используя ключевые слова, вызывающие относительно устойчивые ассоциации с объектом поиска. При этом задачей продуцента запроса является не полное, емкое или точное описание искомой информации, а только указание дифференциального признака (или признаков), позволяющего соотнести содержание запроса с конкретным фактом действительности или конкретной информацией.
Например, запрос картина где тянутся руками не содержит интерпретацию содержания произведения или его полное описание, однако использование ключевого слова где тянутся руками репрезентует устойчивые ассоциации с фреской Микеланджело Буонарроти "Сотворение Адама". Регулярность и частотность использования слов тянуться и рука при описании данного произведения позволяют осуществлять поиск даже в том случае, когда продуцент не знает/не помнит названия и автора (см. таблицу 4).
Таблица 4 - Частотность поисковых запросов, включающих комбинацию слов: картина, тянуться, рука
Поисковые запросы со словами картина, тянуться, рука |
Количество запросов в месяц |
|
картина рука тянется к руке |
365 |
|
картина руки тянутся друг к другу |
276 |
|
картина где тянутся руками |
170 |
Выбор ключевых слов для создания запроса при поиске информации о неизвестном продуценту факте действительности в ряде случаев основан на ассоциациях с каким-либо уже известным фактом. Например, запросы
1) фильмы похожие на гордость и предубеждение список;
2) косметика типа avon
репрезентуют потребность продуцента запроса получить информацию о потенциальных реакциях на стимулы гордость и предубеждение, avon. Использование таких слов-стимулов вместо развернутых описаний можно рассматривать как разновидность языковой компрессии, поскольку с их помощью прагматическая установка продуцента запроса отображается более сжато и емко.
Кроме того, устойчивые (или относительно устойчивые) ассоциации позволяют продуценту уточнить или переформулировать запрос в случае, если результаты выдачи не соответствуют образу искомой информации. Процесс трансформации исходного запроса можно проанализировать благодаря списку ассоциативных запросов, автоматически формируемому поисковой системой. Под ассоциативными запросами в компьютерной лингвистике понимаются запросы, заданные одним и тем же пользователем подряд в течение короткого промежутка времени. Их тематическая связь подтверждается в результате анализа запросов, используемых другими продуцентами. В поисковой системе Яндекс ассоциативные запросы располагаются внизу страницы и снабжены заголовком: Вместе с <текст исходного запроса> ищут.
Например, в ответ на исходный запрос ключевые слова поисковая система Яндекс предлагает следующий список ассоциативных запросов:
1) подбор ключевых слов;
2) что такое ключевые слова;
3) ключевые навыки в резюме примеры;
4) подбор слов;
5) как найти ключевые слова в тексте;
6) проверка уникальности текста;
7) основные признаки текста.
Трансформация исходного запроса осуществляется путем актуализации парадигматических или синтагматических связей слов.
Например, одно из ключевых слов исходного запроса может быть заменено синонимичным (микроволновка/свч печь), кроме того, его значение может уточняться при помощи дополнительных ключевых слов (локи/локи марвел). Локи -- один богов скандинавской мифологии, а также персонаж комиксов и фильмов Marvel. Включив в запрос дополнительный компонент марвел, продуцент уточняет, что актуальность для него представляет второе значение.
3. Критерий общеупотребительности
Анализ поисковых запросов с точки зрения сферы употребления входящих в них слов позволяет говорить о разнице при выборе детерминирующих ключевых слов или ДКС (т.е. ключевых слов с более высокой степенью семантической значимости, по сравнению с другими ключевыми словами) и слов переходной и периферийной зоны (т.е. семантически менее значимых слов) [4] в соответствии с критерием общеупотребительности.
Так, в позиции ДКС могут оказаться общеупотребительные слова (работа в москве; окна пвх), а также слова ограниченной сферы употребления: устаревшие слова (амикошонство значение слова; камзол женский), диалектизмы (гонобобель ягода википедия; векша что это за животное), специальные слова (симулякр пример; фонемы русского языка), жаргонизмы (ксива купить; проги скачать).
Более существенным критерий общеупотребительности оказывается при выборе ключевых слов переходной и периферийной зоны. В указанных позициях чаще всего оказываются общеупотребительные слова, а также историзмы (в связи с отсутствием общеупотребительного аналога), некоторые жаргонизмы, в частотности, слова молодежного и компьютерного сленга (в связи с близостью языка современных поисковых запросов и разговорной речи), термины (что обусловлено спецификой поискового запроса как одного из основных средств поиска информации в сети Интернет). Значительно реже в позициях ключевых слов переходной и периферийной зоны оказываются архаизмы и диалектные слова.
Для большей наглядности сопоставим частотность употребления приведенных выше ключевых слов в позиции ДКС и в других позициях (см. таблицу 5).
Таблица 5 - Сопоставление частотности употребления слов в позиции ДКС и других позициях
Ключевое слово |
Количество вариантов запросов с данным словом |
||
в позиции ДКС |
В позиции слова переходной или периферийной зоны |
||
работа |
1 429 |
631 |
|
окна |
1067 |
983 |
|
амикошонство |
10 |
1 |
|
камзол |
147 |
26 |
|
гонобобель |
22 |
2 |
|
векша |
27 |
2 |
|
симулякр |
73 |
14 |
|
фонема |
303 |
143 |
|
ксива |
171 |
79 |
|
прога |
1237 |
813 |
Следовательно, критерий общеупотребительности в ряде случаев определяет выбор ключевых слов переходной и периферийной зоны.
4. Критерий частотности употребления
При выборе ключевых слов из ряда синонимов продуцент запроса может опираться на критерий частотности употребления. Использование более частотных слов обусловлено тем, что поисковый запрос ориентирован на поиск информации, предоставленной другими пользователями сети Интернет. С этой точки зрения, поисковый запрос отражает представления продуцента о том, какие слова могут оказаться в позиции ключевых по мнению других участников коммуникации.
Сопоставив данные о частотности употребления синонимов фильм и кино, снять и арендовать в качестве ключевых слов, можно сделать вывод о том, что частотность их употребления в текстах поисковых запросов соотносится с частотностью употребления в языке в целом (по данным Национального корпуса русского языка (НКРЯ) [10]). Данные представлены в таблице 6:
Таблица 6 - Сопоставление частотности употребления слов в поисковых запросах и НКРЯ
Ключевое слово |
Количество поисковых запросов |
Частотность в НКРЯ (количество вхождений) |
|
фильм |
187 314 391 |
12 649 |
|
кино |
20 812 162 |
554 |
|
снять |
11 204 017 |
8 448 |
|
арендовать |
160 133 |
231 |
Таким образом, критерий частотности употребления может оказаться значимым при выборе ключевых слов.
5. Критерий краткости
В процессе формирования поискового запроса находит отражение принцип языковой экономии. На практике об этом свидетельствует тот факт, что при возможности выбора продуцент отдаст предпочтение более краткому варианту ключевого компонента. Возможность выбора возникает при реализации следующих условий:
1) наличие у ключевого компонента семантически тождественных вариантов;
2) вхождение данных вариантов в словарный запас продуцента запроса;
3) их общеупотребительность.
В качестве примеров речевой компрессии в текстах поисковых запросов можно привести использование аббревиатур, усеченных слов, английских слов, часто набранных кириллицей, (в случае, если русское соответствие является более длинным), эллиптических конструкций:
1) сгу расписание;
2) саб для компьютера;
3) сбербанк онлайн;
4) книги в fb2.
Сопоставим частотность употребления полных (развернутых) и сжатых вариантов ключевых компонентов в поисковых запросах и представим полученные данные в виде таблицы 7:
Таблица 7 - Сопоставление частотности употребления развернутых и сжатых вариантов ключевого слова
Полный вариант ключевого компонента |
Количество запросов |
Сжатый вариант ключевого компонента |
Количество запросов |
|
научно исследовательский институт |
60 214 |
нии |
453 502 |
|
поливинилхлорид |
14 963 |
пвх |
1 848 353 |
|
в формате doc |
14 938 |
doc |
426 9 |
Как видим, в большинстве случаев продуценты запросов используют компрессионные варианты ключевых слов.
6. Критерий устойчивости употребления
Под устойчивостью употребления ключевых слов в данном случае подразумевается регулярное и частотное воспроизведение одних и тех же конструкций в сходных типичных речевых ситуациях. Примером может служить регулярное включение в поисковые запросы с ДКС фильм, сериал, комедия следующих ключевых слов переходной и периферийной зоны: смотреть онлайн, в хорошем качестве, новинки, список лучших и т.д.
Использование подобных относительно устойчивых сочетаний ключевых слов позволяет сэкономить время и облегчить поиск информации, следовательно, может также рассматриваться как реализация принципа речевой экономии.
7. Стилистический критерий
Поисковая система, в первую очередь, находит источники, являющиеся релевантными запросу, т.е. такие, в которых повторяется заданная комбинация слов. Поэтому значение имеет не только семантика запроса, но и его стилистика. Выбранный продуцентом функциональный стиль во многом определяет результаты поиска, поскольку высока вероятность того, что найденные системой источники совпадут по стилю с запросом.
В качестве примеров можно привести поисковые запросы в разговорном стиле: дюфастон кому навредил; комиксы какие бывают.
Результаты поиска включают ссылки на форумы, обсуждения в социальных сетях, комментарии различных пользователей (необязательно специалистов в указанной сфере), блоги, публицистические статьи, в том числе рекламного характера. Приведенные запросы репрезентуют следующую интенцию продуцента: получить информацию об опыте других пользователей сети Интернет, при этом не уточняется, что информация должна быть достоверной и подтверждаться какими-либо данными.
Изменив функциональный стиль поискового запроса, продуцент получает несколько иные результаты. Например, при использовании запроса потенциальные риски при применении препарата дюфастон (научный стиль) результаты поиска включают, в первую очередь, инструкции по применению данного препарата. А в ответ на запрос разновидности комикса как креолизованного текста (научный стиль) поисковая система предлагает ссылки на научные статьи по указанной теме.
Необходимо подчеркнуть, что изменение функционального стиля поискового запроса может привести к изменению его содержания. В таком случае трансформированный запрос репрезентует иную информационную потребность продуцента и, соответственно, иную прагматическую установку. Кроме того, возникают сложности при определении функционального стиля поискового запроса, что обусловлено небольшим объемом данного типа текста. Тем не менее, связь между стилем поискового запроса и стилями найденных системой источников позволяет выделить стилистический критерий как одно из возможных условий выбора ключевых слов.
В заключение следует отметить, что в данной статье рассматриваются основные, но далеко не все возможные критерии выбора ключевых слов при формировании запроса. Учитывая перечисленные критерии, можно существенно снизить коммуникативные риски при поиске информации. Анализ подобного материала также актуален при изучении ключевых слов в коммуникативном аспекте.
Литература
1. Абрамов Н.А. Словарь русских синонимов и сходных по смыслу выражений./ Н.А. Абрамов // Печатное издание М.: Русские словари, 1999. -- 431c.
2. Аверьянов Л.Я. Контент-анализ [Текст]: учеб. пособие / Л. Я. Аверьянов. М., 2009. С. 456.
3. Матвеева Т. В. Ключевые слова [Текст] / Т. В. Матвеева // Матвеева Т.В. Учебный словарь : русский язык, культура речи, стилистика, риторика. - М., 2003. - С. 103.
4. Потехина М.С. Иерархия ключевых слов в структуре поискового запроса / Потехина М.С. // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2017. С. 10. - №04(128). - Режим доступа: http://ej.kubagro.ru/2017/04/pdf/66.pdf.
5. Романенко А.П. Советская словесная культура: образ ритора [Руко-пись]: дис. докт. филол. наук / А. П. Романенко. Саратов, 2001. С. 355.
6.Сахарный Л.В. Тексты-примитивы и закономерности их порождения // Человеческий фактор в языке: язык и порождение речи. - М.: Наука, 1991. - С. 221-237.
7. Толковый словарь русского языка: в 4 т/ АН СССР, Ин-т рус. яз./ под ред. А. П. Евгеньевой. - 2-е изд. - М. : Рус. яз.: Т.3: 1987, -- 751 с.
8. Толковый словарь русского языка: в 4 т/ АН СССР, Ин-т рус. яз./ под ред. А. П. Евгеньевой. - 2-е изд. - М. : Рус. яз.: Т.4: 1988, -- 797 с.
9. Шмелева Т. В. Ключевые слова текущего момента [Текст] / Т. В. Шмелева // Collegium. - 1993. - № 1. - С. 33-41.
Размещено на Allbest.ru
...Подобные документы
"Метод ключевых слов" как один из распространенных методов перехода к математической модели документа. Закономерности распределения частоты слов, отраженные в законе Ципфа. Экспериментальная оценка статистического анализа текста по модели TF*IDF.
реферат [591,7 K], добавлен 24.06.2009Методы уточнения поискового запроса, расширение запроса с помощью тезауруса. Ключевые концепции для обратной связи по релевантности, вычисление центроидов. Алгоритм Rocchio, положительные или отрицательные сдвиги обратной связи, допущение и оценка.
презентация [1,4 M], добавлен 06.01.2014Информационная поисковая система Яндекс; характеристика услуг и сервисов портала: каталог, новости, города, энциклопедии. Полезные ссылки главной страницы. Формирование и активизация поискового запроса: морфология, контекст, порядок слов, результат.
презентация [2,6 M], добавлен 10.03.2015Статистика посещений какого-либо популярного ресурса. Запросы, по которым пользователи находят сайт. Как сократить область поиска в справочных системах Google и Яндекс. Составление поискового запроса при помощи операторов "+", "-", "inurl", "intitle".
презентация [244,2 K], добавлен 23.02.2012Примеры запросов к одной из поисковых систем Интернет (подбор ключевых слов) и расчетов в табличном процессоре MS Excel (инструменты). Описание машины Тьюринга: составляющие и их функционирование. Основные форматы представления графических данных.
контрольная работа [24,5 K], добавлен 09.06.2009Мотивы и особенности лексики произведений "О дивный новый мир" О. Хаксли и "1984" Дж. Оруэлла. Анализ, сравнение и обобщение ключевых слов и воссоздание художественного мира романов. Создание веб-приложения "Словарь ключевых слов британских антиутопий".
дипломная работа [2,6 M], добавлен 21.06.2016Система поиска в сети и интернет-портал "Яндекс". Образование компании "Яндекс" в 2000 году, ее выход на самоокупаемость в 2002 году. Основное и приоритетное направление компании - разработка поискового механизма. Порядок введения запроса, его диапазон.
презентация [211,7 K], добавлен 03.02.2011Изучение классификации поисковых средств по В.В. Дудихину. Поиск информации с помощью поисковых ресурсов. Формирование запросов. Использование ключевых слов. Индексация документов, размещенных на различных серверах. Зарубежные лидеры поисковых систем.
презентация [775,3 K], добавлен 10.03.2015История создания языков С и С++. Разработка буквенного меню, посредством которого реализуются функции информационно-поискового справочника "Терморезисторы". Определение структуры данных, защита программы от ввода пользователем некорректных параметров.
курсовая работа [18,3 K], добавлен 16.02.2012Порядок формирования запроса на выбор всех ковровских студентов. Отдельно создание данного запроса на студентов, не имеющих телефона. Запрос на выбор всех студентов какого-либо курса независимо от специальности, студентов, родившихся в текущем месяце.
лабораторная работа [1,1 M], добавлен 12.04.2012Система контроля процессов обслуживания кредитовых ведомств (воинских министерств) в среде ОАО "РЖД". Требования к функциям, выполняемым системой. Идентификация ключевых абстракций. Обоснование компоновки Web-страницы. Формирование запроса к системе.
дипломная работа [3,4 M], добавлен 15.10.2013Назначение и виды запросов в Microsoft Access. Реляционная база данных. Разработка запроса в режиме конструктора. Технология решения задачи в Excel. Запросы на обновление, добавление и удаление данных. Перенос слов при вводе в ячейку длинных заголовков.
курсовая работа [1,3 M], добавлен 23.04.2013Порядок создания таблицы; схемы данных; фильтров; запроса "Группы ЭФ", содержащего список учебных групп и перекрестного запроса "Оценки студентов из одной комнаты"; составной формы "Оценки жильцов комнаты". Построение отчета "Итоги сессии в группе 9701".
контрольная работа [2,2 M], добавлен 30.09.2013Проблема выбора товара в Интернете. Типы и свойства онтологий как части концепции Semantic Web. Разработка web-приложения для выбора музыкального инструмента: создание иерархии онтологий для предметной области "Гитара", формирование SPARQL-запроса.
дипломная работа [2,2 M], добавлен 20.04.2012Общее представление о поисковых службах. Характеристика видов информационно-поисковых систем, анализ их преимуществ и недостатков. Приемы простого поиска с помощью ключевых слов. Сохранение информации на компьютере для ее последующего использования.
учебное пособие [313,9 K], добавлен 10.10.2011Описание технологии создания таблиц в режиме "Конструктор" в программной среде Microsoft Access. Сортировка и фильтрация данных в таблицах, создание полей с подстановкой. Пример структуры многотабличного запроса и пример создания итогового запроса.
лабораторная работа [1,6 M], добавлен 17.02.2013Обоснование выбора метода извлечения ключевых слов. Анализ предметной области, проектирование информационной системы поиска релевантных документов. Реализация запросов к электронным библиотекам. Реализация интерфейса системы поиска релевантных документов.
дипломная работа [1,1 M], добавлен 21.09.2016Формат файла конфигурации, содержащего данные для подсветки синтаксиса. Его проверка при помощи XML Schema. Реализация функций для чтения данных подсветки и по загрузке таблицы стилей, ключевых слов и типов. Разбор текста и применение к нему стилей.
курсовая работа [122,3 K], добавлен 30.05.2015Особенности поиска информации в Интернет: стратегия и методика. Поисковые машины, каталоги и порталы информационных ресурсов. Подбор и введение ключевых слов. Использование режима "расширенный поиск", который имеет каждая из поисковых систем в Интернете.
реферат [27,3 K], добавлен 06.08.2014Организация и эволюция развития поискового аппарата электронного каталога библиотеки. Функции и структурные особенности справочно-библиографического аппарата. Электронные каталоги библиотек г. Омска. Общий функционал программного обеспечения OPAC.
курсовая работа [106,8 K], добавлен 16.09.2017