Иерархия ключевых слов в структуре поискового запроса
Анализ ключевых слов с точки зрения степени их семантической значимости для репрезентации прагматической установки продуцента текста. Исследование в ходе поисковых запросов. Экспериментальный метод, методы семантического и коммуникативного анализа текста.
Рубрика | Коммуникации, связь, цифровые приборы и радиоэлектроника |
Вид | статья |
Язык | русский |
Дата добавления | 25.05.2017 |
Размер файла | 16,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
1
Научный журнал КубГАУ, №128(04), 2017 года
Иерархия ключевых слов в структуре поискового запроса
Изучение ключевых слов как наиболее значимых для интерпретации информации лексических единиц [5] - актуальная сфера современной лингвистики, поскольку данное понятие активно используется не только в филологической теории, но и в ежедневной речевой практике основной части современного общества. В отечественной лингвистике ключевые слова анализируются на материале отдельных текстов [1], текстов конкретного автора [4], текстов определенного исторического периода [6, 11], выбранной сферы [9] и т.д. Особый интерес для исследования представляет функционирование ключевых слов в различных типах текстов современного интернет-дискурса. Материалом для данной статьи послужили тексты поисковых запросов системы Яндекс, по данным wordstat.yandex.ru.
Структурные особенности поискового запроса как сложного вербального комплекса, полностью состоящего из ключевых слов [7], и возможность его членения на отдельные значимые компоненты позволяет поставить вопрос об иерархии ключевых слов в пределах поискового запроса. Под иерархией ключевых слов в данном случае понимается степень семантической значимости каждого отдельного ключевого слова для репрезентации содержащейся в запросе информации. Возможно ли выделение наиболее значимых компонентов (условно назовем их детерминирующими ключевыми словами или ДКС) в структуре поискового запроса и на каком основании? Ответ на этот вопрос важен для понимания принципов построения поискового запроса, выбора ключевых слов, а также сущности ключевого слова как особой позиции лексической единицы, позволяющей репрезентовать коммуникативное намерение и прагматическую установку продуцента запроса.
Предположим, что выделение ДКС в структуре поискового запроса возможно, а основанием для такого выделения служат следующие критерии: большая (по сравнению с другими ключевыми словами) семантическая значимость для продуцента запроса и порядок слов.
Использование однокомпонентных поисковых запросов приводит к тому, что прагматическая установка продуцента трактуется расширенно. На практике об этом свидетельствует большое количество результатов выдачи, т.е. сайтов, содержащих указанное ключевое слово. При этом поиск информации, действительно актуальной для продуцента запроса, осложняется. Поэтому, как правило, используются двух- или многокомпонентные запросы, что позволяет конкретизировать/уточнить прагматическую установку и сузить сферу поиска. Следовательно, логично предположить, что некоторые компоненты запроса более актуальны для продуцента, а остальные являются менее значимыми или дополнительными. Наиболее значимые ключевые слова или ДКС представляют собой семантическое ядро поискового запроса. ДКС можно также определить как тему поискового запроса, поскольку они позволяют ответить на вопрос: о чем данный поисковый запрос. Следующие по значимости компоненты конкретизируют аспект ДКС, актуальный для продуцента запроса (условно определяются как переходная зона между ядром и периферией запроса). Наименее значимые компоненты содержат уточнение/дополнение содержания запроса (периферийная зона).
Представляя поисковый запрос в виде сложной иерархической структуры, необходимо отметить такой признак ключевого слова, как текстогенность (выделен Т.В. Шмелевой [10]). В данном случае под текстогенностью понимается способность ключевого слова порождать новые поисковые запросы. Поскольку все компоненты поискового запроса являются ключевыми словами, текстогенностью обладает каждый из них. Однако важно выяснить, какое именно слово породило данный конкретный поисковый запрос, т.е. вокруг какого слова он строится, поскольку это слово обладает наибольшей степенью семантической значимости. Для ответа на этот вопрос необходим анализ прагматической установки, конечной цели поиска и образа искомой информации.
Следует разграничить реальную потребность продуцента, обусловившую создание поискового запроса, и его прагматическую установку, репрезентованную данным запросом. Если реальная потребность связана с каким-либо фактом действительности, то прагматической установкой является поиск информации о данном факте. Таким образом, прагматической установкой, выраженной запросом купить квартиру, является не покупка квартиры, а поиск информации о покупке квартиры. Конечной целью поиска является получение искомой информации, а не собственно покупка. Объект поиска, соответственно, не квартира, а источник информации, сайт, на котором представлены объявления, связанные с продажей квартир. А образом искомой информации является объявление о продаже квартиры, а не сама квартира. Подобное разграничение важно для членения поискового запроса на более и менее семантически значимые ключевые слова.
Проанализируем следующий поисковый запрос:
роман идиот скачать бесплатно в формате txt
В данном примере выделяется следующие ключевые слова: роман идиот, скачать, бесплатно, в формате txt. Прагматической установкой, репрезентованной данным поисковым запросом, является поиск источника (сайта), на котором представлен текст романа Ф.М. Достоевского «Идиот» с возможностью его скачать бесплатно в определенном формате. Цель определяется как получение текста романа с помощью скачивания на конкретных условиях: бесплатно и в формате txt. Образом искомой информации является именно текст романа, затем процесс скачивания, ключевые компоненты бесплатно и в формате txt являются условиями, на которых будет осуществляться скачивания романа. Таким образом, структура приведенного поискового запроса с точки зрения семантической значимости составляющих его компонентов может быть представлена следующим образом:
1) ядро (наиболее значимый семантический компонент или ДКС): роман идиот;
2) переходная зона (менее значимый семантический компонент): скачать;
3) периферийная зона (наименее значимые семантические компоненты): бесплатно и в формате txt.
С этой точки зрения, легче всего выделяются наименее значимые (периферийные) компоненты. Например, в запросах
1) скачать полное собрание сочинений пушкина в формате txt;
2) купить квартиру без посредников;
3) фильмы 2016 смотреть онлайн бесплатно;
4) танки играть онлайн без регистрации;
компоненты в формате txt; без посредников; 2016, онлайн, бесплатно; онлайн, без регистрации менее значимы, поскольку не репрезентуют прагматическую установку, конечную цель поиска, его объект и образ искомой информации, а уточняют и дополняют их. Кроме того, в приведенных примерах указанные ключевые слова не определяются как тема поискового запроса и не являются текстогенными, т.е. не они порождают данные поисковые запросы. Следовательно, слова в формате txt; без посредников; 2016, онлайн, бесплатно; онлайн, без регистрации относятся к периферийной зоне поискового запроса.
Сложнее определить границы между семантическим ядром поискового запроса и переходной зоной. В анализируемых запросах компоненты скачать, полное собрание сочинений пушкина; купить, квартиру; фильмы, смотреть; танки, играть более значимы, по сравнению с периферийными, для репрезентации прагматической установки продуцента запроса, конечной цели поиска, объекта и образа искомой информации. Каждый из них может быть определен как текстогенный, т.е. тот, вокруг которого строится поисковый запрос. При этом остается открытым вопрос о том, какие из перечисленных компонентов являются семантическим ядром запроса, а какие - его конкретизацией.
Если попытаться выделить ДКС среди более значимых компонентов запроса на основании степени семантической конкретности, то в запросах купить квартиру без посредников и фильмы 2016 смотреть онлайн бесплатно ДКС будут являться слова купить и смотреть, поскольку соотносятся с более конкретными фактами действительности: покупка и просмотр. В то время как компоненты квартиру и фильмы соотносятся с большим количеством фактов действительности, поскольку продуцент запроса подразумевает под ними множество разных квартир и разных фильмов. В запросах скачать полное собрание сочинений пушкина в формате txt и танки играть онлайн без регистрации компоненты скачать, полное собрание сочинений пушкина и танки, играть обладают одинаковой степенью семантической конкретности, поскольку каждый из них соотносится в сознании продуцента запроса с одним фактом действительности.
Таким образом, семантический критерий оказывается недостаточным для выделения ДКС в структуре поискового запроса. Необходимо также учитывать более формальный критерий, которым является порядок слов в поисковом запросе.
Под порядком слов в поисковом запросе понимается расположение компонентов запроса по отношению друг к другу.
О роли порядка слов в организации словосочетания, предложения, высказывания писали много и часто [2, 3, 8]. О.Б. Сиротинина рассматривает различия функций порядка слов в письменной и разговорной речи. В письменной речи порядок слов выполняет следующие функции:
1) коммуникативную (выражение актуализации высказывания, степени коммуникативной значимости слова);
2) грамматическую (выражение синтаксической организации словосочетания, предикативной конструкции, высказывания);
3) стилистическую (выражение экспрессивности и стилевой окраски высказывания) [8].
В разговорной речи при помощи порядка слов выражается, в первую очередь, степень коммуникативной значимости компонента высказывания: наиболее значимые слова располагаются в начале высказывания.
Как и в разговорной речи, порядок слов в поисковом запросе является отражением речемыслительного акта, процесса формирования высказывания, соответствующего последовательности возникающих в сознании продуцента запроса понятий. И.И. Ковтунова для обозначения указанной особенности порядка слов использует термин «принцип ассоциативного присоединения» [3]. Следовательно, поисковый запрос можно представить в виде линейной структуры, отражающей расположение ключевых слов в порядке убывания семантической значимости: в начале - ДКС, затем - ключевые слова переходной зоны, в конце - ключевые слова периферийной зоны.
Сильной позицией, свидетельствующей о наибольшей коммуникативной значимости компонента, является начало поискового запроса.
Таким образом, в поисковых запросах
1) фильмы смотреть онлайн бесплатно в хорошем качестве;
2) подарок своими руками на 23 февраля;
3) танки играть онлайн без регистрации;
слова фильмы, подарок, танки являются ДКС, что подтверждается их расположением в сильной позиции -- начале поискового запроса.
Однако порядок слов в поисковом запросе может определяться не только коммуникативным, но и грамматическом аспектом. В этом случае его функцией будет выражение синтаксической организации высказывания. Например, в запросах
1) когда масленица в 2017 году;
2) как сделать скриншот экрана на компьютере;
3) где можно посмотреть фильм викинг;
препозитивное расположение союзов когда, как, где не свидетельствует о более высокой степени их семантической значимости, а отражает синтаксическую организацию предикативной конструкции. Порядок слов в приведенных примерах является прямым (нейтральным) и выполняет грамматическую, а не коммуникативную функцию.
Прямой порядок слов отмечается также в запросах:
1) купить квартиру;
2) сделать яндекс стартовой страницей;
3) сдать гто в саратове;
4) смотреть фильмы онлайн.
Расположение прямого дополнения в позиции после сказуемого в русском языке является нейтральным и не свидетельствует о степени семантической значимости компонентов.
Как и в живой разговорной речи, в поисковом запросе структура словосочетания, предикативной конструкции, высказывания может разрушаться. При этом порядок слов становится коммуникативно значимым. Например, в поисковых запросах
1) квартиры купить;
2) фильмы смотреть;
3) гто сдать;
нарушение прямого порядка слов (постпозиция прямого дополнения) свидетельствует о повышении степени семантической значимости компонентов квартиры, фильмы, гто.
В запросах
1) фильмы советские;
2) романы исторические;
3) цветы искусственные;
постпозиция согласованного определения отражает непрямой порядок слов, в разговорной речи это свидетельствует об актуализации определения как более значимого компонента. В поисковом запросе наблюдается обратная ситуация: семантически более значимым оказывается первый компонент запроса. Следовательно, ДКС в приведенных примерах являются слова фильмы, романы, цветы. Компоненты советские, исторические, искусственные оказываются менее значимыми.
Приведем также примеры разрушения структуры предикативной конструкции, позволяющего подчеркнуть актуальность одного из ключевых слов:
1) восстание декабристов в каком году;
2) кормушка как сделать;
3) гто саратов где сдать.
Следовательно, главным критерием для выделения ДКС в структуре поискового запроса при непрямом порядке слов является его расположение в начале запроса. Прямой порядок слов в коммуникативном аспекте оказывается нейтральным.
Таким образом, для членения поискового запроса на семантическое ядро (или ДКС) и менее значимые компоненты необходимо учитывать как семантический (степень семантической значимости), так и формальный (порядок слов) аспекты.
семантический поисковый запрос текст
Литература
1. Аверьянов Л.Я. Контент-анализ [Текст]: учеб. пособие / Л. Я. Аверьянов. М., 2009. С. 456.
2. Золотова Г.А. Труды В.В. Виноградова и проблемы текста // Вестник Моск. ун-та. Сер. 9. Филология, 1995. № 4. С.84-98.
3. Ковтунова И.И. Современный русский язык [Текст]: Порядок слов и актуальное членение предложения / И. И. Ковтунова. - М.: Просвещение, 1976. - 239 с.
4. Кухаренко В. А. Интерпретация текста [Текст] / В. А. Кухаренко. - М.: Просвещение, 1988. - С. 192.
5. Матвеева Т. В. Ключевые слова [Текст] / Т. В. Матвеева // Матвеева Т.В. Учебный словарь : русский язык, культура речи, стилистика, риторика. - М., 2003. - С. 103.
6. Романенко А.П. Советская словесная культура: образ ритора [Руко-пись]: дис. …докт. филол. наук / А. П. Романенко. Саратов, 2001. С. 355.
7. Сахарный Л.В. Тексты-примитивы и закономерности их порождения // Человеческий фактор в языке: язык и порождение речи. - М.: Наука, 1991. - С. 221-237.
8. Сиротинина О. Б. Порядок слов // Сиротинина О. Б. Лекции по синтаксису русского языка. М., 2003. С. 124-132.
9. Фомина З.Е. Слова-хронофакты в языке политических текстов [Текст] / З. Е. Фомина // Язык и эмоции : сб. науч. тр. Волгоград, 1995. С.207-324.
10. Шмелева Т. В. Ключевые слова текущего момента [Текст] / Т. В. Шмелева // Collegium. - 1993. - № 1. - С. 33-41.
11. Яшин В.Н. Архетипические ключевые слова отечественной политической речи (советский и постсоветский периоды) / В.Н. Яшин. Saarbrucken, 2011. С. 257.
Размещено на Allbest.ru
...Подобные документы
Технології побудови мережі SDH Слов'янськ-Артемівськ-Краматорськ-Слов'янськ. Розрахунок числа каналів та цифрових потоків Е1 між населеними пунктами. Визначення рівня мультиплексорного обладнання. Прокладання кабелю в каналізацію і безтраншейним способом.
дипломная работа [2,9 M], добавлен 18.02.2014Характеристики ключевых схем на дополняющих МОП-транзисторах (КМОП), базовых схем логических элементов на основе программы MC8DEMO. Содержание процессов в формирователях коротких импульсов на базе ЛЭ КМОП и проявления гонок (состязаний) в цифровых схемах.
лабораторная работа [2,6 M], добавлен 24.12.2010Разработка электрической принципиальной и функциональной схемы генератора. Обоснование выбора схем блока вычитания и преобразователя кодов. Функциональная схема генератора последовательности двоичных слов. Расчет конденсаторов развязки в цепи питания.
курсовая работа [1,7 M], добавлен 14.09.2011Способы контроля информационных слов и адресов в цифровых устройствах автоматики. Структурные и функциональные схемы контролирующих устройств. Обеспечение надежности устройств автоматики и вычислительной техники. Числовой аппаратурный контроль по модулю.
контрольная работа [5,0 M], добавлен 08.06.2009Словарные методы кодирования. Сущность их состоит в том, что фразы в сжимаемом тексте заменяются указателем на то место, где они в этом тексте уже pанее появлялись. Декодирование сжатого текста. Алгоритм Абрахама Лемпела и Якоба Зива - LZ77, LZ-сжатие.
реферат [30,5 K], добавлен 11.02.2009Принципиальная схема телевизора не отражает наличия всех элементов схемы и не позволяет судить о пространственном расположении элементов. Метод анализа монтажа. Элементы (детали), используемые в телевизоре, имеют определенные физические характеристики.
реферат [1,5 M], добавлен 04.01.2009Практические навыки схемного введения биполярного транзистора в заданный режим покоя. Определение основных свойств транзистора в усилительном и ключевых режимах. Овладение методикой работы в учебной лаборатории в программно-аппаратной среде NI ELVIS.
лабораторная работа [1,3 M], добавлен 04.03.2015Анализ цепи во временной области методом переменных состояния при постоянных воздействиях. Поиск точных решений уравнений состояния. Метод Эйлера. Построение точных и численных решений. Анализ цепи операторным методом при апериодическом воздействии.
курсовая работа [607,1 K], добавлен 05.11.2011Методы оценки надежности: экспериментальный, аналитический и статистического моделирования. Испытания на надежность - метод экспериментальной оценки надежности РЭСИ на этапах их серийного выпуска. Организация определительных испытаний на надёжность.
реферат [663,3 K], добавлен 28.01.2009Исследование функциональной зависимости параметров сети. Мощность мобильного терминала. Расчет параметров сетей связи стандарта CDMA. Анализа трафик-каналов прямого и обратного соединений, пилот-канала, канала поискового вызова и канала синхронизации.
курсовая работа [166,1 K], добавлен 15.09.2014Особенности обеспечения функций промышленного здания с точки зрения работы системы лифтов, эскалаторов, трансформаторной подстанции, качества телефонной связи. Оценка сбоев и степени надежности работы оборудования на основе теории нечетких множеств.
курсовая работа [1,9 M], добавлен 28.01.2014Определение и физические принципы голографии. Принцип формирования изображения. Методы записи (метод Лейта и Упатниекса, метод Бентона) и тиражирование радужных голограмм. Принципиальная схема установки, схема записи мастер-голограммы и радужной копии.
реферат [787,4 K], добавлен 02.03.2014Расчет мощности, поглощаемой материалом, имеющим диэлектрические потери. Микроволновые установки типа бегущей волны с продольным взаимодействием. Их конструкции. Процесс выбора источника СВЧ энергии. Параметры микроволновой установки. Модель и метод.
дипломная работа [5,9 M], добавлен 01.07.2017Разработка и реализация устройства селекции бинарной подпоследовательности символов из бесконечной бинарной последовательности. Выбор микросхемы регистра сдвига. Методы отладки модели УСПБ, генератор слов. Выбор микросхемы для реализации блока индикации.
курсовая работа [565,0 K], добавлен 08.01.2016Структурная схема микропроцессорной системы. Арифметико-логическое устройство обработки информации. Системные и управляющие регистры процессора, их категории. Схема внутреннего управления. Типовые значения ключевых параметров для кэш-памяти; чипсет.
презентация [2,9 M], добавлен 29.08.2015Цель и практика использования поисковых средств в оперативно-розыскной деятельности. Характеристика и принцип работы поисковых средств: магнитных, химических, индукционных, механического, электрического, излучающего действия, средств контроля и досмотра.
контрольная работа [34,1 K], добавлен 09.01.2009Статистический анализ вероятностных свойств дискретного источника по заданной реализации отрезка его выходного текста сообщений. Расчет спектров модулирующего и модулированного сигналов. Эквивалентная вероятность ошибочного приема двоичного элемента.
курсовая работа [1,1 M], добавлен 15.04.2012Требование к сети связи со стороны потенциальных потребителей. Пользователи системы связи. Эволюция стандартов IEEE 802.16. Обзор современных систем беспроводного абонентского доступа. Сравнение ключевых технологий WiMAX, LTE, спектральной эффективности.
дипломная работа [2,7 M], добавлен 13.02.2014Аккустические методы, основанные на применении колебаний звукового, ультразвукового диапазонов. Резонансный метод ультразвукового контроля. Метод капиллярного проникания индикаторных жидкостей. Стадии процесса электролиза. Условие определения дефектности.
реферат [2,0 M], добавлен 03.02.2009Технические характеристики трехфазного асинхронного двигателя. Разработка схемы управления. Использование аккумуляторной батареи в качестве источника питания. Расчет тепловых режимов ключевых элементов, выбор теплоотвода. Смета затрат на разработку.
дипломная работа [915,9 K], добавлен 20.10.2013