Лингвистическая база данных отрицательно-оценочной лексики: концепция, структура, наполнение
Обзор существующих лингвистических баз данных и выявление оснований для их классификации. Разработка концепции разрабатываемой лингвистической базы данных отрицательно-оценочной лексики, описание ее структуры и оценка возможностей ее применения.
Рубрика | Иностранные языки и языкознание |
Вид | статья |
Язык | русский |
Дата добавления | 21.09.2020 |
Размер файла | 172,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ЛИНГВИСТИЧЕСКАЯ БАЗА ДАННЫХ ОТРИЦАТЕЛЬНО-ОЦЕНОЧНОЙ ЛЕКСИКИ: КОНЦЕПЦИЯ, СТРУКТУРА, НАПОЛНЕНИЕ
К.С. Кочергина
Аннотация
лексика лингвистический база данные
Приводится обзор существующих на данный момент лингвистических баз данных и выявляются основания для их классификации. Предлагается концепция разрабатываемой лингвистической базы данных отрицательно-оценочной лексики (имен существительных со значением номинации лица и группы лиц), описывается ее структура, демонстрируется ее наполнение на примере первого тома «Русского семантического словаря» под ред. Н.Ю. Шведовой (1998). Рассматриваются возможности ее применения в лингвистических исследованиях и других видах деятельности.
Ключевые слова: лингвистическая база данных; имя существительное; отрицательно-оценочная лексика; стилистическая помета; словарь; юридическая лингвистика; лингвистическая экспертиза.
Annotation
Linguistic Database of Negative Evaluative Lexis: Concept, Structure, Content
Kristina S. Kochergina, Tomsk State University (Tomsk, Russian Federation).
Keywords: linguistic database; noun; negative evaluative lexis; stylistic label; dictionary; juridical linguistics; linguistic expert examination.
The article is devoted to the Linguistic Database of Negative Evaluative Lexis (Nouns Denoting Person and Group of Persons)” (LDoNEL) which is being developed for linguistic research, in particular, for linguistic expert examination. The aim of this article is to describe LDoNEL's concept, structure and content. The sources for LDoNEL are the dictionaries of the modern Russian language (from late 20th to early 21st centuries). The material for the study were nouns with negative evaluative semantics denoting a person and a group of persons. The nouns were selected from the indicated sources by continuous sampling based on ideographic, semantic (including thematic one) and stylistic principles. A descriptive analytical (general scientific) method with a combination of its techniques was used in the study. The conceptual design method was used in developing LDoNEL. LDoNEL is characterized as follows: according to the type of lexical units, namely, by their part-of-speech affiliation, it contains nouns; according to the lexical semantic description it describes the negative-evaluative component; according to the data source it contains data from dictionaries and information based on them (about thematic groups and indecent forms); according to application it is intended for use in forensic linguistics practice and also can be used for various research and practical purposes. The article describes the structure of LDoNEL, which consist of 11 data tables: the main table of semantic and stylistic characteristics of negative evaluative lexis in the dictionary, and 10 supporting data tables ensuring the coherence and integrity of the data in the main tables: a dictionaries table; a negative evaluative lexical units table; a lexical units types table; a negative evaluative stylistic labels table; a dictionary stylistic labels table; a chronological labels table; a lexical meaning types table; a lexical classes table; a thematic groups table; a table of characteristics of the form of negative evaluation as indecent. Table fields that form the table's structure are listed for each of the tables. The content of LDo-
NEL is presented on the example of the first volume of the Russian Semantic Dictionary (1998) edited by N.Yu. Shvedova which is the basis for the main table of semantic and stylistic characteristics of negative evaluative lexis in the dictionary. The main table contains 1,737 entries relevant to 1,737 negative evaluative nouns denoting a person and a group of persons and their parameters. As a result of the study, a layer of negative evaluative lexis was selected, fixed, systematized, semantically and stylistically described, and a conceptual structure for describing such units was developed and reflected in the LDoNEL format.
Постановка проблемы
При решении теоретических и прикладных задач в лингвистике может возникнуть необходимость обращения к нескольким лексикографическим источникам, например, при производстве лингвистической экспертизы, когда разнородность систем стилистических помет и расхождение в стилистической квалификации лексики в словарях современного русского языка приводят к снижению точности и объективности проводимых с опорой на них исследований [1]. Одним из решений указанной проблемы может стать применение технологии базы данных, позволяющей получать лексикографическую информацию из различных источников в сопоставлении.
Актуальность данного исследования также обусловлена потребностью юридической лингвистики в специализированном инструменте - лексикографическом издании, пригодном для целей лингвистической экспертизы [2], и необходимостью совершенствования информационных технологий в практике производства лингвистической экспертизы [3] в связи с возрастающей ролью информационных технологий в гуманитарных исследованиях и отсутствием опыта применения таковых в данной области. Представление такого лексикографического продукта в виде базы данных позволит реализовать новый подход к проведению лингвистических экспертиз - с использованием средств автоматизации [4].
База данных (БД) - это «упорядоченная совокупность данных, предназначенных для хранения, накопления и обработки с помощью ЭВМ» [5. С. 96]. Под лингвистической БД (ЛБД), соответственно, понимается совокупность систематизированных лингвистических данных.
Цель настоящей статьи заключается в описании концепции, структуры и наполнения ЛБД отрицательно-оценочной лексики, разрабатываемой для проведения лингвистических исследований, в частности, лингвистической экспертизы.
Источниками данной ЛБД являются словари современного русского языка (конца XX - начала XXI в.), при отборе которых учитываются методические рекомендации по производству лингвистической экспертизы и практика применения словарей в качестве лексикографических источников для нее (по данным экспертных заключений). Наполнение разрабатываемой ЛБД представлено на примере первого тома «Русского семантического словаря» под ред. Н.Ю. Шведовой (1998) [6. Т. 1].
Материалом для исследования послужили имена существительные со значением номинации лица и группы лиц и отрицательно-оценочной семантикой, отобранные из указанного словаря методом сплошной выборки. Отбор материала проведен с опорой на идеографический, семантический, стилистический принципы. В исследовании также применен описательно-аналитический (общенаучный) метод с совокупностью его приемов. При разработке ЛБД использован метод концептуального проектирования, состоящий в определении параметров описания единиц информации и связей между ними в соответствии с задачами, для решения которых создается информационно-справочный ресурс.
История вопроса
Технология БД широко применяется в различных сферах, в том числе лингвистике, например, «в типологических и сравнительных, фонетических, лексических, грамматических исследованиях; лексикографии; семантических исследованиях, включая составление тезаурусов; в компьютерной лингвистике и для решения прикладных лингвистических задач (лингводидактических, автоматизированного перевода, автоматического распознавания и синтеза речи)» [7. С. 26]. В работах Н.А. Мишанкиной рассматриваются проблемы, связанные с обработкой информации и созданием информационных систем на основе технологии БД в гуманитарной сфере и, в частности, с применением данной технологии в области филологических (лингвистических) исследований [7, 8]. Исследователь дает историческую справку о существующих БД и предлагает выделять ЛБД в отдельную категорию, подразделяя ее на два типа: полнотекстовые (содержащие полные тексты) и фактографические (содержащие лингвистические единицы различных языковых уровней).
В качестве примера полнотекстовой ЛБД назовем разработанную коллективом Томского государственного университета (Н.А. Мишанкиной, И.В. Тубало- вой, Ю.А. Эмер) БД «Среднеобский фольклор» [8, 9]. Целью создания этой БД является объединение и представление ранее недоступного фольклорного материала народной культуры Сибири в доступном и удобном формате для различных исследований в области антропологии, этнографии, культурологии, лингвистики, истории сибирского региона. В эту БД входят фольклорные тексты на русском языке в различных жанрах, например частушки, загадки, пословицы, считалки, скороговорки.
К первому типу ЛБД также можно отнести электронные библиотеки, текстовые коллекции и корпуса текстов, например, «Национальный корпус русского языка» (ruscorpora.ru), «Томский диалектный корпус» (http://losl.tsu.ru/?q=corpus/demo).
Среди ЛБД второго типа по уровню описания в них языка можно выделить фонетические, морфологические, лексические и синтаксические ЛБД соответственно.
ЛБД, в которых представлены лексические единицы, особенно активно применяются в лексикографической практике для составления как традиционных, так и электронных словарей. А.Н. Баранов сравнивает две технологии создания словаря (традиционную и компьютерную), отмечая явное преимущество последней: «Традиционная форма фиксации словарных данных - каталожная карточка, в которой указывается описываемое слово, пример употребления, источник примера, автор, а также различная дополнительная информация. Современные компьютерные технологии позволяют упростить процесс сбора и хранения лексикографической информации, используя вместо обычной картотеки базу данных, записи которой представляют собой аналог традиционной каталожной карточки» [10. С. 82]. Однако лексические ЛБД используются не только при создании новых словарей, но и применяются в различных лингвистических исследованиях, поскольку ЛБД как самостоятельный формат представления лексикографической информации обладает рядом преимуществ перед словарями: позволяет накапливать, хранить, систематизировать лингвистическую информацию и осуществлять быстрый поиск в ее пределах, а также имеет открытую структуру для внесения изменений, непрерывно происходящих в языковой системе [11].
Рассмотрим известные на данный момент проекты фактографических ЛБД, содержащих единицы лексического уровня и ориентированных на описание лексической семантики.
БД «Звучание» (Н.А. Мишанкина, Томский государственный университет) включает глаголы, содержащие в своей семантике компонент «звук», отражает лексико-семантическое поле «Звучание» и предусматривает возможность пополнения аудио- или видеоматериалами, демонстрирующими тип звучания, его субъект и связанное с ним действие [7].
БД метафорической терминологии ориентирована на выявление универсальных метафорических моделей, отражающих концептуальные метафоры, являющиеся ключевыми для русского научного дискурса. Авторы (Н.А. Мишанкина, Е.А. Панасенко, Томский политехнический университет) указывают, что разрабатываемая БД может применяться для решения ряда частных задач, например, для выявления наиболее востребованных в терминообразовании лексических единиц национального языка. Материалом для создания этой БД послужили терминологические словари различных научных областей: биологии, геологии, информатики, лингвистики, медицины, психологии, социологии, философии, экологии. Общее количество проанализированных источников составило 65, а количество выявленных метафорических терминологических единиц - около 2 000. Центральной таблицей этой БД является «Лексическая единица», вспомогательными - «Метафорическая модель» и таблицы предметных областей, отражающие метафорическую терминологию конкретной предметной области [12].
Психолингвистическая БД (проект Томского государственного университета: З.И. Резановой, А.А. Миклашевского) используется для описания образно-перцептивного компонента языковой семантики и позволяет применять статистические методы для анализа слабоструктурированной семантической информации. Эта БД содержит полученную в ходе проведения психолингвистического эксперимента информацию о 506 как конкретных, так и абстрактных существительных, а именно об их связи с модально - стями восприятия (зрением, слухом, вкусовыми, обонятельными и осязательными ощущениями) и другую дополнительную информацию, например, о субъективном возрасте усвоения слова [13].
БД прагматически маркированной лексики разрабатывается коллективом Новосибирского государственного педагогического университета: Т.А. Трипольской, Е.Ю. Булыгиной, В.Д. Черняк (г. Санкт- Петербург), В.А. Ефремовым (г. Санкт-Петербург), М.А. Лаппо, Е.Г. Басалаевой, Л.Н. Храмцовой, И.И. Сажениным. Демонстрационная версия этой БД, включающая в себя около 400 единиц, доступна в интернете (spml.ipmip.nspu.ru). Согласно представленному в статьях [14, 15], описанию БД формально и содержательно делится на две части. В первой части представлены словарные статьи следующих классических и современных словарей русского языка: «Толковый словарь русского языка» под ред. Д.Н. Ушакова (1935-1940), «Словарь современного русского литературного языка» в 17 т. (1950-1965), «Словарь русского языка» в 4 т. под ред. А.П. Евгеньевой (1981-1984), «Толковый словарь русского языка» С.И. Ожегова и Н.Ю. Шведовой (1999), «Толковый словарь русского языка конца ХХ века. Языковые изменения» под ред. Г.Н. Скляревской (1998), «Большой толковый словарь русского языка» под ред. С.А. Кузнецова (1998). Вторая часть БД представляет собой словарные статьи «Словаря прагматически маркированной лексики», разработанного авторами- составителями проекта, и включает в себя толкование, иллюстративный материал и подробное описание прагматической зоны значения слова (эмоциональная оценка, идеологический, гендерный, социально- статусный, возрастной, национально-культурный компоненты) с опорой на материалы «Национального корпуса русского языка». Более подробно структура БД прагматически маркированной лексики описывается в работе [16], где также представлены принципы, лежащие в основе создаваемой БД, критерии отбора языковых единиц, их лексикографическая интерпретация, разработанная система помет, типизация лексикографического комментария. Здесь описывается поисковая система данной БД, при этом техническая сторона ее создания характеризуется в работе [17], в которой дается описание двух таблиц БД: первой, хранящей заголовки словарных статей, и второй, содержащей собственно тексты словарного описания.
Словарная БД, фрагмент которой доступен в сети Интернет (ruslex-encode.ru), создается в Институте лингвистических исследований РАН (Е.В. Пуриц- кая, Д.И. Панков). В основе этой БД лежат данные из «Большого академического словаря русского языка» (2004-2014, издание продолжается), а также других академических словарей, из которых извлекаются функционально-стилистические, специальные, динамические пометы при словах с момента их первой фиксации. Словарная БД предназначена для предоставления справочной информации о стилистической характеристике лексики в ее историческом развитии [18].
Проведенный анализ позволяет сделать вывод о том, что каждая из рассмотренных ЛБД создается для решения конкретной исследовательской задачи, и следовательно, они различаются по ряду критериев, на основании чего можно выделить следующие подтипы ЛБД:
- по типу лексических единиц, а именно по их частеречной принадлежности: ЛБД, содержащие глаголы (БД «Звучание»), имена существительные (психолингвистическая БД, БД прагматически маркированной лексики), единицы нескольких частей речи (словарная БД); а также по их сфере употребления: ЛБД, содержащие специальную лексику (БД метафорической терминологии);
- по аспекту описания лексической семантики: ЛБД, в которых описывается семантический компонент «звук» (БД «Звучание»), метафорическая семантика (БД метафорической терминологии), образноперцептивный компонент (психолингвистическая БД), прагматический макрокомпонент (БД прагматически маркированной лексики), нормативно-стилистический компонент в динамическом аспекте (словарная БД);
- по источнику данных: ЛБД, содержащие данные нескольких типов (БД «Звучание»), экспериментальные данные (психолингвистическая БД), словарные данные (БД метафорической терминологии, БД прагматически маркированной лексики, словарная БД);
- по области применения: ЛБД, предназначенные для различных исследовательских целей (БД «Звучание», БД прагматически маркированной лексики), исследования терминологии (БД метафорической терминологии), психолингвистических исследований (психолингвистическая БД), применения в лексикографической практике (словарная БД).
В рамках данного исследования также проведен поиск ЛБД, зарегистрированных в Федеральном институте промышленной собственности (new.fips.ru/ iiss), результаты которого свидетельствуют об отсутствии не только ЛБД отрицательно-оценочной лексики, но и специализированных ЛБД, предназначенных для целей лингвистической экспертизы.
***
Таким образом, одним из продуктивных направлений на пересечении прикладной лингвистики и современной лексикографии является разработка ЛБД, применение которых позволяет как решать ряд новых, так и повышать эффективность решения традиционных для лингвистики задач. Использование технологии БД в лингвистических (и в целом - гуманитарных) исследованиях способствует не только удобному представлению материалов и их объединению в единую структуру, но и повышению эффективности работы с ними за счет возможности использования средств машинной обработки, а также открывает новые перспективы для дальнейших исследований на основе созданных БД или с их использованием.
1. Концепция лингвистической базы данных отрицательно-оценочной лексики.
Представим разрабатываемую в рамках данного исследования фактографическую ЛБД, содержащую лексические единицы - «Лингвистическую базу данных отрицательно-оценочной лексики (имена существительные со значением номинации лица и группы лиц)» [19] (далее - ЛБД ООЛ), основные принципы проектирования которой описаны в [20].
ЛБД ООЛ представляет собой совокупность систематизированных лингвистических данных - лексико-семантических единиц (ЛСЕ) и их параметров. Под ЛСЕ понимается лексическая единица в конкретном значении, а под ее параметрами - значимые семантические, стилистические и другие характеристики.
ЛБД ООЛ разрабатывается для применения в практике лингвистической экспертизы, объектом которой являются конфликтные тексты трех видов: тексты-неудачи, тексты-манипуляторы, тексты-злоупотребления (в терминологии О.Н. Матвеевой [21]). Для текстов-злоупотреблений (собственно конфликтных текстов в узком смысле) характерно наличие оценочных лексических единиц, выражающих отрицательное отношение субъекта оценки к объекту оценки, которым, как правило, является лицо и группа лиц.
Исходя из этого, на данный момент в ЛБД ООЛ включены ЛСЕ с отрицательно-оценочной семантикой, представляющие собой имена существительные (в том числе эквивалентные им единицы) со значением номинации лица и группы лиц. В фокусе данного исследования находятся имена существительные, поскольку, несмотря на то, что семантика оценки может быть выражена любой частью речи, именно существительные «характеризуют объект, выявляя основание оценки и делая оценочное суждение более категоричным: эмоциональные оценки непосредственно приписываются объекту, а не передаются через характеристику его действий или свойств. Глагол, например, относит оценочную характеристику к определенному временному промежутку, прилагательное переносит акцент с лица на его свойства» [22. С. 132]. В перспективе возможно ее пополнение ЛСЕ других частей речи (например, глаголами со значением действия и состояния лица, именами прилагательными со значением свойства и качества лица), а также ЛСЕ с другими семантическими компонентами, например, положительно-оценочным.
В ЛБД ООЛ содержится семантическая и стилистическая (отрицательно-оценочная) информация о ЛСЕ, зафиксированная в толковании и при помощи стилистических помет (СП), извлеченная из лексикографических источников. Помимо словарных данных в ЛБД ООЛ содержится определенная на их основе информация о принадлежности ЛСЕ к тематическим группам и о возможности охарактеризовать форму негативной оценки, выраженной при помощи ЛСЕ, как неприличную.
Одним из принципов составления ЛБД ООЛ является опора на авторитетные (в том числе отобранные с учетом методических рекомендаций и практики производства лингвистической экспертизы) лексикографические издания, поскольку именно этот вид источников признается наиболее надежным [23] и единственным легитимным [24] для применения в экспертной практике.
На данный момент ЛБД ООЛ включает одно наименование лексикографического источника - толково-идеографический словарь современного русского литературного языка - первый том «Русского семантического словаря» (РСС) под ред. Н.Ю. Шведовой (1998). При этом представляется необходимым добавление в ЛБД ООЛ данных из словарей разных типов (об этом см., например, в [25, 26]). Также предполагается, что при достаточном обосновании в ЛБД ООЛ могут быть включены данные из источников другого вида, например, результаты экспериментальных исследований обыденного понимания неприличной формы.
Отметим, что представление данных из нескольких источников в формате ЛБД позволяет при проведении лингвистических исследований (как теоретических, так и практических, в том числе при производстве лингвистической экспертизы) не только отображать информацию из каждого источника в более удобном (структурированном) для анализа виде, но и сопоставлять ее из нескольких, тем самым объективируя результаты исследований.
ЛБД ООЛ планируется разместить в открытом доступе в интернете, возможно использование ЛБД ООЛ в виде компьютерной программы (приложения), а также подключение ЛБД ООЛ в качестве модуля к программам автоматической обработки текстов. На сайте и в программе (приложении) будут доступны два варианта работы пользователя с ЛБД ООЛ через удобный, интуитивно понятный интерфейс: поиск ЛСЕ в ЛБД ООЛ по введенному пользователем в поисковую строку заголовочному слову и поиск (сортировка, фильтрация, группировка) по выбранным пользователем параметрам, например, по алфавиту (по аналогии со словарем), тематическим группам, стилистическим пометам. Так, выбрав в качестве поискового параметра СП бран., пользователь получит список представленных в ЛБД ООЛ ЛСЕ, маркированных соответствующей СП. Особенность данной ЛБД заключается также в том, что она может быть применена для автоматизированного поиска отрицательнооценочной лексики в конфликтных текстах [27], что особенно актуально для исследования текстов большого объема.
Содержащиеся в ЛБД ООЛ данные представляют практический интерес в первую очередь для лингвистов-исследователей, изучающих языковые явления на материале конфликтных текстов, и лингвистов- экспертов. Например, ЛБД ООЛ может применяться как инструмент исследования при решении вопросов о негативной оценке лица и группы лиц по делам об оскорблении, оскорблении представителя власти, неуважении к суду, оскорблении чувств верующих (поскольку содержит информацию о возможности охарактеризовать форму негативной оценки, выраженной при помощи ЛСЕ, как неприличную), а также по делам о клевете, по делам, связанным с экстремистской деятельностью (поскольку содержит информацию о принадлежности ЛСЕ к тематическим группам) и др. Кроме того, ЛБД ООЛ может быть востребована как информационно-справочный ресурс не только специалистами и экспертами, но и следователями, прокурорами, судьями, адвокатами и др.
***
Таким образом, в соответствии с подтипами ЛБД (выделенными выше при описании известных на данный момент проектов), ЛБД ООЛ можно охарактеризовать следующим образом: по типу лексических единиц, а именно по их частеречной принадлежности - ЛБД ООЛ содержит имена существительные; по аспекту описания лексической семантики - в ЛБД ООЛ описывается отрицательно-оценочный компонент; по источнику данных - ЛБД ООЛ содержит данные нескольких типов (словарные данные и определенную на их основе информацию: о тематических группах, к которым относятся ЛСЕ, и о возможности охарактеризовать форму выраженной при помощи ЛСЕ негативной оценки как неприличную); по области применения - ЛБД ООЛ предназначена для применения в лингвоэкспертной практике, а также может быть использована для различных исследовательских и практических целей.
2. Структура лингвистической базы данных отрицательно-оценочной лексики.
«Для создания и ведения Б[аз] д[анных] (обновления, обеспечения доступа к ним по запросам и выдачи их пользователю)» [5. С. 96] используются специализированные программы - системы управления базами данных (СУБД). А.Н. Баранов отмечает, что в настоящее время нет СУБД, предназначенных для лингвистических целей, однако для них пригодны существующие, например, D-Base, ACCESS, FOX-Base, PARADOX [10. С. 82]. Настоящая ЛБД выполнена в реляционной СУБД Microsoft Access 2016, входящей в состав пакета Microsoft Office. Выбор данной программы обусловлен ее удобным графическим интерфейсом и наличием широкого спектра возможностей.
БД состоят, как правило, из нескольких взаимосвязанных таблиц (например, БД метафорической терминологии включает в себя три таблицы: одну основную и две вспомогательные), в которых содержатся данные, распределенные по строкам (записям) и столбцам (полям). Каждая запись представляет собой совокупность значений нескольких полей, которые в зависимости от своей функции содержат данные разных типов, например, текстовые, числовые, гиперссылки, вложения.
Рис. 1 Схема данных ЛБД ООЛ
ЛБД ООЛ состоит из 11 таблиц данных: основная таблица семантико-стилистической характеристики отрицательно-оценочных слов в словаре, например, Semantic_Stylistic_RSS для РСС, и 10 таблиц, относящихся к вспомогательным и обеспечивающих связность и целостность данных в основных таблицах: таблица лексикографических источников Dictionaries List; таблица отрицательно-оценочных лексических единиц All_Lexical_Units_List; таблица типов лексических единиц LexicalUnitsTypes; таблица отрицательно-оценочных СП StylisticLabelsList; таблица отрицательно-оценочных СП в словаре, например, StylisticLabelsRSS для РСС; таблица хронологических помет Chrono_Labels_List; таблица типов лексического значения Mean_Types_List; таблица лексических классов Lexical_Classes_List; таблица тематических групп Thematic_Groups_List; таблица характеристики формы негативной оценки как неприличной Indecent Form.
В таблице Dictionaries_List зафиксирован список лексикографических источников, информация из которых включена в ЛБД ООЛ.
Таблица All_Lexical_Units_List представляет собой сводный перечень всех лексических единиц с отрицательно-оценочной семантикой (на данный момент - со значением номинации лица и группы лиц) и
При этом основные таблицы семантико-стилистической характеристики отрицательно-оценочных слов в словаре и вспомогательные таблицы отрицательно-оценочных СП в словаре создаются для каждого последующего лексикографического источника, данные из которого включаются в ЛБД ООЛ, а такие таблицы, как DictionariesList, All_ Lexi- calUnitsList, LexicalUnitsTypes, Lexical_Classes_ List, Thematic_Groups_List, являются таблицами открытого типа, т.е. пополняются записями и полями при добавлении в ЛБД ООЛ новых данных, в том числе из других источников.
По аналогии со словарем в ЛБД можно выделить макроструктуру, которая представляется в виде схемы данных, отображающей связи между таблицами, и микроструктуру - структуру каждой таблицы данных. Отметим, что для ЛБД, содержащих лексические единицы и извлеченную из лексикографических источников информацию о них, а также предназначенных для применения в лексикографической практике, характерна такая структура таблиц, которая соотносима со структурой словарной статьи. Так, например, в ЛБД ООЛ поле, содержащее ЛСЕ, соотносится с так называемой «левой частью» словарной статьи (зоной заглавного слова), а ряд других полей формирует так называемую «правую часть» словарной статьи (зоны помет, толкования, комментариев).
На рис. 1 приведена схема данных (логическая модель), на которой представлены все таблицы ЛБД ООЛ и при помощи линий отображены связи между ними (связи идут от обозначенных как «1» полей к обозначенным как «да» полям), а также знаком «+» отмечены те поля, которые могут содержать более одного значения.
их значений, зафиксированных во всех словарях- источниках и представленных отдельными записями в ЛБД ООЛ в качестве ЛСЕ.
В таблице Lexical_Units_Types перечислены типы лексических единиц, например, имя существительное, устойчивое сочетание (фразеологическое выражение, идиома), поговорка, пословица.
Таблица Stylistic_Labels_List создана в виде списка отрицательно-оценочных СП с приведением толкования их значения (подробнее об отборе СП, маркирующих отрицательно-оценочную семантику, см. в [1]). Кроме того в данную таблицу включены кванторы типа также, иногда, часто, чаще, теперь, сочетание СП с которыми уточняет стилистическую (в частности, отрицательно-оценочную) характеристику слов.
В таблицах отрицательно-оценочных СП, формируемых для каждого словаря-источника ЛБД ООЛ, (например, в таблице Stylistic_Labels_RSS для РСС) приводятся отрицательно-оценочные СП в том виде, в котором они представлены в словарях-источниках, поскольку в них отмечается наличие разных вариантов условных обозначений одной и той же отрицательно-оценочной СП, а также встречаются комбинированные СП (например, образованные при помощи дефиса), СП в скобках, СП в сочетании с кванторами (подробнее об особенностях стилистической квалификации слов в словарях см. в [1]).
Таблица Chrono_Labels_List содержит варианты хронологических помет, используемых для временной характеристики слов в словарях (подробнее об этом см., например, в [1]).
В таблице Mean_Types_List содержится информация о типах лексического значения: прямом и переносном.
Таблица Lexical_Classes_List отражает лексические классы, к которым относятся ЛСЕ, например, для ЛСЕ со значением номинации лица и группы лиц выделены следующие лексические классы: «Лицо», «Группа лиц», «Лицо и группа лиц».
Таблица Thematic_Groups_List содержит список тематических групп, по которым распределены ЛСЕ с отрицательно-оценочной семантикой (на данный момент - со значением номинации лица и группы лиц). Данный список сформирован с опорой на выделенные в РСС лексико-семантические множества, подмножества, группы, подгруппы и ряды.
Таблица Indecent_Form описывает возможность охарактеризовать форму негативной оценки (на данный момент - лица и группы лиц), выраженной при помощи ЛСЕ, как неприличную в трех вариантах: «можно», «вероятно», «нельзя», что определено на основании анализа зафиксированных в РСС СП при ЛСЕ.
Семантико-стилистическая характеристика отрицательно-оценочных слов в словарях дается в основных таблицах ЛБД ООЛ, формируемых отдельно для каждого словаря-источника, (например, в таблице Semantic_Stylistic_RSS для РСС). В основных таблицах ЛБД ООЛ каждая запись соответствует ЛСЕ с набором ее параметров, а каждое поле - единице информации об этой ЛСЕ, ее параметру (например, толкованию, типу значения, лексическому классу).
Каждая из таких таблиц имеет общую структуру и содержит следующие поля: No - порядковый номер записи в таблице; Lexical_Semantic_Unit - отрицательно-оценочная ЛСЕ; StylisticLabel - отрицательно-оценочная СП при ЛСЕ (выбирается, например, из таблицы StylisticLabelsRSS для РСС); Chrono Label - хронологическая помета при ЛСЕ (выбирается из таблицы ChronoLabelsList); Mean Type - тип значения ЛСЕ (выбирается из таблицы MeanTypesList); Definition - толкование ЛСЕ; Link - отсылка к семантически близкой, тождественной, равнозначной ЛСЕ (выбирается, например, из таблицы SemanticStylisticRSS для РСС); Comment - комментарий к толкованию ЛСЕ; LexicalClass - лексический класс, к которому отнесена ЛСЕ (выбирается из таблицы LexicalClassesList); ThematicGroup - тематическая группа, в которую включена ЛСЕ (выбирается из таблицы ThematicGroupsList); Inde- centForm - информация о возможности или невозможности охарактеризовать форму негативной оценки, выраженной при помощи ЛСЕ, как неприличную (выбирается из таблицы IndecentForm); Page Number - номер страницы словаря-источника, на которой расположена ЛСЕ.
Отметим, что в поле Stylistic Label может быть выбрано несколько условных обозначений СП (с учетом их возможных вариантов, комбинаций, сочетаний, представленных в словаре), что связано с особенностями стилистической характеристики слов в словарях, когда при одном слове может насчитываться до пяти отрицательно-оценочных СП (подробнее об этом см. в [1]); а также в поле Link может быть внесено более одной семантически близкой или тождественной ЛСЕ, что обусловлено перечислением нескольких синонимов при синонимическом толковании слов в словарях-источниках.
***
Таким образом, рассмотрена структура ЛБД ООЛ и описаны связи между формирующими ее таблицами, в частности, для SemanticStylisticRSS как одной из основных таблиц семантико-стилистической характеристики слов в РСС и Stylistic Labels RSS, Chrono Labels List, Mean Types List, Lexical Classes List, Thematic Groups List, Indecent_ Form, предназначенных для ее наполнения, а также ряда других вспомогательных таблиц.
3. Наполнение лингвистической базы данных отрицательно-оценочной лексики.
При заполнении основных таблиц данных ЛБД ООЛ - таблиц семантико-стилистической характеристики отрицательно-оценочных слов в словарях - из словарных статей лексикографических источников извлекаются следующие данные: отрицательно оценочная ЛСЕ (на данный момент - со значением номинации лица и группы лиц); отрицательнооценочная СП к ней при наличии; хронологическая помета к ней при наличии; семантическая помета к ней в случае переносного значения ЛСЕ; толкование значения ЛСЕ; в случае отсылочного и синонимического толкования из него выделяется семантически близкая, тождественная, равнозначная ЛСЕ; комментарий к толкованию при наличии.
Помимо собственно словарных данных в ЛБД ООЛ вносится информация о лексическом классе, к которому относится ЛСЕ; тематической группе, в которую входит ЛСЕ; возможности охарактеризовать как неприличную форму негативной оценки, выраженной при помощи ЛСЕ; номере страницы лексикографического издания, на которой располагается словарная статья, посвященная ЛСЕ.
Опишем наполнение данными одной из основных таблиц ЛБД ООЛ на примере первого тома РСС.
Таблица Semantic_Stylistic_RSS содержит 1 737 записей, соответствующих 1 737 отобранным из РСС отрицательно-оценочным ЛСЕ со значением номинации лица и группы лиц и их параметрам, и имеет общую для всех основных таблиц ЛБД ООЛ структуру, которая представлена выше. Охарактеризуем наполнение каждого поля данной таблицы.
В поле No указаны уникальные коды, являющиеся порядковыми номерами записей, а следовательно, и ЛСЕ, под которыми они внесены в данную таблицу с соблюдением идеографического принципа РСС: ЛСЕ сгруппированы по семантике и даны в алфавитном порядке в пределах каждой лексико-семантической группы.
Код является идентификатором записи в пределах данной таблицы, следовательно, отдельные отрицательно-оценочные значения одного многозначного слова зафиксированы как самостоятельные ЛСЕ под разными кодами в следующих случаях:
- отрицательно-оценочные значения многозначного слова даны в разных словарных статьях и отнесены к разным тематическим группам в РСС, например, для многозначного слова Быдло создано две записи: 1 765 Быдло (презр.) `люди, бессловесно выполняющие для кого-н. тяжелую работу' и 1 829 Быдло (бран.) `о людях из низших социальных слоев'2;
- отрицательно-оценочные значения многозначного слова приведены в одной словарной статье в пределах одной тематической группы в РСС, например, для многозначного слова Сборище создано две записи: 1 749 Сборище (неодобр.) `беспорядочное скопление людей' и 1 750 Сборище `собрание людей (часто нелегальное)';
- в отрицательно-оценочном значении можно выделить две части, на что указывает употребление в толковании сочетания союзов «а также», например, для слова Кикимора (также бран.) `человек, имеющий смешной и нелепый вид, а также некрасивая, непривлекательная женщина' создано две записи: 1 545 Кикимора (также бран.) `человек, имеющий смешной и нелепый вид' и 1 546 Кикимора (также бран.) `некрасивая, непривлекательная женщина'.
Кроме того, в ЛБД ООЛ как самостоятельные ЛСЕ зафиксированы:
- иллюстративные речения, которые получают стилистическую характеристику, отличную от характеристики заглавного слова, а также получают собственное толкование или развивают дополнительный (переносный) смысловой оттенок [6. С. XX], например, созданы такие записи: 1 812 Беззащитное существо (также ирон.) `живая особь, человек или животное', 1 316 Бог наказал `о том, у кого случилась неприятность, кому не повезло, как будто бы в наказание за какую-то его вину, провинность', 1 563 Падший ангел (также перен.) `о грешнике';
- приведенные в так называемой заромбовой части словарной статьи устойчивые сочетания (фразеологические выражения и идиомы), «требующие собственного толкования и - в случае стилистического расхождения с заглавным словом - собственной стилистической характеристики» [6. С. XX], например, созданы такие записи: 7 Человек в футляре `человек, который замкнулся в кругу своих узких интересов, боится всего нового (по названию рассказа А. Чехова)' и 483 Лиса Патрикеевна (пренебр.) `то же, что Лиса'' (см. 482 Лиса `хитрый и льстивый человек');
- «ближайшие производные слова, мотивированные данным словозначением» [6. С. XX], в случае их отличия от производящего слова в стилистической характеристике, например, для слова Жучок, производного от слова Жук (см. 467 Жук (неодобр.) `ловкий человек, плут'), создана запись 468 Жучок (уменьш.- унич.) `то же, что Жук\ при этом производное слово представлено как новая ЛСЕ, для которой в поле Definition приведена идентифицирующая дефиниция «то же, что», а в поле Link указано производящее слово.
Также в ЛБД ООЛ созданы отдельные записи в случае наличия в зоне заглавного слова двух вариантов одной ЛСЕ, когда:
- оба варианта связаны союзом «и», например, для Неумеха и Неумёха создано две записи: 86 Неумеха (неодобр.) `человек, к-рый ничего не умеет делать или делает все плохо' и 87 Неумёха `то же, что Неумеха' - при этом второй вариант (после союза «и») представлен как новая ЛСЕ, для которой в поле Definition приведена идентифицирующая дефиниция «то же, что», а в поле Link указан первый вариант (перед союзом «и»);
- второй вариант присоединен при помощи союза «или», например, для Фома неверный или неверующий создано две записи: 209 Фома неверный `человек, к- рый упорно стоит на своем, не верит очевидному (по евангельской притче об апостоле Фоме, к-рый не хотел верить в воскресение Иисуса Христа до тех пор, пока не прикоснется к его ранам)' и 210 Фома неверующий `то же, что Фома неверный' - при этом второй вариант (после союза «или») представлен как новая ЛСЕ, для которой в поле Definition приведена идентифицирующая дефиниция «то же, что», а в поле Link указан первый вариант (перед союзом «или»);
- второй вариант помещен в скобки, например, для Красна (красная) девица создано две записи: 128 Красна девица (ирон.) `о чересчур скромном, застенчивом мужчине' и 129 Красная девица `то же, что Красна девица' - при этом второй вариант (в скобках) так же представлен как новая ЛСЕ, для которой в поле Definition так же приведена идентифицирующая дефиниция «то же, что», а в поле Link так же указан первый вариант (без скобок).
Наполнение поля Lexical_Semantic_ Unit составляет 1 737 ЛСЕ, отобранных из РСС. В выборку вошли имена существительные и эквивалентные им единицы со значением номинации лица и группы лиц с отрицательным компонентом в денотативном значении, например, 1 292 Противник `враг, недруг', 1 220 Доносчик `человек, к-рый доносит на кого-н., тайно обвиняет кого-н. перед властями, начальством', - и с отрицательно-оценочным коннотативным компонентом значения, зафиксированным как в толковании, например, 1 307 Бракодел `недобросовестный работник, допускающий брак в своей работе', 2 Бумажная душа `о бездушном чиновнике, бюрократе', - так и с помощью СП, например, 1354 Аппаратчик (часто не- одобр.) `служащий какого-н. управления, руководящей организации, аппарата', 1301 Подельник (не- одобр.) `человек, участвующий в одном, общем с кем- н. деле'.
В общей сложности из РСС в ЛБД ООЛ (а именно в таблицу SemanticStylisticRSS) включено 1 676 имен существительных (что составляет 96,5% от общего числа включенных единиц), а также 61 устойчивое сочетание (фразеологические выражения и идиомы), 4 пословицы и 2 поговорки (всего 3,5%).
При наполнении поля Stylistic_Label используются условные обозначения, передающие названия отрицательно-оценочных СП из системы помет, принятой в РСС, список которых представлен во вспомогательной таблице StylisticLabelsRSS. Данное поле заполнено для ЛСЕ, обладающих стилистической характеристикой, зафиксированной в РСС при помощи отрицательно-оценочных СП, при этом учтено их количество при ЛСЕ, комбинации СП, сочетания СП с кванторами. Так, в РСС отмечается наличие двух отрицательно-оценочных СП при ЛСЕ, встречаются комбинации СП груб. бран. и презр. бран., возможны сочетания СП с кванторами. Отметим, что если в РСС отрицательно-оценочные СП при ЛСЕ отсутствуют, то данное поле остается незаполненным (ему присваивается значение пустой строки).
В таблице SemanticStylisticRSS насчитывается 720 ЛСЕ (что составляет 41,5% от их общего числа), обладающих стилистической характеристикой, зафиксированной при помощи отрицательно-оценочных СП: из них с СП ирон. - 86, неодобр. - 142, пренебр. - 163, унич. - 13, презр. - 160, груб. - 35, бран. - 197, а также с комбинациями СП груб. бран. - 18, презр. бран. - 2. Отметим, что из числа стилистически маркированных при 104 ЛСЕ (14,4%) имеется две отрицательно-оценочные СП, что свидетельствует об их полифункциональном употреблении.
Поле Chrono_Label данной таблицы заполняется информацией о выходящих (при помощи хронологической пометы устар.) и вышедших (при помощи хронологической пометы стар.) из употребления ЛСЕ, что дополняет их основную стилистическую (отрицательно-оценочную) характеристику. В данном поле для ЛСЕ указана их временная характеристика (при наличии таковой в РСС), для чего использованы условные обозначения хронологических помет из списка, представленного во вспомогательной таблице ChronoLabelsList. Отметим, что если ЛСЕ входят в активный запас, то данное поле остается незаполненным (ему присваивается значение пустой строки).
В таблице Semantic Stylistic RSS насчитывается 1 622 ЛСЕ (что составляет 93,4% от их общего числа), находящихся в активном запасе; 108 ЛСЕ (6,2%), выходящих из употребления, например, 340 Мироед (презр.; устар.) `Человек, живущий чужим трудом, паразит'; 7 ЛСЕ (0,4%), вышедших из употребления, например, 682 Лиходей (также бран.; стар.) `то же, что Злодей'.
В поле Mean_ Type делается отметка в виде семантической пометы перен. (выбирается из списка типов значения, представленного во вспомогательной таблице MeanTypesList) в случае зафиксированного в РСС переносного значения ЛСЕ, что уточняет ее основную семантическую характеристику - значение номинации лица и группы лиц. Отметим, что если значение ЛСЕ прямое, то данное поле остается незаполненным (ему присваивается значение пустой строки).
В таблице Semantic_Stylistic_RSS насчитывается 1 500 ЛСЕ (что составляет 86,4% от их общего числа) в прямом значении и 237 ЛСЕ (13,6%) в переносном значении, например, 40 Бревно (пренебр., также бран.; перен.) `Глупый и грубый человек', 52 Колпак (пренебр., также бран.; перен.) `Глупый, недалекий, простоватый человек', 103 Щенок (пренебр., бран.; перен.) `Мальчишка, молокосос'.
В поле Definition приводятся толкования ЛСЕ из РСС. Для многозначных слов, зафиксированных в РСС в одной или разных тематических группах, отбирается только то значение (реже - несколько значений), которое выражает семантику отрицательной оценки, и фиксируется в качестве толкования отрицательно-оценочной ЛСЕ. Так, содержащиеся в данной таблице 1 737 ЛСЕ представляют собой 1 612 многозначных слов в их конкретных значениях.
Помимо собственно семантического толкования в РСС используется два приема: синонимическое толкование и отсылочное (опосредованное). Опишем особенности заполнения поля Definition в данных случаях.
Приведенное в данном поле синонимическое толкование для ЛСЕ может быть как единственным для нее, например, 1 548 Страхолюдина `урод, страшилище' ; так и дополнением к семантическому толкованию, например, 352 Сачок `человек, отлынивающий от работы, бездельник, лентяй'. Отметим, что наряду с заполнением данного поля перечисленные в толковании синонимичные ЛСЕ дублируются в поле Link (при условии их наличия в данной таблице).
В таблице Semantic Stylistic RSS 439 ЛСЕ (что составляет 25,3% от их общего числа) толкуется через другие семантически близкие или тождественные им единицы.
Отсылочное (опосредованное) толкование в РСС семантически равнозначных ЛСЕ с помощью идентифицирующей дефиниции «то же, что» фиксируется аналогичным образом: в данном поле приводится указанная дефиниция с внесением в поле Link той ЛСЕ, отсылка к которой дана в толковании. В данной таблице при отсылочном (опосредованном) толковании встречаются отсылки также к тем ЛСЕ, которые в ней не представлены, например, Бабка (иногда пренебр.) `то же, что Бабушка', Студентик (пренебр.) `то же, что Студент'. В приведенных примерах определяемые ЛСЕ являются отрицательно-оценочными, а определяющие - нет (следовательно, не включены в ЛБД ООЛ), однако так как определяемые ЛСЕ в РСС не имеют собственного толкования кроме идентификации «то же, что», то толкования для таких отрицательно-оценочных ЛСЕ, как Бабка, Студентик приводятся от соответствующих нейтральных ЛСЕ Бабушка, Студент, а в поле Link факт отсылки к ним не указывается, например, 1 248 Бабка (иногда пренебр.) `мать отца или матери', 1 339 Студентик (пренебр.) `учащийся высшего учебного заведения'.
В таблице Semantic_Stylistic_RSS 211 ЛСЕ (что составляет 12,2% от их общего числа) не имеют самостоятельного значения, а толкуются через отсылку к другим ЛСЕ, представленным в ней.
В поле Link фиксируются семантические связи между семантически близкими, тождественными, равнозначными ЛСЕ, представленными в ЛБД ООЛ, в случаях их синонимического и отсылочного (опосредованного) толкования в РСС (как представлено выше при описании поля Definition), а также для ближайших производных от заглавного слова и двух вариантов одной ЛСЕ, приведенных в РСС в зоне заглавного слова (как представлено выше при описании поля No). При заполнении данного поля для определяемой ЛСЕ выбирается определяющая ЛСЕ из данной таблицы (или более одной определяющей ЛСЕ, когда в РСС встречается перечисление в толковании к ЛСЕ нескольких синонимов). Отметим, что если такие связи между ЛСЕ отсутствуют, то данное поле остается незаполненным (ему присваивается значение пустой строки).
В таблице SemanticStylisticRSS для 245 ЛСЕ (что составляет 14,1% от их общего числа) установлены семантические связи в виде отсылок к другим ЛСЕ.
Поле Comment содержит извлеченные из словарных статей РСС комментарии к толкованию ЛСЕ, представляющие собой дополнительную информацию, позволяющую уточнять отрицательно-оценоч-ную семантику ЛСЕ. В данном поле представлено несколько типов комментариев, различающихся по своей функции: этимологический комментарий, например, 1 345 Эскулап (ирон.) `врач, лекарь (по имени бога врачевания в древнеримской мифологии)'; приведение первоначального значения, например, 700 Бурбон (презр.; устар.) `грубый, невоспитанный человек, солдафон (первоначально об офицере, выслужившемся из низов)'; указание на локально-временную характеристику, например, 996 Вредитель `человек, к-рому приписывается умышленное нанесение вреда производству (в годы советской власти)'; уточнение объекта отрицательной оценки (его пола, возраста, рода деятельности, других характеристик), например, 1087 Марионетка (перен.) `человек, покорно и слепо действующий по чужой воле (обычно о политическом деятеле)'; уточнение оттенка оценочного значения, например, 1 662 Поросенок (бран.) `употребляется как бранное слово (с оттенком насмешки)'; указание на сферу употребления, например, 1 721 Чернь (презр.; устар.) `низшие слои общества, трудовой народ (в речи аристократов, власть имущих)'; демонстрация лексической сочетаемости, например, 1 811 Оборотень (неодобр.) `о хитром и двуличном человеке (в сочетании: Не человек, а прямо какой-то оборотень)'; указание на особенности функционирования в речи, например, 4 Тип (ирон.) `человек, отличающийся какими-н. характерными свойствами, приметами (обычно с определением)'; определение лексического статуса единицы, например, 1 467 Горбатого могила исправит `о том, чьи недостатки неисправимы (пословица)'; уточнение морфологических характеристик, например, 1 707 Низ `непривилегированные слои общества (во мн. ч.)'. Отметим, что если комментарий к толкованию ЛСЕ в словарной статье РСС отсутствует, то данное поле остается незаполненным (ему присваивается значение пустой строки).
В таблице SemanticStylisticRSS 173 ЛСЕ (что составляет 10% от их общего числа) снабжено комментариями.
В поле Lexical_Class указываются названия лексических классов (выбираются из списка, представленного во вспомогательной таблице Lexical_ Clas- ses_List). Основанием для отнесения ЛСЕ к одному из них является в первую очередь семантика ЛСЕ (ее включенность в РСС в соответствующее лексическое множество), а также наличие семантической пометы собир., свидетельствующей о принадлежности ЛСЕ к разряду собирательных имен существительных, например, 1787 Пьянь (презр.) `Пьяные, пьющие люди'. Отметим, что к классу «Лицо и группа лиц» отнесены ЛСЕ с пометой собир. в сочетании с квантором также, поскольку такие ЛСЕ могут обозначать как отдельное лицо, так и совокупность лиц, например, 65 Полудурье `то же, что Полудурок'.
В таблице Semantic Stylistic RSS представлено 1 621 ЛСЕ (что составляет 93,3% от их общего числа), обозначающих лицо; 109 ЛСЕ (6,3%), обозначающих группу лиц; 7 ЛСЕ (0,4%), обозначающих лицо и группу лиц.
При заполнении поля Thematic_Group для каждой ЛСЕ выбирается название тематической группы (из списка, представленного во вспомогательной таблице ThematicGroupsList), соответствующее тому лексическому множеству, к которому ЛСЕ отнесена в РСС.
...Подобные документы
Понятие и особенности оценочной лексики. Анализ публикаций о теракте Андерса Брейвика, исследование контекстов с положительно и отрицательно окрашенной оценочной лексикой. Выявление сходства и различия в оценке персонажа журналистами и читателями.
курсовая работа [42,1 K], добавлен 27.04.2013Анализ оценочной лексики в материалах, освещающих события на Украине в 2013-2016 году в англоязычных и русскоязычных средствах массовой информации. Примеры использования оценочной лексики при описании происходящего в газетах и информационных порталах.
дипломная работа [179,7 K], добавлен 27.11.2017- Образность как компонент коннотации и функции эмоционально-оценочной лексики в художественном тексте
Образность как компонент коннотации. Функции эмоционально-оценочной лексики в художественном тексте. Источники порождения эмотивности текста. Частные текстовые функции эмотивной лексики.
доклад [12,6 K], добавлен 26.07.2007 Оценочное значение лексики в языке. Компонентное выражение концептов мужественность/женственность, описывающих внешность человека. Лексические единицы с зоонимами. "Оценка человека" - стилистические единицы в разговорно-сленговой сфере английского языка.
курсовая работа [49,2 K], добавлен 06.04.2011Декларативные методы машинной морфологии. Создание базы данных английских словоформ, содержащей полную морфологическую информацию каждой формы. Описание функциональных возможностей системы и взаимодействия ее модулей. Формат входных и выходных данных.
курсовая работа [346,8 K], добавлен 13.05.2015Понятие оценочной лексики, ее исследование в современной лингвистической литературе. Изучение наиболее популярных в детской среде мультфильмов, соотношение лексических единиц с положительной и отрицательной оценкой в речи героев, влияние на речь детей.
курсовая работа [35,6 K], добавлен 14.10.2013Изучение подходов к исследованию фразеологии как самостоятельной лингвистической дисциплины. Характеристика признаков, анализ структуры и выявление отличий фразеологизмов от слов и свободных словосочетаний. Классификация фразеологизмов В.В. Виноградова.
реферат [18,8 K], добавлен 28.08.2011Выборка лексических единиц согласно оценочной шкале утилитарной оценки. Анализ слов, имеющих утилитарную оценку подгруппы "полезный", выбранных методом сплошной выборки с целью сравнения грамматического распределения лексики в русском и английском языках.
реферат [20,6 K], добавлен 27.10.2012Лингвистическая терминология как объект исследования. Теоретические основы описания терминов. Этапы развития лингвистической терминологии, ее формирование посредством описательных грамматик. Словари лингвистических терминов и лингвистические энциклопедии.
дипломная работа [87,1 K], добавлен 25.02.2016Определение стилистических пластов лексики современного французского языка. Понятие, значение лексики ограниченной сферы употребления. Систематизация терминологической и профессиональной лексики, ее функционирование в тексте романе Эмиля Золя "Germinal".
курсовая работа [85,6 K], добавлен 19.03.2014Динамичность лексической системы. Соотношение активного и пассивного запасов лексики. Архаизация русской лексики. Анализ школьных учебников. Понятие и классификация советизмов. Понимание и восприятие хронологически отмеченной лексики школьниками.
дипломная работа [58,0 K], добавлен 27.03.2012Введение основных понятий корпусной лингвистики. Понятие учебного корпуса и лингвистической разметки. Обзор разработок мультимодальных корпусов и изучение их структуры. Создание русско-немецкого подкорпуса. Разметка текстов и аннотирование данных.
курсовая работа [2,0 M], добавлен 20.06.2014- Функционирование сниженной лексики в современном немецком языке на примере художественной литературы
Стратификация лексики современного немецкого языка. Особенности стиля обиходно-бытового общения. Классификация лексики со сниженным значением по шкале Э. Ризель. Анализ лексики со сниженным значением в художественной литературе с позиций теории систем.
дипломная работа [88,2 K], добавлен 29.08.2012 Функции, задачи и стилевые черты публицистики. Наличие в ней общественно-политической, оценочной и неоценочной лексики. Газетно-публицистический стиль и набор языковых средств, характерных для него. Стилистические особенности текстов англоязычной прессы.
курсовая работа [39,2 K], добавлен 21.11.2014Особенности перевода оценочных высказываний. Свойства оценочного предиката. Теория трансформаций Л.С. Бархударова. Переводческие трансформации в оценочных высказываниях. Выбор трансформаций, необходимых для достижения переводческой эквивалентности.
курсовая работа [49,5 K], добавлен 09.05.2011Дискурс предвыборных кампаний как разновидность политического дискурса. Анализ немецкой оценочной лексики разных семантических и структурных типов, используемой при освещении предвыборной кампании в США. Лексические средства оценки в освещении дискурса.
дипломная работа [99,6 K], добавлен 18.11.2017Семантический анализ русской и английской лексики - названий сладостей с точки зрения их формы, цвета, структуры, размера. Описание истории их происхождения, способов приготовления и состава ингредиентов. Сопоставление дефиниции наименований конфет.
реферат [35,1 K], добавлен 22.12.2015Анализ диалектной лексики, обозначающей ландшафт. Историческое распределение диалектизмов по видам. Синонимические отношения между словами этой группы. Взаимосвязь нарицательной и топонимической лексики в говоре Некрасовского района Ярославской области.
курсовая работа [37,0 K], добавлен 03.10.2010Структурные типы слов, семантическая и стилистическая дифференциация лексики. Семантическая дифференциация лексики. Эвфемизм – особая стилистическая фигура. Антонимы. Классификация лексики по сходству формы.
доклад [21,2 K], добавлен 25.08.2006Підходи до визначення військової лексики. Особливості військового сленгу. Аналіз передачі реалій, присутніх в військовій документації армій США та Великої Британії, українською мовою. Класифікація військової лексики з лінгвокраїнознавчої точки зору.
курсовая работа [50,6 K], добавлен 13.12.2013