Главная Коллекция "Revolution" Иностранные языки и языкознание Лингвистические аспекты кросс-языкового реферирования: синтез текстов под управлением предметных онтологий

Лингвистические аспекты кросс-языкового реферирования: синтез текстов под управлением предметных онтологий

Возможность и значимость анализа и синтеза текстов под управлением предметных онтологий. Лингвистические аспекты методики автоматического реферирования, основанной на извлечении знаний из естественно-языковых текстов. Использование когнитивных карт.

Рубрика	Иностранные языки и языкознание
Вид	статья
Язык	русский
Дата добавления	16.01.2018
Размер файла	195,0 K

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Лингвистические аспекты кросс-языкового реферирования: синтез текстов под управлением предметных онтологий

Среди наиболее актуальных и практически значимых технологий в области обработки естественного языка можно назвать анализ под управлением предметных онтологий. Представленный в работе подход позволяет говорить об онтологически-ориентированном синтезе, играющем важную роль, в частности, при решении задачи кросс-языкового реферирования.

Круг проблем, решение которых необходимо в процессе создания прикладной системы кросс-языкового реферирования, в терминах классических задач в области обработки естественного языка можно условно разделить на два подкласса: относящиеся к реферированию как таковому и аналогичные тем, что возникают в процессе автоматического перевода.

Как известно, одним из традиционных вопросов в сфере автоматического перевода является вопрос о возможности и необходимости создания универсального семантического языка, представляющего собой в процессе обработка текста переходную репрезентацию между языком-целью и языком-источником.

В качестве такого средства в рамках рассматриваемой методики кросс-языкового реферирования предлагается использовать когнитивные карты (Cognitive Maps, CMaps), являющиеся разновидностью семантических сетей. Создание универсального семантического языка, избавляющего систему от необходимости построения дополнительного (исходного) реферата на языке-источнике, является не единственным достоинством данного подхода. Использование когнитивных карт - гарант того, что в реферат будет включена только релевантная для пользователя информация, предусмотренная в рамках соответствующей онтологии. В процессе генерации итогового текста используется набор лингвистических шаблонов, аналогичных формальным конструкциям, положенным в основу систем OntosMiner [Ефименко, 2006].

Системы семейства OntosMiner относятся к классу CE-систем (Content Extraction Systems), применяющих в процессе анализа ЕЯ-текстов т.н. Shallow-модели [Soria et al., 2002]. В рамках такого подхода вместо полного синтаксического анализа используется система шаблонов, ориентированных на извлечение сущностей и связей между ними, являющихся экземплярами представленных в онтологии типов. Применение аналогичных принципов при генерации текстов позволяет говорить об автоматическом реферировании на основе лингвистических шаблонов под управлением предметных онтологий. В рамках такого подхода все промежуточные операции могут выполняться на формальных конструкциях-шаблонах, а не на реальных предложениях. Генерация естественноязыковых фрагментов происходит на самом последнем этапе, когда системой получены все данные, необходимые для порождения гладкого и семантически насыщенного текста.

Общее описание алгоритма

Схема алгоритма генерации реферата, от текста-источника до конечного текста, представлена на рис. 1. В рамках данной статьи рассматриваются, главным образом, этапы 4-6 и 11-12. Блоки 2 и 3 относятся к задаче извлечения знаний из коллекции документов. Описанию блоков 7-10 посвящена статья [Khoroshevsky, 2005].

Следует отметить, что рассматриваемая ниже методика создавалась, прежде всего, для европейских языков, а именно английского, немецкого, русского и французского (работа с указанными языками предусмотрена в настоящий момент в системах OntosMiner), однако основные ее принципы представляются верными и для языков принципиально иного строя.

Шаблоны-аналоги

Прежде чем обратиться непосредственно к процессу генерации текста-реферата, необходимо рассмотреть ряд подготовительных этапов.

От NLP к NLP

Важным моментом в работе системы является нахождение шаблонов-аналогов для языка-источника и языка-цели. Под «шаблонами» подразумеваются лингвистические конструкции, представляющие собой средства выражения того или иного типа связей и / или сущностей (объектов онтологии). Последние при этом играют роль актантов семантических отношений (связей). Более частные языковые структуры могут быть обощены до мета-конструкций, рассматриваемых в качестве шаблонов. Такого рода шаблоны коррелируют с различными вариантами выражения того или иного значения в том или ином языке. Часто способы кодирования семантических отношений между объектами можно расположить на некоторой шкале, являющейся, по сути, шкалой эксплицитности выражения предиката. При этом на одном конце шкалы окажутся, например, формы в изъявительном наклонении, а на другом - отглагольные существительные и синтаксические нули. Идея такого рода шкалы происходит из области речевого воздействия и НЛП (Neuro-Linguistic Programming, NLP), в связи с предположением о большем влиянии на сознание слушающего менее эксплицитной информации. Использование подобного рода модели в рамках автоматической обработки естественного языка (Natural Language Processing, NLP - в западной традиции здесь действительно имеет место омонимия терминов) обеспечивает более системный подход к «исчислению» различных способов кодирования той или иной семантики и поиску межъязыковых соответствий.

Размещено на http://www.allbest.ru/

Схема алгоритма кросс-языкового реферирования

Следует упомянуть при этом, что в случае такого подхода исчезает необходимость работать автономно с конкретной языковой парой, поскольку система шаблонов-аналогов позволяет варьировать сочетания языка-источника и языка-цели.

Анализ корпуса языка-источника

Одной из важнейших задач в рамках описываемой технологии является анализ корпуса текстов на языке-источнике. Данный анализ может быть ориентирован на конкретную предметную область. Однако многие конструкции являются универсальными и релевантны для различных предметных областей и жанров. Полученный набор шаблонов включает в себя как относительно простые, так и довольно изысканные способы выражения. Ниже представлена схема одного из шаблонов для семантического отношения «Являться сотрудником», играющего важную роль в целом ряде предметных онтологий (табл. 1).

Табл. 1. Пример лингвистического шаблона (для английского языка)

Cхема шаблона (с комментариями и атрибутами)

Примеры соответствующих фрагментов текста

(

{prepOrg}: одна из возможных конструкций с предлогом

({Organization}): экземпляр объекта типа «Организация»

(({Period} | {StartPoint})?): экземпляр объекта типа «Время»

({Person}): экземпляр объекта типа «Лицо»

(

{beVG} |

{becomeVG} |

({servVG} {As})

): PAST, ACTIVE, INDICATIVE, SG, 3^rd PERS,: одна из возможных для данного шаблона глагольных конструкций

(({Organization}): экземпляр объекта типа «Организация»)?

({JobTitle})): экземпляр объекта типа «Должность»

({prepOrg}: одна из возможных конструкций с предлогом

({Organization}):}): экземпляр объекта типа «Организация»)?

({Period}|{StartPoint})?: экземпляр объекта типа «Время»

Previously, Mr. Curts was Perot Systems' North American Chief Financial Officer, and also served as Treasurer/Head of Business Development.

He was with Goldman Sachs & Co., New York and London from 1980-1983 in the Corporate Finance Department.

Along with Vision, Mr. Jain also co-founded and served as head of operations for Brigade Corporation, a customer support company with 1,300 customer support employees across centers in the U.S., Europe and India.

лингвистический языковой реферирование онтология

Набор шаблонов формирует основу работы системы в рамках задачи извлечения знаний, являясь, таким образом, фильтром для фрагментов входного текста, вовлекаемых в процесс построения когнитивной карты и, как следствие, в генерацию реферата.

Формирование набора шаблонов для языка-цели

Задачу формирования набора шаблонов для языка-цели можно условно разделить на несколько подзадач. Прежде всего, это нахождение точных (или максимально близких) аналогов для конструкций языка-источника. Очевидно, что соответствия такого рода далеко не всегда носят характер взаимно однозначных. Так, например, шаблон для английского языка, представленный выше в Табл. 1, можно сопоставить нескольким русскоязычным шаблонам, что связано, главным образом, с межъязыковыми различиями в порядках слов, системах глагольных времен и наборах падежей (Табл. 2).

Табл. 2. Сопоставление шаблонов языка-источника и языка-цели

Cхемы шаблонов (с комментариями и атрибутами)	Примеры соответствующих фрагментов текста
(({Period} \| {StartPoint})?) ({Person}) ( {beVG} \| ({servVG} {As}) ): ACTIVE, INDICATIVE ({JobTitle})) ({prepOrg} ({Organization})}))?	С декабря 2001 года г-н Клишас является председателем правления компании «Интеррос». (Since 2001, Mr. Klishas is the chairman of the «Interros» board of directors.) В течение последующих нескольких лет служил в структуре МВД в качестве эксперта-криминалиста. (During the next several years he has been serving in the Ministry of Interior sub-division as a forensic expert)
(({Date} \| {StartPoint})?) ({Person}) ({becomeVG}): ACTIVE, INDICATIVE ({JobTitle}) (({Organization})?	В середине 2003-2004 финансового года Хайнц Шиммельбуш становится исполнительным директором. (In 2003-2004 financial year, Hainz Schimmelbush becomes CEO)
ETC…

В подобных случаях шаблон языка-источника может быть, в зависимости от конкретной ситуации, также разбит на несколько или же оставлен в исходном виде. В процессе нахождения шаблонов-соответствий необходимо учитывать лингвистические явления (например, грамматические категории), как общие для различных языков, так и носящие индивидуальный характер В последнем случае значения «недостающих» атрибутов могут быть вычислены на основе других данных, предусмотренных в шаблоне (примером является выбор требуемого падежа на основе информации об управлении глагола, см. раздел 4). Очевидно, что одной из важнейших задач является составление таблицы соответствий глагольных форм, поскольку набор и семантика последних может существенно варьироваться (при этом значимость глагольных образований при анализе семантических отношений между объектами также очевидна). В дополнение к лингвистическим характеристикам, участвующим непосредственно в формировании шаблона, в рамках формального представления различных структур необходимо учесть факторы, «отвечающие» за генерацию «гладкого», естественного текста.

Возможен также автономный анализ корпуса языка-цели (при этом речь в данный момент идет о предварительном анализе, на этапе подготовки системы). Результатом такого анализа будет набор конструкций, не являющихся аналогами шаблонов языка-источника с грамматической точки зрения, однако близких последним по семантике.

Кроме того, для каждого потенциального языка-цели следует предоставить набор «нейтральных» конструкций, использование которых может оказаться единственным решением в случае отсутствия, по той или иной причине, шаблонов-соответствий. Структуры такого рода могут быть использованы и в качестве основы для «переходных» фрагментов, необходимых для генерации гладкого текста. При этом «нейтральные» конструкции не должны, по возможности, нести дополнительной семантики, являясь исключительно констатацией факта того или иного семантического отношения между теми или иными объектами. В ряде случаев в качестве подобных структур могут выступать личные формы глагола в изъявительном наклонении, в действительном залоге, с соответствующим набором необходимых актантов («Сергей Брин и Ларри Пейдж основали Google»). Однако в большинстве случаев дополнительные семантические составляющие (например, временные характеристики) неизбежны, что необходимо учитывать при формировании соответствующих формальных представлений. Удачным решением «нейтрального» характера представляется также использование структур, расположенных на противоположном отрезке шкалы, моделирующей варианты выражения в языке того или иного онтологического предиката. К их числу относятся, например, отглагольные существительные («После его прихода в компанию…»), деепричастные обороты и иные конструкции, с легкостью интегрируемые в широкий спектр различного рода языковых фрагментов.

Использование данных о характеристиках шаблонов в процессе автоматической обработки текстов

В результате работы системы извлечения знаний данные о шаблонах, на основе которых был выполнен анализ исходного текста, сохраняются в виде внутренних, скрытых для пользователя, атрибутов извлеченных объектов и связей. Поскольку доступность более или менее точных соответствий между шаблонами может варьироваться в зависимости от языковой пары, то изначально в качестве атрибутов необходимо предоставить как сведения об идентифицированной структуре в целом, так и информацию об отдельных грамматических и семантических характеристиках. Такого рода данные обеспечивают следующее пространство возможностей. В случае отсутствия точного аналога происходит выбор шаблона с идентичным набором формальных признаков. При этом значения последних или идентичны значениям атрибутов в соответствующей структуре языка-источника, или неспецифицированы. Дополнительной возможностью является использование «нейтральных» конструкций. В общем случае представляется верным следующее утверждение: чем шире набор предусмотренных в паре шаблонов признаков, чем большее количество значений последних идентично, тем более точное совпадение соответствующих фрагментов исходного и конечного текстов может быть обеспечено в процессе реферирования.

Работа с характеристиками шаблонов кратко проиллюстрирована в Табл. 3 и 4.

Табл. 3. Значения атрибутов в шаблоне, специфицирующем фрагмент исходного текста.

Английский (язык-источник)	Атрибуты
Mr. Smith was employed by the Cukurova Group.	«Employ» Relation {base = «employ», tense = «past», voice = «passive», etc…}

Табл. 4. Варианты конструкций в языке-цели

Атрибуты	Русский (язык-цель)
«Employ» Relation {base = «employ», tense = «past», voice = «passive», etc…}	Г-н Смит был принят на работу в Cukurova Group.
«Employ» Relation {base = «employ», tense = «past», voice = «active», etc…} (конструкция в изъявительном наклонении, определенная в рамках подготовительного этапа как нейтральная)	Г-н Смит работал в Cukurova Group.
«Employ» Relation {base = «employ», tense = «-», voice = «-», etc…} (предикат редуцирован до номинативной конструкции)	В числе сотрудников Cukurova Group можно назвать г-на Смита.

Разрешение конфликта значений атрибутов

В ряде случаев возможен конфликт между атрибутами формального и семантического характера. Так, например, известно, что глагольная форма настоящего времени может в некоторых языках кодировать ситуации, относящиеся к прошлому или будущему. Для каждого типа потенциальных конфликтов необходим индивидуальный алгоритм разрешения. Одним из общих принципов является предпочтение наиболее эксплицитно обозначенной в тексте характеристики (например, временной). В частности, анализ корпуса русскоязычных текстов показывает, что в упомянутом выше случае (при употреблении формы настоящего времени в значении прошлого или будущего) типично явное указание сирконстанта времени («C 2000 по 2001 год г-н Иванов работает в компании МТС, затем - в компании Beeline»), что позволяет сделать выбор формальной характеристики с учетом соответствующей модели временных отношений, положенной в основу системы [Ефименко, 2004]. Дополнительная информация, необходимая для корректного разрешения конфликта атрибутов, может быть получена на основе данных о жанре исходного текста, знаний о схеме дискурса [Khoroshevsky, 2005]. В случае, если «гарантированно» корректное разрешение конфликта представляется затруднительным, возможен вариант выбора «нейтральной конструкции».

Пример генерации текста

Ниже кратко проиллюстрированы некоторые из этапов генерации текста реферата под управлением предметной онтологии.

Исходный текст и Когнитивная карта

Sergey Brin, a native of Moscow, received a bachelor of science degree with honors in mathematics and computer science from the University of Maryland at College Park. Brin is a recipient of a National Science Foundation Graduate Fellowship as well as an honorary MBA from Instituto de Empresa. It was at Stanford where he met Larry Page and worked on the project that became Google. Together they founded Google Inc., and Brin continues to share responsibility for day-to-day operations with Larry Page and Eric Schmidt.

Генерация конечного текста

Часть 1: Объекты, связи и шаблоны, извлеченные из исходного текста и представленные в когнитивной карте (пояснения даны курсивом)

Основные объекты (узлы CMap) представлены в Табл. 5.

Табл. 5. Основные объекты.

N	Экземпляры объектов	Атрибуты
1	Person1	{name = «Sergey Brin», number = «singular», gender = «male» (в данном случае вычислено на основе сведений о первом имени, информация словарного характера)}
2	Person2	{name = «Larry Page», number = «singular», gender = «male» (вычислено на основе сведений о первом имени, информация словарного характера)}
3	Organization1	{name = «University of Maryland», number = «singular», keyword = «University»}
4	Organization2	{name = «Instituto de Empresa», number = «singular», keyword = «Instituto»}
5	Organization3	{name = «Google Inc.», number = «singular», keyword = «Incorporation»}
6	Location1	{name = «College Park», number = «singular»}

1) Экземпляр объекта «Лицо»

{Person1, syntactic role = «subject» (определяет не только синт. роль как таковую, но и ряд других характеристик, например, значение падежа)}

Глагол-ядро экземпляра онтологического предиката «получать научную степень»

{base = «receive», tense = «past simple», gender = any, number = any, voice = «active»}}

Экземпляр объекта «Научная степень» (атрибут отношения «получать научную степень»)

{base = «bachelor of science», number = «singular», honors = «yes», speciality = [«mathematics», «computer science»], subspeciality = «-», organization = «Organization1»,

/Вложенный экземпляр онтологического предиката «Располагаться»:

«Organization» object {Organization1}

«Located In» Relation prepositional construction {name = «at»}

«Location» object {Location1}/}

2) Экземпляр объекта «Лицо»

{Person1, syntactic role = «subject»}

Глагол-ядро экземпляра онтологического предиката «получать научную степень»

{base = «receive», tense = «past simple», gender = any, number = any, voice = «active»}}

Экземпляр объекта «Научная степень» (атрибут отношения «получать научную степень»)

{base = «MBA», honors = «yes», number = «singular», speciality = «-», subspeciality = «-», organization = «Organization2»}

3) Список объектов типа «Лицо»

{[Person1, Person2], syntactic role = «subject»}

Глагол-ядро экземпляра онтологического предиката «быть основателем»

{base = «found», tense = «past simple», gender = any, number = any, voice = «active»}

Экземпляр объекта «Организация»

{Organization3, syntactic role = «object»} - необходима спецификация синтаксической роли, поскольку в рамках рассматриваемой онтологии данный тип объекта может в данном сем. отношении играть различные роли; кроме того, роли определяются грамматическими характеристиками «ядерных» конструкций

Часть 2:

Экземпляр объекта «Лицо»

{Person1, syntactic role = «subject»}

Глагол-ядро экземпляра онтологического предиката «получать научную степень»

{base = «receive», tense = «past simple», gender = any, number = any, voice = «active»}

Список объектов типа «Научная степень»

{[{base1 = «bachelor of science», number = «singular», honors1 = «yes», speciality1 = [«mathematics», «computer science»], subspeciality1 = «-», organization1 = «Organization1»

/ Вложенный экземпляр онтологического предиката «Располагаться»:

«Organization» object {name = «Organization1»}

«Located In» Relation prepositional construction {name = «at»}

«Location» object {name = «Location1»}/},

{base2 = «MBA», number2 = «singular», honors2 = «yes», speciality2 = «-», subspeciality2 = «-», organization2 = «Organization2»}]}

Трансформация такого рода обусловлена тем, что два экземпляра отношений одного типа имеют общий узел-источник («первый актант»), а также описываются идентичными шаблонами (с точностью до набора и значений атрибутов). В случае, если результирующая конструкция недостаточно элегантна, возможна генерация двух текстовых фрагментов, соединенных искусственно созданной «переходной» структурой.

Экземпляр объекта «Лицо»

{pronoun, number = «singular», gender = «male, syntactic role = «subject»}

Глагол-ядро экземпляра онтологического предиката «быть основателем»

{base = «found», tense = «past simple», gender = any, number = any, voice = «active»}

Экземпляр объекта «Организация»

{Organization3, syntactic role = «object»}

Элемент-связка

{name = «together with»}

Экземпляр объекта «Лицо»

{Person2, syntactic role = «indirect object»}

Таким образом, происходит перемещение фокуса на экземпляр объекта того же типа.

Часть 3

1) Экземпляр объекта «Лицо»

{Person1, name = «Сергей Брин» (первое имя - словарный аналог исходного, значение фамилии - результат транслитерации), синтаксическая роль = «subject», падеж = «nom» (следствие синт. роли)} > результирующий фрагмент текста: «Сергей Брин»

Глагол-ядро экземпляра онтологического предиката «получать научную степень»

{base = «получить», tense = «past», aspect = «perfective» (информация, заданная на подготовительном этапе при формировании шаблонов-аналогов, см. раздел 3), род = «male» (на основе рода субъекта), число = «singular» (на основе числа субъекта), залог = «active»} > результирующий фрагмент текста: «получил»

Список объектов типа «Научная степень»

1^ыйэлемент списка

{name = «степень (base {case = «gen», number = «singular»}) (в области (speciality {case = «gen»}))? (специализация: (subspeciality (case = «nom»)}))? (honors {case = «instr»}) (organization {case = «prep», number = «singular»})» (констукция в целом и атрибуты ее фрагментов заданы в процессе нахождения шаблонов-аналогов, раздел 3), number = «singular», case = «acc» (задано управлением глагола), base = «бакалавр», honors = «yes», speciality = [«математика», «кибернетика»], subspeciality = «-», organization = {Organization1, name = «Университет Мэриленда» (здесь может фигурировать словарный аналог и / или результат транслитерации / перевода)},

/ Вложенный экземпляр онтологического предиката «Располагаться»:

«Organization» object {name = null}

«Located In» Relation prepositional construction {name = «расположенный в», case = «prep» (задано падежом организации в объекте «Научная степеньt), number = «singular»}

«Location» object {Location1, name = «Колледж Парк» (здесь может фигурировать словарный аналог и / или результат транслитерации / перевода), case = «prep» (задано моделью управления предлога)}/} > результирующий фрагмент текста: «степень бакалавра в области математики и кибернетики с отличием в Университете Мэриленда, расположенном в Колледж Парке»

Элемент-связка

{name = «а также»} > результирующий фрагмент текста: «а также»

2^ойэлемент списка

{…} > результирующий фрагмент текста: «степень MBA с отличием в Институте Эмпреса»

2) Экземпляр объекта «Лицо»

{base = «он», number = «singular», gender = «male, syntactic role = «subject»} > результирующий фрагмент текста: «Он» (Заглавная буква маркирует начало предложения)

Глагол-ядро экземпляра онтологического предиката «быть основателем»

{base = «основать», tense = «past», aspect = «perfective», gender = «male», number = «singular», voice = «active»} > результирующий фрагмент текста: «основал»

Экземпляр объекта «Организация»

(Organization3, name = «корпорация Гугл» здесь может фигурировать словарный аналог и / или результат транслитерации / перевода), case = «acc» (предусмотрено в рамках синтаксической роли и модели управления глагола)} > результирующий фрагмент текста: «корпорацию Гугл»

Элемент-связка

{name = «вместе с» (перевод на уровне отдельных лексем, при конкретные целевые лексемы предусматриваются в процессе формирования шаблонов-аналогов)} > результирующий фрагмент текста: «вместе с»

Экземпляр объекта «Лицо»

{Person2, name = «Ларри Пейдж» (словарный аналоги или результат транслитерации), syntactic role = «indirect object», case = «instr» (предусмотрено в рамках синтаксической роли и модели управления глагола)} > результирующий фрагмент текста: «Ларри Пейджем»

Текст реферата

Вариант 1. Сергей Брин получил степень бакалавра в области математики и кибернетики с отличием в Университете Мэриленда, расположенном в Колледж Парке, а также степень MBA с отличием в Институте Эмпреса. Он основал корпорацию Гугл вместе с Ларри Пейджем.

Вариант 2. Сергей Брин получил степень бакалавра в области математики и кибернетики с отличием в Университете Мэриленда, расположенном в Колледж Парке. Кроме того (искусственно сгенерированный фрагмент), он (анафорическая замена) получил степень MBA c отличием в Институте Эмпреса. Он основал корпорацию Гугл вместе с Ларри Пейджем.

Таким образом, фокус, как упоминалось выше, перемещается к другому экземпляру того же типа, в данном случае, «Ларри Пейдж», что позволяет перейти к генерации последующих фрагментов текста.

В статье представлен онтологически-ориентированный, основанный на использовании лингвистических шаблонов подход к автоматической обработке естественного языка. Как показывает опыт, именно анализ под управлением предметных онтологий позволяет создавать прикладные системы извлечния знаний. Применительно к генерации текстов такого рода подход позволяет получить мощный инструмент в области автоматического, в том числе, кросс-языкового, реферирования. Таким образом, постулируется возможность и практическая значимость не только анализа, но и синтеза текстов под управлением предметных онтологий.

Список литературы

лингвистический языковой реферирование онтология

1. И.В. Ефименко, Обработка естественно языковых текстов: онтологичность в лингвистике и дискурсивность в извлечении знаний, Труды конференции КИИ-2006, Обнинск, Россия, 2006.

2. Soria, C., Bernsen, N.O., Cadee, N., Carletta, J., Dybkjaer, L., Evert, S., Heid, U., Isard, A., Kolodnytsky, M., Lauer, C., Lezius, W., Noldus, L., Pirrelli, V., Reithinger, N., and Vogele, A., Advanced tools for the study of natural interactivity. Third International Conference on Language Resources and Evaluation (LREC 2002), Las Palmas, Spain, 2002.

3. И.В. Ефименко, Время в мультиязычных коллекциях документов: лингвистическая модель и ее реализация в среде GATE, Труды конференции КИИ-2004, Тверь, Россия, 2004.

4. V. Khoroshevsky, Semantic Indexing: Cognitive Maps Based Approach, RANLP-2005, Borovets, Bulgary, 2005.

Размещено на Allbest.ru

...

статья "Лингвистические аспекты кросс-языкового реферирования: синтез текстов под управлением предметных онтологий" скачать

Подобные документы

Лингвистические и стилистические особенности текстов научного стиля английского языка
Черты научного стиля, которые отличают его от других стилей английского языка. Функции и признаки текстов научного стиля, их разновидности. Исследование основных лексических, грамматических и стилистических особенностей текстов английской научной речи.

курсовая работа [603,0 K], добавлен 21.04.2015
Синтаксические особенности научных текстов Л.В. Щербы
Теоретические и лингвистические основы описания трудов Л.В. Щербы, теоретические основы описания научных текстов в современной лингвистике. Своеобразие научных текстов, их синтаксический анализ. Словосочетание и простое предложение в трудах Л. Щербы.

дипломная работа [62,0 K], добавлен 25.02.2010
Кулинарный рецепт как тип текста
Закономерности семантической и структурной организации текстов, их классификация и типы. Сущность монологических и диалогических, устных и письменных текстов. Виды кулинарных рецептов, их лингвистические, национальные особенности и культурная специфика.

курсовая работа [56,8 K], добавлен 23.03.2010
Лингвомедийные особенности английских и русских рекламных текстов
Характеристика и классификация рекламных текстов, их лексические и синтаксические особенности. Сравнительный анализ англоязычных и русскоязычных рекламных текстов. Разработка урока в рамках темы "Mass Media" на основе проанализированных рекламных текстов.

дипломная работа [4,4 M], добавлен 14.02.2013
Специфика воспроизведения гендерных особенностей в англо-русском переводе (на материале текстов рекламной направленности)
Характеристика и классификация рекламных текстов, теоретические аспекты перевода. Лингво-переводческий анализ воспроизведения гендерных особенностей в англо-русском переводе, сопоставительная оценка переводов текстов, выявление адекватности их специфики.

курсовая работа [76,4 K], добавлен 21.06.2011
Проблемы перевода музыкально-поэтических текстов с английского языка на русский
Понятия "содержание" и "форма" при переводе музыкально-поэтических текстов. Сопоставительный анализ текстов оригинала (подлинника) и перевода. Лексические и грамматические трансформации при переводе музыкально-поэтических текстов песен Джона Леннона.

дипломная работа [174,2 K], добавлен 09.07.2015
Общая риторика и частные (судебная, политическая, педагогическая, деловая и другие) риторики
Зарождение и развитие риторики. Искусство спора на суде. Основные этапы риторического канона. Виды ораторского искусства. Обвинительная и защитительная речи. Структура и признаки судебной коммуникации. Лингвистические аспекты законодательных текстов.

курс лекций [787,5 K], добавлен 26.04.2014
Особенности построения текстов различных стилей
Факторы речевой организации текста. Характеристика текста как особой речевой единицы. Основные типы текстов. Построение текстов различных стилей. Особенности построения текстов в научном, публицистическом, официально-деловом и художественном стилях.

курсовая работа [46,9 K], добавлен 22.05.2015
Синтагматический рисунок медиа-текстов группы "editorials"
Структурно-содержательные особенности медийных текстов. Характеристика современного медиадискурса. Анализ синтагматических и лингвостилистических особенностей корпуса текстов группы передовых редакторских статей в качественной и популярной прессе.

дипломная работа [76,6 K], добавлен 29.03.2016
Предписывающие тексты в немецком языке
Категория побудительности в языковедении. Анализ особенностей предписывающих немецких текстов на примере рекламы. Изучение текстов директивно-регулятивного типа, их места в системе речевой коммуникации. Немецко-русский перевод предписывающих текстов.

курсовая работа [33,0 K], добавлен 10.04.2013
Когнитивно-семантическая связь вторичных текстов и их текстов-источников
Становление теории вторичных текстов (ВТ), их классификация. Понятие ВТ как построенного на основе текста-источника с другими прагматическими целями и в другой коммуникативной ситуации. Сохранение в ВТ элементов когнитивно-семантической структуры текста.

статья [37,4 K], добавлен 23.07.2013
Особенности и проблемы перевода рекламных текстов
Классификация, характерные и стилистические особенности рекламных текстов. Приемы параллелизма и повтора. Наиболее частые трудности, возникающие при переводе рекламных текстов. Интересные примеры перевода из публицистической продукции и сети Интернет.

курсовая работа [46,8 K], добавлен 18.04.2011
Перевод метаязыка с французского на русский на примере телепередачи Merci Professeur
"Метаязык" как понятие в лингвистике и переводоведении. Особенности научного стиля и обзор классификаций текстов. Жанр телепередач и прагматический аспект перевода научных текстов. Особенности перевода французских текстов научно-популярного подстиля.

курсовая работа [44,2 K], добавлен 06.03.2015
Реферирование специальной литературы, ее аннотирование
Особенности реферирования и аннотирования текста, принципы смыслового свертывания текста на иностранном и родном языках. Речевые клише, используемые в различных видах реферирования и аннотирования. Чтение и перевод коммерческой и деловой информации.

отчет по практике [209,2 K], добавлен 14.01.2016
Лингвистические особенности виртуального дискурса (на материале онлайн-игр)
Понятие дискурса, его типы и категории. Разновидности онлайн-игр с элементами коммуникации и их характеристики. Жанровая классификация виртуального дискурса. Способы построения игрового коммуникативного пространства. Использование прецедентных текстов.

дипломная работа [87,7 K], добавлен 03.02.2015
Приемы перевода терминологии войск связи и радиоэлектроники на материале английского языка
Изучение лексико-грамматических и стилистических особенностей перевода военных текстов. Текстуальные категории военных текстов. Выявление специфических приемов перевода, используемых для передачи текстов военного характера с английского языка на русский.

дипломная работа [94,1 K], добавлен 20.05.2015
Роль аллюзий в формировании социокультурной компетенции (на материале англоязычных рекламных текстов)
Рекламные тексты, их классификация. Лингвостилистические особенности рекламных текстов. Определение понятия "аллюзия". Виды, механизм действия аллюзий. Аллюзии в английской и американской рекламе. Анализ англоязычных рекламных текстов на наличие аллюзий.

научная работа [71,7 K], добавлен 25.02.2009
Лингвостилистические особенности рекламных текстов и проблемы их перевода
Классификация рекламных текстов. Стилистическое средство как способ передачи выразительности. Методы передачи средств экспрессивности в рекламном тексте. Типология стилистических средств. Анализ перевода английских рекламных текстов на русский язык.

дипломная работа [77,5 K], добавлен 13.04.2015
Метафора в публицистическом тексте
Исследование свойств публицистического текста, его структура, лингвистические и когнитивные особенности. Комплексное изучение особенностей создания и функционирования метафорических моделей в структуре публицистических текстов и газетных заголовках.

дипломная работа [79,8 K], добавлен 05.06.2019
Передача экспрессивности при переводе текстов экономической тематики
Особенности публицистического стиля в русском английском и немецком языках. Экспрессивность в заголовках публицистических текстов экономической тематики. Рассмотрение основных способов передачи экспрессивности при переводе публицистических текстов.

дипломная работа [762,8 K], добавлен 20.01.2025

Другие документы, подобные "Лингвистические аспекты кросс-языкового реферирования: синтез текстов под управлением предметных онтологий"

весь список подобных работ

скачать работу можно здесь

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.