Машинный перевод немецких составных слов на русский язык

Феномен композитообразования в немецком языке. Автоматическое определение частеречного паттерна (типа переводческого соответствия) для русского перевода немецкого композита. Выбор признаков машинного обучения, переводческие соответствия для композитов.

Рубрика Иностранные языки и языкознание
Вид дипломная работа
Язык русский
Дата добавления 28.08.2018
Размер файла 61,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Правительство Российской Федерации

Федеральное государственное автономное образовательное учреждение высшего образования

Национальный исследовательский университет «Высшая школа экономики»

Выпускная квалификационная работа магистра

Машинный перевод немецких составных слов на русский язык

Гуц Варвара

Москва 2018

Оглавление

Введение

Глава I. Феномен композитообразования в немецком языке

I.1 Композиты: частотность в немецкоязычном корпусе

I.2 Способы классификации композитов

I.3 Немецкий композит как образование из нескольких составляющих

Глава II. Предварительный процессинг немецких композитов

II.1 Особенности препроцессинга немецких текстов

II.2 Элайнмент немецких текстов

II.3 Сплиттинг композитов

Глава III. Переводческие соответствия для композитов в русском языке

Глава IV. Создание корпуса композитов и их русских переводов

IV.1 Автоматическое извлечение композитов и их переводческих эквивалентов из параллельного немецко-русского корпуса

IV.2 Анализ композитов и их русских переводов: определение основных характеристик композитов и типов переводческих соответствий

IV.2.1 Морфологический разбор композитов

IV.2.2 Анализ переводов и выделение частеречных паттернов

Глава V. Эксперименты по определению типа перевода

V.1 Выбор признаков для машинного обучения

V.2 Ход экспериментов и результаты обучения

V.3 Анализ результатов

Заключение

Литература

Приложение

Введение

Составные слова в немецком языке (а также в других языках, где словосложение является высоко продуктивным способом образования слов: датский, норвежский, шведский, финский, греческий языки) до сих пор вызывают трудности у большинства систем автоматической обработки естественного языка. В особенности это относится к системам машинного перевода.

Сложность обработки так называемых немецких композитов обусловлена тем, что они достаточно свободно образуются с помощью сложения различных слов. Фактически данный способ словообразования не имеет границ. Это означает, что лексический состав немецкого языка постоянно пополняется значительным количеством новых композитов.

Цель данного исследования заключалась в автоматическом определении частеречного паттерна (типа переводческого соответствия) для русского перевода немецкого композита. Отметим, что мы не ставили перед собой цель автоматического нахождения переводческого эквивалента. Нашей задачей было построение наиболее эффективной модели предсказания типа перевода.

Несмотря на то, что машинному переводу немецких композитов посвящено много исследований, подавляющее большинство из них выполнено для переводческой пары немецкий-английский. Кроме того, особый научный интерес представляет вопрос о возможном автоматическом присваивании типа переводческого соответствия для русского перевода композита.

Исследование состояло из двух основных частей. Во-первых, нам нужно было составить корпус немецких композитов и их переводов на русский язык, извлеченных автоматически из параллельных немецко-русских текстов. Во-вторых, составленный корпус использовался в качестве материала для машинного обучения, целью которого было определение типа переводческого соответствия. Параметрами для машинного обучения являлись различные структурные, семантические и грамматические характеристики немецких композитов. Результаты экспериментов с машинным обучением были проанализированы, высказаны предположения по улучшению полученных результатов.

Глава I. Феномен композитообразования в немецком языке

I.1 Композиты: частотность в немецкоязычном корпусе

По результатам исследования Baroni et al. в немецкоязычном газетном корпусе Austria Presse Agentur (сейчас Austrian Media Corpus), который включал в себя 28 миллионов слов, 47% уникальных словоформ и 7% токенов были композитами (Baroni et al. 2002: 2).

Как подчеркивают авторы вышеназванной статьи, данные цифры указывают на то, что большое число композитов либо являются гапаксами, то есть словами, употребленными в корпусе только один раз, либо встречаются очень редко (83% композитов с частотностью 5 или менее 5). Схожие результаты были опубликованы в работе Schiller: 43% уникальных словоформ и 5,5% токенов в немецкоязычном газетном корпусе из 9,3 миллионов слов (Schiller 2005: 1).

Немецкие композиты могут встречаться в абсолютно любых текстах. Тем не менее, в статье Schiller отмечается, что процент композитов может быть существенно выше в текстах технического характера, например, инструкциях по эксплуатации оборудования: 12% в небольшом тексте-инструкции по использованию принтера (Schiller 2005: 1).

Данная гипотеза подтверждается в работе Escartнn: 0,4% токенов на тренировочном корпусе, который был сформирован из двух корпусов - параллельного корпуса технических текстов TRIS (Technical Regulations Information System) и параллельного корпуса текстов Европарламента Europarl, и 8,5% токенов на тестовом корпусе, который включал в себя только технические тексты (Escartнn 2014: 5).

I.2 Cпособы классификации композитов

С точки зрения структуры, немецкие композиты можно разделить на двухкомпонентные и многокомпонентные, то есть те, которые образованы из двух и более двух непосредственных лексических составляющих. Теоретически, количество составляющих не ограничено. Обычно двухкомпонентные композиты, или композиты с бинарной структурой, составляют подавляющее большинство всех композитов в корпусе. Второе место по распространенности занимают композиты, состоящие из трех лексических основ. Значительно реже встречаются четырех-, пяти- и шестикомпонентные композиты, характерные для технических, юридических, официально-деловых и научных текстов (например, композит Krankenversicherungs-Kostendдmpfungsgesetz (`закон о сдерживании роста расходов на медицинское страхование') состоит из пяти компонентов).

Композиты в немецком языке могут принадлежать к различным грамматическим классам слов. В целом, большинство исследователей выделяет три основные группы композитов: субстантивные, адъективные и вербальные. Наиболее многочисленной группой являются субстантивные композиты. Исследования композитов в рамках систем статистического машинного перевода, в основном, ограничиваются только субстантивами, однако имеются некоторые работы, посвященные другим группам, например, адъективным композитам (Wьrzner, Hanneforth, 2013).

В основном, системы машинного перевода испытывают трудности при обработке так называемых нелексикализованных композитов, то есть тех композитов, которые отсутствуют в обычных словарях, или композитов-неологизмов. Стоит отметить, что нелексикализованные композиты особенно распространены в технических текстах, чаще всего выступая в роли специализированных технических терминов (например, слово SOS-Taste (`кнопка SOS') отсутствует в словарях, но часто используется в инструкциях по эксплуатации различного оборудования). Нелексикализованные композиты противопоставляются лексикализованным композитам, то есть тем, которые имеются в обычных словарях.

Перечисляя основные типы немецких композитов, стоит также упомянуть их разделение с точки зрения семантики на композициональные и некомпозициональные. Значение композитов часто может быть определено исходя из значений их компонентов, что свидетельствует о композициональности. Однако это не всегда возможно. В этой связи приведем пример из работы Weller: композит Heckenschьtze переводится на русский язык как `снайпер' или `замаскированный снайпер', в то время как две его составляющие части, Hecke и Schьtze, переводятся соответственно как `живая изгородь' и `снайпер'. Очевидно, что снайпер может стрелять не только из-за живой изгороди, хотя обычно он действительно стреляет из некого укрытия (Weller 2014: 2).

Вышеописанный композит является примером полукомпозициональности, когда на основании значений компонентов можно частично определить значение всего композита. Стоит отметить, что существуют и совсем некомпозициональные случаи. Так переводческий эквивалент немецкого композита Marienkдfer в русском языке - это `божья коровка', а не `жук Марий', как можно было бы ошибочно перевести при дословном переводе компонентов.

I.3 Немецкий композит как образование из нескольких составляющих

В целом, можно говорить о том, что составные части композита могут занимать в нем три различных позиции: начальную, среднюю и конечную. При чем, компоненты в начальной и средней позициях (так называемые левые компоненты) принято рассматривать как компоненты-модификаторы, а компонент в конечной позиции (правый компонент) как опорный компонент. Немецкий композит теоретически может иметь неограниченное число модификаторов и, как правило, только один опорный компонент, который определяет основные морфосинтактические и семантические свойства композита.

Компоненты-модификаторы могут соединяться с опорным компонентом как посредством нулевой связки, так и с помощью так называемых соединительных элементов, или соединительных суффиксов. Такие элементы играют роль маркеров границы между составляющими частями. Интересно, что существует два подхода к их рассмотрению: как к независимым морфемам, выполняющим роль интерфиксов, и как к составным частям модификаторов (суффиксов, окончаний). В статье El-Kahlout, Yvon, в которой рассматриваются особенности предварительного процессинга текстов на немецком языке при статистическом машинном переводе, перечисляются следующие возможные соединительные элементы, которые добавляются к компонентам-модификаторам: -s, -es, -n, -en, -e, -er, -nen, -ien (El-Kahlout, Yvon, 2010: 5). Weller также относит к данной группе соединительные суффиксы -ens, -ns (Weller, 2017: 3).

Среди всех соединительных элементов наиболее распространенным является -s. Этот элемент, в отличие от остальных вышеперечисленных, может не выполнять функцию флексии компонента-модификатора (gesellschaft|s|politisch (`общественно-политический'): форма Gesellschafts отсутствует в парадигме компонента Gesellschaft). Зачастую добавление -s (-es) приводит к образованию генитива модификатора (Kind|es|alter (`детский возраст'): Kindes - форма гентива от Kind). Также частотным является элемент -(e)n, который определяется формой множественного числа модификатора (Urkunde|n|fдlschung (`фальсификация документов'): Urkunden - форма множественного числа от Urkunde). Остальные соединительные элементы из вышеуказанного перечня также служат для образования форм множественного числа и генитива модификаторов.

Композиты могут образовываться не только путем добавления, но и путем усечения следующих элементов: -en, -n, -e (El-Kahlout, Yvon, 2010: 5). Первые два элемента могут быть усечены у инфинитивов глаголов, третий - у существительных. Помимо того, могут происходить и более сложные изменения в структуре компонентов композитов, такие как появление умлаута в корне (Vцlkermord (`геноцид'): образование множественного числа от слова Volk с умлаутом (Vцlker)) или одновременное усечение и добавление соединительных элементов (Weihnachtskonzert (`рождественский концерт'): удаление элемента -en в слове Weihnachten, добавление соединительной согласной -s).

Как уже упоминалось в пункте 2.2., композиты могут быть существительными, прилагательными или наречиями, в зависимости от того, к какой части речи относится их опорный компонент. При этом, модификаторами преимущественно выступают слова тех же частей речи (таблица 1).

Таблица 1. Основные частеречные паттерны немецких композитов

Опорный

компонент

существительное

глагол

прилагательное

Компонент-

модификатор

существительное

Wortstamm

(Wort + Stamm)

`основа слова'

teilnehmen

(Teil + nehmen)

`принимать

участие'

grasgrьn

(Gras + grьn)

`травянисто-зеленый'

глагол

Schlafzimmer

(schlafen + Zimmer)

`спальня'

gefriertrocknen

(gefrieren

+ trocknen)

`лиофилизировать'

trinkfest

(trinken + fest)

`непьянеющий'

прилагательное

Groвstadt

(groв + Stadt)

`большой город'

kranklachen

(krank + lachen)

`смеяться до смерти'

dunkelrot

(dunkel + rot)

`темно-красный'

Кроме того, составными частями композитов иногда могут являться: наречия (Auвenwelt (`внешний мир'): наречие Auвen + существительное Welt), числительные (Zweikampf (`двоеборье'): числительное zwei + существительное Kampf), местоимения (selbstgefдllig (`самовлюбленный'): наречие selbst + прилагательное gefдllig) и предлоги (Nebenzimmer (`соседняя комната'): предлог neben + существительное Zimmer).

Глава II. Предварительный процессинг немецких композитов

II.1 Особенности препроцессинга немецких текстов

Помимо основных этапов автоматической предварительной обработки текстов, таких как приведение всех слов к одному регистру, удаление знаков пунктуации и других небуквенных символов, а также удаление стоп-слов, препроцессинг текстов на немецком языке имеет ряд некоторых специфических особенностей.

В данном контексте стоит вспомнить о том, что в 1996 году была проведена реформа немецкого правописания. Прежде всего, в результате реформы буква в стала употребляться только после долгих гласных и дифтонгов (например, Fuв (`нога'), heiвen (`называться, означать')). В остальных случаях, после кратких гласных, данная буква была заменена на сочетание ss (например, dass (`что') вместо daв). По факту данная реформа привела к возникновению различных вариантов правописания одних и тех же немецких слов, согласно старым и новым орфографическим правилам, что необходимо учитывать при препроцессинге.

Также при невозможности использовать умлауты, например, при наборе текста на клавиатуре ввиду отсутствия немецкой раскладки, буквы с умлаутом д, ц, ь могут быть заменены на буквенные сочетания ae, oe, ue. В связи с этим часто при препроцессинге немецких текстов рекомендуется заменять все буквы с умлаутом на вышеуказанные буквенные сочетания с целью сохранения единства написания. El-Kahlout и Yvon в своей работе предложили выбирать вариант с наибольшей частотностью: так Waesche (`белье') было заменено на Wдsche, а gedrueckt (`печатный') на gedrьckt (El-Kahlout, Yvon, 2010: 2).

II.2 Элайнмент немецких текстов

Элайнмент (alignment) - это выравнивание корпуса параллельных текстов на уровне слов, фраз или предложений. Элайнмент является необходимым этапом для решения различных компьютерно-лингвистических задач, в частности, для осуществления статистического машинного перевода.

Согласно цифрам, приведенным в статье Corston-Oliver, Gamon, посвященной статистическому элайнменту немецко-английских параллельных текстов, процент ошибки элайнмента составил 20,63% на корпусе из 98971 параллельных предложений, 1541002 токенов в немецких предложениях и 1527134 токенов в английских предложениях (Corston-Oliver, Gamon 2004: 9).

Для улучшения результатов элайнмента авторы данной статьи предложили делать выравнивание не полных слов, а основ слов в обоих языках (стемминг), что, согласно их экспериментам, привело к некоторому уменьшению процента ошибки (16,6%) (Corston-Oliver, Gamon 2004: 9). Однако стоит отметить, что такой подход может означать потерю важной грамматической информации о слове, такой как число и падеж.

Многочисленные эксперименты по элайнменту немецких и английских параллельных текстов демонстрируют, что в большинстве случаев одному немецкому композиту соответствует более чем одно слово в переводе его на английский язык. Данное наблюдение характерно также и для параллельных немецко-русских текстов, о чем пойдет речь в практической части работы.

Popoviж et al. также исследовали вопрос о том, как знание о сегментации немецкого композита на составляющие части может повлиять на качество элайнмента (Popoviж et al. 2006). Все композиты в корпусе были сегментированы с помощью корпусного подхода, о котором пойдет речь в пункте 3.2., и выровнены. После выравнивания компоненты одного композита были обратно соединены, обучение модели происходило на оригинальном немецком корпусе. Таким образом, качество полученного элайнмента было улучшено (Popoviж et al. 2006: 7).

Схожий способ элайнмента композитов рассматривают в своем исследовании Weller и Heid (Weller, Heid 2012). Результатом работы системы сегментации в данном случае являлись псевдотермины из нескольких слов, которые подавались на вход элайнеру. Безусловно, у данного способа имеется ряд проблем, возникающих при переводе: некомпозициональные композиты, полисемичные компоненты, неверный порядок компонентов в языке-переводе. По мнению авторов, последняя проблема может быть решена с помощью паттернов, которые учитывают порядок слов в обоих языках (Weller, Heid 2012: 3).

Еще один подход к улучшению элайнмента немецких композитов продемонстрировали Escartнn et al (Escartнn et al 2014). В одном из экспериментов по статистическому машинному переводу в паре немецкий - испанский авторы добавили в тренировочный корпус список композитов и их переводов, извлеченных из корпуса вручную, что увеличило вероятность элайнмента 1:n, то есть одного композита с несколькими словами в переводе. Авторы статьи подчеркивают, что обычно в испанском языке композиту не только соответствуют несколько слов, как, например, в английском языке, но и зачастую меняется порядок компонентов и добавляются слова других грамматических классов, например, предлогов, что усложняет задачу элайнмента (Escartнn et al 2014: 1).

композитообразование немецкий перевод

II.3 Сплиттинг композитов

Широко используемые на данный момент системы статистического машинного перевода способны генерировать переводы только для тех композитов, которые имеются в тренировочном корпусе. Однако большинство композитов либо встречаются в тренировочном корпусе очень редко, либо отсутствуют. Следовательно, для получения перевода необходимо составить определенные правила предварительного процессинга композитов.

На данный момент наиболее популярным подходом к препроцессингу композитов в машинном переводе является разбиение их на составные части, так называемый сплиттинг. Данный подход позволяет системе осуществлять перевод не всего слова, а только отдельных его частей, которые преимущественно встречаются в корпусе намного чаще, чем сам композит.

Например, слова Stube (`комната') и Tьr (`дверь') намного более частотные, чем композит Stubentьr (`дверь в комнату'). Подобная модель с использованием сплиттинга способна предсказывать перевод для композита, редко встречающегося либо не встретившегося в тренировочном корпусе, при условии наличия в корпусе его компонентов.

В своей статье, описывающей эксперименты по анализу немецких составных слов с помощью конечного преобразователя (FST), Schiller приводит некоторые примеры ложной бинарной сегментации (Schiller 2005: 2).

Во-первых, причиной может являться наличие в немецком композите компонентов, омонимичных деривационным аффиксам:

- деривационный суффикс -ei vs. существительное Ei (`яйцо')

Spielerei: Spieler + -ei (`баловство')

Vogelei: Vogel + Ei (`птичье яйцо')

- префикс -ein и числительное ein (`один')

Einwohner: -ein + wohnen + -er (`житель')

Einzimmerwohnung: Ein + Zimmer + Wohnung (`однокомнатная квартира')

Во-вторых, немецкое слово, не являющееся композитом, часто может быть ложно разбито на несколько полнозначных слов:

Verbraucher (`потребитель') ? Verb + Raucher ("курильщик глаголов")

Abteilungen (`департаменты') ? Abtei + Lungen ("легкие аббатства")

Несмотря на то, что с точки зрения структуры данные составляющие части могут быть сегментированы, с точки зрения семантики подобная сегментация маловероятна и может иметь место только при специфическом контексте.

Помимо чрезмерного бинарного деления, двухкомпонентные композиты могут быть ошибочно разделены на три и более сегмента: например, композит Aktionsplan: Aktion + -s + Plan (`план действий') может быть неверно сегментирован как Akt + Ion + -s + Plan, что морфологически возможно вследствие омонимии деривационного суффикса женского рода -ion и существительного Ion (Koehn, Knight, 2003: 1).

Кроме того, стоит отметить, что в немецком языке некоторые композиты совпадают с именами собственными: например, слово Baumeister, которое переводится на русский язык как `архитектор-строитель', также в зависимости от контекста может являться широко распространенной немецкой фамилией (Cap 2014: 37). В случае, если слово является именем собственным, его, безусловно, нельзя разбивать на составные части.

Одним из распространенных подходов к предварительной обработке немецких композитов при статистическом машинном переводе является алгоритм сплиттинга Koehn и Knight (Koehn, Knight 2003). В своей работе авторы использовали информацию о частотности слов, которая была получена по корпусу, с целью идентификации компонентов композита. Различные варианты сплиттинга ранжировались на основании среднего геометрического частотностей компонентов. "Побеждал" вариант с наибольшим значением частотности (Koehn, Knight 2003: 3).

Данный "корпусный" подход сплиттинга является автономным, поскольку не требует задействовать какие-либо внешние ресурсы. Алгоритм доказал свою эффективность, несмотря на использование минимального количества лингвистической информации о слове: в оригинальной статье авторы допускали возникновение только двух соединительных элементов -s и -es (Koehn, Knight 2003: 2). Тем не менее, к возможным недостаткам данного подхода относится обязательность наличия корпуса значительного объема.

Как корпусный подход, так и алгоритм сплиттинга, основанный на лингвистических правилах, были протестированы для улучшения качества статистического машинного перевода немецких композитов на английский язык в исследовании Popoviж et al. (Popoviж et al. 2006).

Так морфосинтактический анализатор, использованный в вышеуказанной работе, разбивал композит Treibhauseffekt (`парниковый эффект') на три составляющие части, Treib, Haus и Effekt, в то время как сплиттер на основе корпуса оставлял композит неразбитым, поскольку среднее геометрическое частотностей его компонентов (17,9) оказалось меньше, чем частотность самого композита (51) (Popoviж et al. 2006: 4).

По утверждению авторов данной статьи, применение обоих подходов позволило улучшить качество статистического машинного перевода.

Stymne в своей статье также использовала корпусный подход к сплиттингу, основываясь на частотности слов (Stymne 2008). Вместе с тем, автором были предложены некоторые существенные изменения и дополнения к базовому алгоритму (Stymne 2008: 3-4):

- вычисление среднего арифметического вместо среднего геометрического для получения большего числа сплитов;

- компоненты композитов должны состоять не менее чем из трех символов;

- сплитами могут быть только слова определенных классов: существительные (помимо имен собственных), прилагательные, глаголы и наречия;

- конечная составляющая часть композита должна принадлежать к той же части речи, что и сам композит,

- учет всех возможных изменений в структуре компонентов (полный список соединительных элементов и усечений, за исключением умлаутов),

- дополнительное использование начальных словоформ для вычисления частотностей,

- слова с дефисами разбиваются только по дефисам.

Еще одна попытка выяснить, какие сплиттеры, корпусно-ориентированные или лингвистически-ориентированные, дают лучшие результаты разбиения немецких композитов (в частности, субстантивов), а также оказывают более значительное влияние на улучшение качества статистического перевода, была предпринята в исследовании Escartнn (Escartнn 2014).

В данной статье представлен анализ работы четырех различных сплиттеров: одного исключительного корпусно-ориентированного и трех лингвистически-ориентированных, некоторые из которых также могли использовать информацию о частотности слов, доступную в лексических базах данных.

В ходе исследования автором были получены очень схожие результаты. Два из четырех сплиттеров, один корпусно-ориентированный и один лингвистически-ориентированный, были использованы при предварительном процессинге в экспериментах по статистическому машинному переводу. Оценивание показало, что лингвистически-ориентированный сплиттер показал несколько более хорошие результаты, чем корпусно-ориентированный, однако данное преимущество не было напрямую отражено в метриках BLEU и TER (Escartнn 2014: 7).

Weller разработала еще один алгоритм сплиттинга, основанный на корпусе и небольшом количестве лингвистических правил (Weller 2017). Автор подчеркивает простоту разработанного метода, не предполагающего использование большого количества морфологической информации о слове.

Данный алгоритм, как и вышеуказанный алгоритм Stymne, учитывал начальные формы слов, а также их частотности, некоторые соединительные элементы и частеречные теги. Интересно, что некоторые операции по изменению отдельных существительных были запрещены с целью избежания ошибок сплиттинга. Например, теоретически возможное добавление соединительного элемента -e к существительному Reis (`рис') меняет его на другое существительное Reise (`путешествие'), поэтому для слова Reis добавление -e было запрещено (Weller 2017: 4). Автор отмечает, что такой подход позволяет ликвидировать систематические ошибки сплиттинга, хотя в целом не сильно отражается на работе системы.

Глава III. Переводческие соответствия для композитов в русском языке

Немецкие композиты преимущественно переводятся на русский язык с помощью словосочетаний. Большинство подобных сочетаний состоят из двух-трех слов (Busfahrer - `водитель автобуса'), однако в некоторых случаях для адекватного перевода приходится составлять целые выражения (Dauerparker - `водитель, поставивший машину на длительную стоянку'). Словосочетания такого типа чаще всего не являются устойчивыми, или идиоматичными.

Безусловно, переводы многих немецких сложных слов имеются в двуязычных словарях. Это относится к композитам, уже вошедшим в языковой состав. Если композит есть в словаре, обычно рекомендуется использовать приведенный в словаре перевод или переводы, если их несколько. Тем не менее, даже зафиксированные переводы могут оказаться чересчур громоздкими и потребовать определенной корректуры.

Так электронный словарь ABBYY Lingvo предлагает следующий перевод для композита Tьrцffner: `механическое устройство для автоматического управления дверьми'. По желанию переводчик может либо использовать данное выражение, либо сократить его, например, до словосочетаний `устройство для открывания дверей' или `кнопка открывания дверцы' и т.д. Главное избежать существенной потери или искажения смысла.

Немецкие композиты, не вошедшие в двуязычные словари, могут вызывать еще больше затруднений при поиске переводческого эквивалента в русском языке. Такие композиты условно разделены на две группы (Архипов 2011: 35):

1) некомпозициональные композиты, еще не получившие общепризнанных закономерных соответствий по причине того, что они лишь недавно вошли в обиход языка;

2) композициональные композиты, значения которых легко выводятся из значений их составляющих - корней, префиксов, суффиксов, соединительных элементов и окончаний, и именно поэтому не фиксируемые словарями.

Сложности при переводе относятся, в первую очередь, к композитам из первой группы. Однако если значение композитов определяются на основе значений составляющих, это также не всегда означает возможность легко составить адекватный и не громоздкий перевод.

А. В. Павлова и Н. Д. Светозарова, рассуждая о немецких композитах как об одной из категорий трудностей немецко-русского перевода, говорят о том, что немецкое словосложение является одной из причин возникновения в русском языке большого количества так называемых языковых лакун - отсутствия слова для обозначения того или иного понятия (Павлова, Светозарова 2012: 220).

Не всегда можно подобрать слова для точного и полного переводческого эквивалента композита в русском языке. Например, перевод композита Torschlusspanik - `страх не успеть сделать в жизни что-то важное' - не передает идею закрывающихся дверей (Torschluss), а в переводе композита Tapetenwechsel - `смена обстановки' - пропадает образ смены обоев (Tapeten).

Несмотря на большую вариативность в русских переводах немецких композитов, можно выделить некоторые основные частеречные паттерны перевода, применяемые чаще всего.

Как было рассмотрено в пункте 2.2., немецкие композиты, как правило, состоят из опорного компонента и предшествующего или предшествующих ему компонентов-модификаторов, выступающих в роли определения. Подобные определения в переводе на русский язык могут оформляться по-разному (Архипов 2011: 37).

Во-первых, композиты могут быть переведены согласно модели "прилагательное плюс существительное":

Fahrzeug (Fahr + Zeug): `транспортное средство'

Glockenklang (Glocke + n + Klang): `колокольный звон'

Abdominalatmung (Abdominal + Atmung): `брюшное дыхание'

Как видно из вышеприведенных примеров, композиты, значение которых передается в русском языке с помощью сочетания прилагательного и существительного, могут как иметь соединительные суффиксы, так и не иметь их. Кроме того, их модификаторы могут быть разными частями речи (fahr - усеченная основа от глагола fahren; Glocke - существительное, abdominal - прилагательное).

Также стоит отметить, что "прилагательное" в модели может подразумевать использование отглагольного прилагательного или причастия: Kalbsbraten - `жареная телятина', отглагольное прилагательное "жареная".

Данный тип по сути включает в себя переводы с помощью причастных или адъективных оборотов типа Discountgeschдft - `магазин, торгующий по сниженным ценам'.

Во-вторых, распространенным паттерном перевода композитов является паттерн "существительное плюс именная группа в родительном падеже":

Produktionswachstum (Produktion + s + Wachstum): `рост производства'

Fahrraddiebstahl (Fahrrad + Diebstahl): `кража велосипеда'

Freundeskreis (Freund + es + Kreis): `круг друзей'

Рассматривая примеры описываемого паттерна, мы видим, что компоненты композита могут быть связаны как соединительными элементами, так и нулевой связкой. В качестве модификаторов часто выступают имена существительные (Produktion, Fahrrad, Freund), но иногда и другие части речи: например, композит Irrgarten (`лабиринт') в контексте может переводиться как `сад обманов', где irr - прилагательное.

Существительное в родительном падеже часто может иметь при себе зависимые слова, в частности, прилагательные, поэтому паттерн имеет в своем названии термин "именная группа в родительном падеже". Так один из переводов композита Erdensohn - `обитатель земного шара', а термин Aderhautangiom переводится как `ангиома сосудистой оболочки глаза'.

Существительное в родительном падеже - это всегда переводческий эквивалент для компонента-модификатора. Аналогичное можно сказать про прилагательное в предыдущей модели.

Интересно, что нередко встречаются композиты, которые можно переводить как согласно первой, так и согласно второй модели. К примеру, возьмем вышерассмотренные композиты Glockenklang и Produktionswachstum. Первый может переводиться и как `колокольный звон', и как `звон колокола'; второй - и как `рост производства', и как `производственный рост'.

Третью большую группу переводческих эквивалентов составляют переводы композитов одним словом:

Mittagessen (Mittag + Essen): `обед'

Hдngematte (Hдng + e + Matte): `гамак'

Anziehungskraft (Anziehung + s + Kraft): `привлекательность'

В особенности, данная модель характерна для лексикализованных композитов, уже давно существующих в языковом составе. По большому счету такие слова не воспринимаются как композиты. Часто их составляющие части встречаются в корпусе реже, чем сами композиты.

В приведенных выше примерах сложное слово в немецком языке передается простым словом в русском. Однако в некоторых случаях русские переводы также являются сложными словами. Это обычно характерно для композитов, имеющих в своем составе греческие приставки (или части сложных слов):

Autowerk (Auto + Werk): `автозавод'

Mikromechanik(Mikro + Mechanik): `микромеханика'

Aerophobie(Aero + Phobie): `аэрофобия'

Также компонент-модификатор немецкого композита иногда переводится как приложение: немецкому слову Riesenglobus может соответствовать русский перевод `глобус-гигант'.

Самая малочисленная, но, тем не менее, выделяемая отдельно модель включает в себя русские переводы типа "существительное плюс предложная группа":

Heimaturlaub (Heimat + Urlaub): `отпуск на родину'

Knцdelsuppe (Knцdel + Suppe): `суп с клецками'

Bilderbuch (Bild + er + Buch): `книга с картинками'

Предложная группа передает значение компонента-модификатора. Интересно, что в отличие от первой и второй модели, которые могут быть взаимозаменяемыми, композиты, которые переводятся согласно данной модели, как правило, нельзя перевести с помощью адъективной группы или именной группы в генитиве.

Помимо того, стоит отметить, что предложная группа часто является распространенной:

Einfuhrmonopol (Einfuhr + Monopol): `монополия на импорт товаров'

Gipfeltreffen (Gipfel + Treffen): `встреча на высшем уровне'

Abstilldyspepsie (Abstill + Dyspepsie): `диспепсия в связи с прекращением грудного вскармливания'

Вышеперечисленные группы не охватывают все возможные способы перевода немецких композитов. Так, например, некоторые композиты могут переводиться с помощью сочетания существительного и инфинитивного оборота: Lieferfдhigkeit - `способность осуществлять/обеспечивать поставки'.

Глава IV. Создание корпуса композитов и их русских переводов

IV.1 Автоматическое извлечение композитов и их переводческих эквивалентов из параллельного немецко-русского корпуса

Для составления корпуса немецких композитов и их переводов были выбраны семь параллельных немецко-русских текстов общим объемом 634611 токенов, выровненных по фразам. Разметка была выполнена при помощи инструмента Aglona Reader - программы для просмотра, создания и редактирования параллельных текстов в оригинальном формате ParallelBook (PBO). Выбранные для исследования тексты находятся в открытом доступе и были скачаны с официального сайта Aglona Reader (Приложение).

Стоит отметить, что все семь выбранных параллельных текстов относятся к художественному стилю. С одной стороны, композиты в художественных текстах встречаются реже, чем в других стилях, в частности, в технической или официально-деловой документации. С другой стороны, в подобных текстах довольно высокий процент нелексикализованных композитов, то есть той группы композитов, которая представляет особый интерес для исследования (так называемые авторские неологизмы).

На начальном этапе исследования все тексты были объединены в один корпус общим объемом 46259 параллельных фраз (одна фраза - немецкий оригинал вместе с русским переводом). Предварительный процессинг корпуса включал в себя приведение всех слов, как в немецком, так и в русском языке, к одному регистру, а также удаление всех знаков пунктуации, кроме дефиса, который может играть роль соединительного элемента в композитах. В немецких токенах была произведена замена буквы в на буквенное сочетание ss; умлауты д, ь, ц заменены не были. В русских токенах буква ё была заменена на е.

С целью пословного элайнмента параллельных текстов был выбран инструмент efmaral, работающий на основе цепей Маркова (Приложение). В первой серии экспериментов элайнмент был выполнен сразу после предварительной обработки текстов. Однако качество автоматически полученных переводов для композитов оказалось неудовлетворительным. В большом количестве случаев, когда композит переводился на русский язык более чем одним словом, в автоматически выровненном тексте ему соответствовало только одно слово: Wolkenschatten - `облаков' вместо `тени облаков', Sonnenstrahl - `солнца' вместо `луч солнца'. В связи с этим для получения полных правильных переводов композитов было принято решение о необходимости предварительного сплиттинга композитов на составные части.

В данной работе был использован лингвистически-ориентированный сплиттер, работающий на простых правилах. Все слова разбивались всеми возможными способами на две или три составляющие части, наличие каждой из которых проверялось в словаре. Также стоит отметить, что ограничение на количество символов в составных частях не вводилось. В словаре все слова состояли не менее чем из трех символов.

В качестве словаря был взят список из 30000 наиболее частотных слов (начальных форм) в немецком языке (DeReWo). Данный список, или лексическая база, был составлен на основе корпуса, разработанного Институтом немецкого языка в городе Мангейм (Приложение).

Предварительно из словаря были удалены артикли, предлоги, союзы, частицы, междометия, вспомогательные и модальные глаголы, местоимения. Слова вышеперечисленных категорий были изъяты из словаря, поскольку, как правило, все они не выступают в качестве составляющих частей сложных слов, и наличие их в словаре может стать частой причиной ошибочного сплиттинга. Приставочные глаголы типа einschlafen (`засыпать'), где -ein - это префикс и одновременно неопределенный артикль, в данном исследовании изначально не рассматривались.

Помимо того, из словаря были исключены слова, омонимичные распространенным префиксам и суффиксам различных частей речи: Bar, voll, reich, Haft, Weg, fort, Los, mдвig, artig, Schaft. Также, поскольку мы не были заинтересованы в извлечении композитов-числительных, в словарь не вошли числительные zehn (`десять'), hundert (`сто'), tausend (`тысяча'), hunderttausend (`сто тысяч'), выступающие в роли составляющих компонентов многих других числительных, а также прилагательное-префикс -halb (`пол-').

Некоторые слова из словаря представляли собой часто встречаемое сочетание букв внутри других слов. Так сплиттер ошибочно разбивал глаголы с префиксом -zu и основой, начинающейся на букву g, в связи с наличием в словаре слова Zug (`поезд'). Так как для нас была важнее точность, чем полнота, подобные слова были также удалены из словаря (Gen, Gest, Ehe, Ende, enden, Este, haften, Verb, Vers, Zuzug). Объем финального варианта словаря составил 29424 слова.

Правила сплиттинга предусматривали возможное наличие ряда соединительных элементов между компонентами: суффиксы -s, -es, -e, -er, -n, -en, а также дефиса. Суффиксы были выбраны по принципу наиболее частой встречаемости в роли соединительных элементов композитов. Усечение основ, а также изменения корневых гласных (умлауты) правилами не предусматривались.

Перед применением правил сплиттинга все немецкие слова были приведены в начальные формы. Для этого был использован лемматизатор IWNLP на основе немецкого Викисловаря (Приложение). В предварительных экспериментах данный инструмент показал лучшее качество лемматизации по сравнению с несколькими другими лемматизаторами (textblob, germalemma).

В случае, если сплиттер выдавал несколько вариантов сплиттинга, выбирался наиболее простой вариант. Например, сплиттинг композита Hauptspass (`главное развлечение') выдал два варианта разбиения на составляющие части: Haupt|Spass (`главное развлечение') и Haupt|s|Pass (буквально `главный паспорт', но неверно). Поскольку во втором варианте присутствует соединительный элемент -s, что означает более "сложный" разбор, верным был признан первый вариант.

Качество работы сплиттера было проверено на одном из параллельных текстов объемом 3670 уникальных словоформ. Из данного текста вручную были извлечены 206 уникальных композитов, составившие соответственно 5,6% от общего числа уникальных словоформ. Сплиттер сработал с точностью 0,85, что являлось приемлемым для использования в данном исследовании.

Во второй серии экспериментов элайнменту предшествовал сплиттинг композитов. В целом, результаты элайнмента для композитов после сплиттинга оказались значительно лучше. Сегментированные на части композиты были обратно соединены в одно слово и записаны в отдельный файл вместе с их автоматически извлеченными переводами.

Помимо сплиттинга на возможные составляющие части, каждое слово, вернее, его начальная форма, проверялось на наличие в списке композитов, извлеченных на основе GermaNet - немецкого ворднета (Приложение). Из списка предварительно были удалены все приставочные композиты, а именно композиты любых частей речи с приставками -ab, -an, -auf, -aus, -bei, -durch, -ein, -entgegen, -gegen, -hin, -hinter, -in, -mit, -nach, -neben, -oben, -ohne, -um, -unter, -von, -vor, -vorbei, -wider, -wieder, -zu, -zwischen, -ьber. Также были исключены композиты с составляющими zehn, hundert, tausend, hunderttausend и -halb. Финальный список состоял из 74107 композитов.

Благодаря списку GermaNet в нашем корпусе появились композиты, первый компонент которых представляет собой усеченную основу инфинитива или существительного. Так композит Sehkraft (`зрительная сила/сила зрения'), образованный от усеченного инфинитива sehen (seh) и существительного Kraft, не был разбит сплиттером ввиду отсутствия неначальной формы seh в словаре. Однако слово было найдено в списке композитов и помещено в корпус. То же произошло с композитом Pfarrhause (`дом пастора'): модификатор Pfarr был образован усечением основы существительного Pfarre.

Также были распознаны композиты, компоненты-модификаторы которых являются существительными во множественном числе, то есть стоят в неначальной форме, и имеют умлауты в своей основе. Появление умлаутов, как и усечение основ, не было предусмотрено правилами сплиттинга. Например, рассмотрим композит Hдndedruck (`рукопожатие'). Модификатор Hдnde - множественное число от слова Hand. Кроме того, автоматически были извлечены композиты, неразбитые сплиттером по причине отсутствия одного из компонентов в словаре (Augenbraue (`бровь'): в словаре не было слова Braue).

Итак, всего из немецкоязычной части корпуса общим объемом 330624 токенов автоматически было извлечено 8851 композит, что составило 2,7 % токенов. Из них было сегментировано 7719 композитов (87,2 %), 7626 двухкомпонентных и 93 трехкомпонентных. 1132 композита (12,8 %) не были сегментированы сплиттером, но были найдены в списке композитов.

Поскольку автоматически извлеченных (разбитых на части) трехкомпонентных композитов оказалось слишком мало (всего 1 % от общего числа композитов), в рамках данного исследования нами было принято решение рассматривать только композиты, состоящие из двух компонентов. В случае если в дальнейших экспериментах среди неразбитых сплиттером, но найденных в списке композитов обнаруживался трехкомпонентный композит, он также исключался из финального корпуса.

IV.2 Анализ композитов и их русских переводов: определение основных характеристик композитов и типов переводческих соответствий

IV.2.1 Морфологический разбор композитов

Все немецкие композиты, как извлеченные благодаря сплиттеру, так и несегментированные, но имеющиеся в списке композитов, были поданы на вход инструменту SMOR - конечному преобразователю для морфологического анализа слов на немецком языке, разработанному в Институте машинной обработки речи в Штутгарте (Приложение). Данный инструмент находится в открытом доступе и может быть скачан с официального сайта.

SMOR анализирует немецкие словоформы и возвращает информацию о начальной форме слова, части речи и основных грамматических характеристиках, таких как род, число, падеж, склонение, лицо, наклонение и др., а также информацию о некоторых морфемах. Помимо перечисленного, SMOR может определять, написано слово в старой или в новой орфографии (в данной работе не использовалось). SMOR использует 78 различных тегов.

В случае если на вход подается композит, SMOR анализирует каждую из его составных частей. При этом SMOR определяет, какая из составляющих частей является опорным компонентом, а какие части являются компонентами-модификаторами.

После прочтения поданных на вход слов из файла SMOR может генерировать либо все возможные, либо наиболее частотные анализы для каждого слова. Если, например, слово имеет одинаковые формы в трех падежах, то SMOR выдает три анализа, отличающихся только падежным тегом. Так композит Hдuserblцcke (`кварталы') был проанализирован SMOR следующим образом (только наиболее частотные анализы):

Haus<NN>Block<+NN><Masc><Nom><Pl>

Haus<NN>Block<+NN><Masc><Gen><Pl>

Haus<NN>Block<+NN><Masc><Acc><Pl>

Все три морфологических разбора свидетельствуют о том, что данное слово является композитом. Определен опорный компонент (Block), обозначаемый символом "+" в частеречном теге, и компонент-модификатор (Haus). Оба компонента приведены в начальной форме. Компоненту-модификатору присваивается частеречный тег. У опорного компонента, помимо части речи (существительное), определяются категории рода, падежа и числа, которые, как отмечалось ранее в пункте 2.3., относятся также и ко всему композиту в целом.

Стоит отметить, что аналитические разборы композитов также часто включали в себя выделение наиболее распространенных суффиксов, как у компонентов-модификаторов, так и у опорных компонентов. При наличии определялись три суффикса мужского рода (-er, -ist, -ismus), четыре суффикса женского рода (-ung, -keit, -heit, -in) и два суффикса среднего рода (-chen, -lein).

В ходе исследования мы решили, что будем рассматривать только субстантивные композиты как наиболее распространенную группу немецких композитов. Принадлежность того или иного композита к классу существительных была определена с помощью SMOR. Композиты, признанные существительными, но обозначенные как имена собственные (например, Fuhrmann: `Фурман', Siegmund: `Зигмунд'), а также композиты, относящиеся к другим грамматическим классам, были удалены из текущего корпуса.

Также при морфологическом анализе автоматически извлеченных композитов обнаружилось, что некоторые из них могут быть разбиты на три компонента, даже если они были сегментированы сплиттером на две составляющие части. Так композит Dienstmдdchenzimmer (`комната горничной') был распознан сплиттером и разбит на Dienstmдdchen и Zimmer, в связи с наличием слова Dienstmдdchen в словаре. Однако слово Dienstmдdchen (`горничная'), в свою очередь, также является композитом, который следовало бы разбить на Dienst и Mдdchen. Композиты, сегментированные SMOR на три компонента, были исключены из списка.

Исходя из вышесказанного, можно отметить, что мы полностью полагались на морфологические анализы, выполненные с помощью SMOR. Слово входило в финальный список композитов, если SMOR признавал его субстантивным и двухкомпонентным композитом, и исключалось из него в случае иного.

Несмотря на довольно высокое качество морфологических разборов SMOR, некоторые (субстантивные и двухкомпонентные) композиты, верно признанные таковыми благодаря сплиттингу или имеющемуся списку композитов, в итоге не вошли в финальный корпус в связи с рядом причин.

Во-первых, для некоторых композитов SMOR не смог предоставить ни одного возможного морфологического разбора. Так, например, отсутствовал морфологический анализ композита Portierloge (`швейцарская/помещение для швейцара'), состоящего из слов Portier и Loge. Некоторые композиты не были проанализированы ввиду наличия ошибки в написании или старого написания, например, композит Hemdkragen (`воротник сорочки') встретился в корпусе как Hemdekragen, в связи с чем не получил ни одного морфологического анализа.

Во-вторых, часть композитов была определена SMOR как композиты, однако отсутствовал морфологический разбор каждого из компонентов (к примеру, так случилось с композитом Augenblick (`мгновение'), который следовало бы сегментировать на Auge и Blick). Такая проблема встретилась, в частности, у лексикализованных композитов, давно существующих и широко распространенных в немецком языке. Возможно, ее удалось бы избежать, если бы мы рассматривали все, а не только наиболее частотные морфологические анализы. Однако поскольку давно лексикализованные композиты не являлись предметом нашего научного интереса, несегментированные SMOR композиты в итоге не рассматривались.

IV.2.2 Анализ переводов и выделение частеречных паттернов

Анализ русских переводческих эквивалентов подразумевал два основных шага: определение части речи для каждого слова в русском переводе и падежа для имен существительных. Обладая данной информацией, мы могли с довольно хорошей точностью автоматически определять, к какому типу переводческого соответствия относится анализируемый перевод.

Для получения вышеназванной грамматической информации мы использовали морфологический анализатор pymorphy2 (Приложение). Преимущества данного инструмента заключаются в быстрой работе и хорошем качестве морфологических разборов, как для слов, имеющихся в словаре, так и для незнакомых слов.

В ходе экспериментов мы приняли решение о выделении трех основных типов перевода субстантивных композитов на русский язык: прилагательное и существительное (A+N), существительное и именная группа в родительном падеже (N+NPGen), существительное (N). Переводы, которые включали в себя существительное и предложную группу (N+PP), не выделялись в отдельный тип ввиду редкой встречаемости в нашем корпусе и условно относились к типу N. Паттерн N включал в себя как простые, так и сложные существительные. Более сложные случаи переводческих решений для композитов не рассматривались.

В контексте автоматического анализа русских переводов следует сказать о том, что несмотря на различные попытки улучшить элайнмент немецких композитов и их переводческих эквивалентов в русском языке, качество автоматического выравнивания все равно оставляло желать лучшего.

Во-первых, значительная часть переводов оставалась неполной, то есть в элайнменте присутствовали не все слова из перевода. В особенности, это было характерно для типа "прилагательное плюс существительное", при этом, как правило, в полученном переводе отсутствовало существительное. Например, композит Abendlied переводился в тексте как `вечерняя молитва'. Однако в элайнменте оказалось только прилагательное `вечерняя'.

Во-вторых, слова в переводе могли неправильно элайниться с соответствующими им компонентами композитов, что приводило к путанице в порядке слов. К примеру, возьмем уже упомянутые выше композиты Wolkenschatten (`тени облаков') и Sonnenstrahl (`луч солнца'). Оба композита переводились на русский язык одним и тем же типом, "существительное плюс именная группа в родительном падеже". Но если во втором случае элайнмент был выполнен абсолютно верно (Sonne/`солнца', Strahl/`луч'), то в первом случае в элайнменте присутствовали оба слова из перевода, но в неверном порядке (Wolke/`тени', Schatten/`облаков' вместо Wolke/`облаков', Schatten/`тени').

В связи с вышесказанным, нами были разработаны несколько специальных правил, позволивших автоматически определять частеречный паттерн с наименьшим количеством ошибок.

Первое правило заключалось в том, что если в переводе присутствовало более одного существительного и одно из них было в родительном падеже, то перевод композита относился к типу "существительное плюс именная группа в родительном падеже". Данное правило применялось в независимости от того, имелись ли в переводе имена прилагательные. Так в переводе композита Krankenkassenarzt (`врач больничной кассы') согласно первому правилу была верно распознана именная группа в генитиве, несмотря на наличие прилагательного, которое могло бы свидетельствовать о принадлежности к другому типу. Стоит отметить, что иногда данное правило становилось причиной возникновения ошибки: например, перевод композита Liebesblick, который состоял из существительного `взоры' и адъективного оборота `полные любви', следовало бы отнести к типу "прилагательное плюс существительное". Но поскольку `любви' - это форма родительного падежа, согласно первому правилу переводу был присвоен ложный тип N+NPGen.

...

Подобные документы

  • Специфика словообразования в немецком языке. Понятие перевода. Классификация словообразования в немецком языке путем сложения. Немецко-русский перевод литературных произведений. Абсолютная морфотемная структура русских и немецких имен существительных.

    дипломная работа [54,6 K], добавлен 27.12.2016

  • Определение понятия "композит". Лингвостилистические особенности медийного дискурса. Структурно-семантические особенности композитов. Мотивы композитообразования и употребления. Специфика перевода английских композитов в медийных текстах на русский язык.

    дипломная работа [108,7 K], добавлен 27.01.2015

  • Лексико-стилистические и грамматические особенности заголовков, их виды и функции. Основные трудности перевода немецких заголовков на русский язык. Классификация грамматических и лексических трансформаций, используемых при переводе немецких заголовков.

    курсовая работа [290,0 K], добавлен 12.09.2012

  • Отражение гендерного фактора в русском и немецком языках. Особенности перевода гендерно-корректной лексики с немецкого языка на русский. Перевод специфичных слов с индикатором мужского и женского пола. Перевод обращений по имени, титулу или должности.

    дипломная работа [80,6 K], добавлен 16.07.2017

  • Эквивалентность как одна из важнейших характеристик перевода. Типы эквивалентности и основные способы ее достижения. Переводческие решения: применение переводческих трансформаций для достижения эквивалентного перевода с немецкого на русский язык.

    дипломная работа [152,4 K], добавлен 24.08.2011

  • Анализ структуры сложных слов немецкого языка, их характерные структурные типы. Классификация немецких композитов на основе двух принципов: морфологического и семантико-синтаксического. Семантические отношения между компонентами существительных, глаголов.

    курсовая работа [23,0 K], добавлен 24.11.2009

  • Главные особенности перевода немецких сложных существительных и определение способов перевода такого рода существительных. Общая характеристика немецких сложных существительных, а также способы их образования в художественном и техническом языках.

    курсовая работа [71,0 K], добавлен 18.05.2014

  • Понятие, структура и содержание модальности в немецком языке, средства ее выражения. Лексико-грамматические трансформации предложений с модальным значением при переводе общественно-политических текстов с немецкого на русский язык; трудности перевода.

    курсовая работа [96,9 K], добавлен 14.02.2014

  • Теоретические основы и главные особенности перевода научных текстов. Проблемы перевода с русского на английский язык. Словарь как вспомогательное средство переводчика. Лексикографический анализ словаря Н.К. Рябцевой "Научная речь на английском языке".

    курсовая работа [29,6 K], добавлен 06.02.2015

  • Пути обогащения лексического состава языка. Основные способы словообразования. Этапы и методы перевода. Типы соответствий и трансформаций. Классификация немецких композитов в военных текстах. Анализ многокомпонентных терминов в военно-медицинских текстах.

    дипломная работа [93,3 K], добавлен 28.07.2017

  • Основные понятия и функциональные стили лингвостилистики. Принципы работы и типы систем машинного перевода. Сопоставительный анализ отрывков научно-технического текста и их переводов на русский язык с помощью различных СМП - трансфертной и статистической.

    дипломная работа [4,0 M], добавлен 23.06.2011

  • Перевод и другие виды языкового посредничества, их виды, формы и жанры. Место машинного перевода в общей классификации, его краткая характеристика. Содержание проблемы переводимости при машинном переводе, направления и перспективы ее разрешения.

    курсовая работа [42,2 K], добавлен 17.11.2014

  • Основные аспекты, функции порядка слов в немецком языке. Средства и подходы к обучению. Учет возрастных и психолингвистических особенностей обучающихся на средней ступени. Анализ возможных трудностей и методические рекомендации по обучению порядку слов.

    дипломная работа [3,1 M], добавлен 21.01.2017

  • Категория побудительности в языковедении. Анализ особенностей предписывающих немецких текстов на примере рекламы. Изучение текстов директивно-регулятивного типа, их места в системе речевой коммуникации. Немецко-русский перевод предписывающих текстов.

    курсовая работа [33,0 K], добавлен 10.04.2013

  • Термин "экзотизм" в ряду других терминов, обозначающих иноязычные единицы. Функции экзотизмов в тексте. Влияние экзотизмов на становление немецкого языка. Несовпадение объемов значений лексических единиц при переводе с немецкого на русский язык.

    курсовая работа [38,0 K], добавлен 15.01.2016

  • Синтаксические функции, в которых чаще всего выступает причастие в английском языке, особенности использования переводческих трансформаций при их переводе на русский язык. Формы и строевые признаки причастий, основные способы их перевода на русский язык.

    курсовая работа [252,7 K], добавлен 27.11.2012

  • Составление классификации лексических темпоральных показателей в немецком языке и выявление возможных способов их перевода в художественном произведении с немецкого языка на русский. Выявление некоторых строевых особенностей выражения временных понятий.

    дипломная работа [594,4 K], добавлен 07.08.2017

  • Стилистическая характеристика технического текста на английском языке. Особенности перевода научно-технического текста. Переводческие соответствия и трансформации, используемые при переводе технических текстов. Понятие, структура и особенности веб-сайта.

    дипломная работа [56,9 K], добавлен 13.10.2017

  • Определение художественного перевода. Концепция "творческая личность переводчика". Сущность творческой индивидуальности переводчика. Анализ переводов произведения "Ромео и Джульетта" на русский язык. Феномен множественности художественного перевода.

    дипломная работа [186,4 K], добавлен 27.02.2013

  • Понятие и истоки прагматики. Принципы классификации сложных слов в современном немецком языке. Словообразовательные модели, морфологическая и структурная внутренняя валентность, стилистические особенности, номинативные и экспрессивные функции композитов.

    дипломная работа [78,9 K], добавлен 20.07.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.