Специфика словарной поддержки машинного перевода

Характеристика видов, форм и жанров интерпретации смысла текста. Основные проблемы реализации словарной поддержки машинного перевода. Анализ крупнейших систем механической обработки, работающих с русским языком. Особенность выявления лексических ошибок.

Рубрика Иностранные языки и языкознание
Вид курсовая работа
Язык русский
Дата добавления 04.02.2017
Размер файла 54,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

ГЛАВА 1. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ МАШИННОГО ПЕРЕВОДА

1.1 Виды, формы и жанры перевода

1.2 Обзор систем машинного перевода

1.3 Принципы работы систем машинного перевода

ГЛАВА 2. СПЕЦИФИКА СЛОВАРНОЙ ПОДДЕРЖКИ МАШИННОГО ПЕРЕВОДА

2.1 Основные проблемы реализации словарной поддержки машинного перевода

2.2 Анализ практического применение машинного перевода (на примере англоязычного текста)

ЗАКЛЮЧЕНИЕ

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ

ВВЕДЕНИЕ

Перевод представляет собой сложное многогранное явление, в своем роде искусство, отдельные аспекты которого могут быть предметом исследования филологического дискурса. В рамках переводоведения переводческая деятельность изучается как психологическое, литературоведческое, этнографическое явление, достаточное внимание уделяется учеными также и истории развития перевода .

В настоящее время коммуникативная лингвистика особенно интересуется процессами речевой коммуникации, соотношением выраженного и подразумеваемого смысла в высказывании и тексте, влиянием коммуникативного пространства и контекстной ситуации общения на интерпретацию и репрезентацию текста.

В связи с этим представляется возможным выделить главные функции перевода - информативную и коммуникативную. Следовательно перевод - это средство обеспечить возможность общения между людьми, говорящими на разных языках.

Особенно активно современной наукой разрабатывается проблема машинного перевода текстов, которая на самом деле имеет свою богатую историю. Впервые машинный перевод, а также алгоритм осуществления пословного перевода, появляются в 1947г. Следующие два десятилетия были отмечены бурным развитием системы машинного перевода В январе 1954 года на машине IBM - 701 была продемонстрирована первая система машинного перевода IBM Mark II. Однако в 1967 году в США объявили машинный перевод нерентабельным.Это на некоторое время снизило интерес исследователей к специфике машинного перевода. Но уже в 70-е-80-е годы машинный перевод становится экономически выгодным за счет сравнительной дешевизны машинного времени. Среди русских ученых, которые занимались указанной проблемой, следует отметить таких, как А.А. Ляпунова, Г.Г. Белоногова,группа исследователей велись в лаборатории Инженерной Лингвистики ЛГПИ им. А. И. Герцена.

Актуальность исследования обусловлена новыми задачами и перспективами, которые являются характерными для информационного пространства человечества XXI века. Благодаря развитию средств массовой информации актуальность перевода в жизни современного человека неуклонно возрастает. На сегодняшний день переводческие связи охватывают почти все сферы человеческой деятельности. Движение информационных потоков во времени и пространстве практически не знает границ. Журналисты, корреспонденты, комментаторы, телеоператоры и другие многочисленные участники международного информационного процесса стремятся передать, по-своему ощущая и интерпретируя бесконечное разнообразие, многоголосие окружающего мира. В связи с этим постоянно растет значение переводческой деятельности, и, как следствие, возникают переводческие проблемы. Возникновение новых языковых проблем обуславливает поиски новых решений. В отличие от недавнего прошлого, когда перевод был связан преимущественно с текстами художественной литературы, в современном коммуникативном пространстве все более важное место - и по объему, и по социальной значимости - стали занимать переводы текстов специального характера - информационные, экономические, юридические, технические и рекламы.

Развитие кибернетики открыло возможности машинного перевода. Машинная обработка текста - это перевод, строящийся на использовании машиной обозначенных и постоянных для данного вида материала соответствий между лексическими и грамматическими явлениями разных языков. В настоящее время пользователь имеет широкий к достаточно широкому выбор пакетов программ, облегчающих переводческую деятельность, однако осуществить качественный перевод и получить в результате идеальный вариант переводного текста, на данный момент не предоставляется возможным посредством одной машины, без вмешательства человека.

Этот факт обратил на себя наше внимание, вследствие чего данная работа посвящена следующей теме: «Словарная поддержка процедур машинного перевода».

Объект исследования - реализация словарной поддержки при осуществлении машинного перевода.

Предметом являются стилистические, грамматические и семантические особенности машинного перевода.

Цель исследования - выявление, изучение и анализ особенностей машинного перевода.

Для достижения указанной цели были поставлены следующие задачи:

- классифицировать виды перевода;

-раскрыть специфику проблем, возникающих при машинном переводе;

-проанализировать качество продукта машинной обработки (на примере перевода англоязычного текста)

При написании данного исследования были использованы следующие методы: методы классификации применяются для систематизации изученных материалов, метод сопоставительного анализа применен для характеристики процесса машинной обработки текста, также использовались методы анализа, синтеза, обобщения и сравнения.

Данная работа состоит из введения, двух глав, заключения и списка использованной литературы.

ГЛАВА 1. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ МАШИННОГО ПЕРЕВОДА

1.1 Виды, формы и жанры перевода

Понятие «перевод» относится к числу общеизвестных и общепонятных, но и оно, в качестве трактовки специального вида человеческой деятельности и ее результата, претендует на уточнение и терминологическое определение.

Перевод как один из видов языковой деятельности представляет собой процесс адекватной и полноценной передачи мыслей, высказанных на одном языке, средствами другого языка [Нелюбин, 2009, с. 138].

Перевод - это сложный и многогранный вид человеческой деятельности. Хотя обычно говорят о переводе «с одного языка на другой», но, в действительности, в процессе перевода происходит не просто замена одного языка другим. В переводе сталкиваются различные культуры, разные личности, разные склады мышления, разные литературы, разные эпохи, разные уровни развития, разные традиции и установки. Переводом интересуются культурологи, этнографы, психологи, историки, литературоведы, и разные стороны переводческой деятельности могут быть объектом изучения в рамках соответствующих наук. В то же время в науке о переводе -- переводоведения -- могут выделяться культурологические, когнитивные, психологические, литературные и прочие аспекты [Комиссаров, 2002, с. 22].

Обращает на себя внимание и определение А.В.Федорова: «Перевести -- значит выразить верно и полно средствами одного языка то, что уже выражено ранее средствами другого языка» [Федорова, 1983, с. 10].

Осуществляя коммуникативную деятельность в двуязычной ситуации, переводчик одновременно кодирует и декодирует обрабатываемую им информацию в кодах двух разных знаковых систем. Поэтому процесс перевода можно считать сложным видом психолингвистической деятельности в условиях двуязычной ситуации [Нелюбин, 2009, с. 17].

Реальная переводческая деятельность осуществляется переводчиками в различных условиях; переводимые тексты весьма разнообразны по тематике, языку, жанровой принадлежности; переводы выполняются в письменной или устной форме, к переводчикам предъявляются неодинаковые требования в отношении точности и полноты перевода. [Комиссаров, 1990, с. 94]. Все это обусловливает существование разных видов перевода, каждый из которых, оставаясь переводом в своей общелингвистической основе, может иметь существенные особенности, что, в свою очередь, вызывает необходимость научной классификации видов переводческой деятельности [Сдобников, Петрова, 2006,с. 96-102].

Понятие видов перевода связано, прежде всего, с жанровыми особенностями материала, являющегося объектом межъязыковой передачи. Выделяют два основных вида перевода: перевод художественный и перевод специальный.

Художественный перевод, или перевод литературоведческий, функционирует в сфере художественной литературы. Его теоретической базой является литературоведческая теория перевода, направленная также и на решение историко-литературных задач.

Для художественного текста ведущей является художественно-эстетическая или поэтическая функция. Для специальных текстов - функция сообщения, информирования.

В обозначенных двух видах перевода различают также жанры перевода. Литературоведческий и лингвистический дискурсы определяют жанр как исторически сложившийся ряд художественных произведений и произведений специальных отраслей знаний. Такие произведения характеризуются определенными композиционными, стилистическими и другими признаками, а также отдельными разновидностями этого ряда, относящимся к разным функциональным стилям и подсистемам языка. Соответственно, в художественном переводе - это проза, драматургия, поэзия и другие подстили, в специальном переводе - это подъязыки (подстили, языки официальных документов (дипломатических, юридических, военных, коммерческих и др.), научно-технических по предметным областям знания (химии, физики, математики, электроники и т.д.), публицистических (газетных сообщений, газетных статей, журнальных статей, эссе, ораторской речи, заголовков, объявлений, рекламы и других СМИ), повседневного общения ( литературно-фамильярный и фамильярно-разговорный).

Формы перевода определяются способом, которым перевод осуществляется. В связи с этим различают письменный и устный переводы, а так же их разновидности : двусторонний, последовательный, синхронный.

Письменный перевод - наиболее распространенная профессиональная форма перевода, когда объем памяти, неограничен Его называют также письменно-письменным.

1. Особенности письменного перевода не ограничивают переводчика жесткими временными рамками, он может в любой момент прервать перевод, вернуться к уже переведенному отрезку речи, потратить дополнительное время на обдумывание варианта перевода. В устном переводе действия переводчик строго ограничен по времени темпом ораторской речи, необходимостью выдавать перевод одновременно со звучанием ораторской речи или сразу же после произнесения соответствующего текста (или его части) оратором [Мирам, 1999, с.47].

Устный перевод - понятие, объединяющее все формы перевода, предполагающие устное оформление. Приводим следующие его разновидности:

· Зрительно - устный перевод или перевод с листа, т.е. устный перевод, осуществляемый одновременно со зрительным восприятием исходного письменного текста. Устный перевод на слух включает последовательный перевод и синхронный перевод.

· Последовательный перевод - устный перевод сообщения с одного языка на другой после его прослушивания, осуществляемый в конце всего сообщения. Он включает: последовательный перевод с записью, когда перевод во время восприятия фиксируется переводчиком с использованием системой записей в последовательном переводе.

· Абзацно-фразовый перевод - упрощенная форма последовательного перевода, когда текст воспроизводится после прослушивания его не целиком, а по частям.

Письменный и устный переводы различаются также и «направлением» перевода, то есть характером соотношения участвующих в акте коммуникации языков. В письменном переводе соотношение языков постоянное, перевод осуществляется всегда «в одну сторону» (например, с английского языка на русский), в то время как в устном переводе это соотношение языков и «направление» перевода могут меняться, как в случае двустороннего перевода беседы (каждый из коммуникантов последовательно выступает то в роли источника, то в роли рецептора).

Как отмечалось выше, это две основные классификации видов переводческой деятельности. Использование иных критериев может привести к созданию других классификаций перевода. Виды перевода можно классифицировать по следующим критериям:

- по участию человека в процессе перевода («машинный перевод» в противопоставлении переводу с участием человека);

- по типу и однородности использованных в процессе коммуникации семиотических систем (межсемиотический перевод и внутрисемиотический перевод, в рамках внутрисемиотического перевода различают межъязыковой перевод и внутриязыковой перевод) [Сдобников, Петрова, 2006, с. 101-103].

1.2 Обзор систем машинного перевода

Машинный перевод представляет собой процесс связанного перевода текстов, осуществляемый посредством словарной поддержки, компьютерной программой с одного естественного языка на другой. Словарная поддержка - это комплекс последовательных, технических процедур , направленных на автоматическое распознавание переводимых единиц и соотнесение их с нормативными требованиями.

Различают следующие основные цели использования машинного перевода :

· Быстрое ознакомление с интересующей информацией - машинный перевод позволяет получить в общих чертах информацию о содержании статьи, книги, научной работы и т. д.

· Возможность коммуникаций - машинный перевод дает возможность связаться с любым человеком из любой точки мира.

· Упрощение работы переводчика - используя машинный перевод, переводчик может значительно ускорить перевод текста.

В настоящее время различают три вида систем машинного перевода :

· Системы на основе грамматических правил (Rule-Based Machine Translation, RBMT).

· Статистические системы (Statistical Machine Translation, SMT).

· Гибридные системы.

Системы на основе грамматических правил производят анализ текста, который используется в процессе перевода. Перевод производится на основе встроенных словарей для данной языковой пары, а так же грамматик, охватывающих семантические, морфологические, синтаксические закономерности обоих языков. На основе всех этих данных исходный текст последовательно, предложение за предложением, преобразуется в текст на требуемом языке. Основной принцип работы таких систем - связь структур исходного и конечного текстов.

Несомненно, преимуществами систем на основе грамматических правил являются грамматическая и синтаксическая точность, стабильность результата, возможность настройки на специфическую предметную область. К недостаткам систем на основе грамматических правил относят необходимость создания, поддержки и обновления лингвистических баз данных, трудоемкость создания такой системы, а так же ее высокая стоимость.

Статистические системы при своей работе используют статистический анализ. В систему загружается двуязычный корпус текстов (содержащий большое количество текста на исходном языке и его «ручной» перевод на требуемый язык), после чего система анализирует статистику межъязыковых соответствий, синтаксических конструкций и т. д. Система является самообучаемой - при выборе варианта перевода она опирается на полученную ранее статистику. Чем больше словарь внутри языковой пары и чем точнее он составлен, тем лучше результат статистического машинного перевода. С каждым новым переведенным текстом улучшается качество последующих переводов. Статистические системы отличаются быстротой настройки и легкостью добавления новых направлений перевода. Среди недостатков наиболее значительными являются наличие многочисленных грамматических ошибок и нестабильность перевода.

Гибридные системы сочетают в себе подходы, описанные выше. Ожидается, что гибридные системы машинного перевода позволят объединить все преимущества, которыми обладают статистические системы и системы, основанные на правилах.

Крупнейшие системы машинного перевода, работающие с русским языком

Три крупнейшие системы машинного перевода, работающие с русским языком-- Abbyy Compreno, Google Translate и Яндекс.Перевод . Каждая из этих систем продолжает активно развиваться, совершенствуясь и улучшая качество перевода.

AbbyyCompreno

Abbyy Compreno - технология, разработанная российской компанией «Abbyy», а также одноименная система, созданная ей же.

Для перевода система строит полное синтаксическое дерево исходного текста. Для его построения она использует отдельно заданные правила для каждого языка. Причем Compreno способна правильно обрабатывать анафоры, эллипсис и другие трудно поддающиеся обработке языковые конструкции. При переводе учитываются связи между словами в этом дереве, возможное положение этих слов вUSH (Universal Sematic Hierarchy - иерархии универсальных семантических значений и отношений между ними) а также статистика взаимоотношений между словами. Основным недостатком данной системы является её закрытость, отсутствие данных о полномасштабных тестированиях данной системы, что делает невозможным оценку качества производимого ей машинного перевода.

Google Translate

Google Translate - система, в настоящий момент разрабатываемая компанией Google. Первоначально разрабатывалась Franz Josef Och. Построена на статистическом методе перевода. Для обучения системы первоначально использовались параллельные корпуса текстов ООН, представленные на шести официальных языках ООН.

Данная система не осуществляет прямой перевод для языковых пар, в которые не входит английский язык. То есть, при переводе, например, с русского языка на французский, сначала будет осуществлен перевод с русского на английский язык, апосле этого - с английского на французский. Более того, для некоторых языков таких шагов больше. Например, тексты на белорусском языке вначале переводятся на русский, после этого на английский и только потом превращаются в текст на конечном языке. Это значительно снижает точность перевода и делает систему абсолютно непригодной для перевода ряда текстов.

Яндекс.Перевод

Яндекс.Перевод представляет собой сервис автоматического перевода слов, фраз, целых текстов, а так же веб-страниц. Как и Google Translate, Яндекс.Перевод использует статистический перевод. Яндекс.Перевод состоит из двух частей -- модели перевода и модели языка. Модель перевода занимается построением графа, содержащего все возможные варианты перевода предложения. Модель языка выбирает лучший вариант перевода с точки зрения оптимальной сочетаемости слов в естественном языке. Хотя список доступных для перевода языков у Яндекс.Перевода значительно меньше, чем у Google Translate, перевод осуществляется напрямую, без использования промежуточных звеньев.

1.3 Принципы работы систем машинного перевода

Словарная поддержка при осуществлении машинного перевода может быть рассмотрена на основе выделения следующих атрибутов: морфологических, синтаксических, лексических, семантических и т.п. Данные атрибуты не присутствуют явно в тексте, они операционализируются с помощью определенного набора технических процедур анализа текста, который характеризуется многоуровневостью и выполняется модулем лингвистического процессора. Можно выделить такие составные компоненты анализа текста:

- графематический анализ (выделение слов и предложений);

- морфологический анализ;

- синтаксический анализ;

- семантический анализ;

- построение модели предметной области (сценария или ситуации) [Нелюбин, 1991, с.46 ]

Многоуровневость анализа текста обеспечивает выделение и с сопоставление выделенных атрибутов. Основываясь на таких атрибутивных наборах при осуществлении алгоритмизации извлечения информации, становится возможным поиск фрагментов текста, релевантных цели. Использование многоуровневого характера анализа текста не является общеобязательным правилом, так как осуществление перевода и требования к его полноте и качеству могут зависеть от области применения полученных результатов, источников информации, а также точности и полноты, с которой эту информацию нужно извлекать. Этим обуславливается их частое исключение из числа этапов анализа текста. Рассмотрим каждый из них подробнее.

Графематический анализ.

Графематический анализ - это техническая процедура первичного анализа текста, позволяющая выделять информацию, для последующей обработки. Основными задачами графематического анализа являются:

- разбивка исходного текста на слова, расстановление пробелов и т.д.

- соединение написанных раздельно слов;

- выявление устойчивых словарных конструкций, не предполагающих аналоговых вариантов;

- маркировка написанных инициалами имени и отчества;

- выделение электронных адресов и имен файлов;

-структурирование входного текста путем выделения в нем абзацев, предложений, заголовков и т д.

2. Морфологический анализ

Морфологический анализ предполагает две группы алгоритмов анализа: словарные и бессловарные. Бессловарные алгоритмы характеризуются большей компактностью и производительностью, однако обладают гораздо меньшей скоростью, нежели словарные. В связи с этим их применение может быть целесообразно при отсутствии требований к высокой точности, а лишь для выявления простых морфологических атрибутов. Если же последующая обработка предполагает синтаксический анализ, то высокая точность является необходимым требованием, и применяется словарный метод. текст словарный машинный перевод

Словарный метод предполагает наличие словаря основ и флексий. По словарю отыскиваются допустимые наборы атрибутов для каждой графемы. В случае отсутствия слова в словаре, выполняется предсказание парадигмы (аналогично бессловарным методам). Одной графеме может соответствовать несколько наборов атрибутов. Такие случаи - морфологическая омонимия - довольно часто встречаются в русском языке. Существуют алгоритмы для решения этой проблемы с высокой вероятностью успеха.

Словосочетание «компьютерная морфология» является относительно новым в употреблении, и еще несколько лет назад было понятно только узкому кругу специалистов. Однако на современном этапе морфология является неотъемлемой частью интеллектуальной поисковой машины.

3. Синтаксический анализ

Главной целью синтаксического анализа выступает построение синтаксических конструкций на одном морфологическом варианте одной клаузы, т.е. одного простого предложения в составе сложного.

Типология, выступая главным предметом теоретической лингвистики, преследует своей целью сравнение грамматик естественных языков и синтаксические законы, применимые одновременно к большому количеству разных языков. Целью же компьютерной лингвистики в области синтаксиса является построение автоматизированного анализатора отдельного языка. Основными функциональными особенностями данного анализатора являются его возможности выделения простых предложений в составе сложного, установление связей между словами и построение полного синтаксического дерева предложения. Отличительной чертой компьютерных программ является то, что они работают только с грамматикой письменного языка, в то время как теоретические исследования располагают возможностями описания как письменного языка, так и устной речи. Таким образом, спектр возможностей в компьютерной лингвистике значительно уже по сравнению с теоретической, но с другой - их выполнение требует значительно большей строгости и формальности описания.

4. Семантический анализ

Семантический анализ существует для построения семантической структуры одного предложения, которая в свою очередь состоит из семантических узлов и семантических отношений. Под семантическим узлом понимается объект текстовой семантики, характеризующийся заполненностью всех валентностей, как эксплицитно выраженные в тексте, так и имплицитно получаемых из экстралингвистических источников. Таким образом, мы видим, что построение семантического узла является возможным лишь в

4. Семантический анализ

Семантический анализ существует для построения семантической структуры одного предложения, которая в свою очередь состоит из семантических узлов и семантических отношений. Под семантическим узлом понимается объект текстовой семантики, характеризующийся заполненностью всех валентностей, как эксплицитно выраженные в тексте, так и имплицитно получаемых из экстралингвистических источников. Таким образом, мы видим, что построение семантического узла является возможным лишь в самом конце семантического анализа. Это и обуславливает главную цель семантического анализа - построение семантических узлов, посредством заполненности всех валентностей.

Можно отметить, что семантический анализ представляет собой выделение в тексте смысловых связей и групп.

К ним, в первую очередь, необходимо отнести выделение именованных сущностей, объектов, которые имеют различную форму записи в тексте и могут принимать различные значения. Например, к таким именованным сущностям относятся даты, физические величины, названия географических объектов, имена и т.п. Эта процедура позволяет приписывать слову или группе слов атрибут, которым может обозначать определяющий вид именованной сущности. Это делается для получения возможности дальнейшего использования данного атрибута с целью идентификации извлекаемой информации.

Следующей особенностью семантического анализа можно назвать механизм выявления семантических классов, к которым относятся взаимосвязанные с предметной областью группы понятий, являющихся одной и той же частью речи.

Расширение кореферентности в тексте - третий аспект семантического анализа. Кореферентность следует понимать как обозначение различными словами одного и того же объекта действительности. Для пояснения уместен будет следующий пример: фраза «глава Российского государства» и «президент России» обозначает одно и то же лицо. Установление референта для выражения (при наличии модели предметной области) может помочь разрешить проблему кореферентности, также этому может способствовать или установление кореферентной связи (признака того, что выражения ссылаются на одни и тот же объект) между выражениями.

Теперь необходимо разобраться с четвертым элементом семантического анализа, которым выступает разрешение анафоры. Под последней понимается невозможность использования языковых выражений без учета интерпретации другого (либо) предшествующего фрагмента текста. Разрешение анафоры сводится к установлению связи между анафорическим выражением и его интерпретацией (антецедентом). Частным случаем этой проблемы является разрешение местоименной анафоры, где в роли анафорического выражения выступает местоимение.

И, наконец, завершающим этапом семантического анализа является выявление семантических ролей и связей. Основанием для реализации этого подхода выступает использование словаря моделей управления. Данный словарь состоит из списка предикатов русского языка, которыми описываются различные способы синтаксической реализации в тексте различных типов смысловых отношений между понятиями, отражающими некоторую ситуацию. Словарная статья описывает семантические роли участников этой ситуации и способы их выражения в тексте. После выявления семантических ролей можно выделить и различные семантические связи между участниками ситуации. Виды ролей определяются при составлении словаря, а виды связей задаются, как правило, уже при решении конкретной задачи [Кормалев, 2003, с. 96].

5. Построение модели предметной области

Наиболее сложным, но и приносящим наиболее точные результаты этапом является построение модели ситуации или предметной области, которая описывается в тексте. Этот этап реализует представление в структурном виде, отражающем все значимые смысловые связи, всего текста или набора текстов. Но так как задача построения модели очень сложна, в прикладных системах редко прибегают к ее использованию [Каничев, 1998, с. 55].

Таким образом, в первой главе мы рассмотрели и дали интерпретацию понятию «перевод». Выделили его виды, формы и жанры. Так же рассмотрели понятие «машинный перевод». Затронув тему машинного перевода, мы рассмотрели, какое место он занимает в общей классификации перевода. Выяснили, каким образом осуществляется работа программы-переводчика.

ГЛАВА 2. СПЕЦИФИКА СЛОВАРНОЙ ПОДДЕРЖКИ МАШИННОГО ПЕРЕВОДА

2.1 Основные проблемы реализации словарной поддержки машинного перевода

Реализация словарной поддержки осуществляется путем решения некоторых специфических трудностей, которые могут возникнуть в процессе перевода.

Представляется возможным выделить и охарактеризовать наиболее существенные проблемы реализации машинного перевода:.

-прблемы, связанные с лексическим значением слова;

-проблемы морфологического строя языка;

-проблемы перевода грамматических конструкций, которые состоят из нескольких слов (идиомы и словоочетния).

Проблема значения слова возникает в связи с тем, что одно переводимое слово на языке перевода может иметь несколько значений . Это так называемая лексическая неоднозначность.В случае когда предложение может иметь несколько структур перевода, мы имеем дело со структурной неоднозначностью. Предложение, как правило, почти всегда имеет несколько значений.

Сложность перевода заключается в том, что такие неоднозначности имеют свойство накапливаться в тексте. Так, если предложение в своем составе имеет два слов, каждое из которых может иметь по два значения, то перевод данного предложения можно произвести четырьмя способами.Для качественного, достоверного перевода неодбходимо рассматривать все варианты и выбрать один наиболее подходящий.. В связи с данной проблемой уместно было бы процесс перевода интерактивным. В этом случае, человек сидящий за компьютером решал бы, какой вариант более приемлем.

Проблемы морфологического строя языка

Грамматические, точнее морфологические особенности строя языка обуславливают различия в характере переводческих правил для конкретного языка. такие различия обнаруживаются при переводе с английского языка на русский.Это объясняется отсутствием в английском языке ряда форм, вследствии чего согласование выступает как форма связи между членами словосочетания. машинный перевод ставит перед собой задачу выработать такую систему правил, которая прозволит максимально точно определять, какой текст другого языка максимально точно передает язык оригинала. аждый язык имеет словарный состав и грамматический строй , следовательно в каждом тексте существуют грамматические связи для выражения различных отношений между понятиями, которые эти слова обозначают.Таким образом, перевод с одного языка на другой должен содержать не только правила перевода слов, но особенности правильной передачи грамматических конструкций. [Кузнецов, Ляпунов, Реформатский, 1956, с. 108-112].

Сложные конструкции - идиомы и словосочетания. Идиома - это набор слов, который имеет собственное значение, не зависящее от значения составных частей.

If Jim mends the bucket, his children will be rich.

If Jim kicks the bucket, his children will be rich.

Если Джим сыграет в преферанс, его дети будут богатыми.

Если Джим сыграет в ящик, его дети будут богатыми.

Если пользоваться любыми другими правилами, первое предложение можно перевести правильно, а второе нельзя, так как "kick the bucket" - идиома. Есть, конечно, исключения. Например, "to take bull by the horns" можно совершенно свободно перевести на русский ("взять быка за рога").

Идиомы похожи на языковые пробелы, и, вероятно, решение этой проблемы должно быть одинаковым. Идиомы должна выявляться на одном из начальных этапов перевода, чтобы избежать их потери, и обрабатываться системой как одно слово. Трудность возникает только в вопросе привязки идиомы к слову, по которому будет производиться ее поиск. В предыдущем примере можно задать условие поиска идиомы по глаголу "to kick", чтобы искать ее окончание, или по существительному "buсket". Проблема в том, что идиомы могут быть записаны в нескольких формах и эти формы могут не всегда образовываться по обычным грамматическим правилам.

Словосочетания отличаются от идиом. Их смысл полностью исходит из смысла составных частей, но только не всегда можно узнать, какие слова следует употреблять:

This butter is rancid (неправильно - sour, rotten, stale).

То есть тот факт, что англичане говорят "rancid butter", но не "sour butter", нельзя угадать только по слову "butter" и тем более по слову "rancid" [Марчук, 1983, с. 231].

Однако общее значение в разных языках могут иметь не только отдельные слова, но и словосочетания, поэтому простейший переводящий автомат ищет соответствия не только для отдельных слов, но и для словосочетаний, выполняя так называемый пословно-пооборотный перевод.

Кроме того, соответствие слов разных языков друг другу не является однозначным, т.е. одному слову языка А может соответствовать несколько слов языка и наоборот. Следовательно, словарная поддержка предусмотривает программу выбора правильного эквивалента.

Такие программы обычно основываются на двух принципах:

1. Выбор подходящего языкового эквивалента с опорой на синтаксическую модель переводного текста.

2. Выбора эквивалента с учетом семантической модели. Для получения наиболее качественного перевода необходимо использовать обе модели в комплексе, так как они сами по себе довольно сложны в примерении на практике. Кроме того задача осложняется трудностью выбора наиболее соотносимого языкового элемента.

Помимо всего выше сказанного, необходимо учитывать ряд особенностей словарной поддержки, которые не решает всех проблем машинного перевода:

· Электронный перевод не распознает и не устраняет описки, опечатки, орфографические ошибки ( в этом случае могут помочьспециальные программы, ориентированные на проверку правописания);

· Неправильная расстановка знаков препинания осложняет перевод, в свями с неправильно понятой ситтаксической структурой высказывания;

· Машинный перевод игнорирует русскую букву «ё», «не видит» ударений в словах

· Инверсия не воспринимается электронным переводчиком и осложняет процесс передачи текста;

· Трудности при переводе могут возникать из-за правописания большойи маленькой заглавных букв. Маленькая буква в некоторых случаях становится большой, большая маленькой - практически нет.

· Не стоит пропускать предлоги. В противном случае в английском переводе зачастую утрачивается корректный смысл.

· Не рекомендуется употреблять жаргоны, неологизмы, диалектизмы. Электронная база словарей может не содержать подобных выражений. [Федорова, 1983, с. 241].

· Машинный переводчик распознает только общепринятые сокращенияи и аббревиатуры. Неправильный перевод сокращения - это только половина проблемы. Неправильно переаведенное слово может исказить смысл всего предложения.

Хороший перевод текста - это не только творческая, но и достаточно трудоемкая работа. Что касается творческой части, то в обозримом будущем в соревновании компьютер-человек всегда победит "живой" переводчик. Однако для решения проблем, обусловленных трудоемкостью процесса перевода, системы МП могут оказаться хорошим подспорьем. Для того чтобы это лучше понять, перечислим достоинства программ машинного перевода:

1. Машинный перевод обеспечивает высокую скорость переводов. Это облегчает работу переводчиков, предоставляет возможность быстро ознакомиться со смыслом текста.

2. Комфортная стоимость.

3. Доступность, простота в использовании.

4. Конфиденциальность. Информация, доверенная машинному переводу останется в любом случае неразглашенной.

5. Электронный переводчик универсален.

6. Возможность перевода текстов в Интернете. Программы-переводчики позволяют знакомиться с информацией на иностранных языках. Онлайновые системы МП предоставляют возможность знакомиться с иностранными сайтами, не затрудняясь с их переводом. [Марчук, 1996, с. 187].

2.2 Анализ практического применение машинного перевода (на примере англоязычного текста)

Чтобы лучше понять принципы действия систем МП и их методы использования словарей и анализа грамматики, равно как и синтеза структур на выходном языке, системами машинного перевода был переведен пара текс. Перевод производился с английского языка на русский (системы переводили небольшой текст ). При анализе мы использовали 2 критерия: 1) правильность подбора системого значения слов (уровень лексики), 2) правильность согласования слов в предложении (уровень грамматики).

К лексическим ошибкам мы отнесли, кроме неправильно подобранных системой значений слов при переводе, также и случаи, когда система не может по каким-либо причинам перевести то или иное слово.

К грамматическим ошибкам отнесли случаи неправильного согласования слов в предложении в роде, числе, лице, падеже, нарушения пунктуации и неправильного построения синтаксических конструкций

В качестве примера приводим статью, посвященную изучению женских характеров в творчестве И.С. Тургенева:

In Russian literature, it is the pre-dominantly male authored Russian realist novel which has produced some of the most remarkable and complex female characters in the whole of the novel genre in the absence of Russian counterparts of female realist novelists such as Jane Austen, the Brontes or George Elliot. Turgenev's women are frequently seen as prototypes of this tradition and Russian readers are as familiar with their names and personalities as real life acquaintances.

While analyzing Turgenev's representation of various women characters in Fathers and Sons, one important underlying question would be how `true' or `authentic' this representation would be. To Pam Morris, “feminist critical reading of canonical texts reveals a pervasive misinterpretation of women within the literary tradition. In particular, feminist critics have altered us to the way in which women are often constructed as `other' to a male norm.” Instead of being perceived as identities in their own right, women characters tend to function as locations for male desires, fears and anxieties about the female. Most often in a broad sense, the representation of women in literature is comprised largely of variations upon the stereotypical images of the virgin and whore, wicked witch and child-like innocent, Eve and Magdalene, wife, mother and mistress.

Вот ее перевод на русский язык, выполненный человеком:

В русской литературе, авторами реалистических романов являются преимущественно мужчины.Именно перу мужчин принадлежат одни из самых замечательных и сложных женских образов, писатели-реалисты женщины , такие как Дж. Остин, сестры Бронте,Дж. Эллиот, отсутствуют. Тургеневские героини часто рассматривается в качестве прототипа этой традиции и русские читатели знакомы с их именами и личностями, как со знакомыми из реальной жизни. При анализе представленных Тургеневым различных женских персонажей в Отцы и дети, основным вопросом является подлинность данной репрезентации. По Пэм Moрис, "феминистически критическое прочтение канонических текстов показывает, распространение неправильного толкования женщин в литературной традиции. В частности, феминистские критики указывают нам на то, что женский образ часто строится как ", второстепенный в отношении вмужской нормы ». Вместо того, чтобы восприниматься на равных, женские персонажи, как правило, функционируют в угоду мужским желаниям, исполнены страхами и тревогами о женском. Чаще всего в широком смысле, репрезентация женских характеров в литературе, состоит в основном из вариаций на тему стереотипных образов: девственница и особа легкого поведения, злая ведьма и по-детски невинное дитя, Ева и Магдалина, жена, мать и хозяйка.

При переводе переводчику пришлось поменять порядок слов в нескольких предложениях.

Перевод, выполненный онлайн-переводчиком Google:

В русской литературе, это предварительно преимущественно мужской автором русский реалистический роман, который произвел некоторые из самых замечательных и сложных женских персонажей в целом романного жанра в отсутствие российскими коллегами женского пола реалистов писателей, таких как Джейн Остин, Brontes или Джордж Элиот. Женщины Тургенева часто рассматривается как прототипы этой традиции и российские читатели так хорошо знакомы с их именами и личностями, как в реальной жизни знакомых.

При анализе представление Тургенева различных женщин персонажей отцов и сыновей, один важный основополагающий вопрос будет, как "истинный" или "подлинный" это представление будет. Пэм Моррис, "феминистское критическое чтение канонических текстов показывает, всепроникающее неправильного толкования женщин в литературной традиции. В частности, феминистские критики изменили нас на пути, в которых женщины часто строится как «другого» в мужской нормы. "Вместо того, чтобы восприниматься как идентичностей в их собственном праве, женщины символы, как правило функционировать в качестве мест для мужчин желаний, страхов и беспокойство по поводу женщин. Чаще всего в широком смысле, представительство женщин в литературе состоит в основном из вариаций на стереотипных образов Богоматери и шлюха, злой ведьмы и невинный, Ева и Магдалины, жены, матери и хозяйки.

Обнаружены такие ошибки : лексические -не нашлось верного перевода английскому «other»- правильный перевод - «второстепенный», а не «другой» ; «child-like innocent» требует художественного перевода «по-детски невинное дитя», «невинный» - это неточный вариант; грамматические (неверное согласование в роде слов «всепроникающее неправильного толкования», неверное согласование в числе фраз: «на пути, в которых», «женщины часто строится». Кроме того встречаются несогласованные грамматические конструкции: «преимущественно мужской автором русский реалистический роман», «при анализе представление Тургенева различных женщин». Видно, что переводы довольно сильно различаются. В первом переводе сохранены правильные грамматические, синтаксические структуры. Во втором тексте слова, по большей части, не связаны друг с другом. Главная мысль и идея текста понятна - женские характеры в романах И.С. Тургенева-.улавливается слабо. Не соблюдается огромное количество правил. Отсюда можно сделать вывод. Система машинного перевода не усовершенствована. Человеческий фактор играет огромное значение. Второй текст нуждается в обстоятельном исследовании и корректировке.

Во 2 главе мы рассмотрели некоторые особенности машинного перевода, проблемы переводимости при машинном переводе. Перечислили достоинства и недостатки машинного перевода. Провели переводческий эксперимент, где выявили основные ошибки машинного перевода. Выяснили, что машинный перевод не может обойтись без участия человека.

ЗАКЛЮЧЕНИЕ

История машинного перевода насчитывает немногим более пятидесяти лет. Постоянное усовершенствование систем машинного перевода оставило в прошлом первые программы, использовавшие ограниченные ресурсы универсальных компьютеров первого поколения. Интенсивное развитие научной мысли и техники позволяет постоянно совершенствовать современные возможности в связи супотреблением мощных ресурсов серверов и персональных компьютеров, включая ПК, в которых можно размещать карманные словари. Уровень полной автоматизации видится в перспективе развития наук, работающих над созданием подобных систем.

Специфика современной машинной обработки предполагает получение в результате перевода текста максимально приближенный к языку оригинала результат. На данном этапе развития машинного перевода конечный продукт обработки текста еще имеет некоторые неточности и недостатки.

Основные проблемы реализации словарной поддержки машинного перевода являются следующие:

проблемы значения слова;

различие в типе морфологического сторя языка;

сложности перевода грамматических конструкций, состоящих из нескольких слов ( идиомы и словосочетания).

Изучив теоретический материал по теме данного исследования и проанализировав качество продукта машинной обработки на примере фрагмента англоязычного текста, мы пришли к следующим выводам:

· Наибольшее число трудностей при переводе и, соответственно, ошибок относится к уровню грамматики. Электронные переводчики адекватно переводят простые части речи, но допускают ошибки в переводе падежей, принадлежности прилагательных, речевых оборотов

· Переводчик справляется с переводом слов во множественном и единственном числе, но имеется определенная трудность в переводе падежей и постановки глаголов в нужное число. Это объясняется различной интерпретацией падежей в русском и английском языках: в русском - через окончание, в английском - через предлоги.

· Недостатком некоторых переводчиков является неточность перевода слов, имеющих несколько значений. Для более адекватного перевода в перспективе можно предложить более глубокий эвристический анализ грамматического построения предложения, с улучшением качества перевода различных частей речи и их грамматических характеристик, а так же исключить конфликт словарей при переводе специализированных текстов

· Машинный переводчик не умеет исправлять ошибки и распознавать неправильно написанные слова (здесь могут оказаться полезными специальные программы проверки орфографии).

Практические проблемы, возникающие при применении автоматического оборудования для перевода с одного языка на другой разнообразны и сложны. Однако современное развитие науки с увеличением быстродействия процессоров и ростом объема оперативной памяти постоянно повышает качество машинного перевода.

Наиболее перспективным направлением развития систем машинного перевода является совершенствование подсистем грамматического анализа и синтеза, а также увеличение объема контекстуального охвата текста и совершенствование семантических цепочек с целью более точного подбора значений слов. Программа-переводчик - это, прежде всего, инструмент, который позволяет решить проблемы перевода или повысить эффективность труда переводчика только в том случае, если он используется грамотно.

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ

1. Ермаков А.Е. Неполный синтаксический анализ текста в информационно-поисковых системах. - М.: Ника-центр , 2002. - 315 с.

2.Каничев М. Встреча компьютерных толмачей. // Мир ПК. - М.:Высшая школа, 1998. - № 8. - С. 53-61.

3. Комиссаров В.Н. Современное переводоведение. Учебное пособие. М.:ЭТС, 2002. - 413 с.

4. Комиссаров В.Н. Теория перевода (лингвистические аспекты). - М. : Высшая школа, 1990. - 253 с.

5. Кормалев Д.А. Приложения технологии извлечения информации из текста: теория и практика. - Переяславль-Залесский, 2003. - 221 с.

6. Кузнецов П.С. Основные проблемы машинного перевода (вводная статья) / Кузнецов П.С., Ляпунов А.А., Реформатский А.А. // Вопросы языкознания. - М.,1956. - N 5. - С.107-111.

7. Марчук Ю.Н. Компьютерная лингвистика: учебное пособие. - М.: Восток-Запад, 2007. - 319 с.

8. Миньяр-Белоручев Р.К. Общая теория перевода и устный перевод. - М.: Воениздат, 1980.-237 с.

9. Мирам Г.Э. Профессия переводчик. - М.:Ника-центр,1999.-145 с.

10. Нелюбин Л.Л. Толковый переводческий словарь. - М.:Флинта, 2009. . - 306 с.

11. Нелюбин Л.Л. Введение в технику перевода. - М.:Флинта, 2009.-209 с.

12. Нелюбин Л.Л. Компьютерная лингвистика и машинный перевод. - М.: ВЦП, 1991.- 198 с.

13.Сдобников В.В., Петрова О.В. Теория перевода. - М.: АСТ Восток-Запад, 2006. - 425с.

14. Федорова А.В. Основы общей теории перевода 4-е издание. - М: Высшая школа, 1983. - 416 с.

Размещено на Allbest.ru

...

Подобные документы

  • Перевод и другие виды языкового посредничества, их виды, формы и жанры. Место машинного перевода в общей классификации, его краткая характеристика. Содержание проблемы переводимости при машинном переводе, направления и перспективы ее разрешения.

    курсовая работа [42,2 K], добавлен 17.11.2014

  • Понятие и разновидности письменного перевода, его основные этапы и назначение, особенности реализации. Понятие и содержание художественного перевода, специфика и средства оформления информации в нем. Проблемы, возникающие в процессе перевода поэзии.

    курсовая работа [54,6 K], добавлен 18.04.2011

  • Понятие и виды перевода, его значение для человечества. Специфика перевода в зависимости от вида текста. Особенности юридического перевода и необходимое качество переводов. Обязанности юриста-международника. Специфика профессиональной этики переводчика.

    дипломная работа [88,2 K], добавлен 24.05.2012

  • Классификация видов, форм и типов перевода. Понятие синхронного перевода, его характеристики. Распределение внимания синхронного переводчика. Коммуникативная ситуация синхронного перевода. Вероятностное прогнозирование. Обучение синхронному переводу.

    реферат [28,5 K], добавлен 16.12.2016

  • Виды и способы перевода, определение способа перевода и меры информационной упорядоченности для переводного текста. Преимущества и трудности синхронного перевода, проблемы синхронистов, возникающие в процессе перевода, психологические условия работы.

    реферат [27,7 K], добавлен 25.10.2010

  • Обзор выявления в оригинале конструкций, требующих синтаксических трансформаций при переводе, их классификации и анализа способов перевода. Описания перевода при помощи перестановок, членения и объединения предложений, синтаксических проблем перевода.

    курсовая работа [49,1 K], добавлен 29.12.2011

  • Теория интертекстуальности в переводческом аспекте. Роль, место и проблемы перевода интертекстуальных включений. Реалии и безэквивалентная лексика. Особенности и способы перевода слов-реалий. Английские интерпретации языковых реалий русской культуры.

    реферат [71,5 K], добавлен 07.04.2015

  • Рассмотрение понятия предпереводческого анализа текста как многоаспектной аналитической деятельности по извлечению смысла оригинала и определению инварианта перевода. Ознакомление с синтаксическими, грамматическими и прагматическими стратегиями перевода.

    курсовая работа [33,4 K], добавлен 24.04.2013

  • Определение понятия "стратегия перевода". Характеристика основных видов переводческих стратегий. Стратегии перевода И.С. Алексеевой. Особенности реферативного перевода и его место в общей классификации. Виды реферативного перевода и их специфика.

    курсовая работа [55,8 K], добавлен 09.01.2015

  • Проведение адекватного перевода оригинального английского текста на русский язык. Определение и анализ лексических, грамматических и стилистических средств выразительности языка научно-популярного стиля, понятия и эмоционально–образные приёмы текста.

    дипломная работа [53,8 K], добавлен 05.07.2012

  • Предмет, методы и направления исследования, основное содержание и значение теории перевода. Виды перевода, сферы его применения, оценка качества и языковой сложности. Переводческая сегментация текста, его связность. Типы лексических трансформаций.

    контрольная работа [33,6 K], добавлен 20.12.2011

  • Понятие и теории перевода, его связь с лингвистикой. Причины формирования и процесс становления науки о переводе. Создание системы машинного переводчика. Развитие сопоставительных контрастивных исследований в языкознании. Современное переводоведение.

    презентация [50,0 K], добавлен 29.07.2013

  • Изучение морфологических и синтаксических особенностей научно-технического стиля, в аспекте применения автоматизированных средств перевода. Анализ принципа работы и типов систем машинного перевода. Сравнение текстов, переведенных машиной и переводчиком.

    дипломная работа [4,0 M], добавлен 20.06.2011

  • Использование фразеологизмов в речи. Идиоматика художественного текста как общелингвистическая проблема. Анализ идиоматики фразеологических сращений английского текста. Проблемы интерпретации художественного текста в рамках определенной лингвокультуры.

    дипломная работа [154,4 K], добавлен 06.06.2015

  • Анализ статьи "О двуязычной ситуации", в которой идет речь о лингвистических проблемах машинного перевода. Основные виды отношений сегментов входного текста и сегментов выходного текста: полная калькируемость, квазикалькируемость и некалькируемость.

    краткое изложение [17,8 K], добавлен 20.04.2011

  • Понятие языка и нормы перевода. Обеспечение высокого качества перевода переводчиком. Семантические проблемы перевода. Межъязыковые расхождения в грамматикализации "классических" грамматических категорий. Синтаксические проблемы перевода стихотворений.

    реферат [33,3 K], добавлен 23.12.2011

  • Основные понятия и функциональные стили лингвостилистики. Принципы работы и типы систем машинного перевода. Сопоставительный анализ отрывков научно-технического текста и их переводов на русский язык с помощью различных СМП - трансфертной и статистической.

    дипломная работа [4,0 M], добавлен 23.06.2011

  • Теоретические основы перевода. Оценка выполнения перевода романа У. Коллинза "Женщина в белом" с точки зрения лексико-грамматических и лексических аспектов. Общие замечания, ошибки и вставки. Некоторые интересные случаи. Вольности и неточности перевода.

    курсовая работа [49,9 K], добавлен 19.12.2010

  • Периодизация истории развития перевода и подходов к нему. Понятие перевода, подходы к переводу текста. Особенности перевода с английского на русский. Специфика работы с иноязычным текстом. Варианты подхода к изучения феномена "ложных друзей переводчика".

    курсовая работа [47,7 K], добавлен 10.01.2017

  • Hахождении и систематизации неточностей и ошибок в переводах "Гамлета" на первом этапе (переводческая часть работы) и выявлении зависимости правильности интерпретации от адекватности перевода на втором (литературоведческая часть).

    реферат [12,6 K], добавлен 10.10.2004

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.