Технологии преобразования текста в системах машинного перевода

Идея перевода текста, речи без использования труда людей-переводчиков. Системы машинного перевода на основе модели "большого словаря со сложной структурой". Системы машинного перевода на основе модели "Смысл Текст". Формальная грамматика языка.

Рубрика Иностранные языки и языкознание
Вид реферат
Язык русский
Дата добавления 09.06.2013
Размер файла 1,0 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Министерство общего и профессионального образования

Российской Федерации

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ «СТАНКИН»

РЕФЕРАТ

по теме:

«ТЕХНОЛОГИИ ПРЕОБРАЗОВАНИЯ ТЕКСТА В СИСТЕМАХ МАШИННОГО ПЕРЕВОДА»

Зав. кафедрой управления и информатики в технических системах, д.т.н., проф. Ковшов Е.Е.

Руководитель темы,

к.т.н., доц. (дата, подпись) Митропольский Н.Н.

Исполнитель темы,

магистрант 2 курса обучения Рогозина М.М.

Москва - 2013

СОДЕРЖАНИЕ

ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ

ВВЕДЕНИЕ

1. МАШИННЫЙ ПЕРЕВОД

2. ИСТОРИЯ РАЗВИТИЯ МАШИННОГО ПЕРЕВОДА

3. КОНЦЕПЦИИ РАЗВИТИЯ СИСТЕМ МАШИННОГО ПЕРЕВОДА

3.1 Системы машинного перевода на основе модели «большого словаря со сложной структурой»

3.1.1 Формальные операции

3.1.2 Translation Memory

3.2 Системы машинного перевода на основе модели «Смысл Текст»

ЗАКЛЮЧЕНИЕ

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ

МП - машинный перевод;

СемП - семантическое представление;

СМП - система машинного перевода;

ТКС - толково-комбинаторный словарь

TM - Translation Memory.

ВВЕДЕНИЕ

Перевод имеет долгую историю. Своими корнями он восходит к тем далеким временам, когда праязык начал распадаться на отдельные языки и возникла необходимость в людях, знавших несколько языков и способных выступать в роли посредников при общении представителей разных языковых общин.

Переводом называется процесс и результат создания на основе исходного текста на одном языке равноценного ему в коммуникативном отношении текста на другом языке. При этом коммуникативная равноценность, или эквивалентность, понимается как такое качество текста перевода, которое позволяет ему выступать в процессе общения носителей разных языков в качестве полноправной замены исходного текста (оригинала) в сфере действия языка перевода [1].

Идея перевод текста, речи без использования труда людей-переводчиков возникла довольно давно. Еще Ч. Бэббидж хотел, чтобы построенная им вычислительная машина могла переводить устную речь. В XX веке эти мечты начинают становиться реальностью: в век глобализации, когда книги и тексты на иностранном языке, деловая электронная переписка с иностранными компаниями или же личная переписка с жителями других стран, просмотр передач и фильмов на другом языке перестали быть чем-то из ряда вон выходящим, активно развиваются системы машинного перевода (СМП), т.к. объемы текстов, которые необходимо переводить ежедневно становятся все больше, так же, как и количество языков, с которых требуется получать перевод. Обращение каждый раз к профессиональному переводчику требует временных и материальных затрат, которые не всегда можно себе позволить, поэтому СМП становятся так популярны сегодня, хоть и отнюдь не совершенны: компьютер еще плохо разбирается в грамматических нюансах и жаргоне, поэтому его главное назначение - переводы деловых бумаг, руководств, писем из электронной почты, Web-страниц. Другое применение систем - облегчение рутинной работы переводчиков, выполнение за них перевода, которого можно легко подправить.

В настоящем реферате будут рассмотрены понятие машинного перевода и классификация СМП, история развития подобных систем, модели, на основе которых осуществляется машинный перевод и применение этих моделей в программах перевода.

1. МАШИННЫЙ ПЕРЕВОД

Машинный перевод - выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия. [2]

Соответственно программы, которые осуществляют перевод, носят название систем машинного перевода (СМП).

В 1990 году Ларри Чайлдс (Larry Childs), специалист по машинному переводу, предложил следующую классификацию СМП по степени их «самостоятельности»:

1. FAMT (Fully-automated machine translation) - полностью автоматизированный машинный перевод;

2. HAMT (Human-assisted machine translation) - машинный перевод при участии человека;

3. MAHT (Machine-assisted human translation) - перевод, осуществляемый человеком с использованием компьютера. [3]

Первая группа СМП подразумевает то, что в компьютер вводится текст на одном языке, а затем он выдает полностью корректно переведенный текст на другом языке. Но таких идеальных систем пока не существует: естественные языки сложны и плохо поддаются формализации. Примером может служить трудности перевода слова «can» английского языка. Помимо значения вспомогательного модального глагола «мочь» есть еще ряд значений: «консервная банка», «тюрьма» или архаичное «знать, понимать». Когда у компьютера есть выбор между всеми этими значениями перевода для данного слова, остается проблемой сделать правильный. Определенные успехи были достигнуты в сфере разработки программ перевода, различающих смысл, основываясь на контексте. Более поздние исследования при анализе текстов опираются больше на теорию вероятности, на статистический анализ эталонных текстов. Тем не менее, полностью автоматизированный машинный перевод текстов с обширной тематикой все еще является невыполнимой задачей.

Ко второй группе относятся СМП, которые осуществляют перевод не без помощи человека. Говоря о машинном переводе при участии человека, обычно подразумевают редактирование текстов как до, так и после их обработки компьютером. Люди-переводчики изменяют тексты так, чтобы они стали понятны машинам. После того, как компьютер сделал перевод, люди опять-таки редактируют «грубый» машинный перевод, делая текст на выходном языке правильным. К подобным системам относятся «PROMT» [4] и «Google Translate» [5].

При третьем подходе человек-переводчик ставится в центр процесса перевода, в то время как программа компьютера расценивается в качестве инструмента, делающего процесс перевода более эффективным, а перевод - точным. Это обычные электронные словари, которые обеспечивают перевод требуемого слова, возлагая на человека ответственность за выбор нужного варианта и смысл переведенного текста (например, ABBYY Lingvo [6]). Такие словари значительно облегчают процесс перевода, но требуют от пользователя определенного знания языка и затрат времени на его осуществление. И все же сам процесс перевода значительно ускоряется и облегчается.

2. ИСТОРИЯ РАЗВИТИЯ МАШИННОГО ПЕРЕВОДА

Впервые мысль о возможности машинного перевода высказал Чарльз Бэббидж, разработавший в 1836-1848 гг. проект цифровой аналитической машины. Идея Ч. Бэббиджа состояла в том, что память объемом 1000 50-разрядных десятичных чисел (по 50 зубчатых колес в каждом регистре) можно использовать для хранения словарей. Ч. Бэббидж привел эту идею в качестве обоснования для запроса у английского правительства средств, необходимых для физического воплощения аналитической машины, которую ему так и не удалось построить. [7]

А через 100 лет, в 1947 году, У. Уивер (директор отделения естественных наук Рокфеллеровского фонда) написал письмо Норберту Винеру. В этом письме он предлагал использовать технику дешифрования для перевода текстов. У. Уивер писал: «I have a text in front of me which is written in Russian but I am going to pretend that it is really written in English and that it has been coded in some strange symbols. All I need to do is strip off the code in order to retrieve the information contained in the text» («У меня перед глазами текст, написанный по-русски, но я собираюсь сделать вид, что на самом деле он написан по-английски и закодирован при помощи довольно странных знаков. Все, что мне нужно, -- это взломать код, чтобы извлечь информацию, заключенную в тексте»). Аналогия между переводом и дешифрованием была естественной в контексте послевоенной эпохи, если учитывать успехи, которых достигла криптография в годы Второй мировой войны. Этот год считается годом рождения машинного перевода. Идеи Уивера легли в основу подхода к МП, основанного на концепции interlingva: стадия передачи информации разделена на два этапа. На первом этапе исходное предложение переводится на язык-посредник (созданный на базе упрощенного английского языка), а затем результат этого перевода представляется средствами выходного языка. В этом же году был разработан алгоритм осуществления пословного перевода, а в 1948 году Р. Риченс предложил правило разбиения слова на основу и окончание. [7]

В последующие два десятилетия системы машинного перевода бурно развивались. Помимо очевидных практических нужд важную роль в становлении машинного перевода сыграло то обстоятельство, что предложенный в 1950 г. английским математиком А. Тьюрингом знаменитый тест на разумность («тест Тьюринга») фактически заменил вопрос о том, может ли машина мыслить, на вопрос о том, может ли машина общаться с человеком на естественном языке таким образом, что тот не в состоянии будет отличить ее от собеседника-человека. Тем самым вопросы компьютерной обработки естественно-языковых сообщений на десятилетия оказались в центре исследований по кибернетике (а впоследствии по искусственному интеллекту), а между математиками, программистами и инженерами-компьютерщиками с одной стороны и лингвистами - с другой установилось продуктивное сотрудничество. В январе 1954 года на машине IBM-701 была продемонстрирована первая система машинного перевода IBM Mark II, базирующуяся на словаре из 250 слов и 6 синтаксических правил и обеспечивающую перевод 49 заранее отобранных предложений. Этот эксперимент положил начало исследовательскому буму: в следующие 10 лет правительство и военные ведомства США затратили на исследования в области МП около 40 млн. долларов. Но в 1967 году специально созданная Комиссия Национальной Академии Наук США признала машинный перевод нерентабельным, что существенно затормозило исследования в этой области. Новый подъем машинный перевод переживает в 70-е годы, а в 80-е становится экономически выгодным за счет сравнительной дешевизны машинного времени.

Однако в СССР исследования в области машинного перевода продолжались. После демонстрации системы IBM Mark II группа ученых ВИНИТИ начала разработку системы машинного перевода для машины БЭСМ. Первый образец перевода с английского на русский язык был получен к концу 1955 года.

Другое направление работ возникло в Отделении прикладной математики Математического института АН СССР (ныне ИПМ им. М. В. Келдыша РАН) по инициативе А. А. Ляпунова. Первые программы машинного перевода, разработанные этим коллективом, были реализованы на машине «Стрела». Благодаря работе над созданием систем МП оформилось такое направление, как прикладная лингвистика.

В 70-е годы над созданием систем МП трудилась группа разработчиков ВИНИТИ РАН под руководством проф. Г.Г. Белоногова. Первая их система МП была разработана в 1993 году, а в 1996 году после ряда доработок была зарегистрирована в РОСАПО под названием Retrans. Эта система использовалась министерствами обороны, путей сообщения, науки и технологии.

Особого упоминания заслуживает работа в этой области отечественных лингвистов, таких, как И. А. Мельчук и Ю. Д. Апресян (Москва), результатом которой стал лингвистический процессор ЭТАП. В 1960 г. в составе Научно-исследовательского института математики и механики в Ленинграде была организована экспериментальная лаборатория машинного перевода, преобразованная затем в лабораторию математической лингвистики Ленинградского государственного университета.

Параллельные исследования велись в лаборатории Инженерной Лингвистики ЛГПИ им. А. И. Герцена (ныне Педагогический Университет). Именно они и легли в основу наиболее популярной сейчас системы МП «PROMT». Последние версии этого программного продукта используют наукоемкие технологии и построены на основе технологии расширенных сетей переходов и формализма нейронных сетей. [7]

3. КОНЦЕПЦИИ РАЗВИТИЯ СИСТЕМ МАШИННОГО ПЕРЕВОДА

В настоящее время существует две концепции развития систем МП:

1. Модель «большого словаря со сложной структурой» (входной текст переводится с помощью специальных алгоритмов с использованием больших словарей, описывающих широкий круг морфологических явлений: фонетическая реализация слова, акцентная парадигма, большое число словообразовательных аффиксов);

2. Модель «СмыслТекст» (переход от текста на рассматриваемом языке к формальному представлению смысла этого текста (семантическому представлению) и, наоборот, переход от некоторого смысла к конкретному тексту, несущему данный смысл).

3.1 Системы машинного перевода на основе модели «большого словаря со сложной структурой»

3.1.1 Формальные операции

В основе работы подобных систем лежит алгоритм перевода - последовательность однозначно и строго определенных действий над текстом для нахождения соответствий в данной паре языков L1 - L2 при заданном направлении перевода (с одного конкретного языка на другой). Обычные словари и грамматики разных языков не применимы для машинного перевода, так как описывают значения слов и грамматические закономерности в нестрогой форме, никак не приемлемой для «машинного» использования. Следовательно, нужна формальная грамматика языка, т.е. логически непротиворечивая и явно выраженная (безо всяких подразумеваний и недомолвок). Как только начали появляться формальные описания различных областей языка - прежде всего морфологии и синтаксиса, - наметился прогресс и в разработке систем автоматического перевода. Чтобы успешно работать, система машинного перевода включает в себя, во-первых, двуязычные словари, снабженные необходимой информацией (морфологической, относящейся к формам слова, синтаксической, описывающей способы сочетания слов в предложении, и семантической, т.е. отвечающей за смысл), а во-вторых - средства грамматического анализа, в основе которых лежит какая-нибудь из формальных, т.е. строгих, грамматик. Наиболее распространенной является следующая последовательность формальных операций, обеспечивающих анализ и синтез в системе машинного перевода.

1. На первом этапе осуществляется ввод текста и поиск входных словоформ (слов в конкретной грамматической форме, например дательного падежа множественного числа) во входном словаре (словаре языка, с которого производится перевод) с сопутствующим морфологическим анализом, в ходе которого устанавливается принадлежность данной словоформы к определенной лексеме (слову как единице словаря). В процессе анализа из формы слова могут быть получены также сведения, относящиеся к другим уровням организации языковой системы, например, каким членом предложения может быть данное слово. В школьном грамматическом разборе предложения мы опираемся и на значения слов, составляющих предложение (например, отыскивая подлежащее, задаем вопрос: о чем говорится в предложении?). Для машины же совмещение двух этих операций - и грамматического разбора, и обращения к смыслу слов - задача трудная. Лучше сделать синтаксический анализ не зависящим от смысла слов, а словарь использовать на других этапах перевода.

Что такое независимый синтаксический анализ, можно понять, если попытаться разобрать фразу, из которой «убраны» значения конкретных слов. Блестящим образцом фразы такого рода является придуманное академиком Л. В. Щербой предложение: «Глокая куздра штетко будланула бокра и кудрячит бокрёнка». Бессмысленная фраза? Как будто да: в русском языке нет слов, из которых она состоит (кроме союза и). И все же в какой-то степени мы ее понимаем: «куздра» - это существительное (мы даже можем предположить, что оно обозначает какое-то животное), «глокая» - определение к нему, «будланула» - глагол-сказуемое (похожий на толканула, боднула), «штетко» - скорее всего, обстоятельство образа действия (что-то вроде сильно, резко), «бокра» - это прямое дополнение («будланула» кого? - «бокра») и т. д.

То есть машина осуществляет синтаксический анализ предложения без опоры на значения составляющих его слов, с использованием информации только об их грамматических свойствах. В результате синтаксического анализа возникает синтаксическая структура, которая изображается в виде дерева зависимостей: «корень» - сказуемое, а «ветви» - синтаксические отношения его с зависимыми словами. Каждое слово предложения записывается в своей словарной форме, а при ней указываются те грамматические характеристики, которыми обладает это слово в анализируемом предложении.

2. Следующий этап включает в себя перевод идиоматических словосочетаний, фразеологических единств или штампов данной предметной области (например, при англо-русском переводе обороты типа in case of, in accordance with получают единый цифровой эквивалент и исключаются из дальнейшего грамматического анализа); определение основных грамматических (морфологических, синтаксических, семантических и лексических) характеристик элементов входного текста (например, числа существительных, времени глагола, их роли в данном предложении и пр.), производимое в рамках входного языка; разрешение неоднозначности (скажем, англ. round может быть существительным, прилагательным, наречием, глаголом или же предлогом); анализ и перевод слов. Обычно на этом этапе однозначные слова отделяются от многозначных (имеющих более одного переводного эквивалента в выходном языке), после чего однозначные слова переводятся по спискам эквивалентов, а для перевода многозначных слов используются так называемые контекстологические словари, словарные статьи которых представляют собой алгоритмы запроса к контексту на наличие/отсутствие контекстных определителей значения.

3. Окончательный грамматический анализ, в ходе которого доопределяется необходимая грамматическая информация с учетом данных выходного языка (например, при русских существительных типа сани, ножницы глагол должен стоять в форме множественного числа, притом, что в оригинале может быть и единственное число).

Синтез выходных словоформ и предложения в целом на выходном языке. Здесь не получится обойтись простым переводом «узлов» дерева на другой язык. Синтаксис каждого языка устроен на свой лад: то, что в русском предложении - подлежащее, в другом языке может (или должно) быть выражено дополнением, а дополнение, наоборот, должно преобразоваться в подлежащее; то, что в одном языке обозначается группой слов, переводится на другой всего одним словом и т. д. Так, при переводе русской фразы «У меня была интересная книга» на английский язык глагол «быть» надо перевести глаголом to have - «иметь», сочетание «у меня» преобразовать в подлежащее I («я»), а слово «книга», которое в русском языке - подлежащее, по-английски должно стать прямым дополнением: I had an interesting book (буквально: «Я имел интересную книгу»). В связи с этим в машинную память помимо наборов синтаксических правил для каждого языка «вкладывают» и правила преобразования синтаксических структур. К этому добавляют правила перехода от уже преобразованной структуры к предложению того языка, на который делается перевод. Такой переход от структуры к реальному предложению называется синтаксическим синтезом.

В зависимости от особенностей морфологии, синтаксиса и семантики конкретной языковой пары, а также направления перевода общий алгоритм перевода может включать и другие этапы, а также модификации названных этапов или порядка их следования, но вариации такого рода в современных системах, как правило, незначительны. Анализ и синтез могут производиться как пофразно, так и для всего текста, введенного в память компьютера; в последнем случае алгоритм перевода предусматривает определение так называемых анафорических связей (такова, например, связь местоимения с замещаемым им существительным - скажем, местоимения им со словом местоимения в самом этом пояснении в скобках).

Для решения проблемы многозначности слова используется анализ контекста. Дело в том, что каждое из нескольких значений многозначного слова в большинстве случаев реализуются в своем наборе контекстов. То есть у каждого из «конкурирующих» (при интерпретации) значений - свой набор контекстов. И именно вот эта зависимость значения от окружения позволяет слушающему понять высказывание правильно. Для правильного понимания высказывания необходимо в полной мере учитывать также правила обусловленности выбранного значения лексическим окружением (действующие при «фразеологической» интерпретации слова), правила обусловленности выбранного значения семантическим контекстом (так называемые законы семантического согласования) и правила обусловленности выбранного значения грамматическим (морфолого-синтаксическим) контекстом. То есть для решения проблемы «моносемизации» слов при автоматическом переводе основой служит изучение и тщательное описание закономерностей лексической, семантической и грамматической сочетаемости. При этом правила такой сочетаемости достаточно подробно описываются в словарях - а именно, (а) с мощным охватом лексики, но весьма бегло и нетщательно, а также весьма имплицитно это делается в традиционной лексикографии; и, с другой стороны, (б) в выборочном порядке (со слабым охватом лексики), но зато весьма аккуратно и тщательно, и довольно-таки эксплицитно это делается в работах по «толково-комбинаторной» лексикографии (последних сорока лет).

Действующие системы машинного перевода, как правило, ориентированы на конкретные пары языков (например, французский и русский или японский и английский) и используют, как правило, переводные соответствия либо на поверхностном уровне, либо на некотором промежуточном уровне между входным и выходным языком. Качество машинного перевода зависит от объема словаря, объема информации, приписываемой лексическим единицам, от тщательности составления и проверки работы алгоритмов анализа и синтеза, от эффективности программного обеспечения. Современные аппаратные и программные средства допускают использование словарей большого объема, содержащих подробную грамматическую информацию. Информация может быть представлена как в декларативной (описательной), так и в процедурной (учитывающей потребности алгоритма) форме.

Возможно, есть смысл не говорить о мелких игроках на рынке подобных систем, а рассмотреть два основных представителя существующих СМП данной группы.

Первым представителем является отечественный переводчик «PROMT». В его основе лежат алгоритмические правила перевода для пары языков. Под алгоритмом перевода понимается последовательность однозначно и строго определенных действий над текстом для нахождения переводных соответствий в данной паре языков Яз1 -Яз2 при заданном направлении перевода (с одного конкретного языка на другой). Такая СМП включает в себя двуязычные словари, снабженные необходимой грамматической информацией (морфологической, синтаксической и семантической) для обеспечения передачи эквивалентных, вариантных и трансформационных переводных соответствий, а также алгоритмические средства грамматического анализа, реализующие какую-либо из принятых для автоматической переработки текста формальных грамматик.

Совершенно очевидно, что основным недостатком таких систем является нарастающая сложность правил анализа и обработки входного текста. Здесь можно сослаться на Татьяну Даниэлян, инженера-системотехника, главу управления разработкой лингвистической платформы Compreno компании ABBYY), которая утверждает, что чем подробнее и тщательнее разработчик описывает эти правила, тем больше обнаруживается исключений: алгоритм неконтролируемо ветвится. Алгоритмическая система, кроме того, -- раб словарей. Чтобы выбрать при переводе слово из десятка вариантов, который дает словарь, алгоритма не придумаешь. [8]

Вот пример забавного перевода «PROMT 7.0».

Оригинал:

Execute installer by tray icon and insert ms windows binaries or another os with custom mouse driver support in current boot drive.

Перевод:

Казните монтажника изображением подноса и вставьте наборы из двух предметов окон госпожи или другой рот с таможенной поддержкой водителя мыши в текущем двигателе ботинка.

Вторым из самых известных электронных переводчиков, является «Google Translate». Он является статистической СМП, т.е. использует готовые образцы перевода словосочетаний из так называемых параллельных (профессионально переведенных, эталонных) текстов. Фундаментальная проблема статистических систем, по мнению разработчиков, -- недостаток параллельных текстов для множества предметных областей и пар языков. Из-за этого, например, перевод с португальского на французский исполняется по схеме «португальский > английский > французский» с очевидной потерей смысла. Статистический перевод плохо работает и с отрицаниями. Встретив во фразе частицу «не», система вынуждена гадать, к чему именно это «не» относится: с точки зрения статистики, две фразы, отличающиеся только частицей «не», едва ли не идентичны. Похожесть фраз вообще играет со статистическими системами злые шутки: бывает, они переводят «Ющенко» как «Yanukovich»: это диктуется схожестью образцов перевода из параллельных текстов. Обе фамилии встречаются в окружении одних и тех же слов («президент», «Украина», «политика» и т.д.) [8].

Вот пример некорректного перевода «Google».

Оригинал:

еж

Перевод на «африкаанс»:

reier

Обратный перевод на русский:

цапля

перевод текст машинный язык

3.1.2 Translation Memory

ТМ - это база данных, где хранятся выполненные переводы. Технология ТМ работает по принципу накопления: в процессе перевода в ТМ сохраняется исходный сегмент (предложение) и его перевод. При обработке нового текста, поступившего на перевод, система сравнивает каждое его предложение с сохраненными в базе сегментами. Если идентичный или подобный исходному сегмент найден, то перевод этого сегмента отображается вместе с переводом и указанием совпадения в процентах. Слова и фразы, которые отличаются от сохраненного текста, выделяются подсветкой. Таким образом, переводчику остается перевести только новые сегменты и отредактировать частично совпадающие. Каждое изменение или новый перевод сохраняются в ТМ. А в результате нет необходимости дважды переводить одно и то же предложение. [9]

С другой стороны, при работе с крупными проектами переводчик сталкивается с проблемой согласованного применения терминологического глоссария в ходе длительного проекта или быстрого повторного использования ранее переведенного текста. По своей природе подобные рутинные задачи сравнительно легко (в отличие от машинного перевода) формализуются и программируются.

Каждая запись базы данных ТМ представляет собой единицу (предложение или абзац) параллельных текстов (как правило, на двух языках). Такая база данных хранит предыдущие переводы с целью их возможного повторного использования и решения задач быстрого поиска по содержимому. Несмотря на то что программы, оснащенные памятью перевода, называются системами автоматизированного перевода (CAT, computer-aided/assisted translation), их не следует путать с программами машинного перевода (machine translation) - память перевода ничего не переводит сама по себе, в то время как машинный перевод основан на генерации переводов по результатам грамматического разбора исходного текста.

Как правило, запись памяти перевода состоит из двух сегментов: на исходном (source) и конечном (target) языках. Если идентичный (или похожий) сегмент на исходном языке встречается в тексте, сегмент на конечном языке будет найден в памяти перевода и предложен переводчику в качестве основы для нового перевода. Автоматически найденный текст может быть задействован так, как есть, отредактирован или полностью отвергнут. Большинство программ используют алгоритм нечеткого соответствия (fuzzy matching), существенно улучшающий их функциональные возможности, поскольку в этом случае можно находить предложения, лишь отдаленно напоминающие искомые фразы, но, тем не менее, пригодные для последующего редактирования.

Преимущества от использования такого программного обеспечения поначалу могут быть неочевидны - однако по мере наполнения базы данных результаты автоматической подстановки основ для перевода будут становиться все более точными и регулярными.

Архитектура автоматизированной системы и ее функциональные возможности могут различаться. Средства поиска могут работать как с целыми сегментами, так и с отдельными словами или фразами, позволяя переводчику выполнять терминологический поиск. В систему также включают отдельную программу для работы с глоссарием, содержащим утвержденные для применения в проекте термины. Некоторые системы работают с программами машинного перевода. Основной рабочий интерфейс либо встраивается непосредственно в имеющийся текстовый процессор, такой как Word, либо представляет собой отдельный редактор. В состав системы обязательно включают фильтры для импорта-экспорта файлов различных форматов. Кроме того, многие системы, если не все, имеют средство для добавления в память перевода сегментов из, как правило, имеющихся у переводчика старых переведенных файлов.

То, что применимо к понятию «обучение языку», применимо и к «Translation Memories».

1. «Пустая» система запоминает термины и предложения.

2. Строится «память переводов» - Translation Memory (TM).

3. TM становится «языковой памятью» по продукту или по деятельности компании в целом.

Технологии МП и ТМ друг друга дополняют, но никак не дублируют. Система МП готова к использованию сразу после установки (хотя это не исключает того, что в процессе работы пользователю захочется что-то изменить в словаре, алгоритмах перевода и т.п.). Систему ТМ необходимо специально настраивать на перевод текстов в какой-то конкретной области, и чем больше эти тексты друг на друга похожи (например, такая система используется для перевода стандартных договоров), тем меньше времени требуется для настройки.

В связи с этим совершенно логично появление гибридов - example-based machine translation - программ, объединяющих системы машинного перевода и ТМ (например, компания «ПРОМТ» создала интегрированную технологию PROMT Term и PROMT For TRADOS, которая объединяет систему TM TRADOS и систему машинного перевода - PROMT XT Professional). PROMT For TRADOS (P4T) предназначена для интеграции системы машинного перевода PROMT и системы ТM TRADOS:

* перевод в системе TRADOS;

* перевод в системе PROMT не найденных в ТМ сегментов;

* вставка переведенных PROMT сегментов в TM.

Схема автоматизированной цепочки перевода на основе интегрированной технологии PROMT-TRADOS

Применение интегрированной технологии делает процесс перевода больших массивов документации управляемым и повышает его экономическую эффективность.

Пример реализации проектов с применением интегрированной технологии PROMT-TRADOS.

Предположим, необходимо осуществить перевод инструкции к мини-АТС.

1. На первом этапе применяется программа PROMT TerM. Документы анализируются, и выявляется основная терминология, которая заносится в словари системы машинного перевода PROMT.

2. Выполняется машинный перевод (МП) с подключенным словарем, продолжается терминологическая работа по коррекции словаря.

3. Результаты МП корректируются и заносятся в ТМ переводимого документа.

4. Таким образом пользователь получает:

· терминологический словарь;

· переведенный документ;

· соответствующую переведенному документу TM, которая может быть использована в дальнейшей работе с документами подобного рода. [9]

3.2 Системы машинного перевода на основе модели «СмыслТекст»

На всей земле был один язык и одно наречие.

Быт. 11:1

Направление развития СМП, связанное с использованием для перевода языка-посредника, заинтересовало ученых в Советском Союзе в 60-х годах XX века. Первым идею о переводе путем извлечения смысла и его передачи на другом языке высказывал в своих беседах с учениками известный советский ученый А.А. Ляпунов. Позднее данная идея была развита в работах ученика А.А. Ляпунова - И.А. Мельчука.

Данная модель опирается на понимание естественного языка как механизма, преобразующего заданные смыслы в соответствующие им тексты и заданные тексты - в соответствующие им смыслы. Более разработан в модели переход от смыслов к текстам, т. е. языковой синтез. Модель предполагает систему уровней и правил перехода между ними. Непосредственно к семантике относятся описание семантического уровня и правил перехода к синтаксическому уровню, а точнее, к глубинно-синтаксическому. Система правил, обеспечивающая такой переход в модели, называется семантическим компонентом. Особенно интересны, с семантической точки зрения, такие компоненты модели, как толково-комбинаторный словарь и система перифразирования, и такие понятия, как лексические функции и модель управления.

Семантический уровень включает в себя особого рода семантическое представление (обычно используется сокращение СемП) связного фрагмента речи без расчленения его на предложения и слова. Семантическое представление состоит из семантического графа и сведений о коммуникативной организации (см. рисунок 1). Семантический граф состоит, в свою очередь, из вершин (точек) и соединяющих их дуг. Вершины помечаются символами элементарных смысловых единиц (семы), а дуги - символами связи между семами. Такое семантическое представление отвечает, в частности, фразе Иван читает только журналы [10].

Рис. 1. Пример семантического графа

При синтезе к семантическому представлению применяется действие семантического компонента. Семантический компонент производит следующие основные операции:

1. Расчленяет семантический граф на фрагменты, которые соответствуют фразам, и устанавливает последовательность фрагментов (соответственно и фраз в будущем тексте).

2. Подбирает лексику на абстрактном уровне. Подбор обобщенных слов заключается в вычленении таких фрагментов семантического графа, которым в данном языке может соответствовать отдельное слово.

3. Подбирает грамматические средства на абстрактном уровне, а именно вычленяет такие фрагменты семантического графа, которые в данном языке выражаются с помощью грамматики, и перерабатывает их в предварительные грамматические характеристики при обобщенных словах.

4. Определяет общее синтаксическое строение фраз на абстрактном уровне (с помощью глубинно-синтаксических отношений).

И. А. Мельчук отмечает, что именно на этом этапе происходит первоначальное «национальное» оформление заданного смысла.

При анализе семантический компонент выполняет обратные операции.

Следует отметить важную роль семантического представления, которое при синтезе подается на вход модели и соответствует множеству синонимичных текстов, получаемых в результате ее работы. При анализе же семантическое представление является конечным продуктом действия модели.

Описание семантического уровня подразумевает наличие семантического языка, который состоит из:

1. Словаря, включающего элементарные семантические единицы (семы), промежуточные семантические единицы, соответствующие словам естественного языка, и символы-характеристики коммуникативной организации;

2. Правил образования, с помощью которых из единиц словаря строятся семантические представления;

3. Правил преобразования, задающих равносильность двух семантических представлений (путем свертывания фрагментов графа в промежуточные единицы и развертывания последних).

Особую роль в работе семантического компонента играет словарь лексики естественного языка, называемый толково-комбинаторным словарем (часто используется сокращение ТКС). Именно с помощью этого словаря вычленяются обобщенные слова. Словарь содержит различную информацию о слове, распределенную по нескольким зонам (по версии, соответствующей книге И. А. Мельчука 1974 г., в словарной статье 11 зон). Среди главных, с семантической точки зрения, зон - толкование, модель управления, стандартные и нестандартные лексические функции.

Для каждого слова в ТКС в идеале приводятся все слова, связанные с ним по смыслу. Это, во-первых, его парадигматические варианты, или замены, т. е. те языковые средства, которые заменяют данное слово в определенных контекстах при определенных условиях, и, во-вторых, его синтагматические партнеры, или параметры, т. е. те языковые средства, которые идиоматично выражают при данном слове различные смыслы. Все эти средства называются лексическими коррелятами. Связи слов с коррелятами описываются с помощью функций, называемых лексическими. Лексическая функция сопоставляет множеству слов множество лексических коррелятов, так что между любым словом и его коррелятом имеет место одно и то же отношение.

Особый интерес для описания разнообразия лексической сочетаемости представляют лексические функции с фразеологически связанными выражениями. Среди таких функций различаются стандартные и нестандартные. Стандартная лексическая функция удовлетворяет двум требованиям: во-первых, она должна иметь широкую лексическую сочетаемость, а именно - вступать в комбинации с большим числом разных смыслов, во-вторых, она должна иметь большое количество языковых выражений. Каждой стандартной лексической функции с фразеологически связанными выражениями дается имя, обычно сокращение латинского слова. Лексическая функция Magn (от лат. magnus -'большой'), которой соответствует смысл 'очень', вместе с аргументами и значением записывается следующим образом:

Magn (брюнетка) = жгучая;

Magn (рана) = тяжелая;

Magn (знать) = назубок, как свои пять пальцев...

Magn (дождь) = проливной и т. д.

Семантическое отношение между аргументами лексической функции Magn (брюнетка, рана, знать, дождь и т. д.) и соответствующими значениями {жгучий, тяжелый и т. п.} постоянно и равно смыслу 'очень'. Данная функция имеет чрезвычайно широкую лексическую сочетаемость и огромное количество языковых выражений. Среди основных функций-замен можно назвать Syn (синоним), Conv (конверсив), Anti (антоним), Gener (гипероним), Der (синтаксический дериват - слово, совпадающее с аргументом по смыслу, но принадлежащее к другой части речи) [10].

Такой подход фактически не был реализован до настоящего момента ни в одной системе СМП из-за сложности подобной модели. Однако эта работа очень сильно повлияла на развитие отечественной компьютерной лингвистики. И к семантическому разбору текста в данный момент обратилась компания ABBYY, разрабатывая технологию Compreno.

В основе технологии Compreno, разрабатываемой компанией ABBYY лежит концепция, заключающаяся в следующем: на каком бы языке цивилизованные люди ни говорили, у понятий, которые они обозначают словами, гораздо больше схожего, чем различного. Все мы живем в домах, пользуемся мебелью, телефонами, ездим на машинах, ходим на работу в офисы, летаем на самолетах и т.д. Эти понятия общие и не зависят от языка с точки зрения того, какими мы их себе представляем. Уловив эту связующую нить, в ABBYY построили независимую от конкретного языка универсальную семантическую иерархию понятий.

Семантическая иерархия понятий представляет собой универсальное для всех языков дерево, толстые ветви которого являются более общими понятиями (например, «движение»), а тонкие -- более специфическими смысловыми значениями, структурированными от общего к частному («ползать», «летать», «ходить пешком», «бегать» и т.д.). Если речь идет про руководителя организации, то во главе данного лексического класса фигурирует понятие «лидер», а в подклассах представлены более частные понятия, такие, как «босс», «начальник», «руководитель», «шеф» и прочие слова и словосочетания, являющиеся своего рода листочками на дереве понятий. ABBYY Compreno оперирует не словами, а значениями (понятиями). Одно значение может быть в одной ветке иерархии, а другое -- в иной (см. рис. 2).

Такая древовидная структура обеспечивает наследование свойств от предков к потомкам и позволяет избегать неоднозначностей в процессе перевода предложений с одного языка на другой. Пояснение разработчики дают на примере значения слова «управление», в русском языке соответствующего нескольким понятиям на разных ветвях универсального семантического дерева: можно «управление» интерпретировать как департамент, а можно, к примеру, -- как действие. И благодаря тому, что семантический класс «управление» в смысле некой организации представлен в одной ветке дерева, а как действия в другой, система автоматически подбирает правильное слово при переводе текста на английский язык, делая выбор в пользу «department» или «management» в зависимости от контекста фразы. Как следствие, служащие ядром Compreno семантические описания позволяют легко переводить текст с английского или русского языка в универсальный язык и с универсального -- на любой другой, описания которого имеются в системе.

Рис. 2. Пример семантической иерархии понятий

Вторым крупным блоком платформы Compreno является синтаксис. Важно понимать, что синтаксис описывает то, каким образом понятия связаны друг с другом внутри одного или нескольких предложений. Для кодирования этих связей в языках используются члены предложения, согласования, порядок слов, падежи, различные служебные слова, союзы, предлоги и много всего остального. Синтаксис -- это, образно говоря, большой конструктор из перечисленных элементов.

В различных языках могут использоваться разные элементы конструктора. Например, в английском порядок слов является важной частью синтаксиса. Вопросительные предложения формируются одним образом, повествовательные -- другим, и никак иначе. Бывают некоторые опциональные обстоятельства времени и места, которые ставятся в начало предложения, но обычно на первом месте находится подлежащее, на втором -- сказуемое и дальше располагаются остальные части речи. В русском языке другая ситуация. Мы не завязываемся на порядок слов, но зато для нас важно согласование, что, собственно, и является едва ли не самым крупным камнем преткновения для людей, изучающих русский.

Другая важная вещь, которую необходимо учитывать при синтаксическом разборе текста, -- подстановки и связи между словами, имеющие место тогда, когда мы пропускаем какое-либо слово, но понимаем, что оно все равно есть. Яркий пример -- фраза «Мальчик любит красные яблоки, а девочка - зеленые». Ясно, что в отношении девочки речь идет про яблоки (а также про то, что она их любит), и мы прекрасно это поняли, хотя в тексте пара слов пропущена. Есть и другие, более сложные синтаксические связи, успешно разбираемые Compreno. Например: «Хоть мальчик и хотел поиграть, но он понимал, что у него мало времени». В данном случае мы два раза заменили слово «мальчик» местоимениями «он» и «него», и машине важно понимать, что это один и тот же объект, и восстанавливать пропущенные узлы (см. рис. 3).

Рис. 3. Пример разбора синтаксических связей при помощи технологии Compreno

ABBYY Compreno стремится к определению смысла текста, написанного на обычном языке, позволяя машине «понять» этот текст и трансформировать его в универсальное представление, не зависящее от языка

Блок Compreno, отвечающий за синтаксис, разбирает роли различных понятий в предложении и связывает их друг с другом. Система анализирует текст и выстраивает дерево связей, в котором главным является обычно какое-то действие. От него далее идут объект, субъект и прочие атрибуты, привязывающиеся либо к объекту, либо к субъекту и передающие заложенный в конкретном предложении смысл. Чтобы синтаксический разбор был максимально точным, Compreno использует семантический анализ, основанный на вышеописанной универсальной иерархии понятий. Все это в сумме предоставляет новый уровень свободы при обработке машиной текстов, позволяет ей «понимать» смысл исходного предложения и затем синтезировать этот смысл на другом языке.

Наконец, третьей важной составляющей лингвистической платформы ABBYY является статистика, позволяющая системе правильно сочетать фразы и более полно разбираться с омонимией, когда одно и то же слово может означать разные вещи (типичный пример: «замок» и «замок»). Не менее важна статистическая информация и для корректного разбора предложений с двусмысленным толкованием. Например, провести грамотный анализ фразы «Эти типы стали есть в нашем цехе» можно только прибегнув к данным о частоте взаимоотношений между понятиями, вникнув тем самым в контекст речи или, иными словами, в предмет обсуждения. Если он о металлургии, то повествование идет про сталь, если про поведение людей, то логичным будет сделать выбор в пользу некоторых не очень хороших типов.

В основу статистической модели Compreno положен внушительный набор текстов разной тематики и жанров, едва ли не ежедневно обрабатываемых системой. Причем текстовых данных не абы каких, а созданных либо переведенных с одного языка на другой именно человеком. Подобный подход снижает вероятность возникновения ошибок в процессе принятия системой решений и искажений при синтезе смысловых конструкций.

Говоря о практической значимости платформы ABBYY Compreno, разработчики, прежде всего, акцентируют внимание на решении двух ключевых задач -- автоматическом переводе текстов для множества языковых пар и интеллектуальном поиске информации.

Первая задача, связанная с транслированием текстовых данных, крайне важна в век цифровых технологий, стирающих формальные границы и барьеры между странами. При постоянно возрастающих объемах многоязычной информации, необходимости вовлечения все большего количества участников из разных уголков мира в реализацию современных проектов критически важными становятся не только скорость получения перевода, но и качество получаемых на выходе текстов. С обеспечением последнего у существующих систем машинного перевода дела обстоят вовсе не так гладко, как может показаться на первый взгляд. Виной всему -- многочисленные принципиальные ограничения в научных подходах, которые являются основой многих существующих машинных переводчиков. Эти ограничения связаны с невозможностью корректно обрабатывать исключения, объективной сложностью языковых конструкций, игнорированием семантики, неумением фиксировать реальные связи в предложении и прочими проблемами. Технология Compreno является инженерным воплощением фундаментальных лингвистических исследований многих учёных мира, аккумулирующим примерно 50-летний опыт. И благодаря этому Compreno умеет преодолевать перечисленные сложности и позволяет синтезировать текст по смыслу такой же, какой он был на оригинальном языке, или максимально похожий. Для оценки возможностей системы ниже представлен пример перевода кусочка статьи [11] средствами статистического переводчика и платформы ABBYY.

Исходник:

If we tried manually to give the system those languages, it would be a hopeless task. The only possible way we could do this is to harness the power of machine computation. We build statistical models that are automatically training themselves and learning all the time.

ABBYY Compreno:

Если бы мы попытались вручную дать системе те языки, это было бы безнадёжной задачей. Единственный возможный способ, которым мы могли бы сделать это, состоит в том, чтобы использовать силу машинного вычисления. Мы создаём статистические модели, которые автоматически обучаются и учатся всё время.

Статистический переводчик:

Если бы мы попытались вручную, чтобы дать системе этих языков, то было бы безнадежной задачей. Единственно возможным путем мы могли бы сделать это, чтобы использовать возможности машины вычислений. Мы строим статистические модели, которые автоматически обучение себя и учитесь все время.

Важность второй задачи -- интеллектуального поиска -- является следствием колоссального объема порождаемой человечеством информации, растущего в геометрической прогрессии и требующего иных подходов к анализу и поиску нужных данных. Сейчас поиск работает в основном с использованием словесной информации: при поиске документа сначала придумываются слова, которые должны в нем содержаться, затем вводятся ключевые фразы, получаются удовлетворяющие критериям поиска данные и далее вручную выбирается интересующая информация. Такой, ставший привычным поиск имеет ряд крупных недостатков. Во-первых, далеко не всегда можно сформулировать запрос, точно описывающий ту информацию, которую необходимо найти. Во-вторых, придумывая уточняющие слова, мы суживаем выборку и ограничиваем поиск. Наконец, перебирать все комбинации ключевых слов порой бывает крайне утомительно, а то и вовсе невозможно. Со всеми этими недостатками успешно справляются технологии ABBYY Compreno, позволяющие осуществлять смысловой поиск с использованием тех понятий и связей, которые были извлечены машиной из поискового запроса, сформулированного обычным языком. [12]

Сейчас не существует настолько универсальной технологии, позволяющей решить множество прикладных задач: многоязычный поиск, т.е. когда на вопрос на одном языке находятся ответы на всех языках, поддерживаемых системой, классификация и фильтрация документов, защита от несанкционированного использования информации, автоматическое реферирование и аннотирование документов, распознавание речи, требующих качественного лингвистического анализа текстов. И речь идет не только о традиционных задачах, таких как перевод, но и задачах, решение которых на качественно новом уровне было невозможно в прошлом (например, автоматический поиск фактов и связей в массивах информации).

ЗАКЛЮЧЕНИЕ

Таким образом, можно сделать вывод о том, что в настоящее время не существует полностью автоматизированных систем машинного перевода: все программы-переводчики, которые сегодня используются, несовершенны, перевод получается неточный. Для получения качественного перевода необходимо предварительно обрабатывать входной текст, упрощать его, а затем полученный перевод снова обрабатывать, добавляя конструкции, которые были изменены или упрощены в ходе предварительной обработки входного текста.

Несмотря на недостатки, существующие СМП пользуются большой популярностью: они уменьшают рутинный труд человека-переводчика, помогают в повседневной жизни быстро переводить простые тексты: электронную переписку, газетные статьи с простой лексикой и т.п.

Направления развития СМП делятся на два типа: СМП на основе алгоритмов, не использующих семантику входного текста и СМП на основе модели «СмыслТекст», где перевод идет сначала на язык-посредник, представляющий семантику входного текста, а затем уже с языка-посредника на язык перевода.

Первое направление сейчас представлено большинством существующих программ переводчиков. Качество перевода программами, использующими только такие алгоритмы, довольно низкое. Но технология TM может улучшить получаемый выходной текст, находя в базе правильных переводов фрагменты входного текста.

Второе направление, несмотря на сложность, представляет наибольший интерес, и появляются технологии, способные воплотить эту идею: например, Compreno использует семантическую иерархию понятий, разбирает роли различных понятий в предложении и связывает их друг с другом. На основе этого промежуточного представления в дальнейшем осуществляется перевод.

...

Подобные документы

  • Характеристика стилистических особенностей художественного текста. Стиль детской литературы. Приемы перевода художественного текста для придания эмоционального эффекта. Эмоциональная выразительность языка перевода произведения "Винни Пух и все-все-все".

    курсовая работа [87,2 K], добавлен 24.10.2014

  • Характеристика и главные трудности перевода художественного текста. Стилистические средства художественной речи. Эквивалентность как важнейшая характеристика перевода. Классификация переводческих трансформаций. Анализ перевода стилистических средств.

    дипломная работа [84,7 K], добавлен 26.05.2015

  • Понятие и виды перевода, его значение для человечества. Специфика перевода в зависимости от вида текста. Особенности юридического перевода и необходимое качество переводов. Обязанности юриста-международника. Специфика профессиональной этики переводчика.

    дипломная работа [88,2 K], добавлен 24.05.2012

  • Перевод и другие виды языкового посредничества, их виды, формы и жанры. Место машинного перевода в общей классификации, его краткая характеристика. Содержание проблемы переводимости при машинном переводе, направления и перспективы ее разрешения.

    курсовая работа [42,2 K], добавлен 17.11.2014

  • Виды и способы перевода, определение способа перевода и меры информационной упорядоченности для переводного текста. Преимущества и трудности синхронного перевода, проблемы синхронистов, возникающие в процессе перевода, психологические условия работы.

    реферат [27,7 K], добавлен 25.10.2010

  • Понятие и теории перевода, его связь с лингвистикой. Причины формирования и процесс становления науки о переводе. Создание системы машинного переводчика. Развитие сопоставительных контрастивных исследований в языкознании. Современное переводоведение.

    презентация [50,0 K], добавлен 29.07.2013

  • Понятие перевода, его функции и роль в современном мире. Особенности профессии переводчика. Лингвокультурные факторы перевода юридического текста. Правовая лингвистика и взаимосвязь языка и права. Виды и особенности перевода юридических текстов.

    курсовая работа [59,0 K], добавлен 11.12.2009

  • Теоретические аспекты рассмотрения особенностей перевода устойчивых словосочетаний и терминологических клише на основе научных текстов и диссертационных работ. Анализ конкретного текста и выявление влияния контекста на перевод специальных терминов.

    курсовая работа [77,3 K], добавлен 09.11.2012

  • Психолингвистическая и жанрово-стилистическая классификация видов перевода. Виды перевода по признаку первичности/непервичности оригинала, по соотношению типов исходного языка и переводного языка, по признаку полноты и способу содержания исходного текста.

    реферат [23,3 K], добавлен 30.06.2014

  • Выделение единиц перевода на уровне фонем, графем, морфем, слов, словосочетаний, предложений и текста. Выявление текстовой функции исходной единицы перевода. Пространственно-временные и причинно-следственные характеристики словесного состава текста.

    презентация [38,7 K], добавлен 29.07.2013

  • Проведение адекватного перевода оригинального английского текста на русский язык. Определение и анализ лексических, грамматических и стилистических средств выразительности языка научно-популярного стиля, понятия и эмоционально–образные приёмы текста.

    дипломная работа [53,8 K], добавлен 05.07.2012

  • Художественный текст как вид перевода. Профессиональное и ориентированное обучение - средство повышения качества подготовки переводчиков. Параметры художественного перевода, его определение. Особенности перевода фольклора в трилингвистическом аспекте.

    дипломная работа [159,3 K], добавлен 04.04.2014

  • Норма перевода как совокупность требований, предъявляемых к качеству перевода. Нормы эквивалентности перевода: жанрово-стилистическая, прагматическая и конвенциональная. Выявление особенностей функционирования конвенциональной нормы при переводе текста.

    реферат [43,6 K], добавлен 19.01.2011

  • Основные проблемы перевода художественного текста. Исследование природы переводческих трансформаций и их использования как основного средства достижения эквивалентности при переводе художественного текста. Лексические приемы перевода Т.А. Казакова.

    дипломная работа [137,6 K], добавлен 27.03.2015

  • Сложность проблемы выделения единиц перевода в тексте. Основные виды, характерные признаки и особенности использования клише в речевой деятельности. Образные выражения и их употребление в переносном смысле. Сущность применения готовых единиц перевода.

    презентация [38,7 K], добавлен 30.10.2013

  • Предмет, методы и направления исследования, основное содержание и значение теории перевода. Виды перевода, сферы его применения, оценка качества и языковой сложности. Переводческая сегментация текста, его связность. Типы лексических трансформаций.

    контрольная работа [33,6 K], добавлен 20.12.2011

  • Анализ статьи "О двуязычной ситуации", в которой идет речь о лингвистических проблемах машинного перевода. Основные виды отношений сегментов входного текста и сегментов выходного текста: полная калькируемость, квазикалькируемость и некалькируемость.

    краткое изложение [17,8 K], добавлен 20.04.2011

  • Понятие языка и нормы перевода. Обеспечение высокого качества перевода переводчиком. Семантические проблемы перевода. Межъязыковые расхождения в грамматикализации "классических" грамматических категорий. Синтаксические проблемы перевода стихотворений.

    реферат [33,3 K], добавлен 23.12.2011

  • Обзор выявления в оригинале конструкций, требующих синтаксических трансформаций при переводе, их классификации и анализа способов перевода. Описания перевода при помощи перестановок, членения и объединения предложений, синтаксических проблем перевода.

    курсовая работа [49,1 K], добавлен 29.12.2011

  • Основные характеристики технического текста. Лексико-грамматические особенности стиля технического текста. Перераспределение содержания, сопровождаемое изменением синтаксической структуры фразы. Анализ перевода инструкции к китайским телефонам.

    курсовая работа [62,9 K], добавлен 17.04.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.