Машинний переклад: його типологія, переваги та недоліки

Практичне застосування машинного перекладу в подоланні мовного бар’єру. Класифікація машинного перекладу, його типологія, переваги та недоліки. Ефективність використання пам’яті перекладу в сукупності з лінгвістичними програмами предметної області.

Рубрика Иностранные языки и языкознание
Вид статья
Язык украинский
Дата добавления 06.02.2023
Размер файла 23,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.Allbest.Ru/

Херсонський національний технічний університет

Кафедра інформаційних технологій

Кафедра теорії та практики галузевого перекладу

Машинний переклад: його типологія, переваги та недоліки

Г. Веселовська, к.т.н., доцент

С. Радецька, к.п.н., доцент

Херсон, Україна

Анотація

У статті розглянуто можливі класифікації машинного перекладу, виокремлено найбільш чітку типологію, а також визначено, які саме переваги та недоліки в кожного типу машинного перекладу. Міжкультурну комунікацію складно уявити без використання перекладу, але придбання компетенції перекладача вимагає багато часу і зусиль. Тому важко переоцінити актуальність вивчення і вирішення проблем, пов'язаних із машинним перекладом, і важливість його практичного застосування в подоланні мовного бар'єру.

Терміном «машинний переклад» (скорочено МП, англійською мовою «Machine Translation», або «MT») називають дію, коли одна природна мова перекладається на іншу з використанням для цього спеціального програмного забезпечення. Під час дослідження було виявлено, що існує кілька класифікацій машинного перекладу (за кількістю мов, за спрямованістю перекладу, за роллю, яку відіграє людина в процесі МП). Проте ми розглянули найбільш вживану типологізацію - поділ на дві основні групи: машинний переклад, заснований на правилах, та статистичний. Окремо виділені гібридні системи, які покликані поєднувати в собі найбільш ефективні риси систем, заснованих на правилах, і статистичні системи. У дослідженні описано ці чотири типи машинного перекладу, їх особливості, причини та випадки вживання. До того ж вказано, які саме програми належать до того чи іншого типу машинного перекладу. Також у статті вказано на переваги та недоліки кожного з чотирьох типів машинного перекладу.

На основі дослідженого зроблено висновок, що нині дедалі більшої популярності набувають гібридні підходи, покликані з'єднати в собі плюси класичних і статистичних підходів. Нині системи МП не придатні для роботи з текстами, що містять велику кількість складносурядних і складнопідрядних речень і якісно працюють в основному на рівні словосполучення.

Ключові слова: машинний переклад, гібридна система, статистична система, пам'ять перекладів, система заснована на правилах.

Annotation

Machine translation: its typology, advantages and disadvantages

H. Veselovska, Candidate of Technical Sciences, Associate Professor at the Department of Information Technologies; S. Radetska, Candidate of Philological Sciences, Associate Professor at the Department of Theory and Practice of Translation Kherson National Technical University (Ukraine)

The article identifies the possible classifications of machine translation, highlights the clearest typology, and identifies the advantages and disadvantages of each type ofmachine translation. Intercultural communication is difficult to imagine without the use of translation, but acquiring the competence of a translator requires a lot of time and effort. Therefore, it is difficult to overestimate the relevance of studying and solving problems related to machine translation, and the importance of its practical application in overcoming the language barrier.

The term “Machine Translation” (abbreviatedMT, in Ukrainian “Машинний переклад” or “МП”) refers to the action when one natural language is translated into another one using special software. During the research it was found that there are several classifications of machine translation (by the number of languages, by the direction of translation, by the role that a person plays in the process of MT). However, we have considered the most commonly used typology - the division into two main groups: machine translation based on rules and statistical. Hybrid systems are singled out, which are designed to combine the most effective features of rule-based systems and statistical systems. The study describes these four types of machine translation, their features, causes and uses. In addition, it is specified which programs belong to a particular type of machine translation. The article also points out the advantages and disadvantages of each of the four types of machine translation.

Based on the study, it was concluded that currently becoming increasingly popular hybrid approaches designed to combine the advantages of classical and statistical approaches. At the moment, MT systems are not suitable for working with texts that contain a large number of complex and complex sentences and work well mainly at the phrase level.

Key words: machine translation, hybrid system, statistical system, translation memory, rule-based system.

Постановка проблеми

У час інформаційного вибуху і глобалізації всіх видів комерційної діяльності світ гостро потребує компетентних перекладачів. Зіткнувшись із величезними обсягами документів, складеними чи перекладеними на дедалі більшу кількість різних мов, люди приходять до висновку про необхідність використання машинних ресурсів для перекладу. Усі види машинного перекладу неминуче стають глобальною індустрією в цій сфері.

Проте не всі перекладачі обізнані у використанні цього виду перекладу, класифікації та типології системного машинного перекладу, що може призвести до неточностей та затримок у роботі. Саме тому питання типологізації машинного перекладу є нині дуже актуальним.

Аналіз досліджень. Теоретичною базою цього дослідження послужили роботи таких дослідників із питань машинного перекладу: Л.Н. Беляєвої, І.А. Борисової, А. Молчанова, Н.К. Рябцевої, М. Костаюса, M. Хеврне та ін.

Метою статті - розгляд можливих класифікацій машинного перекладу, виокремлення найбільш чіткої типології, а також визначення того, які саме переваги та недоліки є в кожного типу машинного перекладу.

Виклад основного матеріалу

Машинний переклад (МП) - це галузь наукових досліджень, експериментальних розробок і систем машинного перекладу (СМП), які вже функціонують, в яких основна частина процесу перекладу з однієї природної мови іншою виконується комп'ютером.

Класифікацію систем машинного перекладу можна зробити за різними критеріями (Беляева, 2007). Наприклад, можна виділити системи:

а) за кількістю мов (бінарні здійснюють переклад в одній парі мов, а багатомовні працюють із кількома мовами);

б) за спрямованістю перекладу (в одному і багатьох напрямах, якщо мова перекладу і мова оригіналу можуть мінятися місцями залежно від вимог користувача);

Залежно від того, яку роль відіграє людина в процесі МП, іншими словами, за ступенем автоматизації, зазвичай виділяють три типи СМП:

1) повністю автоматичні системи МП;

2) МП-системи, машинний переклад за участю людини;

3) TM-системи, переклад здійснюється людиною з використанням комп'ютера.

Повністю автоматичні системи машинного перекладу є скоріше нездійсненною мрією, ніж реальною ідеєю. Усі системи машинного перекладу працюють за участю людини в тій чи іншій мірі. Щоб комп'ютер міг перекласти текст, йому потрібна допомога предредактора, який тим чи іншим чином попередньо обробляє текст перекладу, інтерредактора, який бере участь у процесі перекладу, та постредактора, який виправляє помилки і недоліки в перекладеному машиною тексті (Рябцева, 1986). TM-системи іноді називають ще «пам'яттю перекладів». Вони є скоріше просто зручним інструментом, ніж елементом автоматизації.

Інший варіант класифікації систем МП, що прийшов з області корпусної лінгвістики - це поділ на підходи, в яких використовуються паралельні корпуси і, відповідно ті, в яких вони не використовуються. Системи, що використовують корпуси, далі діляться залежно від основної стратегії перекладу - на системи, засновані на прикладах (EBMT), і статистичні системи (SMT) (Hearne, 2011).

Найпростіший і найпоширеніший варіант класифікації - це поділ на два основних типи систем МП (Молчанов, 2013):

а) засновані на правилах (rule-based machine translation, RBMT);

б) статистичні.

Окремо розташовані гібридні системи, які покликані поєднувати в собі найбільш ефективні риси систем, заснованих на правилах, і статистичних систем.

Перший тип, який ми розглянемо - це пам'ять перекладів (Translation memory) (засіб автоматизованого перекладу, який не є системою машинного перекладу, проте користується великою популярністю). Друга назва - накопичувач перекладів. Його слід згадати, тому що він ефективно використовується в сукупності з програмами-перекладачами (PROMT, Lingvo). лінгвістичний програма предметний машинний переклад

Пам'ять перекладів - це, по суті, набір вже перекладених «одиниць перекладу» (translation unit). «Одиниця перекладу» частіше називається сегментом тексту, і кожен такий сегмент є найчастіше одним реченням, або рідше - цілим абзацом або частиною складносурядного речення.

Іншими словами накопичувач перекладів - це база даних, в якій зберігаються пари «сегмент - переклад». Якщо сегмент вихідного тексту повністю збігається з сегментом у базі накопичувача перекладів, він підставляється в переклад. Однак за певних розбіжностей між цими двома сегментами потрібне подальше втручання перекладача для внесення змін.

Ефективність використання пам'яті перекладу в сукупності з програмами-перекладачами пояснюється тим, що в початковому тексті можуть бути присутні сегменти, яких немає в базі накопичувача.

Переваги такого типу МП в тому, що пам'ять перекладу забезпечує однаковість перекладу термінів в однакових фрагментах. Загалом підвищується ефективність перекладу текстів великих обсягів. Підвищується якість перекладу документів - різних договорів і специфікацій. Системи пам'яті перекладів необхідні, коли кілька перекладачів працюють над одним проектом, збільшується їх продуктивність (Молчанов, 2013).

Однак недоліків у процесі використання систем пам'яті перекладів більше, ніж переваг. Види текстів, з якими використання систем накопичувачів перекладів буде ефективним, обмежені. Кожна програма вимагає адаптації, звикання, навчання, це стає недоліком, коли робота йде з різними програмами пам'яті перекладів. У самому тексті одна помилка може поширитися на весь проект, а також зв'язок між реченням, запропонованим програмою, і наступним реченням (або навіть текстом), може бути зовсім відсутнім. Для ефективної роботи з накопичувачем перекладів потрібен перекладач високої кваліфікації.

Другим типом, розглянутим у нашому дослідженні, є системи машинного перекладу, засновані на правилах (rule-based machine translation), - термін, що позначає системи машинного перекладу, засновані на лінгвістичній інформації про вихідну мову і мову перекладу зі словників та граматики. Системи машинного перекладу, засновані на правилах, охоплюють базис семантичних, синтаксичних, морфологічних закономірностей кожної мови. Подібні системи машинного перекладу називають класичними. Історично ці системи з'явилися першими, їх актуальність до сих пір не втрачена, ця система нині використовуються найбільш широко.

За допомогою цих даних вихідний текст перетворюється на текст перекладу по реченню. Система робить величезну роботу, формує зв'язний переклад речення, ґрунтуючись на інформації про кожне слово, узгоджуючи між собою всі члени речення. Цей алгоритм роботи частково аналогічний роботі людини-перекладача: аналіз тексту, пошук варіантів перекладу в своїй «словниковій базі», застосування правил, тобто спочатку аналіз тексту, після чого з'являється варіант перекладу. Дуже часто такі системи протиставляються статистичним системам машинного перекладу. Принцип роботи подібних систем - зв'язок структур вихідного тексту і тексту перекладу (Борисова, 2014).

Перевагами систем заснованих на правилах є граматична і синтаксична точність, стабільність результату, можливість настройки на певну предметну область.

До недоліків систем, заснованих на правилах, зараховують необхідність створення, підтримки і оновлення лінгвістичних баз даних, трудомісткість створення такої системи, а також її порівняно високу вартість.

Третім досліджуваним нами типом МП, є статистичний машинний переклад - це різновид машинного перекладу тексту, заснований на порівнянні великих обсягів мовних пар.

Мовні пари - це тексти, що містять речення в одній мові і відповідні їм речення в іншій, можуть бути як варіантами написання двох речень людиною - носієм двох мов, так і перекладом із вихідної мови мовою перекладу, виконаним людиною. Таким чином, статистичний машинний переклад має властивість «самонавчання». Чим більше в розпорядженні є мовних пар і чим точніше вони відповідають одна одній, тим кращий результат статистичного машинного перекладу.

Найяскравіший приклад, що допомагає зрозуміти, як працює ця система машинного перекладу, - Google Translate. У процесі роботи система аналізує величезні словникові бази парних фрагментів (фраз з двох-трьох слів) - оригінал фрагмента і його переклад. Програма обчислює найбільш ймовірну послідовність слів вихідної мови, яку вона вважає відповідною перекладу вихідного тексту. На відміну від традиційних систем перекладу (саме систем, заснованих на правилах), статистична програма не враховує у своїй роботі граматичні правила, що, безумовно, відбивається на якості перекладу. Нерідкі випадки, коли замість зв'язкового перекладу статистичний перекладач видає абсолютно неузгоджені речення, позбавлені будь-якого сенсу (Молчанов, 2013).

До недоліків цієї системи зараховують недостатній обсяг словникових баз. Наприклад, сервіс Google не завжди справляється з перекладом імен та назв, виникають складнощі з узгодженням членів речення. Цілком ймовірно, що в майбутньому розробникам вдасться підвищити якість перекладів, виконуваних цим методом машинного перекладу.

З очевидних плюсів варто виділити швидке налаштування (порівняно з системами, заснованими на правилах) і самонавчання (участь експерта під час налаштування системи можна звести до мінімуму).

Найбільша система статистичного машинного перекладу, що працює з українською мовою, - це, звісно, Google Translate.

Четвертий тип машинного перекладу - це гібридні системи. Існує думка, що корінь переважної більшості проблем машинного перекладу лежить у невідповідності систем мов, а успіхи в розробці програмного забезпечення для перекладу текстів не пов'язані з поганою роботою програмістів або комп'ютерних техніків, а є результатом поганого опрацювання цієї проблеми з лінгвістичної сторони (Борисова, 2014). Результатом цієї ідеї стали розвиток і розробка гібридних підходів.

Гібридні підходи стають дедалі більш популярними, оскільки вони поєднують кращі якості підходу, заснованого на правилах, і статистичного підходу (Costa-jussa, 2015).

Машинний переклад - це міждисциплінарна галузь знань, а до вирішення завдань машинного перекладу можна підходити з різних позицій, використовуючи дані лінгвістики або статистики. Саме існування різних підходів уможливило створення гібридних методів. Гібридні технології фокусуються на тому, щоб взяти всі кращі якості сучасних підходів. Нині найбільш поширений варіант гібридного перекладача - це підключення правил до вже сучасної системи статистичного перекладу (SMT).

Проте проводяться також дослідження, які фокусуються на поліпшенні роботи систем, заснованих на правилах (RBMT), за допомогою додаткової статистичної інформації. Нині лінгвісти, інженер-програмісти і фахівці з області IT активно співпрацюють в області МП у процесі спільних семінарів, проводять експерименти і розробляють архітектуру гібридних систем перекладу (Costa-jussa, 2015).

Говорячи про гібридні підходи, варто також згадати про нову унікальну технологію ABBYY Compreno, яка спочатку розвивалася як переклад за правилами. Нині вона являє собою багатофункціональну лінгвістичну технологію (Burukina, 2014). Система складається з двох основних і низки додаткових компонентів. Перший компонент - це універсальне дерево понять або універсальна семантична ієрархія. Усі слова в парі мов є листям на цьому дереві, між ними задаються відносини, інформація про семантичну сполучуваність. Другий компонент - це синтаксичний аналізатор, який визначає структуру речення і відносини між його словами. Для отримання точного синтаксичного аналізу використовуються семантичні дані про значення слів, які зберігаються в семантичному компоненті. Крім цього, Compreno використовує статистичні методи для зняття лексико-семантичної омонімії та оцінки ймовірності виникнення різних елементів лінгвістичного опису в текстових корпусах.

Висновки

На основі викладеного ми можемо стверджувати, що дедалі більшої популярності набувають гібридні підходи, покликані з'єднати в собі плюси класичних і статистичних підходів. Нині системи МП не придатні для роботи з текстами, що містять велику кількість складносурядних і складнопідрядних речень і якісно працюють в основному на рівні словосполучення. Саме тому ця тема є гарним підґрунтям для вивчення.

Список використаних джерел

1. Беляева Л.Н. Лингвистические автоматы в современных гуманитарных технологиях: Учебное пособие. Санкт- Петербург, 2007. 243 с.

2. Борисова И.А. К опыту постредактирования на материале англо-русского перевода с помощью автоматических систем Google translate и Promt. Вестник МГЛУ. 2014. №13 (699). С. 53-59.

3. Молчанов А. Статистические и гибридные методы перевода в технологиях компании ПРОМТ. Москва, 2013. 154 с.

4. Рябцева Н.К. Информационные процессы и машинный перевод. Лингвистический аспект. Москва, 1986. 168 с.

5. Burukina I. Translating implicit elements in RBMT. Translating and the Computer. 2014. №36. P 182-193.

6. Costa-jussa M. Latest trends in hybrid machine translation and its applications. Computer Speech & Language. 2015. №32(1). P 3-10.

7. Hearne M. Statistical Machine Translation: A Guide for Linguists and Translators. Language and Linguistics Compass. 2011. №5. P 205-226.

References

1. Beliaeva L.N. (2007) Lingvisticheskie avtomaty v sovremennykh humanitarnykh tekhnologiiakh: Uchebnoe posobie. [Linguistic Machines in modern humanitarian technologies: Textbook]. SPb. 243 p. [in Russian].

2. Borisova I.A. (2014) K opytu postredaktirovaniia na materiale anhlo-russkoho perevoda s pomoshchiu avtomaticheskikh system Google translate i Promt. [To the experience of post-editing based on the material of the English-Russian translation using the automatic systems Google translate and Promt]. Vestnik MHLU. №13 (699). P 53-59. [in Russian].

3. Molchanov A. (2013). Statisticheskie i hibridnye metody perevoda v tekhnolohiiakh kompanii PROMT. [Statistical and hybrid translation methods in PROMT technologies]. М., 154 p. [in Russian].

4. Riabtseva N.K. (1986) Informatsionnye protsessy i mashynnyi perevod. Linhvisticheskii aspekt. [Information processes and machine translation. Linguistic aspect.] М., 168 p. [in Russian].

5. Burukina I. (2014) Translating implicit elements in RbMt. Translating and the Computer. №36. P 182-193.

6. Costa-jussa M. (2015) Latest trends in hybrid machine translation and its applications. Computer Speech & Language. №32(1). P 3-10.

7. Hearne M. (2011) Statistical Machine Translation: A Guide for Linguists and Translators. Language and Linguistics Compass. №5. P 205-226.

Размещено на allbest.ru

...

Подобные документы

  • Аналіз прописних теоретичних моделей перекладу, що пояснюють сутність перекладацького процесу. Суть співвіднесеності мовних одиниць із певними предметами і явищами реальної дійсності. Використання трансформаційної та ситуативно-денотативної теорій.

    статья [23,3 K], добавлен 19.09.2017

  • Розгляд антонімічного перекладу як однієї з лексико-граматичних трансформацій. Аналіз мовного антонімічного перекладу формальної негативації, позитивації й анулювання наявних у реченні негативних компонентів. Опис контекстуального антонімічного перекладу.

    статья [20,1 K], добавлен 14.08.2017

  • Поняття про герундій та його функція у реченні. Особливості перекладу герундія після прийменників. Варіанти перекладу герундія залежно від виконуваних функцій. Аналіз способів перекладу пасивного і перфектного герундія, його зворотів та конструкцій.

    курсовая работа [62,7 K], добавлен 10.03.2013

  • Проблема адекватності перекладу художнього тексту. Розкриття суті терміну "контрастивна лінгвістика" та виявлення специфіки перекладу художніх творів. Практичне застосування поняття "одиниці перекладу". Авторське бачення картини світу під час перекладу.

    статья [26,9 K], добавлен 24.04.2018

  • Основні поняття теорії лексичного калькування та його різновиди. Калькування як спосіб перекладу лексичних одиниць, його місце у системі шляхів перекладу. Погляд на словотворче калькування як на поморфемний переклад. Калькування та буквальний переклад.

    курсовая работа [65,4 K], добавлен 08.06.2012

  • Загальна характеристика синхронного перекладу: короткий огляд історії розвитку та його різновиди. Умови екстремальності та особливості синхронного перекладу - його структура, швидкість виконання перекладацьких дій, характер лінгвістичних трансформацій.

    курсовая работа [118,6 K], добавлен 21.10.2014

  • Характеристика основних аспектів перекладу, класифікація стратегій. Вільний, дослівний та літературний (адекватний) переклад. Експлікація (описовий переклад): поняття, особливості. Функціонально-стилістична домінанта перекладу публіцистичних текстів.

    курсовая работа [30,0 K], добавлен 02.10.2011

  • Теоретичні аспекти термінологічної лексики. Види та класифікація політичної термінології. Лінгвокультурні фактори передачі тексту в умовах міжкультурної комунікації. Практичне застосування політичної термінології Великобританії та США. Проблеми перекладу.

    курсовая работа [42,7 K], добавлен 07.06.2011

  • Дослідження витоків та основних принципів концепції "енергійного перекладу" Сен-Сімона. Визначення його місця у розвитку теоретичного знання про переклад доби Просвітництва. Роль метафоричних образів у концептуалізації перекладу як наукового поняття.

    статья [28,5 K], добавлен 19.09.2017

  • Німецька реклама та її відтворення у перекладі. Адекватність та еквівалентність перекладу реклами. Способи перекладу німецьких рекламних слоганів. Дослівний переклад реклами, субституція як специфічний засіб перекладу. Парафраза як спосіб перекладу.

    курсовая работа [57,7 K], добавлен 21.06.2013

  • Теоретичні підходи в дослідженні газетно-інформаційних повідомлень та їх перекладу. Загальні поняття і роль перекладу в сучасному світі, проблеми перекладу газетно-інформаційних повідомлень, аналіз лінгвістичних та екстралінгвістичних факторів перекладу.

    дипломная работа [76,8 K], добавлен 06.06.2010

  • Сутність перекладу та його характерні риси. Аналіз перекладу твору Д.К. Роулінґ "Гаррі Поттер і Таємна Кімната" українською мовою та встановлення його особливостей на лексичному та стилістичному рівнях. Стилістичні особливості перекладу художніх творів.

    дипломная работа [86,4 K], добавлен 31.07.2010

  • Приклади використовування на практиці перекладацьких прийомів за умов усного послідовного та письмового перекладу текстів за фахом. Вибір перекладацької стратегії згідно з видом перекладу. Алгоритм перекладу різних типів технічної та ділової документації.

    отчет по практике [29,2 K], добавлен 14.05.2012

  • Правила перекладу граматичних форм та приклади на засіб перекладу. Розбіжності у смислових функціях відповідних одиниць у вихідній мові та мові перекладу. Застосування опису значення вихідної одиниці. Антонімічний переклад, фразеологічний еквівалент.

    контрольная работа [16,4 K], добавлен 23.03.2009

  • Визначення поняття синтаксичної трансформації як особливого виду міжмовного перетворення та невід’ємної частини процесу перекладу. Характеристика основних типів синтаксичних трансформацій та аналіз їх використання під час перекладу різних текстів.

    статья [24,1 K], добавлен 24.11.2017

  • Специфічність перекладу газетних матеріалів, труднощі та шляхи перекладу деяких його складових. Принципи правильного застосування граматичної та часової форми при їх перекладі, а також скорочених назв, скорочень міжнародних організацій, кліше, штампів.

    курсовая работа [31,5 K], добавлен 23.02.2011

  • Проблеми фразеології у мовознавстві. Поняття перекладу у науковій літературі. Типи відповідників при перекладі. Визначення фразеологічного звороту у лінгвістиці, класифікація фразеологізмів. Французькі фразеологізми в аспекті перекладу українською мовою.

    курсовая работа [58,1 K], добавлен 07.02.2011

  • Культурно-лінгвістичні аспекти перекладу китайської мови. Стратегії та тактики українсько-китайського перекладу. Особливості перекладу омонімів та антонімів. Правила міжмовного транскрибування (на матеріалі китайсько-українських/російських відповідників).

    книга [2,3 M], добавлен 26.03.2015

  • Переклад художнього тексту як особливий вид лінгвістичної та мовознавчої діяльності. Головні засоби досягнення адекватного перекладу, основні форми трансформацій. Особливості перекладу ліричних творів, фразеологічних одиниць та їх метафоричних елементів.

    курсовая работа [45,0 K], добавлен 20.11.2011

  • Класифікація різновидів англійських заперечень, підходи до їхнього перекладу. Порівняльно-зіставний аналіз відтворення заперечних конструкцій. Jсобливості перекладу англійських заперечнь на лексичному, граматичному, синтаксичному та стилістичному рівнях.

    дипломная работа [102,0 K], добавлен 18.11.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.