Використання систем машинного перекладу під час навчання перекладу науково-технічних текстів

Розгляд програм машинного перекладу, аналіз переваг і недоліків їх використання в роботі перекладача. Створення електронних галузевих словників і баз даних. Формування навичок адекватного застосування вузькогалузевих термінів в науково-технічних текстах.

Рубрика Иностранные языки и языкознание
Вид статья
Язык украинский
Дата добавления 15.01.2023
Размер файла 24,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://allbest.ru

Західноукраїнський національний університет

Використання систем машинного перекладу під час навчання перекладу науково-технічних текстів

Шилінська І.Ф., кандидат педагогічних наук, доцент,

доцент кафедри іноземних мов

та інформаційно-комунікаційних технологій

Кузів М.З., кандидат педагогічних наук, доцент,

доцент кафедри іноземних мов

та інформаційно-комунікаційних технологій

Анотація

У статті проаналізовано існуючі програми машинного перекладу, переваги і недоліки їх використання в роботі перекладача. Окреслено основні етапи розвитку машинного перекладу. Розмежовано поняття машинного перекладу та комп'ютеризованого перекладу, який здійснюється людиною з використанням систем автоматизованого перекладу і варіантів машинного перекладу. машинний переклад електронний словник термін

Розглядається питання необхідності використання програм машинного перекладу в процесі професійної підготовки майбутніх перекладачів оскільки поява Industry 4.0 призвела до виникнення Translation 4.0, тобто автоматизації перекладу та необхідності створення автоматизованого робочого місця перекладача з системою машинного перекладу, електронними словниками та базами даних.

Зазначено, що найбільш якісного перекладу з використанням систем машинного та автоматизованого перекладу можна досягти при роботі з текстами науково-технічної тематики.

Окреслено особливості науково-технічних текстів та виокремлено труднощі їх перекладу. Зазначено, що постредагування є обов'язковим елементом роботи з отриманим варіантом машинного перекладу. Навчання студентів машинного перекладу науково-технічної літератури необхідно починати з текстів, термінологія яких є стандартизованою і відображена в галузевих словниках.

Важливе значення для якісного постредагування мають навички та уміння адекватного використання певної лексичної одиниці відповідно до контексту, у тому числі вузькогалузевих термінів і загальнонародних слів в науково-технічних текстах. Наведено приклад фрагменту оригінального тексту, машинний варіант його перекладу програмою Google Translate із окресленими недоліками та представлено кінцевий варіант після постредагування.

Зазначено, що найбільш оптимальним варіантом використання машинного перекладу сьогодні є комп'ютеризований переклад, який здійснює людина з використанням комп'ютера.

Ключові слова: машинний переклад, комп'ютеризований переклад, науково-технічні тексти, майбутні перекладачі.

Вступ

Постановка проблеми. Сьогодні інтенсивний розвиток міжнародного співробітництва у різних галузях науки і техніки, використання інформаційних технологій у процесі комунікації та вибуховий ріст інформації актуалізують проблему вдосконалення професійної підготовки майбутніх перекладачів. Від якості перекладацької діяльності залежить успішність комунікації та досягнення взаєморозуміння з фахівцями інших культур. Технічний прогрес диктує нові вимоги до професійної підготовки перекладачів, які будуть працювати в епоху четвертої промислової революції (Industry 4.0), що уже відбувається у наші дні і має на меті впровадження високоефективних автоматизованих виробничих процесів з використанням новітніх інформаційно-комунікаційних технологій. Такі процеси автоматизації виробництва передбачають технічну комунікацію, тобто обмін інформацією, яка може бути представлена різними мовами. Відповідно виникає необхідність впровадження систем машинного перекладу у процес виробництва.

Хоча машинний переклад почали використовувати ще у другій половині ХХ століття, лише зараз в еру вибухового росту інформації та необхідності її постійної обробки повною мірою розкривається його потенціал. Поява Industry 4.0 призвела до виникнення Translation 4.0, тобто автоматизації перекладу з додаванням різних функцій, які може зараз виконувати штучний інтелект, включаючи подальше навчання машини, а також її інтеграцію у робочий процес перекладу під керівництвом людини [1].

Аналіз останніх досліджень і публікацій. Дослідження систем машинного перекладу та оцінювання його якості висвітлюються у роботах вітчизняних та зарубіжних учених (А. Бірю- ков, Г Мірам, А. Міщенко, О. Бабіна, Л. Бєляєва, Н.Мохов, D. Arnold, P Brown, J. Cocke, A. Koehn, W. Weaver та інші). На доцільності використання систем машинного перекладу у професійній підготовці майбутніх перекладачів акцентують увагу В. Ігнатенко, А. Ольховська, А.Янковець.

Зокрема, А. Ольховська у структурі фахової компетентності перекладача виокремлює такі компоненти: мовно-культурний (володіння мовами оригіналу і перекладу, соціолінгвістичними і транскультурними знаннями, уміннями і навичками), особистісно-міжособистісний (володіння так званими soft skills), перекладацький (уміння і навички перекладу та інтерпретації), професійно-орієнтований (здатність якісно надавати перекладацькі послуги) та технологічний компонент, який передбачає володіння знаннями, уміннями та навичками використовувати сучасні технології перекладу, у тому числі системи машинного перекладу та інтегровані системи [2, с. 270].

Утім, на сьогодні недостатньо вивченими є особливості впровадження у навчальний процес систем машинного перекладу. Актуальність формування практичних навичок використання систем машинного перекладу студентами обумовлює необхідність узагальнення теоретичних аспектів цієї сфери та розробки нових підходів до такого навчання.

Метою статті є аналіз існуючих програм машинного перекладу, визначення їх ролі та особливостей застосування під час перекладу науково-технічних текстів у процесі професійної підготовки майбутніх перекладачів.

Виклад основного матеріалу дослідження

Машинний переклад базується на використанні комп'ютера, який при графічному представленні інформації розпізнає мовні одиниці на основі їх форми, а під час усного сприйняття інформації розпізнавання відбувається відповідно до фізичних чи акустичних властивостей мовних одиниць [3, с. 24]. Моделює і автоматично здійснює перетворення тексту з однієї природної мови в іншу комп'ютерний аналог розумової (перекладацької) діяльності людини. Системи машинного перекладу (СМП) забезпечують швидкий доступ до великого обсягу інформації іноземною мовою. Промислові СМП в основному перекладають науково-технічні тексти, використовуючи термінологічні банки даних, що дозволяє дотримуватися єдності термінології і професійної лексики. Сьогодні завдяки програмам машинного перекладу стало можливим перекладати великі обсяги інформації за менший проміжок часу.

Перший етап розвитку машинного перекладу характеризувався використанням методу «кодування-декодування» (encodingdecoding approach), який ще називають прямим методом машинного перекладу. Для виконання такого перекладу необхідні були знання математики і програмування. Цей метод базується на алгоритмах послідовного перекладу, коли виконується переклад лише лексичних одиниць [4, с. 104]. Смислові і синтаксичні зв'язки речення не враховувалися. Такою формою перекладу могли користуватися фахівці певної галузі при перекладі текстів з простою граматикою і стандартизованою лексикою.

Більш удосконаленим методом перекладу є так званий трансферний метод. Згідно з цим методом, граматика мови перекладу і оригіналу співставляється відповідно до певного набору правил за допомогою мови-посередника (спеціальної формально-логічної мови) або трансфера (спеціального модуля міжмовних перетворень). Програма перекладу за допомогою мови-посередника передбачає морфологічний, синтаксичний і семантичний аналіз тексту оригіналу; здійснює представлення тексту оригіналу опорною мовою за допомогою модуля мови-посередника, перетворення представленого мовою-посередником тексту оригіналу у текст мови перекладу, використовуючи відповідні семантичні, синтаксичні, лексичні і морфологічні дані словників мови перекладу.

Статистичний машинний переклад базується на порівнянні двох мовних версій і заснований на прикладах [5, с. 234]. Чим більше мовних версій, тим краща якість перекладу. При цьому комп'ютер не використовує лінгвістичні алгоритми, а визначає ймовірність використання певного слова або виразу. Тобто, відбувається пошук найбільш імовірного перекладу речення в існуючій базі даних двомовних корпусів текстів.

В останні роки якість машинного перекладу значно покращилася завдяки удосконаленню програм, що розробляють програмісти разом із лінгвістами. Комп'ютеризований переклад (Machine-Aided Human Translation) здійснюється людиною з використанням систем автоматизованого перекладу (САП) і варіантів машинного перекладу.

Пам'ять перекладу (Translation Memory) зберігається у системі у формі раніше виконаних перекладів, що дає можливість перекладачеві перевірити термін певної галузі. Програми ділять текст на сегменти і представляють його для перекладу в зручнішій формі. Принцип роботи похожий на роботу текстових редакторів. Система дозволяє робити зміни і виправлення в тексті [6, с. 231].

Використання хмарних технологій (Cloud Technologies) дає можливість організувати колективний процес перекладу. Завдяки серверній базі перекладачі мають доступ до впорядкованої, стилістично і термінологічно однорідної бази пам'яті перекладу.

Програма Language Master є засобом перекладу для трьох мов: української, російської і англійської. Текст перекладається з урахуванням граматичних особливостей обох мов. Непере- кладені слова позначаються у вікні перекладу червоним кольором. Такі проблеми виникають у зв'язку з відсутністю слів у словнику програми або через помилки в оригіналі. Система дає можливість підключити додаткові словники з економіки й інформатики та забезпечує перевірку орфографії.

Програма для перекладу Pragma 6х з підтримкою для восьми мов, яка розроблена і широко використовується в Україні, містить досить великі словники, має зручний інтерфейс. Переклад в програмі здійснюється в двох вікнах - для тексту оригіналу і перекладу. Після запуску перекладача необхідно вказати напрям перекладу і тематику тексту. Слова, які не знайдені в словнику, позначаються червоним кольором в тексті перекладу, ті, які мають декілька варіантів - зеленим. Меню Pragma6х містить такі пункти: швидкий переклад, коректор словників, активація, налаштування, перевірка, оновлення, довідка, про програму, вихід.

Найбільш ефективними і сучасними технологіями машинного перекладу сьогодні є системи, які базуються на глибинних нейронних мережах. Нейронна мережа може виконувати переклад не запам'ятовуючи окремі фрази, вона кодує семантику речення.

В нейронному машинному перекладі не лише можна порівняти слова і фрази у двох текстах, а і встановити взаємозв'язок між двома мовами. Така модель перекладу здатна до самонавчання і вдосконалення [6, с. 233]. Застосування систем нейронного машинного перекладу зменшує кількість помилок при перекладі до 85%. Утім і вона має свої недоліки: робить помилки при перекладі власних назв, термінів, які рідко зустрічаються, не приймається до уваги контекст.

Німецька програма DeepL з'явилася у 2017 році і продемонструвала нову якість машинного перекладу. Ця програма використовую технологію глибинного навчання (Deep Learning Technology), яка базується на штучній нейронній мережі і використовує он-лайн словник Linguee.

Нова технологія перекладу SDL Trados Studio Freelance 2021 поєднує пам'ять перекладу і машинний переклад, дає можливість збільшити швидкість перекладу, покращити його якість завдяки інтеграції інструментів, необхідних для перекладу, редагування тексту, управління проектами та роботи з термінологією.

Утім, будь-яка система машинного перекладу, налаштована на певну галузь, потребує редагування. Найбільш якісного перекладу з використанням систем машинного та автоматизованого перекладу можна досягти при роботі з текстами науково-технічної тематики. У випадку перекладу художніх текстів про адекватність перекладу мова не йде, оскільки машині не під силу зрозуміти нюанси авторського стилю та ідіоматичних висловів.

Технічні тексти характеризуються певними особливостями, які дають можливість ефективно застосовувати сучасні програми машинного перекладу. Передусім, це чіткий і логічний виклад матеріалу, наявність термінології, характерної для цієї галузі, відсутність емоційного забарвлення. Тексти науково-технічного стилю характеризуються певними жанровими особливостями. Крім наукових статей та анотацій, існує велика кількість документів і інструкцій (технічний опис, патенти, інструкції щодо експлуатації і ремонту). Такі тексти є лаконічними, містять велику кількість спеціальної термінології і стандартних позначень. Сьогодні обсяг товарів і послуг компаній, які займаються розробкою і створенням інформаційних технологій, постійно зростає, моделі оновлюються, ринок збуту розширюється, що призводить до випуску нових інструкцій з експлуатації і обслуговування.

З-поміж основних проблем перекладу науково-технічних текстів є те, що лексика ІТ-галузі постійно оновлюється і навіть найсучасніші словники можуть не містити увесь необхідний термінологічний вокабуляр. Крім того, труднощі представляє переклад формул, таблиць, багатозначність слів. Досить часто в англомовному тексті можна знайти термінологічну лексику, яка немає еквівалентів в українській мові. Це пояснюється швидким розвитком ІТ-технологій. Інша проблема полягає у відмінностях морфологічних і словотворчих процесів української і англійської мов.

Науковці виокремлюють проблеми машинного перекладу науково-технічних текстів, які проявляються на різних лінгвістичних рівнях: графічному, лексичному, синтагматичному [7, с. 6]. Проблеми на графічному рівні виникають під час аналізу тексту і мають технічний характер. Вони пов'язані з використанням різних графічних символів, а також з наявністю орфографічних помилок у тексті. Лексичні проблеми машинного перекладу виникають у зв'язку з недостатнім обсягом лексикону, який може зрозуміти машина, формальною та семантичною варіативністю лексики. Проблеми машинного перекладу на синтагматичному рівні пов'язані з інтерпретацією зв'язків між одиницями словосполучень і речень у мові перекладу.

Сьогодні з розвитком Industry 4.0 виникає необхідність створення автоматизованого робочого місця (АРМ) перекладача з системою машинного перекладу, електронними словниками та базами даних [8, с. 9]. Спеціалізовані системи машинного перекладу з налаштованими словниками, тезаурусами, системами перевірки орфографії дають можливість отримувати варіант перекладу, який потребує кінцевого редагування. Постредагування є обов'язковим елементом роботи з отриманим варіантом машинного перекладу. Для успішного редагування перекладачеві окрім знання термінології необхідно володіти знаннями жанрових особливостей науково-технічних текстів, уміннями і навичками продукувати різні види текстів предметної сфери українською і англійською мовами.

Автоматизовані спеціалізовані системи перекладу зазвичай використовуються досвідченими перекладачами і можуть представляти певні труднощі для студентів.

Як програмне забезпечення, такі системи вимагають оволодіння певними навичками роботи з комп'ютером, а також відповідних знань при їх встановленні. Не всі системи є безкоштовними, більш спеціалізовані і популярні вимагають від користувача придбання ліцензії.

Навчання студентів машинного перекладу науково-технічної літератури необхідно починати з таких текстів, термінологія яких є стандартизованою і відображена в галузевих словниках.

Для перекладу текстів майбутні перекладачі зазвичай використовують програму Google Translate - веб-сервіс компанії Google, який може здійснювати переклад всієї веб-сторінки і паралельно пошук інформації з перекладом на іншу мову. Переклад дає можливість зрозуміти загальний зміст оригіналу, але не є точним, містить граматичні, лексичні і стилістичні помилки і потребує редагування.

Важливе значення для якісного постредагування мають навички та уміння адекватного використання певної лексичної одиниці відповідно до контексту. Труднощі представляють не лише вузькогалузеві терміни, а і загальнонародні слова в науково-технічних текстах. Наприклад, іменник candidate у науково-технічних текстах відповідно до його сполучуваності з іншими словами вживається у таких значеннях: structural candidate - структурний варіант, candidate solutions - види можливих рішень, information candidate - засіб інформації, candidate material - відповідний матеріал, candidate option- цікавий варіант вирішення проблеми. З-поміж інших досить часто вживаних загальнонародних слів можна виокремити наступні: contribution - стаття, наукова праця; claim - теза, положення, твердження; idea - погляд на природу явища, suggestion - раціональне пояснення та ін.

Перевагою електронних словників на відміну від паперових є те, що в них періодично оновлюються бази даних новими термінами. Крім того, електронні словники часто пропонують еквіваленти термінів у різних галузях науки. Прикладом такого словника є Multitran, в якому можна знайти значення слова відповідно до кожної галузі науки чи виробництва.

Використання студентами програми Google Translate під час здійснення перекладу є не лише першим кроком до оволодіння навичками машинного перекладу, а і допомагає розвинути відчуття мови, покращити знання лексики і граматики у процесі здійснення постредагування. Процес постредагування включає: перечитування фрагменту тексту машинного перекладу, порівняння тексту оригіналу і тексту машинного перекладу, оцінювання якості перекладу на основі стандартизованих інструкцій, прийняття рішення щодо достовірності перекладу, удосконалення або повторний переклад тексту[9, с. 25].

Нижче наведено фрагмент тексту, який відноситься до предметної сфери інформаційних технологій:

A “key logger” system can track every keystroke you make. These programs are spread either by someone putting it onto your computer while you are away, or through a virus or Trojan that attacks your system over the internet. Key loggers track your keystrokes and report on your activities, usually over the internet. They can be defeated through passphrase protecting your computer, practicing safe emailing, using an anti-virus program, and using a mouse-guided program to type in your passphrase. Key loggers can also be disabled by physically disconnecting your computer's internet access when you are not using the computer.

Переклад, здійснений програмою Google Translate:

Система «реєстратор ключів» може відстежувати кожне натискання клавіші, яке ви робите. Ці програми поширюються або через те, що хтось встановив їх на ваш комп'ютер, поки вас немає, або через вірус чи троян, які атакують вашу систему через Інтернет. Ключові журнали відстежують ваші натискання клавіш і повідомляють про вашу діяльність, як правило, через Інтернет. Їх можна подолати, використовуючи парольну фразу, яка захищає ваш комп'ютер, практикуючи безпечну електронну пошту, використовуючи антивірусну програму та вводячи парольну фразу за допомогою миші. Ключові журнали також можна вимкнути, фізично відключивши доступ до Інтернету на комп'ютері, коли ви не користуєтеся комп'ютером.

Як бачимо, смисл тексту зрозумілий для фахівців і користувачів персональних комп'ютерів, але існують проблеми стилю і використання певних лексичних одиниць. Якщо ІТ-фахівці розуміють значення терміна key logger і використовують зазвичай при перекладі транслітерацію кирилицею: кілоґґер, то філологам варто звернутися до словників для уточнення цього значення. Тим більше, що система у зв'язку з відсутністю терміна у словнику програми пропонує різні варіанти перекладу у кожному окремому випадку: реєстратор ключів, ключові журнали, що не передають адекватність значення цього терміна. У словнику наведений описовий варіант перекладу означеного терміна: реєстратор (роботи) клавіатури, програма або апаратний пристрій, які реєструють кожне натискання клавіш на клавіатурі [ 10, с. 295].

Варіант перекладу, отриманий після постредагування:

Реєстратор роботи клавіатури може відстежувати кожне натискання клавіші, яке ви робите. Такі програми розповсюджують через Інтернет разом з вірусами, які проникають у комп'ютер, у тому числі троян, або встановлюють на ваш комп'ютер поки вас немає. Реєстратор клавіатури відстежує натискання клавіш і передає інформацію про вашу діяльність, як правило, через Інтернет. Цього можна уникнути, встановивши пароль, який захищає ваш комп'ютер, а також дотримуючись правил безпеки електронного листування, використовуючи антивірусну програму та вводячи пароль за допомогою миші. Реєстратор клавіатури також можна деактивувати, відключивши доступ до Інтернету, коли ви не користуєтеся комп'ютером.

Обізнаність з предметною сферою і галузевою термінологією, а також знання жанрово стилістичних особливостей науково-технічного стилю дозволяє зменшити часові витрати на постредагування машинного перекладу.

Висновки

Сьогодні з-поміж вимог, які висувають перекладацькі компанії до претендентів на посадку перекладача є навички і вміння працювати із СМП. Найбільш оптимальним варіантом машинного перекладу є комп'ютеризований переклад, який здійснює людина з використанням комп'ютера, лише вона може зрозуміти стилістичні нюанси тексту іншої мови. Оволодіння системою знань, умінь і навичок застосування програм машинного перекладу, а також відповідними уміннями здійснювати постредагування отриманого варіанту машинного перекладу є необхідною складовою фахової підготовки майбутніх перекладачів. Розробка спеціальної методики використання таких програм становить перспективу подальших наукових розвідок.

Література

1. Translation and Industry 4.0. URL: https://www.themanufacturer.com/ articles/translation-and-industry-4-0/ (дата звернення: 13.01. 2022).

2. Ольховська А. С. Машинний переклад та постредагування у фаховій підготовці майбутніх перекладачів. Фаховий та художній переклад: теорія, методологія, практика: збірник наукових праць / за заг. ред. А.Г. Гудманяна, С.І. Сидоренка. Київ: Аграр Медіа Груп, 2020. С. 268-274.

3. Карпіловська Є. А. Вступ до прикладної лінгвістики: комп'ютерна лінгвістика: підручник. Донецьк: ТОВ «Юго-Восток, Лтд», 2006. 188 с.

4. Мірам Г. Алгоритми перекладу: вступний курс з формалізації перекладу (англ. мовою) / за ред. М. Даймонда. Київ: Твім інтер, 1998. 176 с.

5. Янковець А. Особливості використання машинного перекладу в умовах професійної підготовки майбутніх перекладачів. Науковий вісник Ужгородського національного університету. Серія «Педагогіка. Соціальна робота». 2017. Вип. 25. С. 233-236.

6. Мохов Н. А., Митчелл П. Д. Новейшие информационные технологии в переводе: опыт и перспективы. Язык и культура: сборник статей XXIX международной научной конференции (Томск, 16-18 октября 2018 г.). Томск, 2019. С. 230-235.

7. Бабина О. И. Машинная переводимость русскоязычных научно-технических текстов. ВестникЮУрГУ. Серия «Лингвистика». 2014. № 3. Т. 11. С. 5-14.

8. Беляєва Л. Н. Машинный перевод в работе переводчика: практический аспект. Вестник ПНИПУ: Проблемы языкознания и педагогики. 2019. № 2. С. 8-20.

9. Мартинюк О. В. Попереднє та кінцеве редагування текстів у процесі машинного перекладу засобами комп'ютерного програмного забезпечення та онлайн-сервісів. Актуальні проблеми філології та перекладознавства: збірник наукових праць. Хмельницький: ХНУ, 2019. № 17. С. 22-26.

10. Е. М. Пройдаков, Л. А.Теплицький. Англо-український тлумачний словник з обчислювальної техніки, Інтернету і програмування. 2-ге вид. Київ: Видавничий дім «СофтПрес», 2006. 824 с.

Summary

Using machine translation systems when training scientific and technical translation

Shylinska I., Kuziv M.

The existing machine translation programs, advantages and disadvantages of their use in translators' activities are analyzed in this paper. The main stages of machine translation development are highlighted. The concepts of Machine Translation and Machine-Aided Human Translation performed by a person using Computer-Aided Translation are distinguished.

The necessity of using machine translation programs in the training of future translators is considered since the new capabilities of Industry 4.0 has led to the emergence of Translation 4.0, i.e., the automation of translation and the importance of setting up the automated translator's workplace (workstation) with machine translation system, electronic dictionaries and databases.

It is noted that the highest quality translation using Machine Translation and Computer-Aided Translation systems can be achieved when working with scientific and technical texts.

In this connection, the main peculiarities of scientific and technical texts are outlined and the difficulties of their translation are highlighted. It is also pointed out that the post-editing is necessary after the text has already been machine translated.

To develop machine translation skills, students should perform translation of the scientific and technical texts with standardized terminology which is registered in electronic or paper subject-field dictionaries. To carry out qualitative post-editing, it is important to have sufficient knowledge of language and skills in using lexical units and common words in scientific and technical texts due to the context including subject-field terminology.

An example of the source language text is given as well as its machine translation by Google Translate program with outlined shortcomings and the post-edited final version is presented. It is noted that today Machine-Aided Human Translation performed by a person using Computer-Aided Translation can provide the best results in translating.

Key words: Machine Translation, Machine-Aided Human Translation, scientific and technical texts, future translators.

Размещено на Allbest.ru

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.