Проблеми становлення українського термінотворення в галузі штучного інтелекту

Наведення прикладів перекладу термінів з подальшим їх аналізом із залученням різних методів перекладу. Дослідження в галузі штучного інтелекту, пов’язаного з розробленням програм, які розв’язують завдання на основі використання евристичних методів.

Рубрика Иностранные языки и языкознание
Вид статья
Язык украинский
Дата добавления 09.12.2018
Размер файла 24,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Проблеми становлення українського термінотворення в галузі штучного інтелекту

Коновалова В.Б., к. пед. н.,

доцент кафедри ділової іноземної мови та перекладу

Мирошниченко В.М., к. філол. н.,

доцент кафедри ділової іноземної мови та перекладу

Національний технічний університет «Харківський політехнічний інститут»

У статті проаналізовані історія та проблеми становлення українського термінотворення в галузі штучного інтелекту. Наводяться приклади перекладу термінів з подальшим їх аналізом із залученням різних методів перекладу.

Ключові слова: термін, термінотворення, штучний інтелект, методи перекладу.

В статье проанализированы история и проблемы становления украинского терминообразования в области искусственного интеллекта. Приводятся примеры перевода терминов с последующим их анализом с привлечением различных методов перевода.

Ключевые слова: срок, терминообразование, искусственный интеллект, методы перевода.

The article analyzes the history and problems of the Ukrainian terminology formation in the field of artificial intelligence. Examples of translation of terms with their further analysis with the involvement of different translation methods are given. Key words: term, terminology, artificial intelligence, translation methods.

Постановка проблеми. Натепер українське термінознавство перебуває в процесі свого становлення. Багато проблем залишаються поки що невирішеними. Термінологія штучного інтелекту не є винятком із правил, ураховуючи той факт, що сама галузь тільки нещодавно привернула до себе увагу вітчизняних науковців.

Необхідність перекладу нових термінів у галузі штучного інтелекту є наслідком живого діалогу між фахівцями-ученими, спеціалістами цієї сфери в різних країнах за допомогою перекладачів, що відбувається постійно на внутрішньовишівських і міжви- шівських семінарах, термінологічних нарадах і конференціях як регіонального, державного, так і міжнародного рівня.

Контактуючи з різними мовами, українська мова так чи інакше запозичує нові слова як загальновживані, так і спеціальні. Тому нерідко постає проблема точного перекладу й пошуку національного відповідника.

Сьогодні елементи штучного інтелекту (далі - ШІ) використовуються в багатьох галузях, від побутової техніки до управління атомними станціями. Розвиток ШІ йде паралельно з удосконаленням комп'ютерів і прогресом у галузі когнітивної науки. Існують припущення, що через кілька десятків років ШІ досягне рівня людини, а потім і перевершить його. Саме внаслідок становлення українського термінознавства термінологія в галузі ШІ вимагає системного дослідження, яке має засновуватися на національному ґрунті й уміщувати в собі міжнародний досвід і надбання.

Аналіз останніх досліджень і публікацій.

Термінологія в галузі ШІ як складова частина сучасної української наукової мови зараз зна-ходиться на гребені свого становлення. Відомо, що упродовж 1990-х років з'явилася низка тер-мінологічних довідників, які тією чи іншою мірою заповнювали прогалину спеціальних назв і понять. Звичайно, не всі лексикографічні праці відповідали духові та завданням часу, на жаль, у більшості не відповідають і сьогодні, але кожна з них сприяла тому, що українська мова продовжує своє функціонування на рівні найпрестижніших європейських мов.

Сьогодні розвиток фундаментальних досліджень у галузі ШІ передбачає вирішення, зокрема, таких проблем:

- автоматизований переклад, інформаційний пошук, генерація документів, організація природного діалогу між користувачем і комп'ютером;

- оброблення та сприйняття природної мови й тексту;

- системи технічного зору та розпізнавання образів;

- створення баз знань;

- створення експертних систем.

Постановка завдання. На основі викладеного можна сформулювати мету дослідження, яка полягає в аналізі історії та проблеми становлення українського термінотворення в галузі ШІ.

Виклад основного матеріалу дослідження. Системи СТТТІ - це системи, створені на базі ЕОМ, які імітують вирішення людиною складних інтелектуальних завдань. Із розвитком галузі з'являється велика кількість термінів, переклад яких може створити певні труднощі навіть для досвідченого перекладача. Отже, у розвитку термінології ШІ можна виділити декілька основних етапів: термін штучний інтелект

1) уважається, що розвиток сучасних систем штучного інтелекту розпочався з 50-х років ХХ століття. Цьому сприяла програма, розроблена А. Ньюеллом і призначена для доведення теорем під назвою «Логіг-Тео- ретик». Деякі автори називають цю систему експертною. Ця робота поклала початок першого етапу досліджень в галузі штучного інтелекту, пов'язаного з розробленням програм, які розв'язують завдання на основі використання різноманітних евристичних методів. Цей етап зумовив появу й розповсюдження терміна «штучний інтелект» [1, с. 12-13]. Отже, можемо зазначити, що саме в цей період з'явилися перші терміни в досліджуваній галузі;

2) термінологія в галузі штучного інтелекту, одного з найголовніших напрямів інформатики, почала своє ґрунтовне формування в 60-ті роки XX століття. Цей етап характеризувався постійною появою великої кількості термінів, частина яких зникла так само швидко, як і з'явилася;

3) середина 70-х років ХХ століття - період становлення термінології галузі штучного інтелекту. З'явилися терміни, які було визнано переважною більшістю фахівців. У цей час зусилля вчених концентрувалися на таких напрямах, як розроблення методів представлення, тобто способів формулювання проблем таким чином, щоб їх можна було легко вирішити; розроблення методів пошуку, тобто доцільних способів управління ходом рішення завдання, щоб воно вирішувалося протягом реального часу за допомогою реальних засобів;

4) остаточно основну термінологію закріплено в першій половині 80-х років ХХ століття і саме із цього періоду стали видаватися словники та енциклопедичні довідники зі штучного інтелекту. Більшість термінів за дуже рідким винятком за походженням є англомовними. Причиною того є проведення інтенсивних і ґрунтовних досліджень у цій галузі в США.

Незважаючи на значну кількість праць, присвячених науковій термінології, окремі терміносистеми залишаються практично не дослідженими. Перебуваючи на стадії становлення, термінологія в галузі штучного інтелекту включає багато неологізмів (зокрема авторських, уперше використаних у конкретному тексті), які не зафіксовані в тер- мінографічних джерелах. Штучний інтелект належить до галузей знання, у яких домінує інтелектуальна складова. У таких галузях термінотворення, як правило, починається не від ремісничої лексики, яка є характерною для більшості галузевих термінологій, а від авторських неологізмів за схемою: авторський неологізм ^ «стихійний» термін ^ загальноприйнятий (стандартизований) термін [2, с. 18].

Англомовна термінологія ШІ, як і більшість сучасних термінологічних систем, складається з лексичних одиниць двох типів: одно- та багатокомпонентних термінів. Серед досліджених термінів, які функціонують у текстах зі штучного інтелекту, виявлено 26% однокомпонентних одиниць і, відповідно, 74% багатокомпонентних одиниць (які налічують дві й більше кореневі морфеми). Це характеризує загальну тенденцію сучасного термінотворення, яка полягає у використанні складних синтаксичних одиниць, адже саме практична неможливість передати всі поняття штучного інтелекту за допомогою однокомпонентних термінів зумовлює утворення структурно складніших одиниць - термінів-композитів і словосполучень. Майже половина досліджуваних багатокомпонентних термінів належить до моделі NN (noun - іменник). Домінування утворень цього типу пояснюється, з одного боку, тенденцією до лаконічності та спрощення мовних форм, з іншого - широким діапазоном семантичних відношень, які здатна передавати конструкція NN. Передусім це об'єктні, суб'єктні, інструментальні відношення. У текстах галузі штучного інтелекту часто йдеться про ситуацію дії та про її окремі складники - об'єкт, інструмент чи результат дії, наприклад: chaining algorithm, character classification, data analysis.

Поповнення лексичного складу терміно- системи штучного інтелекту, як відомо, від-бувається безупинно і здійснюється не тільки завдяки появі нових термінів (до речі, у суспільно-політичних науках це відбувається меншою мірою, ніж у науках природничих чи технічних, пов'язаних безпосередньо з дослідництвом, експериментами, виробництвом). У процесі міжгалузевих комунікацій відбувається взаємне запозичення термінів відповідними галузевими терміносисте- мами. Такий процес можна назвати інтеграцією терміносистеми під впливом глобалізації.

Характерною складністю перекладу текстів у досліджуваній галузі є те, що багато термінів належать до безеквівалентної лексики, тобто на момент перекладу не мають відповідників в українській мові (крім описових статей) [3, c. 15]. Тим не менше це не означає принципову неможливість їх перекладу. Поступово терміни ШІ набувають перекладацьких відповідностей, і цей процес вимагає постійного ретельного вивчення. Водночас відомо, що словники комп'ютерних термінів, які є в наявності, або відстають на кілька років від розвитку комп'ютерної техніки, або надають лише часткову інформацію про той чи інший термін. Це стосується навіть он-лайн словників, які за своєю природою повинні йти урівень із прогресом.

Для перекладачів у галузі штучного інтелекту є необхідним:

1) адекватне власне підґрунтя попередніх знань;

2) знання мови, її правила;

3) знання обставин, пов'язаних із ситуацією висловлювання.

Отже, якщо перша та частково третя умови залежать від реципієнта, який не є носієм мови-інформатора, то обов'язком кваліфікованого перекладача є забезпечення всіх умов, необхідних для розуміння реципієнтом певного блоку інформації, тобто реципієнт повинен мати змогу отримати логічну, послідовну, а найголовніше достовірну інформацію щодо об'єкта дослідження в галузі.

Натепер використовують переважно декілька способів перекладу термінів у галузі штучного перекладу, якими є транскодування (чотири основні типи: транскрипція, транслітерація, змішане транскодування, адаптоване транскодування), калькування, експлікація та переклад на основі аналогії [4, с. 55].

Насамперед варто зазначити, що труднощі перекладу термінології в галузі штучного інтелекту пов'язані з міждисциплінарним характером. Оскільки в цій галузі використовуються методи, що традиційно розвиваються в логіці, психології, лінгвістиці, кібернетиці, дискретній математиці та програмуванні, то під час перекладу текстів саме зі ШІ зустрічається чимало загальногалузевих термінів з інших наук, що також значно ускладнює роботу перекладача. Наприклад, метод транскрибування: wavelet - вейвлет; backtracking - бектрекінг (метод пошуку рішення в мовах логічного програмування); cluster - кластер; behaviourism - біхевіоризм; interview - інтерв'ю, транслітерації - slot - слот; descriptor - дескриптор, indicator - індикатор; model - модель, portal - портал; concept - концепт, концепція, analogy - аналогія; pixel - піксель; formula - формула, змішаного тран- скодування (як показує дослідження, один із найменш уживаних способів перекладу): interface - інтерфейс; on-line - он-лайн, адаптоване транскодування: neurobionics - ней- робіоніка; induction - індукція, unification - уніфікація; matrix - матриця; card - карта, concatenation - конкатенація. Для такого способу перекладу термінів характерна наявність у відповідниках української мови пом'якшень у кінці слів, родових закін-чень у мові перекладу, які відсутні в англійських словах, наприклад, module - модуль; modification - модифікація, conjunction - кон'юнкція, disjunction - диз'юнкція (операція АБО), biometry - біометрія. Необхідно зазначити деякі особливості в перекладі цих слів-термінів, а саме: 1) подвоєння приголосних під час перекладу українською мовою між голосними не передається, як, наприклад, у слові commutator - комутатор; 2) літера r у кінці зазвичай передається незалежно від того, чи вимовляється вона у слові-джерелі, наприклад, monitor - монітор.

Іншим важливим засобом перекладу термінології в галузі ШІ є калькування. Цей прийом перекладу найчастіше застосовується в перекладі складних термінів. Нерідко в процесі перекладу транскрипція й калькування використовуються одночасно, наприклад: homogeneous structure - гомогенна структура; stochastic automation - стохастичний апарат; associative memory - асоціативна пам'ять, artificial neutral network - штучна нейронна мережа. Іноді використання прийому калькування супроводжується зміною послідовності калькованих елементів, наприклад, query language - мова запитів; process-handling procedure - процедура управління процесом; image recognition - розпізнання зображення. Калькування є виправданим під час перекладу термінологічних словосполучень тоді, коли складові елементи цих словосполучень уже посіли певне місце в термінологічній системі мови перекладу і є доступними для розуміння спеціалістів.

Наступним способом перекладу, на який варто звернути особливу увагу, на наш погляд, є експлікація. Під час застосування саме цього способу треба переконатися у відсутності наявного перекладного відповідника, який може бути наявним у вже перекладеній літературі, але ще не зафіксованим у словниках. Цей спосіб є зручним і продуктивним саме тому, що терміносистема ШІ є відносно несталою, наслідком чого є постійне виникнення та зникнення термінів. За допомогою експлікації перекладаються багатокомпонентні термінологічні словосполучення, наприклад: processor-specific code - програма, що прив'язана до певного процесора; unifier - той (об'єкт), що поєднує, problem solver - той, хто вирішує завдання, designator - той, що вказує; той, що позначає певну характеристику, knowledge-based system - система, що ґрунтується на знаннях, intelligent technique - метод, оснований на використанні розвинутої логіки, implication - висновок, отриманий унаслідок логічного роздумування. Щоб правильно застосувати такий прийом перекладу, необхідно добре знати предметну сферу тексту, що перекладається, щоб правильно розкрити зміст позначеного терміном поняття. Наприклад: deluxe - розширена версія програмного пакета, яка включає додаткові програми чи можливості; shareware - умовно-безкоштовне програмне забезпечення, з яким можна працювати протягом певного проміжку часу.

Експлікація є часто використовуваним способом під час перекладу українською мовою, адже для англійської мови, аналітичної за своєю структурою, характерна наявність багатокомпонентних безприйменникових словосполучень (кластерів), що не є притаманним українській мові і створює певні труднощі в процесі перекладу. Ці труднощі під час перекладу багатокомпонентних словосполучень можна подолати за допомогою калькування зі зміною послідовності компонентів словосполучення. Наприклад, knowledge representation language - мова подання знань, BIOS (Basic Input/Output System) - базова система вводу-виводу; або термін, що зустрічається в галузі дуже часто: inference network - комплекс ланцюгів умовиводів. Перевагою калькування перед експлікацією є те, що експлікація багатослівна, а у випадку калькування кожному елементу словосполучення мови оригіналу відповідає один елемент словосполучення мовою перекладу, отже, реалізується принцип економії мовних засобів.

Не менш важливим є використання еквівалентного перекладу, або перекладу на основі аналогії, що є актуальним, коли значення англійського слова повністю відповідає значенню одного українського слова. Цей вид перекладу досить поширений під час перекладу англійських термінів, хоча в українській мові існує не надто велика кількість слів-відповідників у галузі штучного інтелекту. Можна навести такі приклади еквівалентного перекладу: switchboard -комутатор (хоча під час перекладу англійською в цьому випадку можна застосувати й спосіб транслітерації, використовуючи слово commutator); база знань - knowledge base; direct inference - пряме припущення, abductive inference - абдуктивний умовивід, inference by analogy - умовивід за аналогією, plausible inference - правдоподібний умовивід, asynchronous process - асинхронний процес, логічне обчислювання - logical calculus.

Зростання якісно нових досягнень науковців у галузі ШІ передбачає зміни й поповнення словникового складу, тому що мова повинна відповідати інноваціям і рухатися разом з галузевою наукою, уніфікуючи та коректно репрезентуючи її в словниках.

Серед термінологічних одиниць, які становлять підмови різних галузей науки й техніки, у тому числі й галузі ШІ, особливе місце посідають терміни-епоніми, з перекладом яких виникають певні труднощі.

Аналіз науково-технічної літератури англійською мовою показує, що загалом у мові науки спостерігається тенденція до широкого використання даних термінологічних одиниць, специфічні риси яких не знижують їх можливостей фіксувати, зберігати та передавати науково-технічну інформацію. Саме тому існує необхідність більш ретельного й усебічного вивчення термінів-епонімів.

Мусимо зазначити, що цілісна картина тер- мінів-епонімів у галузі ШІ знаходиться ще в стадії становлення. Відсутність більш-менш повного опису основних проблем перекладу термінів-епонімів серйозно ускладнює як теоретичну роботу із систематизації, уніфікації і стандартизації термінологічних одиниць досліджуваної галузі в мові-реципієнті, так і безпосередньо практичну роботу з перекладу науково-технічної літератури та документації, що містять певну кількість термінів-епонімів, що є необхідним для обміну інформацією між фахівцями різних країн .

Відомо, що в науці епонім - це назва явища, поняття, структури або методу за ім'ям людини, яка вперше виявила або описала його. Частина термінів у галузі ШІ утворюється на основі особових імен (як правило, прізвищ). Це або похідні терміни (наприклад, darwinism - дарвінізм), або термінологічні словосполучення, де прізвище може бути як у загальному, так і в родовому відмінку.

Отже, означення-прізвище може перекладатися такими способами:

1) означення-прізвище подається в постпозиції в родовому відмінку: Petri network - мережа Петрі, Horn clause - диз'юнкт Хорна, Kelly construct - конструкція Келли, Post machine - машина Поста, Turing machine - машина Т'юринга (назва, що закріпилася за абстрактними (уявними) «обчислювальними машинами» деякого точно охарактеризованого типа, що дають придатне для цілей математичного розгляду уточнення загального інтуїтивного уявлення про алгоритми). Концепція такого роду машини склалася в середині 30-х років ХХ століття А.М. Т'ю- рингом у результаті виробленого їм аналізу дій людини, що виконує відповідно до заздалегідь розробленого плану ті або інші обчислення, тобто послідовні перетворення знакових комплексів, Turing test - тест Т'юринга (тест призначений для визначення рівня інтелекту машини. Поки що жодна програма й близько не підійшла до проходження тесту. Хоча такі програми, як Еліза (ELIZA), іноді змушували людей вірити, що вони говорять з людиною), Fillmor case - відмінок Філмора, Osgood space - простір Осгуда, Herbrand universum - універсум Эрбрана; Shannon information theory - теорія інформації Шеннона, Skolem function - функція Сколема, Goedel's theorem - теорема Геделя, Mahalanobis distance - відстань Махалано- біса, Dikovsky-Ullman algorithm - алгоритм Диковського-Ульмана;

2) означення-прізвище подається в постпозиції в орудному відмінку в сполученні з при-йменником «за»: Gabor hologram - голограма за Габором (під час запису голограми виникає відразу два зображення по різні сторони пластинки, J. Von Neumann regularity - регулярність за Дж. фон Нейманом, Convergence Theorem of Rosenblatt and Novikoff - теорема збіжності за Розенблаттом і Новіковим;

3) присвійним прикметником, утвореним від прізвища: Bayes risk - байєсів ризик, Socratic dialogue - сократична бесіда, Bayesian approach - байєсівський підхід (до прийняття рішень), Bayesian principle - байєсів принцип, Bayesian Probability Theorem - байєсівська теорема вірогідності, Wiener process - віне- ровський процес (у теорії стохастичних процесів), Gaussian white noise - гауссівский білий шум, von Neumann architecture - фон-не- йманівська обчислювальна архітектура (основана на концепції програми, що зберігається, та послідовних обчисленнях), Euclidean distance - евклідова відстань.

Прикладом перекладу за допомогою першого і третього способу є таке речення: Some popular distance measurements include Euclidean, Mahalanobis and cosine distance - деякі популярні вимірювання відстані включають вимірювання евклідової відстані, відстані Махаланобіса й косинуса відстані;

4) словосполученням, у якому є слово «метод», «спосіб» тощо: Monte-Carlo simulation - моделювання методом Монте-Карло (метод статистичних випробувань), Robinson's resolution - метод резолюцій Робінсона;

5) описово (з поступовим вилученням прізвища): фулерени (молекули, що володіють мастильними властивостями, здатністю надпровідності й поглинання світла) - buckminsterfulleren. Незвичайна історія відкриття цієї нової форми вуглецю відображена й уживається вченими в термінології: перша назва являла собою поєднання імені та прізвища архітектора (Richard Buckminster Fuller), який запропонував стійку структуру; одночасно кристалографи, які змоделювали цю структуру (яка, до речі, нагадує футбольний м'яч), дали їй назву - buckyball; після відкриття нанотрубок японським ученим S. Iijima (1991 рік) з'явився термін - buckytube (нанотрубка, один кінець якої закінчується фулереном). Іншим прикладом є термін Boolean operation, який зазвичай перекладають як булева операція, але іноді вилучають компонент прізвища, внаслідок чого відповідним терміном українською мовою стає вираз «логічна операція» [5, с. 54-59].

Висновки з проведеного дослідження.

Отже, можемо підсумувати, що термінологія в галузі штучного інтелекту є однією з най- динамічніших із термінологічних систем у наш час, її навряд чи колись можна буде вважати повністю й до кінця дослідженою, оскільки інновації в комп'ютерній техніці розвиваються досить стрімко та потребують швидкого поширення, що викликає необхідність застосовувати навички професійних перекладачів. Тому перспективою роботи є подальше вивчення лінгвістичних особливостей перекладу термінології, а саме запозичень, а також класифікація термінів у галузі штучного інтелекту.

Важливим для перекладачів у галузі ШІ є те, що після здобуття Україною незалежності й надання українській мові статусу державної термінотворча робота значною мірою активізувалася. Почали видаватися та перевидаватися численні термінологічні словники з різних галузей науки й техніки, що певним чином полегшує процес перекладу.

У цей процес включилися як мовознавці, так і галузеві фахівці, і галузь ШІ, яка протягом останніх років набула значного розвитку, не стає винятком.

Література

1. Кратко М. Проблеми української наукової мови. Вісник Львівського національного університету «Львівська політехніка». 2002. № 453. С. 12-13.

2. Гореликова С.Н. Природа термина и некоторые особенности терминообразования в английском языке. Вестник ОГУ 2002. № 6.

3. Скороходько Е.Ф. Термін у науковому тексті. Київ: Логос, 2006. 99 с.

4. Вагапова Л.Л., Вагапов А.С. К проблеме перевода английской безэквивалентной лексики (на материале текстов по вычислительной технике и информационным технологиям). П. : Издательство ПГПИ, 2000. С. 15.

5. Єнікєєва Є.М. Особливості перекладу комп'ютерних термінів на українську мову. Вісник СумДУ 2001. № 5 (26). С. 54-59.

Размещено на Allbest.ru

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.