Нейронные сети как способ повышения качества автоматизированного перевода

Основные преимущества использования нейронных сетей при обучении автоматизированному переводу. Описание общей схемы и принципа работы нейронной сети, применение данной технологии в системе NMTS. Характеристика технологий автоматического перевода.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 28.01.2019
Размер файла 294,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Нейронные сети как способ повышения качества автоматизированного перевода

Н.И. Сабуров, О.А. Побокова

Рассматриваются преимущества использования нейронных сетей при обучении автоматизированному переводу. Описывается общая схема и принцип работы нейронной сети, а также применение данной технологии в системе NMTS (Neural Machine Translation System). Произведен сравнительный анализ качества перевода, выполненного с помощью различных методов.

Ключевые слова: нейронные сети; автоматизированный перевод; машинное обучение; анализ.

Целью данной работы является анализ использования нейронных сетей в области автоматизированного перевода и их влияния на качество переведенных текстов. Актуальность работы обусловлена особой значимостью машинного перевода в условиях растущей глобализации общества. В статье используются описательный и сравнительный методы исследования. Авторы сравнивают три перевода текста, осуществленные сервисами Google Translate, Yandex Переводчик и человеком.

На протяжении всей истории человечества люди накапливали и передавали информацию из поколения в поколение. Эволюция хранения информации шла бок о бок с эволюцией человека, от первых наскальных рисунков и до современных дата-центров, которые могут хранить и обрабатывать колоссальные массивы информации. Развитие технологий привело человечество к интернационализации и глобализации.

Технологии автоматического перевода разрушили межкультурные барьеры. Чтобы перевести текст на любой язык мира, достаточно кликнуть мышью либо запустить программу переводчика на портативном устройстве и получить голосовой перевод в реальном времени. Но данный метод имеет свои существенные недостатки, например отсутствие контекста и смысловой нагрузки в предложениях, неверное склонение, род, число. Все эти факторы препятствовали осуществлению перевода на профессиональном уровне.

Появление нейронных сетей намного продвинуло идею искусственного интеллекта, которая уже не рассматривается как научная фантастика. Сегодня нейронные сети используются в обработке и анализе больших объемов данных, автоматизируя рутинные процессы.

Нейронные сети в некотором роде являются имитациями мозга, поэтому с их помощью активно решают разнообразные «нечеткие» задачи - распознавание речи, образов, рукописного текста, выявление закономерностей, классификация, прогнозирование.

В сферах, где невозможно применить традиционные технологии, нейронные сети часто выступают единственным эффективным способом решения проблемы. По данным Ward Systems Group, в 1998 году программные продукты на базе нейронных сетей применялись более чем в 500 крупнейших компаниях мира из списка американского журнала Fortune.

Пионерами в исследовании и создании искусственных нейронных сетей можно считать Дж. Маккалока (J. McCulloch) и У. Питтса (W. Pitts). Их работа «Логическое исчисление идей, относящихся к нервной деятельности» была издана в 1943 году.

Нейронная сеть - это обучаемая система. Она может действовать не только по заданному алгоритму и формулам, но и на основе прошлого опыта. Ее работу можно сравнить с процессом складывания мозаики ребенком, который с каждой попыткой делает все меньше ошибок.

Сама по себе структура нейронной сети состоит из блоков. На каждый блок приходится некое множество данных X, внутри блока каждому X присваивается свой вес K. Затем к произведению X*K прибавляется L, так называемый сдвиг регистра для увеличения скорости обучения: .

В блоке все показатели суммируются и затем подаются на функцию, которая, в свою очередь, усиливает слабые сигналы, а также исключает насыщение, получаемое от больших сигналов.

Нейронная сеть способна обучаться решению задач, для которых у человека не существует формализованных, быстрых или работающих с приемлемой точностью теоретических или эмпирических алгоритмов. Требуется задать некоторый критерий качества решения задачи, который нейронная сеть должна будет минимизировать или оптимизировать.

Механизмы, построенные на основе самостоятельного обучения, получили широкое применение в системах автоматизированного перевода. В частности, сервис Google Translate обрабатывает тексты идентичного содержания на разных языках и строит зависимости между фразами и предложениями для верной передачи смысла в данном контексте. Ведь главное отличие человеческого перевода от машинного в том, что машина не осознает контекст информации, и в итоге получается бессмыслица.

От начала и до конца перевод текста теперь полностью возлагается на нейронную сеть. До недавнего времени искусственный интеллект использовался в Google Translate в ограниченном режиме для несложных второстепенных задач. Например, для сравнения и анализа текстов, доступных на нескольких языках, например официальных документов Европарламента или ООН. В данном режиме сравнивался перевод каждого отдельно взятого слова в текстах.

Нейронная сеть компании Google под названием NMTS (Neural Machine Translation System) работает в инновационном режиме. Для примера рассмотрим сложную языковую пару «китайский - английский» и пропустим текст через NMTS. Система анализирует не только существующие варианты перевода, полученные при обучении, но и выполняет интеллектуальный анализ, разбивая предложение на отдельные сегменты.

Как показано на рис. 1, NMTS разбивает китайское предложение на сегменты и строит между ними отношения в зависимости от веса каждого фрагмента (серый - прямое отношение, другие цвета - косвенное отношение). Косвенные отношения позволяют построить предложение с верной грамматикой и смысловой нагрузкой.

нейронная сеть автоматический перевод

Рис. 1. Отношения между сегментами китайского и английского предложений

Нейронная сеть стала полезным инструментом автоматизированного перевода, поскольку она с каждым переводом становится «умнее», а следовательно, растет качество перевода исходного материала. Преимущество нейронных сетей перед обычным алгоритмом системы автоматического перевода можно наблюдать на рис. 2.

Рис. 2. Качество перевода, осуществляемого различными методами

Из данных показателей можно сделать вывод, что качество перевода системы, основанной на нейронных сетях, соответствует переводу, выполненному человеком. Дальнейшее развитие данной технологии уже в скором будущем приведет к полной автоматизации перевода сложнейших текстов без грамматических и семантических ошибок.

В качестве примера рассмотрим перевод текста на русский язык с помощью Google Translate NMTS, Yandex Translate и человека (табл. 1, 2).

Исходный текст:

Клеточная часть батареи состоит из секций клеток, расположенных в 3-6 ярусов. Основным элементом этой части является перегородка и перегородка промежуточная. Перегородки представляют из себя две швелеробразные стойки, согнутые из листовой оцинкованной стали толщиной 1,5 мм к которым крепятся боковая стенка на перегородку перфорированную и гнездовая стенка на перегородку гнездовую.

Таблица 1

Перевод с русского на английский

Google Translate NMTS

Yandex Переводчик

Человеческий перевод

Cellular part of the battery consists of sections of cells located in 3-6 tiers. The main element of this part is the partition and the intermediate partition. Partitions are two skreborraznye racks, bent from galvanized steel sheet thickness of 1.5 mm to which the side wall is attached to the partition perforated and nesting wall on the nest partition.

Cell battery part consists of sections of cells, arranged in tiers 3-6. The main element of this part is the partition wall and intermediate partition. Partitions are two solenopsae stand, bent from galvanized sheet steel with a thickness of 1.5 mm which are attached to the side wall on septum perforated and nesting wall to wall female.

The cage part of the battery consists of 3 - 6-tier cage sections. The basic element of this cage part is partition and intermediate partition. Partitions are made of two channel bars bent of a sheet galvanized steel 1,5 mm thick, to which it is fastened a sidewall on the perforated partition and a nested wall on the nested partition.

Таблица 2

Обратный перевод на русский результатов перевода на английский из табл. 1

Google Translate NMTS

Yandex Переводчик

Сотовая часть батареи состоит из секций ячеек, расположенных в 3-6 ярусах. Основным элементом этой части является раздел и промежуточный раздел. Перегородки представляют собой две скреброзные стойки, отогнутые из оцинкованного стального листа толщиной 1,5 мм, к которым боковая стенка крепится к перегородке перфорированной и вложенной стенкой на перегородке гнезда.

Клеточная часть батареи состоит из секции клеток, расположенных в несколько ярусов 3-6. Главным элементом этой части является перегородкой и промежуточные перегородки. Перегородки двух solenopsae подставку, согнутых из листа оцинкованной стали толщиной 1,5 мм, которые крепятся к боковой стенке с сентября-тум перфорированные и вложения стены к стене женщина.

Сравнение различных переводов показывает, что они отличаются друг от друга. Специалист, владеющий английским языком, заметит, что качество перевода, выполненного человеком, гораздо выше. Для Yandex Translate характерно отсутствие грамматического согласования, что приводит к потере смысла, а также неадекватное использование лексических единиц. Приведем пример перевода фразы «две швелеробразные стойки»:

- two skreborraznye racks (Google Translate);

- two solenopsae stand (Yandex Переводчик);

- two channel bars (человеческий перевод).

Перевод, выполненный с помощью Google Translate, является наиболее адекватным.

Обзор имеющихся публикаций по данной теме [1-5] позволяет надеяться, что машинный перевод сервиса Google Translate с применением нейронных сетей будет способствовать более качественному переводу. При этом важно, что система будет воспринимать предложения целиком, не разбивая их на отдельные слова. Предполагается, что нейронная сеть в будущем будет подвергнута дальнейшему совершенствованию, поскольку в настоящее время всякий машинный перевод представляет собой сложную задачу. Если человек, осуществляющий перевод, исходит из того, какую мысль нужно донести до читателя, то научить этому программу весьма проблематично. Однако прогресс не стоит на месте, создаются новые программы, которые упрощают процесс перевода, и нужно знать их недостатки и преимущества.

Проблематика, рассмотренная в данной статье, представляет собой перспективное направление для исследования. Анализ роли нейронных сетей в повышении качества машинного перевода можно осуществить на базе различных пар языков, текстов различных жанров.

Системы автоматизированного перевода моделируют работу человека-переводчика. Их полезность зависит от того, в какой степени в них учитываются объективные законы языка и мышления. Изучение этих законов позволит совершенствовать данные программы и повышать качество переводческого продукта.

Библиографический список

1. Уоссермен Ф.. Нейрокомпьютерная техника: теория и практика / перевод на рус. яз. Ю.А. Зуева, В.А. Точенова. М.: Мир, 1992. C. 14-25.

2. Нейросети для чайников. Начало [Электронный ресурс]. URL: https://habrahabr.ru/post/143129/ (28.04.2017).

3. Переводчик Google Translate подключили к нейросети [Электронный ресурс]. URL: https://geektimes.ru/post/280912/ (28.04.2017).

4. Зачем нужны аналитические технологии [Электронный ресурс]. URL: http://www.neuroproject.ru/what.php (02.05.2017).

5. Пример технического перевода с русского на английский язык [Электронный ресурс]. URL: http://perevods.com/byuro/?gl=8 (15.05.2017).

Размещено на Allbest.ru

...

Подобные документы

  • Механизм работы нервной системы и мозга человека. Схема биологического нейрона и его математическая модель. Принцип работы искусственной нейронной сети, этапы ее построения и обучения. Применение нейронных сетей в интеллектуальных системах управления.

    презентация [98,6 K], добавлен 16.10.2013

  • Прогнозирование на фондовом рынке с помощью нейронных сетей. Описание типа нейронной сети. Определение входных данных и их обработка. Архитектура нейронной сети. Точность результата. Моделирование торговли. Нейронная сеть прямого распространения сигнала.

    дипломная работа [2,7 M], добавлен 18.02.2017

  • Описание структурной схемы искусственного нейрона. Характеристика искусственной нейронной сети как математической модели и устройств параллельных вычислений на основе микропроцессоров. Применение нейронной сети для распознавания образов и сжатия данных.

    презентация [387,5 K], добавлен 11.12.2015

  • Преимущества нейронных сетей. Модели нейронов, представляющих собой единицу обработки информации в нейронной сети. Ее представление с помощью направленных графов. Понятие обратной связи (feedback). Основная задача и значение искусственного интеллекта.

    реферат [1,2 M], добавлен 24.05.2015

  • Возможности программ моделирования нейронных сетей. Виды нейросетей: персептроны, сети Кохонена, сети радиальных базисных функций. Генетический алгоритм, его применение для оптимизации нейросетей. Система моделирования нейронных сетей Trajan 2.0.

    дипломная работа [2,3 M], добавлен 13.10.2015

  • Общие сведения о принципах построения нейронных сетей. Искусственные нейронные системы. Математическая модель нейрона. Классификация нейронных сетей. Правила обучения Хэбба, Розенблатта и Видроу-Хоффа. Алгоритм обратного распространения ошибки.

    дипломная работа [814,6 K], добавлен 29.09.2014

  • Принципы организации и функционирования биологических нейронных сетей. Система соединенных и взаимодействующих между собой простых процессоров. Нейронные сети Маккалока и Питтса. Оценка качества кластеризации. Обучение многослойного персептрона.

    курсовая работа [1,1 M], добавлен 06.12.2010

  • Понятие и свойства искусственных нейронных сетей, их функциональное сходство с человеческим мозгом, принцип их работы, области использования. Экспертная система и надежность нейронных сетей. Модель искусственного нейрона с активационной функцией.

    реферат [158,2 K], добавлен 16.03.2011

  • Преимущества и недостатки нейронных сетей с радиальными базисными функциями (РБФ). Функции newrbe и newrb для построения РБФ общего вида и автоматической настройки весов и смещений. Пример построения нейронной сети с РБФ в математической среде Matlab.

    лабораторная работа [238,7 K], добавлен 05.10.2010

  • Понятие искусственного нейрона и искусственных нейронных сетей. Сущность процесса обучения нейронной сети и аппроксимации функции. Смысл алгоритма обучения с учителем. Построение и обучение нейронной сети для аппроксимации функции в среде Matlab.

    лабораторная работа [1,1 M], добавлен 05.10.2010

  • Сущность и экономическое обоснование, методы и подходы к прогнозированию валютного курса. Описание технологии интеллектуальных вычислений. Применение генетических алгоритмов для настройки архитектуры нейронных сетей. Основные способы улучшения модели.

    курсовая работа [1,3 M], добавлен 26.03.2016

  • Математическая модель искусственной нейронной сети. Структура многослойного персептрона. Обучение без учителя, методом соревнования. Правило коррекции по ошибке. Метод Хэбба. Генетический алгоритм. Применение нейронных сетей для синтеза регуляторов.

    дипломная работа [1,5 M], добавлен 17.09.2013

  • Рождение искусственного интеллекта. История развития нейронных сетей, эволюционного программирования, нечеткой логики. Генетические алгоритмы, их применение. Искусственный интеллект, нейронные сети, эволюционное программирование и нечеткая логика сейчас.

    реферат [78,9 K], добавлен 22.01.2015

  • Особенности нейронных сетей как параллельных вычислительных структур, ассоциируемых с работой человеческого мозга. История искусственных нейронных сетей как универсального инструмента для решения широкого класса задач. Программное обеспечение их работы.

    презентация [582,1 K], добавлен 25.06.2013

  • Способы применения технологий нейронных сетей в системах обнаружения вторжений. Экспертные системы обнаружения сетевых атак. Искусственные сети, генетические алгоритмы. Преимущества и недостатки систем обнаружения вторжений на основе нейронных сетей.

    контрольная работа [135,5 K], добавлен 30.11.2015

  • Математическая модель нейронной сети. Однослойный и многослойный персептрон, рекуррентные сети. Обучение нейронных сетей с учителем и без него. Алгоритм обратного распространения ошибки. Подготовка данных, схема системы сети с динамическим объектом.

    дипломная работа [2,6 M], добавлен 23.09.2013

  • Базовые архитектуры компьютеров: последовательная обработка символов по заданной программе и параллельное распознавание образов по обучающим примерам. Искусственные нейронные сети. Прототип для создания нейрона. Поведение искусственной нейронной сети.

    контрольная работа [229,5 K], добавлен 28.05.2010

  • Простейшая сеть, состоящая из группы нейронов, образующих слой. Свойства нейрокомпьютеров (компьютеров на основе нейронных сетей), привлекательных с точки зрения их практического использования. Модели нейронных сетей. Персептрон и сеть Кохонена.

    реферат [162,9 K], добавлен 30.09.2013

  • Компьютерные сети и их классификация. Аппаратные средства компьютерных сетей и топологии локальных сетей. Технологии и протоколы вычислительных сетей. Адресация компьютеров в сети и основные сетевые протоколы. Достоинства использования сетевых технологий.

    курсовая работа [108,9 K], добавлен 22.04.2012

  • История возникновения, примеры использования и основные виды искусственных нейронных сетей. Анализ задач, решаемых при помощи Персептрона Розенблатта, создание схемы имитационной модели в среде Delphi. Исходные коды компьютерной программы Perseptron.

    дипломная работа [933,1 K], добавлен 18.12.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.