Promt - проект машинного перевода

Десктопные переводчики PROMT для английского, немецкого, французского, испанского, итальянского, португальского и русского языков. Создание первой системы машинного перевода PROMT. Качество перевода и его зависимость от объёмов лингвистических баз данных.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 30.03.2015
Размер файла 19,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Promt - проект машинного перевода

Компания PROMT

Год основания 1991

Расположение Россия: Санкт-Петербург, Москва

Германия: Гамбург

США: Сан-Франциско

Ключевые фигуры Светлана Соколова (основатель)

Продукция Системы машинного перевода

PROMT (от PROject MT - проект машинного перевода) - российская компания, разработчик систем машинного перевода. В настоящий момент существуют десктопные переводчики PROMT для английского, немецкого, французского, испанского, итальянского, португальского и русского языков. Причем имеются пары не только с русским языком, но и с иностранными, например англо-испанский, англо-португальский, немецко-французский, испанско-немецкий и др. Офисы компании открыты в России, США и Германии. В серверных продуктах PROMT доступные также китайский, японский, арабский и другие языки. В последние годы PROMT поставляет наряду с различными вариантами своей системы автоматического перевода и сопутствующими специализированными словарями ещё и собственные решения на основе технологии памяти переводов.

Технологии PROMT не раз удостаивались наград различных конкурсов. Так, в конкурсе, который проводится ежегодно в рамках семинара по статистическому машинному переводу под эгидой Ассоциации компьютерной лингвистики (ACL), переводчик от PROMT признан лучшим для перевода с английского языка на русский в 2013[1] и в 2014[2] г.

История

Компания основана в Санкт-Петербурге в 1991 году бывшими сотрудниками лаборатории инженерной лингвистики ЛГПИ им. А.И. Герцена. Руководитель компании со дня основания - Светлана Соколова.

Первая система машинного перевода называлась PROMT (1991), в 1992 году название было изменено на STYLUS, а в 1998 - обратно на PROMT.

6 марта 1998 года PROMT запускает первый российский сервис бесплатного онлайн-перевода Translate.ru.

В 1997 году PROMT вместе с французской компанией Softissimo выпускает линейку продуктов для западного рынка под названием Reverso[3].

В 2008 году контрольный пакет акций компании был выкуплен Renova Capital. Сумма сделки не разглашается, но по данным "Реновы", общий объём мирового рынка услуг перевода для компаний составил в 2007 году $9-10 млрд, при этом продажи PROMT составили 2 % от этой суммы, то есть $180-200 млн. Исходя из этих данных, по оценкам одного из наблюдателей рынка, стоимость приобретенного "Реновой" пакета составила не более $20-40 млн переводчик машинный лингвистический

Принципы работы

Первоначально в основе перевода PROMT лежала технология машинного перевода, основанная на правилах (RBMT). RBMT строится на основе лингвистического описания двух естественных языков (двуязычных словарей и других баз данных, содержащих морфологическую, грамматическую и семантическую информацию), формальных грамматик и, собственно, алгоритмов перевода. Качество перевода зависит от объёмов лингвистических баз данных (словарей) и глубины описания естественных языков, то есть необходим учет максимального количества особенностей грамматической структуры.

В конце 2010 года PROMT представил Гибридную технологию перевода, совмещающую в себе подход RBMT и SMT[5]. Суть такого совмещения в том, что вместо одного варианта перевода программа порождает множество переводов, число которых у одного предложения, в зависимости от многозначности слов, конструкций и результатов статистической обработки, может доходить до нескольких сотен. Далее вероятностная модель языка позволяет выбрать самый вероятный из предложенных вариантов.

Совмещение RBMT и SMT подходов дает преимущество от обеих технологий. Такой подход также позволяет быстро обучать переводчик[6].

С 2011 г. PROMT также предлагает решения на основе статистического подхода

Основные возможности

· Перевод слов, словосочетаний и текстов, в том числе с помощью "горячих" клавиш.

· Перевод выделенной области экрана с графическим текстом.

· Перевод документов разных форматов: doc(x), xls(x), ppt(x), rtf, html, xml, txt, ttx, pdf (в том числе отсканированные), jpeg, png, tiff.

· Использование, редактирование и создание специализированных словарей и профилей перевода.

· Подключение баз Translation Memory и глоссариев.

· Интеграция в офисные приложения, веб-браузеры, корпоративные порталы и сайты.

Основные продукты

1. Пользовательские продукты

1. Сервис Translate.ru[8].

2. PROMT Home[9].

3. PROMT Professional[10].

4. PROMT Expert[11].

5. Переводчик для детей Magic Gooddy[12].

6. Мобильные приложения Translate.Ru и PROMT Offline для iOS, Android, Windows Phone 8[13].

7. PROMT Агент для Mac[14].

2. Серверные решения для компаний на Windows и Linux

1. PROMT Translation Server (PTS)[15].

2. PROMT Cloud[16].

3. Решения для разработчиков и интеграторов (API)

1. PROMT Translation Server Developer Edition[17].

2. Translate.ru Api[18].

PROMT - это программа, входящая в состав семейства PROMT Family, представляющая собой профессиональную среду для перевода и мощный лингвистический редактор с широким набором функций настройки перевода.

PROMT - это единая среда переводчика, в которой можно не только переводить, но также и редактировать перевод, работать со словарями для всех языковых направлений одновременно. Эта программа позволяет выполнять как простой и быстрый, так и сложный профессиональный перевод текста, а также выполнять лингвистический анализ перевода, который затем можно использовать для улучшения качества перевода других текстов сходной тематики.

PROMT - гибкая система, настраиваемая на перевод конкретного текста. Для этого предусмотрена возможность подключения специализированных предметных словарей, поставляемых компанией ПРОМТ, а также создания собственных пользовательских словарей. Удобным средством настройки системы является также имеющаяся возможность выбора тематики документа, автоматически определяющей, какие словари подключать, какие слова оставить без перевода и как обрабатывать специальные конструкции типа электронных адресов, даты и времени. Широкие возможности повышения качества перевода появляются за счет использования баз переводов Ассоциированной памяти, подключения макросов и настройки правил перевода.

PROMT-документ в системах машинного перевода семейства PROMT Family - это совокупность:

- исходного текста;

- его перевода;

- скрытой структуры, поддерживающей согласование исходного текста и текста перевода по абзацам;

- информации о незнакомых словах;

- тематики документа.

PROMT-документ хранится в файле формата Документ PROMT (по умолчанию файлу присваивается расширение. std).

Создав новый документ или открыв файл с исходным текстом в программе PROMT (например, документ Word), Вы тем самым создаете PROMT-документ.

Если Вы предполагаете в дальнейшем продолжить работу с документом в программе PROMT (например, Вы выполнили перевод текста не до конца и хотите закончить его в другой раз), то целесообразно сохранить документ в файле формата Документ PROMT. При этом сохраняются и исходный текст, и перевод, и вся структура связи между ними, а также тематика документа и список незнакомых слов.

Концепция PROMT-документа позволяет выполнять интерактивное редактирование и перевод документа:

- просматривать и видоизменять исходный текст/текст перевода;

- переводить исходный текст полностью или по абзацам;

- возвращаться к уже переведенным фрагментам исходного текста, редактировать их или корректировать словарь, после чего заново переводить отредактированный текст.

Чтобы перевести текст, необходимо выполнить следующие действия:

1) Откройте файл с исходным текстом или создайте новый документ, если Вы хотите набрать новый текст непосредственно в PROMT.

2) Проверьте разбивку текста на абзацы.

3) Проверьте орфографию и отредактируйте исходный текст, если это необходимо.

4) Выберите шаблон тематики, подходящий для перевода данного документа.

Шаблон тематики в системах машинного перевода семейства PROMT-Family включает следующие основные объекты:

- упорядоченный список подключенных словарей;

- список зарезервированных слов;

- упорядоченный список подключенных препроцессоров.

Помимо этих основных объектов, шаблон тематики может включать некоторые расширенные свойства:

- ключевые слова;

- базы переводов Ассоциированной памяти;

- макросы;

- правила перевода;

- транслитерация незнакомых слов.

5) Создайте тематику документа, настроив компоненты выбранного шаблона тематики:

- подключите словари, которые будут использоваться при переводе документа. Если не подключен ни один словарь, при переводе будет использоваться только общелексический Генеральный словарь;

- зарезервируйте слова, которые должны оставаться в тексте перевода так, как они встречаются в исходном тексте.

Программа позволяет зарезервировать некоторые слова или словосочетания, то есть пометить их во входном тексте как не требующие перевода.

Чтобы зарезервировать слово или словосочетание:

1) Выберите команду "Зарезервировать" из меню "Перевод" или нажмите кнопку, либо переключитесь на вкладку "Зарезервированные слова" информационной панели и выберите команду контекстного меню "Добавить".

2) В диалоговом окне "Зарезервировать слово" в строке "Слово" или словосочетание наберите слово, которое Вы хотите зарезервировать.

В списке "Семантический класс" укажите семантический класс, к которому можно отнести это слово.

Семантический класс - это класс слов, объединенных общим значением. Значения всех слов языка могут быть сведены к ограниченному набору семантических классов (например, Деятельность, Качество и пр.)

3) Отметьте опцию "Транслитерировать", если хотите, чтобы при переводе слово было представлено символами выходного языка.

Транслитерация - это представление слов одного языка символами другого языка.

Например. При переводе с русского языка на английский фамилия "Иванов" может быть представлена латинскими буквами как "Ivanov".

4) Отметьте опцию "Формат шрифта", если Вы хотите зарезервировать это слово (словосочетание), только если оно отображается в исходном тексте шрифтом определенного формата. Диалоговое окно "Шрифт" позволяет указать тип, размер и стиль шрифта.

5) Подключите препроцессор, если хотите отменить перевод некоторых конструкций, например, адресов электронной почты, имен файлов, а также выбрать форму представления даты и времени в тексте перевода. Препроцессор в системах машинного перевода семейства PROMT Family - это набор функций, предназначенных для предварительной обработки входного текста с целью исключения из перевода или преобразования в соответствии с нормами выходного языка некоторых конструкций.

6) Выберите значения правил перевода для перевода всего документа. Правила перевода в системах машинного перевода семейства PROMT Family - это набор функций, позволяющих выбирать режим перевода некоторых языковых конструкций, которыми невозможно управлять, модифицируя словарные данные. Список правил перевода зависит от направления перевода.

Например. Для англо-русского направления существуют следующие правила перевода:

- Перевод местоимения "you" - можно выбрать значения:

а) "Вы";

б) "вы";

в) "ты".

- Род местоимения "I" - можно выбрать значения:

а) мужской род;

б) женский род.

7) Подключите макрос, который Вы хотите использовать при переводе документа. Макрос (сценарий, скрипт) - это программа, написанная на одном из скриптовых языков, и использующая предоставляемую данным приложением объектную модель для настройки приложения или расширения его функциональности.

8) Подключите базу переводов Ассоциированной памяти, если хотите использовать занесенные в нее ранее переводы сегментов текста. Ассоциированная память (АП) в системах машинного перевода семейства PROMT Family - это упрощенная система класса Translation Memory, встроенная в систему перевода. Назначение АП состоит в запоминании повторяющихся сегментов текста вместе с переводом и их последующего использования при переводе с помощью лингвистического редактора PROMT. Ассоциированная память системы PROMT Family по сравнению с полнофункциональными системами класса Translation Memory имеет ряд упрощений:

- упрощенный алгоритм выделения сегментов (сегменты выделяются по знакам препинания: точка, вопросительный и восклицательные знаки, знак абзаца, двоеточие, точка с запятой);

- упрощенный алгоритм поиска искомого сегмента в базе данных (ищется только 100% совпадение);

- отсутствие терминологического менеджера.

База переводов Ассоциированной памяти в системах машинного перевода семейства PROMT Family - это база, содержащая отдельные сегменты текста вместе с их переводами. В процессе автоматического перевода программа сравнивает сегмент исходного текста с сегментами из подключенных баз переводов Ассоциированной памяти. В случае полного совпадения перевод сегмента подставляется из базы переводов Ассоциированной памяти.

9) Отметьте абзацы, которые не требуют перевода.

10) Переведите текст (сразу весь документ или по абзацам).

11) Введите незнакомые слова в свой пользовательский словарь, если хотите, чтобы они в дальнейшем переводились.

12) Воспользуйтесь электронным словарем для уточнения значений слов.

13) Уточните значения правил перевода для отдельных абзацев.

14) Обратите внимание на слова с вариантами переводов.

Электронный словарь - это программа, которая позволяет получить для любого слова множество вариантов перевода. Словари ориентированы на различные предметные области.

Уточняя полученный перевод, Вы можете воспользоваться электронными словарями, разработанными другими фирмами (если они установлены на Вашем компьютере). Могут быть использованы следующие электронные словари:

- Lingvo 6.0/6.5, 7.0 (программа фирмы ABBYY (БИТ));

- Context 3.51, 4.0 (программа фирмы Информатик);

- MultiLex 1.0, 2.0, 3.0/3.5 (программа фирмы МедиаЛингва).

При переводе программа PROMT не использует эти электронные словари. Поэтому, если какого-либо слова нет в словарях системы машинного перевода семейства PROMT Family, или Вас не устраивает перевод какого-либо слова или словосочетания, то Вы можете вызвать электронный словарь и воспользоваться им как справочным.

Размещено на Allbest.ru

...

Подобные документы

  • Программы автоматизированного перевода: электронные словари, tools-приложения, система Translation Memory, редакторское ПО. Анализ использования САТ-программ в практической деятельности. Выполнение перевода при помощи переводчиков Wordfast и Promt.

    курсовая работа [46,5 K], добавлен 10.11.2011

  • История автоматизированного перевода. Современные компьютерные программы перевода. Сфера использования машинного перевода. Формы организации взаимодействия человека и ЭВМ в машинном переводе. Интерредактирование и постредактирование машинного перевода.

    курсовая работа [30,0 K], добавлен 19.06.2015

  • Исследование современных технологий машинного перевода. Изучение классификации систем перевода. Характеристика особенностей работы с электронным словарем. Языковые инструменты Google. Программы для проверки правописания и грамматики, текстовые редакторы.

    реферат [917,0 K], добавлен 02.11.2014

  • История возникновения, эволюция машинного перевода. Основные требования к коммуникативной эквивалентности. Последовательность формальных операций в системе машинного перевода, ее концепции развития. Переводчик для офиса. Преимущества электронных словарей.

    презентация [455,3 K], добавлен 22.10.2013

  • Порядок використання комп'ютера для автоматичного перекладу текстів, умови доцільності використання спеціального програмного забезпечення. Характеристика програми PROMT, її можливості та опис інтерфейсу, принцип та правила роботи. Переклад Web-сторінок.

    реферат [14,9 K], добавлен 21.09.2009

  • Обзор известных онлайн-переводчиков. Общая характеристика, принцип действия и возможности переводчиков текстов Translate.ru от Promt, Google и META. Электронные словари и мобильные переводчики. Отправка вопросов в техподдержку и отзывов о переводе.

    реферат [153,8 K], добавлен 14.07.2010

  • Мировая история технологии машинного перевода как класса систем искусственного интеллекта. Классификация программ онлайн-переводчиков, поддержка функции контролируемого входного языка. Многоязычные браузеры в Интернете и перечень электронных словарей.

    контрольная работа [21,6 K], добавлен 03.02.2011

  • Способы автоматического перевода математической литературы с английского языка на русский. Вопросы передачи формул (пересчет при необходимости). Импликации в математических текстах. Применение технологии Translation Memory. Основные математические штампы.

    реферат [33,2 K], добавлен 07.09.2009

  • Специализированные программы-переводчики. Возможности компьютерных словарей. Проблемы перевода многостраничной документации. Принципы, по которым построены компьютерные словари. Какие тексты нецелесообразно переводить с помощью компьютерных переводчиков.

    презентация [9,2 K], добавлен 13.11.2010

  • Функциональная структура автоматизированного комплекса, характеристика основных программ системы проектирования: Outlook Express/TheBat, Promt 2000, SmartWhois, SmartPayPals, CuteFTP, RegIT. Механизм работы с Web-магазином, логическая структура.

    дипломная работа [300,0 K], добавлен 28.06.2011

  • Целые числа в позиционных системах счисления. Недостатки двоичной системы. Разработка алгоритмов, структур данных. Программная реализация алгоритмов перевода в различные системы счисления на языке программирования С. Тестирование программного обеспечения.

    курсовая работа [593,3 K], добавлен 03.01.2015

  • Основные концепции языков программирования, механизмы типизации данных. Описание языков программирования и методов трансляции. Конечные автоматы и преобразователи. Общие методы синтаксического анализа. Формальные методы описания языкового перевода.

    курс лекций [5,5 M], добавлен 04.12.2013

  • Сущность, изготовление и оформление бланков предприятия, их основные реквизиты. Особенности использования и специфика работы с программами Microsoft Word, Microsoft Excel, ABBY FineReader, Microsoft Access, Microsoft PowerPoint, Promt 98 и Polyglossum.

    реферат [39,7 K], добавлен 09.10.2009

  • Создание программы для перевода кодов с языка Pascal на язык Си. Обработка программ операторами case, assign, rewrite и write. Способы объявления файла, комментария, переменных, логических и арифметических выражений. Виды синтаксических анализаторов.

    курсовая работа [461,0 K], добавлен 03.07.2011

  • Історія машинного перекладу як науково-прикладного напряму. Теорія машинного перекладу. Особливості використання систем, орієнтованих на персональні комп’ютери. Напрямки розвитку та застосування машинного перекладу. Приклади систем машинного перекладу.

    реферат [21,5 K], добавлен 19.02.2011

  • Исследование процесса разработки и кодирования приложения для перевода двоичных чисел в шестнадцатеричные в операционной системе Linux. Изучение требований к надежности и программной документации. Определение основных состояний интерфейса программы.

    курсовая работа [2,4 M], добавлен 23.06.2012

  • Компьютерная программа как последовательность инструкций, предназначенная для исполнения устройством управления вычислительной машины. Анализ стандартов перевода текстов компьютерных игр. Рассмотрение особенностей ИТ-перевода, примеры грубейших ошибок.

    реферат [65,5 K], добавлен 29.01.2013

  • Постановка и актуальность задачи написания программы для перевода текстов с транслита. Метод ее решения, входные и выходные данные. Список процедур и функций выполняемые программой. Ее структура: главная форма, форма "О программе" и "Редактор алфавита".

    курсовая работа [259,8 K], добавлен 26.03.2009

  • Понятие и цель применения текстовых данных. Принцип кодирования азбуки Морзе. Основные методы языка высокого уровня C#. Алгоритм работы, листинг, тестирование программы для перевода текста в последовательность кодов азбуки Морзе. Руководство пользователя.

    курсовая работа [1,4 M], добавлен 15.01.2013

  • Перевод - процесс создания на основе исходного текста на одном языке равноценного ему в коммуникативном отношении текста на другом языке, требования к обеспечению его эквивалентности. Машинные технологии перевода; характеристика систем Translation Memory.

    презентация [347,8 K], добавлен 06.01.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.