Оптимизация информационной функции языка посредством IT-технологий

Определение основных путей совершенствования функционирования языка как средства передачи информации. Характеристика разработки словаря переводчиком. Особенность использования автоматического переводного словаря. Анализ системы класса Translation Memory.

Рубрика Иностранные языки и языкознание
Вид статья
Язык русский
Дата добавления 28.01.2019
Размер файла 19,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

УДК 802

Национальный исследовательский Иркутский государственный технический университет

ОПТИМИЗАЦИЯ ИНФОРМАЦИОННОЙ ФУНКЦИИ ЯЗЫКА ПОСРЕДСТВОМ IT-ТЕХНОЛОГИЙ

А.А. Мигунова

В последнее десятилетие в формах и стиле систем информационного обеспечения коммуникативной деятельности произошли кардинальные изменения, основной причиной которых стала компьютеризация текстовой деятельности. Естественно, это процесс затронул и сферу переводоведения.

Переводчик в процессе своей профессиональной деятельности может не пользоваться всеми новшествами современного мира, но IT-технологии существенно облегчают его работу.

Машинный перевод (МП) берет свои истоки с начала 50х годов ХХ столетия. И в конце прошлого века произошел спад интереса к этой технологии, что привело к исчезновению многих систем машинного перевода. Но с появлением и стремительным расширением всемирной сети Интернет многие информационные технологии потребовали внедрения в промышленных масштабах какого-либо оперативного (online) переводческого инструмента. Под требования Интернета подходил только машинный перевод, и это обстоятельство вызвало интерес к новым разработкам. Многие системы, которые ранее являлись промышленными, получили коммерческое развитие и вышли на рынок информационных технологий в качестве полноценного программного продукта, обладающего свойствами товара.

В результате увеличивающегося интереса и возрастающих потребностей в осуществлении перевода больших массивов информации многие владельцы наиболее мощных и популярных сайтов приступили к массовому внедрению технологий машинного перевода. Для этого выбираются технологии, позволяющие осуществлять перевод в режиме реального времени. Такие системы применяются в основном на сайтах, связанных с интенсивным обменом информацией в актуальных областях международной деятельности.

Но главным современным достижением является то, что системами МП, работающими в режиме реального времени, оснащены самые распространенные поисковые системы Интернета. Например, поисковая система Google.

Данная система в состоянии выполнять переводы целых страниц; возможны и несколько направлений перевода. Первоначальный вариант может быть отредактирован непосредственно в окне системы, использован в среде Интернета или скопирован в текстовый файл. Система способна делать переводы на множество языков. Если у пользователя возникают сомнения в правильности перевода или по каким-то другим причинам ему необходимо посмотреть оригинал, он может вызвать его, отметив заинтересовавший фрагмент перевода.

Поисковая система Google выполняет все эти действия бесплатно. Но, вообще, стоимость машинного перевода такого качества приблизительно в 25 раз ниже стоимости традиционного перевода. Конечно же, качество переводов, выполненных человеком, значительно выше, но получить такие переводы в режиме реального времени в процессе работы в Интернете практически невозможно, и услуги системы МП являются единственным и достаточно хорошим решением проблемы извлечения справочной информации.

Несмотря на бурное развитие информационных технологий в области машинного перевода во всем мире существуют всего несколько систем, профессионально работающих с русским языком.

В нашей стране, к сожалению, количество фирм, занимающихся машинным переводом, чрезвычайно мало. Бесспорный лидер на российском рынке фирма «ПРОМТ». Кроме ряда коммерческих продуктов эта фирма предлагает и систему МП, работающую на сайте фирмы в режиме реального времени. Она позволяет переводить небольшие тексты электронных писем и сразу же отправлять их по указанным адресам. Онлайновая версия располагает весьма ограниченными возможностями, однако полная коммерческая версия (например, Promt XT Premium, Promt XT Office) вполне конкурентоспособна по сравнению с самыми совершенными системами МП преуспевающих западных разработчиков. [1]

Комплект PROMT XT Premium содержит в себе огромное количество модулей. Основной его модуль PROMT -- главный компонент всей системы -- представляет собой профессиональную среду для перевода и настроек его режимов. Модуль Dictionary Editor Pro позволяет пользователю создавать и редактировать собственные словари, подключаемые к основной системе и используемые в процессе перевода. Модуль PromtX -- редактор-переводчик с возможностью автоматического перевода буфера обмена Windows и текстов, введенных с клавиатуры в любом приложении Windows, работающем с текстом. Программа PromtE может работать совместно с Microsoft Internet Explorer для перевода Web-страниц. Модуль PROMT Plug-In for Acrobat выполняет функции перевода документов формата PDF в среде Adobe Acrobat. Для реализации функции перевода в приложениях Microsoft Office 2000 и Microsoft Office XP (Word, Excel, PowerPoint, FrontPage, Outlook) используется программа SmarTool. Модуль Electronic Dictionary -- это электронный словарь, содержащий всю словарную базу специализированных словарей компании «ПРОМТ». Для интеграции специализированных словарей в систему включается программа TDSetup. Функции менеджера баз данных ассоциированной памяти осуществляет программа Associated Memory Manager. В состав поставки PROMT XT Premium входит утилита резервного сохранения/восстановления данных системы PROMT Backup. Для пакетного перевода файлов предназначена программа File Translator. Модуль Dictionary Services представляет собой набор средств для профессиональной работы со словарями (статистика, сравнение, слияние словарей). В систему входят также программа для формирования дистрибутивов специализированных словарей и шаблонов тематик SdcMaker и средство для автоматизации процессов извлечения и управления терминологией PROMT Terminology Manager. Система МП компании «ПРОМТ» может работать совместно с системой памяти перевода TRADOS, для чего в состав PROMT XT Premium включен модуль PROMT for TRADOS. язык автоматический переводной словарь

Зарубежная система машинного перевода SYSTRAN обладает несколькими языковыми парами для перевода, как правило, в обоих направлениях, а в отдельных случаях -- в одном направлении, преимущественно на английский язык, В комплект поставки также входит SYSTRAN WebTrans, позволяющий осуществлять перевод Web-страниц. Кроме того, эта система с начала 1998 г. интегрирована в состав сервера AltaVista, что позволяет осуществлять автоматический перевод найденных Web-страниц. В состав SYSTRAN входит несколько десятков специализированных словарей, представляющих собой самостоятельные подключаемые по желанию пользователя блоки.

Подводя итог описанию современного состояния машинного перевода в сети Интернет, хотелось бы отметить, что в последнее время системы МП все больше используются в различных службах информационной сети. Интернет становится той сферой жизнедеятельности, в которой возможно реальное создание мирового сообщества без границ и каких-либо национальных ограничений. Единственное препятствие для плодотворной работы в этом направлении -- языковой барьер. Решить эту проблему помогут современные системы МП.

Автоматический переводной словарь. Основная задача переводного словаря -- дать соответствия типа лексическая единица языка оригинала -- лексическая единица (или единицы) языка перевода. Переводной словарь косвенным образом помогает также решать некоторые задачи анализа текста оригинала за счет включения в предисловие грамматического описания входного языка, а также за счет включения в словник в качестве отсылочных статей некоторых словоформ входного языка, образуемых нерегулярными способами. Составители переводных словарей иногда вводят в них грамматический очерк выходного языка. В таких случаях можно говорить, что эти словари до некоторой степени помогают осуществлять синтез текста.

Первоочередной проблемой при разработке словаря является определение минимально достаточного состава словарной статьи. С этой проблемой справился многоязычный электронный словарь ABBYY Lingvo 12.0 -- многоязычная компьютерная система словарей. Это абсолютно новое решение лексического обеспечения автоматизированного рабочего места переводчика. Достаточно обратить внимание на то, что только англо-русская и русско-английская части словаря представляют собой огромную библиотеку из 47 профессиональных словарей общим объемом 2 307 740 словарных статей. Коллекция словарей, входящих в «английскую часть» Lingvo 12.0, делает его абсолютно универсальным и достаточным для современного автоматизированного рабочего места переводчика.

Систему характеризует высокая степень «интеллектуальности» поиска: если введено задание с неточностью или опечаткой, поиск все же осуществляется, в итоге выводится меню с разными вариантами, в той или иной степени соответствующими запросу.

Поскольку Lingvo полностью совместим с текстовым редактором MSWord и открывается в его среде, нужную информацию из словаря можно просто отметить с помощью «мыши» и «перетащить» в текст.

Удобным новшеством последней версии Lingvo является всплывающая подсказка. При загруженном Lingvo чтение или просмотр незнакомого материала оказывается очень комфортным: нужно только подвести «мышь» к любому слову и подсказка всплывает автоматически. При необходимости по выбранной подсказке можно вызвать полную информацию о слове из всех словарей.

В составе Lingvo есть несколько сервисных блоков. Грамматический блок отображает парадигмы как русских слов, так и иностранных; фонетический -- дает транскрипции, а произношение наиболее частотных слов можно услышать в дикторском исполнении.

Одна из многих сервисных функций -- возможность фиксирования своего собственного словаря внутри общей системы. В работе с Lingvo предусмотрено быстрое добавление личных словарных карточек и редактирование уже имеющихся.

Память переводов. В настоящее время большое распространение получила системы класса Translation Memory (память переводов), которую чаще называют ТМ-инструменты. Эти инструменты предназначены для сохранения пар предложений в переводческой базе данных. База данных ТМ-инструмента состоит из пар сопоставленных друг с другом сегментов (TU -- Translation Units) на языке источника и языке перевода. Обычно в качестве сегмента выделяется предложение, однако, по желанию пользователя, в качестве единиц перевода в базу данных можно вводить и фрагменты предложений, и отдельные абзацы.

Основной идеей концепции Translation Memory является исключение необходимости снова переводить предложение (или его фрагмент), которое когда-то ранее уже было переведено пользователем и занесено в базу данных (в «память переводчика»).

Предусмотрены два режима поиска соответствий: точные (Exact matching) и неточные соответствия (Fuzzy matching). В первом случае программа сопоставляет предложенный сегмент на языке источника с теми, которые имеются в базе данных, и предлагает его перевод только в том случае, если обнаруживает их полное соответствие. В результате же неточного поиска в базе билингв в качестве варианта перевода программа выдает предложения, схожие с запрашиваемым сегментом. Степень сходства в режиме неточного поиска определяется самим пользователем в зависимости от того, хочет ли он просмотреть все предложения, имеющие хотя бы какую-то общую часть с текущим, или же он предпочтет обратиться только к тем, которые незначительно отличаются от сегмента, который ему нужно перевести. Таким образом, его задача сводится к переводу только тех фрагментов, которые им никогда ранее не переводились. [2]

Большинство систем класса Translation Memory хранят в своих базах данных помимо билингв и терминологических единиц еще и служебную информацию о текущем проекте: дату создания базы данных, имя пользователя, имя/название клиента, для которого выполнен перевод, имя автора записи, название проекта и указание на тематику текущих текстов. Благодаря тому, что каждая пара сегментов снабжена всей этой информацией, пользователь может установить фильтр внутри базы данных на основании необходимых ему параметров и проводить поиск неточных соответствий.

В последние годы системы класса Translation Memory приобретают все большую известность среди людей, связанных с письменным переводом. Мировой рынок предлагает множество продуктов, которые уже приобрели популярность и широко используются в процессе автоматизации переводческой деятельности.

В заключении стоит отметить, что современное общество наполнено и пронизано потоками информации, которые нуждаются в обработке. С развитием информационных технологий растет прозрачность мира, скорость и объемы передачи информации между элементами мировой системы, появляется еще один интегрирующий мировой фактор. Информационные технологии прочно вошли в нашу жизнь. Применение ЭВМ стало обыденным делом, хотя совсем ещё недавно рабочее место, оборудованное компьютером, было большой редкостью. Информационные технологии открыли новые возможности для работы и отдыха, позволили во многом облегчить труд человека, в нашем случае переводчика. Поэтому квалифицированный переводчик должен следить за современными IT-разработками, чтобы быть в центре информационной революции и успешно овладевать всеми навыками IT-переводов для облегчения своей профессии.

Библиографический список

1. Баранов А.Н. Введение в прикладную лингвистику. Изд. 3-е.- М.: Издательство ЛКИ, 2007.

2. Семенов А.Л. Современные информационные технологии и перевод: учеб.пособие для студ. Перевод. Фак. Высш. Учеб. Заведений // М.: Издательский центр «Академия», 2008.

Аннотация

Исследованы пути оптимизации информационных функций языка посредством IT-технологий. Определены основные пути совершенствования функционирования языка как средства передачи информации.

Ключевые слова: информационная функция языка - системы машинного перевода - автоматические переводные словари - память переводов

This article discusses ways to optimize the information functions of language through IT-technologies and identifies ways of improving the functioning of language as a means of transmitting information.

Key words: information function of language - machine translation systems - automatic translation dictionaries - translation memory

Размещено на Allbest.ru

...

Подобные документы

  • История создания "Толкового словаря живого великорусского языка" В. Даля. Содержание словаря: основные условные сокращения, орфоэпия, лексика литературного языка и местных диалектов; афоризмы с толкованием; иностранные термины; грамматические трудности.

    презентация [1,1 M], добавлен 16.02.2014

  • Memory, Teaching and his types. Why we need teaching of memory. Short-term and protracted memory: oppositions and coincidences. Short-term memory and methods of his improvement. Listening of methods is in translation. Scholars of research of listening.

    дипломная работа [45,4 K], добавлен 10.07.2009

  • Краткие сведения о жизненном пути и деятельности Владимира Ивановича Даля - русского ученого, лексикографа и составителя "Толкового словаря живого великорусского языка". Структура Далева словаря. Отношение Даля к раскрытию значения толкуемого слова.

    презентация [2,4 M], добавлен 18.04.2015

  • Владимир Иванович Даль как автор "Толкового словаря живого великорусского языка". Богатство лексического материала. Преимущество народного языка перед европеизированным литературным. Этнографическая школа Даля. Реформирование литературного языка.

    реферат [20,7 K], добавлен 06.09.2008

  • Концепция словаря. Лексикографический параметр как способ лексикографической интерпретации какого-то структурного элемента. Элементы авторской установки словаря. Тематический порядок расположения лексических статей. Фонетическая характеристика вокабулы.

    презентация [1,7 M], добавлен 22.11.2013

  • Терминология - словарное ядро языка науки. Систематизация терминологической лексики, упорядочение и унификация. Формирование словника словаря терминов. Словарь военной терминологии периода Второй мировой войны (на основе "Дневника боевых действий").

    курсовая работа [80,0 K], добавлен 19.12.2015

  • Понятие системности словаря (структурные типы слов, семантическая и стилистическая дифференциация лексики). Пути развития и пополнения словарного состава языка. Свободные словосочетания и фразеологические единицы.

    шпаргалка [40,2 K], добавлен 22.08.2006

  • Определение фонетики. Изучение фонетической системы русского языка, которая состоит из значимых единиц речи - слов, форм слова, словосочетаний и предложений, для передачи и различения которых служат фонетические средства языка: звуки, ударение, интонация.

    реферат [122,0 K], добавлен 06.12.2010

  • Изобразительно-выразительные средства китайского языка. Метонимия, олицетворение, овеществление и гипербола - основные литературные приемы и средства передачи эмоциональной выразительности. Фразеология и основы стилистического синтаксиса китайского языка.

    курсовая работа [42,1 K], добавлен 07.06.2012

  • Теоретические аспекты исследования стереотипов во взаимосвязи языка и культуры. Исследование значения слова семья по данным фразеологического словаря русского и английского говора. Особенность реализации фразеологий понятий супруги, родители и дети.

    дипломная работа [80,8 K], добавлен 27.07.2017

  • Анализ словаря компьютерных терминов для начинающих пользователей. Доказательства эффективности законов, способствующих планомерной реализации политики Франции в области языка. Особенности реализации языковой политики применительно к компьютерной сфере.

    статья [23,9 K], добавлен 23.07.2013

  • Толковые словари. Издания "Толкового словаря живого великорусского языка" В.И. Даля. Однотомный словарь русского языка. Системные словари. Cловарь русских синонимов. Cловари иностранных слов. Переводные словари. Электронные словари.

    реферат [36,7 K], добавлен 29.01.2007

  • Чтение, письменный и устный перевод текста с английского языка на русский, с русского языка на английский. Составление англо-русского словаря по специальности. Написание сочинения на тему "At the Barber's". Письменные ответы на вопросы на ангийском языке.

    контрольная работа [19,3 K], добавлен 16.04.2010

  • Фундамент синтаксического анализа. Словоизменительные морфологические средства. Структура системы синтаксического анализатора текста и используемая методика анализа текста. Графематический и фрагментационный анализ. Структура морфологического словаря.

    курсовая работа [194,3 K], добавлен 24.06.2012

  • Единый язык русской нации, язык международного общения в современном мире. Усиливающееся влияние русского языка на другие языки. Замечательный язык мира по разнообразию грамматических форм и по богатству словаря, богатейшей художественной литературы.

    сочинение [11,8 K], добавлен 04.10.2008

  • Причины и основные направления реформирования русского языка. Анализ и ключевые моменты основных реформ русского языка, оказавших влияние на современную речь и орфографию. Определение перспективы дальнейшего развития русского разговорного языка.

    курсовая работа [31,5 K], добавлен 19.03.2015

  • Проблема возникновения и стилистическая роль синонимов. Значение словарей в жизни человека, их классификация. Научное и прикладное значение словаря синонимов А.Ю. Кожевникова, его особенности, роль при изучении иностранного языка и при переводе.

    курсовая работа [43,5 K], добавлен 14.01.2013

  • Характеристика основных функций русского языка, их связь с его сущностью, природой, назначением в обществе и взаимосвязь между собой. Важность формирования коммуникативной функции языка в школе. Основы и проявления когнитивной и кумулятивной функций.

    реферат [15,4 K], добавлен 20.04.2009

  • Продуктивные модели словообразования в русском языке. Источники и сферы заимствования лексики. Актуализация узкоупотребительной, устаревшей лексики. Особые лексические средства манипуляции общественным сознанием в современном публицистическом дискурсе.

    дипломная работа [264,1 K], добавлен 12.10.2015

  • Анализ восприятия интеллекта носителями русского языка (по данным русского ассоциативного словаря). Специфика пословиц, отражающих отношение русского человека к интеллекту. Особенности восприятия мужского и женского ума в русских и английских пословицах.

    курсовая работа [29,3 K], добавлен 13.06.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.