Преодоление переводческих трудностей с помощью "регулярных выражений"

Изучение расширенных возможностей программ-конкордансеров, в частности функции "регулярные выражения", основанной на использовании метасимволов для формирования поисковых запросов. Эффективность извлечения лингвистической информации из корпуса текстов.

Рубрика Иностранные языки и языкознание
Вид статья
Язык русский
Дата добавления 26.01.2021
Размер файла 231,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Государственного морского университета имени Ф.Ф. Ушакова

Военного университета МО РФ, кандидат филологических наук

Преодоление переводческих трудностей с помощью «регулярных выражений»

Д.Ю. Груздев, доцент кафедры английского языка

Л.К. Груздева, доцент кафедры иностранных языков

А.С. Макаренко, начальник кафедры английского языка

Аннотация

Настоящая работа посвящена изучению расширенных возможностей программ-конкордансеров, в частности функции «регулярные выражения», основанной на использовании метасимволов для формирования поисковых запросов. В качестве основы для этого исследования использовался успешный опыт применения подобных программ и специализированных корпусов для преодоления переводческих трудностей начинающими специалистами.

При этом потенциал ресурса не был исчерпан полностью, множество функций осталось без внимания. Авторы предположили, что более сложные функции, не пригодившиеся неопытным переводчикам, могут оказаться полезными для профессионалов, которым корпус нужен не столько для поиска лингвистической информации, сколько для проверки предположений. Для проверки выдвинутой гипотезы проводится эксперимент с участием двух групп, опытных и начинающих переводчиков, с использованием интроспективного метода фиксации размышлений вслух (англ. think-aloud protocols) [Someren, Barnard, Sandberg, 1994: 1]. Анализ, в рамках которого рассматриваются не только фактические действия информантов, но и предлагаются различные варианты работы с указанием основных преимуществ и недостатков каждого, сопровождается примерами. В результате авторы приходят к выводу о целесообразности применения функции «регулярные выражения» при условии наличия хорошей языковой подготовки и опыта работы по тематике перевода.

При этом точность запроса, неизбежно возникающая с повышением языковой компетентности специалиста и пагубно сказывающаяся на эффективности извлечения лингвистической информации из корпуса текстов, компенсируется метасимволами. Грамотное использование ресурса позволяет обеспечить гибкость запроса, таким образом восполняя отсутствие в возможностях корпус-менеджеров алгоритма нечёткого поиска (англ. fuzzy string search) [Bast, Celikik, 2013: 2].

Ключевые слова: регулярные выражения, корпус текстов, конкорданс, метасимволы, сортировка по ключевому слову, пассивная лексика.

Lena K. Gruzdeva,

Assistant Professor at the Department of Foreign Languages, Ushakov State

Maritime University, Novorossiysk, Russia

Aleksandr S. Makarenko,

Cand. Sc. (Philology), Head of the Department of English, Military

University, Moscow, Russia

“REGULAR EXPRESSIONS” AS A WAY OF DEALING WITH TRANSLATION DIFFICULTIES

The paper is focused on finding ways to exploit enhanced capabilities of corpus-managers, particularly the Regex function, utilizing wildcards in queries. The basis for this study derives from the experience, by all means successful, of utilizing this resource coupled with ad-hoc corpora by inexperienced translators to overcome translation difficulties. Since not entire potential was taken advantage of, the authors suggested that more complex functions could be useful for weathered translators, who would use them not to look for linguistic data but rather check their assumptions. To test the hypothesis the researchers carried out an experiment involving two groups of translators, experienced and beginners, who were asked to provide TAP (think-aloud protocol) [Someren, Barnard, Sandberg, 1994: 1 ] based translations of a passage. The analysis not only covering actual solutions and operations of the informants but also extrapolating their actions to potential outcomes is backed by examples. The authors came to the conclusion that Regex is a worthy thing given good language proficiency and subject savvy of the translator. Besides, the accuracy of queries, which comes inevitably as the specialist's language proficiency improves and has an advert effect on the efficiency of linguistic data retrieving from a corpus, will be offset by wildcards. If used expertly, regular expressions provide flexibility making up for the lack of fuzzy string search [Bast, Celikik, 2013: 2] in corpus-managers.

Key words: regular expressions, linguistic corpus, concordance, wildcards, KWIC sort, passive vocabulary.

Введение

Перевод -- это многогранный процесс, требующий и твёрдых знаний языка, по крайней мере, языка перевода (ПЯ), и осведомлённости переводчика в области, в которой осуществляется перевод. Среди языковых трудностей выделяют следующие основные классы: лексические, грамматические и стилистические [Нелюбин, 2009: 98]. О том какие из них представляют наибольшую сложность для переводчика, спорить не приходится, ибо внимание и тем и другим в теории перевода уделяется одинаковое. Тем не менее, решение одной из групп проблем в процессе перевода должно предшествовать другой.

На первый взгляд порядок очевиден. Переводчик начинает с лексического наполнения. Во-первых, переводчик обращается к словарю чаще, чем к справочникам по грамматике. Во-вторых, в словаре первое, что проверяет переводчик -- это перевод слова. Грамматические комментарии, в каком бы количестве они не были представлены в словарной статье, обычно учитываются переводчиком после ознакомления с вариантами перевода [Комиссаров, 2011: 156]. В-третьих, поскольку стилистические трудности решаются за счёт выбора стилистически верных лексических единиц и грамматических конструкций, то и преодоление таких трудностей происходит в процессе решения переводческих проблем, относящихся к двум первым категориях.

Также эту точку зрения подтверждает наш опыт работы с другими электронными ресурсами переводчика, например, электронным корпусом текстов. Практически все наши предыдущие исследования, в которых мы рассматривали способы поиска лингвистической информации для переводчика в корпусе текстов Электронный корпус текстов -- большой массив естественных текстов языка, представленных на машинном носителе и должным образом упорядоченных с целью их использования в научных и практических целях [Шевчук, 2003, 2010, 2013]. с помощью программ-конкордансеров Программа-конкордансер (или корпус-менеджер) -- это специализированная программа, которая помогает автоматически построить конкорданс, т.е. список контекстов, в которых слово или словосочетание предстает в своём лексическом окружении [Шевчук, 2010, 2013]., сводились к проверке переводов отдельных слов или поиску грамматических конструкций, характерных для интересующих переводчика слов [Владимов, 2003, 2004, 2005; Кошкин, 2005; Груздев, 2011, 2013].

Тем не менее, в программах-конкордансерах, в частности в AntConc, которую мы использовали неоднократно в наших экспериментах, реализованы функции, позволяющие осуществлять поиск по грамматическим моделям [Anthony, 2006, 2012]. Речь идёт о так называемых «регулярных выражениях» (regular expressions). Для поиска используются символы и метасимволы, с помощью которых задаётся модель для поиска примеров в тексте [Paul Baker, Andrew Hardie, Tony McEnery, 2006: 138] (см. рис. 1).

Рис. 1. Окно программы AntConc. В поисковой строке Search Term задан запрос с использованием функции Regex

В этом мы усмотрели предпосылки для реализации поиска возможных путей преодоления переводческих трудностей на основе грамматических моделей. Отмечаем, что технически такой подход уже реализуем [McEnery and Hardie, 2012].

Вместе с тем пока рано говорить о целесообразности его использования. Поэтому до практического изучения подхода и его реализации с помощью корпуса текстов и программы-конкордан- сера предстоит выяснить соответствует ли он стратегиям работы переводчика.

Раздел 1. Предпосылки для использования «регулярных выражений»

В качестве отправной точки будем использовать направление перевода. Основные проблемы при переводе на иностранный язык связаны с недостатком средств выражения, как лексических, так и грамматических. Поэтому переводчик уделяет значительную часть времени работе непосредственно с исходным текстом, упрощает его, подводит его форму к тому, что без труда сможет передать на ПЯ. В результате в тексте перевода сохранится основной смысл с большой вероятностью потери второстепенных, незначительных элементов, которые носитель языка смог бы передать.

При работе в обратном направлении этап работы с текстом оригинала практически отсутствует. За счёт богатого словарного запаса и ассоциативных связей слов в памяти переводчик без труда сможет передать на ПЯ не только основную мысль, но и максимально сохранить нюансы смысла. Именно обширные знания родного языка ведут к главной трудности, с которой сталкиваются переводчики, работающие с иностранного языка, а именно -- затруднению выбора вербальных средств «наиболее полно выражающих смысл оригинала» [Герасимова, 2010: 4]. Таким образом, при переводе на родной язык трансформации, в частности грамматические и смешанные, осуществляются на основе подобранных лексических соответствий. Выбор грамматической формы при переводе в данном случае зависит не только и не столько от грамматической формы оригинала, сколько от её лексического наполнения, то есть от характера и значения лексических единиц, получающих в высказывании определённое грамматическое оформление [Комиссаров, 2011: 176].

Грамматические формы также не возникают ниоткуда. Напротив, они привязаны к выбранному переводчиком лексическому составу текста на ПЯ за счёт частого употребления именно этой формы, которая и закрепляется в языковой картине мира. Будучи носителем ПЯ, переводчик хорошо знаком с «этой системой, формирующей представление о явлениях и предметах окружающей действительности в сознании её носителей» [Степанов, 2012: 11].

Очевидно, что при переводе на иностранный язык переводчик лишен преимуществ, происходящих из знания картины мира, а когнитивные фреймы ПЯ недостаточно структурированы, чтобы обеспечить быстрое нахождение эквивалента в огромном запасе пассивной лексики [Комиссаров, 2011: 177]. В результате специалист вынужден трансформировать исходный текст, с тем чтобы сформировать «матрицу» текста для наполнения её вербальными средствами ПЯ, знакомыми переводчику.

В письменном переводе преобладает «параллелизм синтаксической организации по отношению к оригиналу» независимо от направления перевода [Комиссаров, 1990: 69]. Поэтому критерием употребления трансформаций являются существенные языковые различия, а не объём знаний переводчика. Незнание соответствий, если таковые существуют, не освобождает переводчика от необходимости их применения, если от этого зависит достижение максимально возможного уровня эквивалентности [Латышев, 1986] без «нарушения норм или узуса ПЯ при условии соблюдения жанрово-стилистических требований к текстам данного типа и общественно-признанной конвенциональной нормы перевода» [Комиссаров, 1990: 167]. Очевидно, что для решения переводческих проблем и преодоления переводческих трудностей не обойтись без традиционных и инновационных средств.

Раздел 2. Первый опыт

В этой связи мы видим два вероятных сценария работы переводчика: (1) в условиях отсутствия знаний необходимых лексических соответствий и (2) с необходимым лексическим багажом для осуществления перевода. В варианте (1) переводчик не сможет не обратиться к словарям, предварительно не прибегая к значительным трансформациям. Это значит, что и преодоление трудности начнется с решения лексической проблемы. В варианте (2) мы исходим из того, что переводчик оперирует знакомой лексикой, которую он знает, как применить в речи, т.е. эта лексика входит в активный запас переводчика. Рассмотрим ещё один подсценарий. Предположим, что переводчику знаком лексический эквивалент, который встретился ему несколько раз в журналах или в книге, но он не прочувствовал до конца, как эта лексическая единица функционирует в речи. То есть речь идёт о пассивной лексике, которая ко всему прочему не структурирована в когнитивных фреймах неносителя языка. Поэтому надеяться на собственные знания переводчику в таких случаях не приходится. Мы предполагаем, что это один из случаев, когда переводчик фактически начнёт искать пути преодоления трудности с решения грамматических проблем несмотря на то, что в качестве поискового запроса будет использоваться конкретная лексическая единица.

Рассмотрим пример (1) Противотанковые возможности отечественных БМП.:

(1) Лобовая броня БМП-1 выдерживала попадание осколков и винтовочных пуль, а также обстрел боеприпасами калибра 12,7-20 мм.

Опытный переводчик знает, что калибр оружия или боеприпаса в английском языке выносится на первое место. Тем не менее, в данном примере мы столкнулись с однородными членами, представленными типами поражающих элементов, и только для последнего указан диапазон калибров. Нам представляется, что цифры, вынесенные вперед, не будут способствовать сохранению целостности английского предложения при восприятии: The BMP-1's glacis plate provided protection against small arms fire, shell splinters and 12.7-20 mm projectiles.

Между тем нам встречались конструкции, в которых калибр передавался в развернутой форме, т.е. после боеприпаса. Для того чтобы избежать препозицию, необходимо использовать предлог. Основываясь на опыте, предположим, что вероятные варианты включают in/of caliber.

Именно эту конструкцию мы попытаемся проверить с помощью функции «регулярные выражения» программы AntConc и раннее составленного нами корпуса «Бронетанковые войска» (БТВ) См. подробнее в работах [Груздев, 2011, 2013; Шевчук, 2013]..

Для нашего запроса мы будем использовать метасимволы «(прелог|предлог)» [Dickinson, 2013, p. 6], обеспечивающие выбор между несколькими вариантами в процессе поиска. Также не стоит забывать одно из самых важных правил при работе с программами- кордансерами, которое заключается в необходимости формировать короткие и емкие запросы [Груздев, 2013, с. 68]. В связи с этим слово caliber сократим до cal с помощью метасимвола * [Dickinson, 2013, p. 14], заменяющего все последующие буквы слова. Таким образом, мы обеспечили максимальную гибкость запроса, расширив вероятный диапазон поиска. Наш запрос выглядит следующим образом: (in|of) cal* (см. табл. 1).

Конкорданс 1, составленный для словосочетания caliber (запрос -- (of|in) cal*)

№ п/п

Совпадения

26

<.. .> protection from SA fire up 12.7 mm in caliber as well as splinters.

27

<.. .> and armor-piercing rounds up to 40 mm in caliber.

28

<...> armament, which will be at least 105 mm in caliber, <...>.

29

<.> armor- piercing projectiles up to 40 mm in caliber.

Запрос действительно помог нам найти в корпусе необходимую информацию. При переводе примера (1) можно сохранить структуру русского предложения и оставить калибры в цифровом выражении в конце:

^e BMP-1's glacis plate provided protection against small arms fire, shell splinters and projectiles 12.7-20 mm in caliber.

Немаловажно и то, что в конкордансе 1 представлены только релевантные строки. Их удалось так сгруппировать благодаря ещё одной функции AntConc, сортировки результатов поиска (KWIC Sort). Причём сортировать можно не только по ключевому слову, но и по любому другому, удалённому от него вправо или влево на указанное количество слов.

Между тем, интересующие нас строки появились под номерами 26-29 из 75 совпадений. Оказалось, что из-за использования метасимвола * после усечённого слова cal программа искала все слова, которые начинались на ca, за которой следовало 0 или более букв l [Christ, Schulze, Hofmann, Konig, 1999: 24]. Поэтому среди совпадений были слова cable, capacity, carrier, can и др. Если исправить запрос и сократить caliber до буквы b, то в результатах отобразятся только четыре варианта, каждый из которых будет содержать ответ на интересующий нас вопрос.

Безусловно, можно было использовать и другие возможности программы для решения переводческой задачи. Во-первых, самым простым способом было бы начать с обычного поиска по главному слову caliber. Далее по результатам анализа совпадений, которых бы нашлось немало, формировались бы уточняющие запросы. Во-вторых, в программе реализована функция расширенного поиска, которая позволяет задать наиболее всеобъемлющий запрос, исключающий необходимость повторных уточняющих запросов [Груздев, 2013: 60-62]. Однако для реализации этой функции необходимо прописать все возможные варианты появления языковых единиц в тексте относительно друг друга. Таким образом, оба варианта значительно проигрывают поиску с использованием функции «регулярные выражения» с точки зрения затраченного времени.

Тем не менее, приведённый пример практически не подтверждает наше предположение о возможности начала решения переводческих проблем с поиска грамматических конструкций, полностью минуя этап поиска лексического наполнения при переводе на иностранный язык. Этот этап присутствовал, хоть и в усечённом виде.

Раздел 3. Преимущества и ограничения

Напомним, что мы исходили из того, что слово находилось в пассивном запасе переводчика, что и обусловило необходимость поиска соответствующей грамматической конструкции. Поэтому во время работы с корпусом текстов мы строили свой запрос всё же вокруг предложенного лексического соответствия, что, безусловно, ставит рассматриваемый подход использования корпусов текстов в один ряд с другими более простыми стратегиями. Например, в рамках предыдущих экспериментов с тематическими корпусами текстов, в частности, в диссертационном исследовании, Д.Ю. Груздев сделал вывод, что начинающие переводчики рассматривают данный ресурс только как средство проверки употребимости лексической единицы, которую они знали, нашли в справочниках или предположили. Отсюда вытекают и четыре основные схемы использования ресурса, а именно -- (1) «дословный перевод + корпус текстов», (2) «словарь + корпус текстов», (3) «Интернет + корпус текстов» и (4) «учебное пособие + корпус текстов» [Груздев, Груздева, Аванесова, 2017: 136].

С другой стороны, начинающие переводчики работают буквально наугад. Их цель поиска в корпусе заключается в том, чтобы найти соответствие термину, реже конструкции. Корпусные исследования опытного переводчика, напротив, будут иметь более целенаправленный характер. В этом случае и запросы будут иметь целью проверить предположение. Очевидно, что у специалиста с опытом есть больше возможностей составить более точный запрос. Однако точность выражается в подборе нужного лексического эквивалента. На этом вся точность заканчивается, ибо остальная часть запроса должна иметь более общий характер, чтобы дать программе возможность проверить больше комбинаций [Груздев, Груздева, Аванесова, 2017].

Такой запрос составить под силу только переводчику с соответствующей языковой подготовкой и, помимо всего прочего, подкованному в тематике перевода. Для технической же реализации требуется несколько большие возможности, чем те, которые обеспечиваются в простом поиске. Смеем предположить, что с такой задачей может справиться расширенный поиск или поиск с использованием функции «регулярные выражения», которая и обеспечит необходимую гибкость.

Для практического подтверждения наших выводов мы предложили перевести отрывок (2) двум группам по пять человек в каждой, причём в одной из них представлены переводчики с опытом работы более 10 лет (группа 1), а в другой -- начинающие специалисты (группа 2):

(2) Поставляемая аппаратура обеспечивает связь в звене рота -- батальон -- полк. выражение метасимвол лингвистический текст

Для перевода этого фрагмента обеим группам было предложено использовать только корпус текстов по тактике, составленный нами преимущественно из полевых уставов ВС США. Все переводчики владеют необходимыми навыками для работы со специализированными корпусами текстов [Hanston, 2002; Lavioza, 2002: 34-38], но исключительно в простом режиме построения конкорданса по слову, что наложило на нас определённые ограничения. Самое существенное заключалось в том, что мы не могли ставить задачу использовать поиск в режиме «регулярные выражения». В связи с этим нами было принято решение сосредоточиться на стратегии поиска информации в корпусе профессионалами и начинающими специалистами.

Группа 1 отметила, что ранее не встречала в своей практике английских эквивалентов выделенного фрагмента. Лишь два информанта предположили, что возможно level (уровень) является искомой единицей. Однако от проверки в корпусе отказались и примкнули к большинству, принявшему решение оттолкнуться от известного, т.е. от слов «рота-батальон-полк».

Каждый из информантов выбрал по отдельному слову и проверил его в корпусе (см. табл. 2). После сортировки списка совпадений и беглого просмотра результатов все переводчики предложили использовать level для перевода.

Конкорданс 2, составленный для слова company (запрос -- company, количество совпадений -- 814)

№ п/п

Совпадения

308

<.. .> down to the battalion or company level

309

<.. .> obstacles are constructed primarily at company level and below.

310

<.> for the operation, down to the company level <.>

311

<.> attachment of different units at the company level demands training.

Примечательно, что начинающие переводчики уже в ходе работы с конкордансом предположили, что искомое слово будет находиться в постпозиции, т.е. справа от запроса, что способствовало более быстрому анализу результатов. Однако это факт имеет еще большее значение в свете использования метасимволов в режиме «регулярные выражения», так как именно опережающий анализ является ключевым при работе с ними.

Справедливости ради следует отметить, что выражение «в звене рота-батальон-полк» и т.д. является распространенным в военном дискурсе, что объясняет стратегию работы группы 1. Профессионалы сразу выдали два вероятных варианта, а именно -- level и echelon. Еще одно предположение было сделано одним из информантов по аналогии с ещё одним распространённым выражением, используемым при описании ТТХ вооружения, «цели типа “танк”, “вертолёт”» и т.д. (tank- and helicopter-size targets).

Ещё до начала работы с корпусом переводчики предположили, что будут сортировать по левому окружению, предшествующему слову в строке запроса, т.к. в английском языке с высокой степенью вероятности будет использоваться препозиция. Будучи опытными специалистами, информанты группы 1 не останавливались на первом же совпадении и проверили в корпусе каждое из своих предположений. Пришли к выводу, что все три слова подходят для перевода фрагмента, но слово size употребляется чаще остальных, причем в конкордансе было два варианта -- собственно size и sized.

Результаты сравнения двух стратегий и оправдали наши ожидания и удивили. Как мы и предполагали, опытные переводчики более тщательно и основательно подходят к формированию запроса, их работа с корпусом основывается на проверке предположений, а не поиске. Как ни странно, времени на обработку результатов в корпусе ушло больше у опытных переводчиков, ведь они прове-ряли все свои предположения. Группа начинающих специалистов, напротив, потратила меньше времени, но и нашла непопулярный вариант. Между тем последние находились в более выигрышном положении с точки зрения охвата запроса. Ниже в конкордансе для слова company (рота) появилось size (начиная с совпадения 514). Однако echelon в непосредственном окружении слова company отсутствовал. Проанализировав этот результат, мы пришли к выводу, что интересующее слово могло появиться через несколько слов. Например, при перечислении нескольких звеньев управления “at the company and battalion echelons” указание на звено появляется только через союз (and) и слово (battalion). Поэтому и стратегия поиска профессиональных переводчиков является более выгодной с точки зрения точности и результативности.

Таким образом, главным недостатком подхода группы 1 является временной показатель, который вполне устраним, если составить один запрос (см. табл. 3), отвечающий всем предложенным параметрам [Friedl, 1998; Kuebler and Zinsmeister, 2014: 210]:

Таблица 3 Формирование поискового запроса с помощью метасимволов (запрос -- ^^]+( |-)(size|echelon|level), количество совпадений -- 907)

Параметр

Метасимволы

Примечание

1.

Постпозиция

[a-z] +

Любой набор букв без пробелов, т.е. слово

2.

Написание, раздельное или через дефис

( |-)

Выбор из нескольких вариантов

3

Выбор из синонимичного ряда

(sizejechelonjlevel)

Выбор из нескольких вариантов

После проверки этого запроса программа выдала 907 совпадений (сравните с объёмом конкорданса для одного слова company, 814 совпадений). В отсортированном списке все три варианта перевода сгруппировались в диапазоне порядковых номеров от 168 до 209 (см. табл. 4). Теперь с точки зрения затраченного времени стратегия опытных переводчиков значительно превзошла подход начинающих специалистов.

Однако есть ещё один способ сделать запрос точнее без создания значительных ограничений для поискового алгоритма программы, а именно -- использовать названия конкретных уровней подразделений и частей вкупе с метасимволами выбора «(слово|слово)». Доработанный запрос выглядит следующим образом: (battalion| company|platoon|regiment)( |-(size|echelon|level) (см. табл. 5).

Конкорданс 3, составленный для слов size, echelon и level с использованием метасимволов (запрос -- [a-z]+( |-) (sizejechelonjlevel), количество совпадений -- 907)

№ п/п

Совпадения

1

<.. .> HQ normally assigns the lower echelon a forward boundary based on

2

<.. .> of the reserve and, at division echelon and above, engages enemy

34

While the echelon commander has the authority to

<...>

457

Also, at the tactical level, air- borne and air assault ops.

462

<.. .> to execute at a battalion or squad level also.

<...>

847

The CO designates company-size BPs parallel to the axis of <.>

848

The raiding force may vary in size from a platoon to a squad <.>

Таблица 5 Конкорданс 4, составленный для слов size, echelon и level с использованием доработанного запроса на основе метасимволов (запрос -- (battalion|company|platoon|regiment)( |-) (sizejechelonjlevel), количество совпадений -- 95)

№ п/п

Совпадения

2

<...> units at the brigade and battalion echelons unless task organization occurs

<...>

4

<...> It is used primarily at battalion level and below.

5

Prompt execution of battle drills at platoon level and below, <...>

<...>

75

Prepackaging company- and battalion-size resupply sets can ease the execution <...>

84

A battery is a company-size unit in a field artillery <...>

<...>

95

<...> identified in each battalion-sized unit prior to planned ops.

Прежде чем мы перейдем к практической проверке, следует отметить, что именно эти слова группа профессиональных переводчиков изначально и ожидала увидеть перед проверяемыми size, echelon, level. Поэтому наш шаг не нарушает чистоту эксперимента. Результат проверки более чем оправдал наши ожидания. Все 95 совпадений в конкордансе оказались релевантными:

В процессе доведения запроса группы 1 до совершенства нас посетила мысль о том, что и группа 2 могла бы воспользоваться метасимволом выбора из нескольких вариантов -- (company| battalion|regiment|platoon). Однако в этом случае использование «регулярных выражений» не столько улучшило качество выборки, сколько просто её увеличило. Конкорданс содержит 3 785 совпадений. Использование метасимволов привело к тому, что запрос стал слишком общим. Даже сортировка не помогла сократить время обработки результатов.

Заключение

Нам представляется, что для целей данной работы мы собрали достаточное количество материала и сведений, чтобы ответить на главный вопрос о возможности использования функции «регулярные выражения» программы-конкордансера AntConc как средства реализации поиска путей преодоления переводческих трудностей на основе грамматических моделей. В результате теоретической проработки основных положений и их практической проверки мы пришли к ряду выводов. Во-первых, функция «регулярные выражения» подтвердила свою эффективность. При грамотном использовании этого ресурса переводчики действительно добились сокращения времени на поиск и обработку лингвистической информации, а также увеличения эффективности её извлечения из корпуса текстов. В связи с этим считаем целесообразным продолжить разработку этого вопроса. В качестве дальнейших шагов следует (1) изучить метасимволы и их функциональные возможности и (2) адаптировать их использование под нужды переводчиков.

Во-вторых, запрос для поиска или проверки лингвистической информации в корпусе преимущественно строится вокруг лексической единицы. В связи с этим использовать исключительно грамматические конструкции в качестве основы для составления запроса не представляется возможным в рамках работы именно переводчика. В-третьих, эффективность данной функции напрямую зависит от сложности поискового запроса. Её основное преимущество заключается в том, что метасимволы обеспечивают необходимую гибкость при работе с конкордансерами. Однако есть и обратная сторона меда-ли. Если запрос используется не для проверки предположения, а для поиска, например, слова или фразы, то применение функции «регулярные выражения» лишь усложняет задачу. Это объясняется тем, что запрос, составленный на основе ограниченных исходных лингвистических данных, сам по себе слишком общий, а использование метасимволов лишает его всякой конкретики. В результате программа находит чрезмерное количество совпадений, для обработки которых требуется определённое время. Если же программа в руках опытного переводчика, задавшегося целью проверить своё предположение, то функция «регулярные выражения», напротив, поможет оптимизировать работу.

Список литературы

1. Владимов Н.В. Новый подход к решению некоторых переводческих проблем // Языковое сознание: устоявшееся и спорное: Материалы 14-го международного симпозиума по психолингвистике и теории коммуникации. М: РОСНОУ 2003.

2. Владимов Н.В. Корпусный межтекстовый подход к решению некоторых переводческих проблем // Сборник научных статей адъюнктов. Ч. 2. М.: ВУ, 2004.

3. Владимов Н.В. Корпусный подход к решению переводческих проблем (на материале переводов с русского языка на английский): дис. ... канд. фил. наук / Н.В. Владимов. М., 2005. 182 с.

4. Герасимова Н.И. Краткий курс лекций по «теории перевода» для бакалавров. Ростов-на-Дону: Ростовский государственный экономический университет (РИНХ), 2010.

5. Груздев Д.Ю. Корпус текстов как инструмент переводчика // Вестник Московского университета. Сер. 22. Теория перевода. № 2, М., 2011.

6. Груздев Д.Ю. Электронный корпус текстов как эффективный инструмент переводчика: Дис. ... канд. филол. наук. М.: ВУ, 2013. 188 с.

7. Груздев Д.Ю. Перевод на родной язык с электронным корпусом текстов // Вестник Московского университета. Сер. 22. Теория перевода. № 1 / Груздев Д.Ю., Груздева Л.К., Аванесова Т.П. М., 2017.

8. Комиссаров В.Н. Теория перевода (лингвистические аспекты). М.: Высшая школа, 1990. 229 с.

9. Комиссаров В.Н. Современное переводоведение. Учебное пособие. 2-е издание, исправленное. М.: Р. Валент., 2011. 409 с.

10. КошкинР.К. Корпуснолингвистический подход к исследованию перевода // Межкультурная коммуникация и перевод. Материалы межвузовской научной конференции. М.: МОСУ, 2005.

11. Латышев Л.К. Курс перевода: эквивалентность перевода и способы её достижения. М.: Учпедиздат, 1986. 217 с.

12. Нелюбин Л.Л. Толковый переводоведческий словарь. 3-е изд., перераб. М.: Флинта: Наука, 2003. 320 с.

13. Нелюбин Л.Л. Введение в технику перевода (когнитивный теоретикопрагматический аспект): учеб. пособие. М.: Флинта: Наука, 2009. 216 с.

14. Противотанковые возможности отечественных БМП

15. Степанов Е.А. Языковая картина мира военной сферы (лингвокультурологический и терминологический аспекты): Дис. ... канд. фил. наук. М.: ВУ 2012. 200 с.

16. Шевчук В.Н. Корпусная лингвистика и перевод // Тезисы докладов международной научно-практической конференции «Проблемы обучения переводу в ВУЗе». Москва, 2003.

17. Шевчук В.Н. Электронные ресурсы переводчика. М.: Либрайт, 2010. 131 с.

18. Шевчук В.Н. Информационные технологии в переводе. Электронные ресурсы переводчика 2. М.: Зебра Е, 2013. 376 с.

19. AnthonyL. (2012). Advancing AntConc: Design and Performance Improvements for Multi-Language. Japan Association for English Corpus Studies (JAECS) Annual Conference.

20. AnthonyL. (2006). Concordancing with AntConc: An Introduction to Tools and Techniques in Corpus Linguistics. Summary of JACET 2006 workshop. JACET Newsletter.

21. Baker P., Hardi, A., McEner, T. (2006) Glossary of Corpus Linguistics. Edinburgh: Edinburgh University Press.

22. Bast H. & Celikik M. (2013) Efficient Fuzzy Search in Large Text Collections. ACM Transactions on Information Systems (TOIS) (2nd ed.). 31 (10), pp. 39-60.

23. Christ O., Schulze B., Hofmann A., Konig, E. (1999) The IMS Corpus Workbench: Corpus Query Processor (CQP). User's Manual. University of Stuttgart Institute for Natural Language Processing.

24. Dickinson, M. (2013) Corpus Linguistics (L615) Regular Expressions. Indiana University.

25. Hunston S. (2002) Corpora in applied linguistics. Cambridge University Press.

26. McEnery T. & Hardie A. (2012) Corpus Linguistics: Method, Theory and Practice. Cambridge: Cambridge University Press.

27. Friedl J. (1998) Mastering Regular Expressions. California: O'Reilly & Associates Press.

28. Kuebler S. & Zinsmeister H. (2015) Corpus Linguistics and Linguistically Annotated Corpora. Bloomsbury Academic.

29. Laviosa S. (2002) Corpus-based Translation Studies. Theory, Finding, Applications. Amsterdam and Atlanta: Rodopi.

30. Van Someren, M., Barnard, Y., Sandberg, J. (1995) The Think Aloud Method. A Practical Guide to Modelling Cognitive Processes. London: Academic Press.

31. Dmitry Yu. Gruzdev, Cand. Sc. (Philology), Assistant Professor at the Department of English,

32. Military University, Moscow, Russia, PhD; e-mail: gru@inbox.ru

References

1. Anthony L. (2012) Advancing AntConc: Design and Performance Improvements for Multi-Language. Japan Association for English Corpus Studies (JAECS) Annual Conference.

2. Anthony L. (2006) Concordancing with AntConc: An Introduction to Tools and Techniques in Corpus Linguistics. Summary of JACET 2006 workshop. JACET Newsletter.

3. Baker P., Hardi, A., McEner, T. (2006) Glossary of Corpus Linguistics. Edinburgh: Edinburgh University Press.

4. Bast H. & Celikik M. (2013) Efficient Fuzzy Search in Large Text Collections. ACM Transactions on Information Systems (TOIS) (2nd ed.). 31 (10), pp. 39-60.

5. Christ O., Schulze B., Hofmann A., Konig, E. (1999) The IMS Corpus Workbench: Corpus Query Processor (CQP). User's Manual. University of Stuttgart Institute for Natural Language Processing.

6. Dickinson, M. (2013) Corpus Linguistics (L615) Regular Expressions. Indiana University.

7. Friedl J. (1998) Mastering Regular Expressions. California: O'Reilly & Associates Press.

8. Gerasimova N.I. Kratky kurs Lektsiy po teorii perevoda (Brief Lectures on Translation Theory). Rostov-on-Don: Rostov State Economic University (RINH) Publ., 2010

9. Gruzdev D.Yu. Korpus tekstov kak instrument perevodchika [Corpora as Interpreters' Tool]. Vestnik Moskovskogo universiteta. Ser. 22. Teoria perevoda. No. 2, 2011 (In Russian).

10. Gruzdev D.Yu. Elektronnyiy korpus tekstov kak effektivnyiy instrument perevodchika [Digital Corpoara as Effective Interpreter's Tool]. Candidate's thesis filol. nauk. D.Yu. Gruzdev. Moscow: VU, 2013. 188 p. (In Russian).

11. Gruzdev D.Yu. et al. Perevod na rodnoy yazyk s elektronnym korpusom tekstov [Translating into Native Language with Corpora]. Vestnik Moskovskogo universiteta. Ser. 22. Teoria perevoda. No. 1, 2011 (In Russian).

12. Hunston S. (2002) Corpora in applied linguistics. Cambridge University Press.

13. Kuebler S. & Zinsmeister H. (2015) Corpus Linguistics and Linguistically Annotated Corpora. Bloomsbury Academic.

14. Komissarov V.N. Teoriya perevoda (lingvisticheskiye aspecty) [Translation Studies (Linguistics Aspects)]. V.N. Komissarov, Moscow: Higher School Publishing House, 1990. 229 p. (In Russian).

15. Komissarov V.N. Sovremennoye perevodovedeniye. Uchebnoye posobiye. 2-e izdaniye, ispravlennoye [Modern Translation Studies: Stud. Manual. 2nd edition, revised]. V.N. Komissarov, Moscow: R. Valent, 2011. 409 p. (In Russian).

16. Koshkin R.K. Korpusnolingvistichesky podkhod k issledovaniyu perevoda [Corpus Approach to Translation Analysis]. Intercultural Communication and Translation. Materials of Interacademic Scientific Conference. Moscow, 2005 (In Russian).

17. Latyshev L.K. Kurs perevoda: ekvivalentnost' perevoda i sposoby yeyo dostizheniya [Translation Course: Equivalence in Translation and Ways of Achieving It], L.K. Latyshev. Moscow: Uchpedizdat. 217 p. (In Russian).

18. Laviosa S. (2002) Corpus-based Translation Studies. Theory, Finding, Applications. Amsterdam and Atlanta: Rodopi.

19. McEnery T. & Hardie A. (2012) Corpus Linguistics: Method, Theory and Practice. Cambridge: Cambridge University Press.

20. Nelubin L.L. Tolkovy perevodchesky slovar. Izdaniye 3, pererabotannoye [Explanatory Dictionary for Interpreters. 3rd edition, revised]. L.L. Nelubin. Moscow: Flinta: Nauka, 2003. 320 p. (In Russian).

21. Nelubin L.L. Vvedeniye v tekhniku perevoda (kognitivny teoretiko-prag- matichesky aspekt): uchebnoye posobiye [Introduction into Translation Technique (Cognitive Theory and Pragmatic Aspect): Training Guide]. L.L. Nelubin. Moscow: Flinta, 2009. 216 p. (In Russian).

22. Protivotankovie vozmozhnosti otechestvennikh BMP [AT Capabilities of Modern IFVs].

23. Stepanov Ye.A. Yazykovay kartina mira voennoy sfery (lingvokultoro- logichesky i terminologichesky aspekty) [Language Worldview in the Military (Linguacultural and Terminological Aspects)]. Candidate's thesis filol. nauk.

24. Yu. Gruzdev. Moscow: VU, 2012. 200 p. (In Russian).

25. Shevchuk V.N. Korpusnaya lingvistika i perevod [Corpus Linguistics and Translation]. Lecture Notes of the International Research Conference `Issues in Teaching Translation at Higher Education Establishments. Moscow, 2003 (In Russian).

26. Shevchuk V.N. Elektronniye resursy perevodchika [Interpreter's E-Tools]. V.N. Shevchuk. Moscow: Librite, 2010. 131 p. (In Russian).

27. Shevchuk V.N. (2013) Informatsionnii tekhnologii v perevode [Information Technologies in Translation. Interpreter's E-Tools 2]. V.N. Shevchuk. Moscow: Zebra E, 2013. 376 p. (In Russian).

28. Vladimov N.V. Noviy podkhod k resheniyu nekotorikh perevodcheskikh problem [New Approach to Addressing Some Translation Issues]. Language Conscience: Established and Controversial: Materials of the 14th International Symposium on Psycholinguistics and Communication Theory, Moscow: RosNOU, 2003 (In Russian).

29. Vladimov N. V. Korpusny mezhtekstovy podkhod k resheniyu nekotorykh perevodcheskikh problem [Corpus Intertext Approach to Solving Some Issues in Translation]. Collection of Research Papers of PhD Students. Part 2, Moscow: VU, 2004 (In Russian).

30. Vladimov N.V. (2005) Korpusnyiy podhod k resheniyu perevodcheskih problem [Corpora as Means of Addressing Translation Issues]. Candidate's thesis filol. nauk. N.V. Vladimov. Moscow: VU, 2013, 182 p. (In Russian).

31. Van Someren M., Barnard Y., Sandberg J. (1995) The Think Aloud Method. A Practical Guide to Modelling Cognitive Processes. London: Academic Press.

Размещено на Allbest.ru

...

Подобные документы

  • Исследование экспрессивной составляющей дискурса публицистических текстов, детерминация технологий преодоления переводческих трудностей в части устойчивых фразеологических единиц (фразеологизмов и идиоматических выражений) в текстах англоязычной прессы.

    дипломная работа [108,8 K], добавлен 15.06.2012

  • Анализ оригинальных текстов на английском языке, выявление трудностей их перевода. Описание переводческих приемов, с помощью которых был переведен текст. Обзор лексико-грамматических трансформаций: грамматической замены, транслитерации, перестановки.

    реферат [32,0 K], добавлен 04.04.2014

  • Трудности перевода поэтических текстов, понятие переводческой трансформации. Применение переводческих трансформаций при переводе с русского языка на японский на примере песни "Катюша". Трансформации по классификации В.Н. Комиссарова и А.Д. Швейцера.

    курсовая работа [42,9 K], добавлен 10.11.2012

  • Введение основных понятий корпусной лингвистики. Понятие учебного корпуса и лингвистической разметки. Обзор разработок мультимодальных корпусов и изучение их структуры. Создание русско-немецкого подкорпуса. Разметка текстов и аннотирование данных.

    курсовая работа [2,0 M], добавлен 20.06.2014

  • Галлицизмы (от лат. gallicus - галльский) - слова и выражения, заимствованные из французского языка или образованные по модели французских слов и выражений. История проникновения галлицизмов в русский язык, их особенности в современном использовании.

    доклад [20,7 K], добавлен 28.07.2008

  • Особенности обучения русскому как иностранному. Способы преодоления грамматических трудностей с помощью художественных текстов. Комплекс упражнений, ориентированный на совершенствование грамматических навыков на материале художественных текстов.

    дипломная работа [66,4 K], добавлен 13.04.2016

  • Понятие исходного и переводящего языка, их свойства и особенности реализации перевода. Привила оформления переводческих занятий, оценка прагматического потенциала, эквивалентности и адекватности. Классификация и типы переводов, их функции и особенности.

    презентация [277,5 K], добавлен 22.12.2013

  • Структурно-содержательные особенности медийных текстов. Характеристика современного медиадискурса. Анализ синтагматических и лингвостилистических особенностей корпуса текстов группы передовых редакторских статей в качественной и популярной прессе.

    дипломная работа [76,6 K], добавлен 29.03.2016

  • Рассмотрение понятия "профессиональная и языковая компетенция переводчика". Особенности организации обучения переводу и его виды. Изучение специальных упражнений, идентификация и обсуждение переводческих трудностей, манипуляции с текстами оригинала.

    реферат [67,0 K], добавлен 06.05.2013

  • Характеристика общественно-политических текстов. Сущность безэквивалентной лексики. Распространение фразеологизмов. Лексические трансформации, анализ переводческих решений, используемых при переводе лексических единиц с корейского языка на русский.

    курсовая работа [43,9 K], добавлен 26.03.2019

  • Определение сопричастности и наиболее регулярные средства ее выражения в современном русском языке. Функционирование сопричастности в древнерусских текстах. Сопричастность как семантическая категория. Языковые средства выражения сопричастности.

    курсовая работа [29,7 K], добавлен 12.04.2013

  • Характерные особенности рекламных слоганов, их функции и механизм воздействия. Сопоставительный анализ оригиналов и переводов туристических слоганов. Использования переводческих трансформации в русскоязычных эквивалентах английских рекламных слоганов.

    курсовая работа [59,6 K], добавлен 24.05.2014

  • Рассмотрение и анализ популярных в Интернете он-лайн переводчиков, сравнение их возможностей и функций. Технологии, на которых работают он-лайн транслейторы. Сравнительная характеристика перевода английских шуточных текстов с помощью он-лайн словарей.

    курсовая работа [452,6 K], добавлен 06.06.2012

  • Идиоматические выражения в разных языках мира. Лексический состав итальянского языка. Классификация идиоматических выражений: Черданцевой, Потебня, Юриной (с использованием кулинарных образов). Высказывания, описывающие повседневную жизнь человека.

    курсовая работа [64,7 K], добавлен 15.02.2015

  • Категория модальности, роль в предложении. Анализ текстов различных стилей на наличие в них средств выражения предположения и установления их разнообразия. Методика установления соотношения средств выражения предположения в текстах различных стилей.

    курсовая работа [48,7 K], добавлен 21.11.2010

  • Определение и составляющие креолизованного текста. История французского комикса. Комикс как креолизованный текст. Сравнительно-сопоставительный анализ лингвистической организации вербальных составляющих текстов французских комиксов разной степени.

    курсовая работа [6,6 M], добавлен 28.09.2014

  • Качественные и структурные особенности терминов. Выявление характерных черт функционирования терминов и путей их перевода на материале текстов по менеджменту. Определение трудностей при переводе терминов в рамках контекста, отбор их русских эквивалентов.

    дипломная работа [273,4 K], добавлен 09.10.2013

  • Становление лингвистической географии. История возникновения лингвогеографии в Европе. Основные понятия этой науки. Развитие лингвистической географии в России. Картографирование языковых явлений. Диалектное членение русского языка. Ареальная лингвистика.

    курсовая работа [74,8 K], добавлен 07.01.2009

  • Внутренние факторы развития лингвистической науки как предпосылки становления младограмматизма. Развитие младограмматического направления, его основные черты. История Московской лингвистической школы. Шахматов как один из ведущих представителей МЛШ.

    реферат [19,0 K], добавлен 21.06.2010

  • Определение перифразы в современной лингвистике. Семантические признаки в основе перифрастических выражений. Особенности функционирования перифразы в тексте. Главные особенности интродуктивной, экспрессивной, оценочной и рекламно-вербующей функции.

    дипломная работа [97,1 K], добавлен 15.06.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.