"Просодия 1.0" - компьютерная программа анализа фразовой просодии

Модернизация аудиторского анализа фразовой просодии посредством применения компьютеров. Исследование гендерного фактора в просодическом оформлении речи коммуникантов. Современные методы обучения теоретической и практической фонетике английского языка.

Рубрика Иностранные языки и языкознание
Вид статья
Язык русский
Дата добавления 20.01.2019
Размер файла 19,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://allbest.ru

2

Нижегородский государственный лингвистический университет

Кафедра английского языка и американистики

УДК 811.111'34:811.111'276.3 (06)

«Просодия 1.0» - компьютерная программа анализа фразовой просодии

Андрей Сергеевич Банков

С развитием и широким распространением компьютерных технологий доступ к инструментальным методам анализа фонетики значительно упростился. Однако при всех безусловных достоинствах компьютеризации фонетических исследований наблюдаются и недостатки. Один из них заключается в том, что вместе с усовершенствованием приемов и технических возможностей акустического анализа методика и процедуры аудиторского анализа остались на уровне середины прошлого столетия: обработка данных зачастую ведется вручную, на бумаге, что приводит к возникновению ошибок и неточностей, а также отнимает много времени.

Исследователи перестали придавать аудиторскому анализу должное значение, считая его очень трудоемкой и вместе с тем малоэффективной процедурой. Нами была предпринята попытка восполнить пробел, образовавшийся в области компьютеризации аудиторского анализа речи, в частности фразовой просодии, для чего была создана оригинальная компьютерная программа аудиторского анализа «Просодия 1.0».

Разработка и апробация проекта проходили в рамках исследования гендерного фактора в просодическом оформлении речи коммуникантов (на материале американского варианта английского языка). Цель программы заключается в модернизации аудиторского анализа фразовой просодии посредством применения компьютеров.

Программа позволяет значительно сократить время, затрачиваемое на процедуру анализа, и, одновременно с этим, увеличить точность измерений и оценок. Применяя данную программу, исследователь может анализировать фонограммы любой продолжительности в неограниченном количестве.

Также допускается участие неограниченного числа аудиторов при анализе одного отрезка речи, что позволяет сверять оценки разных аудиторов, и шире применять полученные данные как в процессе научных исследований, так и при обучении теоретической и практической фонетике.

Программа построена на идеологии человеко-машинной системы, где в качестве активного субъекта, влияющего на конечный результат, рассматривается взаимодействующая пара человека и машины, а не человек или машина по отдельности.

В связи с этим был разработан руководствующий принцип такого взаимодействия: программа должна максимально облегчить задачу аудитора по присвоению оценок, предоставляя ему широкие возможности самопроверки и исправления неточностей. Отсюда вытекают следующие положения: во-первых, любые операции, которые компьютер может выполнить без участия человека, должны быть автоматизированы. Во-вторых, если аудитору необходимо присвоить какую-либо оценку или провести измерение, программа должна максимально сконцентрировать его внимание на нужном аспекте.

Это достигается за счет применения различных интерфейсов, по-разному представляющих данные и ограничивающих свободу действий оператора при выполнении определенного задания. И, наконец, в-третьих, любые возможные подсказки, которые могут повлиять на оценку аудитора, должны быть исключены, т.к. аудитор может положиться на подсказку допустить ошибку.

Руководствуясь этими положениями, а также требованиями к эргономике интерфейсов и представлениями о том, какие супрасегментные характеристики речи оцениваются аудитором при анализе просодии фразы, была разработана восьмимодульная архитектура программы «Просодия 1.0». Модули (разделы) работают последовательно в следующем порядке: настроечные параметры, разбиение текста на слоги, паузация, оценка фраз и синтагм, ударение, мелодика, тембр, аналитический модуль.

Первые семь модулей имеют собственные интерфейсы и являются диалоговыми подпрограммами, представляющими пользователю различные сервисы. Восьмой модуль собственного интерфейса не имеет и работает автоматически. Это обусловлено тем, что, во-первых, модуль является расчетным и участие человека в нем не требуется. Во-вторых, к тому времени, когда начинает работать последний модуль, программа уже имеет все необходимые данные, чтобы производить расчеты автоматически, экономя время исследователя. В-третьих, при условии наличия правильных алгоритмов возможность возникновения случайных ошибок в расчетах исключена.

В программе устная речь рассматривается как одномерно упорядоченная по временной оси последовательность событий. Поэтому для визуализации временной характеристики речи была выбрана симметричная осциллограмма, на которой в нижней части зеркально отражена верхняя полуволна амплитудной огибающей частотного наполнения речи. Разумеется, можно было бы отобразить всю звуковую волну, однако этот показатель весьма информативен для профессиональных аудиторов и его собственная динамика может дать нежелательные подсказки. Точность дискретизации звучания составляет 50 Гц.

Второй способ формализации устной речи традиционен - это письменный текст. Однако его форма отличается от обычной: во-первых, в тексте используются только прописные буквы, во-вторых, не используются знаки препинания, в-третьих, текст рассматривается как линейно упорядоченная последовательность символов, где их главной характеристикой являются их порядковые номера. Таким образом, сочетание двух видов формализации речи эффективно отражает просодические события и допускает практически любые манипуляции программными средствами, что очень важно. английский фонетика язык просодия

Все исследовательские интерфейсы программы имеют схожую архитектуру, что облегчает работу пользователя при переходе от одного этапа к другому. Интерфейсы программы состоят из трех основных частей:

1) проигрывателя с осциллографической визуализацией фонограммы, расположенного в верхней части экрана;

2) первой рабочей зоны, расположенной в середине экрана и занимающей его бульшую часть; здесь в зависимости от запущенного модуля появляются либо «рабочая матрица символов» (т.е. поле для разметки текста), либо различные таблицы;

3) второй рабочей зоны, занимающей нижнюю часть экрана, куда выводятся различные опции и варианты оценок, необходимые для работы.

Первым этапом собственно исследования является разбиение текста на слоги. Созданная на данном этапе разметка используется в дальнейшем на этапах «Ударение» и «Мелодика». Аудитор может пользоваться любой теорией слога и любым принципом слогоделения, т.к. техническая задача данного этапа состоит в том, чтобы присвоить интервалу символов оценку «слог»/«не слог». Задача компьютера на данном этапе сводится к тому, чтобы максимально облегчить работу аудитора, показывая результаты разметки. При этом красным цветом подсвечиваются места потенциальных ошибок. После регистрации результатов слоговой разметки ее дальнейшее редактирование крайне нежелательно, поэтому на данном этапе при работе с программой аудитор должен проявить максимальную внимательность и точность. Аудиторам рекомендуется прибегать к помощи словарей, содержащих транскрипцию и произносительные нормы, однако важно помнить, что слоги размечаются согласно тому, как их произносит диктор, а не тому, как написано в книге, т.е. явления ассимиляции, аккомодации и элизии должны обязательно учитываться.

Следующий этап - это опыт «Паузация», который является первым этапом, где происходит «привязка» текста к фонограмме с осциллограммой. Операционально опыт выглядит следующим образом: определив паузу, аудитор должен поставить курсор в то место на осциллограмме, где эта пауза начинается, нажать левую кнопку «мыши» и, удерживая кнопку, «растянуть» курсор до того места, где пауза заканчивается. После выделения паузы на осциллограмме аудитор указывает ее местоположение в тексте. Теперь остается только присвоить паузе качественные характеристики: ее субстанциональный тип и функцию. По нажатии кнопки «Регистрация» вся информация о данной паузе сохраняется. После окончания «Паузации» программа между соответствующими паузами автоматически выделяет фразы и синтагмы, которые записываются в две реляционно связанные таблицы.

Туда же записываются и их временные координаты. Вся дальнейшая работа программы построена на результатах опыта «Паузация», поэтому при его регистрации все данные сохраняются и блокируются с целью предотвращения их дальнейшего изменения.

Следующий этап - «Фразы и синтагмы», где речевые отрезки подаются последовательно: сначала все фразы (в порядке их следования в высказывании), затем, каждая фраза предъявляется посинтагменно. Задача аудитора - оценить их с точки зрения коммуникативной функции и экспрессивной нагрузки. По завершении этого этапа данные сохраняются, после чего аудитор может приступить к следующему опыту - «Ударения». Название опыта дано во множественном числе, т.к. здесь аудитору предстоит не только локализовать ударные слоги, но и определить типы ударения. Текст и фонограмма предъявляются пофразово.

В первой рабочей зоне каждая фраза предъявляется с послоговой разметкой слов (данные поступают из этапа «Разметка слогов»). Аудитор прослушивает фонограмму предъявляемой фразы, находит ударные слоги и, размечает их, как на осциллограмме, так и в тексте. Масштаб осциллограммы для данного этапа увеличен, чтобы на экране показывался отрезок фонограммы длиною две секунды, что позволяет аудитору без затруднений увидеть момент, соответствующий границе интересующего его слога.

Следующим этапом является опыт «Мелодика». Здесь используется еще один способ визуализации свойств фонограммы: контурно-уровневое представление фразовой мелодики, состоящее из так называемой «нотной линейки» с нанесенными на нее точками различной величины и расцветки, символизирующими ударные и безударные слоги. «Нотная линейка» представляет собой двухмерную сетку координат, где по оси Х отмечается порядковая позиция слога, а по оси Y его тональный уровень. Таких уровней шесть, нумерация снизу вверх. Под «линейкой» в виде крупного текста даны слоги, соответствующие точкам. Изначально все точки располагаются на четвертом тональном уровне. Это свидетельствует о том, что аудитор может приступить к оценке мелодики данной фразы. Такое расположение слогов именно на четвертом уровне продиктовано соображениями эргономики. Аудитор, прослушивая фонограмму, расставляет точки по тональным уровням.

Модуль «Тембр» является последним интерфейсным модулем. Пользователю последовательно в случайном порядке предъявляется 21 пара различных противопоставленных друг другу тембров и семибальная шкала оценки от одного члена пары до другого. Двигая курсор по шкале и фиксируя нужное значение нажатием клавиши «пробел» или «Enter», аудитор оценивает качества голоса диктора.

После обработки данных программа представляет результаты анализа многих параметров в виде электронных таблиц, что обусловлено требованиями совместимости и «читаемости» полученных данных другими программными средствами (базами данных, электронными таблицами, языками программирования, операционными системами). Благодаря этой особенности появляется возможность автоматизировать процесс качественной и математической обработки результатов, которая может быть произведена средствами любой современной электронной базы данных или электронной таблицы.

Аннотация

УДК 811.111'34:811.111'276.3 (06)

«Просодия 1.0» - компьютерная программа анализа фразовой просодии. Андрей Сергеевич Банков, Кафедра английского языка и американистики, Нижегородский государственный лингвистический университет bankov-andrew@yandex.ru

В данной статье автор описывает разработанный им новый способ анализа фразовой просодии с помощью современных технологий - компьютерную программу «Просодия 1.0», позволяющую значительно упростить процесс исследования фразовой просодии.

Ключевые слова и фразы: фонетика; фразовая просодия; компьютерная программа; аудиторский анализ.

Annotation

«Prosody 1.0» - computer programme of phrase prosody analysis. Andrey Sergeevich Bankov, Department of English Language and Americanistics. Nizhniy Novgorod State Linguistic University bankov-andrew@yandex.ru

In this article the author describes his newly developed method of phrase prosody analysis with the help of modern technologies - computer programme «Prosody 1.0» which allows simplifying the process of phrase prosody research.

Key words and phrases: Phonetics; phrase prosody; computer programme; audit analysis.

Размещено на Allbest.ru

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.