Темпоральная организация устнопорождаемого монологического высказывания: соотношение длительности фонации и паузы

Исследование процентного соотношения длительности фонации и пауз в устнопорождаемом высказывании на материале русского, английского и французского. Устойчивое распределение речевых сегментов как отражение действия механизма компенсаторики и подстройки.

Рубрика Иностранные языки и языкознание
Вид статья
Язык русский
Дата добавления 08.05.2018
Размер файла 63,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Темпоральная организация устнопорождаемого монологического высказывания: соотношение длительности фонации и паузы

Статья является продолжением исследования, посвященного выявлению закономерностей развертывания устного монологического высказывания. Одной из фундаментальных характеристик монологического высказывания является его темпоральная организация, традиционно рассматриваемая в лингвистике как результат взаимодействия артикуляторных жестов, участвующих в создании сложной моторной программы [1, С. 9-20], [2], [3, С. 640-647]. В рамках этой тематики активно ведутся исследования по обнаружению закономерностей распределения длительности гласных и согласных [4, С. 1102-1104], [5, С. 411-426], заполненных и незаполненных пауз [6, С. 469-486], [7], синтагм [8, С. 53-56] и др. речевых сегментов. Изучение темпоральных параметров является актуальным при разработке и развитии систем автоматического распознавания речи, создании компьютерных алгоритмов, квантитативных и статистических моделей [9], [10, С. 9-12], [11, С. 265-292].

Исследования на материале озвученной письменной речи (чтение) показывают, что среди факторов, оказывающих влияние на длительность речевых сегментов, можно выделить позицию сегмента в речевом континууме, его акцентно-ритмический контур, темп произнесения (изохрония), интонационное оформление и коммуникативную значимость [12], [13]. В отличие от читаемого текста в устнопорождаемой речи в силу ее специфики (синтаксической неплавности, вариативности интонационного оформления, наличия самоисправлений, ошибок и т.п.) выделение темпоральных констант оказывается более сложной задачей. Однако наблюдения за развертыванием устнопорождаемого высказывания показывают, что именно темпоральная структура является одним из важнейших условий организации его акустических параметров.

Ранее проведенное нами исследование фонационных отрезков и пауз на материале французского, русского и английского языков в устнопорождаемом монологическом высказывании показало, что распределение их длительности может быть описано логнормальной моделью и обусловлено не столько коммуникативной направленностью высказывания (одинаковое распределение отрезков по длительности обнаружено для высказываний трех типов коммуникативных ситуаций - беседы, интервью на родном языке, устного ответа на экзамене по иностранному языку), сколько действием некой временной программы, организующей отрезки по длительности внутри отдельно взятого высказывания. Причем действие этой программы слабо связано с индивидуальными особенностями говорящего или языком, на котором осуществляется порождение, и вероятно задается особенностями когнитивной задачи - продуцированием монологического высказывания [14, С. 46-49].

Целью исследования, описанного в данной статье, является углубление представлений о работе временного механизма и его роли в акустической организации спонтанного монологического высказывания. Задача исследования - изучение соотношения времени фонации к времени паузации и теоретическое осмысление этой пропорции в свете полученной нами на предыдущем этапе логнормальной модели.

Исследование выполнено на корпусе устных текстов, записанных в трех ситуациях речевого общения: 1) интервью, 2) свободной беседы, 3) устного ответа на экзамене по иностранному языку. Всего в качестве материала было отобрано 100 спонтанных монологических продукций (в соответствии с общепринятыми требованиями к размеру выборки для статистического анализа) длительностью около 4-х мин. каждое; общая длительность звучания корпуса составляет 6.5 ч. Таким образом, исходя из целей анализа, отобранный материал был разделен на 3 группы, каждая из которых соответствует рассматриваемой коммуникативной ситуации:

1. Ответы в ходе интревью

1.1. 15 устных ответов носителей французского языка в ходе видео-интервью различной тематики (спорт, кино, компьютерные игры, литература), записанные на французском телевидении. Возраст интервьюируемых от 25 до 60 лет.

1.2. 15 устных ответов на русском языке (тематика интервью - музыка, литература), записанного на российском телевидении. Возраст интервьюируемых от 28 до 54 лет.

Особенностью данной группы является тот факт, что респондентам заранее известна тема интервью, однако полностью они не готовят ответы на вопросы и отвечают без письменной опоры.

2. Ответы в ходе свободной беседы

15 устных ответов на русском языке в ходе свободной беседы на спонтанно поставленный экспериментатором вопрос. Возраст испытуемых от 30 до 50 лет. Единственное условие поставленное испытуемым - говорить не менее 4-х минут. Отличие данной группы от групп1 и 3 в том, что говорящему заранее неизвестна тема беседы, фактически полностью отсутствует этап подготовки и продумывания высказывания.

3. Ответы русскоговорящих испытуемых на устных экзаменах и конкурсах по иностранному языку

3.1. 15 устных ответов конкурсантов на французском языке, записанных во время проведения устного конкурса Всероссийской олимпиады школьников по французскому языку. Уровень владения языком испытуемых данной группы В1, возраст от 15 до 17 лет.

3.2. 15 устных ответов студентов 3-го курса факультета иностранных языков и регионоведения МГУ имени М.В. Ломоносова, изучающих французский как второй иностранный. Ответы записаны в ходе семестрового экзамена по французскому языку. Уровень владения B1, возраст от 19 до 20 лет.

3.3. 15 устных ответов на английском языке взрослых носителей русского языка. Уровень владения С2, возраст от 30 до 50 лет. Ответы записаны в ходе постановочного эксперимента, имитирующего ситуацию экзамена. Испытуемым было предложено такое же задание, как и подгруппе 3.1.

3.4. Для дополнительной верификации записаны 10 устных ответов русскоговорящих на родном языке. Испытуемым было предложено олимпиадное задание, как и в подгруппах 3.1 и 3.3. Возраст испытуемых от 30 до 50 лет.

Необходимо отметить, что задание для всех подгрупп 3-й группы было схожим. Конкурсантам и экзаменуемым нужно было за 20 минут подготовить монологическое высказывание на заданную тему (всего 6 разных тем), соответствующее критериям связности и логичности построения. Во время подготовки им разрешалось делать записи и продумывать план высказывания. Однако, во время ответа записями конкурсанты не пользовались.

Для подсчета общего времени пауз и фонации в каждой из анализируемых речевых продукций корпуса была выполнена акустическая сегментация речевого сигнала на фонационные отрезки и паузы с помощью программы «PRAAT». За критерий сегментации принималась длительность паузы, которую мы определяем как полный перерыв фонации длительностью 200 мсек и более [16, С. 215-220]. Необходимо отметить, что так называемые в лингвистике «заполненные, нетемпоральные» паузы рассматриваются нами как фонация. Представляется, что такой подход является наиболее перспективным, поскольку он исключает множественность интерпретаций перцептивно-слухового анализа, позволяя максимально формализовать выделение анализируемых единиц и рассматривать фонацию как единое целое, строящееся с учетом всех составляющих ее элементов (хезитации, речевые сбои и т.п.).

Далее с помощью программы «Minitab» осуществлялся количественный анализ с целью устанавления пропорции фонации и пауз в каждой речевой продукции трех изучаемых групп. В начале была посчитана общая продолжительность акустических пауз путем суммирования временной длительности полученных в ходе сегментации отрезков. Подобным образом расчитывалось и общее время фонации. Затем абсолютные значения в миллисекундах были переведены в проценты по отношению к общей продолжительности высказывания. Таким образом, была получена пропорция общей длительности пауз и фонации в высказываниях каждой группы.

После чего в этой же программе проводился сравнительный статистический анализ речевых продукций трех изучаемых групп. Для наглядной репрезентации данных были построены диаграммы размаха. Эти диаграммы позволяют оценить разброс данных и центральную тенденцию распределения, что важно при первичной оценке единиц корпуса большого объема. С помощью данного типа анализа можно расчитать медиану выборки, дисперсию данных, а также выявить крайние значения (выбросы).

Построение выполнялось программой автоматически по так называемому «квартильному» методу, который заключается в том, что совокупность выборки делится на четыре равные части - «квартили» (отображаемые на графике в виде прямоугольника или «ящика»). В первый или нижний квартиль (Q1) попадают значения равные или не превышающие 25% от общего количества совокупности (25-й процентиль), во второй Q2 (медиану) - значения выборки, количество которых составляет от 25% до 50%, третий (Q3) - от 50% до 75%. Четвертый квартиль называемый «интерквартильным размахом» (IQRange) и представляет собой разность между 3-м и 1-м квартилями (Q3-Q1). Наряду с этим важность имеют и края выборки, поскольку разброс изучаемых величин является важным показателем робастности полученной дисперсии.

С помощью описанного выше метода были построены групповые диаграммы размаха, отражающие долю фонации и долю общей длительности пауз в монологических высказывания трех анализируемых нами групп.

Рис. 1. Доля фонации от общей длительности монологического высказывания в ситуации интервью

Рис. 2. Доля фонации от общей длительности монологического высказывания в ситуации свободной беседы

Рис. 3. Доля фонации от общей длительности монологического высказывания в ситуации устного ответа на экзамене по иностранному языку

фонация пауза устнопорождаемый высказывание

Сводная таблица данных «Доля фонации в высказываниях трех групп корпуса»

Сравн. признак

1 группа (интервью)

2 группа (свободная беседа)

3 группа (устный ответ на экзамене)

1-ый квартиль Q1

79

77

81

Медиана Q2

81

79

82

3-й квартиль Q3

83

81

86

Интерквартильный размах

4

3

5

Min, max значение выборки

77 - 86

76 - 82

78 - 88

Кол-во выбросов

0

0

0

Как видно из приведенных графиков и таблицы, соотношение общего времени фонации и пауз в изучаемом корпусе устных речевых продукций составляет приблизительно 80% к 20%. Наибольшая дисперсия значений (интерквартильный размах) обнаружена для высказываний 3-й группы, т.е. высказываний, порождаемых в ситуации экзамена на иностранном языке, что, вероятно, объясняется повышенной сложностью когнитивной задачи для говорящих, а также, очевидно, связана с разной степенью владения иностранном языком (уровни B1-C2). Для проверки данной гипотезы необходим качественный анализ высказываний 3-ей группы. Однако, важно отметить, что данные внутригрупповые отличия незначительны (отклонение от медианы составляет всего 2-3%) и, следовательно, не нарушают общей пропорции фонации и пауз: так же как и в двух других группах это соотношение составляет 80% к 20%, соответственно. Зафиксированная пропорция может быть охарактеризована как устойчивая и слабо зависящая от вариативных параметров (языка, коммуникативной ситуации, экстралингвистических факторов). О робастности наблюдаемого распределения свидетельствует и отсутствие внутригрупповых выбросов.

Полученные результаты согласуются с данными других исследований, проводившихся на материале русского, английского, итальянского и армянского языков, и показавших, что соотношение фонации и пауз в устнопорождаемом монологическом высказывании составляет 70% к 30% [16, С. 21], [17, С. 55]. Небольшое расхождение с нашими данными, по-видимому, объясняется тем, что мы рассматриваем «заполненные паузы» как фонацию. В целом же, результаты настоящего исследования подтверждают, что пропорция 80% к 20% является типичной для монологического устнопорождаемого высказывания.

Устойчивость выявленного соотношения коррелирует с обнаруженной нами на предыдущем этапе логнормальной моделью распределения длительности фонационных отрезков и пауз в тех же трех изучаемых ситуациях речевого общения. Из этого, вероятно, следует тот факт, что темпоральная структура высказывания задается не столько условиями коммуникации в конкретный момент времени или его общей длительностью (устойчивое соотношение проявляется в высказываниях разной длительности), сколько типом когнитивной задачи - продуцированием монологического высказывания, т.е. порождением на «длинную дистанцию». Обнаруженная пропорция слабо связана с тематикой высказывания, языковой наполняемостью и даже темпом речи. Любые неплавности, речевые сбои, характерные для устной речи, компенсируются, «выравниваются» в процессе речепорождения, вследствие чего возникает устойчивое соотношение фонации и пауз в изучаемых высказываниях.

В этой связи можно провести параллель между развертыванием монологического высказывания и работой сложной нелинейной системы, описанной во многих трудах по синергетике и теории систем. Для подстройки различных элементов во времени необходимо, чтобы система по одним направлениям «сжималась», а по другим «растягивалась», т.е. для корректного функционирования системы ее элементы в разный момент времени должны иметь разную временную протяженность, причем степень сжатия в среднем должна обязательно превалировать над степенью расширения [18, С. 66]. Похожие процессы мы наблюдаем и в устнопорождаемом высказывании, в котором темпоральное структурирование осуществляется за счет разной длительности фонационных отрезков и пауз. Несмотря на то, что в любой речевой продукции присутствуют короткие, средние и длинные фонационные отрезки и паузы, в количественном отношении короткие отрезки всегда превалируют над длинными, а распределение всех отрезков высказывания по длительности может быть описано логнормальной моделью. Соотношение общей протяженности фонации и пауз, как было показано в ходе описанного выше эксперимента, устойчиво.

Таким образом, пропорция 80% к 20%, очевидно, есть результат подстройки сложной системы, которой и является процесс речепорождения устного монологического высказывания. Наблюдаемая автоматическая компенсаторика отрезков по длительности, по-видимому, может достигаться только наличием некоего механизма, который сознательно не контролируется говорящим, однако подчиняет все высказывание действию ограничительных процессов, обеспечивающих стабильность порождения монологического высказывания.

Представляется, что устойчивость полученной пропорции, количественно соотносимой со знаменитым законом «Парето», характеризующим многие «естественные» процессы в различных отраслях человеческого знания, является проявлением действия универсального темпорального механизма речепорождения. Нам неизвестно, что конкретно обусловливает появление этой пропорции в речи, но очевидно, что она отражает фундаментальные закономерности процесса порождения устного монологического высказывания.

Список литературы

1. Bell-Berti F., Harris K.S. A temporal model of speech production. // Phonetica. 1981. №38 (1-3).

2. Потапова Р.К., Блохина Л.П. Средства фонетического членения речевого потока в немецком и русском языках. Москва, 1986.

3. Ostry D.J., Munhall K.G. Control of rate and duration of speech movements. // J. Acoust. Soc. Am., vol.77. 1985. №2.

4. Klatt D. Interaction between two factors that influence vowel duration. // JASA, vol.54. 1973.

5. Kristin M.R. Analysis of speech segment duration with the lognormal distribution: A basis for unification and comparison. // Journal of Phonetics, vol. 33. 2005. №4.

6. Rosen K.M., Kent R.D., Duffy J.R. Lognormal distribution of pause length in ataxic dysarthria. // Clinical Linguistic Phonetics. 2003. №17 (6).

7. Christodoulides G., Avanzi M. Phonetic and Prosodic Characteristics of Disfluencies in French Spontaneous Speech // Poster presented at the 14th Conference on Laboratory Phonology 2014, Tokyo, Japan.

8. Кривнова О.Ф. Временные характеристики русских гласных в слитной речи (количественная модель). // Нижний Новгород, 2007.

9. Кривнова О.Ф., Чардин И.С. Паузирование при автоматическом синтезе речи // Теория и практика речевых исследований (АРСО-99). Москва, 1999.

10. Mertens P. Automatic segmentation of speech into syllables. // Proc. European Conference on Speech Technology, Edinburgh, 1987.

11. Ramus F., Nespor M., Mehler J. Correlates of linguistic rhythm in the speech signal. // Cognition. 1999. №73 (3).

12. Златоустова Л.В., Фролова И.Г. и др. Исследование длительности неударных гласных в зависимости от фразовых условий // Семантические и фонологические проблемы прикладной лингвистики. Москва, 1968.

13. Светозарова Н.Д. Интонационная система русского языка. Ленинград, 1983.

14. Ратникова Е.И. Towards a log-normal model of phonation units lengths distribution in the oral utterances. // Международный научно-исследовательский журнал, том 2. Екатеринбург, 2017. №3 (57).

15. Boomer D.S., Dittmann A.T. Hesitation pauses and juncture pauses in speech. // Language and Speech, 1962. №5.

16. Хуршудян В.Г. Средства выражения хезитации в устном армянском дискурсе в типологической перспективе: Дис. … канд. филол. наук. Москва, 2006.

17. Кибрик А.А., Подлесская В.И. Рассказы о сновидениях. Корпусное исследование устного русского дискурса. // М.: Языки славянских культур, 2009.

18. Анищенко В.С. Знакомство с нелинейной динамикой. // М.: Издательство ЛКИ, 2008.

Размещено на Allbest.ru

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.