Распределение длительности фонационных отрезков в устнопорождаемом высказывании: логнормальная модель
Исследование распределения длительности фонационных отрезков в устнопорождаемом высказывании на материале французского, русского и английского языков в трех разных ситуациях общения. Анализ статистически репрезентативного корпуса устных текстов.
Рубрика | Иностранные языки и языкознание |
Вид | статья |
Язык | русский |
Дата добавления | 08.05.2018 |
Размер файла | 368,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru//
Размещено на http://www.allbest.ru//
Московский Государственный университет имени М.В.Ломоносова
Распределение длительности фонационных отрезков в устнопорождаемом высказывании: логнормальная модель
Ратникова Е.И.
Кандидат филологических наук
Аннотация
В статье представлены результаты экспериментального исследования распределения длительности фонационных отрезков в устнопорождаемом высказывании на материале французского, русского и английского языков в трех ситуациях общения: 1) интервью, 2) устной беседы, 3) устного ответа на экзамене по иностранному языку. В ходе анализа статистически репрезентативного корпуса устных текстов было установлено, что такая темпоральная характеристика устнопорождаемого высказывания как длительность фонационного отрезка подчиняется логнормальному статистическому распределению вне зависимости от типа изучаемой ситуации, индивидуальных особенностей говорящих, тематики и общей длительности высказывания, а также от того, на каком языке осуществляется порождение (родном или иностранном). Подчинение логнормальному распределению количественных характеристик проявлений какого-либо процесса свидетельствует об устойчивости базового механизма, отвечающего за их реализацию. Результаты настоящей работы могут быть использованы при разработке методики анализа устнопорождаемого высказывания, а также компьютерных алгоритмов автоматического распознавания речи.
Ключевые слова: акустическая фонетика, устнопорождаемая речь, логнормальное распределение, фонационный отрезок, пауза.
Ratnikova E.I. устнопорождаемый текст высказывание
PhD in Philology, Lomonosov Moscow State University
TOWARDS A LOG-NORMAL MODEL OF PHONATION UNITS LENGTHS DISTRIBUTION IN THE ORAL UTTERANCES
Abstract
The present article is concerned with the issue of developing workable approaches to establishing a more robust parametrization of the phonetic and prosodic characteristics of a speech utterance. The article presents the results of an experimental study analyzing the distribution of phonation units within speech utterances produced in the French, Russian and English languages in three communicative situations: 1) interview; 2) general oral discussion and 3) student's spoken answer in a foreign language test. The analysis of an extensive corpus of recorded speech data showed that such fundamental intrinsic characteristic of speech utterance as the length of its constituent phonation units distinctly follows a log?normal distribution irrespective of the communicative situation, the language spoken (mother or foreign), the thematic subject and overall duration of the utterance, and the individual manner of the speakers. The findings of the conducted study presented in the article can be a valuable resource for developing a practicable methodology of speech?utterance analysis, as well as for fine?tuning and improving the existing speech?recognition algorithms and approaches.
Keywords: acoustic phonetics, oral speech, speech utterance, log?normal distribution, phonation unit, pause.
Introduction
One of the principal temporal-acoustic characteristics of a speech signal is the length of its constituent segments. A number of studies conducted in this field have demonstrated that such phenomena as the distribution of the lengths of filled-in pauses in oral French speech [2], the distribution of the lengths of non-filled-in pauses in the speech of sufferers from ataxic dysarthria articulatory disorders [4], and of the lengths of vowels and consonants in oral English speech [3] follow a log-normal model. Besides that, the length-related characteristics of certain specific instances of the written speech have also been found to be log-normally distributed, for example, the length of postings on internet forums dedicated to various subjects [5]. It is also well-known that in many languages the length of speech segments plays a key role in the formation of the rhythmic structure of an utterance, therefore further and more thorough analysis of the observed distribution patterns undoubtedly presents a matter of exceptional scientific interest bound to deepen our knowledge about the speech-production process.
As it is impossible to explore the whole multitude of speech-production forms within a single study, this article narrows down the research subject to three communicative situations: 1) interview, 2) general oral discussion and 3) a student's spoken answer in a foreign language test. Therefore, the subject of the conducted analysis is monologue spontaneous oral utterance, its spontaneous nature being determined by the absence of any visual (textual) support for the speaker and by the unpredictability of its realization course, the latter, however, not excluding the presence of some general cognitive concept or, in some cases, even of a speech plan. By monologue is meant a long-distance speech production during which the speaker is not interrupted by the listener.
The study adopts a formal approach towards the analysis of the oral utterance, regarding it from the acoustic viewpoint as a combination of phonation units (speech chunks) and pauses. This approach appears to be fully workable at the initial stages of the research as it allows to ensure the required degree of consistency of the input data represented by a large oral-speech corpus (more than 100 speech productions) whose preliminary systematization with the use of perception analysis would have posed considerable difficulties.
While intentionally leaving the language contents of the phonation units outside the boundaries of the analysis, we presume that there exists a certain mechanism, a definitive model, responsible for turning these units into an ultimate speech production. It is the effort to get an insight, however limited, into the workings of this mechanism that lies at the basis of the current research.
The study is dedicated to the exploration of the frequency distribution of phonation units of different lengths making up oral utterances produced, as was mentioned above, in three different communicative situations. The given article presents preliminary results of this experimental research and sets out a hypothesis that irrespective of the communicative situation, thematic speech subject, individual manner of the speaker and the language spoken (mother tongue or taught foreign), the time-length values of the constituent speech segments follow a log-normal distribution.
Experimental Platform
The study examined a corpus of recorded speech data comprising 100 spontaneous monologue speech utterances with a total length 4 minutes produced in three communicative situations: 1) interview, 2) general oral discussion and 3) a student's spoken answer in a foreign language test. The first group contains recorded radio broadcasts in interview format on various subjects (music, sports, cinema, literature, computer games) conducted in Russian and French respectively on Russian and French radio stations. The second group contains recordings made by the author: the speakers were asked to give an extended monologue answer in native Russian to the question put by the researcher. The third group consists of monologue answers of the Russian school students given during a French language competition (the language competency level B2). Therefore, the analyzed corpus comprises speech recordings both in the native and taught foreign languages, with the age of the speakers, both male and female, lying within the range from 15 to 65 years. The sound files were recorded in .wav file format with a sample rate of 44 kHz and processed in Adobe Audition computer program.
Method
Acoustic analysis and speech signal annotation were made with the use of Praat computer program, whereas the quantitative analysis was performed with the use of Excel and statistical analysis with MiniTab program.
Experiment Stages
Segmentation of the speech signals into pauses and phonation units in Praat computer program. The utterances were analyzed from the acoustic standpoint, i.e. as interconnected sequence of phonation and pauses. By `pause' is meant a period of complete silence (interruption of the phonation) with a length starting from 200ms [1]. In line with the approaches of traditional linguistics, the so-called `filled-in pauses' are regarded as phonation, which enables a more precise application of the selected segmentation methodology.
Annotation of the identified segments. Writing orthographic transcription (e.g. see fig. 1 below).
Fig. 1 -- Segmentation and annotation of an English utterance as L2
Calculation of the length of phonation segments in Excel
Histogram and distribution analysis in MiniTab.
The purpose of the next stage was to establish the character of the observed frequency distribution, which was done with the use of Minitab computer program. The analysis of the output histograms demonstrated the presence of a distinct lognormal distribution. Histograms serve as an instrument for graphically representing the experimentally obtained data and describing its frequency distribution. To make the analyzed data visually compact and easily readable, in accordance with the selected grouping algorithm it is sub-divided by the computer program into intervals, or bins. Along with the total number of data values, this algorithm takes into account their range and variance, thus aiming to ensure the best possible representation of the revealed statistical distribution. The most important characteristic of a histogram is its shape, representing the character of the established frequency distribution.
The histograms built in the course of the experiment contain 9 bins (groups), with an interval of 1 second between the average values of the data in each bin. The first bin contains phonation units with a length 200 to 500ms, the second 500ms to 1.5sec and so on.
The Y axis shows the frequency, i.e. the total number of phonation units. The higher the vertical box, the higher the frequency of the phonation units within the given group. This approach was used for all the oral-speech utterances in the analyzed corpus, i.e. for each speaker was built a separate histogram.
The histogram (frequency) analysis has demonstrated that the lengths of the considered phonation units are log-normally distributed (see fig.2).
Fig. 2 -- The example of the log-normal distribution of the phonation units' lengths in an utterance with a duration of 4 minutes in non-native English (p< 0.05)
The quantitative analysis has found that the total number of phonation units varies depending on the total length of the utterance. As for the range of the lengths of the individual phonation units within the utterance, it is subject to a much lesser variance, being almost identical in each particular instance and on average measuring from 200ms to 7sec, meaning that each utterance contains short, medium and long phonation units.
The same graph also shows the inverse relation between the frequency and length of the phonation units. As the most frequent units are situated on the left-hand side from the mean value and the least frequent on the right-hand side, it can be seen that the left side contains the lesser number of bins as compared to the right one containing the most part of them. The most frequent phonation units are grouped in bins 1 and 2, while the less frequent are contained in bins 5 to 8, i.e. the frequency falls as the length grows. As a result, the right-hand side of the histogram has a distinctly elongated narrowing tail demonstrating a skewness and general asymmetry typical of a log-normal distribution.
Conclusions
The identified log-normal distribution pattern for phonation units' lengths has turned out to be valid for all the types of utterances analyzed in the experiment. This allows to conclude that the variance in the phonation units' length values is subject to a certain universal model which is realized each time irrespective of the subject of the utterance, individual traits of the speaker, the language spoken, etc. It seems only natural to assume that the observed general applicability of this distribution pattern reflects the working of a certain intrinsic mechanism regulating the production of a spontaneous oral utterance as such, or at least its temporal structure.
More than that, as the experiment has also shown, this model is not violated by either the degree of predictability of the speech stimulus put forward to the speaker (an unexpected question from the researcher), or the amount of time provided for preparing the answer or delivering it, or the fact whether the communicative task in question was explicitly specified or merely contextually implied. There was only one common condition for all the speakers: the requirement to produce an oral monologue utterance.
Список литературы / References
Boomer D. S., Dittmann A. T. Hesitation pauses and juncture pauses in speech // Language and Speech. - 1962. - 5.- P. 215-220.
Christodoulides G., Avanzi M. Phonetic and Prosodic Characteristics of Disfluencies in French Spontaneous Speech // Poster presented at the 14th Conference on Laboratory Phonology 2014, July 25-27, 2014. Tokyo, Japan.
Kristin M. R. Analysis of speech segment duration with the lognormal distribution: A basis for unification and comparison // Journal of Phonetics.- 2005.- 33(4). - P. 411-426.
Rosen K.M., Kent R.D., Duffy J.R. Lognormal distribution of pause length in ataxic dysarthria // Clinical Linguistic Phonetics. - 2003. - 17(6). - P. 469-86.
Sobkowicz P. et al. Lognormal distributions of user post lengths in Internet discussions - a consequence of the Weber-Fechner law? // EPJ Data Science, 2013.
Размещено на Allbest.ru
...Подобные документы
Анализ функционально-стилистических разновидностей современного немецкого и английского языков, ходства и различия языков в функциональном плане, основные проблемы, с решением которых связано употребление языковых средств в разных ситуациях общения.
дипломная работа [1,8 M], добавлен 11.02.2011Направления исследования наиболее интересных моментов процесса словотворчества в разных социокультурных слоях общества (на материале английского и русского языков). Возможности народной этимологии в качестве источника пополнения словарного состава языка.
реферат [48,3 K], добавлен 01.05.2013Понятие концепта как многомерного сгустка смысла. Концепт "счастье" - состояние полного удовлетворения и везения. Число единиц, репрезентирующих концепт. Лексема "счастье" и ее значение. Признаки концепта, релевантные для всех языков исследования.
презентация [2,0 M], добавлен 11.06.2014Экспансия языков английского, испанского, французского, португальского, нидерландского, русского, что привело к появлению индоевропейской речи на всех материках. Строение индоевропейской семьи языков. Состав славянской группы, ее распространенность.
презентация [3,2 M], добавлен 15.11.2016Структурно-семантическое и идеографические изучение фразеологических единиц, используемых в деловом дискурсе. Выявление их прагматической сущности, когнитивных, дискурсивных и лингвокультурных особенностей. Способы речевой идиоматизации делового общения.
дипломная работа [132,7 K], добавлен 25.02.2016Пословица: сущность, основные функции, место в фразеологии и источники происхождения. Внутренняя организация пословиц французского и русского языков. Семантика фразеологизмов-пословиц. Лексические противопоставления. Употребление параллельных конструкций.
дипломная работа [128,4 K], добавлен 21.01.2013История развития английского языка с давних времен до современности. Иностранные элементы в древнеанглийском наречии, скандинавское влияние в среднеанглийском его варианте. Возникновение и развитие русского языка. Анализ сходства лексики двух языков.
научная работа [515,8 K], добавлен 23.03.2013Учение фоносемантики как науки и освещение теоретических проблем. Рассуждения учёных по звукоизобразительности. Сопоставительный анализ поэтических текстов немецких и русских авторов в аспекте фоносемантики и стилистики в сопоставлении с переводами.
дипломная работа [118,8 K], добавлен 17.01.2015Влияние фонационных средств на процесс коммуникации и восприятие информации. Акустические средства невербальной коммуникации в деловом общении. Паралингвистические и экстралингвистические приемы, позволяющие увеличить эффективность делового общения.
реферат [24,4 K], добавлен 11.05.2017Роль мифологической модели мира в языковом сознании. Миф и мифологема как структурная составляющая и единица мифологической модели мира. Источники мифологем, содержание и значение. Языческий характер кельтских мифологем в устных и письменных памятниках.
контрольная работа [31,5 K], добавлен 26.09.2011Менталитет народа как объект изучения в русской и зарубежной научной литературе. Принципы классификации и лингвокультурологическое содержание пословиц и поговорок русского и английского языков, их анализ на основе предметно-семантической классификации.
дипломная работа [106,5 K], добавлен 23.03.2010Характеристика проблем фразеологии английского и русского языков. Выявление фразеологических единиц на материале политических дебатов и определение их семантических особенностей и оценочного компонента. Фразеологические сращения, единства, сочетания.
курсовая работа [33,1 K], добавлен 19.06.2011Исследование проблемы взаимодействия языков в современной лингвистике. Анализ и характеристика типов контактов языков. Лексические заимствования как результат контактирования языков. Возникновение языковых контактов в истории развития французского языка.
реферат [17,1 K], добавлен 18.07.2011Учение В. Матезиуса "О так называемом актуальном членении предложения". Порядок актуального членения высказывания. Темо-ремостические отношения (на примере русского и английского языков). Рассмотрение концепции ученого-лингвиста Блоха Марка Яковлевича.
курсовая работа [35,5 K], добавлен 24.11.2012Изучение лексико-грамматических и стилистических особенностей перевода военных текстов. Текстуальные категории военных текстов. Выявление специфических приемов перевода, используемых для передачи текстов военного характера с английского языка на русский.
дипломная работа [94,1 K], добавлен 20.05.2015Исследование пословиц и поговорок в отечественном и зарубежном языкознании, лингвостилистические аспекты их изучения. Семантический анализ английских и русских пословиц и поговорок с зоонимическим компонентом, их лексические и морфологические особенности.
дипломная работа [107,0 K], добавлен 19.10.2013Исследование общих сведений о грамматическом строе. Изучение особенностей грамматики синтетических языков. Характеристика закономерностей построения правильных осмысленных речевых отрезков. Падежи и склонения латинского языка. Окончания существительных.
контрольная работа [28,2 K], добавлен 17.01.2013Понятие переводческой и грамматической трансформации, причины их возникновения, классификация. Практическое сравнительное исследование использования грамматических трансформаций на материале устных, письменных переводов русского текста на английский язык.
дипломная работа [71,4 K], добавлен 03.07.2015Особенности лексической системы. Лексико-семантические группы слов, семантические поля и синонимия. Толкование слова "движение" в русском и английском словарях. Анализ языковых единиц английского и русского языков из тематической группы "движение".
курсовая работа [71,4 K], добавлен 16.01.2011Фразеологизмы, понятие, сущность, особенности и их классификация. Фразеологизмы с соматическим компонентом «части тела» в русском и английском языках. Классификация фразеологических единиц русского и английского языков с компонентом "части тела".
научная работа [37,9 K], добавлен 25.02.2009