К вопросу о свойствах частотного словаря на основе текстов, сгенерированных человеком в различных обстоятельствах

Анализ влияния психологического состояния человека на речевую деятельность и лексику информанта. Сравнение частотных списков, полученных при стрессе и его отсутствии. Математическое моделирование зависимости между рангом строки, частотой слов и пауз.

Рубрика Иностранные языки и языкознание
Вид творческая работа
Язык русский
Дата добавления 27.01.2021
Размер файла 18,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://allbest.ru

Военная академия связи

К вопросу о свойствах частотного словаря на основе текстов, сгенерированных человеком в различных обстоятельствах

Атаманова О.В., кандидат филологических наук

преподаватель кафедры 11 радиосвязи

Россия,г. Санкт-Петербург

Аннотация

в статье приведены фрагменты устных текстов, полученных в состоянии стресса, а также предположительно без стресса. Построены частотные списки, проанализированы их свойства.

Ключевые слова: устный текст, лексическая статистика текста, частотный словарь, психологический стресс.

Annotation

Concerning the features of frequency dictionary, based on texts, generated by a humane under various conditions

Atamanova O.V., Сandidate of philological Sciences Lecturer of Mathematics and Engineering Graphics Faculty Military State Academy of Telecommunications Saint-Petersburg, Russia

The fragments of oral texts generated under psychological stress conditions and without stress are presented hereafter. The frequency dictionaries have been compiled, their properties have been analyzed.

Key words: Oral text, lexical statistics of text, frequency dictionary, psychological stress.

В данной статье мне хотелось бы обратиться к вопросу о свойствах частотных словарей, построенных на основе фрагментов устных текстов, полученных при различных обстоятельствах - именно: в состоянии беспокойства и в спокойном состоянии. Мы можем предполагать, что в тех или иных условиях человек может испытывать или скорее всего испытывает психологический стресс.

В других случаях фактор стресса (по крайне мере, тот, который был раньше, при получении первого фрагмента текста) отсутствует.

Что можно сразу заметить, сравнивая такие частотные списки? При выраженном стрессе человек склонен использовать большое количество повторов [2, с.80-85]. Значит, длина частотного списка в большинстве случаев должна быть тем меньше, чем сильнее выражен стресс, то есть на одно и то же количество словоупотреблений количество словоформ становится меньше.

Поэтому при сравнении частотных списков, полученных при двух различных состояниях информанта - в состоянии выраженного стресса и тогда, когда факторы стресса отсутствуют - обычно мы получаем первый список, существенно, короче, чем второй. С точки зрения математических моделей частотный словарь во многих случаях определяют как модель, формализующую обратную зависимость между рангом (номером строки в частотном списке) и частотой слова. Ясно, что увеличение частотности означает уменьшение числа рангов.

Кроме того, интересно рассмотреть то, что находится в верхних строках частотного списка (в верхних рангах словаря). При выраженном стрессе увеличивается количество коротких словоформ, поисковых слов, служебных слов, слов-заместителей и заполнителей молчания, слов-паразитов.

Уменьшается доля слов с абстрактным значением, прилагательных и наречий, вместо них в речи появляется все больше слов, имеющих непосредственное отношение к повседневной жизни испытуемого. Очевидно, что верхние ранги частотного списка, содержащие наиболее часто употребляемые словоформы (и наиболее часто повторяемые) будут с большой вероятностью содержать такие короткие слова.

Известно, что служебные слова содержатся в верхних рангах практически любого частотного словаря. Однако существенное их увеличение, скорее всего, указывает на обеднение лексики информанта, причиной которого явился психологический стресс [2, с. 80-81].

Можно говорить о том, что количество рангов, соответствующих таким «обедненным» словоформам, некоторым образом характеризует психологическое состояние информанта, и свойства показателя числа таких рангов стоит по этой причине рассмотреть более подробно. Этот параметр (М), численно равный рангу последней «обедненной» словоформы, можно соотнести с длиной анализируемого текста, которая, вообще говоря, может быть разной.

Такой показатель (А), равный отношению «накопленного» (суммируемого с предыдущими) значения частоты словоформы ранга М к объему текста, показывает, какая часть текста приходится на «обедненные» словоформы.

Опять же, с точки зрения математических моделей, процесс порождения текста может быть описана статистическо-вероятностной моделью последовательного выбора, которая представляет порождаемый текст как случайную величину, при этом на каждом «шаге» порождения текста, то есть при каждом произносимом слове человек делает выбор между использованием какого-либо нового слова или употреблением старого, уже упоминавшегося ранее [1, с. 16].

Именно стресс при этом задействует дополнительные ресурсы в человеке, поэтому речевая деятельность протекает по все более упрощенному сценарию.

Итак, параметры Ми А, описывающие свойства частотного словаря, зависимы как раз от психологического состояния информанта.

Далее рассмотрим два фрагмента текста, полученных от испытуемой при выраженном стрессе и при его предполагаемом отсутствии. Тексты примерно одинаковой длины, взяты из монологической устной речи, порожденной в условиях свободной коммуникации. Анонимность информанта сохранена. Знаки препинания поставлены на месте пауз хезитации.

Сны с кошмарами это да. Нет, это красота. Я так вспомнить-то, нет, вспомнить я, конечно, нет, почему, он прошел и прошел. Ну, абсолютно. Какой силы? Такой, не знаю, какой силы. Умеренное наверно. Или слабое, потому что, ну, прошел и прошел, то есть. Приснился и приснился и...(47

словоупотреблений)

Нет, ну, теперь вот вообще погружалась я в неотвязные воспоминания, конечно, это сроду не, то есть слов не улавливала. Ну, как вы думаете, когда вот пару раз танком по тебе едут сны с полетами не это состояние как бы наркоз делает так ха-ха (44 словоупотребления).

Построив частотные списки для каждого из фрагментов, видим, насколько отличаются свойства текстов в соответствии с тем, что было сказано выше. лексика информант стресс строка слово пауза

В первом фрагменте на 47 словоупотреблений приходится всего 31 разная словоформа, во втором отрывке это соотношение гораздо меньше - то есть 37 разных словоформ на 44 словоупотребления. В первом фрагменте повторов гораздо больше - два четырехкратных повтора, во втором - только один троекратный повтор служебного слова (не).

Таблица 1. Частотные списки на основе фрагментов устных текстов, полученных в период выраженного стресса и в период стабилизации стресса

Ранг

Период выраженного стресса

Ранг

Период стабилизации стресса

словоформа

частота

«накопленная» частота

словоформа

частота

«накопленная» частота

1

и

4

4

1

не

3

3

2

прошел

4

8

2

вот

2

5

3

нет

3

11

3

как

2

7

4

вспомнить

2

13

4

ну

2

9

5

какой

2

15

5

ха

2

11

6

ну

2

17

6

это

2

13

7

присниться

2

19

7

бы

1

14

8

сила

2

21

8

в

1

15

9

то

2

23

9

вообще

1

16

10

это

2

25

10

воспоминание

1

17

11

я

2

27

11

вы

1

18

12

абсолютно

1

28

12

делать

1

19

13

да

1

29

13

думать

1

20

14

есть

1

30

14

есть

1

21

15

знать

1

31

15

ехать

1

22

16

или

1

32

16

когда

1

23

17

конечно

1

33

17

конечно

1

24

18

кошмар

1

34

18

наркоз

1

25

19

красота

1

35

19

неотвязный

1

26

20

наверно

1

36

20

нет

1

27

21

не

1

37

21

пар

1

28

22

она

1

38

22

по

1

29

23

потому

1

39

23

погружаться

1

30

24

почему

1

40

24

полет

1

31

25

с

1

41

25

раз

1

32

26

слабый

1

42

26

с

1

33

27

сон

1

43

27

слово

1

34

28

так

1

44

28

сон

1

35

29

такой

1

45

29

состояние

1

36

30

умеренный

1

46

30

сроду

1

37

31

что

1

47

31

так

1

38

32

танком

1

39

33

тебе

1

40

34

теперь

1

41

35

то

1

42

36

улавливать

1

43

37

я

1

44

Таким образом, статистические свойства полученных фрагментов связаны с психологическим состоянием человека в момент порождения этих текстов.

Конечно, очень многое зависит от индивидуальных особенностей говорящего. Так, в данном случае число «обедненных» рангов М=1 для обоих фрагментов. Для других информантов этот показатель обычно больше для первого фрагмента (соответствующего стрессовому состояниюО нежели для второго).

Дальнейшее изучение тестов, генерируемых человеком при различных обстоятельствах, может иметь весьма большое практическое значение.

Использованные источники

1. Арапов М.В. Квантитативная лингвистика / М. В. Арапов. - М.: Наука, 1988. - 183[2] с. 2. Носенко Э.Л. Эмоциональное состояние и речь / Э.Л. Носенко. - Киев, Вища школа, 1981. - 195 с.

Размещено на Allbest.ru

...

Подобные документы

  • Отображение фразеологизмов русского языка в современных словарях. Семасиологическая характеристика фразеологизмов об уме. Степень слияния отдельных слов во фразеологических оборотах. Типы фразеологизмов в зависимости от идиоматичности их компонентов.

    дипломная работа [69,1 K], добавлен 16.02.2014

  • Под влиянием исторических, политических и экономических факторов англицизмы широко распространены в нашем языке. В обществе используется большое количество заимствованных слов, сленга, жаргонизмов. Однако возможно обходиться без заимствованных слов.

    научная работа [56,8 K], добавлен 18.12.2008

  • Включение сложных слов в русскую и французскую лексику. Особенности семантики и законов образования сложных слов. Словосложение как один из способов образования новых слов в русском и французском языках. Словосложение в лингвистической литературе.

    курсовая работа [38,0 K], добавлен 05.05.2013

  • Основные группы исконных русских слов, объединенных по своему происхождению. Причины проникновения иноязычных слов в лексику русского языка. Заимствование слов старославянского и неславянского происхождения, примеры их использования в современной речи.

    доклад [33,0 K], добавлен 18.12.2011

  • Характеристика и классификация рекламных текстов, их лексические и синтаксические особенности. Сравнительный анализ англоязычных и русскоязычных рекламных текстов. Разработка урока в рамках темы "Mass Media" на основе проанализированных рекламных текстов.

    дипломная работа [4,4 M], добавлен 14.02.2013

  • Факторы речевой организации текста. Характеристика текста как особой речевой единицы. Основные типы текстов. Построение текстов различных стилей. Особенности построения текстов в научном, публицистическом, официально-деловом и художественном стилях.

    курсовая работа [46,9 K], добавлен 22.05.2015

  • Теоретическое исследование вопроса перевода многозначных слов на примере газетных текстов. Многозначные слова в русском и английском языках. Особенности газетно-информационных текстов. Изучение закономерных соответствий между конкретными парами языков.

    дипломная работа [142,1 K], добавлен 06.06.2015

  • Значение диалектизмов, профессионализмов, жаргонизмов, слов с книжной и разговорной окраской. Анализ текстов разных стилей. Библиографическое описание книги, статьи, документа. Составление аннотации и рецензии. Примеры употребления фразеологизмов.

    контрольная работа [39,1 K], добавлен 25.10.2013

  • Представление о частях речи как классах, полученных на основе совокупности признаков. Анализ безличных глаголов с точки зрения их семантики. Изучение безличных глаголов из "Словаря русского языка" С.И. Ожегова, их специфика и семантическая классификация.

    реферат [38,8 K], добавлен 16.11.2010

  • Проблема правильного и уместного употребления слов. Единицы языка как ячейки семантики. Морфемы полнозначных слов. Типы семантических отношений. Возможность соединения слов по смыслу в зависимости от реальной сочетаемости соответствующих понятий.

    курсовая работа [40,2 K], добавлен 02.01.2017

  • Рассмотрение и анализ популярных в Интернете он-лайн переводчиков, сравнение их возможностей и функций. Технологии, на которых работают он-лайн транслейторы. Сравнительная характеристика перевода английских шуточных текстов с помощью он-лайн словарей.

    курсовая работа [452,6 K], добавлен 06.06.2012

  • Анализ структуры сложных слов немецкого языка, их характерные структурные типы. Классификация немецких композитов на основе двух принципов: морфологического и семантико-синтаксического. Семантические отношения между компонентами существительных, глаголов.

    курсовая работа [23,0 K], добавлен 24.11.2009

  • Характеристика научно-популярных лингвистических текстов с различных позиций. Описание семантических особенностей художественных сравнений. Определение грамматических способов выражения сравнений. Характеристика функций художественных сравнений.

    контрольная работа [35,7 K], добавлен 05.08.2010

  • Выполнение высококвалифицированных переводов. Правильное и полное понимание текста и его значение для перевода. Особенности двуязычных словарей. Сочетания слов в словарях. Переводы однозначного слова при помощи двух или более слов, близких по значению.

    лекция [42,9 K], добавлен 30.10.2013

  • Организация исследования лексики "Словаря русского языка" С.И. Ожегова. Характер распределения многозначных слов по словарю. Оценка влияния многозначности мышления на многозначность слова за счет обобщения и генерации новых смыслов внутри этих понятий.

    статья [22,2 K], добавлен 29.07.2013

  • Сравнительное сопоставление систем служебных слов в русском и французском языках, установление особенностей, присущих данным системам, а также сходств и различий между ними. Универсалии. Практическая цель сравнительно-типологического исследования языков.

    курсовая работа [49,1 K], добавлен 10.03.2009

  • Сравнение разноязычных слов, распределение их по группам, каждая из которых восходит к определенному смысловому корню. Лингвистический анализ происхождения корней в различных географических названиях, соответствия по смыслу и по составляющим звукам.

    реферат [28,9 K], добавлен 06.09.2009

  • Определение "варваризмов" как иноязычных слов и выражений, используемых в речи при описании реалий и обычаев других народов. Создание словаря для облегчения понимания поэтического языка Пушкина и толкования иноязычных слов. Структура словарной статьи.

    контрольная работа [14,9 K], добавлен 26.12.2011

  • Слова категории состояния в системе частей речи английского языка, их понятие и содержание, семантические группы. Сравнительный анализ частотности слов категории состояния, их комбинаторика и особенности функционирования в современном английском языке.

    дипломная работа [78,5 K], добавлен 11.11.2011

  • Влияние пуризма на становление немецкого языка. Пуризм Иоахима Генриха Кампе. Анализ заимствованных слов и немецких эквивалентов. Заимствования, полностью вытеснившие исконно немецкую лексику. Немецкая лексика и заимствования, используемые одновременно.

    курсовая работа [53,8 K], добавлен 26.07.2017

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.