Диалектная лексика

Измерение лексической диалектности носителей. Совершенствование словаря нераспознанных лексем и создание грамматического словаря на основе всех слов корпуса. Сравнение лексических и фонетических показателей. Улучшение интерфейса для работы со словарем.

Рубрика Иностранные языки и языкознание
Вид курсовая работа
Язык русский
Дата добавления 01.07.2017
Размер файла 106,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Данная работа посвящена Устьянскому звуковому корпусу. Основные направления работы касаются диалектологии и лексикографии. Работа охватывает широкий круг задач: от подсчета диалектности информантов до создания грамматического словаря, включающего в себя все слова из корпуса.

В первом разделе описан процесс измерения диалектности, который производился с помощью программы на языке Python. Результаты показали, что особой корреляции между возрастом носителя и его диалектностью у представителей "среднего" поколения нет, но самое старшее поколение (1922-1930 годов рождения) более диалектное по сравнению с остальными, а особенно с младшим поколением. Однако выделились инновационные и консервативные носители диалекта. Это информанты старшего поколения, использующие большее количество диалектных слов, чем другие представители этого же поколения, или представители более молодого поколения, использующие большое количество диалектной лексики. Результаты измерения лексической диалектности сравнивались с результатами, представленными в работах (Daniel et al. 2017) и (Левин 2014). В этих работах также были отмечены консервативные и инновационные носители. Кроме того, был создан частотный список, который позволяет увидеть, какие словоформы употребляются носителями чаще всего и каким количеством носителей.

Вторая часть работы сосредоточена на словаре нераспознанных лексем, который был создан в работе (Калашникова 2016). В словарь были добавлены новые толкования из обновленного "Устьянского народного словаря", кроме того, были улучшены собственные толкования, которые уточнялись в поездке в поселок Октябрьский Архангельской области.

В третьей части описан процесс создания грамматического словаря. Самым важным в создании словаря был выбор морфологического анализатора, поэтому выбор описан и обоснован достаточно подробно. Кроме того, были произведены улучшения интерфейса сайта, где располагаются словарь нераспознанных лексем и грамматический словарь. Оба словаря доступны по ссылке http://pushkinodict.pe.hu/.

Все задачи, решенные в данной работе, имеют значение для будущих исследований устьянского диалекта. Так, подсчет диалектности позволит иметь точные данные для всех носителей, и диалектность информантов не придется прикидывать. Улучшение словаря нераспознанных лексем необходимо не только для будущих исследований, но и для пользователей корпуса, так как позволит видеть определения неизвестных слов с ссылками на полные контексты. И, наконец, грамматический словарь может оказаться полезным, так как в нем можно увидеть парадигмы всех слов, вошедших в корпус.

Список использованных источников и литературы

1. Даниэль М.А., Добрушина Н. Р., фон Вальденфельс Р. Говор бассейна Устьи. Корпус севернорусской диалектной речи. Берн, Москва. 2013-2014. Электронный ресурс. http://slavist.de/Pushkino/login.php

2. Истомин А.А., Мамонов В.П., Силин В.П. и др. Устьянский народный словарь. П. Октябрьский, 2013.

3. Калашникова 2016 - Д.Б. Калашникова. Словарь к звуковому корпусу устьянского диалекта. Курсовая работа. М., 2016.

4. Левин 2014 - И.С. Левин. Реализация ударного этимологического* к между мягкими согласными в говоре Устьянского района Архангельской области. // Е. М. Девяткина (ред.) Проблемы языка: Сборник научных статей по материалам Третьей конференции-школы "Проблемы языка: взгляд молодых ученых". М., 2014.

5. Ляшевская и др. 2010 - Ляшевская О. Н., Астафьева И., Бонч-Осмоловская А. А., Гарейшина А., Гришина Ю., Дьячков В., Ионов М., Королева А. Н., Кудринский М., Литягина А., Лучина Е., Сидорова Е., Толдова С. Ю., Савчук С. О., Коваль С. А. Оценка методов автоматического анализа текста: морфологические парсеры русского языка // Компьютерная лингвистика и интеллектуальные технологии. По материалам ежегодной Международной конференции "Диалог". Вып. 9 (16) - М.: РГГУ, 2010. С. 318-326.

6. Сичинава 2002 - Д.В. Сичинава. К задаче создания корпусов русского языка //Электронная публикация: http://www. mccme.ru/ling/mitrius/article.html. - 2002.

7. Daniel et al. 2017 (submitted) - M. Daniel, N. Dobrushina, P. Kazakova, E. Gerasimenko, D. Ignatenko, E. Makhlina, M. Ovsjannikova, S. Say, I. Shurov, A. Ter-Avanesova, M. Tsfasman, S. Verhees, A. Vinyar, R. von Waldenfels, V. Zhigulskaya. Dialect loss in the Russian North: modelling change across variables (submitted to publication).

8. Heeringa, Braun 2003 - W. Heeringa, A. Braun. The Use of the Almeida-Braun System in the Measurement of Dutch Dialect Distances. Computers and the Humanities, 37(3). P. 257-271.

9. Heeringa, Gooskens 2003 - W. Heeringa, C. Gooskens. Norwegian Dialects Examined Perceptually and Acoustically. Computers and the Humanities, 37(3). P. 293-315.

10. Kondrak 2003 - G. Kondrak. Phonetic Alignment and Similarity. Computers and the Humanities, 37(3). P. 273-291.

11. Nerbonne, Kleiwg 2003 - J. Nerbonne, P. Kleiweg. Lexical Distance in LAMSAS. Computers and the Humanities, 37(3). P. 339-357.

12. Nerbonne, Kretzschmar 2003 - J. Nerbonne, W. Kretzschmar. Introducing Computational Techniques in Dialectometry. Computers and the Humanities, 37(3). P. 245-255.

13. Palander et al. 2003 - M. Palander, L. Opas-Hдnninen, F. Tweedie. Neighbours or Enemies? Competing Variants Causing Differences in Transitional Dialects. Computers and the Humanities, 37(3). P. 359-372.

14. R. v Waldenfels et al. 2014 - Ruprecht von Waldenfels, Michael Daniel, Nina Dobrushina Why Standard Orthography? Building the Ustya River Basin Corpus, an online corpus of a Russian dialect. Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции "Диалог". Вып. 13 (20) - М., 2014.

15. Segalovich 2003 - I.A. Segalovich. Fast Morphological Algorithm with Unknown Word Guessing Induced by a Dictionary for a Web Search Engine. // MLMTA. - 2003. - P. 273-280.

16. Speelman et al. 2003 - D. Speelman, S. Grondelaers, D. Geeraerts. Profile-Based Linguistic Uniformity as a Generic Method for Comparing Language Varieties. Computers and the Humanities, 37(3). P. 317-337.

Приложение 1

Таблица 5. Диалектность информантов (по возрастанию года рождения).

Информант

Количество диалектных слов

Общее количество слов

Диалектность, %

мит1926

136

6001

2,266288952

епл1926

212

10655

1,989676208

еве1950

92

4648

1,979345955

авм1922

325

17660

1,840317101

анс1925

363

20349

1,783871443

пфп1928

457

25950

1,761078998

сек1930

405

23136

1,750518672

авч1930

71

4125

1,721212121

лпп1928

43

2915

1,475128645

авт1928

73

4956

1,472962066

мик1922

160

11044

1,448750453

впч1930

19

1349

1,408450704

аит1954

146

10751

1,358013208

лсо1941

289

21471

1,346001584

мпс1935

136

10420

1,305182342

звк1941

10

782

1,278772379

мгб1949

181

15240

1,187664042

нпо1954

70

6114

1,144913314

опш1935

126

11018

1,143583227

ляп1953

71

6517

1,08945834

кип1931

37

3744

0,988247863

ппп1955

80

8524

0,938526513

егп1928

165

18634

0,885478158

мдн1933

151

17349

0,870367168

няе1952

30

3532

0,849377123

иип1951

63

7516

0,838211815

нвт1952

121

14648

0,826051338

вкч1966

59

7734

0,76286527

ппп1947

40

5637

0,709597304

офш1952

79

11189

0,706050585

ндо1958

84

12275

0,684317719

лгп1947

143

21055

0,679173593

анп1929

10

1498

0,667556742

нвл1939

17

2730

0,622710623

тан1937

18

3298

0,545785324

юап1969

7

1414

0,495049505

пнп1950

17

3585

0,474198047

ипм1956

28

6557

0,427024554

фдл1954

7

1700

0,411764706

вап1963

41

10778

0,380404528

нвп1958

1

271

0,36900369

нап1974

14

3987

0,351141209

ннт1960

38

13190

0,288097043

лнп1952

13

5760

0,225694444

свп1975

16

7307

0,218968113

нис1958

5

2338

0,213857998

мяп1951

25

12464

0,200577664

нпо1965

30

14959

0,200548165

гвп1949

22

10976

0,200437318

ффп1952

15

7603

0,197290543

нфм1961

22

11628

0,189198486

ави1958

4

2156

0,185528757

гбс1951

2

1252

0,159744409

свп1970

6

4113

0,14587892

вдк1947

9

6290

0,143084261

xxx

1

761

0,131406045

ент1968

6

4567

0,131377272

ваб1971

5

4370

0,114416476

няр1948

0

799

0

ххх1956

0

440

0

ввс1956

0

17

0

афш1958

0

1397

0

аэи1973

0

59

0

иит1991

0

410

0

анп1995

0

3669

0

всп1996

0

1689

0

default

0

3

0

xxx2

0

35

0

wife

0

39

0

Дима (внук)

0

57

0

Сноха

0

17

0

ахш

0

67

0

нxм

0

348

0

Всего

4816

501536

Приложение 2

Таблица 6. Частотный список (100 вхождений).

Слово

Количество употреблений

Количество информантов

эво

374

37

дедко

125

18

робили

106

16

сейгод

89

24

робил

86

20

порато

74

24

робит

72

17

экой

71

21

робила

65

20

тамоки

62

8

эко

60

19

этто

55

14

эва

45

16

робят

39

10

люля

33

1

тутоки

32

8

починок

31

5

мезонька

30

6

видко

29

15

экого

29

11

проводины

28

10

угор

27

13

угоре

27

17

евонная

26

12

нали

25

14

мезоньки

23

4

божатка

22

5

евонный

22

14

зароды

22

11

эвон

22

9

ноне

21

3

откуль

20

6

гонили

19

13

ростили

19

11

двоимя

17

11

поветь

17

10

примерли

17

4

оттуль

16

7

эких

16

13

бает

15

4

ревит

15

6

тогды

15

7

запань

14

4

евонные

13

10

никуды

13

7

перёд

13

8

щёлок

13

3

зарод

12

7

садим

12

5

выгонить

11

4

заробишь

11

6

поробила

11

6

церквы

11

5

дерёва

10

4

дровнях

10

7

зобеньки

10

3

кудреватый

10

2

недалёко

10

10

пестерь

10

3

робишь

10

3

угоры

10

5

эку

10

7

вечеровки

9

5

выруба

9

4

голодовали

9

6

кажут

9

3

когды

9

5

кросна

9

4

накладёшь

9

3

пестики

9

3

татка

9

3

ушаты

9

4

баять

8

3

карбас

8

5

козлух

8

4

накладешь

8

6

парничка

8

6

подсанки

8

4

пожни

8

2

евонное

7

4

ейный

7

5

картофь

7

3

лык

7

5

молодицей

7

5

парничок

7

4

робь

7

7

смольнички

7

1

сморода

7

4

сробил

7

3

сядко

7

2

тачанку

7

2

угонили

7

5

угора

7

6

баем

6

1

баю

6

3

голубника

6

1

евонна

6

5

заробила

6

5

заробить

6

5

Размещено на Allbest.ru

...

Подобные документы

  • Концепция словаря. Лексикографический параметр как способ лексикографической интерпретации какого-то структурного элемента. Элементы авторской установки словаря. Тематический порядок расположения лексических статей. Фонетическая характеристика вокабулы.

    презентация [1,7 M], добавлен 22.11.2013

  • Понятие системности словаря (структурные типы слов, семантическая и стилистическая дифференциация лексики). Пути развития и пополнения словарного состава языка. Свободные словосочетания и фразеологические единицы.

    шпаргалка [40,2 K], добавлен 22.08.2006

  • Постать Б. Грінченка як різнопланового діяча. Традиційні методи упорядкування довідкових видань. Основна організаційно-творча робота над "Словарем української мови". Використання "Словаря української мови" Бориса Грінченка у сучасній лексикографії.

    курсовая работа [1,1 M], добавлен 10.06.2011

  • Проблема формирования словника кросскультурного терминологического словаря. Лингвистический, логико-понятийный, лексикографический подходы к объективному отбору лексических единиц, их достоинства и недостатки. Составление системной классификации терминов.

    статья [222,2 K], добавлен 20.08.2013

  • Понятие "общественно-политическая лексика". Слова и словосочетания, принадлежащие к ядру ОПЛ. Общеупотребительная лексика как костяк общенационального литературного словаря. Клише и штампы как речевые стереотипы. Стилистически окрашенная лексика.

    курсовая работа [35,3 K], добавлен 05.05.2009

  • Лексика с точки зрения ее происхождения и употребления. Исследование лексикона учащихся 8-11 классов МКОУ "Буравцовская СОШ" и определение путей пополнения словарного запаса школьников. Создание школьного словаря современного молодежного сленга.

    курсовая работа [102,0 K], добавлен 11.01.2015

  • История создания "Толкового словаря живого великорусского языка" В. Даля. Содержание словаря: основные условные сокращения, орфоэпия, лексика литературного языка и местных диалектов; афоризмы с толкованием; иностранные термины; грамматические трудности.

    презентация [1,1 M], добавлен 16.02.2014

  • Определение "варваризмов" как иноязычных слов и выражений, используемых в речи при описании реалий и обычаев других народов. Создание словаря для облегчения понимания поэтического языка Пушкина и толкования иноязычных слов. Структура словарной статьи.

    контрольная работа [14,9 K], добавлен 26.12.2011

  • Терминология - словарное ядро языка науки. Систематизация терминологической лексики, упорядочение и унификация. Формирование словника словаря терминов. Словарь военной терминологии периода Второй мировой войны (на основе "Дневника боевых действий").

    курсовая работа [80,0 K], добавлен 19.12.2015

  • Выборка лексических единиц согласно оценочной шкале утилитарной оценки. Анализ слов, имеющих утилитарную оценку подгруппы "полезный", выбранных методом сплошной выборки с целью сравнения грамматического распределения лексики в русском и английском языках.

    реферат [20,6 K], добавлен 27.10.2012

  • Сущность слова, его многозначность. Особенности лексических средств. Лексика с точки зрения употребления и происхождения. Анализ ошибок в употреблении синонимов и паронимов. Речевые ошибки, возникающие при нарушении правил лексической сочетаемости.

    курсовая работа [43,3 K], добавлен 07.06.2011

  • Особенность словарной работы в школе. Работа учащихся над словарем. Организация уроков русского языка в начальных классах при проведении лексической работы. Организация практической деятельности по лексической работе. Формирование фонематического слуха.

    курсовая работа [55,6 K], добавлен 10.08.2013

  • Детские годы Ожегова и обучение в Петроградском университете. Работа над толковым словарем совместно с Ушаковым. Отбор лексического и фразеологического материала для краткого словаря. Исследование истории русского литературного языка и социолингвистики.

    реферат [19,1 K], добавлен 04.03.2010

  • Парадигматические отношения в лексической системе современного русского языка. Типы контекстов и соотношение факторов, влияющих на формирование лексических значений слов в их контекстном окружении. Сочетаемость исследуемых лексических единиц и их функции.

    дипломная работа [90,3 K], добавлен 11.10.2014

  • Выполнение высококвалифицированных переводов. Правильное и полное понимание текста и его значение для перевода. Особенности двуязычных словарей. Сочетания слов в словарях. Переводы однозначного слова при помощи двух или более слов, близких по значению.

    лекция [42,9 K], добавлен 30.10.2013

  • Особенности словаря молодежного социолекта, понятия "сленг" и "жаргон"; стилистические кластеры сниженной лексики, причины употребления. Выявление функциональной нагрузки и источников пополнения сниженной лексики немецкого языка в молодежном сленге.

    курсовая работа [45,9 K], добавлен 06.03.2012

  • Экстралингвистические основы изучения говора села Шабельское, методы сбора диалектного материала. Общая характеристика кубанских говоров. Интровертный словарь говора как источник диалектного материала. Типология диалектизмов и микротопонимы в говоре.

    дипломная работа [189,5 K], добавлен 10.11.2015

  • Применение английских слов в японском языке, создание алфавита "катакана" для написания заимствованных слов. Возникновение неологизмов на основе английской лексики. Использование структурных моделей англицизмов и распространенные способы словообразования.

    статья [21,2 K], добавлен 19.12.2010

  • Изучение состава морской речи: терминов, языковой экономии и жаргона. Специфика команд и приказов на флоте, а также лексикона моряков. Структура языка и словообразование в нём. Создание немецко-русского словаря морской терминологии, разбитого по темам.

    курсовая работа [58,4 K], добавлен 27.12.2011

  • Сопоставление лексем с партитивной семантикой, обозначающих отношения "части и целого" в русском и польском языках. Выявление фонетических и грамматических особенностей партитив. Грамматические особенности и распределение лексем по семантическим группам.

    курсовая работа [47,7 K], добавлен 10.11.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.