Диалектная лексика
Измерение лексической диалектности носителей. Совершенствование словаря нераспознанных лексем и создание грамматического словаря на основе всех слов корпуса. Сравнение лексических и фонетических показателей. Улучшение интерфейса для работы со словарем.
Рубрика | Иностранные языки и языкознание |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 01.07.2017 |
Размер файла | 106,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Данная работа посвящена Устьянскому звуковому корпусу. Основные направления работы касаются диалектологии и лексикографии. Работа охватывает широкий круг задач: от подсчета диалектности информантов до создания грамматического словаря, включающего в себя все слова из корпуса.
В первом разделе описан процесс измерения диалектности, который производился с помощью программы на языке Python. Результаты показали, что особой корреляции между возрастом носителя и его диалектностью у представителей "среднего" поколения нет, но самое старшее поколение (1922-1930 годов рождения) более диалектное по сравнению с остальными, а особенно с младшим поколением. Однако выделились инновационные и консервативные носители диалекта. Это информанты старшего поколения, использующие большее количество диалектных слов, чем другие представители этого же поколения, или представители более молодого поколения, использующие большое количество диалектной лексики. Результаты измерения лексической диалектности сравнивались с результатами, представленными в работах (Daniel et al. 2017) и (Левин 2014). В этих работах также были отмечены консервативные и инновационные носители. Кроме того, был создан частотный список, который позволяет увидеть, какие словоформы употребляются носителями чаще всего и каким количеством носителей.
Вторая часть работы сосредоточена на словаре нераспознанных лексем, который был создан в работе (Калашникова 2016). В словарь были добавлены новые толкования из обновленного "Устьянского народного словаря", кроме того, были улучшены собственные толкования, которые уточнялись в поездке в поселок Октябрьский Архангельской области.
В третьей части описан процесс создания грамматического словаря. Самым важным в создании словаря был выбор морфологического анализатора, поэтому выбор описан и обоснован достаточно подробно. Кроме того, были произведены улучшения интерфейса сайта, где располагаются словарь нераспознанных лексем и грамматический словарь. Оба словаря доступны по ссылке http://pushkinodict.pe.hu/.
Все задачи, решенные в данной работе, имеют значение для будущих исследований устьянского диалекта. Так, подсчет диалектности позволит иметь точные данные для всех носителей, и диалектность информантов не придется прикидывать. Улучшение словаря нераспознанных лексем необходимо не только для будущих исследований, но и для пользователей корпуса, так как позволит видеть определения неизвестных слов с ссылками на полные контексты. И, наконец, грамматический словарь может оказаться полезным, так как в нем можно увидеть парадигмы всех слов, вошедших в корпус.
Список использованных источников и литературы
1. Даниэль М.А., Добрушина Н. Р., фон Вальденфельс Р. Говор бассейна Устьи. Корпус севернорусской диалектной речи. Берн, Москва. 2013-2014. Электронный ресурс. http://slavist.de/Pushkino/login.php
2. Истомин А.А., Мамонов В.П., Силин В.П. и др. Устьянский народный словарь. П. Октябрьский, 2013.
3. Калашникова 2016 - Д.Б. Калашникова. Словарь к звуковому корпусу устьянского диалекта. Курсовая работа. М., 2016.
4. Левин 2014 - И.С. Левин. Реализация ударного этимологического* к между мягкими согласными в говоре Устьянского района Архангельской области. // Е. М. Девяткина (ред.) Проблемы языка: Сборник научных статей по материалам Третьей конференции-школы "Проблемы языка: взгляд молодых ученых". М., 2014.
5. Ляшевская и др. 2010 - Ляшевская О. Н., Астафьева И., Бонч-Осмоловская А. А., Гарейшина А., Гришина Ю., Дьячков В., Ионов М., Королева А. Н., Кудринский М., Литягина А., Лучина Е., Сидорова Е., Толдова С. Ю., Савчук С. О., Коваль С. А. Оценка методов автоматического анализа текста: морфологические парсеры русского языка // Компьютерная лингвистика и интеллектуальные технологии. По материалам ежегодной Международной конференции "Диалог". Вып. 9 (16) - М.: РГГУ, 2010. С. 318-326.
6. Сичинава 2002 - Д.В. Сичинава. К задаче создания корпусов русского языка //Электронная публикация: http://www. mccme.ru/ling/mitrius/article.html. - 2002.
7. Daniel et al. 2017 (submitted) - M. Daniel, N. Dobrushina, P. Kazakova, E. Gerasimenko, D. Ignatenko, E. Makhlina, M. Ovsjannikova, S. Say, I. Shurov, A. Ter-Avanesova, M. Tsfasman, S. Verhees, A. Vinyar, R. von Waldenfels, V. Zhigulskaya. Dialect loss in the Russian North: modelling change across variables (submitted to publication).
8. Heeringa, Braun 2003 - W. Heeringa, A. Braun. The Use of the Almeida-Braun System in the Measurement of Dutch Dialect Distances. Computers and the Humanities, 37(3). P. 257-271.
9. Heeringa, Gooskens 2003 - W. Heeringa, C. Gooskens. Norwegian Dialects Examined Perceptually and Acoustically. Computers and the Humanities, 37(3). P. 293-315.
10. Kondrak 2003 - G. Kondrak. Phonetic Alignment and Similarity. Computers and the Humanities, 37(3). P. 273-291.
11. Nerbonne, Kleiwg 2003 - J. Nerbonne, P. Kleiweg. Lexical Distance in LAMSAS. Computers and the Humanities, 37(3). P. 339-357.
12. Nerbonne, Kretzschmar 2003 - J. Nerbonne, W. Kretzschmar. Introducing Computational Techniques in Dialectometry. Computers and the Humanities, 37(3). P. 245-255.
13. Palander et al. 2003 - M. Palander, L. Opas-Hдnninen, F. Tweedie. Neighbours or Enemies? Competing Variants Causing Differences in Transitional Dialects. Computers and the Humanities, 37(3). P. 359-372.
14. R. v Waldenfels et al. 2014 - Ruprecht von Waldenfels, Michael Daniel, Nina Dobrushina Why Standard Orthography? Building the Ustya River Basin Corpus, an online corpus of a Russian dialect. Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции "Диалог". Вып. 13 (20) - М., 2014.
15. Segalovich 2003 - I.A. Segalovich. Fast Morphological Algorithm with Unknown Word Guessing Induced by a Dictionary for a Web Search Engine. // MLMTA. - 2003. - P. 273-280.
16. Speelman et al. 2003 - D. Speelman, S. Grondelaers, D. Geeraerts. Profile-Based Linguistic Uniformity as a Generic Method for Comparing Language Varieties. Computers and the Humanities, 37(3). P. 317-337.
Приложение 1
Таблица 5. Диалектность информантов (по возрастанию года рождения).
Информант |
Количество диалектных слов |
Общее количество слов |
Диалектность, % |
|
мит1926 |
136 |
6001 |
2,266288952 |
|
епл1926 |
212 |
10655 |
1,989676208 |
|
еве1950 |
92 |
4648 |
1,979345955 |
|
авм1922 |
325 |
17660 |
1,840317101 |
|
анс1925 |
363 |
20349 |
1,783871443 |
|
пфп1928 |
457 |
25950 |
1,761078998 |
|
сек1930 |
405 |
23136 |
1,750518672 |
|
авч1930 |
71 |
4125 |
1,721212121 |
|
лпп1928 |
43 |
2915 |
1,475128645 |
|
авт1928 |
73 |
4956 |
1,472962066 |
|
мик1922 |
160 |
11044 |
1,448750453 |
|
впч1930 |
19 |
1349 |
1,408450704 |
|
аит1954 |
146 |
10751 |
1,358013208 |
|
лсо1941 |
289 |
21471 |
1,346001584 |
|
мпс1935 |
136 |
10420 |
1,305182342 |
|
звк1941 |
10 |
782 |
1,278772379 |
|
мгб1949 |
181 |
15240 |
1,187664042 |
|
нпо1954 |
70 |
6114 |
1,144913314 |
|
опш1935 |
126 |
11018 |
1,143583227 |
|
ляп1953 |
71 |
6517 |
1,08945834 |
|
кип1931 |
37 |
3744 |
0,988247863 |
|
ппп1955 |
80 |
8524 |
0,938526513 |
|
егп1928 |
165 |
18634 |
0,885478158 |
|
мдн1933 |
151 |
17349 |
0,870367168 |
|
няе1952 |
30 |
3532 |
0,849377123 |
|
иип1951 |
63 |
7516 |
0,838211815 |
|
нвт1952 |
121 |
14648 |
0,826051338 |
|
вкч1966 |
59 |
7734 |
0,76286527 |
|
ппп1947 |
40 |
5637 |
0,709597304 |
|
офш1952 |
79 |
11189 |
0,706050585 |
|
ндо1958 |
84 |
12275 |
0,684317719 |
|
лгп1947 |
143 |
21055 |
0,679173593 |
|
анп1929 |
10 |
1498 |
0,667556742 |
|
нвл1939 |
17 |
2730 |
0,622710623 |
|
тан1937 |
18 |
3298 |
0,545785324 |
|
юап1969 |
7 |
1414 |
0,495049505 |
|
пнп1950 |
17 |
3585 |
0,474198047 |
|
ипм1956 |
28 |
6557 |
0,427024554 |
|
фдл1954 |
7 |
1700 |
0,411764706 |
|
вап1963 |
41 |
10778 |
0,380404528 |
|
нвп1958 |
1 |
271 |
0,36900369 |
|
нап1974 |
14 |
3987 |
0,351141209 |
|
ннт1960 |
38 |
13190 |
0,288097043 |
|
лнп1952 |
13 |
5760 |
0,225694444 |
|
свп1975 |
16 |
7307 |
0,218968113 |
|
нис1958 |
5 |
2338 |
0,213857998 |
|
мяп1951 |
25 |
12464 |
0,200577664 |
|
нпо1965 |
30 |
14959 |
0,200548165 |
|
гвп1949 |
22 |
10976 |
0,200437318 |
|
ффп1952 |
15 |
7603 |
0,197290543 |
|
нфм1961 |
22 |
11628 |
0,189198486 |
|
ави1958 |
4 |
2156 |
0,185528757 |
|
гбс1951 |
2 |
1252 |
0,159744409 |
|
свп1970 |
6 |
4113 |
0,14587892 |
|
вдк1947 |
9 |
6290 |
0,143084261 |
|
xxx |
1 |
761 |
0,131406045 |
|
ент1968 |
6 |
4567 |
0,131377272 |
|
ваб1971 |
5 |
4370 |
0,114416476 |
|
няр1948 |
0 |
799 |
0 |
|
ххх1956 |
0 |
440 |
0 |
|
ввс1956 |
0 |
17 |
0 |
|
афш1958 |
0 |
1397 |
0 |
|
аэи1973 |
0 |
59 |
0 |
|
иит1991 |
0 |
410 |
0 |
|
анп1995 |
0 |
3669 |
0 |
|
всп1996 |
0 |
1689 |
0 |
|
default |
0 |
3 |
0 |
|
xxx2 |
0 |
35 |
0 |
|
wife |
0 |
39 |
0 |
|
Дима (внук) |
0 |
57 |
0 |
|
Сноха |
0 |
17 |
0 |
|
ахш |
0 |
67 |
0 |
|
нxм |
0 |
348 |
0 |
|
Всего |
4816 |
501536 |
Приложение 2
Таблица 6. Частотный список (100 вхождений).
Слово |
Количество употреблений |
Количество информантов |
|
эво |
374 |
37 |
|
дедко |
125 |
18 |
|
робили |
106 |
16 |
|
сейгод |
89 |
24 |
|
робил |
86 |
20 |
|
порато |
74 |
24 |
|
робит |
72 |
17 |
|
экой |
71 |
21 |
|
робила |
65 |
20 |
|
тамоки |
62 |
8 |
|
эко |
60 |
19 |
|
этто |
55 |
14 |
|
эва |
45 |
16 |
|
робят |
39 |
10 |
|
люля |
33 |
1 |
|
тутоки |
32 |
8 |
|
починок |
31 |
5 |
|
мезонька |
30 |
6 |
|
видко |
29 |
15 |
|
экого |
29 |
11 |
|
проводины |
28 |
10 |
|
угор |
27 |
13 |
|
угоре |
27 |
17 |
|
евонная |
26 |
12 |
|
нали |
25 |
14 |
|
мезоньки |
23 |
4 |
|
божатка |
22 |
5 |
|
евонный |
22 |
14 |
|
зароды |
22 |
11 |
|
эвон |
22 |
9 |
|
ноне |
21 |
3 |
|
откуль |
20 |
6 |
|
гонили |
19 |
13 |
|
ростили |
19 |
11 |
|
двоимя |
17 |
11 |
|
поветь |
17 |
10 |
|
примерли |
17 |
4 |
|
оттуль |
16 |
7 |
|
эких |
16 |
13 |
|
бает |
15 |
4 |
|
ревит |
15 |
6 |
|
тогды |
15 |
7 |
|
запань |
14 |
4 |
|
евонные |
13 |
10 |
|
никуды |
13 |
7 |
|
перёд |
13 |
8 |
|
щёлок |
13 |
3 |
|
зарод |
12 |
7 |
|
садим |
12 |
5 |
|
выгонить |
11 |
4 |
|
заробишь |
11 |
6 |
|
поробила |
11 |
6 |
|
церквы |
11 |
5 |
|
дерёва |
10 |
4 |
|
дровнях |
10 |
7 |
|
зобеньки |
10 |
3 |
|
кудреватый |
10 |
2 |
|
недалёко |
10 |
10 |
|
пестерь |
10 |
3 |
|
робишь |
10 |
3 |
|
угоры |
10 |
5 |
|
эку |
10 |
7 |
|
вечеровки |
9 |
5 |
|
выруба |
9 |
4 |
|
голодовали |
9 |
6 |
|
кажут |
9 |
3 |
|
когды |
9 |
5 |
|
кросна |
9 |
4 |
|
накладёшь |
9 |
3 |
|
пестики |
9 |
3 |
|
татка |
9 |
3 |
|
ушаты |
9 |
4 |
|
баять |
8 |
3 |
|
карбас |
8 |
5 |
|
козлух |
8 |
4 |
|
накладешь |
8 |
6 |
|
парничка |
8 |
6 |
|
подсанки |
8 |
4 |
|
пожни |
8 |
2 |
|
евонное |
7 |
4 |
|
ейный |
7 |
5 |
|
картофь |
7 |
3 |
|
лык |
7 |
5 |
|
молодицей |
7 |
5 |
|
парничок |
7 |
4 |
|
робь |
7 |
7 |
|
смольнички |
7 |
1 |
|
сморода |
7 |
4 |
|
сробил |
7 |
3 |
|
сядко |
7 |
2 |
|
тачанку |
7 |
2 |
|
угонили |
7 |
5 |
|
угора |
7 |
6 |
|
баем |
6 |
1 |
|
баю |
6 |
3 |
|
голубника |
6 |
1 |
|
евонна |
6 |
5 |
|
заробила |
6 |
5 |
|
заробить |
6 |
5 |
Размещено на Allbest.ru
...Подобные документы
Концепция словаря. Лексикографический параметр как способ лексикографической интерпретации какого-то структурного элемента. Элементы авторской установки словаря. Тематический порядок расположения лексических статей. Фонетическая характеристика вокабулы.
презентация [1,7 M], добавлен 22.11.2013Понятие системности словаря (структурные типы слов, семантическая и стилистическая дифференциация лексики). Пути развития и пополнения словарного состава языка. Свободные словосочетания и фразеологические единицы.
шпаргалка [40,2 K], добавлен 22.08.2006Постать Б. Грінченка як різнопланового діяча. Традиційні методи упорядкування довідкових видань. Основна організаційно-творча робота над "Словарем української мови". Використання "Словаря української мови" Бориса Грінченка у сучасній лексикографії.
курсовая работа [1,1 M], добавлен 10.06.2011Проблема формирования словника кросскультурного терминологического словаря. Лингвистический, логико-понятийный, лексикографический подходы к объективному отбору лексических единиц, их достоинства и недостатки. Составление системной классификации терминов.
статья [222,2 K], добавлен 20.08.2013Понятие "общественно-политическая лексика". Слова и словосочетания, принадлежащие к ядру ОПЛ. Общеупотребительная лексика как костяк общенационального литературного словаря. Клише и штампы как речевые стереотипы. Стилистически окрашенная лексика.
курсовая работа [35,3 K], добавлен 05.05.2009Лексика с точки зрения ее происхождения и употребления. Исследование лексикона учащихся 8-11 классов МКОУ "Буравцовская СОШ" и определение путей пополнения словарного запаса школьников. Создание школьного словаря современного молодежного сленга.
курсовая работа [102,0 K], добавлен 11.01.2015История создания "Толкового словаря живого великорусского языка" В. Даля. Содержание словаря: основные условные сокращения, орфоэпия, лексика литературного языка и местных диалектов; афоризмы с толкованием; иностранные термины; грамматические трудности.
презентация [1,1 M], добавлен 16.02.2014Определение "варваризмов" как иноязычных слов и выражений, используемых в речи при описании реалий и обычаев других народов. Создание словаря для облегчения понимания поэтического языка Пушкина и толкования иноязычных слов. Структура словарной статьи.
контрольная работа [14,9 K], добавлен 26.12.2011Терминология - словарное ядро языка науки. Систематизация терминологической лексики, упорядочение и унификация. Формирование словника словаря терминов. Словарь военной терминологии периода Второй мировой войны (на основе "Дневника боевых действий").
курсовая работа [80,0 K], добавлен 19.12.2015Выборка лексических единиц согласно оценочной шкале утилитарной оценки. Анализ слов, имеющих утилитарную оценку подгруппы "полезный", выбранных методом сплошной выборки с целью сравнения грамматического распределения лексики в русском и английском языках.
реферат [20,6 K], добавлен 27.10.2012Сущность слова, его многозначность. Особенности лексических средств. Лексика с точки зрения употребления и происхождения. Анализ ошибок в употреблении синонимов и паронимов. Речевые ошибки, возникающие при нарушении правил лексической сочетаемости.
курсовая работа [43,3 K], добавлен 07.06.2011Особенность словарной работы в школе. Работа учащихся над словарем. Организация уроков русского языка в начальных классах при проведении лексической работы. Организация практической деятельности по лексической работе. Формирование фонематического слуха.
курсовая работа [55,6 K], добавлен 10.08.2013Детские годы Ожегова и обучение в Петроградском университете. Работа над толковым словарем совместно с Ушаковым. Отбор лексического и фразеологического материала для краткого словаря. Исследование истории русского литературного языка и социолингвистики.
реферат [19,1 K], добавлен 04.03.2010Парадигматические отношения в лексической системе современного русского языка. Типы контекстов и соотношение факторов, влияющих на формирование лексических значений слов в их контекстном окружении. Сочетаемость исследуемых лексических единиц и их функции.
дипломная работа [90,3 K], добавлен 11.10.2014Выполнение высококвалифицированных переводов. Правильное и полное понимание текста и его значение для перевода. Особенности двуязычных словарей. Сочетания слов в словарях. Переводы однозначного слова при помощи двух или более слов, близких по значению.
лекция [42,9 K], добавлен 30.10.2013Особенности словаря молодежного социолекта, понятия "сленг" и "жаргон"; стилистические кластеры сниженной лексики, причины употребления. Выявление функциональной нагрузки и источников пополнения сниженной лексики немецкого языка в молодежном сленге.
курсовая работа [45,9 K], добавлен 06.03.2012Экстралингвистические основы изучения говора села Шабельское, методы сбора диалектного материала. Общая характеристика кубанских говоров. Интровертный словарь говора как источник диалектного материала. Типология диалектизмов и микротопонимы в говоре.
дипломная работа [189,5 K], добавлен 10.11.2015Применение английских слов в японском языке, создание алфавита "катакана" для написания заимствованных слов. Возникновение неологизмов на основе английской лексики. Использование структурных моделей англицизмов и распространенные способы словообразования.
статья [21,2 K], добавлен 19.12.2010Изучение состава морской речи: терминов, языковой экономии и жаргона. Специфика команд и приказов на флоте, а также лексикона моряков. Структура языка и словообразование в нём. Создание немецко-русского словаря морской терминологии, разбитого по темам.
курсовая работа [58,4 K], добавлен 27.12.2011Сопоставление лексем с партитивной семантикой, обозначающих отношения "части и целого" в русском и польском языках. Выявление фонетических и грамматических особенностей партитив. Грамматические особенности и распределение лексем по семантическим группам.
курсовая работа [47,7 K], добавлен 10.11.2013