Автоматическое определение ударения с помощью различных методов анализа слова
Анализ закономерностей русского языка с точки зрения применимости в сфере автоматической расстановки ударений. Ознакомление с фонетическими правилами и их связью с орфографическими ошибками. Изучение морфем, которые указывают на поведение ударения.
Рубрика | Иностранные языки и языкознание |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 28.12.2015 |
Размер файла | 84,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Оглавление
Введение
1. Теоретический аспект поведения ударений в русском языке
1.1 Общая информация о системе ударений русского языка
1.2 Становление и историческое развитие системы в русском языке
2. Анализ закономерностей русского языка с точки зрения применимости в сфере автоматической расстановки ударений
2.1 Морфемы, указывающие на поведение ударения
2.1.1 Поведение ударения в существительных
2.1.2 Поведение ударения в глаголах
2.1.3 Поведение ударения в прилагательных
2.1.4 Поведение ударения в других частях речи
2.1.5 Пример реализации алгоритма автоматической расстановки ударений, использующий морфемные характеристики слова
2.2 Фонетические правила и их связь с орфографическими ошибками
3. Архитектура программного обеспечения
3.1 Предобработка текста
3.2 Формирование ключей
3.3 Обработка слов с несколькими возможными ударениями
3.4 Выбор правильного варианта написания
3.5 Формирование финальных результатов
4. Результаты работы программы
Заключение
Литература
Введение
Большинство программ, которые сталкиваются с задачей расстановки ударений в слове, используют внешние ресурсы, такие как, например, словари или специальные базы данных. Тем не менее, этот способ представляется не самым эффективным, поскольку в основу расстановки ударений изначально ложится ручной труд. До сих пор практически не существует программного обеспечения, которое было бы способно с достаточной точностью самостоятельно расставлять ударения вместо того, чтобы прибегать к помощи сторонних ресурсов. Данная работа, напротив, посвящена подробному рассмотрению факторов, влияющих на расположение ударения в слове, а также описанию программы, которая способна автоматически эти ударения расставлять. В рамках исследования были рассмотрены такие факторы, как правила расстановки ударения в разных частях речи, а также самоударные, левоударные и правоударные морфемы. В дополнение был использован инновационный метод, который позволил определить местоположения ударения в слове на основе орфографических ошибок в гласных. Метод основан на связанности фонетических правил русского языка с ударением посредством редукции гласных.
Объектом исследования являются способы нахождения ударения в тексте с возможным наличием грамматических ошибок. В качестве предмета исследования было взято автоматическое определение ударения с помощью различных методов анализа слова.
Цель данной работы состоит в том, чтобы создать программное обеспечение, способное автоматически определять ударение в слове. В тех случаях, когда это невозможно сделать, программа должна предложить список слогов, где постановка ударения наиболее вероятна. В рамках этой цели было поставлено несколько задач. Первая задача заключается в изучении достижений акцентологии и сборе информации в области ударения. Вторая задача состоит в нахождении и изучении косвенных факторов, указывающих на расположение ударения в слове. Третья задача включает в себя построение архитектуры программного обеспечения и написание кода. И, наконец, четвертая задача представляет собой сбор и анализ результатов работы программы.
Теоретическая значимость исследования заключается в развитии существующих алгоритмов акцентуации, в то время как практическая значимость состоит в формировании более результативных программ для расстановки ударений. Наличие таких программ, безусловно, востребовано: системы синтеза речи развиваются высокими темпами, и в ближайшем будущем подобные технологии будут использоваться во все большем круге задач. Данная работа претендует на то, чтобы стать составной частью будущих более сложных программ, поскольку расстановка ударений является одной из важнейших составляющих подготовки текста к голосовому воспроизведению. Еще одной возможной областью применения данной технологии является расширение существующих словарей неологизмами. На выходе программа выдает список слов с расставленными ударениями (для тех случаев, когда программа не смогла точно определить ударение, будут указаны места, где ударение точно находиться не может). Таким образом, при совместном использовании такой программы и специализированного программного обеспечения для сбора данных, принимающего на вход те слова из первой программы, которые не встретились в словарях, становится возможным автоматизированное создание словарных статей по встретившимся неологизмам.
Тема автоматического определения местоположения ударения до сих пор недостаточно исследована, а следовательно нуждается в дальнейшей разработке и является актуальной. Так, до сих пор практически не существует алгоритмов, способных с высокой точностью определить местоположение ударения в слове без использования словарей. Единственной найденной работой по данной тематике является статья О. Г. Хомицевича, С. В. Рыбина, А. О. Таланова и И. В. Опарина «Автоматическое определение места ударения в незнакомых словах в системе синтеза речи». В данной статье подробно рассмотрен алгоритм работы системы синтеза речи «VitalVoice». Тем не менее, здесь стоит учесть, что ввиду запутанной системы ударений русского языка (см. раздел 2.1), невозможно создать программу, которая однозначно расставляла бы ударения во всех встретившихся словоформах. Не стоит забывать и о технических сложностях: некоторые слова могут быть недостаточно частотными для того, чтобы составить по ним схему ударений на основании орфографических ошибок, а также не иметь стандартных морфем, указывающих на поведение ударения в слове. Кроме того, в ряде словоформ наблюдается колебание литературной нормы, вследствие чего даже люди не всегда способны правильно определить место ударения в слове. Именно ввиду таких случаев задача автоматической расстановки ударений сопряжена с рядом трудностей. Тем не менее, данное исследование предлагает возможности для улучшения уже существующих алгоритмов и может послужить основой для дальнейших работ в этом направлении.
Исследование проводится на корпусах блогов русскоязычных интернет-ресурсов и преимущественно направлено на работу со словами с орфографическими ошибками в гласных, поскольку тексты этого корпуса не подвергались литературной правке.
Теоретическую основу дипломной работы составляют работы известных ученых и исследователей, таких как А. А. Зализняк, Н. А. Федянина, С. М. Кузьмина и Н. Ю. Шведова.
Структура дипломной работы обусловлена целью и задачами исследования. Работа состоит из введения, четырех глав и заключения.
В первой главе раскрывается теоретический аспект поведения ударений в русском языке. Рассматриваются ключевые особенности русского ударения - разноместность и подвижность. Дается обзор истории и достижений русской акцентологии, а также системы ударений древнеславянских языков и ее развития.
Вторая глава посвящена анализу акцентных закономерностей русского языка. Выявляются два фактора, способные помочь в определении местоположения ударения, и дается их всестороннее описание в рамках задачи.
В третьей главе описывается архитектура программного обеспечения, созданного по результатам исследования. Подробно расписываются все этапы, которые проходит корпус текстов, превращаясь в таблицы составляющих его словоформ с отмеченными ударными гласными (для случаев, когда это возможно).
В четвертой главе производится оценка работы программы: составляется статистика результатов, анализируются возникшие ошибки в определении местоположения ударений и выявлении правильных вариантов написания словоформ. Также проводится обзор сильных сторон программы.
1. Теоретический аспект поведения ударений в русском языке
1.1 Общая информация о системе ударений русского языка
Русский язык в мировой среде признается одним из самых сложных для изучения языков. Одним из определяющих факторов этой сложности является ударение. В отличие от языков, где ударение четко закреплено за одним из слогов (как, например, в чешском или в французском языках), в русском языке оно является разноместным и подвижным. Разноместность ударения проявляется в том, что его место не прикреплено к одному определенному слогу или к определенной морфологической части слова. Подвижность ударения выражается в том, что его место в каждом отдельном слове не закреплено на определенном слоге. Иными словами, при словоизменении ударение переносится с одного слога на другой. Именно это и создает целый класс дополнительных проблем, связанных с необходимостью запоминать ударение не только в слове, но и в каждой отдельной его форме.
Однако нельзя утверждать, что способность носителей русского языка правильно определить место ударения основана лишь на запоминании словоформ, поскольку количество словоформ огромно. Кроме того, средний русский человек без труда сможет поставить ударение и в практически любом незнакомом ему слове. Отсюда можно сделать вывод, что бытовые, повседневные слова, безусловно, запоминаются носителем вместе с ударением, однако при необходимости поставить ударение в словах менее тривиальных задействуются правила системы ударений русского языка, выученные носителем на примере других слов. Из этого явно следует, что существуют определенные закономерности в том, как устроена акцентуация в русском языке. Тем не менее, современное русское ударение организовано чрезвычайно сложно и все его закономерности не могут быть сформулированы в виде набора простых фраз или тезисов, покрывающих всю систему ударений в русском языке.
Отечественная лингвистика начала интенсивно заниматься вопросом ударения во второй половине XX века; ранее этот вопрос также изучался, но занимал незначительное место в русском языкознании. Таким образом, акцентология на данный момент гораздо менее развитая область, нежели другие типы грамматики. Однако уже сейчас вопросы ударения играют немалую роль в системе языкознания и, в частности, в современной русистике. За минувшие полвека было создано немало описаний и словарей, в том числе и орфоэпических, отражающих современное литературное произношение и норму ударения. Одним из ярких образцов такого словаря является «Орфоэпический словарь русского языка: произношение, ударение, грамматические формы», в котором под руководством Н. А. Еськовой была разработана шкала нормативности - тонкая система градаций, оценок разных форм и разных ударений с точки зрения их нормативного статуса.
Возвращаясь к вопросу сложности и неоднозначности русского ударения, приведем в пример словоформу передало, прокомментировав варианты его ударения с точки зрения шкалы нормативности. Оказывается, что все четыре варианта ударения этого слова встречаются в русской речи, однако каждое из них имеет свою стилистическую и оценочную характеристику. Литературная норма требует ударения на первом слоге (пе?редало); ударение на третьем слоге (переда?ло) не является литературным, однако же литературной нормой допускается. Ударение на последнем слоге (передало?) литературная норма в себя уже не включает, однако в связи с широким его употреблением данное слово часто встречается в орфоэпических словарях с пометой «не рекомендуется». Ударение на второй слог (пере?дало) является ударением диалектным, но и оно также встречается в речи. На этом примере можно увидеть, насколько вариативна в некоторых случаях может быть русская речь с точки зрения ударения.
Другим примером является словоформа позвонит, литературной нормой которого является форма позвони?т, тогда как другая форма, позво?нит, согласно орфоэпическому словарю под редакцией Р.И. Аванесова, не рекомендована. Как читателю должно быть известно, форма позвони?т является устаревающей нормой произношения, а ведь еще в XX веке (что с точки зрения нормы языка было совсем недавно) она была единственной произносительной нормой и не имела аналогов. Оглядываясь на другие подобные слова, с которыми произошел подобный перенос ударения от суффикса к основе (ср., научи?т и нау?чит, лови?т и ло?вит, терпи?т и те?рпит и т.д.), можно с практически стопроцентной уверенностью сказать, что и в словоформе позвонит произойдет подобный перенос.
Как было показано выше, литературная норма со временем изменяется. Так, около четырехсот лет назад некоторые современные формы слов считались грубыми и вульгарными, однако со временем именно эти формы вошли в норму. Так что градация соответствия словоформы литературной норме в орфоэпических словарях представляет собой не что иное, как соотношение разных хронологических срезов. Иными словами, некоторые варианты произношения на данный момент используются только лишь старшим поколением, тогда как младшие поколения придерживаются уже новой акцентной парадигмы. В таких случаях в орфоэпических словарях в качестве нормы отмечается и новая произносительная норма, и старая (с пометой «допустимо, устаревшее»). Очевидно, что устаревающая норма скоро перестанет употребляться и отпадет. К примеру, всего полвека назад словари давали однозначное ударение словам паспо?рт, транспо?рт, принци?п, но к настоящему моменту ударение в этих словах окончательно переместилось на первый слог, а произносительные нормы с ударением на второй слог исчезли из словарей.
Помимо практической стороны, существует еще чисто лингвистическая сторона вопроса: попытки понять, что собой представляет механизм ударения в целом. Литературная норма - вещь очень тонкая, она не является только лишь следствием лингвистических законов. Несомненно, такие законы играют свою роль в формировании и русского ударения, и русского склонения, и других свойств русского языка, однако даже отдельное слово может подвергнуться каким-либо индивидуальным влияниям в ходе истории русского языка (вплоть до влияния какого-нибудь известного писателя или оратора). Все это приводит к тому, что норма оказывается очень индивидуальной, а следовательно даже очень похожие друг на друга слова могут иметь разные ударения.
При попытках понять, что же именно собой представляет механизм ударения и как он устроен в современном русском языке, ученые пришли к одному не самому очевидному заключению: эффективное изучение и описание современного русского ударения правильнее начинать с древности. Может показаться, что древнерусский язык содержит всего лишь старые сведения об ударениях, которые уже не являются актуальными, однако в действительности это не так. Дело в том, что в древнерусском языке XI-XII веков существовала весьма стройная, во всяком случае, гораздо более стройная, чем сейчас, система ударений, характеризующаяся простыми правилами. Однако на протяжении последующего тысячелетия происходили изменения сложившейся системы, которые затронули определенную часть старых правил постановки ударений. Возможно, если бы это изменение совершилось бы полностью, перед нами снова была бы некоторая стройная система, с какими-то новыми правилами, которые бы, однако, тоже отличались бы простотой и не были бы настолько запутанными по сравнению с тем, какие они сейчас. В текущий момент русский язык обладает системой неизмеримо более сложной, нежели система, существовавшая когда-то в древнерусском языке, поскольку большинство изменений представляют собой промежуточные состояния, которые, как правило, являются конфликтными и компромиссными, обладают запутанными правилами и противоречат друг другу. Это является главной причиной сложности изучения ударений. Тем не менее, разобраться в этом возможно, если идти последовательно от понимания древнерусской системы ударений через все основные тенденции, которые ведут к тому, чтобы эта система изменялась.
1.2 Становление и историческое развитие системы ударений в русском языке
Данный раздел посвящен описанию системы ударений в древнерусском языке, также в нем описываются основные закономерности развития акцентной системы русского языка. Раздел основывается на материалах из расшифровки лекции А. А. Зализняка «Из русского ударения», большинство примеров древнерусских слов, встречающихся в данном разделе, взяты из нее же. русский ударение фонетический орфографический
XI-XII века были временем, когда еще никаких новых ударений не появилось, а все найденные тексты с проставленными ударениями выявляли одни и те же тенденции к постановке ударений. Так, например, все глагольные формы с суффиксом -и- несли ударение именно на этом суффиксе (терпи?шь, лови?шь, научи?шь). Лишь потом начал происходить длительный процесс, во время которого в глаголах старое ударение начало переходить с суффикса на корень слова.
В древних славянских языках каждая морфема языка имела свою акцентную характеристику. Разделялось два класса подобных характеристик, каждый со своей маркировкой: класс сильных (с точки зрения ударения) морфем, обозначающийся маркировкой «+», и класс слабых морфем, обозначающийся маркировкой «-». Класс сильных морфем, в свою очередь, делился на два подкласса: с маркировкой самоударности (v) и с маркировкой правоударности (>). Самоударность обозначала падение ударения на морфему, обладающую данной характеристикой, тогда как правоударность указывала на то, что ударение падает на морфему, находящуюся справа. Изложенная парадигма является фундаментальным тезисом концепции, созданной в середине XX века такими выдающимися лингвистами, как В.М. Иллич-Свитычем, В.А. Дыбо и К. Стангом. Теория, изложенная ими на основании этой концепции, состоит, прежде всего, в том, что каждая морфема в древних славянских языках могла быть охарактеризована одним из трех способов: способом самоударности, способом правоударности и минусовым состоянием. Теория работает, подчиняясь единому правилу, полностью покрывающему все словоформы древнерусского языка, что чрезвычайно важно, поскольку в современном языке нет такого правила, которое могло бы покрыть весь массив слов. Единое правило формулируется так: «Ударение привязано к первой, т. е. к самой левой сильной морфеме. Если она самоударная, то ударение падало прямо на нее, если правоударная, то ударение в нормальном случае падало на следующий слог. Если же в словоформе ни одной сильной морфемы нет, то ударение падало на первый слог».
Для большей наглядности стоит привести пример [http://elementy.ru/lib/432371]: морфема дом в древнерусском языке была минусовой, то есть слабой; морфема стол была сильной правоударной; морфема мак - сильно самоударной. Рассмотрим поведение этих морфем в контексте других морфем и словоформ.
Согласно правилу, при присоединении к минусовому корню дом минусовой морфемы -у получим словоформу до?м-у, при присоединении минусового предлога на (все предлоги в древнерусском имели минусовую маркировку) получим словосочетание на? дом, при присоединении сильной самоударной морфемы -овъ получим дом-о?въ, наконец, при присоединении минусовой морфемы -ов- и сильной самоударной морфемы -ыхъ получим дом-ов-ы?хъ.
Теперь рассмотрим сильную правоударную морфему стол: при ее сочетании с минусовой морфемой -у получится словоформа стол-у?, при сочетании с предлогом на - на сто?л (поскольку морфема стол и так является самой правой, на нее и падает ударение), при сочетании с самоударной морфемой -овъ - стол-о?въ, а с минусовой морфемой -ов- и самоударной морфемой -ыхъ - стол-о?в-ыхъ.
Наконец, посмотрим на поведение последней из оставшихся морфем. Самоударная морфема мак в сочетании с минусовой морфемой -у дает словоформу ма?к-у, в сочетании с предлогом на - на ма?к, с самоударной морфемой -овъ - ма?к-овъ, наконец, с минусовой морфемой -ов- и самоударной морфемой -ыхъ - ма?к-ов-ыхъ.
Для удобства, все эти данные представлены в таблице:
Таблица 1. Поведение ударения в древнерусском языке
-у |
на |
-овъ |
-ов- и -ыхъ |
||
дом |
до?м-у - - |
на? дом - - |
дом-о?въ - v |
дом-ов-ы?хъ - - v |
|
стол |
стол-у? > - |
на сто?л - > |
стол-о?въ > v |
стол-о?в-ыхъ > - v |
|
мак |
ма?к-у v - |
на ма?к - v |
ма?к-овъ v v |
ма?к-ов-ыхъ v - v |
Те из слов, которые перешли из древнерусского языка в современный русский, сейчас значительно отличаются от того, как они произносились ранее (так, в словах с корнем -прав- ранее ударение всегда находилось на корне: пра?ва, пра?вила, пра?вота, пра?витель, пра?вительство). Именно это и является иллюстрацией того, что новые правила вторглись в старую систему, подвернув ее изменениям и рассыпав тот стройный ряд, который она имела первоначально. В каждом случае при вторжении в язык нового правила возникает конфликтная ситуация, если ударение, свойственное старой системе, не соответствует ударению, которое диктует это правило. Исторически можно пронаблюдать, что старое всегда постепенно уступает новому и спустя некоторый промежуток времени новое правило окончательно входит в язык. Самое принципиальное направление в структуре новых правил состоит в том, что происходит некоторая унификация ударений в группах слов или словоформ, которые оказываются в чем-либо сходными друг с другом (по грамматической форме, по суффиксу или даже по конечным звукам основы). При этом, как логично предположить, слова, находящиеся в меньшинстве, имеют тенденцию перенимать признаки большинства.
Рассмотрим несколько изменений, произошедших с языком и в значительной степени отклонивших его от старой системы. Первое изменение касается устранения ударения на предлогах. Как мы уже видели, в древнерусском языке у минусовых морфем (рука, вода) при сочетании с предлогом ударение переносилось на предлог. Однако это закономерно приводило к тому, что минусовые словоформы (руку, воду) обладали одним ударением, когда встречались в отрыве от предлога, и другим, когда употреблялись с ним. Тут ярко проявилась языковая тенденция к унификации, которая постепенно приводит к тому, что ударение в таких словах начинает ставиться на основе. В ряде случаев все еще допустимы оба варианта (за? руку и за ру?ку, на? воду и на во?ду), однако в ряде случаев старое ударение уже совершенно недопустимо (например, в словосочетании пе?ред домом). На текущий момент в русском языке осталось всего лишь порядка 150 существительных, которые допускают перенос ударения на предлог. Таким образом, старая система ударений была в значительной степени сломана исчезновением переноса ударения на предлог, ведь раньше это было абсолютной нормой для минусовых морфем.
Следующим изменением стало поведение приставок у глаголов с минусовым корнем. Следует уточнить, что приставки в глаголах и предлоги при именах существительных изначально являлись одними и теми же единицами, словами праязыка, которые могли соединяться и с существительными, и с глаголами. Соответственно, акцентное поведение приставок в точности совпадало с поведением предлогов, которое мы уже рассматривали выше. Для древнерусского языка являлось естественным, что ударение слов с минусовым корнем смещалось на предлог или, соответственно, на приставку. Однако с течением времени в ряде случаев у глаголов ударение переместилось с приставки на суффикс. Так, например, в словах проговори?л, недоговори?л, помяну?л и собра?л и многих других ударение сместилось. В других случаях ударение только движется к смещению, например, словоформа при?дал еще неокончательно вышла из употребления, а орфоэпические словари отмечают ее как допустимую, но устаревшую форму. Однако существуют и такие слова, которые только начали поддаваться воздействию этой тенденции (при?был, у?был).
Еще одна тенденция касается суффиксов: некоторые из них приобретают особую акцентную силу, заключающуюся в том, что они всегда несут на себе ударение. Согласно правилу, описанному выше, никакой суффикс не мог всегда нести на себе ударение, поскольку при самоударных корнях ударение всегда падало только на корень. Однако современный русский язык насчитывает уже десятки таких суффиксов. Таким, например, является суффикс вторичных несовершенных видов на -ать/-ять (управля?ть, поставля?ть), который всегда является ударным. Следовательно, это пример полной победы нового правила. Существуют и такие суффиксы, которую дают неполную победу: таковым, например, является суффикс -ивый. В современном русском языке существует два слова, которые до сих пор сохраняют свою исконную форму, это прилагательные ми?лостивый и юро?дивый.
Теперь стоит выяснить, что же происходит со словами, имеющими на конце даже не суффиксы, а ничего не значащие сочетания звуков (особенно это касается слов, которые были заимствованы в русский язык). Ударение сохраняется в тех случаях, когда это не мешает внутренним закономерностям русского языка. В случае же, если ударение противоречит закономерностям русского языка, то оно изменяет свое место в слове. Очень многие двусложные слова мужского рода, заимствованные в русский язык, имеют ударение на втором слоге, несмотря на то, что в языке, откуда они были заимствованы, они ударение падало на другой слог (база?р, фаса?д, шеде?вр). Кроме того, существует группа заимствованных слов на -рс, -рт и -кс, перед которыми стоит -и-, -у- или -е-, а также группа слов на -ус, -ис и -ер, для которых нормой является иметь ударение на первом слоге (ксе?рокс, ко?декс, тра?нспорт, ко?нкурс, гло?бус, по?люс, те?зис, ба?зис).
Таким образом, в данном разделе нами была рассмотрена система русских ударений с точки зрения истории. В первую очередь, было установлено, что русский язык когда-то был системой с простыми правилами, которые можно было описать одним тезисом и при этом покрыть всю систему ударений языка, а не лишь определенную его часть. Были установлены определенные закономерности развития акцентной системы, что позволило, во-первых, выяснить, что в русской акцентной системе наблюдаются тенденции к унификации словоформ с похожими грамматическим строем или с похожим звучанием, а во-вторых, через призму этих закономерностей увидеть то, что из себя представляет современный русский язык. Кроме прочего, было установлено, что существует ряд морфем, притягивающих ударение, о которых речь пойдет в следующей главе и которые лягут в основу практической реализации алгоритма автоматической расстановки ударений.
2. Анализ закономерностей русского языка с точки зрения применимости в сфере автоматической расстановке ударений
2.1 Морфемы, указывающие на поведение ударения
Поскольку акцентология изучает природу, особенности и функции ударения, она чрезвычайно близка к теме данной работы. Так, морфонологический раздел акцентологии ставит перед собой задачу установления связи наличия или отсутствия ударения с различными видами морфем и их сочетаний. С точки зрения морфонологии выделяется три типа морфем:
1. аутоакцентные (или самоударные), которые всегда требуют ударения (например, рус. вы-, -ёнок-, например, в словах вы?гнать, котёнок);
2. преакцентные (или правоударные), которые находятся в предударном положении (например, рус. по-, пред-, например, в словах попроси?ть, предупреди?ть);
3. постакцентные (или левоударные), которые следуют после ударения (например, рус. -ство, -тва, например, в словах семе?йство, би?тва).
Кроме того, именно акцентология занимается определением правил смещения ударения при словоизменении и словообразовании: так, при словоизменении слова зу?б ударение в ряде форм может сместиться на флексию (зубо?в, зуба?м), а при словообразовании формы вы?писать ударение может сместиться на корень (выпи?сывать).
Именно достижения акцентологии и легли в основу этого исследования. Особенно здесь хочется выделить первую главу книги А. А. Зализняка «От праславянской акцентуации к русской», также вошедшую в состав книги «Труды по акцентологии. Том I». В этой главе автор описывает акцентную систему современного русского языка, причем отдельное внимание уделяет аффиксам, применяя к ним технику акцентных маркировок, которые указывают на акцентуацию в рамках произвольной словоформы. Было выяснено, что для современного этапа развития русского языка преимущество в использовании такой техники намного меньше, чем для более ранних этапов, однако ее применение все еще оправданно при описании словообразования. Иными словами, используемая система акцентных маркировок используется для всех типов морфем кроме окончаний. Типов символов, использующихся в маркировках всего три:
Акцентная характеристика, указывающую на позицию ударения
1. v («самоударность») - ударение падает на саму гласную;
2. < («левоудареность») - ударение падает на гласную слева;
3. > («правоударность») - ударение падает на гласную справа, а если ее нет, то основа безударна (ударение падает на флексию).
Акцентная характеристика, указывающая на наличие доминантности (т.е. на преимущество некоторых морфем в борьбе за ударность). Доминантность маркируется символом D.
Символы, используемые в дополнительной части маркировки суффиксов:
1. Init - ударение ставится на первом слоге слова;
2. Monosyll - ударение изменяется при односложности основы;
3. Polysyll - ударение изменяется при неодносложности основы;
4. Marg - суффикс становится правоударным при маргинальной подвижности в производящем слове;
5. Triv - маргинально-подвижное ударение производящего слова трактуется как тривиальное;
6. Deox - флексионное ударение производящего слова трактуется как тривиальное.
Соответственно, если последовательно записать маркировки всех морфем, входящих в основу слова, можно получить цепь маркировок этой основы, при применении к которой базисного правила, можно определить, где именно в данном слове стоит ударение. Правило, согласно А. А. Зализняку, формулируется следующим образом:
1. Ударение привязано к самой правой морфеме, имеющей доминантность, но если таковой является морфема, имеющая маркировку >D и стоящая не последней в цепи, то ударение привязывается к следующей справа морфеме.
2. Если в цепи маркировок отсутствуют маркировки с D, то ударение привязывается к самой левой морфеме, имеющей маркировку v или <.
3. Если таких маркировок тоже не находится, то ударение привязывается к самой правой морфеме, имеющей маркировку >.
Как уже писалось выше, с использованием данного правила становится возможным определить места ударения в слове. Так, для слова бандити?зм, чертёжик, горо?шинка и слепы?ш акцентными характеристиками будут, соответственно, банд(v)-ит(vD)-изм(vD), черт(>)-ёж(>D)-ик(<), горош(v)-ин(v)-к(<)-(а) и слеп(>)-ыш(>) [примеры из (Зализняк 1985: 38)].
В рамках данной дипломной работы рассматриваться будет преимущественно маркировка суффиксов, поскольку именно суффиксы обладают наиболее сложной и запутанной классификацией. Здесь следует упомянуть, что большинство составных суффиксов дают тот же акцентологический эффект, что и совокупность простых суффиксов, имеющих то же звучание. Таким образом, составные суффиксы в акцентологическом плане приравниваются к соответственным последовательностям простых и отсутствуют в списках маркировок. Кроме того, рассматриваться будут не все суффиксы, упомянутые в работе А. А. Зализняка, а только те, которые соответствуют следующим характеристикам:
1. У суффикса нет отклонений от его акцентного класса (к примеру, у суффикса -ень, принадлежащему к классу <D Init, наблюдается небольшое отклонение в сторону маркировки >, ср. ба?ловень и сле?пень), если только эти отклонения не представлены лишь парой примеров;
2. Суффикс не колеблется между двумя классами (к примеру, у суффиксов -ар- и -яр-, относящихся к классу vD, в большой части слов также действует маркировка >D, ср. гонара?р и маля?р);
3. Суффикс не содержит омонимию с формами других суффиксов в косвенных падежах (ср. голуби?ка и зо?нтика);
4. Суффикс выступает в классе лишь в одном из значений (например, суффикс -ик-а принадлежит к классу vD только для названия ягод);
5. Суффикс не связан с силой базового компонента (так, в слове господи?н базовый компонент слабый, соответственно ударение падает на суффикс, а в слове тата?рин - сильный, соответственно ударение падает на основу; подробнее про силу базовых компонентов см. (Зализняк 1985: 50)).
Первые четыре ограничения связаны с тем, что программа не сможет с достаточной степенью уверенности определить ударение в словах с подобными суффиксами. Пятое ограничение связано с тем, что для правильного определения силы базового компонента необходимо знать его акцентный тип, который не может быть определен посредством программы. На практике соблюдение последнего ограничения означает, что мы почти не рассматриваем суффиксы с маркировкой v или > (поскольку в первом случае ударение может располагаться и на корне, и на суффиксе, а во втором случае - либо на корне, либо на следующей за суффиксом гласной). В типе <, наоборот, рассматриваются практически все суффиксы, поскольку ударение всегда падает левее этого суффикса (а следовательно, такие суффиксы всегда являются безударными). Поведение ударения в префиксах может быть описано одним абзацем: приставки вы- и па- имеют маркировку v, у приставок пра- и су- отмечается склонность к поведению, характерному для маркировки v. Все остальные префиксы (на-, по-, пере-, пред-, в-, с- и др.) имеют маркировку > и, исходя из правил (п. 3), не влияют на поведение ударения в слове.
2.1.1 Поведение ударения в существительных
Правила расстановки ударения в именах существительных намного сложнее, чем в иных частях речи. С помощью анализа акцентного типа ударение здесь можно определить лишь с точностью до морфологического компонента (наосновное или наконечное ударение). С другой стороны, с помощью анализа акцентных характеристик морфем в ряде случаев можно определить, куда именно внутри основы падает ударение. Рассмотрим сначала акцентные типы ударений в существительных.
Всего существует десять типов акцентных типов существительных: первые два из них являются основными, тогда как остальные - побочными. Для каждого типа существует своя схема ударения:
1. Акцентный тип a: ударение неподвижно на одном и том же слоге основы во всех ее формах;
2. Акцентный тип b: ударение неподвижно на флексии во всех формах слова;
3. Акцентный тип bґ: так же, как и в схеме b, но тв. п., ед. ч. ударение наосновное;
4. Акцентный тип c: в формах единственного числа ударение наосновное, а в формах множественного числа - наконечное;
5. Акцентный тип d: в формах единственного числа ударение наконечное, а в формах множественного числа - наосновное;
6. Акцентный тип dґ: так же, как и в схеме d, но вин. п., ед. ч. ударение наосновное;
7. Акцентный тип e: в формах единственного числа и в им. п., мн. ч. ударение наосновное, в косвенных падежах множественного числа - наконечное;
8. Акцентный тип f: во всех формах, кроме им. п., мн. ч. ударение наконечное;
9. Акцентный тип fґ: так же, как и в схеме f, но вин. п., ед. ч. ударение наосновное;
10. Акцентный тип fґґ: так же, как и в схеме f, но тв. п., ед. ч. ударение наосновное.
Кроме этих стандартных типов выделяется так же особые схемы с колебаниями, которые здесь, однако, приведены не будут, поскольку их классификация достаточно обширна. Кроме того, в текущей версии алгоритма не используется распознавание акцентного типа ввиду того, что в материалах исследования лишь в редких случаях встречаются все формы слова, которые необходимы для определения схемы ударения. Взамен используется классификация, описанная в книге А. А. Зализняка, согласно которой:
1. В словах с суффиксом класса vD ударение во всех формах стоит только на этом суффиксе (формы слова забия?ка);
2. В словах с суффиксом класса >D ударение в начальной форме находится на суффиксе (или на следующей за ним гласной, если таковая есть), во всех остальных формах ударение находится на следующей после него гласной (формы слова паде?ж, болтовня?);
3. В словах с суффиксом класса <D ударение во всех формах располагается на предшествующей суффиксу гласной (формы слова анали?тик);
4. В словах с суффиксом класса v ударение во всех формах стоит на том же месте, что и в начальной форме (на корне или на суффиксе, в зависимости от силы базового компонента; формы слова голодо?вка и забега?ловка);
5. В словах с суффиксом класса > ударение в начальной форме находится либо на гласной, следующей после суффикса (формы слова ворожба?), либо всегда на корне (в случае если базовый компонент сильный; формы слова уса?дьба);
6. В словах с суффиксом класса < ударение во всех формах располагается на корне, но его место может изменяться в зависимости от силы базового компонента (в случае слабого компонента ударение будет на предшествующей гласной, в случае сильного может располагаться в любом месте корня; формы слова уби?йство и о?бщество).
В нормальном случае ударение отдельной формы постоянно, однако встречаются отклонения от данного правила: в ряде случаев при сочетании существительных с определенными служебными словами ударение перемещается на это служебное слово (на? голову, по? морю); некоторые словоформы обладают колеблющимся ударением и могут встречаться в обеих формах даже в речи одного носителя (прода?л и про?дал, пропи?л и про?пил, сле?сарей и слесаре?й). Кроме того, в сложных словах помимо основного ударение возможно еще и ударение второстепенное, ослабленное, по сравнению с основным (не?фтеперерабо?тка, ко?нтрразве?дчик, а?втомо?токлу?б).
Теперь рассмотрим акцентные характеристики суффиксов существительных. Здесь будут разобраны только суффиксы, которые могут однозначно указать на расположение ударения. Так, например, программа не сможет определить ударения в существительных, мотивированных глаголами, прилагательными или другими существительными, чье ударение напрямую влияет на ударение в мотивируемой основе.
Начнем с доминантных самоударных суффиксов (vD). Класс имен, входящих в него для нас чрезвычайно важен, поскольку позволяет сразу указать на ударное место в словоформе. К ним относится большая группа первичных суффиксов, образующих существительные общего и среднего рода со структурой «гласная + к, г, х, ш, л? или н?»: -аг-а (молодча?га), -ыг-а (бары?га), -яг-а (бедня?га), -ак-а (зева?ка), -як-а (забия?ка), -ык-а (горемы?ка), -юк-а (злю?ка), -ул-я (сыну?ля), -юл-я (чистю?ля), -ан-я (мама?ня), -он-я (тихо?ня), -ун-я (маму?ня), -ах-а (замара?ха), -ёх-а (неумёха), -ух-а (рябу?ха), -уш-а (дорогу?ша), -ашк-а (замара?шка). Кроме того, в эту группу входят срощенные поглощающие суффиксы -иро?вка (стажиро?вка), -иро?вщик (сортиро?вщик), -ирова?л- (копирова?льщик). Также сюда относятся суффиксы: -ан (велика?н), -ён (в составе -ён-ок, -ён-ыш, -ён-к-а; львёнок), -ат-/-ят- (в составе -ят-а, -ят-ин-а, -ят-ник; вкусня?тина). Часть суффиксов этого класса здесь не приводятся в связи с ограничениями, изложенными в разделе 3.1.
Помимо исходных, в класс доминантных самоударных морфем включается ряд заимствованных суффиксов. К примеру, первичные суффиксы -а?циj-а (авиа?ция), -и?циj-а (эруди?ция), -изм (цини?зм), -ист (арти?ст), а также -ад (лимона?д), -ад-а (серена?да), -оз (гипно?з), -а?рий (глосса?рий), -о?рий (санато?рий), -е?нциj-а (тенде?нция), -ол (купо?л), -ио?н (стадио?н), -оне?р (миллионе?р), -ир (зефи?р), -а?тор (ора?тор), -и?тор (реквизи?тор), -им-а (пантоми?ма), -есс-а (поэте?сса), -ат-а (сона?та), -ите?т (комите?т), -ант (дикта?нт), -ент (абсе?нт).
Следующий класс - это доминантные правоударные суффиксы (>D). В него входят такие исходные суффиксы, как -еж (рубе?ж), -ёж (грабёж), -j-о (хамьё), -няк (сорня?к), -чак (стульча?к), -отн-я (беготня?), -ун (молчу?н), -ач (цирка?ч), -аш (торга?ш).
Класс доминантных левоударных суффиксов (<D) самый немногочисленный. Все суффиксы, к нему принадлежащие, были отсеяны, поскольку они либо употреблялись в нескольких формах (наблюдались отклонения), либо их аналоги присутствовали в других акцентных классах, делая тем самым невозможным по внешнему виду слова определить, к какому из типов относится суффикс и, соответственно, где стоит ударение.
Следующим рассмотрим класс недоминантных самоударных суффиксов (v). К ним относятся суффиксы: -атай (согляда?тай), -овье/-евье (низо?вье, коче?вье), -от-а (зево?та, но есть ряд слов, имеющих другое ударение). К классу недоминантных правоударных суффиксов (>) по установленным критериям подходят только суффиксы -ец-о (письмецо?) и -иц-е (ма?слице). К классу недоминантных левоударных суффиксам (<) относится: -ов-о (ло?гово), -ив-о (ме?сиво), -тв-а (би?тва), -ств-о (после шипящих -ество; семе?йство, пи?ршество), -иj-е (в составе -тие, -ние, кроме -ение; звание), -к-а (сковоро?дка), -чик (огуре?чик), -очк-а (ко?сточка), -ечк-о (вре?мечко), -ушк-о (ча?душко), -ышк-о (до?нышко), -л-о (нача?ло), -ость (жи?вость), -бищ-е (кла?дбище).
2.1.2 Поведение ударения в глаголах
Глаголы обладают несколько более простой системой ударений по сравнению с существительными, однако и у них правила расстановки ударений нетривиальны. Как уже было сказано в разделе 2.2, в начальных формах глаголов с суффиксом -и- ранее повсеместно встречалось ударение на суффиксе (клеи?ть), однако сейчас они имеют тенденцию к смещению ударения на первый слог (кле?ить). Тем не менее, в ряде случаев такого смещения еще не произошло (роди?ть). Наиболее напряженной точкой глагольного ударения являются формы прошедшего времени: обычно ударение падает на тот же слог, что и в инфинитиве (ср., стона?ть и стона?ла), однако в ряде глаголов (около 300) ударение в формах женского рода переходит на окончание, тогда как в остальных формах остается на основе (ср., жи?л и жила?). Кроме того, довольно часто в возвратных глаголах ударение в прошедшем времени переходит на постфикс (ср., нача?ться и начался?).
Всего по соотношению конечного и наосновного ударений в глаголах выделяется 4 акцентных типа:
1. Акцентный тип a: ударение неподвижно на одном и том же слоге основы;
2. Акцентный тип b: ударение на последнем слоге основы в прошлом времени и на флексии во всех формах настоящего времени;
3. Акцентный тип c: ударение на последнем слоге основы в прошлом времени, на флексии в 1 л., ед. ч. в настоящем времени и на основе во всех остальных формах;
4. Акцентный тип d: ударение на флексии во всех формах.
По классификации А. А. Зализняка глагольные суффиксы встречаются лишь в трех акцентных классах: доминантном самоударном, самоударном и левоударном. Как уже было подробно описано в предыдущем разделе, в доминантных самоударных суффиксах ударение всегда падает на этот суффикс, в самоударных может падать как на суффикс, так и на корень, а в левоударных суффикс никогда не находится по ударениям.
Единственным суффиксом, принадлежащим к доминантному самоударному классу (vD), является суффикс -а-ть (приседа?ть), который, однако, встречается и в самоударном классе в случаях отыменных глаголов (холода?ть). Таким образом, этот суффикс не рассматривается согласно принятым нами ограничениям. Суффиксы, входящие в недоминативный самоударный класс (v) также подпадают под ограничение: во всех встреченных случаях они могут выступать как с сильным базовым компонентом, так и со слабым, следовательно, ударение в таких словах может стоять в любой части основы.
Суффиксами, вошедшими в недоминантный левоударный класс (<), являются: -(е)ствова-ть (зве?рствовать), -ыва-ть (завя?зывать), -ича-ть (акти?вничать) и -нича-ть (жа?дничать).
2.1.3 Поведение ударения в прилагательных
Выбор места ударения вызывает затруднения в кратких формах прилагательных. В большинстве прилагательных место ударения в разных формах сохраняется достаточно последовательно (ср., воспи?танный и воспи?тан), однако в некоторых формах наблюдается перемещения ударения с основы на окончание в формах женского рода (де?рзкий, де?рзок, но дерзка?), а также в формах женского рода и в форме множественного числа (бли?зкий, бли?зок, но близка?, близки?). Краткие прилагательные множественного числа еще не так давно имели ударение на основу (про?сты, ве?рны), однако сейчас наблюдается тенденция к переносу ударения на окончание (просты?, верны?), хоть и не на всех словах (де?рзки). Как правило, к переносу ударения на окончание склонны односложные прилагательные без суффиксов. В полных прилагательных на -ист- продуктивным считается перенос ударения на суффикс (бархати?стый), однако таким изменениям подвергаются лишь прилагательные с мотивирующей основой, где ударение стоит на первом слоге. В случае прилагательных, в мотивирующей основе которых ударение стоит на втором слоге, ударение остается на том же слоге (покла?дистый). В отдельных случаях наблюдаются колебания ударения (ср., му?скулистый и мускули?стый).
Всего в прилагательных выделяется пять акцентных типов:
1. Акцентный тип a/a: ударение неподвижно на одном и том же слоге основы;
2. Акцентный тип a/b: ударение на основе во всех полных формах, на флексии - во всех кратких;
3. Акцентный тип a/c: ударение на флексии в краткой форме женского рода, на основе - во всех остальных формах;
4. Акцентный тип b/b: ударение неподвижно на флексии во всех формах;
5. Акцентный тип b/c: ударение на флексии во всех полных формах и в краткой форме женского рода, на основе - в остальных кратких формах.
Большинство прилагательных относится к типу a/a, то есть их ударение неподвижно во всех формах. К остальным четырем акцентным типам относится сравнительно небольшое число прилагательных, причем все они заданы списками.
По классификации А. А. Зализняка к типу недоминантных самоударных суффиксов (vD) относятся исконные: -ав- (моложа?вый), -ляв- (пискля?вый), -ю?сеньк- (малю?сенький), -ёшеньк- (бледнёшенький), -ёхоньк- (здоровёхонький), -ат- (косма?тый), -ова?т- (жидкова?тый), -ит- (знамени?тый), -ови?т- (мозгови?тый), -аст- (голена?стый), -уч- (приставу?чий), -и-ль-н- (равноси?льный) и -и?-тель-н- (вопроси?тельный). Суффиксы -ив- (правди?вый) и слова на -люби?вый (миролюби?вый) также имеют маркировку vD. Из числа заимствованных суффиксов сюда относятся: -и?ч-еск- (фонети?ческий), -ич-н- (хаоти?чный), -ан-ск- (хулига?нский), -иа?н-ск- (вегетериа?нский), -ив-н- (эффекти?вный), -оз-н- (религио?зный), -аль-н- (региона?льный), -а?бель-н- (коммуника?бельный), -он-н- (революцио?нный), -ар-н- (элита?рный) и некоторые более редкие. Маркировку vD также имеют первый морфы в сочетаниях -ий-ск- (австрали?йский), -ей-ск- (полице?йский), -ий-н- (комеди?йный) и -ей-н- (стате?йный).
...Подобные документы
Установление понятия и сущности фразового ударения, описание специфики и закономерностей его расстановки в английском предложении. Исследование ритмической структуры английской фразы, а также в рассмотрение связи между ритмом и ударением в предложении.
курсовая работа [42,5 K], добавлен 24.11.2012Особенности русского словесного ударения. Слабые участки в системе акцентологических норм. Ударения в именах существительных, прилагательных, причастиях и в глаголах. Произносительные нормы русского языка и фонетические законы. Нормы и стили произношения.
презентация [751,4 K], добавлен 10.04.2017Изучение лексикологической и морфологической функций ударения в русском языке. Анализ особенностей фонетического объединения слов в одно целое. Характеристика акцентных систем: монотонии и политонии. Обзор формирования современного русского произношения.
контрольная работа [44,2 K], добавлен 21.06.2012Положение русского языка в мире, популяризация русского языка и литературы. Положение ударения в фонетической структуре слова и развитая система словоизменения с помощью окончаний (флексий) и приставок. Лексические заимствования в современном языке.
творческая работа [13,3 K], добавлен 02.04.2010Правильная расстановка ударений в словах и их варианты, допустимые нормой русского языка. Поиск синонимов к словам. Определение рода существительных, подбор к ним прилагательного или глагола в форме прошедшего времени. Выявление ошибок в предложениях.
контрольная работа [16,3 K], добавлен 11.03.2014Основные свойства ударения в русских словах: разноместность и подвижность. Особенности постановки ударения в именах существительных (в разных падежах и числах), именах прилагательных, глаголах (в различных формах времени), страдательных причастиях.
реферат [18,3 K], добавлен 17.02.2013Понятие нормы. Признаки нормативного языка. Источники и характерные черты языковой нормы. Словесное ударение. Основные правила литературного произношения. Верные и неверные ударения в словах. Произношение безударных гласных. Иноязычные слова и выражения.
контрольная работа [18,0 K], добавлен 05.07.2008Рассмотрение интонации с точки зрения общей фонетики как просодической характеристики языка. Типы русской интонации по Боянусу: низкое падение, высокий подъем, низкий подъем, восходяще-нисходящий тон. Особенности фразового ударения в английском языке.
курсовая работа [576,7 K], добавлен 20.03.2014Исследование основных понятий орфоэпической нормы. Изучение правил устной речи и произношения. Свойства звуков русского языка, процесс их образования и сочетания. Орфоэпические нормы заимствованных слов. Постановка ударения при образовании форм слова.
презентация [159,6 K], добавлен 05.02.2014Теоретические аспекты ударения. Базовые англоязычные термины "stress" и "accent". Семантический и ритмический факторы определения места и степени ударения в английском языке. Акцентные типы многосложных слов. Вариативность как объективное свойство языка.
курсовая работа [40,8 K], добавлен 14.06.2011Особенности русского ударения. Культурноречевые проблемы в морфологии. Согласование сказуемого с подлежащим. Культура официального общения. Особенности оформления различных документов. Структура научного письменного текста и его языковое оформление.
практическая работа [98,4 K], добавлен 18.10.2012Особенности лексики русского языка с точки зрения активного и пассивного запаса. Активный словарь — лексика и фразеология языка, употребительная в данный период в той или иной речевой сфере. Устаревшие слова и неологизмы, как слова пассивного запаса.
реферат [33,7 K], добавлен 24.02.2011Понятие и цели рассуждения, место и значение данного типа текста в речи. Орфоэпия как совокупность правил литературного произношения, ее характеристика и назначение. Норма ударения, особенности в русском языке. Тенденции в развитии русского ударения.
контрольная работа [15,8 K], добавлен 03.01.2011Изучение понятия культуры речи, владения нормами устного и письменного литературного языка. Обзор правил произношения, ударения, словоупотребления, грамматики и стилистики. Анализ использования выразительных средств языка в различных условиях общения.
реферат [164,9 K], добавлен 10.07.2011Понятия правильность речи и языковая норма. Словообразовательные, морфологические, синтаксические нормы и их виды. Словесное, логическое, эмфатическое ударение. Грамматическая правильность и трудности современного русского произношения и ударения.
реферат [22,1 K], добавлен 18.08.2014Предмет и виды фонетики. Классификация гласных и согласных звуков. Понятие и типы слога, основной закон слогоделения в русском языке. Особенности русского ударения. Фонетическое членение речевого потока, расстановка фразовых и тактовых ударений.
контрольная работа [18,6 K], добавлен 20.05.2010Практические навыки освоения норм современного русского языка (поиск синонимов, паронимов, склонение падежей, определение правильности произношения, ударения и построение предложений) с целью повышения уровня речевой культуры русского общества.
контрольная работа [23,1 K], добавлен 20.02.2010Правильность речи как фундамент языковой культуры. Виды языковых норм, их сущностная характеристика. Словообразовательные, морфологические и синтаксические нормы грамматики. Фонетическая природа русского словесного ударения, его характерные признаки.
реферат [22,5 K], добавлен 10.12.2014Слова, сходные по звучанию, но имеющие разное значение (паронимы), различия в значении паронимов. Акцентология, особенности и функции ударения. Лексические средства в предложениях, речевые ошибки, связанные с неправильным употреблением языковых единиц.
контрольная работа [17,7 K], добавлен 23.09.2011Ударение в именах существительных, прилагательных, причастиях и отглагольных прилагательных. Нормативные варианты произношения глаголов, особенности постановки ударения в зависимости от значения слова. Эволюция основных орфоэпических норм русского языка.
презентация [314,9 K], добавлен 22.10.2013