Методы автоматической атрибуции анонимных и псевдонимных текстов на примере произведений, приписываемых С. Довлатову
Атрибуция псевдонимных текстов, приписываемых С. Довлатову. Формирование атрибуционной гипотезы априорных классов. Информативный набор параметров, алгоритм распознавания и их применение для подтверждения авторства псевдонимных фельетонов и юморесок.
Рубрика | Литература |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 27.11.2017 |
Размер файла | 85,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Результаты работы вероятностного алгоритма представлены в таблице 9:
Табл. 15. Вероятностный алгоритм распознавания.
Объекты |
Классы |
|||
К2 (Цион) |
К3 (Матюшкин-Герке) |
К1 (Довлатов) |
||
1 |
0,311 |
0,139 |
0,550 |
|
2 |
0,513 |
0,153 |
0,334 |
|
3 |
0,492 |
0,201 |
0,306 |
|
4 |
0,335 |
0,145 |
0,521 |
|
5 |
0,193 |
0,666 |
0,141 |
|
6 |
0,314 |
0,181 |
0,505 |
|
7 |
0,219 |
0,064 |
0,717 |
|
8 |
0,294 |
0,095 |
0,611 |
|
9 |
0,178 |
0,064 |
0,758 |
|
10 |
0,578 |
0,193 |
0,228 |
|
11 |
0,267 |
0,518 |
0,215 |
|
12 |
0,358 |
0,130 |
0,512 |
|
13 |
0,426 |
0,280 |
0,295 |
|
14 |
0,306 |
0,516 |
0,177 |
|
15 |
0,292 |
0,150 |
0,558 |
|
16 |
0,445 |
0,209 |
0,346 |
|
17 |
0,529 |
0,189 |
0,282 |
|
18 |
0,432 |
0,141 |
0,428 |
|
19 |
0,120 |
0,043 |
0,836 |
|
20 |
0,576 |
0,209 |
0,215 |
|
21 |
0,252 |
0,105 |
0,643 |
|
22 |
0,264 |
0,531 |
0,205 |
|
23 |
0,191 |
0,069 |
0,740 |
|
24 |
0,421 |
0,259 |
0,321 |
|
25 |
0,301 |
0,161 |
0,538 |
|
26 |
0,172 |
0,708 |
0,120 |
|
27 |
0,295 |
0,156 |
0,549 |
Полужирным шрифтом в таблице выделены наибольшие значения, позволяющие отнести объект к определенному классу. В большинстве случаев эти значения превышают 0.5, а значит данные тексты можно однозначно отнести к определенному автору. Однако объекты 3, 13, 16, и 24 имеют вероятность меньшую 0,5, но больше 0,4. В данных случаях можно говорить, что эти объекты с большой долей вероятности принадлежат соответствующим классам. В случае с объектом 18 однозначного решения вынести нельзя, слишком мала разница вероятности принадлежности классу 1 (Довлатов) - 0,428 и классу 2 (Цион) - 0,432.
Таким образом, по результатам вероятностного алгоритма можно составить матрицу решений (см табл. 10), где принадлежность объекта определенному классу обозначается как 1, а не принадлежность - 0.
Табл. 16. Матрица решений
Объекты |
Классы |
|||
К1 (Цион) |
К2 (Матюшкин-Герке) |
К3 (Довлатов) |
||
1 |
0 |
0 |
1 |
|
2 |
1 |
0 |
0 |
|
3 |
1 |
0 |
0 |
|
4 |
0 |
0 |
1 |
|
5 |
0 |
1 |
0 |
|
6 |
0 |
0 |
1 |
|
7 |
0 |
0 |
1 |
|
8 |
0 |
0 |
1 |
|
9 |
0 |
0 |
1 |
|
10 |
1 |
0 |
0 |
|
11 |
0 |
1 |
0 |
|
12 |
0 |
0 |
1 |
|
13 |
1 |
0 |
0 |
|
14 |
0 |
1 |
0 |
|
15 |
0 |
0 |
1 |
|
16 |
1 |
0 |
0 |
|
17 |
1 |
0 |
0 |
|
18 |
0 |
0 |
0 |
|
19 |
0 |
0 |
1 |
|
20 |
1 |
0 |
0 |
|
21 |
0 |
0 |
1 |
|
22 |
0 |
1 |
0 |
|
23 |
0 |
0 |
1 |
|
24 |
1 |
0 |
0 |
|
25 |
0 |
0 |
1 |
|
26 |
0 |
1 |
0 |
|
27 |
0 |
0 |
1 |
2.9 Интерпретация результатов атрибуции
Анализ данных, содержащихся в таблице 10 позволяет отвергнуть нулевую гипотезу, в которой утверждалось то, что все псевдонимные произведения принадлежат Сергею Довлатову. Нашла подтверждение альтернативная гипотеза (H2) - часть произведений принадлежит С.Довлатову, а часть - еще одному или нескольким писателям.
Таким образом, перу Сергея Довлатова принадлежат следующие произведения «Энтузиаст» (Советская Эстония. 03.09.1972. С.4), «Здрасьте, это Вася говорит...» (Вечерний Таллин. 16.01.1974. №13 (443). С. 3), «Случай с Барашкиным» (Советская Эстония. 28.01.1973. С. 4), «Как я бросил пить» (Советская Эстония. 11.02.1973. С. 4), «Звонок из Антимира» (Советская Эстония 25.03.1973. С. 4), «Да здравствует петух!» (Вечерний Таллин. №71. 21.10.1972. С. 3), «Не лезь в бутылку. (Полуфантастическая история)» (Вечерний Таллин. 01.11.1972. С.З), «Последний сапожник» (Вечерний Таллин. №11 (138). 13.01.1973. С.З), С.3), «Сколько лет бабушке?» (Вечерний Таллин. 13.03.1974. С.3), «В ожидании генерала. (Действительное происшествие)» (Вечерний Таллин. № 119 (549). 25.05.1974. С.3), «История» (Вечерний Таллин. 15.12.1973. №290 (417). С.3), «Пончо» (Вечерний Таллин. 12.09.1973. С.З), «Чуткость» (Вечерний Таллин. 12.09.1973. С. 3). Всего 13 произведений.
Владимир Цион является автором публикаций «Заведу себе бар...» (Моряк Эстонии. 21.04.1973. С. 4), «Мужские хлопоты» (Вечерний Таллин. 07.03.1974. С.4), «Муха» (Вечерний Таллин. 27.10.1973. С.3), «Первый «заяц» (Советская Эстония. 01.01.1973. С.4), «Человек изголодался» (Вечерний Таллин. 14.09.1974. №215 (645) С. 3), «Не тот уровень» (Вечерний Таллин. 18.11.1972. С.З), «Ха-ха!» (Вечерний Таллин. 28.02.1973. С.З), «Зонт» (Советская Эстония. 02.09.1973. С. 4). Всего 8 произведений.
Александр Матюшкин-Герке написал «Сон» (Вечерний Таллин. 14.11.1973. №264 (391), «Астрономия» (Вечерний Таллин. 09.02.1974. №34 (464). С. 3), «Труба» (Вечерний Таллин. 28.10.1972. С.З), «Такая специфика» (Вечерний Таллин. №106. 06.12.1972. С.З), «Хочу всё знать!» (Вечерний Таллин. 10.10.1973. С. З). Всего пять произведений.
Авторство фельетона «Почти что драма про некую маму, ее малолетнего сына Игната и директора лесокомбината.», опубликованного 05.01.1974 в газете «Вечерний Таллин» под псевдонимом «И. Олеп» достоверно установить не удалось.
Заключение
В данной работе был представлен опыт применения математических методов атрибуции текстов на примере проблемы авторства псевдонимных фельетонов и юморесок, приписываемых С.Довлатову.
Обзор истории данного вопроса позволил сформулировать атрибуционную гипотезу, отражающую возможность написания данных спорных произведений В.Ционом, А.А.Матюшкиным-Герке и С.Довлатовым. Класс объектов атрибуции составили 27 спорных произведений.
Три априорных класса (К1 «Довлатов» - 29 текстов, К2 «Цион» - 11 текстов, К3 «Матюшкин-Герке» - 15 текстов) были описаны на языке 56 априорных параметров.
Информативный набор параметров составили 4 параметра: Х08 (число подчиненных предложений), Х09 (число подчиненных предложений 1-й степени), X26 (число союзов) и X27 (число подчинительных союзов).
В результате проведенной атрибуции, работы детерминированного и вероятностного алгоритмов, подтвердилась альтернативная гипотеза о том, что часть атрибутируемых произведений принадлежит С.Довлатову, а часть - еще одному или нескольким писателям. Интерпретация полученных результатов показала, что с высокой долей вероятности 5 текстов могут быть отнесены Александру Матюшкину-Герке, 8 - Владимиру Циону и 13 - Сергею Довлатову. Авторство одного из объектов атрибуции (фельетона «Почти что драма про некую маму, ее малолетнего сына Игната и директора лесокомбината.») точно установить не удалось.
Таким образом, заявленная цель была достигнута. Практическая и научная значимость данной работы состоит в том, что она является первой попыткой описания индивидуального стиля Сергея Довлатова с помощью математических методов, а также первым исследованием раннего творчества писателя с использованием теории распознавания образов. Полученные результаты могут стать примером для дальнейших исследований при изучении творчества писателя.
Список литературы
1.Доброзракова Г.А. Псевдонимные юморески и фельетоны Сергея Довлатова. К вопросу атрибуции // Вопросы литературы. Вып. 4. 2014. С.21-54
2.Доброзракова Г.А. Журналистская деятельность С. Довлатова (доэмигрантский период) // Мир науки, культуры, образования. Вып. 1 (56). 2016. С. 311-313
3.Виноградов В. В. Проблема авторства и теория стилей. - М.: Гослитиздат, 1961. - 614 с.
4.Мартыненко Г. Я. Основы стилеметрии. - Л.: Изд-во Ленингр. ун-та, 1988. - 173 с.
5.Мартыненко Г. Я. Многомерный синтаксический анализ художественной прозы // Структурная и прикладная лингвистика: межвуз. сборник / под ред. А. С. Герда. -- Л.: Изд-во Ленингр. ун-та, 1983. Вып.2. - С. 47-61.
6.Марусенко М.А. Атрибуция анонимных и псевдонимных литературных произведений методами распознавания образов: дис. … д-ра филолог. наук: 10.02.19 / М.А. Марусенко. - Л.: Изд-во ЛГУ, 1990. - 370 С. + Автореф. 26 С.
7.Марусенко М.А. Атрибуция анонимных и псевдонимных литературных произведений методами теории распознавания образов. - Л.: Изд-во Ленингр. ун-та, 1990. 164 с.
8.Марусенко М.А., Бессонов Б.Л., Богданова Л.М., Аникин М.А., Мясоедова Н.Е. В поисках потерянного автора. Этюды атрибуции. - СПб.: Филол. фак. С.-Петерб. гос. ун-та, 2001. - 209 с.
9.Милов Л. В., Бородкин Л. И., Иванова Т. И. и др. От Нестора до Фонвизина. Новые методы определения авторства. - М., 1994.
10.Родионова Е.С. Методы атрибуции художественных текстов // Структурная и прикладная лингвистика. Вып. №7: Межвуз. сб. / Под. Ред. А.С.Герда. - СПб.: Изд-во С-Петер. Ун-та. 2008. С.118-127.
11.Родионова Е.С. Отбор информативных параметров при атрибуции стихотворных пьес Мольера // Материалы ХХХVI Международной филологической конференции (12 - 17 марта 2007 г.). - СПб: Филол. фак. С.-Петерб. гос. ун-та, 2007. - Вып. 10: Прикладная и математическая лингвистика / под ред. Т. Г. Скребцовой. С. 67-74
12.Родионова Е.С. Параметризация стилей: отбор информативных параметров при атрибуции пьес Мольера // Вестник Санкт-Петербургского университета. Сер 9. Филология. Востоковедение. Журналистика. Вып. 2 - Ч. 2. - 2007. С 61-67.
13.Севбо И. П. Графическое представление синтаксических структур и стилистическая диагностика. - Киев: Наукова думка, 1981. - 192 с.
14. Тулдава Ю. А. Проблемы и методы квантитативно-системного исследования лексики. - Тарту: Тартуский гос. ун-т, 1987. -203 с.
15.Якубайтис Т. А. Вероятностная атрибуция типа текста по нескольким морфологическим признакам. - Рига: ИЭВТ, 1982. - 53 с.
Размещено на Allbest.ru
...Подобные документы
Оценочность как текстовая категория. Типы оценок: эмоциональная, эстетическая, этическая, сенсорная, количественная и рациональная. Реализация категории оценки в произведениях рок-поэтов на примере текстов Виктора Цоя, Юрия Шевчука и Игоря Талькова.
дипломная работа [83,3 K], добавлен 21.09.2011Манипуляция как вид психологического воздействия. Стратегии убеждения и интерпретации действительности. Анализ лингвистических средств речевого воздействия публицистики на сознание и проверка его эффективности на примере текстов исторической тематики.
дипломная работа [255,4 K], добавлен 09.08.2015Авторская песня: определение понятия и история развития. Понятие фонетических и ритмико-интонационных особенностей. Роль фонетических средств в системе средств создания образности художественного (поэтического) текста на примере текстов А. Панкратовой.
дипломная работа [58,1 K], добавлен 18.01.2014Теории и гипотезы происхождения ариев. Исследование понятия и сущности ведической культуры, специфических черт ведических знаний и текстов. История и этнография в ведах и этносе. Выявление особенностей отражения истории и мифологии Древней Индии в эпосе.
дипломная работа [87,8 K], добавлен 11.02.2013Общее понятие и основные виды метатекстов. Рабочая классификация текстов вторичной коммуникации. Особенности стиля Джейн Остен. Какие косвенные языковые средства характеристики действительности Д. Остен использовала в романе "Гордость и предубеждение".
курсовая работа [904,5 K], добавлен 30.11.2016Особенности поэтических текстов. Выразительные возможности словообразовательных средств и роль звукописи при создании экспрессии поэтических текстов М. Цветаевой. Стилистические фигуры и лексические средства, создающие экспрессивность в ее поэзии.
дипломная работа [65,8 K], добавлен 16.05.2014Характерные черты фельетонов Власа Дорошевича, особенности его стиля. Отражение причин пренебрежительного отношения общества к такой важной и чрезвычайно нужной профессии, как репортер. Хлесткие, обличительные высказывания в фельетоне "Старый палач".
реферат [19,4 K], добавлен 16.12.2014Своеобразие архитектоники книги А.А. Ахматовой. "Вечер": изображение внутренних стимулов поисков Истины, построение текстов. "Четки": единство архитектоники и композиции в изображении мира души. "Белая стая": ощущение личной жизни как жизни национальной.
курсовая работа [78,7 K], добавлен 17.04.2014Особенности поэзии Серебряного века. Истоки символизма в русской литературе. Творчество И. Анненского в контексте начала ХХ века. Новаторство поэта в создании лирических текстов. Интертекстуальность, символы и художественный мир произведений Анненского.
дипломная работа [112,8 K], добавлен 11.09.2019Творческий путь автора Харуки Мураками и результаты локализации его произведений в культурном ландшафте Японии. Анализ критики, научных статей и прочих видов текстов на предмет аллюзий в романе "1Q84". Параллели с романом Джорджа Оруэлла "1984".
курсовая работа [138,2 K], добавлен 08.11.2017Главные произведения Шекспира. Основные версии шекспировского вопроса. Проблема авторства произведений, известных миру как принадлежащие перу Уильяма Шекспира. Представления о культе Шекспира как константе тезаурусов европейской художественной культуры.
реферат [41,4 K], добавлен 30.01.2013Ознакомление с литературными памятниками Древней Руси, исследование жанров и арсенала художественных приемов. Проблема авторства и анонимности произведений "Слова о полку Игореве", "Сказание о Мамаевом побоище", "Слово о погибели Русской земли".
реферат [25,8 K], добавлен 14.12.2011Рассмотрение теоретических аспектов работы над произведениями различных жанров. Изучение психологических особенностей восприятия произведений различного жанра учениками 5–6 классов. Методические рекомендации по анализу сказки, как литературного жанра.
курсовая работа [43,2 K], добавлен 26.02.2015Оценка вклада А.С. Пушкина в развитие редакторского дела в России, два его главных тезиса в области редактирования. Изучение и анализ критического разбора текстов Пушкиным на примере статьи П.А. Вяземского, посвященной жизни и творчеству В.А. Озерова.
реферат [24,4 K], добавлен 10.11.2010Аспекты изучения семантики текста. Роль индивидуальных переживаний автора в его творчестве. Особенности творчества В.В. Маяковского. Л. Брик в жизни поэта. Композиция и звучание, стилистические фигуры, метафоры, лексический состав, ритмика стихотворения.
курсовая работа [26,6 K], добавлен 18.07.2014Процесс перевода как специфический компонент коммуникации. Переводческие трансформации – суть процесса перевода, их классификации. Анализ текстов рассказа "Счастливый принц". Особенности перевода К. Чуковского и перевода П.В. Сергеева и Г. Нуждина.
курсовая работа [51,1 K], добавлен 08.02.2013Изучение эпических произведений. Анализ сюжетно-композиционной основы произведения и работы над эпизодом. Методика изучения произведений Н.В. Гоголя в 5-6 классах. Специфика изучения "Вечеров на хуторе близ Диканьки". Конспекты уроков.
курсовая работа [60,8 K], добавлен 04.12.2006Направления и этапы исследования идейного содержания романа Николая Хвылевого "Вальдшнепы", попытка выделения формальных особенностей. Проведение аналогий между Дмитрием Карамазовым из "Вальдшнепов" и Алешею из "Братьев Карамазовых" Достоевского.
реферат [33,2 K], добавлен 24.04.2012Краткая биографическая справка из жизни Глуховского. Информации о романе "Метро 2033". Главные особенности кинематографичности романа. Связь компьютерной игры "Metro 2033" с литературным произведением Дмитрия Глуховского. Заключительный монолог Артёма.
курсовая работа [38,4 K], добавлен 24.06.2012Расцвет культуры Хэйана и предпосылки возникновения антологии "Собрание старых и новых песен". Формирование японской антологии, ее составители. Структурные особенности текстов поэтической антологии, особенности ее эмоционально-выразительных средств.
курсовая работа [50,1 K], добавлен 27.06.2013