Создание электронного словаря ключевых слов творчества С.А. Есенина
Подсчет ключевых слов, употребленных поэтом в его произведениях с помощью специальной компьютерной программы. Принцип составления базы данных полученных ключевых слов для электронного словаря. Разработка электронного словаря ключевых слов, его функции.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 30.11.2016 |
Размер файла | 62,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Содержание
Введение. Постановка целей и задач исследования
1. Подготовка к созданию электронного словаря ключевых слов
1.1 Автоматический подсчет и последующий анализ ключевых слов. Сбор корпусов текстов, их обработка с помощью специальной компьютерной программы и анализ ключевых слов. Каждый этап совершается для трех жанров есенинских произведений в отдельности
1.1.1 Лирика
1.1.2 Поэмы
1.1.3 Проза
1.2 Создание базы данных ключевых слов. Описание принципа составления таблиц для базы данных
2. Создание электронного словаря ключевых слов
2.1 Проектирование электронного словаря ключевых слов. Назначение словаря, определение его функций
2.2 Разработка электронного словаря ключевых слов. Основные этапы разработки словаря
Заключение. Формулировка основных выводов, результатов исследования
Библиографический список
Введение
Данное исследование посвящено изучению ключевых слов художественного мира С.А. Есенина (1895 - 1925 гг.), полученных в результате машинной обработки и статистического анализа корпуса текстов всех произведений автора, а также созданию электронного словаря ключевых слов, проанализированных в рамках настоящей работы.
В последнее время чрезвычайно возрос интерес к личности и творчеству С.Есенина. В 1995 - 2002 гг. (к 100-летию со дня рождения поэта) Институтом мировой литературы Российской академии наук было выпущено академическое «Полное собрание сочинений» в семи томах (главный редактор - Ю.Л.Прокушев) - наиболее полное, содержащее тексты всех жанров, включая эпистолярную прозу и документы, написанные Есениным, а также тщательно прокомментированное; в 2005 году вышел роман Виталия Безрукова «Есенин», в котором рассказывалось о жизни и таинственных обстоятельствах гибели поэта, на основе которого был снят одноименный телесериал. В 2011 году в издательстве Corpus вышло второе, исправленное и дополненное издание обширнейшей биографии С.Есенина, написанное двумя авторитетными филологами, сотрудниками школы филологии НИУ ВШЭ: О.А. Лекмановым и М.И. Свердловым - данное исследование, в первую очередь, стремится избавить жизненный путь автора от мифологических и недостоверных фактов. В дополнение, жизни поэта посвящено 9 документальных фильмов, в честь Есенина возведено более 20 памятников и мемориальных знаков по всей территории России, а также, согласно данным Федеральной информационной адресной системы на 2013 год, 611 площадей, улиц и переулков России носят имя Есенина. Все вышеуказанные факты подтверждают неослабевающий интерес к жизни и творчеству Есенина, который был рожден 121 год назад, но при этом он и сегодня остается современным для российских читателей, поскольку его работы ярко отражают русскую национальную ментальность.
На протяжении XX века творчество Есенина являлось предметом пристального внимания и изучения филологов и лингвистов. Однако художественный и языковой мир поэта до сих пор недостаточно подробно изучен. Кроме того, в сети интернет не было найдено словарей ключевых слов творчества Есенина (в 2012 и 2013 гг. Бакинским славянским университетом было выпущено несколько частей «Словаря языка Есенина» (автор - Г.И. Шипулина) - в данном словаре приводятся описания всех слов (а не только ключевых) поэтических текстов (не учитывая прозаические) Есенина). Этим обусловлена актуальность настоящего исследования, предполагающего описание художественного мира писателя через ключевые слова всех его произведений (лирика, поэмы, проза) и создание словаря таких лексем.
Под ключевыми словами понимаются «концептуально значимые, семантически осложненные и эстетически нагруженные слова, отличающиеся высокой степенью повторения в тексте» О.И.Кудашова. Кандидатская диссертация на тему «Ключевые слова в лирике М.Цветаевой», 2000 г.. Сквозные ключевые слова, проходящие через все творчество С.Есенина, отражают особенности мировоззрения поэта и осмысление им действительности. Восприятие, понимание названных сторон мировидения осуществляется, прежде всего, через слово и его семантику.
Теоретической базой исследования послужили труды отечественных литературоведов и лингвистов в области изучения жизни и творчества Есенина (Ю.Л. Прокушев «Сергей Есенин. Поэт. Человек», 1973; Ю.Л.Прокушев «Дума о России», 1988; Ю.Л. Прокушев «Образ. Стихи. Эпоха», 1979; Е.Наумов «Сергей Есенин. Жизнь и творчество», 1965; В.Г. Базанов «Сергей Есенин и крестьянская Россия», 1982; С. Куняев «Сергей Есенин», 2010; книга из серии «Библиотека великих писателей»: «Сергей Есенин. Стихотворения, поэмы, проза», 2007; И.Семибратова «Судьбы поэтов серебряного века» 1993; П.Ф.Юшин «Сергей Есенин», 1969); работы по методике анализа художественного текста (научные работы, учебные пособия для студентов на тему «Лингвистический анализ художественного текста» и «Филологический анализ художественного текста» авторов: В.А.Лукин, 1999, Ю.В.Казарин, 2000, Ю.Н.Караулов, 2001, Н.И.Николина, 2003); книги и учебные пособия в области создания баз данных (Н.В. Макарова, В.В. Волков «Информатика: учебник для вузов», 2011; В.И. Гольцман «MySQL 5.0. Библиотека программиста», 2009); работы на тему проектирования и разработки веб-приложений, а также о языке программирования Python (официальный сайт IBM; Н.А. Прохоренок «Python 3 и PyQt. Разработка приложений», 2012).
Научная новизна исследования состоит в том, что в нем предпринимается попытка произвести обсчет ключевых слов произведений автора с помощью компьютерной программы, проанализировать их и смоделировать некоторые аспекты мировосприятия автора, а также составить электронный словарь ключевых слов и тем творчества С.Есенина.
Целью настоящей работы является создание электронного словаря ключевых слов творчества С.А.Есенина.
Поставленная цель предполагает решение следующих задач:
ѕ Осуществить подсчет ключевых слов, употребленных поэтом в его произведениях по трем жанрам (лирика, поэмы, проза), с помощью специальной компьютерной программы;
ѕ Проанализировать полученные ключевые слова и описать систему их взаимодействия для каждого жанра;
ѕ Описать принцип составления базы данных полученных ключевых слов для электронного словаря;
ѕ Продемонстрировать этапы проектирования и разработки электронного словаря ключевых слов.
Для решения поставленных задач используется комплексная методика, соединившая метод контекстуального анализа, сравнительный, сопоставительный, аналитический методы, метод обобщения полученных результатов, количественная и классификационная методика, метод статистического анализа, метод машинной обработки текста.
Объектом исследования является художественный мир произведений С.Есенина трех жанров: лирика, поэмы, проза.
Предметом исследования являются ключевые слова, выявленные в ходе машинной обработки произведений автора по трем указанным жанрам.
Материалом исследования является корпус опубликованных произведений трех жанров (лирика, поэмы и проза), написанных Есениным с 1914 по 1925 гг. Под корпусом понимается «массив естественных текстов естественного языка, представленных в компьютерном виде, т.е. на машинном носителе и должным образом упорядоченных с целью их использования в научных и практических исследованиях» Шевчук В.Н. Электронные ресурсы переводчика: Справочные материалы для начинающего переводчика. -- М.: Либрайт, 2010. -- С. 44..
Теоретическая значимость работы заключается в том, что в ней проводится анализ и классификация ключевых слов творчества Есенина и определяется их значимость в формировании художественного мира автора. Кроме того, в ходе работы углубляется понимание таких терминов и явлений, как «ключевое слово», «художественный мир», «корпус текстов», «электронный словарь».
Практическая ценность исследования определяется, во-первых, возможностью использования его результатов в практике вузовского и школьного преподавания лингвистических и литературоведческих дисциплин: собранный в работе материал может быть вспомогательным для написания курсовых и ВКР по вопросам исследования художественного мира С. Есенина и его ключевых слов. Во-вторых, создание электронного словаря ключевых слов предоставит исследователям творчества поэта возможность изучать ключевые слова и темы творчества С. Есенина в доступной форме и без траты времени на подсчет, анализ и классификацию ключевых слов.
1. Подготовка к созданию электронного словаря ключевых слов
В рамках каждой из частей данной главы будут последовательно описаны и продемонстрированы подготовительные этапы создания электронного словаря ключевых слов творчества С.А. Есенина. Этими этапами являются подсчет и анализ ключевых слов, создание базы данных, проектирование электронного словаря. Каждый из указанных шагов является необходимой и неотъемлемой частью создания и успешного функционирования электронного словаря ключевых слов.
1.1 Автоматический подсчет и последующий анализ ключевых слов
электронный словарь ключевой слово
Автором настоящей работы в 2013, 2014 и 2015 гг. было проведено три исследования на темы, соответственно, «Ключевые слова художественного мира лирики/поэм/прозы С.А. Есенина» [20, 21, 22].
Схема исследования в каждой из работ оставалась неизменной: в первую очередь художественный мир лирики/поэм/прозы изучался с точки зрения литературоведов (классический, описательный метод анализа литературных произведений). Затем с помощью специальной компьютерной программы производился обсчет ключевых слов того же жанра и художественный мир анализировался через призму полученных ключевых лексем (современный метод анализа ключевых слов). После этого результаты разных методов анализа сравнивались.
Одним из важнейших выводов, который удалось сделать в результате вышеупомянутых исследований прошлых годов, стало утверждение, что метод анализа ключевых слов художественного мира лирики/поэм/прозы С.Есенина не только подтверждает, но и добавляет, расширяет те идеи и наблюдения, о которых писали филологи и литературоведы. В связи с этим, представляется значимым продемонстрировать далее в данной исследовательской работе анализ ключевых слов каждого из жанров творчества С.А. Есенина.
1.1.1 Лирика
Периодизация и сбор корпуса лирики.
Анализ ключевых слов художественного мира лирики С.А. Есенина проводился с учетом периодизации, предложенной П.Ф. Юшиным в работе «Сергей Есенин», 1969 г. [15]. Ученый выделил три внутренне связанных между собой периода. Первый, ранний, обозначен годами - 1910 - 1916; второй - 1917-1923; третий - 1924-1925, каждый из которых отразил особое мировоззрение поэта, его социальные и эстетические взгляды, своеобразие поэтики и роль, которую поэзия Есенина играла в современном ему литературном движении.
В первом периоде Юшин выделяет три основных этапа: спасс-клепиковский (1910 - 1912), московский (1913 - 1914), петербургский (1915 - 1916), отразившие различные влияния, которые испытала на себе творческая манера Есенина.
Второй период творчества Есенина исследователь также делит на три этапа: (1917 - 1918; 1919 - 1922; 1922 - 1923), каждый из которых был связан с соответствующей проблематикой: скифство и революция; имажинизм и революция; впечатления зарубежной поездки и их влияние на творческую эволюцию поэта.
Последний период творчества С. Есенина (1924 - 1925) Юшин считает наиболее плодотворным. Временные рамки этого периода прочно закреплены в литературе о поэте и признаны большинством исследователей его творчества. Этот период характерен утверждением необходимости пролетарской революции и сожалением о неудачно сложившейся жизни, о её скоротечности и неизбежности смерти.
Таким образом, корпус всех опубликованных стихотворений С. Есенина был разделен на три подкорпуса, в соответствии с выбранной периодизацией творчества поэта (в результате получились: подкорпус лирики первого периода, второго периода и третьего).
Лирические стихотворения автора были переведены в электронный формат в соответствии с содержанием книги серии «Библиотека Великих Писателей» «Сергей Есенин. Стихотворения, поэмы, проза», выпущенной авторитетным издательством Эксмо в 2007 году [3].
Машинная обработка подкорпусов лирики.
После создания подкорпусов каждый из них был обработан с помощью компьютерной программы - копрус-менеджера AntConc, одной из функций которого является выявление наиболее частотных слов в тексе. Обработка текстов есенинской лирики с учетом периодизации позволила проследить различия или сходства, смену или сохранение ключевых слов в тот или иной период жизни автора.
Анализ ключевых слов.
На следующем этапе исследования в целях удобства анализа результатов машинной обработки все выявленные ключевые лексемы были объединены в различные смысловые кластеры (тематические группы) и представлены в виде таблиц, с которыми можно ознакомиться в приложении к данной работе (см.Приложение, Таблицы 1 - 3).
Первый период.
На основе таблицы (см.Приложение, Таблица 1) смысловых кластеров и ключевых слов первого периода лирических стихотворений можно сделать выводы о том, что ключевой темой данного периода жизни и творчества С.А.Есенина является тема природы, родной деревни, - малой родины, которая, собственно и есть для лирического героя Россия, или, точнее - «Русь» в стихах Есенина. Слово «Русь» имеет мощные фольклорные ассоциации, которые подкрепляются другими частотными славами этого кластера, несущими ассоциации с фольклором: «лебедушка», «сарафан», «коса». Наиболее частотные слова в этом смысловом кластере также представляют элементы русской природы, русской народной жизни и русской деревни в «фольклоризированных» тонах. Помимо народно-сказочного элемента, в трактовке образа Родины несомненны приметы родного Есенину рязанского края, с его характерными для средней полосы России пейзажами: рощами, лесами, полями, дорогами, синью озер и небес и т.д. Кроме того, образ родины на этом этапе включает приметы крестьянского быта: конь, село, хлеб и.т.п.
На втором месте в данной иерархии - тематика человека. Так, на фоне русской природы в есенинском художественном мире обязательно присутствует человек с его эмоциями, чувствами и действиями, которые и являются третьей ступенью иерархии. Однако важно отметить, что природа у Есенина одушевлена и, соответственно, она также может предпринимать те или иные действия (например, «плачет метель», «плачет где-то иволга»).
На следующей ступени иерархии - религиозная тематика, которая, как будет видно далее, на первом этапе есенинского творчества выражена самым большим количеством ключевых слов, в отличие от других периодов.
Данные таблицы свидетельствуют (см.Приложение, Таблица 1), что особое значение уделяется на раннем этапе образам дня и ночи, солнца и луны (месяца). Следует заметить, что слова, посвященные «ночной», «вечерней» тематике явно превосходят «дневную», а слово «месяц», имеющее фольклорные ассоциации, далеко опережает по количеству употреблений слово «луна».
Самой частотной в анализе ранней лирики автора явилась лексема «словно» (25) - это показывает, что сравнение, как художественный прием, играет в поэзии Есенина немаловажную роль. Именно благодаря данному приему, есенинская природа приобретает одушевленность, так как в большинстве случаев поэт сравнивает явления природы с животным миром и с человеком. А человек, в свою очередь, сравнивается с природой, за счет чего в художественном мире поэта рождается ощущение всеобщей взаимосвязанности всех живых существ.
Таким образом, новыми аспектами художественного мира лирики первого периода, которые позволил выявить метод анализа ключевых слов и о которых не упоминали литературоведы ранее, стали: частотность слова «словно», преобладание на данном периоде «ночной» тематики над «дневной», развитость религиозной тематики и тематики эмоций и чувств человека.
Второй период.
По таблице кластеров и ключевых лексем второго периода лирики (см.Приложение, Таблица 2) С.Есенина очевидно, что набор тематических групп остался неизменным, по сравнению с первым периодом. Однако содержательная сторона каждого из кластеров меняется как количественно, так и качественно. К примеру, в кластере «Россия, природа, родная деревня» наиболее частотным оказывается слово «Русь», что отражает настроения Есенина в этот период жизни и творчества. С одной стороны, это беспокойство за судьбу своей родины в связи с революциями, а с другой - осознание бесконечной любви к России, обостренной поездкой за границу. Интересно, что частотность слов «люблю» и «любовь» (см. кластер Эмоции, чувства, действия человека/ явлений природы) здесь также возросла (на первом этапе частотность этих слов равна пяти, здесь - девяти).
Человек по-прежнему является обязательной составляющей художественного мира С. Есенина, однако в ключевых словах по этой тематике «люди» сменяются на лексемы «брат», «друг» и «народ», что снова отражает «включенность» автора в этот период в судьбы своей страны и народа. «Девки» в «сарафанах» сменились на «женщину», что означает уход Есенина от фольклорных традиций.
Таблица тематических кластеров и частотных слов лирики поэта второго периода (см.Приложение, Таблица 2) выразительно свидетельствует о том, что религиозная тематика в ней представлена довольно обширно. Однако если сравнивать данные для первого и для второго периода, становится очевидным, что в первый период религиозная тематика составляла больший удельный вес (55 слов), чем во второй период (37 слов), где она, к тому же, была представлена более разнообразно. Это противоречит выводам, к которым приходят исследователи творчества Есенина. Интересно, что лексемы «бог» и «боженька» на этом этапе сменяются лексемой «Исус». Появляется, также, лексема «крест», возможно, отражающая тему «крестного пути» лирического героя и его родной страны в пору политических катаклизмов.
Тематика дня и ночи, солнца и луны здесь тоже присутствует, однако если по результатам анализа лирики первого периода преобладает «ночная» тематика, то здесь на первый план выступают образы, связанные с солнцем и светом.
В кластере «Эмоции, чувства, действия человека/ явлений природы» на первом этапе преобладают «радость» и «слезы» (лексемы «радость», «смех», «счастье» имеют удельный вес 34 слова, а «слезы», «плачет» - 29 слов) и только 5 раз «хочу». Здесь же «хочу» - главная эмоция, в то время как частотность слов «радость» и «слезы» почти равна («радость», «счастье» - 16 слов; «грусть», «гибель» - 17). Возможно, что такие результаты снова отражают отпечаток времени, настроения автора по поводу происходящих изменений («Я живу, как я сам хочу!» [3; стр.204]).
Еще одним интересным моментом является сокращение употребления лексемы «словно» до 17 раз, что, вероятнее всего, связано с влиянием имажинизма, означающим смену предпочтений поэта в использовании художественных средств.
Таким образом, среди выявленных в ходе анализа ключевых слов лирики второго периода нюансов можно подчеркнуть: частотность лексемы «Русь», как результат беспокойства поэта за судьбу страны в революционное время и осознания любви к родине; уход от фольклорных традиций; преобладание «дневных» образов над «ночными»; сокращение использования художественного приема сравнения (лексема «словно»).
Третий период.
Таблица смысловых кластеров и ключевых слов за последний период лирических стихотворений поэта (см.Приложение, Таблица 3) показывает, что образы России и русской природы преобладают в его творчестве автора и на этом этапе. Таким образом, исходя из результатов анализа предыдущих периодов, тематика, связанная с Родиной и природой является ключевой во всей лирике Есенина. Однако от этапа к этапу происходят значимые изменения в наполнении данного кластера: от первого к третьему периоду исчезает фольклорно-сказочный элемент в образе природы Руси: пропадают «сарафан», «косы», «терем», «лебедушка», природа родной страны выражается в конкретных, реалистичных образах («дом», «сад», «поле», «дорога», «клен», «береза» и т.д.).
Тема эмоций, чувств и действий человека в третьем периоде количественно представлена более весомо, чем в первые два периода (без частотности: здесь - 19 слов, на втором этапе - 13; на первом - 12). Очевидно, что чувственно-эмоциональная сторона лирики Есенина этого периода приобретает особенный накал, что легко объяснить сопровождавшими ее жизненными обстоятельствами. Однако, самое частотное слово - «знаю» вовсе не из эмоциональной сферы, а связано с умственной, мыслительной деятельностью. Из этого можно заключить, что поэт теперь живет не столько сердцем (лексема «сердце» совсем исчезла из ряда частотных), сколько головой.
Интересно заметить, что в данном периоде, лексемы, несущие в себе отрицательные эмоции («жаль», «плачет», «грусть», «грустно», «прощай»), заметно превышают по частотности слова с положительными эмоциями («счастье», «отрада», «радость»), что свидетельствует о мотивах грусти, прощания, увядания (подробнее об этом ниже). Так, на протяжении всех трех периодов жизни и творчества Есенина видна интересная закономерность в кластере, связанном с эмоциями человека: на первом периоде заметно преобладают слова, несущие положительные эмоции, на втором - почти равное количество «положительных» и «отрицательных» слов, на третьем - видно преобладание лексем, означающих отрицательные эмоции.
Тема человека явилась неотъемлемой и на третьем периоде жизни С.А.Есенина. Таким образом, частотный анализ подтверждает, что, она, наряду с тематикой природы и родины, является ключевой в художественном мире лирики поэта. В третьем периоде возросла частотность слов «жизнь» и «поэт», что, вероятнее всего, свидетельствует о размышлениях автора о жизни и творчестве. Помимо этого, к указанной тематике примыкают такие лексемы, как «молодость» и «юность», что в совокупности с «жаль», «прости», «прощай» и «грусть» из эмоциональной сферы, а также глаголами прошедшего времени «стал», «видел» являются показателем мотивов увядания, горьких воспоминаний о былых, навсегда ушедших днях.
Слова, эксплицитно связанные с религиозной тематикой сохранились лишь с частотностью в одно-два слова («дух», «господь»). Зато возросло число употреблений слова душа, которое имплицитно несет религиозные коннотации. Вполне возможно, что лексика, связанная с религией вымарывалась из стихов этого периода цензорами, так как религиозность яростно и последовательно искоренялась в Советском государстве.
В тематике дня и ночи нет заметного преобладания какой-либо из сторон. Интересно в этой связи, что среди светил солнце, которое лидировало по числу употреблений во второй период (23), и было довольно частотным в первый период (11), здесь имеет низкую частотность (3). В контексте слов, описывающих эмоциональное состояние лирического героя, которые приводились выше, такое «распределение сил» может свидетельствовать о том, что в сознании поэта происходило в эти годы смещение к более мрачному мировосприятию. Это подтверждается биографическими обстоятельствами его жизни.
Таким образом, метод анализа ключевых слов позволил выявить некоторые аспекты лирики третьего периода, которые не упоминали ранее исследователи творчества С. Есенина: парадоксальное сочетание лексем, выражающих сильный эмоциональный накал и лексемы «знаю»; переход к реалистичным образам в кластере природы; скудность кластера религии, связанная с политикой цензуры.
В целом, тематические кластеры, которые удалось выявить в ходе кластеризации наиболее частотных слов, совпадают с основными темами творчества поэта, выделяемыми учеными. Помимо этого, компьютерная обработка открыла ряд нюансов, который прежде ускользал от внимания специалистов-филологов. А именно: а) религиозная тематика выражена наибольшим количеством ключевых слов на первом этапе жизни автора (хотя литературоведы считают, что на втором) и заметно сокращается на третьем этапе; б) высокая частотность слова «словно» на первом периоде и постепенное сокращение его частотности на следующих этапах; в) преобладание «ночных» образов над «дневными» в первом и третьем периоде, во втором - «дневных»; г) смена количественных соотношений слов, несущих в себе положительные или отрицательные эмоции, на протяжении всех трех периодов; д)исчезновение фольклорно-сказочного элемента в образе природы Руси от первого к третьему периоду жизни и творчества автора.
1.1.2 Поэмы
Периодизация и сбор корпуса поэм.
Поэмы С.А. Есенина были отнесены к трем этапам жизни и творчества автора, в соответствии с периодизацией, предложенной П.Ф. Юшиным и используемой в исследовании ключевых слов лирики поэта (упомянута ранее в данной работе).
Аналогичным образом корпус всех опубликованных поэм С. Есенина был разбит на три подкорпуса: поэмы первого периода, второго и третьего. Поэмы так же, как и стихотворения, были взяты из книги серии «Библиотека Великих Писателей».
Машинная обработка подкорпусов поэм.
Обработка каждого из подкорпусов поэм также проводилась с помощью корпус-менеджера AntConc, позволяющего получить список наиболее частотных слов в тексте. Указанный принцип деления и автоматической обработки текстов (в соответствии с периодизацией) позволил выявить смену наполнения художественного мира поэм разных периодов, сходства и различия среди ключевых лексем.
Анализ ключевых слов.
После машинной обработки подкорпусов поэм списки ключевых слов были преобразованы в таблицы, где частотные лексемы были объединены в различные смысловые кластеры (тематические группы). Указанные таблицы составлялись для каждого подкорпуса поэм в отдельности; ознакомиться с ними можно в приложении к данной работе (см.Приложение, Таблицы 4 - 6).
Первый период.
На основе данных таблицы кластеров и ключевых слов поэм первого периода (см.Приложение, Таблица 4) можно сделать вывод о том, что одной из ключевых тем этого этапа является тема природы и родной деревни. Здесь можно выделить как собственно природу и ее обитателей (например, «леса», «березы», «кони»), так и явления природы («вихорь», «ветер», «снег», «молнии», «тучи», «гром»), которые, в основном описывают, как можно заметить, хмурую погоду и являются прообразами тревоги, ненастья. Если брать в расчет временные рамки указанного периода жизни и творчества автора (1914 - 1915), несложно предположить, что эти ключевые лексемы отражают ситуацию в стране и обществе, а также являются есенинским предчувствием грядущих бед революции и гражданской войны.
Одним из самых частотных слов первого периода стало слово «Русь», имеющее мощные фольклорные ассоциации, которые подкрепляются другими ключевыми лексемами из разных кластеров, также несущими ассоциации с фольклором: «терем», «батырь», «коса». В добавление, указанная лексема отражает настроения Есенина в этот период жизни и творчества. С одной стороны, это беспокойство за судьбу родины в связи с историческими катаклизмами, а с другой - осознание бесконечной любви к России.
На фоне природы в есенинском художественном мире обязательно присутствует человек с его эмоциями, чувствами и действиями. Мотив несчастья прослеживается и здесь: «горе», «слезы», «печаль», «плакали». Важным является то, что главные герои поэм - исторические и фольклорные персонажи, борцы за свободу - «Марфа», «Евпатий» (обладают высокой частотностью повторений в тексте). Почти все лексемы третьего смыслового кластера указывают на действия, совершаемые данными персонажами, подтверждая, что автор в текстах поэм уделяет героям большое внимание.
Следующий кластер, связанный с религиозной тематикой, выражен б?льшим количеством слов, по сравнению с рассматриваемыми далее этапами жизни и творчества С.Есенина. Таким образом, в первом периоде фольклорные образы вплотную пересекаются с библейскими.
Данные таблицы (см.Приложение, Таблица 4) свидетельствуют о том, что особое значение уделяется в ранних поэмах образам дня и ночи, солнца и луны (месяца). Однако здесь не прослеживается преобладание образов света над образами тьмы и наоборот.
Следующая важная для поэта тема, которую можно выделить исходя из машинной обработки текстов поэм С.Есенина, - Россия, государство, общество. Самое частотное в ранних поэмах слово «царь» (8) относится именно к этому кластеру. И это вполне обосновано - как уже было выяснено, большинство поэм данного периода являются фольклорно-историческими, в них содержатся истории о выходцах из народа, борцах за свободу, что, в свою очередь, тесно связано с тематикой рассматриваемого кластера и всеми словами, содержащимися в нем.
Повышенной частотностью обладает лексема «словно» (5), это показывает, что сравнение, как художественный прием, достаточно распространено в поэмах Есенина. Именно благодаря этому приему, есенинская природа приобретает одушевленность, так как в большинстве случаев поэт сравнивает природы явления с животным миром и с человеком.
В отдельные кластеры были выделены цвета, их оттенки и различные характеристики. Информация таблицы (см.Приложение, Таблица 4) свидетельствует о том, что цветовая гамма данного периода творчества совсем не разнообразна - частотны только белые и черные цвета, чего нельзя сказать о характеристиках - их на порядок больше и они очень разнообразны (например, «родина кроткая», «злые скорби», «радость короткая»).
Таким образом, среди нюансов, которые удалось выделить благодаря компьютерной обработке текстов поэм С.Есенина раннего периода, можно подчеркнуть: частотность слов с семантикой тревоги и несчастья, слов «царь», «Русь», «словно»; обилие и разнообразие различных характеристик родины, героев и их эмоций, чувств и, одновременно, сведение цветовых характеристик к черно-белому контрасту.
Второй период.
Из таблицы с тематическим объединением ключевых слов в кластеры за второй период жизни и творчества С.Есенина (см.Приложение, Таблица 5) видно, что сами кластеры, в целом, остаются прежними, однако каждый из них изменяется как качественно, так и количественно, по сравнению кластерами первого этапа. Известно, что революция 1917 года оказала значительное влияние на мировоззрение и художественный мир автора.
Во-первых, повышенной частотностью обладают имена есенинских героев, исторических персонажей (к примеру, Номах, Рассветов, Пугачев и т.д.), составляющих достаточно обширный кластер. Каждый из героев является прообразом революции - бандит Номах (самая большая частотность), комиссары Рассветов, Чекистов, повстанец Барсук, «сочувствующий коммунистам доброволец» Замарашкин, бунтовщик Пугачев.
Во-вторых, расширился и кластер «Россия, государство, общество», в который вошло и второе по частоте повторений слово «нам». Данное местоимение тоже непосредственно связано с темой революции - автор призывает народ к единству, размышляет о будущем страны, которое связывает с интересами народных масс.
В кластере, связанном с чувствами, действиями человека, частотны такие слова, как «хочу» и «знаю» (наибольшая частотность), «вижу», «буду», «говорю», «люблю». Также поэт в своих размышлениях призывает людей к действию - «слушай», «дай», «должны», «послушайте», «проведите».
Данные таблицы (см.Приложение, Таблица 5) свидетельствуют о расширении кластера вспомогательных, вводных, модальных слов в тексте, частиц, союзов. Этот факт означает, что автор ведет размышления, выстраивая свои рассуждения при помощи приведенных в таблице лексем.
В поэмах второго периода жизни и творчества С.Есенина появляется достаточно большое количество слов, объединяющихся в кластер «Время и пространство». Причем, лексемы, актуализирующие настоящий момент времени («здесь», «нынче», «сегодня», «сейчас»), количественно превышают остальные («всегда», «завтра», «снова», «опять»). Таким образом, все внимание поэта поглощено настоящим.
Тематика дня и ночи, солнца и луны в поэмах второго периода тоже присутствует, однако ночная тематика явно преобладает как количественно, так и качественно.
В кластере, связанном с верой, самым частотным явилось слово «черт». Обилие обращений «боже» и «господи» связаны с мольбами автора о помощи стране и народу в нелегкое время революций (например, «…Господи, отелись!» (воплотись) [3; стр.154]).
Ключевыми кластерами по-прежнему остаются «Природа, родная деревня» и «Человек». Можно сделать вывод о том, что в своих размышлениях С.Есенин пытался показать революцию сквозь призму сознания простого народа. Интересно, что лексемы «дождь», «ветер», «тучи», «осень», «туман» объединены семантикой мрачности, грусти.
Как видно из таблицы (см.Приложение, Таблица 5), кластер цветообозначения стал значительно шире, чем в предыдущий период творчества автора. И здесь заметно одно значительное противоречие - на протяжении всего данного периода в разных кластерах появляются слова, несущие в себе мрачную, нагнетающую, темную семантику, в то время как кластер цветообозначения наполнен достаточно яркими красками - золотой, желтый, синий.
В кластере «Характеристики» отношение автора к революционным преобразованиям показательно - повышенная частотность слова «новый», противопоставление «наших» и «твоих», сравнения «лучше» и «больше».
Таким образом, тема России и революции является основной для поэм второго периода (что утверждали литературоведы). Эту тему поэт старался показать с позиций простого народа, рассказывая в поэмах о бунтарях - выходцах из народа. Ключевыми по-прежнему остаются образы природы и человека на ее фоне. Поэт много размышляет о Родине и революции активно выражает собственную позицию («хочу», «знаю», «буду», «говорю»), взывает к людям («послушайте», «проведите»), строит свои умозаключения с помощью вводных, модальных слов, частиц, союзов, актуализирует проблему во времени (в связи с этим в таблице второго периода появляется новый кластер). Сквозным почти для всех тематических кластеров является мотив мрачности, нагнетания, темноты; единственный кластер, где семантика мрачности отсутствует - кластер цветообозначения.
Третий период.
Из таблицы ключевых слов и смысловых кластеров поэм третьего периода (см.Приложение, Таблица 6) очевидно, что образы России и русской природы снова преобладают. Таким образом, с учетом результатов анализа предыдущих периодов, можно смело утверждать: тематика, связанная с родиной и природой, является ключевой для художественного мира поэм и лирики Есенина. Однако от этапа к этапу происходят значимые изменения в этих кластерах: от первого к третьему периоду исчезает фольклорно-сказочный элемент в трактовке природы и Руси: пропадают «батыри», «косы», «терем», природа родной страны представлена в конкретных, реалистичных образах («дом», «сад», «поле», «Рязань», «дорога», «клен», «береза» и т.д.).
Тема эмоций, чувств и действий человека в третьем периоде претерпевает качественные изменения. Можно заметить, что чувственно-эмоциональная сторона поэм Есенина этого периода приобретает особенный накал («люблю», «помню», «видел», «вспомнил», «забыл», «чувствую»), что легко объяснить сопровождавшими ее жизненными обстоятельствами. Однако, самое частотное слово - «знаю» вовсе не из эмоциональной сферы, а связано с умственной, мыслительной деятельностью. Из этого можно заключить, что поэт теперь живет не столько сердцем, сколько головой.
Как было выяснено ранее, тематика тревоги, нагнетания на первых двух этапах жизни и творчества поэта подкреплялась словами из «природного» кластера, описывающими пасмурную погоду и связанными в сознании автора с темой революции. На третьем периоде творчества из природных катаклизмов в ключевых словах появляется только «метель». И это вполне оправданно - ведь революция закончилась, и в творчестве Есенина возникают иные мотивы.
Интересно, что преобладающими в указанный период являются лексемы, несущие в себе отрицательные эмоции («гроб», «страх», «грусть», «тоска»), а слова с положительными эмоциями (например, «счастье», «отрада», «радость») здесь вовсе отсутствуют. Данные факты свидетельствует о мотивах грусти, прощания, увядания. Эти же мотивы несут в себе слова «временного» кластера - «лет» (самое частотное), «года», «дни», «час». Автор словно вспоминает былые, навсегда ушедшие дни, подводит итоги. «Ночная» тематика преобладает над «дневной», что подчеркивает мрачное мировосприятие писателя. Кроме того, в цветовом кластере самым частотным словом явилась лексема «черный», а также слово «один» в характеристиках. Так, можно сделать вывод, что в художественном мире С.Есенина активно развиваются мотивы одиночества, отверженности, мрачной грусти.
Тема человека явилась неотъемлемой и на третьем этапе жизни и творчества С.А.Есенина. Так, частотный анализ подтверждает, что, она, наряду с тематикой природы и родины, является ключевой для художественного мира лирики (а также поэм) поэта. Причем на третьем этапе частотность слов «жизнь», «поэт», «человек» явно возросла, что, вероятнее всего, свидетельствует о размышлениях автора о мире и месте человека в нем, о жизни и о творчестве. Также в таблице за третий период можно увидеть обилие терминов родства, что означает не только горькие воспоминания и тоску по родным, но и обращение автора к анализу прожитого. В этом кластере так же, как и в «природном», С. Есенин оставляет фольклорно-исторические образы и акцентирует внимание на конкретных, реальных личностях (причем этот ряд включает и самого поэта): Прон, Анна, Ленин, Сергей.
Среди слов, связанных с религиозной тематикой, возросло число употреблений слова «душа», которое имплицитно несет религиозные коннотации. Здесь возникает ситуация, аналогичная с третьим периодом лирики поэта: вероятнее всего, низкая частотность кластера «вера» обусловлена «очисткой» лексики, связанной с религией, цензорами (религиозность последовательно искоренялась в Советском государстве). Такая взаимосвязь в наполнении кластеров ключевыми словами разных жанров одного и того же периода подтверждает целостность и уникальность художественного мира поэта.
Таким образом, новыми аспектами (которые не упоминались исследователями ранее) художественного мира Есенинских поэм третьего периода стали: исчезновение фольклорно-сказочного элемента в описаниях природы и фольклорно-исторического в описаниях героев, переход к более конкретным и реалистичным образам; парадоксальность сочетания обильности чувственно-эмоциональной лексики и частотности слова «знаю»; значительное сокращение употребления религиозной лексики.
В целом, основные темы, полученные и описанные в рамках анализа ключевых слов, совпадают с темами, выделенными исследователями творчества С. Есенина. При этом, современный метод анализа позволил обнаружить некоторые особенности художественного мира поэта, которые прежде оставались незаметными для литературоведов. Для поэм первого периода это: частотность слов, являющихся прообразами тревоги и несчастья, слов «царь», «Русь», «словно», имен основных персонажей; развитость самых различных характеристик родины, героев и их эмоций, чувств и, в то же время, скудость цветовых характеристик. Для поэм второго периода: размышления автора на тему России и революции, выражение собственной позиции, призывы к людям, выстраивание умозаключений с помощью вводных, модальных слов, частиц, союзов, актуализация проблемы во времени за счет использования наречий (в связи с этим появляется новый кластер). С.Есенин в своих размышлениях о революции нередко обращается к религиозным образам, однако от периода к периоду число слов с религиозной семантикой сокращается. Сквозным почти во всех тематических кластерах является мотив мрачности, нагнетания, темноты, однако в кластере цветов такой тенденции нет. Для поэм третьего периода: исчезновение фольклорно-сказочного элемента в описаниях природы и фольклорно-исторического начала в описаниях героев и переход к конкретным жизненным образам; сочетание обилия чувственно-эмоциональной лексики и частотности слова «знаю»; значительное сокращение употребления религиозной лексики.
1.1.3 Проза
Классификация и сбор корпуса прозы.
Важной частью творческого наследия С.А. Есенина является его проза: художественная, публицистическая и критическая (или литературно-критическая).
Несмотря на то, что есенинская проза уступает по общественно-эстетической значимости его поэзии, - считают современные литературоведы (Ю. Прокушев, Е. Наумов, С. Куняев), - она представляет интерес и как вспомогательная лаборатория художественного поиска Есенина, и как самостоятельное, самобытное явление. Органически связанная с его поэзией, проза содержит в себе проникновенный лиризм, яркую образность, ёмкость слова и своеобразную поэзию в слове. Во всех своих жанровых разновидностях она представляет собой интересное, эстетически полноценное явление, достойное внимательного изучения.
Прозаическое наследие поэта невелико (к примеру, всего три произведения в жанре художественной прозы), поэтому более логичным представляется анализ прозы по ее жанрам, без учета периодизации.
Таким образом, из корпуса всей опубликованной прозы С. Есенина было сформировано три подкорпуса: художественная, публицистическая и критическая проза. Произведения были взяты из сборника, который указывался ранее в разделах 1 и 2 (лирика и проза, соответственно).
Машинная обработка подкорпусов прозы.
Машинная обработка прозаических текстов Есенина проводилась с помощью используемой ранее программы AntConc, которая направлена на проведение корпусных лингвистических исследований.
Проза автора обрабатывалась в соответствии с вышеуказанной классификацией, что позволило проследить различия или сходства, смену или сохранение ключевых слов в том или ином жанре прозы.
Анализ ключевых слов.
Для удобства анализа результатов по жанрам прозы С.Есенина были составлены таблицы с наиболее частотными словами, где все выявленные слова были объединены в смысловые кластеры и подкластеры и представлены в виде таблиц, с которыми можно ознакомиться в приложении к настоящему исследованию (см.Приложение, Таблицы 7 - 9).
Художественная проза.
Жанровой особенностью художественной прозы является косвенная передача авторского сознания через персонажей, их характеры и поступки.
Представленные в таблице данные (см.Приложение, Таблица 7) свидетельствуют о том, что самым объемным стал кластер с общим названием «Человек» - это демонстрирует, что одной из ключевых тем художественной прозы С.Есенина является тема человека. Результаты обсчета показывают, какой конкретно человек оказывается в центре художественного мира данного жанра прозы.
В первую очередь, это мужчина. Доказывается этот факт количеством синонимов и частотностью слов, отнесенных к первой части кластера «Человек»: существительных мужского рода здесь 10 (не учитывалась лексема «человек», так как семантически она может означать принадлежность как к женскому, так и к мужскому полу), а их суммарная частотность - 169; существительных женского рода - 4, и их общая частотность равна 62. Кроме того, самое частотное слово данного кластера - «мужик», которое в словаре В.Даля толкуется как «мужчина простолюдин, человек низшего сословия; крестьянин, поселянин, селянин, пахарь, земледел, семьянин и хозяин. || Человек необразованный, невоспитанный, грубый, неуч» [17]. Если обратиться к содержанию трех прозаических произведений Есенина, то становится понятным, что их герои - люди из русской деревни (также, свидетельствуют о том, что для автора важен именно деревенский человек, просторечия «девки», «бабы»). Таким образом, художественная проза автора сосредоточена на крестьянине, «мужике». Есенин не стремится примерять на себя женский образ, как это сделал, например, Г.Флобер в романе «Мадам Бовари», а пытается отразить мир через призму близкого ему мужского сознания. К тому же, Есенин сам был родом из деревни и знал крестьянскую жизнь не понаслышке.
Тенденция преобладания мужского начала над женским прослеживается и в подкластере, связанном с лексемами родства: существительных мужского рода здесь 6, а их суммарная частотность равна 87, женского рода - 3 с общей частотностью 47. Самое частотное слово - «дед», которое, по словарю В.Даля, может означать «старый человек, старик» [17]. Вероятно, данная лексема связана с темой старости и старения в художественном мире Есенина. Данный мотив - сквозной для художественного мира Есенина в целом и является составной частью мотива грусти. Доказательством могут послужить строки из его стихотворений:
«Ах, увял головы моей куст…» [3; стр. 65];
«Увяданья золотом охваченный,
Я не буду больше молодым…» [3; стр. 67];
«…Тех волос золотое сено
Превращается в серый цвет» [3; стр. 71];
«Одержимый тяжелой падучей,
Я душой стал, как желтый скелет» [3; стр. 74]; и т.п.
Интересным представляется анализ подкластера местоимений в кластере «Человек». Во-первых, местоимение «он» более частотно, чем местоимение «она», что вновь свидетельствует о тенденции преобладания мужских образов над женскими в художественной прозе С. Есенина.
Во-вторых, среди местоимений можно выделить такие подгруппы: «я - ты» и «мы - они», при этом «я» и «мы» значительно преобладают. Этот факт непосредственно связан со спецификой художественной прозы Есенина: в ней диалогическая речь героев превалирует над авторским повествованием, отсюда и частотность местоимений первого лица.
Неудивительно, что частотными оказались имена персонажей, а повышенной частотностью обладают имена героев повети «Яр», что объясняется тем, что повесть значительно превосходит по объему рассказы «У Белой воды» и «Бобыль и Дружок». Кроме того, и здесь подтверждается выявленная выше тенденция - мужских имён больше и они обладают большей частотностью.
Следующий подкластер в кластере «Человек» - «Части тела», который представлен довольно обширно. Самая частотная лексема - «голова», её частотность в 3 раза превышает частотность лексемы «сердце», что свидетельствует о том, что есенинский герой живет не эмоциями, а рассудком. В целом, обширность данного подкластера можно связать с важностью темы быта и обыденности в художественной прозе Есенина.
Последний подкластер в смысловом кластере, связанном с темой человека - его «Эмоции, чувства» является наименее распространенным и частотным. Это подтверждает высказанную выше мысль о том, что есенинский герой живет разумом, а не эмоциями. Однако следует обратить внимание на состав лексем в подкластере: здесь больше слов, означающих негативные эмоции и чувства, чем позитивные: «слёзы», «боль», «грусть», «горе» «страх» (суммарная частотность - 28) и «любовь», «радость», «смех» (суммарная частотность - 11). Очевидно, что так создаётся общее настроение художественной прозы, в котором отчетливо звучит мотив грусти, характерный для всего творчества С.А.Есенина.
Кластером, который непосредственно связан с темой человека, является кластер предикатов, в котором объединены слова, обозначающие действия и состояния героев, поэтому он представлен обширно. В нем много глаголов, формирующих авторское повествование: они означают непосредственно действия человека или имеют семантику бытийности («было», а также «была», «был», «были»), выражены формами прошедшего времени. Можно заметить, что большинство глаголов связано с перемещением в пространстве («пошел», «вышел», «пришел», «подошел», «побежал», «приехал» и т.д.).
Самым частотным в кластере предикатов стал глагол «было», который, как удалось выяснить с помощью компьютерной программы AntConc (имеется функция просмотра выбранного ключевого слова в контексте), в основном оформляет безличные конструкции («было пусто», «было темно» и др.). Анна Вежбицкая полагала, что «Богатство и разнообразие безличных конструкций в русском языке показывают, что русский язык отражает и всячески поощряет преобладающую в русской культурной традиции тенденцию рассматривать мир как совокупность событий, не поддающихся ни человеческому контролю, ни человеческому уразумению, причем эти события, которые человек не в состоянии до конца постичь и которыми он не в состоянии полностью управлять, чаще бывают для него плохими» [16]. Кроме того, такие конструкции А.Вежбицкая связывала с концептом судьбы. Таким образом, повышенная частотность лексемы «было», оформляющей по большей части безличные конструкции, в художественной прозе Есенина свидетельствует как о важности природных сил в восприятии героем мира, так и о немаловажности судьбы героев для автора в повествовании.
Во-вторых, значимости образа мужчины для художественной прозы Есенина подтверждается и данным кластером - глаголов мужского рода прошедшего времени больше, чем глаголов женского рода этого же времени.
В-третьих, один из подкластеров в кластере «Предикаты» - «Мыслительная деятельность» - представлен не очень обширно, но в то же время является значимым, так как здесь частотными стали словоформы глаголов «думать» и «знать», что подтверждает мысль о том, что есенинский герой живёт рассудком, а не чувствами, он много думает и рассуждает. Это подкрепляется и тем, что подкластер «Эмоции» в смысловом кластере «Предикаты» выражен еще менее обширно. В нём также есть интересные особенности: наличие глаголов «чувствовала» и «почувствовала», а также глаголов «засмеялся», «улыбнулся» и «улыбался». Значит, именно мужчина у Есенина выбирает разум, а не чувства, он может иногда засмеяться, улыбнуться, а женщина в некотором смысле противопоставлена мужчине - она может чувствовать и почувствовать.
Наконец, в кластере предикатов есть еще один подкластер - «Речевая деятельность» - который достаточно обширен. В первую очередь, это связано с жанром художественной прозы и авторским повествованием, о чем было сказано выше. Интересно, что спокойную речь героев («говорил», «сказал» и т.д. с суммарной частотностью 153) довольно часто сменяют экспрессивные слова «крикнул» и «гаркнул» (суммарная частотность равна 61, однако слово «крикнул» обладает самой высокой частотностью из всех предикатов, связанных с речевой деятельностью), что свидетельствует о повышенной эмоциональной напряженности в тексте.
Следующим важным смысловым кластером становится кластер «Природа», который позволяет выделить еще одну ключевую тему. Однако, в связи с тем, что суммарная частотность слов данного кластера значительно уступает суммарной частотности слов кластера «Человек», в списке ключевых тем тема природы занимает второе место после темы человека. Этот факт может показаться удивительным и даже парадоксальным, если учитывать роль образа природы в поэзии Есенина. Исследования ключевых слов стихотворений и поэм С.Есенина предыдущих лет [20, 21] показали, что природа являлась ведущей темой в его лирических произведениях (за ней следовала тема человека), однако, в художественной прозе природа выполняет иную функцию: она уходит на второй план, становится гармоничным дополнением для развития сюжета о крестьянине.
Как уже отмечалось выше, повесть «Яр» значительно превосходит по объему два других произведения художественной прозы Есенина, именно поэтому лексема «Яр» стала частотной.
В кластере «Природа» представилось возможным выделить больше всего подкластеров (по сравнению с остальными смысловыми кластерами). В первую очередь, это четыре стихии, которые можно представить в порядке уменьшения частотности так: вода, земля, воздух, огонь. Далее, если обратить внимание на состав каждого из этих подкластеров, то заметно преобладание «негативных» стихийных явлений: снег, дождь, лужи, тучи, ветер, грязь, бугор, овраг, дым, пожар. Таким образом, за счёт природных стихий в есенинской художественной прозе поддерживается мотив тоски, грусти и даже придаётся оттенок некоторого угнетения человека этими природными силами.
...Подобные документы
"Метод ключевых слов" как один из распространенных методов перехода к математической модели документа. Закономерности распределения частоты слов, отраженные в законе Ципфа. Экспериментальная оценка статистического анализа текста по модели TF*IDF.
реферат [591,7 K], добавлен 24.06.2009Мотивы и особенности лексики произведений "О дивный новый мир" О. Хаксли и "1984" Дж. Оруэлла. Анализ, сравнение и обобщение ключевых слов и воссоздание художественного мира романов. Создание веб-приложения "Словарь ключевых слов британских антиутопий".
дипломная работа [2,6 M], добавлен 21.06.2016Теоретические основы разработки приложения, реализующего подсвечивание ключевых слов. Описание используемых процедур и функций, структуры программы, интерфейса пользователя. Системные требования для работы приложения, анализ результаты его тестирования.
курсовая работа [1,2 M], добавлен 07.07.2012Отличие исконных слов от заимствованных и установление времени, причины заимствований и их роль для развития языка. Алгоритм подсчета обработанных слов приложением "Подсчет частоты введенных слов в текстовом файле". Отладка и тестирование программы.
курсовая работа [1,1 M], добавлен 13.06.2012Разработка архитектуры, отдельных модулей и сайта Интернет–системы электронной торговли отопительными приборами. Проектирование интерфейса; программная реализация, создание базы данных. Раскрутка сайта: подбор ключевых слов, анализ конкурентных запросов.
курсовая работа [3,4 M], добавлен 20.04.2012Разработка программной базы для исследований в области распознавания речи и поиска ключевых слов в ней. Расчет mel-фильтров. Скрытые марковские модели. Применение в алгоритме сверточного декодирования Витерби. Методы визуализации и обработки аудиоданных.
курсовая работа [1,1 M], добавлен 01.06.2015Описание инфологической и концептуальной модели. Определение типов сущностей и их атрибутов. Поля базы данных, связи между таблицами. Программное обеспечение БД учебных дисциплин и его реализации на основе понятий и ключевых слов предметной области.
дипломная работа [2,1 M], добавлен 26.05.2016Создание электронного филологического словаря. Использование не реляционной базы данных. Средства JavaScript для создания интерактивности на странице. Серверный язык программирования PHP. Специфика словарной статьи. Взаимодействие с базой данных.
курсовая работа [689,9 K], добавлен 26.02.2015Разработка словаря, содержащего термины по патентоведению, в виде базы данных. Систематизация данных путем разделения текста на отдельные файлы по буквам алфавита. Создание файла "Содержание" с гиперссылками для обеспечения быстрого доступа к информации.
презентация [278,1 K], добавлен 16.10.2013Характеристика основных патентных баз данных, используемых при проведении патентно-информационного поиска в Интернете. Стратегия патентного поиска и системы патентной классификации. Использование логических операторов и ключевых слов при поиске.
презентация [1,9 M], добавлен 15.09.2011Программное обеспечение - важный компонент функционирования компьютерной деятельности. Изучение принципа работы резидентных программ. Разработка программы по удалению слов из текстового файла без учета регистра. Требования к программе, разработка проекта.
курсовая работа [404,5 K], добавлен 03.02.2011Формат файла конфигурации, содержащего данные для подсветки синтаксиса. Его проверка при помощи XML Schema. Реализация функций для чтения данных подсветки и по загрузке таблицы стилей, ключевых слов и типов. Разбор текста и применение к нему стилей.
курсовая работа [122,3 K], добавлен 30.05.2015Изучение классификации поисковых средств по В.В. Дудихину. Поиск информации с помощью поисковых ресурсов. Формирование запросов. Использование ключевых слов. Индексация документов, размещенных на различных серверах. Зарубежные лидеры поисковых систем.
презентация [775,3 K], добавлен 10.03.2015Именованная совокупность переменных. Традиционный пример и сведения о структурах. Пример программы создающий список и выводящий его содержимое на консоль. Программа подсчета ключевых слов. Доступ к элементам объединения. Записи в линейном списке.
методичка [35,9 K], добавлен 06.07.2009Общее представление о поисковых службах. Характеристика видов информационно-поисковых систем, анализ их преимуществ и недостатков. Приемы простого поиска с помощью ключевых слов. Сохранение информации на компьютере для ее последующего использования.
учебное пособие [313,9 K], добавлен 10.10.2011Всемирная Паутина - это совокупность информационных ресурсов, связанных средствами телекоммуникаций и основанных на гипертекстовом представлении данных. Поиск информации в Internet. Конкретизация области поиска при помощи выделения ключевых слов.
реферат [111,4 K], добавлен 27.06.2010Примеры запросов к одной из поисковых систем Интернет (подбор ключевых слов) и расчетов в табличном процессоре MS Excel (инструменты). Описание машины Тьюринга: составляющие и их функционирование. Основные форматы представления графических данных.
контрольная работа [24,5 K], добавлен 09.06.2009Необходимость создания словаря по технологии для школьников. Основные этапы, требования и особенности создания электронного словаря. Использование морфологического анализа для оформления и дизайна. Принципы создания веб-страниц в Microsoft Publisher.
творческая работа [2,0 M], добавлен 17.11.2009Проектирование системы голосового управления в автоматизированных жилых комплексах. Распознавание и порождение (синтез) речи компьютером. Синтез устной речи. Технология поиска ключевых слов. Нейросетевое сравнение на основе простых персептронов.
дипломная работа [4,3 M], добавлен 19.06.2011Создание базы данных для автоматизации электронного магазина по продаже шин в терминале ER моделирования. Построение логической и концептуальной модели базы данных. Её реализация в интерактивной среде Интернет. Расчет экономической эффективности магазина.
курсовая работа [4,5 M], добавлен 10.10.2012