Структурне роззначення речень у корпусі текстів Р. Іваничука

Розвиток корпусних студій у лінгвістиці, можливості комп’ютерних технологій у дослідженні мови. Кількісний і якісний портрет ідіолекту Р. Іваничука. Перспективи дослідження типології, чисельності, частоти певних синтаксичних конструкцій у його текстах.

Рубрика Иностранные языки и языкознание
Вид статья
Язык украинский
Дата добавления 11.07.2018
Размер файла 15,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Структурне роззначення речень у корпусі текстів Р. Іваничука

Сучасне мовознавство значною мірою зорієнтоване на розвиток комп'ютерно-лінгвістичної методології дослідження й опису мови. Комп'ютерні технології, прийшовши в лінгвістику, запропонували нові технічні можливості для опрацювання, збереження й відбору мовного матеріалу. Це дало поштовх до зародження та розвитку нової галузі мовознавчих досліджень - корпусної лінгвістики [4, с. 5].

Із появою корпусів значно зросла ефективність лінгвістичної обробки великих масивів текстів. Корпус надає великі можливості для проведення різноаспектних лінгвістичних досліджень мовної системи.

Нині спостерігаємо стрімкий розвиток корпусних студій у всьому світі, що підтверджує як величезна кількість досліджень у цій галузі, так і різноманіття корпусів, що постійно з'являються. До напрямку залучають вивчення загальної теорії корпусної лінгвістики (Д. Байбер, Дж. Синклер, В. Тойберт), кореляції корпусної лінгвістики та інших лінгвістичних дисциплін (М. Вюн, В. Товберт), типології корпусів і методики інтерпретації корпусних даних (С. Гріс), розроблення загальних засад створення природних мов тощо (праці Б. Алтенберга, М. Баньки, В. Френсиса, Г. Кеннеді, Г. Ліча, А. Баранова, М. Михайлова, Р. Рикова, Л. Ричкової, С. Шарова та ін.).

Як стверджує Л. Ричкова, матеріал корпусу дає змогу не лише оптимізувати та об'єктивізувати лінгвістичні дослідження, але і по-новому окреслити багато традиційних лінгвістичних понять [4, с. 18]. До того ж, корпусні методи можна використовувати для вивчення мовних одиниць будь-якого мовного рівня.

Мета цього дослідження - визначити типи речень у корпусі текстів Р. Іваничука за допомогою структурного роззначення, що дасть змогу дослідити ідіолект письменника. Завдання статті полягає в розробленні принципів роззначення речень у КТ письменника.

На основі лінгвістичних корпусів проводять дослідження морфології, словотвору, словозміни, структури синтаксичних конструкцій різного типу (мінімальної, максимальної, класичної довжини речення залежно від типу тексту), а також аналіз різних синтаксичних явищ і конструкцій: вивчають валентність дієслів, типи прийменникового керування, прямий і зворотний порядок слів, синтаксичні функції різних граматичних категорій.

У світовій лінгвістиці, поряд із національними корпусами, все частіше з'являються корпуси текстів конкретних письменників. Вивчення ідіолекту автора стало одним із провідних напрямків сучасного мовознавства. Деякі характеристики автентичності мови можна виявити лише із застосуванням КТ, наприклад, багатство словника, індекси різноманітності та винятковості тощо.

КТ конкретного автора дає змогу вивчати мову письменника, його стиль на орфографічному, морфологічному, лексичному, логіко-семантичному, фразеологічному, синтаксичному, прагматичному, дискурсивному та інших рівнях.

Роззначення надає особливу додаткову інформацію про властивості текстів, які входять до корпусу, воно дозволяє швидко та ефективно знайти ті слова, форми та конструкції, які необхідні досліднику. Роззначення полягає у приписуванні текстам і їхнім компонентам спеціальних позначок:

зовнішніх, або екстралінгвальних (відомості про автора й відомості про текст);

структурних (розділ, абзац, речення, словоформа);

• власне лінгвістичних, що описують лексичні, граматичні та інші характеристики елементів тексту.

Роззначення мусить бути незалежним від тексту: має існувати можливість прибрати позначки й

переглянути текст без них, і навпаки, вичленувати самі лише позначки. В основу роззначення варто покласти загальноприйняті і теоретично нейтральні лінгвістичні принципи, якщо це можливо.

Міжнародний стандарт кодування текстової інформації ТЕІ (англ. Text Encoding Initiative - проект кодування текстів), який «репрезентує ті ознаки тексту, які потребують експліцитної ідентифікації з метою сприяти текстовому опрацюванню за допомогою комп'ютерних програм» [ТЕІ].

Елементами універсальної структури тексту вважають такі: <head> (заголовок), <div> (частина, розділ), <p> (абзац), <s> (речення), <epigraph> (епіграф), <dateline> (дата), <note> (примітка), <said> (пряма мова), <dedication> (присвята), <l> (рядок, у вірші), <abbr> (скорочення), <num> (число) та ін. Позначки, розставлені в кутових дужках (< >), - це інструкції мови роззначення, тимчасом як текст між цими інструкціями є справжнім текстом документу [4, с. 77].

Створення корпусу творів Р. Іваничука, на нашу думку, стане важливим поступом у розробці корпусу української мови, а також цікавим для лінгвістів та інших дослідників творчості цього письменника.

Для того щоб створити КТ письменника, треба визначити алгоритм дій: перш за все, слід формалізувати текст - зробити його роззначення.

Звернімо увагу на структурне роззначення тексту, оскільки воно відбиває інформацію про структуру тексту, дає змогу відокремити одне слово від іншого, виділити розділові знаки, окремі слова, межі словосполучення, речення, абзацу, глави, розділу, заголовка тощо.

У цьому дослідженні зупинимося детальніше на понятті речення та його роззначення у тексті. Тому, насамперед, необхідно визначити, що таке речення, де його початок і кінець.

Відомо, що в мовознавстві існує до тисячі визначень речення. Надзвичайно велика кількість визначень свідчить про те, що це дуже складна за своєю організацією й багатоаспектна одиниця, яку необхідно досліджувати в різних напрямках [8, с. 314]. На думку сучасних лінгвістів, речення - це граматично оформлена за законами певної мови цілісна одиниця мовлення, що є головним засобом формування, вираження й повідомлення думки. У ньому виражено не тільки повідомлення про дійсність, а й ставлення мовця до неї. Мова як засіб спілкування й обміну думками між усіма членами суспільства користується реченням як головною формою спілкування [9, с. 14].

Усім відомо, що на початку речення пишемо велику букву, а в кінці речення ставимо один із цих знаків: . / ? / ! / .../ !!! / ??? / ?! Такі розділові знаки здебільшого ділять текст на речення, а також розділовий знак «...» вказує на те, що в реченні не всі його компоненти наявні, а речення не закінчене, обірване тощо; розділовий знак «?» вказує на те, що речення містить у собі питання; розділовий знак «!» вказує на експресивність мовлення, вигук; у тексті також трапляються комбінації розділових знаків у кінці речення, а на початку можуть ставити розділовий знак «...».

Роззначення є основною характеристикою КТ, і саме наявність такої інформації відрізняє його від простих колекцій чи бібліотек, адже основна мета КТ - мовні особливості, а не зміст текстів. Для позначення початку речення ми будемо використовувати позначку <s>, а кінець речення позначатимемо - </s>:

<^>А орда!<^>

<^>Перестань, Мироне!</s>

<^>Антон ляснув книжкою по столі.</s>

Актуальні проблеми філології та перекладознавства. - Випуск дванадцятий. - 2017 рік <s>I ти прийшла до мене, щоб йому помститися?<^>

<>Тяжкі думи долали волинського князя, й до їжі ніхто не доторкався...</ї>

<^>...Називаюся Ігор Романюк; в це урочище під Страдчівською горою, яка моторошним отвором печерного входу зловісно вдивляється у принишклу видолину за Верещицею, я прийшов - згідно із колишнім домовленням між нами, чотирма філоматами, - із життєвих мандрівок.</^>

<>Ігор невідривно дивився на Оресту, а вона все ще не виходила з ролі, сиділа з опущеними руками, не маючи сили здолати враження від уперше побаченого величного сонця, яке не переставало її засліплювати. </s>

<>Й відчув цієї миті отець Миколай, як накрохмалений білий комірець здушив, немов петля, його невідступну мрію побачити хоча б ще один раз панночку з Крилоської гори...<^>

<>Отець-професор Миколай зайняв приходство у Страдчі того дня, коли вибухла Друга світова війна.<^>

<>Нині цей гріх князя переріс у масові злочини: гинуть у диявольській державі письменники, вчені, мистці, священики...<^>

<л>Записок з питаннями сипалося все більше й більше: викладачі цікавилися, ким працює письменник, не вважаючи, видно, письменницьку працю фахом; студенти хотіли знати, звідки він родом, чи одружений, хтось запитував, чому він вирішив стати письменником, й Ігор намагався переконати цікавих і відчував, що це йому не вдається: можна вибирати професію вчителя, лікаря, інженера, а письменника, співака чи художника вибирає доля, потреба писати зовсім не залежить від волі автора - це спосіб його існування, він мусить лише виховувати в собі витривалість у праці; запитували теж, чи повинен письменник чекати натхнення, й коли Ігор відповів, що натхнення чекає тільки лінюх або мрійник, залою прокотився схвальний сміх.<^>

Судячи з вище наведених прикладів, можна стверджувати, що творчість Р. Іваничука багата на різні типи речень: повні й неповні, односкладні та двоскладні, поширені й непоширені, ускладнені й неускладнені, складносурядні, складнопідрядні, складні безсполучникові, а також складні синтаксичні конструкції.

Близькими до складних синтаксичних конструкцій є конструкції з чужим мовленням, під яким розуміємо різні способи передавання мовлення або думок третьої особи, що входить до авторського тексту, але не є словами автора [5, с. 111].

Чуже мовлення може відтворюватися та передаватися іншим людям такими способами:

- пряма передача чужого мовлення (пряма мова, діалог, цитата);

- непряма передача чужого мовлення (непряма і невласне пряма мова) [9, с. 93].

Питання про синтаксичний статус конструкцій із прямою мовою є дискусійним. Б. Кулик вважає, що структури із прямою мовою утворюють особливий тип синтаксичної конструкції, близький до безсполучникового речення із взаємозалежними складовими частинами [7, с. 268].

І.Білодід виводить ці конструкції за межі синтаксису речення, повністю заперечуючи можливість їхнього функціонування у складі безсполучникових речень [10, с. 429]. М. Каранська таки переконана, що певне семантико-функціональне взаємовідношення між частинами конструкцій прямої мови існує, незважаючи на те що між ними немає синтаксичних зв'язків [7, с. 298]. К. Шульжук розглядає такі утворення як конструкції з прямою мовою, аналізуючи окремо як речення пряму мову і слова автора. Якщо слова автора - це переважно просте речення, то пряма мова може становити будь-який тип простого і складного речення [11, с. 365].

Роззначуючи речення в КТ Р. Іваничука, особливу увагу треба приділити реченням із прямою мовою, наприклад:

<s>A віддихавшись у Парижі, сказав: «Та система не надається до ремонту, її треба поламати й викинути на смітник!»<^>

<s>- Яка досконала соцреалістична схема! - вигукнув Мирон, перемагаючи сміх акторів.<^> <>Ну, а в цій п'єсі заполітизовано все, до того жахливо примітивно: «ви в піонерах були?», «ви ж член партії!» і т. д. і т. п...<^>

<s>A ще деколи проходив тротуаром чорний і масний із щіткою й металевою кулею на шнурі через плече коминяр, і коли Мирон, ще маленьким, при його появі хапався за ґудзика, той цідив крізь зуби: «Вхопися за пуцюрину, цванку!»<^>

Речення такого типу ми будемо вважати одним складним реченням.

Ще однією важливою проблемою є роззначення діалогу. Відомо, що діалог - це різновид прямої мови; він може вводитися словами автора або бути без них. Окремі повідомлення - репліки, з яких складається діалог, пишуть з нового рядка, перед кожним ставлять тире. Слова автора називають ремарками.Під час роззначення діалогу слова автора та перше речення репліки, що йому належить, до розділового знаку «.» ми вважатимемо одним реченням. Наступні речення репліки позначатимемо окремими синтаксичними одиницями.

<^>Аркадій Молодий, пооглядавшись, проказав тихо:

- Друзі, наша розмова може бути почута.</8>ОНам того треба?</s> <К>Краще б ми справді знайшли для зустрічей якусь печеру, бо в цій актовій залі напевно стіни вуха мають.</и>

<s>- А я скажу, куди нам варто податися, - промовив Ігор.</Ь><^> - До Страдча.МиХМТам така печера, що й біс нас не знайде. </з><з>Я добре знаю ті місця, сам родом з Янова... </s>

<s>- Чому б і ні? - підтримала Ігоря Ліда.</з> <s>- Виїхати на пленеру, ми ж таки маємо якийсь стосунок до мистецтва.<Ь>ОІ до романтики теж, адже ще не старі...<^>

Запропонована схема роззначення речень у корпусі текстів Р. Іваничука дасть змогу встановити арсенал синтаксичних конструкцій, визначити типи, частотність, чисельність, довжину речень у творах письменника. Отримані результати допоможуть визначити особливості ідіолекту Р. Іваничука, а описане роззначення суттєво полегшить мовознавчі та літературознавчі дослідження. Письменницький КТ, за умови продуманого роззначення, може дати близький до повного кількісний та якісний портрет ідіолекту автора.

Перелік умовних скорочень

КТ- корпус текстів.

Список використаної літератури

лінгвістика мова текст синтаксичний

1. Бук С. Структурне анотування у корпусі текстів (на прикладі прози Івана Франка) / С. Бук // Українська мова. - 2009. - № 3. - С. 59-71.

2. Вихованець І. Р. Граматика української мови. Синтаксис: [підруч.] / І. Р. Вихованець. - К. : Либідь, 1993. - 368 с.

3. Демська-Кульчицька О. М. Базові поняття корпусної лінгвістики / О. М. Демська-Кульчицька // Українська мова. - 2003. - № 1. - С. 42-47.

4. Жуковська В. В. Вступ до корпусної лінгвістики: навчальний посібник / В. В. Жуковська. - Житомир: Вид-во ЖДУ ім. І. Франка, 2013. - 142 с.

5. Загнітко А. Український синтаксис: теоретико-прикладний аспект / А. П. Загнітко. - Донецьк: ДонНУ, 2009. - 137 с.

6. Іваничук Р. Хресна проща: Романний триптих / Р. Іваничук. - Львів: ЛА «Піраміда», 2011. - 284 с.

7. Каранська М. У. Синтаксис сучасної української літературної мови / М. У. Каранська. - К.: Либідь, 1995. - 312 с.

8. Кулик Б. М. Курс сучасної української літературної мови: Синтаксис / Б. М. Кулик. - 2 частина. - К.: Радянська школа, 1961. - 287 с

9. Синтаксис української мови: навчальний комплекс / уклад. О. В. Дуденко. - Умань: ВПЦ «Візаві», 2015. - 208 с.

10. Сучасна українська літературна мова. Синтаксис / за ред. І. К. Білодіда. - К.: Наукова думка, 1972. - 515 с.

11. Шульжук К. Ф. Синтаксис української мови: [підруч.] / К. Ф. Шульжук. - К.: Видавничий центр «Академія», 2004. - 408 с.

Размещено на Allbest.ru

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.