Алгоритм розпізнавання синтаксичних фразеологізмів (для послідовності чотирьох слів)
Особливості побудови алгоритму розпізнавання синтаксичних фразеологізмів для випадків чотирьох слів, розташованих у тексті поспіль. Формальні і статистичні параметри, за якими можна відмежувати синтаксичні фразеологізми від інших мовних одиниць.
Рубрика | Иностранные языки и языкознание |
Вид | статья |
Язык | украинский |
Дата добавления | 10.05.2018 |
Размер файла | 129,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
АЛГОРИТМ РОЗПІЗНАВАННЯ СИНТАКСИЧНИХ ФРАЗЕОЛОГІЗМІВ (ДЛЯ ПОСЛІДОВНОСТІ ЧОТИРЬОХ СЛІВ)
СИТАР Ганна
Анотація
синтаксичний фразеологізм мовний слово
У статті здійснено спробу побудови алгоритму розпізнавання синтаксичних фразеологізмів для випадків чотирьох слів, розташованих у тексті поспіль. Спираючись на результати попередніх теоретичних досліджень, виділено формальні і статистичні параметри, за якими можна відмежувати синтаксичні фразеологізми від інших мовних одиниць у корпусі українськомовних текстів.
Ключові слова: алгоритм; корпус текстів; модель речення; синтаксичний фразеологізм; українська мова; фразеологізоване речення.
Аннотация
А. СИТАРЬ АЛГОРИТМ РАСПОЗНАВАНИЯ СИНТАКСИЧЕСКИХ ФРАЗЕОЛОГИЗМОВ (ДЛЯ ПОСЛЕДОВАТЕЛЬНОСТИ ЧЕТЫРЁХ СЛОВ)
В статье предпринята попытка построения алгоритма распознавания синтаксических фразеологизмов для четырёх слов, расположенных подряд в тексте. Опираясь на результаты предшествующих теоретических исследований, выделены формальные и статистические параметры, позволяющие разграничить синтаксические фразеологизмы и другие языковые единицы в корпусе украиноязычных текстов.
Ключевые слова: алгоритм; корпус текстов; модель предложения; синтаксический фразеологизм; украинский язык; фразеологизированное предложение.
Annotation
H. SYTAR ALGORITHM OF SYNTACTIC IDIOMS RECOGNITION IN THE CORPUS OF TEXTS (FOR FOUR WORDS IN THE SEQUENCE)
In the article it is made an attempt to construct the syntactic idioms recognition algorithm for four words text sequence. Based on the results of previous theoretical studies we highlighted formal and statistical criteria that enable to distinguish syntactic idioms from other language units in the corpus of Ukrainian-language texts.
Keywords: algorithm; corpus of texts; model of sentence; syntactic idiom; sentence with phraseological structure; the Ukrainian language.
Background: Attention of national and foreign researchers was focused so far on structural and semantic features of syntactic idioms. Automatic analysis of these peculiar units that are on the verge of syntax and phraseology still was not carried out in the scientific literature. This issue requires a theoretical understanding and practical implementation. In the construction of algorithm for four words in the sequence in the text, we lean against previous experience from the conclusion of algorithm for three words in the sequence that embrace for the sentences with one-term and sentences with two-term core component [Ситар 2016].
Purpose: To create an algorithm of recognition of syntactic idioms in the corpus of texts (for four words in the sequence in the text).
Results: Based on the results of previous theoretical studies we highlighted formal and statistical criteria that enable to distinguish syntactic idioms from other language units in the corpus of Ukrainian-language texts.
The author developed a block diagram of syntactic idioms recognition, incorporating two branches constructed accordingly. The first branch is based on the presence of word repeats (full words concurrence or presence of other word forms of the word) and the list of core components determined on previous stages of the study (є... і/й/та;з/із/зіусіх/всіх, не).
The second branch was created for another type of syntactic idioms -- with a three-term core component. It takes into account the following properties of the analyzed units: the presence of combinations of service parts of speech, service parts of speech with pronoun or adverb, pronoun and adverb; compliance of words combinations with the register of the syntactic idioms core components currently comprising 108 structures; association measure of mutual information >19.8.
Discussion: Offered algorithm enables automatic identification of syntactic idiomsand removal of contexts of their use, it can be used to improve the procedure of automatic text processing and creation of automated translation systems.
Вступ
Синтаксичні фразеологізми (або фразеологізовані речення) -- особливий тип речення, у якому стрижневий і змінний компоненти пов'язані ідіоматично і розташовані переважно фіксовано, граматичні зв'язки і прямі лексичні значення слів послаблені [2; 4; 11; 12; 13; 14], наприклад: Що за день! Чим не подарунок?! От вам і відповідь. От же ж новина! Злочин є злочин. Треба так треба. Теж мені молодці! Яке там успішно! Де вже там встигли! Дружба вона і є дружба. Кохання і в Африці кохання та ін. Такі речення належать до дієвих засобів експресивного синтаксису, за допомогою яких мовець виражає ставлення до певної реалії або ситуації дійсності, прагне досягнути впливу на почуття адресата мовлення, сформувати в нього потрібну думку або викликати відповідну дію.
Аналіз досліджень і публікацій
Ґрунтовний аналіз синтаксичної будови та семантики українських фразеологізованих речень та розмежування трьох ступенів фразеологізації речень здійснили М.І. Личук та В.Д. Шинкарук [8, с. 9]. Особливості окремих груп синтаксичних фразеологізмів висвітлено в межах досліджень відповідних семантичних або комунікативних категорій: ствердження і заперечення (праці М.П. Баган, О.П. Кущ, А.Й. Паславської), згоди (дослідження Н.К. Войцехівської), комунікативної інтенції (праці С.Т. Шабат- Савки) та ін. [1; 3; 7; 10; 18]. Проте синтаксичні фразеологізмидосі не розглядали в аспекті автоматичного аналізу.
У комп'ютерній лінгвістиці вважається, що фразеологічні одиниці (у широкому розумінні цього терміна) становлять один вузол, відповідно їх вводять до електронних словників програм автоматичного аналізу тексту або автоматизованого перекладу в готовому вигляді, інколи із перерахуванням можливих варіантів. Вчинити так само із синтаксичними фразеологізмами досить проблематично через те, що будь-який синтаксичний фразеологізм складається з двох компонентів -- стрижневого (незмінного) та змінного, при цьому лексичне наповнення і морфологічна варіантність останнього можуть бути настільки ємними, що її неможливо описати вичерпно та зафіксувати у словниках.
Розглянемо такі речення:
Горпина. То й добре! Сідайте ж, будьте ласкаві!
Бублейниця. Еге! Де вже там сидіти! Мені аж танцювати хочеться, так весело було в сусіди! (І. Нечуй-Левицький. На кожум'яках) Тут і далі наведено приклади, почерпнуті з Українського національного лінгвістичного корпусу (далі УНЛК) Українського мовно-інформаційного фонду Національної академії наук України.;
Був він худенький і такий мерзлякуватий, що у найжаркіший день, тільки залізе у воду, через хвилину вже цокає зубами і, обхопивши себе руками навхрест за плечі, дрібно тремтить, як цуценя під дощем. Де вже там плавати, як просто у воді перебувати несила (В. Нестайко. Одиниця з обманом);
Софрон. Ну, прощай Василино! (Обніма і цілує її). Не сумуй же!
Отаман. Де вже там не сумувать (І. Кар- пенко-Карий. Підпанки);
...це було лице, яке Пігмаліон бачив на своїх колінах тієї літньої ночі у мерехтливих світанкових відблисках, яке він цілував і пестив, обличчя, про яке він казав: «Ти така гарна...» -- а вона посміхалася: «Де вже там гарна? Довго - носа, пащекувата. Як моя мама каже -- на любителя...» (В. Дрозд. Пігмаліон);
-- Що тобі, моя дитино! -- упада вже коло Катрі мати. -- Уступила до хати біла, мов білочок... що тобі, доню?
-- Нічого, мамо, нічого!
-- Де вже там нічого! Журиш ти мене, дочко! (М. Вовчок Три долі);
...Єлені стало ясно -- де вже там пробитися через ту пустелю й дістатися до свого справжнього давнього Олекси (Г. Хоткевич. Авірон).
У наведених реченнях стрижневим є компонент де вже там, а змінним -- сидіти, плавати, не сумувать, гарна, нічого, пробитися, дістатися (із залежними компонентами через ту пустелю, до свого справжнього давнього Олекси відповідно).
На сьогодні наявні спроби створення алгоритмів розпізнавання стійких сполук у широкому розумінні, а не синтаксичних фразеологізмів як окремого типу. Зокрема, у праці В.Д. Гусєва та Н.В. Саломатіної, виконаній на матеріалі російської мови, запропоновано алгоритм для біграм -- сполучень двох слів у тексті. Визначення їхньої стійкості ґрунтується на кількісному параметрі, а саме на відношенні частоти біграми до частоти триграми -- поєднання біграми і слова зліва та поєднання біграми і слова справа [5]. Дослідники пропонують вважати ланцюжок слів стійким за умови, «якщо кількість усіх можливих різних його контекстів (як ліво-, так і правобічних) є достатньо великою, наприклад, зіставлюваною з частотою вживання цього ланцюжка», а зазначені відношення частот <0,5 [5] У праці В.Д. Гусєва та Н.В. Саломатіної термін «ланцюжок слів» позначає будь-які два або більше слова, що розташовані поруч у тексті й не перервані знаками пунктуації, при цьому не враховано наявність / відсутність синтаксичного зв'язку між цими словами [5]..
Спроба реалізації формалізованого підходу до ідентифікації синтаксичних фразеологізмів дозволяє перевірити, чи можуть виділені в теоретичних працях ознаки прислужитися для автоматичного встановлення цих одиниць у тексті. Відповідно такий алгоритм може бути використаний для вдосконалення процедур автоматичного опрацювання тексту та створення систем автоматизованого перекладу, що й мотивує актуальність цього дослідження. У побудові алгоритму для випадків чотирьох слів, розташованих у тексті поспіль, спираємось на попередній досвід з укладання алгоритму для послідовності трьох слів, які охоплюють синтаксичні одиниці із одно- та двочленним стрижневим компонентами [16]. На нашу думку, для створення алгоритму недостатньо тільки структурних або тільки кількісних параметрів аналізованих одиниць, тому ми пропонуємо застосовувати їх поєднання.
Постановка мети і завдання
Мета цього дослідження -- побудувати алгоритм розпізнавання синтаксичних фразеологізмів (для послідовності чотирьох слів у тексті). Відповідно до аналізу залучені речення із дво- та тричленним стрижневим компонентом. Поставлена метазумовлює виконання трьох завдань: 1) виділити ознаки аналізованих синтаксичних фразеологізмів, придатні для формалізації; 2) запропонувати алгоритм розпізнавання в тексті синтаксичних фразеологізмів з урахуванням виділених ознак та різних типів цих одиниць; 3) подати пояснення кроків запропонованого алгоритму.
Формальні критерії аналізу синтаксичних фразеологізмів для випадків чотирьох слів, розташованих поспіль. Аналіз фактичного матеріалу, дібраного з текстів української художньої літератури кінця ХІХ -- початку ХХІ ст., періодичних видань і українськомовних інтернет-ресурсів, обсягом більше 6000 контекстів уживання синтаксичних фразеологізмів дає змогу виділити кілька формальних ознак.
Наявність повтору в реченні. Повтор лексем у реченні виступає своєрідним організаційним чинником, який «цементує» речення, забезпечує його фразеологізацію (про типи повторів у межах фразеологізованих речень див. у праці [17]). Порівняно із синтаксичними фразеологізмами з одночленним стрижневим компонентом серед обстежених конструкцій таких моделей зафіксовано небагато, проте саме повтор є тією специфічною формальною ознакою, яку можна використати для побудови алгоритму. З-поміж таких речень можна виділити дві групи:
а) речення із повтором тієї самої форми слова -- наявний повний збіг словоформ, між якими вживається двочленний стрижневий компонент є... і/й/та: З «друзями», як СНД, не потрібні вороги. Друзі -- Польща, Словаччина, Чеська Республіка,... хочуть, щоб Україна була в ЄС, для кращого життя українського народу, друзі -- Німеччина продає Україні дешевий газ. Друзі -- Грузія хоче, щоб Україна вступила в НАТО, є друзі і «друзі» (www.unian.ua/com- ments/535333);
б) речення з повтором одного слова (у нашому матеріалі -- іменника або дієслова) у різних формах. Якщо перше і четверте слово є різними словоформами слова, то між ними в нашому матеріалі зафіксовано займенник/ іменник у непрямому відмінку та частку не: Ну, ти хоч і старий, а обдурити нас не обдуриш (Г. Тютюнник. Вир) і под. Якщо різні форми одного слова виступають третім і четвертим компонентом, то до них уживається поєднання прийменника з/із/зі та займенника усіх/всіх: Новий рік -- з усіх свят свято (Л. Нечай-Гор- бачук. Читанка для Калинки і Тарасика). На підставі аналізу речень без повторів укладено реєстр моделей синтаксичних фразеологізмів із тричленним стрижневим компонентом, який складається з поєднання службових і повнозначних слів -- типово займенників та прислівників, для яких характерне семантичне спустошення або семантичний зсув: де вже там, куди вже мені, от тобі й, чому б не, як тут не, який же там і под.: Я сказав йому по щирості свою думку про його поезії, підніс їх добрі прикмети, та заразом звернув його увагу на конечність їх обшліфування перед друком. Він усміхнувся сумно.
-- Куди вже мені шліфувати їх! -- говорив, і в його голосі тремтіло щось, мов здавлені сльози (І. Франко);
-- Горнефта нема вдома, -- продовжувала каліченою грецькою мовою, додаючи єгипетських слів. -- Він повернеться -- може, ввечері... а може, тільки завтра.
-- От тобі й радуйся! -- з досадою вигукнула Гелене (Н. Королева. Предок);
Який же там з нього лицар, коли він усього так боїться... (Ю. Покальчук. Аве Марія).
На сьогодні реєстр синтаксичних фразеологізмів із тричленним стрижневим компонентом охоплює 26 моделей. Із урахуванням можливих родових та числових варіантів відповідних лексем (наприклад, який же це/яка ж це /яке ж це /які ж це), чергування голосних (наприклад, от тобі і/от тобі й), наявності загальнолітературного інваріанта і розмовного варіанта (зокрема, чому б не/ чом би не, чому ж не/ чом же не) реєстр стрижневих тричленних компонентів включає 108 складених одиниць (див. табл. 1).
Статистичні критерії аналізу синтаксичних фразеологізмів (для послідовності чотирьох слів у тексті). Статистичним критерієм визначення синтаксичного фразеологізму у тексті став показник асоціації МІ (від англ. mutual information -- англ. взаємна, спільна, повна інформація) -- коефіцієнт, який відбиває невипадковість (залежність) певної послідовності слів у тексті [20]. Оскільки Кеннет Ворд Чарч і Патрік Хенкс ввели формулу МІ для поєднання двох слів, для багатокомпонентних конструкцій застосовуємо модифіковану формулу (1) [19, с. 586], у якій передбачено необхідну кількість складників:
f(c1,c2J...,Cj) xN'-L 1; f(=i) X f(c2) Х...Х f(Cj)
Таблиця 1
Реєстр тричленних стрижневих компонентів синтаксичних фразеологізмів в українській мові
№ |
Стрижневий компонент |
|
з/п |
синтаксичного фразеологізму |
|
1 |
2 |
|
1. |
де вже вам |
|
2. |
де вже йому |
|
3. |
де вже їй |
|
4. |
де вже їм |
|
5. |
де вже мені |
|
6. |
де вже нам |
|
7. |
девже там |
|
8. |
де вже тобі |
|
9. |
до чого ж |
|
10. |
куди вже вам |
|
11. |
куди вже йому |
|
12. |
куди вже їй |
|
13. |
куди вже їм |
|
14. |
куди вже мені |
|
15. |
куди вже нам |
|
16. |
куди вже тобі |
|
17. |
ну така вже |
|
18. |
ну така ж |
|
19. |
ну таке вже |
|
20. |
ну таке ж |
|
21. |
ну такі вже |
|
22. |
ну такі ж |
|
23. |
ну такий вже |
|
24. |
ну такий же |
|
25. |
ну чим не |
|
26. |
ну який вже |
|
27. |
ну який уже |
|
28. |
ну який же |
|
29. |
ну яка ж |
|
30. |
ну яка вже |
|
31. |
ну яке вже |
|
32. |
ну яке ж |
|
33. |
ну які вже |
|
34. |
ну які ж |
|
35. |
ну яка там |
|
36. |
ну яке там |
|
37. |
ну який там |
|
38. |
ну які там |
|
39. |
он який вже |
|
40. |
он який уже |
|
41. |
он яка вже |
|
42. |
он яка уже |
|
43. |
он яке вже |
|
44. |
он яке уже |
|
45. |
он які вже |
|
46. |
он які уже |
де і -- кількість компонентів конструкції; с1 -- перша лексична одиниця; с2 -- друга лексична одиниця; сі -- і-а лексична одиниця; f(c1, c2,... сі) -- абсолютна частота вживання конструкції c1, c2,..., сі в корпусі (з урахуванням порядку одиниць усередині конструкції); f(c1) -- абсолютна частота c1 в корпусі; f(c2) -- абсолютна частота c2 в корпусі; f(q) -- абсолютна частота ^в корпусі;
N -- загальна кількість словоформ у корпусі; log2 -- логарифм числа за основою 2.
Здійснені обчислення демонструють, що для синтаксичних фразеологізмів із тричленним незмінним ком по нен том ко ефіцієнт МІ перебуває в межах від 19,87 (куди вже їм) до 28,4 (де вже там). Саме тому одним із кроків алгоритму є визначення МІ для послідовностей трьох слів, які претендують на статус стрижневого компонента синтаксичних фразеологізмів. До останніх зараховуємо ті конструкції, для яких обчислене МІ > 19,8.
Алгоритм розпізнавання синтаксичних фразеологізмів. У запропонованому алгоритмі використано умовні позначки і правила виконання алгоритмів, викладені в Державному стандарті 19.701-90 [6]. Зокрема, термінатор застосовано на позначення початку й кінця роботи алгоритму; прямокутник -- для процесу, тобто виконання однієї або кількох операцій; ромб -- для рішення або функції перемикального типу з одним входом і двома альтернативними виходами, з яких тільки один може бути активований після виконання вказаних умов.
1 |
2 |
|
47. |
ось тобі і |
|
48. |
ось тобі й |
|
49. |
ось вам і |
|
50. |
ось вам й |
|
51. |
от вам і |
|
52. |
от вам й |
|
53. |
от тобі і |
|
54. |
от тобі й |
|
55. |
ото вам і |
|
56. |
ото вам й |
|
57. |
ото тобі і |
|
58. |
ото тобі й |
|
59. |
от же ж |
|
60. |
от який вже |
|
61. |
от який уже |
|
62. |
оце вже ж |
|
63. |
оце тобі і |
|
64. |
оце тобі й |
|
65. |
оце вам і |
|
66. |
оце вам й |
|
67. |
хто, як не/хто як не |
|
68. |
чи ж не |
|
69. |
чи тобі не |
|
70. |
чи вам не |
|
71. |
чим же не |
|
72. |
чому б не |
|
73. |
чом би не |
|
74. |
чому ж не |
|
75. |
чом же не |
|
76. |
що воно за |
|
77. |
що ж за |
|
78. |
що це за |
|
79. |
що то за |
|
80. |
що, як не |
|
81. |
як вам не |
|
82. |
як же не |
|
83. |
як їй не |
|
84. |
як їм не |
|
85. |
як йому не |
|
86. |
як мені не |
|
87. |
як нам не |
|
88. |
як тобі не |
|
89. |
як тут не |
|
90. |
яке вже там |
|
91. |
яке ж там |
|
92. |
який же це |
|
93. |
який же то |
|
94. |
яка ж це |
|
95. |
яка ж то |
|
96. |
яке ж це |
|
1 |
2 |
|
97. |
яке ж то |
|
98. |
які ж то |
|
99. |
які ж це |
|
100. |
яка вже там |
|
101. |
яка ж там |
|
102. |
яка уже там |
|
103. |
який вже там |
|
104. |
який же там |
|
105. |
який уже там |
|
106. |
які вже там |
|
107. |
які ж там |
|
108. |
які уже там |
Графічно створений алгоритм подано у вигляді блок-схеми (див. схему 1). Він має досить складну структуру та включає всі можливі типи базових структур алгоритмів -- слідування, розгалуження та повторення. Відповідно цей алгоритм поєднує в собі ознаки лінійного, розгалуженого та циклічного алгоритмів. Пояснимо кроки цього алгоритму.
На вході алгоритму маємо корпус текстів, з якого вичленовуємо речення. Під реченнями в суто формальному плані розуміємо послідовності кількох слів, відокремлені одна від одної такими знаками пунктуації, як крапка, знак оклику, знак питання, знак питання і знак оклику, три крапки або крапка з комою.
Оскільки синтаксичні фразеологізми аналізованого типу є багатокомпонентними одиницями, що містять чотири і більше компоненти, у межах кожного речення аналізуємо по чотири слова поспіль (усі можливі лінійно розташовані поєднання чотирьох слів).
Далі перевіряємо вичленовані чотири слова на наявність повторів. Спочатку з'ясовуємо, чи реалізовано повний збіг другої і четвертої лексеми.
Якщо так, то чи є першим компонентом дієслівна форма є, а третім -- сполучник і. Якщо ця умова виконана, то речення вважаємо синтаксичним фразеологізмом і переходимо до наступних чотирьох слів у реченні. Якщо у реченні більше немає слів, то беремо наступне речення і починаємо цикл перевірки спочатку.
Якщо умову щодо другого і четвертого компонента не виконано, перевіряємо чи є перше і четверте слово словоформами одного слова. В УНЛК це можна перевірити за збігом квазіоснов. Якщо так, то визначаємо, чи є другим компонентом займенник або іменник,
а третім -- частка не. За виконання цієї умови кваліфікуємо аналізовану послідовність чотирьох слів як синтаксичний фразеологізм.
Якщо ні, то зіставляємо третє і четверте слово і встановлюємо, чи належать вони до форм одного слова. Якщо цю умову дотримано, з'ясовуємо, чи є перше слово прийменником з (або його варіантами із/зі), а друге слово -- займенником усіх/всіх. Якщо так, то вважаємо, що це синтаксичний фразеологізм.
Далі переходимо до аналізу речень без повторів. Передусім перевіряємо, чи зафіксоване поєднання трьох слів в укладеному нами реєстрі тричленних стрижневих компонентів синтаксичних фразеологізмів (див. табл. 1). Якщо так, то маємо синтаксичний фразеологізм.
Якщо такого поєднання в реєстрі поки що не зафіксовано, встановлюємо частиномовну належність аналізованих слів. В УНЛК це можна зробити за допомогою квазіфлек- сій. Якщо ці слова належать до службових частин мови, займенників або прислівників, то є потреба в наступному кроці алгоритму.
Для незафіксованого в реєстрі поєднання слів виконуємо таку послідовність дій: визначаємо в корпусі текстів абсолютну частоту першого слова f(x), абсолютну частоту другого слова f(y), абсолютну частоту третього слова f(z) та абсолютну частоту конструкції загалом f(x, y, z), підставляємо отримані числа до формули (1) та обраховуємо коефіцієнт МІ.
Якщо отриманий результат МІ >19,8, аналізовану конструкцію кваліфікуємо як синтаксичний фразеологізм і переходимо до аналізу наступних чотирьох слів або наступного речення за їхньої наявності.
На виході алгоритму маємо файл з усіма контекстами вживання синтаксичних фразеологізмів, отриманими на підставі аналізу корпусу текстів.
Висновки
Отже, створений алгоритм розпізнавання синтаксичних фразеологізмів об'єднує дві частини. Спочатку послідовності чотирьох слів перевіряються на наявність повторів слів (з урахуванням двох можливих варіантів -- збіг слів повністю або наявність різних форм одного слова) та відповідність визначеному на попередніх етапах дослідження переліку стрижневих компонентів (є... і/й/та; з/із/зі усіх/всіх, не).
Друга частина алгоритму призначена для ідентифікації іншого типу синтаксичних фразеологізмів -- із тричленним стрижневим компонентом. Вона враховує такі властивості аналізованих одиниць: наявність поєднань службових частин мови, службової частини мови із займенником або прислівником, займенника та прислівника; відповідність поєднань слів укладеному реєстру стрижневих компонентів синтаксичних фразеологізмів; показник асоціації mutual information > 19,8.
На подальшому етапі дослідження плануємо об'єднати дві створені частини -- для послідовностей трьох і чотирьох слів у тексті -- у єдиний алгоритм і створити робочу версію програми автоматичного розпізнавання синтаксичних фразеологізмів на основі УНЛК.
Список використаної літератури
1. Баган Мирослава. Категорія ствердження -- заперечення: нові аспекти дослідження // Науковий вісник Херсонського державного університету. Серія: «Лінгвістика». Херсон, 2005. Вип. 2. С. 171-174.
2. Величко А.В. Фразеологизированные структуры русского предложения // Книга о грамматике: Русский язык как иностранный: Учеб. пособие / Под ред. А.В. Величко. 2-е изд., испр. и доп. М.: Изд-во Моск. ун-та, 2004. С. 37-54.
3. Войцехівська Н.К. Категорія згоди в українському літературному діалогічному дискурсі (на матеріалі художньої літератури ХХ -- початку ХХІ століть): автореф. дис... канд. філол. наук: 10.02.01 / Войцехівська Наталія Костянтинівна / НАН України; Інститут мовознавства ім. О.О. Потебні. К., 2009. 20 с.
4. Всеволодова М.В., Лим Су Ён. Принципы лингвистического описания синтаксических фразеологизмов: На материале синтаксических фразеологизмов со значением оценки / Майя Влади - мировна Всеволодова, Лим Су Ён. М.: МАКС Пресс, 2002. 164 с.
5. Гусев В. Д., Саломатина Н.В. Алгоритм выявления устойчивых словосочетаний с учетом их вариативности (морфологической и комбинаторной) / Владимир Гусев, Наталья Саломатина // Труды междунар. конф. Диалог-2004, Верхневолжский, 2-7 июня 2004. М.: Наука, 2004. С. 530-535.
6. ГОСТ 19.701-90. Схемы алгоритмов, программ, данных и систем. Условные обозначения и правила выполнения [Электронный ресурс]. Режим доступа: http://cert.obninsk.ru/gost/282/ 282.html.
7. Кущ О. П. Категорії ствердження і заперечення в українській мові: автореф. дис... канд. філол. наук: 10.02.01 / Ольга Петрівна Кущ; Дніпро- петр. нац. ун-т. Дніпропетровськ, 2002. 16 с.
8. Личук М.І. Ступені фразеологізації речень: Автореф. дис... канд. філол. наук: 10.02.01 / Марія Іванівна Личук / НАН України; Інститут української мови. К., 2001. 16 с.
9. Личук М.І., Шинкарук В.Д. Ступені фразео- логізації речень / Марія Іванівна Личук, Василь Дмитрович Шинкарук. Чернівці: Рута, 2001. 136 с.
10. Паславська А.Й. Заперечення як мовна універсалія: принципи, параметри, функціонування / Алла Йосипівна Паславська / Львівський національний ун-т ім. Івана Франка. Л.: Видавничий центр ЛНУ ім. І. Франка, 2005. 289 с.
11. Русская грамматика: В 2-х т. Т. 2. Синтаксис / Под. ред. Н. Ю. Шведовой. М.: Наука, 1980. 709 с.
12. Шмелёв Д.Н. Синтаксическая члени- мость высказывания в современном русском языке / Дмитрий Николаевич Шмелёв. Изд. 2-е, стереотипное. М.: КомКнига, 2006. 152 с.
13. Шведова Н.Ю. Очерки по синтаксису русской разговорной речи / Наталия Юльевна Шведова. М.: Изд-во АН СССР, 1960. 377 с.
14. Ситар Ганна. Статус синтаксичних фразеологізмів у системі фразеологічних одиниць / Ганна Ситар // Вісник Донецького національного університету. Серія Б. Гуманітарні науки. Донецьк: ДонНУ, 2011. № 2. С. 66--74.
15. Ситар Ганна. Статистичні критерії аналізу синтаксичних фразеологізмів / Ганна Ситар // Вісник Донецького національного університету. Серія Б. Гуманітарні науки. Вінниця: ДонНУ, 2015. № 1-2. С. 245-256.
16. Ситар Ганна. Алгоритм розпізнавання синтаксичних фразеологізмів у корпусі текстів: спроба створення / Ганна Ситар // Лінгвістичні студії / Linguistic Studies: зб. наук. праць / Донецький нац. ун-т ім. Василя Стуса; гол. ред. А. П. Загнітко. Вінниця: ДонНУ ім. Василя Стуса, 2016. Вип. 32. С. 100-108.
17. Ситарь Анна. Модели синтаксических фразеологизмов с повторами в украинском языке: попытка классификации / Анна Ситарь // Язык, сознание, коммуникация: Сб. статей / Редкол. М.Л. Ремнёва, Е.Л. Бархударова, А.И. Изотов, В. Красных, Ф.И. Панков. М.: МАКС Пресс, 2013. Вып. 47. С. 485-493.
18. Шабат-Савка С.Т. Категорія комунікативної інтенції в українській мові: [монографія] / Світлана Тарасівна Шабат-Савка. Чернівці: «Букрек», 2014. 412 с.
19. Ягунова Елена, Пивоварова Лидия. «От коллокаций к конструкциям» / Елена Ягунова, Лидия Пивоварова // ACTA LINGUISTICA PET- ROPOLITANA. Труды Института лингвистических исследований РАН. Т. X. Ч. 2. Русский язык: грамматика конструкций и лексико-семантические подходы / С.С. Сай, М.А. Овсянникова, А. Оскольская (ред). СПб.: Наука, 2014. С. 568-617.
20. Church Kenneth Ward, Hanks Patrick. Word Association Norms, Mutual Information, and Lexicography / Kenneth Ward Church, Patrick Hanks // Computational Linguistics.1990. 16(1). P 22-29.
Размещено на Allbest.ru
...Подобные документы
Поняття фразеологізмів. Принципи класифікації фразеологічних одиниць. Місце компаративних фразеологізмів в системі фразеологічних одиниць мови. Структурно-семантичні особливості компаративних фразеологізмів в англійській мові. Особливості дієслівних форм.
дипломная работа [112,1 K], добавлен 25.08.2010Фразеологія як лінгвістична дисципліна, предмет її дослідження. Аналіз значення фразеологізмів в українській мові. Класифікація фразеологічних одиниць. Особливості використання фразеологізмів у періодичних виданнях. Помилки у висловлюванні фразеологізмів.
курсовая работа [88,3 K], добавлен 28.10.2014Фразеологізми англійської мови, джерела їх виникнення та класифікація. Проблеми перекладу фразеологічних одиниць В. Шекспіра як джерела виникнення англійських фразеологізмів. Аналіз українських та російських перекладів фразеологізмів у трагедії "Гамлет".
дипломная работа [153,7 K], добавлен 14.05.2017Дослідження складних слів у мовознавстві. Визначення композитів та юкстапозитів. Словоскладання в мовних терміносистемах. Закономірності побудови складних слів українського походження в творах Ліни Костенко. Семантична класифікація одноструктурних слів.
дипломная работа [100,4 K], добавлен 03.10.2014Загальні фразеологізми-бібліїзми в англійській та українській фразеосистемах. Структурні і семантичні особливості відповідників фразеологізмів-бібліїзмів в англійській та українській мовах. Кореляція між фразеологізмами-бібліїзмами і текстами Біблії.
дипломная работа [65,1 K], добавлен 16.06.2011Виявлення спільних та відмінних рис при перекладі фразеологічних одиниць в різних мовах. Класифікація фразеологізмів за видом стійких сполук і за формою граматичної структури. Проблематика художнього перекладу фразеологізмів: прислів’їв, приказок, ідіом.
курсовая работа [54,4 K], добавлен 18.01.2012Місце фразеологізмів в мовній картині світу. Способи відображення семантичних, прагматичних і культурологічних особливостей у лексикографічному портреті фразеологічних оборотів англійської та української мови, що не мають відповідностей в системі слів.
дипломная работа [102,7 K], добавлен 17.08.2011- Способи відтворення німецьких фразеологізмів на позначення емоційного стану людини українською мовою
Розкриття мовних механізмів створення емотивності фразеологічних одиниць німецької мови шляхом їх синхронічного та діахронічного аналізу. Виявлення впливу емотивного компонента значення на актуалізацію фразеологізмів та на дефразеологічну деривацію.
дипломная работа [180,6 K], добавлен 02.03.2014 Порядок слів і структура речення в англійській та українській мовах. Перекладацькі трансформації як спосіб досягнення еквівалентності під час перекладу. Заміна лексико-граматичних елементів речення й синтаксичних зв'язків у реченні в процесі перекладу.
курсовая работа [220,5 K], добавлен 03.04.2014Аспекти вивчення фразеологізмів, їх класифікація та типи, особливості перекладу. Специфіка газетно-публіцистичного дискурсу. Фразеологічний і нефразеологічний переклад, його особливості в англійському газетно-публіцистичному тексті на українську мову.
дипломная работа [97,0 K], добавлен 11.08.2014Проблеми фразеології у мовознавстві. Поняття перекладу у науковій літературі. Типи відповідників при перекладі. Визначення фразеологічного звороту у лінгвістиці, класифікація фразеологізмів. Французькі фразеологізми в аспекті перекладу українською мовою.
курсовая работа [58,1 K], добавлен 07.02.2011Спортивна фразеологія англійської мови. Семантична структура одиниць фразеологізмів спортивної фразеології та особливості їх переосмислення. Функціонально-стилістичні компоненти конотації. Особливості антонімічних, синонімічних і омонімічних відносин.
реферат [36,3 K], добавлен 11.05.2009Національно-культурна семантика мови у структурі мовної особистості. Фразеологізм - високоінформативна одиниця мови. Концептуальний простір фразеологізмів з компонентами-соматизмами. Лексико-семантичні особливості утворення і класифікації фразеологізмів.
курсовая работа [41,4 K], добавлен 23.12.2010Поняття фразеологічної одиниці; історія вивчення української фразеології. Дослідження утворення фразеологізмів: джерела, ознаки, лексико-семантична структура, форма та функціонування фразеологічних одиниць; класифікація фразеологізмів зі словом око/очі.
курсовая работа [41,5 K], добавлен 26.02.2012Дослідження граматичних особливостей та функціональних характеристик синтаксичних конструкцій зі звертаннями у поетичному тексті. Реалізація звертання як компонента комунікативного акту. Аналіз статусу номінацій адресата мовлення у структурі висловлення.
дипломная работа [141,6 K], добавлен 19.09.2014Дослідження синтаксичних особливостей внутрішнього мовлення персонажів у французьких мінімалістичних художніх текстах. Розгляд таких синтаксичних прийомів як еліпсис, інверсія, парцеляція, риторичне запитання у французькій мінімалістичній прозі.
статья [30,9 K], добавлен 31.08.2017Теоретичні засади вивчення англійської фразеології. Основні структурні, семантичні та етнокультурні особливості англійських фразеологізмів з ономастичним компонентом. Методичні рекомендації щодо вивчення фразеологізмів з ономастичним компонентом у школі.
дипломная работа [150,3 K], добавлен 29.11.2011Лексика - це словниковий склад мови з фразеологією включно. Лексикологія. Слово як центральна одиниця мови. Виникнення слів. Лексема і словоформа. Природа лексичного значення слова. Фразеологізми як особливий вид лексики. Походження фразеологізмів.
реферат [27,5 K], добавлен 17.03.2008Класифікація фразеологізмів - стійких словосполучень, які сприймаються, як єдине ціле і вживаються носіями мови в усталеному оформленні. Способи і складності перекладу фразеологізмів з англійської мови на українську. Структурна особливість фразеологізмів.
курсовая работа [43,3 K], добавлен 03.10.2014Основні положення теорії фразеології. Характеристика фразеологізмів, до складу яких входять колороніми. Психологічні передумови вживання фразеологізмів у мовленні. Психолого-педагогічний експеримент.
дипломная работа [101,6 K], добавлен 10.05.2002