Алгебро-логічні моделі формалізації семантики речень та їх застосування в інформаційних системах штучного інтелекту

Розробка методів опису семантики речень засобами алгебри кінцевих предикатів. Проведення аналізу та розробка алгебро-логічної морфологічної моделі на основі морфів: префіксів, суфіксів та флексій. Система автоматичного аналізу текстів природної мови.

Рубрика Иностранные языки и языкознание
Вид автореферат
Язык украинский
Дата добавления 05.07.2014
Размер файла 41,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Харківський національний університет радіоелектроніки

Автореферат

дисертації на здобуття наукового ступеня кандидата технічних наук

АЛГЕБРО-ЛОГІЧНІ МОДЕЛІ ФОРМАЛІЗАЦІЇ СЕМАНТИКИ РЕЧЕНЬ ТА ЇХ ЗАСТОСУВАННЯ В ІНФОРМАЦІЙНИХ СИСТЕМАХ ШТУЧНОГО ІНТЕЛЕКТУ

Брусенцев Віталій Олександрович

Харків - 2003

Анотація

Брусенцев В. О. Алгебро-логічні моделі формалізації семантики речень та їх застосування в інформаційних системах штучного інтелекту. - Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.23 - системи і засоби штучного інтелекту - Харківський національний університет радіоелектроніки, Харків, 2003.

Дисертація присвячена питанням розробки алгебро-логічних моделей формалізації семантики речень. Запропоновано математичний опис частин мови у вигляді формул алгебри кінцевих предикатів і предикатних операцій. Розроблено алгебро-логічну синтаксичну модель на основі словосполучень. Розроблено модель семантики префіксально-суфіксального словотворення. Розроблена діалогова система аналізу і синтезу речень, яка впроваджена в навчальний процес. Розроблені алгебро-логічні моделі аналізу покладені в основу підсистеми обробки інформації при морфометричних дослідженнях на основі префіксально-суфіксальної обробки слів та обробки словосполучень з використанням виникаючих відношень і значень, впровадженої у відділі криоцитології та кількісної морфології Інституту проблем кріобіології та кріомедицини НАН України.

Ключові слова: штучний інтелект, комп'ютерна лінгвістика, алгебра кінцевих предикатів і предикатних операцій, лінгвістичний процесор, морфологічний аналіз, синтаксичний аналіз, семантичний аналіз.

Аннотация

Брусенцев В.А. Алгебро-логические модели формализации семантики предложений и их применение в информационных системах искусственного интеллекта. - Рукопись.

Диссертация на соискание научной степени кандидата технических наук по специальности 05.13.23 - системы и средства искусственного интеллекта - Харьковский национальный университет радиоэлектроники, Харьков, 2003.

Диссертация посвящена вопросам разработки алгебро-логических моделей формализации семантики предложений русского языка. Направление исследований данной работы - развитие лингвистической алгебры, одного из направлений алгебры конечных предикатов и предикатных операций, позволяющей обрабатывать предложение русского языка как математическую формулу, содержащую слова-предикаты, предикатные операции и предметные переменные. Исследованы теоретические основы формализации семантики предложений. В работе впервые предложено использование предметных переменных для обозначения предметов, словосочетаний и связей в предложении. Исследована грамматика русского языка и предложен усовершенствованный вариант лингвистического процессора, состоящего из морфологического, синтаксического и семантического анализаторов. Разработаны новые принципы описания и установления грамматических признаков и частей речи на основе выделенных аффиксов при морфологической обработке предложений. Предложено математическое описание частей речи русского языка, которые представлены в виде формул алгебры конечных предикатов и предикатных операций и позволяют выделить семантику каждой словоформы при морфологическом анализе. Разработана алгебро-логическая синтаксическая модель на основе словосочетаний главного и зависимого слова, а также словосочетаний с предлогами. Определены семантические отношения и вытекающие значения, возникающие в этих словосочетаниях. Разработана модель семантики префиксального, префиксально-суффиксального и суффиксального словообразования имён существительных, имён прилагательных и глаголов. Выделены группы общих значений, объединяющих имена существительные по словообразованию. Имена прилагательные и глаголы разбиты на группы по семантическим связям.

На основе предложенных алгебро-логических моделей разработана диалоговая система анализа и синтеза предложений русского языка с составлением графической сцены и связи с предложением, внедрённая в учебный процесс. Разработанные алгебро-логические модели морфологического, синтаксического и семантического анализа положены в основу подсистемы обработки информации при морфометрических исследованиях на основе лингвистического эксперимента с использованием префиксально-суффиксальной обработки слов и обработки словосочетаний с использованием возникающих отношений и значений, внедрённой в отделе криоцитологии и количественной морфологии Института проблем криобиологии и криомедицины НАН Украины.

Ключевые слова: искусственный интеллект, компьютерная лингвистика, алгебра конечных предикатов и предикатных операций, лингвистический процессор, морфологический анализ, синтаксический анализ, семантический анализ.

Abstract

Brusentsev V.A. Algebra-logical models of formalization of semantics of sentences and their application in information systems of artificial intelligence. - Manuscript.

The dissertation on competition of a scientific degree of the candidate of engineering science on a speciality 05.13.23 - system and means of artificial intelligence - Kharkov national university of radioelectronics, Kharkov, 2003.

The dissertation is devoted to questions of development of algebra-logical models of formalization of semantics of Russian sentences. The mathematical performance of parts of speech represented in the form of formulas of algebra of final predicates and predicate operations is offered. The algebra-logical syntactic model is developed on the basis of word combinations. The model of semantics of prefix-suffix word-formation is developed. The dialogue system of the analysis and synthesis of the sentences which is introduced into educational process is developed. Algebra-logical models of the analysis are developed that are assumed as a basis of a subsystem of processing of the information at morphometrical researches on the basis of prefix-suffix processing of words and processing of word combinations with the use of the arising relations and meanings. The subsystem is introduced in the department of cryocitology and quantitative morphology of the Institute of problems of cryobiology and cryomedicine of the NAS of Ukraine.

Key words: artificial intelligence, computer linguistics, algebra of final predicates and predicate operations, linguistic processor, morphological analysis, syntactic analysis, semantic analysis.

1. Загальна характеристика роботи

Актуальність теми. Однією з головних проблем штучного інтелекту (ШІ) вважається комп'ютерне розуміння природної мови. Ця проблема відноситься до області комп'ютерної лінгвістики, яка займається пошуком алгоритмів та комп'ютерною реалізацією взаємовідносин людини з ЕОМ природною мовою. На цей час ЕОМ виконує обмежені спеціалізовані команди, які закладені в програмах, а також здійснює неякісний переклад тексту. Щоб зняти це обмеження, необхідно підходити до тексту з позицій семантики.

Учені багатьох країн, зокрема України, Росії, Японії, США, Великобританії, Франції тощо, ведуть пошук методів формалізації структури та семантики речення. Методи та моделі, які вже відомі, не цілком задовольняють зміст проблеми. Існуючі ЕОМ та їхні системи обслуговування можуть допомагати тільки в окремих задачах: обчислення даних, контроль якості, керування та спостереження за діями роботів, обробка величезних томів інформації і так далі. Але вони виконують тільки ті команди та дії, що в них запрограмовані і закладені у відповідних процедурах або програмах.

Проблема створення комп'ютерів і систем нового покоління полягає в "розумінні" машиною текстів природної мови, тобто кодування алгоритмів передачі змісту речень на мові людини (тлумачення змісту). Освоєння комп'ютером мови людини дозволить збільшити темпи комп'ютеризації та інформатизації нашого суспільства. Вивчення механізму мови і його математичний опис, особливо розробка ефективного методу формального опису семантики текстів, створюють наукову базу для освоєння машиною природної мови і ведуть до корінного вдосконалення систем штучного інтелекту, з чого виникає необхідність створення сполучної ланки між природною та машинною мовами. Впровадження моделей формалізації семантики речень та їх використання при створенні систем аналізу тексту, машинного перекладу та систем виконання мовних команд у різних галузях вітчизняних підприємств, науки і техніки дозволить удосконалити переклад за допомогою ЕОМ.

Особливий внесок у розвиток теоретичних та практичних питань машинного аналізу тексту та моделювання етапів лінгвістичного аналізу внесли І.Н. Горелов, О. С. Наріньяні, Е. В. Попов, Д. О. Поспєлов, Р. Шенк, Т. Виноград, В.Вудс, Ю. П. Шабанов-Кушнаренко, М. Ф. Бондаренко, О.Ф. Осика, З. В. Дудар, Н. В. Шаронова, Є. О. Соловйова, В. Я. Терзіян, С.Ф. Коряк та ін.

Дослідження, проведені у даній дисертаційній роботі, спрямовані на розвиток лінгвістичної алгебри, яка шляхом використання апарату алгебри кінцевих предикатів і предикатних операцій та лінгвістичного експерименту дозволяє побудувати алгебро-логічну модель граматики, а саме морфологічної, синтаксичної та семантичної моделей, для розробки лінгвістичного процесора.

Зв'язок роботи з науковими програмами, планами, темами. Робота виконана на кафедрі Програмного забезпечення ЕОМ Харківського національного університету радіоелектроніки згідно плану науково-дослідної роботи, в рамках розділу 105-1 “Розробка математичного і програмного забезпечення системи логічної підтримки проектування систем штучного інтелекту” держбюджетної теми “Розробка математичного, алгоритмічного та програмного забезпечення для проектування інтелектуальних систем обробки аудіо, відеосигналів, природно-мовної інформації” (№ДР 0100U005436)., на якій Брусенцев В.О. працює як виконавець.

Метою роботи є розробка моделей і методів встановлення семантичних відношень і значень у морфемах і словосполученнях, які дозволяють визначати семантику слів, словосполучень і речення.

Поставлена мета обґрунтувала такі задачі дослідження:

- Розробити методи опису семантики речень засобами алгебри кінцевих предикатів і предикатних операцій.

- Провести аналіз та розробити алгебро-логічну морфологічну модель на основі морфів: префіксів, суфіксів та флексій.

- Провести аналіз та розробити алгебро-логічну синтаксичну модель на основі семантичних відношень між головним та залежним словами, а також використовуючи семантичні відношення між іншими частинами мови за допомогою прийменників.

- Виконати аналіз та розробити алгебро-логічну семантичну модель на основі префіксального та суфіксального словотворення;

- Реалізувати отримані алгебро-логічні моделі у системі автоматичного аналізу текстів природної мови та виконання зазначених дій з використанням бази даних і бази знань.

Об'єкт дослідження - автоматизовані системи аналізу, перекладу та синтезу тексту природної мови, моделі подання знань.

Предмет дослідження - алгебро-логічні моделі формалізації семантики речень.

Методи дослідження базуються на ідеях та принципах штучного інтелекту теорії словотворення і теорії алгебри логіки та алгебри кінцевих предикатів і предикатних операцій.

Наукова новизна одержаних результатів.

Вдосконалено лінгвістичну алгебру, як інструмент алгебри кінцевих предикатів і предикатних операцій, в області моделювання алгебро-логічних виражень для текстів природної мови, яка дозволила автоматизувати процес формалізації, визначення та обробки семантики речень у процесі лінгвістичного аналізу, а також спростити визначення зв'язків між словами, що належать до різних предметних галузей.

Вперше розроблена алгебро-логічна морфологічна модель, яка базується на математичному описі граматичних ознак шляхом введення предметних змінних з використанням алгебри кінцевих предикатів і предикатних операцій, та нові методи обробки і встановлення взаємозв'язків між морфами, граматичними ознаками і частинами мови, які дозволили встановлювати семантичну належність словоформ при морфемному та морфологічному аналізах, що значно обмежує і прискорює пошук за рахунок семантичних значень морфем.

Вперше розроблені методи встановлення семантичного відношення у словосполученнях між головним і залежним словами з урахуванням семантики, а також у словосполученнях із прийменником, які базуються на алгебро-логічному моделюванні синтаксичного положення частин мови, що дозволило визначити семантичні значення словосполучень і речень, а також спростило процес аналізу обробки речення та дозволило звузити семантичну невизначеність одиниць тексту, які можуть належати до суміжних та різних предметних галузей.

Практичне значення одержаних результатів. Розроблені в дисертаційній роботі алгебро-логічні моделі та методи формалізації семантики речень можуть бути використані при створенні систем аналізу тексту, систем машинного перекладу, систем керування роботами за допомогою мови, систем виконання мовних команд (керування транспортом). На основі розроблених моделей, методів і алгоритмів створено комп'ютерний варіант програми, що демонструє керування графічними об'єктами за допомогою текстів природної мови, проводить аналіз графічної і текстової інформації та виконує синтез тексту (акт впровадження від 10.10.2002 р.).

Розроблений у дисертаційній роботі алгебро-логічний процесор на основі аналізу морфем і словосполучень та алгоритми у вигляді програми, що реалізує аналіз і синтез текстової інформації для обробки графічних зображень при морфометричному дослідженні, були впроваджені у процес досліджень відділу кріоцитології та кількісної морфології ІПКіК НАН України і дозволили прискорити процес обробки даних за параметрами і ключовими словами та отримати результати у вигляді звіту за рахунок префіксально-суфіксальної обробки слів та обробки словосполучень з виникаючими семантичними відношеннями і значеннями (акт впровадження від 21.02.2002 р.).

Особистий внесок здобувача. Усі результати дисертації отримані автором самостійно.

У роботі [1] автором запропонована концептуальна модель інтегрованої системи аналізу текстової інформації; у роботах [2, 3] автором досліджена семантична значущість прийменників та побудована алгебро-логічна модель семантичних відношень між різними частинами мови за допомогою прийменників; у роботі [4, 5] запропонована організація лінгвістичного процесора на основі лінгвістичного експерименту; у роботах [6, 7] автором досліджено питання використання лінгвістичного процесору на базі лінгвістичного експерименту в системах керування транспортом.

Апробація результатів дисертації. Основні положення та результати дисертаційної роботи були апробовані на конференціях: 5-му Міжнародному молодіжному форумі “Радиоэлектроника и молодёжь в XXI веке”, Харків, 2001 р.; 4-й Міжнародній науково-технічній конференції “АВІА-2002”, Київ, 2002 р.; 6-му Міжнародному молодіжному форумі “Радиоэлектроника и молодёжь в XXI веке”, Харків, 2002 р.

Публікації. За результатами дисертаційної роботи опубліковано 7 робіт, з них 4 статті у наукових фахових виданнях згідно з переліком ВАК наукових фахових видань України, 3 тези доповідей на конференціях.

Структура та обсяг роботи. Дисертація складається з вступу, 5 розділів і висновків, має загальний обсяг 228 сторінок. Містить 31 малюнок, 32 таблиці, 5 додатків на 69 сторінках, список використаних літературних джерел, що включає 125 найменувань на 12 сторінках.

2. Основний зміст роботи

У вступі обґрунтовано актуальність дисертаційної роботи, сформульовані основна мета і завдання дослідження, наведені відомості про зв'язки обраного напрямку досліджень із планами організації, де виконана робота. Дано стислу анотацію отриманих у дисертації рішень, відзначена їх практична цінність, наведені дані про використання результатів проведених досліджень у народному господарстві.

У першому розділі дисертаційної роботи досліджено питання створення штучного інтелекту. Зокрема вказано необхідні здібності систем штучного інтелекту на основі комп'ютерної лінгвістики (мови машин усіх рівнів складності, починаючи з бінарного кодування). Розглянуто питання подання та структури знань. Проведено аналіз способів подання знань та виявлені їх переваги і недоліки. Доведено, що найбільш зручною вважається логічна модель подання знань.

Досліджено питання аналогії між математичною та природною мовами. Визначено значення прикладної лінгвістики для розробки систем пошуку та обробки інформації.

Проведено аналіз методів обробки природної мови. Розглянуті перші автоматизовані системи обробки інформації природної мови і баз даних. Досліджені методи побудови формальної морфології, закладені в основу попередніх систем аналізу морфологічної інформації. Здійснено порівняльну характеристику синтаксичних і семантичних аналізаторів.

Досліджено питання використання контекстно-вільної, контекстно-залежної та трансформаційної граматик в основі синтаксичного аналізу. Досліджено моделі Зміст-Текст та Зміст-Текст-Дійсність, які закладені в основу розробки систем семантичного аналізу. Обґрунтовано встановлення взаємозв'язку між природно-мовною інформацією та машинною графікою.

Відповідно до мети дисертаційної роботи, а також на підставі проведеного аналізу були поставлені вказані вище задачі дослідження.

У другому розділі досліджуються теоретичні основи алгебро-логічних моделей формалізації семантики речень, тобто подання алгоритму кодування змістовної інформації на мові алгебри кінцевих предикатів і предикатних операцій.

Проведено аналіз методів лінгвістичної алгебри для формалізації семантики речень з використанням предметних змінних, за допомогою яких складаються математичні речення. Семантика математичного речення чи висловлювання виражена предикатом d = f(х1, х2,..., хn), який являє собою залежність істинної змінної d від предметних змінних х1, х2,..., хn цього висловлювання, тобто семантикою кожного речення є предикат.

Проведено лінгвістичний експеримент для виділення предметних змінних, у якості яких виступають іменники. Він полягає у введенні ситуаційно-текстового предиката, у якому конкретна ситуація повинна відповідати вказаному текстові.

Проведено порівняння природної та математичної мов, підґрунтям чого є припущення про існування глибокої аналогії між ними. Розглянуто приклад формування математичної формули бінарної логіки Буля, а саме формули алгебри логіки (a b) (c d) e, де букви a, b, c, d, e - логічні константи з множини Z={0,1}, яка представлена у вигляді графа на рис. 1, але речення, як формується формула, прибране.

Досліджено процес формування речень, на прикладі російського речення “Пассажирский самолёт выполняет чартерный рейс с небольшого острова на континент”, поданого графом на рис. 2, в якому слова замінили на букви для скорочення запису, а замість операцій вказані номери операцій.

Визначення належності слова до відповідного словосполучення та встановлення зв'язків у словосполученнях виконується за рахунок призначення предметних змінних на основі виділення семантичних зв'язків між морфемами та словами, які виникають при морфологічному та синтаксичному етапах аналізу тексту.

Розроблено алгебро-логічну модель формалізації семантики речення, для побудови якої текст необхідно обробити лінгвістичним процесором. Семантика речення Р полягає у рішенні предиката S:

S(P) = (M(P), N(P), T(P))

де M, N, T - предикати морфологічного, синтаксичного та семантичного аналізу відповідно.

Етапи аналізу виражені сукупністю елементів аналізу у відповідних формулах: морфологічний аналіз = {частина мови, граматичні ознаки, способи словотворення}, синтаксичний аналіз = {пунктуація, способи єднання слів у словосполучення}, семантичний аналіз = {значення мовних одиниць і граматичних форм, значення синтаксичних одиниць}.

Предикат морфологічного аналізу M у своєму складі має 10 частин мови, які подані у математичному вигляді і наведено у формулі (3), де y це частина мови, а верхній індекс вказує на відповідну частину мови:

M (yc yп yг yч yм yн yр yз yц yж)

Предикат синтаксичного аналізу N базується на математичному опису синтаксичних зв'язків між словами у відповідних словосполученнях, які наведені далі та повністю розкриті у дисертаційній роботі.

Предикат семантичного аналізу T виражений математичним описом виникаючих семантичних відношень і значень у словах за допомогою обробки префіксів і суфіксів та у словосполученнях за допомогою обробки двох типів зв'язку слів, які найчастіше вживаються в розмові людини.

Для кожної частини мови виділено певний набір ознак, які позначили через х з індексом у нижньому розряді для вказування відповідної граматичної ознаки ознаки: для іменника - 9, для прикметника - 8, для дієслова - 11, для числівника - 5, для займенника і прислівника по 6, для прийменника, сполучника, частки і вигука по 2.

Досліджено синтаксичну структуру словосполучень та речення. Доведено, що в ролі головного слова може виступати 7 частин мови, у ролі залежного слова може виступати 5 частин мови. Між ними може виникати 20 типів семантичних відношень, що вказують на семантичні значення і дозволяють встановити абстрактне значення словосполучення, необхідне для семантичного аналізу.

Проведено аналіз словосполучень з прийменником і доведено, що найбільш інформативними є словосполучення типу “Дієслово - Прийменник - Іменник”, “Іменник - Прийменник - Іменник” та “Прикметник - Прийменник - Іменник”. Доведено, що між цими частинами мови виникає 31 тип семантичних відношень, кожне з яких має своє семантичне значення в залежності від відмінка іменника.

Розроблені алгебро-логічні моделі подання семантики префіксального, префіксально-суфіксального та суфіксального словотворення іменників, прикметників та дієслів. Префікси і суфікси цих частин мови розподілені на семантичні групи за відповідними семантичними значеннями, які об'єднують велику кількість слів. Для опису словотворення і значень введено 6 критеріїв:

для іменників: префікс, суфікс, частина мови (походження), рід і наголос;

для прикметників: префікс, суфікс, рід і наголос;

для дієслів: префікс і зворотній суфікс.

Третій розділ дисертаційної роботи присвячений розробці алгебро-логічної морфологічної моделі. Запропоновано математичний опис граматичних ознак з використанням предметних змінних, які були використані для подання граматичних ознак.

Таблиця 1. Граматичні ознаки частин мови

x

Значення

х

Значення

х

Значення

х1

число

х11

дієвідміна

х21

відтінок змісту прислівників

х2

рід

х12

Час

х22

група прийменників

х3

відмінок

х13

особа

х23

категорія сполучників

х4

наголос

х14

Стан дієслова

х24

розряд сполучників

х5

твердість або м'якість основи

х15

Зворотній суфікс

х25

тип частки

х6

остання буква

основи

х16

форма дієслова

х26

відтінок значення

х7

суфікс

х17

Клас числівників

х8

закінчення

х18

розряд займенників

х27

тип висловлювання

х9

префікс

х19

категорія прислівників

х10

спосіб нахилу

х20

ступінь прислівників

х28

тип походження

Кожна частина мови має тільки певні граматичні ознаки, які впливають на подальший аналіз та обробку. Зв'язок між частинами мови та ознаками вказані у табл. 2.

У іменників виділено 9 ознак (див. табл. 1 - 2), до складу яких, крім основних граматичних ознак, зазначених граматикою, входять такі ознаки, як префікс, суфікс і закінчення, які можуть впливати на граматичну належність слова. Доведено, що ці ознаки можуть вказати на родову належність слова, а також визначити місцезнаходження наголосу. Виділено 9 префіксів і 171 суфікс, які допомагають визначити рід і наголос іменника. Побудовано дерева суфіксотворення для кожного роду, які дозволяють визначати суфікс при аналізі словоформи.

Таблиця 2. Зв'язок між частинами мови та ознаками

Частина мови

Граматичні ознаки

Іменник

yc (x1 x2 x3 x4 x5 x6 x7 x8 x9 = 1)

Прикметник

yп (x1 x2 x3 x5 x6 x7 x8 x9 = 1)

Дієслово

(x16 x1 x10 x11 x12 x13 x14 x7 x8 x9 x15 =1)

Числівник

(x1 x2 x3 х17 x8 = 1)

Займенник

(x1 x2 x3 х13 х18 x8 = 1)

Прислівник

(х19 х20 х21 x7 x8 x9 =1)

Прийменник

(x3 x22=1)

Сполучник

(x23 x24=1)

Частка

(x25 x26 =1)

Вигук

(x27 x28=1)

Порівняно з іменником для прикметника виділено 8 ознак (див. табл. 1 - 2), які також мають в своєму складі такі ж ознаки, аналогічно іменнику. Встановлено і доведено, що 29 префіксів і 90 суфіксів дозволяють визначити рід і наголос прикметника. Також побудоване дерево суфіксотворення у прикметника, необхідне для аналізу слів.

Проаналізовані граматичні ознаки дієслова і з них виділено 11 (див. табл. 1 - 2), які дозволяють описувати усі форми дієслова. Доведено, що 47 префіксів мають змогу встановлювати деякі граматичні ознаки у дієслів. Для швидкого пошуку і аналізу дієслів за префіксами побудовано дерево префіксотворення. Щодо форми дієслова: у дієприкметника виділено 11 суфіксів, а у дієприслівника 5 суфіксів, за допомогою яких можливе встановлення граматичних ознак.

Для числівників виділено 5 граматичних ознак (див. табл. 1 - 2), які можуть впливати на граматичну належність слова. Встановлено, що найвпливовішими ознаками є закінчення і відмінок числівника, за допомогою яких можна встановити клас числівника.

У займенників виділено 6 ознак (див. табл. 1 - 2), за допомогою яких можна встановити розряд та інші граматичні ознаки. Вказані займенники, які мають закінчення і можуть змінюватися за відмінками як прикметник або числівник.

З граматичних ознак прислівника виділено також 6 ознак (див. табл. 1 - 2), необхідних для опису граматичної належності прислівників за допомогою префіксів, суфіксів і закінчень. Ці ознаки вже на морфологічному етапі аналізу допомагають встановлювати семантику частини мови.

Серед граматичних ознак прийменників виділено 2 ознаки (див. табл. 1 - 2), однією з яких є відмінок, який використовується для розподілу прийменників за належністю до іменника.

У сполучників, часток та вигуків виділено по 2 ознаки (див. табл. 1 - 2), що дозволяють встановлювати не тільки граматичні ознаки цих слів, але й визначати їх семантичну належність.

Четвертий розділ дисертаційної роботи присвячений розробці алгебро-логічних синтаксичної і семантичної моделей, які базуються на встановленні семантичного відношення у двох типах словосполучення з виникаючими семантичними значеннями та методах префіксально-суфіксального словотворення іменників, прикметників і дієслів також з виникаючими семантичними значеннями з урахуванням ознак.

Досліджено словосполучення головного та залежного слів. Встановлено, що у якості головного слова g виступають 7 частин мови або форми: g1 - іменник, g2 - прикметник, g3 - займенник, g4 - дієслово, g5 - числівник, g6 - дієприкметник, g7 - прислівник; у якості залежного слова v виступають: v1 - іменник, v2 - прикметник, v3 - інфінітив, v4 - займенник, v5 - прислівник. Відносини u, які виникають між цими словами, наведені у таблиці 3. Побудовано загальну схему взаємовідношень у словосполученнях між головним і залежним словами (рис. 3).

Таблиця 3. Взаємовідношення u між головним і залежним словами

u

Відношення

u

Відношення

u

Відношення

u1

тимчасові

u8

означальні

u15

причинові

u2

видільні

u9

означально-тимчасові

u16

просторові

u3

кількісні

u10

означально-кількісні

u17

суб'єктні

u4

кількісно-тимчасові

u11

означально-обставинні

u18

вказівні

u5

кількісно-просторові

u12

означально-просторові

u19

уподібнення

u6

об'єктні

u13

невизначені

u20

цільові

u7

обмежувальні

u14

присвійні

Визначено, що кожному відношенню відповідає декілька значень. Подібним чином проведено аналіз інших 10 пар словосполучень.

Проведено аналіз простих прийменників і встановлено їх можливе використання з іменниками у різних відмінках. Розроблено алгебро-логічну модель опису словосполучень з прийменниками, а саме “Дієслово - Прийменник - Іменник”, “Іменник - Прийменник - Іменник” та “Прикметник - Прийменник - Іменник”. Виділено 31 семантичне відношення t, яке виникає у цих словосполученнях: t1 - тимчасове; t2 - видільне; t3 - заміщення; t4 - кількісне; t5 - кількісно-означальне; t6 - позбавлення, видалення; t7 - матеріалу, складу; t8 - міри, ступеня, межі; t9 - призначення; t10 - об'єктне; t11 - зумовленості; t12 - об'єктно-обмежувальне; t13 - означальне; t14 - означально-тимчасове; t15 - означально-кількісне; t16 - означально-обставинне; t17 - означально-обмежувальне; t18 - означально-просторове; t19 - видільне; t20 - належності; t21 - причинове; t22 - причиново-спадкове; t23 - походження; t24 - просторове; t25 - притаманності; t26 - спільності; t27 - змісту і вмісту; t28 - відповідності; t29 - порівняльне; t30 - уподібнення; t31 - цільове. Семантичні відношення, які виникають в цих словосполученнях, описані формулами:

для словосполучення “Дієслово - Прийменник - Іменник”:

DГ ( t1 t10 t11 t15 t16 t20 t21 t24 t25 t26 t28 t30 t31) (5)

для словосполучення “Іменник - Прийменник - Іменник”:

DС ( t1 t2 t3 t4 t5 t7 t8 t9 t10 t12 t13 t14 t17

t18 t19 t21 t22 t23 t24 t26 t27 t30 t31) (6)

для словосполучення “Прикметник - Прийменник - Іменник”:

DП ( t1 t2 t6 t9 t10 t11 t12 t13 t17 t21 t24 t26 t28 t29) (7)

Кожне словосполучення проаналізовано і розкрито у вигляді систем рівнянь у залежності від відмінка іменника.

Досліджено семантику префіксально-суфіксального словотворення іменників і прикметників та семантику префіксального словотворення дієслів. Розроблено алгебро-логічні семантичні моделі словотворення іменників, прикметників і дієслів та введено 6 критеріїв, необхідних для опису словотворення і значень, які з них випливають: z1 - суфікс, z2 - частина мови походження, z3 - рід, z4 - наголос, z5 - префікс, z6 - зворотній суфікс. Для іменників виділено 5 критеріїв опису словотворення і 8 загальних груп значень F, які об'єднують багато слів:

yc (z1 z2 z3 z4 z5 = 1) (8)

yc (F1 F2 F3 F4 F5 F6 F7 F8) (9)

де F1 - група суфіксів, які утворюють назви осіб чоловічої статі; F2 - група суфіксів, які утворюють назви осіб з додатковим значенням недорослості, або дитячості, соціальної неповноцінності; F3 - група суфіксів, які властиві іменникам загального роду; F4 - група суфіксів, які утворюють назви осіб жіночої статі; F5 - група суфіксів, які утворюють назви тварин; F6 - група суфіксів, які утворюють назви предметів; F7 - група суфіксів, які утворюють слова з відверненими значеннями; F8 - суфікси, що утворюють слова зі значенням зменшеності, пестливості, збільшеності.

Для прикметників виділено 4 критерії опису словотворення і 7 груп прикметників:

yп (z1 z2 z4 z5 = 1) (10)

yп (Q1 Q2 Q3 Q4 Q5 Q6 Q7) (11)

де Q1 - група суфіксів, яка утворює присвійні і присвійно-відносні прикметники; Q2 - група суфіксів, яка утворює відносні і якісні прикметники; Q3 - група суфіксів, яка утворює прикметники і похідні від дієприкметників; Q4 - група суфіксів, яка утворює прикметники співвідносні з дієприкметниками; Q5 - група префіксів, яка утворює відносні і якісні прикметники; Q6 - група префіксів і суфіксів, яка утворює прикметники; Q7 - група суфіксів, яка утворює прикметники в зменшувальній і зменшувально-пестливій формі.

Для дієслів виділено 2 критерії опису словотворення і 2 групи дієслів:

yг (z5(z6п z6о) = 1) (12)

yг (J1 J2) (13)

де J1 - група префіксів, яка утворює дієслова без зворотнього суфікса; J2 - група префіксів, яка утворює дієслова із зворотнім суфіксом.

У п'ятому розділі дисертаційної роботи розглядалося практичне застосування розробленого комплексу математичних моделей та алгоритмів, що знайшли своє відтворення при розробці системи аналізу та обробки речення природної мови. Зокрема, за допомогою цього комплексу була розроблена підсистема автоматичного аналізу морфологічної інформації, яка відтворює усі граматичні ознаки для кожного слова. Також було розроблено підсистему побудови дерева синтаксичних відношень у реченні залежно від граматичних ознак словоформ. Введено предметні змінні для зв'язку слів у словосполученні та реченні. Розроблено підсистему обробки семантики морфології і семантики синтаксису для формалізації семантики речення засобами лінгвістичної алгебри на базі лінгвістичного експерименту. Розроблена підсистема складання графічної сцени та обробки речення відповідно до графічної сцени.

Моделі та методи закладені в основу розробки підсистеми обробки інформації при морфометричному дослідженні для складання звіту за рахунок префіксально-суфіксальної обробки слів та досліджених типів словосполучень з використанням семантичних відношень і значень, які виникають за допомогою морфем та синтаксичних відношень у реченні. Це дозволило прискорити процес обробки та отримувати звіт у необхідному форматі за рахунок семантики слів та ключових слів, які вважаються параметрами дослідження та несуть в собі семантику, за якою формується звіт та побудова структури звіту

Висновки

У дисертаційній роботі пропонується теоретичне узагальнення і нове вирішення наукової задачі, яка полягає в розробці алгебро-логічних моделей формалізації семантики речень на основі лінгвістичної алгебри як інструментарію алгебри кінцевих предикатів і предикатних операцій та на основі методів лінгвістичного експерименту. Розв'язання даної задачі полягає в застосуванні розроблених методів семантичної взаємодії слів і словосполучень при аналізу, що дозволяє автоматизувати процес визначення семантики речення на підставі семантичних відношень і значень, і як результатом звузити семантичну невизначеність речень різних предметних галузей. У зв'язку з цим в дисертації:

1. Проаналізована сучасна мета щодо забезпечення коректної обробки інформації, теоретично обґрунтовано доцільність удосконалення підходу семантичної обробки тексту з метою підвищення ефективності взаємодії усіх етапів аналізу тексту за рахунок семантичної обробки інформації.

2. Вдосконалена лінгвістична алгебра, як інструмент алгебри кінцевих предикатів і предикатних операцій, що дозволило автоматизувати процес формалізації, визначення та обробки семантики речень, подавати граматичні ознаки у вигляді предметних змінних та виконувати побудову семантичного дерева речення і встановлення зв'язків між словами у словосполучення за рахунок семантичних відношень і значень. Використання запропонованої алгебри дозволило визначати та обробляти семантику речення при лінгвістичному аналізі, що значно спростило і прискорило процес визначення зв'язків між словами для побудови дерева речення та підвищило ефективність систем автоматичного аналізу і обробки інформації різних предметних галузей.

3. Розроблена алгебро-логічна морфологічна модель і нові методи обробки і встановлення взаємозв'язків між морфами, граматичними ознаками і частинами мови шляхом визначення ознак за морфемами і введення предметних змінних з метою спрощення процедури визначення та розв'язування конфліктів. Це дозволило встановлювати семантичну належність слова і найбільш повно описувати граматичні ознаки слів під впливом семантичних значень різнорідних текстів та розв'язувати граматичні і семантичні конфлікти слів і речень з метою забезпечення взаємодії інформаційних масивів, які належать до суміжних та різних предметних галузей.

4. Розроблено метод визначення семантичних відношень і значень у словосполученнях між головним та залежним словами, а також у словосполученнях з прийменником, який дозволяє визначати за граматичною належністю головне і залежне слово та за їх граматичними ознаками встановлювати семантичне відношення і значення, що дозволило найбільш повно описувати семантику слів, словосполучень і речення та спростило процес аналізу і обробки речення шляхом обмеження семантичної невизначеності.

5. Досліджено методи і моделі подання семантики речень і знань, що дозволило визначити їх переваги та недоліки, а також запропонувати нові методи формалізації семантики речень, які дозволяють досить швидко і точно визначати семантичну належність слова, словосполучення або речення.

6. Розроблено алгоритм використання семантичних відношень і значень для обробки різноманітної інформації, що дозволило проводити коректний аналіз і синтез речень за допомогою зменшення кількості побудов дерева та визначення семантичного напрямку словосполучень або речення, впровадженого в учбовий процес (акт впровадження від 10.10.2002).

7. Розроблено підсистему обробки речень і формування звіту при морфометричних дослідженнях, що дозволило значно прискорити процес обробки результатів досліджень і отримувати у вигляді спеціального звіту, впровадженого у відділі кріоцитології та кількісної морфології ІПКіК НАН України (акт впровадження від 21.02.2002).

Список опублікованих автором праць за темою дисертації

речення алгебра семантика морфологічний

Брусенцев В.А., Шрестха С.Н. Автоматизация семантического анализа предложений русского языка // ХГПУ “ВЕСТНИК”. - 2000. - № 79. - С. 25 - 27.

Брусенцев В.А. Использование отношений между предлогом и другими частями речи при обработке текста на естественном языке // Проблемы бионики. - 2001. - Вып. 54. - С. 101 - 107.

Брусенцев В.А. Математическое описание отношений между предлогом и другими частями речи для обработки текста на естественном языке // Проблемы бионики. - 2001. - Вып. 55. - С. 50 - 53.

Дудар З.В., Шрестха С.М., Брусенцев В.О., Калініченко О.В. Використання лінгвістичного експерименту в системах обробки природньо-мовної інформації // НТУ “ХПІ”. - 2002. - Т.2, № 7. - С. 11-14.

Брусенцев В.А. Применение лингвистического эксперимента в лингвистическом процессоре // Тез. докл. 5-го Международного молодёжного форума “Радиоэлектроника и молодёжь в XXI веке”. - Харьков: ХГТУРЭ. - 2001. - С. 81 - 82.

Брусенцев В.А. Использование лингвистического процессора на базе лингвистического эксперимента в системах управления транспортом // Матеріали 4-ї Міжнародної науково-технічної конференції “АВІА-2002”. -Київ: НАУ. - 2002. - С. 21.1 - 21.4.

Брусенцев В.А. Компьютерное управление объектами посредством естественного языка // Тез. докл. 6-го Международного молодёжного форума “Радиоэлектроника и молодёжь в XXI веке”. -Харьков: ХНУРЭ. - 2002. - С. 48 - 49.

Размещено на Allbest.ru

...

Подобные документы

  • Історія розвитку, основні завдання і характеристика семантики як розділу мовознавчої науки. Вивчення структурних і функціональних особливостей розмовного стилю англійської мови. Розкриття лексико-синтаксичної специфіки розмовної англійської мови.

    курсовая работа [46,8 K], добавлен 10.02.2014

  • Різновиди складних безсполучникових речень. Види безсполучникових складних речень з різнотипними частинами. Складні синтаксичні конструкції, їх функції у мові. Формування української пунктуації, її основні принципи. Схеми граматичного аналізу речень.

    курс лекций [124,3 K], добавлен 26.08.2013

  • Загальна характеристика складнопідрядних речень, їх структура і функції в мові. Класифікація підрядних речень, характеристика їх видів. Різнотипні, нерівноправні частини, залежні одна від другої, у складі складнопідрядних речень. Основі засоби зв'язку.

    лекция [52,1 K], добавлен 26.08.2013

  • Проблема еліпсису та еліптичних речень. Методика позиційного аналізу речення. Семантичний критерій смислового заповнення. Використання методики трансформаційного аналізу. Функціонально-комунікативні особливості еліптичного речення англійської мови.

    дипломная работа [51,4 K], добавлен 03.12.2010

  • Утворення нових слів за допомогою префіксів і суфіксів. Словотворення як основний засіб збагачення словникового складу мови. Способи словотворення: суфіксальний, префіксальний, безафіксний (відкидання морфем), складання слів або їх усічених основ.

    конспект урока [34,9 K], добавлен 10.03.2011

  • Поширені і непоширені називні речення. Основні види односкладних речень. Особливості односкладних речень з головним членом - підметом. Способи вираження головних членів речення односкладних речень. Роль односкладних речень у текстах різних стилів.

    разработка урока [145,1 K], добавлен 25.11.2014

  • Вивчення багатокомпонентного складного речення в системі мови. Неелементарне складносурядне речення. Структурні особливості неелементарних складнопідрядних речень. Багатокомпонентні конструкції у пам'ятках староукраїнської писемності XIV-XVII ст.

    курсовая работа [95,3 K], добавлен 26.03.2014

  • Вивчення типів номінативних речень, що на когнітивному рівні моделюються за ментальними схемами, одиницею представлення яких є синтаксичний концепт. Класифікація речень за структурними типами: репрезентативні, директивні, експресивні та квеситивні.

    статья [22,1 K], добавлен 07.11.2017

  • Поняття та визначення складних речень, особливості їх утворення з двох чи більше простих, об'єднаних в одне ціле змістом і інтонацією. Застосування сполучників та сполучних слів, види розділових знаків, їх використання. Утворення складносурядних речень.

    презентация [211,1 K], добавлен 25.11.2011

  • Дослідження англійських та українських дієслівних парадигм. Семантичні особливості складносурядних речень в українській мові і англійському перекладі роману "Коханець леді Чаттерлі". Аналіз семантико-стилістичних особливостей поліпредикативних речень.

    дипломная работа [93,7 K], добавлен 08.09.2011

  • Розробка теоретичних засад використання інтерактивних технологій навчання на уроках англійської мови. Формування вмінь виражати свої думки за допомогою невеликих і чітких за структурою речень, розвивання навичок консервації та актуалізації інформації.

    статья [26,4 K], добавлен 31.08.2017

  • Визначення сутності та функцій інверсії як синтаксичного та стилістичного засобу. З'ясування можливих механізмів перекладу інвертованих речень українською мовою. Виявлення експресивних одиниць, що використовуються в ЗМІ, осмислення їх семантики.

    дипломная работа [84,9 K], добавлен 07.07.2011

  • Теоретичні засади дослідження гіпотаксису в контексті німецько-українського перекладу науково-публіцистичних текстів. Граматична специфіка, морфологічні та синтаксичні особливості перекладу. Принципи класифікації складнопідрядних речень у німецький мові.

    курсовая работа [94,3 K], добавлен 07.04.2013

  • Поняття про складне речення, його функції в мові. Засоби вираження зв’язку між частинами складного речення. Характеристика типів складних речень. Структура складносурядних речень, їх основні різновиди. Ознаки складносурядних речень, його складові частини.

    лекция [22,2 K], добавлен 26.08.2013

  • Положение семантики в кругу лингвистических дисциплин. Суть когнитивной лингвистики, анализ когнитивной информационной семантики с позиции семасиолога-лингвиста, когнитивное направление в США. Свидетельства относительной автономности языковых механизмов.

    реферат [18,7 K], добавлен 04.09.2009

  • Місце складносурядного речення у синтаксичній системі української мови. Специфіка та класифікація складносурядних речень з єднальними сполучниками. Граматичні та смислові, розділові знаки та смислові зв’язки між частинами складносурядного речення.

    курсовая работа [35,8 K], добавлен 06.12.2015

  • Сущность и предмет рассмотрения семантики, ее место и значение среди языковедческих наук. Специфические черты семантики собственных имен, пять аспектов языковой информации имени. Концептуальная модель топонимической семантики и ее основные уровни.

    курсовая работа [41,3 K], добавлен 20.11.2009

  • Історія становлення теорії безсполучниковості в українському мовознавстві. Структурно-семантичні особливості речень із різнофункціональними частинами. Експресивно-виражальні можливості безсполучникових складних речень та багатокомпонентних утворень.

    дипломная работа [156,7 K], добавлен 13.06.2011

  • Поняття числівника як частини мови, його морфологічні ознаки і вираження в реченні. Утворення прислівників прикметникового, іменникового, займенникового й дієслівного походження. Вживання для утворення особливих, властивих тільки їм, суфіксів і префіксів.

    реферат [31,1 K], добавлен 07.11.2011

  • Лінгвістичні ознаки науково-технічних текстів у німецькій мові. Особливості текстів науково-технічного стилю у перекладацькому аспекті. Проблеми перекладу науково-технічних текстів. Синтаксичні особливості речень та їх відтворення при перекладі.

    курсовая работа [48,2 K], добавлен 21.06.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.