Лингвистический анализ структурной и содержательной связности текстовых импликатов в контексте поиска противоречий в нечеткой базе правил
Оценка противоречий в нечеткой многоуровневой системе продукций. Продуктивность применения методики для проведения семантического анализа структурной и содержательной связности особого рода текстов, представленных в виде наборов текстовых импликатов.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 30.04.2018 |
Размер файла | 461,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Вычислительный центр им. А.А. Дородницына Федерального исследовательского центра «Информатика и управление» Российской академии наук
Лингвистический анализ структурной и содержательной связности текстовых импликатов в контексте поиска противоречий в нечеткой базе правил
Поспелова Л.Я.
ORCID: 0000-0002-5037-4161, Кандидат технических наук, доцент,
Аннотация
семантический текст импликат противоречие
Описана предлагаемая методика выявления и оценки разного рода противоречий в нечеткой многоуровневой системе продукций. Показана продуктивность применения методики для проведения семантического анализа структурной и содержательной связности особого рода текстов, представленных в виде наборов текстовых импликатов. Поскольку в процессе ревизии прикладных баз знаний множество эксплицитных и имплицитных убеждений абстрактного рационального субъекта в идеале должно поддерживать разумную меру логической непротиворечивости и замкнутости относительно операций логического вывода, нечеткая логико-лингвистическая система может служить полигоном для экспериментов по выявлению логических и концептуальных противоречий.
Ключевые слова: нечеткая база правил, логическое противоречие, концептуальное противоречие, имплицитное утверждение, логическая инференция.
Abstract
Pospelova L.Ya.
ORCID: 0000-0002-5037-4161, PhD in Engineering, Associate professor, Senior Researcher, Dorodnicyn Computing Centre, Federal Research Center “Computer Science and Control” of Russian Academy of Sciences
Linguistic analysis of structural and conceptual coherence of text implicates in the context of the search for contradictions in fuzzy rule base
Described the proposed methodology for the identification and evaluation of various kinds of contradictions in the fuzzy multi-level production system. Shown the efficiency of application of the method to conduct a semantic analysis of structural and conceptual coherence of specific kinds of texts presented in the form of sets of text implicates. As a result of the revision of the applied knowledge bases, the set of explicit and implicit beliefs of an abstract rational subject must maintain a reasonable measure of logical consistency and closure concerning the operations of logical inference, therefor a fuzzy logic-linguistic system may serve as a testing ground for experiments on the identification of logical and conceptual contradictions.
Keywords: fuzzy rule base, logical contradiction, conceptual contradiction, implicit statement, logical inference.
Задача интеллектуализации сетевого пространства [1, с. 1297; 4, с. 138] вернула усилия математиков, лингвистов, философов на этап изучения и моделирования механизмов человеческого мышления, этап поиска способов компьютерного представления знаний и убеждений. Наблюдаемая в настоящее время неудовлетворительная степень релевантности запросов обусловлена трудностями формального описания концептов и концептуальных отношений проблемных областей: прикладные онтологии, учитывающие специфику принятия решений компьютером, имеют дело с реальностью сконструированной, а программы систем, основанных на знаниях, строятся на базе той или иной разновидности неклассической логики. В философских трудах разрабатываются эпистемологические концепции изменения систем знаний [4, с. 136], математики исследуют логику убеждений и эпистемологическую логику знаний, паранепротиворечивые логики, дескриптивные логики как основы языков прикладных онтологий [1, с. 1297].
Возросшие требования государственных и общественных структур к качеству комплексной филологической экспертизы текстов активизировали исследования в области семантического и концептуального анализа. Особое внимание уделяется импликативным причинно-следственным отношениям между концептами-понятиями [5, с. 4] и их роли в ходе операций семантического вывода с целью извлечения глубинной (имплицитной) информации [2, с. 1; 4, с. 138]. В указанных работах можно проследить прямую аналогию между текстовыми импликатами и аксиомами логического следования в системах продукций, между процессом извлечения имплицитной информации из набора импликативных суждений (процессом формально-логической инференции) и экспертным логическим выводом. Например, следствия, рассматриваемые лингвистами как имплицитные части высказываний, могут выводиться из семантики на одном, двух или многих шагах рассуждений. Чем короче цепочка вывода, тем ближе следствия находятся к поверхностной, эксплицитной части семантики. На длинных цепочках вывода следствия опустятся на глубинные слои плана содержания и будут рассматриваться не как обязательные пропозиции, но как некие факультативные предположения [2, с. 4] - этот вывод вызывает вполне объяснимый интерес разработчиков баз нечетких правил, заинтересованных в уменьшении меры внутренней неопределенности объекта управления по отношению к выводимому свойству этого объекта..
Обобщенный теоретический подход активно изучает противоречия в онтологиях, выявляет причины возникновения противоречивости при ревизии рациональным субъектом собственных понятий и убеждений [1, с. 1298, 6, с. 138]. Практической стороной занимается прикладная когнитология.
В инженерии знаний концептуализации редко поднимаются до описания абстрактных знаний (философских онтологий верхнего уровня), поскольку суть современного онтологического поворота (смещение интереса от эпистемологии к онтологии) [8, с. 2] в том, что для отображения знаний в эксплицитно-имплицитных формах исследователи прибегают к огрубленным и идеализированным конструкциям, их интересует не интерпретация, не суть вещей, а то, как они профессионально используются на практике.
Наиболее остро стоит проблема повторного использование онтологий в Semantic Web-приложениях [1], когда в результате добавления новых аксиом, ревизии или удаления существующих аксиом пользователи могут обнаружить, что новые онтологии стали противоречивыми. Необходимость выработки единой фундаментальной основы, поддерживающей формальное определение противоречия и отрицания и позволяющей усилить языки онтологий в части представления аксиомы отрицания является одной из первоочередных задач математиков и лингвистов. Для онтологий, основанных на дескриптивных логиках и постулатах рациональности [4, с. 139], авторы [1, с. 1297] предлагают различать два вида противоречий: несогласованность и классическую противоречивость, естественным образом появляющихся в динамических базах знаний. Если классическая (логическая) противоречивость может быть выявлена при тестировании системы на замкнутость относительно логического следования [4, с. 137; 6, с. 186; 7, с. 136], то концептуальное противоречие не поддается формализации в рамках классической логики. Поскольку в реальных приложениях всякая онтология подразумевается нечеткой, развитие конструктивных методов выявления разного рода противоречий является актуальной прикладной задачей.
В настоящей работе объект исследования сужен до статических нечетких многоуровневых систем продукций, для которых метод и алгоритм автоматического выявления логических противоречий на прагматическом функциональном уровне логического вывода описан в [7, с. 136]. Еще одно сужение связано с применением законов «материальной импликации» (ex falso quodlibet - «из ложного - что угодно») в рамках паранепротиворечивой логики.
Описанный в [7, с. 136] алгоритм выявления логических противоречий в нечетких системах правил использует преимущества динамического подхода [6, с. 185]. Отмечено, что для нечетких баз правил нельзя требовать замкнутости множества правил-аксиом относительно логического следования. Например, метод доказательства теорем («reduction ad absurdum») в формализмах классических логик, проверяющий на каждом шаге, не свелось ли результирующее высказывание к пустому множеству [6, с. 187], в нечетком выводе удовлетворительно работать уже не будет. На неуниверсальность закона непротиворечия указывалось еще в работах русского логика Васильева Н.А.: содержательный анализ природы отрицания показал, что единственным источником отрицания является эмпирическая несовместимость признаков. Степень принадлежности объекта управления сразу нескольким несовместимым классам (например, «Значительное падение» и «Значительный рост») по отношению к нечеткой выходной переменной (например, «Прогноз курса национальной валюты») есть степень нечеткости суждения «Пересечение всех результатов нечеткого вывода множества применимых при некотором входе правил есть пустое множество» (носитель результата-выхода - непересекающиеся интервалы).
Исследуемая система правил является системой утверждений логического следования. Нечеткие правила (импликативные отношения между суждениями) могут быть эксплицитными, (явными, выражающими поверхностное содержание) или имплицитными (выражающими скрытый, глубинный слой содержания, его подтекст) [2, с. 1; 5, с. 4]. В процессе логического вывода экономный (имплицитный) способ отображения содержания эксплицируется в развернутое, явно выраженное высказывание-импликацию. Значения входные переменных являются самыми эксплицитными (соответствующими действительности) частями семантики высказывания в конкретном сеансе экспертного вывода. Компиляция многоуровневых иерархических баз правил может рассматриваться как выведение всех правил-импликаций на эксплицитный уровень. При поиске противоречий в иерархических нечетких системах продукций выход в виде нечетких переменных одного уровня напрямую передается на входы правил следующего уровня иерархии без дефаззификации и фаззификации. Поэтому при описании промежуточных (имплицитных) переменных достаточно обозначить только терм-множества.
Итак, пусть скомпилированная база правил содержит нечетких импликаций для эксплицитных входов и одного выхода:
(1)
где: - множество входных переменных, заданных на своих универсальных множествах ; нечеткие термы - элементы терм-множеств: ; принадлежность терма соответствующему универсальному множеству задается функцией принадлежности ; - выходная переменная, заданная на универсе , её нечеткие термы имеют функции принадлежности .
Принятые форматные ограничения (1) не помешают нашим рассуждениям о противоречивости даже иерархических НБЗ. Переход к скомпилированным продукциям, у которых будут отсутствовать имплицитные лингвистические переменные, произойдет без потери экспертной информации и без ущерба для рассмотрения идеи метода.
Логические противоречия выявляются при оценке степени замкнутости системы правил относительно логического следования. В абдукции истинность с заключения правила Rtпереносится на посылки:
Оправдательный механизм абдукции используется при последовательном тестировании каждой импликации. Эксплицитным входом служит «зашумленный» сигнал, который описывается нечеткими множествами, совпадающими с условиями проверяемого правила, например, правила R1:
(2)
Для входа (2) для каждого из правил нечеткой базы знаний вычисляется нечеткая t- импликация Мамдани. В результате получим новую нечеткую переменную либо со «срезанной», либо с исходной функцией принадлежности терм-множеству выхода-заключения правила. Rt:
Мера применимости проверяемого правила R1 всегда будет максимальной при заданном «зашумленном» входе (2) с максимальным значением меры выполненности посылки данного правила. Функция принадлежности результата будет совпадать с , т.е. не будет «срезанной». Правило неприменимо, когда мера выполненности посылки равна нулю.
Высокая мера возможности получения противоречивых, двусмысленных результатов нечеткого вывода будет зафиксирована, если для данного входа (2) нечеткой системы (1) найдется такое применимое правило R0, что результат исчисления нечеткой импликации для него будет в значительной мере принадлежать терму выхода , который несовместим с термом-заключением тестируемого правила R1:
Здесь - носитель нечеткого множества . На следующем шаге анализируются все носители нечетких множеств - результатов . Противоречие в нечеткой базе правил будет иметь максимальную степень, если найдутся такие подмножества значений входных переменных, для которых будут участвовать в композиции (в нечетком агрегировании) только правила с несовместимыми заключениями (в рассмотренном примере это правила R1 и R0).
Агрегированный нечеткий выход для заданного входа (2) исчисляется взятием максимального значения по всем результатам нечеткого вывода множества применимых правил . Функция принадлежности объединения этих нечетких подмножеств имеет вид:
(3)
Эта функция определена на . Ее причудливый вид уже длительное время вызывает беспокойство у прикладников. Предложены десятки методов дефаззификации нечеткого множества . Но если функция (3) не унимодальна, локальные максимумы сравнимы по величине с глобальным и соответствуют противоречащим друг другу термам, а носитель вторичного нечеткого множества состоит из непересекающихся интервалов, то применение любого из известных методов даст результат дефаззификации, который вызовет оторопь: его трудно считать приемлемым значением выходной переменной.
На рис. 1 показан пример трансформации поверхности отклика в ответ на введение логического противоречия. На рис. 1.а представлена непротиворечивая и согласованная база правил. Рис. 1.б - поверхность отклика логически противоречивой базы правил (после дефаззификации центроидным методом). Рис. 1.в иллюстрирует поверхность отклика той же самой логически противоречивой базы правил, но после дефаззификации, учитывающей, что носитель вторичного нечеткого множества представлен непересекающимися интервалами. В логически противоречивой нечеткой базе правил поверхность отклика (б) имеет седловидную область неустойчивых решений. Надо иметь в виду, что поверхность отклика строится огрубленно, по результатам дефаззификации, когда вторичное нечеткое множество тем или иным методом отображается в число (точку поверхности). Если же обратиться ко всей нечеткой области отклика, то она предстанет в гипербрусе облаком с пустотами (в). Проекции пустот на оси дадут «опасные» интервалы значений некоторых входов.
Рис. 1 - Поверхности отклика: а - непротиворечивая база правил; б - логически противоречивая, в - что и база правил (b), но после дефаззификации с учетом «пустот»
Рисунок 2 иллюстрирует поверхность отклика для системы правил, содержащей концептуальное противоречие. Например, правила:
Ri: IF(x1 is Low) AND (x2 is Low) THEN (y is Low)
Rk: IF(x1 is High) AND (x2 is High) THEN (y is Low)
формально не противоречат друг другу, но противоречия проявляются при конкретной интерпретации понятий. Когда на вход поступают переменные, принадлежащие с высокой степенью возможности термам «High», поверхность отклика предлагает неприемлемые (с содержательной точки зрения) значения выходной переменной. Область поверхности отклика для значений входных переменных, частично принадлежащих термам «High», демонстрирует заметную неустойчивость (см. рис. 2).
Рис. 2 - Поверхность отклика содержит концептуальное противоречие
Итак, предлагаемый метод фиксирует логическое или концептуальное противоречие, если в результате нечеткого вывода новое состояние системы станет недопустимым [6] для некоторой интерпретации (4):
(4)
(5)
Если интерпретировать функцию принадлежности нечеткого результата как распределение возможностей (и как плотность меры неопределенности), то нечеткие cтепени допустимости противоречия, степени согласованности и достоверности результатов в (4) и (5) можно качественно и количественно оценивать путем анализа носителя вторичного нечеткого множества: какова область значений входных переменных, для которых носитель вторичного множества разбивается на непересекающиеся интервалы, какова величина промежутка между границами соседних интервалов и т.п..
Метод лишь выявляет «подозрительные» цепочки правил нечеткого логического вывода, в результате которого может быть получен неустойчивый результат (взаимоисключающие прогнозы, взаимоисключающие диагнозы и т.д.) для найденных интервалов входных переменных. Метод подтверждает рекомендации уделять внимание расположению максимумов функций принадлежности крайних термов относительно границ интервалов возможных значений выходной переменной.
Нечеткие логико-лингвистические системы, описываемые наборами значений входных и выходных лингвистических переменных, отношения между которыми задаются эвристическими правилами, могут формально представлять профессиональные тексты. Как в логике, так и в лингвистике под импликацией подразумевается некая причинно-следственная связь, а как имплицитная рассматривается не выраженная в явном виде, подразумеваемая посылка. Чем длиннее цепочка вывода с использованием эвристик, тем дальше следствия находятся от поверхностной, эксплицитной части семантики, тем выше мера нечеткости результирующих суждений как в лингвистической экспертизе текста, так и в нечетких системах управления.
Работа выполнена при поддержке Российского научного фонда (РНФ № 14-11-00432).
Литература
1. Flouris G., Huang Z., Pan J.Z., Plexousakis D., and Wache H. Inconsistencies, Negations and Changes in Ontologies [Текст]// Proceedings of the 21st National Conference on Artificial Intelligence (AAI-06). - 2006. - P. 1295-1300. [Электронный ресурс] - Режим доступа. - URL: http://users.ics.forth.gr/~fgeo/Publications/AAAI06.pdf
2. Баранов А.Н. Скрытое (имплицитное) утверждение в лингвистической экспертизе текста // Труды первой Интернет-конференции «Право как дискурс, текст и слово», 2010. [Электронный ресурс] - Режим доступа. - URL: http://siberia-expert.com/publ/konferencii/konferencija_2010/9-1-0-325
3. Казаченко О.В. Когерентность и когезия текста. Московский институт лингвистики. Альманах современной науки и образования. Тамбов: Грамота, 2009. № 8. Ч. 2. С. 88-90. [Электронный ресурс] - Режим доступа. - URL: http://www.gramota.net/materials/1/2009/8-2/37.html
4. Козаченко Н.П. Критерии рациональности изменения убеждений: Непротиворечивость // Логические исследования. Ежегодник Института философии РАН. - 2010. - Вып. 16. - С. 134-155. [электронный ресурс] - Режим доступа. - URL: http://iph.ras.ru/uplfile/logic/log16/LI-16kozachenko.pdf
5. Корниенко Е.А. К вопросу об импликации в профессиональном тексте. [электронный ресурс] - Режим доступа. - URL: http://pglu.ru/upload/iblock/c2f/uch_2009_iii_00017.pdf
6. Поспелов И.Г., Поспелова Л.Я. Динамическое описание систем продукций и проверка непротиворечивости продукционных экспертных систем // Изв. АН СССР. Техническая кибернетика. - 1987. - № 1. - С. 184-192.
7. Поспелова Л.Я. Метод автоматического выявления несогласованностей в статических нечетких системах продукций // Международный научный институт “Educatio”: ежемесячный научный журнал. Часть 2. Технические науки. 2015. № 2(9). С. 134-139. [электронный ресурс] - Режим доступа. - URL: http://cyberleninka.ru/article/n/metod-avtomaticheskogo-vyyavleniya-nesoglasovannostey-v-staticheskih-nechetkih-sistemah-produktsiy
8. Савчук В.В. Что такое повороты в философии? // Доклад на историко-методологическом семинаре “Русская мысль”. РХГА. 2012. С. 2-14. [электронный ресурс] - Режим доступа. - URL: http://rhga.ru/science/conferences/rusm/stenogramms/savchuk.php
Размещено на Allbest.ru
...Подобные документы
Алгоритм умножения двоичных чисел. Выбор и описание структурной схемы операционного автомата. Реализация содержательной граф-схемы алгоритма. Построение отмеченной граф-схемы и структурной таблицы переходов и выходов. Правила кодирования на D-триггерах.
курсовая работа [273,2 K], добавлен 01.04.2013Исследование нечеткой модели управления. Создание нейронной сети, выполняющей различные функции. Исследование генетического алгоритма поиска экстремума целевой функции. Сравнительный анализ нечеткой логики и нейронной сети на примере печи кипящего слоя.
лабораторная работа [2,3 M], добавлен 25.03.2014Параметры автомобиля, используемые в экспертной системе. Задание нечетких и лингвистических переменных, виды термов. Список правил для функционирования системы, результаты анализа ее работы. Применение алгоритма Мамдани в системах нечеткой логики.
курсовая работа [1,5 M], добавлен 10.02.2013Детерминированный и вероятностный подходы к оценке живучести сетей. Анализ моделей гибели и вероятности связности сетей. Табличное представление результатов вычислений и построение графических зависимостей в программе, написанной на языке Object Pascal.
дипломная работа [2,9 M], добавлен 03.09.2013Изучение методов разработки систем управления на основе аппарата нечеткой логики и нейронных сетей. Емкость с двумя клапанами с целью установки заданного уровня жидкости и построение нескольких типов регуляторов. Проведение сравнительного анализа.
курсовая работа [322,5 K], добавлен 14.03.2009Обзор учебно-методической, научной литературы и анализ имеющейся методики изучения содержательной линии информатики "Моделирование и формализация". Технология разработки информационно-компьютерной среды для реализации учебно-методического комплекса.
дипломная работа [105,6 K], добавлен 05.08.2011Классификация программ обработки текстовых документов. Общие принципы оформления издания. Правила набора текста. Системы распознавания текста (OCR). Комплекс программного обеспечения для настольных издательских систем. Примеры текстовых редакторов.
презентация [75,0 K], добавлен 13.08.2013Задание термов лингвистических переменных. Выбор четких входных переменных. Степени истинности правил. Построение нечеткой базы знаний для задачи об эффективности работы предприятия, проверка ее на полноту. Нечеткий вывод для конкретных значений.
контрольная работа [170,2 K], добавлен 19.11.2014Текстовый редактор - приложение для обработки текстовой информации. Описание текстовых процессоров как более совершенных текстовых редакторов. Типы текстовых файлов: форматированные, неформатированные. Основные правила редактирования и набора текста.
презентация [747,3 K], добавлен 26.11.2010Понятие семантики; обзор и анализ существующих средств семантического разбора естественно-языковых текстов. Разработка алгоритма работы системы на основе семантического анализа, его реализация на языке программирования; проектирование интерфейса системы.
дипломная работа [1,7 M], добавлен 18.03.2012Точные и приближенные методы анализа структурной надежности. Критерии оценки структурной надежности методом статистического моделирования. Разработка алгоритма и программы расчета структурной надежности. Методические указания по работе с программой.
дипломная работа [857,8 K], добавлен 17.11.2010Рассмотрение и анализ моделей и алгоритмов семантического поиска в мультиагентной системе поддержки пользователей. Ознакомление с интерфейсом чата с ботом. Изучение и характеристика экспериментальных оценок релевантности и пертинентности запросов.
дипломная работа [3,0 M], добавлен 13.10.2017Важнейшие принципы обучения в школе. Понятие и основные виды наглядности. Развитие воображения в процессе обучения. Диапазон использования компьютера в учебно-воспитательном процессе. Понятие содержательной линии. Общая классификация методов обучения.
курсовая работа [270,9 K], добавлен 15.12.2012Функциональные характеристики программы форматирования текстовых файлов, требования к ее интерфейсу и данным. Схема взаимодействия компонентов системы, выбор среды исполнения и программная реализация алгоритмов. Тестирование и оценка качества программы.
курсовая работа [61,1 K], добавлен 25.07.2012Организация возможности просмотра текстовых файлов и осуществления поиска нужных слов в тексте. Редактирование текста (шрифт, размер). Алгоритм поиска подстроки в строке (метод Кнута-Морриса-Пратта). Загрузка текста из файла (с расширением .txt).
курсовая работа [2,2 M], добавлен 29.05.2013Анализ и математическая постановка задачи. Описание алгоритма действий, структурной организации программы и ее программной реализации. Текст основной программы, модулей вывода текстовых файлов на экран, извлечения ехе-файлов и подсчёта лабораторных работ.
курсовая работа [28,1 K], добавлен 28.02.2011Предотвращение несанкционированного распространения информации в текстовых файлах. Разработка подсистемы обнаружения утечки информации с фильтром идентификации текстовых областей в передаваемом потоке данных и их сходства с конфиденциальными данными.
дипломная работа [1,8 M], добавлен 14.03.2013Создание и редактирование электронных баз данных. Обработка электронных таблиц. Операции изменения формата документа. Основные функции текстовых процессоров. Деловая графика. Построение рисунков, диаграмм, гистограмм различных типов в программе Excel.
презентация [773,1 K], добавлен 23.12.2013Комплекс заданий компьютерной диагностики знаний учащихся по содержательной линии "Алгоритмизация". Наблюдение за деятельностью обучаемых и анализ результатов исследования. Основные требования и область применения пакета программ Sun Rav Book Office.
презентация [286,7 K], добавлен 18.09.2014Двоичные деревья в теории информации. Двоичные кодовые деревья допускают интерпретацию в рамках теории поиска. Обоснование выбора, описание алгоритма и структур данных. Обоснование набора тестов. Построение оптимального кода. Сущность алгоритма Хаффмана.
курсовая работа [241,6 K], добавлен 17.10.2008