Высокоуровневые эвристики для автоматизированного формирования базы знаний

Возможности использования элементов аналогии и индуктивного вывода как специализаций высокоуровневых эвристик в рамках развиваемого подхода к автоматизированному формированию базы знаний. Реализация логики такого использования на задачах планиметрии.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 18.01.2018
Размер файла 79,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

11

Размещено на http://www.allbest.ru/

Высокоуровневые эвристики для автоматизированного формирования базы знаний

С.С. Курбатов

Аннотация

В рамках развиваемого подхода к автоматизированному формированию базы знаний исследуются возможности использования элементов аналогии и индуктивного вывода как специализаций высокоуровневых эвристик. Разработана и в экспериментальном варианте реализована логика такого использования на задачах планиметрии. Реализация выполнялась на языке 4GL для реляционной базы Progress, для наглядности использовался интерфейс с Word.

высокоуровневая эвристика база

Введение

Известно, что использование эвристик позволяет существенно уменьшить перебор вариантов при поиске решения [Рассел, 2006]. Однако, большей частью, эвристики специализированы и жестко фиксированы для решения конкретной задачи [Nilsson, 2009], [David et al., 2010]. Поэтому основной акцент был перенесен на развитие систем, базирующихся на знаниях [Осипов, 2002]. Тем не менее, неоднократно и во многих работах отмечалось, что при решении задачи у человека часто изначально возникает некоторая интуитивная догадка, гипотеза, и затем производится ее обоснование. Появляется цель и производится поиск рационального пути к ней [Знатнов]. Компьютерные программы (в том числе и основанные на знаниях) пока далеки от полноценного воплощения такого подхода. В данной работе сделана попытка рассматривать высокоуровневые эвристики как знания, а эвристическую функцию для конкретной задачи как специализацию некоторой высокоуровневой эвристики. На примере конкретной задачи рассмотрена имитация действий человека на уровне выдвижения эмпирических догадок, используемых в дальнейшем для строгого доказательства. Уровень трудности этой задачи сопоставим с уровнем задач, решаемых в классической работе [Гелернтер, 1967].

Логика общего механизма использования использование элементов аналогии и индуктивного вывода как специализации высокоуровневых эвристик отрабатывалась на планиметрических задачах, а в целях наглядности для основной системы представления знаний был разработан интерфейс с Word. Этот интерфейс позволял связывать внутренние объекты Word (типа line, oval и т.д.) с их естественно-языковыми описаниями, передавать информацию о рисунке в основную систему и отображать действия системы на рисунке. Основная система в экспериментальном варианте реализована на языке 4GL для реляционной базы Progress. Используемое представление знаний и механизмы его обработки ориентированы на априорное задание знаний в базе на максимально высоком уровне и на возможности автоматизированного формирования новых знаний [Курбатов, 2006]. Отметим, что в настоящее время работы в данном направлении в основном либо достаточно сильно специализированы, либо развиваемая концепция далека от программного воплощения и излагается на уровне идей классической работы [Пойа, 1970].

В данной работе предполагается, что ответ на вопрос из [Рассел, 2006]: “Возможно ли, чтобы компьютер мог составить некоторую эвристическую функцию механически? ” является положительным. Однако эвристическая функция для конкретной задачи должна формироваться как специализация некоторой высокоуровневой эвристики. Множество же высокоуровневых эвристик в базе знаний задается априорно.

1. Общая логика

Кратко и на общем уровне опишем конкретный пример использования аналогии, индукции и вывода, технические детали экспериментов, как с данным, так и с другими примерами будут отображены на HTML-странице [eia--dostup, 2010]. Основная логика предполагает взаимосвязь индуктивного и дедуктивного методов в процессе решения задачи. Логика включает в себя генерацию конкретных экземпляров структур языка представления знаний (ЯПЗ) из общего описания, запуск блока индукции для поиска закономерностей (гипотез, предположений) на множестве этих экземпляров и запуск дедуктивного блока для доказательства (подтверждения/опровержения) найденных на индуктивном этапе (по сути эмпирически) предположений. Эта логика была намечена еще в ранней работе автора [Курбатов, 1977] на примере задачи покрытия шахматной доски прямоугольниками 1 x 2.

Проиллюстрируем фрагмент работы этой логики на конкретном примере из области не самой тривиальной планиметрической задачи. Формулировка задачи: построить остроугольный треугольник по основаниям его высот. Упрощенно логика поиска решения может быть представлена следующими этапами.

1-ый этап: запись формулировки задачи на ЯПЗ. Эта запись либо непосредственно заносится в ЭВМ с использованием редактора знаний, либо (предполагается) транслируется в структуры ЯПЗ с помощью лингвистического транслятора.

2-ой этап: генерация конкретных экземпляров структур ЯПЗ из общего описания задачи.

3-ий этап: формирование индуктивных предположений по множеству экземпляров.

4-ый этап: доказательство/опровержение предположений.

5-ый этап: поиск и использование аналогий.

1-ый и 4-ый этапы достаточно стандартны. Основную идейную составляющую содержат этапы 2-ой, 3-ий и 5-ый. Первые два из них определяют связь индуктивного и дедуктивного методов, на этапе 3 формируется предположение, позволяющее более целенаправленно организовать процесс доказательства на этапе 4. Если дедуктивный процесс закончился успешно, в ряде случаев естественно обобщить доказательство. Обычно это выражается фразой типа “аналогично получаем …”. Именно для формализации такой фразы предназначен 5-ый этап.

Схема использования аналогии несколько отличается от типовой формы выявления общих атрибутов у двух объектов и выдвижения предположения о наличии у одного из объектов признака (или его значения) другого объекта. В текущем варианте выдвигалось предположение о множестве аналогичных объектов (М), далее рассматривалось доказательство для подмножества из М и делался вывод (по аналогии) о переносимости этого доказательства на другие подмножества из М (той же мощности). Степень достоверности вывода по аналогии этом случае зависит от степени достоверности предположения об аналогичности объектов, входящих в множество М. Доказательство, проведенное для подмножества, может быть логически безупречным.

В данном случае одним единичным объектом является подмножество аналогичных объектов, а другими единичными объектами являются другие подмножества исходного множества. Свойством (признаком) единичного объекта является доказательство некоторого утверждения, гипотезами для которого служат элементы, входящие в единичный объект. Выводом или умозаключением по аналогии здесь будет утверждение о переносимости доказательства на другие единичные объекты. Отметим, что этот вывод проверяем: можно повторить цепочку доказательства для других единичных объектов. Если же такой повтор терпит неудачу, то следует пересмотреть исходное предположение об аналогичности объектов.

2. Конкретная задача

Конкретизируем эти этапы для нашей задачи (фрагментарно).

1) Описание на ЯПЗ условия включает описание треугольника с вершинами A, B, C и основаниями высот A1, B1, C1, см. Рис.1. При этом основания отмечены как известные объекты, а вершины как неизвестные. Задача решающей процедуры - выполнять преобразования над данной структурой ЯПЗ с целью означить вершины как известные объекты.

Наглядное отображение условий задачи и действий системы в процессе поиска решения осуществлялось с помощью интерфейса основной системы и Word. Интерфейс использует два файла, в одном формируется задание для Word, в другом результаты выполнения задания. Для интерпретации задания и формирования результатов на уровне макросов Word были реализованы примитивы создания объектов на экране (отрезки, овалы и т.д.), вычисления длин и углов, проведения высот в треугольнике, просмотра всех объектов на экране и т.п.

Основные действия по решения задачи выполняются в системе, реализованной на языке реляционной базы (4GL Progress). Именно в ней выполняется диалог по описанию условий задачи и формирование соответствующей структуры ЯПЗ и задания для Word-интерфейса. Использование векторной графики и сбалансированное распределение функций между Word и Progress позволяет существенно снизить нагрузку на базу знаний, Word используется фактически как рецептор относительно высокого уровня. В растровом варианте, когда на вход подается массив точек, ситуация была бы значительно сложнее. Некоторые примеры диалога и работы Word-интерфейса даны на HTML-странице [eia-dostup, 2010].

2) Поскольку попытка непосредственно получить ответ оканчивается неудачей, выполняется генерация конкретных структур ЯПЗ (множество экземпляров), удовлетворяющих описанию задачи. В результате формируются несколько треугольников, координаты которых получены системой случайным образом.

3) Над множеством экземпляров выполняется индуктивный поиск предположений, претендующих на доказательство. При этом поиске предполагается, что в системе имеется соответствующий алгоритмический базис: предикаты для сравнения координат точек, длин отрезков, величин углов и т.п. Не загромождая текст рядом неудачных попыток системы, отметим автоматически найденные эмпирические факты: равенство углов (Рис 1.). В отличие от типичного индуктивного вывода здесь трудности не столько в получении формулы (равенство определяется вызовом стандартного предиката), сколько в выборе объектов/атрибутов для сравнения.

Рис.1. Произвольный остроугольный треугольник и его высоты.

Выбор предполагает использование эвристики высокого уровня “при выборе объектов для сравнения/анализа отдавать предпочтение объектам, в которые входят большее число известных элементов”. В данном случае объектами сравнения/анализа являются треугольники, а множество всех точек (потенциальных вершин) естественно разбивается на множества известных и неизвестных (напомним, что в соответствии с условием задачи основания высот считаются известными).

Система предполагает, что элементы этих множеств аналогичны (сходство по признаку известны/неизвестны) В соответствии с вышеприведенной эвристикой для сравнения/анализа предлагается выбрать (за исключением тривиального случая множества всех известных объектов) треугольник типа A, B1, C1. Этот треугольник включает две известные и одну неизвестную вершины. После выбора система путем вызова стандартных формул эмпирически находит для экземпляра конкретные значения атрибутов (длин отрезков, величин углов и т.п.).

Во всех случаях выбора операций/объектов/атрибутов используется ограничение по ресурсам и эвристика типа “если количество вариантов для перебора превышает заданный ресурс, то использовать эвристику для ограничения вариантов”. Как ресурс, так и эвристика для ограничения зависят от задачи и также выбираются эвристически, или задаются в процессе диалога.

Процесс дальнейшего решения зависит от эмпирически найденных совпадений длин/пропорциональности отрезков или величин углов. Опишем один из типичных путей, автоматически полученных системой в ходе экспериментов. После выбора треугольника A, B1, C1 и эмпирического вычисления его углов и сторон, для анализа был выбран треугольник A, B, C, имеющий с A, B1, C1 общий угол (по соответствующей эвристике). Сравнение двух других углов выявляет их эмпирическое совпадение и позволяет выдвинуть предположение о подобии выбранных треугольников.

В данном случае подмножество аналогичных элементов является парой вершин B1 и C1, выбираемых из множества аналогичных (A1, B1, C1). Эмпирически найденное предположение о подобии передается для доказательства дедуктивному блоку. При этом в случае удачи фраза “аналогично получаем …" означает вывод по аналогии для треугольников A1, B, C1 и A1, B1, C, без обращения к дедуктивному блоку. Последний в свою очередь при неудаче обращается к эмпирическим данным, опираясь на известные признаки подобия треугольников (в частности - пропорциональность сторон с общим углом).

Эти эмпирические данные не имеют доказательной силы, но могут рассматриваться как контрпример (правда, не в данном случае). В рассматриваемом примере дедуктивный блок не смог непосредственно доказать догадку о подобии и обратился к индуктивному блоку за дальнейшими эмпирическими данными. Для целей иллюстрации взаимосвязи индуктивного и дедуктивного методов при автоматическом решении описание на данном уровне подробности достаточно. Опуская детали, отметим, что решение было найдено после эмпирического определения равенства углов б (B, A, A1 и B, C, C1), доказательства их равенства из подобия прямоугольных треугольников и доказательства подобия треугольников A, B, O и A1, B1, O.

И наконец доказательство (с использованием аналогии) равенства б углов B, B1, A1 и B, B1, C1 позволяет доказать, что в искомом треугольнике высоты являются биссектрисами известного треугольника. Путь к решению, очевидно, не является единственным и зависит от деталей взаимодействия индуктивного и дедуктивного блоков (в частности от ресурсов, выделяемых на организацию перебора). В процессе экспериментов было найдено несколько решений, некоторые технические подробности отражены на HTML-странице [eia-dostup, 2010]. На этой странице даны примеры, наглядно демонстрирующие действия системы с помощью упомянутого ранее интерфейса с Word. Следует отметить, что в этих примерах аналогия используется не только в случае успеха, но и при неудаче. Например, неудача при выборе треугольника A, C1, O позволяет отклонить выбор для анализа пяти аналогичных треугольников.

Подчеркнем, что предположение об аналогичности и о справедливости эмпирически найденных равенств для произвольного (остроугольного) треугольника носят правдоподобный характер, но доказательство подобия выполнено логически строго. В данном случае фраза “аналогично получаем …" распространяется на три треугольника (число сочетаний из 3 по 2), очевидно распространение на более общий случай. Очевидны также ориентировочные оценки выигрыша при использовании аналогии, зависящие как от мощности множества аналогичных объектов, так и от сложности доказательства для единичного случая.

Отметим также, что описание ряда важных и сложных решений было опущено для наиболее четкого прослеживания логики: генерация объектов, эмпирическое исследование и формирование предположений (индуктивная фаза), поиск доказательства/опровержения предположений (дедуктивная фаза). В этот ряд входят: выбор априорных объектов базы знаний и их представление в структурах ЯПЗ, процедура сопоставления структур ЯПЗ, организация управляющей структуры верхнего уровня и т.д.

3. Естественно-языковое описание графических концептов и отношений

Интерфейс с Word, выступая как рецепторный компонент, передает интеллектуальной системе информацию о рисунке. Если этот компонент типа “вектор”, то естественно считать, что передается информация об объектах и их атрибутах (типы и координаты). В текущем варианте эта информация передается в файле, интерпретация которого выполняется интеллектуальной системой. Соответствие между внутренними именами объектов Word (line, oval и т.д.) и ЕЯ-описаниями легко выполнялось на этапе обучения в диалоге.

Отметим, что основная система на языке 4GL и макросы Word выполняются не только в разных окнах, но и как разные процессы. Теоретически, при развитой системе представления знаний, генерация интерфейсного файла возможна в конструкциях, максимально ориентированных на рецепторный компонент. Более детально вопросы комплексного взаимодействия ЕЯ-описаний и изображений обсуждаются в [Хахалин и др., 2010].

На экспериментальном уровне отрабатывается логика обучения системы более сложным ЕЯ-описаниям, в частности, отношениям между произвольными объектами (“справа”, “слева”, “выше”, “ниже”) или между объектами типа <отрезок> (“параллельны”, “перпендикулярны”, “пересекаются”). Логика предполагает использование примеров на рисунке и ЕЯ-описаний в качестве исходных данных для генерации формализованого представления (например, на уровне отношений между координатами). На этом уровне Интерфейс с Word рассматривался как эффекторный компонент, отображающий на рисунке данные о значениях атрибутов, полученные из основной системы.

4. Заключение

Решение задачи, полученное с помощью вышеописанной логики, интересно, но основная цель состояла в последующем расширении возможностей системы представления знаний по обобщению найденного решения и пополнению базы знаний. В данном конкретном случае исследовались возможности обобщения структур ЯПЗ, фиксирующих найденное решение. В результате предполагается сформировать в базе знаний структуры, которые можно рассматривать как леммы/теоремы с соответствующими ЕЯ-описаниями. Последние могут иметь, например, вид “В произвольном остроугольном треугольнике основания высот отсекают треугольники, подобные исходному" или “ В произвольном остроугольном треугольнике высоты являются биссектрисами треугольника, образованного основаниями высот”.

В настоящее время на логическом уровне разрабатываются возможности представления таких структур и их использования для решения других задач. В частности, разрабатываются вопросы индексации, организации иерархии лемм/теорем и различные семантически-ориентированные характеристики (источник объекта, признаки доступности для вывода и т.п.). Инструментальный уровень базы знаний использует комбинированное представление семантической сети и реляционной базы данных. Результаты программных экспериментов позволяют оценить направление данного исследования как перспективное. Текущие результаты и технические подробности экспериментов регулярно отражаются на HTML-странице [eia-dostup, 2010].

Благодарности. Работа выполнена при финансовой поддержке РФФИ (проект № 09-01-00259).

Список литературы

1. [Гелернтер, 1967] Гелернтер Г. Реализация машины, доказывающей геометрические теоремы // Вычислительные машины и мышление. - М.: Мир, 1967.

2. [Знатнов] Знатнов С.Ю. О программном обеспечении компьютерных доказательств web version http://iph. ras.ru/uplfile/logic/log11/Li_11_Znatnov. pdf

3. [Курбатов, 2006] Курбатов С.С. Инструментальные средства для автоматизированного формирования баз знаний. // Новости искусственного интеллекта № 1. - М.: Анахарсис, 2006.

4. [Курбатов, 1977] Курбатов С.С. Обработка символьной сложно структурированной информации на современных ЭВМ. // Диссертация кандидата технических наук. - М.: МЭИ, 1977.

5. [Курбатов, 2004] Курбатов С.С. Автоматический анализ схемы и данных реляционных баз. // Новости искусственного интеллекта № 1. - М.: Анахарсис, 2004.

6. [Осипов, 2002] Осипов Г. Искусственный интеллект: основные направления и состояние исследований // Журнал "Компьютерра". 2002. №30.

7. [Пойа, 1970] Пойа Д. Математическое открытие - М.: Наука, 1970.

8. [Рассел, 2006] Рассел С. Искусственный интеллект Современный подход Второе издание. // Москва - Санкт-Петербург - Киев. - М.: Издательский дом “Вильямс”, 2006.

9. [Хахалин и др, 2010] Хахалин Г.К. О схеме взаимодействия в комплексе “Анализ и синтез естественного языка и изображений”. // Двенадцатая национальная конференция по искусственному интеллекту с международным участием (КИИ-2010). - Тверь: ТГТУ, 2010.

10. [David et al, 2010] David L. Poole and Alan K. Artificial Intelligence Foundations of Computational Agents. - Cambridge University Press, 2010.

11. [eia-dostup, 2010] HTML-страница - eia-dostup.ru/ head_doc_01. HTM.

12. [Nilsson, 2009]. Nilsson N. J. The quest for artifical intelligence history of ideas and achievements web version Stanford University, 2009. http://www.cambridge.org/us/0521122937

Размещено на Allbest.ru

...

Подобные документы

  • База знаний - структурированная информация из области знаний для использования кибернетическим устройством (человеком). Классификация, структура, формат представления знаний, интеллектуальные системы поиска информации. Базы знаний на примере языка Пролог.

    презентация [51,3 K], добавлен 17.10.2013

  • Анализ процессов диагностики повреждений трубопровода. Разработка модели продукционной базы знаний: обзор методов представления знаний, описание создания базы знаний и разработки механизма логического вывода. Экономическое обоснование концепции проекта.

    дипломная работа [3,0 M], добавлен 16.04.2017

  • Построение графа связей фактов и определение структуры базы знаний. Описание функций инициализации и констатации фактов, входных и выходных данных. Операции, направленные на занесение фактов и действий в базу знаний. Итоговое представление базы знаний.

    курсовая работа [176,9 K], добавлен 13.11.2012

  • Построение баз знаний для семантической сети. Цели создания и язык представления онтологий. Структура исследований в области многоагентных интеллектуальных информационных систем, архитектура агента. Экономическое обоснование разработки базы знаний.

    дипломная работа [1,6 M], добавлен 29.09.2013

  • Понятие базы знаний для управления метаданными. Особенности баз знаний интеллектуальной системы. Языки, используемые для разработки интеллектуальных информационных систем. Классические задачи, решаемые с помощью машинного обучения и сферы их применения.

    реферат [16,9 K], добавлен 07.03.2010

  • Процедура назначения дальнего воздушного боя по воздуху на истребителе 4-го поколения F-16M1. Индикационное обеспечение ДБВ, проект бортовой оперативно-советующей экспертной системы. Фрагмент базы знаний для проблемной субситуации "Защита с нападением".

    курсовая работа [4,4 M], добавлен 08.01.2016

  • Основные модели представления знаний. Системы поддержки принятия решений. Диаграмма UseCase. Разработка базы данных на основе трех моделей: продукционные правила, семантическая сеть, фреймовая модель. Программная реализация системы принятия решений.

    курсовая работа [715,1 K], добавлен 14.05.2014

  • Разработка, составление и отладка программного модуля "База знаний" средствами программы Quick Sales. Описание схемы базы: возможности редактирования, удаления и добавления данных. Текст программы и контрольный пример поиска через панель управления.

    курсовая работа [519,0 K], добавлен 26.01.2013

  • Разработка экспертной системы по выбору языка программирования, отвечающего критериям разработчика: представление базы знаний; выбор и обоснование механизма вывода решения. Программа формирования основного меню, реализация механизма выработки решения.

    курсовая работа [2,5 M], добавлен 15.08.2012

  • Сетевая система контроля знаний студентов на основе объектно-ориентированного подхода. Выбор программно-технических средств для реализации проекта. Алгоритмическое и программное обеспечение, интерфейс пользователя. Разработка элементов базы данных.

    дипломная работа [1,3 M], добавлен 04.02.2013

  • Понятия, классификация и структура экспертных систем. Базы знаний и модели представления знаний. Механизмы логического вывода. Инструментальные средства проектирования и разработки экспертных систем. Предметная область ЭС "Выбор мобильного телефона".

    курсовая работа [2,2 M], добавлен 05.11.2014

  • Отличительные черты компьютерных программ экспертных систем, их разработка. Составные части систем: база знаний, механизм вывода, система пользовательского интерфейса. Структура базы знаний экспертной системы для помощи медикам в постановке диагноза.

    курсовая работа [325,0 K], добавлен 04.02.2011

  • Пример экспертной системы с использованием метода Криса-Нейлора. Структура базы данных. Стратегия вывода результатов выбора страны. Руководство пользователя, редактирование базы знаний. Режим тестирования, его завершение, блок объяснения решения.

    контрольная работа [1,6 M], добавлен 29.12.2012

  • Особенности разработки системы автоматизированного контроля знаний специалистов по дефектоскопии. Обзор автоматизированных систем обучения и контроля знаний. Психологические механизмы усвоения знаний. Принципы создания эффективной тестирующей программы.

    дипломная работа [1,8 M], добавлен 30.08.2010

  • Начальное представление систем нечеткого вывода: логический вывод, база знаний. Алгоритм Мамдани в системах нечеткого вывода: принцип работы, формирование базы правил и входных переменных, агрегирование подусловий, активизация подзаключений и заключений.

    курсовая работа [757,3 K], добавлен 24.06.2011

  • Разработка и внедрение автоматизированного комплекса проверки знаний, позволяющего производить одновременный контроль знаний до 127 рабочих мест. Система сбора и обработки информации на основе локальной микросети на базе микропроцессорных контроллеров.

    курсовая работа [37,2 K], добавлен 23.12.2012

  • Семантическая сеть - совокупность объектов предметной области, отношений между ними. Причинно-следственные связи между двумя объектами в семантической сети. Представление знаний путем использования фреймов, при помощи логики предикатов. Правила продукций.

    реферат [46,1 K], добавлен 01.12.2010

  • Разработка информационно-программного комплекса для использования на IBM-совместимых ПК в качестве автоматизированного рабочего места обработки информации. Реализация базы данных в СУБД IBexpert. Характеристики разработанной информационной системы.

    курсовая работа [1,3 M], добавлен 13.08.2012

  • Разработка и реализация программного комплекса для обеспечения возможности проведения тестирования в образовательной среде. Разработка структура системы, базы данных, алгоритмов, интерфейса пользователя. Технико-экономическое обоснование проекта.

    дипломная работа [3,3 M], добавлен 03.09.2012

  • Проектирование и реализация базы данных для обеспечения автоматизированного учета результатов футбольного турнира. Осуществление логического, а также физического проектирования базы данных. Описание запросов на выборку и манипуляцию данными на языке SQL.

    курсовая работа [1,9 M], добавлен 17.06.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.