Предметная онтология для понимания текстов геометрических задач

Описание предметной онтологии "Планиметрия". Классы понятий, их структуры и свойства. Список используемых отношений и характеристика процедур вывода. Онтологические описания ситуаций как результат преобразования и означивания структур понятий в задачах.

Рубрика Математика
Вид статья
Язык русский
Дата добавления 09.01.2016
Размер файла 253,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Предметная онтология ДЛЯ понимания текстов геометрических задач

THE domain ontology under geometrical text understanding

Хахалин Г.К. (gkhakhalin@yandex.ru)

Научно-Исследовательский Центр Электронной Вычислительной Техники, Москва

Дается описание предметной онтологии «Планиметрия». Определяются классы понятий, их структуры и свойства. Приводятся список используемых отношений, и дается характеристика процедур вывода. Для текстов геометрических задач приводятся онтологические описания ситуаций как результат преобразования и означивания структур понятий.

Введение

Проблема построения онтологий возникла не на пустом месте. При создании интеллектуальных систем (и в частности, систем обработки текстов) всегда стояла задача разработки моделей проблемных сред: что, как и при использовании каких языков описаний представлять информацию о фрагментах окружающего мира. Нельзя сказать, что все сделанное в этом направлении «пошло прахом». Наработан значительный багаж в части языков представления знаний, процедур вывода (манипулирования этими знаниями) и т.д.

Сегодня в теории принято классифицировать онтологии по степени зависимости от задач или прикладной области, по языку представления онтологических знаний и его выразительным возможностям и другим параметрам [1, 2]. Особое место занимают онтологии верхнего уровня (описывают наиболее общие концепты: пространство, время, материя, объект, событие, действие и т. д.) [3]. Существуют онтологии, ориентированные на предметную область (см. примеры в [4, 5]). Онтологии, ориентированные на задачу, отражают специфику приложения, выполняющего конкретную задачу. Прикладные онтологии описывают концепты, которые зависят как от онтологии задач, так и от онтологии предметной области.

Онтологический инжиниринг подразумевает [2]:

* определение классов понятий в онтологии;

* наведение таксономии на классы (подкласс - класс - надкласс);

* разработку структур понятий и ситуаций;

* определение свойств и значений этих свойств;

* процедуры вывода и преобразования ситуаций.

В данном докладе представляется работа с использованием онтологического инжиниринга по созданию прикладной онтологии «Планиметрия», предназначенной для понимания текстов геометрических задач.

1. Структура предметной онтологии «Планиметрия»

На формальном уровне онтология -- система, содержащая определенные концепты (понятия, классы), свойства концептов (атрибуты, роли), отношения между концептами (зависимости, функции) и дополнительные ограничения, которые определяются аксиомами. Концептом может быть описание задачи, функция, действие, стратегия и т. п.

1.1 Определение классов понятий

В онтологии «Планиметрия» рассматриваются следующие основные понятия Треугольник, Параллелограмм, Трапеция, Овал, Плоская Кривая и другие концепты, которые участвуют в структурных описаниях основных понятий.

В центре онтологии находятся классы. Класс Плоская Фигура представляет все объекты планиметрических фигур. Конкретные Плоские Фигуры - экземпляры этого класса. Конкретный треугольник - это экземпляр класса Треугольник. Класс может иметь подклассы, которые представляют более конкретные понятия, чем надкласс. Например, класс Треугольник можно разделить на подклассы Прямоугольный, Равносторонний и Равнобедренный Треугольник.

Важная часть любого представления знаний - это классификация по категориям или классам объектов.

1.2 Наведение таксономии

Отношения между классами и подклассами понятий организуются в виде таксономии или таксономической иерархии. Для представления таксономии используется отношение является_видом (A kind of). Фрагмент таксономии для онтологии «Планиметрия» представлен на рис.1

Размещено на http://www.allbest.ru/

Рис. 1. Фрагмент таксономии в онтологии «Плоская геометрическая фигура»

1.3 Структуры понятий и ситуаций

Один объект может составлять часть другого объекта - это привычно для описания окружающего нас мира. Глаза - это часть лица, Крыло или Кабина - часть Самолета, а данная статья - часть трудов конференции Диалог. Для отображения таких видов взаимоотношений целого и частей служат три вида понятий. Составные понятия, в которых используется отношение является_частью (PartOf). Для таких понятий бывает достаточным только перечисление частей, например, оглавление для трудов конференции. Там, где важны отношения между частями, служат структурные понятия. Для выделения структуры используется отношение имеет_структуру. Пример фрагмента структуры понятия Треугольник в виде n-арной семантической сети (семантического гиперграфа) К сожалению, используемые языки для разработки и уточнений онтологий (например, Schematic Language или Elaboration Language [2]) мало приспособлены для описания предлагаемых структур понятий «Планиметрия». представлен на рис. 2. Встречаются такие составные объекты, которые имеют различимые части, но не имеют конкретной структуры. Например, три изображенных на рисунке треугольника имеют площадь 25 см2. Для таких объектов вводится понятие совокупности с отношением группа_из (BunchOf). Например, если три треугольника обозначить как Тре-к1, Тре-к2, Тре-к3, то выражение BunchOf ({Тре-к1, Тре-к2, Тре-к3}) обозначает составной объект, частями (но не элементами) которого являются три треугольника. Этот объект может использоваться как обычный, хотя и не структурированный объект.

Ситуация - это такие описания, которые «компонуются» из некоторого множества взаимосвязанных определенным образом понятий. Они чаще всего не имеют статус понятия и носят временный характер. Такие описания возникают в процессе формирования результата на поступление входной информации. Иногда такого рода описания (скажем, в зависимости от частоты их появления) могут оформляться в онтологии в качестве некоторого сложного понятия. Например, вписанная в треугольник окружность есть ситуация, полученная из описания треугольника, в который добавили описание окружности с определенными ограничениями (окружность с такими параметрами, при которых она касается трех сторон треугольника). Такая ситуация в области планиметрии запомнена в качестве структурного понятия Вписанная (в Треугольник) Окружность.

Рис. 2. Фрагмент структуры понятия Треугольник

При составлении структур используются в качестве составляющих понятия, не вошедшие в таксономию классов, но необходимые для полного описания понятия: Точка, Отрезок Прямой, Сторона, Угол, Высота, Диагональ, Медиана, Биссектриса, Средняя Линия и т.д.

Полная структурная часть понятия может оказаться не столь наглядной, как хотелось бы. Для этого предусматривается возможность при разработке и отладке онтологии представлять эти структуры в виде нескольких стратов - структур, в которых присутствуют базовые элементы, а в остальных частях определены разные компоненты. На рис.1 для наглядности понятие Треугольник определено в виде структуры трех отрезков прямых, соединенных концевыми точками. Хотя полная структура понятия Треугольник включает биссектрисы, медианы и высоты треугольника (см. рис. 3, где в структуре треугольника представлены понятия Угол, а на рис. 4 - понятие Медиана).

1.4 Определение свойств и значений свойств

Каждое понятие онтологии имеет свойства: это может быть обозначение класса Параллелограмм ABCD, его Площадь или Периметр. Каждое свойство может быть задано конкретным значением или способом (формулой, реализуемой с помощью присоединенной процедуры) вычисления данного значения свойства. На рисунке интегральными свойствами понятия Треугольник являются Площадь и Периметр. Значения этих свойств для экземпляра понятия подсчитываются по формулам F1 и F2, которые реализуются процедурами при означенных (конкретных, числовых) значениях свойств внутренних понятий Треугольника: длин сторон или длины одной стороны и соответствующей высоты. В представлении на языке семантической сети эти свойства связываются с соответствующими понятиями отношениями: имеет, имеет_длину, имеет_значение и т.п. Отметим, что некоторые целостные свойства понятия могут быть представлены как внутри структуры этого понятия, так и в виде интегрального его свойства. В данном примере таким свойством является зависимость сторон треугольника, которая описывается формулой F3 (гиперграфовое преставление позволяет выделять такие n-ки внутри структуры как подструктуры). Эта зависимость сторон может быть представлена свойством целостного понятия Треугольник, например, в виде:

Критерии предпочтения того или другого способа представления такого рода свойств автору неизвестны.

Для онтологии планиметрических фигур используются следующие свойства соответствующих понятий: координаты точки, длина, периметр, площадь, высота, угол, кривизна и др.

1.5 Определение отношений

При разработке и при использовании любой онтологии необходимо определиться с перечнем применяемых отношений и их свойствами. Это следует делать исходя из оптимизации списка применяемых отношений и из последующей их кодификации. На сегодняшний день нет общепринятого полного перечня отношений. Поэтому приходится для каждой предметной области вводить свои отношения (хотя относительно некоторых отношений такая практика есть, например, A kind of, PartOf). Ниже в таблице приведены отношения, используемые в онтологии «Планиметрии». Для многих отношений в онтологии имеются имена обратных отношений, например, вид - род, имеет_длину - является_длиной и т.д.

Таблица 1. Отношения в предметной онтологии «Планиметрия»

вид (A kind of)

разность

является_частью (PartOf)

образует

элемент_класса (is a)

имеет_значение

имеет_структуру

имеет_длину

равно

вычисляется_по_формуле

имеет

соприкасается_в_концевой_точке

принадлежит

совпадает

ограничивает

исходит_из

имеет_имя

делит_пополам

проходит_через

является_внутренней_точкой

произведение

параллельно

сумма

перпендикулярно

группа_из (BunchOf)

параллельно

1.6 Процедуры вывода

Использование онтологии как модели предметной области определяется некоторым множеством процедур вывода, которые кратко рассмотрены ниже.

Категории или классы объектов необходимы для организации базы знаний с целью использования информации о наследовании. Если известно, что все экземпляры класса Многоугольник имеют площадь, и утверждается, что Треугольник является подклассом класса Многоугольник, а Равнобедренный Треугольник является подклассом класса Треугольник, то каждый равнобедренный треугольник имеет площадь. Если объект принадлежит к нескольким классам, то в этом случае мы имеем множественное наследование. Таким примером в данной онтологии служит Квадрат, который одновременно принадлежит и к понятию Прямоугольник и к понятию Ромб.

Важная особенность семантических сетей - способность представлять заданные по умолчанию значения для классов понятий. Это позволяет естественно вводить исключения. Заданные по умолчанию значения находятся с помощью процедуры наследования, поскольку эта процедура следует по связям, направленным вверх от самого объекта, и останавливается, как только находит искомое значение. Значение по умолчанию перекрывается более конкретным значением. Например, площадь любого треугольника подсчитывается по формуле 1/2 ас hac (значение по умолчанию), а для прямоугольного треугольника площадь можно подсчитать по более простой формуле 1/2 ac bc (более конкретное значение).

Еще одна общая форма вывода: использование обратных связей. Например, связь имеет_длину является обратной по отношению к является_длиной. Это означает, что имеет место высказывание:

p, s имеет_длину (p, s) является_длиной (s, p).

Возможно, излишне хранить информацию и о прямой, и об обратной связи. Тем не менее, с точки зрения приобретения и использования знаний удобно иметь доступной эту информацию в явном виде. Система приобретения знаний может автоматически заполнить в описаниях и прямое и обратное отношение, обеспечивая полноту и согласованность базы знаний.

Выразительная мощность семантических сетей проявляется, если ввести присоединенные процедуры - метод, с помощью которого осуществляется вызов специальной процедуры, предназначенной для обработки определенных отношений. Примером такой процедуры является упоминаемая выше процедура вычисления по формуле.

При оперировании с конкретными экземплярами понятий реализуется процедура означивания. По входной информации некоторые переменные в описании структуры понятия принимают либо конкретные значения, либо значения, которые необходимо найти по условиям задачи. Например, если во входных данных относительно понятия Равнобочная Трапеция указаны длина одного из оснований и боковой стороны, то процедура означивания предполагает задание в обобщенной структуре этого понятия вместо переменных (длины основания и боковой стороны) их конкретные значения.

Фрагменты онтологии, включая структуры и свойства понятий, при решении конкретных задач становятся материалом для описания ситуации, которая определяется входными данными. В дополнение к этим фрагментам онтологии предполагается введение понятий и связей, определяемых входными условиями (текстом геометрической задачи). Это реализуется с помощью процедур дополнения. Рассмотрим некоторые из этих процедур на следующем примере. Пусть задан текст геометрической задачи:

Площадь треугольника, один из углов которого равен разности двух других, равна площади квадрата, сторона которого совпадает с одной из сторон этого треугольника. Найти углы данного треугольника.

В описании понятия Треугольник никакой информации о «разности двух углов» и о «равенстве этой разности третьему углу» быть не может. А ситуация, описывающая данный текст должна ее включать. В этом случае подключаются процедуры дополнения, которые на основе присутствия знания в онтологии о понятии Разность (x, y) и о связи равно модифицируют описание ситуации введением соответствующих узлов и дуг, как это представлено на рис. 3. Данный рисунок иллюстрирует процедуры дополнения для понятий Треугольник и Квадрат и процедуры частичного означивания. Выделенные узлы и жирные связи отображают те объекты, которые представлены в тексте задачи. Знак вопроса при значениях понятий Угол определяет то, что эти значения необходимо найти в процессе решения геометрической задачи.

Рис. 3. Частично означенная структура ситуации Треугольник и Квадрат для геометрической задачи

предметный онтология задача

При любом языке представления знаний необходимой процедурой является сопоставление описаний. Это либо сравнение по образцу (pattern matching), либо поиск изоморфизма графов. Последняя процедура, описанная в [6], предполагает сопоставление семантического представления текста геометрической задачи со структурными фрагментами предметной онтологии. Результат такого сопоставления представлен на рис. 3., где понятия углов треугольника, их значений и одной из сторон этого треугольника (выделенные узлы) сопоставлены с фрагментами семантического описания текста задачи.

2. Понимание текстов геометрических задач

Тексты геометрических задач [7] представляют собой набор связных предложений. Они включают простые и сложные предложения, неполные предложения (с анафорами и эллипсисами).

Под пониманием геометрических задач будем подразумевать такое их представление на языке предметной онтологии «Планиметрия», которое будет являться связным, означенным и дополненным описанием ситуации, представленной текстом. Рассмотреть весь процесс анализа текстов геометрических задач в рамках данной работы не представляется возможным. Поэтому проиллюстрируем для пары текстов геометрических задач те структуры ситуаций, которые должны быть получены в результате лингвистического анализа с использованием данной предметной онтологии.

Геометрическая задача:

Найдите площадь треугольника, две стороны которого равны 6 и 8, а медиана, заключенная между ними, равна 5.

На рис. 4. представлена означенная структура ситуации, соответствующая тексту задачи, где l1 = 6, l2 = 8, l4 = 5 являются означенными элементами. Полученное представление является связным (связность выделенных элементов определяется существующими связями в структуре понятия Треугольник и связью им_структуру). Этот результат, конечно, содержит больше информации, чем представлено в тексте. Такая «избыточность», на наш взгляд, является существенным моментов процесса понимания текста при наличии предметной онтологии.

Рис. 4. Означенная структура понятия Треугольник для геометрической задачи

Геометрическая задача:

В равнобедренной трапеции боковая сторона равна 12, а основания 20 и 28. Найдите периметр трапеции.

На рис. 5. представлена означенная структура ситуации, соответствующая тексту задачи, где l = 12, l2 = 20, l3 = 28 являются означенными элементами. Здесь выделенные элементы определяют те данные, которые были представлены во входном тексте.

Рис. 5. Означенная структура понятия Равнобочная Трапеция

Заключение

Процесс построения любой онтологии является итеративным, при котором происходит ее модификация и расширение. В качестве одного из возможных направлений расширения предметной онтологии «Планиметрия» может быть введение в данную онтологию понятий, планиметрические фигуры которых изображены на рис. 6.

Рис. 6. Различные виды плоских фигур

Каждая из этих фигур имеет общепринятое название и может быть представлена в качестве отдельного понятия онтологии.

Важным вопросом создания и поддержания онтологии является процесс ее тестирования. Для онтологии «Планиметрия» в качестве средств тестирования возможны следующие:

- построение текстов на базе онтологических представлений, например с помощью системы генерации текстов по структурным описаниям [8];

- синтез по структурным описаниям понятий конкретных изображений планиметрических фигур с помощью системы концептуальной графики;

- собственно решение геометрических задач с помощью какого-либо решателя типа Problem Solver.

Литература

1. Гаврилова Т.А. Формирование прикладных онтологий // Труды ХХ национальной конференции по Искусственному Интеллекту с международным участием - КИИ-2006, т. 2 - М.: Физматлит, 2006.

2. Гладун А.Я., Рогушина Ю.В.. Онтологии в корпоративных системах. // Корпоративные системы, №1, 2006.

3. Рассел Стюарт, Норвиг Питер. Искусственный интеллект: современный подход, 2-е изд.: Пер. с англ. - М.: Издательский дом «Вильямс», 2006. 1408 с.

4. Добров Б.В., Лукашевич Н.В. Онтологии для автоматической обработки текстов: описание понятий и лексических значений. // Компьютерная лингвистика и интеллектуальные технологии: Труды Международной конференции "Диалог 2006" / Под ред. Н.И. Лауфер, А.С. Нариньяни, В.П. Селегея. - М.: Изд-во РГГУ, 2006.

5. Сидорова Е.А., Загорулько Ю.А., Кононенко И.С. Семантический подход к анализу документов на основе онтологии предметной области // Компьютерная лингвистика и интеллектуальные технологии: Труды Международной конференции "Диалог 2006" / Под ред. Н.И. Лауфер, А.С. Нариньяни, В.П. Селегея. - М.: Изд-во РГГУ, 2006.

6. Хахалин Г.К. Использование гиперграфов в лингвистической трансляции // Труды Международного семинара "Диалог'99" по компьютерной лингвистике и ее приложениям. М., 1999. Т. 2. С. 315-320.

7. Шарыгин И. Ф. Задачи по геометрии. Планиметрия. - М.: Наука, 1982 -- 160 с.

8. Болдасов М.В., Соколова Е.Г. Генерация текстов на естественном языке - теории, методы, технологии // НТИ, Серия 2, N7, 2006, с.1-15.

Размещено на Allbest.ru

...

Подобные документы

  • Геометрия как раздел математики, изучающий пространственные структуры, отношения и их обобщения. Планиметрия, стереометрия, проективная геометрия. История развития науки. Исследование свойств плоских фигур. Сущность понятий "полупрямая", "треугольник".

    презентация [1,1 M], добавлен 16.10.2014

  • Нечёткие системы логического вывода. Исследование основных понятий теории нечетких множеств. Операции над нечёткими множествами. Нечёткие соответствия и отношения. Описания особенностей логических операций: конъюнкции, дизъюнкции, отрицания и импликации.

    презентация [191,0 K], добавлен 29.10.2013

  • Физическое и математическое определение центра масс. Основные свойства центров масс. Изучение закона Харди-Вайнберга. Решение геометрических задач барицентрическим методом. Применение барицентрических координат в химических и топологических задачах.

    курсовая работа [903,5 K], добавлен 25.02.2015

  • Методика нахождения различных решений геометрических задач на построение. Выбор и применение методов геометрических преобразований: параллельного переноса, симметрии, поворота (вращения), подобия, инверсии в зависимости от формы и свойств базовой фигуры.

    курсовая работа [6,4 M], добавлен 13.08.2011

  • Понятия целой и дробной частей действительного числа. Основные свойства функции и ее график. Применение свойств функции y = [x] при решении уравнений и геометрических задач. Описание реальных процессов непрерывными функциями. Решение задач на делимость.

    курсовая работа [487,7 K], добавлен 29.05.2016

  • Разработка простого метода для решения сложных задач вычислительной и прикладной математики. Построение гибкого сеточного аппарата для решения практических задач. Квазирешетки в прикладных задачах течения жидкости, а также применение полиномов Бернштейна.

    дипломная работа [1,9 M], добавлен 25.06.2011

  • Возникновение науки исследования операций и особенности применения операционных методов. Отделение формы задачи от ее содержания с помощью процесса абстракции. Классы задач. Некоторые математические методы, используемые для получения решений на моделях.

    реферат [17,7 K], добавлен 27.06.2011

  • Рассмотрение видов арифметических задач, используемых в работе с дошкольниками. Этапы обучения решению арифметических задач. Изучение структуры, модели записи математического действия. Алгоритм решения задач. Роль данных занятий в общем развитии ребенка.

    презентация [379,7 K], добавлен 19.06.2015

  • Понятие о геометрическом преобразовании. Роль движений в геометрии. Применение аффинных преобразований при решении задач. Свойства аффинного преобразования. Транзитивность, рефлексивность и симметричность. Свойство перспективно-аффинного соответствия.

    курсовая работа [547,9 K], добавлен 08.05.2011

  • Исследование понятия симметрии, соразмерности, пропорциональности и одинаковости в расположении частей. Характеристика симметрических свойств геометрических фигур. Описания роли симметрии в архитектуре, природе и технике, в решении логических задач.

    презентация [1001,7 K], добавлен 06.12.2011

  • Изучение проявлений геометрических законов в живой природе и использования их в образовательной практической деятельности. Описание геометрических законов и сущность геометрических построений. Графическое образование и его место в современном мире.

    дипломная работа [2,3 M], добавлен 24.06.2010

  • Анализ основных понятий, утверждений, связанных с показательной и логарифмической функциями в курсе математики. Изучение методик решения типовых задач. Подбор и систематизация задач на нахождение и использование показательной и логарифмической функций.

    курсовая работа [1,5 M], добавлен 20.07.2015

  • Четыре основные задачи, решаемые методами преобразования. Сущность способа замены плоскостей проекций. Решение ряда задач по преобразованию прямой общего положения в прямую уровня, а затем - в проецирующую, выполнив последовательно два преобразования.

    реферат [185,5 K], добавлен 17.10.2010

  • Краткое историческое описание становления теории множеств. Теоремы теории множеств и их применение к выявлению структуры различных числовых множеств. Определение основных понятий, таких как мощность, счетные, замкнутые множества, континуальное множество.

    дипломная работа [440,3 K], добавлен 30.03.2011

  • Порядок доказательства истинности заключения методом резолюции (с построением графа вывода пустой резольвенты) и методом дедуктивного вывода (с построением графа дедуктивного вывода). Выполнение бинарных операций и составление результирующих таблиц.

    курсовая работа [185,3 K], добавлен 24.05.2015

  • Формулы вычисления дисперсии суммы двух случайных величин с использованием категории математического ожидания. Характеристика понятий дисперсии. Особенности ее вычисления во взаимосвязи со средним квадратичным отклонением, определение размерности.

    презентация [80,4 K], добавлен 01.11.2013

  • Характеристика тригонометрических понятий. Свойства тригонометрических функций, особенности их практического применения в электротехнике. Исследование электрических сигналов путем визуального наблюдения графика сигнала на экране с помощью осциллографа.

    презентация [287,9 K], добавлен 28.05.2016

  • Теория групп как фундаментальное понятие и один из разделов современной математики. Основные определения и теоремы. Смежные классы: правые и левые, двойные. Нормальные подгруппы, фактор-группы. Способы их использования в решении различных задач.

    курсовая работа [136,6 K], добавлен 30.03.2010

  • Основные условия симметричности фигуры. Примеры геометрических фигур, обладающих центральной симметрией. Центральная симметрия плодов растений и некоторых цветов, живых существ. Центральная симметрия в транспорте. Анализ аксиом стереометрии и планиметрии.

    презентация [207,7 K], добавлен 30.10.2013

  • Понятие и математическая сущность квадратного корня, его назначение и методика вычисления. Теоремы, отображающие свойства квадратного коря, их обоснование и доказательство. Применение характеристик квадратных корней в решении геометрических задач.

    реферат [132,1 K], добавлен 05.01.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.