Главная Коллекция "Revolution" Программирование, компьютеры и кибернетика Разработка представления семантики ценностно-ориентированных текстов в базе знаний (на материале русских пословиц)

Разработка представления семантики ценностно-ориентированных текстов в базе знаний (на материале русских пословиц)

Разработка и обоснование общей структуры базы знаний для представления семантики ценностно-ориентированных текстов. Формулировка правил построения формального описания по тексту на естественном языке. Описание алгоритмов поиска по ключевым словам.

Рубрика	Программирование, компьютеры и кибернетика
Вид	автореферат
Язык	русский
Дата добавления	27.09.2018
Размер файла	379,7 K

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Р В Р’В Р вЂ™Р’В Р В РІР‚в„ўР вЂ™Р’В¤Р В Р’В Р вЂ™Р’В Р В РІР‚в„ўР вЂ™Р’В°Р В Р’В Р вЂ™Р’В Р В Р вЂ Р Р†Р вЂљРЎвЂєР Р†Р вЂљРІР‚СљР В Р’В Р вЂ™Р’В Р В РІР‚в„ўР вЂ™Р’В» Р В Р’В Р вЂ™Р’В Р В Р’В Р Р†Р вЂљР’В¦Р В Р’В Р вЂ™Р’В Р В РІР‚в„ўР вЂ™Р’Вµ Р В Р’В Р вЂ™Р’В Р В Р’В Р Р†Р вЂљР’В Р В Р’В Р В Р вЂ№Р В Р вЂ Р В РІР‚С™Р Р†РІР‚С›РІР‚вЂњР В Р’В Р вЂ™Р’В Р В РІР‚в„ўР вЂ™Р’В±Р В Р’В Р В Р вЂ№Р В Р’В Р Р†Р вЂљРЎв„ўР В Р’В Р вЂ™Р’В Р В РІР‚в„ўР вЂ™Р’В°Р В Р’В Р вЂ™Р’В Р В Р’В Р Р†Р вЂљР’В¦

Р В Р’В Р вЂ™Р’В Р В Р Р‹Р Р†Р вЂљРЎвЂќР В Р’В Р вЂ™Р’В Р В РІР‚в„ўР вЂ™Р’В±Р В Р’В Р вЂ™Р’В Р В РІР‚в„ўР вЂ™Р’В·Р В Р’В Р вЂ™Р’В Р В Р Р‹Р Р†Р вЂљРЎС›Р В Р’В Р В Р вЂ№Р В Р’В Р Р†Р вЂљРЎв„ў

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

На правах рукописи

Специальность 05.13.17 - «Теоретические основы информатики»

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Разработка представления семантики ценностно-ориентированных текстов в базе знаний (на материале русских пословиц)

Малкова Анастасия Сергеевна

Москва 2011

Работа выполнена в Институте лингвистики федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Российский государственный гуманитарный университет».

Научный руководитель: доктор физико-математических наук, доцент О.М. Аншаков

Официальные оппоненты: доктор технических наук, профессор О.П. Кузнецов кандидат физико-математических наук, старший научный сотрудник Д.В. Виноградов

Ведущая организация: Институт системного анализа Российской академии наук

Защита состоится 14 ноября 2011 г. в 16 часов на заседании диссертационного совета Д.212.198.13 при Российском государственном гуманитарном университете по адресу: г. Москва, Миусская пл., д. 6, ауд. 206.

С диссертацией можно ознакомиться в библиотеке Российского государственного гуманитарного университета.

Автореферат разослан 7 октября 2011 г.

Ученый секретарь диссертационного совета кандидат технических наук Д.Б. Халяпин

1. ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность

Представление знаний в настоящее время является одним из центральных направлений развития информационных технологий. Основная цель направления - разработка методических оснований и прикладных средств, позволяющих использовать вычислительные машины для решения интеллектуальных задач, требующих глубоких знаний о предметной области, таких как принятие экспертных решений, интеллектуальный поиск, извлечение актуальных знаний из больших объемов необработанных данных.

Ядром интеллектуальных систем, основанных на знаниях, является формализованная модель реальности - структурное описание, в котором основные закономерности строения и функционирования элементов предметной области описаны в терминах формальных объектов и отношений. Строгое формальное описание позволяет формулировать алгоритмы для манипулирования знаниями: вывода новых знаний на основе имеющихся, выдачи ответов по запросам, сканирования на предмет наличия противоречий и т.п.

Системы, основанные на знаниях, в настоящее время разрабатываются в таких областях, как медицина В области медицины созданы большие стандартные, структурированные словари, например, такие как snomeD и семантическая сеть Системы Унифицированного Медицинского Языка (the Unified Medical Language System)., экономика, анализ новостных лент. Представление знаний является одним из перспективных направлений развития сети Интернет (проект Semantic Web).

Анализ семантики ценностно-ориентированных текстов (ЦОТ) - это одна из областей, где методы представления знаний до сих пор не использовались. Термин ценностно-ориентированные применяется в настоящей работе для обозначения текстов, описывающих явления, лежащие в области этики и морали. Это пословицы, басни, притчи, афоризмы. Семантическую основу ЦОТ составляет проблемная ситуация или комплекс проблемных ситуаций: реализация морального выбора, разрешение социального конфликта, предписание поведенческого сценария, этическая оценка людей и событий.

Актуальность создания семантических моделей для ЦОТ обусловлена тем, что ЦОТ являются важным компонентом языка, как самостоятельно, так и входя в состав других, более крупных текстов, где они часто занимают акцентные позиции: заголовки, эпиграфы, резюме (мораль) и т.п. Адекватная формальная модель семантики ЦОТ позволит автоматизировать целый ряд процедур интеллектуальной обработки ЦОТ, таких как семантический поиск, машинный перевод, культурологический анализ статистическими методами и другие.

Отсутствие практики применения методов представления знаний для анализа семантики ЦОТ связано с объективной сложностью выделения формальных объектов в данной предметной области. При разработке семантической модели в настоящей работе были использованы и адаптированы методы, сформировавшиеся в дисциплинах, для которых ЦОТ является традиционным объектом исследования: филологии, отчасти психологии, когнитивной лингвистики. В том числе был рассмотрен ряд структурных семантических моделей пословицы (Г.Л. Пермяков Пермяков Г.Л. Пословицы и поговорки народов Востока: Систематизированное собрание изречений двухсот народов. -- М.: Лабиринт, 2001, В.С. Баевский Баевский В.С. Лингвистические, математические, семиотические и компьютерные модели в истории и теории литературы. М.: Языки славянской культуры, 2001., А.К. Жолковский Жолковский А.К. К описанию выразительной структуры паремий. // Паремиологический сборник. Пословица. Загадка. п/р Г.Л.Пермякова. -- М.: "Наука", 1978, М. Черкасский, Т.С. Зевахина Зевахина Т.С. Метафора мертвая и метафора живая: экспериментальный подход к паремиологии дунганского и китайского языков // Компьютерная лингвистика и интеллектуальные технологии / Труды Международного семинара Диалог'2002. - М.: Наука, 2002б. - Т. 1. - С. 154-162, А. Дандес Дандес А. О структуре пословицы. // Паремиологический сборник. Пословица. Загадка. п/р Г.Л.Пермякова. -- М.: "Наука", 1978., Н.Барли Барли Н. Структурный подход к пословице и максиме. // Паремиологические исследования. п/р Г.Л.Пермякова. -- М.: "Наука", 1984. и другие), максимы (Ю.С. Мартемьянов, Г.В. Дорофеев Мартемьянов Ю.С. Дорофеев Г.В., Опыт терминологии общелитературной лексики (о мире тщеславия по Ф. де Ларошфуко) // Вопросы кибернетики. Логика рассуждений и ее моделирование. -- М.: 1983), исследованы основные положения концептуальной теории метафоры Дж. Лакоффа и Т. Джонсона Лакофф Дж, Джонсон М. Метафоры, которыми мы живем. -- М.: Едиториал УРСС, 2004. и фундаментальных трудов по теории мифа (К. Леви-Стросс Леви-Строс К. Структурная антропология / Пер. с фр. Вяч. Вс. Иванова. -- М.: ЭКСМО-Пресс, 2001., О.М. Фрейденберг Фрейденберг О.М. Поэтика сюжета и жанра / Ред. и коммент. Н.В.Брагинской. -- М.:Лабиринт, 1997., Е.М. Мелетинский Мелетинский Е.М. Поэтика мифа. -- М.: Издательская фирма «Восточная литература» РАН, Школа «Языки русской культуры», 1995.).

В работе была осуществлена формализация структурного подхода, развившегося на базе классической филологии и структурной антропологии (О.М. Фрейденберг, К. Леви-Стросс) и когнитивной лингвистики (Дж. Лакофф) для построения формальной семантической модели частного случая ЦОТ - пословицы.

Цели и задачи диссертационной работы

Целью диссертационной работы является построение базы знаний (описание объектов, отношений и ограничений на значения, а также аналитического аппарата) для формализованного представления семантики ценностно-ориентированных текстов (пословиц) и ее программная реализация в информационной системе «МЕТАФОРА - тезаурус русских пословиц».

Для достижения заявленной цели были поставлены и решены следующие задачи.

1. Анализ научно-методических основ формального представления семантики ЦОТ:

a. обзор и анализ методов представления знаний в направлении Искусственный интеллект.

b. анализ существующих подходов к описанию семантики ЦОТ в дисциплинах, для которых ЦОТ является традиционным объектом исследования (структурной фольклористике, лингвистической семантике, когнитивной лингвистике);

2. Разработка методологического подхода к формальному представлению семантики пословицы:

a. разработка и обоснование общей структуры базы знаний для представления семантики ЦОТ;

b. разработка формальной модели семантики пословицы, в том числе составление словарей элементов модели, формулировка правил построения формального описания по тексту на естественном языке.

3. Разработка методики интеллектуального анализа семантики пословиц с помощью базы знаний, включая:

a. формальное описание критериев семантического сходства текстов;

b. описание алгоритмов поиска по ключевым словам.

4. Разработка концепции, схемы данных информационно-справочного Интернет-ресурса «МЕТАФОРА - тезаурус русских пословиц», реализующего формальную модель пословицы (включая аппарат интеллектуального анализа семантики пословиц).

Методы исследования

В диссертационной работе используются методы, характерные для трех дисциплин: представления знаний (направление Искусственный интеллект), концептуального моделирования (когнитивная лингвистика) и структурной нарратологии (фольклористика, филология).

Объект и предмет исследования

Объектом исследования являются русские пословицы. В качестве экспериментальной выборки использован словарь современных русских пословиц под ред. В.М. Мокиенко Словарь русских пословиц / В.М. Мокиенко, Ю.А. Ермолаева, А.А. Зайнульдинов и др.; под ред. В.М. Мокиенко. -- М.: Астрель: АСТ, 2007., содержащий 505 единиц. Выбор обусловлен тем, что словарь снабжен обширным справочным аппаратом, включающим толкования, культурологическую справку, примеры употреблений в художественной литературе, а также тем фактом, что при относительно сжатом объеме словарь охватывает большое тематическое многообразие пословиц. Также в экспериментальную выборку вошли 100 случайно отобранных английских пословиц.

Предметом исследования является семантика пословицы.

Результаты, выносимые на защиту

Получены лично автором и выносятся на защиту следующие научные результаты:

1. Методологический подход к проектированию базы знаний для представления семантики ЦОТ:

a. общая структура базы знаний для данной предметной области
(принципы выделения формальных объектов и отношений);

b. формальная модель семантики частного случая ЦОТ - пословицы.

2. Методика интеллектуального анализа семантики пословицы с помощью базы знаний, включающая:

a. формальные критерии семантического сходства пословичных высказываний;

b. язык поисковых запросов (поиск по ключевым словам).

3. Концепция, структура данных, аппарат интеллектуального анализа информационно-справочного Интернет-ресурса «МЕТАФОРА».

Научная новизна

Научная новизна результатов диссертационной работы заключается в следующем.

1. Разработан новый подход к представлению знаний в ЦОТ, объединяющий методы структурной фольклористики, когнитивной лингвистики и Искусственного интеллекта.

2. Построена новая формальная модель пословицы, позволяющая формально описывать критерии семантического сходства высказываний и осуществлять поиск по запросам.

3. Создана информационная система, включающая уникальный интеллектуальный поисковый аппарат.

Теоретическая значимость и практическая ценность

Теоретическая значимость работы заключается в разработке методологического подхода к представлению семантики ЦОТ в базе знаний, отражающего характерные особенности предметной области и, как следствие, позволяющего эффективно решать специфические задачи интеллектуального поиска и анализа.

Практическая ценность работы заключается разработке средств семантического анализа пословичных высказываний, которые могут быть использованы в электронных словарях и тезаурусах ЦОТ, системах поддержки перевода, поисковых машинах, в программном обеспечении филологических, этнографических (в т.ч. кросскультурных) исследований, а также для решения других задач интеллектуального семантического анализа ЦОТ.

Апробация полученных результатов

Результаты диссертационной работы докладывались и обсуждались на конференциях: XL Международной филологической конференции СПбГУ (2011), КИИ-2010, «История и математика-2007», «Рефлексивные процессы и управление-2007»; на семинарах ИСА (2010, 2009), ВИНИТИ (2009), «Искусственный интеллект» в Политехническом музее (2009), «Искусственный интеллект» ВМиК МГУ (2008), «Фольклор и постфольклор» Центра Типологии и Семиотики Фольклора РГГУ (2007, 2010).

Публикации

Научные результаты были опубликованы в журналах, рекомендованных ВАК: «Научно-техническая информация» Сер.2 «Информационные процессы и системы», «Моделирование и анализ информационных систем» (ЯрГУ), Вестник РГГУ серия «Информатика, защита информации, математика» (в печати); в сборниках трудов: Двенадцатой национальной конференции по искусственному интеллекту КИИ-2010, конференции «Математическая история-2008», конференции «Курдюмовские чтения-2007» а также в тезисах трех конференций. Список публикаций приведен в конце автореферата.

Структура и объем работы

Диссертация состоит из введения, четырех глав, заключения, библиографического списка и двух приложений. Объем основного текста работы - 154 страницы. В тексте содержатся 47 рисунков и диаграмм, 20 таблиц, список литературы включает 111 наименований.

2. СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность выбранной темы; формулируются цель и задачи исследования, показана научная новизна, теоретическая значимость и прикладная ценность результатов. Кратко излагается содержание диссертации по главам.

Первая глава посвящена анализу научно-методических основ и формированию структуры диссертационного исследования.

Раздел 1.1 посвящен описанию современного состояния исследований в области формального представления знаний в искусственном интеллекте: приводятся основные определения, области применения, принципы функционирования каждого из методов.

В разделе 1.2 дается характеристика объекта исследования, рассматриваются существующие подходы к представлению семантики ЦОТ, сформировавшиеся в рамках специальных дисциплин: структурной фольклористики, лингвистической семантики, когнитивной лингвистики.

В разделе 1.3 вводятся понятия базы знаний и модели знаний: существующие определения, способы представления, области применения. Обсуждается роль модели знаний для решения задач структуризации данных, семантического поиска, вывода новых знаний. Показывается целесообразность применения данного формального аппарата для представления семантики ЦОТ.

В заключительном разделе формулируется цель работы: создание базы знаний для представления семантики ЦОТ (на примере частного случая ЦОТ - пословицы), излагаются основные задачи и структурно-логическая схема исследования.

Вторая глава посвящена решению второй задачи диссертационного исследования: разработке формальной модели семантики пословицы (как частного случая ЦОТ) и решению ряда сопутствующих задач: построения модели реальности для пословичного текста, формирования словаря базовых элементов модели, описания правил построения формальных описаний по текстам на ЕЯ.

Согласно правилам проектирования баз знаний, основанных на онтологической модели представления знаний, которые были сформулированы в работе Н. Ной и Д. МакГинесс, структура базы знаний зависит от многих факторов: устройства предметной области, требуемого уровня абстракции, широты охвата материала, комплекса практических задач, которые предполагается решать с помощью БЗ, намеченной степени формализации. Таким образом, постановка задачи и описание требований к базе знаний являются важным этапом, определяющим ее структуру и конечный вид.

В разделе 2.1 детально рассматривается объект исследования (пословица), исследуется ее семантическая организация.

Пословица была избрана в качестве объекта исследования, поскольку из всех ЦОТ малых жанров (басни, притчи, афоризмы) она является наиболее компактной, стабильной, универсальной. Под стабильностью понимается тенденция к дублированию одной и той же (или близкой) семантики в целых кластерах квазисинонимичных текстов, прослеживаемая не только в рамках одного фонда, но и на многонациональном материале. Под универсальностью - минимизация авторского, индивидуального начала, которая отличает фольклорные произведения от авторских. Несмотря на возможное появление у пословицы в различных ситуационных контекстах окказиональных значений, существует одна (в редких случаях две-три) базовая интерпретация, зафиксированная в толковом словаре.

Пословица хорошо изучена и описана в филологии. Это позволяет задействовать в диссертационном исследовании обширный справочно-методический материал, наработанный данной специальной дисциплиной: толковые словари, системы классификации пословиц, существующий опыт формализации.

Все перечисленные факторы позволяют говорить о принципиальной возможности создания адекватной формальной семантической модели пословицы.

В п. 2.1.2 формулируются практические задачи, которые возможно будет решить на выбранном корпусе текстов с помощью базы знаний. Их постановка также оказывает влияние на структуру базы знаний. К ним относятся следующие задачи интеллектуальной обработки корпусов ЦОТ:

1. Семантический поиск текстов, находящихся между собой в различных семантических отношениях: сходства, противоположности, частичного сходства, противоречивости. Для пословиц эта задача наиболее актуальна в контексте создания электронных мультиязычных словарей.

2. Семантический поиск по ключевым словам (например: пословицы о труде, о дружбе, о беспечности, о смирении с судьбой и т.п.). При этом ключевые слова интерпретируются не как теги, а как семантические конструкты, которые соотносятся со структурой проблемной ситуации, отраженной в пословицах.

Указанные задачи могут быть решены (т.е. разработаны формальные процедуры анализа), если в результате выделения объектов семантика отдельного текста пословицы (также как структура поискового запроса) будет представима в виде набора однозначно интерпретируемых семантических единиц. Тогда сходство двух пословичных высказываний может быть интерпретировано как полное или частичное совпадение наборов их составляющих, а соответствие поисковым запросам будет понято как вхождение элементов запроса в состав высказывания.

При этом большое значение имеет однозначность семантических описаний. Если один и тот же смысл может быть выражен несколькими различными способами, то это приведет к резкому усложнению алгоритмов семантического анализа. Таким образом, семантическое сходство двух высказываний должно необходимо влечь за собой совпадения в их формальной структуре, и при этом ни один из базовых элементов модели не может быть выражен через комбинацию других.

Обобщая, можно сказать, что критерием успешности модели является формирование системы классов подобия, сохраняющей семантические отношения (частичного сходства, противоположности и др.) на множестве пословичных текстов.

Рисунок 1. Формирование классов подобия в процессе моделирования.

Итак, словарь модели формирует очень компактный набор элементов, описанных на высоком уровне абстракции. Малое количество элементов упрощает описание аксиоматики, классификацию объектов, хотя и снижает точность семантических описаний отдельных высказываний.

Необходимо отметить, что экспериментальная выборка текстов специально была подобрана таким образом, чтобы в ней были представлены не одна или несколько тематических групп, а все многообразие пословичных текстов. Это необходимо для того, чтобы модель и алгоритмы поиска на ней обладали свойствами универсальности.

В последнем пункте раздела (п. 2.1.3) осуществлен детальный анализ объекта исследования (пословицы) с целью выявления его семантической структуры: определения сущности базовых элементов модели и природы связывающих их отношений.

В пункте показано, что лингвистические методы анализа недостаточны для адекватного представления семантики ЦОТ, поэтому теоретической базой для исследования послужили труды филологов и антропологов, в частности работы представителей французского и отечественного структурализма (К.Леви-Стросс, О.М.Фрейденберг). Согласно их выводам, со структурной точки зрения фольклорные произведения представляет собой последовательность элементарных микросюжетов. Их строение подчинено двум базовым ментальным механизмам: мифологическому отождествлению (уподоблению) и оппозиционному противопоставлению. В разделе рассмотрена суть этих механизмов.

В основе системы категорий первобытной логики, реконструированной французским антропологом К.Леви-Строссом Леви-Строс К. Первобытное мышление. -- М.: ТЕРРА -- Книжный клуб; Республика, 1999, лежит принцип бинарных оппозиций - пар противопоставленных понятий, из которых одно, как правило, имеет позитивную оценку, а другое - негативную, таких как: холодное - теплое, низкое - высокое, сырое - вареное, темное - светлое, женское - мужское, мертвое - живое и другие. При этом тепло, свет, жизнь, верх, правда, сакральное наделяются позитивной оценкой, а холод, тьма, смерть, низ, ложь, профанное - негативной.

Не только сюжетные линии в фольклоре, но и системы верований и обрядов имеют в своей основе подобные оппозиционные противопоставления. В настоящее время аппарат бинарных оппозиций представляет собой широко распространенный и активно используемый рабочий инструмент этнографических и фольклористических исследований.

С другой стороны, профессор кафедры классических языков ЛГУ О.М. Фрейденберг, исследуя логику развития сюжетных линий в мифологии античности, пришла к выводу, что она формируется под критическим влиянием ментального феномена, который можно назвать «мифологическим отождествлением». Это бессознательное ощущение глубинной взаимосвязи между двумя явлениями вплоть до полного стирания границ между ними. Исследовательница пишет: «Система первобытной образности - это система восприятия мира в форме равенств и повторений» Фрейденберг О.М. Поэтика сюжета и жанра / Ред. и коммент. Н.В.Брагинской. -- М.:Лабиринт, 1997. О.М. Фрейденберг указывает основные направления отождествления: равенства целого и части, мнимого и реального, прошлого, настоящего и будущего, актера и роли, акции и реакции, постоянного и временного, лидера и возглавляемого им коллектива и другие.

В повествовании отождествление может принимать характер причинно-следственной, экзистенциальной связи, имплицитного логического перехода. О.М. Фрейденберг показывает, как мифологическое отождествление участвует в формировании повествовательных сюжетов: сбываются пророчества (отождествление мнимого и реального); злодеев настигает возмездие (акция и реакция); события далекого прошлого определяют судьбы героев (прошлое и будущее); кукла, перышко, перстень, платочек воплощают в себе силы их обладателя (объект и атрибут); дети чудесных родителей (зверей, стихий и богов) наделяются сверхъестественной силой (порождающее и порожденное); внешние преображения (костюм, татуировка) изменяют характер героев.

Практически любое базовое отождествление может быть преобразовано в утверждение, по структуре близкое к пословичному:

Какое целое, такая и часть.

Какой лидер, такие и подчиненные.

Каким [некто] был, таким и останется.

Какое начало [дела], таков и конец. и др.

Утверждения, построенные на мифологических отождествлениях, представителям архаической культуры представляются очевидными, хотя природа этой причинно-следственной связи сугубо ментальная, основанная на вере в гораздо большей степени, чем на реальном опыте.

Полученные выводы о ключевой значимости двух ментальных механизмов (оппозиционного противопоставления и отождествления) подтверждает также и один из основателей когнитивной лингвистики Дж. Лакофф Лакофф Дж, Джонсон М. Метафоры, которыми мы живем. -- М.: Едиториал УРСС, 2004. В своей классической работе «Метафоры, которыми мы живем» Дж. Лакофф показывает несостоятельность подхода к метафоре, как к тропу, имеющему периферийную значимость в языке, и предлагает рассматривать ее как один из фундаментальных когнитивных механизмов. Он определяет два основных вида метафор: структурные и ориентационные.

Структурные метафоры «осмысляют понятия одного рода в терминах понятий другого рода». Так в английском языке (также как и в русском), СПОР осмысляется как БИТВА, что служит источником бесконечного многообразия фразеологических оборотов вида: одержать победу в споре, держать удар, отбиваться от нападок, укрепить свои позиции и др. Язык пронизан огромным количеством подобных метафорических уподоблений: ИНФЛЯЦИЯ как ПРОТИВНИК, ВРЕМЯ как ДЕНЬГИ, ЛЮБОВЬ как ПУТЕШЕСТВИЕ и т.п.

Ориентационные метафоры восходят к противопоставлению ВЕРХ-НИЗ (НИЗ при этом оценивается отрицательно, а ВЕРХ - положительно). Они лежит в основе таких фразеологизмов как низкие помыслы, низкие вкусы, низкий поступок, низы общества. След противопоставления ВЕРХ-НИЗ прослеживается в широком круге метафорических пар: РАДОСТЬ-ГРУСТЬ (Он пребывал в приподнятом настроении. - Он был подавлен.), ЗДОРОВЬЕ-БОЛЕЗНЬ (Он выкарабкался из болезни. - Его подкосило.), БОГАТСТВО-БЕДНОСТЬ, ДОБРОДЕТЕЛЬ-ПОРОК, ВЛАСТЬ-ПОДЧИНЕНИЕ и многие другие.

Тот факт, что выводы, полученные исследователями, работающими в различных, хотя и смежных, дисциплинах, независимо и на разном материале, имеют столь глубокие параллели, подтверждает состоятельность опоры на механизмы отождествления и оппозиционного противопоставления при моделировании семантики ЦОТ.

Таким образом, подводя итог раздела 2.1, можно сказать, что пословица в исследовании интерпретируется как особая информационная единица, содержащая специфические (ценностно-ориентированные) знания о мире. Ее семантика соотносится со структурой проблемной этической ситуации, регулярно воспроизводящейся в кластерах синонимичных текстов. И существуют закономерности в построении ценностных суждений, которые могут быть описаны относительно формально, - это механизмы оппозиционного противопоставления и отождествления (уподобления).

В разделе 2.2. на материале конкретных текстов показано, как, рассматривая отождествление и оппозиционное противопоставление в качестве основных структурообразующих механизмов ЦОТ, можно сконструировать модель реальности для пословичного высказывания и создать базу знаний.

Формальная модель допускает запись в синтаксисе различных языков программирования и инженерии знаний. Для описания онтологий рекомендован язык OWL, являющийся расширением RDF. В настоящей работе для описания формальной модели был избран язык теории множеств. Одновременно с этим был разработан графический язык диаграмм, призванный облегчить визуальное восприятие модели. Между графическими диаграммами и записями и логическими выражениями существует взаимнооднозначное соответствие.

Множеством ценностных оппозиций (или просто оппозиций) будем называть множество упорядоченных пар O P N, где

(i) P, N - непустые конечные множества,

(ii) P N = ,

(iii) O есть график биективного отображения P на N.

Интуитивный смысл оппозиции - это пара понятий, характеризующих человека или некоторые внешние обстоятельства с двух сторон - позитивно и негативно, например: добродетель-порок, успех-неудача.

Оппозиции можно разбить на два класса с помощью сюръективного отображения: class: O M, где M = {man, univ}

Mman = {o | class(o) = man} - оппозиции, характеризующие поступки, черты характера человека. Mman = {добродетель, порок, знания, глупость, труд, безделье, помощь, вред, воля, покорность}.

Muniv = {o | class(o) = univ} -- оппозиции, характеризующие обстоятельства, которые, однако, могут являться результатом целенаправленной деятельности человека. Muniv = {успех, неудача, доход, убыток, удовольствие, страдание, покой, работа, статус, презрение, одиночество, дружба}.

Для любой пары o = p, n O положим P(o) = p, N(o) = n.

P(o) будем называть позитивной частью оппозиции o.

N(o) будем называть негативной частью оппозиции o.

В графической записи оппозиции описываются двумя расположенными одна над другой окружностями. Верхняя окружность соответствует позитивному элементу оппозиции, а нижняя - негативному.

Рисунок 2 Графическое представление оппозиции.

Множеством структурно-функциональных пар (или уподоблений) будем называть множество упорядоченных пар R , где

(i) , - непустые конечные множества,

(ii) = ,

(iii) R есть график биективного отображения на .

Интуитивный смысл уподобления - это пара понятий, восходящих к одному из мифологических уподоблений (см. параграф 1.3). В модели уподобление играет роль основания, по которому противопоставляются две оппозиции в рамках отношения.

R = {временно, в итоге, мнимо, реально, материально, духовно, желаемое, доступное, часть, целое, некто, сам, сфера, акция}.

Вторая часть уподобления всегда занимает доминирующую позицию (целое доминирует над частью, содержание - над формой и т.п.)

Для любой пары r = , R положим

(r) = , (r) = .

(r) будем называть доминирующей частью уподобления r.

(r) будем называть подчиненной частью уподобления r.

В графической записи уподобление протянуто в горизонтальной оси: слева находится подчиненная часть, справа - доминирующая.

Рисунок 3 Графическое представление уподобления.

Обозначим T = {человек, мир} - множество типов акторов (действующих лиц) ценностного высказывания, У = {-1, +1} - множество результирующих этических оценок ценностного высказывания (положительная оценка - «одобрение», «оправдание», отрицательная - «осуждение», «констатация несправедливости»). Пусть t1, t2 T, o1, o2 O, r R, у У.

Звеном для t1, t2, o1, o2, r назовем упорядоченную тройку:

L = t1, (r), x1, t2, (r), x2, у,

где x1 {P(o1), N(o1)}, x2 {P(o2), N(o2)}.

Неформальная интерпретация: звено - это отношение между двумя оппозициями, основанное на некотором уподоблении и обладающее результирующей этической оценкой. база знание текст семантика

В графической записи звена две оппозиции изображаются рядом друг с другом, при этом левая оппозиция соотносится с подчиненной частью уподобления, правая - с доминирующей.

Рисунок 4 Графическое представление звена.

Тип актора t1, t2 определяет, к какому из классов Mman, Muniv принадлежат оппозиции o1, o2 соответственно.

Поскольку существует два типа акторов T = {человек, мир}, возможно четыре варианта их сочетания в звене:

1. o1 Mman, o2 Muniv: высказывание описывает влияние поступков, черт характера человека на его судьбу, отношение к нему других людей, например: кто трудится, будет жить в достатке.

2. o1 Muniv, o2 Mman: высказывание описывает влияние внешних обстоятельств на поступки человека, необходимость совершать вынужденные действия, например: что пропало, того уже не вернуть.

3. o1, o2 Mman: высказывание устанавливает приоритеты между чертами характера человека или внутри коллектива, например: главное не внешность, а сущность человека.

4. o1, o2 Muniv: высказывание устанавливает приоритеты между обстоятельствами, например: в больших делах издержки неизбежны.

Таким образом, в высказываниях, где оппозиции принадлежат к разным классам, полученное отношение может быть охарактеризовано как «влияние», где к одному - как «предпочтение».

Положим

+1, x P

val(x) =

-1, x N

Значение val(x) будем называть ±оценкой части оппозиции.

Конфигурацией звена L = t1, (r), x1, t2, (r), x2, у назовем упорядоченную тройку conf(L) = val(x1), val(x2), у.

Интуитивный смысл конфигурации - это регулярное сочетание позитивных/ негативных частей оппозиций, входящих в состав высказывания, с результирующей этической оценкой высказывания.

В модели всего выявлены десять различных видов конфигураций. Они могут быть объединены в пары - у двух конфигураций в паре все три оценки (val(x1), val(x2) и у) противоположны. Графические схемы конфигураций и примеры интерпретаций приведены в таблице 1.

Таблица 1 Графические схемы конфигураций.

Оценки	Граф. схема	Пример интерпретации
val(x1)	val(x2)	у	а)	б)
ТИП «ВЛИЯНИЕ»
+1 -1	+1 -1	+1 +1			а) кто трудится, будет иметь доход б) кто бездельничает, потерпит убыток
+1 -1	-1 +1	-1 -1			а) некто трудился, а терпит убытки б) некто бездельничал, а имеет доход
ТИП «ПРЕДПОЧТЕНИЕ»
-1 +1	+1 -1	+1 -1			а) пусть часть плохая, зато целое хорошее б) хотя часть хорошая, да целое плохое
+1 -1	-1 +1	+1 -1			а) когда целое плохое, хор.часть - уже хорошо б) плохая часть портит хорошее целое
+1 -1	+1 -1	+1 -1			а) целое хорошее и часть хороша б) целое плохое и часть плоха

Используя введенное понятие конфигурации conf(L) = val(x1), val(x2), у, определим сокращенную запись для звена L = t1, (r), x1, t2, (r), x2, у. Звено может быть представлено в виде t1, t2, o1, o2, r, с, где с - конфигурация связи.

Рассмотрим два примера звеньев: их формальную запись, семантическую интерпретацию и графическую схему.

Пример 1. человек, человек, добродетель, порок, добродетель, порок, форма, содержание, +1,-1,-1

Интерпретация: Человек, с виду добродетельный, в действительности может оказаться дурным.

Рисунок 5 Графическая схема звена (пример 1).

Пример 2 человек, мир, труд, безделье, доход, убыток, человек, мир, +1,+1,+1. Интерпретация: Кто трудится, будет жить в достатке.

Рисунок 6 Графическая схема звена (пример 2).

Модель реальности. Полная схема пословицы. (пп. 2.2.1, 2.2.2).

Анализ экспериментальной выборки показал, что пословичные высказывания отражают взаимодействие человека с окружающим миром. В пословицах представлены четыре основных вида утверждений:

1. ЧЕЛОВЕК > МИР: влияние поступков, черт характера человека на его судьбу, отношение к нему других людей.

2. МИР > ЧЕЛОВЕК: влияние внешних обстоятельств на поступки человека; необходимость совершать вынужденные действия.

3. ЧЕЛОВЕК > ЧЕЛОВЕК: установление приоритетов, зависимостей между чертами характера человека или внутри коллектива.

4. МИР > МИР: установление приоритетов, зависимостей между внешними обстоятельствами.

Данные четыре вида утверждений могут быть объединены в полной схеме пословицы. Полная модель семантики пословицы включает три звена и представляет собой упорядоченную тройку

Prov = t11, t12, o11, o12, r1, с1,

t1, t2, o1, o2, r, с,

t21, t22, o21, o22, r2, с2, где

t1 = t11 = t12 = человек, t2 = t21 = t22 = мир, o1 = o12, o2 = o22.

Графическая схема полной модели пословицы включает схемы трех звеньев:

Рисунок 7. Графическая схема полной модели пословицы.

Первое и третье звено характеризуются отношением типа «предпочтение». Они устанавливают приоритеты внутри каждой из сфер МИР и ЧЕЛОВЕК. Второе звено характеризуются отношением типа «влияние». Оно устанавливает причинно-следственную связь между двумя сферами, направленную либо в одну, либо в другую сторону. Все акторы первого звена и первый актор второго звена имеют значение человек, второй актор второго звена и все акторы третьего звена имеют значение мир. В полной модели пословицы отдельные звенья могут оставаться пустыми (незадействованными).

Ниже приведены примеры полных схем трех пословиц, в том числе таких, где задействованы не все звенья.

Пример 3: Мал золотник, да дорог. человек, человек, добродетель, порок, добродетель, порок, форма, содержание, -1, +1, +1, , . Интерпретация: Человек с виду неприметный может оказаться очень достойным.

Рисунок 8 Графическая схема модели пословицы (пример 3).

Пример 4: Кто рано встает, тому Бог дает. , человек, мир, труд, безделье, доход, убыток, человек, мир, +1,+1,+1, . Интерпретация: Кто трудится, будет жить в достатке.

Рисунок 9 Графическая схема модели пословицы (пример 4).

Пример 5: Отольются волку овечкины слезки. , человек, мир,
добродетель, порок, удовольствие, страдание, человек, мир, -1, -1, +1, мир, мир, удовольствие, страдание, акция, реакция, +1, -1, -1. Интерпретация: дурной человек временно может жить припеваючи, но в конце концов он будет наказан.

Рисунок 10 Графическая схема модели пословицы (пример 5)

Представление о модели реальности для пословичного высказывания
позволяет сформулировать правила построения формального описания пословицы по тексту на естественном языке. Они могут быть описаны в виде последовательности шагов, приведенной в п. 2.2.4 диссертационной работы. Данная последовательность имеет полуформальный характер, ее назначение - служить руководством экспертам при работе моделью. Необходимо отметить, что полностью автоматизировать процесс генерации схем в настоящее время не представляется возможным.

1. Оценка высказывания. Определить ±-оценку высказывания (одобрение или осуждение).

2. Центральное отношение. Определить, присутствует ли в пословице причинно-следственная связь ЧЕЛОВЕК > МИР или МИР > ЧЕЛОВЕК; если присутствует, то каково ее направление;

3. Доминирующие отношения.

a. Определить, присутствуют ли в семантике высказывания доминирующие отношения; к какой из двух сфер (МИР или ЧЕЛОВЕК) они относятся. При этом следует ориентироваться на список возможных маркеров отношений, доступный в модели.

b. Определить конфигурации доминирующих отношений (из списка конфигураций). При этом их ±-оценки должны быть согласованы с общей ±-оценкой высказывания.

4. Объекты (оппозиции). Подобрать наиболее близкие по семантике оппозиции из классов МИР и ЧЕЛОВЕК для каждой из частей высказывания.

В третьем разделе второй главы (2.3) перечисляются списки элементов модели, полученные в результате анализа текстов из экспериментальной выборки. Полученные списки являются рабочими, их нельзя считать универсальными (применимыми на любом материале) или оптимальными. Задача формирования оптимальных словарей объектов выходит за рамки диссертационного исследования, ее решение должно осуществляться в сотрудничестве с экспертами-паремиологами.

При формировании списков применялся «экономный» подход, при котором количество элементов модели минимально, и каждый из них охватывает широкое семантическое поле (включающее множество семантически близких понятий). При этом каждому структурному элементу соответствует уникальный компонент смысла, не выразимый через комбинацию других элементов. Таким образом, исключается возможность двоякого представления семантики, что существенно для реализации алгоритмов семантического поиска по семантическим отношениям и по ключевым словам.

В результате словарь был ограничен минимальным набором из 11 оппозиций (5 из класса ЧЕЛОВЕК, 6 из класса МИР), 9 типов доминирующих отношений и 5 видов конфигураций, что позволило описать семантику до 90% высказываний из выборки, сохраняя основные отношения сходства, противоположности, частичного сходства. Полученные рабочие списки были приведены выше при описании формальной модели. Численные показатели результатов верификации модели на экспериментальной выборке: около 70% высказываний представимы хорошо и удовлетворительно, 20% - частично, еще 10% - не могут быть адекватно представлены в модели.

Третья глава посвящена решению третьей задачи диссертационного исследования: в ней показано, как предложенная формальная модель пословичного высказывания может быть использована для описания алгоритмов семантического поиска. Специально для исследования поискового потенциала модели в экспериментальную выборку были включены 100 английских пословиц.

Основной предпосылкой для создания алгоритмов семантического поиска является тот факт, что модель базируется не на лексическом составе высказывания, а на структуре описанной в пословице ситуации. Соответственно, если два высказывания соотносятся со сходными ситуациями, то они будут иметь определенные совпадения в семантике.

Модель позволяет определить следующие семантические отношения, базирующиеся на регулярных совпадениях в формальных описаниях высказываний: подобие, противоположность (контрапозиция/антонимия), частичное сходство.

1. Подобными можно считать высказывания, обладающие идентичной семантической структурой.

2. Противоположными (контрапозитивными либо антонимичными в зависимости от структуры) можно считать высказывания, содержащие одни и те же содержательные элементы (уподобления, оппозиции), но с противоположной ±оценкой конфигурации. Контрапозиция - выражение одной и той же идеи через отрицание (знание приводит к успеху, глупость приводит к неудаче). Антонимия - описание противоположных ситуаций (внешность хорошая, натура плохая и наоборот внешность плохая, натура хорошая).

3. Для определения частичного сходства нет четких критериев. Любое совпадение фрагментов семантической структуры двух высказываний может быть проинтерпретировано как семантическая близость.

Модель задает разбиение пословичных высказываний на кластеры таким образом, что высказывания, принадлежащие к одному кластеру, обладают сходной семантической структурой, соответственно их семантические схемы содержат общие фрагменты. Между разными кластерами также существуют регулярные семантические параллели (общая картина разбиения и пример кластера приведены в разделе 4.5).

Итак, структура модели такова, что многие регулярные совпадения в формальных описаниях двух высказываний могут быть содержательно интерпретированы и на их основе разработаны критерии семантического поиска.

Модель также может быть использована для поиска с помощью поисковых запросов (раздел 3.3). Основу такого запроса составляют ключевые слова. Особенность предлагаемого подхода заключается в том, что ключевые слова интерпретируются не как теги, а как семантические конструкты: каждому ключевому слову сопоставлены одно или несколько (объединенных логическим ИЛИ) фиксированных сочетаний элементов схемы пословичного высказывания.

Так, например, выглядят формальные записи поисковых слов жадность (желаемый доход, но доступный убыток) и учение (временное невежество, но в итоге - знания):

За счет комбинационных возможностей модели возможно определить широкий спектр понятий, не входящих в ее базовый словарь, но выразимых через сочетания его элементов (такие понятия как смелость, терпение, богатство, неблагодарность, неисправимость, правда, сила/власть, основательность, невзгоды, кара, дружба, закон, внешность, беспечность, своеволие, жадность, несвоевременность, промахи, спешка, опытность, одиночество, отчаянность, злонамеренность, похвальба, самопожертвование, учение, трусость, соблазн, недостойный, тайное, судьба, бестолковый, неопытность, скромность и др.)

Рисунок 11 Формальная схема поискового слова жадность.

Рисунок 12 Формальная схема поискового слова учение.

В настоящий момент поисковые слова заносятся в базу данных и выверяются в итеративном процессе анализа пословичных высказываний из корпуса.

Разработанный поисковый аппарат востребован в контексте создания электронных мультиязычных словарей пословиц.

В четвертой главе описывается структура и интерфейсы информационной системы МЕТАФОРА, реализующей семантическую модель пословицы.

Система представляет собой клиент-серверное приложение, располагается в сети Интернет по адресу http://metaphora2.ru/ и включает в себя:

1. библиотеку текстов пословиц;

2. редактор семантических моделей пословиц;

3. поисковый аппарат:

a. для семантического поиска по различным критериям сходства;

b. для поиска по ключевым словам.

4. демонстрационные модули.

Система была разработана в соавторстве с В.И. Январевым (ВМиК МГУ).

Роль автора диссертационной работы заключалась в проектировании и реализации фрагмента базы данных, обеспечивающего функционирование модели и интеллектуального модуля (включая таблицы, запросы, процедуры обработки) и в проектировании и реализации пользовательских интерфейсов системы.

Роль соавтора, В.И. Январева, заключалась в проектировании клиент-серверной архитектуры системы (на базе CMS Waсko Wiki Quick Start 4.0), реализации многопользовательского режима, поддержки системы версий.

Клиентская часть системы выполнена с использованием технологии Flash (язык программирования ActionScript3, среда разработки FlexBuilder2). Серверная часть написана на PHP 5. В качестве хранилища данных используется СУБД MySQL.

На рис. 13 приведен интерфейс редактора формальных описаний пословиц, реализованный с помощью технологии Flash (доступ к нему имеют администраторы системы). В левой части располагается интерактивный редактор схемы активной пословицы. В правой (на вкладках) - поисковые инструменты, в числе которых: поиск по фрагменту текста, поиск по фрагменту схемы, по ключевым словам, а также модуль статистики.

Для широкого круга пользователей (без ограничения прав доступа) открыты демонстрационные модули, которые в более привычном для пользователей Интернет HTML-интерфейсе демонстрируют основные возможности модели:

1. поиск пословиц по набору ключевых слов;

2. поиск ключевых слов, проассоциированных с заданной пословицей;

3. поиск пословиц, находящихся в отношении подобия/противоположности /частичного сходства с заданной пословицей;

Рисунок 13 Интерфейс редактора формальных описаний пословиц ИС «МЕТАФОРА».

Также в HTML-интерфейсе реализован модуль, позволяющий экспертам конструировать семантические схемы пословиц с помощью электронной анкеты (вопросно-ответной подсистемы).

В Заключении сформулированы основные научные и практические результаты работы, обсуждаются перспективные направления дальнейших исследований. Основное направление дальнейших работ заключается в совершенствовании аппарата интеллектуального поиска и анализа: расширении списка ключевых слов, исследовании возможностей формального описания сложных семантических отношений (отношения противоречия, частичного сходства). При расширении корпуса текстов словари элементов могут быть уточнены. Большой интерес с точки зрения перспектив использования модели представляет перенесение ее на ЦОТ других жанров (сказку, басню и др.).

В Приложениях приведен список всех полученных в процессе исследования формальных описаний пословичных высказываний из экспериментальной выборки и список имеющихся в базе ключевых слов с их формальными интерпретациями.

3. ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

Поставленная в диссертационном исследовании задача - разработка формального представления семантики пословицы в базе знаний - была успешно решена. В процессе исследования были решены следующие частные задачи.

1. Проведен анализ предметной области, в процессе которого выявлены характерные особенности ЦОТ и описана структура предметной области.

2. Разработана структура базы знаний для представления семантики пословицы как частного случая ЦОТ (определены классы, объекты, отношения). Предложена формальная модель пословичного высказывания. Разработан графический язык для записи формальных схем.

3. Разработан аналитический аппарат базы знаний: определены критерии семантического сходства (подобия, противоположности, частичного сходства); сформулированы принципы поиска по ключевым словам.

4. Модель верифицирована на экспериментальной выборке текстов: словарь современных русских пословиц под ред. В.М. Мокиенко (505 единиц) и 100 случайно выбранных английских пословиц. В модели представимы до 90% высказываний из выборки (70% хорошо и 20% удовлетворительно).

5. База знаний реализована (в соавторстве) в информационной системе МЕТАФОРА, представляющей собой клиент-серверное приложение.

СПИСОК ПУБЛИКАЦИЙ

1. Малкова А.С. Разработка представления семантики ценностно-ориентированных текстов в базе знаний (на материале русских пословиц) // НТИ. Сер. 2. Информационные процессы и системы. 2011. № 1. -- С. 13-23.

2. Малкова А.С. Формальное разрешение проблемы противоречивости оценок в ценностных высказываниях (на материале русских пословиц). // Вестник РГГУ (в печати).

3. Малкова А.С. Представление знаний в ценностных суждениях (на материале русских пословиц) // Двенадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2010 (20-24 сентября 2010 г., г. Тверь, Россия): Труды конференции. Т.1. -- М: Физматлит, 2010. -- С. 353 -361.

4. Малкова А.С., Январев В.И. Информационная система для анализа социокультурных данных, заложенных в фольклорных текстах // Проблемы математической истории: основания, информационные ресурсы, анализ данных / Отв. ред. Г.Г. Малинецкий, А.В. Коротаев. -- М.: Книжный дом «ЛИБРОКОМ», 2009. -- С. 116-130.

5. Малкова А.С., Январев В.И. Формальная модель семантики художественного текста (на материале русских пословиц) // Моделирование и анализ информационных систем, 2007, T. 14, №.4. -- С.43-53.

6. Малкова А.С. Моделирование структуры пословиц // 14 международная конференция «Математика-Компьютер-Образование» г. Пущино, 22-27 января 2007. Тезисы. -- С. 288.

7. Малкова А.С. Разработка информационной системы для анализа структуры пословиц // Третьи Курдюмовские чтения: Синергетика в естественных науках, г.Тверь, 19-22 апреля 2007. Сборник трудов. -- С. 428.

8. Малкова А.С., Январев В.И. Информационная система для анализа социокультурных данных, заложенных в фольклорных текстах // Математическое моделирование исторических процессов: тезисы докладов II международной конференции. -- М.: ИПМ им. М.В.Келдыша, 2007. -- С. 45-46.

Размещено на Allbest.ru

...

автореферат "Разработка представления семантики ценностно-ориентированных текстов в базе знаний (на материале русских пословиц)" скачать

Подобные документы

Экспертная система поиска кандидатов на вакансии на бирже труда
Фреймовые модели представления знаний. Разработка структуры фреймов для реализации экспертной системы. Разработка экспертной системы с фреймовой моделью представления знаний. Редактирование базы фактов кандидатов и описание режима консультации.

курсовая работа [1,3 M], добавлен 13.10.2012
Разработка интеллектуальной системы диагностики повреждения трубопровода
Анализ процессов диагностики повреждений трубопровода. Разработка модели продукционной базы знаний: обзор методов представления знаний, описание создания базы знаний и разработки механизма логического вывода. Экономическое обоснование концепции проекта.

дипломная работа [3,0 M], добавлен 16.04.2017
Способы представления знаний
Представление знаний в когнитологии, информатике и искусственном интеллекте. Связи и структуры, язык и нотация. Формальные и неформальные модели представления знаний: в виде правил, с использованием фреймов, семантических сетей и нечетких высказываний.

контрольная работа [29,9 K], добавлен 18.05.2009
Использование фреймов для представления знаний
Фреймы как один из распространенных формализмов представления знаний в электронных системах, их классификация и типы, структура и элементы. Иерархические фреймовые структуры и принципы их построения. Код программы Интерфейс. Разработка программного кода.

лабораторная работа [524,2 K], добавлен 02.11.2013
Базы данных, знаний и экспертные системы
База знаний - структурированная информация из области знаний для использования кибернетическим устройством (человеком). Классификация, структура, формат представления знаний, интеллектуальные системы поиска информации. Базы знаний на примере языка Пролог.

презентация [51,3 K], добавлен 17.10.2013
Способы описания знаний
Проблема представления знаний. Представление декларативных знаний как данных, наделенных семантикой. Представление процедурных знаний как отношений между элементами модели, в том числе в виде процедур и функций. Представление правил обработки фактов.

курсовая работа [33,1 K], добавлен 21.07.2012
Разработка структуры базы знаний
Построение графа связей фактов и определение структуры базы знаний. Описание функций инициализации и констатации фактов, входных и выходных данных. Операции, направленные на занесение фактов и действий в базу знаний. Итоговое представление базы знаний.

курсовая работа [176,9 K], добавлен 13.11.2012
Интеллектуальные информационные системы. Базы знаний
Построение баз знаний для семантической сети. Цели создания и язык представления онтологий. Структура исследований в области многоагентных интеллектуальных информационных систем, архитектура агента. Экономическое обоснование разработки базы знаний.

дипломная работа [1,6 M], добавлен 29.09.2013
Система семантического разбора для естественно-языковых текстов
Понятие семантики; обзор и анализ существующих средств семантического разбора естественно-языковых текстов. Разработка алгоритма работы системы на основе семантического анализа, его реализация на языке программирования; проектирование интерфейса системы.

дипломная работа [1,7 M], добавлен 18.03.2012
Использование фреймов для представления знаний
Изучение фреймового способа представления знаний, его специфики и основных характеристик. Обзор других методов представления знаний, их плюсы и минусы. Иерархическая структура данных фрейма. Механизм управления выводом с помощью присоединенной процедуры.

реферат [2,6 M], добавлен 22.12.2014
Представление знаний. Операции над знаниями
Проблема представления знаний в компьютерных системах – одна из основных проблем в области искусственного интеллекта. Исследование различных моделей представления знаний. Определения их понятия. Разработка операции над знаниями в логической модели.

курсовая работа [51,9 K], добавлен 18.02.2011
Разработка алгоритмов и программных средств для построения компетентностно-ориентированных моделей в обучающих интегрированных экспертных системах
Процессы индивидуализации, интеллектуализации и веб-ориентации традиционных обучающих систем как важные особенности современных компьютерных технологий обучения. Знакомство с программными средствами для построения компетентностно-ориентированных моделей.

дипломная работа [2,7 M], добавлен 04.10.2014
Разработка элективного курса "Основы искусственного интеллекта"
Определения знаний и приобретения знаний человеком. Виды знаний и способы их представления. Приобретение и извлечение знаний. Визуальное проектирование баз знаний как инструмент обучения. Программное обеспечение для проведения лабораторных работ.

дипломная работа [960,9 K], добавлен 12.12.2008
Модели представления знаний
Классы и группы моделей представления знаний. Состав продукционной системы. Классификация моделей представления знаний. Программные средства для реализации семантических сетей. Участок сети причинно-следственных связей. Достоинства продукционной модели.

презентация [380,4 K], добавлен 14.08.2013
Разработка анализирующей части компилятора языка С
Разработка анализирующей части компилятора для выполнения проверки исходной программы на соответствие грамматике языка, правилам семантики и построения внутреннего представления. Описание анализаторов: лексического, синтаксического и семантического.

контрольная работа [704,9 K], добавлен 01.02.2013
Представление знаний
Сущность данных и информации. Особенности представления знаний внутри ИС. Изучение моделей представления знаний: продукционная, логическая, сетевая, формальные грамматики, фреймовые модели, комбинаторные, ленемы. Нейронные сети, генетические алгоритмы.

реферат [203,3 K], добавлен 19.06.2010
Разработка онтологической базы знаний и её реализация для сбора в сети интернет сведений по бортовым информационно управляющим системам автомобиля
Методы представления знаний заданной предметной области. Создание онтологии бортовых информационно управляющих систем автомобиля. Создание среды разработки и приложения для поиска в интернете с использованием онтологии. Проверка эффективности приложения.

презентация [1,6 M], добавлен 25.12.2014
Назначение онтологий. Информационный поиск
Оценка качества поисковых систем. Индексирование по ключевым словам. Внутренние представления запросов и документов на информационно-поисковом языке. Способы улучшения поиска при помощи тезаурусов и онтологий. Ранжированный поиск (vector-space model).

лекция [31,5 K], добавлен 19.10.2013
Проектирование базы знаний
Основные модели представления знаний. Системы поддержки принятия решений. Диаграмма UseCase. Разработка базы данных на основе трех моделей: продукционные правила, семантическая сеть, фреймовая модель. Программная реализация системы принятия решений.

курсовая работа [715,1 K], добавлен 14.05.2014
Программный модуль базы знаний
Разработка, составление и отладка программного модуля "База знаний" средствами программы Quick Sales. Описание схемы базы: возможности редактирования, удаления и добавления данных. Текст программы и контрольный пример поиска через панель управления.

курсовая работа [519,0 K], добавлен 26.01.2013

Другие документы, подобные "Разработка представления семантики ценностно-ориентированных текстов в базе знаний (на материале русских пословиц)"

весь список подобных работ

скачать работу можно здесь

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.