Атрибуция текстов, как обобщенная задача идентификации и прогнозирования
Описание применения универсальной когнитивной аналитической системы "Эйдос": автоматизация формализации предметной области на основе вербального описания ее объектов, формирование описательных шкал и градаций, синтез семантической информационной модели.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 25.04.2017 |
Размер файла | 19,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Атрибуция текстов, как обобщенная задача идентификации и прогнозирования
Луценко Е.В., к.т.н.
Рассмотрим классическую тестовую задачу для систем искусственного интеллекта, предложенную Рышардом Михальски и Джеймсом Ларсоном и подробно описанную на страницах 205-208 в книге Д.Мичи и Р.Джонстона "Компьютер - творец".
Суть этой задачи сводится к тому, чтобы выработать правила, обеспечивающие идентификацию железнодорожных составов и прогнозирование направления их следования на основе их формализованных или вербальных описаний.
Выбор данной задачи не накладывает ограничений на выводы, полученные в результате ее исследования. Это обусловлено тем, что она имеет ряд характерных особенностей, наблюдающихся в подобных задачах в самых различных предметных областях, т.е. по сути данная задача с полным основанием может рассматриваться как типовая для широкого класса задач идентификации и прогнозирования.
Эти особенности состоят в следующем:
1. Имеется ряд объектов, имеющих сложную многоуровневую структуру признаков.
2. Для каждого из этих объектов известно, к каким обобщенным категориям (классам) он относится.
3. Необходимо сформировать модель, обеспечивающую как идентификацию объектов, так и определение их принадлежности к обобщенным классам.
Если признаки и классы относятся к одному времени, то имеет место задача идентификации (распознавания). Если же признаки (факторы, причины) относятся к прошлому, а классы, характеризующие состояния объектов - к будущему, то это задача прогнозирования. Математически эти задачи не отличаются.
Существуют различные подходы к решению данной задачи различаются способами формализации предметной области, объектов обучающей выборки и синтеза математической модели.
В данной статье мы рассмотрим два основных подхода:
1. "Классический", т.е. основанный на изучении объектов предметной области экспертами (когнитивный анализ), выделении признаков объектов и формирования описательных шкал и градаций, в которых шкалам и градациям соответствуют уникальные коды.
2. "Лингвистический", в котором вербальные описания объектов предметной области на естественном языке используются для автоматизированной формализации предметной области, формирования обучающей выборки и синтеза модели.
Кратко рассмотрим реализацию обоих этих подходов в интеллектуальной технологии "Эйдос".
Железнодорожный состав является сложным объектом, имеющим несколько иерархических уровней и допускающим, соответственно, несколько уровней описания.
Можно, например, описывать составы с использованием шкал только 2-го уровня или только 3-го уровня. Возможны и смешанные варианты.
1-й вариант соответствует гипотезе, что на запад или восток идут не составы, а отдельные вагоны (отличающиеся типом и грузом), а состав идет туда же, куда и большинство вагонов.
2-й вариант соответствует гипотезе, что составы как бы не состоят из различных вагонов с различными грузами, а свойства вагонов и грузов являются свойствами непосредственно состава.
Необходимо отметить, что сравнительно небольшое количество признаков вагонов обеспечивает огромное количество различных типов вагонов, из которых реально в приведенных составах встречается лишь незначительная часть. Очевидно, существует еще большее количество вариантов сочетаний различных типов вагонов с различными грузами, следования их друг за другом и т.п..
Из этого следует по крайней мере два основных вывода:
1. Составить исчерпывающий справочник для описания состава на 2-м уровне, в котором бы указывались все варианты сочетаний различных типов вагонов с различными грузами на практике довольно трудоемко и вряд ли нецелесообразно (из-за его огромной размерности).
2. Реально встречающиеся в составах сочетания типов вагонов и видов грузов практически все будут являться уникальными, что обеспечит однозначную идентификацию составов, если их описывать только на 2-м уровне. Это превращает задачу в тривиальную. Поэтому будем рассматривать описание составов на 3-м уровне с элементами 2-го.
Вербальные описания железнодорожных составов практически на естественном языке являются их лингвистическими моделями, которые могут обрабатываться в системе "Эйдос". При этом в справочники будут заноситься, причем автоматически, только реально встретившиеся признаки составов. информационный аналитический эйдос автоматизация
Задача 1.
1. Формализовать задачу, создав классификационные и описательные шкалы с использованием таблицы 1 и обучающую выборку на основе рисунка 1.
2. Осуществить синтез и верификацию модели.
3. Провести анализ модели, сформулировав правила для прогнозирования направления движения составов (в режиме: "Типология", "Информационные портреты классов").
4. Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи.
5. Сравнить составы по степени "типичности" для своих кластеров ("Идущие на запад", "Идущие на восток"). Вывести в графической форме семантические сети составов, построить классические когнитивные карты для составов идущих на запад и на восток.
Задача 2
1. Создать стандартизированные с использованием таблицы 1 текстовые описания составов в виде отдельных файлов стандарта DOS-текст с концами строк, записать их в поддиректорию DOB в виде: ####-zap.txt и ####-vos.txt.
2. Сгенерировать классификационные и описательные шкалы в режиме: "Автоввод первичных признаков и TXT-файлов", "Признаки - слова".
3. Сгенерировать обучающую выборку с использованием режима: "Ввод-корректировка обучающей выборки", "F7 InpTXT", "F6 Ввод из всех файлов". Дополнить анкеты, соответствующие составам, кодами принадлежности к обобщенным образам классов: "Идущие на запад", "Идущие на восток".
4. Осуществить синтез и верификацию модели.
5. Провести анализ модели, сформулировав правила для прогнозирования направления движения составов (в режиме: "Типология", "Информационные портеры классов").
6. Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи.
7. Сравнить составы по степени "типичности" для своих кластеров ("Идущие на запад", "Идущие на восток"). Вывести в графической форме семантические сети составов, построить классические когнитивные карты для составов идущих на запад и на восток.
Пример решения задачи 1
Пример решения задания 2.1: "Формализовать задачу, создав классификационные и описательные шкалы и обучающую выборку"
Пример решения задания 2.1: "Создать стандартизированные текстовые описания составов в виде отдельных файлов стандарта DOS-текст"
Создать стандартизированные с использованием таблицы 1 текстовые описания составов в виде отдельных файлов стандарта DOS-текст с концами строк, записать их в поддиректорию DOB в виде: ####-zap.txt и ####-vos.txt, где #### - номер анкеты (состава) в виде 0001, 0002 и т.д., а остальные символы произвольные, но выбираются таким образом, чтобы отражать содержание анкеты.
0001-VOS.TXT
Кол-во_вагонов=4
форма_вагона_прямоугольная
форма_вагона_прямоугольная
форма_вагона_прямоугольная
форма_вагона_прямоугольная
длина_вагона_короткий
длина_вагона_короткий
длина_вагона_длинный
длина_вагона_длинный
N_осей_вагона=2
N_осей_вагона=2
N_осей_вагона=2
N_осей_вагона=3
стенки_вагона_одинарные
стенки_вагона_одинарные
стенки_вагона_одинарные
стенки_вагона_одинарные
крыша_вагона_отсутствует
крыша_вагона_отсутствует
крыша_вагона_отсутствует
крыша_вагона_двухскатная
груз_1_большой_круг
груз_1_шестиугольник
груз_1_треугольник
груз_3_квадрата
0002-VOS.TXT
Кол-во_вагонов=3
форма_вагона_прямоугольная
форма_вагона_V-образная
форма_вагона_U-образная
длина_вагона_короткий
длина_вагона_короткий
длина_вагона_короткий
N_осей_вагона=2
N_осей_вагона=2
N_осей_вагона=2
стенки_вагона_одинарные
стенки_вагона_одинарные
стенки_вагона_одинарные
крыша_вагона_отсутствует
крыша_вагона_отсутствует
крыша_вагона_прямая
груз_2_маленьких_круга
груз_1_короткий_прямоугольник
груз_1_треугольник
0003-VOS.TXT
Кол-во_вагонов=3
форма_вагона_прямоугольная
форма_вагона_прямоугольная
форма_вагона_ромбовидная
длина_вагона_длинный
длина_вагона_короткий
длина_вагона_короткий
N_осей_вагона=3
N_осей_вагона=2
N_осей_вагона=2
стенки_вагона_одинарные
стенки_вагона_одинарные
стенки_вагона_одинарные
крыша_вагона_отсутствует
крыша_вагона_прямая
крыша_вагона_прямая
груз_1_большой_круг
груз_1_треугольник
груз_1_перевернутый_треугольник
0004-VOS.TXT
Кол-во_вагонов=4
форма_вагона_прямоугольная
форма_вагона_прямоугольная
форма_вагона_эллипсоидная
форма_вагона_V-образная
длина_вагона_короткий
длина_вагона_короткий
длина_вагона_короткий
длина_вагона_короткий
N_осей_вагона=2
N_осей_вагона=2
N_осей_вагона=2
N_осей_вагона=2
стенки_вагона_одинарные
стенки_вагона_одинарные
стенки_вагона_одинарные
стенки_вагона_двойные
крыша_вагона_отсутствует
крыша_вагона_отсутствует
крыша_вагона_отсутствует
крыша_вагона_прямая
груз_1_квадрат
груз_1_треугольник
груз_1_треугольник
груз_1_ромб
0005-VOS.TXT
Кол-во_вагонов=3
форма_вагона_прямоугольная
форма_вагона_прямоугольная
форма_вагона_прямоугольная
длина_вагона_короткий
длина_вагона_короткий
длина_вагона_длинный
N_осей_вагона=3
N_осей_вагона=2
N_осей_вагона=2
стенки_вагона_одинарные
стенки_вагона_одинарные
стенки_вагона_двойные
крыша_вагона_отсутствует
крыша_вагона_прямая
крыша_вагона_прямая
груз_1_большой_круг
груз_1_треугольник
груз_1_длинный_прямоугольник
0006-ZAP.TXT
Кол-во_вагонов=2
форма_вагона_прямоугольная
форма_вагона_прямоугольная
длина_вагона_короткий
длина_вагона_длинный
N_осей_вагона=2
N_осей_вагона=2
стенки_вагона_одинарные
стенки_вагона_одинарные
крыша_вагона_отсутствует
крыша_вагона_прямая
груз_3_маленьких_круга
груз_1_треугольник
0007-ZAP.TXT
Кол-во_вагонов=3
форма_вагона_прямоугольная
форма_вагона_прямоугольная
форма_вагона_U-образная
длина_вагона_короткий
длина_вагона_короткий
длина_вагона_длинный
N_осей_вагона=2
N_осей_вагона=2
N_осей_вагона=2
стенки_вагона_одинарные
стенки_вагона_одинарные
стенки_вагона_двойные
крыша_вагона_отсутствует
крыша_вагона_отсутствует
крыша_вагона_гофрированная
груза_нет
груз_1_большой_круг
груз_1_треугольник
0008-ZAP.TXT
Кол-во_вагонов=2
форма_вагона_прямоугольная
форма_вагона_U-образная
длина_вагона_короткий
длина_вагона_длинный
N_осей_вагона=2
N_осей_вагона=3
стенки_вагона_одинарные
стенки_вагона_одинарные
крыша_вагона_отсутствует
крыша_вагона_прямая
груз_1_большой_круг
груз_1_длинный_прямоугольник
0009-ZAP.TXT
Кол-во_вагонов=4
форма_вагона_прямоугольная
форма_вагона_прямоугольная
форма_вагона_V-образная
форма_вагона_V-образная
длина_вагона_короткий
длина_вагона_короткий
длина_вагона_короткий
длина_вагона_длинный
N_осей_вагона=2
N_осей_вагона=2
N_осей_вагона=2
N_осей_вагона=2
стенки_вагона_одинарные
стенки_вагона_одинарные
стенки_вагона_одинарные
стенки_вагона_одинарные
крыша_вагона_отсутствует
крыша_вагона_отсутствует
крыша_вагона_отсутствует
крыша_вагона_гофрированная
груз_1_большой_круг
груз_1_большой_круг
груз_1_длинный_прямоугольник
груз_1_короткий_прямоугольник
0010-ZAP.TXT
Кол-во_вагонов=2
форма_вагона_прямоугольная
форма_вагона_U-образная
длина_вагона_короткий
длина_вагона_длинный
N_осей_вагона=2
N_осей_вагона=2
стенки_вагона_одинарные
стенки_вагона_одинарные
крыша_вагона_отсутствует
крыша_вагона_отсутствует
груз_1_короткий_прямоугольник
груз_2_коротких_прямоугольника
Пример решения задания 2.2: "Сгенерировать классификационные и описательные шкалы"
Для этого используем режим: "F1 Словари - Автоввод первичных признаков и TXT-файлов - F3 Признаки - слова".
Классы во втором задании те же самые, что и в первом. Признаки выглядят несколько иначе, т.к. формируются автоматически из текстовых описаний составов.
Этапы синтеза модели, ее оптимизации, проверки адекватности и анализа подробно описаны в работах [2, 3], поэтому в данной статье мы приведем лишь их результаты.
Пример решения задания 2.4: "Осуществить синтез и верификацию семантической информационной модели"
Пример решения задания 2.5 "Провести анализ модели, сформулировав правила для прогнозирования направления движения составов"
В подсистеме: "Типология", "Информационные портеры классов" системы "Эйдос" получаем следующие информационные портреты классов.
Пример решения задания 2.6: "Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи"
В подсистеме "Оптимизация" режиме " режиме "Исключение признаков с низкой селективной силой" получаем перечень признаков, ранжированных в порядке убывания среднего количества информации о направлении следования состава.
Пример решения задания 2.7: "Сравнить составы по степени "типичности" для своих кластеров ("Идущие на запад", "Идущие на восток"). Вывести в графической форме семантические сети составов. Построить классические когнитивные карты для составов идущих на запад и на восток"
Сравним составы по степени "типичности" для своих кластеров ("Идущие на запад", "Идущие на восток"). В подсистеме "Типология" режиме "Типологический анализ классов распознавания - Кластерный и конструктивный анализ - просмотр и печать кластеров и конструктов" выводим конструкт: "Идущие на запад" и "Идущие на восток".
- составы 4-й, 1-й и 3-й являются типичными для "Идущих на восток", а 5-й и особенно 2-й - нетипичными;
- составы 10-й, 9-й и 8-й являются типичными для "Идущих на запад", а 7-й и особенно 6-й - нетипичными.
Выведем в графической форме семантические сети составов.
Семантические сети классов отображают результаты кластерно-конструктивного анализа в графической форме. Для этого используется режим: "Вывод 2d-семантических сетей классов".
Построим классические когнитивные карты для составов идущих на запад и на восток". В Системе "Эйдос" классическая когнитивная карта строится из двух графических диаграмм:
1. Неклассического нейрона (подсистема "Анализ", режим "Графическое отображение нелокальных нейронов")
2. Семантической сети признаков (подсистема "Типология", режим "Кластерный и конструктивный анализ признаков - вывод 2d-семантических сетей признаков")
Классическая когнитивная карта может быть изображена в форме конуса, но для наглядности изображения большого объема информации его вершина и боковая поверхность показана в форме нейрона, а основание - в форме семантической сети.
Таким образом, вербальные описания объектов реальности на естественном языке с полным основанием могут рассматриваются как их иерархические лингвистические модели. Вербальные описания объектов реальности на естественном языке рассматриваются в статье как их иерархические лингвистические модели. Предложены методика и автоматизированная технология, основанные на применении универсальной когнитивной аналитической системы "Эйдос", обеспечивающие: автоматизированную формализацию предметной области на основе вербального описания ее объектов, автоматизированное формирование описательных шкал и градаций, а также обучающей выборки, синтез семантической информационной модели, ее оптимизацию, проверку адекватности и анализ. Предлагаемые технологии обеспечивают значительную экономию труда и времени по сравнению с традиционным подходом.
Литература
1. Мичи Д., Джонстон Р. Компьютер - творец. -М.: Мир, 1987. -251 с.
2. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). -Краснодар: КубГАУ. 2002. - 605 с.
3. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280 с.
Размещено на Allbest.ru
...Подобные документы
Понятие и разновидности, подходы к формированию инфологических моделей. Модель информационной системы Захмана, направления ее развития и анализ результатов. Компоненты инфологического уровня описания предметной области. Сбор требований пользователей.
презентация [136,3 K], добавлен 19.08.2013Анализ предметной области "Конкурс поэтов" на основе объектно-ориентированного подхода. Разработка оконного приложения и описание информационной модели предметной области. Описание разработанных процедур С++ и результатов тестирования приложения.
курсовая работа [355,9 K], добавлен 18.06.2013Моделирование - последовательность переходов от неформального словесного описания информационной структуры предметной области к формализованному описанию объектов в терминах модели. Применение инфологической модели. Состав и структура предметной области.
курсовая работа [602,0 K], добавлен 27.02.2009Содержательное описание предметной области. Структурный анализ бизнес-процесса на основе IDEF0-модели. Построение информационно-логической модели данных. Структурная схема на основе IDEF0. Даталогическая модель данных. Реализация информационной системы.
курсовая работа [849,7 K], добавлен 10.07.2014Создание и разработка информационной системы автоматизации учета книг в книжном магазине. Описание предметной области, постановка задачи и обзор методов ее решения. Модели и алгоритмы представления системы. Обоснование технических и программных средств.
курсовая работа [1,7 M], добавлен 31.03.2012Анализ предметной области. Разработка информационной системы для улучшения качества обслуживания клиентов и автоматизации работы кассы столовой. Проектирование логической модели. Определение регламентированных запросов и описание клиентских приложений.
курсовая работа [1,6 M], добавлен 17.02.2013Исследование основных требований, предъявляемых к инфологической модели. Методы представления предметной области. Инфологическое описание предметной области. Модель "сущность-связь". Типы бинарных связей. Отражение объектов в информационной системе.
презентация [397,3 K], добавлен 29.09.2013Описание предметной области и определение предметной области информационной системы детского сада. Разработка логической и физической модели базы данных дошкольного образовательного учреждения. Анализ функционала информационной системы детского сада.
курсовая работа [1,6 M], добавлен 20.04.2015Автоматизация проектирования визуальной модели системы. Построение диаграммы последовательности и классов. Информационный анализ предметной области и выделение информационных объектов. Построение логической модели данных. Программное обеспечение.
дипломная работа [1,5 M], добавлен 27.10.2017Концепция программной среды Delphi и её преимущества. Ключевые понятия языка С++. Построение информационной модели предметной области, описание полей таблиц базы данных, листинг программы. Создание меню, реализующего функции информационной системы.
курсовая работа [1,1 M], добавлен 28.01.2016Процессный подход как технология формализации предметной области. Описание бюро труда и экономического планирования. Анализ затрат рабочего времени бюро. Описание документации для учета трудозатрат. Разработка и реализация проекта информационной системы.
курсовая работа [3,2 M], добавлен 12.10.2013Оценка предметной области: концептуальные требования; выявление информационных объектов и связей между ними; построение базы данных. Описание входных и выходных данных информационной системы "Магазин компьютерной техники". Анализ диаграммы прецедентов.
курсовая работа [294,8 K], добавлен 13.04.2014- Программа адаптации распределенной структуры гибридной информационной системы идентификации объектов
Анализ существующих систем и подходов, обзор предметной области решения. Система Macroscop. Комплекс "Интеллектуальное видеонаблюдение Kipod". Системы видеонаблюдения VOCORD. Разработка математической модели минимизации структуры. Интерфейс программы.
дипломная работа [1,5 M], добавлен 19.01.2017 Анализ предпроектного обследования предметной области "Компьютерного сервиса". Особенность разработки функциональная модель IDEF0 для графического представления описания информационной системы. Построение модели данных для проектируемой системы.
контрольная работа [751,8 K], добавлен 12.01.2023Типология свойств объекта, его связей и моделей представления информации. Изображение предметной области в виде логических и физических моделей. Требования к системам баз данных. Достоинства трехуровневой архитектуры. Процесс идентификации объектов.
лекция [60,0 K], добавлен 19.08.2013Описание предметной области. Организация диалога пользователя с компьютером. Определение важных для предметной области объектов, их свойств и отношений друг с другом. Среда разработки базы данных - Microsoft Visual FoxPro 6.0. Требования к приложению.
курсовая работа [880,1 K], добавлен 11.01.2012Организация, архитектура и структура информационной системы. Показатели эффективности ее работы. Цели и задачи анализа АСУ. Компоненты автоматизированных систем. Описание предметной области, входных и выходных данных. Построение диаграммы прецедентов.
курсовая работа [231,0 K], добавлен 11.04.2014Проектирование информационной системы для удобного ведения учета товара. Функциональная модель предметной области. Обоснование выбора языка программирования. Описание программы, руководство пользователя. Протокол тестирования программного продукта.
курсовая работа [537,6 K], добавлен 18.09.2014Обоснование необходимости разработки информационной системы. Анализ предметной области. Техническое задание на создание ЭИС. Правовой статус и краткая экономическая характеристика предприятия. Состояние учетно-аналитической работы на предприятии.
реферат [21,2 K], добавлен 09.01.2009Анализ предметной области и разработка проекта информационной системы по поддержке пользователей на базе 1С: Предприятие. Проведение формализации логических моделей информационных процессов и процедур в проектной системе. Реализация функций системы 1С.
дипломная работа [1,9 M], добавлен 27.01.2013