Структурный подход к мониторингу концептуальных информационных ресурсов
Проблема разработки полезных и широко используемых интеллектуальных систем. Структурный подход к мониторингу информационных ресурсов, необходимый при функционировании и управлении программными системами. Графовые модели оценивания структурных свойств.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 19.01.2018 |
Размер файла | 153,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Структурный подход к мониторингу концептуальных информационных ресурсов
Е.А. Шалфеева
Институт автоматики и процессов Управления ДВО РАН, Владивосток
Качество реализации интеллектуальных программных систем зависит от характеристик качества используемых моделей знаний и других используемых концептуальных информационных ресурсов. Предлагается структурный подход к оцениванию информационных ресурсов. Этот подход позволяет на ранних этапах разработки интеллектуальных программных систем проверять все используемые модели, а также делать оценки относительно качества ресурсов, используемых такими системами. Такой метод оценивания помогает обнаруживать некорректность модели предметной области, дефекты представления информации, находить несогласованности между определениями понятий, недостатки и потенциальные неудобства, имеющиеся в информационных ресурсах.
Введение
Проблема разработки практически полезных, реально и широко используемых интеллектуальных систем является одной из центральных в области искусственного интеллекта. Важнейшими представителями интеллектуальных программных систем являются системы, в архитектуре которых явно выделена отдельно хранимая, пополняемая и редактируемая база знаний предметной области.
Опыт использования специальных компьютерных методов построения баз знаний показывает необходимость проверки и подтверждения накапливаемых и формализуемых знаний. В литературе недостаточно информации о методах, позволяющих проводить объективное оценивание и тщательные испытания экспертных и других интеллектуальных систем.
Информационными ресурсами, которые могут использоваться интеллектуальными системами, являются базы знаний, базы данных, а также онтологии. Некоторые из онтологий не используются непосредственно, но являются метаинформацией для знаний либо данных. Все перечисленные информационные ресурсы должны проверяться и оцениваться, т.е. быть объектами мониторинга Мониторинг - в широком смысле - специально организованное, систематическое наблюдение за состоянием объектов … с целью их оценки, контроля или прогноза. (www.tracker.co.ua/gps_glossary.html), потому что их качество отражается на качестве результатов функционирования ИС.
С другой стороны, на стадии разработки такой системы, последующего ее сопровождения или управления ею [Грибова и др., 2010] используются модели предметной области и решаемых задач, в частности их онтологии [Caleroetal., 2006]. Мониторинг этих ресурсов (в частности, контроль ограничений целостности, согласованности, соглашений между знаниями и действительностью) важен для создания качественных компонентов системы.
Для эффективного и объективного мониторинга важно с одной стороны обнаруживать то, что человеку сделать трудно или почти невозможно, и с другой стороны - облегчить обнаружение того, что может найти лишь человек. Для этого применим подход к измерению и оцениванию структурных свойств ресурсов, поскольку допускает автоматизацию получения значений свойств.
Цель работы: представить структурный подход к мониторингу концептуальных информационных ресурсов, актуальных при создании и функционировании интеллектуальных систем (ИС).
1. Объекты мониторинга
графовый информационный модель программный
Концептуальные информационные ресурсы - такие ресурсы, которые могут обрабатываться интеллектуальными системами, представлены в терминах некоторой онтологии, а структура и содержание которых понятны специалистам [Грибова и др., 2010].
Информация в предметных областях может быть структурирована множеством разных способов и представлена на различных языках. Одним из способов представления ресурсов, используемых в исследовательских интеллектуальных системах, является язык представления информации различных уровней общности (ИРУО-язык) [Клещев и др., 2006]. Этот язык позволяет описывать и абстрактные термины онтологий, и конкретные термины моделей знаний, и конкретные сведения баз данных.
Каждый термин предметной области, элемент информации представляется областью своих возможных значений либо как совокупность его компонентов и описателей, которые также являются терминами этой предметной области или других областей. Практика показала, что для заметной доли хранимой концептуальной информации характерны связи целое-частное, сущность-атрибут. Элемент информации на языке ИРУО может представляться: 1) набором составных частей, 2) набором альтернатив, 3) множеством значений, 4) конкретным значением некоторого типа или 5) ссылкой на термин другого ресурса (тогда можно считать, что он включается целиком в этот ресурс). Элемент информации может по каким-то причинам быть не определен.
Такие связи характерны, в частности, для ресурсов, описывающих действительность, т.е. ситуации, составляющие входные данные для решаемых прикладных задач. Примером ресурса с такими связями является «Информация о наблюдениях в урологии» в подсистеме ведения истории болезни пациента. Этот ресурс характеризуется наличием партономических связей между терминами и связями термина с множеством значений. Различные ресурсы исследовательской диагностической системы в офтальмологии - база заболеваний, база наблюдений и их онтологии - хранятся в едином ИРУО-формате.
Объектом мониторинга при управлении такого рода исследовательскими системами является каждый информационный ресурс, используемый для ее разработки, и именно: метаонтологии, онтологии, модели знаний, модели компонентов интеллектуальной системы (ИС), базы данных.
Цель мониторинга - выявление дефектов, недостатков и неудобств в информационных ресурсах.
2. Графовые модели для оценивания структуры информационного ресурса
Предлагаемый метод выявления дефектов, недостатков и неудобств основан на определении и получении значений структурных свойств, классификации их степени значимости в зависимости от типа \ категории ресурса и его назначения в разрабатываемой ИС.
Если под свойством ресурса понимать некоторую его характерную особенность или особенность некоторого его осмысленного фрагмента, то структурным свойством ресурса является свойство, определяемое только на основе анализа структуры этого ресурса.
Пример определения модели: граф стандартной партономии информационного ресурса - графовая модель <В, Д> , где вершины В = {в-i}, в-i - составные и простые сущности ресурса, а дугиД = {д-j}, д-j - связи сущностей следующих видов: состоит из, включает часть, является последовательностью, представлено альтернативой.
Структурные свойства ресурса определяются в терминах соответствующих графов через подсчет числа вершин или дуг, числа одноименных дуг, разветвлений, числа и доли дуг с определенными метками и т.д. Пример определения структурного свойства по этому графу:
В зависимости от типа ресурса (модель знаний, данные, онтология) и цели его использования при создании программной системы одни и те же структурные свойства могут интерпретироваться по-разному.
3. Определение дефектов информационных ресурсов
При мониторинге ресурсов наиболее важно обнаружить множество дефектов.
Дефектом информационного ресурса считаем свойство (или состояние) ресурса, делающее его непригодным для использования при разработке ИС.
В зависимости от типа ресурса дефектами являются разные его свойства, некоторые дефекты могут быть характерными лишь для некоторых предметных областей, т.е. быть проблемно-зависимыми. Ниже будут представлены проблемно-независимые дефекты, характерные для одного типа ресурсов - для баз знаний. (Конкретный пример метода обнаружения дефекта или произвольного структурного свойства показан в параграфе 5).
Структурными дефектами базы знаний являются наличие цикличных утверждений (определяется как множество или число циклов в графовой модели), а также несвязанность элементов знаний (определяется как отсутствие дуг в графовой модели). На практике это редко встречающиеся дефекты.
Более распространенными являются неструктурные дефекты - показатели неполноты, некорректности. К таковым относятся: отсутствующие фрагменты (элементы) знаний, неверные названия терминов, неверные значения сущностей. Автоматизация их поиска трудноосуществима. Однако анализ структурных свойств позволяет 1) найти «подозрительные места» в информационном ресурсе, 2) указать на структурные особенности, повышающие риск внесения ошибок и риск их невыявления, и 3) обеспечить демонстрацию фрагментов структуры, облегчающую поиск ошибок экспертом.
Рис. 1. Виды деятельности, обеспечивающие мониторинг концептуальных ресурсов
Для выявления «подозрительных мест» могут быть определены специальные «вспомогательные» свойства. Для указания на структурные особенности, повышающие указанные риски, служат свойства-особенности (о связях особенностей с рисками для дефектов - в параграфе 6). Для того чтобы визуализация фрагментов структуры действительно облегчала поиск ошибок, важно исключить потенциальные неудобства в анализируемых ресурсах (о связях потенциальных неудобств с обнаружением дефектов - в параграфе 5).
4. Определение недостатков информационных ресурсов
Немалое значение имеет при мониторинге ресурсов и обнаружение множества недостатков.
Недостатком ИРсчитаем свойство (или состояние) ресурса, дающее риск неадекватного функционирования (например, неверные выходные данные) ИС, разработанной с его использованием.
Проблемно-независимым недостатком, характерным для баз знаний, является: «незавершенные термины» (определяется как множество или число терминов-листов графа партономии ресурса, которые отсутствуют в теоретико-множественном графе этого ресурса).
Пример недостатка базы наблюдений урологического больного - не заданы возможные значения характеристики "длительность" для наблюдаемого признака "отхождение камней".
Свойство базы знаний не конкретизированные в базе знаний термины онтологии (формальная неполнота) можно определить с помощью графа включения путем обнаружения тех обязательных вершин (модальность дуг к ним равна единице) ресурса-онтологии, которые не связаны ни с одной вершиной ресурса-базы знаний.
5. Определение потенциальных неудобств
Потенциальное неудобство - свойство ИР, затрудняющее возможность человеку работать с информацией или снижающее эффективность его автоматической обработки.
Среди проблемно-независимых неудобств базы знаний актуальны многозначные термины, термины с одинаковыми областями значений, совпадение названий и значений.
Свойство-неудобство «многозначные термины» имеет два проявления: число/множество одноименных терминов с разной структурой и число/множество одноименных терминов, имеющих разные области значений. Первое определяется как число одноименных вершин в графе партономии, второе - как число одноименных вершин в графе теоретико-множественных связей. Это является неудобством при анализе/чтении и редактировании базы знаний, проверке полноты и корректности введенных знаний экспертом, при выборе подходящего термина для обозначения некоторой сущности при проектировании диалога с экспертом.
Пример выявления этого факта: в базе знаний заболеваний офтальмологии используется термин «качественные значения» с разной структурой. Причина этого лежит в неоднозначном определении такого термина («качественные значения») в соответствующей онтологии заболеваний.
Пример использования графа и его структурного свойства для выявления этого факта таков.
Для рассматриваемого ресурса строится граф стандартнойпартономии. Этот граф содержит несколько более сотни вершин, в том числе одноименных, дуги графа принадлежат одному из трех типов - «состоит из» (для тех случаев, когда указывается множество однотипных частей), «включает часть» (когда каждая часть уникальна по своей структуре), «представлено альтернативой». Например, есть дуга «состоит из» от «качественные значения» к «значение», дуга «включает часть» от «качественные значения» к реакция на воздействие события, дуга «представлено альтернативой» от «выбор типа значений» к «целые значения» и от «выбор типа значений» к «качественные значения».
Множество одноименных терминов с разной структурой - определяется как множество одноименных вершин в графе партономии, из которых выходят разные дуги или выходят дуги к разным вершинам. Для этого понадобится метрика множество разных определений указанного термина. И искомое свойство-неудобство будет определяться поэтапно.
Сначала определяется множество имен терминов ресурса как множество имен вершин в графе партономии этого ресурса. Фрагмент полученного значения таков: {«характеристика», «выбор типа значений», «целые значения», «качественныезначения», «вариант НР»…}.
Далее для каждого имени термина - определяется метрика множество разных определений указанного термина. Например, множество разных определений («качественные значения») = {{значение (*)}, {вариант КП (*)},{вариант КП, КП, измененное воздействием событий}, {вариант (*)}, {вариант этиологии (*)},{вариант НР (*)}, {{вариант НР, реакция на воздействие события}}.
И, наконец, свойство-неудобство множество одноименных терминов с разной структурой будет определяться как множество терминов, для которых мощность значений метрики множество разных определений больше единицы. Фрагмент полученного значения таков: множество одноименных терминов с разной структурой = {…, «качественные значения», …}.
Совпадение названий и значенийопределяется какчисло/множество случаев совпадений названия вершины (не-листовой) графа партономии с названием некоторой вершины в графе теоретико-множественных связей того же ресурса.
Потенциальными неудобствами, затрудняющими поиск ошибок экспертом, являются чрезмерно большие или неудачно поделенные на модули ресурсы. Как хороший модуль в программировании обладает свойствами высокой прочности и слабого сцепления с другими, так и информационный ресурс должен иметь разумный, небольшой объем информации, отдельные элементы которой сильно связаны друг с другом и, по возможности, мало - с элементами других информационных ресурсов.
Мониторинг размера модулей, внутримодульных и межмодульных связей является необходимым.
6. Определение особенностей
Особенностью ИР считаем структурное свойство ресурса, отличающее его от ресурсов, удовлетворяющих критериям качества.
Объем информации, одновременно анализируемой/редактируемой человеком должен удовлетворять разумным критериям. Считается, что оптимально - 6-7 сущностей человек способен одновременно охватывать вниманием. Поэтому к проблемно-независимым особенностям базы знаний, требующим мониторинга,относятся:
число терминов, детализирующих элемент информации (определяется как полустепень исхода вершины в партономии и сравнивается обычно со значением 10);
Выявленные подмножества (если их больше нуля) - потенциальные неудобства для экспертов. Они же помогают обнаружить эксперту такой дефект, как неверные значения сущностей (например, для вышеупомянутого случая с характеристикой «периодичность» и ее значениями имеется, отсутствует, определенными также и для термина «Присутствие», и для «Трудность временно воздержаться»).
Свойство использование в базе знаний терминов онтологии (определяемое по графу использования) позволяет выявить «подозрительные места» для проверки экспертом того, чтобы в базе знаний не оставались утверждения с неконкретизированными значениями (например, если в базе заболеваний будет вместо значения наблюдения подставлена ссылка на весь возможный диапазон значений некоторого термина, определенный в некоторой онтологии).
Заключение
Предложенный подход к мониторингу информационных ресурсов, необходимый при разработке и управлении интеллектуальными программными системами, позволяет получать объективные значения структурных свойств, выявлять дефекты, задавать субъективные показатели качества ресурсов, основываясь на структурных свойствах. Мониторинг обеспечивает ранний контроль качества моделей, используемых при проектировании, и декларативных компонентов самих разрабатываемых ИС, и регулярный контроль используемых ими баз знаний и другой хранимой информации.
Благодарности. Работа выполнена при финансовой поддержке гранта РФФИ "Управление концептуальными метаонтологиями, онтологиями, знаниями и данными в интеллектуальных системах" и ДВО РАН "Обеспечение качества интеллектуального программного обеспечения в процессе его проектирования на основе онтологий".
Список литературы
1. Грибова и др., 2010 Грибова В.В., Клещев А.С., Шалфеева Е.А. Системы управления интеллектуальными Интернет-приложениями - Владивосток: ИАПУ ДВО РАН, 2010.
2. Клещеви др., 2006 Клещев А.С., Орлов В.А. Компьютерные банки знаний. Универсальный подход к решению проблемы редактирования информации // Информационные технологии. 2006. №5.
3. Рыбина и др., 1999 Рыбина Г. В., Душкин Р. В. и др. Вопросы извлечения и представления неточных и недоопределенных знаний при автоматизированном построении баз знаний для интегрированных экспертных систем. // Третья международная летняя школа-семинар по искусственному интеллекту для студентов и аспирантов (Браславская школа 1999). Сборник научных трудов. Мн.: БГУИР, 1999.
4. Caleroetal., 2006 CaleroC., RuizF., PiattiniM. (eds). Ontologies for Software Engineering and Software Technology. Springer Verlag, 2006.
5. Doherty et al., 2003 Doherty J. A., Reichley R. M. et. al. Monitoring Pharmacy Expert System Performance Using Statistical Process Control Methodology. // AMIA Annual Symposium Proc., 2003.
6. Kleschev et al., 2008 Kleschev A., Shalfeeva E., Defining Structural Properties of Ontologies. // Journal of Computer and Systems Sciences International. 2008. Vol. 47, No. 2. © Pleiades Publishing, Ltd., 2008.
7. Spring, 1997 Spring G.S. Critical review of expert system validation in transportation. Transportation Research Record 1588. 1997.
Размещено на Allbest.ur
...Подобные документы
История развития информационных технологий. Классификация, виды программного обеспечения. Методологии и технологии проектирования информационных систем. Требования к методологии и технологии. Структурный подход к проектированию информационных систем.
дипломная работа [1,3 M], добавлен 07.02.2009Методологические основы оценки качества информационных ресурсов. Анализ принципов методологии, используемых при решении задач ОКФИС. Логика организации, ее теоретический базис, нормы и правила. Методы и средства моделирования информационных систем.
контрольная работа [66,7 K], добавлен 23.01.2011Исследование проблем формирования и использования информационных ресурсов как совокупности сведений, получаемых в процессе практической деятельности людей. Состав и свойства информационных ресурсов. Государственная политика в сфере защиты информации.
реферат [23,7 K], добавлен 31.01.2011Автоматизированные информационные системы и их структура. Обзор существующих автоматизированных информационных систем "Расписание". Структурный подход к проектированию автоматизированной системы "Расписание", построение моделей данных и анализ внедрения.
дипломная работа [3,1 M], добавлен 29.06.2010Изучение деятельности фирмы СООО "Гейм Стрим", занимающейся разработкой программного обеспечения интеллектуальных систем. Проведение работы по тестированию информационных систем на степень защищенности и безопасности от разного рода информационных атак.
отчет по практике [933,1 K], добавлен 05.12.2012Роль интеллектуальных информационных систем в развитии общества. Проблемы концептуального классификационного моделирования для систем, основанных на знаниях. Иерархическая структура универсума. Интенсиональность и параметричность классификации, структура.
реферат [15,4 K], добавлен 19.02.2011Применение информационных технологий в управлении проектами (инновациями), определение их эффективности. Методические принципы защиты информации. Виды и особенности интеллектуальных информационных систем. Организация электронного документооборота.
курс лекций [1,1 M], добавлен 29.04.2012Основные черты современных информационных технологий. Цель применения информационных технологий - снижение трудоемкости использования информационных ресурсов. Использованные программные средства для разработки информационной системы для продажи книг.
курсовая работа [1,2 M], добавлен 27.06.2014Новые виды субъектов рынка информационных ресурсов. Становление и развитие рынка в России: государственные, некоммерческие, коммерческие информационные службы. Влияние Интернета на российский рынок информационных услуг. Сферы информационного рынка.
реферат [55,5 K], добавлен 01.12.2007Предмет и основные понятия информационных систем. Базовые стандарты корпоративных информационных систем. Характеристика входящих и исходящих потоков информации. Основные понятия искусственного интеллекта. Обеспечение безопасности информационных систем.
курс лекций [295,6 K], добавлен 11.11.2014Информационный ресурс - совокупность накопленной информации, зафиксированной на материальных носителях. Типы мировых информационных сетей. Классификация информационных ресурсов, браузеры-программы, язык разметки, система адресации в сети Интернет.
курс лекций [427,8 K], добавлен 18.12.2010Технология программных агентов. Форматы метаданных, использующиеся для описания электронных ресурсов. Разработка интеллектуальных агентов. Среда разработки Jadex для построения интеллектуальных агентов. BDI модель интеллектуального агента ресурсов.
курсовая работа [279,8 K], добавлен 20.02.2011Основная идея методологии и принципы RAD-разработки информационных систем, ее главные преимущества. Причины популярности, особенности применения технологии. Формулировка основных принципов разработки. Среды разработки, использующие принципы RAD.
презентация [866,8 K], добавлен 02.04.2013Особенности разработки информационных систем с использованием унифицированного языка моделирования UML. Основные этапы рационального унифицированного процесса разработки информационных систем с примерами и иллюстрациями. Реализация информационной системы.
методичка [950,2 K], добавлен 23.01.2014Методология структурного анализа и проектирования информационных систем. Базовый стандарт процессов жизненного цикла программного обеспечения. Цели и принципы формирования профилей информационных систем. Разработка идеальной модели бизнес-процессов.
презентация [152,1 K], добавлен 07.12.2013Методологии разработки информационных систем в отечественной и зарубежной литературе. Государственные и международные стандарты в области разработки программного обеспечения. Разработка фрагмента информационной системы "Учебно-методический ресурс".
курсовая работа [364,6 K], добавлен 28.05.2009Жизненный цикл информационных систем, методологии и технологии их проектирования. Уровень целеполагания и задач организации, классификация информационных систем. Стандарты кодирования, ошибки программирования. Уровни тестирования информационных систем.
презентация [490,2 K], добавлен 29.01.2023Условия эффективности, формы и типы использования информационных ресурсов в процессе подготовки социального педагога. Методика и анализ исследования функций и значения ресурсов сети Интернет в современном педагогическом процессе подготовки студентов.
дипломная работа [171,1 K], добавлен 16.12.2015Факторы угроз сохранности информации в информационных системах. Требования к защите информационных систем. Классификация схем защиты информационных систем. Анализ сохранности информационных систем. Комплексная защита информации в ЭВМ.
курсовая работа [30,8 K], добавлен 04.12.2003Общество и информация, определение информации и ее свойства, базовые информационные процессы. Виды и особенности экономической информации. Понятие, виды и этапы развития информационных компьютерных систем. Обзор информационных ресурсов Интернет.
шпаргалка [645,8 K], добавлен 22.02.2011