Экспертная система диагностирования по неструктурированным признакам
Экспертная система диагностики состояния плодовых деревьев. Определение значений неструктурированных признаков. Методы парных сравнений объекта диагноза с эталонами. Исследование зависимости достоверности результатов от квалификации пользователей.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 29.01.2019 |
Размер файла | 583,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http: //www. allbest. ru/
Институт проблем регистрации информации НАН Украины ул. Н. Шпака, 2, 03113 Киев, Украина
Институт прикладного системного анализа при НТУУ «КПИ» проспект Победы, 37-а, 03056 Киев, Украина
Экспертная система диагностирования по неструктурированным признакам
В.Г. Тоценко, Е.А. Петрова, Л.А. Чернявская
Аннотация
Описана экспертная система диагностики плодовых деревьев по неструктурированным признакам. Для определения значений неструктурированных признаков использованы методы парных сравнений объекта диагноза с эталонами. Приведены методика и результаты экспериментального исследования зависимости достоверности результатов от квалификации пользователей, которые свидетельствуют об их слабой корреляции.
Ключевые слова: диагностика, экспертные системы.
Введение
Задача диагностирования является одной из важнейших задач медицины, техники, сельского хозяйства и т.д. В настоящей работе предпринята попытка практической проверки принципов построения экспертной системы диагностирования (ЭСД) по неструктурированным признакам.
Для этого была создана ЭСД плодовых деревьев, с помощью которой решается задача исследования зависимости достоверности диагностирования от квалификации эксперта в данной области. Значения неструктурированных диагностических признаков (НДП) могут быть заданы множествами эталонов, в качестве которых в данной работе были приняты изображения (например, характерные для данной болезни дерева изображения поврежденных листьев, плодов, коры).
Эта задача имеет принципиальное решение, поскольку, в зависимости от результатов исследований, решается вопрос о возможности использования ЭСД экспертами разной квалификации без потери достоверности результатов.
1. Концепция системы
Система представляет собой ЭСД, с помощью которой производится диагностика болезней плодовых деревьев. Система рассчитана как на экспертов, которые имеют соответствующий уровень квалификации и знания в области сельского хозяйства, так и на людей, которые не имеют их. Определение значений диагностических признаков производится путем визуального сравнения объекта диагностирования (ОД) с эталонами, записанными в базе знаний ЭСД, и определения степени похожести эталона на ОД, а не путем опознавания заболевания.
Интерфейс системы рассчитан на людей с разным уровнем компьютерной подготовки.
Экспертная система работает в следующих режимах: 1) построение базы знаний; 2) определение значений неструктурированных диагностических признаков; 3) вычисление распределения вероятностей болезней от объекта диагноза.
Вводятся входные данные:
-- Fb = {fz}, z = (1,t) -- множество болезней;
-- множество E множеств эталонов
Eh = {ejh}, j = (1,kh), h = (1,n),
описывающих значения НДП, где ejh -- эталон, описывающий j-е значение h-го НДП;
Y = {yz}, z = (1,t)
-- множество продукций, задающих условия наличия у ОД болезней из множества Fb.
В системе построена база знаний (БЗ), которая состоит из множеств значений (эталонов): поражение коры, поражение листьев и поражение плодов. Так как диагностирование может проходить с использованием части диагностических признаков, то эксперту предлагается выбрать, какие признаки будут участвовать в диагностике.
Для обеспечения универсальности системы БЗ спроектирована дополняемой, то есть эксперт может сам вводить новые эталоны, новые болезни и записывать условия наличия у ОД болезни. Множество диагностических признаков представляет собой множество
C = {ch}, h = (1,n).
Для каждого из признаков ch С задано множество эталонов
Eh = {ejh}, j = (1,kh),
значений признака ch, задающее h-й диагностический признак (например, диагностический признак с1 -- поражение коры, для которого задано множество
Е1 = {e11, e12, e13,...},
где ejh -- изображение коры с каким-либо повреждением).
В БЗ определено множество болезней и множество продукций, задающих условия наличия у ОД болезней.
Построение БЗ происходит до начала диагностирования. Диагностирование происходит в несколько этапов, и его суть состоит в чередовании процессов определения коэффициентов сходства ОД с эталонами, присваивания их дугам графа, задающего БЗ, определения вероятности существования у ОД i-й болезни путем вычисления вероятности связности начальной вершины с вершиной, отмеченной болезнью yi и вычисления показателя различимости болезней.
Для вычисления значений коэффициентов сходства можно воспользоваться одним из методов, описанных в [1]. В данной работе реализованы методы:
-- «линия без обратной связи с экспертом»;
-- «квадрат с обратной связью с экспертом».
Эксперт выбирает метод, после чего представляются эталоны, которые попарно сравниваются по критерию сходства с объектом диагностирования, и требуется определить степень превосходства сходства с ОД одного эталона над другим.
Построение базы знаний
Исходными данными для построения БЗ являются:
-- Fb = {fz}, z = (1,t ) -- множество болезней;
-- множество E множеств эталонов
Eh = {ejh}, j = (1,kh), h = (1,n),
описывающих значения НДП, где ejh -- эталон, описывающий j-е значение h-го НДП;
-- Y = {yz}, z = (1,t)
-- множество продукций, задающих условия наличия у ОД болезней из множества Fb.
База знаний ЭСД задается графом, который строится в несколько этапов. На первом этапе строится основа графа. Вторым этапом является разметка терминальных вершин графа множествами подозреваемых болезней в соответствии с множеством продукций и минимизация графа.
Построение основы
Пусть дано множество НДП
С = {cj}, j = (1,k),
и множество E множеств эталонов
Eh = {ejh}, j = (1,kh), h = (1,n),
задающие значения НДП:
E1 = {e11, e12, e13}; E2 = {e21, e22}; E3 = {e31, e32, e33}.
Требуется построить граф типа дерево, содержащий все пути длины n.
1. Множества Еh нужно упорядочить по мере возрастания числа эталонов, то есть данные множества нужно упорядочить таким образом:
E2 = {e21, e22}; E2 = {e11, e12, е13}; E3 = {e31, e32, e33}.
2. Строится граф, задающий основу БЗ.
Предложенный алгоритм обеспечивает минимизацию числа вершин графа [2].
Проиллюстрируем способ его построения на рассматриваемом примере. Он содержит вершины первого, второго, …, n-уровня, где n -- количество НДП. На рис. 1-3 показан процесс построения основы графа для рассматриваемого примера.
Размещено на http: //www. allbest. ru/
Рис. 1
Рис. 2
Рис. 3
Из i-й вершины j-го уровня, j = (1,kj), исходит kj дуг, каждая из которых входит в вершину (j + 1)-го уровня, причем r-я дуга, r = (1,kj), обозначена символом эталона ejr.
Количество kn вершин n-го уровня равно: n1 Ч n2 Ч … Ч nn.
Отметка терминальных вершин множествами болезней
Задача формулируется следующим образом.
Дано:
-- граф -- основа БЗ;
-- Fb = {fz}, z = (1,t)
-- множество болезней;
-- Y = {yz}
-- множество продукций, описывающих наличие болезни у ОД.
Требуется разместить терминальные вершины графа -- основы БЗ в соответствии с правилами-продукциями.
Для каждой импликанты продукции yi надо найти множество путей, содержащих в качестве отрезка эту импликанту и отметить эти пути болезнью fi. Вершины, не получившие отметки хотя бы одной болезнью, отметить символом U неопознанной болезни. Вершина, в которую ведет путь, отмеченный только признаками «здорового состояния» получает отметку fv, то есть не содержит болезней, описанных в БЗ и неопознанных болезней.
Путь, отмеченный импликантой, содержащей только значения признаков, соответствующие здоровому объекту, ведет в вершину, обозначенную f0, что свидетельствует о том, что объект диагноза не имеет болезней, описанных в базе знаний или неопознанных болезней.
Алгоритм диагностирования
Так как в данной системе БЗ строится до начала процесса диагностирования, то на входе мы имеем граф (рис. 3), терминальные вершины которого отмечены множеством подозреваемых болезней, неопределенных болезней и отсутствием болезней. До начала процесса диагностирования дугам, отмеченным отсутствием болезней, описанных в БЗ, присваиваются коэффициенты сходства равные единице, а остальным дугам -- равные нулю. После этого эксперту предлагается оценить эталоны, в результате чего с помощью методов, описанных в [1], определяются коэффициенты сходства. После оценки коэффициентов сходства с эталонами, задающими значения первого из рассматриваемых НДП, они присваиваются дугам, отмеченным этими значениями НДП, у остальных дуг остаются прежние значения, и рассчитываются вероятности связности начальной вершины с терминальными вершинами. Если степень различимости болезней удовлетворяет пользователя, то процесс диагностирования заканчивается, в противном случае определяются значения следующего диагностического признака и т.д. В качестве функции степени различимости было принято:
k = 1 - pc/pmax,
где pmax -- максимальное значение вероятности наличия болезни; pc -- следующее по величине за pmax значение вероятности болезни.
Неудовлетворительное значение коэффициента различимости может быть не только следствием недостаточного количества НДП и их малой информативности, но и наличием у ОД сразу нескольких болезней.
Методы определения точных значений или оценок вероятности связности вершин графа достаточно разработаны. В данной работе был применен метод определения оценок вероятностей связности, описанный в [3], сущность которого состоит в представлении графа в виде параллельного соединения последовательно соединенных ребер с последующим вычислением оценки вероятности связности.
Описание работы системы
Как уже говорилось, БЗ в данной системе является изменяемой, поэтому пользователю в начале предлагается выбрать один из режимов работы программы:
a) изменение БЗ;
б) диагностирование.
В режиме изменения БЗ эксперту предлагается выбрать способ изменения БЗ:
a) введение изображения;
б) введение болезни или правила.
При выборе первого режима эксперт может дополнить БЗ новым изображением.
При выборе второго режима эксперт может ввести новую болезнь и правило определения этой болезни, или выбрать болезнь из списка и ввести правило определения этой болезни (пример на рис. 4).
При выборе второго режима (диагностирование) происходит сам процесс диагностирования.
Так как не все диагностические признаки могут участвовать в процессе диагностирования, то система предлагает выбор тех признаков, которые будут использованы в диагностировании.
Рис. 4
Далее эксперту предлагается выбрать метод вычисления коэффициентов сходства, после чего необходимо ввести изображение объекта диагностирования, причем программа указывает, какой это будет диагностический признак.
Далее начинается сам процесс диагностирования. Поочередно появляются изображения (значения диагностических признаков), и эксперту нужно оценить, какое из изображений больше похоже на ОД (рис. 5).
Рис. 5
После этого указывается степень превосходства сходства (рис. 6).
Рис. 6
Диагностирование по другим признакам (повреждение плодов, листьев) происходит аналогично. После определения таким образом оценок диагностических признаков, рассчитываются компоненты распределения вероятностей болезней и коэффициент контрастности.
В итоге, на экране монитора появляются результаты диагностирования, как показано на рис. 7.
Рис. 7
экспертный плодовый дерево пользователь
Методика эксперимента
Было проведено более двадцати экспериментов по диагностике болезней плодовых деревьев. Целью этих экспериментов было определение зависимости достоверности результатов диагностирования от квалификации экспертов при определении болезней яблони по неструктурированным диагностическим признакам. В них брали участие люди разной квалификации: 7 человек -- специалисты в данной области, это значит, что они раньше имели возможность пользоваться какими-то вспомогательными программами при диагностике болезней; 9 человек -- садовники, которые знакомы с данной проблематикой и имели возможность оценивать болезнь, но никогда не делали этого с профессиональной точки зрения; 5 человек -- это люди, которые раньше никогда не сталкивались с подобной проблемой.
Каждому пользователю системы, а он автоматически становился экспертом, предоставлялась возможность пользоваться системой без подсказки разработчиков.
Сначала эксперту нужно было определить, по каким признакам он будет проводить парные сравнения, далее необходимо было выбрать метод, по которому производится оценка. Только после этого выбирался объект оценивания для самостоятельного ввода. В зависимости от метода оценивания, система предъявляла пары эталонов и предлагала определить степень превосходства сходства одного эталона объекта диагноза над другим эталоном. В каждый момент времени эксперт имел возможность сделать перерыв и затем продолжить диагностирование с того момента, на котором он остановился.
Результаты эксперимента были сведены в таблицы, которые приведены ниже.
Таблица 1
Вероятность болезни Название болезни |
Специалисты |
||||||||
* |
P1 |
P2 |
P3 |
P4 |
P5 |
P6 |
P7 |
||
Черный рак |
1 |
0,86 |
0,85 |
0,91 |
0,79 |
0,89 |
0,98 |
0.99 |
|
Обыкновенный рак |
0 |
0,11 |
0,14 |
0,09 |
0,16 |
0,09 |
0 |
0,01 |
|
Лишайник |
0 |
0,01 |
0,01 |
0 |
0,03 |
0,02 |
0,02 |
0 |
|
Цитоспороз коры |
0 |
0,02 |
0 |
0 |
0,03 |
0,02 |
0 |
0 |
|
Монилиозная гниль |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
Филлостикоз |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
Парша |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
Серая тля |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
Коэффициент контрастности |
1 |
0,87 |
0,95 |
0,90 |
0,87 |
0,90 |
0,97 |
0,99 |
|
Математическое ожидание ошибки |
0 |
0,07 |
0,08 |
0,05 |
0,11 |
0,06 |
0,01 |
0 |
* -- истинное значение «черный рак»
Таблица 2
Вероятность болезниНазваниеболезни |
Садоводы-любители |
|||||||||
* |
P1 |
P2 |
P3 |
P4 |
P5 |
P6 |
P7 |
P8 |
||
Черный рак |
1 |
0,75 |
0,81 |
0,76 |
0,73 |
0,82 |
0,87 |
0,71 |
0,84 |
|
Обыкновенный рак |
0 |
0,11 |
0,21 |
0.22 |
0,16 |
0,16 |
0,03 |
0,15 |
0,04 |
|
Лишайник |
0 |
0,01 |
0 |
0 |
0,03 |
0,01 |
0,02 |
0,05 |
0,02 |
|
Цитоспороз коры |
0 |
0,02 |
0 |
0 |
0,03 |
0,01 |
0,07 |
0,07 |
0,05 |
|
Монилиозная гниль |
0 |
0 |
0 |
0 |
0 |
0 |
0,01 |
0 |
0,01 |
|
Филлостикоз |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0,04 |
|
Парша |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
Серая тля |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
Коэффициент контрастности |
1 |
0,78 |
0,74 |
0,71 |
0,78 |
0,80 |
0,91 |
0,79 |
0,94 |
|
Математическое ожидание ошибки |
0 |
0,07 |
0,11 |
0,11 |
0,11 |
0,09 |
0,07 |
0,15 |
0,07 |
Таблица 3
Вероятность болезниНазвание болезни |
Дилетанты |
||||||
* |
P1 |
P2 |
P3 |
P4 |
P5 |
||
Черный рак |
1 |
0.75 |
0.70 |
0.64 |
0,85 |
0,74 |
|
Обыкновенный рак |
0 |
0,13 |
0.21 |
0,19 |
0,06 |
0,16 |
|
Лишайник |
0 |
0,01 |
0,04 |
0,06 |
0,04 |
0,04 |
|
Цитоспороз коры |
0 |
0,03 |
0,03 |
0,04 |
0 |
0,04 |
|
Монилиозная гниль |
0 |
0,02 |
0,01 |
0,05 |
0,05 |
0 |
|
Филлостикоз |
0 |
0,06 |
0,01 |
0,02 |
0 |
0,02 |
|
Парша |
0 |
0 |
0 |
0 |
0 |
0 |
|
Серая тля |
0 |
0 |
0 |
0 |
0 |
0 |
|
Коэффициент контрастности |
1 |
0,83 |
0,70 |
0,71 |
0,93 |
0,78 |
|
Математическое ожидание ошибки |
0 |
0,13 |
0,15 |
0,18 |
0,08 |
0,13 |
По результатам эксперимента (табл. 1-3) было определено математическое ожидание ошибки диагностирования:
Мд = ,
где Pi -- вероятность наличия болезней по результатам диагностирования; -- истинное значение вероятности наличия болезни.
Средние значения математического ожидания ошибки диагностирования по каждому классу экспертов получились следующие: специалисты -- Мдср = 0,05; садоводы-любители -- Мдср = 0,0975; дилетанты -- Мдср = 0,13.
Выводы
По результатам эксперимента можно сказать, что ошибка эксперта, который имеет высокую квалификацию или вообще ее не имеет, не очень отличается (приблизительно 8 процентов). Поэтому можно сделать вывод, что достоверность результатов диагностирования мало зависит от квалификации экспертов, а это, в свою очередь, означает, что созданная система универсальна и имеет право на жизнь и конкуренцию.
Экспериментальное исследование ЭСД плодовых деревьев по неструктурированным диагностическим признакам позволяет сделать следующие выводы:
1) реализованный метод диагностики позволяет диагностировать болезни плодовых деревьев с приемлемой для практики достоверностью;
2) достоверность результатов диагностирования мало зависит от специальной подготовки пользователя.
Литература
1. Тоценко В.Г. Методы и системы поддержки принятия решений. Алгоритмический аспект. -- К.: Наук. думка. -- 2002. -- 382 с.
2. Тоценко В.Г. Обобщенная концепция экспертных систем диагностирования // Электрон. моделирование. -- 1995. -- № 5. -- С. 26-33.
3. Тоценко В.Г., Скрипник И.В. Метод определения оценок надежности сетей // Электрон. моделирование. -- 1992. -- № 5. -- С. 55-58.
Размещено на Allbest.ru
...Подобные документы
Экспертная система (ЭС), осуществляющая обработку опытных данных дисперсионным и регрессионным анализом. Методы статистической обработки данных. Характеристики металлоконструкций и параметры нагружения. Анализ работоспособности металлоконструкции.
дипломная работа [2,1 M], добавлен 12.03.2008Процесс подбора экспертной системой наиболее подходящих вариантов, оценки альтернатив в поисках оптимально подходящего конкретному пользователю мотоцикла. Экспертная система как набор программ и база знаний. Исходный код разрабатываемой системы.
курсовая работа [626,5 K], добавлен 23.11.2012Понятие одноранговой локальной сети и сети с выделенным сервером. Сущность технологий обработки информации "файл-сервер" и "клиент-сервер". Экспертная система, ее базовая структура, особенности и применение. Технология разработки программного обеспечения.
контрольная работа [22,7 K], добавлен 24.06.2009Экспертная система - компьютерная программа, способная частично заменить специалиста-эксперта в разрешении проблемной ситуации. Структура, режимы функционирования, классификация экспертных систем, этапы разработки. Базы знаний интеллектуальных систем.
реферат [32,2 K], добавлен 04.10.2009Создание интеллектуальной экспертной системы по подбору комплектующих для стационарного компьютера. Медицина как пример экспертной системы с использованием метода Криса-Нейлора. Извлечение знаний, их структурирование, представление, стратегия вывода.
контрольная работа [827,5 K], добавлен 14.12.2012Рассмотрение экспертных систем: классификация, назначение, общие принципы построения и функционирования. Среда разработки данных систем: BorlandC++ Builder 6.0 и AMZI! Prolog. Описание процесса разработки экспертной системы "Выбор спортивного инвентаря".
курсовая работа [426,9 K], добавлен 19.08.2012Исследование общих сведений о медицинских экспертных системах, способных заменить специалиста-эксперта в разрешении проблемной ситуации. Обучение искусственных нейронных сетей в программе Statistica 7. Обзор программной реализации модуля кластеризации.
дипломная работа [5,9 M], добавлен 14.06.2012Основные электронные музыкальные инструменты, использующиеся для удобства звукозаписи и обработки музыки. Характеристики и типы электрогитар. Экспертная система, помогающая принять решение в выборе электрогитары. Системы пользовательского интерфейса.
реферат [43,4 K], добавлен 14.08.2010Понятие экспертных систем, их классификация, виды и структура. Построение продукционной модели экспертной системы прогнозирования результатов сессии на основании анализа успеваемости, ее реализация в языке логического программирования Visual Prolog.
дипломная работа [1,6 M], добавлен 25.01.2011Пример экспертной системы с использованием метода Криса-Нейлора. Структура базы данных. Стратегия вывода результатов выбора страны. Руководство пользователя, редактирование базы знаний. Режим тестирования, его завершение, блок объяснения решения.
контрольная работа [1,6 M], добавлен 29.12.2012Разработка базы данных с применением выбранной модели представления знаний и системы пользовательского интерфейса. Определение системы логического вывода. Спецификация составных частей программы. Обзор основных используемых приёмов и методов обработки.
курсовая работа [765,6 K], добавлен 12.05.2013Мобильная система Вооруженных Сил - защищенная операционная система общего назначения. Изоляция и защита пользователей друг от друга. Правила допуска в систему. Привилегированные и непривилегированные пользователи. Способы проверки безопасности.
учебное пособие [1,7 M], добавлен 09.06.2009Классификация экспертных систем и программного обеспечения для их разработки. Практическое применение искусственного интеллекта на машиностроительных предприятиях и в экономике. Составление дерева решения. Язык функционального программирования LISP.
курсовая работа [542,6 K], добавлен 12.12.2013Изучение технологии экспертных систем, которая заключается в том, чтобы получить от эксперта его знания и при необходимости извлекать их из памяти компьютера. Задачи для решения, которых создаются ЭС: интерпретация данных, диагностика, прогнозирование.
реферат [22,6 K], добавлен 12.09.2010Основные этапы и механизм процесса создания, ведения и модификации баз знаний в экспертных системах. Понятие предметного (фактуального) и проблемного (операционного) знания. Модели предоставления знаний: сетевая, фреймовая, логическая, продукционная.
презентация [243,0 K], добавлен 16.10.2013Понятие и свойства искусственных нейронных сетей, их функциональное сходство с человеческим мозгом, принцип их работы, области использования. Экспертная система и надежность нейронных сетей. Модель искусственного нейрона с активационной функцией.
реферат [158,2 K], добавлен 16.03.2011Разработка базы знаний и её тестирование с помощью оболочки экспертных систем Little Helper. Оценка технических характеристик телевизора, ценового фактора. Практическое применение искусственного интеллекта на машиностроительных предприятиях и в экономике.
курсовая работа [1,0 M], добавлен 19.09.2012Принцип работы алгоритма бинарного поиска в массиве. Способы исследования алгоритма "прямое включение". Формулы зависимости числа сравнений от элементов в массиве. Графики среднего числа сравнений и перемещений практических и теоретических измерений.
курсовая работа [646,1 K], добавлен 07.01.2014Структура экспертных систем, их классификация и характеристики. Выбор среды разработки программирования. Этапы создания экспертных систем. Алгоритм формирования базы знаний с прямой цепочкой рассуждений. Особенности интерфейса модулей "Expert" и "Klient".
курсовая работа [1,1 M], добавлен 18.08.2009Назначение и архитектура экспертных систем, их применение в сфере образования. Экспертные системы тестирования, принципы их функционирования. Инструментальные средства создания приложения и разработка программы тестирования. Описание программы, листинг.
дипломная работа [706,4 K], добавлен 07.05.2012