АСК-анализ, моделирование и идентификация живых существ на основе их фенотипических признаков
Изучение и характеристика интеллектуальной информационной системы "Эйдос". Разработка методики оценки качества математических моделей систем искусственного интеллекта для классификации животных по внешним признакам на основе базы данных репозитария UCI.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 14.05.2017 |
Размер файла | 4,8 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Кубанский государственный аграрный университет
АСК-анализ, моделирование и идентификация живых существ на основе их фенотипических признаков
Луценко Евгений Вениаминович, д.э.н., к.т.н., профессор
Пенкина Юлия Николаевна, студентка факультета прикладной информатики
Краснодар
Аннотация
Так как существует множество альтернатив систем искусственного интеллекта, то возникает необходимость оценки качества математических моделей и систем искусственного интеллекта, которые поддерживают эти модели. Данная работа направлена на изучение и разработку типовой методики использования базы данных репозитария UCI для оценки качества математических моделей систем искусственного интеллекта. Целью работы разработка методики оценки качества математических моделей систем искусственного интеллекта для классификации животных по внешним признакам на основе базы данных репозитария UCI. Задачами работы являются: систематизация, закрепление и расширение теоретических и практических знаний по дисциплине "Интеллектуальные информационные системы и технологии"; изучение интеллектуальной информационной системы "Эйдос"; решение поставленной цели с помощью интеллектуальной информационной системы "Эйдос". Объектом исследования является база данных "zoo" репозитария UCI. В первой главе работы происходит обзор теории к решению задачи, выявление проблематики, исходных данных, инструментария и метризации шкал. Во второй главе работы представлены решение поставленной задачи. В заключении приведены результаты работы, сделаны выводы по достижению поставленных целей и задач
Ключевые слова: АСК-анализ модели идентификация живые существа фенотипические признаки
1. Краткая теория
1.1 Проблематика
Создание систем искусственного интеллекта является одним из важных направлений развития информационных систем. Так как существует множество альтернатив систем искусственного интеллекта, то возникает необходимость оценки качества математических моделей и систем искусственного интеллекта, которые поддерживают эти модели.
Существует задача оценки качества математических моделей систем искусственного интеллекта для классификации животных по внешним признакам на основе базы данных репозитария UCI, решение которой довольно сложное.
Имеются многие технологии, которые позволяют решить эту задачу, но разработка довольная дорогостоящая, так как надо иметь мощные технологии и инструментарий. Для достижения поставленной цели необходимы свободный доступ к тестовым исходным данным и методика, которая поможет преобразовать эти данные в форму, которая необходима для работы в системе искусственного интеллекта.
1.2 Исходные данные
В данной работе использована база данных "zoo" из банка исходных данных по задачам искусственного интеллекта - репозитария UCI, который выполнен сотрудниками Школы информатики и компьютерных исследований Калифорнийского университета США. На момент написания работы этот банк включает в себя 290 баз исходных данных по различным задачам.
1.3 Инструментарий
Для решения задачи используем стандартные возможности Microsoft Office Word и Excel. А так же систему искусственного интеллекта "Эйдос-Х++" версии от 27.05.2014.
Математическая модель системы "Эйдос" была разработана в 1979 и впервые прошла экспериментальную апробацию в 1981 году. С 1981 по 1992 система "Эйдос" неоднократно реализовалась на платформе Wang (на компьютерах Wang-2200С). Для IBM-совместимых персональных компьютеров система "Эйдос" впервые реализована в 1992 году и с тех пор совершенствуется постоянно, вплоть до настоящего времени [1, 12, 13].
Система "Эйдос" предназначена для [2]:
1. Прогнозирования состояния сложных систем и разработки методик их тестирования, разработки тестов в разных предметных областях;
2. Эксплуатации при массовой обработки информации в промышленном режиме этих методик;
3. Анализа достоверности заполнения исходных данных, а также для углубленного анализа результатов этого тестирования, который включает информационный (ранговый) и кластерно-конструктивный анализ эталонных описаний признаков и классов распознавания.
Система является бесплатным, широкодоступный лицензионным программным продуктом.
Отличием от экспертных систем системы "Эйдос-Х++" является то, что для обучения работы на ней от экспертов не требуется формулирование правил и весовых коэффициентов, а само их решение о принадлежности объекта и его состояния к определенному классу. Правила и весовые коэффициенты система формулирует автоматически.
Отличием от систем статистической обработки информации являются цели самой системы:
- формирование образов распознавания и признаков по данным обучающей выборки;
- исключение тех признаков из системы, которые являются менее ценными для решения задач системы;
- вывод в удобной текстовой и графической форме для анализа и восприятия информации об обобщенных образам классов распознавания и их признаков;
- сравнение обобщенных образов классов распознавания с распознаваемыми формальными описаниями объектов;
- кластерно-конструктивный анализ (сравнение обобщенных образов классов распознавания и признаков друг с другом);
- расчет частотных распределений классов распознавания и признаков, а также двумерных матриц сопряженности на основе критерия X2 и коэффициентов Пирсона, Чупрова и Крамера;
- результаты анализа выводятся в форме когнитивных диаграмм и семантических сетей.
Выходит, что системы выполняет за исследователя-аналитика работу, которую приходится выполнять вручную при использовании систем статистической обработки информации. Поэтому система "Эйдос" аналитическая.
Система содержит базовые когнитивные операции, которые дают право называть ее когнитивной системой:
- восприятие;
- присвоение знаковых имен;
- обобщение, синтез, индукция;
- дедукция;
- анализ признаков;
- абстрагирование;
- классификация обобщенных образов;
- классификация признаков;
- сравнение обобщенных образов;
- сравнение признаков;
- идентификация конкретных объектов.
Система "Эйдос" генерирует более пятидесяти различных текстовых форм, а также более шестидесяти различных видов двух- и трехмерных графических форм.
Основными характеристиками системы являются:
1. Обеспечивает на уровне девяносто процентов достоверность распознавания обучающей выборки, которая повышается после оптимизации системы признаков;
2. Обеспечивает одновременную обработку сотен тысяч классов распознавания и признаков, при этом признаки могут быть как качественные, так и количественные;
3. Возможность разработки супертестов, а так же интеграции стандартных тестов в свою среду;
4. Обеспечивает высокую степень наглядности, благодаря научной графики, также имеется естественный словесный интерфейс при обучении системы и запросах на распознавание.
Система может быть применена в таких областях, как:
- синтез адаптивных систем автоматизированного управления сложными нелинейными системами в различных предметных областях;
- определение оптимальной профессиональной принадлежности, профессиональной деятельности и перспектив обучения, также в специальных областях, которые требуют от человека адекватного поведения в экстремальных ситуациях и специфических способностей;
- исследования на основе обработки больших объемов информации по политологии, экономике, социологии и прикладной психологии;
- медицинская диагностика, мониторинг динамики состояний больных, определение гомеопатических типов, изучение взаимосвязей между лечебными воздействиями и эффектом;
- изучение тенденций фондового рынка, анализ и прогнозирование биржевых ситуаций, прогнозирование курсов валют и ценных бумаг;
- в любых областях, в которых возникают задачи идентификации и прогнозирования ситуаций или состояний сложных объектов по внешним признакам;
- изучение влияния факторов различной природы на количество и качество результатов деятельности;
- использование выявленных зависимостей для разработки обоснованных рекомендаций.
Microsoft Office Word - текстовый процессор, предназначенный для создания, просмотра и редактирования текстовых документов, с локальным применением простейших форм таблично-матричных алгоритмов. Выпускается корпорацией Microsoft в составе пакета Microsoft Office [3].
Программа Microsoft Office Excel созданна корпорацией Microsoft и предназначена для работы с электронными таблицами [4]. Она предоставляет возможности экономико-статистических расчетов, графические инструменты и язык макропрограммирования VBA. Microsoft Excel входит в состав Microsoft Office и на сегодняшний день является одним из наиболее популярных приложений в мире. эйдос информационный репозитарий
1.4 Метризация шкал
Измерительные шкалы - это инструмент создания формальных моделей реальных объектов, а так же и инструмент, который позволяет повысить степень формализации этих моделей до такого уровня, при котором возможна их реализация на компьютерах [5].
Чем выше степень формализации модели, тем точнее решаются различные задачи с использованием этих моделей, тем проще использовать модели для проектирования искусственный систем и их создания, а также тем более точные и развитые математические методы могут применяться в этих моделях.
"Задача метризации шкал" была четко сформулирована, поставлена и решена в 1958 году датским математиком Г. Рашем. Задача метризации шкал - это задача преобразования шкалы к виду наиболее формализованному. Метризация шкал осуществляется путем ввода метрики (единицы измерения) и проводится с целью повышения степени формализации этой шкалы. В отношении к системе "Эйдос" метризация шкал - введение единицы измерения и отношений порядка и начала отсчета на шкале.
В интеллектуальной системе "Эйдос" в системно-когнитивном анализе предлагается 7 способов метризации всех типов шкал, которые обеспечивают корректную совместную сопоставимую количественную обработку разнородных по своей природе факторов, различных единиц измерения. Факторы описываются шкалами, а значения факторов - градациями шкал.
Существует три основных группы факторов:
- физические;
- социально-экономические;
- психологические (субъективные).
В каждой группе есть много различных видов факторов, но в СК-анализе они рассматриваются с единой точки зрения - сколько информации содержится в их значениях о переходе объекта, на который они действуют, в определенное состояние, при этом направление влияния и сила значений факторов измеряется в одних общих для факторов единицах измерения (единицах количества информации). По этой причине можно складывать силу и направление влияния всех действующих на объект значений факторов, и определять результат их совместного влияния на объект. При этом объект является нелинейным, а факторы взаимодействуют друг с другом внутри него (не выполняется принцип суперпозиции).
При условии, что разные факторы измеряются в различных единицах измерения, результат сравнения объектов будет зависеть от единиц измерения факторов, что недопустимо.
Измерение - Отображение реальных объектов в формальных шкалах. Система "Эйдос" представляет - средство для построения и применения измерительных инструментов в различных предметных областях. В ней реализованы разнообразные технологии метризации, которые позволяют любые свойства объектов (количественные и качественные) исследовать в наиболее сильных абсолютных шкалах знаний.
2. Решение поставленной задачи
2.1 Описание решения
Решение поставленной задачи выполним в два этапа:
1. Преобразование исходных данных из HTML-формата в промежуточные файлы в Excel;
2. Преобразование исходных данных из промежуточных файлов в базы данных системы "Эйдос".
2.2 Преобразование исходных данных из HTML-формата в промежуточные файлы в Excel
Из банка исходных данных по задачам искусственного интеллекта - репозитария UCI получаем исходную информацию по базе данных "zoo", которую оставим без изменений [6].
Общее описание задачи:
1. Title: Zoo database
2. Source Information
-- Creator: Richard Forsyth
-- Donor: Richard S. Forsyth
8 Grosvenor Avenue
Mapperley Park
Nottingham NG3 5DX
0602-621676
-- Date: 5/15/1990
3. Past Usage:
-- None known other than what is shown in Forsyth's PC/BEAGLE User's Guide.
4. Relevant Information:
-- A simple database containing 17 Boolean-valued attributes. The "type"
attribute appears to be the class attribute. Here is a breakdown of
which animals are in which type: (I find it unusual that there are
2 instances of "frog" and one of "girl"!)
Class# Set of animals:
====== ===============================================================
1 (41) aardvark, antelope, bear, boar, buffalo, calf,
cavy, cheetah, deer, dolphin, elephant,
fruitbat, giraffe, girl, goat, gorilla, hamster,
hare, leopard, lion, lynx, mink, mole, mongoose,
opossum, oryx, platypus, polecat, pony,
porpoise, puma, pussycat, raccoon, reindeer,
seal, sealion, squirrel, vampire, vole, wallaby,wolf
2 (20) chicken, crow, dove, duck, flamingo, gull, hawk,
kiwi, lark, ostrich, parakeet, penguin, pheasant,
rhea, skimmer, skua, sparrow, swan, vulture, wren
3 (5) pitviper, seasnake, slowworm, tortoise, tuatara
4 (13) bass, carp, catfish, chub, dogfish, haddock,
herring, pike, piranha, seahorse, sole, stingray, tuna
5 (4) frog, frog, newt, toad
6 (8) flea, gnat, honeybee, housefly, ladybird, moth, termite, wasp
7 (10) clam, crab, crayfish, lobster, octopus,
scorpion, seawasp, slug, starfish, worm
5. Number of Instances: 101
6. Number of Attributes: 18 (animal name, 15 Boolean attributes, 2 numerics)
7. Attribute Information: (name of attribute and type of value domain)
1. animal name: Unique for each instance
2. hairBoolean
3. feathersBoolean
4. eggsBoolean
5. milkBoolean
6. airborneBoolean
7. aquaticBoolean
8. predatorBoolean
9. toothedBoolean
10. backboneBoolean
11. breathesBoolean
12. venomousBoolean
13. finsBoolean
14. legsNumeric (set of values: {0,2,4,5,6,8})
15. tailBoolean
16. domesticBoolean
17. catsizeBoolean
18. typeNumeric (integer values in range [1,7])
8. Missing Attribute Values: None
9. Class Distribution: Given above
Обучающая выборка:
aardvark,1,0,0,1,0,0,1,1,1,1,0,0,4,0,0,1,1
antelope,1,0,0,1,0,0,0,1,1,1,0,0,4,1,0,1,1
bass,0,0,1,0,0,1,1,1,1,0,0,1,0,1,0,0,4
bear,1,0,0,1,0,0,1,1,1,1,0,0,4,0,0,1,1
boar,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,1,1
buffalo,1,0,0,1,0,0,0,1,1,1,0,0,4,1,0,1,1
calf,1,0,0,1,0,0,0,1,1,1,0,0,4,1,1,1,1
carp,0,0,1,0,0,1,0,1,1,0,0,1,0,1,1,0,4
catfish,0,0,1,0,0,1,1,1,1,0,0,1,0,1,0,0,4
cavy,1,0,0,1,0,0,0,1,1,1,0,0,4,0,1,0,1
cheetah,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,1,1
chicken,0,1,1,0,1,0,0,0,1,1,0,0,2,1,1,0,2
chub,0,0,1,0,0,1,1,1,1,0,0,1,0,1,0,0,4
clam,0,0,1,0,0,0,1,0,0,0,0,0,0,0,0,0,7
crab,0,0,1,0,0,1,1,0,0,0,0,0,4,0,0,0,7
crayfish,0,0,1,0,0,1,1,0,0,0,0,0,6,0,0,0,7
crow,0,1,1,0,1,0,1,0,1,1,0,0,2,1,0,0,2
deer,1,0,0,1,0,0,0,1,1,1,0,0,4,1,0,1,1
dogfish,0,0,1,0,0,1,1,1,1,0,0,1,0,1,0,1,4
dolphin,0,0,0,1,0,1,1,1,1,1,0,1,0,1,0,1,1
dove,0,1,1,0,1,0,0,0,1,1,0,0,2,1,1,0,2
duck,0,1,1,0,1,1,0,0,1,1,0,0,2,1,0,0,2
elephant,1,0,0,1,0,0,0,1,1,1,0,0,4,1,0,1,1
flamingo,0,1,1,0,1,0,0,0,1,1,0,0,2,1,0,1,2
flea,0,0,1,0,0,0,0,0,0,1,0,0,6,0,0,0,6
frog,0,0,1,0,0,1,1,1,1,1,0,0,4,0,0,0,5
frog,0,0,1,0,0,1,1,1,1,1,1,0,4,0,0,0,5
fruitbat,1,0,0,1,1,0,0,1,1,1,0,0,2,1,0,0,1
giraffe,1,0,0,1,0,0,0,1,1,1,0,0,4,1,0,1,1
girl,1,0,0,1,0,0,1,1,1,1,0,0,2,0,1,1,1
gnat,0,0,1,0,1,0,0,0,0,1,0,0,6,0,0,0,6
goat,1,0,0,1,0,0,0,1,1,1,0,0,4,1,1,1,1
gorilla,1,0,0,1,0,0,0,1,1,1,0,0,2,0,0,1,1
gull,0,1,1,0,1,1,1,0,1,1,0,0,2,1,0,0,2
haddock,0,0,1,0,0,1,0,1,1,0,0,1,0,1,0,0,4
hamster,1,0,0,1,0,0,0,1,1,1,0,0,4,1,1,0,1
hare,1,0,0,1,0,0,0,1,1,1,0,0,4,1,0,0,1
hawk,0,1,1,0,1,0,1,0,1,1,0,0,2,1,0,0,2
herring,0,0,1,0,0,1,1,1,1,0,0,1,0,1,0,0,4
honeybee,1,0,1,0,1,0,0,0,0,1,1,0,6,0,1,0,6
housefly,1,0,1,0,1,0,0,0,0,1,0,0,6,0,0,0,6
kiwi,0,1,1,0,0,0,1,0,1,1,0,0,2,1,0,0,2
ladybird,0,0,1,0,1,0,1,0,0,1,0,0,6,0,0,0,6
lark,0,1,1,0,1,0,0,0,1,1,0,0,2,1,0,0,2
leopard,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,1,1
lion,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,1,1
lobster,0,0,1,0,0,1,1,0,0,0,0,0,6,0,0,0,7
lynx,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,1,1
mink,1,0,0,1,0,1,1,1,1,1,0,0,4,1,0,1,1
mole,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,0,1
mongoose,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,1,1
moth,1,0,1,0,1,0,0,0,0,1,0,0,6,0,0,0,6
newt,0,0,1,0,0,1,1,1,1,1,0,0,4,1,0,0,5
octopus,0,0,1,0,0,1,1,0,0,0,0,0,8,0,0,1,7
opossum,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,0,1
oryx,1,0,0,1,0,0,0,1,1,1,0,0,4,1,0,1,1
ostrich,0,1,1,0,0,0,0,0,1,1,0,0,2,1,0,1,2
parakeet,0,1,1,0,1,0,0,0,1,1,0,0,2,1,1,0,2
penguin,0,1,1,0,0,1,1,0,1,1,0,0,2,1,0,1,2
pheasant,0,1,1,0,1,0,0,0,1,1,0,0,2,1,0,0,2
pike,0,0,1,0,0,1,1,1,1,0,0,1,0,1,0,1,4
piranha,0,0,1,0,0,1,1,1,1,0,0,1,0,1,0,0,4
pitviper,0,0,1,0,0,0,1,1,1,1,1,0,0,1,0,0,3
platypus,1,0,1,1,0,1,1,0,1,1,0,0,4,1,0,1,1
polecat,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,1,1
pony,1,0,0,1,0,0,0,1,1,1,0,0,4,1,1,1,1
porpoise,0,0,0,1,0,1,1,1,1,1,0,1,0,1,0,1,1
puma,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,1,1
pussycat,1,0,0,1,0,0,1,1,1,1,0,0,4,1,1,1,1
raccoon,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,1,1
reindeer,1,0,0,1,0,0,0,1,1,1,0,0,4,1,1,1,1
rhea,0,1,1,0,0,0,1,0,1,1,0,0,2,1,0,1,2
scorpion,0,0,0,0,0,0,1,0,0,1,1,0,8,1,0,0,7
seahorse,0,0,1,0,0,1,0,1,1,0,0,1,0,1,0,0,4
seal,1,0,0,1,0,1,1,1,1,1,0,1,0,0,0,1,1
sealion,1,0,0,1,0,1,1,1,1,1,0,1,2,1,0,1,1
seasnake,0,0,0,0,0,1,1,1,1,0,1,0,0,1,0,0,3
seawasp,0,0,1,0,0,1,1,0,0,0,1,0,0,0,0,0,7
skimmer,0,1,1,0,1,1,1,0,1,1,0,0,2,1,0,0,2
skua,0,1,1,0,1,1,1,0,1,1,0,0,2,1,0,0,2
slowworm,0,0,1,0,0,0,1,1,1,1,0,0,0,1,0,0,3
slug,0,0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,7
sole,0,0,1,0,0,1,0,1,1,0,0,1,0,1,0,0,4
sparrow,0,1,1,0,1,0,0,0,1,1,0,0,2,1,0,0,2
squirrel,1,0,0,1,0,0,0,1,1,1,0,0,2,1,0,0,1
starfish,0,0,1,0,0,1,1,0,0,0,0,0,5,0,0,0,7
stingray,0,0,1,0,0,1,1,1,1,0,1,1,0,1,0,1,4
swan,0,1,1,0,1,1,0,0,1,1,0,0,2,1,0,1,2
termite,0,0,1,0,0,0,0,0,0,1,0,0,6,0,0,0,6
toad,0,0,1,0,0,1,0,1,1,1,0,0,4,0,0,0,5
tortoise,0,0,1,0,0,0,0,0,1,1,0,0,4,1,0,1,3
tuatara,0,0,1,0,0,0,1,1,1,1,0,0,4,1,0,0,3
tuna,0,0,1,0,0,1,1,1,1,0,0,1,0,1,0,1,4
vampire,1,0,0,1,1,0,0,1,1,1,0,0,2,1,0,0,1
vole,1,0,0,1,0,0,0,1,1,1,0,0,4,1,0,0,1
vulture,0,1,1,0,1,0,1,0,1,1,0,0,2,1,0,1,2
wallaby,1,0,0,1,0,0,0,1,1,1,0,0,2,1,0,1,1
wasp,1,0,1,0,1,0,0,0,0,1,1,0,6,0,0,0,6
wolf,1,0,0,1,0,0,1,1,1,1,0,0,4,1,0,1,1
worm,0,0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,7
wren,0,1,1,0,1,0,0,0,1,1,0,0,2,1,0,0,2
В описании задачи мы видим несоответствия:
- атрибут "type" относится к классификационным шкалам и градациям, а не к описательным, так как содержит информацию о принадлежности объекта к классу;
- объект "frog" указан два раза и имеет отличие по одиннадцатому атрибуту;
- атрибут "animal name" не должен включаться в систему атрибутов, так как является прямым указанием на объект.
Для преобразования данных из HTML-формата в Excel необходимо:
1. Скопировать текст обучающей выборки в Microsoft Office Word;
2. Нажать Ctrl+F;
3. В открывшемся окне (рисунок 1) выбрать вкладку "Заменить";
4. В поле "Найти" поставить символ ",";
5. Выбрать поле "Заменить на", нажать "Больше", затем "Специальный", выбрать "Символ табуляции" и нажать "Заменить все" (рисунок 1);
6. Скопировать получившийся текст в Microsoft Office Excel;
7. Используя информацию, содержащеюся в общем описании задачи, привести таблицу к виду, представленному на рисунке 2.
Рисунок 1 - Настройки замены
Рисунок 2 - Фрагмент исходной базы данных в Microsoft Office Excel
База данных животных дополнена значениями до 200 для более точной классификации.
2.3 Преобразование исходных данных из промежуточных файлов в базы данных системы "Эйдос"
Сначала нужно скачать и установить систему.
Для этого по адресу: http://lc.kubagro.ru/aidos/_Aidos-X.htm необходимо открыть и выполнить следующую инструкцию:
Инструкция по скачиванию и установке системы «Эйдос» (объем около 50 Мб)
Система не требует инсталляции, не меняет никаких системных файлов и содержимого папок операционной системы,
т.е. является портативной (portable) программой. Но чтобы она работала необходимо аккуратно выполнить следующие пункты.
1. Скачать самую новую на текущий момент версию системы «Эйдос-Х++» по ссылке:
http://lc.kubagro.ru/a.rar (ссылки для обновления системы даны в режиме 6.2)
2. Разархивировать этот архив в любую папку с правами на запись с коротким латинским именем и путем доступа, включающим только папки с такими же именами (лучше всего в корневой каталог какого-нибудь диска).
3. Запустить систему. Файл запуска: _AIDOS-X.exe
4. Задать имя: 1 и пароль: 1 (потом их можно поменять в режиме 1.2).
5. Выполнить режим 1.11 (только 1-й раз при установке системы в данную папку)
6. Перед тем как запустить новый режим НЕОБХОДИМО ЗАВЕРШИТЬ предыдущий (Help можно не закрывать)
Инструкция по скачиванию и установке обновления системы «Эйдос» до текущей версии (объем около 3 Мб)
Обновление из данного режима |
Обновление из системы «Эйдос-Х++» |
|
1. Скачать файл обновлений системы «Эйдос-Х++» по ссылке:http://lc.kubagro.ru/Install_Aidos-X/Downloads.exe. Лучше всего скачать этот архив в папку, в которой находится система «Эйдос-Х++». Если там такой файл уже есть, то заменить его.2. Если система «Эйдос-Х++» запущена, выйти из нее, иначе занятые файлы, в т.ч. исполнимый модуль системы (файл: _AIDOS-X.exe), не обновятся.3. Разархивировать архив Downloads.exe в папку, в которой находится система «Эйдос-Х++», кликнув по нему и выбрав опцию: «Замена всех файлов». |
1. В системе «Эйдос-Х++») запустить режим 6.2 и кликнуть по самой последней на экранной форме гиперссылке: http://lc.kubagro.ru/Install_Aidos-X/Downloads.exe. Лучше всего скачать этот архив в папку, в которой находится система «Эйдос-Х++». Если там такой файл уже есть, то заменить его.2. Выйти из системы «Эйдос-Х++», т.к. иначе занятые файлы, в т.ч. исполнимый модуль системы (файл: _AIDOS-X.exe), не обновятся.3. Разархивировать архив Downloads.exe в папку, в которой находится система «Эйдос-Х++», кликнув по нему и выбрав опцию: «Замена всех файлов». |
После этого:
- запустить систему. Файл запуска: _AIDOS-X.exe;
- задать имя: 1 и пароль: 1 (потом их можно поменять в режиме 1.2);
- после обновления системы режим 1.11 запускать нет необходимости.
Это наиболее полная на данный момент незащищенная от несанкционированного копирования портативная (portable) версия системы (не требующая инсталляции) с исходными текстами, находящаяся в полном открытом бесплатном доступе (около 50 Мб). Обновление имеет объем около 3 Мб.
Для преобразования исходных данных обучающей выборки в базы данных системы "Эйдос" необходимо файл Microsoft Office Excel, который содержи базу данных животных скопировать в Aidos-X\AID_DATA\Inp_data и назвать Inp_data.xlsx. Этот файл организован следующим образом (рисунок 3):
Рисунок 3 - Помощь по режиму
Далее запускаем систему "Эйдос" из папки "Aidos-X" файлом _aidos-x.exe. Система попросит ввести логин и пароль (рисунок 4). Необходимо ввести: логин - 1, пароль - 1.
Рисунок 4 - Авторизация в системе "Эйдос"
После откроется главное окно программы (рисунок 5).
Рисунок 5 - Главное окно программы "Эйдос"
Далее необходимо выполнить режим 1.11 для сброса приложений и локализации системы (рисунок 6).
Рисунок 6 - Сброс и локализация системы
Для загрузки базы данных необходимо зайти в режим 2.3.2.2 (рисунок 7):
Рисунок 7 - Экранная форма Универсального программного интерфейса импорта данных в систему "Эйдос"
В настройках выбрать:
- "Задайте тип файла исходных данных Inp_data": "XLSX-MS Excel-2007(2010)";
- "Задайте диапазон столбцов классификационных шкал": "Начальный столбец классификационных шкал" - 2, "Конечный столбец классификационных шкал" - 3;
- "Задайте диапазон столбцов описательных шкал": "Начальный столбец описательных шкал" - 4, "Конечный столбец описательных шкал" - 19;
- "Задание параметров формирования сценариев или способа интерпретации текстовых полей": "Не применять сценарный метод АСК-анализа и спец.интерпретацию TXT-полей".
После нажать кнопку "Ок". Далее открывается окно, где размещена информация о размерности модели (рисунок 8). В этом окне необходимо нажать кнопку "Выйти на создание модели".
Рисунок 8 - Задание размерности модели системы "Эйдос"
Далее открывается окно, где происходит процесс импорта данных из внешней БД "Inp_data" в систему "Эйдос" (рисунок 9). В том окне необходимо дождаться завершения формализации предметной области и нажать кнопку "Ок".
Рисунок 9 - Процесс импорта данных из внешней БД "Inp_data" в систему "Эйдос"
Для просмотра классификационных шкал и градаций необходимо запустить режим 2.1 (рисунки 10-11).
Рисунок 10 - Классификационные шкалы и градации (по типу)
Рисунок 11 - Классификационные шкалы и градации
Для просмотра описательных шкал и градаций необходимо запустить режим 2.2 (рисунок 12).
Рисунок 12 - Описательные шкалы и градации
2.4 Синтез и верификация статистических и интеллектуальных моделей
Рассмотрим этапы последовательного повышения степени формализации модели путем преобразования исходных данных в информацию, а далее в знания, которые применяются АСК-анализе и системе "Эйдос-Х" (рисунок 13).
Рисунок 13 - Этапы последовательной обработки данных, информации и знаний в системе "Эйдос-Х"
Далее запустим режим 3.5, в котором происходит выбор моделей для синтеза и верификации (рисунок 14) и нажмем кнопку "Ок". После успешного завершения, также необходимо нажать кнопку "Ок" (рисунок 15).
Рисунок 14 - Выбор моделей для синтеза и верификации
В данном режиме имеется много различных методов верификации моделей. Отметим, что судя по базам репозитария UCI его разработчики не знают, что жаба - это пресмыкающееся, а не земноводное. Есть в этих базах и другие странные вещи, но их не много и это не влияет на достижение целей данной работы.
Рисунок 15 - Синтез и верификация заданных из 10 моделей
В результате выполнения режима 3.5 созданы все модели, со всеми частными критериями, представленными в таблице, перечисленные на рисунке 14, но здесь мы приведем лишь некоторые из них.
Рассмотрим решение задачи идентификации на примере модели INF1, в которой рассчитано количество информации по А. Харкевичу, которое мы получаем о принадлежности идентифицируемого объекта к каждому из классов, если знаем, что у этого объекта есть некоторый признак. Это так называемые частные критерии сходства, приведенные в таблице.
Но если нам известно, что объект обладает не одним, а несколькими признаками, то как посчитать их общий вклад в сходство с теми или иными классами? Для этого в системе «Эйдос» используется 2 аддитивных интегральных критерия: «Сумма знаний» и «Семантический резонанс знаний» [5].
Обозначения:
i - значение прошлого параметра; j - значение будущего параметра;
Nij - количество встреч j-го значения будущего параметра при i-м значении прошлого параметра; M - суммарное число значений всех прошлых параметров; W - суммарное число значений всех будущих параметров.
Ni - количество встреч i-м значения прошлого параметра по всей выборке; Nj - количество встреч j-го значения будущего параметра по всей выборке; N - количество встреч j-го значения будущего параметра при i-м значении прошлого параметра по всей выборке.
Iij - частный критерий знаний: количество знаний в факте наблюдения i-го значения прошлого параметра о том, что объект перейдет в состояние, соответствующее j-му значению будущего параметра;
Ш - нормировочный коэффициент (Е.В.Луценко, 2002), преобразующий количество информации в формуле А.Харкевича в биты и обеспечивающий для нее соблюдение принципа соответствия с формулой Р. Хартли; Pi - безусловная относительная частота встречи i-го значения прошлого параметра в обучающей выборке; Pij - условная относительная частота встречи i-го значения прошлого параметра при j-м значении будущего параметра .
Частные критерии знаний, используемые в настоящее время в СК-анализе и системе «Эйдос-Х++»
Наименование модели знаний и частный критерий |
Выражение для частного критерия |
||
через относительные частоты |
через абсолютные частоты |
||
INF1, частный критерий: количество знаний по А.Харкевичу, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу. Относительная частота того, что если у объекта j-го класса обнаружен признак, то это i-й признак |
|||
INF2, частный критерий: количество знаний по А.Харкевичу, 2-й вариант расчета относительных частот: Nj - суммарное количество объектов по j-му классу. Относительная частота того, что если предъявлен объект j-го класса, то у него будет обнаружен i-й признак. |
|||
INF3, частный критерий: Хи-квадрат: разности между фактическими и теоретически ожидаемыми абсолютными частотами |
--- |
||
INF4, частный критерий: ROI - Return On Investment, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу |
|||
INF5, частный критерий: ROI - Return On Investment, 2-й вариант расчета относительных частот: Nj - суммарное количество объектов по j-му классу |
|||
INF6, частный критерий: разность условной и безусловной относительных частот, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу |
|||
INF7, частный критерий: разность условной и безусловной относительных частот, 2-й вариант расчета относительных частот: Nj - суммарное количество объектов по j-му классу |
Матрица абсолютных частот (модель ABS) (фрагмент)
Код |
Наименование |
1-ТИП-земноводные |
2-ТИП-млекопитающие |
3-ТИП-многоногие |
4-ТИП-насекомые |
5-ТИП-пресмыкающиеся |
6-ТИП-птицы |
7-ТИП-рыбы |
|
1 |
ШЕРСТЬ-есть |
0 |
94 |
0 |
10 |
0 |
0 |
0 |
|
2 |
ШЕРСТЬ-нет |
7 |
7 |
11 |
6 |
14 |
34 |
17 |
|
3 |
ПЕРЬЯ-есть |
0 |
0 |
0 |
0 |
0 |
32 |
0 |
|
4 |
ПЕРЬЯ-нет |
7 |
101 |
11 |
16 |
14 |
2 |
17 |
|
5 |
ЯЙЦО-есть |
7 |
1 |
9 |
16 |
12 |
34 |
17 |
|
6 |
ЯЙЦО-нет |
0 |
100 |
2 |
0 |
2 |
0 |
0 |
|
7 |
МОЛОКО-есть |
0 |
101 |
0 |
0 |
0 |
0 |
0 |
|
8 |
МОЛОКО-нет |
7 |
0 |
11 |
16 |
14 |
34 |
17 |
|
9 |
ВОЗДУШНЫЙ-есть |
0 |
3 |
0 |
11 |
0 |
26 |
0 |
|
10 |
ВОЗДУШНЫЙ-нет |
7 |
98 |
11 |
5 |
14 |
8 |
17 |
|
11 |
ВОДНЫЙ-есть |
7 |
49 |
11 |
16 |
14 |
34 |
17 |
|
12 |
ВОДНЫЙ-нет |
0 |
52 |
0 |
0 |
0 |
0 |
0 |
|
13 |
ХИЩНИК-есть |
3 |
44 |
9 |
3 |
12 |
13 |
14 |
|
14 |
ХИЩНИК-нет |
4 |
57 |
2 |
13 |
2 |
21 |
3 |
|
15 |
ЗУБАСТЫЙ-есть |
4 |
98 |
0 |
0 |
8 |
2 |
17 |
|
16 |
ЗУБАСТЫЙ-нет |
3 |
3 |
11 |
16 |
6 |
32 |
0 |
|
17 |
ПОЗВОНОЧНИК-есть |
7 |
101 |
0 |
0 |
13 |
34 |
17 |
|
18 |
ПОЗВОНОЧНИК-нет |
0 |
0 |
11 |
16 |
1 |
0 |
0 |
|
19 |
ДЫШИТ-есть |
7 |
101 |
3 |
16 |
12 |
32 |
0 |
|
20 |
ДЫШИТ-нет |
0 |
0 |
8 |
0 |
2 |
2 |
17 |
|
21 |
ЯДОВИТЫЙ-есть |
1 |
1 |
2 |
6 |
5 |
0 |
0 |
|
22 |
ЯДОВИТЫЙ-нет |
6 |
100 |
9 |
10 |
9 |
34 |
17 |
|
23 |
ПЛАВНИК-есть |
3 |
2 |
0 |
0 |
0 |
2 |
17 |
|
24 |
ПЛАВНИК-нет |
4 |
99 |
11 |
16 |
14 |
32 |
0 |
|
25 |
НОГИ-восемь |
0 |
0 |
2 |
2 |
0 |
0 |
0 |
|
26 |
НОГИ-две |
0 |
9 |
0 |
0 |
0 |
28 |
0 |
|
27 |
НОГИ-нет |
0 |
8 |
5 |
0 |
7 |
2 |
17 |
|
28 |
НОГИ-три |
0 |
0 |
0 |
0 |
0 |
2 |
0 |
|
29 |
НОГИ-четыре |
7 |
84 |
2 |
0 |
7 |
2 |
0 |
|
30 |
НОГИ-шесть |
0 |
0 |
2 |
14 |
0 |
0 |
0 |
|
31 |
ХВОСТ-есть |
1 |
96 |
1 |
1 |
14 |
34 |
17 |
|
32 |
ХВОСТ-нет |
6 |
5 |
10 |
15 |
0 |
0 |
0 |
|
33 |
ДОМАШНИЙ-есть |
0 |
18 |
0 |
4 |
4 |
13 |
1 |
|
34 |
ДОМАШНИЙ-нет |
7 |
83 |
11 |
12 |
10 |
21 |
16 |
|
35 |
БОЛЬШЕ КОШКИ-есть |
0 |
82 |
2 |
0 |
4 |
9 |
11 |
|
36 |
БОЛЬШЕ КОШКИ-нет |
7 |
19 |
9 |
16 |
10 |
25 |
6 |
|
Сумма числа признаков |
112 |
1616 |
176 |
256 |
224 |
544 |
272 |
||
Число объектов об.выб. |
7 |
101 |
11 |
16 |
14 |
34 |
17 |
Матрица информативностей (модель INF1) в миллибитах(фрагмент)
Код |
Наименование |
1-ТИП-земноводные |
2-ТИП-млекопитающие |
3-ТИП-многоногие |
4-ТИП-насекомые |
5-ТИП-пресмыкающиеся |
6-ТИП-птицы |
7-ТИП-рыбы |
|
1 |
ШЕРСТЬ-есть |
511 |
161 |
||||||
2 |
ШЕРСТЬ-нет |
644 |
-1697 |
644 |
-217 |
644 |
644 |
644 |
|
3 |
ПЕРЬЯ-есть |
1554 |
|||||||
4 |
ПЕРЬЯ-нет |
153 |
153 |
153 |
153 |
153 |
-2332 |
153 |
|
5 |
ЯЙЦО-есть |
644 |
-3404 |
468 |
644 |
509 |
644 |
644 |
|
6 |
ЯЙЦО-нет |
565 |
-922 |
-1133 |
|||||
7 |
МОЛОКО-есть |
599 |
|||||||
8 |
МОЛОКО-нет |
617 |
617 |
617 |
617 |
617 |
617 |
||
9 |
ВОЗДУШНЫЙ-есть |
-1673 |
1083 |
1176 |
|||||
10 |
ВОЗДУШНЫЙ-нет |
196 |
169 |
196 |
-824 |
196 |
-1073 |
196 |
|
11 |
ВОДНЫЙ-есть |
264 |
-370 |
264 |
264 |
264 |
264 |
264 |
|
12 |
ВОДНЫЙ-нет |
599 |
|||||||
13 |
ХИЩНИК-есть |
-117 |
-103 |
450 |
-843 |
490 |
-218 |
455 |
|
14 |
ХИЩНИК-нет |
100 |
89 |
-905 |
408 |
-1116 |
168 |
-931 |
|
15 |
ЗУБАСТЫЙ-есть |
-106 |
358 |
-106 |
-2100 |
385 |
|||
16 |
ЗУБАСТЫЙ-нет |
165 |
-2176 |
908 |
908 |
165 |
855 |
||
17 |
ПОЗВОНОЧНИК-есть |
132 |
132 |
67 |
132 |
132 |
|||
18 |
ПОЗВОНОЧНИК-нет |
1724 |
1724 |
-590 |
|||||
19 |
ДЫШИТ-есть |
137 |
137 |
-1002 |
137 |
2 |
84 |
||
20 |
ДЫШИТ-нет |
1414 |
-13 |
-791 |
1694 |
||||
21 |
ЯДОВИТЫЙ-есть |
565 |
-1776 |
777 |
1412 |
1369 |
|||
22 |
ЯДОВИТЫЙ-нет |
-67 |
60 |
-108 |
-344 |
-319 |
68 |
68 |
|
23 |
ПЛАВНИК-есть |
1116 |
-1580 |
-625 |
1860 |
||||
24 |
ПЛАВНИК-нет |
-379 |
95 |
112 |
112 |
112 |
59 |
||
25 |
НОГИ-восемь |
1936 |
1607 |
||||||
26 |
НОГИ-две |
-641 |
1310 |
||||||
27 |
НОГИ-нет |
-790 |
742 |
826 |
-1051 |
1434 |
|||
28 |
НОГИ-три |
1554 |
|||||||
29 |
НОГИ-четыре |
591 |
429 |
-905 |
-17 |
-1894 |
|||
30 |
НОГИ-шесть |
720 |
2098 |
||||||
31 |
ХВОСТ-есть |
-1533 |
130 |
-1929 |
-2258 |
174 |
174 |
174 |
|
32 |
ХВОСТ-нет |
1369 |
-1132 |
1420 |
1447 |
||||
33 |
ДОМАШНИЙ-есть |
-101 |
196 |
313 |
568 |
-1073 |
|||
34 |
ДОМАШНИЙ-нет |
196 |
24 |
196 |
-57 |
-99 |
-227 |
143 |
|
35 |
БОЛЬШЕ КОШКИ-есть |
358 |
-955 |
-558 |
-625 |
159 |
|||
36 |
БОЛЬШЕ КОШКИ-нет |
681 |
-784 |
505 |
681 |
386 |
411 |
-232 |
Матрица знаний (модель INF3) (фрагмент)
Код |
Наименование |
1-ТИП-земноводные |
2-ТИП-млекопитающие |
3-ТИП-многоногие |
4-ТИП-насекомые |
5-ТИП-пресмыкающиеся |
6-ТИП-птицы |
7-ТИП-рыбы |
|
1 |
ШЕРСТЬ-есть |
-3,64 |
41,48 |
-5,72 |
1,68 |
-7,28 |
-17,68 |
-8,84 |
|
2 |
ШЕРСТЬ-нет |
3,64 |
-41,48 |
5,72 |
-1,68 |
7,28 |
17,68 |
8,84 |
|
3 |
ПЕРЬЯ-есть |
-1,12 |
-16,16 |
-1,76 |
-2,56 |
-2,24 |
26,56 |
-2,72 |
|
4 |
ПЕРЬЯ-нет |
1,12 |
16,16 |
1,76 |
2,56 |
2,24 |
-26,56 |
2,72 |
|
5 |
ЯЙЦО-есть |
3,64 |
-47,48 |
3,72 |
8,32 |
5,28 |
17,68 |
8,84 |
|
6 |
ЯЙЦО-нет |
-3,64 |
47,48 |
-3,72 |
-8,32 |
-5,28 |
-17,68 |
-8,84 |
|
7 |
МОЛОКО-есть |
-3,54 |
50,00 |
-5,56 |
-8,08 |
-7,07 |
-17,17 |
-8,59 |
|
8 |
МОЛОКО-нет |
3,54 |
-50,00 |
5,56 |
8,08 |
7,07 |
17,17 |
8,59 |
|
9 |
ВОЗДУШНЫЙ-есть |
-1,40 |
-17,20 |
-2,20 |
7,80 |
-2,80 |
19,20 |
-3,40 |
|
10 |
ВОЗДУШНЫЙ-нет |
1,40 |
17,20 |
2,20 |
-7,80 |
2,80 |
-19,20 |
3,40 |
|
11 |
ВОДНЫЙ-есть |
1,82 |
-25,74 |
2,86 |
4,16 |
3,64 |
8,84 |
4,42 |
|
12 |
ВОДНЫЙ-нет |
-1,82 |
25,74 |
-2,86 |
-4,16 |
-3,64 |
-8,84 |
-4,42 |
|
13 |
ХИЩНИК-есть |
-0,43 |
-5,49 |
3,61 |
-4,84 |
5,14 |
-3,66 |
5,67 |
|
14 |
ХИЩНИК-нет |
0,43 |
5,49 |
-3,61 |
4,84 |
-5,14 |
3,66 |
-5,67 |
|
15 |
ЗУБАСТЫЙ-есть |
-0,52 |
32,86 |
-7,10 |
-10,32 |
-1,03 |
-19,93 |
6,04 |
|
16 |
ЗУБАСТЫЙ-нет |
0,52 |
-32,86 |
7,10 |
10,32 |
1,03 |
19,93 |
-6,04 |
|
17 |
ПОЗВОНОЧНИК-есть |
0,98 |
14,14 |
-9,46 |
-13,76 |
0,96 |
4,76 |
2,38 |
|
18 |
ПОЗВОНОЧНИК-нет |
-0,98 |
-14,14 |
9,46 |
13,76 |
-0,96 |
-4,76 |
-2,38 |
|
19 |
ДЫШИТ-есть |
1,02 |
14,65 |
-6,41 |
2,32 |
0,03 |
2,93 |
-14,54 |
|
20 |
ДЫШИТ-нет |
-1,02 |
-14,65 |
6,41 |
-2,32 |
-0,03 |
-2,93 |
14,54 |
|
21 |
ЯДОВИТЫЙ-есть |
0,48 |
-6,58 |
1,18 |
4,80 |
3,95 |
-2,55 |
-1,28 |
|
22 |
ЯДОВИТЫЙ-нет |
-0,48 |
6,58 |
-1,18 |
-4,80 |
-3,95 |
2,55 |
1,28 |
|
23 |
ПЛАВНИК-есть |
2,16 |
-10,12 |
-1,32 |
-1,92 |
-1,68 |
-2,08 |
14,96 |
|
24 |
ПЛАВНИК-нет |
-2,16 |
10,12 |
1,32 |
1,92 |
1,68 |
2,08 |
-14,96 |
|
25 |
НОГИ-восемь |
-0,14 |
-2,02 |
1,78 |
1,68 |
-0,28 |
-0,68 |
-0,34 |
|
26 |
НОГИ-две |
-1,30 |
-9,69 |
-2,04 |
-2,96 |
-2,59 |
21,71 |
-3,15 |
|
27 |
НОГИ-нет |
-1,37 |
-11,70 |
2,86 |
-3,12 |
4,27 |
-4,63 |
13,69 |
|
28 |
НОГИ-три |
-0,07 |
-1,01 |
-0,11 |
-0,16 |
-0,14 |
1,66 |
-0,17 |
|
29 |
НОГИ-четыре |
3,43 |
32,49 |
-3,61 |
-8,16 |
-0,14 |
-15,34 |
-8,67 |
|
30 |
НОГИ-шесть |
-0,56 |
-8,08 |
1,12 |
12,72 |
-1,12 |
-2,72 |
-1,36 |
|
31 |
ХВОСТ-есть |
-4,74 |
13,18 |
-8,02 |
-12,12 |
2,52 |
6,12 |
3,06 |
|