Прогнозирование количества и классов солнечных вспышек на основе их предыстории по данным репозитория UCI с применением автоматизированного системно-когнитивного анализа и интеллектуальной системы "Эйдос"
Характеристика создания в среде системы "Эйдос" интеллектуального приложения, предназначенного для прогнозирования количества солнечных вспышек разных классов на основе предыстории их развития. Особенность использования базы данных репозитория UCI.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 20.05.2017 |
Размер файла | 1,8 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ПРОГНОЗИРОВАНИЕ КОЛИЧЕСТВА И КЛАССОВ СОЛНЕЧНЫХ ВСПЫШЕК НА ОСНОВЕ ИХ ПРЕДЫСТОРИИ ПО ДАННЫМ РЕПОЗИТОРИЯ UCI С ПРИМЕНЕНИЕМ АСК-АНАЛИЗА И ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ «ЭЙДОС»
Содержание
1. Краткая теория
1.1 Проблематика
1.2 Исходные данные
1.3 Инструментарий
1.4 Метризация шкал
2. Синтез и верификация моделей
2.1 Описание решения
2.2 Преобразование исходных данных из HTML-формата в файл исходных данных MS Excel
2.3 Этапы АСК-анализа и преобразование исходных данных в информацию, а ее в знания в системе "Эйдос"
2.4 Скачивание и инсталляция системы «Эйдос»
2.5 Автоматизированная формализация предметной области путем импорта исходных данных из внешних баз данных в систему "Эйдос"
2.6 Синтез и верификация статистических и интеллектуальных моделей
2.7 Частные критерии и виды моделей системы «Эйдос»
2.8 Ценность описательных шкал и градаций для решения задач идентификации и прогнозирования
2.9 Интегральные критерии системы «Эйдос»
2.10 Результаты верификации моделей
3. Решение задач идентификации и прогнозирования в наиболее достоверной модели
4. Исследование моделируемой предметной области путем исследования ее модели
4.1 Информационные портреты классов и признаков
4.2 Когнитивные функции
4.3 SWOT и PEST матрицы и диаграммы
4.4 Нелокальные нейроны
4.5 Семантические сети классов и признаков
4.6 Когнитивные диаграммы классов и признаков
Заключение
Литература
Аннотация
1. Краткая теория
1.1 Проблематика
Создание систем искусственного интеллекта является одним из важных и перспективных направлений развития современных информационных технологий. Так как существует множество альтернатив систем искусственного интеллекта, то возникает необходимость оценки качества математических моделей этих систем. В работах [1, 2, 17] рассматривалось решение этой задачи для оценки качества модели, реализованной в универсальной автоматизированной системе «Эйдос», представляющей собой программный инструментарий автоматизированного системно-когнитивного анализа (АСК-анализ) [3, 4]. Данная статья является продолжением этого подхода.
Для достижения поставленной цели необходимы свободный доступ к тестовым исходным данным и методика, которая поможет преобразовать эти данные в форму, которая необходима для работы в системе искусственного интеллекта. Удачным выбором является база данных тестовых задач для систем искусственного интеллекта репозитария «Репозиторий UCI (UCI Machine Learning Repository) -- крупнейший репозиторий реальных и модельных задач машинного обучения. Содержит реальные данные по прикладным задачам в области биологии, медицины, физики, техники, социологии, и др. Задачи (наборы данных, data set) именно этого репозитория чаще всего используются научным сообществом для эмпирического анализа алгоритмов машинного обучения. Репозиторий UCI создан в университете г.Ирвин (Калифорния, США).»
1.2 Исходные данные
В данной работе использована база данных "Solar Flare Data Set ": из банка исходных данных по задачам искусственного интеллекта - репозитария UCI, который создан, развивается и поддерживается сотрудниками Школы информатики и компьютерных исследований Калифорнийского университета США. На момент написания работы этот банк включает в себя 290 баз исходных данных по различным задачам.
1.3 Инструментарий
Для решения задачи используем стандартные возможности Microsoft Office Word и Excel, а также систему искусственного интеллекта "Эйдос-Х++".
Математическая модель системы "Эйдос" была разработана в 1979 и впервые прошла экспериментальную апробацию в 1981 году. С 1981 по 1992 система "Эйдос" неоднократно реализовалась на платформе Wang (на компьютерах Wang-2200С). Для IBM-совместимых персональных компьютеров система "Эйдос" впервые реализована в 1992 году и с тех пор совершенствуется постоянно, вплоть до настоящего времени [6, 7, 8].
1.4 Метризация шкал
Измерительные шкалы - это инструмент создания формальных моделей реальных объектов, а так же и инструмент, который позволяет повысить степень формализации этих моделей до такого уровня, при котором возможна их реализация на компьютерах [9].
Чем выше степень формализации модели, тем точнее решаются различные задачи с использованием этих моделей, тем проще использовать модели для проектирования различных систем и их создания, а также тем более точные и развитые математические методы могут применяться в этих моделях.
Однако если разные факторы измеряются в различных единицах измерения, то результат сравнения объектов будет зависеть от единиц измерения факторов, что недопустимо. Поэтому возникает проблема сопоставимости результатов измерений разнородных величин (измеряемых в разных единицах измерения) в шкалах различных типов (номинальных, порядковых и числовых).
В АСК-анализе и его инструментарии интеллектуальной системе "Эйдос" эта проблема решается путем метризации шкал [9]. Система «Эйдос» в настоящее время поддерживает 7 способов метризации всех типов шкал, которые обеспечивают корректную совместную сопоставимую количественную обработку разнородных по своей природе факторов, различных единиц измерения. Факторы описываются шкалами, а значения факторов - градациями шкал. В АСК-анализе все они рассматриваются с единой точки зрения: сколько информации содержится в их значениях о переходе объекта, на который они действуют, в определенное состояние, при этом направление влияния и сила значений факторов измеряется в одних общих для факторов единицах измерения (единицах количества информации). По этой причине можно складывать силу и направление влияния всех действующих на объект значений факторов, и определять результат их совместного влияния на объект. При этом объект является нелинейным, а факторы взаимодействуют друг с другом внутри него (не выполняется принцип суперпозиции).
Измерение - Отображение реальных объектов в формальных шкалах. Система "Эйдос" представляет - средство для построения и применения измерительных инструментов в различных предметных областях. В ней реализованы разнообразные технологии метризации, которые позволяют любые свойства объектов (количественные и качественные) исследовать в наиболее сильных абсолютных шкалах знаний.
2. Синтез и верификация моделей
2.1 Описание решения
В соответствии с методологией АСК-анализа решение поставленной задачи проведем в четыре этапа:
1. Преобразование исходных данных из HTML-формата в промежуточные файлы MS Excel.
2. Преобразование исходных данных из промежуточных файлов MS Excel в базы данных системы "Эйдос".
3. Синтез и верификация моделей предметной области.
4. Применение моделей для решения задач идентификации, прогнозирования и исследования предметной области.
2.2 Преобразование исходных данных из HTML-формата в файл исходных данных MS Excel
Из банка исходных данных по задачам искусственного интеллекта - репозитария UCI получаем исходную информацию по базе данных "Solar Flare Data Set ", которую оставим без изменений [5].
1. TItle: Solar Flare database
2. Source Information
- Donor: Gary Bradshaw <gbradshaw@clipr.colorado.EDU>
- Date: 3/89
3. Past Usage:
- Gary Bradshaw: (Class Attributes were collapsed to 0 and >0)
- See the past-usage file for a note written by Gary Bradshaw
4. Relevant Information:
- The database contains 3 potential classes, one for the number of times a certain type of solar flare occured in a 24 hour period.
- Each instance represents captured features for 1 active region on the sun.
- The data are divided into two sections. The second section (flare.data2) has had much more error correction applied to the it, and has consequently been treated as more reliable.
5. Number of Instances: flare.data1: 323, flare.data2: 1066
6. Number of attributes: 13 (includes 3 class attributes)
7. Attribute Information:
1. Code for class (modified Zurich class) (A,B,C,D,E,F,H)
2. Code for largest spot size (X,R,S,A,H,K)
3. Code for spot distribution (X,O,I,C)
4. Activity (1 = reduced, 2 = unchanged)
5. Evolution (1 = decay, 2 = no growth,
3 = growth)
6. Previous 24 hour flare activity code (1 = nothing as big as an M1,
2 = one M1,
3 = more activity than one M1)
7. Historically-complex (1 = Yes, 2 = No)
8. Did region become historically complex (1 = yes, 2 = no) on this pass across the sun's disk
9. Area (1 = small, 2 = large)
10. Area of the largest spot (1 = <=5, 2 = >5)
From all these predictors three classes of flares are predicted, which are represented in the last three columns.
11. C-class flares production by this region Number in the following 24 hours (common flares)
12. M-class flares production by this region Number in the following 24 hours (moderate flares)
13. X-class flares production by this region Number in the following 24 hours (severe flares)
8. Missing values: None
9. Class Distribution:
flare.data1:
0 1 2 4 Total
C-class flares 287 29 7 0 323
M-class flares 291 24 6 2 323
X-class flares 316 7 0 0 323
flare.data2:
0 1 2 3 4 5 6 7 8 Total
C-class flares 884 112 33 20 9 4 3 0 1 1066
M-class flares 1030 29 3 2 1 0 1 0 0 1066
X-class flares 1061 4 1 0 0 0 0 0 0 1066
Обучающая выборка
На сайте UCI по адресу: http://archive.ics.uci.edu/ml/machine-learning-databases/solar-flare/ представлено два набора данных:
- «flare.data1» по адресу: http://archive.ics.uci.edu/ml/machine-learning-databases/solar-flare/flare.data1 (323 записи за период с 02/13/69 по 03/27/69);
- «flare.data2» по адресу: http://archive.ics.uci.edu/ml/machine-learning-databases/solar-flare/flare.data2 (1066 записей за период с 08/19/78 по 12/23/78).
Мы объединим эти данные и обработаем их совместно в одной модели. Фрагмент исходных данных «flare.data1» приведен в таблице 1:
Attribute Information:
1. Code for class (modified Zurich class) (A,B,C,D,E,F,H)
2. Code for largest spot size (X,R,S,A,H,K)
3. Code for spot distribution (X,O,I,C)
4. Activity (1 = reduced, 2 = unchanged)
5. Evolution (1 = decay, 2 = no growth, 3 = growth)
6. Previous 24 hour flare activity code (1 = nothing as big as an M1, 2 = one M1, 3 = more activity than one M1)
7. Historically-complex (1 = Yes, 2 = No)
8. Did region become historically complex on this pass across the sun's disk (1 = yes, 2 = no)
9. Area (1 = small, 2 = large)
10. Area of the largest spot (1: <=5, 2: >5)
From all these predictors three classes of flares are predicted, which are represented in the last three columns.
11. C-class flares production by this region in the following 24 hours (common flares); Number
12. M-class flares production by this region in the following 24 hours (moderate flares); Number
13. X-class flares production by this region in the following 24 hours (severe flares); Number
Ниже приведен автоматизированный перевод наименований полей базы исходных данных, т.е. классификационных и описательных шкал и градаций:
Описательная информация:
1. Код для класса (модифицированный класс Цюрих) (A, B, C, D, E, F, H).
2. Код для наибольшего размера пятна (X, R, S, A, H, K).
3. Код для распространения пятна (X, O, I, C).
4. Деятельность (1 = уменьшается, 2 = без изменений).
5. Эволюция (1 = распад, 2 = нет роста, 3 = рост).
6. Предыдущая 24 час вспышка активности код (1 = ничего, как большой, как М1, 2 = Один M1, 3 = больше активности, чем один M1).
7. Исторически-комплекс (1 = Да, 2 = Нет).
8. Разве региона становятся исторически комплекс на этом проходе по диску Солнца (1 = да, 2 = нет).
9. Площадь (1 = малый, 2 = большая).
10. Площадь самого большого пятна (1: <= 5, 2: > 5).
На основе всех этих характеристик развития пятна, предшествующих солнечным вспышкам, необходимо спрогнозировать количество и класс солнечных вспышек на ближашие 24 часа (включая и их отсутствие), информация о которых содержится в последних трех столбцах исходных данных:
11. Количество вспышек С-класса, произошедших в этой области в течение следующих 24 часов.
12. Количество вспышек M-класса, произошедших в этой области в течение следующих 24 часов.
13. Количество вспышек X-класса, произошедших в этой области в течение следующих 24 часов.
Таким образом, ясно, что колонки с 1 по 10 содержат описательные шкалы и градации, а с 11 по 13 - классификационные шкалы и градации.
Поскольку ввод исходных данных в систему «Эйдос» планируется осуществить с помощью ее универсального программного интерфейса импорта данных из внешних баз данных, который работает с файлами MS Excel, то преобразуем данные из html-файла в xls-файл, для чего выполним следующие операции.
Рисунок 1. Окно MS Word параметров преобразования текста в таблицу
В результате получим таблицу 2:
4. В полученной таблице 2:
- в самом начале добавим пустую строку, а затем перенесем в нее наименования колонок из файла общего описания задачи «flare.names», расположенного по адресу: http://archive.ics.uci.edu/ml/machine-learning-databases/solar-flare/flare.names;
- в меню: «Файл - параметры страницы» поменяем ориентацию листа на альбомную;
- затем заменим числовые значения в колонках таблицы 2 с 4-й по 10-ю на текстовые из того же файла «flare.names». Для этого выделим блоком необходимую колонку, нажмем Ctrl+H и внесем в появившееся окно информацию о том, что и на что мы меняем, а затем выберем: «Заменить все», но только в выделенном участке текста.
В последующем это улучшит читаемость и наглядность выходных форм, получаемых в системе «Эйдос».
6. Скопируем получившуюся таблицу из MS Word в MS Excel и запишем ее с именем: Inp_data.xls в папку: c:\Aidos-X\AID_DATA\Inp_data\. В файле Inp_data.xls добавим пустую колонку на позиции «A» и автоматически пронумеруем все строки.
В результате получим таблицу исходных данных, полностью подготовленную для обработки в системе «Эйдос» и записанную в нужную папку в виде файла нужного типа с нужным именем (таблица 3). В этой таблице содержатся данные 1389 наблюдений, поэтому ниже приводится лишь их фрагмент.
Полностью эти исходные данные можно скачать по адресу:
2.3 Этапы АСК-анализа и преобразование исходных данных в информацию, а ее в знания в системе "Эйдос"
АСК-анализ включает следующие этапы [3, 4]:
1. Когнитивная структуризация предметной области (неформализованный этап). На этом этапе решается, что мы хотим прогнозировать и на основе чего. В нашей задаче мы хотим прогнозировать продолжительность жизни пациента после перенесенного им инфаркта на основе анализа эхокардиограммы.
2. Формализация предметной области. На этом этапе разрабатываются классификационные и описательные шкалы и градации, а затем с их использованием исходные данные кодируются и представляются в форме баз событий, между которыми могут быть выявлены причинно-следственные связи.
3. Синтез и верификация моделей (оценка достоверности, адекватности). Повышение качества модели. Выбор наиболее достоверной модели для решения в ней задач.
4. Решение задач идентификации и прогнозирования.
5. Решение задач принятия решений и управления.
6. Решение задач исследования моделируемой предметной области путем исследования ее модели.
На рисунке 1 приведены автоматизированные в системе «Эйдос» этапы АСК-анализа, которые обеспечивают последовательное повышение степени формализации модели путем преобразования исходных данных в информацию, а далее в знания (рисунок 3).
Подробно этот процесс описан в работе [10]. Суть этого процесса в следующем:
1. Информация рассматривается как осмысленные исходные данные.
2. Смысл, согласно концепции Шенка-Абельсона [12] считается известным, когда выявлены причинно-следственные связи.
3. Анализ - это операция выявления смысла из исходных данных.
4. Причинно-следственные связи существуют не между элементами исходных данных, а между реальными событиями, которые они отражают (моделируют), т.е. причинно-следственные связи - это характеристика реальной области, а не абстрактных моделей. Иначе говоря, анализ самих исходных данных невозможен, а возможен только анализ событий, описанных этими исходными данными.
5. Поэтому перед анализом исходных данных необходимо предварительно преобразовать их в базы событий, т.е. в эвентологические базы.
6. Это преобразование осуществляется с помощью справочников событий, факторов и их значений, т.е. с помощью классификационных и описательных шкал и градаций, которые также необходимо разработать.
7. Формализация предметной области представляет собой разработку справочников классификационных и описательных шкал и градаций и преобразование с их помощью баз исходных данных в базы событий (т.е. обучающую выборку), и является первым автоматизированным в системе «Эйдос» этапом АСК-анализа.
8. Затем следуют остальные перечисленные выше этапы АСК-анализа:
- синтез и верификация моделей и выбор наиболее достоверной из них;
- решение в ней задач идентификации, прогнозирования, принятия решений и исследования предметной области, т.е. преобразование информации в знания.
Этап синтеза и верификации моделей завершает процесс анализа исходных данных и преобразования их в информацию, а ее в знания.
В АСК-анализе есть несколько режимов, обеспечивающих решение задачи принятия решений для управления или достижения целей, которая представляет собой обратную задачу прогнозирования: это и режим 4.2.1, позволяющий формировать информационные портреты классов, а также режим 4.4.8, поддерживающий количественный автоматизированный SWOT и -PEST анализ, включая построение SWOT и -PEST матриц и диаграмм [13], а также режим 4.4.10, визуализирующий нейросетевую интерпретацию модели знаний системы «Эйдос» [14]. Эти режимы обеспечивают преобразование информации в знания, т.к. знания представляют собой информацию, полезную для достижения целей, т.е. по сути технологию, в частности ноу-хау [10]. Наличие цели является ключевым моментом для преобразования информации в знания. А постановка целей (целеполагание) не мыслима без мотивации, которая в настоящее время является слабо формализованным этапом.
Итак, в процессе анализа исходные данные представляются в форме базы событий, между которыми выявляются причинно-следственные связи, и, таким образом, исходные данные преобразуются в информацию, представляющую собой осмысленные данные (смысл есть знание причинно-следственных связей), а затем информация используется для достижения целей (управления), т.е. преобразуется в знания.
Формализация предметной области включает разработку классификационных и описательных шкал и градаций и преобразование с их использованием исходных данных (таблица 1) в обучающую выборку. Этот этап полностью автоматизируется программным интерфейсом системы «Эйдос» с внешними табличными базами исходных данных (режим 2.3.2.2).
Но перед выполнением этого этапа АСК-анализа, естественно, необходимо сначала скачать и установить систему «Эйдос».
2.4 Скачивание и инсталляция системы «Эйдос»
По этим ссылкам всегда размещена наиболее полная на момент скачивания незащищенная от несанкционированного копирования портативная (portable) версия системы (не требующая инсталляции) с исходными текстами, находящаяся в полном открытом бесплатном доступе (объем около 50 Мб). Обновление имеет объем около 3 Мб.
Для преобразования исходных данных обучающей выборки в базы данных системы "Эйдос" необходимо файл MS Excel, который содержит базу исходных данных, скопировать в папку: Aidos-X\AID_DATA\Inp_data и назвать Inp_data.xls. Этот файл организован следующим образом (рисунок 4):
2.5 Автоматизированная формализация предметной области путем импорта исходных данных из внешних баз данных в систему "Эйдос"
Для загрузки базы исходных данных в систему «Эйдос» необходимо воспользоваться универсальным программным интерфейсом для ввода данных из внешних баз данных табличного вида (таблица 1), т.е. режимом 2.3.2.2 (рисунок 5):
Рисунок 5. Экранная форма Универсального программного интерфейса импорта данных в систему "Эйдос" (режим 2.3.2.2.)
В экранной форме, приведенной на рисунке 5, задать настройки, показанные на рисунке:
- "Задайте тип файла исходных данных Inp_data": "XLS - MS Excel-2003";
- "Задайте диапазон столбцов классификационных шкал": "Начальный столбец классификационных шкал" - 12, "Конечный столбец классификационных шкал" - 14 (три последних столбца в таблице 3);
- "Задайте диапазон столбцов описательных шкал": "Начальный столбец описательных шкал" - 2, "Конечный столбец описательных шкал" - 11;
- "Задание параметров формирования сценариев или способа интерпретации текстовых полей": "Не применять сценарный метод АСК-анализа и спец.интерпретацию TXT-полей".
После нажать кнопку "ОК". Далее открывается окно, где размещена информация о размерности модели. В этом окне необходимо нажать кнопку "Выйти на создание модели".
Далее открывается окно, отображающее стадию процесса импорта данных из внешней БД "Inp_data.xls" в систему "Эйдос" (рисунок 7), а также прогноз времени завершения этого процесса. В том окне необходимо дождаться завершения формализации предметной области и нажать кнопку "ОК".
Рисунок 7. Процесс импорта данных из внешней БД "Inp_data.xls" в систему "Эйдос"
В результате формируются классификационные и описательные шкалы и градации, с применением которых исходные данные (таблица 3) кодируются и представляются в форме эвентологических баз данных. Этим самым полностью автоматизировано выполняется 2-й этап АСК-анализа «Формализация предметной области». Этот режим на данных таблицы 3 выполняется довольно быстро: всего за 22 секунды.
Для просмотра классификационных шкал и градаций необходимо запустить режим 2.1:
Рисунок 9. Описательные шкалы и градации (фрагмент)
Тем самым создаются все необходимые и достаточные предпосылки для выявления силы и направления причинно-следственных связей между значениями факторов и результатами их совместного системного воздействия (с учетом нелинейности системы [11]).
2.6 Синтез и верификация статистических и интеллектуальных моделей
В данном режиме имеется много различных методов верификации моделей, в том числе и поддерживающие бутстрепный метод.
В результате выполнения режима 3.5 созданы все модели, со всеми частными критериями, перечисленные на рисунке 11, но ниже мы приведем лишь некоторые из них (таблицы 5, 6, 7). Но предварительно рассмотрим частные и интегральные критерии, применяемые в настоящее время в системе «Эйдос».
2.7 Частные критерии и виды моделей системы «Эйдос»
Рассмотрим решение задачи идентификации на примере модели INF1, в которой рассчитано количество информации по А.Харкевичу, которое мы получаем о принадлежности идентифицируемого объекта к каждому из классов, если знаем, что у этого объекта есть некоторый признак. Это так называемые частные критерии сходства, приведенные в таблице 4.
Таблица 4 - Частные критерии знаний, используемые в настоящее время в АСК-анализе и системе «Эйдос-Х++»
Наименование модели знаний |
Выражение для частного критерия |
||
через относительные частоты |
через абсолютные частоты |
||
INF1, частный критерий: количество знаний по А.Харкевичу, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу. Относительная частота того, что если у объекта j-го класса обнаружен признак, то это i-й признак |
|||
INF2, частный критерий: количество знаний по А.Харкевичу, 2-й вариант расчета относительных частот: Nj - суммарное количество объектов по j-му классу. Относительная частота того, что если предъявлен объект j-го класса, то у него будет обнаружен i-й признак. |
|||
INF3, частный критерий: Хи-квадрат: разности между фактическими и теоретически ожидаемыми абсолютными частотами |
--- |
||
INF4, частный критерий: ROI - Return On Investment, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу |
|||
INF5, частный критерий: ROI - Return On Investment, 2-й вариант расчета относительных частот: Nj - суммарное количество объектов по j-му классу |
|||
INF6, частный критерий: разность условной и безусловной относительных частот, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу |
|||
INF7, частный критерий: разность условной и безусловной относительных частот, 2-й вариант расчета относительных частот: Nj - суммарное количество объектов по j-му классу |
Обозначения:
i - значение прошлого параметра;
j - значение будущего параметра;
Nij - количество встреч j-го значения будущего параметра при i-м значении прошлого параметра;
M - суммарное число значений всех прошлых параметров;
W - суммарное число значений всех будущих параметров.
Ni - количество встреч i-м значения прошлого параметра по всей выборке;
Nj - количество встреч j-го значения будущего параметра по всей выборке;
N - количество встреч j-го значения будущего параметра при i-м значении прошлого параметра по всей выборке.
Iij - частный критерий знаний: количество знаний в факте наблюдения i-го значения прошлого параметра о том, что объект перейдет в состояние, соответствующее j-му значению будущего параметра;
Ш - нормировочный коэффициент (Е.В.Луценко, 1979, впервые опубликовано в 1993 году [15]), преобразующий количество информации в формуле А.Харкевича в биты и обеспечивающий для нее соблюдение принципа соответствия с формулой Р.Хартли;
Pi - безусловная относительная частота встречи i-го значения прошлого параметра в обучающей выборке;
Pij - условная относительная частота встречи i-го значения прошлого параметра при j-м значении будущего параметра.
По сути, частные критерии представляют собой просто формулы для преобразования матрицы абсолютных частот (таблица 5) в матрицы условных и безусловных процентных распределений и матрицы знаний (таблицы 6 и 7) (проф. В.И.Лойко).
2.8 Ценность описательных шкал и градаций для решения задач идентификации и прогнозирования
Для любой из моделей системой «Эйдос» рассчитывается ценность градации описательной шкалы, т.е. признака, для идентификации или прогнозирования. Количественной мерой ценности признака в той или иной модели является вариабельность по классам частного критерия (таблица 6) для этого признака. Мер вариабельности существует много, но наиболее известными является среднее модулей отклонения от среднего, дисперсия и среднеквадратичное отклонение. Последняя мера и используется в АСК-анализе и системе «Эйдос».
В системе «Эйдос» ценность признаков нарастающим итогов выводится в графической форме.
При большом объеме обучающей выборки можно без ущерба для достоверности модели удалить из нее малозначимые признаки. Для этого в системе «Эйдос» также есть соответствующие инструменты.
2.9 Интегральные критерии системы «Эйдос»
Но если нам известно, что объект обладает не одним, а несколькими признаками, то как посчитать их общий вклад в сходство с теми или иными классами? Для этого в системе «Эйдос» используется 2 аддитивных интегральных критерия: «Сумма знаний» и «Семантический резонанс знаний».
Интегральный критерий «Семантический резонанс знаний» представляет собой суммарное количество знаний, содержащееся в системе факторов различной природы, характеризующих сам объект управления, управляющие факторы и окружающую среду, о переходе объекта в будущие целевые или нежелательные состояния.
Интегральный критерий представляет собой аддитивную функцию от частных критериев знаний, представленных в help режима 3.3:
В выражении круглыми скобками обозначено скалярное произведение. В координатной форме это выражение имеет вид:
,
где: M - количество градаций описательных шкал (признаков);
- вектор состояния j-го класса;
- вектор состояния распознаваемого объекта, включающий все виды факторов, характеризующих сам объект, управляющие воздействия и окружающую среду (массив-локатор), т.е.:
В текущей версии системы «Эйдос-Х++» значения координат вектора состояния распознаваемого объекта принимались равными либо 0, если признака нет, или n, если он присутствует у объекта с интенсивностью n, т.е. представлен n раз (например, буква «о» в слове «молоко» представлена 3 раза, а буква «м» - один раз).
Интегральный критерий «Семантический резонанс знаний» представляет собой нормированное суммарное количество знаний, содержащееся в системе факторов различной природы, характеризующих сам объект управления, управляющие факторы и окружающую среду, о переходе объекта в будущие целевые или нежелательные состояния.
Интегральный критерий представляет собой аддитивную функцию от частных критериев знаний, представленных в help режима 3.3 и имеет вид:
где:
M - количество градаций описательных шкал (признаков);
- средняя информативность по вектору класса;
- среднее по вектору объекта;
- среднеквадратичное отклонение частных критериев знаний вектора класса;
- среднеквадратичное отклонение по вектору распознаваемого объекта.
- вектор состояния j-го класса;
- вектор состояния распознаваемого объекта, включающий все виды факторов, характеризующих сам объект, управляющие воздействия и окружающую среду (массив-локатор), т.е.:
В текущей версии системы «Эйдос-Х++» значения координат вектора состояния распознаваемого объекта принимались равными либо 0, если признака нет, или n, если он присутствует у объекта с интенсивностью n, т.е. представлен n раз (например, буква «о» в слове «молоко» представлена 3 раза, а буква «м» - один раз).
Приведенное выражение для интегрального критерия «Семантический резонанс знаний» получается непосредственно из выражения для критерия «Сумма знаний» после замены координат перемножаемых векторов их стандартизированными значениями:
Свое наименование интегральный критерий сходства «Семантический резонанс знаний» получил потому, что по своей математической форме является корреляцией двух векторов: состояния j-го класса и состояния распознаваемого объекта.
2.10 Результаты верификации моделей
Наиболее достоверной в данном приложении оказались модели INF4 при интегральном критерии «Сумма знаний» и модель INF5 с интегральным критерием «Резонанс знаний». При этом достоверность отнесения ситуации к классу, к которому она действительно относится, составляет 70,194%, а достоверность не отнесения ситуации к классу, к которому она не относится - 81,889%. Таким образом, уровень достоверности прогнозирования с применением модели выше, чем экспертных оценок, достоверность которых считается равной примерно 70%.
Для оценки достоверности моделей в АСК-анализе и системе «Эйдос» используется метрика, сходная с F-критерием:
Рисунок 14. Виды прогнозов и принцип определения достоверности
моделей по авторскому варианту метрики, сходной с F-критерием
Также обращает на себя внимание, что статистические модели, как правило, дают более низкую средневзвешенную достоверность идентификации и не идентификации, чем модели знаний, и практически никогда - более высокую. Этим и оправдано применение моделей знаний и интеллектуальных технологий.
Из рисунка 15 видно, что:
- наиболее достоверная модель INF4 лучше определяет непринадлежность объекта к классу, чем принадлежность (что видно также из рисунка 13);
- модуль уровня сходства-различия в наиболее достоверной модели INF4 для верно идентифицированных и верно неидентифицированных объектов значительно выше, чем для ошибочно идентифицированных и ошибочно неидентифицированных. Это верно практически для всего диапазона уровней сходства-различия, кроме небольших по модулю значений в диапазоне от 0 до 15% уровня сходства. Для очень больших значений уровней сходства-различия (более 70%) также различие между верно и ошибочно идентифицированными и неидентифицированными ситуациями практически отсутствует.
Ясно, что любые данные о наблюдениях можно считать суммой истинного значения и шума, причем ни первое, ни второе неизвестны. Поэтому имеет смысл сравнить созданные модели с чисто случайными моделями, совпадающими по основным характеристикам (приведены на рисунке). В системе «Эйдос» есть лабораторная работа № 2.01: «Исследование RND-модели при различных объемах выборки» (устанавливается из Диспетчера приложений - режима 1.3). Если данная работа устанавливается при отсутствии текущего приложения, то все параметры создаваемых моделей задаются вручную, если же текущая модель существует, как в нашем случае, то все основные ее параметры определяются автоматически. интеллектуальный приложение вспышка репозиторий
Рисунок Экранная форма, отображающая процесс установки лабораторной работы № 2.01: «Исследование RND-модели при различных объемах выборки» по образцу текущего приложения
Совершенно очевидное различие частотных распределений уровней сходства-различия верно и ошибочно идентифицированных и неидентифицированных состояний объекта моделирования и случайной модели (рисунки 15 и 18) объясняется тем, что в реальных моделях кроме шума есть также и информация об истинных причинно-следственных взаимосвязях факторов и их значений с одной стороны, и состояниями объекта моделирования, которые ими обуславливаются, с другой стороны.
На основе его сравнения с рисунком 13 можно сделать следующие выводы:
- достоверность лучшей модели INF5, отражающей реальный объект моделирования, примерно на 20% выше, чем аналогичной случайной модели;
- различие между достоверностью статистических моделей и моделей знаний, созданных на основе случайной выборки, значительно меньше, чем у моделей, отражающих реальный объект моделирования;
- в реальных моделях кроме шума есть также и информация об истинных причинно-следственных взаимосвязях факторов и их значений с одной стороны, и состояниями объекта моделирования, которые ими обуславливаются, с другой стороны, причем примерно 1/3 достоверности обусловлена отражением в реальных моделях закономерностей предметной области, а 2/3 достоверности обусловлено наличием шума в исходных данных. На основании этого можно предположить, что в исходных данных (таблица 3) уровень сигнала о реальных причинно-следственных связях в моделируемой предметной области примерно в два раза ниже уровня шума.
3. Решение задач идентификации и прогнозирования в наиболее достоверной модели
В соответствии с технологией АСК-анализа (рисунок 3) зададим текущей модель INF4 (режим 5.6) (рисунок 20) и проведем пакетное распознавание в режиме 4.2.1:
Рисунок 20. Экранные формы режима задания модели в качестве текущей
Рисунок 21. Экранная форма режима пакетного распознавания
в текущей модели
В результате пакетного распознавания в текущей модели создается ряд баз данных, которые визуализируются в выходных экранных формах, отражающих результаты решения задачи идентификации и прогнозирования.
Режим 4.1.3 системы «Эйдос» обеспечивает отображение результатов идентификации и прогнозирования в различных формах:
1. Подробно наглядно: "Объект - классы".
2. Подробно наглядно: "Класс - объекты".
3. Итоги наглядно: "Объект - классы".
4. Итоги наглядно: "Класс - объекты".
5. Подробно сжато: "Объект - классы".
6. Обобщенная форма по достоверности моделей при разных интегральных критериях.
7. Обобщенный статистический анализ результатов идентификации по моделям и интегральным критериям.
8. Статистический анализ результатов идентификации по классам, моделям и интегральным критериям.
9. Распознавание уровня сходства при разных моделях и интегральных критериях.
10. Достоверность идентификации классов при разных моделях и интегральных критериях.
Ниже кратко рассмотрим некоторые из них.
На рисунках 22 и 23 приведены примеры прогнозов высокой и низкой достоверности частоты и классов солнечных вспышек в наиболее достоверной модели INF4 на основе наблюдения предыстории их развития:
4. Исследование моделируемой предметной области путем исследования ее модели
Так созданные модели показали достаточно высокую адекватность, то их исследование обоснованно можно считать исследованием самой моделируемой предметной области.
Это исследование в частности включает:
- информационные портреты классов и признаков;
- когнитивные функции;
- SWOT и PEST матрицы и диаграммы;
- нелокальные нейроны;
- семантические сети классов и признаков;
- когнитивные диаграммы классов и признаков.
4.1 Информационные портреты классов и признаков
Информационный портрет класса - это список факторов, ранжированных в порядке убывания силы их влияния на переход объекта управления в состояние, соответствующее данному классу. Информационный портрет класса отражает систему его детерминации. Генерация информационного портрета класса представляет собой решение обратной задачи прогнозирования, т.к. при прогнозировании по системе факторов определяется спектр наиболее вероятных будущих состояний объекта управления, в которые он может перейти под влиянием данной системы факторов, а в информационном портрете мы наоборот, по заданному будущему состоянию объекта управления определяем систему факторов, детерминирующих это состояние, т.е. вызывающих переход объекта управления в это состояние. В начале информационного портрета класса идут факторы, оказывающие положительное влияние на переход объекта управления в заданное состояние, затем факторы, не оказывающие на это существенного влияния, и далее - факторы, препятствующие переходу объекта управления в это состояние (в порядке возрастания силы препятствования). Информационные портреты классов могут быть от отфильтрованы по диапазону факторов, т.е. мы можем отобразить влияние на переход объекта управления в данное состояние не всех отраженных в модели факторов, а только тех, коды которых попадают в определенный диапазон, например, относящиеся к определенным описательным шкалам.
Информационный (семантический) портрет фактора - это список классов, ранжированный в порядке убывания силы влияния данного фактора на переход объекта управления в состояния, соответствующие данным классам. Информационный портрет фактора называется также его семантическим портретом, т.к. в соответствии с концепцией смысла системно-когнитивного анализа, являющейся обобщением концепции смысла Шенка-Абельсона, смысл фактора состоит в том, какие будущие состояния объекта управления он детерминирует. Сначала в этом списке идут состояния объекта управления, на переход в которые данный фактор оказывает наибольшее влияние, затем состояния, на которые данный фактор не оказывает существенного влияния, и далее состояния - переходу в которые данный фактор препятствует. Информационные портреты факторов могут быть от отфильтрованы по диапазону классов, т.е. мы можем отобразить влияние данного фактора на переход объекта управления не во все возможные будущие состояния, а только в состояния, коды которых попадают в определенный диапазон, например, относящиеся к определенным классификационным шкалам.
Рассмотрим информационные портреты классов в режиме 4.2.1 (рисунок 23):
Рисунок 23. Пример информационного портрета класса с кодом 13 (наблюдение 2 вспышек M-класса) в модели INF4
Из этого портрета мы можем сделать вывод о том, что на основе определений конкретных объектов обучающей выборки (т.е. конкретных онтологий), в каждом из которых были с одной стороны приведены признаки объекта, а с другой указана его принадлежность к обобщающим классам, система «Эйдос» смогла сформировать обобщенные определения классов (обобщенные онтологии), в которых для каждого класса указана степень характерности и не характерности для него всех имеющихся в модели признаков. В данном случае в качестве объектов обучающей выборки выступали наблюдения солнечных вспышек, но в принципе ими могут быть любые объекты или их состояния из любой предметной области (например, [9]), т.к. система «Эйдос» разрабатывалась в обобщенной постановке, независящей от предметной области.
Поставив курсор на любую строку в правом окне мы можем включить фильтр по соответствующей описательной шкале (фактору) и увидеть в информационном портрете как влияют различные значения этого фактора на ситуацию, выбранную в левом окне (рисунок 24):
Рассмотрим информационные или семантические (смысловые) портреты признаков в режиме 4.3.1. Данный режим показывает, какой смысл имеет то или иное значение фактора (признак), т.е., например, для модели INF1: какое количество информации содержится в факте наблюдения данного значения фактора о том, что этот объект моделирования перейдет в те или иные состояния, соответствующие различным классам (рисунок 24).
Рисунок 24. Пример информационного (семантического) портрета значения фактора (признака)
4.2 Когнитивные функции
Применительно к задаче, рассматриваемой в данной работе, когнитивная функция показывает, какое количество информации содержится в различных значениях факторов о том, что объект моделирования перейдет в те или иные будущие состояния.
Когнитивным функциям посвящено много работ автора, но наиболее новой и обобщающей из них является работа [16]. Поэтому здесь не будем останавливаться на описании того, что представляют собой когнитивные функции в АСК-анализе.
Графические файлы всех когнитивных функций (для всех сочетаний классификационных и описательных шкал) для модели INF3 и некоторые другие графические выходные формы данного приложения приведены.
4.3 SWOT и PEST матрицы и диаграммы
SWOT-анализ является широко известным и общепризнанным методом стратегического планирования. Однако это не мешает тому, что он подвергается критике, часто вполне справедливой, обоснованной и хорошо аргументированной. В результате критического рассмотрения SWOT-анализа выявлено довольно много его слабых сторон (недостатков), источником которых является необходимость привлечения экспертов, в частности для оценки силы и направления влияния факторов. Ясно, что эксперты это делают неформализуемым путем (интуитивно), на основе своего профессионального опыта и компетенции. Но возможности экспертов имеют свои ограничения и часто по различным причинам они не могут и не хотят это сделать. Таким образом, возникает проблема проведения SWOT-анализа без привлечения экспертов. Эта проблема может решаться путем автоматизации функций экспертов, т.е. путем измерения силы и направления влияния факторов непосредственно на основе эмпирических данных. Подобная технология разработана давно, ей уже около 30 лет, но она малоизвестна - это интеллектуальная система «Эйдос». Данная система всегда обеспечивала возможность проведения количественного автоматизированного SWOT-анализа без использования экспертных оценок непосредственно на основе эмпирических данных. Результаты SWOT-анализа выводились в форме информационных портретов. В версии системы под MS Windows: «Эйдос-Х++» предложено автоматизированное количественное решение прямой и обратной задач SWOT-анализа с построением традиционных SWOT-матриц и диаграмм [13] (рисунок 27):
Инвертированные SWOT-матрицы и SWOT-диаграммы показывают влияние значения фактора на поведение объекта моделирования. Отметим, что эти матрицы и диаграммы предложены автором и система «Эйдос» является на данный момент единственной системой, позволяющей проводить соответствующий анализ непосредственно на основе эмпирических данных, причем в любой предметной области.
PEST-анализ является SWOT-анализом с более детализированной классификацией внешних факторов. Поэтому выводы, полученные на примере SWOT-анализа, можно распространить и на PEST-анализ.
4.4 Нелокальные нейроны
Нелокальные нейроны и интерпретируемые нейронные сети позволяют в наглядной форме отобразить систему детерминации будущих состояний. Нелокальный нейрон представляет собой будущее состояние объекта управления с изображением наиболее сильно влияющих на него факторов с указанием силы и направления (способствует-препятствует) их влияния. Нейронная сеть представляет собой совокупность взаимосвязанных нейронов. В классических нейронных сетях связь между нейронами осуществляется по входным и выходным сигналам, а в нелокальных нейронных сетях - на основе общего информационного поля, реализуемого семантической информационной моделью. Система «Эйдос» обеспечивает построение любого подмножества многослойной нейронной сети с заданными или выбираемыми по заданным критериям рецепторами и нейронами, связанными друг с другом связями любого уровня опосредованности [14].
Рисунок 30. Пример нелокального нейрона в модели INF3
4.5 Семантические сети классов и признаков
Семантические сети классов и признаков являются графической визуализацией результатов кластерно-конструктивного анализа.
Кластерно-конструктивный анализ - это математический метод анализа данных, входящий в АСК-анализ, обеспечивающий: выявление классов, наиболее сходных по системе их детерминации и объединение их в кластеры; выявление кластеров классов, наиболее сильно отличающиеся по системе их детерминации и построение из них полюсов конструктов классов, при этом остальные кластеры включаются в конструкты в качестве промежуточных между полюсами; выявление факторов, наиболее сходных по детерминируемым ими классам и объединение их в кластеры; выявление кластеров факторов, наиболее сильно отличающиеся по детерминируемым ими классам и построение из них полюсов конструктов факторов, при этом остальные кластеры включаются в конструкты в качестве промежуточных между полюсами.
Состояния объекта управления, соответствующие классам, включенным в один кластер, могут быть достигнуты одновременно, т.е. являются совместимыми (коалиционными) по детерминирующим их факторам. Состояния объекта управления, соответствующие классам, образующим полюса конструкта, не могут быть достигнуты одновременно, т.е. являются противоположными по детерминирующим их факторам (антагонистическими).
Факторы, включенные в один кластер, оказывают сходное влияние на поведение объекта управления и могут, при необходимости, быть использованы для замены друг друга. Факторы, образующие полюса конструкта, оказывают противоположное влияние на поведение объекта управления.
Кластерно-конструктивный анализ классов позволяет сравнить их по сходству системы детерминации и отобразить эту информацию в наглядной графической форме семантической сети классов.
Кластерно-конструктивный анализ факторов позволяет сравнить факторы по сходству их влияния на переход объекта в будущие состояния и отобразить эту информацию в наглядной графической форме семантической сети факторов.
Рисунок 31. Экранные формы задания параметров кластерно-конструктивного анализа классов и признаков в различных моделях
Рисунок 34. Примеры семантических сетей значений факторов без фильтра и с фильтром по уровню связи в модели INF1
4.6 Когнитивные диаграммы классов и признаков
Когнитивные диаграммы классов (значений факторов) - это графические диаграммы, позволяющие отобразить в чем конкретно состоит сходство и различие любых двух классов (или любых двух значений факторов), т.е. детально увидеть структуру каждой линии связи в семантической сети. Когнитивные диаграммы представляет собой графическое изображение обобщенного коэффициента корреляции профилей классов (или факторов), при этом каждая линия, вносящая вклад в сходство или различие соответствует одному слагаемому, ее цвет - знаку, а толщина - модулю этого слагаемого.
На рисунках 35, 36 и 37, 38 приведены примеры экранных форм задания параметров когнитивных когнитивных диаграмм классов и признаков и примеры графической визуализации этих диаграмм (соответственно).
Рисунок 35. Пример экранной формы задания параметров когнитивной
диаграммы классов в модели INF3
Заключение
Так как существует множество систем искусственного интеллекта, то возникает необходимость сопоставимой оценки качества их математических моделей. Одним из вариантов решения этой задачи является тестирование различных системы на общей базе исходных данных, для чего очень удобно использовать общедоступную базу репозитория UCI.
В данной работе приводится развернутый пример использования базы данных репозитория UCI для оценки качества математических моделей, применяемых в АСК-анализе и его программном инструментарии системе искусственного интеллекта «Эйдос».
При этом наиболее достоверной в данном приложении оказались модели INF4, основанная на семантической мере целесообразности информации А.Харкевича при интегральном критерии «Сумма знаний». Уровень достоверности прогнозирования принадлежности объекта к классу с применением данной составляет 70,194%, а достоверность прогнозирования непринадлежности объекта к классу - 81,889%, что заметно выше, чем достоверность экспертных оценок, которая считается равной около 70%.
Для оценки достоверности моделей в АСК-анализе и системе «Эйдос» используется метрика, сходная с F-критерием.
Также обращает на себя внимание, что статистические модели в данном приложении дают примерно на 21% более низкую средневзвешенную достоверность идентификации и не идентификации, чем модели знаний, что, как правило, наблюдается и в других приложениях. Этим и оправдано применение моделей знаний.
Ясно, что если на основе базы данных UCI, рассмотренной в данной статье, построить модели прогнозирования не с помощью АСК-анлаиза и реализующей его системы «Эйдос», а с применением других математических методов и реализующих их программных систем, то можно сопоставимо сравнить их качество.
Данная статья может быть использована как описание лабораторной работы по дисциплинам:
- Интеллектуальные системы;
- Инженерия знаний и интеллектуальные системы;
- Интеллектуальные технологии и представление знаний;
- Представление знаний в интеллектуальных системах;
- Основы интеллектуальных систем;
- Введение в нейроматематику и методы нейронных сетей;
- Основы искусственного интеллекта;
- Интеллектуальные технологии в науке и образовании;
- Управление знаниями;
- Автоматизированный системно-когнитивный анализ и интеллектуальная система «Эйдос»;
которые автор ведет в настоящее время, а также и в других дисциплинах, связанных с преобразованием данных в информацию, а ее в знания и применением этих знаний для решения задач идентификации, прогнозирования, принятия решений и исследования моделируемой предметной области (а это практически все дисциплины во всех областях науки).
...Подобные документы
Разработка веб-приложений на основе Servlet API. Основные способы передачи данных от пользователя. Краткая справка по необходимым программным компонентам. Составление программы интернет-чата на основе протокола HTTP. Диаграмма классов веб-приложения.
лабораторная работа [1,1 M], добавлен 01.05.2014Разработка системы автоматизированного анализа сложных объектов образовательной системы. Построение диаграмм последовательности, кооперации, классов, состояний, компонентов, а также развертывания. Представление сгенерированных кодов клиента и сервера.
курсовая работа [501,1 K], добавлен 23.06.2014Характеристика объекта автоматизации. Создание многоуровневой архитектуры приложения, отладка метода безошибочной идентификации пользователей системы. Разработка нестандартного метода преобразования объектов базы данных в объекты классов приложения.
курсовая работа [395,4 K], добавлен 28.04.2015Описание предметной области. Алгоритм разработки приложения для создания, управления и просмотра базы данных библиотечной литературы. Построение схемы классов для графического отображения функций программы и анализа взаимосвязей между различными классами.
курсовая работа [2,0 M], добавлен 14.12.2012Создание автоматизированной системы мониторинга состояния аппаратных средств компьютерных сетей на основе протокола SNMP в среде программирования С++Builder. Описание реляционной базы данных и ее визуальное представление. Разработка диаграммы классов.
отчет по практике [2,2 M], добавлен 05.01.2016Выявление классов-сущностей (диаграмма классов) и вариантов использований системы. Моделирование видов деятельности, взаимодействий, состояний, пользовательского интерфейса и архитектуры системы (диаграмм развертывания) на основе выявленных требований.
дипломная работа [2,1 M], добавлен 24.01.2016Анализ исследований на тему предрасположенности человека к химических зависимостям. Создание опроса, на основе проанализированной литературы. Анализ и выбор технологии для создания интеллектуальной системы. Проектирование интеллектуальной системы.
дипломная работа [2,5 M], добавлен 26.08.2017Общая характеристика использования информационных технологий на предприятии. Обоснование выбора программных средств разработки приложения. Логическое и физическое моделирование базы данных. Построение диаграммы классов автоматизированной системы учета.
дипломная работа [12,5 M], добавлен 13.06.2015Разработка фрагментов математического обеспечения для автоматизированной информационной системы прогнозирования нагрузки пассажирских авиаперевозок. Анализ входных данных и предметной области. Состав информационной базы автоматизированного комплекса.
курсовая работа [1,6 M], добавлен 07.03.2015Создание модели информационной системы оптовой базы с помощью средства ModelMaker. Диаграммы последовательности, диаграмма классов, создание предварительного модуля проекта на языке Object Pascal. Документирование информационной системы оптовой базы.
курсовая работа [516,4 K], добавлен 01.06.2016Общая характеристика систем обработки информации, их роль в управлении современным предприятием. Разработка проекта автоматизации процесса учета товаров на основе использования базы данных для магазина. Создание клиентской базы с возможностью обновления.
дипломная работа [3,1 M], добавлен 13.07.2011Исследование характеристик и функциональных возможностей системы управления базами данных Microsoft Office Access. Определение основных классов объектов. Разработка базы данных "Делопроизводство". Создание таблиц, форм, запросов, отчетов и схем данных.
реферат [1,3 M], добавлен 05.12.2014Понятие, законодательное регулирование и виды электронных подписей. Разработка структурной схемы приложения и базы данных. Создание диаграммы прецедентов и классов. Проектирование интерфейса программы. Анализ руководства пользователя web-приложения.
дипломная работа [869,8 K], добавлен 12.08.2017Выбор сервера базы данных, инструментальных средств разработки клиентского интерфейса и технологий. Описание таблиц базы данных системы мониторинга. Разработка инструментальных средств создания элементов системы. Интерфейс генерации тестов. Расчет затрат.
дипломная работа [1,9 M], добавлен 12.03.2013"Наивная" модель прогнозирования. Прогнозирование методом среднего и скользящего среднего. Метод опорных векторов, деревьев решений, ассоциативных правил, системы рассуждений на основе аналогичных случаев, декомпозиции временного ряда и кластеризации.
курсовая работа [2,6 M], добавлен 02.12.2014Описание документооборота института и кафедры. Анализ технологии документооборота на основе диаграмм SADT (IDEF0). Обоснование проектных решений по видам обеспечения. Разработка базы данных на основе даталогического моделирования в среде MS Access.
дипломная работа [3,1 M], добавлен 09.02.2012Теоретические основы применения технологии ADO в среде Delphi. Основные понятия и определения теории баз данных. Компоненты Delphi для создания приложений, оперирующих с базами данных. Общий вид и основные особенности работы приложения "Аптека".
курсовая работа [1,4 M], добавлен 09.08.2012Базы данных и системы управления ими. Свойства полей баз данных, их типы и безопасность. Программное обеспечение системы управления базами данных, современные технологии в данной области. Принципы организации данных, лежащие в основе управления.
курсовая работа [24,6 K], добавлен 11.07.2011Обзор веб-приложений для реализации онлайн фитнес-системы поддержания физической формы человека. Диаграммы вариантов использования. Построение логической модели данных. Способы идентификации классов анализа. Разработка сценариев и макетов экранных форм.
дипломная работа [1,2 M], добавлен 02.08.2016Методика создания базы данных (БД) "Учет готовой продукции на складе". Порядок разработки пользовательского приложения (информационной системы) на основе БД. Перечень и общая характеристика документов, необходимых для учета готовой продукции на складе.
курсовая работа [2,4 M], добавлен 06.09.2010