Исследование символьных и цифровых рядов методами теории информации и АСК-анализа (на примере числа Пи с одним миллионом знаков после запятой)
Применение теории информации и автоматизированного системно-когнитивного анализа для исследования символьных и цифровых рядов на примере числа Пи с одним миллионом знаков после запятой при использовании когнитивной аналитической системы "Эйдос-Х++".
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 15.05.2017 |
Размер файла | 3,7 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Кубанский государственный аграрный университет
Статья
на тему: Исследование символьных и цифровых рядов методами теории информации и АСК-анализа (на примере числа Пи с одним миллионом знаков после запятой)
Выполнил:
Луценко Евгений Вениаминович
В статье описывается программный интерфейс с универсальной когнитивной аналитической системой «Эйдос-Х++», обеспечивающий преобразование символьных, в частности числовых рядов в такую форму, которая непосредственно воспринимается данной системой. В результате в системе могут быть созданные 3 статистических и 7 интеллектуальных моделей этих рядов, в которых отражены взаимосвязи между символами или цифрами в этих рядах.
Для отражения взаимосвязей между символами используются те же самые частные и интегральные критерии автоматизированного системно-когнитивного анализа (АСК-анализ), что и при отражении причинно-следственных взаимосвязей между событиями в реальной области, что ранее не применялось в теории чисел.
Приводится подробный численный пример подобного исследования на примере выявления взаимосвязей между цифрами, представляющими собой десятичные знаки числа р, при этом в приведенном примере используется миллион знаков числа р после запятой
Ключевые слова: автоматизированный системно-когнитивный анализ, интеллектуальная система «эйдос», теория чисел, вычислительный эксперимент
The article describes a software interface with the universal cognitive analytical system "Eidos-X++" ensuring the transformation of character, in particular - the numerical series in a form that is directly perceived by this system. As a result, the system can contain 3 statistical and 7 intellectual models of the series, which highlights the relationship between the characters or numbers in these lines.
To reflect the relationships between the characters we used the same private and integral data of the automated system of cognitive analysis (ASC-analysis), and in the reflection of reasons-and-effect relationships between events in the real area that has not previously been used in the theory of numbers. The article provides a detailed numerical examples of such studies on the example of the identification of relationships between numbers that represent the decimal digits of the PI number, in the example we use one million digits of the PI number after the decimal point
Keywords: automated system-cognitive analysis, eidos intellectual system, number theory, computational experiment
Все уже привыкли к тому, что при изучении объектов и явлений реальной области конкретными науками широко применится математика и компьютерные технологии, т.е. математика обогащает конкретные науки, способствует их развитию и повышению научного уровня исследований.
При этом необходимо понимать, что в математике нет мер для количественного отражения силы и направления причинно-следственных зависимостей, т.к. нет и самого понятия причинно-следственных зависимостей, которое относится не к абстрактной, а к реальной области. Это связано с тем, что причинно-следственные зависимости возможны только между реальными, а не абстрактными объектами. Меры взаимосвязи, выработанные математикой, такие как корреляция, сами по себе не являются мерами причинно-следственных связей, т.к. не отражают поведение объекта исследования, как в случае действия, так и в случае отсутствия действия на него исследуемого фактора [1, 2]. Поэтому конкретными науками выработан ряд собственных количественных мер силы и направления причинно-следственных зависимостей [3]. Среди этих мер в первую очередь необходимо упомянуть про классическую статистику Хи-квадрат и модель Георга Раша [3]. автоматизированный системно-когнитивный анализ
Автором предложено использовать для этой цели как эти, так и еще ряд способов повышения степени формализации разнородных номинальных шкал путем преобразования их в числовые с началом отсчета и общей единицей измерения, в качестве которой используется, например, количество информации [4]. Ранее эти способы разрозненно использовались в различных направлениях науки, но осознанно не объединялись вместе как модели знаний и меры силы и направления причинно-следственных связей.
На наш взгляд представляет интерес возможность использования всех этих количественных мер силы и направления причинно-следственных связей, выработанных конкретными науками, для исследования взаимосвязей между абстрактными математическими объектами, например такими, как элементы символьных, в частности цифровых рядов. Возможно, так конкретные науки могут внести некоторый, пусть небольшой вклад в обогащение математики, т.е. в какой-то степени вернуть ей свой долг. Разработке этому направления мысли посвящены работы [5, 6, 7] и другие.
В данной статье рассмотрим применение теории информации и АСК-анализа для исследования символьных и цифровых рядов на примере числа р одним миллионом знаков после запятой.
Данная задача относится к теории чисел, результаты в которой формулируются в форме гипотез и теорем. Но что представляет собой математическая гипотеза или теорема с точки зрения теории информации? Это некое высказывание, содержащее определенное количество информации об абстрактных математических объектах, их свойствах и отношениях. Предметом изучения теории чисел является такой абстрактный объект как число, а также свойства чисел и их отношений.
Любой символ можно рассматривать как цифру в системе счисления, включающей в качестве цифр весь алфавит, в который входит данный символ. Поэтому символьные и цифровые ряды могу рассматриваться как символьные или как цифровые в определенных системах счисления, т.е. между ним нет принципиальной разницы
Возникает закономерный вопрос: а возможно ли автоматизировать исследование свойств чисел и их отношений таким образом, чтобы результаты этого исследования можно было формулировать в виде высказываний с указанием конкретного количества информации, содержащегося в них?
Данная статья является попыткой обоснования утвердительного ответа на этот вопрос. Для этого предлагается применять для исследования свойств чисел в теории чисел тот же метод, который широко апробирован и хорошо зарекомендовал себя при исследования реальных объектов и их отношений в различных предметных областях, а именно автоматизированный системно-когнитивный анализ (АСК-анализ), основанный на теории информации [8] и его программный инструментарий - универсальную когнитивную аналитическую систему «Эйдос» [9. 10].
Рассмотрим на простейшем примере: цифрового ряда и миллиона десятичных знаков числа р, как может выглядеть подобное исследование. Целью исследования является выявление причинно-следственных зависимостей между цифрой ряда и 5-ю предыдущими цифрами способом, который ранее не использовался для этой цели, а именно с помощью АСК-анализа и системы «Эйдос».
Будем придерживаться последовательности обработки данных, информации и знаний, принятых в АСК-анализе и его программном инструментарии - интеллектуальной системе «Эйдос» (рисунок 1):
Рисунок 1. Последовательность преобразования данных в информацию, а ее в знания в АСК-анализе и интеллектуальной системе «Эйдос»
Очень кратко о АСК-анализе.
АСК-анализ представляет собой системный анализ, структурированным по базовым когнитивным (познавательным) операциям, что позволило его автоматизировать и включает:
- формализуемую когнитивную концепцию, из которой выводится минимальный полный набор когнитивных операций (когнитивный конфигуратор);
- математическая модель, основанную на системном обобщении семантической меры информации А.Харкевича;
- методику численных расчетов, т.е. структуры данных и алгоритмы;
- программный инструментарий - интеллектуальную систему "Эйдос".
Последовательность преобразования данных в информацию, а ее в знания в АСК-анализе и интеллектуальной системе «Эйдос», представленная на рисунке 1, соответствует этапам АСК-анализа:
Этапы разработки приложения в АСК-анализе:
1. Когнитивная структуризация предметной области.
2. Формализация предметной области.
3. Подготовка и ввод обучающей выборки.
4. Синтез семантической информационной модели (СИМ).
5. Повышение качества СИМ.
6. Проверка адекватности СИМ (измерение внутренней и внешней, дифференциальной и интегральной валидности).
7. Решение задач идентификации, прогнозирование и принятия решений;
8. Исследование моделируемой предметной области путем исследования ее модели (анализ СИМ).
Теоретические аспекты АСК-анализа и опыт его практического применения для решения задач в различных предметных областях подробно описан в ряде работ автора [6, 11-28] Полный открытей бесплатный доступ к этим и другим работам предоставлен на сайте автора: и в данной статье на этом останавливаться нецелесообразно. Отметим лишь, что этот метод обеспечивает:
- выявление причинно-следственных связей в эмпирических данных и преобразование их сначала в информацию, а затем в знания;
- сопоставимую обработку данных, полученных в различных видах измерительных шкал и представленных в различных единицах измерения;
- использование знаний для решения задач идентификации, прогнозирование и принятия решений.
Скачаем, установим и запустим систему «Эйдос»
1. Самую новую на текущий момент версию системы «Эйдос-Х++» всегда можно скачать на странице:
2. Разархивируем этот архив в любую папку с правами на запись с коротким латинским именем самой папки и всех папок на пути к ней.
3. Запустить систему. Файл запуска: _AIDOS-X.exe.
4. Задать имя: 1 и пароль: 1.
5. Выполнить режим 1.1 (только 1-й раз при установке системы в эту папку).
6. Скачиваем архив и записываем его содержимое в папку: c:\Aidos-X\AID_DATA\Inp_data\.
7. Запускаем программу Char_series.exe Данная программа приведена в архиве с исходным текстом и в экранной форме, представленной на рисунке 2, задаем имя файла с рядом: «Pi.txt», длину учитываемых в моделях предыстории: 5.
Рисунок 2. Экранная форма программного интерфейса, преобразующего символьный или цифровой ряд в форму, непосредственно воспринимаю системой «Эйдос»
Через 17 секунд выдается сообщение, приведенное на рисунке 3:
Рисунок 3. Экранная форма программного интерфейса с информацией об окончании процесса преобразования
Затем запускаем режим 2.3.2.2 системы «Эйдос» с опциями, заданными на экранной форме, приведенной на рисунке 4:
Рисунок 4. Экранная форма универсального программного интерфейса системы «Эйдос» для ввода данных из внешних баз данных
После нажатия «ОК» появляется окно внутреннего калькулятора данного интерфейса, на котором в данном случае ничего невозможно посчитать, т.к. в приложении нет числовых шкал, а просто отображается сколько найдено классификационных и описательных шкал и какое у них суммарное количество уникальных градаций (рисунок 5):
Рисунок 5. Экранная форма внутреннего калькулятора программного интерфейса с отображением параметров размерности модели
После выхода на создание модели начинается процесс автоматической формализации предметной области, включающий:
1. Генерацию классификационных и описательных шкал и градаций, позволяющих закодировать все символы ряда.
2. Генерацию базы событий и обучающей выборки, в которой символы уже заменены их кодами.
В результате выполнения данного режима получаем следующие классификационные и описательные шкалы и градации и обучающую выборку (таблицы 1-3):
Таблица 1 - Классификационные шкалы и градации
Код |
Наим. |
|
1 |
CLASSES-0 |
|
2 |
CLASSES-1 |
|
3 |
CLASSES-2 |
|
4 |
CLASSES-3 |
|
5 |
CLASSES-4 |
|
6 |
CLASSES-5 |
|
7 |
CLASSES-6 |
|
8 |
CLASSES-7 |
|
9 |
CLASSES-8 |
|
10 |
CLASSES-9 |
Таблица 2 - Описательные шкалы и градации
Код |
Наим. |
Код |
Наим. |
Код |
Наим. |
Код |
Наим. |
Код |
Наим. |
|
1 |
ATR1-0 |
11 |
ATR2-0 |
21 |
ATR3-0 |
31 |
ATR4-0 |
41 |
ATR5-0 |
|
2 |
ATR1-1 |
12 |
ATR2-1 |
22 |
ATR3-1 |
32 |
ATR4-1 |
42 |
ATR5-1 |
|
3 |
ATR1-2 |
13 |
ATR2-2 |
23 |
ATR3-2 |
33 |
ATR4-2 |
43 |
ATR5-2 |
|
4 |
ATR1-3 |
14 |
ATR2-3 |
24 |
ATR3-3 |
34 |
ATR4-3 |
44 |
ATR5-3 |
|
5 |
ATR1-4 |
15 |
ATR2-4 |
25 |
ATR3-4 |
35 |
ATR4-4 |
45 |
ATR5-4 |
|
6 |
ATR1-5 |
16 |
ATR2-5 |
26 |
ATR3-5 |
36 |
ATR4-5 |
46 |
ATR5-5 |
|
7 |
ATR1-6 |
17 |
ATR2-6 |
27 |
ATR3-6 |
37 |
ATR4-6 |
47 |
ATR5-6 |
|
8 |
ATR1-7 |
18 |
ATR2-7 |
28 |
ATR3-7 |
38 |
ATR4-7 |
48 |
ATR5-7 |
|
9 |
ATR1-8 |
19 |
ATR2-8 |
29 |
ATR3-8 |
39 |
ATR4-8 |
49 |
ATR5-8 |
|
10 |
ATR1-9 |
20 |
ATR2-9 |
30 |
ATR3-9 |
40 |
ATR4-9 |
50 |
ATR5-9 |
Таблица 3 - Обучающая выборка (фрагмент)
KOD_OBJ |
NAME_OBJ |
CLS1 |
ATR1 |
ATR2 |
ATR3 |
ATR4 |
ATR5 |
|
1 |
9 |
10 |
6 |
12 |
25 |
32 |
44 |
|
2 |
2 |
3 |
10 |
16 |
22 |
35 |
42 |
|
3 |
6 |
7 |
3 |
20 |
26 |
32 |
45 |
|
4 |
5 |
6 |
7 |
13 |
30 |
36 |
42 |
|
5 |
3 |
4 |
6 |
17 |
23 |
40 |
46 |
|
6 |
5 |
6 |
4 |
16 |
27 |
33 |
50 |
|
7 |
8 |
9 |
6 |
14 |
26 |
37 |
43 |
|
8 |
9 |
10 |
9 |
16 |
24 |
36 |
47 |
|
9 |
7 |
8 |
10 |
19 |
26 |
34 |
46 |
|
10 |
9 |
10 |
8 |
20 |
29 |
36 |
44 |
|
11 |
3 |
4 |
10 |
18 |
30 |
39 |
46 |
|
12 |
2 |
3 |
4 |
20 |
28 |
40 |
49 |
|
13 |
3 |
4 |
3 |
14 |
30 |
38 |
50 |
|
14 |
8 |
9 |
4 |
13 |
24 |
40 |
48 |
|
15 |
4 |
5 |
9 |
14 |
23 |
34 |
50 |
|
16 |
6 |
7 |
5 |
19 |
24 |
33 |
44 |
|
17 |
2 |
3 |
7 |
15 |
29 |
34 |
43 |
|
18 |
6 |
7 |
3 |
17 |
25 |
39 |
44 |
|
19 |
4 |
5 |
7 |
13 |
27 |
35 |
49 |
|
20 |
3 |
4 |
5 |
17 |
23 |
37 |
45 |
|
21 |
3 |
4 |
4 |
15 |
27 |
33 |
47 |
|
22 |
8 |
9 |
4 |
14 |
25 |
37 |
43 |
|
23 |
3 |
4 |
9 |
14 |
24 |
35 |
47 |
|
24 |
2 |
3 |
4 |
19 |
24 |
34 |
45 |
|
25 |
7 |
8 |
3 |
14 |
29 |
34 |
44 |
|
26 |
9 |
10 |
8 |
13 |
24 |
39 |
44 |
|
27 |
5 |
6 |
10 |
18 |
23 |
34 |
49 |
|
28 |
0 |
1 |
6 |
20 |
28 |
33 |
44 |
|
29 |
2 |
3 |
1 |
16 |
30 |
38 |
43 |
|
30 |
8 |
9 |
3 |
11 |
26 |
40 |
48 |
|
31 |
8 |
9 |
9 |
13 |
21 |
36 |
50 |
|
32 |
4 |
5 |
9 |
19 |
23 |
31 |
46 |
|
33 |
1 |
2 |
5 |
19 |
29 |
33 |
41 |
|
34 |
9 |
10 |
2 |
15 |
29 |
39 |
43 |
|
35 |
7 |
8 |
10 |
12 |
25 |
39 |
49 |
В базах данных событий, представленных в форме таблицы 3, насчитывается около миллиона записей.
На следующем этапе АСК-анализа осуществляется синтез и верификация (оценка достоверности) 3 статистических моделей и 7 моделей знаний. В системе «Эйдос» эти этапы выполняются в режиме 3.5, экранная форма управления которым приведена на рисунке 6:
Рисунок 6. Экранная форма режима синтеза и верификации моделей
Для проверки адекватности моделей используется каждая 100-я цифра. При 1000000 объектов обучающей выборки получается, что каждая модель проверяется на 10000 контрольных примерах. При этом каждый из этих примеров дает настолько ничтожный вклад в модель, что удалять их из обучающей выборки, чтобы они не повлияли на результат идентификации, как это принято в бутстрепном методе, нет никакой необходимости.
В результате выполнения режима 3.5 сформированы статистические модели и модели знаний, некоторые из которых представлены ниже в таблицах 4, 5 и 6:
- в таблице 4 приведена матрица абсолютных частот наблюдений признаков у объектов обучающей выборки, относящихся к различным категориям (классам);
- в таблице 5 мы видим количество информации в миллионных долях бита (микробитах), которое содержится в факте наблюдения определенного признака у объекта о том, что этот объект принадлежит определенному классу;
- в таблице 6 приведены значения хи-квадрат.
Таблица 4 - Матрица абсолютных частот (модель: ABS)
KOD_PR |
NAME |
CLS1 |
CLS2 |
CLS3 |
CLS4 |
CLS5 |
CLS6 |
CLS7 |
CLS8 |
CLS9 |
CLS10 |
SUMMA |
SREDN |
DISP |
|
1 |
ATR1-0 |
9939 |
9892 |
10050 |
10038 |
9948 |
10042 |
9896 |
9952 |
10174 |
10035 |
99966 |
9996,6000000 |
87,1157595 |
|
2 |
ATR1-1 |
10007 |
10064 |
9721 |
10013 |
9874 |
9992 |
9934 |
9944 |
10061 |
10148 |
99758 |
9975,8000000 |
118,0186426 |
|
3 |
ATR1-2 |
9907 |
10110 |
10062 |
9951 |
10060 |
9989 |
9858 |
10226 |
9956 |
9912 |
100031 |
10003,1000000 |
111,3248001 |
|
4 |
ATR1-3 |
10052 |
9939 |
10056 |
10026 |
9960 |
10188 |
9925 |
10098 |
9951 |
10037 |
100232 |
10023,2000000 |
82,1905645 |
|
5 |
ATR1-4 |
10017 |
10009 |
9980 |
10009 |
9958 |
10036 |
10194 |
10043 |
9914 |
10071 |
100231 |
10023,1000000 |
74,9050510 |
|
6 |
ATR1-5 |
10066 |
9791 |
10056 |
10051 |
10194 |
10232 |
10011 |
10045 |
9919 |
9998 |
100363 |
10036,3000000 |
125,0635838 |
|
7 |
ATR1-6 |
10147 |
9896 |
10086 |
9974 |
10014 |
9982 |
9819 |
9867 |
9880 |
9885 |
99550 |
9955,0000000 |
104,7971586 |
|
8 |
ATR1-7 |
9888 |
10095 |
9962 |
10069 |
10022 |
9964 |
10112 |
9802 |
9991 |
9900 |
99805 |
9980,5000000 |
98,6466759 |
|
9 |
ATR1-8 |
10029 |
9954 |
10073 |
10048 |
9962 |
9922 |
9950 |
9924 |
10088 |
10038 |
99988 |
9998,8000000 |
62,8645811 |
|
10 |
ATR1-9 |
9914 |
10008 |
9986 |
10053 |
10239 |
10015 |
9851 |
9904 |
10054 |
10084 |
100108 |
10010,8000000 |
109,5615504 |
|
11 |
ATR2-0 |
10011 |
10040 |
10067 |
9968 |
10059 |
9931 |
9939 |
9882 |
9968 |
10100 |
99965 |
9996,5000000 |
69,9384650 |
|
12 |
ATR2-1 |
9922 |
10143 |
9911 |
9982 |
9962 |
9994 |
9954 |
9982 |
9867 |
10042 |
99759 |
9975,9000000 |
76,2619025 |
|
13 |
ATR2-2 |
9981 |
10064 |
9941 |
9871 |
10212 |
9986 |
9905 |
10003 |
10091 |
9977 |
100031 |
10003,1000000 |
98,5826782 |
|
14 |
ATR2-3 |
9913 |
10041 |
10024 |
10118 |
10004 |
10030 |
9852 |
10142 |
9985 |
10123 |
100232 |
10023,2000000 |
92,3192528 |
|
15 |
ATR2-4 |
10052 |
9885 |
10107 |
10226 |
9934 |
10099 |
9939 |
9956 |
10140 |
9893 |
100231 |
10023,1000000 |
117,3697387 |
|
16 |
ATR2-5 |
10129 |
10051 |
10077 |
10058 |
9853 |
9997 |
10075 |
10019 |
10053 |
10051 |
100363 |
10036,3000000 |
73,3121939 |
|
17 |
ATR2-6 |
9930 |
9929 |
9991 |
9900 |
9917 |
10003 |
9868 |
9940 |
9991 |
10081 |
99550 |
9955,0000000 |
61,7665857 |
|
18 |
ATR2-7 |
9966 |
9851 |
9988 |
10049 |
9906 |
10182 |
9975 |
10025 |
9892 |
9971 |
99805 |
9980,5000000 |
92,9841683 |
|
19 |
ATR2-8 |
9984 |
9954 |
9945 |
9955 |
10122 |
10158 |
9994 |
9905 |
10007 |
9964 |
99988 |
9998,8000000 |
80,0427663 |
|
20 |
ATR2-9 |
10078 |
9800 |
9981 |
10105 |
10262 |
9982 |
10049 |
9951 |
9994 |
9906 |
100108 |
10010,8000000 |
124,2513581 |
|
21 |
ATR3-0 |
9904 |
10044 |
9960 |
10101 |
10024 |
9998 |
9914 |
10016 |
9976 |
10028 |
99965 |
9996,5000000 |
60,0208297 |
|
22 |
ATR3-1 |
9950 |
9926 |
9960 |
10118 |
10109 |
10087 |
9845 |
9729 |
9967 |
10068 |
99759 |
9975,9000000 |
124,8647713 |
|
23 |
ATR3-2 |
9991 |
9872 |
9904 |
9929 |
10011 |
10183 |
10008 |
10110 |
9930 |
10093 |
100031 |
10003,1000000 |
99,9716071 |
|
24 |
ATR3-3 |
9838 |
10170 |
10164 |
10159 |
9954 |
10093 |
9870 |
9904 |
10026 |
10054 |
100232 |
10023,2000000 |
125,7915383 |
|
25 |
ATR3-4 |
10004 |
10027 |
9957 |
9981 |
9940 |
10055 |
10140 |
10039 |
10067 |
10022 |
100232 |
10023,2000000 |
58,0149406 |
|
26 |
ATR3-5 |
10149 |
9927 |
9930 |
10105 |
10125 |
10042 |
9887 |
10026 |
10190 |
9982 |
100363 |
10036,3000000 |
104,1025669 |
|
27 |
ATR3-6 |
9963 |
9822 |
10187 |
9904 |
10051 |
9928 |
9934 |
10082 |
9905 |
9774 |
99550 |
9955,0000000 |
122,9064685 |
|
28 |
ATR3-7 |
9972 |
9948 |
9954 |
9938 |
10103 |
10071 |
9991 |
10028 |
9930 |
9869 |
99804 |
9980,4000000 |
70,0653663 |
|
29 |
ATR3-8 |
10144 |
10125 |
10015 |
9887 |
9857 |
10011 |
10027 |
9900 |
10035 |
9987 |
99988 |
9998,8000000 |
95,4716945 |
|
30 |
ATR3-9 |
10051 |
9897 |
10001 |
10110 |
10057 |
9894 |
9934 |
9971 |
9962 |
10231 |
100108 |
10010,8000000 |
104,6855609 |
|
31 |
ATR4-0 |
10161 |
9883 |
10106 |
9991 |
9896 |
10066 |
10084 |
9785 |
9997 |
9995 |
99964 |
9996,4000000 |
115,1252458 |
|
32 |
ATR4-1 |
9838 |
10109 |
9961 |
9939 |
9865 |
10000 |
9924 |
10065 |
9954 |
10105 |
99760 |
9976,0000000 |
93,6743769 |
|
33 |
ATR4-2 |
10210 |
9790 |
10121 |
10130 |
9973 |
9938 |
9844 |
9969 |
10096 |
9960 |
100031 |
10003,1000000 |
133,4711371 |
|
34 |
ATR4-3 |
10004 |
10092 |
9925 |
10142 |
10006 |
10213 |
9912 |
10011 |
9874 |
10053 |
100232 |
10023,2000000 |
105,8518881 |
|
35 |
ATR4-4 |
10010 |
10080 |
10036 |
10077 |
10101 |
9939 |
9946 |
10058 |
10062 |
9923 |
100232 |
10023,2000000 |
65,2496062 |
|
36 |
ATR4-5 |
9941 |
10093 |
10162 |
9893 |
10163 |
10053 |
10034 |
9997 |
10019 |
10008 |
100363 |
10036,3000000 |
86,6757047 |
|
37 |
ATR4-6 |
9957 |
9786 |
9824 |
10038 |
10002 |
9896 |
9923 |
10021 |
10105 |
9998 |
99550 |
9955,0000000 |
98,9017470 |
|
38 |
ATR4-7 |
9773 |
9919 |
10032 |
10026 |
10156 |
10065 |
10062 |
10013 |
9917 |
9841 |
99804 |
9980,4000000 |
115,8027058 |
|
39 |
ATR4-8 |
10122 |
10002 |
9911 |
10082 |
9957 |
9951 |
9829 |
9981 |
9895 |
10258 |
99988 |
9998,8000000 |
125,1486228 |
|
40 |
ATR4-9 |
9950 |
10004 |
9954 |
9914 |
10112 |
10241 |
9992 |
9905 |
10069 |
9967 |
100108 |
10010,8000000 |
103,5082391 |
|
41 |
ATR5-0 |
10175 |
9874 |
10000 |
9977 |
9881 |
9844 |
10044 |
10030 |
10132 |
10007 |
99964 |
9996,4000000 |
108,3750689 |
|
42 |
ATR5-1 |
10033 |
9955 |
9863 |
9997 |
10087 |
10188 |
9837 |
9965 |
9980 |
9855 |
99760 |
9976,0000000 |
109,6783175 |
|
43 |
ATR5-2 |
9919 |
9931 |
10145 |
10064 |
10087 |
9831 |
10062 |
10065 |
9939 |
9988 |
100031 |
10003,1000000 |
96,8451800 |
|
44 |
ATR5-3 |
9977 |
9978 |
10027 |
10103 |
10251 |
10075 |
9993 |
9920 |
9991 |
9918 |
100233 |
10023,3000000 |
99,3322707 |
|
45 |
ATR5-4 |
10018 |
10000 |
10003 |
9917 |
9881 |
9969 |
10022 |
10161 |
10187 |
10074 |
100232 |
10023,2000000 |
96,5007772 |
|
46 |
ATR5-5 |
10168 |
9942 |
10015 |
10103 |
10142 |
10071 |
9930 |
9966 |
9943 |
10083 |
100363 |
10036,3000000 |
88,5965261 |
|
47 |
ATR5-6 |
9804 |
9835 |
10074 |
9800 |
9977 |
10177 |
9957 |
9979 |
9935 |
10012 |
99550 |
9955,0000000 |
119,8999583 |
|
48 |
ATR5-7 |
10001 |
10178 |
9898 |
10069 |
9815 |
10128 |
9862 |
9899 |
9923 |
10030 |
99803 |
9980,3000000 |
120,0241179 |
|
49 |
ATR5-8 |
9845 |
10060 |
10002 |
10128 |
10163 |
9985 |
9943 |
9898 |
9979 |
9985 |
99988 |
9998,8000000 |
97,2463081 |
|
50 |
ATR5-9 |
10026 |
10005 |
10005 |
10074 |
9947 |
10094 |
9900 |
9922 |
9979 |
10156 |
100108 |
10010,8000000 |
79,9594342 |
|
0 |
Всего признаков |
499830 |
498790 |
500160 |
501160 |
501155 |
501810 |
497750 |
499025 |
499940 |
500540 |
5000160 |
0,0000000 |
0,0000000 |
|
0 |
Среднее |
9997 |
9976 |
10003 |
10023 |
10023 |
10036 |
9955 |
9981 |
9999 |
10011 |
0 |
10000,3200000 |
0,0000000 |
|
0 |
Ср.кв.откл. |
100 |
104 |
89 |
88 |
114 |
99 |
86 |
93 |
83 |
95 |
0 |
0,0000000 |
97,6014430 |
|
0 |
Всего объектов |
99966 |
99758 |
100032 |
100232 |
100231 |
100362 |
99550 |
99805 |
99988 |
100108 |
1000032 |
0,0000000 |
0,0000000 |
Для преобразования абсолютных частот встреч признаков у объектов обучающей выборки в разрезе по классам (таблица 4) в знания используются следующие частные критерии (таблица 5):
Таблица 5 - Частные критерии знаний, используемые в настоящее время в АСК-анализе и системе «Эйдос-Х++»
Наименование модели знаний и частный критерий |
Выражение для частного критерия |
||
через относительные частоты |
через абсолютные частоты |
||
INF1, частный критерий: количество знаний по А.Харкевичу, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу. Относительная частота того, что если у объекта j-го класса обнаружен признак, то это i-й признак |
|||
INF2, частный критерий: количество знаний по А.Харкевичу, 2-й вариант расчета относительных частот: Nj - суммарное количество объектов по j-му классу. Относительная частота того, что если предъявлен объект j-го класса, то у него будет обнаружен i-й признак. |
|||
INF3, частный критерий: Хи-квадрат: разности между фактическими и теоретически ожидаемыми абсолютными частотами |
--- |
||
INF4, частный критерий: ROI - Return On Investment, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу Применение предложено Л.О. Макаревич |
|||
INF5, частный критерий: ROI - Return On Investment, 2-й вариант расчета относительных частот: Nj - суммарное количество объектов по j-му классу |
|||
INF6, частный критерий: разность условной и безусловной относительных частот, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу |
|||
INF7, частный критерий: разность условной и безусловной относительных частот, 2-й вариант расчета относительных частот: Nj - суммарное количество объектов по j-му классу |
Обозначения:
i - значение прошлого параметра; j - значение будущего параметра;
Nij - количество встреч j-го значения будущего параметра при i-м значении прошлого параметра;
M - суммарное число значений всех прошлых параметров;
W - суммарное число значений всех будущих параметров.
Ni - количество встреч i-м значения прошлого параметра по всей выборке;
Nj - количество встреч j-го значения будущего параметра по всей выборке;
N - количество встреч j-го значения будущего параметра при i-м значении прошлого параметра по всей выборке.
Iij - частный критерий знаний: количество знаний в факте наблюдения i-го значения прошлого параметра о том, что объект перейдет в состояние, соответствующее j-му значению будущего параметра;
Ш - нормировочный коэффициент (Е.В.Луценко, 2002), преобразующий количество информации в формуле А.Харкевича в биты и обеспечивающий для нее соблюдение принципа соответствия с формулой Р.Хартли;
Pi - безусловная относительная частота встречи i-го значения прошлого параметра в обучающей выборке;
Pij - условная относительная частота встречи i-го значения прошлого параметра при j-м значении будущего параметра.
Таблица 6 - Матрица информативности (модель знаний: INF1) в микробитах
KOD_PR |
NAME |
CLS1 |
CLS2 |
CLS3 |
CLS4 |
CLS5 |
CLS6 |
CLS7 |
CLS8 |
CLS9 |
CLS10 |
SUMMA |
SREDN |
DISP |
|
1 |
ATR1-0 |
-1164 |
-1737 |
1085 |
398 |
-1540 |
205 |
-1200 |
-536 |
3821 |
600 |
-67 |
-7 |
1660 |
|
2 |
ATR1-1 |
753 |
2424 |
-5634 |
309 |
-2699 |
-422 |
74 |
-260 |
1864 |
3460 |
-131 |
-13 |
2609 |
|
3 |
ATR1-2 |
-1999 |
2818 |
1202 |
-1617 |
732 |
-1075 |
-2169 |
5174 |
-984 |
-2196 |
-114 |
-11 |
2471 |
|
4 |
ATR1-3 |
698 |
-1288 |
642 |
-432 |
-1852 |
2741 |
-1142 |
2028 |
-1524 |
71 |
-59 |
-6 |
1543 |
|
5 |
ATR1-4 |
-51 |
226 |
-990 |
-795 |
-1893 |
-494 |
4619 |
854 |
-2324 |
801 |
-48 |
-5 |
1932 |
|
6 |
ATR1-5 |
717 |
-4800 |
360 |
-177 |
2868 |
3388 |
435 |
614 |
-2499 |
-1049 |
-145 |
-15 |
2388 |
|
7 |
ATR1-6 |
4194 |
-752 |
2754 |
-82 |
783 |
-188 |
-1984 |
-1485 |
-1596 |
-1745 |
-101 |
-10 |
2058 |
|
8 |
ATR1-7 |
-1925 |
2985 |
-462 |
1409 |
404 |
-1128 |
3797 |
-3459 |
259 |
-1970 |
-89 |
-9 |
2275 |
|
9 |
ATR1-8 |
730 |
-438 |
1530 |
565 |
-1284 |
-2432 |
-76 |
-1190 |
1946 |
617 |
-32 |
-3 |
1356 |
|
10 |
ATR1-9 |
-2012 |
469 |
-596 |
414 |
4364 |
-681 |
-2487 |
-1883 |
960 |
1343 |
-110 |
-11 |
2021 |
|
11 |
ATR2-0 |
392 |
1464 |
1452 |
-1107 |
852 |
-2187 |
-264 |
-2054 |
-582 |
1993 |
-42 |
-4 |
1481 |
|
12 |
ATR2-1 |
-1087 |
4106 |
-1468 |
-361 |
-790 |
-381 |
505 |
559 |
-2331 |
1197 |
-51 |
-5 |
1780 |
|
13 |
ATR2-2 |
-396 |
1836 |
-1403 |
-3355 |
3961 |
-1140 |
-1144 |
425 |
1917 |
-788 |
-88 |
-9 |
2096 |
|
14 |
ATR2-3 |
-2301 |
911 |
-45 |
1535 |
-903 |
-625 |
-2732 |
2965 |
-790 |
1908 |
-77 |
-8 |
1832 |
|
15 |
ATR2-4 |
700 |
-2459 |
1733 |
3824 |
-2413 |
853 |
-836 |
-1019 |
2530 |
-3039 |
-127 |
-13 |
2312 |
|
16 |
ATR2-5 |
2060 |
844 |
810 |
-27 |
-4460 |
-1616 |
1807 |
56 |
391 |
90 |
-46 |
-5 |
1872 |
|
17 |
ATR2-6 |
-461 |
-35 |
715 |
-1685 |
-1314 |
265 |
-912 |
103 |
810 |
2483 |
-31 |
-3 |
1203 |
|
18 |
ATR2-7 |
-233 |
-2284 |
100 |
981 |
-2104 |
3533 |
860 |
1385 |
-1885 |
-431 |
-78 |
-8 |
1812 |
|
19 |
ATR2-8 |
-239 |
-438 |
-1224 |
-1438 |
2147 |
2631 |
875 |
-1603 |
209 |
-976 |
-56 |
-6 |
1479 |
|
20 |
ATR2-9 |
1521 |
-4055 |
-704 |
1525 |
4847 |
-1392 |
1798 |
-863 |
-329 |
-2492 |
-143 |
-14 |
2523 |
|
21 |
ATR3-0 |
-1922 |
1550 |
-850 |
1748 |
102 |
-739 |
-807 |
847 |
-409 ... |
Подобные документы
Исследование вертикальных проекций яркости и размаха яркости. Программная реализация алгоритма автоматического анализа цифровых изображений номерных знаков с целью сегментации цифробуквенных символов. Разработка графического пользовательского интерфейса.
дипломная работа [1,5 M], добавлен 12.04.2013Основные понятия стеганографии. Атаки на стегосистемы, стегосистемы водяных знаков. Применение дискретных вейвлет преобразований в кодировании цифровых зображений. Алгоритмы стеганографического встраивания информации в изображения формата JPEG2000.
дипломная работа [3,5 M], добавлен 09.06.2013Оформление таблицы на листе Excel. Применение округления чисел до двух знаков после запятой. Выделение диапазона данных, необходимых для построения графика. Добавление диаграммы на листе. Подписи горизонтальной оси. Добавление линий разделения на график.
контрольная работа [1,6 M], добавлен 13.11.2011Предмет и задачи теории информации, ее функции при создании АСУ. Определение пропускной способности дискретных (цифровых) каналов при отсутствии шумов. Расчет скорости передачи информации. Вычисление значения энтропии - среднего количества информации.
контрольная работа [112,0 K], добавлен 18.01.2015Система передачи информации. Использование энтропии в теории информации. Способы преобразования сообщения в сигнал. Динамический диапазон канала. Определение коэффициента модуляции. Преобразование цифровых сигналов в аналоговые. Использование USB–модемов.
курсовая работа [986,3 K], добавлен 18.07.2012Способы передачи и хранения информации наиболее надежными и экономными методами. Связь между вероятностью и информацией. Понятие меры количества информации. Энтропия и ее свойства. Формула для вычисления энтропии. Среднее количество информации.
реферат [99,7 K], добавлен 19.08.2015Характеристика информации. Перевод числа из двоичной системы в десятичную, шестнадцатеричную и восьмеричную. Способы оценки количества информации. Технические средства обработки информации. Принцип работы, история изобретения струйного принтера.
контрольная работа [1016,6 K], добавлен 22.10.2012Понятие и способы дискретизации аналоговых сигналов. Ознакомление с примерами аналого-цифрового преобразование звука. Изучение способов кодирования цифровых изображений, видеоданных и текста. Рассмотрение теоремы Котельникова и теории информации.
презентация [1,2 M], добавлен 15.04.2014Изучение сущности информации - сведений, знаний, которые получаются, передаются, преобразуются, регистрируются с помощью некоторых знаков. Способы передачи информации электрическими, магнитными и световыми импульсами. Программное обеспечение компьютеров.
контрольная работа [18,6 K], добавлен 27.02.2011Система счисления и перевод числа из одной системы в другую. Машинное предоставление информации. Числа с фиксированной точкой: прямой, обратный (инверсный) или дополнительный код. Программная реализация алгоритма и описание использованных процедур.
курсовая работа [96,7 K], добавлен 20.11.2010Теория информации как наука, предмет и методы ее изучения, применение в компьютерной технике. Системы передачи информации, разновидности сообщений и их источники. Разновидности помехи и способы их устранения. Аппаратура, используемая при передаче данных.
реферат [23,7 K], добавлен 14.07.2009Характеристика влияния компьютера на здоровье человека. Определение корней уравнения в Microsoft Excel с точностью до шестого знака после запятой. Решение системы линейных уравнений методом вычисления определителей и матричным способом в Microsoft Excel.
контрольная работа [734,0 K], добавлен 19.03.2012Понятие и юридическая природа цифровых произведений. Рассмотрение способов защиты авторских прав для мультимедийной информации (шифрование, защита носителей, электронные ключи, цифровые водяные знаки). Характеристика видов цифровых произведений.
курсовая работа [48,3 K], добавлен 29.01.2010Алгебра матриц: задание численных и символьных элементов вектора и матрицы с и без применения шаблонов, использование векторных и матричных операторов и функций. Операции умножения и деления вектора и матрицы друг на друга и на скалярные числа.
практическая работа [107,0 K], добавлен 05.12.2009Основы теории передачи информации. Экспериментальное изучение количественных аспектов информации. Количество информации по Хартли и К. Шеннону. Частотные характеристики текстовых сообщений. Количество информации как мера снятой неопределенности.
лабораторная работа [42,3 K], добавлен 15.02.2011Применение цифровых микросхем для вычисления, управления и обработки информации. Назначение микропроцессора и устройств микропроцессорной системы, их структурная и принципиальная схемы. Системная шина процессора и распределение адресного пространства.
курсовая работа [1,5 M], добавлен 29.02.2012Применение нейрокомпьютеров на российском финансовом рынке. Прогнозирование временных рядов на основе нейросетевых методов обработки. Определение курсов облигаций и акций предприятий. Применение нейронных сетей к задачам анализа биржевой деятельности.
курсовая работа [527,2 K], добавлен 28.05.2009Проектирование цифрового автомата для выполнения арифметической операции деления двоичных чисел, алгоритм работы. Числа с плавающей запятой. Типы элементов памяти управляющего автомата JK-триггер, не имеющего запрещенных состояний на основных входах.
курсовая работа [747,4 K], добавлен 25.03.2012Символьные переменные и функции являются как объекты класса sym object, производимые над ними операции. Методика упрощения и преобразования выражений. Функции для выполнения математического анализа. Графические возможности символьных переменных.
лабораторная работа [236,3 K], добавлен 06.07.2009Изучение символьных и строковых типов данных, алгоритма задачи на языке программирования Паскаль. Описания получения и установки отдельного символа строки, изменения регистра символов. Анализ создания и просмотра файла, поиска и сортировки информации.
курсовая работа [440,7 K], добавлен 13.06.2011