Астросоциотипология и спектральный анализ личности по астросоциотипам с применением семантических информационных мультимоделей

Описание системы "Эйдос-астра" и алгоритмов голосования моделей. Алгоритм измерения достоверности идентификации классов в различных частных моделях. Зависимость достоверности идентификации в среднем по категориям от количества секторов в частной модели.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 26.04.2017
Размер файла 1,3 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Кубанский государственный аграрный университет, Краснодар, Россия

АСТРОСОЦИОТИПОЛОГИЯ И СПЕКТРАЛЬНЫЙ АНАЛИЗ ЛИЧНОСТИ ПО АСТРОСОЦИОТИПАМ С ПРИМЕНЕНИЕМ СЕМАНТИЧЕСКИХ ИНФОРМАЦИОННЫХ МУЛЬТИМОДЕЛЕЙ

Луценко Евгений Вениаминович

д. э. н., к. т. н., профессор

Трунев А.П. к. ф.-м. н., Ph.D

Директор, A&E Trounev IT Consulting, Торонто, Канада

В статье приводятся основные научные результаты, полученные в 2007 году при создании и исследовании семантической информационной мультимодели, обеспечивающей как выявление зависимостей между астропризнаками и принадлежностью респондентов к обобщенным социальным категориям, так и использование знания этих зависимостей для идентификации респондентов по этим категориям. Мультимодель включает 172 частные модели на 37 обобщенных категорий, причем каждая из категорий представлена не менее чем 1000 респондентов при общем объеме выборки 20007 респондентов. При этом применяется метод системно-когнитивного анализа, который рассматривается как один из универсальных вариантов решения 13-й проблемы Гильберта на практике (теоретически эта проблема решена в теoреме А.Н.Колмогорова, являющейся обобщением теоремы В.И.Арнольда (1957).

Ключевые слова: АСТРОСОЦИОТИПОЛОГИЯ, СПЕКТРАЛЬНЫЙ АНАЛИЗ, АСТРОСОЦИОТИП, СЕМАНТИЧЕСКИЕ ИНФОРМАЦИОННЫЕ МУЛЬТИМОДЕЛИ.

Данная статья содержит описание основных результатов научных исследований и разработок в области астросоциотипологии, полученных авторами в 2007 году, и является продолжением итоговой статьи [19] по результатам 2006 года.

В статье [19] ставился вопрос о том, действительно ли существуют зависимости между астрономическими признаками респондентов на момент рождения (астропризнаками) и обобщенными категориями, отражающими социальный статус личности (т.к. астросоциотипами).

По мнению авторов, на этот вопрос, имеющий фундаментальное научное значение, был получен убедительный положительный ответ, т. е. с применением автоматизированного системно-когнитивного анализа (АСК-анализ) [1-12] - нового метода искусственного интеллекта и его инструментария - системы "Эйдос" [20] были созданы модели, позволяющие обоснованно утверждать, что эти зависимости существуют и их характер выявлен и известен нам [8, 13-19].

Необходимо отметить, что сила этих зависимостей для различных категорий оказалась весьма различной, и из более 11000 категорий нами было выявлено всего лишь несколько десятков наиболее статистически представленных категорий, для которых эти связи оказались наиболее сильными [19].

В той же статье [19] был сформулирован и второй вопрос, закономерно вытекающий из первого: возможно ли знание этих зависимостей между астропризнаками и социальными типами использовать для идентификации респондентов на практике?

Для положительного ответа на второй вопрос необходимо не только выявить зависимости между астропризнаками и социальным статусом респондентов, но и разработать такие модели и технологии, которые бы обеспечили настолько высокий уровень достоверности идентификации, чтобы это могло представлять уже не только научный, но и прагматический интерес. В 2007 году нами были предприняты усилия по созданию таких моделей и технологий.

В самом начале исследований и разработок в области астросоциотипологии (такое название получило новое научное направление, предложенное и развиваемое авторами в рамках астросоциологии) были исследованы многочисленные модели, отличающиеся наборами обобщенных категорий (классов), а также описательных шкал и градаций. При этом созданные модели оценивались на достоверность методами бутстрепной статистики, реализованными в системе "Эйдос" [6]. В результате была выбрана так называемая 3-я модель, которая затем и была подробно исследована для получения ответа на первый вопрос.

В этих исследованиях было обнаружено следующее.

1. Достоверность идентификации по категориям практически обратно пропорционально зависит от количества респондентов обучающей выборки, относящихся к этой категории [8, 13-19].

2. Достоверность идентификации одних и тех же классов в разных моделях различна, и для каждого класса всегда есть конкретная частная модель, в которой он идентифицируется с наивысшей достоверностью.

Причины 1-й закономерности мы видим в том, что чем больше респондентов обучающей выборки приходится на категорию, тем выше вариабельность внутри нее по астропризнакам и, соответственно, тем ниже уровень сходства каждого конкретного респондента с обобщенным образом этой категории.

При небольшом количестве респондентов на категорию задача идентификации с ней редуцируется в задачу поиска, аналогичную тому, который осуществляется в информационно-поисковых системах. Поиск осуществляется с высокой степенью достоверности, но для нас он неинтересен, т.к. осуществляется не на основе выявленных и действующих в предметной области (генеральной совокупности) закономерностей, а по простому совпадению признаков. Из этого мы сделали вывод о том, что впредь исследовать только те категории, которые представлены очень большой статистикой. Например, в данной статье исследуются модели идентификации с 37 категориями, каждая из которых представлена не менее 1000 респондентами. При этом "вес", т.е. вклад информации о каждом конкретном респонденте в обобщенный образ категории становится пренебрежимо малым, и поэтому достоверность модели можно проверять не на основе респондентов, данные которых не использовались при ее синтезе, а на тех, которые для этого использовались.

Объяснение 2-й закономерности еще предстоит найти, однако можно высказать два важных соображения:

- сам факт наличия этой закономерности говорит о том, что, по-видимому, существует много различных механизмов "детерминации" астропризнаками принадлежности респондентов к социальным категориям, и для разных категорий этот механизм различен, и поэтому одна модель более адекватно отражает один механизм, а вторая - другой;

- не существует какой-то одной модели, обеспечивающей столь высокий уровень идентификации респондентов по всем категориям, как наилучшая из частных моделей по каждой из категорий.

Поэтому у авторов в начале 2007 года возник проект разработки специальной системы, которая реализовала бы "коллективы решающих правил" [24], т.е. была бы способна:

- автоматически генерировать большое количество частных моделей, которые бы образовывали одну целостную систему, которую мы назвали "мультимодель";

- исследовать частные модели на адекватность идентификации респондентов в них по различным категориям;

- идентифицировать респондентов в системе частных моделей, т.е. в каждой из них, в том числе с учетом априорной информации о достоверности идентификации по различным категориям в частных моделях ("скоростное распознавание");

- обобщать результаты идентификации конкретных респондентов в разных частных моделях с учетом информации о достоверности идентификации в них по разным категориям ("голосование моделей").

Такая система была разработана - это система "Эйдос-астра" [21], являющаяся 3-й системой окружения универсальной когнитивной аналитической системы "Эйдос" [20] (есть еще две системы окружения: "Эйдос-фонд" [22] и "Эйдос-" [23]).

Благодаря использованию технологии голосования частных моделей или коллективов решающих правил в системе "Эйдос-астра", достоверность идентификации респондентов по каждому из классов в мультимодели не ниже, чем в частной модели, в которой он идентифицируется с наивысшей достоверностью из всех созданных и исследованных частных моделей. Это обеспечивается тем, что в каждой частной модели идентификация проводится только по тем категориям, идентификация которых в данной модели осуществляется с наивысшей достоверностью из всех частных моделей, а также другими более сложными алгоритмами голосования и взвешивания решений, которые кратко описаны ниже.

С помощью системы "Эйдос-астра" в 2007 году были созданы и исследованы несколько мультимоделей, отличающихся как набором социальных категорий, так и самих частных моделей. В статье мы опишем лишь одну из этих мультимоделей, включающую 37 социальных категорий и 172 частные модели, как наиболее полно статистически представленную. В этой мультимодели на каждую из категорий приходится не менее 1000 респондентов, а общий объем обучающей выборки составляет 20007 респондентов.

Описание системы "Эйдос-астра" и алгоритмов голосования моделей

Система "Эйдос-астра" предназначена для синтеза мультимодели и идентификации социального статуса респондентов по астрономическим показателям на момент их рождения и применяется с теми же целями, что и стандартные психологические и профориентационные тесты (т.е. тесты на способность к определенным видам деятельности), обеспечивая выполнение следующих функций:

- генерация исходных баз данных на основе времени и координат рождения респондентов;

- генерация описательных шкал и градаций и обучающей выборки для частных моделей с заданным числом разбиений описательных шкал;

- синтез мультимодели;

- измерение достоверности идентификации респондентов по классам в частных моделях;

- идентификация респондентов распознаваемой выборки в частных моделях;

- голосование результатов идентификации в частных моделях и генерация баз данных для Универсальной когнитивной аналитической системы "ЭЙДОС", в которой проводится углубленное исследование созданной модели.

Текущая версия системы "Эйдос-астра" состоит из набора отдельных сервисных программ и двух взаимосвязанных модулей, первый из которых ("Inpob_mm.exe") обеспечивает синтез мультимодели, а второй ("Inprs_mm.exe") - ее тестирование на достоверность и применение для идентификации респондентов. Эти модули разработаны на языке программирования CLIPPER 5.01+TOOLS II+BiGraph 3.01r1 и размещаются в головной директории для синтеза мультимодели, которую определяет сам пользователь. Исходный текст этих модулей 8-м шрифтом имеет размер: "Inpob_mm.exe" 63 листа, "Inprs_mm.exe" - 109 листов формата А4.

Перед запуском модуля синтеза мультимодели ("Inpob_mm.exe"):

- база данных с исходной информацией для синтеза мультимодели (база прецедентов) должна быть записана в выработанном ранее совместно в В.Н. Шашиным [19] стандарте с именем "Abankall.dbf";

- база данных (БД), содержащая перечень социальных категорий, по которым будет проводиться многопараметрическая типизация (обобщение), и идентификация должна быть записана в стандарте с именем "Newpf.dbf" (файл формируется и записывается в Excel в стандарте dbf 4 (dBASE IV) (*.dbf));

- в диалоге пользователь задает перечень частных моделей (количество секторов в описательных шкалах для создаваемых частных моделей).

Перечень категорий и частотное распределение респондентов обучающей выборки по категориям, а также объединенная база данных прецедентов формируются предварительно с помощью специально для этого созданных сервисных программных модулей, входящих в состав системы "Эйдос-астра".

При этом в качестве исходной информации использовались Excel-файлы, содержащие для каждого респондента информацию о категориях, к которым он относится, и полную характеристику в форме астропризнаков. Основным источником астрологической базы данных, подготовленной для системы ЭЙДОС, является Lois Rodden's AstroDatabank (www.astrodatabank.com). Эта база содержит жизнеописание знаменитостей и простых людей, проживавших (или проживающих) в США. Достоинством этой базы данных является то, что все события жизни классифицированы, а все профессиональные и иные категории упорядочены. На первом этапе данные были конвертированы в формат баз данных JDataStore фирмы Borland, затем тщательно отсортированы с использованием SQL запросов и специальных функций на языке Java. В результате были получены астрологические и биографические данные для 20007 уникальных персон и 16360 записей событий, происходивших с ними. Для них всех с помощью библиотеки швейцарских эфемерид (www.astro.com) были вычислены координаты небесных тел (долгота и широта в градусах и расстояние в астрономических единицах). Для записей с точным временем вычисляли куспиды астрологических домов в системе Плацидуса, а также звездные стоянки Луны - накшатры (использовалась система из 27 стоянок). С целью анализа были использованы эфемериды следующих небесных тел: Солнца, Луны, Меркурия, Венеры, Марса, Юпитера, Сатурна, Урана, Нептуна, Плутона и Хирона. Следующим шагом является сортировка персон по категориям. В результате было получено XML дерево категорий исходной базы данных. Для этой цели была написана процедура, позволяющая безошибочно изменять категории, сортируя его. Далее база данных была полностью экспортирована в формат Excel, а из него - в формат интеллектуальной системы ЭЙДОС. Архив исходных данных в формате Excel доступен по адресу: http://astro.proforums.ru/tmp/abank.rar. На этом этапе в исследованиях и разработках активное участие принимал В.Н. Шашин [2, 13-19].

При работе модуля синтеза мультимодели он прогнозирует время завершения процесса и отображает его стадию, а также сам ведет базу данных, содержащую протокол успешно завершенных операций и позволяющую нормально продолжить и завершить процесс синтеза даже после полного аварийного (т.е. в любой момент) выключения компьютера. Это необходимо потому, что процесс синтеза мультимодели может быть довольно длительным: от нескольких часов до нескольких суток и даже недель в зависимости от объема обучающей выборки, количества и размерности частных моделей.

После завершения процесса синтеза мультимодели запускается модуль "Inprs_mm.exe", обеспечивающий ее использование для идентификации и прогнозирования. Этот модуль имеет следующие режимы:

1. Измерение внутренней дифференциальной валидности [3, 5] моделей, т.е. достоверности идентификации классов в различных частных моделях.

2. Генерация БД Atest_mm.dbf для измерения достоверности идентификации в моделях.

3. Скоростное распознавание респондентов из Atest.dbf с использованием БД DostIden.dbf.

4. Полное распознавание респондентов из Atest.dbf во всех частных моделях.

5. Голосование моделей (с выбором одного из пяти алгоритмов).

6. Голосование моделей по всем ПЯТИ алгоритмам по очереди.

БД Atest_mm.dbf и Atest.dbf должны быть в том же стандарте, что и БД Abankall.dbf.

Рассмотрим алгоритмы этих режимов.

1. Алгоритм измерения достоверности идентификации классов в различных частных моделях

1. Если БД достоверности идентификации классов DostIden.dbf уже существует, то добавить или удалить в ней столбцы новых частных моделей из БД Setup_mm.dbf, иначе - создавать эту БД заново (на шаге 4).

2. Если БД тестирующих выборок респондентов TestResp.dbf уже существует, то спросить, переформировать ли ее заново (шаги 3, 6), иначе - использовать имеющуюся.

3. Если создание БД TestResp.dbf заново, то задать в диалоге ее параметры.

4. ПОДГОТОВКА К ИСПОЛНЕНИЮ АЛГОРИТМА:

4.1. Выборка из БД Setup_mm.dbf массива видов моделей.

4.2. Запись строки описательных шкал для Logoastr_d.

4.3. Рекогносцировка.

5. Если не продолжение расчета БД DostIden.dbf, то создать ее заново и заполнить нулями.

6. Если создание БД TestResp.dbf заново, то

6.1. Создать ее по заданным в п. 3 ее параметрам.

6.2. Заполнить кодами источников тестирующих респондентов.

7. Цикл по видам моделей из БД Setup_mm.dbf, начиная с последней модели.

8. Создание БД результатов распознавания и массива-локатора в директории частной модели.

9. Если продолжение расчета DostIden.dbf, то пропустить уже просчитанные модели (где не нули).

10. Цикл по классам заданного диапазона.

11. Копирование тестирующей выборки ПО ЗАДАННОМУ КЛАССУ В ТЕКУЩЕЙ МОДЕЛИ из обучающей в распознаваемую.

12. Если задано измерение внешней валидности - удаление из обучающей выборки тестирующей и пересинтез модели, иначе п.13.

13. Идентификация тестирующей выборки ТОЛЬКО С ЕЕ КЛАССОМ.

14. Конец цикла по классам заданного диапазона.

15. Расчет достоверности идентификации заданных классов в данной модели.

16. Занесение информации о достоверности идентификации в БД достоверности идентификации классов.

17. Если задано измерение внешней валидности - добавление распознаваемой выборки к обучающей (ее восстановление), иначе п.18.

18. Конец цикла по видам моделей.

19. Дорасчет БД достоверности идентификации классов.

2. Алгоритм генерации БД "Atest_mm.dbf" для измерения достоверности идентификации в моделях

На первом этапе организуется цикл по БД "TestResp.dbf", созданной в предыдущем режиме и содержащей коды (id) респондентов для измерения достоверности идентификации по каждой категории. В этом цикле формируется массив, содержащий коды респондентов и исключающий их повторы в формируемой БД "Atest_mm.dbf".

На втором этапе из БД "Abankall.dbf" выбираются записи по определенным на предыдущем этапе респондентам, и эти записи добавляются в БД "Atest_mm.dbf".

В дальнейшем сформированная в данном режиме база данных "Atest_mm.dbf" может быть использована для измерения достоверности идентификации респондентов по категориям при полном распознавании. Для этого ее надо предварительно переименовать в "Atest.dbf", т.к. на работу именно с этой базой рассчитан режим полного распознавания.

3. Алгоритм режима скоростного распознавания респондентов из Atest.dbf с использованием априорной информации о достоверности идентификации по категориям из БД DostIden.dbf

1. Сброс распознаваемой выборки во всех остальных частных моделях.

2. Сгенерировать распознаваемую выборку в тех частных моделях, которые оказались наиболее достоверными по данным БД DostIden.dbf, причем в каждой частной модели создавать ее только один раз!!! В каждой частной модели может наиболее достоверно идентифицироваться НЕСКОЛЬКО классов. Поэтому нужно иметь БД с информацией об этом и проводить распознавание в этой модели в ЦИКЛЕ по этим классам. Эта БД и есть DostIden.dbf.

3. Сделать цикл по БД DostIden.dbf (по частным моделям + классам).

4. Идентифицировать ВСЕХ респондентов из БД Atest.dbf в каждой частной модели ТОЛЬКО с теми классами, которые идентифицируется в данной модели наиболее достоверно (по данным из DostIden.dbf).

Данный алгоритм основан на простой идее о том, что по каждой из социальных категорий рационально идентифицировать респондентов только в той частной модели, в которой эта категория (по данным предварительного исследования частных моделей) идентифицируется с наивысшей достоверностью из всех частных моделей. На описываемой мультимодели этот алгоритм осуществляет идентификацию 370 респондентов за 40 минут вместо 2-х суток полной идентификации.

4. Алгоритм полного распознавания респондентов из Atest.dbf во всех частных моделях

Существуют 3 варианта:

1-й: пакетного распознавания респондентов из Atest.dbf не было выполнено ни в одной частной модели.

2-й: пакетное распознавания респондентов из Atest.dbf было выполнено не во всех частных моделях.

3-й: пакетное распознавания респондентов из Atest.dbf было выполнено во всех частных моделях.

Необходимо сообщить пользователю, какой вариант имеет место - 2-й или 3-й, и предложить ему закончить распознавание или начать заново:

- ЗАКОНЧИТЬ имеет смысл с тем же файлом Atest.dbf;

- НАЧАТЬ ЗАНОВО имеет смысл с новым файлом Atest.dbf;

- если не было выполнено пакетного распознавания ни в одной частной модели, то просто МОЛЧА начать его выполнять для тех моделей, для которых выполнен синтез модели.

Затем организуется цикл по частным моделям.

Распознавание выполняется только, если: синтез модели уже выполнен, а распознавание еще нет.

Проводится запись исходных БД для генерации распознаваемой выборки модели в поддиректорию с этой частной моделью.

Выполняется генерация исходных файлов распознаваемой выборки частной модели из БД Atest.dbf.

Проводится пакетное распознавание как в базовой системе "Эйдос".

5. Алгоритм голосования моделей (с выбором одного из 5-и алгоритмов)

Пользователю в диалоге предлагается задать один из режимов голосования моделей, когда в итоговую карточку идентификации респондента берется:

1. СУММАРНАЯ ЧАСТОТА ИДЕНТИФИКАЦИИ респондента с каждым классом, рассчитанная по всем частным моделям [2, 13].

2. СРЕДНЕЕ уровней сходства с этим классом из всех карточек идентификации частных моделей.

3. Уровень сходства этого респондента с классом из той частной карточки идентификации, в которой он МАКСИМАЛЬНЫЙ.

4. Уровень сходства из карточки идентификации той частной модели, которая показала МАКСИМАЛЬНУЮ достоверность распознавания ДАННОГО КЛАССА из всех моделей.

5. СРЕДНЕЕ СУММЫ ПРОИЗВЕДЕНИЙ уровней сходства с данным классом на достоверность его идентификации в частных моделях.

1-й алгоритм голосования моделей.

В данном алгоритме, который был предложен первым, определяется СУММАРНАЯ ЧАСТОТА ИДЕНТИФИКАЦИИ респондента с каждым классом, рассчитанная по всем частным моделям.

Пользователю предлагается в диалоге ввести следующие параметры:

- минимальный учитываемый уровень сходства респондента с классом в %;

- частоту идентификации респондента с классом в частных моделях в %.

Затем выполняются следующие шаги:

1. Скопировать БД Rasp.dbf из всех директорий моделей с именами: Rasp1###.dbf, где ### - вид модели.

2. Объединить их все в одну БД Rasp.dbf.

3. Рассортировать так, чтобы записи с одинаковым результатом идентификации респондента с классом оказались рядом.

4. Создать новую БД Rasp1.dbf, в которой сделать записи с суммарной частотой идентификации респондента с каждым классом, рассчитанной по всем частным моделям.

5. Физически рассортировать объединенную БД так, как надо для отображения карточек идентификации в базовой системе "Эйдос".

6. Скопировать БД в директорию ALL1 и переиндексировать.

2-й алгоритм голосования моделей.

В этом алгоритме определяется СРЕДНЕЕ уровней сходства с этим классом из всех карточек идентификации частных моделей.

1. Скопировать БД Rasp.dbf из всех директорий моделей с именами: Rasp1###.dbf, где ### - вид модели.

2. Объединить их все в одну БД Rasp.dbf.

3. Рассортировать так, чтобы записи с одинаковым результатом оказались рядом.

4. Сделать новую БД Rasp1.dbf, в которой объединить записи, просуммировав уровни сходства.

5. Физически рассортировать объединенную БД так, как надо для отображения карточек идентификации в базовой системе "Эйдос".

6. Скопировать БД в директорию ALL2 и переиндексировать.

3-й алгоритм голосования моделей.

В данном алгоритме определяется уровень сходства этого респондента с классом из той частной карточки идентификации, в которой он МАКСИМАЛЬНЫЙ.

1. Скопировать БД Rasp.dbf из всех директорий моделей с именами: Rasp1###.dbf, где ### - вид модели.

2. Объединить их все в одну БД Rasp.dbf.

3. Рассортировать ее так, чтобы записи с одинаковым классом оказались рядом и ранжированы в порядке убывания сходства.

4. Сделать новую БД Rasp1.dbf, в которой из предыдущей взять только записи с максимальным уровнем сходства.

5. Физически рассортировать объединенную БД так, как надо для отображения карточек идентификации в базовой системе "Эйдос".

6. Скопировать БД в директорию ALL3 и переиндексировать.

4-й алгоритм голосования моделей.

В данном алгоритме определяется уровень сходства из карточки идентификации той частной модели, которая показала МАКСИМАЛЬНУЮ достоверность распознавания ДАННОГО КЛАССА из всех моделей.

1. Скопировать БД Rasp.dbf из всех директорий моделей с именами: Rasp1###.dbf, где ### - вид модели.

2. Объединить их все в одну БД Rasp.dbf.

3. Рассортировать ее так, чтобы записи с одинаковым классом оказались рядом и ранжированы в порядке убывания сходства.

4. Сделать новую БД Rasp1.dbf, в которую из предыдущей для каждого класса взять записи только из тех частных моделей, в которых они идентифицируются с MAX достоверностью.

5. Физически рассортировать объединенную БД так, как надо для отображения карточек идентификации в базовой системе "Эйдос".

6. Скопировать БД в директорию ALL4 и переиндексировать.

5-й алгоритм голосования моделей.

В данном алгоритме определяется СРЕДНЕЕ СУММЫ ПРОИЗВЕДЕНИЙ уровней сходства с данным классом на достоверность его идентификации в частных моделях.

1. Скопировать БД Rasp.dbf из всех директорий моделей с именами: Rasp1###.dbf, где ### - вид модели.

2. Объединить их все в одну БД Rasp.dbf.

3. Рассортировать ее так, чтобы записи с одинаковым классом оказались рядом и ранжированы в порядке убывания сходства.

4. Сделать новую БД Rasp1.dbf, в которой из предыдущей взять СРЕДНЕЕ СУММЫ ПРОИЗВЕДЕНИЙ уровней сходства с данным классом на достоверность его идентификации в частных моделях.

5. Физически рассортировать объединенную БД так, как надо для отображения карточек идентификации в базовой системе "Эйдос".

6. Скопировать БД в директорию ALL5 и переиндексировать.

6. Алгоритм голосования моделей по всем ПЯТИ алгоритмам по очереди

Он представляет собой режим, полностью аналогичный предыдущему, в котором все алгоритмы голосования запускаются по очереди со значениями параметров по умолчанию.

Все частные и обобщающие модели, созданные с помощью системы окружения "Эйдос-астра", полностью совестимы с базовой универсальной когнитивной аналитической системой "Эйдос" и могут быть просмотрены и исследованы в этой системе.

Описание результатов синтеза и исследования мультимодели

Основными причинами выбора для исследования мультимодели на 37 категорий, каждая из которых представлена не менее чем 1000 респондентов при объеме обучающей выборки 20007 респондентов, являются высокая статистическая достоверность полученных результатов и возможность убедительно говорить о том, что в результате проведенного исследования действительно выявлены закономерности между астропризнаками и социальными категориями (социотипами).

Перечень выбранных категорий и частотное распределение респондентов по этим категориям приведены в таблице 1.

Таблица 1

Справочник классификационных шкал и градаций (обобщенные категории) и частотное распределение респондентов по ним

Код

категории

Наименование категории

Кол-во

респондентов

1

SC:М-

13640

2

SC:Ж-

5125

3

SC:A53-Sports

4567

4

SC:A1-Book Collection

4471

5

SC:A15-Famous

3373

6

SC:A42-Medical

2910

7

SC:A323-Sexuality

2675

8

SC:A5-Entertainment

2577

9

SC:A9-Relationship

2442

10

SC:A40-Occult Fields

2396

11

SC:B111-Sports:Basketball

2385

12

SC:B329-Sexuality:Sexual perversions

2360

13

SC:A55-Art

2232

14

SC:A19-Writers

2223

15

SC:A129-Death

2168

16

SC:A25-Personality

2083

17

SC:A68-Childhood

1996

18

SC:A31-Business

1813

19

SC:C330-Sexuality:Sexual perversions:Homosexual m

1807

20

SC:B45-Famous:Greatest hits

1795

21

SC:A29-Parenting

1754

22

SC:B173-Sports:Football

1613

23

SC:B97-Occult Fields:Astrologer

1480

24

SC:B21-Relationship:Number of marriages

1417

25

SC:B2-Book Collection:Profiles Of Women

1389

26

SC:A92-Birth

1343

27

SC:B14-Entertainment:Actor/ Actress

1256

28

SC:?-

1242

29

SC:B49-Book Collection:American Book

1178

30

SC:B26-Personality:Body

1163

31

SC:B189-Medical:Illness

1159

32

SC:B6-Entertainment:Music

1086

33

SC:A99-Financial

1075

34

SC:B48-Famous:Top 5% of Profession

1073

35

SC:A38-Politics

1039

36

SC:A23-Psychological

1007

37

SC:A108-Education

1002

По большинству категорий респондентов значительно более 1000. Это объясняется тем, что один и тот же респондент одновременно может относиться к нескольким категориям. В графической форме частотное распределение респондентов по категориям представлено на рисунке 1.

Рисунок 1 Частотное распределение респондентов по категориям

В результате синтеза мультимодели были получены 172 частные модели с различным количеством разбиений круга на секторы: 2, 3, 4,..., 173. Максимальное количество разбиений составило 173, т. к. при 23 описательных шкалах и таком количестве разбиений во всех шкалах получается суммарно 3979 градаций, тогда как в текущей версии системы "Эйдос" максимальное количество градаций описательных шкал в модели не может превосходить 4000. Однако в данном случае это ограничение не является принципиальным, т.к. оно не помешало нам увидеть общей картины.

В качестве примеров приведем справочники описательных шкал и градаций для частных моделей с 2 и 3 разбиениями (таблицы 2 и 3).

Система "Эйдос-астра" автоматически формирует справочники классификационных и описательных шкал и градаций для всех заданных частных моделей, а затем с использованием этих справочников и БД "Abankall.dbf" также автоматически формирует обучающую выборку в каждой из этих частных моделей. Таким образом, система "Эйдос-астра" обеспечивает автоматическую формализацию предметной области в системе частных моделей.

Приведем в качестве примера фрагмент обучающей выборки частной модели с двумя разбиениями (таблица 4).

Таблица 2

Справочник описательных шкал и градаций частной модели с двумя разбиениями

Код

Наименование

Код

Наименование

1

SUNLON-[2]: {0.000, 180.000}

25

HOUSE2-[2]: {0.000, 180.000}

2

SUNLON-[2]: {180.000, 360.000}

26

HOUSE2-[2]: {180.000, 360.000}

3

MOONLON-[2]: {0.000, 180.000}

27

HOUSE3-[2]: {0.000, 180.000}

4

MOONLON-[2]: {180.000, 360.000}

28

HOUSE3-[2]: {180.000, 360.000}

5

MERCURYLON-[2]: {0.000, 180.000}

29

HOUSE4-[2]: {0.000, 180.000}

6

MERCURYLON-[2]: {180.000, 360.000}

30

HOUSE4-[2]: {180.000, 360.000}

7

VENUSLON-[2]: {0.000, 180.000}

31

HOUSE5-[2]: {0.000, 180.000}

8

VENUSLON-[2]: {180.000, 360.000}

32

HOUSE5-[2]: {180.000, 360.000}

9

MARSLON-[2]: {0.000, 180.000}

33

HOUSE6-[2]: {0.000, 180.000}

10

MARSLON-[2]: {180.000, 360.000}

34

HOUSE6-[2]: {180.000, 360.000}

11

JUPITERLON-[2]: {0.000, 180.000}

35

HOUSE7-[2]: {0.000, 180.000}

12

JUPITERLON-[2]: {180.000, 360.000}

36

HOUSE7-[2]: {180.000, 360.000}

13

SATURNLON-[2]: {0.000, 180.000}

37

HOUSE8-[2]: {0.000, 180.000}

14

SATURNLON-[2]: {180.000, 360.000}

38

HOUSE8-[2]: {180.000, 360.000}

15

URANUSLON-[2]: {0.000, 180.000}

39

HOUSE9-[2]: {0.000, 180.000}

16

URANUSLON-[2]: {180.000, 360.000}

40

HOUSE9-[2]: {180.000, 360.000}

17

NEPTUNELON-[2]: {0.000, 180.000}

41

HOUSE10-[2]: {0.000, 180.000}

18

NEPTUNELON-[2]: {180.000, 360.000}

42

HOUSE10-[2]: {180.000, 360.000}

19

PLUTOLON-[2]: {0.000, 180.000}

43

HOUSE11-[2]: {0.000, 180.000}

20

PLUTOLON-[2]: {180.000, 360.000}

44

HOUSE11-[2]: {180.000, 360.000}

21

NODELON-[2]: {0.000, 180.000}

45

HOUSE12-[2]: {0.000, 180.000}

22

NODELON-[2]: {180.000, 360.000}

46

HOUSE12-[2]: {180.000, 360.000}

23

HOUSE1-[2]: {0.000, 180.000}

24

HOUSE1-[2]: {180.000, 360.000}

Таблица 3

Справочник описательных шкал и градаций частной модели с тремя разбиениями

Код

Наименование

Код

Наименование

1

SUNLON-[3]: {0.000, 120.000}

37

HOUSE2-[3]: {0.000, 120.000}

2

SUNLON-[3]: {120.000, 240.000}

38

HOUSE2-[3]: {120.000, 240.000}

3

SUNLON-[3]: {240.000, 360.000}

39

HOUSE2-[3]: {240.000, 360.000}

4

MOONLON-[3]: {0.000, 120.000}

40

HOUSE3-[3]: {0.000, 120.000}

5

MOONLON-[3]: {120.000, 240.000}

41

HOUSE3-[3]: {120.000, 240.000}

6

MOONLON-[3]: {240.000, 360.000}

42

HOUSE3-[3]: {240.000, 360.000}

7

MERCURYLON-[3]: {0.000, 120.000}

43

HOUSE4-[3]: {0.000, 120.000}

8

MERCURYLON-[3]: {120.000, 240.000}

44

HOUSE4-[3]: {120.000, 240.000}

9

MERCURYLON-[3]: {240.000, 360.000}

45

HOUSE4-[3]: {240.000, 360.000}

10

VENUSLON-[3]: {0.000, 120.000}

46

HOUSE5-[3]: {0.000, 120.000}

11

VENUSLON-[3]: {120.000, 240.000}

47

HOUSE5-[3]: {120.000, 240.000}

12

VENUSLON-[3]: {240.000, 360.000}

48

HOUSE5-[3]: {240.000, 360.000}

13

MARSLON-[3]: {0.000, 120.000}

49

HOUSE6-[3]: {0.000, 120.000}

14

MARSLON-[3]: {120.000, 240.000}

50

HOUSE6-[3]: {120.000, 240.000}

15

MARSLON-[3]: {240.000, 360.000}

51

HOUSE6-[3]: {240.000, 360.000}

16

JUPITERLON-[3]: {0.000, 120.000}

52

HOUSE7-[3]: {0.000, 120.000}

17

JUPITERLON-[3]: {120.000, 240.000}

53

HOUSE7-[3]: {120.000, 240.000}

18

JUPITERLON-[3]: {240.000, 360.000}

54

HOUSE7-[3]: {240.000, 360.000}

19

SATURNLON-[3]: {0.000, 120.000}

55

HOUSE8-[3]: {0.000, 120.000}

20

SATURNLON-[3]: {120.000, 240.000}

56

HOUSE8-[3]: {120.000, 240.000}

21

SATURNLON-[3]: {240.000, 360.000}

57

HOUSE8-[3]: {240.000, 360.000}

22

URANUSLON-[3]: {0.000, 120.000}

58

HOUSE9-[3]: {0.000, 120.000}

23

URANUSLON-[3]: {120.000, 240.000}

59

HOUSE9-[3]: {120.000, 240.000}

24

URANUSLON-[3]: {240.000, 360.000}

60

HOUSE9-[3]: {240.000, 360.000}

25

NEPTUNELON-[3]: {0.000, 120.000}

61

HOUSE10-[3]: {0.000, 120.000}

26

NEPTUNELON-[3]: {120.000, 240.000}

62

HOUSE10-[3]: {120.000, 240.000}

27

NEPTUNELON-[3]: {240.000, 360.000}

63

HOUSE10-[3]: {240.000, 360.000}

28

PLUTOLON-[3]: {0.000, 120.000}

64

HOUSE11-[3]: {0.000, 120.000}

29

PLUTOLON-[3]: {120.000, 240.000}

65

HOUSE11-[3]: {120.000, 240.000}

30

PLUTOLON-[3]: {240.000, 360.000}

66

HOUSE11-[3]: {240.000, 360.000}

31

NODELON-[3]: {0.000, 120.000}

67

HOUSE12-[3]: {0.000, 120.000}

32

NODELON-[3]: {120.000, 240.000}

68

HOUSE12-[3]: {120.000, 240.000}

33

NODELON-[3]: {240.000, 360.000}

69

HOUSE12-[3]: {240.000, 360.000}

34

HOUSE1-[3]: {0.000, 120.000}

35

HOUSE1-[3]: {120.000, 240.000}

36

HOUSE1-[3]: {240.000, 360.000}

Таблица 4

Обучающая выборка частной модели с двумя разбиениями (фрагмент)

id

Наименование

Коды категорий

1

Aadland, Beverl

2

4

5

8

9

14

24

25

27

32

Коды астропризнаков

1

4

6

7

9

11

13

15

17

19

21

24

26

28

30

31

33

35

37

39

41

44

46

Коды категорий

2

Aadland, Floren

2

4

5

9

14

16

18

21

25

30

36

Коды астропризнаков

1

4

6

8

10

12

13

16

17

19

22

23

25

27

29

32

34

36

38

40

42

43

45

Коды категорий

3

Aafjes, Bertus

1

14

Коды астропризнаков

1

4

5

7

9

12

13

16

17

19

22

Коды категорий

4

Aal-Pomares, He

1

8

35

Коды астропризнаков

2

3

6

8

9

11

14

15

17

19

22

23

25

27

29

31

33

36

38

40

42

44

46

Коды категорий

5

Aaron, Dave

1

5

6

10

18

20

Коды астропризнаков

2

4

6

8

10

11

13

15

18

19

21

23

25

27

30

32

34

36

38

40

41

43

45

Коды категорий

6

Aaron, Hank

1

3

4

5

16

20

29

30

34

Коды астропризнаков

2

4

6

8

10

12

14

15

17

19

22

23

26

28

30

32

34

36

37

39

41

43

45

Коды категорий

7

Aavikko, Armi

2

5

8

13

20

32

Коды астропризнаков

1

3

5

7

9

12

14

15

18

19

22

24

26

28

30

32

34

35

37

39

41

43

45

Коды категорий

8

Abad, Andy

1

8

13

32

Коды астропризнаков

2

3

6

8

10

11

13

16

18

19

21

23

25

27

29

31

33

36

38

40

42

44

46

Коды категорий

9

Abbado, Claudio

1

4

5

8

9

13

16

17

20

21

24

30

32

Коды астропризнаков

1

3

5

7

9

11

14

15

17

19

22

23

25

27

29

31

33

36

38

40

42

44

46

Для каждой частной модели на основе обучающей выборки формируется сначала матрица абсолютных частот (таблица 5), а затем и матрица информативностей (таблица 6). В качестве математической модели СК-анализа используется системная теория информации (СТИ), предложенная автором [3, 5, 1-12].

Таблица 5

Фрагмент матрицы абсолютных частот встреч признаков по категориям в частной модели с двумя разбиениями

Коды

приз-

наков

Коды категорий

1

2

3

4

5

6

7

8

9

10

11

12

1

6744

2623

2281

2201

1671

1477

1378

1271

1222

1201

1230

1208

2

6896

2502

2286

2270

1702

1433

1297

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.