Астросоциотипология и спектральный анализ личности по астросоциотипам с применением семантических информационных мультимоделей
Описание системы "Эйдос-астра" и алгоритмов голосования моделей. Алгоритм измерения достоверности идентификации классов в различных частных моделях. Зависимость достоверности идентификации в среднем по категориям от количества секторов в частной модели.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 26.04.2017 |
Размер файла | 1,3 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Кубанский государственный аграрный университет, Краснодар, Россия
АСТРОСОЦИОТИПОЛОГИЯ И СПЕКТРАЛЬНЫЙ АНАЛИЗ ЛИЧНОСТИ ПО АСТРОСОЦИОТИПАМ С ПРИМЕНЕНИЕМ СЕМАНТИЧЕСКИХ ИНФОРМАЦИОННЫХ МУЛЬТИМОДЕЛЕЙ
Луценко Евгений Вениаминович
д. э. н., к. т. н., профессор
Трунев А.П. к. ф.-м. н., Ph.D
Директор, A&E Trounev IT Consulting, Торонто, Канада
В статье приводятся основные научные результаты, полученные в 2007 году при создании и исследовании семантической информационной мультимодели, обеспечивающей как выявление зависимостей между астропризнаками и принадлежностью респондентов к обобщенным социальным категориям, так и использование знания этих зависимостей для идентификации респондентов по этим категориям. Мультимодель включает 172 частные модели на 37 обобщенных категорий, причем каждая из категорий представлена не менее чем 1000 респондентов при общем объеме выборки 20007 респондентов. При этом применяется метод системно-когнитивного анализа, который рассматривается как один из универсальных вариантов решения 13-й проблемы Гильберта на практике (теоретически эта проблема решена в теoреме А.Н.Колмогорова, являющейся обобщением теоремы В.И.Арнольда (1957).
Ключевые слова: АСТРОСОЦИОТИПОЛОГИЯ, СПЕКТРАЛЬНЫЙ АНАЛИЗ, АСТРОСОЦИОТИП, СЕМАНТИЧЕСКИЕ ИНФОРМАЦИОННЫЕ МУЛЬТИМОДЕЛИ.
Данная статья содержит описание основных результатов научных исследований и разработок в области астросоциотипологии, полученных авторами в 2007 году, и является продолжением итоговой статьи [19] по результатам 2006 года.
В статье [19] ставился вопрос о том, действительно ли существуют зависимости между астрономическими признаками респондентов на момент рождения (астропризнаками) и обобщенными категориями, отражающими социальный статус личности (т.к. астросоциотипами).
По мнению авторов, на этот вопрос, имеющий фундаментальное научное значение, был получен убедительный положительный ответ, т. е. с применением автоматизированного системно-когнитивного анализа (АСК-анализ) [1-12] - нового метода искусственного интеллекта и его инструментария - системы "Эйдос" [20] были созданы модели, позволяющие обоснованно утверждать, что эти зависимости существуют и их характер выявлен и известен нам [8, 13-19].
Необходимо отметить, что сила этих зависимостей для различных категорий оказалась весьма различной, и из более 11000 категорий нами было выявлено всего лишь несколько десятков наиболее статистически представленных категорий, для которых эти связи оказались наиболее сильными [19].
В той же статье [19] был сформулирован и второй вопрос, закономерно вытекающий из первого: возможно ли знание этих зависимостей между астропризнаками и социальными типами использовать для идентификации респондентов на практике?
Для положительного ответа на второй вопрос необходимо не только выявить зависимости между астропризнаками и социальным статусом респондентов, но и разработать такие модели и технологии, которые бы обеспечили настолько высокий уровень достоверности идентификации, чтобы это могло представлять уже не только научный, но и прагматический интерес. В 2007 году нами были предприняты усилия по созданию таких моделей и технологий.
В самом начале исследований и разработок в области астросоциотипологии (такое название получило новое научное направление, предложенное и развиваемое авторами в рамках астросоциологии) были исследованы многочисленные модели, отличающиеся наборами обобщенных категорий (классов), а также описательных шкал и градаций. При этом созданные модели оценивались на достоверность методами бутстрепной статистики, реализованными в системе "Эйдос" [6]. В результате была выбрана так называемая 3-я модель, которая затем и была подробно исследована для получения ответа на первый вопрос.
В этих исследованиях было обнаружено следующее.
1. Достоверность идентификации по категориям практически обратно пропорционально зависит от количества респондентов обучающей выборки, относящихся к этой категории [8, 13-19].
2. Достоверность идентификации одних и тех же классов в разных моделях различна, и для каждого класса всегда есть конкретная частная модель, в которой он идентифицируется с наивысшей достоверностью.
Причины 1-й закономерности мы видим в том, что чем больше респондентов обучающей выборки приходится на категорию, тем выше вариабельность внутри нее по астропризнакам и, соответственно, тем ниже уровень сходства каждого конкретного респондента с обобщенным образом этой категории.
При небольшом количестве респондентов на категорию задача идентификации с ней редуцируется в задачу поиска, аналогичную тому, который осуществляется в информационно-поисковых системах. Поиск осуществляется с высокой степенью достоверности, но для нас он неинтересен, т.к. осуществляется не на основе выявленных и действующих в предметной области (генеральной совокупности) закономерностей, а по простому совпадению признаков. Из этого мы сделали вывод о том, что впредь исследовать только те категории, которые представлены очень большой статистикой. Например, в данной статье исследуются модели идентификации с 37 категориями, каждая из которых представлена не менее 1000 респондентами. При этом "вес", т.е. вклад информации о каждом конкретном респонденте в обобщенный образ категории становится пренебрежимо малым, и поэтому достоверность модели можно проверять не на основе респондентов, данные которых не использовались при ее синтезе, а на тех, которые для этого использовались.
Объяснение 2-й закономерности еще предстоит найти, однако можно высказать два важных соображения:
- сам факт наличия этой закономерности говорит о том, что, по-видимому, существует много различных механизмов "детерминации" астропризнаками принадлежности респондентов к социальным категориям, и для разных категорий этот механизм различен, и поэтому одна модель более адекватно отражает один механизм, а вторая - другой;
- не существует какой-то одной модели, обеспечивающей столь высокий уровень идентификации респондентов по всем категориям, как наилучшая из частных моделей по каждой из категорий.
Поэтому у авторов в начале 2007 года возник проект разработки специальной системы, которая реализовала бы "коллективы решающих правил" [24], т.е. была бы способна:
- автоматически генерировать большое количество частных моделей, которые бы образовывали одну целостную систему, которую мы назвали "мультимодель";
- исследовать частные модели на адекватность идентификации респондентов в них по различным категориям;
- идентифицировать респондентов в системе частных моделей, т.е. в каждой из них, в том числе с учетом априорной информации о достоверности идентификации по различным категориям в частных моделях ("скоростное распознавание");
- обобщать результаты идентификации конкретных респондентов в разных частных моделях с учетом информации о достоверности идентификации в них по разным категориям ("голосование моделей").
Такая система была разработана - это система "Эйдос-астра" [21], являющаяся 3-й системой окружения универсальной когнитивной аналитической системы "Эйдос" [20] (есть еще две системы окружения: "Эйдос-фонд" [22] и "Эйдос-" [23]).
Благодаря использованию технологии голосования частных моделей или коллективов решающих правил в системе "Эйдос-астра", достоверность идентификации респондентов по каждому из классов в мультимодели не ниже, чем в частной модели, в которой он идентифицируется с наивысшей достоверностью из всех созданных и исследованных частных моделей. Это обеспечивается тем, что в каждой частной модели идентификация проводится только по тем категориям, идентификация которых в данной модели осуществляется с наивысшей достоверностью из всех частных моделей, а также другими более сложными алгоритмами голосования и взвешивания решений, которые кратко описаны ниже.
С помощью системы "Эйдос-астра" в 2007 году были созданы и исследованы несколько мультимоделей, отличающихся как набором социальных категорий, так и самих частных моделей. В статье мы опишем лишь одну из этих мультимоделей, включающую 37 социальных категорий и 172 частные модели, как наиболее полно статистически представленную. В этой мультимодели на каждую из категорий приходится не менее 1000 респондентов, а общий объем обучающей выборки составляет 20007 респондентов.
Описание системы "Эйдос-астра" и алгоритмов голосования моделей
Система "Эйдос-астра" предназначена для синтеза мультимодели и идентификации социального статуса респондентов по астрономическим показателям на момент их рождения и применяется с теми же целями, что и стандартные психологические и профориентационные тесты (т.е. тесты на способность к определенным видам деятельности), обеспечивая выполнение следующих функций:
- генерация исходных баз данных на основе времени и координат рождения респондентов;
- генерация описательных шкал и градаций и обучающей выборки для частных моделей с заданным числом разбиений описательных шкал;
- синтез мультимодели;
- измерение достоверности идентификации респондентов по классам в частных моделях;
- идентификация респондентов распознаваемой выборки в частных моделях;
- голосование результатов идентификации в частных моделях и генерация баз данных для Универсальной когнитивной аналитической системы "ЭЙДОС", в которой проводится углубленное исследование созданной модели.
Текущая версия системы "Эйдос-астра" состоит из набора отдельных сервисных программ и двух взаимосвязанных модулей, первый из которых ("Inpob_mm.exe") обеспечивает синтез мультимодели, а второй ("Inprs_mm.exe") - ее тестирование на достоверность и применение для идентификации респондентов. Эти модули разработаны на языке программирования CLIPPER 5.01+TOOLS II+BiGraph 3.01r1 и размещаются в головной директории для синтеза мультимодели, которую определяет сам пользователь. Исходный текст этих модулей 8-м шрифтом имеет размер: "Inpob_mm.exe" 63 листа, "Inprs_mm.exe" - 109 листов формата А4.
Перед запуском модуля синтеза мультимодели ("Inpob_mm.exe"):
- база данных с исходной информацией для синтеза мультимодели (база прецедентов) должна быть записана в выработанном ранее совместно в В.Н. Шашиным [19] стандарте с именем "Abankall.dbf";
- база данных (БД), содержащая перечень социальных категорий, по которым будет проводиться многопараметрическая типизация (обобщение), и идентификация должна быть записана в стандарте с именем "Newpf.dbf" (файл формируется и записывается в Excel в стандарте dbf 4 (dBASE IV) (*.dbf));
- в диалоге пользователь задает перечень частных моделей (количество секторов в описательных шкалах для создаваемых частных моделей).
Перечень категорий и частотное распределение респондентов обучающей выборки по категориям, а также объединенная база данных прецедентов формируются предварительно с помощью специально для этого созданных сервисных программных модулей, входящих в состав системы "Эйдос-астра".
При этом в качестве исходной информации использовались Excel-файлы, содержащие для каждого респондента информацию о категориях, к которым он относится, и полную характеристику в форме астропризнаков. Основным источником астрологической базы данных, подготовленной для системы ЭЙДОС, является Lois Rodden's AstroDatabank (www.astrodatabank.com). Эта база содержит жизнеописание знаменитостей и простых людей, проживавших (или проживающих) в США. Достоинством этой базы данных является то, что все события жизни классифицированы, а все профессиональные и иные категории упорядочены. На первом этапе данные были конвертированы в формат баз данных JDataStore фирмы Borland, затем тщательно отсортированы с использованием SQL запросов и специальных функций на языке Java. В результате были получены астрологические и биографические данные для 20007 уникальных персон и 16360 записей событий, происходивших с ними. Для них всех с помощью библиотеки швейцарских эфемерид (www.astro.com) были вычислены координаты небесных тел (долгота и широта в градусах и расстояние в астрономических единицах). Для записей с точным временем вычисляли куспиды астрологических домов в системе Плацидуса, а также звездные стоянки Луны - накшатры (использовалась система из 27 стоянок). С целью анализа были использованы эфемериды следующих небесных тел: Солнца, Луны, Меркурия, Венеры, Марса, Юпитера, Сатурна, Урана, Нептуна, Плутона и Хирона. Следующим шагом является сортировка персон по категориям. В результате было получено XML дерево категорий исходной базы данных. Для этой цели была написана процедура, позволяющая безошибочно изменять категории, сортируя его. Далее база данных была полностью экспортирована в формат Excel, а из него - в формат интеллектуальной системы ЭЙДОС. Архив исходных данных в формате Excel доступен по адресу: http://astro.proforums.ru/tmp/abank.rar. На этом этапе в исследованиях и разработках активное участие принимал В.Н. Шашин [2, 13-19].
При работе модуля синтеза мультимодели он прогнозирует время завершения процесса и отображает его стадию, а также сам ведет базу данных, содержащую протокол успешно завершенных операций и позволяющую нормально продолжить и завершить процесс синтеза даже после полного аварийного (т.е. в любой момент) выключения компьютера. Это необходимо потому, что процесс синтеза мультимодели может быть довольно длительным: от нескольких часов до нескольких суток и даже недель в зависимости от объема обучающей выборки, количества и размерности частных моделей.
После завершения процесса синтеза мультимодели запускается модуль "Inprs_mm.exe", обеспечивающий ее использование для идентификации и прогнозирования. Этот модуль имеет следующие режимы:
1. Измерение внутренней дифференциальной валидности [3, 5] моделей, т.е. достоверности идентификации классов в различных частных моделях.
2. Генерация БД Atest_mm.dbf для измерения достоверности идентификации в моделях.
3. Скоростное распознавание респондентов из Atest.dbf с использованием БД DostIden.dbf.
4. Полное распознавание респондентов из Atest.dbf во всех частных моделях.
5. Голосование моделей (с выбором одного из пяти алгоритмов).
6. Голосование моделей по всем ПЯТИ алгоритмам по очереди.
БД Atest_mm.dbf и Atest.dbf должны быть в том же стандарте, что и БД Abankall.dbf.
Рассмотрим алгоритмы этих режимов.
1. Алгоритм измерения достоверности идентификации классов в различных частных моделях
1. Если БД достоверности идентификации классов DostIden.dbf уже существует, то добавить или удалить в ней столбцы новых частных моделей из БД Setup_mm.dbf, иначе - создавать эту БД заново (на шаге 4).
2. Если БД тестирующих выборок респондентов TestResp.dbf уже существует, то спросить, переформировать ли ее заново (шаги 3, 6), иначе - использовать имеющуюся.
3. Если создание БД TestResp.dbf заново, то задать в диалоге ее параметры.
4. ПОДГОТОВКА К ИСПОЛНЕНИЮ АЛГОРИТМА:
4.1. Выборка из БД Setup_mm.dbf массива видов моделей.
4.2. Запись строки описательных шкал для Logoastr_d.
4.3. Рекогносцировка.
5. Если не продолжение расчета БД DostIden.dbf, то создать ее заново и заполнить нулями.
6. Если создание БД TestResp.dbf заново, то
6.1. Создать ее по заданным в п. 3 ее параметрам.
6.2. Заполнить кодами источников тестирующих респондентов.
7. Цикл по видам моделей из БД Setup_mm.dbf, начиная с последней модели.
8. Создание БД результатов распознавания и массива-локатора в директории частной модели.
9. Если продолжение расчета DostIden.dbf, то пропустить уже просчитанные модели (где не нули).
10. Цикл по классам заданного диапазона.
11. Копирование тестирующей выборки ПО ЗАДАННОМУ КЛАССУ В ТЕКУЩЕЙ МОДЕЛИ из обучающей в распознаваемую.
12. Если задано измерение внешней валидности - удаление из обучающей выборки тестирующей и пересинтез модели, иначе п.13.
13. Идентификация тестирующей выборки ТОЛЬКО С ЕЕ КЛАССОМ.
14. Конец цикла по классам заданного диапазона.
15. Расчет достоверности идентификации заданных классов в данной модели.
16. Занесение информации о достоверности идентификации в БД достоверности идентификации классов.
17. Если задано измерение внешней валидности - добавление распознаваемой выборки к обучающей (ее восстановление), иначе п.18.
18. Конец цикла по видам моделей.
19. Дорасчет БД достоверности идентификации классов.
2. Алгоритм генерации БД "Atest_mm.dbf" для измерения достоверности идентификации в моделях
На первом этапе организуется цикл по БД "TestResp.dbf", созданной в предыдущем режиме и содержащей коды (id) респондентов для измерения достоверности идентификации по каждой категории. В этом цикле формируется массив, содержащий коды респондентов и исключающий их повторы в формируемой БД "Atest_mm.dbf".
На втором этапе из БД "Abankall.dbf" выбираются записи по определенным на предыдущем этапе респондентам, и эти записи добавляются в БД "Atest_mm.dbf".
В дальнейшем сформированная в данном режиме база данных "Atest_mm.dbf" может быть использована для измерения достоверности идентификации респондентов по категориям при полном распознавании. Для этого ее надо предварительно переименовать в "Atest.dbf", т.к. на работу именно с этой базой рассчитан режим полного распознавания.
3. Алгоритм режима скоростного распознавания респондентов из Atest.dbf с использованием априорной информации о достоверности идентификации по категориям из БД DostIden.dbf
1. Сброс распознаваемой выборки во всех остальных частных моделях.
2. Сгенерировать распознаваемую выборку в тех частных моделях, которые оказались наиболее достоверными по данным БД DostIden.dbf, причем в каждой частной модели создавать ее только один раз!!! В каждой частной модели может наиболее достоверно идентифицироваться НЕСКОЛЬКО классов. Поэтому нужно иметь БД с информацией об этом и проводить распознавание в этой модели в ЦИКЛЕ по этим классам. Эта БД и есть DostIden.dbf.
3. Сделать цикл по БД DostIden.dbf (по частным моделям + классам).
4. Идентифицировать ВСЕХ респондентов из БД Atest.dbf в каждой частной модели ТОЛЬКО с теми классами, которые идентифицируется в данной модели наиболее достоверно (по данным из DostIden.dbf).
Данный алгоритм основан на простой идее о том, что по каждой из социальных категорий рационально идентифицировать респондентов только в той частной модели, в которой эта категория (по данным предварительного исследования частных моделей) идентифицируется с наивысшей достоверностью из всех частных моделей. На описываемой мультимодели этот алгоритм осуществляет идентификацию 370 респондентов за 40 минут вместо 2-х суток полной идентификации.
4. Алгоритм полного распознавания респондентов из Atest.dbf во всех частных моделях
Существуют 3 варианта:
1-й: пакетного распознавания респондентов из Atest.dbf не было выполнено ни в одной частной модели.
2-й: пакетное распознавания респондентов из Atest.dbf было выполнено не во всех частных моделях.
3-й: пакетное распознавания респондентов из Atest.dbf было выполнено во всех частных моделях.
Необходимо сообщить пользователю, какой вариант имеет место - 2-й или 3-й, и предложить ему закончить распознавание или начать заново:
- ЗАКОНЧИТЬ имеет смысл с тем же файлом Atest.dbf;
- НАЧАТЬ ЗАНОВО имеет смысл с новым файлом Atest.dbf;
- если не было выполнено пакетного распознавания ни в одной частной модели, то просто МОЛЧА начать его выполнять для тех моделей, для которых выполнен синтез модели.
Затем организуется цикл по частным моделям.
Распознавание выполняется только, если: синтез модели уже выполнен, а распознавание еще нет.
Проводится запись исходных БД для генерации распознаваемой выборки модели в поддиректорию с этой частной моделью.
Выполняется генерация исходных файлов распознаваемой выборки частной модели из БД Atest.dbf.
Проводится пакетное распознавание как в базовой системе "Эйдос".
5. Алгоритм голосования моделей (с выбором одного из 5-и алгоритмов)
Пользователю в диалоге предлагается задать один из режимов голосования моделей, когда в итоговую карточку идентификации респондента берется:
1. СУММАРНАЯ ЧАСТОТА ИДЕНТИФИКАЦИИ респондента с каждым классом, рассчитанная по всем частным моделям [2, 13].
2. СРЕДНЕЕ уровней сходства с этим классом из всех карточек идентификации частных моделей.
3. Уровень сходства этого респондента с классом из той частной карточки идентификации, в которой он МАКСИМАЛЬНЫЙ.
4. Уровень сходства из карточки идентификации той частной модели, которая показала МАКСИМАЛЬНУЮ достоверность распознавания ДАННОГО КЛАССА из всех моделей.
5. СРЕДНЕЕ СУММЫ ПРОИЗВЕДЕНИЙ уровней сходства с данным классом на достоверность его идентификации в частных моделях.
1-й алгоритм голосования моделей.
В данном алгоритме, который был предложен первым, определяется СУММАРНАЯ ЧАСТОТА ИДЕНТИФИКАЦИИ респондента с каждым классом, рассчитанная по всем частным моделям.
Пользователю предлагается в диалоге ввести следующие параметры:
- минимальный учитываемый уровень сходства респондента с классом в %;
- частоту идентификации респондента с классом в частных моделях в %.
Затем выполняются следующие шаги:
1. Скопировать БД Rasp.dbf из всех директорий моделей с именами: Rasp1###.dbf, где ### - вид модели.
2. Объединить их все в одну БД Rasp.dbf.
3. Рассортировать так, чтобы записи с одинаковым результатом идентификации респондента с классом оказались рядом.
4. Создать новую БД Rasp1.dbf, в которой сделать записи с суммарной частотой идентификации респондента с каждым классом, рассчитанной по всем частным моделям.
5. Физически рассортировать объединенную БД так, как надо для отображения карточек идентификации в базовой системе "Эйдос".
6. Скопировать БД в директорию ALL1 и переиндексировать.
2-й алгоритм голосования моделей.
В этом алгоритме определяется СРЕДНЕЕ уровней сходства с этим классом из всех карточек идентификации частных моделей.
1. Скопировать БД Rasp.dbf из всех директорий моделей с именами: Rasp1###.dbf, где ### - вид модели.
2. Объединить их все в одну БД Rasp.dbf.
3. Рассортировать так, чтобы записи с одинаковым результатом оказались рядом.
4. Сделать новую БД Rasp1.dbf, в которой объединить записи, просуммировав уровни сходства.
5. Физически рассортировать объединенную БД так, как надо для отображения карточек идентификации в базовой системе "Эйдос".
6. Скопировать БД в директорию ALL2 и переиндексировать.
3-й алгоритм голосования моделей.
В данном алгоритме определяется уровень сходства этого респондента с классом из той частной карточки идентификации, в которой он МАКСИМАЛЬНЫЙ.
1. Скопировать БД Rasp.dbf из всех директорий моделей с именами: Rasp1###.dbf, где ### - вид модели.
2. Объединить их все в одну БД Rasp.dbf.
3. Рассортировать ее так, чтобы записи с одинаковым классом оказались рядом и ранжированы в порядке убывания сходства.
4. Сделать новую БД Rasp1.dbf, в которой из предыдущей взять только записи с максимальным уровнем сходства.
5. Физически рассортировать объединенную БД так, как надо для отображения карточек идентификации в базовой системе "Эйдос".
6. Скопировать БД в директорию ALL3 и переиндексировать.
4-й алгоритм голосования моделей.
В данном алгоритме определяется уровень сходства из карточки идентификации той частной модели, которая показала МАКСИМАЛЬНУЮ достоверность распознавания ДАННОГО КЛАССА из всех моделей.
1. Скопировать БД Rasp.dbf из всех директорий моделей с именами: Rasp1###.dbf, где ### - вид модели.
2. Объединить их все в одну БД Rasp.dbf.
3. Рассортировать ее так, чтобы записи с одинаковым классом оказались рядом и ранжированы в порядке убывания сходства.
4. Сделать новую БД Rasp1.dbf, в которую из предыдущей для каждого класса взять записи только из тех частных моделей, в которых они идентифицируются с MAX достоверностью.
5. Физически рассортировать объединенную БД так, как надо для отображения карточек идентификации в базовой системе "Эйдос".
6. Скопировать БД в директорию ALL4 и переиндексировать.
5-й алгоритм голосования моделей.
В данном алгоритме определяется СРЕДНЕЕ СУММЫ ПРОИЗВЕДЕНИЙ уровней сходства с данным классом на достоверность его идентификации в частных моделях.
1. Скопировать БД Rasp.dbf из всех директорий моделей с именами: Rasp1###.dbf, где ### - вид модели.
2. Объединить их все в одну БД Rasp.dbf.
3. Рассортировать ее так, чтобы записи с одинаковым классом оказались рядом и ранжированы в порядке убывания сходства.
4. Сделать новую БД Rasp1.dbf, в которой из предыдущей взять СРЕДНЕЕ СУММЫ ПРОИЗВЕДЕНИЙ уровней сходства с данным классом на достоверность его идентификации в частных моделях.
5. Физически рассортировать объединенную БД так, как надо для отображения карточек идентификации в базовой системе "Эйдос".
6. Скопировать БД в директорию ALL5 и переиндексировать.
6. Алгоритм голосования моделей по всем ПЯТИ алгоритмам по очереди
Он представляет собой режим, полностью аналогичный предыдущему, в котором все алгоритмы голосования запускаются по очереди со значениями параметров по умолчанию.
Все частные и обобщающие модели, созданные с помощью системы окружения "Эйдос-астра", полностью совестимы с базовой универсальной когнитивной аналитической системой "Эйдос" и могут быть просмотрены и исследованы в этой системе.
Описание результатов синтеза и исследования мультимодели
Основными причинами выбора для исследования мультимодели на 37 категорий, каждая из которых представлена не менее чем 1000 респондентов при объеме обучающей выборки 20007 респондентов, являются высокая статистическая достоверность полученных результатов и возможность убедительно говорить о том, что в результате проведенного исследования действительно выявлены закономерности между астропризнаками и социальными категориями (социотипами).
Перечень выбранных категорий и частотное распределение респондентов по этим категориям приведены в таблице 1.
Таблица 1
Справочник классификационных шкал и градаций (обобщенные категории) и частотное распределение респондентов по ним
Код категории |
Наименование категории |
Кол-во респондентов |
|
1 |
SC:М- |
13640 |
|
2 |
SC:Ж- |
5125 |
|
3 |
SC:A53-Sports |
4567 |
|
4 |
SC:A1-Book Collection |
4471 |
|
5 |
SC:A15-Famous |
3373 |
|
6 |
SC:A42-Medical |
2910 |
|
7 |
SC:A323-Sexuality |
2675 |
|
8 |
SC:A5-Entertainment |
2577 |
|
9 |
SC:A9-Relationship |
2442 |
|
10 |
SC:A40-Occult Fields |
2396 |
|
11 |
SC:B111-Sports:Basketball |
2385 |
|
12 |
SC:B329-Sexuality:Sexual perversions |
2360 |
|
13 |
SC:A55-Art |
2232 |
|
14 |
SC:A19-Writers |
2223 |
|
15 |
SC:A129-Death |
2168 |
|
16 |
SC:A25-Personality |
2083 |
|
17 |
SC:A68-Childhood |
1996 |
|
18 |
SC:A31-Business |
1813 |
|
19 |
SC:C330-Sexuality:Sexual perversions:Homosexual m |
1807 |
|
20 |
SC:B45-Famous:Greatest hits |
1795 |
|
21 |
SC:A29-Parenting |
1754 |
|
22 |
SC:B173-Sports:Football |
1613 |
|
23 |
SC:B97-Occult Fields:Astrologer |
1480 |
|
24 |
SC:B21-Relationship:Number of marriages |
1417 |
|
25 |
SC:B2-Book Collection:Profiles Of Women |
1389 |
|
26 |
SC:A92-Birth |
1343 |
|
27 |
SC:B14-Entertainment:Actor/ Actress |
1256 |
|
28 |
SC:?- |
1242 |
|
29 |
SC:B49-Book Collection:American Book |
1178 |
|
30 |
SC:B26-Personality:Body |
1163 |
|
31 |
SC:B189-Medical:Illness |
1159 |
|
32 |
SC:B6-Entertainment:Music |
1086 |
|
33 |
SC:A99-Financial |
1075 |
|
34 |
SC:B48-Famous:Top 5% of Profession |
1073 |
|
35 |
SC:A38-Politics |
1039 |
|
36 |
SC:A23-Psychological |
1007 |
|
37 |
SC:A108-Education |
1002 |
По большинству категорий респондентов значительно более 1000. Это объясняется тем, что один и тот же респондент одновременно может относиться к нескольким категориям. В графической форме частотное распределение респондентов по категориям представлено на рисунке 1.
Рисунок 1 Частотное распределение респондентов по категориям
В результате синтеза мультимодели были получены 172 частные модели с различным количеством разбиений круга на секторы: 2, 3, 4,..., 173. Максимальное количество разбиений составило 173, т. к. при 23 описательных шкалах и таком количестве разбиений во всех шкалах получается суммарно 3979 градаций, тогда как в текущей версии системы "Эйдос" максимальное количество градаций описательных шкал в модели не может превосходить 4000. Однако в данном случае это ограничение не является принципиальным, т.к. оно не помешало нам увидеть общей картины.
В качестве примеров приведем справочники описательных шкал и градаций для частных моделей с 2 и 3 разбиениями (таблицы 2 и 3).
Система "Эйдос-астра" автоматически формирует справочники классификационных и описательных шкал и градаций для всех заданных частных моделей, а затем с использованием этих справочников и БД "Abankall.dbf" также автоматически формирует обучающую выборку в каждой из этих частных моделей. Таким образом, система "Эйдос-астра" обеспечивает автоматическую формализацию предметной области в системе частных моделей.
Приведем в качестве примера фрагмент обучающей выборки частной модели с двумя разбиениями (таблица 4).
Таблица 2
Справочник описательных шкал и градаций частной модели с двумя разбиениями
Код |
Наименование |
Код |
Наименование |
|
1 |
SUNLON-[2]: {0.000, 180.000} |
25 |
HOUSE2-[2]: {0.000, 180.000} |
|
2 |
SUNLON-[2]: {180.000, 360.000} |
26 |
HOUSE2-[2]: {180.000, 360.000} |
|
3 |
MOONLON-[2]: {0.000, 180.000} |
27 |
HOUSE3-[2]: {0.000, 180.000} |
|
4 |
MOONLON-[2]: {180.000, 360.000} |
28 |
HOUSE3-[2]: {180.000, 360.000} |
|
5 |
MERCURYLON-[2]: {0.000, 180.000} |
29 |
HOUSE4-[2]: {0.000, 180.000} |
|
6 |
MERCURYLON-[2]: {180.000, 360.000} |
30 |
HOUSE4-[2]: {180.000, 360.000} |
|
7 |
VENUSLON-[2]: {0.000, 180.000} |
31 |
HOUSE5-[2]: {0.000, 180.000} |
|
8 |
VENUSLON-[2]: {180.000, 360.000} |
32 |
HOUSE5-[2]: {180.000, 360.000} |
|
9 |
MARSLON-[2]: {0.000, 180.000} |
33 |
HOUSE6-[2]: {0.000, 180.000} |
|
10 |
MARSLON-[2]: {180.000, 360.000} |
34 |
HOUSE6-[2]: {180.000, 360.000} |
|
11 |
JUPITERLON-[2]: {0.000, 180.000} |
35 |
HOUSE7-[2]: {0.000, 180.000} |
|
12 |
JUPITERLON-[2]: {180.000, 360.000} |
36 |
HOUSE7-[2]: {180.000, 360.000} |
|
13 |
SATURNLON-[2]: {0.000, 180.000} |
37 |
HOUSE8-[2]: {0.000, 180.000} |
|
14 |
SATURNLON-[2]: {180.000, 360.000} |
38 |
HOUSE8-[2]: {180.000, 360.000} |
|
15 |
URANUSLON-[2]: {0.000, 180.000} |
39 |
HOUSE9-[2]: {0.000, 180.000} |
|
16 |
URANUSLON-[2]: {180.000, 360.000} |
40 |
HOUSE9-[2]: {180.000, 360.000} |
|
17 |
NEPTUNELON-[2]: {0.000, 180.000} |
41 |
HOUSE10-[2]: {0.000, 180.000} |
|
18 |
NEPTUNELON-[2]: {180.000, 360.000} |
42 |
HOUSE10-[2]: {180.000, 360.000} |
|
19 |
PLUTOLON-[2]: {0.000, 180.000} |
43 |
HOUSE11-[2]: {0.000, 180.000} |
|
20 |
PLUTOLON-[2]: {180.000, 360.000} |
44 |
HOUSE11-[2]: {180.000, 360.000} |
|
21 |
NODELON-[2]: {0.000, 180.000} |
45 |
HOUSE12-[2]: {0.000, 180.000} |
|
22 |
NODELON-[2]: {180.000, 360.000} |
46 |
HOUSE12-[2]: {180.000, 360.000} |
|
23 |
HOUSE1-[2]: {0.000, 180.000} |
|||
24 |
HOUSE1-[2]: {180.000, 360.000} |
Таблица 3
Справочник описательных шкал и градаций частной модели с тремя разбиениями
Код |
Наименование |
Код |
Наименование |
|
1 |
SUNLON-[3]: {0.000, 120.000} |
37 |
HOUSE2-[3]: {0.000, 120.000} |
|
2 |
SUNLON-[3]: {120.000, 240.000} |
38 |
HOUSE2-[3]: {120.000, 240.000} |
|
3 |
SUNLON-[3]: {240.000, 360.000} |
39 |
HOUSE2-[3]: {240.000, 360.000} |
|
4 |
MOONLON-[3]: {0.000, 120.000} |
40 |
HOUSE3-[3]: {0.000, 120.000} |
|
5 |
MOONLON-[3]: {120.000, 240.000} |
41 |
HOUSE3-[3]: {120.000, 240.000} |
|
6 |
MOONLON-[3]: {240.000, 360.000} |
42 |
HOUSE3-[3]: {240.000, 360.000} |
|
7 |
MERCURYLON-[3]: {0.000, 120.000} |
43 |
HOUSE4-[3]: {0.000, 120.000} |
|
8 |
MERCURYLON-[3]: {120.000, 240.000} |
44 |
HOUSE4-[3]: {120.000, 240.000} |
|
9 |
MERCURYLON-[3]: {240.000, 360.000} |
45 |
HOUSE4-[3]: {240.000, 360.000} |
|
10 |
VENUSLON-[3]: {0.000, 120.000} |
46 |
HOUSE5-[3]: {0.000, 120.000} |
|
11 |
VENUSLON-[3]: {120.000, 240.000} |
47 |
HOUSE5-[3]: {120.000, 240.000} |
|
12 |
VENUSLON-[3]: {240.000, 360.000} |
48 |
HOUSE5-[3]: {240.000, 360.000} |
|
13 |
MARSLON-[3]: {0.000, 120.000} |
49 |
HOUSE6-[3]: {0.000, 120.000} |
|
14 |
MARSLON-[3]: {120.000, 240.000} |
50 |
HOUSE6-[3]: {120.000, 240.000} |
|
15 |
MARSLON-[3]: {240.000, 360.000} |
51 |
HOUSE6-[3]: {240.000, 360.000} |
|
16 |
JUPITERLON-[3]: {0.000, 120.000} |
52 |
HOUSE7-[3]: {0.000, 120.000} |
|
17 |
JUPITERLON-[3]: {120.000, 240.000} |
53 |
HOUSE7-[3]: {120.000, 240.000} |
|
18 |
JUPITERLON-[3]: {240.000, 360.000} |
54 |
HOUSE7-[3]: {240.000, 360.000} |
|
19 |
SATURNLON-[3]: {0.000, 120.000} |
55 |
HOUSE8-[3]: {0.000, 120.000} |
|
20 |
SATURNLON-[3]: {120.000, 240.000} |
56 |
HOUSE8-[3]: {120.000, 240.000} |
|
21 |
SATURNLON-[3]: {240.000, 360.000} |
57 |
HOUSE8-[3]: {240.000, 360.000} |
|
22 |
URANUSLON-[3]: {0.000, 120.000} |
58 |
HOUSE9-[3]: {0.000, 120.000} |
|
23 |
URANUSLON-[3]: {120.000, 240.000} |
59 |
HOUSE9-[3]: {120.000, 240.000} |
|
24 |
URANUSLON-[3]: {240.000, 360.000} |
60 |
HOUSE9-[3]: {240.000, 360.000} |
|
25 |
NEPTUNELON-[3]: {0.000, 120.000} |
61 |
HOUSE10-[3]: {0.000, 120.000} |
|
26 |
NEPTUNELON-[3]: {120.000, 240.000} |
62 |
HOUSE10-[3]: {120.000, 240.000} |
|
27 |
NEPTUNELON-[3]: {240.000, 360.000} |
63 |
HOUSE10-[3]: {240.000, 360.000} |
|
28 |
PLUTOLON-[3]: {0.000, 120.000} |
64 |
HOUSE11-[3]: {0.000, 120.000} |
|
29 |
PLUTOLON-[3]: {120.000, 240.000} |
65 |
HOUSE11-[3]: {120.000, 240.000} |
|
30 |
PLUTOLON-[3]: {240.000, 360.000} |
66 |
HOUSE11-[3]: {240.000, 360.000} |
|
31 |
NODELON-[3]: {0.000, 120.000} |
67 |
HOUSE12-[3]: {0.000, 120.000} |
|
32 |
NODELON-[3]: {120.000, 240.000} |
68 |
HOUSE12-[3]: {120.000, 240.000} |
|
33 |
NODELON-[3]: {240.000, 360.000} |
69 |
HOUSE12-[3]: {240.000, 360.000} |
|
34 |
HOUSE1-[3]: {0.000, 120.000} |
|||
35 |
HOUSE1-[3]: {120.000, 240.000} |
|||
36 |
HOUSE1-[3]: {240.000, 360.000} |
Таблица 4
Обучающая выборка частной модели с двумя разбиениями (фрагмент)
id |
Наименование |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коды категорий |
|||||||||||||||
1 |
Aadland, Beverl |
2 |
4 |
5 |
8 |
9 |
14 |
24 |
25 |
27 |
32 |
||||
Коды астропризнаков |
|||||||||||||||
1 |
4 |
6 |
7 |
9 |
11 |
13 |
15 |
17 |
19 |
21 |
|||||
24 |
26 |
28 |
30 |
31 |
33 |
35 |
37 |
39 |
41 |
44 |
|||||
46 |
|||||||||||||||
Коды категорий |
|||||||||||||||
2 |
Aadland, Floren |
2 |
4 |
5 |
9 |
14 |
16 |
18 |
21 |
25 |
30 |
36 |
|||
Коды астропризнаков |
|||||||||||||||
1 |
4 |
6 |
8 |
10 |
12 |
13 |
16 |
17 |
19 |
22 |
|||||
23 |
25 |
27 |
29 |
32 |
34 |
36 |
38 |
40 |
42 |
43 |
|||||
45 |
|||||||||||||||
Коды категорий |
|||||||||||||||
3 |
Aafjes, Bertus |
1 |
14 |
||||||||||||
Коды астропризнаков |
|||||||||||||||
1 |
4 |
5 |
7 |
9 |
12 |
13 |
16 |
17 |
19 |
22 |
|||||
Коды категорий |
|||||||||||||||
4 |
Aal-Pomares, He |
1 |
8 |
35 |
|||||||||||
Коды астропризнаков |
|||||||||||||||
2 |
3 |
6 |
8 |
9 |
11 |
14 |
15 |
17 |
19 |
22 |
|||||
23 |
25 |
27 |
29 |
31 |
33 |
36 |
38 |
40 |
42 |
44 |
|||||
46 |
|||||||||||||||
Коды категорий |
|||||||||||||||
5 |
Aaron, Dave |
1 |
5 |
6 |
10 |
18 |
20 |
||||||||
Коды астропризнаков |
|||||||||||||||
2 |
4 |
6 |
8 |
10 |
11 |
13 |
15 |
18 |
19 |
21 |
|||||
23 |
25 |
27 |
30 |
32 |
34 |
36 |
38 |
40 |
41 |
43 |
|||||
45 |
|||||||||||||||
Коды категорий |
|||||||||||||||
6 |
Aaron, Hank |
1 |
3 |
4 |
5 |
16 |
20 |
29 |
30 |
34 |
|||||
Коды астропризнаков |
|||||||||||||||
2 |
4 |
6 |
8 |
10 |
12 |
14 |
15 |
17 |
19 |
22 |
|||||
23 |
26 |
28 |
30 |
32 |
34 |
36 |
37 |
39 |
41 |
43 |
|||||
45 |
|||||||||||||||
Коды категорий |
|||||||||||||||
7 |
Aavikko, Armi |
2 |
5 |
8 |
13 |
20 |
32 |
||||||||
Коды астропризнаков |
|||||||||||||||
1 |
3 |
5 |
7 |
9 |
12 |
14 |
15 |
18 |
19 |
22 |
|||||
24 |
26 |
28 |
30 |
32 |
34 |
35 |
37 |
39 |
41 |
43 |
|||||
45 |
|||||||||||||||
Коды категорий |
|||||||||||||||
8 |
Abad, Andy |
1 |
8 |
13 |
32 |
||||||||||
Коды астропризнаков |
|||||||||||||||
2 |
3 |
6 |
8 |
10 |
11 |
13 |
16 |
18 |
19 |
21 |
|||||
23 |
25 |
27 |
29 |
31 |
33 |
36 |
38 |
40 |
42 |
44 |
|||||
46 |
|||||||||||||||
Коды категорий |
|||||||||||||||
9 |
Abbado, Claudio |
1 |
4 |
5 |
8 |
9 |
13 |
16 |
17 |
20 |
21 |
24 |
30 |
32 |
|
Коды астропризнаков |
|||||||||||||||
1 |
3 |
5 |
7 |
9 |
11 |
14 |
15 |
17 |
19 |
22 |
|||||
23 |
25 |
27 |
29 |
31 |
33 |
36 |
38 |
40 |
42 |
44 |
|||||
46 |
Для каждой частной модели на основе обучающей выборки формируется сначала матрица абсолютных частот (таблица 5), а затем и матрица информативностей (таблица 6). В качестве математической модели СК-анализа используется системная теория информации (СТИ), предложенная автором [3, 5, 1-12].
Таблица 5
Фрагмент матрицы абсолютных частот встреч признаков по категориям в частной модели с двумя разбиениями
Коды приз- наков |
Коды категорий |
||||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
||
1 |
6744 |
2623 |
2281 |
2201 |
1671 |
1477 |
1378 |
1271 |
1222 |
1201 |
1230 |
1208 |
|
2 |
6896 |
2502 |
2286 |
2270 |
1702 |
1433 |
1297 |
... |
Подобные документы
Анализ современного состояния общей проблемы синтеза моделей многофакторного оценивания и подходов к ее решению. Разработка математической модели метода компараторной идентификации модели многофакторного оценивания. Описание генетического алгоритма.
дипломная работа [851,7 K], добавлен 11.09.2012Анализ существующих методов реализации программного средства идентификации личности по голосу. Факторы, влияющие на уникальность речи. Разработка программного средства идентификации личности по голосу. Требования к программной документации приложения.
дипломная работа [12,7 M], добавлен 17.06.2016- Контроль достоверности исходной информации и диагностика отказов информационно-измерительных каналов
Изучение алгоритмов допускового контроля достоверности исходной информации, с помощью которых выявляются полные и частичные отказы информационно-измерительных каналов. Определение погрешности выполнения уравнения связи между количествами информации.
лабораторная работа [565,4 K], добавлен 14.04.2012 Описание сервиса электронного кафе и определение основных требований к системе. Модели вариантов использования, состояний, последовательности, классов, компонентов и развертывания. Описание алгоритмов, реализующих бизнес-логику серверной части.
курсовая работа [3,3 M], добавлен 23.12.2014Подсистема анализа изображения отпечатка пальца в составе системы идентификации личности по отпечаткам пальцев на основе папиллярного узора для дальнейшего распознавания личности. Характеристика функциональных возможностей системы и код програмы.
дипломная работа [3,1 M], добавлен 01.07.2008Проведение идентификации модели по схеме МНК. Запись исходной модели в дискретной форме. Сравнение параметров модели и результатов идентификации. Анализ графиков модельного выходного сигнала и оценки выходного сигнала, восстановленных по схеме МНК.
лабораторная работа [461,0 K], добавлен 19.02.2015Описание формальной модели алгоритма на основе рекурсивных функций. Разработка аналитической и программной модели алгоритма для распознающей машины Тьюринга. Разработка аналитической модели алгоритма с использованием нормальных алгоритмов Маркова.
курсовая работа [1,5 M], добавлен 07.07.2013Классификация и основные характеристики биометрических средств идентификации личности. Особенности реализации статических и динамических методов биометрического контроля. Средства авторизации и аутентификации в электронных системах охраны и безопасности.
курсовая работа [1,7 M], добавлен 19.01.2011Анализ биометрических систем идентификации личности по отпечаткам пальцев, форме кисти руки, оболочке глаза. Лицо как биометрический идентификатор. Анализ рынка систем распознавания личности. Оценка эффективности систем идентификации по геометрии лица.
курсовая работа [1,8 M], добавлен 30.05.2013- Разработка алгоритмов и программ для определения сходства семантических сетей на основе их сложности
Семантические сети как модели представления знаний. Основные методы определения сходства графовых моделей систем. Метод решения задач определения сходства семантических сетей на основе их сложности. Разработка алгоритмов и их программная реализация.
дипломная работа [1,3 M], добавлен 17.12.2011 Основные цели и задачи построения систем распознавания. Построение математической модели системы распознавания образов на примере алгоритма идентификации объектов военной техники в автоматизированных телекоммуникационных комплексах систем управления.
дипломная работа [332,2 K], добавлен 30.11.2012Реализация алгоритмов вычисления математических объектов на конкретных вычислительных машинах. Числовые данные в практических задачах. Анализ математических моделей, связанных с применением вычислительных машин в различных областях научной деятельности.
курсовая работа [369,3 K], добавлен 13.01.2018Построение концептуальной модели системы и ее формализация. Алгоритмизация модели системы и ее машинная реализация. Построение логической схемы модели. Проверка достоверности модели системы. Получение и интерпретация результатов моделирования системы.
курсовая работа [67,9 K], добавлен 07.12.2009Критерии и основные стратегии планирования процессора. Разработка моделей алгоритмов SPT (Shortest-processing-task-first) и RR (Round-Robin). Сравнительный анализ выбранных алгоритмов при различных условиях и различном количестве обрабатываемых данных.
курсовая работа [179,3 K], добавлен 21.06.2013Типы моделей данных: иерархическая, сетевая, реляционная. Структура входных и выходных данных. Классы управления данными, исключений. Структура таблиц, используемых в программе. Описание алгоритмов решения задачи. Диаграммы классов, блок-схемы алгоритмов.
курсовая работа [1,5 M], добавлен 22.06.2012Теоретические основы и проблемы принятия решений. Синтез модели многофакторного оценивания, метод компараторной идентификации. Особенности реализации базового генетического алгоритма. Программный способ определения эффективного состава команды проекта.
дипломная работа [733,1 K], добавлен 09.06.2012Обеспечение достоверности передаваемой информации применением корректирующих кодов. Код Хэмминга - алгоритм обнаружения и исправления одиночной ошибки. Использование циклических кодов при последовательной передачей между ЭВМ и внешними устройствами.
дипломная работа [123,7 K], добавлен 02.08.2009Обзор области генерации сетевого трафика. Описание выбранных методов, моделей, алгоритмов решения задач. Создание модели поведения пользователя, распределение количества посещённых страниц сайта. Выбор средств реализации программного продукта (проекта).
курсовая работа [1,3 M], добавлен 30.06.2017Понятие алгоритма и анализ теоретических оценок временной сложности алгоритмов умножения матриц. Сравнительный анализ оценки временной сложности некоторых классов алгоритмов обычным программированием и программированием с помощью технологии Open MP.
дипломная работа [1,6 M], добавлен 12.08.2017Построение модели прецедентов, модели пригодности для прецедента. Описание атрибутов и операций классов системы. Проектирование с применением методологии ICONIX. Построение диаграммы пригодности, диаграммы последовательностей и диаграмма классов.
курсовая работа [949,5 K], добавлен 25.05.2015