Модель представления и количественной оценки знаний

Разработка математической модели для представления и количественной оценки знаний, основанной на понятии "информационная среда". Рассмотрение вопросов имитационного моделирования. Подходы к сопоставлению параметров модели и интеллектуального объекта.

Рубрика Математика
Вид статья
Язык русский
Дата добавления 27.05.2018
Размер файла 52,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МОДЕЛЬ ПРЕДСТАВЛЕНИЯ И КОЛИЧЕСТВЕННОЙ ОЦЕНКИ ЗНАНИЙ

П.Ю. Шалимов

Аннотация

математический модель оценка знание

Предложена математическая модель для представления и количественной оценки знаний, основанная на понятии «информационная среда». Рассмотрены вопросы имитационного моделирования. Намечены подходы к сопоставлению параметров модели и интеллектуального объекта, прогнозированию его развития.

Ключевые слова: информация, информационная среда, модель представления знаний, количественная оценка знаний, прогнозирование.

Основная часть

По мере накопления информации знания становятся одним из ресурсов как отдельного человека, так и предприятия. Одним их основных этапов преобразования информации в знания с целью их использования в задачах принятия решений и целом ряде других интеллектуальных задач является их формализация посредством определенной модели. Среди традиционных моделей представления знаний в первую очередь следует отметить продукционные, логические, семантические сети, фреймы, онтологии. Сфера применимости этих моделей в задачах принятия решений включает поиск в базе правил, обучение новым знаниям, объяснение решений. Это делает знания действительно движущей силой в сложных производственных системах.

Однако такие модели не дают основания для прогнозирования развития интеллектуальных систем, оценки их уровня, идентификации понятия качества интеллектуального ресурса, сравнения с линейкой аналогичных объектов. Главная причина такого положения состоит в том, что описанные традиционные модели не содержат в себе посылок для количественной оценки знаний. Проблема количественной оценки знаний становится все более актуальной вследствие коммерциализации. Появляются новые формы выражения и накопления знаний: корпоративные базы знаний, ресурсы сети Интернет.

Математическая модель для представления знаний с возможностью количественного оценивания. Подход к проблеме количественной оценки может основываться на том, что знания появляются в результате информационного обмена. Модель информационной среды объекта предметной области становится его моделью знаний. Однако само понятие «информационная среда» (ИНС) нельзя назвать четко определенным. Нет устоявшегося определения этого понятия: при анализе материалов сети Интернет можно найти до семи различных определений, зачастую существенно различающихся [1-3].

Модель информационной среды [1] - эвристическая, она базируется на ряде гипотез относительно видов основных функциональных зависимостей. Информационная среда - объект, обменивающийся структурированной информацией с другими аналогичными объектами и накапливающий эту информацию.

Модель ИНС, адаптированная для задачи представления знаний, включает:

· семантические информационные направления 1,2,..., n;

· актуальности семантических информационных направлений А12,...,Аn;

· входные информационные потоки направлений Х12,...,Хn;

· выходные информационные потоки направлений Y1,Y2,...,Yn;

· пороговые элементы, входные (V1,V2,...,Vn) и выходные (U1,U2,...,Un);

· потенциалы семантических направлений W1,W2,...,Wn;

· потенциал информационной среды Q.

В основе модели находится понятие семантического направления. По семантическому направлению происходит обмен информацией между средами. Семантические направления характеризуют тематическую ориентацию передачи информации между информационными средами и нумеруются целыми положительными числами. В общем случае (n - максимальное количество направлений, учитываемых в конкретном расчете). Семантические направления инвариантны относительно среды: соответствие конкретной темы направления и его номера не зависит от среды в каждой рассматриваемой схеме взаимодействия.

Актуальность направления является количественной оценкой приоритетности этого направления на данном отрезке времени (A0…1). Сумма всех актуальностей направлений среды на данном отрезке времени

. (1)

Входные потоки направлений Х1,Х2,…,Хn определяются количеством информации, поступившей в среду по соответствующему направлению, выходные потоки направлений Y1,Y2,...,Yn - величиной информации, переданной другим информационным средам в рассматриваемой расчетной схеме.

Пороговые элементы, входные (V1,V2,...,Vn ) и выходные (U1,U2,...,Un), определяют режимы пропуска соответствующих потоков в среду и обратно. В простейшем случае пороговые элементы реализуют дискретный режим пропускания информационных потоков в зависимости от актуальности направления: если Ai<Vi, то Xi=0; если Ai<Ui, то Yi=0. Состояние, при котором значение пороговых элементов Vi, Ui равно 0, соответствует полному безусловному пропусканию потоков. Значение пороговых элементов, равное единице, соответствует заблокированным направлениям при отсутствии информационных потоков.

Потенциалы семантических направлений W1,W2,...,Wn являются мерами накопления соответствующей тематической информации. В общем случае потенциал будет определяться выражением

,

где W - функция преобразования входного потока в потенциал направления (функция упаковывания); t - время жизни информационной среды.

Аргумент функции W будет называться накопленным потоком направления. Потенциал семантического направления - величина, находящаяся в интервале [0; 1]. Значение 0 соответствует случаю, когда не было получено информации по данному направлению. Значение 1 показывает, что получена вся возможная в данной расчетной схеме информация.

Функция преобразования входного потока определяет способность информационной среды к накоплению информации по семантическому направлению. Этот тип функций описывается следующим образом:

(2)

или

, (3)

где s - накопленный поток направления.

Параметр a определяет крутизну функции F и является одной из основных характеристик информационной среды, отвечающей за способность накопления структурированной информации. С позиций когнитивного подхода вектор W - знания информационной среды, и параметр а отвечает за качество процесса накопления знаний (обучение). Параметр а - характеристика качества процесса накопления структурированной информации.

Потенциал информационной среды является мерой накопления информации в ИНС и в общем случае определяется как

,

где Q - функция преобразования потенциалов.

Функция преобразования потенциалов направлений в потенциал ИНС описывается следующим выражением:

, (4)

где b - параметр накопления информации в среде.

Изменяя параметр b, можно строить функции с различной крутизной и, следовательно, различной эффективностью процесса накопления информации в среде. Параметр b является еще одной характеристикой модели, отвечающей за качество процесса накопления информации в среде.

Актуальность семантического направления определяется как функция от потенциала этого направления:

Ai=A(Wi),

где A(Wi) - функция зависимости актуальности от потенциала направления.

Используется функция, задаваемая следующим выражением:

, (5)

где p, r, t - параметры, определяющие график конкретной функции. Изменяя эти параметры, можно получать функции с различной крутизной (параметр r), сдвигом (параметр р), высотой (параметр t). Значения W и A принадлежат интервалу от 0 до 1.

Тем самым может быть реализована как спадающая, так и растущая по мере роста потенциала направления актуальность. Также при определенном сочетании управляющих параметров может быть реализована функция, ассоциирующаяся с зависимостью количества семантической информации, воспринимаемой потребителем, от объема его тезауруса. Следует отметить, что функция актуальности вида (5) будет обеспечивать в ходе вычислений ввод в действие новых семантических направлений.

Выходной информационный поток направления определяется как

,

где Y(AI) - функция информационного потока.

В первом приближении используется прямая линейная зависимость информационного потока от актуальности. Входной поток направления определяется суммированием входных потоков, полученных от других сред в рассматриваемой схеме:

,

где Yji - выходной поток по направлению i для среды j.

Значения пороговых элементов зависят от потенциала среды:

;

.

Пороговые значения актуальностей направлений уменьшаются по мере роста потенциала среды. Это позволяет математической модели обеспечивать ввод новых направлений по мере увеличения потенциала среды. Такая зависимость выглядит следующим образом:

Vi=V0i p(Q);

Ui=U0i p(Q);

p(Q)=1-tanh(hQ), (6)

где Vi - текущее значение порога актуальности; V0i, U0i - начальные значения порогов актуальностей; h - параметр функции.

Модель является рекуррентной. Фактор времени в такой модели явно не присутствует, что затрудняет ее использование в задачах прогнозирования. Аналог времени появляется на стадии имитационного моделирования информационной среды.

Имитационное моделирование. В основе задачи имитационного моделирования информационной среды лежат:

· расчетная схема, состоящая из М сред с количеством направлений N;

· распределение потенциалов направлений W для каждой рассматриваемой ИНС;

· распределение входных порогов V актуальностей;

· распределение выходных порогов U актуальностей.

Требуется определить конечное распределение потенциалов направлений и среды после выполнения некоторого количества актов распространения информации (эпох). Согласно представленной математической модели, ИНС определяют следующие параметры:

· характеристика качества процесса накопления структурированной информации - параметр а в выражениях (2) и (3);

· характеристика качества процесса накопления информации в среде - параметр b в выражении (4);

· характеристики функции актуальности - параметры p, r, t в выражении (5);

· характеристика функции управления порогами - параметр h в выражении (6).

Эти параметры модели в дальнейшем будут называться характеристическими, поскольку они определяют индивидуальные свойства среды.

В ходе имитационного моделирования возможны последовательный и пакетный режимы распространения информации в рамках выбранной схемы. В первом случае последовательно просматриваются все информационные среды в выбранной схеме и все их направления, каждая передача информации учитывается изменением соответствующих потенциалов направлений и сред. В пакетном режиме изменение соответствующих потенциалов будет учитываться только после рассмотрения всех сред в выбранной схеме. В обоих режимах под эпохой понимается рассмотрение всех возможных в данной схеме актов передачи информации. На протяжении всей эпохи остаются неизменными значения актуальностей направлений, потенциалов направлений и сред. Новые значения эти параметры получают при окончании эпохи.

Рассматриваются две основные группы вычислительных экспериментов (в зависимости от целей моделирования): локальные и глобальные. Локальные вычислительные эксперименты предполагают наблюдение за основными характеристиками одной или нескольких информационных сред в расчетной схеме. В глобальных экспериментах объектом наблюдения являются все среды в расчетной схеме. Наблюдаемыми характеристиками в большинстве случаев являются потенциал информационной среды, потенциалы направлений, количество направлений, по которым передавались сообщения. Примеры ассоциаций между вычислительными экспериментами и реальными ситуациями: «учреждение образования», «веб-сайт». Название ассоциации дается по реальной ситуации и в дальнейшем может использоваться для именования вычислительного эксперимента.

Вербальное описание алгоритма моделирования. Алгоритм предполагает циклическую обработку всех информационных сред выбранной расчетной схемы в следующей последовательности:

Инициализация. Генерируются значения порогов актуальностей направлений с помощью датчика равномерно распределенных чисел в интервале [0;1]. В зависимости от целей конкретного вычислительного эксперимента актуальностям отдельных направлений ряда исследуемых сред могут быть присвоены запретительные значения (=1). Например, ИНС библиотечного ресурса имеет запретительные значения по каждому входному направлению Vi=l. В качестве направлений выступают разделы содержания. Аналогично, в зависимости от целей конкретного вычислительного эксперимента, выбираются потенциалы направлений.

Распространение информации в средах расчетной схемы. Для каждого направления каждой ИНС рассчитывается актуальность:

,

где Aij и W ij - соответственно актуальность и потенциал направления i; rj,pj, tj - параметры функции актуальности в среде j.

Затем определяются выходные потоки по каждому направлению каждой среды. Один из возможных подходов к определению выходного потока предполагает, что он прямо пропорционален актуальностям направлений. При этом необходимо учесть, что по целому ряду направлений, имеющих текущие значения актуальностей меньше пороговых, передача информации не состоится. Тогда при определении выходных потоков направлений следует использовать нормированные с учетом выражения (1) значения актуальностей:

Yij=Aij при AijUij;

0 при Aij<Uij,

где Aij - нормированные актуальности направлений.

Регистрация потоков информации в потенциалах направлений и ИНС. Для каждого направления каждой ИНС определяется суммарный поток за эпоху следующим образом:

при AijVij;;

0 при Aij<Vij ,

где j - номер рассматриваемой ИНС; k - нумерация по ИНС в расчетной схеме; m - максимальное число ИНС в схеме; i - номер рассматриваемого направления.

Определяются потенциалы направлений с использованием соответствующих функций преобразования входного потока:

или

.

Для каждой среды в расчетной схеме определяется новый потенциал:

,

где Qj - потенциал среды с номером j;bj - параметр накопления информации в ИНС.

Для каждой ИНС определяются новые значения пороговых функций:

;

,

где Voij и Uoij - начальные значения порогов актуальностей направлений; hj - параметр функции изменения пороговых значений.

4. Последовательное выполнение этапов 2 и 3. Выполнение одной последовательности этапов 2 и 3 соответствует одной эпохе. В конкретном вычислительном эксперименте эпохе может быть сопоставлено время, хотя оно в модели в явном виде не присутствует.

Описанная модель ИНС может быть применима для представления знаний, если сопоставить параметрам модели соответствующее семантическое описание. Семантическому направлению модели информационной среды будет сопоставляться термин «тезаурус». Потенциалу направления Wi будет соответствовать полнота (объем) определения термина «тезаурус». Соответственно вектор потенциалов направлений W, потенциал ИНС Q будут представлять собой количественные оценки знаний.

Численный эксперимент, основан на следующей расчетной схеме. Исследуемая ИНС: максимальное количество направлений - 100; потенциалы направлений - 0,0; пороговые значения входных направлений - равномерно распределенные величины в интервале [0;0,5]; пороговые значения выходных направлений - равномерно распределенные величины в интервале [0,5;1]; начальное значение потенциала - 0. Информационные среды окружения: количество - 5; максимальное количество направлений - 100; потенциалы направлений - равномерно распределенные случайные значения в интервале [0,2;0,3]; пороговые значения входных направлений - равномерно распределенные величины в интервале [0,1;0,9]; пороговые значения выходных направлений - равномерно распределенные величины в интервале [0,1;0,9]. Регистрируются значения потенциала исследуемой среды Q и количества действующих направлений D на протяжении первых 80 эпох. Действующим считается направление, по которому передается информация. В зависимости от целей исследования наблюдаемыми в ходе вычислительного эксперимента величинами могут быть следующие параметры: потенциал выделенной информационной среды, количество действующих направлений, суммарный потенциал всех сред в расчетной схеме, скорость увеличения потенциала в зависимости от характеристических параметров. При выполнении вычислительных экспериментов, направленных на апробацию предложенной математической модели информационной среды, определяются указанные параметры и их диапазоны. С учетом того, что количество действующих направлений и потенциал среды являются мерами кругозора и уровня интеллекта системы, число эпох - аналогом времени, такие вычислительные эксперименты имеют высокий прогностический потенциал.

Потенциалы направлений должны сопоставляться со значениями реальных объектов путем статистических исследований с использованием синтаксических аналогий. Синтаксическая аналогия - допущение, которое полагает, что объемы семантической информации и знаний имеют прямо пропорциональную зависимость с количеством синтаксической информации при рассмотрении на достаточно большом объеме опытного материала. Например, для оценивания величин потенциалов направлений используется следующая процедура: выбирается направление (термин глоссария, тезауруса, энциклопедии), оценивается в байтах объем соответствующей информации (по нескольким источникам). В качестве источников информации могут выступать словари, энциклопедии, учебные пособия. Количество использованных источников будет определять точность статистического исследования, в котором получаются математическое ожидание и дисперсия величин, сопоставляемых потенциалам и направлениям модели.

Параметры вычислительного эксперимента соответствуют случаю приобретения знаний ребенком в возрасте от 0 до 3 лет [4]. Считается, что в возрасте 2-3 лет ребенок знает 50-300 слов, что будет аналогом количества действующих направлений 5. Уровни по потенциалам направлений представлены в виде оценок, полученных экспертным способом. Появление новых знаний в информационной среде проявляется увеличением потенциалов направлений, вводом новых направлений информационной среды, увеличением потенциала информационной среды, изменением характеристик функции управления пороговыми значениями актуальностей направлений.

Модель ИНС учитывает все аспекты понятия «информация»: синтаксический, семантический, прагматический. Синтаксический аспект показывается информационными потоками Yi,Xi, семантический - потенциалами направлений Wi, прагматический - актуальностями направлений Ai и пороговыми значениями Ui,Vi. Информационный обмен в модели организуется по следующему принципу: знания в момент времени t (вектор потенциалов W(t)) стимулируют определенное распределение актуальностей (А), что приводит к появлению информационных потоков (Y,X), преобразующихся в новое знание W(t+1). В численном эксперименте это показано для одной информационной среды, находящейся в определенном окружении. Такого типа вычислительные эксперименты могут проводиться для прогнозирования развития, вариативного сопоставления параметров и результатов, оценивания уровня.

Основные проблемы возникают при сопоставлении результатов вычислительного эксперимента с реальной ситуацией. В параметрах модели придется учитывать значения для конкретных информационных объектов. В описанном численном эксперименте значения параметров ранжировались по уровням с приписыванием им вербальных и количественных характеристик. Например, шкала потенциалов делится на пять уровней: начальный (0<Wi<0,2), энциклопедический (0,2<Wi<0,4), учебный (0,4<Wi<0,6), профессиональный (0,6<Wi<0,8), экспертный (0,8<Wi<0,9). В целом ряде случаев такой точности исходных данных может быть не достаточно.

Предложенная модель позволяет количественно оценивать знания в информационной среде, к которой, в частности, относятся человек, веб-сайт, глобальная сеть Интернет, любое интеллектуальное произведение, в численных значениях интервала [0;1]. При этом знания трактуются как полученная и особым образом «упакованная» информация. Модель позволяет решать задачи оптимизации, прогнозирования развития интеллектуальных ресурсов, сравнивать их динамику, задавать параметры развития.

Список литературы

1. . Шалимов, П.Ю. Математическая модель информационной среды/ П.Ю. Шалимов// Вестн. БГТУ. 2008. № 1. C.54-60.

2. Шалимов, П.Ю. Моделирование информационной среды образовательного учреждения / П.Ю. Шалимов // Качество инженерного образования: материалы 3-й Междунар. науч.-метод, конф. Брянск, 2009. С. 181-183.

3. Дорот, В. Л. Толковый словарь современной компьютерной лексики/ В.Л. Дорот - 2-е изд., перераб. и доп. СПб.: BHV-Санкт-Петербург, 2001. 509 с.

4. Дубровина, И.В. Психокоррекционная и развивающая работа с детьми / И.В. Дубровина, А.Д. Андреева, Е.Е. Данилова [и др].; под ред. И.В. Дубровиной. 2-е изд. М.: Академия, 1998. 160 с.

5. Гладун, А.Я. Онтологии в корпоративных системах / А.Я. Гладун, Ю.В. Рогушина // Корпоративные системы.2006. №1.

Размещено на Allbest.ru

...

Подобные документы

  • Изучение физического процесса как объекта моделирования. Описание констант и параметров, переменных, используемых в физическом процессе. Схема алгоритма математической модели, обеспечивающая вычисление заданных зависимостей физического процесса.

    курсовая работа [434,5 K], добавлен 21.05.2022

  • Теоретические основы оценивания показателей точности и описание статистической имитационной модели. Моделирование мощности излучения и процесса подготовки к измерениям. Статистическая обработка результатов моделирования и сущность закона распределения.

    дипломная работа [1,9 M], добавлен 10.06.2011

  • Создание математической модели движения шарика, подброшенного вертикально вверх, от начала падения до удара о землю. Компьютерная реализация математической модели в среде электронных таблиц. Определение влияния изменения скорости на дальность падения.

    контрольная работа [1,7 M], добавлен 09.03.2016

  • Проектирование математической модели. Описание игры в крестики-нолики. Модель логической игры на основе булевой алгебры. Цифровые электронные устройства и разработка их математической модели. Игровой пульт, игровой контроллер, строка игрового поля.

    курсовая работа [128,6 K], добавлен 28.06.2011

  • Синтез оптимального управления при осуществлении разворота. Разработка математической модели беспилотных летательных аппаратов. Кинематические уравнения движения центра масс. Разработка алгоритма оптимального управления, результаты моделирования.

    курсовая работа [775,3 K], добавлен 16.07.2015

  • Основные положения теории математического моделирования. Структура математической модели. Линейные и нелинейные деформационные процессы в твердых телах. Методика исследования математической модели сваи сложной конфигурации методом конечных элементов.

    курсовая работа [997,2 K], добавлен 21.01.2014

  • Суть компьютерного моделирования. Система, модели и имитационное моделирование. Механизмы продвижения времени. Компоненты дискретно-событийной имитационной модели. Усиление и ослабление факторов сопутствующих активности гейзера, динамическая модель.

    курсовая работа [776,2 K], добавлен 28.06.2013

  • Сущность математического моделирования. Аналитические и имитационные математические модели. Геометрический, кинематический и силовой анализы механизмов подъемно-навесных устройств. Расчет на устойчивость мобильного сельскохозяйственного агрегата.

    курсовая работа [636,8 K], добавлен 18.12.2015

  • Динамическая модель как теоретическая конструкция, описывающая изменение состояний объекта. Характеристика основных подходов к построению: оптимизационный, описательный. Рассмотрение способов построения математических моделей дискретных объектов.

    контрольная работа [769,7 K], добавлен 31.01.2013

  • Процесс выбора или построения модели для исследования определенных свойств оригинала в определенных условиях. Стадии процесса моделирования. Математические модели и их виды. Адекватность математических моделей. Рассогласование между оригиналом и моделью.

    контрольная работа [69,9 K], добавлен 09.10.2016

  • Изучение актуальной задачи математического моделирования в биологии. Исследование модифицированной модели Лотки-Вольтерра типа конкуренция хищника за жертву. Проведение линеаризации исходной системы. Решение системы нелинейных дифференциальных уравнений.

    контрольная работа [239,6 K], добавлен 20.04.2016

  • Подходы к оценке кредитного риска: недостатки методик Базеля II. Модели оценки: качество и прозрачность методик, структура данных. Скоринговые методики, кластерный и дискриминантный анализ, нейронные сети и дерево классификаций, data mining и регрессии.

    курсовая работа [3,3 M], добавлен 21.08.2008

  • Геометрический, кинематический и силовой анализ механизма навески трактора Т150К. Использование плоской математической модели механизма. Расчет на устойчивость мобильного сельскохозяйственного агрегата. Определение координат характерных точек механизма.

    курсовая работа [547,1 K], добавлен 22.12.2015

  • Составление математической модели для предприятия, характеризующей выручку предприятия "АВС" в зависимости от капиталовложений (млн. руб.) за последние 10 лет. Расчет поля корреляции, параметров линейной регрессии. Сводная таблица расчетов и вычислений.

    курсовая работа [862,4 K], добавлен 06.05.2009

  • Основные правила расчета значений дифференциального уравнения. Изучение выполнения оценки погрешности вычислений, осуществления аппроксимации решений. Разработка алгоритма и написание соответствующей программы. Построение интерполяционного многочлена.

    курсовая работа [212,6 K], добавлен 11.12.2013

  • Основные понятия теории течения жидкости. Создание математической модели распределения температурного поля в вязкой жидкости. Разработка цифровой модели изменения поля температуры в зависимости от: теплопроводности жидкости и металла, граничных условий.

    дипломная работа [4,0 M], добавлен 03.07.2014

  • Деятельность при решении задач складывается из умственных действий и осуществляется эффективно, если первоначально она происходит на основе внешних действий с предметами. Главная проблема - дети не могут перейти от текста задачи к математической модели.

    дипломная работа [79,2 K], добавлен 24.06.2008

  • Усвоение знаний, умений и навыков. Понятие и сущность знаний. Сущность умений и навыков. Проверка и учет знаний, умений и навыков учащихся по математике в начальных классах. Роль и функции проверки. Способы проверки и учета знаний, умений по математике.

    курсовая работа [77,5 K], добавлен 09.10.2008

  • Алгоритм построения ранговой оценки неизвестных параметров регрессии. Моделирование регрессионных зависимостей с погрешностями, имеющими распределения с "тяжёлыми" хвостами. Вычисление асимптотической относительной эффективности рангового метода.

    курсовая работа [1,2 M], добавлен 05.01.2015

  • Решение дифференциальных уравнений математической модели системы с гасителем и без гасителя. Статический расчет виброизоляции. Определение собственных частот системы, построение амплитудно-частотных характеристик и зависимости перемещений от времени.

    контрольная работа [1,6 M], добавлен 22.12.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.