Инвариантные модели предсказательного метамоделирования

Основные методы формализации определенного типа знаний из предметной области на основе инвариантных моделей и интеграции этих знаний в процесс конструирования метамодели. Задача восстановления неизвестной зависимости. Аппроксимация инвариантной модели.

Рубрика Математика
Вид статья
Язык русский
Дата добавления 18.01.2018
Размер файла 24,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Инвариантные модели предсказательного метамоделирования

А.В. Бернштейн

Институт Системного Анализа РАН, Москва

Е.В. Бурнаев

Институт Проблем Передачи Информации им. А.А. Харкевича, РАН, Москва

В настоящей работе предлагаются методы формализации определенного типа знаний из предметной области на основе инвариантных моделей и интеграции этих знаний в процесс конструирования метамодели.

Введение

Методы построения метамоделей обычно основаны на решении классической задачи анализа данных - задачи восстановления неизвестной зависимости на основе имеющихся наблюдений (построение аппроксимации неизвестной функции, построение регрессионной зависимости). Применяемые при построении метамодели процедуры анализа данных имеют ряд особенностей, которые отличают их от классических постановок задач анализа данных. Эти особенности связаны как со спецификой предметных областей, так и с необходимостью взаимосвязанного решения нескольких задач анализа данных, когда выходные данные одной частной задачи являются входными данными для другой задачи, и целевые функции для частных задач нельзя определить независимо. При этом очевидно, что учет знаний из предметной области в процессе построение метамодели позволяет получить метамодель лучшего качества.

В настоящей работе предлагаются методы формализации определенного типа знаний из предметной области и интеграции этих знаний в процесс конструирования метамодели. В частности, предложено два новых подхода для построения метамодели, которые учитывают инвариантность рассматриваемой задачи. В первом подходе принимается инвариантность задачи относительно некоторой конечной группы преобразований. Во втором подходе принимается во внимание, что выход аппроксимируемой зависимости имеет аддитивную структуру относительно заданных групп компонент входного вектора.

Применение предложенных подходов к реальным задачам позволило существенно сократить ошибку построения метамоделей в ситуации, когда моделируемая система обладает свойствами симметрии/инвариантности.

1. Задача восстановления неизвестной зависимости

инвариантный модель зависимость знание

1.1 Постановка задачи аппроксимации

Задача аппроксимации как элемент построения по данным метамодели сформулирована в докладе [Kuleshovetal, 2009]. Пусть M - некоторая исходная модель (метод), позволяющая для заданных входных данных X XRp строить функцию отклика - вычислять значение характеристики Y = FM(X) Rq.

Пусть DN = {(Xi, Yi = FM(Xi)), i = 1, 2, … , N} - результаты N экспериментов с моделью M для множества входных данных XN = {Xi, i = 1, 2, … , N}, по которым строится аппроксимация Y = FSM(X) = FSM(XDN) для исходной зависимости Y = FM(X). Если для всех X X (не только для X XN) имеет место приближенное равенство FSM(X) FM(X), то модель SM, определяемая построенной зависимостью FSM(X), может рассматриваться как заменитель (Surrogate) для исходной модели M и является суррогатной моделью (метамоделью).

Качество построенной аппроксимации определяется средней ошибкой аппроксимации (FSMDN) = (N-1iYi-FSM(Xi)2)1/2 на обучающем множестве DN, но при этом построенная зависимость должна обладать «обобщающей способностью», то есть обеспечивать требуемую точность и для других точек X X \ XN.

1.2 Примеры знаний из предметной области

Во многих прикладных проблемах наряду с данными DN может также иметься дополнительная априорная информация о неизвестной функции FM(X), выражающаяся определенными знаниями и/или моделями предметной области.

Зачастую эти знания и модели предметной области можно описать некоторым подмножеством (многообразием) Xknowledge Xво входном пространстве признаков, таким, что исходная задача построения метамодели FSM(X) для X Xможет быть сведена к задаче построения метамодели FSM(X) для X Xknowledge. Обычно подмножество Xknowledge имеет значительно меньшую внутреннюю размерность и/или какие-то другие специальные свойства, использование которых позволяет значительно увеличить эффективность метамодели.

Пример 1 [Burnaevetal., 2009]. В модели M = Mstress расчета с помощью метода конечных элементов характеристики прочности стрингера самолета Y = FM(X) как функции от геометрической формы стрингера, свойств материала и прилагаемых сил, среди входных данных (p-мерного вектора X = (x1, x2, x3, … , xp)) присутствуют ширина и длина прямоугольной поверхности стрингера (скажем, компоненты x1 и длина x2вектора x). Тогда функция FM(X) обладает свойством симметрии, а именно, FM(x1, x2, x3, … , xp) FM(x2, x1, x3, … , xp).

Пример 2. Пусть имеется m > 1 источников излучения I1, I2, … , Im, и j_й источник характеризуется векторным p-мерным параметром xj, j = 1, 2, … , m. Пусть в заданной точке измерения j-й источник создает поле, характеризуемое величиной yj = f(xj), j = 1, 2, … , m, и измеряется результирующее поле Y = F(X), зависящее от (pm)-мерного вектора X = (x1, x2, …, xm). Если результирующее поле Y равно сумме полей от каждого источника, то функция F(X) имеет вид

F(X) = F(x1, x2, … ,xm) = f(x1) + f(x2) + … + f(xm). (1.1)

1.3 Формализованное описание знаний из предметной области

В общем виде, априорная информация из Примера 1 об аппроксимируемой функции F(x) может быть сформулирована следующим образом. Известна группа G = {g} преобразований множества входных векторов XRp в себя, состоящая из конечного числа G элементов. Пусть аппроксимируемая функция FM(X) инвариантна относительно группы преобразований G:

F(X) F(gX), X X, gG. (1.2)

В Примере 1 группа G преобразований Rp в себя состоит из двух элементов {g, e}, где gX = (x2, x1, x3, … , xp) Rp, а e = g2 - тождественное преобразование. Очевидно, группа G изоморфна группе перестановок S2 перестановок двух элементов.

Будем называть исходную модель, для которой верно соотношение (1.1) или соотношение (1.2), моделью с аддитивной структурой, или, соответственно, инвариантной (относительно группы преобразований G) моделью.

Другие примеры формализации и использования знаний и моделей предметной области см. в [Chernovaetal., 2009].

2. Аппроксимация инвариантной модели

Рассмотрим сформулированную выше задачу построения по выборке DN аппроксимации для исходной модели Y = F(X), удовлетворяющей свойству инвариантности (1.2) относительно группы преобразований G.

Очевидно, что для рассматриваемой задачи для построения аппроксиматора можно использовать расширенную выборку DN,G, DN,G = {DN(g), gG}, состоящую из NG элементов, где выборка DN(g) состоит из элементов

DN(g) = {(Xi, Yi = F(gXi)), i = 1, 2, …, N}.

Пусть FS(x) произвольный исходный аппроксиматор со средней ошибкой

(FSDN,G)) = ((NG)-1igGYi - FS(gXi)2)1/2,

вычисленной по расширенной выборке DN,G. Имеет место соотношение:

2(FSDN,G) = 2(ESGDN) + 2(ES, G, DN), (2.1)

где FSG(X) = G-1gGFS(gX) есть «симметризованный» аппроксиматор, а2(ES, G, DN) = N-1iVG(Xi), здесь

VG(X)=G-1gG(FS(gX))2-FSG(X))2=G-1gG(FS(gX))2 - (FSG(X))2.

Величины FSG(X) и VG(X) могут рассматриваться как математическое ожидание EG(FS(gX)) и, соответственно, дисперсия VarG(FS(gX)) случайной величины FS(gX), в которой элемент g выбирается в группе G случайным равновероятным образом. Соответственно, ошибку (FSDN,G) также можно представить в виде математического ожидания случайной ошибки (FSDN(g)) = EG((FSDN(g)).

Из соотношения (2.1) следует, что исходный аппроксиматор FS(X) строго мажорируется его инвариантной версией FSG(X), если только аппроксиматор FS(X) не инвариантен относительно группы G (по крайней мере, на множестве XN, в этом случае FS(X) и FSG(X) совпадают).

Многие используемые на практике процедуры построения нелинейных аппроксиматоров (Multidimensionalnon-parametricregression, Kernelrid geregression, Support Vector Regression, Artificial Neural Networks, Radial Basic Functions, etc.) строят аппроксимационные зависимости в виде линейных комбинаций jjh(X, j) функций из выбранного «словаря» [Bernsteinetal., 2008]. Если аппроксиматор FS(X) имел указанный вид, то инвариантный аппроксиматор также равен линейной комбинации jjHG(X, j) из словаря, состоящего из симметризованных функций HG(x, ) = EG(h(x, )).

3. Аппроксимация модели с аддитивной структурой

Пусть вектор X = (x1:x2: … :xm) Rpm представлен в виде на m записанных последовательно подвекторов {x1, x2, … , xm} одинаковой размерности p. Из свойства аддитивности (1.1) следует, что для x Rp

f(x) = F(x:x: ... :x)/m,

и, следовательно,

F(X) = F(x1:x2: ... :xm) = (?{i=1,...,m}F(xi:xi: ... :xi))/m.

Очевидно, что модели с аддитивной структурой являются инвариантными относительно группы Gm преобразований Rpm в себя, изоморфной группе перестановок Sm порядка m: если g = (i1, i2, … , im) - перестановка чисел (1, 2, … , m), то gX = (xi1:xi2: ... :xim).

Пусть FS(X) произвольный исходный аппроксиматор, и

FSL(X) = FSL(x1:x2: ... :xm) = (?{i=1,...,m}FS(xi:xi: ... :xi))/m.

его «аддитивированная» версия. Очевидно, что аппроксиматор FSL(X) инвариантен относительно группы Gm.

Если аппроксиматор FS(X) имел вид j(j h(X, j)) j(j h((x1:x2: … :xm), j)), то аппроксиматор FSL(X) имеет вид j(j{i=1,...,m}HL(xi, j)), где HL(x, ) = h((x:x: … :x), ))/m.

4. Результаты вычислительных экспериментов

Для анализа эффективности предложенных процедур были проведены вычислительные эксперименты.

В Примере 1 была получена обучающая выборка Dtrain, состоящая из Ntrain = 50000 результатов экспериментов с моделью Mstress, по которой были построены аппроксиматорFS(X), предложенный в [Bernsteinetal., 2008], и его инвариантная версия FSG(X). По новой тестовой выборке Dtest, состоящей из Ntest = 100000 результатов других независимых экспериментов, вычислены средние ошибки (ESDtest) и (ESGDtest) аппроксиматоровFS(X) и FSG(X), которые приведены в Таблице 1.

Рассмотрим для Примера 2 несколько обучающих выборок Dtrain,k, k = 1, 2, 3, 4, состоящих из одинакового количества Ntrain = 10 000 результатов измерений результирующего поля, полученного от m = 2 источников излучения. В k -й серии измерений множества Xtrain,1 и Xtrain,2 p = 7-мерных значений характеристик x1 и x2 источников I1 и I2 выбирались случайно в множествах XkRp, k = 1, 2, 3, 4, различающихся разбросом мест положения источников и частотных характеристик излучения. По выборке экспериментов с моделью Mstress, по которой построены аппроксиматорыFS,k(X), предложенные в [Bernstein et al., 2008], и их инвариантные FSG,k(X) и аддитивированныеFSL,k(X) версии, k = 1, 2, 3, 4.

Табл. 1. Ошибки (ESDtest) и (ESGDtest) для FS(X) и FSG(X)

(ESDtest)

(ESGDtest)

4.411E-03

3.575E-03

По новым тестовым выборкам Dtest,k, состоящим из Ntest = 50 000 других независимых экспериментов, в которых характеристики источников также выбирались случайно в множествах XkRp, вычислены средние ошибки (ES,kDtest,k), (ESG,kDtest,k) и (ESL,kDtest,k) аппроксиматоровFS,k(X), FSG,k(X) и ESG,k, k = 1, 2, 3, 4, нормированные (по отношению к размахам тестовых выборок) значения которых приведены в Таблице 2.

Приведенные результаты убедительно демонстрируют эффективность использования в суррогатных моделях знаний предметной области.

Табл. 2. Значения ошибок (ES,kDtest,k), (ESG,kDtest,k) и (ESL,kDtest,k) для аппроксиматоровFS,k(X), FSG,k(X) и ESG,k, k = 1, 2, 3, 4

k

(ES,kDtest,k)

(ESG,kDtest,k)

(ESL,kDtest,k)

1

0.0263

0.0099

0.0037

2

0.0421

0.0171

0.0052

3

0.0446

0.0209

0.0075

4

0.0510

0.0294

0.0098

Выводы

Учет знаний и моделей предметной области позволяет строить более точные метамодели. Знания и модели предметной области могут быть представлены в виде специального многообразия, обладающего специфическими свойствами.

В работе разобраны методы формализации знаний предметной области, описывающих свойства симметрии/инвариантности моделируемой системы. Предложены способы учета этих формализованных знаний при построении метамодели.

Использование свойств симметрии/инвариантности системы, порождающей данные, в статистических процедурах уже было описано, например, в [Eaton, 1989]. Однако, методы учета свойств симметрии/инвариантности системы в задаче построения метамодели, по всей видимости, описаны в литературе впервые.

Список литературы

1. Bernstein et al., 2008 Bernstein A., Burnaev E. andKuleshov A. On a methodology for constructing approximations of multidimensional dependences // Proc. 4th International Conference “Parallel Computations and Control”, Moscow. 2008.

2. Burnaev et al., 2009 Burnaev E. and Grihon S. Construction of the Metamodeles in Support of Stiffened Panel Optimization // Proc. VIInternationalConference“Mathematical Methods in Reliability. Theory.Methods. Applications” (MMR-2009), Moscow. 2009.

3. Chernova et al., 2009 Chernova S., Ivanova E. Reduction of complex geometrical object dimension in the presence of particular parametric models // Artificial Intelligence and Decision Making. 2009. № 3.

4. Eaton, 1989 Eaton M. Group Invariance Applications in Statistics.Inst. of Math.Stat., 1989.

5. Kuleshov et al., 2009 Kuleshov A. and BernsteinA. Cognitive technologies in adaptive models of complex plants // Proc. 13th IFAC Symposium on Information Control Problems in Manufacturing (INCOM'09), Moscow. 2009.

Размещено на Allbest.ur

...

Подобные документы

  • Усвоение знаний, умений и навыков. Понятие и сущность знаний. Сущность умений и навыков. Проверка и учет знаний, умений и навыков учащихся по математике в начальных классах. Роль и функции проверки. Способы проверки и учета знаний, умений по математике.

    курсовая работа [77,5 K], добавлен 09.10.2008

  • Описание подходов к построению динамической модели технологического процесса, этапы и направления данного процесса, ее конкретное представление. Аппроксимация заданных уравнений и оценка полученных результатов, решение и математическое значение.

    контрольная работа [92,9 K], добавлен 11.03.2015

  • Процесс выбора или построения модели для исследования определенных свойств оригинала в определенных условиях. Стадии процесса моделирования. Математические модели и их виды. Адекватность математических моделей. Рассогласование между оригиналом и моделью.

    контрольная работа [69,9 K], добавлен 09.10.2016

  • Оценка надежности аналитической методики. Дисперсионный анализ результатов опытов и аппроксимация результатов эксперимента. Расчет линейного уравнения связи. Определение полного квадратного уравнения. Вычисление типа и объема химического реактора.

    курсовая работа [229,2 K], добавлен 06.01.2015

  • Обзор применения аппарата разностных уравнений в экономической сфере. Построение моделей динамики выпуска продукции фирмы на основе линейных разностных уравнений второго порядка. Анализ модели рынка с запаздыванием сбыта, динамической модели Леонтьева.

    практическая работа [129,1 K], добавлен 11.01.2012

  • Моделирование непрерывной системы контроля на основе матричной модели объекта наблюдения. Нахождение передаточной функции формирующего фильтра входного процесса. Построение графика зависимости координаты и скорости от времени, фазовой траектории системы.

    курсовая работа [1,5 M], добавлен 25.12.2013

  • Анализ динамических процессов в системе на основе использования построенной аналитической модели. Моделирование с использованием пакета расширения Symbolic Math Tolbox. Построение модели в виде системы дифференциальных уравнений, записанных в форме Коши.

    курсовая работа [863,4 K], добавлен 21.06.2015

  • Изучение некоторых полугрупп, возникающих в статистических вычислениях, их основные свойства. Использование в статистике инвариантной меры, определение общего вида полухарактеров и характеров двух полугрупп, использующихся в анализе на полумодулях.

    курсовая работа [188,6 K], добавлен 08.01.2013

  • Вводные понятия. Классификация моделей. Классификация объектов (систем) по их способности использовать информацию. Этапы создания модели. Понятие о жизненном цикле систем. Модели прогнозирования.

    реферат [36,6 K], добавлен 13.12.2003

  • Аппроксимация функции y = f(x) линейной функцией y = a1 + a2x. Логарифмирование заданных значений. Расчет коэффициентов корреляции и детерминированности. Построение графика зависимости и линии тренда. Числовые характеристики коэффициентов уравнения.

    курсовая работа [954,7 K], добавлен 10.01.2015

  • Алгоритм проведения регрессионного анализа для создания адекватной модели, прогнозирующей цены на бензин на будущий период. Основы разработки программного обеспечения, позволяющего автоматизировать исследования операций в заданной предметной области.

    контрольная работа [182,0 K], добавлен 06.02.2013

  • Создание математической модели движения шарика, подброшенного вертикально вверх, от начала падения до удара о землю. Компьютерная реализация математической модели в среде электронных таблиц. Определение влияния изменения скорости на дальность падения.

    контрольная работа [1,7 M], добавлен 09.03.2016

  • История зарождения и создания линейного программирования. Транспортная задача. Общая постановка, цели, задачи. Основные типы, виды моделей. Методы составления начального опорного плана. Понятие потенциала и цикла. Задача, двойственная к транспортной.

    курсовая работа [166,7 K], добавлен 17.07.2002

  • Основные положения теории принятия решений, разработанной на основе математических методов и формальной логики, классификация управленческих решений. Некорректно поставленные задачи и регуляризирующие (робастные) алгоритмы: адаптивные, инвариантные.

    курсовая работа [1,1 M], добавлен 23.11.2010

  • Основные понятия теории течения жидкости. Создание математической модели распределения температурного поля в вязкой жидкости. Разработка цифровой модели изменения поля температуры в зависимости от: теплопроводности жидкости и металла, граничных условий.

    дипломная работа [4,0 M], добавлен 03.07.2014

  • Задача численного интегрирования функций. Вычисление приближенного значения определенного интеграла. Нахождение определенного интеграла методами прямоугольников, средних прямоугольников, трапеций. Погрешность формул и сравнение методов по точности.

    методичка [327,4 K], добавлен 01.07.2009

  • Построение модели множественной регрессии теоретических значений динамики ВВП, определение средней ошибки аппроксимации. Выбор фактора, оказывающего большее влияние. Построение парных моделей регрессии. Определение лучшей модели. Проверка предпосылок МНК.

    курсовая работа [352,9 K], добавлен 26.01.2010

  • Уравнения и способы их решения методом подбора переменных, на основе соотношения между частью и целым, зависимости между компонентами действий, знаний смысла умножения, приема с весами. Развитие познавательного интереса к математике в начальной школе.

    курсовая работа [591,0 K], добавлен 24.10.2014

  • Методы определения объемов выпуска изделий каждой модели, при которых прибыль будет максимальна Составление математической модели задачи целочисленного программирования. Решение задачи симплекс-методом. Поиск целочисленного решения методом отсечения.

    контрольная работа [156,9 K], добавлен 30.01.2011

  • Основные модели естествознания, подходы к исследованию явлений природы, её фундаментальных законов на основе математического анализа. Динамические системы, автономные дифференциальные уравнения, интегро-дифференциальные уравнения, законы термодинамики.

    курс лекций [1,1 M], добавлен 02.03.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.