Подготовка данных для построения нейросетевых моделей при малом количестве экспериментов

Методика статистического моделирования данных для обучения нейронных сетей с целью прогнозирования прочностных свойств волокнисто-пористых биокомпозитов. Количество данных, необходимое для обучения и тестирования сети. Эмпирическая линейная регрессия.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 27.04.2017
Размер файла 581,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Подготовка данных для построения нейросетевых моделей при малом количестве экспериментов

Соколовский Алексей Ратмирович

Соколовская Ирина Юрьевна

Аннотации

В статье представлена методика статистического моделирования данных для обучения нейронных сетей с целью прогнозирования прочностных свойств волокнисто-пористых биокомпозитов. Методика апробирована на примерах данных экспериментальных исследований прочности хромовых кож из бычины и эластичных кож

The approach of statistical modeling of data for neural networks training in order to predict strength characteristics for fiber-porous biocomposites is presented. This approach was attested on the examples of test data of the toughness for box-calf and elastic leather

Ключевые слова: обучение нейронной сети, статистический метод, численный эксперимент, прочность

Keywords: Neural networks training, statistical method, numerical experiment, toughness

Одной из основных проблем при создании нейросетевых моделей для анализа экспериментальных данных и дальнейшего использования при прогнозировании является количество данных, необходимое для обучения и тестирования сети. Малое число примеров может вызвать "переобученность" сети [1-3], когда она хорошо функционирует на примерах обучающей выборки, но плохо - на тестовых примерах, подчиненных тому же статистическому распределению. Считается [4,5], что число наблюдений должно быть в десять раз больше числа связей в сети.

При построении нейронных сетевых моделей для прогнозирования прочностных свойств материалов часто сталкиваются с проблемой недостаточности обучающей выборки [6,7]. Если задача получения большего количества данных при пассивном эксперименте связана в основном с временными затратами, то при активном эксперименте - это еще и большие материальные расходы.

Физико-механические свойства материалов имеют четкую вероятностную природу, начиная с атомно-молекулярного уровня и заканчивая уровнем элемента конструкции. Свойства материала оказываются не только различными в разных точках одного и того же элемента конструкции, но они являются различными и при испытании образцов в лабораторных условиях [8,9]. Для волокнисто-пористых биокомпозитов это объясняется наличием неконтролируемых флуктуаций химического состава материала, его композиционной структурой, случайными изменениями параметров технологических процессов и их неустойчивостью. В силу особенностей структуры ориентация пучков коллагеновых волокон носит случайный характер [6], поэтому отмечают преимущественную ориентацию волокон в одном из направлений (в чепрачной части - вдоль хребтовой линии), что на макро-уровне приводит к проявлению анизотропных свойств. В результате такие физико-механические характеристики, как предел прочности, относительное удлинение при разрыве, неупругая деформация приобретают ярко выраженный стохастический характер.

На предприятиях производства кожи и меха лабораторией технического контроля осуществляется инструментальный контроль физико-механических свойств кожевой ткани выборочно по партии, которые комплектуются по виду исходного сырья и другим параметрам. Прочностные свойства определяются в среднем при разрыве образцов в продольном и поперечном направлении хребтовой линии (сопротивление разрыву, сопротивление разрыву по лицу, предельные удлинения) [10] из стандартных участков кож, взятых случайным образом из партии. Количество данных, полученных за несколько лет измерений обычно достаточно для построения нейросетевой модели, но, так как в плоскости листа материал проявляет ортотропные свойства, для построения поверхности прочности необходимы дополнительные данные по прочностным показателям, как минимум, в направлении 450 к хребтовой линии кож [11,12].

На основании вышеизложенного стоит задача дополнения экспериментальных данных за счет статистического моделирования.

При моделировании экспериментальных данных, отражающих макро-неоднородности материала, необходимо исходить из того, что причиной их рассеяния могут являться два фактора: свойства материала (неоднородность, вариации химического состава) и методики испытаний (погрешность изготовления образцов и измерений деформаций или приложенной нагрузки и т.д.). Таким образом, предполагаем, что предельные состояния образцов являются аддитивными составляющими двух случайных функций:

, (1)

где М[] = 0 и (М[*] - оператор математического ожидания).

В связи с этим может рассматриваться как шум, порождающийся второй группой факторов и наложенный на случайную функцию , отражающую стабильные случайные свойства материала. Так как роль сводится к созданию незначительных флуктуаций около каждой из реализаций , то при создании статистической модели данных в явном виде может быть опущена.

При построении стохастической модели данных по предельным напряжениям и предельным деформациям волокнисто-пористого биокомпозита необходимо:

- иметь экспериментальные данные по предельным напряжениям и предельным деформациям в направлениях: преимущественной ориентации пучков коллагеновых волокон, под углом 900 и 450 к этому направлению;

- установить вид законов распределения случайных значений модели;

- установить корреляционную зависимость между предельным напряжениями и (или) предельным деформациям в направлении преимущественной ориентации пучков коллагеновых волокон и ориентированных под углом 900 и 450 к этому направлению.

Предположим, что величины: - предел прочности при нагружении в направлении преимущественной ориентации волокон; - предел прочности при нагружении в направлении 900 к преимущественной ориентации волокон; - предел прочности при нагружении в направлении 450 к преимущественной ориентации волокон имеют случайный характер. В тоже время их значения связаны между собой регрессионной зависимостью.

Обозначая через F(X) любую из перечисленных величин, можем записать [13]:

, (2)

где n - нормированная случайная величина, ,

M[*] и S[*] - соответственно операторы математического ожидания и среднеквадратического отклонения (, D[*] - оператор дисперсии). Преобразуем (2) к виду

. (3)

Очевидно, что при

(4)

соотношение (3) преобразуется к виду

, (5)

где .

Определяя коэффициенты эмпирической линейной регрессии () на [14]:

, (6)

, (7)

где и - средние выборочные и и ;

, ,

и - коэффициенты корреляции,

получим зависимость этих величин от значений предельных напряжений в направлении преимущественной ориентации волокон. Из (6) учетом (5) получаем модельные значения для обучения нейронной сети. Вместо линейной зависимости в (6) и (7) может быть использована и нелинейная корреляционная зависимость.

Алгоритм моделирования статистических данных состоит в следующем. На основании данных экспериментов проверяется гипотеза корреляционной зависимости данных и определяется уравнение регрессии. С учетом функциональной зависимости в средних значениях, соотношения (4) и генерации случайных величин n (5), распределенных по нормальному закону, получаем набор данных. нейронный сеть волокнистый

Экспериментальная проверка условия (4) и моделирования статистических данных была выполнена на основании экспериментальных данных по определению предела прочности бычины хромового дубления и эластичных кож. Данные получены на ЗАО "КОРС", отбор производился по отдельным кожам, взятых случайным образом по три из партии. Из каждой кожи отбиралось по три образца направлением ориентации вдоль, поперек и под углом 450 к хребтовой линии, усредненные значения по образцам использовались при дальнейшей обработке и моделировании.

В таблице 1 представлены данные по корреляции значений предельных напряжений для различных кож (рисунки 1, 2).

Таблица 1 Значение коэффициентов корреляции

Материал

бычина

1

0,977

0,775

0,977

1

-

0,775

-

1

эластичные кожи

1

0,823

0,543

0,823

1

-

0,543

-

1

полукожник

1

0,995

0,947

0,995

1

-

0,947

-

1

а)

б)

Рисунок 1 Регрессионные зависимости значений предельных напряжений для бычины: а) и - предельные напряжения соответственно вдоль и поперек хребтовой линии, МПа; б) и - предельные напряжения соответственно вдоль и под 450 к хребтовой линии, МПа

Как видно из таблицы значения коррелированны между собой, что позволяет найти функциональные зависимости в средних значениях.

Рисунок 2 Регрессионные зависимости значений предельных напряжений для эластичных кож: а) и - предельные напряжения соответственно вдоль и поперек хребтовой линии, МПа; б) и - предельные напряжения соответственно вдоль и под 450 к хребтовой линии, МПа

На рисунках 3 и 4 представлены полигоны и функции нормального распределения для значений предельных напряжений образцов.

Рисунок 3. Функции нормального распределения 1 и полигоны 2 для предельных напряжений бычины: и - предельные напряжения соответственно вдоль, поперек и под 450 к хребтовой линии, МПа.

Проверка по критерию Пирсона [13] (Таблица 2) подтвердила высокую степень согласованности статистических и теоретических распределений.

Рисунок 4 Функции нормального распределения 1 и полигоны 2 для предельных напряжений эластичных кож: и - предельные напряжения соответственно вдоль, поперек и под 450 к хребтовой линии, МПа

В соответствии с полученными значениями критерия Пирсона гипотезу о выбранных законах распределения можно считать правдоподобной.

Таблица 2. Значения величин критерия Пирсона

Материал

Направление

Расчетное значение

Критическое значение

Бычина

вдоль хребтовой линии

5,944

5,991

поперек хребтовой линии

1,836

5,991

под 450 к хребтовой линии

1,570

5,991

Эластичные кожи

вдоль хребтовой линии

5,801

5,991

поперек хребтовой линии

4,52

5,991

под 450 к хребтовой линии

1,982

5,991

Полукожник

вдоль хребтовой линии

5,801

5,991

поперек хребтовой линии

4,52

5,991

под 450 к хребтовой линии

1,982

5,991

Таким образом, разработанная методика моделирования статистических данных позволяет дополнить результаты экспериментов до необходимого количества для построения нейронной сети.

Список литературы

1. Хайкин, Саймон Нейронные сети: полный курс /Саймон Хайкин. - М.: "Вильямс", 2006. -1104 с.

2. Нейронные сети. STATISTICA Neural Networks: Методология и технологии современного анализа данных /Под. ред. В.П. Боровикова. 2-е изд., перераб. и доп. -М.: Горячая линия-Телеком, 2008. -392 с..

3. Джейн Анил, К. Введение в искусственные нейронные сети./ Джейн Анил К., Мао Жианчанг, К.М. Моиуддин // Открытые системы - 1997 - №4. - с. 3-24

4. Горбань, А.Н. Обучение нейронных сетей. -М.: Изд. СССР-США СП "ParaGraph", 1990. 160 с. (English Translation: AMSE Transaction, Scientific Siberian, A, 1993, Vol. 6. Neurocomputing, рp.1-134).

5. Горбань, А.Н. Нейронные сети на персональном компьютере.// А.Н. Горбань, Д.А. Россиев. -Новосибирск: Наука, 1996. 276 с.

6. Соколовский А.Р. Прогнозирование прочности волокнисто-пористых биокомпозитов с использованием нейронных сетей (монография) / А.Р. Соколовский - М.: МГУДТ. 2010. 92 с. ISBN 978-5-87055-121-0

7. Мунасипов С.Е. Построение поверхности прочности анизотропного пористо-волокнистого биокомпозита с применением нейронных сетей //С.Е. Мунасипов, А.Р. Соколовский, И.Ю. Соколовская / Динамика систем, механизмов и машин. Материалы VII Международной научно-технической конференции -Омск: ОмГТУ, 2009. -Кн. 2. с.384

8. Ломакин, В.А. Статистические задачи механики твердых деформируемых тел. / В.А. Ломакин М.: Наука. 1970. 139 с.

9. Самарин, Ю.П. О применении стохастических уравнений в теории ползучести материалов // Изв. АН СССР. МТТ, 1974. №1. С. 88-94.

10. ГОСТ 938.11-69 Кожа. Метод испытания на растяжение.. -М.: Издательство стандартов. 10 с.

11. Соколовский А.Р. Исследование анизотропии прочностных свойств кож для низа обуви и кожгалантерейных изделий. // А.Р. Соколовский, А.С. Железняков /Обувь: Маркетинг конструирование технология, материалы. Межвузовский сборник научных трудов. -М: МГАЛП, 1999. с.71-74

12. Соколовский А.Р. Влияние технологических операций на прочность волокнисто-пористого биокомпозита / А.Р. Соколовский // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2010. - №61(09). - Режим доступа: http://ej.kubagro.ru/2010/07/pdf/07.pdf

13. Вентцель, Е.С. Теория вероятностей. М.: Наука. 1969. 576 с.

14. Корн, Г.Справочник по математике для научных работников и инженеров / Г. Корн, Т. Корн - М: Наука. - 1984. - 831 с.

Размещено на Allbest.ru

...

Подобные документы

  • Алгоритмы кластеризации данных, отбора факторов, построения множественной линейной регрессии, оценки параметров процесса на скользящем постоянном интервале. Решение задач анализа данных на нейронных сетях и результаты моделирования нелинейных функций.

    контрольная работа [1,5 M], добавлен 11.01.2016

  • Анализ применения нейронных сетей для прогнозирования ситуации и принятия решений на фондовом рынке с помощью программного пакета моделирования нейронных сетей Trajan 3.0. Преобразование первичных данных, таблиц. Эргономическая оценка программы.

    дипломная работа [3,8 M], добавлен 27.06.2011

  • Общие сведения о принципах построения нейронных сетей. Искусственные нейронные системы. Математическая модель нейрона. Классификация нейронных сетей. Правила обучения Хэбба, Розенблатта и Видроу-Хоффа. Алгоритм обратного распространения ошибки.

    дипломная работа [814,6 K], добавлен 29.09.2014

  • Сущность и понятие кластеризации, ее цель, задачи, алгоритмы; использование искусственных нейронных сетей для кластеризации данных. Сеть Кохонена, самоорганизующиеся нейронные сети: структура, архитектура; моделирование кластеризации данных в MATLAB NNT.

    дипломная работа [3,1 M], добавлен 21.03.2011

  • Выбор публичных показателей для построения, обучения и тестирования модели нейронной сети, которая будет использована в основе информационной системы прогнозирования банкротства банков. Обзор моделей прогнозирования банкротства кредитных организаций.

    дипломная работа [1,2 M], добавлен 30.06.2017

  • Искусственные нейронные сети как одна из широко известных и используемых моделей машинного обучения. Знакомство с особенностями разработки системы распознавания изображений на основе аппарата искусственных нейронных сетей. Анализ типов машинного обучения.

    дипломная работа [1,8 M], добавлен 08.02.2017

  • Диагностический анализ изучения алгоритмов обучения нейронных сетей "с учителем". Сбор входных и выходных переменных для наблюдений и понятие пре/пост процессирования. Подготовка и обобщение многослойного персептрона, модель обратного распространения.

    курсовая работа [249,3 K], добавлен 22.06.2011

  • Понятие искусственного нейрона и искусственных нейронных сетей. Сущность процесса обучения нейронной сети и аппроксимации функции. Смысл алгоритма обучения с учителем. Построение и обучение нейронной сети для аппроксимации функции в среде Matlab.

    лабораторная работа [1,1 M], добавлен 05.10.2010

  • Архитектура и топологии IP-сетей, принципы и этапы их построения. Основное оборудование корпоративных IP сетей магистрального и локального уровней. Маршрутизация и масштабируемость в объединенных сетях. Анализ моделей проектирования кампусных сетей.

    дипломная работа [2,0 M], добавлен 10.03.2013

  • Обзор существующих решений на основе открытых данных. Технологии обработки данных и методы их визуализации. Социальные сети для извлечения данных. Ограничение географической локации. Выбор набора и формат хранения открытых данных, архитектура системы.

    курсовая работа [129,5 K], добавлен 09.06.2017

  • Характеристика моделей обучения. Общие сведения о нейроне. Искусственные нейронные сети, персептрон. Проблема XOR и пути ее решения. Нейронные сети обратного распространения. Подготовка входных и выходных данных. Нейронные сети Хопфилда и Хэмминга.

    контрольная работа [1,4 M], добавлен 28.01.2011

  • Возможности программ моделирования нейронных сетей. Виды нейросетей: персептроны, сети Кохонена, сети радиальных базисных функций. Генетический алгоритм, его применение для оптимизации нейросетей. Система моделирования нейронных сетей Trajan 2.0.

    дипломная работа [2,3 M], добавлен 13.10.2015

  • Классификация моделей построения баз данных. Работа с реляционными базами данных: нормализация таблиц, преобразование отношений полей, преобразование функциональной модели в реляционную. Понятие языка определения данных и языка манипуляции данными.

    реферат [123,0 K], добавлен 22.06.2011

  • Классификация компьютерных сетей. Назначение компьютерной сети. Основные виды вычислительных сетей. Локальная и глобальная вычислительные сети. Способы построения сетей. Одноранговые сети. Проводные и беспроводные каналы. Протоколы передачи данных.

    курсовая работа [36,0 K], добавлен 18.10.2008

  • Прогнозирование на фондовом рынке с помощью нейронных сетей. Описание типа нейронной сети. Определение входных данных и их обработка. Архитектура нейронной сети. Точность результата. Моделирование торговли. Нейронная сеть прямого распространения сигнала.

    дипломная работа [2,7 M], добавлен 18.02.2017

  • Изучение принципа работы интернет-аукциона (на примере сайта molotok.ru). Способ получения информации с веб-ресурсов. Разработка программного обеспечения с целью создания исходных данных для обучения нейронных сетей и классификации товаров с их помощью.

    дипломная работа [2,0 M], добавлен 29.06.2012

  • Понятие о нейронных сетях и параллели из биологии. Базовая искусственная модель, свойства и применение сетей. Классификация, структура и принципы работы, сбор данных для сети. Использование пакета ST Neural Networks для распознавания значимых переменных.

    реферат [435,1 K], добавлен 16.02.2015

  • Проектирование программного обеспечения. Построение начальной контекстной диаграммы и концептуальной моделей данных. Диаграммы потоков данных и системных процессов нулевого уровня и последовательности экранных форм. Описание накопителей данных.

    курсовая работа [1,4 M], добавлен 07.03.2013

  • Технология построения сетей передачи данных. Правила алгоритма CSMA/CD для передающей станции. Анализ существующей сети передачи данных предприятия "Минские тепловые сети". Построение сети на основе технологии Fast Ethernet для административного здания.

    дипломная работа [2,5 M], добавлен 15.02.2013

  • Рост активности в области теории и технической реализации искусственных нейронных сетей. Основные архитектуры нейронных сетей, их общие и функциональные свойства и наиболее распространенные алгоритмы обучения. Решение проблемы мертвых нейронов.

    реферат [347,6 K], добавлен 17.12.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.