Подготовка данных для построения нейросетевых моделей при малом количестве экспериментов
Методика статистического моделирования данных для обучения нейронных сетей с целью прогнозирования прочностных свойств волокнисто-пористых биокомпозитов. Количество данных, необходимое для обучения и тестирования сети. Эмпирическая линейная регрессия.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 27.04.2017 |
Размер файла | 581,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Подготовка данных для построения нейросетевых моделей при малом количестве экспериментов
Соколовский Алексей Ратмирович
Соколовская Ирина Юрьевна
Аннотации
В статье представлена методика статистического моделирования данных для обучения нейронных сетей с целью прогнозирования прочностных свойств волокнисто-пористых биокомпозитов. Методика апробирована на примерах данных экспериментальных исследований прочности хромовых кож из бычины и эластичных кож
The approach of statistical modeling of data for neural networks training in order to predict strength characteristics for fiber-porous biocomposites is presented. This approach was attested on the examples of test data of the toughness for box-calf and elastic leather
Ключевые слова: обучение нейронной сети, статистический метод, численный эксперимент, прочность
Keywords: Neural networks training, statistical method, numerical experiment, toughness
Одной из основных проблем при создании нейросетевых моделей для анализа экспериментальных данных и дальнейшего использования при прогнозировании является количество данных, необходимое для обучения и тестирования сети. Малое число примеров может вызвать "переобученность" сети [1-3], когда она хорошо функционирует на примерах обучающей выборки, но плохо - на тестовых примерах, подчиненных тому же статистическому распределению. Считается [4,5], что число наблюдений должно быть в десять раз больше числа связей в сети.
При построении нейронных сетевых моделей для прогнозирования прочностных свойств материалов часто сталкиваются с проблемой недостаточности обучающей выборки [6,7]. Если задача получения большего количества данных при пассивном эксперименте связана в основном с временными затратами, то при активном эксперименте - это еще и большие материальные расходы.
Физико-механические свойства материалов имеют четкую вероятностную природу, начиная с атомно-молекулярного уровня и заканчивая уровнем элемента конструкции. Свойства материала оказываются не только различными в разных точках одного и того же элемента конструкции, но они являются различными и при испытании образцов в лабораторных условиях [8,9]. Для волокнисто-пористых биокомпозитов это объясняется наличием неконтролируемых флуктуаций химического состава материала, его композиционной структурой, случайными изменениями параметров технологических процессов и их неустойчивостью. В силу особенностей структуры ориентация пучков коллагеновых волокон носит случайный характер [6], поэтому отмечают преимущественную ориентацию волокон в одном из направлений (в чепрачной части - вдоль хребтовой линии), что на макро-уровне приводит к проявлению анизотропных свойств. В результате такие физико-механические характеристики, как предел прочности, относительное удлинение при разрыве, неупругая деформация приобретают ярко выраженный стохастический характер.
На предприятиях производства кожи и меха лабораторией технического контроля осуществляется инструментальный контроль физико-механических свойств кожевой ткани выборочно по партии, которые комплектуются по виду исходного сырья и другим параметрам. Прочностные свойства определяются в среднем при разрыве образцов в продольном и поперечном направлении хребтовой линии (сопротивление разрыву, сопротивление разрыву по лицу, предельные удлинения) [10] из стандартных участков кож, взятых случайным образом из партии. Количество данных, полученных за несколько лет измерений обычно достаточно для построения нейросетевой модели, но, так как в плоскости листа материал проявляет ортотропные свойства, для построения поверхности прочности необходимы дополнительные данные по прочностным показателям, как минимум, в направлении 450 к хребтовой линии кож [11,12].
На основании вышеизложенного стоит задача дополнения экспериментальных данных за счет статистического моделирования.
При моделировании экспериментальных данных, отражающих макро-неоднородности материала, необходимо исходить из того, что причиной их рассеяния могут являться два фактора: свойства материала (неоднородность, вариации химического состава) и методики испытаний (погрешность изготовления образцов и измерений деформаций или приложенной нагрузки и т.д.). Таким образом, предполагаем, что предельные состояния образцов являются аддитивными составляющими двух случайных функций:
, (1)
где М[] = 0 и (М[*] - оператор математического ожидания).
В связи с этим может рассматриваться как шум, порождающийся второй группой факторов и наложенный на случайную функцию , отражающую стабильные случайные свойства материала. Так как роль сводится к созданию незначительных флуктуаций около каждой из реализаций , то при создании статистической модели данных в явном виде может быть опущена.
При построении стохастической модели данных по предельным напряжениям и предельным деформациям волокнисто-пористого биокомпозита необходимо:
- иметь экспериментальные данные по предельным напряжениям и предельным деформациям в направлениях: преимущественной ориентации пучков коллагеновых волокон, под углом 900 и 450 к этому направлению;
- установить вид законов распределения случайных значений модели;
- установить корреляционную зависимость между предельным напряжениями и (или) предельным деформациям в направлении преимущественной ориентации пучков коллагеновых волокон и ориентированных под углом 900 и 450 к этому направлению.
Предположим, что величины: - предел прочности при нагружении в направлении преимущественной ориентации волокон; - предел прочности при нагружении в направлении 900 к преимущественной ориентации волокон; - предел прочности при нагружении в направлении 450 к преимущественной ориентации волокон имеют случайный характер. В тоже время их значения связаны между собой регрессионной зависимостью.
Обозначая через F(X) любую из перечисленных величин, можем записать [13]:
, (2)
где n - нормированная случайная величина, ,
M[*] и S[*] - соответственно операторы математического ожидания и среднеквадратического отклонения (, D[*] - оператор дисперсии). Преобразуем (2) к виду
. (3)
Очевидно, что при
(4)
соотношение (3) преобразуется к виду
, (5)
где .
Определяя коэффициенты эмпирической линейной регрессии () на [14]:
, (6)
, (7)
где и - средние выборочные и и ;
, ,
и - коэффициенты корреляции,
получим зависимость этих величин от значений предельных напряжений в направлении преимущественной ориентации волокон. Из (6) учетом (5) получаем модельные значения для обучения нейронной сети. Вместо линейной зависимости в (6) и (7) может быть использована и нелинейная корреляционная зависимость.
Алгоритм моделирования статистических данных состоит в следующем. На основании данных экспериментов проверяется гипотеза корреляционной зависимости данных и определяется уравнение регрессии. С учетом функциональной зависимости в средних значениях, соотношения (4) и генерации случайных величин n (5), распределенных по нормальному закону, получаем набор данных. нейронный сеть волокнистый
Экспериментальная проверка условия (4) и моделирования статистических данных была выполнена на основании экспериментальных данных по определению предела прочности бычины хромового дубления и эластичных кож. Данные получены на ЗАО "КОРС", отбор производился по отдельным кожам, взятых случайным образом по три из партии. Из каждой кожи отбиралось по три образца направлением ориентации вдоль, поперек и под углом 450 к хребтовой линии, усредненные значения по образцам использовались при дальнейшей обработке и моделировании.
В таблице 1 представлены данные по корреляции значений предельных напряжений для различных кож (рисунки 1, 2).
Таблица 1 Значение коэффициентов корреляции
Материал |
||||||
бычина |
1 |
0,977 |
0,775 |
|||
0,977 |
1 |
- |
||||
0,775 |
- |
1 |
||||
эластичные кожи |
1 |
0,823 |
0,543 |
|||
0,823 |
1 |
- |
||||
0,543 |
- |
1 |
||||
полукожник |
1 |
0,995 |
0,947 |
|||
0,995 |
1 |
- |
||||
0,947 |
- |
1 |
а)
б)
Рисунок 1 Регрессионные зависимости значений предельных напряжений для бычины: а) и - предельные напряжения соответственно вдоль и поперек хребтовой линии, МПа; б) и - предельные напряжения соответственно вдоль и под 450 к хребтовой линии, МПа
Как видно из таблицы значения коррелированны между собой, что позволяет найти функциональные зависимости в средних значениях.
Рисунок 2 Регрессионные зависимости значений предельных напряжений для эластичных кож: а) и - предельные напряжения соответственно вдоль и поперек хребтовой линии, МПа; б) и - предельные напряжения соответственно вдоль и под 450 к хребтовой линии, МПа
На рисунках 3 и 4 представлены полигоны и функции нормального распределения для значений предельных напряжений образцов.
Рисунок 3. Функции нормального распределения 1 и полигоны 2 для предельных напряжений бычины: и - предельные напряжения соответственно вдоль, поперек и под 450 к хребтовой линии, МПа.
Проверка по критерию Пирсона [13] (Таблица 2) подтвердила высокую степень согласованности статистических и теоретических распределений.
Рисунок 4 Функции нормального распределения 1 и полигоны 2 для предельных напряжений эластичных кож: и - предельные напряжения соответственно вдоль, поперек и под 450 к хребтовой линии, МПа
В соответствии с полученными значениями критерия Пирсона гипотезу о выбранных законах распределения можно считать правдоподобной.
Таблица 2. Значения величин критерия Пирсона
Материал |
Направление |
Расчетное значение |
Критическое значение |
|
Бычина |
вдоль хребтовой линии |
5,944 |
5,991 |
|
поперек хребтовой линии |
1,836 |
5,991 |
||
под 450 к хребтовой линии |
1,570 |
5,991 |
||
Эластичные кожи |
вдоль хребтовой линии |
5,801 |
5,991 |
|
поперек хребтовой линии |
4,52 |
5,991 |
||
под 450 к хребтовой линии |
1,982 |
5,991 |
||
Полукожник |
вдоль хребтовой линии |
5,801 |
5,991 |
|
поперек хребтовой линии |
4,52 |
5,991 |
||
под 450 к хребтовой линии |
1,982 |
5,991 |
Таким образом, разработанная методика моделирования статистических данных позволяет дополнить результаты экспериментов до необходимого количества для построения нейронной сети.
Список литературы
1. Хайкин, Саймон Нейронные сети: полный курс /Саймон Хайкин. - М.: "Вильямс", 2006. -1104 с.
2. Нейронные сети. STATISTICA Neural Networks: Методология и технологии современного анализа данных /Под. ред. В.П. Боровикова. 2-е изд., перераб. и доп. -М.: Горячая линия-Телеком, 2008. -392 с..
3. Джейн Анил, К. Введение в искусственные нейронные сети./ Джейн Анил К., Мао Жианчанг, К.М. Моиуддин // Открытые системы - 1997 - №4. - с. 3-24
4. Горбань, А.Н. Обучение нейронных сетей. -М.: Изд. СССР-США СП "ParaGraph", 1990. 160 с. (English Translation: AMSE Transaction, Scientific Siberian, A, 1993, Vol. 6. Neurocomputing, рp.1-134).
5. Горбань, А.Н. Нейронные сети на персональном компьютере.// А.Н. Горбань, Д.А. Россиев. -Новосибирск: Наука, 1996. 276 с.
6. Соколовский А.Р. Прогнозирование прочности волокнисто-пористых биокомпозитов с использованием нейронных сетей (монография) / А.Р. Соколовский - М.: МГУДТ. 2010. 92 с. ISBN 978-5-87055-121-0
7. Мунасипов С.Е. Построение поверхности прочности анизотропного пористо-волокнистого биокомпозита с применением нейронных сетей //С.Е. Мунасипов, А.Р. Соколовский, И.Ю. Соколовская / Динамика систем, механизмов и машин. Материалы VII Международной научно-технической конференции -Омск: ОмГТУ, 2009. -Кн. 2. с.384
8. Ломакин, В.А. Статистические задачи механики твердых деформируемых тел. / В.А. Ломакин М.: Наука. 1970. 139 с.
9. Самарин, Ю.П. О применении стохастических уравнений в теории ползучести материалов // Изв. АН СССР. МТТ, 1974. №1. С. 88-94.
10. ГОСТ 938.11-69 Кожа. Метод испытания на растяжение.. -М.: Издательство стандартов. 10 с.
11. Соколовский А.Р. Исследование анизотропии прочностных свойств кож для низа обуви и кожгалантерейных изделий. // А.Р. Соколовский, А.С. Железняков /Обувь: Маркетинг конструирование технология, материалы. Межвузовский сборник научных трудов. -М: МГАЛП, 1999. с.71-74
12. Соколовский А.Р. Влияние технологических операций на прочность волокнисто-пористого биокомпозита / А.Р. Соколовский // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2010. - №61(09). - Режим доступа: http://ej.kubagro.ru/2010/07/pdf/07.pdf
13. Вентцель, Е.С. Теория вероятностей. М.: Наука. 1969. 576 с.
14. Корн, Г.Справочник по математике для научных работников и инженеров / Г. Корн, Т. Корн - М: Наука. - 1984. - 831 с.
Размещено на Allbest.ru
...Подобные документы
Алгоритмы кластеризации данных, отбора факторов, построения множественной линейной регрессии, оценки параметров процесса на скользящем постоянном интервале. Решение задач анализа данных на нейронных сетях и результаты моделирования нелинейных функций.
контрольная работа [1,5 M], добавлен 11.01.2016Анализ применения нейронных сетей для прогнозирования ситуации и принятия решений на фондовом рынке с помощью программного пакета моделирования нейронных сетей Trajan 3.0. Преобразование первичных данных, таблиц. Эргономическая оценка программы.
дипломная работа [3,8 M], добавлен 27.06.2011Общие сведения о принципах построения нейронных сетей. Искусственные нейронные системы. Математическая модель нейрона. Классификация нейронных сетей. Правила обучения Хэбба, Розенблатта и Видроу-Хоффа. Алгоритм обратного распространения ошибки.
дипломная работа [814,6 K], добавлен 29.09.2014Сущность и понятие кластеризации, ее цель, задачи, алгоритмы; использование искусственных нейронных сетей для кластеризации данных. Сеть Кохонена, самоорганизующиеся нейронные сети: структура, архитектура; моделирование кластеризации данных в MATLAB NNT.
дипломная работа [3,1 M], добавлен 21.03.2011Выбор публичных показателей для построения, обучения и тестирования модели нейронной сети, которая будет использована в основе информационной системы прогнозирования банкротства банков. Обзор моделей прогнозирования банкротства кредитных организаций.
дипломная работа [1,2 M], добавлен 30.06.2017Искусственные нейронные сети как одна из широко известных и используемых моделей машинного обучения. Знакомство с особенностями разработки системы распознавания изображений на основе аппарата искусственных нейронных сетей. Анализ типов машинного обучения.
дипломная работа [1,8 M], добавлен 08.02.2017Диагностический анализ изучения алгоритмов обучения нейронных сетей "с учителем". Сбор входных и выходных переменных для наблюдений и понятие пре/пост процессирования. Подготовка и обобщение многослойного персептрона, модель обратного распространения.
курсовая работа [249,3 K], добавлен 22.06.2011Понятие искусственного нейрона и искусственных нейронных сетей. Сущность процесса обучения нейронной сети и аппроксимации функции. Смысл алгоритма обучения с учителем. Построение и обучение нейронной сети для аппроксимации функции в среде Matlab.
лабораторная работа [1,1 M], добавлен 05.10.2010Архитектура и топологии IP-сетей, принципы и этапы их построения. Основное оборудование корпоративных IP сетей магистрального и локального уровней. Маршрутизация и масштабируемость в объединенных сетях. Анализ моделей проектирования кампусных сетей.
дипломная работа [2,0 M], добавлен 10.03.2013Обзор существующих решений на основе открытых данных. Технологии обработки данных и методы их визуализации. Социальные сети для извлечения данных. Ограничение географической локации. Выбор набора и формат хранения открытых данных, архитектура системы.
курсовая работа [129,5 K], добавлен 09.06.2017Характеристика моделей обучения. Общие сведения о нейроне. Искусственные нейронные сети, персептрон. Проблема XOR и пути ее решения. Нейронные сети обратного распространения. Подготовка входных и выходных данных. Нейронные сети Хопфилда и Хэмминга.
контрольная работа [1,4 M], добавлен 28.01.2011Возможности программ моделирования нейронных сетей. Виды нейросетей: персептроны, сети Кохонена, сети радиальных базисных функций. Генетический алгоритм, его применение для оптимизации нейросетей. Система моделирования нейронных сетей Trajan 2.0.
дипломная работа [2,3 M], добавлен 13.10.2015Классификация моделей построения баз данных. Работа с реляционными базами данных: нормализация таблиц, преобразование отношений полей, преобразование функциональной модели в реляционную. Понятие языка определения данных и языка манипуляции данными.
реферат [123,0 K], добавлен 22.06.2011Классификация компьютерных сетей. Назначение компьютерной сети. Основные виды вычислительных сетей. Локальная и глобальная вычислительные сети. Способы построения сетей. Одноранговые сети. Проводные и беспроводные каналы. Протоколы передачи данных.
курсовая работа [36,0 K], добавлен 18.10.2008Прогнозирование на фондовом рынке с помощью нейронных сетей. Описание типа нейронной сети. Определение входных данных и их обработка. Архитектура нейронной сети. Точность результата. Моделирование торговли. Нейронная сеть прямого распространения сигнала.
дипломная работа [2,7 M], добавлен 18.02.2017Изучение принципа работы интернет-аукциона (на примере сайта molotok.ru). Способ получения информации с веб-ресурсов. Разработка программного обеспечения с целью создания исходных данных для обучения нейронных сетей и классификации товаров с их помощью.
дипломная работа [2,0 M], добавлен 29.06.2012Понятие о нейронных сетях и параллели из биологии. Базовая искусственная модель, свойства и применение сетей. Классификация, структура и принципы работы, сбор данных для сети. Использование пакета ST Neural Networks для распознавания значимых переменных.
реферат [435,1 K], добавлен 16.02.2015Проектирование программного обеспечения. Построение начальной контекстной диаграммы и концептуальной моделей данных. Диаграммы потоков данных и системных процессов нулевого уровня и последовательности экранных форм. Описание накопителей данных.
курсовая работа [1,4 M], добавлен 07.03.2013Технология построения сетей передачи данных. Правила алгоритма CSMA/CD для передающей станции. Анализ существующей сети передачи данных предприятия "Минские тепловые сети". Построение сети на основе технологии Fast Ethernet для административного здания.
дипломная работа [2,5 M], добавлен 15.02.2013Рост активности в области теории и технической реализации искусственных нейронных сетей. Основные архитектуры нейронных сетей, их общие и функциональные свойства и наиболее распространенные алгоритмы обучения. Решение проблемы мертвых нейронов.
реферат [347,6 K], добавлен 17.12.2011