Модели, алгоритмы и комплекс программ исследования многопараметрических систем
Разработка метода и алгоритма формирования модели многопараметрической системы на базе параллельного генетического алгоритма. Определение лучших значений показателей концепции при изменении входных признаков на основе нелинейной регрессионной модели.
Рубрика | Экономико-математическое моделирование |
Вид | автореферат |
Язык | русский |
Дата добавления | 28.03.2018 |
Размер файла | 333,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
На правах рукописи
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
МОДЕЛИ, АЛГОРИТМЫ И КОМПЛЕКС ПРОГРАММ ИССЛЕДОВАНИЯ МНОГОПАРАМЕТРИЧЕСКИХ СИСТЕМ
МОКШИН В.В.
Казань - 2010
Работа выполнена в Казанском государственном техническом университете им. А. Н. Туполева
Научный руководитель: кандидат технических наук, доцент Якимов Игорь Максимович
Официальные оппоненты: доктор технических наук, профессор Захаров Вячеслав Михайлович доктор технических наук, профессор Латыпов Рустам Хафизович
Ведущая организация: Самарский государственный аэрокосмический университет им. С.П. Королева, г. Самара
Защита диссертации состоится «__» ________ 2010 года в _____ часов на заседании диссертационного совета Д 212.079.01 в Казанском государственном техническом университете им. А.Н. Туполева по адресу: 420111, г. Казань, ул. К. Маркса, д. 10, зал заседаний Учёного совета.
С диссертацией можно ознакомиться в библиотеке Казанского государственного технического университета им. А.Н. Туполева по адресу: 420111, г. Казань, ул. К. Маркса, д. 10. Автореферат диссертации размещен на сайте Казанского государственного технического университета им. А.Н.Туполева
Автореферат разослан «___» _________ 2010 года.
Учёный секретарь диссертационного совета, доктор физико-математических наук, профессор П.Г. Данилаев
1. Общая характеристика работы
Актуальность темы. В зависимости от характера многопараметрических систем используются различные виды моделирования, такие как детерминированные и стохастические, статические и динамические, дискретные, непрерывные и дискретно-непрерывные и т.д. В качестве многопараметрических систем могут рассматриваться как технические, биологические и экономические системы, так и производственные предприятия, и социологические объекты (город, район, регион и т.д.). Моделирование многопараметрических систем предполагает исследование объектов на их моделях.
Существуют различные подходы, направленные на формирование моделей, описывающих функционирование дискретных многопараметрических систем, поведение которых обуславливается большим числом внешних признаков. При всем существующем разнообразии методов Data Mining, ориентированных на исследование многопараметрических систем, практически все они сталкиваются с общей трудностью - вопросом отбора значимых для модели входных признаков. Особенно актуальна эта проблема при построении регрессионных моделей. Это связано с тем, что сформированные модели адекватны при интерполяции, в то время как на этапе экстраполяции эти модели уже не пригодны ввиду значительных ошибок прогноза.
Исследованию проблем создания методики определения оптимальных значений показателей системы и вопросам моделирования многопараметрических систем посвящены работы следующих ученых: Айвазян С.А., Бусленко Н.П., Глова В.И., Заде Л.А., Захаров В.М., Ивахненко А.Г., Сиразетдинов Т.К., Царев Р.Ю., Якимов И.М., Бастергян А.А., Larose D. T., Chipman H. A., Cantu-Paz E., Mu Zhu., Dash M., Miller A., Yang J., Ханк Д. Э., и т.д.
Однако, в этом направлении существуют недостаточно исследованные вопросы и нерешенные задачи, имеющие теоретическое и практическое значение. Например, использование параллельных генетических алгоритмов отбора значимых признаков и определения оптимальных значений показателей системы. Актуальной задачей является разработка адекватных многопараметрических моделей, эффективных алгоритмов и реализующих их программных комплексов. Решению этой задачи посвящена настоящая диссертация.
Объект исследования. Модели и методы моделирования многопараметрических систем.
Предмет исследования. Методы, модели, алгоритмы формирования нелинейной регрессионной модели многопараметрической системы.
Научная задача: разработка новых методов и алгоритмов построения нелинейных регрессионных уравнений для моделирования многопараметрической системы, многокритериального поиска решения и программного комплекса формирования нелинейной регрессионной модели для анализа многопараметрической системы и определения оптимальных показателей системы.
Цель работы: создание методов, моделей, алгоритмов и программных средств формирования нелинейной регрессионной модели при решении задачи отбора значимых признаков для повышения эффективности построения моделей многопараметрических систем и оценка их качества (эффективности).
В соответствии с поставленной целью в работе решались следующие задачи:
1. Анализ проблем, возникающих при применении методов формирования модели для многопараметрической системы.
2. Разработка методики формирования нелинейной регрессионной модели многопараметрической системы.
3. Разработка метода и алгоритма формирования модели многопараметрической системы на базе параллельного генетического алгоритма.
4. Разработка алгоритма определения оптимальных значений показателей системы при изменении входных признаков на основе нелинейной регрессионной модели.
5. Разработка комплекса методик и программ, реализующих предлагаемые методы и алгоритмы.
Методы исследований.
В работе использовались положения: теории систем, теории вероятности, теории математической статистики, нечеткой логики, теории эволюционного моделирования и теории оптимизации. Теоретические исследования сопровождались разработкой математических моделей, реализованных на ЭВМ и в виде программных средств.
Научная новизна работы:
1. Разработан метод формирования нелинейной регрессионной модели для исследования многопараметрической системы на основе сочетания многофакторной нелинейной регрессионной модели, метода группового учета аргументов, численного метода отбора значимых признаков и нечеткой логики.
2. Разработан численный метод отбора значимых признаков и формирования структуры регрессионных зависимостей на основе параллельного генетического алгоритма.
3. Разработан численный метод определения требуемого количества параллельных эволюционных путей для отбора значимых признаков.
4. Разработан модифицированный алгоритм определения оптимальных значений результативных показателей на основе полученной нелинейной регрессионной модели с использованием нечеткой логики и параллельных вычислений.
Достоверность полученных результатов. Предложенные в диссертационной работе модели и алгоритмы обоснованы теоретическими решениями и не противоречат известным положениям других авторов. Практическая апробация и внедрение на промышленном предприятии и предприятии почтовой связи результатов работы подтвердили эффективность формирования полиномиальной модели многопараметрической системы и определение наилучших значений показателей системы.
Практическая ценность результатов работы полученных научных результатов в диссертации состоит в том, что в ней дана методика моделирования многопараметрической системы. Разработанные алгоритмы позволяют тестировать разработанный метод на требуемое количество параллельных эволюционных путей, определять оптимальные параметры генетических алгоритмов отбора значимых признаков. Расширяется возможность определения оптимальных значений результативных показателей нелинейной регрессионной модели многопараметрической системы. Модели, алгоритмы и комплекс программ является инструментальным средством для моделирования многопараметрических систем и исследования свойств нелинейных регрессионных моделей с использованием генетического моделирования, нечеткой логики и параллельных вычислений.
Реализация результатов работы. Теоретические и практические результаты диссертационной работы, в том числе, их программная реализация, были внедрены на машиностроительном предприятии «СИЗ» (г. Елабуга) и Елабужском межрайонном почтамте (г. Елабуга). Отдельные результаты работы были также использованы в учебном процессе кафедры Автоматизированных систем обработки информации и управления КГТУ им. А.Н.Туполева. Разработанные в диссертационной работе модели и методы также могут быть использованы для повышения эффективности моделирования и в других организациях.
Апробация работы.
Основные положения диссертационной работы докладывались, обсуждались и получили положительную оценку на конференциях: Международная конференция «Туполевские чтения» (г. Казань, 2004, 2005, 2006, 2008, 2009); Всероссийская научная конференция «Робототехника, мехатроника и интеллектуальные системы» (г. Таганрог, 2005); Всероссийский конкурс-конференция «Технологии Microsoft в теории и практике программирования» (г. Санкт-Петербург, 2007, 2008); Всероссийский конкурс-конференция «Технологии Microsoft в теории и практике программирования» (г. Нижний Новгород, 2007); Всероссийская конференция студентов, аспирантов и молодых ученых «Технологии Microsoft в теории и практике программирования» (г. Новосибирск, 2008); Международная молодежная научная конференция «XXXIV Гагаринские чтения» (г. Москва, 2008); Всероссийская научно-практическая конференция «Наука и профессиональная деятельность» (г. Нижнекамск, 2008, 2009 ,2010); Международная конференция-семинар «Высокопроизводительные параллельные вычисления на кластерных системах» (г. Казань, 2008); Научно-практическая конференция студентов и аспирантов «Наука и инновации в решении актуальных проблем города» (г. Казань, 2008); Международная научно-практическая конференция «Инфокоммуникационные технологии глобального информационного общества» (г. Казань, 2008, 2009).
Публикации.
Основные результаты диссертационной работы опубликованы в 26 печатных работах, в том числе 5 статей, две из которых в печатных изданиях, рекомендованных ВАК и 21 тезиса докладов.
На защиту выносятся следующие результаты:
1. Метод формирования нелинейной регрессионной модели многопараметрической системы.
2. Численный метод отбора признаков и формирования структуры регрессионных зависимостей на основе параллельного генетического алгоритма.
3. Алгоритм поиска наилучшего количества параллельных эволюционных путей для отбора значимых признаков.
4. Модифицированный алгоритм поиска оптимальных значений результативных показателей методом упорядоченного предпочтения через сходство с идеальным решением.
5. Комплекс программ, реализующих предлагаемые методы и алгоритмы.
Структура и объем диссертации. Диссертационная работа состоит из введения, четырех глав, заключения и списка использованной литературы, включающего 84 наименование, изложена на 189 страницах машинописного текста, содержит 64 рисунка и 41 таблиц, приложение на 25 страницах.
содержание работы
Во введении обоснована актуальность, научная новизна и практическая значимость работы, изложены цели, задачи и методы диссертационного исследования.
В первой главе рассматриваются вопросы и проблемы моделирования многопараметрических систем. Анализируются методы формирования регрессионных моделей многопараметрических систем. Обосновывается необходимость моделирования дискретных многопараметрических систем с использованием эволюционного моделирования. Ставятся задачи по разработке методики формирования нелинейной регрессионной модели многопараметрической системы и разработке алгоритма поиска оптимальных значений результативных показателей на основе полученных регрессионных зависимостей с использованием параллельных вычислений, генетического моделирования и нечеткой логики. Эти задачи вытекают из необходимости отбора наиболее существенных признаков для моделирования дискретных многопараметрических систем и определения оптимальных значений показателей системы.
Моделирование многопараметрических систем основано на данных о системе за некоторый промежуток времени. Существование «скрытых» знаний обусловлено большими объёмами накопленных данных. Для их анализа используются специальные методы Data Mining: статистические пакеты, нейронные сети, эволюционные методы, алгоритмы поиска логических связей и закономерностей, а также гибридные модели, сочетающие в себе достоинства различных технологий.
Основные этапы данного процесса:
1) предварительный анализ исходного набора данных - анализ и формулировка задачи исследования, создание наборов данных, выделение обучающей выборки;
2) подготовка (предобработка) данных заключается в получении качественных, корректных данных с точки зрения методов их анализа;
3) преобразование (трансформация) данных осуществляется путём их сглаживания, агрегирования, обобщения, нормализации;
4) data mining - использование инструментальных средств для поиска закономерностей в данных;
5) оценка (постобработка) данных - анализ построенных математических моделей и интерпретация полученных результатов.
При всем существующем разнообразии методов Data Mining, практически все они сталкиваются с общей трудностью - вопросом отбора значимых для модели входных признаков (в зарубежной литературе такая проблема известна как feature selection). Сокращение числа независимых переменных призвано уменьшить размерность модели не только с тем, чтобы удалить из нее все незначащие признаки, ненесущие в себе какой-то полезной для анализа информации, и тем самым упростить модель, но и чтобы устранить избыточные признаки. Дублирование информации в составе избыточного признака не просто не улучшает качество модели, но и порой, наоборот, ухудшает его (как, например, в случае с мультиколлинеарностью).
В общем виде математическое описание исследуемой системы может быть выражено зависимостью , где - множество векторов выходных переменных (результативных показателей) системы. В качестве выходных переменных, как правило, используются показатели, отражающие цели исследования. Показатели выражаются математическими зависимостями в виде регрессионных выражений. В общем случае множество входных переменных (признаков) подразделяют на классы: - множество векторов входных контролируемых управляемых независимых признаков (факторов), действующих на процессы; - множество векторов входных контролируемых, но неуправляемых независимых признаков; - оператор системы, определяющий связь между указанными величинами.
После определения совокупности функциональных зависимостей результативных показателей от входных признаков возникает необходимость поиска оптимальных значений показателей системы. Необходимо учитывать ограничения на сами функции и входные признаки, а также поиск оптимального решения среди множества альтернатив с учетом многокритериальности.
Одной из важнейших задач при разработке нелинейной регрессионной модели многопараметрической системы является отбор значимых признаков и определение оптимальных значений показателей на основе разработанной модели. Традиционные методы эффективны для отбора признаков при поиске регрессионной зависимости при интерполяции. А когда речь идет об использовании полученной модели для прогнозирования (экстраполяции), то ошибка прогноза в разы увеличивается. Эти причины актуализируют необходимость разработки методов, алгоритмов и реализующих их программных комплексов формирования нелинейной регрессионной модели многопараметрической системы и определения оптимальных значений показателей с использованием полученной модели.
Глава 2 посвящена разработке метода формирования нелинейной регрессионной модели исследования многопараметрической системы. Разработан численный метод, в котором запускается несколько относительно коротких параллельных эволюционных путей отбора признаков. Определяется частота появления каждого признака относительно всех параллельных эволюционных путей. В работе алгоритма используется «ранняя остановка», как в нейронных сетях. Это позволяет не допустить «переобучения» модели, исключить незначимые признаки и уменьшить ошибку прогноза. Наиболее вероятно, что если признак действительно важен, тогда частота его появления на всех или большинстве эволюционных путях будет высокой. Если признак неважен, то частота его появления будет высока только для некоторых эволюционных путей. В результате средняя частота появления признаков на всех параллельных эволюционных путях будет высока только для признаков, которые действительно важны. В ходе выделения значимых признаков определяется также необходимое количество эволюционных путей.
Рис. 1. Блок-схема алгоритма формирования регрессионной модели с учетом изменения системы во времени (ГА - генетический алгоритм со стандартными генетическими операторами, ГП - генерация популяции, ВВП - вычисление весов признаков, - количество параллельных эволюционных путей).
После выделения совокупности наиболее существенных признаков при формировании модели исследования многопараметрической системы используется рекурсивно-регрессионная самоорганизация на основе метода группового учета аргументов (рис. 1); на этапе оптимизации и поиска решения - метод упорядоченного предпочтения по сходству с идеальным решением. Под идеальным решением понимается результат оптимизационной задачи для каждого из показателей системы. Реализация отбора значимых признаков и формирование регрессионной модели в виде обобщенного полинома Колмогорова-Габора с учетом изменения системы во времени схематически представлена на рис. 1. Полином Колмогорова-Габора имеет вид:
где вектор весовых коэффициентов -й функции (1) признаков находится по формуле:
Здесь - матрица значений членов полинома (1), - матрица значений -го результативного показателя . Например, , , и т.д. являются членами полинома (1).
На первом этапе в блоке 1 (рис.1) происходит сбор информации по признакам , и по откликам yj, . Для рассматриваемого машиностроительного предприятия , а для предприятия почтовой связи количество входных признаков получилось . Причем 8 признаков мы можем менять, а остальные 72 устанавливаются фиксировано, т.е. значения 72 признаков менять предприятие почтовой связи не может. С учетом особенностей рассматриваемого объекта исследования количество входных признаков может быть увеличено. Отбор значимых признаков осуществляется в блоках 1 и 2, состоящего из этапа настройки и этапа отбора значимых признаков. На этапе настройки происходит поиск наилучшего количества параллельных эволюционных путей и требуемое количество поколений . Наилучшим количеством поколений будет считаться такое, при котором энтропия популяции будет . Далее происходит отбор значимых признаков с помощью параллельного генетического алгоритма при заданном количестве эволюционных путей и количеством поколений по критерию обобщенной перекрестной проверки .
После отбора значимых признаков запускается алгоритм формирования структуры регрессионного полинома (1) с учетом изменения системы во времени. Его составляют следующие блоки: генерации нелинейных регрессионных моделей, оценки качества моделей, выбора моделей, анализа и контроля. В блоке анализа и контроля осуществляется сбор данных о признаках и выдачу информации о структуре регрессионных моделей либо запуск анализа и отбора значимых признаков. Генерация модели продолжается до тех пор, пока не достигнуто минимальное значение критерия регулярности, либо его оценка :
где - количество временных наблюдений признаков, -значение результативного показателя в -ой точке проверочной выборки , - вычисленное значение по сгенерированному полиному в -ой точке проверочной выборки в соответствии с полиномом вида (1).
Алгоритм отбора значимых признаков и алгоритм формирования многомерного нелинейного регрессионной модели (1) представлены в разделах 2.4.- 2.5.
Параллельный генетический алгоритм отбора значимых признаков и определение наилучшего количества эволюционных путей.
Идея отбора значимых признаков заключается в том, что вместо одного длинного эволюционного пути запускаются несколько относительно коротких параллельных эволюционных путей . Для каждого запускается свой эволюционный путь отбора признаков с количеством поколений и размером популяции . Пусть - есть -ое поколение популяции на - ом эволюционном пути, где , . Требуется определить частоту появления -го входного признака по всем параллельным эволюционным путям .
Алгоритм отбора значимых признаков с количеством параллельных эволюционных путей :
Входные данные:
- матрица (временные наблюдения -го результативного показателя функционирования системы);
- матрица (временные наблюдения признаков , );
- размер популяции;
- количество поколений;
- количество параллельных эволюционных путей;
- вероятность мутации особи поколения (по умолчанию ).
Шаг 1: Назначение количества параллельных эволюционных путей .
Шаг 2: Для каждого параллельного эволюционного пути выполняются шаги 3, 4.
Шаг 3: Пусть - результат генетического алгоритма с параметрами (, , , , ).
В качестве функции приспособленности в генетическом алгоритме используется критерий обобщенной перекрестной проверки:
где , - элемент главной диагонали матрицы , соответствующий , - количество временных наблюдений признаков, -количество входных признаков, используемых для описания результативного показателя , , - особь, формируемое сочетание входных признаков, представленное в виде двоичной записи. Здесь 1 соответствует отобранному фактору, а 0 - фактору, которым мы пренебрегаем.
Шаг 4: Вычисляется - вес каждого признака , на - м генетическом пути, который характеризует частоту его появления,
где , .
Шаг 5: Определение частоты появления входного признака относительно всех параллельных эволюционных путей ,
Шаг 6: Сортировка частоты появления признаков вектора в порядке убывания и определение максимального расстояния между частотами и , ,
Шаг 7: Вычисление , которое характеризует максимально допустимое расстояние для отбора признаков между упорядоченными в порядке убывания частотами появления признаков и , ,
где .
Шаг 8: Если выполняется условие (6), то переходим к шагу 9, иначе все признаки будут считаться значимыми.
Шаг 9: Среди отсортированных частот появления признаков вектора , для дальнейшего исследования выбираются те признаки, веса которых находятся выше максимального расстояния . Отобранные признаки включаются в массив , где (см. рис.1). Если признак включается в модель, то в соответствующей позиции массива будет стоять 1, иначе - 0.
Выходные данные:
- массив отобранных признаков.
Основная идея поиска оптимального количества параллельных эволюционных путей заключается в следующем. Алгоритм отбора значимых признаков запускается раз для каждого количества параллельных эволюционных путей . В результате определяется некоторый трехмерный массив частоты появления признаков для каждого входного признака xi, при каждом количестве параллельных эволюционных путей с учетом повторных запусков алгоритма отбора признаков (рис. 2).
Рис. 2. Схематическое представление трехмерного массива частоты появления входных признаков , для результативного показателя
Например, при и получается массив частот . Если этот алгоритм отбора признаков повторять раз, то сформируется массив частот . Для каждого входного признака , из каждой выборки определяется и формируется массив . После чего из получившегося массива также определяются и . Аналогичные рассуждения применяются для каждого количества параллельных эволюционных путей .
Наилучшим количеством параллельных эволюционных путей будет считаться такое число , при котором разброс частот появления признаков будет наименьшим.
В случае, когда совокупность отобранных признаков становится стабильной, увеличение количества параллельных эволюционных путей прекращается.
Отобранные признаки и количество параллельных эволюционных путей передаются в блок анализа и контроля. Далее, запускается алгоритм формирования структуры многомерной регрессионной модели с учетом её изменения. многопараметрический генетический нелинейный регрессионный
Формирование структуры регрессионной модели
Формирование регрессионной модели (1) методом группового учета аргументов можно описать в виде генетического алгоритма, используя стандартные генетические операторы. Описание популяции с номером поколения можно представить в виде - матрицы возможных степеней входных признаков, - матрицы коэффициентов регрессионных моделей претендентов и - матрицы координат мономов полинома регрессионной модели. Элементы матрицы указывают на номера строк матрицы . В этом случае каждая особь при и популяции размером содержит информацию о структуре регрессионной модели (1) для , , (см. рис. 3) состоит из количества возможных членов регрессионной модели - .
Рис. 3. Схематическое представление особи , содержащей информацию о структуре регрессионной модели для результативного показателя
На рис. 3 - коэффициенты регрессионной модели, которые образуют матрицу . Значения являются элементами матрицы , а - критерий регулярности (2). Таким образом, модель-претендент или регрессионная модель (1) с учетом матриц можно представить в виде формулы:
где - количество членов регрессионного полинома, вычисляемого по формуле:
где M - число входных признаков, p - степень полинома (1). В работе используются полиномы со степенью .
Разработан алгоритм формирования структуры регрессионной модели, заданной степенью p:
Входные данные:
- матрица размерности (наблюдения одного из результативных показателей функционирования системы);
- матрица размерности (наблюдения входных признаков xi, );
- матрица отобранных признаков с количеством параллельных эволюционных путей и количеством входных признаков ;
- размер популяции;
- вероятность мутации особи поколения .
Шаг 1: Деление выборки временных наблюдений признаков на две части:
обучающую и проверочную , т.е. . Генерация полиномов осуществляется на основе обучающей выборки ;
Шаг 2: Формирование начальной популяции размером .
Шаг 3: До тех пор, пока значение критерия регулярности уменьшается, генерация и изменение структуры моделей (8) продолжается (выполняются шаги 3-5).
Шаг 4: На проверочной выборке для каждой модели (8) вычисляется критерий регулярности , полиномы сортируются в порядке убывания и отбирается половина полиномов с наименьшими значениями .
Шаг 5. Выполнение генетических операторов.
Выходные данные:
Матрицы и номер отобранной модели с наименьшим критерием регулярности .
На получаемые регрессионные модели накладываются следующие ограничения:
1. Количество степеней свободы:
; ,
где - количество переменных в j-ой регрессионной модели.
2. Отношение стандартной ошибки к среднему значению должно быть не более 0,05:
; .
3. Уровень значимости множественного коэффициента детерминации, показывающего в долях от единицы насколько изменение переменных, вошедших в уравнение регрессии, определяет изменение результативного показателя, не должен превышать 0,05:
; .
4. Уровень значимости регрессионной модели по критерию Фишера должен быть не более 0,05:
; .
5. Все коэффициенты регрессионной модели должны иметь уровень значимости по критерию Стьюдента не более 0,05.
; ; .
После того как будет получена математическая модель для результативных показателей , , состоящая из системы нелинейных регрессионных моделей, выполняется поиск оптимальных значений показателей системы с помощью модифицированного метода упорядоченного предпочтения через сравнения с идеальным решением, уменьшая - мерное пространство целей до двумерного (Заде Л.А., Царев Р.Ю.). Наилучшее решение имеет наикратчайшее расстояние до наилучшего идеального решения (PIS) и наибольшее расстояние до наихудшего идеального решения (NIS). Задача становится нечеткой двуцелевой в виду возникающих конфликтов между целями и ввода формулировок «как можно ближе к PIS» и «как можно дальше от NIS». Для достижения компромисса при решении полученной задачи используется оператор Беллмана-Заде. Под «идеальным» решением понимается результат решения задачи оптимизации для каждого регрессионного полинома , с ограничениями на входные признаки и результативные показатели.
Задача многоцелевого поиска оптимальных значений признаков и показателей системы рассматривается в разделе 2.6 и представляется в виде: , где , - количество целей, функции , . Принцип компромисса имеет вид: , . где , , и , ; , , и , ;
, - цель для минимизации типа «стоимость», , - цель для максимизации типа «выгода»; ; , . В результате является вектором наилучших индивидуальных решений для всех целей и называется . - вектор наихудших возможных решений для всех целей и называется .
Рис. 4. Изменение энтропии с учетом изменения энтропии популяции. В экспериментах 1, 2, 3 копии особей в популяции не допускаются. В экспериментах 4, 5, 6 копии особей в популяции допускаются
В третьей главе проводится исследование метода формирования полиномиальной модели, влияния количества параллельных эволюционных путей на качество отбираемых признаков. В разделе 3.1. приводится описание разработанного программного комплекса. Анализируются параметры, характеризующие алгоритм формирования нелинейной регрессионной модели многопараметрической системы. На рис. 4 приведены результаты вычислений энтропии популяции с учетом ситуации, когда копии особей допускаются в популяции и в случае, если копии особей не допускаются.
Из рисунка 4 видно, что после 10-го поколения энтропия для первых трех экспериментов приблизительно равна 0,13, т.е. численно стабильна. В то время, как для 4-6 экспериментов энтропия поколений численно стабильна уже после 7-го поколения и равна 0, т.е. появление того или иного признака определено. Результаты определения частот появления признаков для различного количества параллельных эволюционных путей приведены на рис. 5.
Рис. 5. Степени важности входных факторов , для описания некоторого результативного показателя а) для количества эволюционных путей , 3, 5, 7 б) для количества эволюционных путей , 40, 50, 70
Из рис. 5. видно, что при небольших значениях разброс весов входных признаков существенный. В то время как при дальнейшем увеличении соответствующие веса , меняются незначительно, что позволяет выделять значимые признаки.
Проводится исследование модифицированного метода упорядоченного предпочтения сравнением с идеальным решением. Сравнение разработанного метода формирования модели многопараметрической системы с другими методами для одного из результативных показателей проводится по коэффициентам множественной детерминации ():
Рис. 6. Сравнение разработанного метода с другими методами отбора признаков по критерию множественной детерминации
На рис. 6 для каждого рассматриваемого метода приведены значения на этапе формирования и тестирования (прогнозирования) регрессионного полинома, используя и временных интервалов соответственно.
В результате моделирования многопараметрической системы показана эффективность разработанного метода по критерию множественной детерминации формирования нелинейной регрессионной модели и возможность его использования для прогнозирования, так как с учетом временной выборки коэффициент множественной детерминации изменился незначительно и .
В четвёртой главе рассматривается применение разработанных в диссертации математических методов на примере машиностроительного предприятия и межрайонного почтамта.
Для формирования модели функционирования производственного предприятия выбраны в качестве входных внешних признаков , и результативных показателей , параметров. При исследовании использовались квартальные значения отобранных признаков, а конечной задачей являлось увеличение выручки от продажи товаров, продукции, работ и услуг. Была получена нелинейная регрессионная модель многопараметрической системы, включающая систему из десяти регрессионных уравнений. Такое количество полиномов соответствует числу отобранных результативных показателей , .
В результате отбора значимых признаков для каждого из результативных факторов , получены значения частот , появления каждого входного признака , в каждом из эволюционных путей. Отбор входных признаков проводился с размером популяции , количеством поколений , при уровне мутации особи и количестве параллельных эволюционных путей . Количество параллельных эволюционных путей и количество поколений были получены в результате использования алгоритма поиска требуемого количества параллельных эволюционных путей и алгоритма определения требуемого количества поколений.
Рассматриваются этапы отбора значимых признаков, описывающих функционирование машиностроительного предприятия, формирование структуры регрессионных зависимостей с учетом отобранных значимых признаков. Приводятся результаты, полученные в ходе формирования нелинейной регрессионной модели предприятия, а также результаты, полученные в ходе определения оптимальных значений показателей системы методом упорядоченного предпочтения через сходство с идеальным решением.
После формирования математической модели машиностроительного предприятия в виде совокупности регрессионных зависимостей, приведенных в разделе 4.2., решается задача поиска оптимальных значений входных признаков и результативных показателей путем решения многокритериальной задачи с помощью модифицированного метода упорядоченного предпочтения через сходство с идеальным решением с использованием параллельных вычислений:
Определили контрольные точки и , т.е. наикратчайшее расстояние до позитивного идеального решения и наибольшее расстояние до негативного идеального решения соответственно. Таким образом, пространство из 10 целей, соответствующее количеству результативных признаков , , привели к двумерному.
где , и , ;
, и , ;
, - цель для минимизации типа «расходы на конечный товар», - цель для максимизации типа «прибыль».
В результате, - вектор решений, состоящий из наилучших индивидуальных решений (), а - вектор решений, состоящий из наихудших индивидуальных решений (). Значения и имеют значения в пределах области допустимых значений результативных признаков.
По результатам определения оптимальных параметров по заданным критериям приводятся оптимальные значения показателей и признаков системы, используя которые можно увеличить чистую прибыль y3оптим в 1,4 раза.
Также, используя разработанный метод построена нелинейная регрессионная модель для почтового предприятия. Отобраны 16 результативных показателей эффективности функционирования предприятия почтовой связи - yj, j=. В качестве влияющих на них признаков выбраны производственно-экономические признаки - , ; социально-экономические признаки города Елабуга - , , тарифные признаки, устанавливаемые РТ - , i, тарифные признаки, устанавливаемые РФ - , . В результате получено 16 нелинейных регрессионных моделей. По результатам оптимизации констатируем, что выручку от продажи товаров, продукции, работ, услуг можно увеличить на 31%. Прибыль от продаж можно увеличить на 40%.
В заключении диссертационной работы сформулированы научные результаты, полученные в ходе её выполнения и намечены направления перспективных исследований.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
1. Проведен анализ проблем, возникающих при формировании нелинейных регрессионных моделей многопараметрических систем. Обосновано использование генетического моделирования и параллельных вычислений для отбора значимых признаков и формирования полиномиальной модели, которая используется для моделирования функционирования многопараметрической системы.
2. Разработан параллельный генетический алгоритм отбора признаков и формирования структуры регрессионной модели. Он состоит из совокупности простых генетических алгоритмов, где используется подход запуска относительно коротких эволюционных путей. В результате определяется частота появления каждого признака относительно всех эволюционных путей, что и является критерием отбора признаков. На его основе разработана методика моделирования многопараметрической системы.
3. Разработан численный метод поиска требуемого количества параллельных эволюционных путей для отбора значимых признаков и количества поколений; метод учитывает энтропию последних популяций каждого из эволюционных путей. Это повышает качество выборки значимых признаков при формировании нелинейной регрессионной модели для моделирования функционирования машиностроительного предприятия и предприятия почтовой связи. Для рассматриваемых примеров количество параллельных эволюционных путей , количество поколений .
4. Разработан модифицированный алгоритм поиска оптимального решения многокритериальной задачи на основе полученной полиномиальной модели функционирования многопараметрической системы с использованием нечеткой логики и параллельных вычислений. Решением являются значения входных признаков, при которых результативные показатели являются наилучшими.
5. Разработан комплекс методик и программ, реализующий предложенные методы и алгоритмы для моделирования многопараметрической системы. На основе многопараметрического примера проведены экспериментальные исследования работы предложенной модели, методики и алгоритмов. Их применение позволило повысить качество регрессионной модели по критерию множественной детерминации на 20%. Уровень значимости множественного коэффициента детерминации на этапе тестирования модели .
6. Получены результаты, позволяющие повысить эффективность определения значений входных признаков и результативных показателей для машиностроительного предприятия с возможностью увеличения прибыли от продаж в 1,4 раза и для предприятия почтовой связи в 1,3 раза с рекомендуемыми значениями входных признаков.
Публикации по теме диссертации
Публикации в изданиях, рекомендованных ВАК России:
1. Мокшин В.В., Якимов И.М., Юльметьев Р.М., Мокшин А.В. Рекурсивно-регрессионная самоорганизация моделей анализа и контроля сложных систем // Нелинейный мир. - Москва, 2009. - т.7. - № 1. - С. 66-76.
2. Мокшин В.В. Параллельный генетический алгоритм отбора значимых факторов, влияющих на эволюцию сложной системы // Вестник Казанского государственного технического университета им. А.Н. Туполева.- Казань, 2009. - №3. - С.53-65.
В других журналах и материалах научных конференций:
3. Мокшин В.В. Автоматизированная система анализа процессов обработки деталей // Информация, инновации, инвестиции: Материалы Всероссийской конференции с международным участием. - г. Пермь, 2004 г. - С.173-175.
4. Мокшин В.В. Создание интеллектуальной системы, объединяющей разнородные автоматизированные системы для географически распределенного производства, предприятия // Робототехника, мехатроника и интеллектуальные системы: Материалы Всероссийской научной конференции студентов и аспирантов с международным участием. - г. Таганрог, 2005 г. - С.197-199.
5. Мокшин В.В. Информационные системы больничного комплекса // XII Туполевские чтения: Материалы международной молодежной научной конференции. - г. Казань, 2004. Т. III, - С.127.
6. Мокшин В.В. Модель информационно-управляющей системы объектов географически распределенного предприятия // Технологии Microsoft в теории и практике программирования: Всероссийский конкурс работ и конференция студентов, аспирантов и молодых ученых. - Новосибирск, 2006 - http://www.iis.nsk.su/news/events/mskonkurs/2006/accepted.shtml
7. Мокшин В.В. Использование имитационной модели для оценки эффективности производства // Туполевские чтения XIII: Материалы международной молодежной научной конференции, посвященной 1000-летию города Казани. - г. Казань, 2005. - С.141.
8. Мокшин В.В. Повышение надежности и отказоустойчивости информационно-управляющих систем // Решетневские чтения: Материалы IX международной научной конференции, посвященной 45-летию Сибирского государственного аэрокосмического университета имени академика М.Ф. Решетнева. - г. Красноярск, 2005 - С.287.
9. Мокшин В.В. Оптимизация деятельности предприятия на основе регрессионной модели // XIV Туполевские чтения: Материалы международной молодежной научной конференции. - г. Казань, 2006. - С. 132.
10. Мокшин В.В. Использование регрессионной модели для исследования и оптимизации функционирования предприятия // Технологии Microsoft в теории и практике программирования: Материалы Всероссийского конкурса работ и конференции студентов, аспирантов и молодых ученых. - г. Санкт-Петербург, 2007. - С.198.
11. Мокшин В.В. Якимов И.М. Поиск оптимальных решений для исследования и управления предприятием // Технологии Microsoft в теории и практике программирования: Материалы Всероссийского конкурса работ и конференции студентов, аспирантов и молодых ученых. - г. Нижний Новгород, 2007. - С. 187-189.
12. Мокшин В.В. Информационная система статистических исследований и оптимизации функционирования предприятия // Исследования по информатике. Выпуск 12, г. Казань, 2007. - С. 79 - 93.
13. Мокшин В.В. Информационная система исследования и оптимизация функционирования предприятия // Технологии Microsoft в теории и практике программирования: Материалы Всероссийской конференции студентов, аспирантов и молодых ученых. - г. Новосибирск, 2008. - С.198-200.
14. Мокшин В.В. Использование рекурсивного подхода для формирования нелинейных регрессионных моделей в управлении производственными процессами // XXXIV Гагаринские чтения: Материалы Международной молодежной научной конференции. - г. Москва, 2008. Т.6. - 238 С.
15. Мокшин В.В. Использование оптимизационных подходов для создания модели оценки и управления предприятием // Материалы конкурса работ и конференции студентов, аспирантов и молодых ученых Технологии Microsoft в теории и практике программирования: Материалы межвузовского конкурса-конференции студентов, аспирантов и молодых ученых Северо-Запада. - СПб., 2008. - С. 252 - 254.
16. Мокшин В.В., Якимов И.М. Формирование нелинейной регрессионной модели для управления производственными процессами. Проблемы и пути решения // Наука и профессиональная деятельность: Материалы Всероссийской научно-практической конференции. - г. Нижнекамск, 2008. - С.291-295.
17. Мокшин В.В. Использование нейросетевых технологий для эффективного управления производственным предприятием // XVI Туполевские чтения: Материалы международной молодежной научной конференции. - г. Казань, 2008. - С. 169-170.
18. Мокшин В.В. Рекурсивный подход формирования нелинейных регрессионных моделей для управления производственными процессами // XVI Туполевские чтения: Материалы международной молодежной научной конференции. - г. Казань, 2008. - С. 174-175.
19. Мокшин В.В. Рекурсивный алгоритм построения регрессионных моделей сложных вероятностных объектов // Инфокоммуникационные технологии глобального информационного общества: Материалы 6-й ежегодной международной научно-практической конференции. - г. Казань, 2008. - С.317-320.
20. Мокшин В.В. Параллельный алгоритм решения многокритериальной задачи повышения эффективности управления сложной системы // Высокопроизводительные параллельные вычисления на кластерных системах: Материалы 7-й международной конференции-семинара. - г. Казань: Изд. КГТУ, 2008. - С. 239-241.
21. Мокшин В.В. Анализ и контроль сложных систем на основе рекурсивно-регрессионной самоорганизации // Наука и инновации в решении актуальных проблем города: Материалы научно-практической конференции студентов и аспирантов. - г. Казань: Изд-во «Отечество», 11-12 декабря 2008 г.- С. 23- 24.
22. Мокшин В.В., Якимов И.М. Методы формирования моделей анализа и контроля сложных систем // Наука: современное состояние и перспективы развития: Материалы Всероссийской научно-практической конференции. - Нижнекамск: Изд-во Казан. гос. техн. ун-та, 14 мая 2009 г. - С. 134-137.
23. Мокшин В.В., Якимов И.М. Рекурсивный алгоритм построения регрессионных моделей сложных вероятностных объектов // Инфокоммуникационные технологии глобального информационного общества: Сборник трудов 6-й ежегодной международной научно-практической конференции. - г. Казань, 4-6 сентября, изд-во ООО «Центр оперативной печати», 2008 г. - С.367-373.
24. Мокшин В.В., Якимов И.М. Методика отбора значимых факторов, влияющих на эволюцию сложной системы // Инфокоммуникационные технологии глобального информационного общества: Сборник трудов 7-й ежегодной международной научно-практической конференции. - г. Казань: Изд-во ООО «Центр оперативной печати», 2009 г. - С.254-359.
25. Мокшин В.В. Автоматизированная система отбора значимых факторов, влияющих на эволюцию сложной системы // XVI Туполевские чтения: Сборник научных трудов международной молодежной научной конференции. - г.Казань: Изд-во Казан. гос. техн. ун-та, 2009. - С. 174 - 175.
Размещено на Allbest.ru
...Подобные документы
Выбор факторных признаков для построения регрессионной модели неоднородных экономических процессов. Построение диаграммы рассеяния. Анализ матрицы коэффициентов парной корреляции. Определение коэффициентов детерминации и средних ошибок аппроксимации.
контрольная работа [547,6 K], добавлен 21.03.2015Построение описательной экономической модели. Матрица корреляций между исходными статистическими признаками. Оценка параметров модели. Определение и графическое изображение регрессионной зависимости между показателями. Оценка адекватности модели.
контрольная работа [215,8 K], добавлен 13.10.2011Решение задач линейного программирования с применением алгоритма графического определения показателей и значений, с использованием симплекс-метода. Использование аппарата теории двойственности для экономико-математического анализа оптимального плана ЗЛП.
контрольная работа [94,6 K], добавлен 23.04.2013Построение математической модели, максимизирующей прибыль фирмы от реализации всех сделок в виде задачи линейного программирования. Сущность применения алгоритма венгерского метода. Составление матрицы эффективности, коэффициентов затрат и ресурсов.
контрольная работа [168,7 K], добавлен 08.10.2009Проектирование регрессионной модели по панельным данным. Скрытые переменные и индивидуальные эффекты. Расчет коэффициентов однонаправленной модели с фиксированными эффектами по панельным данным в MS Excel. Выбор переменных для построения данной регрессии.
курсовая работа [2,3 M], добавлен 26.08.2013Эконометрическое исследование признаков деятельности предприятий: доля расходов на закупку товаров, среднедневная заработная плата одного работающего. Построение линейного графика регрессионной зависимости между показателями, оценка адекватности модели.
контрольная работа [93,3 K], добавлен 14.12.2011Построение уравнения регрессии, учитывающего взаимодействия факторов, проверка полученной модели на адекватность. Построение математической модели и нахождение численных значений параметров этой модели. Вычисление коэффициентов линейной модели.
курсовая работа [1005,0 K], добавлен 07.08.2013Эконометрика как одна из базовых дисциплин экономического образования во всем мире. Прогноз социально-экономических показателей, характеризующих состояние и развитие анализируемой системы. Понятие и построение модели парной регрессии и корреляции.
контрольная работа [633,2 K], добавлен 10.12.2013Предпосылки к возникновению теории управления запасами. Основные характеристики моделей системы снабжения и ее роль в обеспечении непрерывного и эффективного функционирования фирмы. Выбор концептуальной и математической модели, суть метода и алгоритма.
курсовая работа [149,4 K], добавлен 03.12.2009Случайная выборка из генеральной совокупности. Сущность метода Монте-Карло. Определение адекватности принятой эконометрической модели. Линейная регрессионная модель вида. Система нормальных уравнений в матричной форме. Параметры регрессионной модели.
контрольная работа [323,5 K], добавлен 08.12.2010Подходы к оценке стоимости финансовых активов в рамках линейной и нелинейной парадигмы. Анализ фрактальных свойств американского фондового рынка. Разработка методики расчета параметров модели Веге-Изинга, построенной на основе гипотезы когерентных рынков.
дипломная работа [2,3 M], добавлен 13.12.2010Определение понятий "функциональные и структурные математические модели", рассмотрение их значение, главных функций и целей. Составление модели "черного ящика", простейшее отображение реальной системы. Метод исследования объектов с помощью их моделей.
реферат [13,2 K], добавлен 17.11.2015Эволюционные процессы в природе. Принципы работы генетических алгоритмов - методов оптимизации многопараметрических функций. Операторы ГА, выбора родительской пары, отбора особей в новую популяцию. Разнообразие ГА, их модернизация. Модели параллельных ГА.
курсовая работа [292,0 K], добавлен 18.06.2012Задачи операционного исследования. Построение базовой аналитической модели. Описание вычислительной процедуры. Решение задачи оптимизации на основе технологии симплекс-метода. Анализ результатов базовой аналитической модели и предложения по модификации.
курсовая работа [1,5 M], добавлен 12.12.2009Исследование особенностей разработки и построения модели социально-экономической системы. Характеристика основных этапов процесса имитации. Экспериментирование с использованием имитационной модели. Организационные аспекты имитационного моделирования.
реферат [192,1 K], добавлен 15.06.2015Разработка системы массового обслуживания с ожиданием, частичной взаимопомощью между каналами и ограниченным временем нахождения заявки в системе. Создание аналитической и имитационной модели, проверка ее адекватности. Описание блок-схемы алгоритма.
контрольная работа [280,8 K], добавлен 18.11.2015Использование информационных технологий при решении задач нелинейной оптимизации. Определение оптимального ассортимента продукции. Линейные модели оптимизации в управлении. Использование мощностей оборудования. Размещение проектов на предприятиях.
контрольная работа [560,8 K], добавлен 14.02.2011Описание алгоритма культурного обмена и проведение экспериментального исследования средней трудоемкости алгоритма случайного поиска. Основные идеи алгоритма и эффективность итерационных методов решения. Зависимость функции качества от длины генотипа.
курсовая работа [373,3 K], добавлен 24.06.2012Сущность экономико-математической модели, ее идентификация и определение достаточной структуры для моделирования. Построение уравнения регрессии. Синтез и построение модели с учетом ее особенностей и математической спецификации. Верификация модели.
контрольная работа [73,9 K], добавлен 23.01.2009Разработка модели авторегрессии скользящего среднего, которая описывает и объясняет динамику объема грузов, перевозимых основными видами транспорта. Применение этой модели для прогнозирования развития всей грузовой транспортной системы Украины.
статья [514,3 K], добавлен 30.06.2012