Исследование методов интеллектуального анализа для формирования краткосрочного прогноза в программной среде Statistica
Анализ продаж фирмы продукции фирмы ООО "НОРД". Прогнозирование дальнейшего объема продаж на кратковременный период с применением инструментов программной среды Statistica (нейронных сетей и модели АРПСС). Сравнение результатов используемых методов.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 28.01.2017 |
Размер файла | 2,4 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Приамурский государственный университет им.Шолом-Алейхема
ИССЛЕДОВАНИЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДЛЯ ФОРМИРОВАНИЯ КРАТКОСРОЧНОГО ПРОГНОЗА В ПРОГРАММНОЙ СРЕДЕ STATISTICA
Николаев С.В., Пронина О.Ю., Баженов Р.И.
Аннотация
Цель данной статьи с помощью нескольких видов интеллектуального анализа программного пакета Statistica сформировать краткосрочный прогноз продаж фирмы ООО «НОРД», показать применение методов и сравнить их результаты.
Ключевые слова: временные ряды, данные, интеллектуальный анализ, краткосрочный прогноз, модель АРПСС, нейронные сети
нейронный продажа statistica
С развитием современных технологий, в том числе и глобальной сети интернет, все больше и больше информации становится доступной как частному пользователю, так и различным компаниям, фирмам. Более того, накопленная отчетность и другая информация в фирмах содержит в себе большое количество ценной информации, но из-за больших объемов, обработать ее может только ЭВМ и при наличии специализированных программ. Именно с ростом большого объема информации стали особо актуальны различные статистические программы, способные выполнять широкий круг задач. Программный пакет Statistica является одним из них.
Для использования программного пакета Statistica нет необходимости знать сложные методы анализа в деталях, хотя иметь некоторый фундамент математических знаний все же нужно. С помощью программы Statistica можно использовать весь потенциал данных методов для, анализа и интерпретации данных [1, 2].
О статистическом анализе данных в своих работах пишут В.П. Боровиков, И.П. Боровиков, а также А.А. Халафян, о возможностях инструмента data miner в своей статье описывает П.С. Большаков. [1,2,3] Для программы Statistica разработчиками написано полное электронное руководство [4,5]. Различные авторы занимались проблемами анализа. А.А. Попов провел факторный анализ экономики региона с использованием программной системы SPSS [6,7]. Особенности моделирования латентных изменений с помощью AMOS SPSS рассмотрел Р.И. Остапенко [8,9]. А.А. Серов исследовал скоринг экспериментальных данных с применением прогнозных моделей в среде пакета SPSS [10]. Cущность, преимущества и недостатки кластерного анализа показал С.А. Суслов [11,12]. Р.И. Баженов и др. изучали возможности применения различных видов анализа [13-20].
Цель данной статьи на основе имеющихся данных провести анализ продаж и спрогнозировать дальнейший объем продаж на кратковременный период, используя инструменты программной среды Statistica. Провести сравнение результатов используемых методов.
В качестве исходных данных были взяты данные о продажах за 2014 г. фирмы ООО «НОРД». Выгрузка данных представлена в формате Ms Excel. Часть данных приведена на рис. 1.
Рисунок 1 -- Исходные данные
Перед загрузкой данных в программную среду Statistica необходимо привести их к нужному формату. Так как мы собираемся проводить анализ временных рядов, то для работы необходимо создать сводную таблицу, которая будет отображать продажи в каждый момент времени. В нашем случае, в качестве единицы временного периода будет взят день. Отсортируем данные по датам продаж. Форматированные данные приведены ниже на рис. 2.
Рисунок 2 -- Отформатированные исходные данные
Statistica предусматривает работу с файлами MS Excel, отсюда, перенос данных из Excel в Statistica не вызывает затруднений. Данные в программе Statistica представлены на рис. 3.
Отобразим графически данные для анализа. Для этого воспользуемся построением двумерных графиков в программе Statistica («Графика» а «2М Графики» а «Линейные графики» (для переменных)). Результат представлен на рис. 4.
Рисунок 3 -- Экспортированные данные
Рисунок 4 -- График исходных данных
На графике видно, что присутствуют большие скачки объема продаж, что, несомненно, повлияет на наш прогноз. Для этого преобразуем имеющийся временной ряд с помощью методов сезонной композиции. Данный анализ расположен: «Анализ» а «Углубленные методы анализа» а «Временные ряды и прогнозирование». Далее необходимо выбрать «Сезонная декомпозиция» (Census1). В появившихся настройках анализа добавим компонент скользящего среднего, в качестве переменной выберем наш временной ряд. Все настройки анализа представлены на рис. 5.
Рисунок 5 -- Настройки сезонной декомпозиции
Выполнив анализ, необходимо перейти к вкладке прогноз, где на основе проведенного анализа отобразим график с преобразованным, временным рядом (на рис. 6 пунктирная, красная линия). Именно преобразованный ряд будет использоваться для анализа АРПСС (ARIMA).
Краткосрочный прогноз. Модель АРПСС (ARIMA)
Рисунок 6 -- График со скользящей средней
Для построения краткосрочно анализа с помощью АРПСС выберем данный анализ во вкладках «Анализ» а «Углубленные методы анализа» а «Временные ряды и прогнозирование». Необходимо выбрать «АРПСС и автокорреляционные функции». Для анализа необходимо задать параметры, приведенные на рис.7.
В графическом виде результат анализа будет выглядеть следующим образом (рис.8). Красной пунктирной линией показан краткосрочный прогноз. Зеленными пунктирными линиями ограничен доверительный коридор, который расширяется, при увеличении периода прогнозирования.
Прогнозирование с помощью нейронных сетей
Одним из способов прогнозирования временного ряда можно рассмотреть нейронные сети. Нейронные сети избавляют нас от необходимости придерживаться определенной сезонной или трендовой модели.
Рисунок 7 -- Параметры прогноза
Рисунок 8 -- График краткосрочного прогноза
Проблемами использования нейронных сетей затрагивалась в различных исследованиях. В.Ю. Осипов показал применение рекуррентной нейронной сети с двумя сигнальными системами [21,22]. В.Г. Манжула и др. [23-25] изучали нейронные сети Кохонена и нечеткие нейронные сети в интеллектуальном анализе данных. Качество восстановления образов искусственной нейронной сетью Хопфилда рассмотрели И.В. Колбасина, Е.Д. Старовойт и С.С. Бежитский [26]. В.А. Седов и Н.А. Седова моделировали расхождения судов в зоне чрезмерного сближения нейронными сетями [27, 28]. Использованием нейронных сетей для оценки уровня заболоченности территории на основе данных дистанционного зондирования занимались А.Д. Варламов и Р.В. Шарапов [30, 31]. Р.И.Баженов и др. [32-35] применили нейронные сети в распознавании образов, прогнозировании.
Для использования нейронных сетей необходимо воспользоваться вкладкой «Анализ» и «Нейронные сети». В появившемся диалоговом окне устанавливаем тип задачи: Временные ряды, в качестве инструмента: Мастер решений (рис. 9).
Рисунок 9 -- Настройка нейронных сетей
В качестве переменной выбираем наш ряд. После нажатия кнопки «ОК», необходимо ввести еще ряд настроек. Окна с настройками представлены ниже (рис. 10, 11, 12).
Рисунок 10 -- Настройка нейронных сетей с помощью мастер решений (1)
Рисунок 11 -- Настройка нейронных сетей с помощью мастер решений (2)
Рисунок 12 -- Настройка нейронных сетей с помощью мастер решений (3)
В следующем этапе предстоит выбрать нейронные сети, наиболее подходящие (рис.13). На вкладке «Быстрый» необходимо выбрать опцию «Итоги моделей». Появившуюся таблицу отсортируем по «Тест. производительности» по возрастанию, выберем три сети с наименьшим показателем, запомним их номера (рис.14).
Во вкладке «дополнительно» выбираем функцию «проекция временного ряда». Выбираем наши нейронные сети из списка, нажав на кнопку «Выбрать модели» (рис. 15).
Для графического отображения прогнозирования необходимо нажать кнопку «График временного ряда» (рис. 16).
Судя по графику, две сети плохо реагируют на данные и скорее всего не справляются с поставленной задачей, поэтому для сравнения будут браться результаты нейронной сети №57, отображенной красной линией на графике.
Сравнение двух методов. Анализ полученных результатов для сравнения проанализируем результаты двух методов (рис. 17,18).
Рисунок 13 -- Результаты по поиску нейронных сетей
Рисунок 14 -- Сортировка и поиск необходимый нейронных сетей
Рисунок 15 -- Список выбранных нейронных сетей
Рисунок 16 -- График временного ряда выбранных нейронных сетей
Рисунок 17 -- Данные с результатом прогноза нейронных сетей
Рисунок 18 -- Данные с результатом прогноза АРПСС (ARIMA)
Для наглядности объединим данные в одну таблицу. Посчитаем разницу между прогнозом АРПСС и нейронной сетью. Так же определим рамки допустимых значений с помощью доверительного коридора АРПСС. Результат отображен на рис. 19.
Рисунок 19 - Итоговое сравнение результатов прогноза
Отметим, что средняя разница в числах равно 2445.65, однако и отметим, что данное отклонение находится в пределах доверительного коридора АРПСС(ARIMA).
При всем при этом необходимо понимать, что прогнозирование не способно решить все возможные проблемы, а наиболее эффективно в комплексе с другими анализами. Так же прогнозирование не учитывает резкого изменения факторов, которые особенно сильно влияют на прогноз. Проведенное исследование может быть использовано в при обучении методам интеллектуального анализа студентов различных направлений [36-38].
Библиографический список
1. Боровиков В.П., Боровиков И.П. STATISTICA статистический анализ и обработка данных в среде Windows. М.: Филинъ, 1997.
2. Халафян А.А. STATISTICA 6. Статистический анализ данных. Учебник. М.: Бином, 2007. 512 с.
3. Большаков П.С. Возможности Statistica Data Miner.
4. STATISTICA (Версия 6.1). Электронное руководство.
5. StatSoft.
6. Попов А.А. Основы проведения факторного анализа социально-экономического развития региона с использованием программного комплекса SPSS (на примере Алтайского края) // Вестник Российского экономического университета им. Г.В. Плеханова. 2010. № 5. С. 81-88.
7. Попов А.А. Проведение факторного анализа экономики региона с использованием программной системы SPSS // В мире научных открытий. 2010. № 2-1. С. 120-124.
8. Остапенко Р.И. Особенности моделирования латентных изменений с помощью AMOS SPSS // Перспективы науки и образования. 2014. № 1 (7). С. 89-95.
9. Остапенко Р.И. Особенности анализа лонгитюдных данных в психолого-педагогических исследованиях с помощью AMOS SPSS // Современные научные исследования и инновации. 2014. № 4 (36). С. 74.
10. Серов А.А. Скоринг экспериментальных данных с применением прогнозных моделей в среде пакета SPSS // Традиции и новации в профессиональной подготовке и деятельности педагога. Материалы Всероссийской научно-практической конференции преподавателей и студентов. Ответственный редактор В.П.Анисимов. Тверь: Тверской государственный университет, 2013. С. 53-54.
11. Суслов С.А. Кластерный анализ: сущность, преимущества и недостатки // Вестник НГИЭИ. 2010. Т. 1. № 1. С. 51-57.
12. Демин Л.А., Суслов С.А., Экономико-математические методы моделирования экономических систем: учебно-методическое пособие./Л. А. Демин. Княгинино: Нижегородский государственный инженерно экономический институт, 2006. 56 с.
13. Муллинов Д.О., Баженов Р.И. Разработка в среде EVIEWS регрессионной модели рынка гаражных помещений г. Биробиджана //Nauka-Rastudent.ru. 2015. № 1 (13). С. 43.
14. Лагунова А.А., Баженов Р.И. Разработка в среде GRETL регрессионной модели рынка вторичного жилья г. Биробиджана // Nauka-Rastudent.ru. 2015. № 1 (13). С. 40.
15. Пронина О.Ю., Баженов Р.И. Исследование методов регрессионного анализа программной среды EVIEWS // Nauka-Rastudent.ru. 2015. № 1 (13). С. 45.
16. Баженов Р.И., Векслер В.А., Гринкруг Л.С. RFM-анализ клиентской базы в прикладном решении 1С:Предприятие 8.3 // Информатизация и связь. 2014. № 2. С. 51-54.
17. Пивенко К.А., Баженов Р.И. Построение регрессионной модели в среде GRETL на примере рынка поддержанных автомобилей г. Биробиджана и г. Хабаровска // Экономика и менеджмент инновационных технологий. 2015. № 4-1 (43). С. 72-80.
18. Эм А.А., Баженов Р.И. Разработка в среде EVIEWS регрессионной модели реализации продукции компании по производству резинометаллических изделий // Экономика и менеджмент инновационных технологий. 2015. № 4-2 (43). С. 58-709.
19. Муллинов Д.О., Винокуров А.С., Баженов Р.И. Разработка в среде SPSS регрессионной модели рынка автомобилей // Nauka-Rastudent.ru. 2015. № 6 (18). С. 24.
20. Широкова Н.А., Баженов Р.И. Применение корреляционного анализа для исследования данных спортивных показателей студентов в среде SPSS // Nauka-Rastudent.ru. 2015. № 6 (18). С. 25.
21. Осипов В.Ю. Рекуррентная нейронная сеть с двумя сигнальными системами // Информационно-управляющие системы. 2013. № 4 (65). С. 8-15.
22. Осипов В.Ю. Нейронная сеть с прошедшим, настоящим и будущим временем // Информационно-управляющие системы. 2011. № 4. С. 30-33.
23. Манжула В.Г., Федяшов Д.С. Нейронные сети Кохонена и нечеткие нейронные сети в интеллектуальном анализе данных // Фундаментальные исследования. 2011. № 4. С. 108-114.
24. Манжула В.Г. Оценка интегральной избыточности в процессе синтеза микроэлектронных систем // Современные проблемы науки и образования. 2011. № 4. С. 33.
25. Манжула В.Г. Информационная поддержка синтеза схемотехнически интегрированных принципиальных электрических схем // Научно-технические ведомости Санкт-Петербургского государственного политехнического университета. Информатика. Телекоммуникации. Управление. 2012. Т. 2. № 145. С. 144-150.
26. Колбасина И.В., Старовойт Е.Д., Бежитский С.С. О качестве восстановления образов искусственной нейронной сетью Хопфилда // Решетневские чтения. 2013. Т. 2. № 17. С. 26-27.
27. Седов В.А., Седова Н.А. Моделирование расхождения судов в зоне чрезмерного сближения нейронными сетями // Научные проблемы транспорта Сибири и Дальнего Востока. 2014. № 3. С. 102-105.
28. Седов В.А., Седова Н.А. Гибридная система управления судном // Научно-технический вестник Поволжья. 2013. № 2. С. 204-207.
29. Варламов А.Д., Шарапов Р.В. Использование нейронных сетей в задачах мониторинга экзогенных процессов дистанционными методами // Геоинформатика. 2014. № 4. С. 62-68.
30. Варламов А.Д., Шарапов Р.В. Использование нейронных сетей для оценки уровня заболоченности территории на основе данных дистанционного зондирования // Нейрокомпьютеры: разработка, применение. 2015. № 3. С. 29-33.
31. Варламов А.Д. Использование априорной информации о месторасположении объектов лица для оценки его биометрических признаков нейронной сетью // Нейрокомпьютеры: разработка, применение. 2015. № 3. С. 34-38.
32. Николаев С.В., Баженов Р.И. Распознавание образов с помощью нейронных сетей в среде MATLABR2009B // Nauka-Rastudent.ru. 2015. № 1 (13). С. 44.
33. Ступников А.В., Баженов Р.И. Прогнозирование цены легковых автомобилей с помощью нейронных сетей в среде Neural Network Wizard // Современная техника и технологии. 2015. № 7
34. Баженов Р.И. Информационная безопасность и защита информации: практикум. Биробиджан: Изд-во ГОУВПО «ДВГСГА», 2011. 140 с.
35. Баженов Р.И. Интеллектуальные информационные технологии. Биробиджан: ПГУ им. Шолом-Алейхема, 2011. 176 с.
36. Баженов Р.И. О применении балльно-рейтинговой системы для оценивания курсовых работ по дисциплине «Интеллектуальные системы и технологии» // Приволжский научный вестник. 2014. № 5 (33). С. 135-138.
37. Баженов Р.И. Проектирование методики обучения дисциплины «Интеллектуальные системы и технологии» // Современные научные исследования и инновации. 2014. № 5-2 (37). С. 48.
38. Баженов Р.И. Проектирование методики обучения дисциплины «Информационные технологии в менеджменте» // Современная педагогика. 2014. № 8 (21). С. 24-31.
Размещено на Allbest.ru
...Подобные документы
Исследование общих сведений о медицинских экспертных системах, способных заменить специалиста-эксперта в разрешении проблемной ситуации. Обучение искусственных нейронных сетей в программе Statistica 7. Обзор программной реализации модуля кластеризации.
дипломная работа [5,9 M], добавлен 14.06.2012Общее описание программы Statistica. Архитектура и интерфейс системы. Регрессионный анализ в Statistica. Решение задачи регрессионного анализа с помощью пакета анализа данных табличного процессора MS Excel. Многомерный дисперсионный анализ в SPSS.
курсовая работа [2,4 M], добавлен 22.01.2013Нейронные сети как средство анализа процесса продаж мобильных телефонов. Автоматизированные решения на основе технологии нейронных сетей. Разработка программы прогнозирования оптово-розничных продаж мобильных телефонов на основе нейронных сетей.
дипломная работа [4,6 M], добавлен 22.09.2011Ознакомление с основами программного пакета Statistica. Описание статистики и графики. Группировка данных, корреляции, методы множественной регрессии. Рассмотрение набора непараметрических статистик. Реализация дисперсионного и ковариационного анализа.
контрольная работа [544,5 K], добавлен 09.06.2015Классификация задач DataMining. Создание отчетов и итогов. Возможности Data Miner в Statistica. Задача классификации, кластеризации и регрессии. Средства анализа Statistica Data Miner. Суть задачи поиск ассоциативных правил. Анализ предикторов выживания.
курсовая работа [3,2 M], добавлен 19.05.2011Применение нейрокомпьютеров на российском финансовом рынке. Прогнозирование временных рядов на основе нейросетевых методов обработки. Определение курсов облигаций и акций предприятий. Применение нейронных сетей к задачам анализа биржевой деятельности.
курсовая работа [527,2 K], добавлен 28.05.2009Создание макроса на языке Statistica Visual Basic (SVB) для проверки гипотезы о нормальности остатков множественной регрессии. Возможности программирования на языке SVB в пакете STATISTICA. Проверка гипотезы в модели вторичного рынка жилья в г. Минске.
курсовая работа [573,1 K], добавлен 02.10.2009Описание деятельности фирмы Rep’S, анализ существующих процессов. Разработка новой технологии продаж продукции. Выбор архитектуры для реализации информационной системы. Выбор программного обеспечения. Оценка эффективности разработанного проекта.
курсовая работа [1,8 M], добавлен 18.12.2011Проверка наличия линейной связи между соответствующими показателями деятельности коммерческих банков Украины в модуле Multiple Regression ППП Statistica. Расчет теоретических значений зависимой переменной и ошибки модели, вид графика линейной функции.
лабораторная работа [1,5 M], добавлен 19.05.2011Создание модели бизнес-процессов "Распродажа" в ВPwin. Цели и правила распродажи. Прогнозирование бизнес-процессов ППП "Statistica". Методы анализа, моделирования, прогноза деятельности в предметной области "Распродажа", изучение ППП VIP Enterprise.
курсовая работа [2,4 M], добавлен 18.02.2012Разработка системы прогнозирования временных рядов динамики продаж товаров с учетом факторов влияния ForExSal, предназначенной для определения краткосрочного прогноза предполагаемого спроса. Анализ концептуальной и функциональной схемы работы системы.
отчет по практике [1,9 M], добавлен 27.03.2011Модели оценки кредитоспособности физических лиц в российских банках. Нейронные сети как метод решения задачи классификации. Описание возможностей программы STATISTICA 8 Neural Networks. Общая характеристика основных этапов нейросетевого моделирования.
дипломная работа [1,4 M], добавлен 21.10.2013Исследование задачи и перспектив использования нейронных сетей на радиально-базисных функциях для прогнозирования основных экономических показателей: валовый внутренний продукт, национальный доход Украины и индекс потребительских цен. Оценка результатов.
курсовая работа [4,9 M], добавлен 14.12.2014Рассмотрение основных понятий защиты информации в сетях. Изучение видов существующих угроз, некоторых особенностей безопасности компьютерных сетей при реализации программных злоупотреблений. Анализ средств и методов программной защиты информации.
дипломная работа [1,5 M], добавлен 19.06.2015Анализ методов и средств выявления мнений пользователей социальных сетей. Обзор средств мониторинга и анализа, подбор необходимого программного обеспечения и технических средств. Разработка архитектуры базы данных, реализация программных модулей.
дипломная работа [3,7 M], добавлен 19.01.2017Разработка клиент-серверного приложения, определяющего объемы закупок товаров; автоматизация построения тренда с целью уменьшения затрат времени на прогнозирование объемов продаж. Программная реализация: структура базы данных, интерфейс программы.
курсовая работа [3,0 M], добавлен 23.05.2013Изучение возможностей среды статистических вычислений R для классификации многомерных неоднородных ассиметричных данных с помощью Expectation-Maximization (EM) алгоритмов. Использование R для анализа модели смеси вероятностных распределений (FMM).
реферат [1,8 M], добавлен 09.12.2014Анализ бизнес-ситуации в области продаж сканеров в г. Днепропетровске. Прогнозирование стоимости сканеров на период исследования и на неделю вперед с помощью функции MS Office Excel "ПРЕДСКАЗ". Использование формул для автоматизации процесса вычислений.
курсовая работа [314,9 K], добавлен 16.08.2010Расчет двигателя 8R32D в программной среде "Дизель РК". Параметры цилиндро-поршневой группы, газораспределения, топливной аппаратуры, наддува. Описание и принцип действия турбокомпрессора. Определение оптимального значения коэффициента избытка воздуха.
курсовая работа [2,5 M], добавлен 29.04.2013Огляд особливостей інтерфейсу та можливостей програми Statistica 8.0. Використання гістограм, діаграм розсіювання та графіків у суспільно-географічних дослідженнях. Двомірний візуальний аналіз даних як способів відображення та систематизації інформації.
курсовая работа [3,2 M], добавлен 19.11.2013