Анализ продаж и прогнозирование в сфере производства продовольственной продукции
Переход экономики на формат рыночных отношений - причина перемен в экономической сфере функционирования российских предприятий. Налог на прибыль - прямой сбор, величина которого прямо будет зависеть от конечных финансовых результатов работы фирмы.
Рубрика | Экономика и экономическая теория |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 26.12.2019 |
Размер файла | 419,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
Размещено на http://www.allbest.ru
Введение
Переход экономики РФ на формат рыночных отношений и связанное с этим появившееся многообразие форм собственности кардинальным образом поменяли информационную, правовую и экономическую среду функционирования предприятий. Преобразования коснулись всех сторон. В регулировании и ведении бизнеса предприятия обрели независимость, возможность владеть резервами и конечными итогами труда и нести всю полноту экономической ответственности за выбранные решения. В этих условиях процветание и коммерческий успех предприятия во многом зависят от того, какова его эффективность деятельности. Окончательную денежную оценку разных сторон финансовой и производственной деятельности предприятия можно получить на основе совокупности различных показателей, формирующих финансовый результат. Финансовый результат деятельности предприятия характеризуется показателями прибыли (убытка). Без прибыли предприятие не может прогрессировать в рыночной экономике, исключением могут являться организаций, финансируемые за счёт государства или других источников. Следовательно, задача увеличения финансового результата жизненно необходима для хозяйствующего субъекта. Для выявления возможности улучшения финансового положения будет применяться анализ финансовых показателей и по результатам расчётов приниматься экономически обоснованные решения. Благодаря прибыли осуществляется также часть обязательств предприятия перед бюджетом, банками и другими организациями. показывают Степень финансового роста и деловой активности компании характеризуют данные о прибыли.
По прибыли также можно определить уровень отдачи авансированных средств и рентабельность вложений в активы нынешнего предприятия. Уменьшение убытков и максимизация прибыли и будут являться первостепенными задачами предприятия. Для решения данной задачи требуется умение анализировать хозяйственную деятельность организации, владеть знаниями о механизме формирования прибыли; уметь обнаруживать и измерять факторы, оказывающие влияние на конечный итог деятельности и анализировать потенциальный его рост, прогнозировать рост компании в своей сфере. Одним из главных показателей эффективности деятельности предприятия будет являться величина чистой прибыли, характеризующая рентабельность работы компании на российском рынке.
Постановка задачи.
Целью данной работы является построение автоматизированной системы прогнозирования прибыли для предприятия-производителя продуктов питания, используя алгоритмы машинного обучения. Для достижения поставленной цели, необходимо решить следующие задачи:
1) Рассмотреть теоретические основы формирования и планирования прибыли на предприятии.
2) Изучить существующую литературу по данной теме
3) Проанализировать динамику продаж и выявить причины увеличения или уменьшения спроса на продукцию
4) Сформулировать факторы, влияющие на прибыль.
5) Выявить лучший алгоритм для прогнозирования прибыли, сравнив результаты работы нескольких алгоритмов с реальными данными.
6) Оценить перспективы анализа в данной сфере деятельности.
Главными источниками информации для анализа финансовых результатов будут являться данные бухгалтерского учёта и бухгалтерской (финансовой) отчётности.
Степень решённости проблемы. На текущее состояние есть множество исследований, которые охватывают широкую проблематику, начиная от теоретических проблем методологии построения алгоритмов и заканчивая проблемами прикладного порядка. Т.к. эта область будет находиться на стыке нескольких областей, таких как математика, программирование и экономика, то имеется возможность применения смежных областей знаний. Могу сказать, что при весьма обширном освещении этой темы, комплексных работ, хорошо раскрывающих полный процесс от формирования теоретической модели, до конечного программного продукта практически нет.
Предметом исследования являются процессы планирования и формирования прибыли на предприятии.
Обзор литературы.
В данной работе будет рассматриваться применение классификаторов машинного обучения для анализа «сырых» данных и составления прогноза прибыли определённого предприятия.
В книге [1] СОДЕРЖИТСЯ информация о методах формирования выборки для обучения, а также подробно описывается структуры нейросети. В книге [4] раскрывается понятие прибыли предприятия, а также её составляющей в виде чистой прибыли организации. В курсе лекций Воронцова [5] представлены теоретические описания алгоритмов и методов обучения.
В книге [7] рассмотрены основные преимущества применения к вычислениям языка Python, подробно описан модуль Scikit-learn и библиотеки, содержащиеся в нем: matplotlib (библиотека для рисования графиков в Python), NumPy - средство интеллектуальной обработки данных. В книгах [10] и [14] рассматривается алгоритм Tensorflow c подключаемой библиотекой Keras. В них представлен принцип работы алгоритма от Google и его основные преимущества, по сравнению с остальными классификаторами. В книге [7] рассказывается о принципе работы многомерной регрессии. Детально описывается каждый шаг в прогнозе таким методом.
1. Теоретические основы формирования прибыли, влияние факторов на неё и разбор основных методов прогноза данных
1.1 Основные определения
Многочисленные исследования на предмет изучения соразмерности прибыли, подсчитанной в бухгалтерском учете, её экономической составляющей, дали толчок к классифицированию таких понятий как прибыль «экономическая» и «бухгалтерская». В данной работе будет рассматриваться "бухгалтерская " прибыль. Под бухгалтерской прибылью понимается прибыль, исчисленная в аналогии с действующими правилами в бухгалтерском учете, указывается в отчёте о прибылях и убытках как разница между доходами и расходами, признаваемыми в отчетном периоде.
Прибыль - это превышение доходов над расходами. Обратное будем называть убытком. рыночный прибыль финансовый
Расходами предприятия будем признавать уменьшение экономических выгод в результате выбытия активов (денежных средств, иного имущества) и (или) появления обязательств, которое приводит к уменьшению капитала этой организации, за исключением уменьшения вкладов по решению участников (собственников имущества). [4]
Коммерческие расходы - это совокупность затрат, которые возникают после сдачи готовой продукции на склад и происходящих до сбыта. Торговые предприятия включают сюда и затраты общехозяйственного характера (административные, управленческие).
Управленческие расходы - это очень важные для управления предприятием средства, составляющие часть текущих расходов и влияющие на формирование себестоимости продукции.
Налог на прибыль - это прямой налог, величина которого прямо будет зависеть от конечных финансовых результатов работы предприятия.
Теоретической базой экономического анализа финансовых результатов деятельности предприятия, будет является принятая для всех предприятий, независимо от форм собственности, единая модель хозяйственного механизма в условиях рыночных отношений, которая будет основана на формировании прибыли (см. рис. 1). Эта модель отражает присущее всем предприятиям единство: целей деятельности, показателей финансовых результатов деятельности, процессов формирования и распределения прибыли, систем налогообложения. Основной источник доходов предприятия - доход от продажи продукции, а конкретно только та её часть, которая осталась за вычетом трудовых, денежных и материальных затрат на производство и реализацию продукции. [16]. Финансовый результат от экономической деятельности предприятия будет выражаться в двух показателях: прибыль от продаж и валовая прибыль. Валовую прибыль будем рассчитывать, как разность между доходом от продаж и себестоимостью реализованной продукции. Прибыль от продаж будет формироваться, как разность между выручкой от продаж и полной себестоимостью реализованной продукции, и будет включать в себя себестоимость реализованной продукции, управленческие и коммерческие расходы.
Рис. 1. Модель хозяйственного механизма предприятия, основанная на формировании прибыли
Финансовый результат от всех видов обычной деятельности также выражается двумя показателями: прибылью до налогообложения (разность между доходами и расходами от основной производственной, финансовой или инвестиционной деятельности) и прибылью после налогообложения.
Итоговым финансовым результатом деятельности предприятия будет являться чистая прибыль.
Машинное обучение (Machine Learning) -- узкоспециализированная область знаний, которая входит в состав главных источников технологий и методов, используемых в областях огромных данных и интернета вещей, изучающая и разрабатывающая алгоритмы автоматизированного отделения знаний из простого набора данных, обучения программных систем, на основе обретённых данных, генерации прогнозных и/или постановляющих рекомендаций и т.д. Главная идея МО в том, что имеется возможность создавать алгоритмы, которые будут сами обучаться на предоставленных сырых данных и в итоге создавать свои прогнозы.
Существует 3 основных вида МО:
Обучение с учителем. Когда подаются данные и правильные результаты, задача машины в том, чтобы обучиться на этих примерах и смогла выдать осмысленный результат для данных, с которыми прежде не была знакома.
Обучение без учителя. Когда подаются только «сырые» данные. И машина должна определить зависимость и вывести результат без посторонней помощи.
Есть ещё такой вид, как обучение с подкреплением, в таком случае машина ведёт себя как агент, который общается с внешним миром и пытается найти способы поведения, приносящие отличный результат.
Модель - это упрощенный образ объекта из реальной жизни, отражающий его наиболее нужные характеристики, с точки зрения исследования.
Прогнозирование -- это предсказание (предвидение), предполагающее состояние или представление, желаемых или вероятных сторон, решений, состояний, проблем будущего.
Прогноз -- это исходный результат процесса прогнозирования, выражающейся в словесной, графической, математической или другой форме суждения о допустимом состоянии объекта и его среды в дальнейший период времени.
Метод - это путь, метод достижения цели, исходящий из знания в наибольшей степени общих закономерностей. Замысловатый прием, высокоупорядоченная совокупность элементарных приемов, направленных на создание прогноза в целом;
Методика - определенное сочетание приемов (способов) выполнения прогностических операций, получение и обработка информации о будущем на основе однородных методов разработки прогноза.
Методология прогнозирования - раздел знаний о способах, методах, системах прогнозирования.
Система прогнозирования - это специализированная и организованная для прогнозирования сложных процессов или явлений совокупность технических средств, методик.
Тренд (тенденция) -- долгосрочная тенденция преобразования исследуемого временного ряда.
Временной ряд - числовые величины определенного статистического показателя в градационные периоды или моменты времени.
Коэффициент сезонности - значения, на которую + / - продажи в сравнении со средними в определённую часть времени.
Регрессионный анализ -- это статистическая способность влияния какого-то числа независимых переменных на зависимую переменную . Ур-е линейной регрессии:
где: и , оценённые коэффициенты регрессии. Если знак при коэффициенте регрессии +, то связь зависимой переменной с независимой будет положительной. Если знак при коэффициенте регрессии -, то связь зависимой переменной с независимой является отрицательной (обратной). Коэффициент регрессии показывает, на сколько в среднем изменяется величина результативного признака y при изменении факторного признака х на единицу
Регрессия -- функция, допускающая по усреднённой величине одного признака определять среднюю величину иного признака, корреляционно связанного с первым.
Корректный подход к оценке метода прогнозирования будет включать несколько этапов:
детальное изучение природы исследуемого процесса или объекта для выбора оптимальных методов прогнозирования;
для создания прогнозов и для проверки итоговых результатов берётся выборка двух групп среди доступных данных;
уточнение исходных данных с целью выявления ошибок;
оценка достоверности и разработка прогнозов полученных результатов;
применение (интерпретация) выведенных результатов и выполнение, при необходимости, дополнения и уточнения прогнозов.
Категории методов прогнозирования
Качественные методы прогнозирования -- субъективны, будут основаны на мнениях клиентов, экспертов. Используются при отсутствии исторических данных. Такие методы применимы, для среднесрочных и долгосрочных решений. Примерами качественных методов прогнозирования могут являться исследование рынка, метод Делфи, историческая аналогия жизненного цикла и т.д.
Количественные модели прогнозирования в виде функции от исторических данных обычно используются для прогнозирования будущих данных. Используются, когда исторические числовые данные доступны и будет ожидаться сохранность динамики данных в будущем. Такие методы, обычно, применимы для среднесрочного и краткосрочного прогнозирования. В качестве примеров количественных методов прогнозирования можно выявить: скользящие средние, Метод опорных векторов, Дерево решений, мультипликативные сезонные индексы и т.д.
Для данной работы подходят только количественные модели прогнозирования.
1.2 Факторы, влияющие на уровень продаж
На величину прибыли и ее динамику воздействуют факторы, как зависимые, так и не зависимые от усилий предприятия. Фактически вне сферы воздействия предприятия находятся конъюнктура рынка, уровень цен на потребляемые материально-сырьевые и топливно-энергетические ресурсы, нормы амортизационных отчислений. В известной нам степени зависят от предприятия такие факторы, как уровень цен на продаваемую продукцию и заработная плата. К факторам, зависящим от них, относятся уровень хозяйствования, компетентность руководства менеджеров, конкурентоспособность выпускаемой продукции, организация труда и производства, его производительность, эффективность и состояние финансового и производственного планирования. [31, с. 89]
Прибыль от реализации продукции, работ, услуг занимает наибольший удельный вес в структуре валовой прибыли организации. Ее величина формируется под воздействием ряда факторов, важнейшими из которых являются: себестоимость, объем реализации, структура реализуемой продукции, уровень действующих цен.
Факторы, влияющие на продажи в рассматриваемом случае:
1) Стоимость сырья - Владелец предприятия не может регулировать это ценообразование. Но в его компетенции сменить поставщика сырья, учитывая другие нюансы.
2) Наличие праздничных дней в рассматриваемом периоде - очень важный фактор для анализа именно на пищевых предприятиях. Когда праздник выпадает на выходные и предвыходные дни (пятница, суббота или воскресенье), прибыль увеличивается в несколько раз.
3) Погода или Сезонность. Немаловажный фактор для данной отрасли бизнеса. Может диктовать политику продаж в данный день или период.
4) Курсы Валют - иногда может сильно влиять на стоимость закупаемого сырья. Но всё же о нём стоит упомянуть.
5) Выплата различных денежных пособий гражданам - основываясь на проведенном анализе, замечена тенденция увеличения затрат на покупки в начале месяца. Так как около 35% людей в России получают социальные выплаты (не учитывая пенсии по старости), которые приходятся в основном на конец календарного месяца.
6) Инфляция. Очень важно разделять реальный процент инфляции от официального. По проведённому анализу реальная инфляция по стране около 15-20%.
7) Экономическая обстановка (экономический кризис, например) - с 2012 года доходы населения падают и в 2018 году, этот показатель сравним с 2008 годом. 8) Зависимость от величины налогов в РФ. В наше время практически каждый год вводится новый налог или повышается налоговый тариф. Учитываются в нашем случае такие налоги как: НДС - 18%; Налог на прибыль - 20%; Налог на имущество - 2,2%; выплаты в ПФР - 22%.
2. Обзор алгоритмов и практическая реализация
2.1 Немного о предприятии
В рамках объекта исследования мною было выбрано предприятие ЗАО «Зеленокумский Хлебозавод». Основано в 1968 и является одним из самых старейших предприятий города Зеленокумска. Зарегистрирована компания 6 июля в 1993 году в Инспекции МНС России по Советскому району Ставропольского края. 28 декабря 1998 года зарегистрирована Советской районной государственной администрацией Ставропольского края.
Основным видом деятельности предприятия является «Производство хлеба и мучных изделий не длительного хранения»
Организация также осуществляет деятельность по следующим неосновным направлениям: «Прочая розничная торговля в неспециализированных магазинах», «Розничная торговля хлебом и хлебобулочными изделиями».
Основная отрасль компании - «Хлебопекарная промышленность»
Главным органом управления ЗАО «Зеленокумский Хлебозавод» значится генеральный директор. В его задачах осуществляются вопросы выполнение и разработки целей, стратегии их достижения, а также руководство нынешней работой фирмы, распоряжение имуществом, приём и увольнение персонала.
Обладая хорошей ликвидностью такой рынок будет являться прекрасной модельной площадкой для применения численных методов.
2.2 Обзор применяемых алгоритмов ML
Градиентный бустинг: принцип метода и особенности реализации в xgboost.
Библиотека xgboost написана на C++ и может применяться как автономно (с помощью интерфейса командой строки), но и при помощи библиотек-интерфейсов для R, Python, Julia и Scala.
Идея градиентного бустинга заключается в выстраивании ансамбля последовательно детализирующих друг друга элементарных моделей. Так n-ная элементарная модель будет обучаться на “ошибках” ансамбля из n-1 моделей, ответы моделей продумано суммируются. “Ошибки” тут как таковой и нету, ведь известно,что любая последующая модель будет приближать антиградиент функции потерь, который не обязан буть равным разности фактических значений и предсказанных (т.е. ошибке в дословном смысле). Разные функции потерь будут иметь различные производные, но для среднеквадратичной функции потерь, заданной как
антиградиент (производная с обратным знаком) это разность между фактическими и предсказанными величинами:
Далее в качестве более усложнённого примера рассмотрим логистическую функцию потерь. Элементарная модель называется элементарной совсем не потому, сильно простая, как например неглубокое решающее дерево. Под элементарностью понимается допустимость присутствия модели в роли составляющей части модели наиболее высокого порядка, в нашем случае - модели градиентного бустинга.
Бустить можно много моделей - общие линейные, K-ближайших соседей, деревья решений и другие, например, на StackOverflow в одном из ответов упоминался бустинг нейросетей с 5ю скрытыми слоями. То есть ограничений на сложность модели нет, будет лишь общая для МО дилемма смещения-дисперсии (bias-variance tradeoff): модель обязана быть довольно гибкой, для восстановления отыскиваемой зависимости, но может позволить себе не переобучаться.
Распространена элементарная модель в градиентном бустинге также, как и weak learner (абстрактный и непереводимый термин). К характерностям реализации бустингового алгоритма в xgboost относится использование вдобавок к 1ой ещё и 2ой производной от функции потерь, наличие встроенной регуляризации, и возможность задавать пользовательские функции потерь и метрики качества. Первая сугубо техническая особенность увеличивает эффективность алгоритма. Встроенная регуляризация содействует борьбе с переобучением: на следующей итерации решающее дерево не будет строиться до максимальной глубины, если это будет минимально повышать качество модели ценой её весомого усложнения.
В конечном счёте, в качестве функции потерь пользователь, может задать любую функцию, у которой имеется непрерывная 1ая и 2ая производная. Множественная (линейная) регрессия.
Многомерная линейная регрессия
Линейная регрессия использует простой функционал качества - среднеквадратичную ошибку. Нам предстоит работа с выборкой, содержащей 10 признаков. Для настройки параметров (весов) модели решается следующая задача:
(++ +…+)-
где,... - значения признаков -го объекта, - значение целевого признака -го объекта, - число объектов в обучающей выборке.
Многомерная линейная регрессия, называется также множественной линейной регрессией. Начнём с постановки задачи, рассчитаем целевую функцию и в конце выведем решение.
Пусть имеется массив входных переменных:
X = x1, x2, …, xN.
Где любое xi - вектор размерности D.
Любое входящее xi равен 2. Притом исходящие данные Y = y1, y2, …, yN остаются скалярными величинами.
Обычно, входные данные X отображаются в виде таблицы или матрицы с N строк и D столбцов, то есть размерности NxD. Каждый ряд - это итог одного наблюдения. Любой элемент матрицы xij - это наблюдение i при размерности j, где i=1..N и j=1..D.
Для множественной линейной регрессии
Y = w1x1 + w2x2 + … + wDxD.
Можно записать:
y = wTX.
Следует помнить, что в случае простой линейной регрессии, кроме того, имелся и свободный член b, характеризовавший точку пересечения искомой прямой с осью y. В случае множественной регрессии для этого вводится новая переменная x0 и устанавливается её величина, равной единице:
Y = w0 + w1x1 + … = w0x0 + w1x1 + … = wTX.
Целевая функция останется такой же, что и раньше. Но y теперь будет немного другая:
Необходимо найти частные производные и приравнять их к нулю. Т.е. найти D производных и получить D уравнений с D неизвестными:
Поскольку
wTxi = w0xi0 + … + wjxij + ,,, + wDxiD,
то получается:
Таким образом:
,
В обоих частях уравнения находятся скалярные числа. Перепишем ур-е в матричной форме
xijTy = wT(XTxij).
Запишем уравнение в матричной форме.
= wT
ещё раз транспонируем правую часть. При транспонировании всё меняю местами и итоговый результат получается в виде:
[wT]T = .
найдём искомое .
,
Это решение уравнения множественной линейной регрессии.
В библиотеках Python есть специальные функции для решения уравнений вида Ax=b. При программировании обозначу:
A=, x= и b=.
Наивный Байесовский алгоритм
Наивный метод основан на предположении, что будущее лучше всего характеризуется последними изменениями. Метод основывается на предположении о том, что прогнозируемые показатели в будущем периоде равны показателям предшествующего периода. Наивный прогноз понятен, прост в подготовке, быстр в реализации, не требует, фактически, никаких затрат. Наивный байесовский алгоритм - это алгоритм классификации, который основан на теореме Байеса с допущением о независимости признаков. Другими словами, НБА будет предполагать, что существование какого-либо признака в классе не связано с наличием какого-то либо иного признака. В связи с таким предположением алгоритм именуется «наивным». Модели на основе НБА очень просты и полезны при работе с весьма объёмными наборами данных. При такой простоте НБА способен обогнать даже некоторые сложные алгоритмы классификации.
Теорема Байеса даёт рассчитать апостериорную вероятность P(c|x) на основе P(c), P(x) и P(x|c).
Где:
* P(c|x) - апостериорная вероятность текущего класса c (т.е. текущей величины целевой переменной) при данном значении признака x.
* P(c) - априорная вероятность текущего класса. * P(x|c) - правдоподобие, т.е. вероятность текущего значения признака при текущем классе.
* P(x) - априорная вероятность текущей величины признака.
Вид финальной формулы:
Т.е. все что нужно сделать, это вычислить вероятности P(C) и P(x|C). Вычисление этих параметров и называется тренировкой классификатора.
Положительные стороны:
1) Классификация, в том числе многоклассовая, выполняется быстро и легко.
2) Когда предположение о независимости выполняется, НБА лучше работает чем иные алгоритмы, такие как логистическая регрессия (logistic regression), и при этом запрашивает меньший объем обучающих данных.
3) НБА точнее работает с категорийными признаками, чем с непрерывными. Для непрерывных признаков планируется нормальное распределение, что будет являться весьма громким допущением.
Отрицательные стороны:
1) Если в тестовом наборе данных будет присутствовать некое значение категорийного признака, не встречающееся в обучающем наборе данных, тогда модель присвоит нулевую вероятность этому значению и не сможет совершить прогноз. Называется такое явление «нулевая частота» (zero frequency). Эта проблема решается с помощью сглаживания. Например, сглаживание по Лапласу (Laplace smoothing).
2) Может НБА и служит неплохим классификатором, величины спрогнозированных вероятностей не всегда будут достаточно точными. Из-за этого не следует очень полагаться на результаты.
3) Допущение о независимости признаков тоже будет служить ограничением НБА. Наборы полностью независимых признаков будут встречаться очень нечасто в реальности.
4 вида применения НБА:
а) Многоклассовая классификация. б) Классификация в режиме реального времени.
в) Классификация текстов, анализ тональности текста, фильтрация спама.
г) Рекомендательные системы - НБК сочетаемый с коллаборативной фильтрацией (collaborative filtering) будет разрешать получить рекомендательную систему. При помощи методов МО и интеллектуального анализа данных в рамках этой системы новая информация для пользователя будет отфильтровываться на основании его спрогнозированного мнения о ней.
В дальнейшем мною будет использоваться библиотека Scikit-learn.
Она содержит 3 типа моделей на основе НБА:
* Gaussian (нормальное распределение). Такого типа модель применяется в случае непрерывных признаков и говорит, что значения признаков будут иметь нормальное распределение. Используется в работе
* Multinomial (мультиномиальное распределение). Применяется в случае дискретных признаков.
* Bernoulli (распределение Бернулли). Применим в случае двоичных дискретных признаков (принимает только два значения: 0 и 1).
Библиотека TensorFlow и Keras.
TensorFlow - это библиотека с открытым исходным кодом для задач машинного обучения, разработанная Google. С её помощью можно создать и обучить нейронные сети различной архитектуры для распознавания и обнаружения образцов и поиска взаимосвязей. TensorFlow содержит в себе TensorBoard - средство визуализации в браузере для оценивания качества обучения модели.
TensorFlow добивается высокой производительности с помощью распараллеливания задач между графическими и центральным процессорами.
Любое вычисление в TensorFlow рассматривается как граф потока данных, или же как граф вычислений. Граф вычислений будет являться моделью, описывающей последовательность выполнения вычислений. Он состоит из операций (tf.Placeholder), переменных(tf.Variable). В графе проводится вычисление тензоров -- многомерных массивов.
Операции, содержащиеся в грaфах, производятся в сессиях (tf.Session). Есть 2 типа сессий -- интерактивные (tf.InteractiveSession) и обычные. Для вычислений с помощью интерактивной сессии удобно использовать консоль. Сессия сохраняет состoяние переменных (Variables) и очередей (queues). В графе любая вершина будет иметь 0 или больше входов и 0 или больше выходов, и представим в виде реализации операции. Тензоры представимы в виде рёбер графа, а именно массивами произвольного размера. Кроме того, в графе могут содержаться особые вершины-управляющие зависимости (control dependencies). Они указывают на то, что исходный узел должен прекратить выполнение до того, как узел получателя управляющей зависимости начнёт исполняться.
Переменная -- характерный вид операции, возвращающий указатель на постоянно изменяющийся тензор: такая переменная не исчезает после единичного использования графа. Указатели на подобные тензоры будут передаваться многочисленным операциям, изменяющим указанный тензор.
Исключительность Tensorflow состоит в возможности проведения частичных подграфовых вычислений. Это позволяет сделать разбиение нейронной сети, а значит можно использовать распределённое обучение.
Keras - это библиотека, которая позволяет на более высоком уровне взаимодействовать с нейросетями. Упрощает множество задач, применяется в достаточно быстрых экспериментах и заметно уменьшает кол-во однообразного кода. В качестве Back-end библиотеки для вычисления keras применятся tenzorfow и theano.
2.3 Вывод формулы (факторов)
Пч=В, С, КР, УР, Вл.прб., %$, %Eu, ПрОД, ПрОР, н/п, ЧД,
где: В - выручка от сбыта товаров, услуг, продукции, за минусом НДС;
С - себестоимость проданных работ, услуг, продукции, товаров;
КР - коммерческие расходы;
УР - управленческие расходы;
Вл.прб - валовая прибыль
%$ - коэф. Зависимости от доллара
%Eu - коэф. Зависимости от евро
ПрОД - прочие операционные доходы;
ПрОР - прочие операционные расходы;
н/п -налог на прибыль;
ЧД - чрезвычайные доходы;
Это немного видоизменённая факторная модель аддитивного вида, где результативный показатель представим в виде алгебраической суммы нескольких факторных показателей. Определить влияние факторов на прибыль, можно использовав данные отчёта об убытках и прибылях за 2015-2017 год, представленные, например, в следующей табл. для 2017г.
Табл. 1
3. Анализ результатов и итоговые графики и таблицы
В ходе эксперимента было выявлено следующее, сравнив результаты работы четырёх алгоритмов, а именно НБА, Tensorflow c библиотекой Keras, Линейная регрессия и XGboost (градиентный бустинг), приходим к выводу, что лучше всех работает Линейная регрессия.
По графику и результатам работы программы видим, что этот алгоритм, имеет меньшую среднеквадратичную ошибку 1.13. Linear Regression показал более точные прогнозируемые значения для тестовой выборки, разница была менее 1 тыс., как и в сравнении с реальной величиной прибыли, так и для будущего периода работы предприятия имеется почти полное совпадение прогнозируемого значения с реальной величиной (см. в таблицах и графиках ниже). Немного хуже показал себя результат алгоритм от Google -Tensorflow в среднем по выборке наблюдалась небольшая неточность в прогнозах, а среднеквадратичная ошибка - 1132, а в целом прогноз отличался не на критическую величину, а где-то почти совпадал с реальной, но так как данных пока не так уж и много, как хотелось бы, можно сетовать на некоторую неточность в прогнозе данных в алгоритме.
XGboost весьма нестабилен, величина среднеквадратичной ошибки- 6579, то есть показывает немного разные результаты при различном подборе выборки тестовых данных. И огромная величина ошибки этому подтверждение. Но придерживаемся мнения, что при увеличении данных, всё будет исправляться в лучшую сторону.
НБА показал самый неутешительный результат, величина ошибки составила 5305, но, как и с XGboost при различном подборе тестовых величин имеем разные результаты и вдобавок к этому так как в программе почти все факторы берутся зависимыми друг от друга, то этот алгоритм как уже описывалось в прошлой главе будет работать с такими данными чуть хуже.
Но всё это поправимо добавлением новых данных и увеличением числа факторов, влияющих на прибыль предприятия. Можно с уверенностью говорить, что при увеличении данных все алгоритмы в конечном итоге начнут показывать хороший результат. И разница между реальными и прогнозируемыми значениями будет минимальной.
Результат работы программы в таблицах и графиках:
Среднеквадратичные ошибки алгоритмов:
Табл. 2
Прогноз данных для тестовой выборки:
Табл. 3
Рис. 2
Для подкрепления успеха созданной программы были взяты данные о величине факторов предприятия за первые несколько месяцев работы в 2018 году, в консоли приложения вводятся факторы x и не вводится значение y, и машина на основе прошлого своего обучения должна вывести эту прогнозируемую прибыль, как видно на графике результат оказался весьма позитивным. Алгоритм Линейной регрессии показал лучший результат -25.21 (реальные данные - 25) по сравнению с другими классификаторами и оказался очень близким к реальным данным. Алгоритм Tensorflow сработал немного хуже -21.86, но показал 88% результат. А вот классификаторы Xgboost и НБА неоднозначны, сказывается недостаточное для них количество данных для обучения на данный период работы.
Прогноз данных на основе опыта обучения машины:
Табл. 4
Рис. 3
Так же было выведено значение веса каждого фактора. Как мы видим на графике, большее влияние на конечную составляющую прибыли имеет значение «Валовая прибыль» - 196.02 и «Коммерческие расходы» - 263.81. Но если в случае с первым фактором имеется прямо пропорциональная зависимость, то в случае со вторым фактором наблюдается обратно пропорциональная зависимость.
Рис. 4
Затраты на инструментальные программные средства.
Разработка осуществляется на языке программирования Python. Удобной средой для разработки будет являться IDE PyCharm и пользовался Jupyter Notebook для выведения более информативных графиков и таблиц с результатами.
Заключение
В соответствии с поставленной целью мною была разработана и протестирована автоматизированная система прогнозирования прибыли для предприятия пищевой промышленности, которая содержит 4 алгоритма классификации на основе машинного обучения. Также в этой работе приведено сравнение эффективности каждого из протестированных алгоритмов. Предварительно тщательно изучив каждый из алгоритмов Machine Learning выявлены плюсы и минусы каждого и объяснено почему выбраны именно они. Были рассмотрены получившиеся результаты работы и сказано почему получились такие итоговые показатели.
Возможным направлением для дальнейшей работы может быть проведена дальнейшая разработка и улучшение программы для точного прогнозирования прибыли, а также убытков предприятия на долгосрочный период. Также в дальнейшем будет осуществляться доработка программы в таком ключе, чтобы пользователь мог вводить желаемую величину прибыли, а программа могла бы на основе предыдущего обучения выводить величину каждого фактора, чтобы осуществить потребность пользователя.
Литература
1. C. Осовский. Нeйронные сети для обрабoтки инфoрмации. Финанcы и Cтатистика, 2004.
2. Gооgle Rеsearch Team. Tеnsorflow: Large-scale machine learning on heterogeneous distributed systems. arXiv:1603.04467 [cs.DC], 2016.
3. M. Sсhrimpf. Should i use tеnsorflow? arXiv:1611.08903 [cs.LG], 2016.
4. Вакуленко Т.Г., Фомина Л.В. Анaлиз бухгалтерской (финансовой) отчетности для принятия управленческих решений. - Спб.: «Издательский Торговый Дом «Герда», 1999 - 160 с.
5. Машинное обучение (курс лекций, К.В.Воронцов) 2009.
6. Bishop C.M. Pattern Recognition and Machine Learning. -- Springer, 2006.
7. Коэльо Л.П., Ричарт В. Построение систем машинного обучения на языке Python. 2016.
8. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning. Springer, 2014.
9. C. Manning and R. Socher. Лекции Стэнфордского университета по курсу “natural language processing with deep learning”. http://web. stanford.edu/class/cs224n/.
10. Hello, TensorFlow. Библиотека машинного обучения от Google
11. Хейдт М. Изучаем pandas.
12. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction.
13. Кристофер Д. Мэннинг, Прабхакар Р, Х. Шютце. Введение в информационный поиск.
14. Джулли А., Пал С. Библиотека Keras -- инструмент глубокого обучения.
15. Любушин Н.П. Комплексный экономический анализ хозяйственной деятельности / Н.П. Любушин. - 3-е изд. - М.: ЮНИТИ-ДАНА, 2006. - 448 с.
16. Экономический анализ активов организации / под ред. Д.А. Ендовицкого. - М.: Эксмо, 2009. - 608 с.
17. Tianqi Chen, C. Guestrin. XGBoost: A Scalable Tree Boosting System. 2016
Размещено на Allbest.ru
...Подобные документы
Предприятия в период реформ. Экономическая среда и основные цели предприятий. Влияние экономической ситуации на предприятия. Финансы предприятий. Перестройка функционирования, организации и поведения российских предприятий в условиях рынка.
курсовая работа [54,9 K], добавлен 14.03.2004Понятие экономической безопасности и характеристика ее показателей. Анализ экономики России с точки зрения экономической безопасности. Опасность утраты продовольственной независимости страны. Спад производства и потеря рынков. Угрозы в социальной сфере.
курсовая работа [91,1 K], добавлен 29.04.2015Понятие и состав финансовых результатов, этапы их формирования. Экономическая характеристика ООО "Ансант". Общий анализ уровня и динамики финансовых результатов хозяйственной деятельности предприятия, прибыли от продаж продукции и уровня рентабельности.
курсовая работа [88,1 K], добавлен 28.09.2012Понятие фирмы, ее сущность и роль, принятие решения фирмой о вступлении в отрасль. Анализ влияния ценовых изменений на прибыль фирмы. Эффективность деятельности предприятий разной отраслевой принадлежности и различных организационно-правовых форм.
курсовая работа [45,9 K], добавлен 19.08.2009Разработка проекта контракта купли товара. Характеристика коммерческого риска и его оценка. Анализ показателей финансовой устойчивости фирмы, прогнозирование ее финансовых показателей. Расчет объема продаж продукции, прибыли и потока наличности.
контрольная работа [49,5 K], добавлен 28.10.2010Понятие фирмы, ее сущность и роль. Принятие фирмой решения о вступлении в отрасль. Издержки производства, валовой доход и прибыль фирмы. Основные проблемы функционирования фирм в России. Государственная поддержка малого и среднего предпринимательства.
курсовая работа [396,7 K], добавлен 25.11.2014Формирование показателей прибыли. Распределение финансовых результатов предприятия. Горизонтальный и вертикальный анализ прибыли по данным отчета о прибылях и убытках. Факторный рентабельности продаж и затрат, прибыли на примере ОАО "Электростройресурс".
курсовая работа [76,8 K], добавлен 18.05.2008Предприятие как самостоятельный хозяйствующий субъект. Теория фирмы. Факторы производства и эффективное функционирование предприятия в условиях рыночных отношений. Организационные формы предприятий: коммерческие и некоммерческие организации.
курсовая работа [29,7 K], добавлен 18.11.2007Общая характеристика предприятия ООО "СтройЭнергоМонтаж". Анализ производства и реализации продукции (объемов оказываемых услуг, товарооборота). Коммерческая деятельность компании в сфере торговли, ее финансовое состояние (прибыль и рентабельность).
отчет по практике [448,4 K], добавлен 08.12.2014Прибыль в сфере коммерции, ее содержание и значение; порядок формирования финансового результата деятельности предприятия. Анализ показателей финансовых результатов деятельности. Направления улучшения финансовых результатов деятельности предприятия.
курсовая работа [510,8 K], добавлен 14.06.2012Сущность, особенности и принципы организации финансов коммерческих предприятий, их функции. Источники формирования финансовых ресурсов предприятий и направления их использования. Группировка финансовых отношений. Понятие прибыли и рентабельности фирмы.
курсовая работа [20,2 K], добавлен 25.11.2010Структура и порядок формирования финансовых результатов и нераспределенной прибыли. Учет финансовых результатов от продаж и прочей реализации, расчетов по налогу на прибыль. Поиски резервов для увеличения прибыльности предприятия как основная задача.
курсовая работа [41,2 K], добавлен 27.05.2010Показатели состояния и уровня продовольственной ситуации в стране. Механизмы обеспечения продовольственной безопасности в сфере повышения доступности продовольствия. Анализ развития аграрной сферы экономики РФ. Разработка мероприятий по импортозамещению.
курсовая работа [2,1 M], добавлен 25.03.2015Изучение показателей финансовых результатов деятельности предприятия. Факторный анализ прибыли и рентабельности. Решение задач, связанных с затратами на производство и прибылью от продажи продукции. Определение отраслевой структуры численности работников.
курсовая работа [137,0 K], добавлен 15.06.2015Анализ компании ОАО "ЮНИМИЛК": характеристика предприятия, организация производства; повышение экономической эффективности и прогнозирование результатов финансово-хозяйственной деятельности. Бизнес-план по внедрению новой продукции – творожка "Яначка".
курсовая работа [104,8 K], добавлен 24.10.2014Роль рыночных отношений в развитии аграрных рынков. Специфика формирования рыночных отношений в аграрном секторе Республики Беларусь. Динамика производства сельскохозяйственной продукции. Программа по развитию экономики агропромышленного производства.
курсовая работа [139,2 K], добавлен 06.01.2015Условия максимизации экономической прибыли фирмы. Метод совокупных показателей. Величина убытков на единицу продукта. Минимизация убытков. Условие прекращения деятельности. Определение оптимального объема производства в условиях совершенной конкуренции.
курсовая работа [365,3 K], добавлен 14.11.2013Основные показатели финансово-хозяйственной деятельности предприятия: прибыль, выручка от продажи товаров, продукции, работ, услуг и величина имущества (активов, авансированного капитала). Анализ финансовых результатов и рентабельности ООО "ТАЛ-сервис".
дипломная работа [606,8 K], добавлен 05.10.2012Ознакомление с краткой характеристикой рынка продовольственной продукции в России. Исследование динамики физического товарооборота продовольственной продукции по регионам России. Определение задач статистического анализа продовольственной продукции.
курсовая работа [382,0 K], добавлен 16.09.2017Сущность и принципы статистической науки, история ее становления и развития, современные достижения и методики. Анализ числа предприятий отрасли, численности работающих и их структуры, производства продукции и финансовых показателей, прогнозирование.
курсовая работа [443,1 K], добавлен 12.09.2014