Эффективное автоматизированное выявление бизнес-процессов и исходные данные для него

Анализ сетей информационных потоков организации. Критерии оценки качества исходных данных. Определение качества исходных данных и эффективности применения автоматизированного выявления бизнес-процессов на примере процесса "Согласование контрактов".

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 06.11.2015
Размер файла 4,1 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Из описания выбранных для исследования подходов можно сделать вывод о том, что для автоматизированных методов выявления бизнес-процессов характерно три этапа произведения анализа, а именно подготовка данных, алгоритмическая обработка и выведение и интерпретация результатов. Благодаря современным технологиям каждый этап в этих методологиях может быть автоматизирован и практически не требует вмешательства экспертов. Сбор данных запускается автоматически и производится на серверах компании за считанные часы, выбор алгоритма может также определяться программой в зависимости от типа собранных данных, после чего производится анализ и автоматическое выведение полученных результатов в требуемых форматах. Именно к такому уровню автоматизации анализа сегодня стремятся исследователи, так как он позволит решить проблему дороговизны и нехватки временных ресурсов. А возможность выявления и построения карт процессов без участия человека - сделать модель максимально объективной: данные не потребуется передавать из рук в руки и из уст в уста. Решение ресурсной проблемы и возможность непрерывного анализа данных, генерируемых организацией на постоянной основе, позволит изучать деятельность в динамике, вносить изменения в режиме on-line и добиваться лучших результатов. Таким образом, можно заключить, что цель применения автоматизированного выявления бизнес-процессов - описание деятельности организации и построение карт процессов с минимальным привлечением человеческих и временных ресурсов за счет автоматизации.

На основании изученной литературы можно также заключить, какие основные проблемы возникают в ходе применения методов автоматизированного выявления процессов. Такие сложности можно классифицировать соответственно каждому этапу методологий.

Так, ключевыми проблемами этапа сбора данных является недостаточность информации, ее неструктурированное хранение и неподходящий для выбранного алгоритма анализа формат - все это усложняет процесс сбора и предварительной обработки исходных данных, а иногда даже делает невозможным применение необходимого метода [1, 8]. Выбор математического алгоритма, его устойчивость на различных данных, а также универсальность применения, и даже оптимальность исполнения и использования вычислительных мощностей характеризуют этап алгоритмического анализа. И даже подбор нотаций, разрезов отображения и построение карт процессов может составить трудность, в том случае, если выбранные для отображения выводы не могут быть сделаны на основании загруженных данных или с помощью выбранного алгоритма. Кроме того, инструменты и нотации вывода данных должны быть снабжены всеми необходимыми параметрами точечной настройки. То есть в итоге анализа должны быть сгенерированы модели с различной степенью детальности и в различных плоскостях исследованных данных для применения пользователем фильтров. Такой подход к категоризации проблем используют, к примеру, исследователи нидерландского Технологического университета Эйндхофена относительно классификации и определения сложностей применения глубинного анализа.

Чтобы проиллюстрировать принципы глубинного поиска процессов профессор Ван дер Аалст рассматривает различные примеры практического применения этого метода в своих статьях [1,2]. При этом каждый отдельный случай дает разный результат относительно качества созданной модели, что определяется рядом возникающих проблем. Он называет несколько основных трудностей использования автоматизированного анализа журналов событий ИС. Среди них обнаружение «скрытых» и дублирующих друг друга процессов, выявление структур предопределенного выбора, циклов, а также правильного использования временных отметок в логах для установления характеристик того или события.

Отдельными пунктами также выделены проблемы неполноты и шума в исходных анализируемых данных, что особенно сказывается на качестве определяемой модели. Третьим направлением вопросов и сложностей глубинного поиска бизнес-процессов можно назвать выбор техники визуализации результатов анализа и проведения дополнительного исследования с помощью сравнения разработанной модели и заложенных в основу системы нормативных моделей, если таковые имеются [2]. Профессор отмечает, что каждое из этих направлений достойно обширного и глубокого изучения, однако, так как обычно два этапа алгоритмической обработки и визуализации зафиксированы, то именно сбор и подготовка данных, которые в каждом случае будут разными, наиболее часто определяет конечный результат.

Используя описанную категоризацию проблем на пути применения других автоматизированных методов выявления бизнес-процессов, можно сделать вывод о том, что каждый кластер наиболее тесно взаимосвязан именно с предыдущим по очереди реализации этапов метода. Таким образом, исследование проблем эффективного применения автоматизированного анализа деятельности организации необходимо проводить комплексно, начиная с изучения исходных данных. На основании такого вывода и для концентрации на некоторой одной проблеме, целью данного исследования стало изучение лишь определение исходных данных, которые становятся ключом к успешному автоматизированному выявлению бизнес-процессов.

Критерии оценки качества исходных данных для анализа

Несомненно, проблема качества исходных данных для анализа как одна из ключевых решалась изначально, вместе с появлением методик автоматизированного выявления бизнес-процессов. Так, например, в связи с большим влиянием на качество результирующих моделей специалистами были выявлены основные требования к структуре логов для глубинного поиска процессов. На их основе разработаны и продолжают разрабатываться специализированные конверторы для преобразования имеющихся журналов событий в наиболее подходящий для анализа формат. Был даже принят единый формат для использования исследовательской платформы ProM, XES, конвертер в этот формат на сегодняшний день встраивается по умолчанию в доступные для общего пользования инструменты глубинного поиска бизнес-процессов семейства ProM. Однако для анализа сетей информационных потоков и семантического анализа документации общих требований к исходных данным не выработано. Это связано с тем, что используемые алгоритмы не накладывают строгих ограничений в плане формата загрузки и обычно достаточно просто ввести исходный текст документов. Однако такое свободное использование методологий не гарантирует успешного выявления бизнес-процессов, ведь для получения наиболее близкой к реальности карты процесса или статистики необходимо соблюдение и других требований.

Изучение методологий [2, 28, 30], практических примеров их применения [6, 7, 11, 29], а также теоретических основ о процессном подходе и бизнес-анализе позволили сделать выводы о том, какими основными критериями можно воспользоваться для того, чтобы оценить исходные данные для автоматизированного выявления процессов. Часть этих критериев также была почерпнута из требований к данным при использовании классических методов анализа и составления описаний процессов AS-IS [35, 42], однако для успешного проведения оценки данных именно в разрезе их использования для алгоритмической обработки некоторые из них были переформулированы. Ниже перечислены пять основных критериев, высокая оценка данных по которым предположительно должна стать ключом к успешному выявлению бизнес-процессов посредством программных средств.

Полнота

Под полнотой исходных данных для автоматизированного выявления бизнес-процессов исследователи обычно подразумевают достаточный объем зафиксированных фактов, характеризующих процесс, и их подробное описание в некотором едином формате. Важно заметить, что здесь имеет большое значение исследуемый период или версия процесса, так как часто необходимо исследовать только определенную версию процесса, например, последнюю актуальную. Соответственно, полными данными для одной версии будут те, что содержат факты либо всего периода действия этой версии, либо периода, на котором точно были зафиксированы все возможные типы экземпляров процесса. Также полнота означает, что используемые для анализа данные содержат подробное описание каждого этапа процесса, все варианты последовательностей этапов, если такое возможно, а также все параметры для каждого факта.

Так, полнота журнала событий подразумевает, что в нем зафиксированы все этапы процесса, все возможные их комбинации, а также каждому событию создано описание насколько же полное, насколько полно оно сделано для других событий этого журнала. Для текстовых документов же и писем полноту определить несколько сложней, однако в случае, если имеется четкое представление о рамках исследуемой деятельности организации, эксперт без труда сможет также оценить ее. В случае с письмами полной их коллекцией можно считать все сообщения, которые генерировались в ходе процесса всеми его участниками, а для текста достаточной полнотой можно считать наличие информации обо всех классических составляющих процесса: времени и периодичности, инициирующем событии, правиле исполнения, исполняющем и результате.

Иначе говоря, полнота данных для применения методов автоматизированного выявления бизнес-процессов подразумевает наличие записей обо всех этапах каждого возможного в выбранном периоде экземпляра процесса, для каждого упомянутого факта наличие всех необходимых параметров, характеризующих его процесс, наличие всех имеющихся данных о процессе в изучаемом периоде.

Чистота

Другим важнейшим для алгоритмической обработки параметром данных является их чистота, однако данный критерий нуждается в очень подробном пояснении. Исходя из того, что исходные данные должны относиться непосредственно к изучаемом процессу, то чистотой таких данных можно называть отношение зафиксированных данными фактов к исследуемому объекту и отсутствие в них информации побочного характера. Кроме того, учитывая тот факт, что в большинстве случаев исходной информацией являются слова и выражения естественного языка, чистотой таких данных можно называть единообразие языка, использование соответствующих терминов для одного и того же факта или объекта, малое количество символов, несущих какую-либо смысловую нагрузку, в тексте.

В статьях Вила Ван дер Аалста и его коллег также присутствует понятие шума, которое представляется одним из весомых факторов, которые влияют на результаты анализа журналов событий. Что же именно подразумевается под шумом в исходных данных? Шумом для подобных данных является любое отклонение данных от действительного факта, так, например, для журнала событий шумом может считаться незафиксированное действие или зафиксированное позже, с неполной информацией и другими отклонениями от общего формата и правил записи. Для текста на естественных языках шумом можно считать отдельные речевые обороты и другие выбросы, которые содержат смысловую нагрузку, однако не дают алгоритму однозначно интерпретировать содержание. То же может наблюдаться и для стандартов писем, если, например, в череде писем определенного типа, содержания или тона возникают отдельные письма, несущие иную содержательную окраску.

Присутствие шума нарушает семантическую стройность данных. Так наличие записей, которые выполнены некорректно относительно записей о схожих событиях (опечатки, значения, не предусмотренные в данном журнале, нарушение концепции описывающей события спецификации) будут интерпретированы алгоритмом как уникальные, что повышает дисперсию фактов и снижает математическую вероятность найденных закономерностей.

Таким образом, можно сделать вывод, что говоря о таком критерии, как чистота исходных данных для автоматизированного выявления бизнес-процессов, необходимо понимать под этим отсутствие или минимальное присутствие шумов в данных, а также этимологическое, языковое, терминологическое единообразие.

Актуальность

Критерий актуальности является одним из самых простых и наиболее легко ценимых для исследуемых данных, так как за него принимается соответствие даты появления или фиксации данных изучаемому периоду жизни процесса. Так, в случае, если процесс изменяется с течением времени, и у него существуют фиксированные версии, то исследование периода, в который процесс принимал несколько версий, даст информацию о том, каковыми были все актуальные на то время версии. В случае большого количества различных типов экземпляров процессов, множества ветвлений, определение периода создаст вероятность того, что некоторые экземпляры могут не попасть в исследование. Таким образом, все исходные данные должны соответствовать определенному периоду или всему сроку существования процесса, в зависимости от того, что именно является задачей выявления и описания процесса. В случае нашего исследования, актуальными будут данными, вписывающиеся в рамки периода, в котором зафиксирована эталонная карта процесса.

Это связано с тем, что итогом практического исследования должно стать не только построение карты и описания процесса на основании имеющихся данных, но и проведение сравнительного анализа с эталонной картой для выявления расхождений в полученных моделях.

Достоверность

Достоверность представляет собой достаточно широко определяемый критерий, который в первую очередь относится к информационной безопасности и пути сбора данных. Достоверными данными для автоматизированного выявления бизнес-процессов можно считать такие оцифрованные факты, которые с момента их создания или генерации и до алгоритмического анализа не подвергались существенным изменениям содержания и смысла. Так, например, изменение формата письма из MSG в TXT не является критичным в том случае, если вся информация, характерная для первого формата, была транслирована во второй, и текст самого письма не был изменен. То есть в случае использования методов выявления процессов предварительный сбор данных должен в результате предоставлять именно ту информацию и именно в том объеме, в каком она была порождена самим исследуемым процессом, его участниками и средствами. Кроме того, при изучении некоторого конкретного множества процессов необходимо соотнесение предоставляемой для анализа информации и области исследования. Анализируемые данные должны с высокой долей вероятности относиться непосредственно к изучаемым процессам, в противном случае карта и статистические данные хоть и будут построены, однако будут уже не столь точными, так как в их расчете для многих математических алгоритмов играет роль и первоначально загруженный общий объем информации. Таким образом, не следует использовать информацию, которая заведомо может быть недостоверной, то есть, например, старые версии документации или личные письма не рабочей почты. В итоге, говоря о достоверности данных, необходимо оценивать их принадлежность к изучаемому процессу и, конечно же, целостность и безопасность хранения и обработки.

Подходящий формат

О качестве исходных данных для алгоритмической обработки может говорить не только их содержание, но и формат, в котором они могут быть собраны и предоставлены в обработку. Так как автоматизированные методы выявления бизнес-процессов подразумевают использование математических алгоритмов, совсем не последнюю роль для анализа играет ввод данных. В зависимости от программного средства и методологии исходные данные должны представлять собой определенный формат представления фактов о процессе. Так, например, для глубинного поиска процессов необходим журнал событий - коротко зафиксированные отметки об этапах работы обязательно в табличном формате. В таком формате невозможно представить какую-либо административную информацию или текстовые сообщения, так как они носят совсем другой характер и структуру. Для разных же инструментов глубинного анализа потребуются разные табличные форматы, с которыми могут работать те или иные алгоритмы: XLSX, XML или CSV. Это точно таким же образом относится и к инструментам, реализующим принципы других методологий. Возможно, семантический анализ доступен только на определенном языке или только для определенного объема данных. Все эти ограничения, накладываемые инструментами выявления процессов, несут в себе различные трудности их использования, однако никогда не стоит забывать, что практически любой формат может быть каким-либо образом конвертирован в другой. Иногда такие преобразования требуют преобразований в структуре данных, однако основным критерием в предварительной обработке является сохранение достоверности. Таким образом, степень того, подходит ли формат данных для выявления процессов сильно зависит от выбранного инструмента, а также стадии, на которой данный критерий будет оценен. В случае если даже после предварительной обработки данных не удалось добиться единой онтологии и таксономии (для журналов событий) и соответствия формата выбранной методике анализа, автоматизированное выявление бизнес-процессов будет либо неудачным, либо не состоится вообще.

Согласно требованиям к составлению гипотезы, содержащей предположения о критериях для оценки, каждому такому критерию должна быть присвоена шкала оценок с описанием значений и примерами. Для каждого из описанных критериев будет применена шкала оценки в баллах от 1 до 5, значения оценки должны быть выбраны в соответствие со всеми требованиями критериях. Значения каждого из критериев в данном исследовании будут соотнесены с расшифровками критериев, приведенными в таблице 1 ниже, но для других случаев анализа могут быть индексированы в зависимости от условий проведения анализа, имеющихся данных, стадии развития и меры «оцифрованности» процесса.

Так, в итоге произведения анализа исследовательских работ и теоретических трудов об автоматизированных методах выявления процессов, составлена следующая гипотеза. Успешность применения автоматизированных методов выявления бизнес-процессов может быть гарантирована высоким качеством исходных данных, где качество данных может быть оценено по пяти критериям (полнота, чистота, актуальность, достоверность, подходящий формат) по пятибалльной шкале. В случае предположения о том, что каждый из переложенных критериев имеет одинаковую значимость для оценки общего качества данных, для итоговой оценки качества (при ее расчете по принципу системы сбалансированных показателей) 1 набранный балл по любому из критериев будет добавлять до 4% вероятности успешного выявления бизнес-процесса.

Таблица 1. Шкала оценок с расшифровками для каждого из выбранных критериев качества исходных данных для автоматизированного выявления БП

Оценка критерий

1

2

3

4

5

Полнота

Данные содержат непоследовательные, обрывочные записи о процессе. Описание этапов/шагов не содержит описательных параметров (инициирующее событие, исполнители, принцип обработки или регламент, временные рамки, результат и др.), которые могут быть использованы для выявления процесса.

Данные содержат непоследовательные записи о процессе, полнота набора записей о каждом этапе под сомнением. Зафиксированы один или несколько параметров, используемые для описания бизнес-процесса.

Данные содержат последовательные записи о процессе, структурированные в неком едином формате не некоторых промежутках времени. Для некоторых этапов процесса отсутствуют необходимые параметры процесса.

Данные содержат четко структурированные записи о каждом этапе событий с описанием каждого из необходимых для выявления процесса параметров. Период, за которые собраны записи, по мнению экспертов, может не включать все возможные экземпляры процесса. Описание параметров не достаточно подробно.

Данные содержат всю необходимую информацию для выявления всех параметров процесса, структурированы согласно параметру и достаточны для исследования. Данные зафиксированы последовательно для каждого экземпляра процесса в рамках исследуемого периода времени.

Чистота

- Данные носят хаотичный описательный характер,

- содержат информацию не только об исследуемых процессах,

- не структурированы лингвистически,

- в одном и том же описательном массиве использованы разные языки и стили,

- табличный формат или описательные шаблоны не использованы.

- Данные содержат информацию об описываемом процессе и связанных с ним,

- слабо структурированы,

- использованы разные обозначения для одних и тех же терминов,

- присутствуют разные шаблоны в одном и том же описательном массиве.

- Данные описаны с включениями и отступлениями на естественном языке в формате описания фактов,

- существует описанием связанных процессов без определенных связей с исследуемым,

- большинство массивов данных зафиксированы в неком едином формате или использует шаблоны,

- параметры процесса связаны и соединены в текст посредством большого количества связующих слов.

- Данные описаны в формате строгой документации на естественном языке,

- связи со связанными процессами не структурированы относительно этапов процесса,

- для каждого описательного формата использован единый шаблон, - наличие связующих слов, преобладание слов, связанных с ключевыми параметрами процесса.

- Данные содержат только смысловую информацию о процессе и его фактах,

- четко структурированы по этапам,

- приведены в едином формате и терминологии.

- информация о связанных процессах краткая и структурирована по связям с каждым из этапов изучаемого процесса

- для каждого описательного формата/массива использован единый шаблон,

- присутствие слов, слабо связанных с описанием параметров процесса, минимально (минимальный шум).

Актуальность

Данные приведены за неопределенный промежуток времени, не содержат временных меток. Массив данных не может быть оценен экспертами, как относящийся к какому-либо конкретному периоду жизни процесса.

Данные содержат отдельные временные отметки, могут быть отнесены экспертами к какому-либо конкретному периоду жизни процесса.

Большинство записей об этапах процесса содержит временные отметки, что позволяет эксперту точно определить, а аналитику сделать предположение о том, какой период жизни процесса описан. Период, к которому относятся данные, частично совпадает с исследуемым.

Каждая запись или информационный блок содержит хотя бы одну временную отметку (начала/конца), что позволяет четко соотнести все записи с определенным периодом жизни процесса без привлечения эксперта. Период, к которому относятся данные, в достаточно мере совпадает с исследуемым.

Каждая запись или информационный блок содержит несколько временных отметок (начала/конца/необходимой длительности), данные могут быть соотнесены с конкретным исследуемым периодом жизни процесса, как экспертом, так и аналитиком.

Достоверность

Данные содержат информацию, по которой можно судить, что она относится к исследуемому процессу. Есть доказательства того, что они были изменены после факта первичного созданий исполнителями процесса, что нарушило логическую целостность описания. Данные предоставлены третьим лицом, нет достоверной информации о том, как они были собраны и хранились до этого.

Данные содержат информацию, по которой можно судить, что она относится к исследуемому процессу. Данные предоставлены участниками процесса, нет данных о том, что было изменено в сравнении с первичным состоянием. В течение периода хранения доступ к данным был открыт.

Данные с высокой вероятностью содержат информацию об изучаемом процессе и его экземплярах, были предоставлены самими участниками процесса. Данные были обработаны самими участниками процесса, подвергались смене формата, корректировкам, дополнению описаний. В течение периода хранения доступ к редактированию данных был предоставлен участникам процесса и ответственным лицам.

Данные проверено содержат информацию именно об изучаемом процессе и его экземплярах, были предоставлены официальным представителем участников процесса. Данные были обработаны ответственными лицами, подвергались лишь смене формата представления фактов с полным сохранением полноты описания. В течение периода хранения доступ к редактированию данных был предоставлен лишь ответственным лицам.

Данные проверено содержат информацию именно об изучаемом процессе и его экземплярах, были предоставлены официальным представителем участников процесса. Данные предоставлены в первичном виде, в каком были созданы участниками, или подвергались смене формата представления фактов с полным сохранением полноты описания и были утверждены участниками процесса. В течение периода хранения доступ к редактированию данных был закрыт.

Подходящий формат

Формат не соответствует требуемому для алгоритмической обработки и не может быть конвертирован с сохранением целостности данных.

Формат не соответствует необходимому формату, но может быть конвертируем с минимальными потерями полноты и целости данных. После конвертации возможна необходимость ручной или автоматической корректировки.

Формат соответствует одному из доступных для анализа алгоритмов, может быть конвертирован в другие требуемые. Для анализа потребуется ручная корректировка формата.

Формат соответствует выбранному алгоритму, однако для начала использования данных необходимы небольшие корректировки, которые могут быть произведены автоматически.

Формат полностью соответствует выбранному алгоритму автоматизированного анализа, данные полностью готовы для выявления процессов.

Определение качества исходных данных и эффективности применения автоматизированного выявления бизнес-процессов на примере процесса «Согласование контрактов»

Процесс «Согласование контрактов».

Согласование контрактов и договоров является неотъемлемой частью деятельности любой организации, в особенности крупных международных компаний, отделением каковой является ЗАО «Дж. Т. И. по маркетингу и продажам». По названию компании не трудно догадаться о том, что основной ее деятельностью является административные поддерживающие активности производства, разработка маркетинговых стратегий продвижения продукта и, собственно, продажи. В связи с этим компания постоянно заключает огромное количество контрактов и приложений к ним с самыми разными подрядчиками, оказывающими услуги самого разного профиля: от поставки сырья до проведения тренингов персоналу. Однако, как и в любом административном корпоративном центре, перед подписанием и оплатой договора проходят целую череду согласований в самых разных отделах. В ходе согласования контракты переписываются, суммы договоров могут быть изменены, и, более того, договоренности даже могут быть приостановлены из-за претензий к условиям сделок от того или иного отдела. Контракты могут быть разного характера и на разные суммы, от чего зависит, какие отделы будут их согласовывать и чье одобрение нужно в итоге для того, чтобы успешно получить одобрение на оплату. Все документы имеют своих заинтересованных лиц - инициаторов, представителей самых разных отделов, ответственных за закупку необходимых сервисов и оборудования для работы своих коллег и компании в целом. В год инициируется и обрабатывается не менее пятисот различных контрактов и дополнений, и из года в год это количество не уменьшается. В связи с этим в компании данный административный процесс был автоматизирован одним из первых, и сейчас осуществляется посредством уже второй по счету современной системы документооборота Contracts Approval System (CAS).

На сегодняшний день процесс согласования контрактов полностью перенесен в CAS: в этой системе осуществляется и согласование, и правка документов, и хранение истории согласования договоров. Система поддерживает интеграцию с другими информационными системами компании для получения данных о контрагентах, курсах валют и многом другом. Процесс согласования поддерживается системой согласно установленным правилам, таким образом, в зависимости от параметров документа выбирается тот или иной путь согласования. Система хранит историю согласования каждого документа в формате журнала событий, рассылает сообщения и уведомления в формате почтовых писем в процессе согласования. Сам процесс в рамках CAS построен на основании требований к системе, которые описаны в регламентирующей документации. Ниже приведена общая процессная карта согласования контрактов, согласно которой происходит одобрение документов в системе. Также в Приложении 1 приведены схемы одобрения контрактов (последовательности участвующих в согласовании лиц) в зависимости от типа документа.

Рисунок 1. Модель процесса согласования контракта в системе Contracts

Исходные данные, описывающие процесс «Согласование контрактов»

Практическая часть данного исследования, как было описано выше, посвящена оценке исходных данных бизнес-процесса согласования контрактов в компании «Дж. Т. И. по маркетингу и продажам» согласно выработанным в ходе теоретического исследования критериям, и последующему исследованию бизнес-процесса на основании этих данных. Результатом практического исследования должен стать вывод о соответствии полученного описания бизнес-процесса его реальному состоянию, что позволит сделать заключение о влиянии качества исходных данных на результаты автоматизированного выявления процессов. Для осуществления полного исследования и подбора критериев, актуальных при использовании любых методов автоматизированного выявления процессов, для анализа данных были выбраны три основных методологии, каждая из которых требует для ее применения некую исходную информацию, относящуюся, участвующую или описывающую изучаемый процесс. Согласно теоретической части исследования для применения всех трех методов автоматизированного выявления бизнес-процессов необходима следующая информация о процессе в соответствующих форматах: журнал событий информационных систем, поддерживающих процесс, административная документация или регламент осуществления процесса и сообщения, которые были созданы и пересылались участникам процесса в ходе его реализации.

Для применения глубинного поиска процессов в исследовании был получен журнал событий информационной системы Contracts Approval System, описывающий последовательные шаги одобрения контрактов различного типа в течение одного года. Первичный вид, в котором был получен журнал событий, представляет собой excel-таблицу, в которой записаны следующие параметры, выгруженные с сервера информационной системы: уникальный номер карточки контракта, тип действия, произведенный на этапе согласования, дата и время произведенного действия, роль, которая выполнила данной действий, имя сотрудника, пребывавшего в этой роли, и комментарий, который был оставлен при совершении операции для последующих согласующих.

Рисунок 2. Фрагмент таблицы, содержащей журнал событий, регистрируемых

Для выявления процесса с помощью анализа сети информационных потоков были использованы письма, которые рассылаются системой ее пользователям, так как на данный момент этот процесс полностью автоматизирован и реализован в CAS. Данные письма содержат достаточную информацию о времени, контракте и его этапе согласования, а также инициаторе и основном смысле документа. Подобное уведомление генерируется системой в случае смены контрактом его статуса, то есть перехода на новый этап согласования или отказа согласующего одобрить контракт. Пример уведомления в первичном виде, в каком оно было получено для анализа, приведен на рисунке 3. Кроме того, информационным потоком данного процесса является обмен комментариями в рамках системы CAS, которые можно увидеть в самом правом столбце таблицы на рисунке 2. Оба описанные информационных потока будут учтены и проанализированы для составления схемы информационных потоков процесса.

Рисунок 3. Пример уведомления, генерируемого системой CAS для пользователей

Для применения метода семантического анализа в качестве исходных данных для исследования доступна лишь регламентирующая работу системы CAS документация, требования к ее разработке, а также инструкция по использованию системы для всех ролей пользователей. Документация составлена экспертом-аналитиком, участвовавшим в проекте разработки и автоматизации процесса согласования контрактов и имеющим богатый опыт разработки подобных описаний. Требования и инструкция составлены на русском языке в естественной форме для ознакомления сотрудников со стороны бизнеса и аналитика со стороны разработчика, в принятом в компании формате структурированного описания по функциями приложения. Документация обновляется на постоянной основе в случае изменения процесса, таким образом, поддерживаясь в актуальном для пользователей системы состоянии. Однако, не смотря на достаточность описательных документов, все из них составлены таким образом, что в тексте невозможно выявить структуру «субъект» - «действие» - «объект», так как они не являются подобно должным инструкциям предписывающими определенные действия в процессе.

Таким образом, можно сказать, что в целом для применения семантического анализа такая информация может быть использована, однако успешность выявления процесса с ее помощью ставится под вопрос. Такие данные, вероятней всего, позволят лишь составить общий список слов, которыми можно описать процесс и которые, в том числе, являются ключевыми.

Предварительная обработка и оценка исходных данных по выбранным критериям

Согласно составленной гипотезе исходные данные о процессе могут и должны быть оценены по ряду критериев, на основании чего может быть спрогнозирована успешность применения методов автоматизированного выявления процессов. Однако далеко не все данные сразу по итогам сбора готовы для алгоритмического анализа, большинство данных требует предварительной подготовки, очистки, приведения к нужному формату, что является неотъемлемым этапом каждой из описанных методологий. Для того, чтобы определить, какие именно преобразования необходимы и могут быть произведены с этим массивом информации, необходимо произвести их первичную оценку, используя критерии, выработанные в качестве гипотезы, и затем проанализировать и произвести возможные улучшения качества по каждому из критериев, оценка которых ниже желаемой. Финальная же оценка данных для выявления итогового уровня качества исходной информации должна быть произведена после всех преобразований и обработок, для того, чтобы зафиксировать качество данных, которые будут непосредственно переданы на вход алгоритму для анализа.

Полученные исходные данные об использовании информационной системы CAS, представляющие собой журнал событий, уведомления и техническую и инструктирующую документацию, до предварительной обработки оценены следующим образом:

Таблица 2. Оценка исходных данных о процессе согласования контрактов до обработки

Критерий

Оценка

Полнота

4

Чистота

4

Актуальность

4

Достоверность

5

Подходящий формат

3

Полнота выбранных исходных данных не могла быть оценена выше 4 баллов из 5, так как файлы содержат записи этапов одобрений лишь за один год, что в рамках изменения данного процесса и поддерживающей его системы, по мнению экспертов-разработчиков, является достаточным периодом для отображения лишь основного массива типов контрактов. Более же редкие типы контрактов с крупными подрядчиками или на большие денежные суммы могут заключаться один раз в два-три года, что делает вероятным их исключение из выбранного массива записей. К сожалению, объем исследуемых данных не может быть увеличен в силу политик информационной безопасности компании «Дж. Т. И.» по сохранению корпоративной тайны в течение трех лет после того, как информация являлась актуальной. Другим требованием к полноте данных является достаточное для составления описания процесса наличие параметров о каждом шаге его выполнения. В данном направлении качество данных может быть оценено достаточно высоко, так как и представленный журнал событий, и имеющиеся письма и документация содержат упоминание инициирующих событий, содержания действия, роли и имени исполнителя, временные отметки, предписывающие время выполнения, а также получаемый результат.

Чистота данных оценена на 4 балла из 5, так как, согласно выработанной шкале оценки, данные описаны структурировано, в формате строгой документации на естественном языке, относятся только к смысловой стороне исследуемого процесса, для каждого описательного формата использован единый шаблон, использован один язык для каждого описательного блока. Однако в инструктирующей документации и требованиях содержится большое количество описательной информации, не связанной непосредственно с параметрами исследуемого процесса, а также связующих слов для облегчения восприятия пользователями. Таким образом, можно сказать, что очищение документации от естественных речевых оборотов для произведения латентно-семантического анализа и повышения смысловой составляющей может быть произведено только экспертом, так как, в противном случае, такое преобразование может повлечь изменения структуры текста и связей терминов. Однако в журнале событий были обнаружены записи событий, которые описывали тестирование, производившееся администраторами и фиктивными пользователями, что не относится к исследуемому процессу и присутствие не полностью согласованных карточек и тестовых экземпляров портит как картинку самого процесса, так и статистику участия пользователей в той или иной роли. В связи с этим из журнала событий были удалены все записи, помеченные как тестирование функционала приложения. Однако журнал содержит также комментарии, которые ведутся пользователями на разном языке, в различном формате высказываний и вопросов. Это делает анализ сети информационных потоков не столь качественным, не давая возможность определить характер взаимодействия между той или иной ролью. Таким образом, произведенные преобразования не изменят общую оценку чистоты данных, однако все-таки улучшат их качество.

Актуальность данных оценена на 4 балла из 5, так как среди временных отметок в журнале событий указано для каждого этапа только время исполнения, а письма содержат также отметки о сроке, в который должно быть выполнено действие. Документация, между тем, не имеет временных отметок для этапов согласования контрактов, однако является актуальным описанием, что подтверждено формально и экспертами. К сожалению, так как журнал событий информационной системы не фиксирует других временных отметок, кроме момента исполнения задачи, а для подтверждения актуальности документации в любом случае необходимо привлечение эксперта, данный показатель не может быть улучшен.

Достоверность полученных мной данных оценена на 5 баллов из 5, так как данные проверено относятся к изучаемому процессу, получены от ответственного лица и хранились в период с момента создания до передачи в доступе только для ответственных лиц. Кроме того, имеется подтвержденная информация, о том, что журнал событий и полученные уведомления не были подвержен изменениям, документация подвергалась изменениям ответственным лицом для поддержания ее актуальности. Корректировки формата, описанные в следующем абзаце, не повлияли на достоверность.

Полученные данные для глубинного поиска процессов и анализа сетей информационных потоков были подходящего для проведения анализа формата, но имеющая документация для семантического анализа вероятней всего не пригодна, так как в ней невозможно выделить морфологические структуры, которыми описывается процесс, что невозможно исправить, не изменив смысл документов и их целостность. Журнал событий содержал данные о дате и времени в различном формате разделителя, что было исправлено с помощью макроса-обработки. Формат сообщений при анализе был сохранен, однако для автоматизированного анализа сети информационных потоков, вероятно, могла бы понадобиться конвертация формата сообщений в текстовый, что реализуемо без потери полноты данных. Таким образом, можно сказать, что формат данных для применения двух методологий может быть оценен достаточно высоко (5 баллов), однако учитывая неподходящую структуру документов для семантического анализа эта оценка должна быть ниже. В итоге предварительной обработки исходных данных их качество было улучшено, в том числе изменилась оценка формата данных с 3 баллов до 4. Итоговые оценки, соответствующие выработанной шкале, приведены в таблице 3.

Таблица 3. Оценка исходных данных после обработки и подготовки для последующего выявления бизнес-процесса «Согласование контрактов»

Критерий

Оценка

Полнота

4

Чистота

4

Актуальность

4

Достоверность

5

Подходящий формат

4

Выявление процесса «Согласование контрактов» с помощью глубинного поиска бизнес-процессов

Первым этапом применения методологии глубинного поиска бизнес-процессов является сбор и предварительная обработка данных, которая была описана выше. Как уже было описано ранее, для каждой из методологий автоматизированного выявления процессов качество исходных данных в целом определяет результат ее применения. Таким образом, учитывая достаточно высокие оценки качества данных по выбранным критериям, можно сделать вывод о том, что собранные данные являются достаточными для успешного применения глубинного поиска процессов, и можно ожидать до 88% - расчет произведен на основании предположения о равенстве влияния каждого из выбранных критериев на общий уровень качества исходных данных для автоматизированного выявления процессов, таким образом каждый оценочный пункт по одному критерию добавляет 4% от 100% уровня качества данных. совпадения полученной модели с эталонной моделью процесса.

В результате применения выбранного инструмента реализации глубинного поиска процессов Disco к предварительно обработанному журналу событий были получены разносторонние данные о процессе в зависимости от настройки параметров для анализа. Выбор параметров процесса, которые будут приняты в ходе анализа в качестве идентификатора экземпляра процесса, событий, исполняющего и временной отметки, с помощью данного инструмента может быть произведен достаточно гибко пользователем перед произведением выявления процессов (Приложение 2). Таким образом, в ходе исследования журнала событий были получены несколько моделей процесса, а также различная статистика. При выборе в качестве события действия, произведенного тем или иным согласующим в системе, была получена общая модель согласования документа в системе CAS (Рисунок 4). Карта процесса является интерактивной и позволяет также настроить количество отображаемых на ней экземпляров процесса - это может абсолютное большинство схожих экземпляров или все, что позволит увидеть на карте все возможные пути развития событий при согласовании того или иного документа. На Рисунке 4 приведена модель процесса, содержащая отображения схем всех экземпляров процесса, а в Приложении 3 - графики и статистика участия ролей и частота этапов, что позволяет видеть все возможные последовательности этапов согласования друг за другом и оценить их степень значимости в процессе.

Рисунок 4. Модель процесса «Согласование контрактов», выявленная с помощью глубинного поиска процессов

При выборе в качестве события роли согласующего, которые также закреплены для каждого этапа согласования документов (Приложение 4), была получена карта последовательностей согласования (Рисунок 5) для каждого типа контракта, что является непосредственным аналогом схемы согласования, приведенной в качестве эталонного описания. Кроме того, в результате получены статистические данные о степени вовлеченности каждой обнаруженной роли в процессе. При выборе в качестве событий имени пользователя для выявления степени загруженности каждого пользователя и количества совершаемых им типов действий (Приложение 5) была составлена карта последовательного взаимодействия пользователей (Рисунок 6), которая интересна в основном цветовыми пометками загруженности участников процесса согласования, а также статистикой принятия решений одобрения каждой ролью. Выделенные темно-синим участники процесса являются ключевыми участниками процесса, и также могут быть приняты в качестве экспертов согласования документов в данной системе. Статистика же ярко демонстрирует, что некоторые роли никогда не отклоняют документацию, что, возможно, говорит о том, что данный этап согласования может быть пропущен или переведен в формат уведомления.

Рисунок 5. Модель последовательности активностей ролей, участвующих в согласовании процесса «Согласование контрактов»

Рисунок 6. Модель последовательностей согласования, отображающая передачу потока (документа) от одного участника процесса «Согласование контрактов» другому

Действительно, выбранный инструмент позволил на используемых исходных данных произвести полноценное выявление и исследование процесса согласования контрактов, представив его в различных плоскостях и статистических разрезах. В результате данного этапа практического исследования получена достаточная информация для того, чтобы в общем сложить представление о процессе и сделать общие выводы о его соответствии эталонной модели.

Выявление процесса «Согласование контрактов» с помощью анализа сети информационных потоков

Анализ сети информационных потоков на сегодняшний день применяется достаточно редко для выявления процессов, что стало причиной того, что непосредственное применение принципов данного подхода будет в рамках данного исследования применено вручную. Для этого на основании имеющихся данных и цели анализа будет предложен алгоритм, посредством применения которого будут обработаны имеющиеся уведомления и комментарии согласования в системе CAS и создана карта информационных потоков.

Для реализации успешного выявления бизнес-процесса необходимо составить карту информационных потоков, которыми характеризуется данный процесс, а также получить некие статистические данные о характере взаимодействий в рамках каждого отдельного потока. Таким образом, алгоритм обработки сообщений для выявления закономерностей и построения графа информационных потоков должен работать со следующей информацией: парами отправитель-получатель, инициирующим событием отправки, темой сообщения, характером и смыслом текста сообщения. Вручную была произведена сортировка и обработка массива писем, сгенерированных системой за изучаемый период, а также проанализированы комментарии одобрения и отклонения при согласовании контрактов в журнале событий. По итогам изучения информационных потоков процесса можно заключить, что получателями сообщений являются только пользователи системы CAS, отправителем является система CAS и все ее пользователи (Рисунок 7).

Рисунок 7. Модель информационных поток взаимодействия между различными ролями процесса «Согласование контрактов»

Отправка сообщения производится только в случае факта некого события в системе, а именно запуска карточки документа на согласование, отклонение контракта с требованием корректировки, полное отклонение контракта, отклонение контракта инициатором после полного согласования. Генерируемые системой уведомления отправляются согласующим и инициатору по факту совершения действия в системе, дополнительные сообщения согласования присваиваются на каждом шаге одобрения документа и включаются в текст уведомления, а также доступны для просмотра в карточке самого документа. Генерируемые системой уведомления носят периодический характер в том случае, если требование действия, указанное в уведомлении, не выполнено получателем.

Сообщения согласования в рамках системы в карточке документа не носят характер требующих каких-либо действий в самой системе, однако большинство их них зафиксировано в повелительной форме русского языка, что означает призыв инициатора или других согласующих к некоторым действиям в системе или после согласования контракта. По итогам исследования с помощью инструмента моделирования бизнес-процессов Bizagi в нотации BPMN разработана также модель, описывающая выявленный процесс с точки зрения его зарегистрированных информационных потоков (Приложение 6). Также благодаря зафиксированному времени отправки сообщений системой в процессе анализа было достаточно просто на большом количестве экземпляров процессов согласования произвести анализ последовательностей получателей данных сообщений. В результате выявленные последовательности были выявлены и зафиксированы в модели последовательностей согласующих.

Безусловно, имплементация принципов методологии анализа сетей информационных потоков вручную и на основании только двух типов исходных данных является не самым лучшим способом выявить бизнес-процесс и получить его полное описание. Однако в качестве дополнительного источника информации о процессе это дает внушительный вклад, делая доступным верхнеуровневое описание процесса, описание путей и характера взаимодействия участников каждого этапа.

Выявление процесса «Согласование контрактов» с помощью семантического анализа документации

Семантический анализ документации сегодня является распространенным инструментом для классификации текста, определения его ключевых смысловых компонентов, а так определения его уникальности и многих других параметров в зависимости от целей изучения. Однако в рамках данного исследования подход и алгоритмы семантического анализа должны быть направлены, в первую очередь, на выделение ключевых слов текста и выявление связей типа «субъект» - «действие» - «объект» для обнаружения непосредственного процессного описания.

Для простого семантического анализа текста, как описано выше, был выбран on-line сервис семантического анализа Advego, хорошо зарекомендовавший себя среди свободно доступных инструментов подобного класса. Применение такого сервиса очень просто, однако среди получаемых доступных параметров текста скупая информация о характере анализируемого массива: статистика текста, такая как количество уникальных и значимых слов и характер языка, которым написан текст, вывод семантического ядра текста, то есть наиболее частых и значимых слов, количественная оценка повторений всех уникальных слов. В целом такой анализ позволяет лишь составить общее впечатление о тематике текста и дает лишь провести параллель с процессами, которые могут быть описаны в исследуемом документе. В ходе исследования имеющихся документов, регламентирующих работу с системой CAS, были получены следующие данные об их содержании:

...

Подобные документы

  • Виды неопределенностей в исходных данных систем и процессов защиты информации. Методы восстановления пропущенных значений в исходных данных. Моделирование методом экспертного построения функций, принадлежности оценки уровня риска информационной системы.

    дипломная работа [735,3 K], добавлен 13.07.2011

  • Анализ основных направлений автоматизации бизнес-процессов с информационными технологиями. Разработка баз данных для решения проблем хранения и систематизации информации. Проектирование и реализация логической модели бизнес-процесса на примере библиотеки.

    курсовая работа [505,8 K], добавлен 25.10.2011

  • Анализ текущих бизнес-процессов при работе букмекерской конторы. Построение функциональных моделей предметной области и диаграмм потоков данных. Основные меры по реорганизации бизнес-процессов и разрешению противоречий. Разработка мобильных приложений.

    курсовая работа [246,0 K], добавлен 10.01.2014

  • Архитектура интегрированных информационных систем ARIS как методология моделирования бизнес-процессов, преимущества и недостатки использования. Выбор бизнес-процесса для моделирования и его содержательное описание, табличный формат его описания.

    курсовая работа [2,2 M], добавлен 19.06.2015

  • Анализ деятельности предприятия и моделирование основных бизнес-процессов. Моделирование бизнес-процессов при помощи CASE-средства Rational Rose. Получение прибыли путем расширения рынка товаров и услуг. Бизнес-процесс "Заказ и закупка товара".

    дипломная работа [1,2 M], добавлен 31.07.2012

  • Основные запросы, на которые ориентирована база данных. Описание источников и форм исходных данных. Комплектация автоматизированного рабочего места сотрудника ДПС. Формирование постановления об административном правонарушении в электронном виде.

    курсовая работа [1,5 M], добавлен 14.11.2017

  • Характеристика объектов автоматизации. Перечень бизнес-процессов системы. Обработка заявки клиента. Составление договора купли-продажи. Детальное описание элементов проектируемой базы данных. Проведение оценки сокращения трудозатрат пользователя.

    дипломная работа [1,6 M], добавлен 12.06.2015

  • Практический опыт и проблемы внедрения систем автоматизированного составления расписания. Описание исходных данных для разработки функционала программы. Описание структуры разделов пользовательского интерфейса. Модуль проверок корректности расписания.

    курсовая работа [3,6 M], добавлен 26.09.2014

  • Рассмотрение теоретических подходов к информационным системам и созданию сайта. Исследование бизнес-процессов больницы. Анализ информационных потоков, обеспечивающих работу лечебницы. Разработка проекта сайта организации и оценка его эффективности.

    дипломная работа [232,4 K], добавлен 05.07.2010

  • Предпроектный анализ объекта автоматизации. Описание потоков данных и бизнес процессов. Обзор и анализ существующих проектных решений, их достоинства и недостатки. Разработка концепции архитектуры построения. Основные рекомендации по рисованию программ.

    курсовая работа [2,8 M], добавлен 13.03.2015

  • Разработка проекта автоматизации документооборота при помощи механизма бизнес-процессов и с использованием современных программных наработок в 1С:Предпирятие. Создание информационной базы "Деканат" для обработки данных процесса обучения студентов.

    дипломная работа [954,8 K], добавлен 26.07.2013

  • Специфика рекламной деятельности в агентствах недвижимости, обзор программных продуктов. Описание бизнес-процессов, назначение и цели создания автоматизированной системы, структура базы данных и ее Логическая модель, инструкция и интерфейс пользователей.

    дипломная работа [3,4 M], добавлен 21.04.2009

  • Моделирование бизнес-процессов как средство поиска путей оптимизации деятельности компании. Методология SADT (структурный анализ и проектирование), семейство стандартов IDEF и алгоритмические языки в основе методологий моделирования бизнес-процессов.

    реферат [21,7 K], добавлен 14.12.2011

  • Организации данных в таблице для документирования и графического представления информации при помощи программы Microsoft Excel. Создание и оформление исходных таблиц. Расчеты в таблицах, сортировка и фильтрация данных. Построение нестандартных диаграмм.

    реферат [3,6 M], добавлен 27.12.2013

  • Особенности проектирования информационных систем основанных на базах данных. Использование CASE-средств и описание бизнес процессов в BP-Win. Этапы проектирования современных информационных систем, виды диаграмм и визуальное представление web-сайта.

    курсовая работа [1,9 M], добавлен 25.04.2012

  • Написание модуля на языке Ассемблер для вычисления значения выражения. Составление программы корректного ввода исходных данных в таблицу и вывода результата в виде таблицы. Создание модуля для обработки строк и программы корректного ввода исходных данных.

    курсовая работа [36,8 K], добавлен 18.09.2010

  • Разработка модуля для вычисления значения функции, который впоследствии подключается к программе ввода исходных данных с контролем допусимого значения в таблицу. Проектирование модуля для работы со строками и для обработки массивов текстовой информации.

    курсовая работа [17,8 K], добавлен 24.09.2010

  • Сравнительный анализ гостиничных информационных систем. Анализ и выбор CASE-средств для моделирования бизнес-процессов. Визуальная и математическая модели предметной области, выбор архитектуры и платформы информационной системы, построение базы данных.

    дипломная работа [1,4 M], добавлен 20.07.2014

  • Обзор методов моделирования бизнес-процессов. Оптимизация процессов с помощью методологии Мартина. Анализ проблем и причины недостаточной эффективности в работе "ФМ Ложистик Кастомс". Автоматизация процесса сверки сведений из электронных документов.

    дипломная работа [4,5 M], добавлен 11.12.2013

  • Описание общих закономерностей функционирования организации. Изучение структуры предприятия, определение функций его подразделений и основных бизнес процессов. Разработка клиент-серверной системы по автоматизации получения и обработки заявок от абонентов.

    курсовая работа [1,8 M], добавлен 02.10.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.