Особенности использования машинного обучения для обработки входящих запросов в helpdesk-подразделениях
Построение модели машинного обучения для обработки входящих запросов в службу технической поддержки. Решение задачи классификации запросов в службу технической поддержки при помощи оригинального алгоритма, учитывающего специфику предметной области.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 25.04.2022 |
Размер файла | 482,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ОСОБЕННОСТИ ИСПОЛЬЗОВАНИЯ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ОБРАБОТКИ ВХОДЯЩИХ ЗАПРОСОВ В HELPDESK- ПОДРАЗДЕЛЕНИЯХ
Корнишин А.А.,
студент магистратуры 4 курс, факультет «Прикладная математика и информатика» ФГБОУ ВО «Тольяттинский государственный университет», Россия, г. Тольятти
Аннотация: Предлагается адаптация наиболее распространённых и эффективных методов машинного обучения для решения задачи классификации запросов в службу технической поддержки при помощи оригинального алгоритма, учитывающего специфику предметной области. Предполагаемые научные результаты должны подтвердить гипотезу о том, что построение и реализация модели машинного обучения для обработки входящих запросов в службу технической поддержки упростит и улучшит работу 1-й линии технической поддержки, сократит затраты на 1 -ю линию службы технической поддержки.
Ключевые слова: автоматизация, машинное обучение, служба технической поддержки, обработка входящих запросов, методы классификации, классификация входящих запросов, информационная система
Вводная часть
Служба технической поддержки крупной ИТ-компании, предоставляющей ИТ-услуги на аутсорсорсинг, должна оперативно обрабатывать поток приходящих по электронной почте запросов от заказчиков.
При этом, клиенты ИТ-компании могут обращаться по вопросам IT поддержки непосредственно в подразделения, ответственные за решения различных задач, часто не по адресу. Ненужная внутренняя переадресация обращений клиентов, отсутствие единого подхода к формированию заявок, соответственно отсутствие возможности осуществлять контроль исполнения заявок, резко снижают эффективность работы службы технической поддержки.
Отсутствие единой системы сбора заявок на обслуживание вычислительной техники снижает качество предоставляемых клиентам услуг и эффективность работы.
Оператор сможет полностью выполнять свои функции с максимальной эффективностью только, если будет произведено внедрение автоматизированной информационной системы с обработкой запросов.
В связи с тем, что ИТ-компании предоставляют очень широкий спектр ИТ-услуг, запросы распределяются в различные отделы технической поддержки. Обычно, этим распределением занимается 1 -я линия службы технической поддержки.
Для повышения эффективности обработки и распределения запросов необходимо выявить лучшую модель обработки входящих запросов и подтвердить это программной реализацией.
В работах многих авторов таких, как Батура Т.В. [1], Большакова Е.И. [2], Комарова А.В. [7] анализируются различные методы автоматической обработки и классификации текстов.
В работах авторов таких, как Варшавский П.Р. [3], Кашницкий Ю.С. [5], Клячкин В.Н. [6], Кузнецов И.А. [11], Лунев К.И. [12], Нгуен, М.Т. [13], Lilleberg J., Zhu Y., Zhang Y. [17] рассматриваются особенности алгоритмов машинного обучения для классификации текстовых документов и данных, ансамблевые методы машинного обучения.
Но вопросы применения для вышеуказанных методов и алгоритмов для обработки входящих запросов в helpdesk-подразделениях не исследовались.
Основная часть
Предполагаемые научные результаты должны подтвердить гипотезу о том, что построение и реализация модели машинного обучения для обработки входящих запросов в службу технической поддержки упростит и улучшит работу 1 -й линии технической поддержки, сократит затраты на 1 -ю линию службы технической поддержки.
В ходе взаимодействия клиентов, оператора и специалистов helpdesk - подразделения возникают различные проблемы.
Необходимо проанализировать существующий процесс, чтобы выявить: ненужные обращения клиентов; дублированные обращения; нелогичность последовательностей действий; причины повторяющихся обращений; отсутствие источника информации; отсутствие ответственного за результат.
В процессе работы могут использоваться разные методы обработки входящих запросов клиентов.
При циклическом распределении все новые запросы маршрутизируются непрерывно в цикле, чтобы каждый оператор принимал равное число запросов. С помощью очереди производится последовательный перебор всех операторов пока не будет найден тот, кто сможет принять вызов. Первый вызов будет направлен первому оператору, следующий - второму оператору, далее - третьему оператору, и так далее. Для этого метода не требуются определенные знания от оператора и он подходит для общих запросов.
При синхронном распределении новые запросы приходят всем операторам одновременно. Обработка запроса будет производится тем, кто первым взял трубку. Этот метод является самым быстрым для связи клиента с оператором.
Метод с учетом активности операторов, каждый из которых устанавливает статус активности. Система передает оповещение о вызове только активным операторам.
Применение автоматического распределения запросов способствует повышению пропускной способности контакт-центра, равномерному распределению нагрузки между операторами с учетом уровня их компетенций и повышению эффективности обслуживания клиентов.
Автоматизация обработки входящих запросов имеет ряд преимуществ.
Автоматическое распределение запросов снижает время обработки, обеспечивает повышение скорости обслуживания клиентов.
Сотрудники меньшее время затрачивают на выяснение проблем и большее уделяют решению задач.
При автоматическом равномерном распределении запросов сводится к минимуму время простоя, все сотрудники заняты своими задачами.
Своевременное решение вопросов клиентов способствует повышению доверия к компании и лояльности клиентов.
Машинное обучение является совокупностью методов, позволяющих изучить данные и выявить закономерности, они имеют преимущество над методами традиционной статистики, поскольку уменьшают число начальных допущений, менее консервативны к выбору подхода для решения задачи, используют эмпирические методы для оценки уровня обобщения. Машинное обучение основано на индуктивном подходе: малой части данных достаточно для вывода об общем состоянии процесса [14, 15].
Наиболее широко применяется подход машинного обучения с учителем, в котором весь объем данных разделяется на две выборки (обучающая и тестовая), а алгоритм обрабатывает данные из обучающей выборки, при этом выполняется сравнение результата с эталонным значением.
Методы обучения с учителем для задачи классификации широко распространены на практике, поскольку часто требуется отнести объект к определенному классу, используя известные данные о других объектах [1]. Примером такой задачи является задача бинарной классификации разделения клиентов.
В крупной ИТ-компании предоставляются различные три основные группы услуг клиентам:
разработка и поддержка ПО; хранение и бэкап данных;
хостинг и поддержка ActiveDirectory и/или серверов.
В рамка предоставления этих услуг клиенты могут пересылать в техподдержку следующие виды запросов:
создать/удалить/изменить учетную запись в AD; проблема с использованием программ или баг в ПО; добавление новой функции в ПО; создание/настройка сервера; создание маршрутов между серверами; создание/изменение правил firewall.
Заявки обрабатывает 1-я линия и именно её работу должно упростить внедрение МО.
Определены ключевые признаки, по которым можно классифицировать запрос:
- по теме письма;
- по ключевым словам;
- по источнику (от кого);
- по упоминаниям исполнителя.
Система обработки запросов должна уметь автоматически назначать задачи и проекты соответствующим специалистам или участникам команды.
Автоматическое назначение исполнителей и последующая рассылка уведомлений не только устранит любые возможные недоразумения, связанные с кругом обязанностей, но и улучшит подотчетность в команде.
В результате разработка и внедрение ИС должна позволить:
сократить время обработки запросов; сократить количество повторных запросов.
Методы нейронных сетей широко применяются для обработки больших объемов данных и имеют уникальные вычислительные возможности. Нейросети прямого распространения позволяют аппроксимировать функции и решать задачи классификации [10, с.177].
Методы нейронных сетей имеют следующие преимущества:
- высокая эффективность;
- операции легко поддаются распараллеливанию;
- возможность успешного решения задач при наличии неполной, искаженной и противоречивой входной информацией;
- возможность обучения на наборе данных с неизвестными законами и зависимостями между входными и выходными данными.
Присутствуют и следующие недостатки:
- методы нейронных сетей не могут классифицировать с требуемым качеством, при недостаточной полноте набора примеров для конкретной задачи;
- проблемы подготовки обучающей выборки, связанные с трудностями нахождения достаточного количества обучающих примеров;
- проблема переобучения нейросети, приводит к тупиковым ситуациям.
Предлагается практическая реализация схемы формализованного алгоритма процесса классификации входящих запросов в службу технической поддержки на основе многоклассовой классификации и машинного обучения.
В модели информационной системы основными взаимодействующими акторами являются специалист техподдержки, оператор-координатор и клиент.
На рисунке 1 отображена диаграмма компонентов проектируемой информационной системы обработки запросов клиентов.
Рисунок 1 - Диаграмма компонентов
На рисунке 2 отображена диаграмма последовательности компонента «Модуль машинного обучения для анализа запроса».
Рисунок 2- Диаграмма последовательности компонента «Модуль машинного обучения для анализа запроса»
машинное обучение служба техническая поддержка алгоритм
На рисунке 3 отображена диаграмма последовательности компонента «Модуль применения модели».
Рисунок 3 - Диаграмма последовательности компонента «Модуль применения модели»
Таким образом, построенная структура программного продукта позволяет определить средства разработки программного продукта.
Выбрана среда разработки Visual Studio 2018, язык программирования C# и библиотека для машинного обучения ML.NET.
Выбранные средства реализации позволят разработать информационную систему обработки запросов клиентов с применением инновационных методов машинного обучения.
Заключительная часть
Новизна решаемой задачи заключается в оригинальном применении метода машинного обучения к решению задачи классификации входящих текстовых запросов в службу технической поддержки и их распределения.
Предполагаемые научные результаты должны подтвердить гипотезу о том, что построение и реализация модели машинного обучения для обработки входящих запросов в службу технической поддержки практически упростит и улучшит работу 1 -й линии технической поддержки, сократит затраты на 1-ю линию службы технической поддержки.
Основным направлением для дальнейшего исследования является практическая реализация информационной системы обработки входящих запросов и анализ экспериментальных результатов ее применения.
Список литературы:
1. Батура Т.В. Методы автоматической классификации текстов // Программные продукты и системы. - Т. 30, № 1, 2017. - С.85-99.
2. Большакова Е.И. и др. Автоматическая обработка текстов на естественном языке и анализ данных: учеб. пособие / М.: Изд-во НИУ ВШЭ, 2017. - 269 с.
3. Варшавский П.Р., Кожевников. А.В. Реализация программных средств для классификации данных на основе аппарата сверточных нейронных сетей и прецедентного подхода // Программные продукты и системы, № 4, 2020. - С. 591598.
4. Кафтанников И.Л., Парасич А.В. Проблемы формирования обучающей выборки в задачах машинного обучения // Вестник Южно-Уральского государственного университета. Серия: Компьютерные технологии, управление, радиоэлектроника. - 2016. - № 3. - С. 15-24.
5. Кашницкий Ю.С., Игнатов Д.И. Ансамблевый метод машинного обучения, основанный на рекомендации классификаторов // Интеллектуальные системы. Теория и приложения. - Т.19, № 4, 2015.- С. 37-55.
6. Клячкин В.Н., Жуков Д.А. Прогнозирование состояния технического объекта с применением методов машинного обучения // Программные продукты и системы. - Т.32, №2, 2019. - С. 244-250.
7. Комарова А.В., Менщиков А.А., Полев А.В., Гатчин Ю.А. Метод автоматизированного извлечения адресов из неструктурированных текстов // International Journal of Open Information Technologies. - Т.5, № 11, 2017. - С. 21-26.
8. Кораблев А.Ю., Булатов Р.Б. Машинное обучение в бизнесе // Азимут научных исследований: экономика и управление. - 2018. - Т. 7, № 2. - С. 68-72.
9. Корнина А.Е. Машинное обучение и нейронные сети в бизнесе // Хроноэкономика. - 2018. - № 2. - С. 111-115.
10. Краснянский М.Н., Обухов А.Д., Соломатина Е.М., Воякина А.А. Сравнительный анализ методов машинного обучения для решения задачи классификации документов научно-образовательного учреждения / Вестник ВГУ, серия: системный анализ и информационные технологии, № 3, 2018. - С. 173-182.
11. Кузнецов И.А. Методы и алгоритмы машинного обучения для предобработки и классификации слабоструктурированных текстовых данных в научных рекомендательных системах / АВТОРЕФЕРАТ диссертации на соискание ученой степени к.т.н. - Москва - 2019. - 26 с.
12. Лунев К.И. Особенности применения машинного обучения для классификации текстовых документов // Научные записки НГУЭУ. Выпуск 2, 2020. - С.30-32.
13. Нгуен М.Т. Тестирование методов машинного обучения в задаче классификации http запросов с применением технологии tf-idf // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии. - 2019. - № 4. - С. 119-131.
14. Ракитский А.А. Методы машинного обучения: учебно-методическое
пособие / Новосибирск: Сибирский государственный университет телекоммуникаций и информатики, 2018. - 32 c.
15. Юрочкин А.Г., Коростелева Н.А. Проблемы машинного обучения // Вестник Воронежского института высоких технологий. - 2020. - № 1. - С. 49-51.
16. Adeniyi D.A., Wei Z., Yongquan Y. Automated web usage data mining and recommendation system using K-Nearest Neighbor (KNN) classification method // Applied Computing and Informatics. - Т.12, № 1, 2016. - С. 90-108.
17. Lilleberg J., Zhu Y., Zhang Y. Support vector machines and word2vec for text classification with semantic features // Cognitive Informatics & Cognitive Computing. - 2015. - С. 136-140.
18. Pliakos K., Geurts P., Vens C. Global multi-output decision trees for interaction prediction // Machine Learning. - 2018. - С. 1-25.
19. Wu X. et al. Top 10 algorithms in data mining //Knowledge and information systems. - Т.14, № 1, 2008 - С. 1-37.
20. Yang W., Boyd-Graber J., Resnik P. A discriminative topic model using document network structure //Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics. - Т.1, 2016. - С. 686-696.
Размещено на Allbest.ru
...Подобные документы
Маркетинговая составляющая сферы социальных сетей. Описание системы мониторинга запросов потребителей. Общая характеристика систем технической поддержки (Service desk, Help desk). Начальная страничка интерфейса поддержки при возникновении проблемы.
дипломная работа [2,5 M], добавлен 25.10.2015Обработка распределенных данных и запросов. Многопотоковые и многосерверные архитектуры. Основные типы параллелелизма при обработке запросов. Структура компонентов поддержки удаленного доступа. Доступ к базам данных в двухзвенных моделях клиент-сервер.
презентация [123,1 K], добавлен 19.08.2013Изучение реляционной модели данных. Выявление потребности задач в данных и определение состава и структуры информационных объектов. Построение концептуальной модели предметной области. Создание форм, запросов и отчетов с помощью конструктора запросов.
курсовая работа [6,3 M], добавлен 09.10.2021Методы диагностики производительности запросов. Выбор инструментов для front-end разработки. Проектирование архитектур программной системы. Реализация системы регистрации и авторизации пользователей на сайте. Причины неэффективности SQL-запросов в Oracle.
дипломная работа [1,0 M], добавлен 09.11.2016Оптимизация программы "диспетчер-кодировщик" в блоке предварительной обработки запросов. Определение характера и интенсивности информационного потока, поступающего на вход блока выполнения запросов. Построение детерминированных и стохастических моделей.
курсовая работа [592,7 K], добавлен 30.03.2011Понятие запросов как объектов СУБД Access, предназначенных для отбора данных и удовлетворяющих заданным условиям. Основные виды запросов: простой, перекрестный, с параметром, группировкой, вычисляемым полем. Отличия запросов-действий от других запросов.
контрольная работа [2,9 M], добавлен 29.06.2015Описание предметной области "Магазин по продаже компьютерных комплектующих". Построение ER и реляционной модели данных, сущности и связи. Создание ER и реляционной модели данных, запросов, представлений, хранимых процедур для предметной области.
курсовая работа [32,2 K], добавлен 15.06.2014Построение информационно-логической модели базы данных. Корректировка данных средствами запросов. Проектирование алгоритмов обработки данных. Реализация пользовательского интерфейса средствами форм. Разработка запросов для корректировки и выборки данных.
курсовая работа [680,9 K], добавлен 19.10.2010Создание визуального построителя запросов на извлечение данных с помощью оператора SELECT и его разделов. Постановка задачи; язык запросов SQL, общие сведения; агрегатные функции и результаты запросов. Программная реализация и алгоритм работы приложения.
курсовая работа [152,8 K], добавлен 12.08.2011Путь обработки запроса в реляционной СУБД. Оптимизации запросов на примере Oracle 9.2. Исследования по оптимизации планов выполнения запросов за счёт нормализации таблиц, выбора табличного пространства и распределения таблиц по этому пространству.
курсовая работа [364,8 K], добавлен 12.01.2012Инструменты для поиска "плохих запросов". Причины снижения производительности. Способы оптимизации запросов. Табличные переменные и временные таблицы. Техника написания "быстрых" запросов. Анализ плана выполнения. Соединение вложенных циклов nested loop.
презентация [105,2 K], добавлен 06.01.2014Классификации баз данных и СУБД. Технология модели "клиент-сервер". Особенности языка структурированных запросов SQL. Структура и назначение операторов определения, манипулирования и управления данными. Разработка реляционной БД, создание SQL запросов.
курсовая работа [1,4 M], добавлен 17.08.2015Системный анализ и анализ требований к базе данных. Особенности создания отчетов, запросов и форм в Visual Studio 2012. Программная реализация ER-диаграммы. Создание инфологической, логической и физической модели базы данных. Генерация ее в SQL Server.
курсовая работа [1,0 M], добавлен 22.11.2012Построение концептуальной модели. Проектирование реляционной модели данных на основе принципов нормализации: процесс нормализации и глоссарий. Проектирование базы данных в Microsoft Access: построение таблиц, создание запросов в том числе SQL – запросов.
курсовая работа [35,9 K], добавлен 08.11.2008Характеристика предметной области, входных и выходных документов, участников нормализации и алгоритма реализации базы данных. Описание таблиц, проектирование форм, запросов, отчётов, создание главной кнопочной формы. Тестирование программного комплекса.
курсовая работа [5,8 M], добавлен 20.05.2015Методика и основные этапы разработки интернет-сайта, его структура и элементы, дизайн и программная часть. Проектирования и требования к интерфейсу. Механизм поддержки клиентов и порядок обработки запросов. Выбор и обоснование программных средств.
дипломная работа [1,8 M], добавлен 28.08.2014Операции реляционной алгебры. Программы построения плана выполнения запроса. Разработка обучающей программы запросов с использованием реляционных операций. Проектирование программы обучения реляционной алгебре. Требования к программной документации.
курсовая работа [56,0 K], добавлен 25.11.2010Построение концептуальной модели. Создание таблиц, входящих в состав базы данных. Разработка основных запросов, отчетов о количестве учеников в данном классе и работе школы; форм для просмотра и редактирования данных в программе Microsoft Access.
курсовая работа [2,7 M], добавлен 08.05.2015Построение инфологической, логической и физической модели предметной области. Ограничения целостности базы данных. Организация ввода и корректировки данных. Описание информационных потребностей пользователей. Реализация запросов, построение отчетов.
курсовая работа [2,9 M], добавлен 22.01.2015Анализ предметной области, определение сущностей и связей. Разработка базы данных, создание таблиц и запросов. Исходные тексты процедур модулей. Тестирование информационной системы на корректность работы. Схема инфологической модели предметной области.
курсовая работа [4,3 M], добавлен 19.12.2011