Метрики для оценки качества чат-бот приложений

Виды чат-бот приложений с использованием алгоритмов машинного обучения. Характеристика методов оценки, для измерения бизнес-показателей и технических показателей. Снижение загрузки колл-центра. Оценка качества классификации сообщений, интерфейс оператора.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 29.12.2020
Размер файла 327,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Метрики для оценки качества чат-бот приложений

Ураев Денис Алексеевич магистрант, кафедра программного обеспечения информационных технологий, Белорусский государственный университет информатики и радиоэлектроники

Аннотация

В статье анализируются метрики и методы оценки качества чат-бот приложений. Данное направление является относительно молодым и набирает всё большую популярность в таких областях, как сервисы электронной коммерции, колл-центры, игровая индустрия. А так как чат-боты зачастую заменяют людей, то для оценки их качества недостаточно применять только метрики оценки программного обеспечения. Данная тема является актуальной, потому что международные и единые стандарты для оценки качества чат-бот приложений еще не выработаны.

Ключевые слова: чат-бот, оценка качества, методы оценки, бизнес-показатели, KPI.

Abstract

Quality assessment metrics of chatbot applications

Urayev Denis Aleskeyevich Master, Information technology software department, Belarusian state university of informatics and radio electronics

The article analyzes the metrics and methods for assessing the quality of chat bot applications. This area is relatively young and is gaining more and more popularity in areas such as e-commerce services, call centers, and the gaming industry. Since chat-bots often replace people, it is not enough to use only software evaluation metrics to evaluate their quality. This topic is relevant, because international and common standards for assessing the quality of chat bot applications have not yet been developed.

Keywords: chat bot, quality assessment, assessment methods, business indicators, KPI.

чат-бот приложение сообщение

Чат-бот приложения с использованием алгоритмов машинного обучения является только развивающимся направлением, поэтому международные стандарты для оценки качества чат- бот приложений еще не выработаны. Однако, так как чат-бот приложения напрямую воспроизводят то, как могут работать реальные люди, то чат-ботов можно считать «сотрудниками» нового поколения. Поэтому, для оценки эффективности чат-бот приложений, я бы предложил использовать KPI метрики (Key Performance Indicator), которые используются в бизнес-оценке как показатель деловой активности сотрудников организаций. С другой стороны, так как чат-боты являются программным обеспечением, для оценки качества также можно использовать стандартные методы оценки ПО [1].

Таким образом, методы оценки качества чат-бот приложений можно разделить на две категории:

1. Методы оценки, для измерения бизнес-показателей.

2. Методы оценки, для измерения технических-показателей.

Оценка бизнес-показателей. Набор метрик, для оценки бизнес-показателей, является самым главным с точки зрения бизнеса, так как помогает рассчитать, в какой срок окупятся затраты на разработку бота и отвечает ли он ожиданиям. Сами KPI в данном случае могут быть разными и зависят от функций бота. Далее приведены самые популярные примеры:

- Снижение загрузки колл-центра. Это одна из самых распространенных задач чат- ботов. Так как большинство запросов в колл-центр являются стандартными, роботы справляются с ними не хуже людей. Они обслуживают пользователей в чатах и по телефону и переводят на «живых» операторов только когда это требуется. К примеру, по данным компаний украинского мобильного оператор «Киевстар», внедрение чат-бота позволяет снизить загрузку операторов на 85% [2].

- Конверсии в покупки. Эта простая метрика актуальна для e-commerce и используется также, как в традиционном маркетинге. Такие бренды, как H&M или Taco Bell используют ботов как интернет-магазин в мессенджере.

- Активация. Одно из преимуществ ботов заключается в том, что после добавления в друзья к пользователю они могут периодически напоминать им о себе и о вашем бизнесе. Например, сообщая о новых акциях в магазине или предлагая интересный контент, связанный с брендом. А по итогам -- просчитывать, какой процент пользователей удалось «вернуть» среди тех, кто давно не заходил на сайт.

- Количество пользователей. Всегда можно отслеживать общее количество пользователей за указанный период времени и сравнивать его с предыдущим периодом. Общее количество складывается из новых пользователей и вернувшихся. Число последних - очень полезная метрика. Она показывает, сколько пользователей повторно используют вашего чат-бота в сравнении с предыдущим периодом. Этот показатель особенно важен тем компаниям, у которых ежедневно большой поток посетителей на сайте или в приложении. Если он растет, значит ваши пользователи были удовлетворены ответом бота ранее и охотно выбирают новый канал коммуникации.

- NPS - индекс потребительской лояльности. Чат-бот является удобным инструментом для проведения опроса и расчета показателя NPS. NPS - это индекс потребительской лояльности, т.е. оценка лояльности пользователей по отношению к продукту и компании. Обычно такой опрос проводят посредством email-рассылок, звонков, всплывающих окон и т.д. С чат-ботом проводить такую оценку удобнее и быстрее. В конце диалога пользователю можно предлагать оценить разговор. Например, чат-бот пишет «Остались ли вы довольны ответом?» Бот предлагает выбрать ответ из нескольких вариантов: «Я спрашивал про другое», «Я не понял ответа», «Ответ не решил проблему». Исходя из ответа, мы можем выявить причину отрицательной оценки, проанализировав историю этого диалога. На основе оценок, полученных от пользователей, данную метрику можно рассчитать по формуле:

NPS = (Сумма оценок от 9 до 10) -- (Сумма оценок от 0 до 6)/ на кол-во всех респондентов * 100

Оценка технических показателей. Архитектура чат-бот приложений содержит 3 компонента, которые являются общими для всех чат-ботов, построенных на различных платформах и для различных целей:

1. Dialog Flow - путь разговора, который определяет разработчик.

2. ML модель классификации сообщений (ML Classification model), для определения намерения пользователей.

3. ML модель для извлечения данных (ML Information Extraction model) из пользовательских сообщений.

Таким образом для оценки качества чат-бота с технической точки зрения будут использованы 3 метрики, которые оценивают каждую из компонент системы. Для этого, из архива сохранённых разговоров будут извлекаться переписки между пользователем и чат- ботом, и данные переписки будут обрабатываться операторами в ручном режиме.

Для оценки качества Dialog Flow задача оператора будет заключаться в том, чтобы отметить каждый ответ чат-бота как уместный или неуместный (неправильный). Иногда чат- боты путаются, и это нормально. Это чаще всего происходит при нетипичных входящих запросах, тех, ответы на которые не заложены в базу знаний бота. Пример формы, для отображения оператору, представлен на рисунке 1.

Для оценки качества классификации сообщений (ML Classification model), оператор должен вручную проклассифицировать каждый запрос от пользователей. Данная оценка является важной, так как правильная классификация исходного намерения пользователя является точкой входа в разговор с чат-ботом. Данный показатель должен быть особенно высоким для определения тех намерений пользователя, которые входят в «область знания» чат-бота. В дальнейшем, ответ оператора будет сравниваться с ответом классификационной ML модели для составления статистики. Также, так как ответы операторов мы считает за «истину», то их ответы в будущем могут быть использованы для перетренировки новых ML моделей. Таким образом будет налажен процесс того обучения и чат-бот будет становиться «умнее».

¦ Repeated messages

¦ IBot's queston/answer is out of context/illogical

¦This response is badly phrased

¦This response is good

Рис. 1. Интерфейс оператора для оценки качества ответов чат-бота

Пример того, как выглядит интерфейс оператора по классификации пользовательских сообщений в архивном разговоре приведен на рисунке 2.

Для оценки качества извлечения данных (ML Information Extraction model) задача оператора выделить ценные данные из пользовательских сообщений (например, имя пользователя, страну, период банковской выписки, почтовый ящик и т.п.). Данные оценки являются особенно важными в чат-ботах, которые работают с личными данными пользователя, их аккаунтами в системах, связанных с деньгами (чат-бот приложения для банков, мобильных операторов и т.п.) Полученные ответы от операторов также будут использованы для генерации статистики и в будущих тренировках новых ML моделей, сохраняя непрерывным процесс «обучения» чат-бота.

Рис. 2. Интерфейс оператора для классификации сообщений

На рисунке 3 представлен пример интерфейса оператора для извлечения данных из пользовательских сообщений в ручном режиме. Процесс извлечения происходит путём тэгирования (выделения с последующей подсветкой) слов и данных внутри сообщения.

Рис. 3. Интерфейс оператора для извлечения данных из сообщений

Список литературы

1. Лемешковская Н. Возможно ли измерить KPI чат-бота? // Яндекс Дзен. 2018.

2. Чат-бот Зоряна от Киевстар: 2 млн диалогов, 12 тысяч ответов в базе и новые функции // Киевстар, 2018.

Размещено на Allbest.ru

...

Подобные документы

  • Разработка критериев оценки экрана веб-приложений. Основные подходы к защите веб-приложений. Анализ российских нормативных документов. Зарубежная практика выбора экрана веб-приложений. Разработка и обоснование общих требований к механизмам защиты.

    дипломная работа [68,7 K], добавлен 04.08.2016

  • Получение и обработка данных о веб-сайте. Иерархическая классификация, алгоритмы машинного обучения. Решающие деревья, плоские классификаторы. Метрики оценки качества. Полная точность (accuracy), кросс-валидация. Параллельные вычисления, хранение данных.

    курсовая работа [276,8 K], добавлен 04.09.2016

  • Оценка качества подготовки программистов и снижение трудозатрат на подготовку и проверку их лабораторных работ. Разработка проекта по автоматизации процесса обучения программированию с помощью интегрированной среды оценки структуры и качества программы.

    дипломная работа [2,5 M], добавлен 07.06.2012

  • Анализ показателей оценки эффективности информационных систем и технологий. Расчет трудовых и стоимостных показателей и показателей достоверности информации, разработка программы для ускорения методов обработки данных. Интерфейс и листинг приложения.

    дипломная работа [1,2 M], добавлен 14.01.2012

  • Анализ проблем, возникающих при применении методов и алгоритмов кластеризации. Основные алгоритмы разбиения на кластеры. Программа RapidMiner как среда для машинного обучения и анализа данных. Оценка качества кластеризации с помощью методов Data Mining.

    курсовая работа [3,9 M], добавлен 22.10.2012

  • Использование языка программирования Бейсик для создания приложений в области компьютерных технологий: бизнес, игры, мультимедиа, базы данных. Моделирование работы оператора по управлению автобусами. Разработка интерфейса и редактирование маршрутов.

    курсовая работа [637,6 K], добавлен 29.01.2011

  • Устройство веб-приложений, преимущества их построения. Характеристика технологий веб-программирования, используемых на стороне сервера и на стороне клиента. Формирование и обработка запросов, создание интерактивного и независимого от браузера интерфейса.

    контрольная работа [76,4 K], добавлен 08.07.2014

  • Разработка программных средств. Жизненный цикл программного средства и понятие его качества. Форма и интерфейс приложений, алгоритмы решения задач на языке Delphi. Методы борьбы со сложностью. Преодоление барьера между пользователем и разработчиком.

    курсовая работа [650,5 K], добавлен 27.01.2011

  • Подходы и алгоритмы автоматизации тестирования. Анализ специфики работы с локальными и веб-приложениями, внедрение автоматических тестов в процесс контроля качества приложений Global XB, GCube и Thistle. Оптимальный инструмент разработки скриптов.

    дипломная работа [1,5 M], добавлен 15.01.2012

  • Облачные технологии в бизнес-процессах. Модели использования бизнес-приложений в качестве интернет-сервисов. Практика применения облачных технологий. Приложения, созданные на основе Windows Azure. Создание систем и офисных приложений по запросу.

    реферат [25,3 K], добавлен 16.06.2013

  • Создание процедурно-ориентированной и объектно-ориентированной реализации конкретного приложения и сравнительный анализ их вычислительной эффективности. Определение попадания точки внутрь фигуры. Возможности улучшения характеристик качества приложений.

    курсовая работа [1,5 M], добавлен 04.12.2021

  • Положения алгоритмов сжатия изображений. Классы приложений и изображений, критерии сравнения алгоритмов. Проблемы алгоритмов архивации с потерями. Конвейер операций, используемый в алгоритме JPEG. Характеристика фрактального и рекурсивного алгоритмов.

    реферат [242,9 K], добавлен 24.04.2015

  • Исследование возможных вариантов выявления ошибок в комплексе программ (в том числе и сложных алгоритмических) с использованием системы показателей качества. Выбор действий по установлению причин выявленных несоответствий, их локализации и устранению.

    реферат [261,2 K], добавлен 26.10.2010

  • Знакомство с этапами разработки трёх приложений для системы семейства Linux с использованием языка программирования С++. Анализ особенностей операционной системы Ubuntu 12.10. Характеристика способов тестирования команд с помощью стандартных средств.

    контрольная работа [732,1 K], добавлен 06.08.2013

  • Преимущество построения Web-приложений для поддержки стандартных функций браузера. Настройка проекта Web-приложения. Создание и изменение исходных файлов. Изменение файла JavaServer Pages по умолчанию. Основные проблемы при выполнении Web-приложений.

    контрольная работа [362,8 K], добавлен 10.11.2013

  • Принципы написания оконных приложений, представляющих данные в табличном виде и осуществляющих взаимодействие с символьными и байтовыми потоками ввода-вывода в среде Eclipse. Особенности построения приложений с расширенным графическим интерфейсом.

    методичка [1,0 M], добавлен 01.05.2014

  • Создание системы предобработки данных; разработка системы классификации на базе методов и алгоритмов машинного обучения, их реализация в программной системе. Предобработка информации, инструкция пользователя, система классификации, машинный эксперимент.

    дипломная работа [917,1 K], добавлен 31.01.2015

  • Характеристика модели клиент-сервер как технологии взаимодействия в информационной сети. Разработка и описание алгоритмов работы приложений на платформе Win32 в среде Microsoft Visual Studio, использующих для межпроцессного взаимодействия сокеты.

    курсовая работа [544,6 K], добавлен 02.06.2014

  • Обзор существующих приложений в сфере оказания автомобильной помощи. Рассмотрение алгоритмического конструирования комплекса мобильных приложений по оказанию автомобильной помощи на дорогах. Оценка тестирования авторизации в приложении для водителя.

    дипломная работа [1,9 M], добавлен 12.02.2018

  • Описание технологии ASP.NET исполняемой на платформе Net FrameWork, ее преимущества. Возможности применения коллекции ViewState. Примеры использования шаблонов. Основные контролы Web приложений. Разработка программы-словаря с использованием ASP.NET.

    курсовая работа [1,2 M], добавлен 13.09.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.