Речевые технологии в управлении предприятием
Особенности технологии управления голосом, тенденции ее развития и сферы применения. Основные принципы работы и главные составляющие речевых систем. Технологии для автоматизации различных производственных процессов, основанные на речевых командах.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 18.08.2018 |
Размер файла | 355,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Электронный научно-практический журнал «МОЛОДЕЖНЫЙ НАУЧНЫЙ ВЕСТНИК» ИЮНЬ 2016 |
|
ТЕХНИЧЕСКИЕ НАУКИ |
Размещено на http://www.allbest.ru/
Электронный научно-практический журнал «МОЛОДЕЖНЫЙ НАУЧНЫЙ ВЕСТНИК» ИЮНЬ 2016 |
|
ТЕХНИЧЕСКИЕ НАУКИ |
Факультет математической экономики, статистики и информатики РЭУ им. Г. В. Плеханова
Речевые технологии в управлении предприятием
Хорошавина К. А., Захарова Е. В.
Аннотация
В данной статье речь пойдет о технологии управления голосом, тенденциях ее развития и сферах применения. Приведены основные принципы работы и главные составляющие речевых систем. Будут рассмотрены существующие технологии для автоматизации различных производственных процессов, основанные на речевых командах. Описаны проблемы развития речевых технологий, которые мешают их внедрению на предприятия.
Ключевые слова: речевые технологии, управление голосом, синтез речи.
Annotation
This article is focused on the technology of voice control, the trends of its development, fields of application, in particular in business and in various enterprises. We will show the basic working principles and main components of the speech system. Will be considered existing technology to automate various production processes, based on the voice commands. Will be described the problems of development of speech technologies that hinder their implementation on enterprises.
Keywords: speech technologies, voice control, speech synthesis.
В настоящее время речевые технологии занимают неотъемлемую часть нашей жизни. Они используются в сфере обслуживания (банковских организациях, call-центрах), ускоряя процесс обработки входящих звонков и сокращая издержки; в быту - радио-няни, которые на сегодняшний день уже имеют не только звук, но и видео и обратную связь; в повседневной жизни - например, в автомобилях, оснащенных системой голосового управления, чтобы водителя ничто не отвлекало во время движения. Во всех этих областях речевые технологии позволяют существенно снизить трудозатраты и операционные издержки.
Активное внедрение речевых систем также наблюдается и на предприятиях различной сферы деятельности в процесс управления и производства. Данные технологии успешно сочетают в себе множество функциональных возможностей, при этом они достаточно просты в обучении и очень эффективны в эксплуатации.
На данный момент времени существуют три основные составляющие речевых технологий. И первой, наиболее распространенной является - синтез речи. Это симуляция человеческого голоса и воспроизведение им какого-либо текста. Здесь немаловажную роль играют плавность звучания, ударения и интонация. Замена системой человека позволяет, не прибегая к человеческому ресурсу, успешно оптимизировать процесс клиентского обслуживания. К примеру, практически во всех современных супермаркетах используется система речевого оповещения, которая позволяет не только своевременно уведомлять клиентов, используя эффективные речевые шаблоны, но и управлять эвакуацией людей из супермаркета при пожаре. Системы синтеза речи, кроме сложности и величины словаря, обычно классифицируются следующим образом:
- по уровню кодирования (по тому, что является единицей, хранимой в словаре: слово, слог или фонема);
- методу кодирования.
Существуют два метода кодирования: непосредственное хранение фрагмента речевого сигнала (слова, слога или звука-фонемы) словаря (волновой метод) и хранение параметров речевого сигнала вместо него самого (параметрический метод). Второй метод позволяет гибко регулировать параметры выходящего речевого сигнала и значительно снижать необходимое для хранения словаря и самого сигнала количество памяти, но в некоторой степени снижает качество синтезируемой речи.
Примером программного интерфейса, поддерживающим функцию синтеза речи, является API Windows.Media.SpeechSynthesis в Windows 8.1. В Windows 8.1 входит несколько модулей синтеза речи, называемых голосами. Для каждого голоса задано имя, например Microsoft David (мужской голос, язык en-US), Microsoft Zira (женский голос, язык en-US) и Microsoft Hazel (женский голос, язык en-UK). Пользователь может выбирать голос на панели управления в разделе Язык. Синтез речи в Windows 8.1 дает следующие возможности: управление речевой команда автоматизация
- настраивать для синтезатора речи пол, голос и язык;
- преобразовывать обычный текст в речь с использованием характеристик и свойств по умолчанию для текущего голоса;
- создавать речь из строки, содержащей код на SSML, для настройки характеристик голоса, произношения, громкости, высоты, скорости, акцента и т. п.;
- считывать звуковые данные, созданные модулем синтеза речи, из потока с произвольным доступом и записывать их в поток.
Вторая составляющая - это система распознавания речи. Она позволяет преобразовать в компьютерную форму слитную человеческую речь. Системы распознавания голоса по сложности принято делить на следующие группы:
- системы для автоматического распознавания слитной речи (программное приложение выделяет слова в потоке речи пользователя, при этом поток речи частично слитный);
- системы для автоматического распознавания отдельных слов (программное приложение распознает слова команд, произносимых пользователем);
- системы для понимания речи (программные приложения, обладающие элементами интеллекта и в состоянии выделять слова в потоке речи на основе смыслового анализа, а также сохранять информацию о произнесенной речи в базе знаний, откуда информация может быть извлечена для решения интеллектуальных задач).
Также программы распознавания речи принято классифицировать:
- по размеру словаря (под словарем понимается набор хранимых в системе единиц речи, например, слов, слогов, фонем-звуков);
- по качеству распознавания (приемлемым считается процент ошибки распознавания не более 5 процентов);
- по способу обработки входного сообщения;
- по степени зависимости от диктора. [1]
Примером такой системы, применяемой на предприятии, является универсальная система распознавания слитной речи в процессе диктовки - ViaVoice, анонсируемая корпорацией IBM в 1997 году. Данная система состоит из словаря в 25 тысяч слов, расширяющегося до 230 тысячи слов. Применяя ViaVoice на предприятии, пользователями была замечена повышенная
производительность труда и экономия рабочего времени без затрат на низкоквалифицированную работу как набор текста самостоятельно.
Для совместного использования первых двух составляющих существует интерфейсная система, которая представляет собой третью составляющую голосовых технологий. Данная система должна понимать, когда следует синтезировать, а когда распознавать человеческую речь. При правильной работе данной интерфейсной системы существенно упрощается процесс автоматизации предприятия. Попробуем разобраться в некоторых уже существующих и внедренных на производство системах голосового управления.
Одной из таких систем является итальянская “Thinkdesign”, используемая в машиностроении. Она функционирует на IBM PC на операционной системе Microsoft Windows. Ее использование позволяет полностью сфокусироваться на создании конструкции, а не на работе со всевозможными переключателями, меню и командными строками. Старая версия этой системы без речевого управления, как показала практика, менее эффективна в процессе производства по сравнению с обновленной версией, в которую включен графический интерфейс без опций управления и параметров, которые отвлекают от основной задачи конструирования. Теперь все эти опции включены в мини-диалоги, которые задаются голосовыми командами. Но в связи с тем, что данная система и подобные ей были разработаны заграницей, ввод голосовых команд может быть осуществлен только на английском языке.
Еще одним важным параметром при сравнении голосовых систем является их зависимость от диктора.
Дикторозависимая система предназначена для использования только одним человеком, т.к. при разработке данной системы используются характеристики того диктора, на примере которого она обучалась. В это же время дикторонезависимая система может работать с любым диктором, но ее независимость достигается за счет хранения звуковых эталонов для всех наиболее типичных голосов носителей данного языка и требует в несколько раз большей производительности и памяти, чем в дикторозависимых системах [2].
Примером дикторозависимой системы, применяемой на предприятии, предназначенной для распознавания речи и для выдачи речевых команд компьютеру, является система «Горыныч Проф», состоящая из: главного окна программы и вспомогательных окон мониторинга. Верхнее окно предназначено для отображения названия сигнала в виде слова. Нижнее окно отображает выведенное графическое изображение в виде слова.
Пользовательский интерфейс приведен на рис. 1
Алгоритм работы с данной программой заключается в следующем:
1. В начале работы с программой следует настроить микрофон и настроить произношение слов словаря для конкретного пользователя.
2. Выбирается нужный словарь и в левое окно выводятся все слова из необходимого словаря. Далее в списке указывается в списке слов нужная команда двойным щелчком мыши.
3. Затем пользователь произносит выбранное слово так, как в дальнейшем он собирается его произносить при работе с программой. Отображение записанного слова будет выведено на экран. Если результат пользователя устраивает, то он должен кликнуть по кнопке «Заменить». Если результат пользователя не устраивает, то он может сделать запись заново.
4. Для распознавания речи и перевода её в текст необходимо помимо «Горыныча» включить какой-либо текстовый редактор.
Подводя итоги работы с данной системой, можно сказать, что работа с таким речевым интерфейсом и настройка словаря занимает достаточно много времени (по 10-15 минут на репетиции произношения одного слова). Кроме того, для работы такой программы требуется качественная звуковая карта и качественная гарнитура с микрофоном. [1]
Электронный научно-практический журнал «МОЛОДЕЖНЫЙ НАУЧНЫЙ ВЕСТНИК» ИЮНЬ 2016 |
|
ТЕХНИЧЕСКИЕ НАУКИ |
Размещено на http://www.allbest.ru/
Электронный научно-практический журнал «МОЛОДЕЖНЫЙ НАУЧНЫЙ ВЕСТНИК» ИЮНЬ 2016 |
|
ТЕХНИЧЕСКИЕ НАУКИ |
Рисунок 1. Речевой интерфейс программы «Горыныч Проф»
Примером дикторонезависимой системы, применяемой на предприятии, является система Babear SDK Version 3.0., основными преимуществами которой являются:
• Не требует обучения под конкретного пользователя, адаптация происходит в процессе работы пользователя;
• Позволяет распознавать речь в зашумленной среде;
• Возможность использовать поиск ключевых слов;
• Настройка под необходимую работу пользователя (произношение коротких команд или полной речи);
На отечественном рынке речевых технологий большая часть разработок принадлежит Центру Речевых Технологий. Это российская компания-производитель электронной техники и программного обеспечения в области записи, обработки и анализа звуковой информации.[3] Их продукты успешно применяются на предприятиях для обеспечения информационной безопасности («Smart Tracker» -- бесконтактная биометрическая система безопасности, позволяющая устанавливать личность по уникальным характеристикам, таким, как лицо и голос человека) и предприятиях по оказанию различного вида услуг («Барышня» -- система голосовой маршрутизации телефонных вызовов). Также современные отечественные организации в целях повышения эффективности бизнес-процессов разрешают своим сотрудникам использовать средства аудио- и видеоконференций для общения с клиентами, контрагентами, профессиональными сообществами для обеспечения некоторых сервисов, таких как техническая поддержка клиентов, call-центр. Контроль соблюдения политики безопасности без специализированного средства сводится к прослушиванию аудиозаписей оператором. Это требует значительных ресурсов, вводит дополнительный риск человеческого фактора и сомнительно с юридической точки зрения.[4] Рассмотрим эту и другие проблемы развития речевых технологий, являющиеся препятствием для автоматизации производственных процессов на предприятиях.
Несомненно, одной из важнейших проблем является безопасность речевых данных. Без специального уровня защиты ее утеря может привести к необратимым последствиям, а покупка дополнительного оборудования очень высока, не считая стоимости самой голосовой системы. Следовательно, организациям, только начинающим свой профессиональный путь, потребуется использование дополнительных ресурсов на их приобретение.
В процессе разработки и внедрения речевых интерфейсов на предприятия также возникли такие проблемы, как: невозможность полностью подавить внешний шум, чувствительность систем к речевым особенностям диктора (акцент, произношение), точность распознавания слитной речи и другие.
Подводя итог, хочется отметить, что, практическая ценность в организации новой технологии человеко-машинного интерфейса с использованием речевого ввода заключается в том, что она обеспечивает прямой доступ к управлению современными высокопроизводительными системами специалистам с невысокой квалификацией.[5] Но для успешного развития данных речевых технологий на отечественном рынке немаловажным условием является устранение вышеприведённых проблем при их эксплуатации на предприятиях, а также проведение дополнительных разработок, связанных с созданием новых методов и систем анализа именно русской речи с их дальнейшей интеграцией в современные системы управления.
Список литературы
1. Попов А.А. Эргономика пользовательских интерфейсов в информационных системах: учебное пособие/ А.А. Попов. - М.: РУСАЙНС, 2016.- 312с.
2. Кучерявый А. А. «Бортовые информационные системы: курс лекций»
3. Wikipedia [электронный ресурс] /Статья: Центр Речевых Технологий/ Режим доступа: https://ru.wikipedia.org/wiki/Центр_Речевых_Технологий
4. CRN [электронный ресурс] /Статья: Речевые технологии: на пороге важных событий/ Режим доступа: http://www.crn.ru/numbers/spec-numbers/detail.php?ID=79646
5. Изилов Я. Ю. Технологии речевого управления для автоматизации производственных процессов // Информационно-управляющие системы . 2003.
Размещено на Allbest.ru
...Подобные документы
Принцип работы автоматизированной информационной технологии, особенности ее применения в налоговой системе. Роль АИС "Налог" в повышении эффективности функционирования системы налогообложения. Информационные технологии управления бюджетной системой.
контрольная работа [18,8 K], добавлен 13.10.2009Классификация автоматизированных информационных систем. Классические примеры систем класса А, B и С. Основные задачи и функции информационных систем (подсистем). Информационные технологии для управления предприятием: понятие, компоненты и их назначение.
контрольная работа [22,9 K], добавлен 30.11.2010Информационные технологии управления турфирмами для автоматизации деятельности туроператоров, турагентов по формированию и реализации турпродукта потребителю. Глобальные компьютерные системы бронирования. Информационные технологии управления гостиницами.
контрольная работа [37,1 K], добавлен 05.05.2014Классификация информационных систем и технологий в организационном управлении. Методы и организация создания ИС и ИТ. Состав, структура, внутримашинного информационного обеспечения. Информационные технологии и процедуры обработки экономической информации.
контрольная работа [28,9 K], добавлен 25.07.2012Главные аспекты развития предприятий и внешней среды и их влияние на роль информационных технологий в управлении предприятием: интеграция децентрализованных систем, психологический фактор и языковые уровни. Основные тенденции развития IT-индустрии.
курсовая работа [1,1 M], добавлен 21.08.2011Автоматизированные поисковые системы. Информационные технологии в делопроизводстве и документообороте. Компьютерные сети и гипертекстовые технологии. Использование систем управления базами данных. Обработка информации на основе электронных таблиц.
контрольная работа [2,9 M], добавлен 15.12.2013Основная идея методологии и принципы RAD-разработки информационных систем, ее главные преимущества. Причины популярности, особенности применения технологии. Формулировка основных принципов разработки. Среды разработки, использующие принципы RAD.
презентация [866,8 K], добавлен 02.04.2013Организация, состав, структура внутримашинного информационного обеспечения. Сети хранилищ данных и базы знаний – перспектива развития ИО в управлении организации. Системы автоматизации коллективной работы над документами. Назначение экспертных систем.
контрольная работа [28,8 K], добавлен 24.05.2012Применения компьютеров в гостиницах расширяются от их признанной роли в системах бронирования до образования комплексных информационных систем управления, координации и мониторинга всего бизнеса. Основные информационные технологии в гостиничном бизнесе.
реферат [43,3 K], добавлен 29.04.2008Беспроводные технологии и классификация беспроводных сетей, принципы их построения. Концепция и основные положения Bluetooth - первой технологии, позволяющей организовать беспроводную персональную сеть передачи данных, принцип его работы и использование.
курсовая работа [1011,7 K], добавлен 11.12.2014Массовые технологии производства электронных дисплеев. Современные методы изготовления дисплеев, принципы их работы, преимущества и недостатки. Сферы применения дисплеев, объемы использования в современных устройствах, тенденции развития отрасли.
реферат [1,1 M], добавлен 23.05.2010Новые информационные технологии в управленческой деятельности. Информационно–вычислительные и ситуационные центры в государственном и региональном управлении. Координация процессов создания, внедрения, эксплуатации и развития информационных систем.
курсовая работа [1,6 M], добавлен 06.04.2009Основные составляющие информационной технологии. Классические принципы построения архитектуры ЭВМ. Принцип последовательного выполнения операций. Перспективы применения экспертных систем в землеустроительных системах автоматизированного проектирования.
контрольная работа [13,8 K], добавлен 13.11.2012Понятие информационной технологии и ее принципы: интерактивный режим работы, интегрированность с другими программными продуктами, гибкость процесса измерения данных. Цели применения автоматизированных информационных систем в следственной деятельности.
реферат [23,4 K], добавлен 15.03.2015Применение информационных технологий при анализе финансовых потоков организации. Сущность электронного документооборота и его возможности. Принципы работы со служебной корреспонденцией. Информационные технологии управления отношениями с контрагентами.
методичка [1,1 M], добавлен 17.03.2015Понятие и классификация информационных систем, их типы и функциональные особенности: связи, хранения и обработки информации, поисковые. Процесс устаревания данных систем, их значение и задачи в мире, сферы использования и возможности, управление.
презентация [555,0 K], добавлен 10.03.2015Роль информационных процессов в организационно–экономической сфере, технологии и методы обработки информации. Поисковые системы, основные программы для работы в Интернете, средства работы с электронной почтой, системы быстрого обмена сообщениями.
контрольная работа [230,5 K], добавлен 19.02.2012Сущность и содержание системы управления, основные принципы формирования ее информационной модели. Определение роли и значения информации в процессе управления. Принципы и инструменты автоматического управления. Главные задачи теории управления.
реферат [43,4 K], добавлен 10.02.2011История создания и развития Bluetooth Wi-Fi. Область использования WiMAX - телекоммуникационной технологии. Аппаратная реализация и возможности IrDA. Способы и скорость передачи данных. Подключение и настройка. Достоинства и недостатки беспроводных сетей.
курсовая работа [34,4 K], добавлен 20.05.2011Основные составляющие современного персонального компьютера и их назначение. Геоинформационные системы и возможности их применения на автомобильном транспорте. Принципы построения навигационных систем. Сотовые системы связи. Локальные компьютерные сети.
контрольная работа [54,9 K], добавлен 21.02.2012