Синтез речи по правилам – программа "Vocaloid"
Особенности программного обеспечения "Vocaloid" компании Yamaha, имитирующего поющий голос человека на основе заданной мелодии и текста. Использование программой компьютерной технологии полного синтеза речи с использованием отрезков естественного языка.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 15.03.2019 |
Размер файла | 14,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ФГБОУ ВО "Тюменский индустриальный университет"
Синтез речи по правилам - программа "Vocaloid"
Захарова С.П.
Научный руководитель:
к.п.н., доцент Сенкевич Л.Б.
г. Тюмень, Россия
В современном мире, чтобы создать музыку, не обязательно иметь огромную студию с живыми инструментами и обладать сильным голосом. Достаточно иметь компьютер и пару программ, которые заменят вам целый оркестр и подкорректируют ваш голос. Новейшие технологии не только упрощают работу профессионалам, но и делают создание музыки доступным для всех.
Так и поступила компания Yamaha, создавшая программное обеспечение, имитирующее поющий голос человека на основе заданной мелодии и текста. Программа работает на основе технологии полного синтеза речи с использованием отрезков естественного языка. Любую программу на основе Vocaloid можно условно поделить на две части: систему синтеза голоса (пения) и библиотеки исполнителей. Сначала голос разбивается на небольшие отрывки и записывается в базу данных. Далее, пользователь вводит мелодию произведения, указывает для каждой ноты соответствующую фонему текста песни, после чего Vocaloid синтезирует пение. Предусмотрена возможность изменения тембра, скорости, частот, наложения различных эффектов. Другими словами, с этой технологией можно петь без певца. Поющие голоса синтезированы на основе фрагментов голосов, взятых у исполнителей; эти фрагменты собраны в единую базу Singer Library. Существует бесчисленное множество музыкальных композиций, загруженных на Nico Video, Youtube.
Данная программа приобрела огромную популярность. В 2010 году в Токио был проведен первый концерт Хатсуне Мику, где эта искусственная исполнительница танцевала и перевоплощалась в разные наряды прямо на сцене под живую музыку! Эта 3D-галлограмма с компьютерным голосом покорила не только всю Японию, но и другие страны. CD диски с песнями Vocaloid вошли в топы продаж, популярные песни люди пели в караоке, так что софт и музыка, основанные на Vocaloid, стали собственной музыкальной культурой.
С первого превью этой программы произошло множество изменений: теперь сложно найти различия между ней и голосом живых людей. Пользователям стало легко создавать свои каверы и прочие приятные вещи. Интернет предоставляет возможности для развития Vocaloid, можно будет в будущем использовать множество интересных решений, которые позволят пользоваться различными приложениями на основе Vocaloid на мобильных телефонах и портативных игровых устройствах.
Самые известные продукты (так же их можно назвать исполнителями) на базе программного обеспечения фирмы Yamaha Corporation:
1. Хатсуне Мику (яп.Џ‰‰№ѓ~ѓN) - виртуальная певица, созданная компанией Crypton Future Media 31 августа 2007 года. Ее голос синтезирован из семплированного голоса японской сейю Саки. В переводе с английского языка слово sample означает "образец". Применительно к звуку и музыкальным секвенсорам сэмпл - это какой-то оцифрованный фрагмент звучания инструмента или голоса. Образ зеленоволосой девушки был создан японским иллюстратором KEI Garou, работавшим над внешностью других вокалоидов для Crypton Future Media. Она является самым известным и популярным вокалоидом и стала поп-идолом. Также, благодаря технологии лазерной 3D-голографии, она даёт и живые концерты. Свыше 2,5 миллиона пользователей подписано на её страницу в Facebook.
2. Голос Мэйко полностью создан компьютером, поэтому звучит более грубо. За основу взят голос японской певицы Мэйко Хайго. Мэйко может исполнять любые песни различных жанров, такие как рок, поп, джаз, детские песни. Согласно официальному дизайну, она одета в белую жилетку, короткую юбку малинового цвета с двумя белыми ремешками и коричневые сапоги. Она первый женский ВОКАЛОИД первой серии, выпущенный в Японии. vocaloid речь голос мелодия
3. 27 декабря 2007 был выпущен второй пакет Кагаминэ Рин/Лен с персонажами-зеркальными двойниками: мальчик Лен и девочка Рин.
"Голоса" Рин и Лен основаны на голосе сэйю Асами Симода (Asami Shimoda).
В ближайшем будущем пользоваться Vocaloid станет так же естественно, как играть на музыкальных инструментах; платформа поддерживает должное внимание композиторов уже долгое время! Главной особенностью данной программы Технология Vocaloid будет распространяться среди все большего числа людей, которые, в свою очередь, найдут новые возможности использовать ее для своего удовольствия. Я надеюсь, что она станет неотъемлемой частью музыкальной индустрии.
Источники
1. http://all-vocaloids.ru/ofitsial-no-vocaloid-yamaha/
2. https://ru.wikipedia.org/wiki/Мику_Хацунэ
3. https://ru.wikipedia.org/wiki/Vocaloid
Размещено на Allbest.ru
...Подобные документы
Функции текстового редактора как программы для работы с текстом. Использование редактора MS Word в научной деятельности исследователя-ономаста. Технология распознавания текста и организация работы с программой FineReader. Системы распознавания речи.
реферат [979,3 K], добавлен 16.10.2013Появление поисковых систем. Применение семантических сетей для анализа текста. Определение релевантности, ранжирование и индексация. Особенности программы Balabolka. Системы анализа речи. Современные особенности поиска. Развитие сервисов поисковых систем.
реферат [3,2 M], добавлен 22.04.2015Проектирование системы голосового управления в автоматизированных жилых комплексах. Распознавание и порождение (синтез) речи компьютером. Синтез устной речи. Технология поиска ключевых слов. Нейросетевое сравнение на основе простых персептронов.
дипломная работа [4,3 M], добавлен 19.06.2011Описание среды разработки Microsoft Visual Studio. Поддерживаемые технологии и языки программирования. Возможности и особенности компьютеризированного тестирования человека. Проектирование программного обеспечения с использованием объектного подхода.
курсовая работа [3,0 M], добавлен 09.02.2013Появление искусственных систем, способных воспринимать и понимать человеческую речь. Автоматическая обработка естественного языка. Анализ, синтез текстов. Системы автоматического синтеза. Проблема понимания, оживление текстов. Модели коммуникации.
реферат [19,0 K], добавлен 02.11.2008Принцип работы нейросетей и модели синтеза. Ключевые моменты проблемы распознавания речи. Система распознавания речи как самообучающаяся система. Описание системы: ввод звука, наложение первичных признаков на вход нейросети, модель и обучение нейросети.
курсовая работа [215,2 K], добавлен 19.10.2010Требования к технологии проектирования программного обеспечения (ПО). Состав и описание стадий полного жизненного цикла ПО. Классификация моделей жизненного цикла ПО, их особенности. Методологии разработки ПО, приёмы экстремальный программирование.
презентация [874,4 K], добавлен 19.09.2016Изучение элементов языка С++, программирование разветвлений и циклов с использованием операторов условного и перехода. Обработка одномерных массивов. Поиск максимального элемента массива с заданной размерностью. Листинги программы и результатов.
курсовая работа [647,7 K], добавлен 05.02.2013Оценка акустической защищённости на основе "метода формантной разборчивости" с использованием инструментальных средств. Расчет значений октавного уровня соотношения "сигнал/шум" на основе исходных данных. Определение словесной разборчивости речи.
курсовая работа [721,0 K], добавлен 28.05.2015Разработка программного обеспечения для регистрации удержаний из заработной платы. Характеристика используемой операционной системы и языка программирования. Написание алгоритма и текста программы меню, ввода данных и формирования выходных документов.
курсовая работа [2,1 M], добавлен 20.11.2012Строение артикуляционного аппарата человека с точки зрения возможности распознавания речи по артикуляции. Комплекс параметров артикуляции на основе контура внутренней области губ. Реализация модуля распознавания фонем русской речи по изображениям губ.
дипломная работа [3,1 M], добавлен 19.08.2012Основы и характеристика технологии Ajax, ее преимущества и применение. Системы, созданные с использованием Ajax, базовые технологии. Файловый веб менеджер на основе технологии Ajax, его основные возможности и принцип реализации программного кода.
курсовая работа [25,6 K], добавлен 23.12.2009Проектирование программного обеспечения для создания баз данных о работах студентов университета при помощи языка Visual Basic. Разработка интерфейса пользователя. Руководство для системного программиста. Краткое описание алгоритма работы с программой.
курсовая работа [2,6 M], добавлен 19.03.2010Технологии лазерного сканирования и задачи, решаемые с его помощью. Принцип работы сканирующей системы, ее технические характеристики. Функциональные возможности программного обеспечения Cyclone 6.0, его модули, обмен данными с программой AutoCAD.
реферат [3,8 M], добавлен 19.05.2010Создание информационной системы обработки матриц. Общая характеристика программного обеспечения, которое реализует выполнение заданных функций. Программа разработана с использованием среды визуального программирования Delphi 7 и языка Object Pascal.
курсовая работа [373,4 K], добавлен 14.01.2011Особенности аналитической и эмпирической моделей надежности программных средств. Проектирование алгоритма тестирования и разработка программы для определения надежности ПО моделями Шумана, Миллса, Липова, с использованием языка C# и VisualStudio 2013.
курсовая работа [811,5 K], добавлен 29.06.2014Анализ платформы GATE и ее инструмента для аннотирования текста. Обзор существующих редакторов для визуальных языков и языка JAPE, их возможности, преимущества и недостатки. Проектирование визуальных конструкций на основе языка программирования JAPE.
дипломная работа [770,5 K], добавлен 08.02.2017Анализ локально-вычислительной сети компании. Выбор общего программного обеспечения, обеспечения для инженерного отдела, бухгалтерии, сервера. Состав программного обеспечения вычислительной системы и его конфигурация. Сетевые операционные системы.
курсовая работа [405,4 K], добавлен 08.02.2016Знакомство с программой PageMaker: создание новой публикации; форматирование символов и абзацев; глобальное форматирование. Импорт и редактирование текста. Рисование средствами PageMaker. Импорт графики. Связывание файлов. Компоновка текста и графики.
лабораторная работа [2,2 M], добавлен 01.12.2007Возможности среды программирования delphi при разработке приложения с визуальным интерфейсом. Разработка спецификации программного обеспечения и на ее основе кода программного продукта. Отладка программы "трассировкой", ее тестирование и оптимизация.
курсовая работа [501,4 K], добавлен 07.12.2016