Принципы сжатия звуковой информации на основе алгоритмов MPEG
Описание математических методов кодирования и сжатия звуковой информации. Характеристика различных форматов звуковых данных. Сравнительный анализ различных форматов звуковой информации. Характеристика преимуществ и недостатков формата MPEG Layer III.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 26.05.2018 |
Размер файла | 1,0 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Устранение помех на границах сегментов
Так как в качестве базиса, как правило, берутся непрерывные функции, то, несмотря на округление коэффициентов, при восстановлении сегмента мы получаем непрерывную функцию. Но между сегментами может возникнуть ескачекъ, т.к. в конце текущего сегмента восстановленный сигнал является суперпозицией одних компонент, а в начале следующего сегмента - суперпозицией других компонент. Под компонентами здесь понимаются базисные функции, умноженные на соответствующие коэффициенты разложения. И если значения сигнала на стыке двух сегментов совпадали до округления, то после округления они могут не совпадать. Таким образом, непрерывность исходного сигнала может быть утеряна.
Если рассматривать спектр восстановленного сигнала, то разрыв интерпретируется как высокочастотная осцилляция, и на слух он воспринимается, как щелчок. Такие щелчки сильно выделяются на фоне остальных погрешностей и выливаются в шум на протяжении всего восстановленного сигнала.
Эта проблема решается перекрыванием сегментов. При сжатии сегменты берутся с некоторым заступом на следующие, а при восстановлении применяется следующий прием: на протяжении участка перекрывания, амплитуда текущего восстановленного сегмента непрерывно уменьшается до нулевой, а амплитуда следующего восстановленного сегмента непрерывно увеличивается от нулевой амплитуды до исходного значения. Чтобы описать этот процесс, возьмем неубывающую функцию
w( x) О C[0,1] , такую, что w(0) = 0, w(1) = 1.
Пусть область перекрывания на временной оси - есть интервал [a, b]. Будем умножать амплитуду сигнала текущего сегмента в области перекрывания на чего, эти амплитуды складываются. Этот процесс называется кроссфэйдингом (crossfading).
Рис. 2.14 Кроссфэйдинг в области перекрывания сегментов.
На рисунке 2.14 изображен восстановленный сигнал, который был сжат с использованием метода перекрывания сегментов; сигнал представляет собой синусоидальную волну, а в качестве w(x) взята линейная функция. Таким образом, возможный разрыв устраняется, так как сигнал сегмента теперь представляет собой непрерывную функцию на временной оси, а восстановленный сигнал является композицией сигналов сегментов.
Деление сигнала на сегменты: Статическая реализация
Первый и самый простой способ заключается в выборе фиксированной длины сегмента, то есть на вход процедуре сжатия последовательно подаются сегменты одинаковой длины, а затем сегмент-остаток.
Деление сигнала на сегменты: Адаптивная реализация
Второй способ заключается в выборе длины текущего сегмента на основе характеристик предыдущего. В качестве таких характеристик можно взять коэффициенты разложения предыдущего сегмента. В случае преобладания высоких частот можно уменьшать длину текущего сегмента для лучшей локализации высоких частот. В случае преобладания низких частот мы, наоборот, увеличиваем длину текущего сегмента для лучшей локализации низких частот. Этот метод используется почти во всех доминирующих форматах сжатия звука на сегодняшний день, таких как MP3 и Ogg Vorbis.
Динамическая реализация
Третий способ заключается в подборе такого разбиения, которое минимизирует суммарное количество байтов закодированного сигнала, то есть предоставление программе возможности еадаптироватьсяъ к структуре сигнала. Это возможно в случае, если преобразование ечувствительноъ к разбиению сигнала на сегменты. Поясним это свойство на примере.
Рис. 2.15 Разбиение на сегменты
На рисунке 2.15 изображена часть сигнала, разбитая на сегменты. Отметим, что для преобразования Фурье этот вариант разбиения будет самым эффективным среди всех возможных с точки зрения сжатия, так как сегмент C будет иметь всего один ненулевой коэффициент разложения, в A и E будут нули, и лишь сегментах B и D будут присутствовать разные составляющие спектра. Чтобы определить наиболее эффективное с точки зрения сжатия разбиение, можно использовать динамическое программирование.
Итак, нам необходимо определить разбиение, минимизирующее объем выходных данных - такую последовательность точек, что интервалы между соседними точками принимаются за сегменты звукового сигнала, подлежащие сжатию. Во-первых, отметим, что слишком большие длины сегментов брать бессмысленно, так как в случае преобразования Фурье, с ростом длины сегмента растут трудоемкость и погрешность. Во- вторых, мы должны зафиксировать шаг для динамического программирования, который определяет длину минимального возможного сегмента в разбиении так, что длина каждого сегмента кратна этому шагу. Если фиксировать шаг равный 1, то при сжатии больших объемов аудио информации алгоритм становится очень трудоемким.
Введем некоторые обозначения:
h - длина минимально возможного сегмента.
n - количество шагов в сегменте максимальной возможной длины. Таким образом, мы получили равномерную сетку на сигнале с шагом h:
Введем понятие пути Pk из x0 в xk:
где M = |Pk| - 1 - число сегментов в пути Pk. Обратим внимание на то, что в определении пути присутствуют три свойства: длина каждого сегмента (pj-1, pj) пути Pk кратна шагу h, не равна нулю и не превышает длины максимально возможного сегмента nh.
Пусть вес сегмента (хi, xj) - это количество байт после сжатия сегмента сигнала, ограниченного этими точками, обозначим вес сегмента за d(хi, xj).
Тогда вес пути Pk равен сумме весов всех его сегментов:
Путь Pm из x0 в конечную точку xm можно интерпретировать как разбиение исходного сигнала. Отметим, что путь из x0 в xm минимального веса и будет искомым разбиением. Итак, можно ввести эквивалентную задачу на следующем графе:
Рис. 2.16 Граф состояний
На рисунке 2.16 изображен граф состояний, соответствующий конкретной задаче сжатия, в которой число шагов m = 10, количество шагов в максимально возможном сегменте n = 4.
Каждая вершина графа (xk, t) характеризует множество путей из x0 в xk, которые состоят из t сегментов. Вес любого ребра
в графе определим как вес сегмента
Нам необходимо найти путь минимального веса до любой из вершин (x10, t). Можно ввести фиктивные ребра, вес которых равен нулю (изображены пунктиром) до фиктивной вершины T, тогда задача сводится к нахождению пути минимального веса на графе (рис. 2.16) из S в T.
Вес ребер не зависит от числа сегментов t, и, по сути, нам не важно, сколько сегментов в пути, а важен его вес, поэтому все состояния, соответствующие фиксированному xk и разным t можно считать тождественными, таким образом, можно рассматривать проекцию графа (рис. 2.16) на ось x:
Рис. 2.17 Проекция графа состояний на ось x
Задача сводится к нахождению пути минимального веса на графе (рис. 2.3) из x0 в xm. Будем решать задачу методом динамического программирования. Разобьем задачу на этапы. На k-м этапе необходимо найти путь минимального веса из x0 в xk, обозначим его через P k * , при условии, что P k ?1* уже найдены. Запишем уравнение Бэллмана:
На k-м этапе у нас имеется n управлений, где i-е управление отвечает за выбор пути
Выбор оптимального управления осуществляется очевидным образом, в соответствии с уравнением Бэллмана, то есть i ? arg min{d ( Pj ?1,...,nk-j*) d ( xk-j ,xk )} .
Для определения величин d(xk-j, xk), где j = 1, 2, …, n, нам необходимо провести сжатие n сегментов (xk-1, xk), (xk-2, xk), …, (xk-n, xk).
Заметим, что на каждом шаге алгоритма Дейкстры при добавлении вершны xk мы также должны сжать n сегментов (xk, xk+1), (xk, xk+2), …, (xk, xk+n).
Следовательно, так как количество шагов алгоритма Дейкстры и описанного алгоритма равно m, то трудоемкости этих алгоритмов совпадают. Но описанный алгоритм более удобен в реализации, так как в алгоритме Дейкстры вершины могут добавляться непоследовательно.
Сделаем несколько замечаний относительно реализации описанного алгоритма динамического программирования:
1. При сжатии сегментов, на каждом шаге формируются n блоков, содержащих сжатые сегменты сигнала, из которых выбирается один, а остальные удаляются.
2. В пути, фактически, не содержится точек разбиения, а содержится несколько таких блоков, связанных указателями, и мы храним только указатели на последние блоки путей.
3. При формировании нового пути, нам не нужно копировать все блоки из k-j-го пути, нам достаточно установить указатель i-го блока, на последний блок k-j-го пути, а указатель k-го пути на j-й блок.
4. На k-м шаге нам уже не нужны пути P0* ,P1* , …,P k ? n ?1* , и после k-го шага, путь P k ? n* уже не понадобится. Удалим те его блоки, на которые нет ссылок из других путей. Следовательно, на k-м шаге можно хранить только указатели на последние блоки последних n путей.
5. На каждом шаге блоки со ссылками образуют дерево и являются его узлами.
2.4 Заключение по 2-й главе
Оцифрование звука и любой другой аналоговой информации стало доступно после изобретения теоремы Котельникова и применением преобразования Фурье, а также развитием полупроводниковый приборов в частности микросхем для осуществления данной цели.
Во второй главе данной работы были рассмотрены и глубоко изучены основные виде дискретизации, кодировании, сжатия. А также были изучены все теоретические аспекты функционирования форматов MPEG и Ogg Vorbis кодирования и сжатия звука.
Переобразование звука в форматах MPEG и Ogg Vorbis довольно схожи, но имеют различия в самих кодов используемых для кодирования звуковой информации. Процесс создания MPEG или Ogg Vorbis файла, или переобразование звука в данные форматы, требует прохождения различных процессов описанных во второй главе. На сегодняшний день качество и «вес» каждого звукового файла зависит от теоретических основ, математических методов используемых в различных форматах. Но кодирование и сжатие не происходит без потерь. Для обеспечения высокого качество нужен больший размер. При минимизации размера теряется качество. Самые оптимальные критерии размера и качества приведены в формате MPEG Layer III. Теоритическое различие создания разных методов, схем и кодов для кодирования и сжатия обусловливается применением данного звукового формата в разных областях применении оцифрованных звуковых файлов. Это может быть как озвучивание компьютерных игр и приложений, так и озвучивание интернет сайтов. Также отдельно подразделяют файлы для прослушивания музыки. В настоящее время формат MPEG Layer III популярен не только для прослушивания музыки и различных аудио данных, но и для озвучивания интернет сайтов, веб-приложений и в некоторых случаях для озвучивания компьютерных приложение.
Глава 3. Форматы цифровых звуковых файлов
3.1 Звуковые стандарты MPEG
MPEG-1 Audio Layer I (сокр. MP1) - один из трёх форматов (уровень 1) сжатия звука с потерями, определённых в стандарте MPEG-1[5]. Хотя MPEG-1 Audio Layer I поддерживается большинством современных медиаплееров, этот формат считается устаревшим. Вместо него в основном используются форматы MP2 и MP3.
Для обозначения файлов, в которых содержится только аудиоинформация формата MP1, используется расширение .mp1 или, иногда, .m1a.
Технология сжатия MP1 использует сравнительно простую схему полосного кодирования с 32 поддиапазонами.
Layer I (слой 1) рекомендуется для применения в профессиональной области, в системах записи-перезаписи с высоким студийным качеством с достаточной ёмкостью памяти. Он характеризуется небольшой сложностью и невысокой степенью редукции аудиоданных.
MPEG-1 layer I также использовался в Digital Compact Cassette, как часть аудиокодека PASC (англ. Precision Adaptive Sub-band Coding - прецизионное адаптивное полосное кодирование). В связи с необходимостью передачи постоянного потока отдельных блоков данных (кадров) на ленточный носитель, в PASC использовался дополнительный бит в MPEG заголовке для определения начала кадра. Битрейт всегда 384 кбит/с.[6]
Расширение формата было представлено в MPEG-2 Audio Layer I и определено в стандарте ISO/IEC 13818-3 (MPEG-2 Part 3)[8], первая редакция была опубликована в 1995[4]
дополнительные частоты дискретизации: 16, 22.05 и 24 кГц
дополнительные битрейты: 48, 56, 80, 112, 144 и 176 кбит/с.
Кодирование и декодирование звуковых сигналов MPEG-1 Layer I
Метод кодирования
Входной цифровой звуковой сигнал разделяется на кадры (фреймы), каждый из которых кодируется и декодируется независимо от других кадров. Размер кадра для уровня Layer I составляет 384 отсчёта.
Полоса аудиосигнала с помощью цифровых полосовых фильтров разбивается на 32 поддиапазона. Все поддиапазоны имеют одинаковую ширину, которая зависит от частоты дискретизации входного сигнала. После разделения частота дискретизации уменьшается в 32 раза, так что число отсчётов в кадре в каждом поддиапазоне равно 12.
Затем выполняется квантование данных. Предварительно определяются масштабные множители, которые зависят от максимального значения сигнала. При этом масштабный множитель определяется для каждого поддиапазона в кадре, то есть для 12 отсчётов сигнала поддиапазона. Перед квантованием значения сигнала делятся на соответствующие масштабные множители. [7]
Затем в блоке квантования и кодирования выполняется квантование данных. В основе сжатия звуковой информации на уровне Layer I лежит метод, называемый адаптивным распределением битов. Этот метод заключается в выполнении квантования с различным числом двоичных разрядов квантования для разных частотных поддиапазонов. При этом используется равномерное квантование. Полное число битов, выделяемых на все поддиапазоны в данном кадре, зависит от частоты дискретизации входного сигнала и от заданной выходной скорости передачи двоичных символов, то есть от требуемой степени сжатия звуковой информации. Распределение битов по поддиапазонам осуществляется блоком психоакустической модели.
Чтобы выполнить распределение битов в блоке психоакустической модели, анализируется спектр исходного звукового сигнала (не разложенного на поддиапазоны). Для этого производится быстрое преобразование Фурье участков этого сигнала по 512 отсчётов, после чего вычисляется спектр мощности звукового сигнала и величины звукового давления в каждом частотном поддиапазоне.
Затем анализируются тональные (синусоидальные) и нетональные составляющие звукового сигнала, определяются локальные и глобальные пороги маскировки и вычисляются отношения сигнал/маскирующий сигнал для всех поддиапазонов, на основании которых производится распределение битов по поддиапазонам.
В тех поддиапазонах, в которых искажения звука, вызываемые квантованием, менее заметны для слушателя или маскируются большим уровнем сигнала в других поддиапазонах, квантование делается более грубым, то есть для этих поддиапазонов выделяется меньше битов. Для полностью маскируемых поддиапазонов битов совсем не выделяется. Благодаря этому, удаётся существенно уменьшить количество передаваемой информации при сохранении достаточно высокого качества звука.
Декодирование
Данные, содержащиеся в кадре, декодируются в соответствии с порядком их следования и таблицами кодов, которые содержатся в программе работы декодера. Декодированные данные о распределении битов и о масштабных множителях используются для декодирования и деквантования звуковых данных. После деквантования отсчёты сигналов поддиапазонов умножаются на соответствующие масштабные множители.
После декодирования и деквантования отсчёты сигналов всех поддиапазонов объединяются в выходной цифровой звуковой сигнал.
MPEG-1 Audio Layer II (сокр. MP2, иногда называется Musicam) - один из трёх форматов (уровень 2) сжатия звука с потерями, определённых в стандарте MPEG-1[3]. Применяется в цифровом радиовещании DAB и устаревшем стандарте Video CD, который в 90-е годы использовался для распространения фильмов на оптических компакт-дисках и существовал до широкого распространения DVD [15].
Кодер MPEG-1 Audio Layer 2 развился из аудиокодека MUSICAM (англ. Masking pattern adapted Universal Subband Integrated Coding And Multiplexing - универсальное полосное кодирование и мультиплексирование с адаптацией к шаблону маскировки), разработанного CCETT, Philips и IRT в 1989 как часть исследований EUREKA 147 европейских межправительственных разработок для систем цифрового радиовещания для стационарных, портативных и мобильных приёмных устройств (основан в 1987). Основные параметры MPEG-1 Audio были унаследованы из MUSICAM, включая банк фильтров, обработку во временной области, размер аудиокадра и т. д. Однако, после дополнительного усовершенствования, алгоритм MUSICAM не был использован в финальной версии стандарта MPEG-1 Layer II.
MPEG-1 Audio Layer II определён в стандарте ISO/IEC 11172-3 (MPEG-1 Часть 3)
Частота дискретизации: 32, 44.1 и 48 кГц
Битрейты: 32, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320 и 384 кбит/с.
Расширение формата было представлено в MPEG-2 Audio Layer II и определено в стандарте ISO/IEC 13818-3 (MPEG-2 Part 3)[5][6]
дополнительные частоты дискретизации: 16, 22.05 и 24 кГц
дополнительные битрейты: 8, 16, 24, 40 и 144 кбит/с, для формата 5.1 - около 1 Мбита/с.
поддержка мультиканальности - до 5 полных каналов и канала низкочастотных эффектов.
Поддерживается переменный битрейт (VBR)
Кодирование и декодирование звуковых сигналов MPEG-1 Layer II
Метод кодирования
Входной цифровой звуковой сигнал разделяется на кадры (фреймы), каждый из которых кодируется и декодируется независимо от других кадров. Размер кадра для уровня Layer II составляет 1152 отсчёта.
Полоса аудиосигнала с помощью цифровых полосовых фильтров разбивается на 32 поддиапазона. Все поддиапазоны имеют одинаковую ширину, которая зависит от частоты дискретизации входного сигнала. После разделения частота дискретизации уменьшается в 32 раза, так что число отсчётов в кадре в каждом поддиапазоне равно 36.
Затем выполняется квантование данных. Предварительно определяются масштабные множители, которые зависят от максимального значения сигнала. При этом масштабный множитель определяется для групп по 12 отсчётов в каждом поддиапазоне, причём множитель может быть общим для двух или трёх групп. Таким образом, для каждого поддиапазона в кадре определяется до трёх масштабных множителей. Перед квантованием значения сигнала делятся на соответствующие масштабные множители.
Затем в блоке квантования и кодирования выполняется квантование данных. В основе сжатия звуковой информации на уровне Layer II лежит метод, называемый адаптивным распределением битов. Этот метод заключается в выполнении квантования с различным числом двоичных разрядов квантования для разных частотных поддиапазонов. При этом используется равномерное квантование. Полное число битов, выделяемых на все поддиапазоны в данном кадре, зависит от частоты дискретизации входного сигнала и от заданной выходной скорости передачи двоичных символов, то есть от требуемой степени сжатия звуковой информации. Распределение битов по поддиапазонам осуществляется блоком психоакустической модели.
После квантования выполняется кодирование полученных данных. Квантованные отсчёты сигнала в каждом поддиапазоне объединяются по три, и полученные последовательности битов кодируются с использованием таблиц кодов с переменной длинной. Кроме того с помощью соответствующих таблиц кодируются данные о распределении битов по поддиапазонам и данные о масштабных множителях [17].
Чтобы выполнить распределение битов в блоке психоакустической модели анализируется спектр исходного звукового сигнала (не разложенного на поддиапазоны). Для этого производится быстрое преобразование Фурье участков этого сигнала по 1024 отсчётов, после чего вычисляется спектр мощности звукового сигнала и величины звукового давления в каждом частотном поддиапазоне.
Затем анализируются тональные (синусоидальные) и нетональные составляющие звукового сигнала, определяются локальные и глобальные пороги маскировки и вычисляются отношения сигнал/маскирующий сигнал для всех поддиапазонов, на основании которых производится распределение битов по поддиапазонам.
В тех поддиапазонах, в которых искажения звука, вызываемые квантованием, менее заметны для слушателя или маскируются большим уровнем сигнала в других поддиапазонах, квантование делается более грубым, то есть для этих поддиапазонов выделяется меньше битов. Для полностью маскируемых поддиапазонов битов совсем не выделяется. Благодаря этому удаётся существенно уменьшить количество передаваемой информации при сохранении достаточно высокого качества звука.
Декодирование
Данные, содержащиеся в кадре, декодируются в соответствии с порядком их следования и таблицами кодов, которые содержатся в программе работы декодера. Декодированные данные о распределении битов и о масштабных множителях используются для декодирования и деквантования звуковых данных. После деквантования отсчёты сигналов поддиапазонов умножаются на соответствующие масштабные множители.
После декодирования и деквантования отсчёты сигналов всех поддиапазонов объединяются в выходной цифровой звуковой сигнал.
MP3 (более точно, англ. MPEG-1/2/2.5 Layer 3; но не MPEG-3) - это кодек третьего уровня, разработанный командой MPEG, лицензируемый формат файла для хранения аудиоинформации.
MP3 является одним из самых распространённых и популярных форматов цифрового кодирования звуковой информации с потерями. Он широко используется в файлообменных сетях для оценочной передачи музыкальных произведений. Формат может проигрываться практически во всех популярных операционных системах, на большинстве портативных аудиоплееров, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров.
В формате MP3 используется алгоритм сжатия с потерями, разработанный для существенного уменьшения размера данных, необходимых для воспроизведения записи и обеспечения качества воспроизведения звука очень близкого к оригинальному (по мнению большинства слушателей), хотя аудиофилы говорят об ощутимом различии. При создании MP3 со средним битрейтом 128 кбит/с в результате получается файл, размер которого примерно равен 1/11 от оригинального файла с CD-Audio. Само по себе несжатое аудио формата CD-Audio имеет битрейт 1411,2 кбит/с. MP3-файлы могут создаваться с высоким или низким битрейтом, который влияет на качество файла-результата. Принцип сжатия заключается в снижении точности некоторых частей звукового потока, что практически неразличимо для слуха большинства людей. Данный метод называют кодированием восприятия.[1] При этом на первом этапе строится диаграмма звука в виде последовательности коротких промежутков времени, затем на ней удаляется информация, не различимая человеческим ухом, а оставшаяся информация сохраняется в компактном виде. Данный подход похож на метод сжатия, используемый при сжатии картинок в формат JPEG.
Существует три версии MP3 формата для различных нужд: MPEG-1, MPEG-2 и MPEG-2.5. Отличаются они возможными диапазонами битрейта и частоты дискретизации:
32-320 кбит/c при частотах дискретизации 32000 Гц, 44100 Гц и 48000 Гц для MPEG-1 Layer 3;
16-160 кбит/c при частотах дискретизации 16000 Гц, 22050 Гц и 24000 Гц для MPEG-2 Layer 3;
8-160 кбит/c при частотах дискретизации 8000 Гц и 11025 Гц для MPEG-2.5 Layer 3.
Режимы управления кодированием звуковых каналов
Так как формат MP3 поддерживает двухканальное кодирование (стерео), существует 4 режима:
Стерео - двухканальное кодирование, при котором каналы исходного стереосигнала кодируются независимо друг от друга, но распределение бит между каналами в общем битрейте может варьироваться в зависимости от сложности сигнала в каждом канале.
Моно - одноканальное кодирование. Если закодировать двухканальный материал этим способом, различия между каналами будут полностью стёрты, так как два канала смешиваются в один, он кодируется и он же воспроизводится в обоих каналах стереосистемы. Единственным плюсом данного режима может являться только выходное качество по сравнению с режимом Стерео при одинаковом битрейте, так как на один канал приходится вдвое большее количество бит, чем в режиме Стерео.
Двухканальное стерео (англ. Dual Channel) - два независимых канала, например звуковое сопровождение на разных языках. Битрейт делится на два канала. Например, если заданный битрейт 192 кбит/c, то для каждого канала он будет равен только 96 кбит/c.
Объединённое стерео (англ. Joint Stereo, M/S Stereo) - по мнению некоторых, самый оптимальный способ двухканального кодирования. Например, в одном из режимов Объединённое стерео левый и правый каналы преобразуются в их сумму (L+R) и разность (L?R). Для большинства звуковых файлов насыщенность канала с разностью (L?R) получается намного меньше канала с суммой (L+R). Также тут свою роль играет восприятие звука человеком, для которого различия в направлении звука намного менее примечательны. Поэтому объединённое стерео позволяет либо сэкономить на битрейте канала разности (L?R), либо улучшить качество на том же битрейте, поскольку на канал суммы (L+R) отводится бомльшая часть битрейта. Бытует мнение, что данный режим не подходит для звукового стереоматериала, в котором в двух каналах воспроизводится субъективно абсолютно различный материал, так как он стирает различия между каналами. Но современные кодеки используют различные схемы в разных фреймах (включая чистое стерео) в зависимости от исходного сигнала.
CBR
CBR расшифровывается как Constant Bit Rate, то есть постоянный битрейт, который задаётся пользователем и не изменяется при кодировании произведения. Таким образом, каждой секунде произведения соответствует одинаковое количество закодированных бит данных (даже при кодировании тишины). CBR может быть полезен для потоков мультимедиа данных по ограниченному каналу; в таком случае кодирование использует все возможности канала данных. Для хранения данный режим кодирования не является оптимальным, так как он не может выделить достаточно места для сложных отрезков исходного произведения, при этом бесполезно тратя место на простых отрезках. Повышенные битрейты (выше 256 кбит/c) могут решить данную проблему, выделив больше места для данных, но зато и пропорционально увеличивая размер файла.
VBR
VBR расшифровывается как Variable Bit Rate, то есть изменяющийся битрейт или переменный битрейт, который динамически изменяется программой-кодером при кодировании в зависимости от насыщенности кодируемого аудиоматериала и установленного пользователем качества кодирования (например, тишина закодируется с минимальным битрейтом). Этот метод MP3-кодирования является самым прогрессивным и до сих пор развивается и улучшается, так как аудиоматериал разной насыщенности может быть закодирован с определённым качеством, которое обычно выше, чем при установке среднего значения в методе CBR. Плюс к тому, размер файла уменьшается за счёт фрагментов, не требующих высокого битрейта. Минусом данного метода кодирования является сложность предсказания размера выходного файла. Но этот недостаток VBR-кодирования незначителен в сравнении с его достоинствами. Также минусом является то, что VBR считает «незначительной» звуковой информацией более тихие фрагменты, таким образом получается, что если слушать очень громко, то эти фрагменты будут некачественными, в то время как CBR делает с одинаковым битрейтом и тихие, и громкие фрагменты.
Формат VBR постоянно улучшается, благодаря постоянному совершенствованию математической модели кодеков, в частности, после выхода обновлённой версии свободного MP3-кодека LAME (версия 3.99.3), кодирование с переменным битрейтом, по заявлению самих разработчиков, качественно лучше CBR и тем более ABR.
ABR
ABR расшифровывается как Average Bit Rate, то есть усредненный битрейт, который является гибридом VBR и CBR: битрейт в кбит/c задаётся пользователем, а программа варьирует его, постоянно подгоняя под заданный битрейт. Таким образом, кодек будет с осторожностью использовать максимально и минимально возможные значения битрейта, так как рискует не вписаться в заданный пользователем битрейт. Это является явным минусом данного метода, так как сказывается на качестве выходного файла, которое будет немного лучше, чем при использовании CBR, но намного хуже, чем при использовании VBR. С другой стороны, этот метод позволяет наиболее гибко задавать битрейт (может быть любым числом между 8 и 320, против исключительно кратных 16 чисел метода CBR) и вычислять размер выходного файла.
Технические недостатки. Количество каналов звука ограничено двумя, в отличие от AAC и Vorbis.
Юридические ограничения. Патентом на MP3 владеет компания Alcatel-Lucent, которая требует лицензирования некоторых способов использования формата. Срок действия связанных с MP3 патентов истекает в 2007-2017 годах. Почти полный стандарт появился в открытом доступе 6 декабря 1991 года. В США изобретения публично раскрытые более года не могут быть запатентованы. Однако для патентов, оформленных до 8 июня 1995 года, существовала возможность увеличить их сроки действия. Известные патенты, касающиеся расшифровки MP3, прекратили действие в США к декабрю 2012; по другим данным, если учитывать только патенты, заявка на которые была подана до декабря 1992 года, это может произойти в сентябре 2015 года.
MPEG-3 - предназначался для использования в системах телевидения высокой чёткости (high-defenition television, HDTV) со скоростью потока данных 20-40 Мбит/с , но позже стал частью стандарта MPEG-2 и отдельно теперь не упоминается. Кстати, формат MP3, который иногда путают с MPEG-3, предназначен только для сжатия аудиоинформации и полное название MP3 звучит как MPEG-Audio Layer-3.
MP3
MP3 - это звуковые файлы с компрессией по технологии MPEG (MPEG 1.0, 2.0 и 2.5, MP3, MPEG 1 Layer 3, Audio MPEG), позволяющей обеспечить наилучшее качество звука при минимальном объеме файла. Это достигается учетом особенностей человеческого слуха, в том числе эффекта маскирования слабого сигнала одного диапазона частот более мощным сигналом соседнего диапазона, когда он имеет место, или мощным сигналом предыдущего фрейма, вызывающего временное понижение чувствительности уха к сигналу текущего фрейма (попросту, удаляются второстепенные звуки, которые не слышатся человеческим ухом из-за наличия в данный/предыдущий момент другого - более громкого). Также учитывается неспособность большинства людей различать сигналы, по мощности лежащие ниже определенного уровня, разного для разных частотных диапазонов. Данный процесс называется адаптивным кодированием и позволяет экономить на наименее значимых с точки зрения восприятия человеком деталях звучания. Степень сжатия (следовательно и качество), определяются не форматом, а шириной потока данных при кодировании в MP3.
Аудиоинфоpмация, сжатая по данной схеме, может пеpедаваться потоком (streaming), а может храниться в файлах формата MP3 или WAV-MP3. Отличие второго от первого состоит в наличии дополнительного заголовка WAV-файла, что позволяет при наличии MP3 кодека в системе использовать для работы с таким файлом стандартные средства Windows. Параметры компрессии при кодировании файла можно варьировать в широких пределах. Так, например, наивысшее качество, не отличимое от качества CD, достигается при скорости передачи (bitrate) 112...128 kb/s (обеспечиваемой ISDN-модемами), при этом сжатие составляет примерно 14:1 относительно исходного объема (вспомним: на 650 Mb компакт-диска помещается всего 74 минуты звука, т.е. 1 минута "стоит" почти 9 Mb!). Для Интернет, впрочем, и такие объемы великоваты, поэтому чаще используется кодирование с качеством "Подобно УКВ-вещанию" (MPEG 1.0, bitrate 56 kb/s, 44.1 sampling frequency, bandwidth 11 kHz, stereo, 1 min=415 kb), при котором воспроизведение в реальном масштабе времени может быть обеспечено 56К-модемами. Что же касается классического рок-н-ролла, то для него, поскольку он изначально записывался в моно режиме и с неширокой полосой частот, оптимальным можно считать кодирование с качеством "Лучше ДВ/СВ радио" (MPEG 2.0, bitrate 32 kb/s, 22.05 samp. freq., bandwidth 7.5 kHz, mono, 1 min=237 kb).
Принципиальной особенностью MPEG-кодирования является компрессия с потерями. После упаковки и распаковки звукового файла методом MP3 результат не идентичен оригиналу "бит в бит". Напротив, упаковка целенаправленно исключает из упаковываемого сигнала несущественные компоненты, что приводит к чрезвычайному возрастанию коэффициента сжатия. В зависимости от необходимого качества звука метод MP3 способен сжать звук в десять и более раз (См. Степень сжатия и качество).
Приемущества MP3
MP3 на сегодня имеет два огромных преимущества перед другими доступными форматами. Правда, MicroSoft пытает потеснить MP3 со своим новым форматом WMA, а также есть альтернативные форматы VQF и AAC, но они еще не получили должного распространения, хотя качество WMA, если судить по отзывам, несколько лучше. Однако WMA пока, фактически, закрыт для свободного использования, поэтому у него есть проблемы с различным софтом для кодирования / прослушивания / обслуживания (хотя, кто же сомневается в мобилизационных возможностях MicroSoft :-). Первое преимущество состоит в том, что ни про один из существующих подобных форматов нельзя пока сказать, что он полностью гарантирует устойчивое сохранение качества звучания на достаточно высоких битрейтах, кроме MP3, который достойно выдержал проверку временем. Второе, не менее важное преимущество - на ближайшие годы, а возможно, и на все десятилетие, MP3 стал стандартом де факто, поскольку много сделано в него вложений пользующимися им сторонами, в том числе и цифровыми радиостанциями. Для MP3 также написано множество удобного программного обеспечения. Сейчас уже налажено производство аппаратных MP3 плееров, и карманных, и для автомобилей. Таким образом, MP3 стал первым массово признанным форматом хранения аудио после CD-Audio (пусть, часто и нелегальным).
Степень сжатия и качество
128 kbps, в принципе, нормальный формат, если Вы имеете обычную аудиотехнику и рядовой слух. Но, чтобы быть уверенным, лучше кодировать на 160 kbps, т.к. это даст запас (весьма существенный) по сравнению с 128 kbps на тот случай, если улучшится качество аппаратуры. А если хотите быть совсем уверены в том, что Ваша музыка ничего не потеряет от кодирования, то берите 192 kbps. 128 kbps (11:1) Самый популярный на сегодня битрейт. Степень сжатия 11:1 - это, конечно, аргумент, особенно для Интернета, где каждый килобайт на счету. Однако при этом не очень хорошо сохраняются высокие частоты и имеют место некоторые искажения звука. При этом можно точно сказать, что на обычной аппаратуре, например используя обычную звуковую карту, компьютерные колонки, пусть и неплохого качества, разницы не будет заметно, если только Вы не эксперт по звуку. Однако на качественных колонках отсутствие высоких частот проявляется довольно заметным образом - музыка звучит приглушенно. На 128 кб/с лучше себя ведут кодеры от Fraunhofer-IIS - они оставляют больше высоких частот, чем кодеры ISO и, тем более, Xing. Все ISO кодеры как один добавляют характерный звон, наличие которого связано с особенностью психоаккустических фильтров ISO. На этом битрейте отлично себя показал MP3 Producer, специально оптимизированный под низкие битрейты. 160 kbps (8:1) Лучше, чем 128 кб/с. На неплохой (хорошей непрофессиональной) аппаратуре разницы уже не заметно. Но все равно присутствует недостаток высоких частот. На этом битрейте себя лучше проявили кодеры от Fraunhofer, т.к. ISO кодеры продолжают "звенеть", хотя и меньше. Выбирать приходится между кодерами от Fraunhofer, поэтому неплохой выбор - новый MP3 Producer. 192 kbps (7:1) Последнее время, с ростом пропускной способности каналов Интернета, этот битрейт становится более популярным на его просторах. Заметная часть новых записей оцифровавается именно в 192 kbps, во всяком случае теми, кто занимается MP3 серьезно. Кодеры от Fraunhofer убирают высоких больше, чем кодеры ISO, которые уже не "звенят". На этом битрейте кодеры от ISO чуть-чуть опережают Fraunhofer. Но ISO-оптимизированные - гораздо быстрее. 256 kbps (5:1) Вот тут практически все совсем перестают ощущать разницу между записью с CD и MP3-файлами, даже на очень качественной аппаратуре, при кодировании ISO-кодерами. Все ISO-кодеры обеспечивают на слух одинаковое качество, которое выше, чем у других кодеков [13].
Используя стерео эффекты и ограничивая ширину полосы звуковых частот, кодирование схем может достигнуть приемлемого надежного качества в более низких частотах. Некоторые типичные данные для MPEG Layer-3 приведены в таблице 3.1
Таблица 3.1 Типичные данные для MPEG Layer-3
sound quality |
bandwidth |
mode |
bitrate |
reduction ratio |
|
telephone sound |
2.5 kHz |
mono |
8 kbps * |
96:1 |
|
better than shortwave |
4.5 kHz |
mono |
16 kbps |
48:1 |
|
better than AM radio |
7.5 kHz |
mono |
32 kbps |
24:1 |
|
similar to FM radio |
11 kHz |
stereo |
56...64 kbps |
26...24:1 |
|
near-CD |
15 kHz |
stereo |
96 kbps |
16:1 |
|
CD |
>15 kHz |
stereo |
112..128kbps |
14..12:1 |
Во всех международных тестах слушания, MPEG Layer-3 впечатляюще доказывал высокое исполнение, поддерживая исходное качество при сжатии данных 1:12 (около 64 kbit/s ). Если материал допускает ограниченную ширину полосы частот около 10 kHz, разумное надежное качество для стерео сигналов может быть достигнуто при сжатии 1:24. Степени сжатия приведены в таблице 3.2.
Таблица 3.2 Степени сжатия
1:4 |
by Layer 1 (corresponds with 384 kbps for a stereo signal), |
|
1:6...1:8 |
by Layer 2 (corresponds with 256..192 kbps for a stereo signal), |
|
1:10...1:12 |
by Layer 3 (corresponds with 128..112 kbps for a stereo signal), |
3.2 Сравнительный анализ цифровых звуковых стандартов MP3
Формат сжатия MPEG Layer III был изобретен и запатентован институтом Фраунхоффера в начале 90-х годов ХХ века. Принцип кодирования основан на том, что человеческое ухо воспринимает не все звуки, идущие из динамика, а значит, большое количество информации, записанной на обычных аудио-CD, является избыточным. Например, если возникает сильный звук на определенной частоте, а на частоте чуть выше - слабый, то человек слышит только сильный звук, а слабый при этом «выпадает». Также человек не воспринимает другие звуки за 5 мс до и в течение 100 мс после сильного звука (инертность слуха). Эти и другие особенности позволяют уменьшить звуковые файлы в десятки раз. Правда, чем качественнее звук на выходе надо получить, тем более «объемистым» будет MP3-файл. Одной из важных особенностей MP3-файлов является наличие так называемого ID3-Tag'а. Он заключает в себе информацию о той музыке, которая записана в файл. Чаще всего ее вносят перед кодировкой файла. На данный момент существует две версии тага: ID3v1 Tag и ID3v2 Tag. Оба они представляют собой несколько полей, в которые вносятся номер трека, название композиции, альбома, композитор (группа), жанр, год, комментарии. Во второй версии тага добавлены еще несколько дополнительных полей.
MPEG (от Motion Picture Expert Group - группа экспертов по движущимся изображениям) 1 Layer III (реже MPEG 2 Layer III) уже долгие годы является для многих пользователей единственной ассоциацией со словосочетанием "компьютерная музыка". Разработанный в конце 80х годов, нетребовательный к ресурсам (воспроизведение MP3 файлов возможно даже на компьютерах с процессорами 486) формат, позволявший сжимать музыку до 10 раз без катастрофических потерь качества быстро прижился на домашних компьютерах. Хотя еще недавно большинство кодировщиков были платными, сейчас несложно найти проигрыватели и кодировщики, распространяемые по лицензии freeware. Через некоторое время стало ясно, что "CD качество" при битрейте в 128 Кб/с невозможно, по крайней мере с данным стандартом, так как с оснащением компьютеров более совершенными звуковыми картами и акустическими системами позволяло выявить недостатки подобного кодирования. Вполне закономерным стало повышение битрейта и совершенствование кодеков: технологии VBR и Joint Stereo (комбинированное стерео) позволяли значительно сократить размер файла при повышении качества. Современные кодировщики позволяют достичь качества звучания, на слух неотличимого от компакт диска на битрейтах в диапазоне 192-256 Кб/с даже на высококачественной аппаратуре. Тем не менее, в некоторых редких случаях (при наличии хорошего слуха и аппаратуры) даже битрейта 320Кб/с бывает недостаточно. Трудность заключается в том, что сам по себе формат MP3 имеет недостатки, от которых практически невозможно избавиться. Одним из них является так называемый эффект преэхо, из-за которого кодирование определенных сигналов сопряжено со значительными трудностями. На практике же использование постоянного битрейта 320Кб/с зачастую оказывается избыточным и чаще всего приводит к бессмысленной трате места. Качество звучания MP3 файла может сильно зависеть от выбранных кодировщика и проигрывателя. Для создания MP3 файлов идеально подходит бесплатный LAME (кодировщики Fraunhofer являются платными и позволяют достичь сравнимого с LAME качества, а кодеры Xing, Blade и большинство других не заслуживают внимания), а для воспроизведения - одна из последних версий Winamp 2.
MP3pro
Кодек MP3Pro был анонсирован в июле 2001. Появления кодека ожидали с интересом и некоторым нетерпением по двум причинам. Во-первых, этот кодек по своим возможностям обещал быть если не революционным, то очень развитым. Во-вторых, MP3Pro анонсировался и задумывался как продолжение знаменитого «MP3» (MPEG-1 Layer III), а то, что разработкой MP3Pro занимался «отец» MP3 (институт Fraunhofer), внушало доверие и уважение. Несмотря на солидность разработчиков и проекта, MP3Pro довольно долго оставался в тени. Сначала не было ни одной программы не только для кодирования в MP3Pro, но даже для воспроизведения файлов в этом формате. Потом, хотя программы, использующие MP3Pro, и стали появляться, процесс их интеграции проходил вяло и малозаметно для пользователя. И только сегодня MP3Pro стал развиваться и приобретать аппаратную основу, что незамедлительно сказалось на потребительском рынке. В частности, на рынке начали появляться аппаратные плееры, способные воспроизводить аудио в формате MP3Pro. Этот факт является хорошим сигналом для пользователя, говорящим о том, что MP3Pro после всех неурядиц все-таки принят производителями. В данной статье мы кратко рассмотрим историю появления MP3Pro, популярно и доступной форме разберемся в его возможностях, области применения, а также в проблемах, возникающих при использовании кодека. Механизм «упрощения» аудио можно пояснить следующим образом. Исходный аудио поток раскладывается на частотные составляющие спектра. Ясно, что чем меньше «нюансов звучания» имеются в сигнале (чем проще частотный спектр), тем лучше он поддается компрессии. Упростить сигнал можно по-разному. Например, существует ряд способов упрощения информации о стерео панораме сигнала; можно также отфильтровать все частоты выше определенной границы, что автоматически упростит сигнал в высоких частотных областях (но при этом, естественно, заметно испортит звучание). Но основным способом является психоакустический анализ (с последующей соответствующей обработкой сигнала), когда кодер анализирует аудио информацию и, опираясь на указанный пользователем битрейт, «решает» какие тонкости звучания можно выбросить. В качестве справки: при сжатии в MP3 пользователь указывает желаемый битрейт (или границы изменения битрейта) для сжатого выходного потока (битрейт - количество бит, используемых для хранения одной секунды аудио). Чем ниже битрейт, тем меньше бит позволяется кодеру отводить для хранения информации об одной секунде аудио и, таким образом, тем «глубже» кодер упрощает сигнал, что соответственно влияет на качество звучания получаемого сжатого потока аудио. Наиболее распространенное среднее значение битрейта для MP3 колеблется в пределах от 128 до 192 Kbps («килобит в секунду»). Здесь следует заметить, что применение психоакустики приводит к тому, что процесс декодирования уже не способен восстановить утраченные во время компрессии данные (нюансы звучания, отфильтрованные частоты и проч.). Кодек MP3Pro анонсирован в июле 2001 года компанией Coding Tech. вместе с Tomson Mulimedia и институтом Fraunhofer. Формат MP3Pro является прямым продолжением, или точнее, развитием старого MP3. MP3Pro совместим с MP3 «вперед» полностью и «назад» частично. То есть файлы, закодированные с помощью MP3Pro, можно воспроизводить в обычных проигрывателях, однако качество звучания при этом заметно хуже, чем при воспроизведении в специальном MP3Pro-проигрывателе. Это связано с тем, что файл (контейнер) в формате MP3Pro несет в себе два потока аудио: один - стандартный в формате MPEG-1 Layer III, а другой - специальный, дополнительный поток. Обычные проигрыватели MP3 распознают в новом формате только один поток - обычный MPEG-1 Layer 3, это и обуславливает лишь частичную совместимость «назад». В MP3Pro использована новая технология SBR (Spectral Band Replication). Эта технология предназначена для передачи верхнего частотного диапазона. Идея технологии и ее предпосылки следующие. Дело в том, что как и алгоритмы компрессии данных без потерь ограничены в своей эффективности, так и технологии, основанные на использовании психоакустической модели, имеют один общий недостаток: все они работают качественно до битрейта 128 Kbps. На более низких битрейтах начинают проявляться сильные искажения звучания, так называемые «артефакты кодирования»: бульканье, позвякивания, заметные скачки уровня сигнала на различных частотах и проч. Единственный найденный способ борьбы с этим явлением заключается в урезании частотного диапазона сигнала перед компрессией. Однако эта процедура также отрицательно сказывается на восприятии звучания. Все это показывает, что для получения более-менее качественного звучания на низких битрейтах использования психоакустической модели недостаточно. Новая технология SBR от Coding Tech. дополняет использование психоакустической модели. Идея технологии состоит в следующем: в файле передается (кодируется) чуть более узкий диапазон частот, чем обычно (с «урезанными верхами»), а верхние частоты воссоздаются уже самим декодером на основе имеющейся небольшой дополнительной информации о более высоких частотных составляющих. Таким образом, технология SBR применяется фактически не столько на стадии сжатия, сколько на стадии декодирования. Технология SBR в MP3Pro задействована следующим образом. Основные данные кодируются в несколько более зауженном, чем обычно, диапазоне частот в MP3 и записываются в первый основной поток контейнера MP3Pro. Второй, параллельный поток данных, невидимый для обычного MP3-проигрывателя, несет ту минимальную необходимую информацию, которая используется при воспроизведении для восстановления верхних частот. Исследования показывают, что эта информация есть усредненная мощность сигнала в верхнем (урезанном) диапазоне частот. Точнее, не одна усредненная мощность для всего диапазона вырезанных частот, а информация о средней мощности в нескольких полосах частот верхнего диапазона. Такой вывод был сделан на основе следующего несложного, но очень показательного теста. Возьмем тестовый сигнал протяженностью 13 секунд, состоящий из белого шума от 0 до 10 КГц, плюс тон, плавно переходящий от 10 до 19 КГц. Закодируем этот сигнал с помощью MP3Pro (в режиме VBR со средним битрейтом 142 Kbps) и, для сравнения, в обычный MP3 (в режиме CBR на битрейте 140 Kbps). Во время сжатия кодер закодировал в MP3 весь частотный диапазон сигнала ниже 10 КГц, сигнал выше этого рубежа был нарезан на полосы, в каждой такой полосе кодер просто следил за средним уровнем сигнала и сохранял результат в выходном потоке. Пока плавно поднимающийся тон находился в пределах одной подполосы, для кодера средний уровень сигнала в этой подполосе оставался неизменным. Как только тон «уходил» из подполосы, измеряемый кодером уровень сигнала падал до нуля. Во время декодирования декодер, не имея данных о том, что находилось в каждой подполосе, просто брал известный сигнал в нижнем диапазоне (в какой-то определенной области), умножал его на известный средний уровень сигнала в подполосе и размещал в ней полученный после умножения сигнал. Конечно, это лишь искусственный тест, однако он как никакой другой наиболее ярко выявляет механизм работы MP3Pro. Стоит обратить внимание на то, что «старичок» MP3 на битрейте даже чуть ниже MP3Pro достаточно точно и четко «отработал» и сохранил информацию о всем частотном диапазоне.
MPEGplus/Musepack (MP+/MPC/MPP)
Данный кодировщик похож по принципу действия на MPEG Layer II (MP2), но использует более совершенный алгоритм. В отличие от большинства других современных кодеков целью создателей Musepack было вовсе не стремление получить максимально возможное качество на низких битрейтах: лучше всего формат показывает себя на средних и высоких битрейтах (типичный битрейт файлов обычно находится в диапазоне 160-180Кб/с). Великолепная психоакустическая модель, использующая VBR кодирование позволяет добиться прекрасного качества звучания. В результате кодек показывает результаты более высокие, чем большинство его соперников на аналогичных битрейтах. Скорость работы кодировщика достаточно высока: на создание MPC файла тратится примерно в два раза меньше времени, чем на создание MP3 файла при помощи lame с аналогичными настройками. Качество файлов, получаемых при сжатии в MPC значительно превышает качество аналогичных файлов MP3. При использовании настройки --normal кодировщика я ни разу не смог отличить кодированный файл от оригинала в ABX тесте. Более того, MPC файлы, созданные таким образом звучат лучше, чем высококачественные MP3 файлы с битрейтом 320Кб/с (разумеется, в тех редких случаях, когда данное сравнение можно проводить). Следует сказать, что именно пресет normal является "изюминкой" формата. Данный режим, вопреки названию, дает результат, абсолютно неотличимый от оригинала на слух, причем разницу не ощущают даже люди, обладающие прекрасным слухом и качественным оборудованием.
...Подобные документы
Анализ процесса оцифровки зависимости интенсивности звукового сигнала от времени. Характеристика технологии создания музыкальных звуков в современных электромузыкальных цифровых синтезаторах. Изучение основных звуковых форматов, способов обработки звука.
курсовая работа [2,3 M], добавлен 23.11.2011Цифровое представление звуковых сигналов. Устройства вывода звуковой информации: колонки, динамик и наушники. Устройства ввода звуковой информации. Частота и интенсивность звука. Амплитуда звуковых колебаний, мощность источника звука, диапазон колебаний.
реферат [133,3 K], добавлен 08.02.2011Описание устройств ввода графической, звуковой информации, их назначение, классификация, конструкция, характеристики. Графические планшеты, сканнеры. Анализ способов представления и кодирования информации. Программные средства для архивации данных.
контрольная работа [31,2 K], добавлен 22.11.2013Современные методы цифрового сжатия. Классификация алгоритмов сжатия. Оцифровка аналогового сигнала. Алгоритм цифрового кодирования. Последовательное двойное сжатие. Чересстрочность и квантование. Сокращение цифрового потока. Профили, уровни формата MPEG.
реферат [784,9 K], добавлен 22.01.2013Сущность универсального метода упаковки, его преимущества и недостатки. Кодирование путем учета числа повторений. Примеры схем распаковки последовательности байтов. Алгоритмы сжатия звуковой, графической и видеоинформации. Разновидности формата МРЕG.
презентация [96,2 K], добавлен 19.05.2014Общие подходы к компьютерному представлению графической и звуковой информации. Растровая и векторная графика: характеристика, отличительные особенности, условия использования. Представление цветов в компьютере, существующие модели и их сравнение.
презентация [2,3 M], добавлен 02.03.2016Понятие звуковой информации как кодирования звука, в основе которого лежит процесс колебания воздуха и электрического тока. Величина слухового ощущения (громкость). Временная дискретизация звука, ее частота. Глубина и качество звуковой информации.
презентация [545,6 K], добавлен 13.05.2015Кодирование как процесс представления информации в виде кода. Кодирование звуковой и видеоинформации, характеристика процесса формирования определенного представления информации. Особенности универсального дружественного интерфейса для пользователей.
контрольная работа [20,3 K], добавлен 22.04.2011Понятие информации и основные принципы ее кодирования, используемые методы и приемы, инструментарий и задачи. Специфические особенности процессов кодирования цифровой и текстовой, графической и звуковой информации. Логические основы работы компьютера.
курсовая работа [55,8 K], добавлен 23.04.2014Методы компрессии информации. Обзор и характеристика существующих методов сжатия информации, основанных на процедуре кодирования Хаффмена. Алгоритмы динамического кодирования методом FGK и Виттера. Программная реализация и руководство пользователя.
курсовая работа [33,2 K], добавлен 09.03.2009Анализ источников сигналов и видов акустических каналов защищаемой информации. Распространение и поглощение звуковых волн. Технические каналы утечки акустических данных. Модель угроз для информации через вибро- и электроакустический, оптический каналы.
дипломная работа [1,3 M], добавлен 05.07.2012Энтропия и количество информации. Комбинаторная, вероятностная и алгоритмическая оценка количества информации. Моделирование и кодирование. Некоторые алгоритмы сжатия данных. Алгоритм арифметического кодирования. Приращаемая передача и получение.
курсовая работа [325,1 K], добавлен 28.07.2009Общие сведения об управляющих автоматах, построенных на основе принципа программируемой логики. Программно-вычислительный комплекс разработки эффективных форматов микрокоманд для различных способов кодирования. Алгоритмы кодирования операционной части.
дипломная работа [2,1 M], добавлен 26.06.2012Обработка изображений на современных вычислительных устройствах. Устройство и представление различных форматов изображений. Исследование алгоритмов обработки изображений на базе различных архитектур. Сжатие изображений на основе сверточных нейросетей.
дипломная работа [6,1 M], добавлен 03.06.2022Обзор и общее описание, оценка преимуществ и недостатков виртуальных приборов на базе звуковой карты компьютера: осциллографы, анализаторы, генераторы, измерители сопротивления. Выбор и расчет схемы измерения. Разработка программного обеспечения.
дипломная работа [4,1 M], добавлен 17.02.2013Понятие и отличительные черты аналоговой и цифровой информации. Изучение единиц измерения цифровой информации: бит (двоичная цифра) и байт. Особенности передачи, методы кодирования и декодирования текстовой, звуковой и графической цифровой информации.
реферат [479,4 K], добавлен 22.03.2010Аналоговое и цифровое представление информации. Понятие, классификация и характеристика методов сжатия данных: алгоритмы одно- и двухпараметрической адаптации, линейной экстра- и интерполяции. Кодирование информации и вычисление циклического кода.
курсовая работа [157,4 K], добавлен 07.12.2012Информационные революции, связанные с появлением и совершенствованием средств и методов обработки информации. Достижения в области вычислительной техники. Характеристика индустриального и информационного общества. Развитие экранно-звуковых средств.
реферат [113,7 K], добавлен 06.08.2013Техническая характеристика сигналов в системах цифровой обработки. Описание программ для обработки цифровой и синтезированной звуковой информации, шумоподавление звука. Профессиональная обработка звука и звуковой волны: сжатие, запись, сэмплирование.
курсовая работа [82,9 K], добавлен 01.03.2013Задачи обработки и хранения информации при помощи ЭВМ. Сжатие и кодирование информации в информационно-вычислительных комплексах. Метод Лавинского как простейший метод сжатия информации (числовых массивов) путем уменьшения разрядности исходного числа.
курсовая работа [66,0 K], добавлен 09.03.2009