Анализ и сжатие изображений с использованием математической 3D-морфологии

Создание адекватного математического описания изображений, передающего их содержание, смысл как одна из фундаментальных проблем анализа изображений. Алгоритм обработки и сжатия изображений. Программное обеспечение данного процесса, его этапы и анализ.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 18.01.2018
Размер файла 95,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Анализ и сжатие изображений с использованием математической 3D-морфологии

Проблема сжатия информации была, есть и всегда будет актуальной. При известных современных методах, чем больше эффективность сжатия - больше задержка. В каждом конкретном случае выбирается то или иное компромиссное решение. Известно, что для корректной передачи цвета требуется 16 миллионов оттенков (8 бит на каждую из трех цветовых компонент). Таким образом, для описания картинки на экране, содержащей 575 линий по 720 пикселей, требуется 1,240 Мбайта. Для передачи такой информации по B-каналу ISDN, если не используется сжатие, потребуется около 2,5 минут. Эта цифра помогает понять актуальность проблемы сжатия графической информации [1].

Математическая 3D-морфология в обработке и сжатии изображений

Одной из фундаментальных проблем анализа изображений является создание адекватного математического описания изображений, передающего их содержание, смысл. Иными словами, это описание должно отражать лишь существенные (с точки зрения решаемой задачи) особенности изображения, и не зависеть от несущественных деталей. Методы морфологического анализа являются, таким образом, шагом на пути решения проблемы описания семантики изображений [2].

В основе методов морфологического анализа лежит математическое понятие формы. Под формой изображения понимается максимальный инвариант преобразований изображения, которым оно подвергается при изменении условий наблюдения, изменении параметров регистрирующей аппаратуры и др. [3]

Поясним понятие формы изображения сначала на простом примере.

Все представленные на рис. 1 изображения имеют одну и ту же форму (в обычном понимании) и отличаются лишь условиями регистрации. Формально каждое изображение можно задать как функцию:

,

определенную на поле зрения X и принимающую два значения: С1 и С2 на его подмножествах А1 - «единице» и А2 - «фоне» соответственно, - индикаторная функция:

,

причем множества А1 и А2 не пересекаются [4].

Рис. 1. Примеры изображений «единицы», сравнимых по форме

Отсюда следует, что каждое, отдельно взятое подмножество, может быть обработано независимо от остальных, при этом его цвет не имеет значения, имеет значение только форма - семантика изображения. Количество же этих слоев-подмножеств может быть довольно большим и нести в себе значительный объем информации.

Основой интеллектуального анализа изображений в данной работе является подход Харалика (Haralick) и Шапиро (Shapiro), интерпретирующий цветное изображение как поверхность в 3-х мерном пространстве. 2-мерное Эвклидово пространство е2 это естественная область для плоскостного описания формы множеством точек, а также третье измерение z - глубина цвета [5,6].

Практические аспекты применения предлагаемой концепции и алгоритма

Основное преимущество предлагаемого алгоритма и построение новой концепции в работе с изображениями заключается в особенности разбиения на различные информационные слои - подмножества, а также отсутствие жесткой привязки к палитре цветов. То есть изображение, состоящее из двух цветов, красного и синего, фактически будет рассмотрено, как монохромное. А каждое из подмножеств имеет свой смысл, что имеет огромное практическое значение.

Предлагаемый алгоритм не является универсальным и показывает хорошие результаты в узких сферах применения. Например, в картографии и разработке геоинформационных систем, с использованием данного алгоритма можно получить растровое изображение хорошего качества, при этом достаточно хорошо сжимаемое при хранении и передаче. В частности при использовании в геоинформационных системах крупных баз данных, особенно если они физически распределены по различным серверам и данные передаются через Интернет, то объемы информации имеют огромное значение. Основное же преимущество заключается в том, что предложенный алгоритм позволяет хранить закодированное цельное изображение местности, однако по запросу пользователя через канал связи возможно передать не громоздкие общие данные, или даже не просто фрагмент изображения, но также интересующие пользователя области и регионы, политические, физические и другие, которые отмечены определенным цветом, а значит выделены в особое подмножество и выполнить такой запрос не составит труда. Экономия времени на передаче данных очевидна, за счет исключения информации не нужной пользователю. Подобные же функции могут быть востребованы и в других сферах, таких как медицина, криминалистика и другие.

Алгоритм обработки и сжатия изображений

Используя указанный подход можно сформулировать суть предлагаемого анализа, обработки и кодирования изображения, которая заключается в разложении его на цветовые слои - подмножества, путем выделения формы объектов, и кодировании каждого из этих слоев независимо друг от друга в бинарном режиме. Для адекватного анализа цвета в работе рассматриваются три цветовых компоненты: красный, зеленый и синий независимо друг от друга.

Обработка цветов и кодирование подмножеств

Алгоритм кодирования выполняется в два прохода:

1. Первый проход. Анализ изображения, обработка цветов.

a. Выделение цветов.

b. Интеллектуальное прореживание, устранение неразличимых оттенков.

c. Определение количества подмножеств - N.

2. Второй проход. Кодирование.

a. Представление двумерных множеств, как одномерные.

b. Определение принадлежности пикселя к соответствующему подмножеству.

c. Послойное кодирование подмножеств с учетом анализа очередного пикселя, для экономии объема.

d. Запись в файл блоков кода переменной длины.

На первой стадии производится анализ изображения. Выбираются имеющиеся на изображении цвета, при этом производится прореживание цветов по каждой из трех цветовых компонент для отсеивания неразличимых, неинформативных полутонов. После завершения этой стадии результирующее количество цветов является количеством подмножеств, подготавливаемых для кодирования.

Исходя из вышесказанного, мы получаем незакодированное изображение, описываемое как набор подмножеств, описывающих форму объектов:

здесь это не измененное множество, то есть это те цвета, которые мы видим на изображении, та же точно форма и эти множества друг от друга независимы.

На рис. 2 отражены 4 представления набора пикселей (сверху вниз): привычное представление в цвете; срез поверхности точек в 3-D пространстве (по функции top-surface) [5]; срез объемной фигуры, отражающей структуру изображения (функция Umbra) [5]; собственный способ представления , повышающий эффективность кодирования. Измененные множества отмечаются как и работать с ними можно также, как и с любыми другими множествами, но они зависят от других слоев, которые должны прорисовываться сверху, поскольку суть представления в том, что если одни цветовые слои включают в себя другие, то нет необходимости запоминать несущественные элементы в более низших слоях, которые в дальнейшем будут затерты более высшими. Таким образом, достигается дополнительное сжатие, отраженное в разнице между последними двумя представлениями. То есть отличие слоя от слоя в пропущенных, сэкономленных пикселях будет нивелировано слоем , который впоследствии затрет несущественную разницу.

Рис. 2. Разбиение изображения на цветовые слои, срез 3D поверхности

Далее кодируется в последовательность значений - чередующееся количество прозрачных и заполненных пикселей, для каждого, уже измененного, подмножества , которые теперь зависят от последующего слоя. Вследствие чего получаем новые значения. Кроме того, выделяется цвет фона, который не кодируется, а является инверсией к сумме всех подмножеств. При этом коды сгруппированных пикселей могут быть достаточно громоздки, и они должны быть объединены с другой информацией об изображении: данные о цветах, ширине и высоте изображения и т.п.

С учетом вышеуказанных требований была предложена структура кодировки (Рис. 3). Где Блоки «0:0, 0:1 и т.д.» - это количество чередующихся сгруппированных заполненных либо пустых пикселей, по принципу «есть цвет - нет цвета».

Объем данных каждого элемента структуры

Ширина изображения

2 байта

Высота изображения

2 байта

Код цвета

3 байта

Блок кодировки

1-4 байта, переменный

Рис. 3. Структура кодировки

При таких технических характеристиках обрабатываемое изображение может превышать 500 МегаПикселей. Если повысить количество байт в одном блоке, то величина и качество изображения будет возрастать в геометрической прогрессии.

Блок кодировки может принимать значения от 1 до 4 байт, при этом каждый восьмой бит несет в себе информацию, ожидается ли следующий байт текущего блока или начало следующего блока. Порядок закодированных подмножеств (слоев) также имеет значение, что является одной из особенностей алгоритма.

Алгоритм декодирования

В алгоритм декодирования входит:

1. Прорисовка фона соответствующим цветом.

2. Переход от слоя к слою

a. Перевод одномерных кодов в двумерные.

b. Раскодирование блочных кодов.

c. Прорисовка слоев на изображении.

В основе декодирования лежит прорисовывание одних слоев-подмножеств поверх других, в порядке, зарегистрированном при кодировании. При раскодировании блоки считываются, с учетом их различной длины, кроме того из линейного кода переводятся в двумерные множества на плоскости каждого из слоев, и количество таких слоев равно количеству цветов. При обычной прорисовке изображения можно использовать обычную функцию объединения слоев, не зависимо от того, что теперь мы работаем над измененными слоями :

где:

Однако мы можем работать с различными множествами независимо друг от друга, в чем и заключается особенность морфологического подхода и разработанной концепции. Эти особенности можно описать примером и показать практический смысл.

Рис. 4. Схема выделения и передачи отдельных информационных слоев в изображении

Допустим при работе с физической картой местности, в которой цветом отмечены различные высоты, можно по запросу выделить интересующую область по интервалу высот, а «лишние» области изображения не передавать через канал связи (Рис. 4.). Что актуально в наше время интернет технологий. В этом случае, для выделения интересующего смыслового слоя нужно найти функцию , где и мы используем алгоритм:

1.

где:

Получаем , что является суммой всех слоев, выше интересующего слоя k до n. Это множество было взято потому, что теперь с его помощью мы удаляем из те отличия, которые помогли нам более эффективно сжать и закодировать изображение.

2.

Теперь мы получили:

.

Это и есть первоначальный информационный цветовой слой , запрошенный пользователем, объем которого на порядок меньше целого изображения. То есть алгоритм декодирования был выполнен на сервере, выбрав необходимые данные, сэкономив тем самым время передачи данных и время поиска пользователем нужной информации в целом, громоздком изображении.

Реализация в программе и результаты

Данный алгоритм обработки и сжатия изображений реализован в программном обеспечении на языке Delphi, как дополнение к имеющемуся программному комплексу. С помощью этого программного обеспечения возможно открывать изображения основных графических форматов, обрабатывать их, а затем сохранять, в том числе и в новом, предложенном формате сжатия. В данном программном комплексе изображения сохраняются в файл, но этот алгоритм легко может быть применим и к хранению в базах данных.

Программное обеспечение позволило провести практические опыты, определить степень сжатия, а также сравнить с уже имеющимися форматами. При использовании такого метода обеспечивается довольно высокий коэффициент сжатия, он достигает значений 18:1.

изображение сжатие программный алгоритм

Тип тестируемого изображения

Без сжатия (BMP)

GIF

JPG (векторное сжатие)

Тестируемый алгоритм

Цветное с крупными объектами

~1200 Кб

~44 Кб

~54 Кб

~66 Кб

Мелкодисперсное, серое изображение

~415 Кб

~215 Кб

~80 Кб

~150 Кб

Как видно из таблицы, в сравнении с другими форматами, тестированное изображение не намного уступает по объемам и сам метод сжатия универсальным назвать нельзя, однако методы 3D морфологии для разработки такого подхода позволяют иначе рассматривать изображения. Как уже было написано выше, цветовые слои, из которых состоит изображение, могут нести смысловую нагрузку. Следовательно, область и выбранные по запросу слои будут гораздо более компактными по сравнению с другими форматами только потому, что появляется возможность избавиться от лишней информации, которую не нужно передавать от сервера к пользователю. А при разработке и эксплуатации информационных систем этот метод может сделать работу более удобной, быстрой и разгрузить каналы передачи данных.

Литература

1. Семенов Ю.А. Telecommunication technologies - телекоммуникационные технологии; http://book.itep.ru, 2007.

2. Пытьев Ю.П. Морфологический анализ цветных изображений, http://cityref.ru/prosmotr/7518-0.htm, 2005.

3. Пытьев Ю.П. Задачи морфологического анализа изображений. Математические методы исследования природных ресурсов Земли из космоса. - М.: Наука, 1984.

4. Задорожный С.С. Морфологический анализ формы изображений: http://www.butovo.com/~zss/bw_morf.html, 2002.

5. Shapiro L.G., Stockman G.C. Computer Vision. Prentice Hall, 2001.

6. Haralick R.M. and Shapiro L.G. Computer and Robot Vision, vol.2. - P.453-507. - Addison-Wesley, 1992.

Размещено на Allbest.ru

...

Подобные документы

  • Обработка изображений на современных вычислительных устройствах. Устройство и представление различных форматов изображений. Исследование алгоритмов обработки изображений на базе различных архитектур. Сжатие изображений на основе сверточных нейросетей.

    дипломная работа [6,1 M], добавлен 03.06.2022

  • Изучение современных методик компьютерной обработки биомедицинских изображений с целью улучшения изображений для их наилучшего визуального восприятия врачом-диагностом и эффективного сжатия изображений – для надежного хранения и быстрой передачи данных.

    курсовая работа [2,3 M], добавлен 15.04.2019

  • Типы изображений (черно-белые, полутоновые, цветные) и их форматы. Устройства, создающие цифровые изображения, и их параметры. Применение и характеристики методов сжатия изображений. Поиск по содержимому в базах данных изображений. Структуры баз данных.

    презентация [360,4 K], добавлен 11.10.2013

  • Высокопроизводительные вычисления в обработке данных дистанционного зондирования Земли. Классификация аэрокосмических изображений. Способы удаленного доступа к суперкомпьютеру. Сжатие без потерь и с потерями. Программное обеспечение системы сжатия.

    дипломная работа [2,6 M], добавлен 28.09.2011

  • Цифровые рентгенографические системы. Методы автоматического анализа изображений в среде MatLab. Анализ рентгеновского изображения. Фильтрация, сегментация, улучшение изображений. Аппаратурные возможности предварительной нормализации изображений.

    курсовая работа [890,9 K], добавлен 07.12.2013

  • Анализ проблем, возникающих при совмещении изображений в корреляционно-экстремальных навигационных системах. Использование двумерного дискретного преобразования Фурье. Нахождение корреляционной функции радиолокационного и моделируемого изображений.

    дипломная работа [3,6 M], добавлен 07.07.2012

  • Положения алгоритмов сжатия изображений. Классы приложений и изображений, критерии сравнения алгоритмов. Проблемы алгоритмов архивации с потерями. Конвейер операций, используемый в алгоритме JPEG. Характеристика фрактального и рекурсивного алгоритмов.

    реферат [242,9 K], добавлен 24.04.2015

  • Анализ существующих методов масштабирования изображений. Повышение скорости обработки и изменения картинок. Алгоритм масштабирования с использованием параллелизма. Отбор пикселей для правильного расчета градиента. Выбор метода интерполяции изображения.

    курсовая работа [5,8 M], добавлен 17.06.2017

  • Обзор существующего программного обеспечения для автоматизации выделения границ на изображении. Разработка математической модели обработки изображений и выделения контуров в оттенках серого и программного обеспечения для алгоритмов обработки изображений.

    дипломная работа [1,7 M], добавлен 27.03.2013

  • История появления и основные понятия графического дизайна. Выявление главных преимуществ и недостатков недеструктивной обработки изображений. Сравнение деструктивной и недеструктивной обработки изображений. Сущность и особенности двухмерной графики.

    реферат [5,2 M], добавлен 05.05.2023

  • Современные системы текстурного анализа изображений. Примеры текстурной сегментации одноканальных изображений. Использование признаков, полученных на основе гистограммы яркостей второго порядка, для классификации спектрозональных аэрофотоснимков.

    реферат [573,5 K], добавлен 15.01.2017

  • Сравнительная оценка существующих программ, повышающих разрешение изображений на языке Borland Delphi. Выбор оптимального инструментария для разработки логической схемы. Форма поиска файлов, преобразования изображений и реализации алгоритмов интерполяции.

    дипломная работа [3,0 M], добавлен 29.11.2011

  • Задача пространственно-временной обработки изображений при наличии шумов и помех. Методы оптимизации при пространственно-временной обработке изображений. Структура специализированной программы, описание ее пользовательского интерфейса. Смета затрат.

    дипломная работа [957,2 K], добавлен 10.06.2013

  • Описание математических методов представления и обработки графических изображений. Описание разработанного программного дополнения. Описание функций и их атрибутов. Представление и обработка графических изображений. Результаты тестирования программы.

    курсовая работа [1,7 M], добавлен 27.01.2015

  • Обзор методов создания Web-ресурса для публикации фотопанорамных изображений. Необходимые компоненты для работы сервера. Создание хранилища данных в программной оболочке Denwer. Публикация готовых панорамных изображений на сайте кафедры ИСКМ ВолГУ.

    курсовая работа [1,9 M], добавлен 28.08.2012

  • Основы программирования на языке VB.NET. Область применения трехмерных изображений. Форматы хранения пакетов инженерной графики. Преимущества трехмерного моделирования. Разработка программы по вращению трехмерных изображений на языках VB.NET и VRML.

    курсовая работа [195,1 K], добавлен 11.03.2013

  • Изучение и программная реализация в среде Matlab методов обработки, анализа, фильтрации, сегментации и улучшения качества рентгеновских медицинских изображений. Цифровые рентгенографические системы. Разработка статически обоснованных алгоритмов.

    курсовая работа [4,7 M], добавлен 20.01.2016

  • Принцип действия и назначение факсимильной связи, сферы ее применения, оценка преимуществ и недостатков. Сущность и особенности использования адресно-позиционного кодирования. Алгоритм программы сжатия и восстановления изображения по методу АПК.

    курсовая работа [23,3 K], добавлен 16.04.2010

  • Основные компоненты создания текста. Использование текстовых эффектов, редактирование изображений в растровом редакторе Adobe Photoshop. Работа с простым текстом. Создание объемного и сверкающего текстов, теней, огненной, ледяной и золотой надписей.

    лабораторная работа [648,4 K], добавлен 18.10.2012

  • Выполнение геометрической коррекции сканированного листа карты Украины масштаба 1:1000000 в среде Erdas. Возможности выявления объектов с использованием радиолокационных снимков. Создание цифровых моделей рельефа и перспективных изображений местности.

    курсовая работа [2,0 M], добавлен 17.12.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.