Система покращення алгоритмів стиску зображення

Архітектура системи на основі нейронних мереж для покращення алгоритмів стиску зображення. Створення інструменту, який не змінюючи існуючі алгоритми кодування, декодування зможе представити інструмент, який суттєво покращить якість зображень та їх розмір.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык украинский
Дата добавления 22.04.2021
Размер файла 913,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Стаття з теми:

Система покращення алгоритмів стиску зображення

Олашин Олександр Олександрович, студент Національного технічного університету України «Київський політехнічний інститут імені Ігоря Сікорського»

Анотація

Запропоновано архітектуру системи на основі нейронних мереж для покращення алгоритмів стиску зображення. Проведено порівняння ефективності роботи даної системи та інших систем стику зображення.

Ключові слова: нейронні мережі, алгоритми стиску зображення.

Аннотация

СИСТЕМА УЛУЧШЕНИЯ АЛГОРИТМОВ СЖАТИЯ ИЗОБРАЖЕНИЯ

Олашин Александр Александрович, студент Национального технического университета Украины «Киевский политехнический институт имени Игоря Сикорского

Предложено архитектуру системы на основе нейронных сетей для улучшения алгоритмов сжатия изображений. Проведено сравнение эффективности работы данной системы и других систем сжатия изображений.

Ключевые слова: нейронные сети, алгоритмы сжатия изображения.

Summary

SYSTEM FOR IMPROVING IMAGE COMPRESSION ALGORITHMS

Olashyn Oleksandr, Student of the National Technical University of Ukraine «Igor Sikorsky Kyiv Polytechnic Institute»

A system architecture based on neural networks is proposed to improve image compression algorithms. The efficiency of this system and other image compression systems is compared.

Key words: neural networks, image compression algorithms.

Технології розвиваються надзвичайно стрімко. І їх розвиток прискорюється з кожним роком. Однак деякі речі як не дивно залишаються доволі інертними до змін. Яскравим прикладом є алгоритми стику зображень (або ж формати зображень). Так PNG було створено в 1997, а JPEG і того раніше -- в 1992 році. Здається це було нещодавно, однак по міркам сучасного технологічного зростання цілу вічність тому. Дані формати залишаються надзвичайно популярними і досі домінують на ринку зображень [1].

Однак на превеликий жаль вимоги до якості зображень з поступом технологій тільки зростають. Так якщо раніше основним критерієм до алгоритмів було стиснути зображення якомога сильніше, то зараз при покращенні дисплеїв якість зображення грає не менш важливу роль ніж його компактність.

Ціллю даної роботи є створення інструменту, який не змінюючи існуючі алгоритми кодування та декодування зможе представити інструмент, який суттєво покращить якість зображень та їх розмір.

Існують різні підходи до вирішення задачі покращення алгоритмів стиску зображення. Більшість дослідників в своїй роботі опираються на різноманітні типи нейронних мереж, як найбільш перспективного інструменту. Наприклад, варто відзначити роботу Dong [2], в якій запропоновано метод покращення роздільної здатності зображення на основі згорткової мережі. Іншим прикладом є стаття Google Reasearch Group [3], де чудово описано застування рекуретної нейронної мережі для задачі стиску зображення і приведено приклади, що ілюструють ефективність даної мережі.

У даній роботі, як основний інструмент було обрано саме згорткову нейронну мережу, через її дуже високі показники ефективності для розв'язку задачі, а також через меншу кількість ресурсів необхідних для тренування такої мережі.

Запропонована система має наступний вигляд -- вона складається з двох нейронних мереж, які застосовують звичайний кодек зображення для самої операції стиску (рисунок 1).

зображення алгоритм стискання

Рис. 1 - Архітектура запропонованої системи

Завдання першої мережі -- створити зменшену версію оригінального зображення, яка зберігає всі основні структурні елементи. Потім зменшене зображення стискається за допомогою стандартного кодеку (наприклад JPEG). Для відновлення зображення використовується друга мережа -- вона відновлює, покращує та збільшує декодоване зображення.

Перший шар являє собою згортковий шар, що використовує, де ReLU слугує функцією активації. Цей шар використовується для того, щоб отримати основні характеристики зображення. Фільтри мають розмір 3х3хс, де с -- кількість каналів вихідного зображення. В даній роботі використовується 48 фільтрів (через обмеження обчислювальних потужностей). Нелінійність досягається використанням ReLU як функції активації. Наступний шар використовується для зменшення зображення та покращення отриманих характеристик. Для цього застосовується операція згортки з кроком, що дорівнює два. Фільтри даного шару мають розміри 3х3х48 і ReLU також застосовується як функція активації. Для останнього третього шару використовують с фільтрів розміру 3х3х48 для створення компактного представлення зображення.

RCNN складається з 18 шарів. Перший шар складається з 48 фільтрів розміром 3х3хс і використовується для створення 48 карт характеристик. Як функція активації використовується ReLU. Потім йдуть 16 шарів використовуються 48 фільтрів розміром 3х3х48. Варто зазначити, що в кожному з цих шарів також використовується нормалізація між операціями згортки та ReLU. Для останнього шару використовується с фільтрів розміром 3x3x48 для відновлення зображення.

Систему було натреновано на 200 зображеннях, розміру 180x180. Для тестування було обрано 5 популярних зображень, що використовуються для тестування нейронних мереж (рисунок 2).

Рис. 2 - Тестові зображення

Систему було порівняно зі стандартним алгоритмом JPEG, а також ж ARCNN [4] -- однією з найкращих нейронних мереж для стиску зображення. Також були окремо протестовані мережі по окремо та система загалом. Результати можна побачити в таблиці 1 та таблиці 2.

Таблиця 1 - Результати роботи за критерієм PSNR (dB)

Метод

Метелик

Дім

Папуга

Листя

Фотограф

Середній результат

JPEG

22.58

27.77

26.19

22.49

24.45

20.18

ARCNN

25.64

29.68

28.13

25.07

25.27

21.63

CCNN

22.85

27.9

27.01

22.85

24.78

20.508

RCNN

24.55

28.34

27.57

24.23

25.17

21.062

Запропонована система

25.78

28.48

28.01

25.03

25.58

21.576

Таблиця 2 - Результати роботи за критерієм SSIM

Метод

Метелик

Дім

Папуга

Листя

Фотограф

Середній

результат

JPEG

0.7378

0.7733

0.7581

0.7775

0.7283

0.60744

ARCNN

0.8741

0.8209

0.8446

0.8983

0.7674

0.66624

CCNN

0.7201

0.8019

0.8232

0.7761

0.7582

0.63188

RCNN

0.867

0.8189

0.8411

0.8643

0.7543

0.65572

Запропонована система

0.8732

0.8321

0.8367

0.8821

0.7677

0.66372

Якість отриманих зображень перевірялись за допомогою двох основних показників -- коефіцієнту пікового сигналу до шумового співвідношення (PSNR) та індексу структурної схожості (SSIM).

Як можна побачити з наведених вище таблиць -- запропонована система суттєво перевищила звичайний JPEG (при чому JPEG використовувався, як кодер/декодер в системі). Також по результативності система майже досягнула результатів ARCNN -- яка вважається взірцем нейронних мереж для стиску зображень.

Висновки. Серед різноманітних підходів до вирішення задачі стиску зображень, в цій роботі було обрано той, який в перспективі повинен дати найбільшу універсальність. Так використання нейронних мереж, не як основного інструменту для стиску зображення, а як допоміжного елементу в системі зі стандартним алгоритмом стиску довело свою ефективність. Результати таблиць 1 та 2 показують, що фінальний результат роботи системи є надзвичайно якісним -- середні показник PSNR дорівнював 21.576, що лише трохи менший показнику однієї з найкращих мереж на даний момент АИСММ (21.63), а результат ЭЭШ 0.66372 ще менше відстав від ARCNN (0.66624).

Література

1. JPEG, PNG, or GIF? The Ultimate Cheat Sheet of Image File Formats [Електронний ресурс]: [Веб-сайт]. -- Електронні дані. -- Jami Oetting -- 28.07.2017

2. Image super-resolution using deep convolutional networks / [C. Dong, C. C. Loy, K. He, X. Tang.] // IEEE transactions on pattern analysis and machine intelligence -- 2016. -- Vol. 38. -- PP. 295-307.

3. Image Compression with Neural Networks [Електронний ресурс]: [Веб-сайт]. -- Електронні дані. -- Nick Johnston, David Minnen -- 29.09.2016

4. Deep Convolution Networks for Compression Artifacts Reduction [Електронний ресурс]: [Веб-сайт]. -- Електронні дані. -- Ke Yu, Chao Dong, Chen Change Loy, Xiaoou Tang

Размещено на Allbest.ru

...

Подобные документы

  • Основні теоретичні відомості алгоритмів стиснення зображень: класи зображень та їх представлення в пам'яті, алгоритми та принципи групового кодування. Огляд та аналіз сучасних програмних засобів конвертування. Тестування, опис роботи програмного засобу.

    курсовая работа [2,9 M], добавлен 15.03.2014

  • Програмний продукт "Графічний кодер чорно-білих зображень". Аналіз технологій одержання компактних подань відеоінформації способом організації кодування й пошук шляхів підвищення їх ефективності. Кодування зображень на основі зміни градації яскравості.

    дипломная работа [1,8 M], добавлен 29.06.2009

  • Комп’ютерне моделювання системи сегментації та розпізнавання облич на зображеннях. Підвищення швидкодії моделювання за кольором шкіри та покращення якості розпізнавання при застосуванні робастних boosting-методів. Розробка алгоритмів функціонування.

    дипломная работа [1,6 M], добавлен 02.07.2014

  • Розкриття вмісту теорії стискування і опис класифікаційних характеристик методів компресії з втратами і без втрат. Оцінка втрат якості зображень при їх стискуванні за допомогою програм-кодеків. Розрахунок математичної моделі кодера стискання зображень.

    дипломная работа [1,1 M], добавлен 25.11.2012

  • Історія створення мови С#. Аналіз алгоритмів кодування даних. Розробка системи в середовищі Visual Studio 2008 Express. Схема шифрування алгоритму DES. Дослідження алгоритму RC2. Приклади хешів RIPEMD-160. Програмна реалізація основних процедур системи.

    дипломная работа [1,7 M], добавлен 25.10.2012

  • Призначення та область застосування програм, які орієнтовані на перетворення зображень з плоского в об’ємне. Основні стадії формування тривимірного зображення. Класифікація моделей і методів візуалізації. Особливості створення карти глибин по пікселям.

    курсовая работа [325,8 K], добавлен 04.06.2010

  • Особливості використання MSVisio для зображення плакатів. Програмні коди та блок-схеми алгоритмів задач. Структура фізичного серверу та місце віртуального приватного сервера (VPN) в ньому. З’єднання VPN-шлюзу з Інтернетом за допомогою маршрутизатора.

    контрольная работа [3,8 M], добавлен 23.06.2010

  • Загальна характеристика теорії редагування зображень, місце у ній растрових зображень. Аналіз переваг та недоліків програм малювання і векторної графіки. Структура, розмір і розширення зображення. Сутність і призначення основних форматів графічних файлів.

    реферат [1,1 M], добавлен 13.10.2010

  • Розробка та використання програми для пришвидшення процесу перетворення двомірного зображення у об'ємне. Методика та процес випробовування для виявлення та усунення недоліків в роботі програми. Інтерфейс програми, встановлення параметрів зображення.

    курсовая работа [3,2 M], добавлен 09.06.2010

  • Застосування нейронних мереж при вирішенні різних технічних проблем. Архітектура штучних нейронних мереж. Дослідження штучного інтелекту. Гіпотеза символьних систем. Представлення за допомогою символів. Синтаксичний та семантичний аналіз розуміння мови.

    курсовая работа [985,8 K], добавлен 14.01.2010

  • BMP як формат зберігання растрових зображень, огляд структури файлу. Створення програми для запису та перегляду графічних BMP-файлів на мові програмування Turbo Pascal 7.0, розробка функціональної схеми і алгоритмів, особливості проведення тестування.

    курсовая работа [325,8 K], добавлен 12.06.2011

  • Інтерфейс Adobe Photoshop. Прийоми редагування зображення та створення композицій. Прийоми редагування зображення інструментами малювання. Синтез зображень з Photoshop та Surfer. Результат суміщення растрової основи та Surfer-зображення у редакторі.

    дипломная работа [5,1 M], добавлен 23.08.2014

  • Історія виникнення та сфери використання тримірної графіки. Дослідження процесу візуалізації тримірного зображення. Створення програмного забезпечення, здатного перетворювати стандартні графічні зображення до графічних зображень внутрішніх форматів Мауа.

    дипломная работа [3,6 M], добавлен 23.09.2013

  • Сучасні методи захисту текстової інформації. Порівняльний аналіз шифру Бекона з іншими відомими шифрами. Практичне використання алгоритмів кодування тексту. Написання програми "Шифр Бекона", використані компоненти для реалізації алгоритму, їх властивості.

    курсовая работа [606,8 K], добавлен 28.03.2016

  • Розробка та дослідження алгоритмів і програм кодування даних з виявленням помилок на основі циклічних CRC-кодів. Аналіз циклічних кодів. Розробка та тестування програмних модулів. Розрахунок економічних показників. Вирішення питань охорони праці.

    дипломная работа [5,4 M], добавлен 22.06.2010

  • Геометричні перетворення зображення. Усунення розмитості зображення за допомогою алгоритму сліпої деконволюції або з допомогою фільтра Вінера. Моделювання Blur та відновлення розмитого зображення. Імітація (Motion Blur) розмитості рухом, його відновлення.

    курсовая работа [1,8 M], добавлен 22.11.2014

  • Методи поліпшення растрових зображень. Параметри виду, буфер глубини, джерело світла в бібліотеці Opengl. Створення тривимірної фігурі та забезпечення її повороту при натисненні на "пробіл". Операції маштабування з використанням клавіш "плюс" та "мінус".

    контрольная работа [142,9 K], добавлен 22.09.2009

  • Геометричне перетворення цифрового зображення в середовище Matlab. Побудова його гістограми, поліпшення, фільтрація та сегментація, розмитнення з використанням фільтру Гауса. Відновлення зображення деконволюцією Вінера та по маломірному масиву INITPSF.

    курсовая работа [1,1 M], добавлен 05.02.2015

  • Створення програми, яка здатна перетворювати двовимірні зображення у об’ємні. Проект для побудови ландшафтів, отримання фотографій об’єктів під іншим кутом огляду, досліджень поверхонь зрізів матеріалів. Опис алгоритму програми. Вхідні та вихідні дані.

    курсовая работа [548,3 K], добавлен 09.06.2010

  • Визначення поняття "алгоритми", їх властивості, метод складання. Способи подання алгоритмів: письмовий, усний, схематичний, графічний, кодований. Навчальна алгоритмічна мова. Особливості створення блок-схеми. Алгоритм поданий мовою програмування.

    презентация [2,9 M], добавлен 06.05.2019

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.