Система покращення алгоритмів стиску зображення
Архітектура системи на основі нейронних мереж для покращення алгоритмів стиску зображення. Створення інструменту, який не змінюючи існуючі алгоритми кодування, декодування зможе представити інструмент, який суттєво покращить якість зображень та їх розмір.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | украинский |
Дата добавления | 22.04.2021 |
Размер файла | 913,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Стаття з теми:
Система покращення алгоритмів стиску зображення
Олашин Олександр Олександрович, студент Національного технічного університету України «Київський політехнічний інститут імені Ігоря Сікорського»
Анотація
Запропоновано архітектуру системи на основі нейронних мереж для покращення алгоритмів стиску зображення. Проведено порівняння ефективності роботи даної системи та інших систем стику зображення.
Ключові слова: нейронні мережі, алгоритми стиску зображення.
Аннотация
СИСТЕМА УЛУЧШЕНИЯ АЛГОРИТМОВ СЖАТИЯ ИЗОБРАЖЕНИЯ
Олашин Александр Александрович, студент Национального технического университета Украины «Киевский политехнический институт имени Игоря Сикорского
Предложено архитектуру системы на основе нейронных сетей для улучшения алгоритмов сжатия изображений. Проведено сравнение эффективности работы данной системы и других систем сжатия изображений.
Ключевые слова: нейронные сети, алгоритмы сжатия изображения.
Summary
SYSTEM FOR IMPROVING IMAGE COMPRESSION ALGORITHMS
Olashyn Oleksandr, Student of the National Technical University of Ukraine «Igor Sikorsky Kyiv Polytechnic Institute»
A system architecture based on neural networks is proposed to improve image compression algorithms. The efficiency of this system and other image compression systems is compared.
Key words: neural networks, image compression algorithms.
Технології розвиваються надзвичайно стрімко. І їх розвиток прискорюється з кожним роком. Однак деякі речі як не дивно залишаються доволі інертними до змін. Яскравим прикладом є алгоритми стику зображень (або ж формати зображень). Так PNG було створено в 1997, а JPEG і того раніше -- в 1992 році. Здається це було нещодавно, однак по міркам сучасного технологічного зростання цілу вічність тому. Дані формати залишаються надзвичайно популярними і досі домінують на ринку зображень [1].
Однак на превеликий жаль вимоги до якості зображень з поступом технологій тільки зростають. Так якщо раніше основним критерієм до алгоритмів було стиснути зображення якомога сильніше, то зараз при покращенні дисплеїв якість зображення грає не менш важливу роль ніж його компактність.
Ціллю даної роботи є створення інструменту, який не змінюючи існуючі алгоритми кодування та декодування зможе представити інструмент, який суттєво покращить якість зображень та їх розмір.
Існують різні підходи до вирішення задачі покращення алгоритмів стиску зображення. Більшість дослідників в своїй роботі опираються на різноманітні типи нейронних мереж, як найбільш перспективного інструменту. Наприклад, варто відзначити роботу Dong [2], в якій запропоновано метод покращення роздільної здатності зображення на основі згорткової мережі. Іншим прикладом є стаття Google Reasearch Group [3], де чудово описано застування рекуретної нейронної мережі для задачі стиску зображення і приведено приклади, що ілюструють ефективність даної мережі.
У даній роботі, як основний інструмент було обрано саме згорткову нейронну мережу, через її дуже високі показники ефективності для розв'язку задачі, а також через меншу кількість ресурсів необхідних для тренування такої мережі.
Запропонована система має наступний вигляд -- вона складається з двох нейронних мереж, які застосовують звичайний кодек зображення для самої операції стиску (рисунок 1).
зображення алгоритм стискання
Рис. 1 - Архітектура запропонованої системи
Завдання першої мережі -- створити зменшену версію оригінального зображення, яка зберігає всі основні структурні елементи. Потім зменшене зображення стискається за допомогою стандартного кодеку (наприклад JPEG). Для відновлення зображення використовується друга мережа -- вона відновлює, покращує та збільшує декодоване зображення.
Перший шар являє собою згортковий шар, що використовує, де ReLU слугує функцією активації. Цей шар використовується для того, щоб отримати основні характеристики зображення. Фільтри мають розмір 3х3хс, де с -- кількість каналів вихідного зображення. В даній роботі використовується 48 фільтрів (через обмеження обчислювальних потужностей). Нелінійність досягається використанням ReLU як функції активації. Наступний шар використовується для зменшення зображення та покращення отриманих характеристик. Для цього застосовується операція згортки з кроком, що дорівнює два. Фільтри даного шару мають розміри 3х3х48 і ReLU також застосовується як функція активації. Для останнього третього шару використовують с фільтрів розміру 3х3х48 для створення компактного представлення зображення.
RCNN складається з 18 шарів. Перший шар складається з 48 фільтрів розміром 3х3хс і використовується для створення 48 карт характеристик. Як функція активації використовується ReLU. Потім йдуть 16 шарів використовуються 48 фільтрів розміром 3х3х48. Варто зазначити, що в кожному з цих шарів також використовується нормалізація між операціями згортки та ReLU. Для останнього шару використовується с фільтрів розміром 3x3x48 для відновлення зображення.
Систему було натреновано на 200 зображеннях, розміру 180x180. Для тестування було обрано 5 популярних зображень, що використовуються для тестування нейронних мереж (рисунок 2).
Рис. 2 - Тестові зображення
Систему було порівняно зі стандартним алгоритмом JPEG, а також ж ARCNN [4] -- однією з найкращих нейронних мереж для стиску зображення. Також були окремо протестовані мережі по окремо та система загалом. Результати можна побачити в таблиці 1 та таблиці 2.
Таблиця 1 - Результати роботи за критерієм PSNR (dB)
Метод |
Метелик |
Дім |
Папуга |
Листя |
Фотограф |
Середній результат |
|
JPEG |
22.58 |
27.77 |
26.19 |
22.49 |
24.45 |
20.18 |
|
ARCNN |
25.64 |
29.68 |
28.13 |
25.07 |
25.27 |
21.63 |
|
CCNN |
22.85 |
27.9 |
27.01 |
22.85 |
24.78 |
20.508 |
|
RCNN |
24.55 |
28.34 |
27.57 |
24.23 |
25.17 |
21.062 |
|
Запропонована система |
25.78 |
28.48 |
28.01 |
25.03 |
25.58 |
21.576 |
Таблиця 2 - Результати роботи за критерієм SSIM
Метод |
Метелик |
Дім |
Папуга |
Листя |
Фотограф |
Середній результат |
|
JPEG |
0.7378 |
0.7733 |
0.7581 |
0.7775 |
0.7283 |
0.60744 |
|
ARCNN |
0.8741 |
0.8209 |
0.8446 |
0.8983 |
0.7674 |
0.66624 |
|
CCNN |
0.7201 |
0.8019 |
0.8232 |
0.7761 |
0.7582 |
0.63188 |
|
RCNN |
0.867 |
0.8189 |
0.8411 |
0.8643 |
0.7543 |
0.65572 |
|
Запропонована система |
0.8732 |
0.8321 |
0.8367 |
0.8821 |
0.7677 |
0.66372 |
Якість отриманих зображень перевірялись за допомогою двох основних показників -- коефіцієнту пікового сигналу до шумового співвідношення (PSNR) та індексу структурної схожості (SSIM).
Як можна побачити з наведених вище таблиць -- запропонована система суттєво перевищила звичайний JPEG (при чому JPEG використовувався, як кодер/декодер в системі). Також по результативності система майже досягнула результатів ARCNN -- яка вважається взірцем нейронних мереж для стиску зображень.
Висновки. Серед різноманітних підходів до вирішення задачі стиску зображень, в цій роботі було обрано той, який в перспективі повинен дати найбільшу універсальність. Так використання нейронних мереж, не як основного інструменту для стиску зображення, а як допоміжного елементу в системі зі стандартним алгоритмом стиску довело свою ефективність. Результати таблиць 1 та 2 показують, що фінальний результат роботи системи є надзвичайно якісним -- середні показник PSNR дорівнював 21.576, що лише трохи менший показнику однієї з найкращих мереж на даний момент АИСММ (21.63), а результат ЭЭШ 0.66372 ще менше відстав від ARCNN (0.66624).
Література
1. JPEG, PNG, or GIF? The Ultimate Cheat Sheet of Image File Formats [Електронний ресурс]: [Веб-сайт]. -- Електронні дані. -- Jami Oetting -- 28.07.2017
2. Image super-resolution using deep convolutional networks / [C. Dong, C. C. Loy, K. He, X. Tang.] // IEEE transactions on pattern analysis and machine intelligence -- 2016. -- Vol. 38. -- PP. 295-307.
3. Image Compression with Neural Networks [Електронний ресурс]: [Веб-сайт]. -- Електронні дані. -- Nick Johnston, David Minnen -- 29.09.2016
4. Deep Convolution Networks for Compression Artifacts Reduction [Електронний ресурс]: [Веб-сайт]. -- Електронні дані. -- Ke Yu, Chao Dong, Chen Change Loy, Xiaoou Tang
Размещено на Allbest.ru
...Подобные документы
Основні теоретичні відомості алгоритмів стиснення зображень: класи зображень та їх представлення в пам'яті, алгоритми та принципи групового кодування. Огляд та аналіз сучасних програмних засобів конвертування. Тестування, опис роботи програмного засобу.
курсовая работа [2,9 M], добавлен 15.03.2014Програмний продукт "Графічний кодер чорно-білих зображень". Аналіз технологій одержання компактних подань відеоінформації способом організації кодування й пошук шляхів підвищення їх ефективності. Кодування зображень на основі зміни градації яскравості.
дипломная работа [1,8 M], добавлен 29.06.2009Комп’ютерне моделювання системи сегментації та розпізнавання облич на зображеннях. Підвищення швидкодії моделювання за кольором шкіри та покращення якості розпізнавання при застосуванні робастних boosting-методів. Розробка алгоритмів функціонування.
дипломная работа [1,6 M], добавлен 02.07.2014Розкриття вмісту теорії стискування і опис класифікаційних характеристик методів компресії з втратами і без втрат. Оцінка втрат якості зображень при їх стискуванні за допомогою програм-кодеків. Розрахунок математичної моделі кодера стискання зображень.
дипломная работа [1,1 M], добавлен 25.11.2012Історія створення мови С#. Аналіз алгоритмів кодування даних. Розробка системи в середовищі Visual Studio 2008 Express. Схема шифрування алгоритму DES. Дослідження алгоритму RC2. Приклади хешів RIPEMD-160. Програмна реалізація основних процедур системи.
дипломная работа [1,7 M], добавлен 25.10.2012Призначення та область застосування програм, які орієнтовані на перетворення зображень з плоского в об’ємне. Основні стадії формування тривимірного зображення. Класифікація моделей і методів візуалізації. Особливості створення карти глибин по пікселям.
курсовая работа [325,8 K], добавлен 04.06.2010Особливості використання MSVisio для зображення плакатів. Програмні коди та блок-схеми алгоритмів задач. Структура фізичного серверу та місце віртуального приватного сервера (VPN) в ньому. З’єднання VPN-шлюзу з Інтернетом за допомогою маршрутизатора.
контрольная работа [3,8 M], добавлен 23.06.2010Загальна характеристика теорії редагування зображень, місце у ній растрових зображень. Аналіз переваг та недоліків програм малювання і векторної графіки. Структура, розмір і розширення зображення. Сутність і призначення основних форматів графічних файлів.
реферат [1,1 M], добавлен 13.10.2010Розробка та використання програми для пришвидшення процесу перетворення двомірного зображення у об'ємне. Методика та процес випробовування для виявлення та усунення недоліків в роботі програми. Інтерфейс програми, встановлення параметрів зображення.
курсовая работа [3,2 M], добавлен 09.06.2010Застосування нейронних мереж при вирішенні різних технічних проблем. Архітектура штучних нейронних мереж. Дослідження штучного інтелекту. Гіпотеза символьних систем. Представлення за допомогою символів. Синтаксичний та семантичний аналіз розуміння мови.
курсовая работа [985,8 K], добавлен 14.01.2010BMP як формат зберігання растрових зображень, огляд структури файлу. Створення програми для запису та перегляду графічних BMP-файлів на мові програмування Turbo Pascal 7.0, розробка функціональної схеми і алгоритмів, особливості проведення тестування.
курсовая работа [325,8 K], добавлен 12.06.2011Інтерфейс Adobe Photoshop. Прийоми редагування зображення та створення композицій. Прийоми редагування зображення інструментами малювання. Синтез зображень з Photoshop та Surfer. Результат суміщення растрової основи та Surfer-зображення у редакторі.
дипломная работа [5,1 M], добавлен 23.08.2014Історія виникнення та сфери використання тримірної графіки. Дослідження процесу візуалізації тримірного зображення. Створення програмного забезпечення, здатного перетворювати стандартні графічні зображення до графічних зображень внутрішніх форматів Мауа.
дипломная работа [3,6 M], добавлен 23.09.2013Сучасні методи захисту текстової інформації. Порівняльний аналіз шифру Бекона з іншими відомими шифрами. Практичне використання алгоритмів кодування тексту. Написання програми "Шифр Бекона", використані компоненти для реалізації алгоритму, їх властивості.
курсовая работа [606,8 K], добавлен 28.03.2016Розробка та дослідження алгоритмів і програм кодування даних з виявленням помилок на основі циклічних CRC-кодів. Аналіз циклічних кодів. Розробка та тестування програмних модулів. Розрахунок економічних показників. Вирішення питань охорони праці.
дипломная работа [5,4 M], добавлен 22.06.2010Геометричні перетворення зображення. Усунення розмитості зображення за допомогою алгоритму сліпої деконволюції або з допомогою фільтра Вінера. Моделювання Blur та відновлення розмитого зображення. Імітація (Motion Blur) розмитості рухом, його відновлення.
курсовая работа [1,8 M], добавлен 22.11.2014Методи поліпшення растрових зображень. Параметри виду, буфер глубини, джерело світла в бібліотеці Opengl. Створення тривимірної фігурі та забезпечення її повороту при натисненні на "пробіл". Операції маштабування з використанням клавіш "плюс" та "мінус".
контрольная работа [142,9 K], добавлен 22.09.2009Геометричне перетворення цифрового зображення в середовище Matlab. Побудова його гістограми, поліпшення, фільтрація та сегментація, розмитнення з використанням фільтру Гауса. Відновлення зображення деконволюцією Вінера та по маломірному масиву INITPSF.
курсовая работа [1,1 M], добавлен 05.02.2015Створення програми, яка здатна перетворювати двовимірні зображення у об’ємні. Проект для побудови ландшафтів, отримання фотографій об’єктів під іншим кутом огляду, досліджень поверхонь зрізів матеріалів. Опис алгоритму програми. Вхідні та вихідні дані.
курсовая работа [548,3 K], добавлен 09.06.2010Визначення поняття "алгоритми", їх властивості, метод складання. Способи подання алгоритмів: письмовий, усний, схематичний, графічний, кодований. Навчальна алгоритмічна мова. Особливості створення блок-схеми. Алгоритм поданий мовою програмування.
презентация [2,9 M], добавлен 06.05.2019