Главная Коллекция "Revolution" Программирование, компьютеры и кибернетика Технология нейронной стилизации изображений с помощью машинного и глубокого обучения: методы и применение

Технология нейронной стилизации изображений с помощью машинного и глубокого обучения: методы и применение

Появление и перспективы использования технологии нейронной стилизации. Типологизация методов машинного обучения для стилизации изображений. Рассмотрение реализации стилизации изображений с помощью машинного и глубокого обучений на языке Python.

Рубрика	Программирование, компьютеры и кибернетика
Вид	статья
Язык	русский
Дата добавления	09.12.2024
Размер файла	299,8 K

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ТЕХНОЛОГИЯ НЕЙРОННОЙ СТИЛИЗАЦИИ ИЗОБРАЖЕНИЙ С ПОМОЩЬЮ МАШИННОГО И ГЛУБОКОГО ОБУЧЕНИЯ: МЕТОДЫ И ПРИМЕНЕНИЕ

Бунина Д.А., Лузан С.Р.

Аннотация

Появление технологии нейронной стилизации изображений открыло новые возможности для развития спектра возможностей применения машинного и глубокого обучений. Однако, как и в случае с любой технологией интеллектуальных систем, она также даёт дополнительные возможности в сфере информационной безопасности. В статье рассматриваются методы машинного и глубокого обучения для стилизации изображений.

Передача нейронного стиля основана на концепции глубоких нейронных сетей, которые способны изучать и представлять сложные закономерности в данных. Используя эти сети, в работе был разработан алгоритм, который может извлекать особенности стиля и содержания двух изображений и объединять их для создания нового стилизованного изображения.

Ключевые слова: информационная безопасность, стилизация изображений капча, машинное обучение, глубокое обучение.

Annotation

Bunina D.A., Luzan S.R. NEURAL STYLING TECHNOLOGY IMAGES USING MACHINE AND DEEP LEARNING: METHODS AND APPLICATIONS

The emergence of neural image stylization technology has opened up new opportunities for the development of a range of possibilities for using machine and deep learning. However, as with any intelligent systems technology, it also provides additional capabilities in the field of information security. The article discusses machine and deep learning methods for image stylization.

Neural style transfer is based on the concept of deep neural networks, which are capable of learning and representing complex patterns in data. Using these networks, the work developed an algorithm that can extract the style and content features of two images and combine them to create a new stylized image.

Keywords: information security, image stylization, captcha, machine learning, deep learning.

Основная часть

В эпоху стремительной цифровизации информационная безопасность стала ядром современной информационной инфраструктуры. Увеличение зависимости от цифровых технологий в экономике и обществе создает идеальные условия для киберугроз, которые угрожают целостности, конфиденциальности и доступности информации. В этом контексте развитие эффективных мер информационной безопасности является не только необходимостью, но и условием для обеспечения устойчивого развития цифровой экономики и общества.

Капча, или Completely Automated Public Turing test to tell Computers and Humans Apart, - это проверка, которая отличает человека от робота. Однако, с развитием нейронных сетей и стилизации изображений, капча стала не только защитой от автоматических ботов, но и испытанием для искусственного интеллекта.

Стилизованные нейронной сетью изображения, которые могут имитировать стиль знаменитых художников или создавать новые, неожиданные эффекты, поставили капчу перед новыми вызовами. Теперь алгоритмы должны не только распознавать символы, но и отличать стилизованные изображения от оригиналов.

В этом контексте капча стала не только инструментом безопасности, но и тестом для нейронных сетей, которые должны научиться отличать искусство от реальности. Именно в этом месте пересечения безопасности и искусственного интеллекта рождается новый уровень защиты от киберугроз.

Машинное и глубокое обучение - это инновационные направления в области информационной безопасности, которые могут помочь в стилизации изображений [1]. Машинное обучение позволяет анализировать большие объемы данных и переносить стиль одного изображения на другое за короткий промежуток времени, а глубокое обучение может помочь в извлечении сложных и скрытых паттернов из изображений, делая их более реалистичными и детализированными [2].

Машинное обучение - это мощный инструмент, который может помочь в решении различных задач. Методы машинного обучения для стилизации изображений можно разделить на четыре типа:

— обучение с учителем: поиск идеального ответа,

— обучение без учителя: поиск скрытых закономерностей,

— обучение с частичным наблюдением: золотая середина,

— обучение с подкреплением: поиск оптимального решения.

Обучение с учителем - это метод, который использует маркированные данные для обучения модели. Алгоритм работает с примерами, содержащими пары "известный вход - известный выход", и целью является минимизация ошибки между предсказанным и фактическим выходами модели. Существуют различные вариации обучения с учителем, такие как случайный лес, машины опорных векторов, классификация на основе решений дерева и метод k- ближайших соседей.

Обучение без учителя - это метод, который обучает модель на неразмеченных данных без контроля со стороны пользователя. Алгоритм должен самостоятельно обнаружить закономерности, скрытые взаимосвязи и структуры в данных. Это может включать в себя задачи кластеризации, поиска аномалий, поиска ассоциаций и уменьшения размерности. Существуют различные вариации обучения без учителя, такие как кластеризация К-средних, иерархическая кластеризация, дендрограмма и метод главных компонент.

Обучение с частичным наблюдением - это метод, который занимает промежуточное положение между обучением с учителем и без учителя. Алгоритм использует как размеченные, так и неразмеченные данные для обучения модели. Это полезно в ситуациях, когда получение достаточного количества размеченных данных затруднено, но есть доступ к неразмеченным данным. машинный обучение стилизация изображение

Обучение с подкреплением - это метод, который обучает программное обеспечение принимать решения для достижения наиболее оптимальных результатов. Это обучение основано на имитации процесса обучения методом проб и ошибок, который люди используют для достижения своих целей. Существуют различные типы обучения с подкреплением, такие как Q-обучение, глубокие сети Q и метод SARSA.

Глубокое обучение - это революционный подход в машинном обучении, который позволяет искусственным нейронным сетям моделировать высокоуровневые абстракции в данных. Это разновидность машинного обучения, в которой нейронные сети обучаются на огромных объемах данных, что позволяет им настроить нейроны и образовать модель, способную обрабатывать новые данные.

Существуют различные методы глубокого обучения, которые могут быть использованы для стилизации изображений:

— свёрточные нейронные сети (CNN): это метод, который позволяет изучать нейронные сети, чтобы определять закономерности и отношения между входными последовательностями. Это идеальный способ для стилизации изображений, где нужно обнаруживать сложные закономерности и отношения между пикселями,

— рекуррентные нейронные сети (RNN): это алгоритм, который позволяет обучать нейронную сеть, чтобы обнаруживать паттерны и отношения между входными признаками во времени. Это полезно для стилизации видео и анимации,

— сеть долгосрочной памяти (LSTM): это тип RNN, который позволяет обучать нейронную сеть, находить закономерности и отношения между входными эффектами во времени. Это идеальный способ для стилизации видео, где нужно обнаруживать сложные закономерности и отношения между кадрами,

— автоэнкодеры: это метод, который позволяет обнаруживать аномалии в изображении на основе их отличия от нормального изображения. Это полезно для стилизации изображений, где нужно обнаруживать и исправлять ошибки,

— генеративно-состязательные сети (GAN): это метод глубокого обучения, который позволяет минимально использовать синтетические данные, чтобы улучшить стилизацию изображений. Это идеальный способ для создания реалистичных и уникальных изображений.

Реализация стилизации изображений с помощью машинного и глубокого обучений на языке Python представлена ниже:

import functools

import os

import tensorflow as tf

import tensorflow_hub as hub

import numpy as np

import matplotlib.pyplot as plt

def crop_center(image):

shape = image.shape

new_shape = min(shape[1], shape[2])

offset_y = max(shape[1] - shape[2], 0) // 2

offset_x = max(shape[2] - shape[1], 0) // 2

image = tf.image.crop_to_bounding_box(image, offset_y, offset_x, new_shape, new_shape)

return image

@functools.lru_cache(maxsize=None)

def load_image(image_url, image_size=(512, 512),

preserve_aspect_ratio=True):

image_path = tf.keras.utils.get_file(os.path.basename(image_url)[-256:], image_url)

img = tf.io.decode_image(tf.io.read_file(image_path), channels=3,

dtype=tf.float32)[tf.newaxis,...]

img = crop_center(img)

img = tf.image.resize(img, image_size, preserve_aspect_ratio=True)

return img

def show_images(images, titles=('',)):

n = len(images)

image_sizes = [image.shape[1] for image in images]

w = (image_sizes[0] * 6) // 320

plt.figure(figsize=(w * n, w))

gs = plt.GridSpec(1, n, width_ratios=image_sizes)

for i in range(n):

plt.subplot(gs[i])

plt.imshow(images[i][0], aspect-equal')

plt.axis('off)

plt.title(titles[i] if len(titles) > i else '')

plt.show()

content_image_url =

'https://cdn62.zvuk.com/pic?type=release&id=28817066&ext=jpg&size=1920x1920'

style_image_url = 'https:// sun 1 -92.userapi. com/s/v1/if1 /2saph0Y dK-

Wi1Nb2UeWeHDq8Loa0C9ODNNUv9xOWYo_LpVJ-c-

HgvWAgWK3Mmx064q4gkzM4jpg?size=400x400&quality=96&crop=388,0,1492, 1492&ava=1'

output_image_size = 512

content_img_size = (output_image_size, output_image_size)

style_img_size = (512, 512)

content_image = load_image(content_image_url, content_img_size)

style_image = load_image(style_image_url, style_img_size)

style_image = tf.nn.avg_pool(style_image, ksize=[3,3], strides=[1,1],

padding='SAME')

show_images([content_image, style_image], ['Стилизуемое изображение',

'Изображение примера стиля'])

hub_handle = 'https://tfhub.dev/google/magenta/arbitrary-image-stylization- v1-256/2'

hub_module = hub.load(hub_handle)

outputs = hub_module(content_image, style_image)

stylized_image = outputs[0]

outputs = hub_module(tf.constant(content_image), tf.constant(style_image)) stylized_image = outputs[0]

show_images([content_image, style_image, stylized_image],

titles=['CTHUH3yeMoe изображение', 'Изображение примера стиля', 'Стилизованное изображение']).

С целью получения стилизованного нейронной сетью изображения иного стиля необходимо заменить URL-адрес примера стиля (style_image_url), также можно поступить в отношении и оригинального изображения (content_image_url), если требует стилизовать другое изображение.

Рисунок 1 Стилизуемое изображение и изображение примера стиля

Рисунок 2 Стилизованное нейронной сетью изображение

Список литературы

1. Что такое глубокое обучение? / Oracle [Электронный ресурс]. URL: https://www.oracle.com/cis/artificial-intelligence/machine-learning/what-is-deep- learning/ (дата обращения 19.06.2024);

2. Что такое машинное обучение? / SAP [Электронный ресурс]. URL: https://www.sap.com/central-asia-caucasus/products/artificiaUintelligence/what-is- machine-learning.html / (дата обращения 20.06.2024);

3. Полное руководство по передаче стиля с использованием глубокого обучения/ Mlcentre [Электронный ресурс]. URL: https://mlcentre.ru/articles/163490/ (дата обращения 20.06.2024);

4. Haitian, C. StyleCAPTCHA: CAPTCHA Based on Stylized Images to Defend against Deep Networks / Ucdavis: статья / Chen Haitian, Bai Jiang, Hao Chen - США: FODS '20, 2020. 10 с.

Размещено на Allbest.ru

...

статья "Технология нейронной стилизации изображений с помощью машинного и глубокого обучения: методы и применение" скачать

Подобные документы

Разработка системы распознавания изображений на основе аппарата искусственных нейронных сетей
Искусственные нейронные сети как одна из широко известных и используемых моделей машинного обучения. Знакомство с особенностями разработки системы распознавания изображений на основе аппарата искусственных нейронных сетей. Анализ типов машинного обучения.

дипломная работа [1,8 M], добавлен 08.02.2017
Введение в мультимедийные базы данных. Базы данных для изображений
Типы изображений (черно-белые, полутоновые, цветные) и их форматы. Устройства, создающие цифровые изображения, и их параметры. Применение и характеристики методов сжатия изображений. Поиск по содержимому в базах данных изображений. Структуры баз данных.

презентация [360,4 K], добавлен 11.10.2013
Повышение разрешающей способности изображений
Сравнительная оценка существующих программ, повышающих разрешение изображений на языке Borland Delphi. Выбор оптимального инструментария для разработки логической схемы. Форма поиска файлов, преобразования изображений и реализации алгоритмов интерполяции.

дипломная работа [3,0 M], добавлен 29.11.2011
Методы обработки рентгеновских диагностических изображений
Цифровые рентгенографические системы. Методы автоматического анализа изображений в среде MatLab. Анализ рентгеновского изображения. Фильтрация, сегментация, улучшение изображений. Аппаратурные возможности предварительной нормализации изображений.

курсовая работа [890,9 K], добавлен 07.12.2013
Использование Cuda для сжатия изображений
Обработка изображений на современных вычислительных устройствах. Устройство и представление различных форматов изображений. Исследование алгоритмов обработки изображений на базе различных архитектур. Сжатие изображений на основе сверточных нейросетей.

дипломная работа [6,1 M], добавлен 03.06.2022
Программирование трехмерных изображений в VisualBasic.NET
Основы программирования на языке VB.NET. Область применения трехмерных изображений. Форматы хранения пакетов инженерной графики. Преимущества трехмерного моделирования. Разработка программы по вращению трехмерных изображений на языках VB.NET и VRML.

курсовая работа [195,1 K], добавлен 11.03.2013
Системы машинного перевода
История автоматизированного перевода. Современные компьютерные программы перевода. Сфера использования машинного перевода. Формы организации взаимодействия человека и ЭВМ в машинном переводе. Интерредактирование и постредактирование машинного перевода.

курсовая работа [30,0 K], добавлен 19.06.2015
Машинний переклад
Історія машинного перекладу як науково-прикладного напряму. Теорія машинного перекладу. Особливості використання систем, орієнтованих на персональні комп’ютери. Напрямки розвитку та застосування машинного перекладу. Приклади систем машинного перекладу.

реферат [21,5 K], добавлен 19.02.2011
Поиск кластеров сообществ Live Journal с помощью методов Data Mining в среде RapidMiner
Анализ проблем, возникающих при применении методов и алгоритмов кластеризации. Основные алгоритмы разбиения на кластеры. Программа RapidMiner как среда для машинного обучения и анализа данных. Оценка качества кластеризации с помощью методов Data Mining.

курсовая работа [3,9 M], добавлен 22.10.2012
Перспектива использования технологии машинного обучения в медицине
Machine Learning как процесс обучения машины без участия человека, основные требования, предъявляемые к нему в сфере медицины. Экономическое обоснование эффективности данной технологии. Используемое программное обеспечение, его функции и возможности.

статья [16,1 K], добавлен 16.05.2016
Автоматизированная система колоризации полутонового изображения
Разработка приложения, целью которого ставится преобразование черно-белых полутоновых изображений в цветные. Обзор методики обработки изображения, способов преобразования изображения с помощью нейронной сети. Описания кластеризации цветового пространства.

дипломная работа [6,3 M], добавлен 17.06.2012
Пример обработки рентгеновских биомедицинских изображений с использованием системы MATLAB
Изучение современных методик компьютерной обработки биомедицинских изображений с целью улучшения изображений для их наилучшего визуального восприятия врачом-диагностом и эффективного сжатия изображений – для надежного хранения и быстрой передачи данных.

курсовая работа [2,3 M], добавлен 15.04.2019
Публикация фотопанорамных изображений на Web-ресурсе
Обзор методов создания Web-ресурса для публикации фотопанорамных изображений. Необходимые компоненты для работы сервера. Создание хранилища данных в программной оболочке Denwer. Публикация готовых панорамных изображений на сайте кафедры ИСКМ ВолГУ.

курсовая работа [1,9 M], добавлен 28.08.2012
Разработка нейронной сети с быстрой и простой обучаемостью программы новым символам
Обзор программных продуктов для анализа изображений: ABBYY FineReader и OCR CuneiForm. Понятие и виды нейронных сетей. Алгоритм обучения персептрона. Результаты исследований и описание интерфейса программы. Расчет себестоимости программного обеспечения.

дипломная работа [590,7 K], добавлен 17.08.2011
Компрессия изображений
Применение различных методов компрессии изображений и анимации. Определение наиболее подходящего формата сжатия. Выбор кодеков при помощи программы RIOT. Применение дополнительных способов оптимизации с использование программ OptiPNG, PNGOUT и TweakPNG.

лабораторная работа [1,5 M], добавлен 31.05.2013
Автоматическая классификация изображений по текстурным признакам
Современные системы текстурного анализа изображений. Примеры текстурной сегментации одноканальных изображений. Использование признаков, полученных на основе гистограммы яркостей второго порядка, для классификации спектрозональных аэрофотоснимков.

реферат [573,5 K], добавлен 15.01.2017
Разработка человеко-машинного интерфейса в GraphWorX32
Человеко-машинный интерфейс. Текстовый и смешанный (псевдографический) интерфейсы. Применение человеко-машинного интерфейса в промышленности. Программные средства для разработки человеко-машинного интерфейса. Среда разработки мнемосхем GraphworX32.

дипломная работа [5,3 M], добавлен 19.03.2010
Программа цифровой обработки растровых графических изображений
Описание математических методов представления и обработки графических изображений. Описание разработанного программного дополнения. Описание функций и их атрибутов. Представление и обработка графических изображений. Результаты тестирования программы.

курсовая работа [1,7 M], добавлен 27.01.2015
Разработка искусственной нейронной сети для распознавания пола по фотографии
Разработка алгоритма и программы для распознавания пола по фотографии с использованием искусственной нейронной сети. Создание алгоритмов: математического, работы с приложением, установки весов, реализации функции активации и обучения нейронной сети.

курсовая работа [1,0 M], добавлен 05.01.2013
Создания анимированных изображений в программе Adobe ImageReady
Общая характеристика, принципы и методы работы с программой Adobe ImageReady. Особенности и этапы создания анимированных изображений с помощью программы, ее интерфейс и палитра, дополнительные возможности, сходства и различия от Adobe Photoshop.

аттестационная работа [39,2 K], добавлен 26.02.2009

Другие документы, подобные "Технология нейронной стилизации изображений с помощью машинного и глубокого обучения: методы и применение"

весь список подобных работ

скачать работу можно здесь

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.