Анализ форматов, использующих стеганографию в электронных книгах

Исследование возможности использования форматов файлов, применяющихся в электронных книгах, в качестве стеганографических объектов. Структура наиболее распространенных форматов текстовых документов. Методы вложения дополнительной информации в файлы.

Рубрика Коммуникации, связь, цифровые приборы и радиоэлектроника
Вид статья
Язык русский
Дата добавления 15.01.2021
Размер файла 10,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Анализ форматов, использующих стеганографию в электронных книгах

Ахрамеева К.А., кандидат технических наук,

Юркин Д.В., кандидат технических наук

Герлинг Е.Ю., кандидат технических наук

Седельников Д.А., студент 4 курс

Телекоммуникаций, Российская Федерация, г. Санкт-Петербург

Аннотация

В статье рассматривается возможность использования форматов файлов, использующихся в электронных книгах, в качестве стеганографических объектов. Рассмотрена структура наиболее распространенных форматов текстовых документов. Предложены методы вложения дополнительной информации в анализируемые файлы.

Ключевые слова: стеганография, pdf, fb2, DjVu.

Annotation

The article considers the possibility of using file formats used in e-books as steganographic objects. The structure of the most common formats of text documents is considered. Methods of embedding additional information in the analyzed files are proposed.

Key words: steganography, pdf, fb2, DjVu.

Современные технологии проникли во все сферы жизни человека: от мощнейших компьютеров до бытовой техники. Чтение книг является одним из самых неотъемлемых видов досуга, соответственно технологический процесс не обошёл и его. Большое распространение получили электронные книги, которые стали вытеснять бумажные аналоги. Наделенные большими преимуществами, такими как возможность чтения в любое время суток на любых девайсах, возможность быстрого доступа к ним и оперативного обмена ими между пользователями, электронные книги оказались отличной заменой обычным бумажным книгам. Более того, современные электронные книги могут быть представлены в различных форматах, что позволяет открывать и использовать их в любых доступных системах и на любых устройствах. Именно возможности изменения их без вреда для изначально содержащейся в них информации и скрытной передачи данных через исходный код файлов и стороннее программное обеспечение сделали электронные книги интересным объектом для исследования относительно использование методов стеганографии.

Наиболее распространенным методом для передачи скрытой информации в текстовых файлах являются методы лингвистической стеганографии [1]. Лингвистическая стеганография предполагает вложение информации в текстовые документы, представленные на любом языке, таким образом, чтоб содержание основного текста не исказилось. Однако, помимо лингвистических методов стеганографии, представляет интерес сам формат файлов. Рассмотрим на примере некоторых форматов электронных книг вложение дополнительной информации, как в саму структуру файла, так и при модификации исходного текста (лингвистическая стеганография).

1. Portable Document Format (PDF) - открытый формат электронных документов, предназначенный для представления полиграфической продукции в электронном виде.

PDF-документ образуется объектами разных типов:логические

переменные, числа (целые и дробные), строки, массивы, словари, потоки, комментарии.

Структура PDF выглядит следующим образом: заголовок, объекты (obj данные), xref-таблица, информация об объектах, с которых необходимо начать чтение файлов.

PDF-формат является независимым от платформы форматом. Текст и изображения внутри файлов PDF отображаются одинаково на любой платформе. PDF документ состоит из множества объектов, которые определяют внешний вид и функциональность документа. Способ отображения объектов контролируется определенными командами внутри объекта, называемыми операторами. Спецификация PDF определяет множество операторов для управления отображением текста. Файлы PDF обычно сжимаются для экономии места на диске. Сжатие PDF файла не влияет на защищенность служебной информации внутри файла и не является препятствием для ее извлечения.

Анализ PDF стандарта позволяет предложить следующие методы сокрытия дополнительной информации:

- Каждый объект чередовать определенным способом, тем самым меняя структуру документа. В данном способе предполагается изменять структуру документа, не меняя содержимое. Если существует n объектов, то имеется n! различных комбинаций, следовательно, возможно передать не более log2(n!) бит данных.

- Использование межсимвольных и пробельных интервалов. Например, изменяя обычные пробельные символы в A0 для кодирования единицы и оставляя в неизменности обычные пробельные символы для вложения нуля [2]. Либо изменяя ширину символа А0 до нуля позволяет произвести вставку любого количество таких символов в документ без опасения, что данные изменения будут визуально видны в результирующем документе. Таким образом, между двумя любыми символами в документе встраивается несколько неразрывных пробелов нулевой длины, количество, которых кодирует необходимый ASCII символ. [3].

- Инкрементальные обновления. PDF формат позволяет использовать инкрементальные обновления для хранения различных версий одного документа, то есть небольшие части документа, которые содержат изменения по сравнению с предыдущей версий. Например, можно встраивать данные [2]:

• изменяя текст видимым образом, затем записывать инкрементальное обновление, содержащее исходные данные PDF, поэтому измененный текст фактически не отображается;

• записывать инкрементальные обновления для объектов, которые не существуют в исходных данных, поэтому обновление не имеет никакого эффекта. Данные встроенные в значение объектов потока, используются в обновлении;

• записывать инкрементальные обновления с помощью заданной длины для нескольких объектов; следовательно, данные можно получить, прочитав раздел перекрестной ссылки обновления, который включает начальный адрес каждого обновленного объекта.

- Выравнивание текста и TJ оператор. В работе [4] утверждается, что для выравнивания текста (слева и справа) используется PDF writer, который генерирует случайные значения для TJ операторов. В таком случае можно скрыть данные в наименее значимых битах этих значений TJ оператора (в случае, когда значения TJ оператора являются случайными и не содержат шаблон). Оператор TJ используется для отображения текстовых строк в файле PDF. Он содержит массив строк и чисел, состоящих из символов и значений пространства, используемых между этими символами. Каждое значение пространства между символами вычитается из текущей текстовой позиции, которая сдвигает соответствующую строку влево на это значение (или вправо, в случае отрицательного значения)[3].

2. FictionBook (FB2) - формат представления электронных версий книг в виде XML-документов, где каждый элемент книги описывается своими тегами. Стандарт призван обеспечить совместимость с любыми устройствами и форматами. XML позволяет легко создавать документы, готовые к непосредственному использованию и программной обработке (преобразованию, хранению, управлению) в любой среде. Документы, обычно имеющие расширение fb2, могут содержать структурную разметку основных элементов текста, некоторое количество информации о книге, а также вложения с двоичными файлами, в которых могут храниться иллюстрации, например обложка.

Возможные способы внедрения дополнительной информации:

- формат может содержать binary тег, внутри которого содержится изображение. В таком случае есть возможность произвести вложение дополнительной информации методами стеганографии для изображений. Однако, выбор подходящего метода, требует дополнительных исследований;

- лингвистические методы вложения, например, увеличение количества пробелов и иных символы (например, нижнее подчеркивание) за пределами тегов или внутри самих тегов.

3. DjVu - технология сжатия изображений с потерями, разработанная специально для хранения сканированных документов - книг, журналов, рукописей и прочее, где обилие формул, схем, рисунков и рукописных символов делает чрезвычайно трудоёмким их полноценное распознавание.

В DjVu используется алгоритм JB2, который ищет повторяющиеся символы и сохраняет их изображение только один раз. Соответственно имеется перечень возможных способов сокрытия:

- выбрать множество всех похожих символов и выбрать один с помощью хеш-стеганографии;

- выбирать два символа вместо одного. Первый символ считать передающим 0, а второй символ считать передающим 1. С помощью «чередования» можно передавать сокрытую информацию;

- скрывать данные внутри самой картинки, обозначающей символ в DjVu, например, с помощью метода с вложением в наименее значащие биты;

- использовать методы стеганографии, предполагающие вложение дополнительной информации в шумы сканера, изменение расстояний между строками и т.д.

Электронные книги сегодня получают все более широкое распространение. Поэтому ожидаемо, что форматы электронных книг будут использоваться для организации скрытой передачи информации методами стеганографии. Важно понимать какие алгоритмы могут быть использованы для вложения сообщений, как для совершенствования уже существующих методов, так и для разработки методов стегоанализа. Анализ наиболее распространенных форматов, использующихся в электронных книгах показал, что помимо методов лингвистической стеганографии, возможно использовать для вложения и особенности структуры формата файлов.

Использованные источники

формат стеганографический файл информация

1. Коржик В.И., Небаева К.А., Герлинг Е.Ю., Догиль П.С., Федянин И.А. Цифровая стеганография и цифровые водяные знаки. Часть 1. Цифровая стеганография. [монография]: - СПбГУТ. - СПб., 2016 - 226 с.

2. Lee I-Shi. A new approach to covert communication via pdf files / I-Shi Lee, Wen-Hsiang Tsa // Signal Processing. - 2010. - P. 557-565.

3. Карачанская Е., Использование стеганографии для сокрытия сообщения внутри PDF-файлов. // Коношко К. // Евразийское Научное Объединение. С. 1-2.

4. Zhong Shangping. Data hiding in a kind of pdf texts for secret communication / Shangping Zhong, Xueqi Cheng, Tierui Chen // International Journal of Network Security. - 2007. -№ 4(1). - P. 17-26.

Размещено на Allbest.ru

...

Подобные документы

  • Запись голосовой информации. Применение диктофонной техники в качестве промежуточного звена регистрации информации при создании машинописных документов. Технологии создания электронных документов, автоматический ввод текста с диктофона в компьютер.

    курсовая работа [196,4 K], добавлен 21.10.2009

  • Исследование физических параметров звука. Характеристика программного обеспечения для редактирования и обработки видео и аудио. Анализ известных форматов видео, видео разъёмов и эффектов видео редакторов. Методика измерения субъективного качества видео.

    курсовая работа [48,0 K], добавлен 02.04.2013

  • Характеристика этапов проектирования электронных систем. Применение высокоуровневых графических и текстовых редакторов в процессе проектирования. Параметры конфигурации для аппаратных средств. Последовательность проектных процедур архитектурного этапа.

    контрольная работа [17,6 K], добавлен 11.11.2010

  • Описание структуры и изучение устройства элементов аналоговых и IP-систем видеонаблюдения. Параметры камер видеонаблюдения и анализ форматов видеозаписи. Характеристика устройств обработки видеосигналов и обзор программного обеспечения видеонаблюдения.

    курсовая работа [1,2 M], добавлен 29.09.2013

  • Понятие "система" в технике - сложная совокупность объектов и связей между ними, предназначенная для реализации заданных функций. Каждая конструкция характеризуется определённой системой свойств. Классификация электронных средств по отдельным признакам.

    реферат [22,7 K], добавлен 12.09.2010

  • Роль электронных коммуникаций в компаниях. Электронные коммуникации внутри компании, их классификация в зависимости от величины и сложности. Преимущества и недостатки электронных коммуникаций. Проблема связи между центральным офисом и филиалами.

    реферат [24,9 K], добавлен 30.11.2010

  • Понятие электронного усилителя, принцип работы. Типы электронных усилителей, их характеристики. Типы обратных связей в усилителях и результаты их воздействия на работу электронных схем. Анализ электронных усилителей на основе биполярных транзисторов.

    курсовая работа [540,7 K], добавлен 03.07.2011

  • Параметры и свойства устройств обработки сигналов, использующих операционного усилителя в качестве базового элемента. Изучение основных схем включения ОУ и сопоставление их характеристик. Схемотехника аналоговых и аналого-цифровых электронных устройств.

    реферат [201,0 K], добавлен 21.08.2015

  • Миниатюрный, встраиваемый электронный вольтметр с анимированным светодиодным индикатором. Описание схемы электрической принципиальной. Основные понятия теории надежности. Сравнение промышленных форматов. Экспорт текущего проекта в формат N/C Drill.

    дипломная работа [2,0 M], добавлен 12.06.2013

  • Описание форматов команд и обрабатываемых данных. Содержательная ГСА функционирования центрального обрабатывающего устройства, его структурная схема. Архитектура внешних выводов процессорного блока. Синтез управляющего автомата. Кодирование операций.

    курсовая работа [1,4 M], добавлен 17.12.2013

  • Назначение систем видеоконференций. Передача мультимедийных данных через сеть Internet в режиме реального времени. Выбор структуры и форматов данных в системе видеоконференций. Выбор метода кодирования и декодирования, описание стандарта кодирования.

    курсовая работа [863,8 K], добавлен 17.10.2012

  • Динамический режим работы усилителя. Расчет аналоговых электронных устройств. Импульсные и широкополосные усилители. Схемы на биполярных и полевых транзисторах. Правила построения моделей электронных схем. Настройка аналоговых радиотехнических устройств.

    презентация [1,6 M], добавлен 12.11.2014

  • Описание работы электронных часов и микроконтроллера АТTiny2313 фирмы Atmel. Выходные буферы порта. Принципиальная схема электронных часов. Разработка печатной платы и практическое её применение. Принципы программирования и прошивки микроконтроллера.

    курсовая работа [749,0 K], добавлен 29.05.2009

  • Описание структурной и функциональной схем электронных часов, выбор элементной базы. Разработка счетчика времени с системой управления на базе микроконтроллера. Экономический расчет затрат на проектирование, разработку и сборку макета электронных часов.

    дипломная работа [223,5 K], добавлен 26.07.2015

  • Проектирование современных электронных средств и характеристика существующих методов их конструирования. Государственные стандарты оформления конструкторской документации, их учет и хранение в бюро технической документации. Виды носителей информации.

    контрольная работа [60,0 K], добавлен 15.09.2010

  • Изучение понятия, видов, целей (изъятие, предупреждение брака), этапов процесса (получение первичной информации о состоянии объекта, сравнение с установленными нормами, выявление расхождений данных) и средств контроля параметров электронных средств.

    контрольная работа [52,6 K], добавлен 06.03.2010

  • Основные понятия и принципы использования карточек. Способы идентификации пластиковых карт. Особенности устройства смарт-карты. Применение криптографии для карт с магнитной полосой. Устройства обслуживания электронных платежей. Стандарты расчетов.

    реферат [831,2 K], добавлен 12.05.2004

  • Основные методы проектирования и разработки электронных устройств. Расчет их статических и динамических параметров. Практическое применение пакета схемотехнического моделирования MicroCap 8 для моделирования усилителя в частотной и временной областях.

    курсовая работа [2,8 M], добавлен 23.07.2013

  • Понятие, задачи и проблемы автоматизации проектирования сложных электронных систем. Структура комплекса аппаратно-программных средств САПР. Описание микросхемного, регистрового, вентильного и кремниевого уровней представления мультипроцессорных систем.

    реферат [153,5 K], добавлен 11.11.2010

  • Классификация и структура систем беспроводного доступа. Анализ методов уплотнения и распределения каналов. Характеристики наиболее распространенных протоколов доступа. Многоканальные и многоадресные системы передачи информации со статическим уплотнением.

    дипломная работа [465,6 K], добавлен 18.07.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.