Комбинаторный способ сжатия "не сжимаемых данных"

Восстановление утраченной при сжатии информации с помощью урезания на один байт "не сжимаемых данных" с помощью поискового алгоритма. Особенность процедуры комбинаторной разархивации сверхсжатых данных и их сравнения с описанием несжатых предоставлений.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 25.07.2018
Размер файла 64,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1

1

НТЦ Модуль

Комбинаторный способ сжатия «не сжимаемых данных»

Филатов Олег Владимирович

г. Москва

Ныне действующие способы сжатия информации достигли своего предела. Этот предел формулируется в виде понятия «Не сжимаемого на один» байт данных. Доказаны теоремы, которые с математической строгостью объясняют существование предела сжатия от начального размера исходной информации. Но, тем не менее, в связи с развитием общего уровня знаний в соседних и родственных с математикой науках возникают новые научные концепции и идеи, применение которых в практической жизни приводят к трансформации самой математики путём ввода в математику новых понятий. Так, например, человечество создало компьютеры. Компьютерные алгоритмы и компьютерное моделирование стало не только изучаться в различных разделах математики, но и результаты работы компьютерных программ стали помогать в развитии математических идей и методов математических доказательств.

В этой статье описывается успешный компьютерный эксперимент, который позволил сжать «не сжимаемые на один» данные. Сжатие достигнуто не благодаря традиционному математическому аппарату, а благодаря отработанным компьютерным технологиям. Достигнутое сжатие вряд ли имеет практическое значение, оно слишком для этого мало. Но оно имеет концептуальное значение, так как показывает возможность преодоления предела сжатия данных за счёт идеи ассоциативного восстановления данных.

Примером ассоциативного восстановления данных служит восстановление старинных икон и картин. Когда утраченная часть изображения дорисовывается исходя из анализа оставшейся части иконы (картины) и общих культурных знаний историка - реставратора и искусствоведа.

Ассоциативное восстановление данных - это когда несуществующие данные создаются исходя из общего представления о целостном объекте. Недостающие данные восстанавливают по описанию когда-то существовавшего целостного объекта. То есть, вновь вводимые данные должны так вписаться в существующие данные, что имеющееся описание прежде существовавшего целого объекта будет хорошо описывать объединение оставшихся данных и вновь внесённых данных.

Присвоим не сжимаемому на единицу файлу (данным) единичный уровень Колмогоровской сложности. Демонстративное сжатие этого файла (данных) на один байт или же запись одного байта дополнительной информации в этот файл без увеличения его размера можно воспринимать как прохождение сквозь единичный уровень Колмогоровской сложности. Назовём сверхсжатием состояние данных, в которых преодолён единичный уровень Колмогоровской сложности, а сверхсжатые данные - это данные, хранящиеся в сверхсжатом файле. Впоследствии уровни сверхсжатия можно будет характеризовать числами, не равными единице.

В работе [1] был описан способ получения сверхсжатия, для использования которого требуется вычислительная мощь суперкомпьютера. В этой статье описан способ сверхсжатия, который можно проверить применительно к одному байту, на любом компьютере. И который не потребует знаний математического аппарата [1], так как в качестве его основной программы используется любой коммерческий компрессор, позволяющий сжимать и распаковывать без потерь файлы, и следящий за целостностью сжатой информации.

Возможность сжатия данных «в точку» в предлагаемом способе сверхсжатия данных исключается по двум причинам. Во-первых, из-за степенного роста требуемых вычислительных ресурсов и времени обработки данных, при увеличении степени сверхсжатия данных время обработки становится неприемлемо большим. Во-вторых, сверхсжатие данных в точку невозможно из-за невозможности выкинуть служебные данные компрессора. Так как целостность служебных данных компрессора обеспечивает возможность комбинаторного восстановления сверхсжатой информации. Исчезновение раздела со служебными данными компрессора (описание существовавшего ранее целостного объекта) приведёт к невозможности произвести комбинаторную разархивацию. Основная часть

Процедура получения сверхсжатых данных. Сверхсжатие данных было получено для фотографии, рис. 1. Размер исходного файла фотографии 1 211 380 байт. Фотография дополнительно была сжата архиватором. Её размер после сжатия стал 1 180 772 байта. После сжатия архиватором файл стал «не сжимаемым на один» файлом (единичный уровень Колмогоровской сложности), который не мог быть далее сжат ранее известными способами.

Из этого файла был удалён один байт, сотый от начала файла. Номер удаляемого байта (сто) не был обоснован никакими соображениями, кроме его красивости. Содержимое выброшенного байта нигде не было сохранено. Размер сжатого файл стал равным 1 180 771 байт - на «ритуальный» один байт меньше, чем размер абсолютно не сжимаемого файла (1 180 772 байта). Поскольку этот файл (1 180 771 байта) можно разархивировать в первоначальном виде, то этот файл не является испорченным архивом (архивом с повреждёнными данными), а является файлом со сверхсжатыми данными.

Процедура восстановления данных из сверхсжатого файла. Ассистент перенёс сверхсжатые данные на свой компьютер. После чего на компьютере ассистента было создано 256 файлов (28). В каждом из 256 файлов в сотую байтовую позицию был вставлен один байт. Теперь размер каждого из 256 файлов снова стал равным 1 180 772 байта. Содержимого одного файла от другого отличалось содержимым вставленного по адресу 100 байта. Каждый вставленный байт отличался от предшествующего вставленного байта на единицу. Значения вставленных 256 байтов: 0, 1, 2, … 255.

Ассистент поочерёдно при помощи разархиватора пытался разархивировать каждый из 256 файлов. В 255 случаях процесс разархивации не запускался, и выдавалось сообщение об ошибке архивных данных. Никаких разархивированных файлов не возникло.

В одном случае (из 256) процесс разархивации был произведён штатно, без сообщения об ошибке и с образованием разархивированного файла. Для данной конкретной фотографии это произошло при значении вставленного байта, равному 66. Файлы, содержащие байты с числами не равными 66, не смогли разархивироваться.

Таким образом, из файла со сверхсжатыми данными (1 180 771 байта) был получен файл с абсолютно не сжимаемыми данными (1 180 772 байта), из которого было восстановлено исходное изображение, рис. 1.

Рис. 1

Обсуждение

«Поисковый алгоритм» проявляет себя в рассмотренном выше восстановлении данных картинки на этапе разархивации. Поиск заключается в обнаружении такого числа в вставляемом в файл байте, при котором обсчёт параметров данных в файле совпадёт с прежнем обсчётом этих параметров. Прежний обсчёт хранится как часть «не сжимаемого на один» файла.

Можно выделить два типа «не сжимаемых на один» файлов: файлы с сжатой информацией и файлы, образованные из случайных бинарных событий (не несущих ни какой информации). При попытке сжатия достаточно длинных случайных бинарных файлов (данных), архиватор увеличивает размер «сжатого» файла, добавляя к ним свою информацию, и вместо уменьшения размера файла получается, наоборот, рост его длины. Поэтому для получения сверхсжатого файла случайных бинарных данных необходимо выбросить при сверхсжатии участок файла, длина которого превысит длину добавленной архиватором информации. Очевидно, что декомпрессия сверхсжатого файла случайных бинарных данных методом комбинаторного перебора потребует значительных аппаратных и временных ресурсов. сжатие байт разархивация данный

В статье был продемонстрирован способ получения сверхсжатых данных и процедура комбинаторной разархивации (восстановления) сверхсжатых данных до состояния «несжимаемых далее данных».

Сверхсжатие достигается путём прямого уничтожения части информации. Восстановление уничтоженной информации производится путём включёний вновь придумываемой информации в имеющуюся информацию (объединение информации) и сравнения объединённой информации с описанием, каким была информация до потери своей части.

Восстановление осмысленных данных (например, изображения) отличается от восстановления бессмысленных данных полученных при генерации случайных бинарных событий тем, что применение компрессора к изображению уменьшает размер итогового файла с картинкой, а применение компрессора к достаточно большому файлу со случайными бинарными данными создаёт итоговый файл ещё большего размера.

Литература

1. Филатов О. В. статья «Описание распределения составных событий и их мизесовских частот через число возможных исходов. Механизм сжатия некоторых «не сжимаемых на один» последовательностей. «Проблемы современной науки и образования», № 9 (39), 2015 г.

Аннотация

Сжатие на один байт «не сжимаемых данных» с помощью поискового алгоритма, который путём перебора всех возможных значений и их сравнения с описанием несжатых данных восстанавливает утраченные при сжатии данные.

Ключевые слова: сверхсжатие, сверхсжатые данные, уровень Колмогоровской сложности.

Compression by one byte «incompressible data» by using the search algorithm which by trying all possible values and comparing them with a description of uncompressed data restores data lost during compression.

Keywords: supercompression, super compressed data, the level of Kolmogorov complexity.

Размещено на Allbest.ru

...

Подобные документы

  • Особенности кодирования информации с помощью метода Хаффмана. Реализация кодера и декодера с использованием статического алгоритма Хаффмана. Структура программы, оценка ее эффективности (степени сжатия) в зависимости от типа и размера сжимаемых файлов.

    курсовая работа [136,2 K], добавлен 15.06.2013

  • Составление методического пособия пользователя для восстановления утраченной информации своими силами. Способы простого автоматического восстановления с помощью специализированных утилит и ручное восстановление памяти при помощи использования редакторов.

    дипломная работа [7,0 M], добавлен 27.04.2010

  • Разработка приложения для шифрования данных с помощью алгоритма DES5: процесс шифрования, расшифрования, получение ключей. Спецификация программы, процедуры и функции; описание интерфейса пользователя. Реализация задачи в среде программирования DELPHI.

    курсовая работа [812,6 K], добавлен 27.03.2012

  • Цели восстановления данных. Обеспечение отказоустойчивости, предупреждение неисправностей в работе. Параметры, необходимые для планирования сроков восстановительных работ. Создание устройства резервного копирования баз данных с помощью Transact-SQL.

    презентация [247,6 K], добавлен 10.11.2013

  • Программный способ восстановления данных без физического вмешательства в устройство накопителя, а также в функционирование микропрограммы и структуру модулей служебной информации. Восстановление структуры файловой системы или ее удаленных данных.

    презентация [67,5 K], добавлен 20.11.2016

  • Представление данных в памяти компьютера. Обобщенные структуры и модели данных. Методы доступа к информации. Физическая организация системы управления базами данных, структура сервера. Архитектура "клиент-сервер". Создание базы данных с помощью "Денвер".

    курсовая работа [770,3 K], добавлен 17.11.2014

  • Причины "исчезновения" информации с жестких дисков и карт памяти. Принцип работы и обзор программ восстановления данных, восстановление данных с поцарапанных CD и DVD. Архивирование важных данных как лучший метод предупреждения потери информации.

    курсовая работа [2,2 M], добавлен 27.12.2010

  • Особенности и преимущества Microsoft Office Access как системы управления базами данных реляционного типа. Процесс создания новой таблицы с помощью конструктора, построение схемы данных, создание запроса с помощью языка SQL, вывод информации в отчёте.

    контрольная работа [199,2 K], добавлен 15.12.2014

  • Программа на языке Turbo Pascal для шифрования данных с помощью шифра Тритемиуса. Входные, выходные данные. Схема алгоритма и текст программы. Порядок ввода исходных данных и описание получаемых результатов. Тестовых задания и анализ их функционирования.

    курсовая работа [4,0 M], добавлен 06.01.2011

  • Способ улучшения сжатия файлов формата DjVu. Общая схема алгоритма классификации букв. Основной алгоритм сравнения пары букв. Быстрый отказ для пары разных букв. Дерево разрезов. Получение монохромных изображений. Алгоритм для устранения мусора.

    курсовая работа [64,7 K], добавлен 28.10.2008

  • Формы представляемой информации. Основные типы используемой модели данных. Уровни информационных процессов. Поиск информации и поиск данных. Сетевое хранилище данных. Проблемы разработки и сопровождения хранилищ данных. Технологии обработки данных.

    лекция [15,5 K], добавлен 19.08.2013

  • Приобретение практических навыков по определению объема памяти, отводимого на внешнем запоминающем устройстве под файл данных. Расчет производительности поиска информации, хранящейся в файле на ВЗУ. Вычисление использованных кластеров и байт памяти.

    лабораторная работа [31,2 K], добавлен 26.11.2011

  • Реляционная модель базы данных в текстовом виде. Код, с помощью которого были созданы и заполнены таблицы. Разработка схемы базы данных справочника селекционера. Создание запросов, их основные виды. Процедуры на выбор данных, добавление и удаление.

    методичка [1,1 M], добавлен 20.05.2014

  • Проект реляционной базы данных, ее нормализация. Поиск данных с помощью фильтра и запросов. Пример создания и работы с БД "Музыкальный каталог" (Музыка.accdb). Установление связей с помощью одноименных полей, являющихся в главной таблице первичным ключом.

    методичка [1,7 M], добавлен 25.04.2015

  • Анализ некоторых причин повреждения баз данных. Основные возможности восстановления баз данных на примере SQL Server 2005. Специфика этапа подготовки к восстановлению и его проведение. Общая характеристика специальных ситуаций восстановления информации.

    курсовая работа [40,3 K], добавлен 11.11.2010

  • Теоретические сведения и основные понятия баз данных. Системы управления базами данных: состав, структура, безопасность, режимы работы, объекты. Работа с базами данных в OpenOffice.Org BASE: создание таблиц, связей, запросов с помощью мастера запросов.

    курсовая работа [3,2 M], добавлен 28.04.2011

  • Основные понятия базы данных. Разработка сложной формы для обработки данных. Модели организации данных. Архитектура Microsoft Access. Реляционные связи между таблицами баз данных. Проектирование базы данных. Модификация данных с помощью запросов действий.

    лабораторная работа [345,5 K], добавлен 20.12.2011

  • Создание таблиц базы данных с помощью MS Access "Страны Азии". Форма базы данных и запросы к выборкам данных. Модификация структуры таблиц, создания связей между главными таблицами, редактирование данных и проектирование форм для реальной базы данных.

    контрольная работа [723,9 K], добавлен 25.11.2012

  • Разработка программы шифрования данных с использованием алгоритма DES. Структура алгоритма, режимы его работы. Электронный шифровальный блокнот. Цепочка цифровых блокнотов. Цифровая и внешняя обратная связь. Структура окна: функции основных кнопок.

    лабораторная работа [830,3 K], добавлен 28.04.2014

  • Анализ различных способов хранения информации: одномерный массив, типизированный файл и динамический список. Сортировка только положительных чисел. Словесное описание алгоритма. Блок-схема процедуры обработки данных с помощью одномерного массива.

    контрольная работа [319,7 K], добавлен 29.05.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.