Архивация данных

Анализ способов архивации данных и средств ее осуществления. Существующие алгоритмы сжатия информации. Сравнение программ-архиваторов для операционной системы Windows. Подробное рассмотрение одной из самых популярных программ-архиваторов - WinRAR.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 23.06.2013
Размер файла 1,2 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

Размещено на http://www.allbest.ru

Министерство образования Российской Федерации

ФГАОУ ВПО «УрФУ имени первого Президента России Б.Н. Ельцина»

Институт военно-технического образования и безопасности

Кафедра защиты в чрезвычайных ситуациях

Курсовая работа по информатике на тему:

Архивация данных

Научный руководитель Суханова Н.Г.

Студент Томашова Л.А.

Екатеринбург

2013

Введение

Мы живем в веке информационных технологий, где важную роль играет информация. С каждым годом, объем информации увеличивается, так как мир стремится к открытиям и нововведениям. В нашем веке компьютерных технологий информация занимает огромные объемы памяти. Решением проблемы экономии памяти на носителях является архивация данных, то есть различные способы передачи и хранения информации в сжатом виде.

Целью данной курсовой работы является изучение архивации данных и средств ее осуществления.

Задачи:

познакомиться с такими понятиями как «архивация данных», «архиватор»;

изучить существующие алгоритмы сжатия информации;

познакомиться с программами-архиваторами для Windows;

подробно рассмотреть одну из самых популярных программ-архиваторов WinRAR.

В данной работе будут приведены ответы на такие вопросы как:

«Что такое архивация?», «Какие существуют программы-архиваторы?» - и приведу пример способов архивации.

Перед началом работы необходимо ознакомиться с печатными и электронными источниками, которые могут помочь ответить на заданные вопросы.

В ходе написания данной курсовой работы используются знания, приобретенные на занятиях информатики, по использованию программ пакета Microsoft Office.

С помощью программы Microsoft Word можно создавать, редактировать, форматировать, сохранять и распечатывать документы. Текстовый процессор Microsoft Word имеет широкий спектр возможностей по созданию документов (вставка списков и таблиц, средства проверки орфографии, сохранение, исправление и др.)

Архивация. Электронный архив

Если до создания ЭВМ использовали информацию, написанную вручную или на печатном станке, то в современном мире, где практически у каждого есть персональный компьютер, неудивительно, что все большую популярность набирают электронные архивы.

Электронный архив представляет собой информационную систему, которая предоставляет многопользовательский доступ к электронным документам. Электронный архив призван выполнять следующие функции:

создание каталога документов с определенной иерархией;

распределение информации по типу документов;

хранение документов в электронном виде;

обеспечение пользователям доступа к документам;

просмотр и работа с электронными копиями;

поиск документа как по каталогу, так и по заданным параметрам;

резервное копирование документа;

печать документов;

администрирование системы (регистрация новых пользователей, контроль за работой, наделение правами доступа и т.д.).

Электронный архив и электронный документооборот - не взаимозаменяемые понятия, скорее, они служат в качестве дополнения друг друга. Функции, которые выполняют эти системы, можно сравнить с функциями бумажного архива и документооборота. Данные системы имеют одно основное отличие: архив используется для хранения и поиска информации, менять которую не нужно. Поэтому можно выделить следующие отличия хранения информации в электронном архиве от документооборота:

пользователи имеют доступ к информации, но не могут ее менять;

все документы находятся на центральном сервере, а пользователям для работы предоставляются электронные копии;

пристальное внимание уделяется резервированию и защите информации.

Создавать электронный архив документов следует по следующим причинам:

Удобство. С электронной копией документа намного проще работать: ее легко печатать, пересылать, копировать, а также использовать информацию из нее в других документах.

Простота поиска. В электронном архиве документов намного проще и быстрее найти нужную информацию.

Сохранность. В электронном архиве пользователь работает с копией документа, а потому в отличие от бумажного архива не имеет возможности повредить или утерять оригинал. Кроме того, бумага со временем изнашивается, чего нельзя сказать об электронной копии.

Доступное резервирование. Электронный архив документов дает 100%-ную гарантию, что в чрезвычайных ситуациях вся ваша информация останется в целости и сохранности. Резервирование электронного архива занимает немного времени и обходится намного дешевле, чем резервирование бумажных документов.

Экономия времени. Пользователю не нужно тратить время, чтобы идти на склад и долго искать определенный каталог и информацию в нем. В электронном архиве нужный документ можно найти за считанные минуты. Документы не вывозятся из их обычного места хранения, работы по скоростному сканированию производятся в непосредственной близости с архивным хранилищем заказчика. Изъятия документов из архива не происходит - документ лишь ненадолго покидает архивные полки.

Экономия денежных средств. Проведение массового сканирования документов архива силами специализированной внешней организации значительно дешевле (особенно для больших архивов) за счет исключения затрат на приобретение мощных сканеров и систем ввода, обучение персонала, выделение и оснащение рабочих помещений. Модель «заказчик-исполнитель» оптимальна в терминах цена/качество. На произведенный массив дается гарантия качества сканирования и точности индексации документов.

Все эти преимущества делают создание электронного архива документов все более популярной услугой.

архивация сжатие информация

Архивация данных

С развитием электронных архивов стала актуальна проблема экономичного хранения информации. В связи с этим большую популярность приобрела архивация данных.

Архивация -- это подготовительная обработка (сбор, классификация, каталогизация, сжатие) данных для долгосрочного хранения или передачи их по сети.

Архивация файлов -- перекодирование данных с целью уменьшения их объёма без значительных информационных потерь.

Архивация чаще всего проводится, когда необходимо создать резервные копии наиболее ценных файлов, освободить место на диске или же передать файлы по электронной почте.

Электронное архивирование -- запись информации в электронном виде для долговременного хранения. Часто его путают с созданием резервных копий данных.

(Резервное копирование (англ. backup) -- процесс создания копии данных на носителе (жёстком диске, дискете и т. д.), предназначенном для восстановления данных в оригинальном или новом месте их расположения в случае их повреждения или разрушения.)

Архивный файл представляет собой набор из одного или нескольких файлов, помещенных в сжатом виде в единый файл, из которого их можно при необходимости извлечь в первоначальном виде. Архивный файл содержит оглавление, позволяющее узнать, какие файлы содержатся в архиве.

В оглавлении архива для каждого содержащегося в нем файла хранится следующая информация:

имя файла;

размер файла на диске и в архиве;

сведения о местонахождении файла на диске;

дата и время последней модификации файла;

код циклического контроля для файла, используемый для проверки целостности архива;

степень сжатия.

Любой из архивов имеет свою шкалу степени сжатия. Чаще всего можно встретить следующую градацию методов сжатия:

без сжатия (соответствует обычному копированию файлов в архив без сжатия);

скоростной;

быстрый (характеризуется самым быстрым, но наименее плотным сжатием);

обычный;

хороший;

максимальный (максимально возможное сжатие является одновременно и самым медленным методом сжатия).

Степень сжатия зависит от:

используемого архиватора;

метода сжатия;

типа исходного файла.

Степень сжатия характеризуется коэффициентом сжатия:

, (1)

где Kc - коэффициент сжатия;

Vc - объем сжатого файла;

Vи - объем исходного файла.

Файлы различных типов сжимаются по-разному. Например, коэффициент сжатия текстовых документов значительно выше, чем графических. Лучше всего архивируются графические файлы в формате.bmp, документы MS Office и Web-страницы.

Если k = 1, то алгоритм не производит сжатия, то есть выходное сообщение оказывается по объёму равным входному.

Если k < 1, то алгоритм порождает сообщение большего размера, нежели несжатое, то есть, совершает «вредную» работу.

Ситуация с k < 1 вполне возможна при сжатии. Принципиально невозможно получить алгоритм сжатия без потерь, который при любых данных образовывал бы на выходе данные меньшей или равной длины. Обоснование этого факта заключается в том, что, поскольку число различных сообщений длиной n бит составляет ровно 2n, число различных сообщений с длиной меньшей или равной n (при наличии хотя бы одного сообщения меньшей длины) будет меньше 2n. Это значит, что невозможно однозначно сопоставить все исходные сообщения сжатым: либо некоторые исходные сообщения не будут иметь сжатого представления, либо нескольким исходным сообщениям будет соответствовать одно и то же сжатое, а значит, их нельзя отличить. Но даже когда алгоритм сжатия увеличивает размер исходных данных, легко добиться того, чтобы их объём гарантировано не мог увеличиться более чем на 1 бит. То есть сделать так, чтобы даже в самом худшем случае имело место неравенство:

K=So/(So+1)

Делается это следующим образом: если объём сжатых данных меньше объёма исходных, возвращаются сжатые данные путем добавления к ним «1», иначе возвращаем исходные данные, добавив к ним «0». Коэффициент сжатия может быть как постоянным (некоторые алгоритмы сжатия звука, изображения и т. п.), так и переменным. Во втором случае он может быть определён либо для каждого конкретного сообщения, либо оценён по некоторым критериям:

средний (обычно по некоторому тестовому набору данных);

максимальный (случай наилучшего сжатия);

минимальный (случай наихудшего сжатия);

или каким-либо другим. Коэффициент сжатия с потерями при этом сильно зависит от допустимой погрешности сжатия или качества, которое обычно выступает как параметр алгоритма. В общем случае постоянный коэффициент сжатия способны обеспечить только методы сжатия данных с потерями.

Для сжатия файлов используются программы архиваторы.

Архиваторы

В настоящее время большинство из нас часто пользуются всемирной сетью Internet и сталкиваются с информацией, заархивированной различными программами - архиваторами.

Архиватор - это программа, осуществляющая упаковку одного и более файлов в архив или серию архивов для удобства переноса или хранения, а также распаковку архивов. Многие архиваторы используют сжатие без потерь для уменьшения размера архива.

Работа архиваторов заключается в следующем: найти повторяющиеся фрагменты в файлах и записать вместо них информацию о количестве повторяющихся кусков.

Процесс сжатия файлов называется архивированием. Процесс восстановления сжатых файлов - разархивированием.

Иногда необходимость архивации возникает при желании пользователя продублировать информацию как на своем компьютере, так и на дискетах. Архивный файл представляет собой набор из одного или нескольких файлов, помещенных в сжатом виде в единый файл. Для создания архивного файла предназначены специальные программы архивации данных или программы-архиваторы. Часть из этих программ распространяется бесплатно, часть - на коммерческой основе, но основное количество распространяются как условно бесплатные “Shareware”, т.е. они могут быть получены бесплатно на некоторый срок, с дальнейшей выплатой, как правило, небольшой суммы их распространителям. Большинство программ-архиваторов позволяют создавать многотомные архивы различной размерности. Такого рода возможность позволяет переносить с помощью дискет с одного компьютера на другой достаточно большие по размерности программы. Среди наиболее распространенных программ-архиваторов можно назвать ARJ, PKZIP, LHA, PKPAK, PAK, ZIP, RAR, WinZIP и WinRAR.

Современные архиваторы отличаются используемыми алгоритмами, скоростью работы, степенью сжатия.

Простейшие архиваторы просто последовательно объединяют содержимое файлов в архив. Архив должен также содержать информацию об именах и длине оригинальных файлов для их восстановления. Большинство архиваторов также сохраняют метаданные файлов, предоставляемые операционной системой, такие, как время создания и права доступа.

Программа, создавая архив, обрабатывает как текстовые файлы, так и бинарные файлы. Первые всегда сжимаются в несколько раз (в зависимости от архиватора), тогда как сжатие бинарных файлов зависит от их характера. Одни бинарные файлы могут быть сжаты в десятки раз, сжатие же других может и вовсе не уменьшить занимаемый ими объем.

Сжатие данных обычно происходит значительно медленнее, чем обратная операция.

Характеристики архиваторов:

по степени сжатия;

по скорости сжатия.

Характеристики архиваторов - обратно зависимые величины. То есть, чем больше скорость сжатия, тем меньше степень сжатия, и наоборот.

Нахождение для любого входного файла программы наименьшего возможного размера, печатающей этот файл, является алгоритмически неразрешимой задачей, поэтому «идеальный» архиватор невозможен.

Программные и аппаратные средства. Алгоритмы сжатия

Все способы сжатия можно разделить на две категории: обратимое (сжатие без потерь) и необратимое сжатие.

Под необратимым сжатием подразумевают такое преобразование входного потока данных, при котором выходной поток, основанный на определенном формате информации, представляет, с некоторой точки зрения, достаточно похожий по внешним характеристикам, на входной поток объект, однако отличается от него объемом.

Такие подходы и алгоритмы используются для сжатия, например, данных растровых графических файлов с низкой степенью повторяемости байтов в потоке. При таком подходе используется свойство структуры формата графического файла и возможность представить графическую картинку приблизительно схожую по качеству отображения (для восприятия человеческим глазом) несколькими способами. Поэтому, кроме степени или величины сжатия, в таких алгоритмах возникает понятие качества. Т.к. исходное изображение в процессе сжатия изменяется, то под качеством можно понимать степень соответствия исходного и результирующего изображения, оцениваемая субъективно, исходя из формата информации. Для графических файлов такое соответствие определяется визуально, хотя имеются и соответствующие интеллектуальные алгоритмы и программы. Необратимое сжатие невозможно применять в областях, в которых необходимо иметь точное соответствие информационной структуры входного и выходного потоков. Данный подход реализован в популярных форматах представления видео и фото информации, известных как JPEG и JFIF алгоритмы и JPG и JIF форматы файлов.

Обратимое сжатие всегда приводит к снижению объема выходного потока информации без изменения его информативности, т.е. без потери информационной структуры.

Более того, из выходного потока, при помощи восстанавливающего или декомпрессирующего алгоритма, можно получить входной, а процесс восстановления называется декомпрессией или распаковкой и только после процесса распаковки данные пригодны для обработки в соответствии с их внутренним форматом.

Сжатие без потерь

Сжатие способом кодирования серий (RLE)

Наиболее известный простой подход и алгоритм сжатия информации обратимым путем - это кодирование серий последовательностей (Run Length Encoding - RLE).

Суть методов данного подхода состоит в замене цепочек или серий повторяющихся байтов или их последовательностей на один кодирующий байт и счетчик числа их повторений.

Например:

44 44 44 11 11 11 11 11 01 33 FF 22 22 - исходная последовательность

03 44 05 11 01 01 01 33 01 FF 02 22 - сжатая последовательность

Первый байт указывает сколько раз нужно повторить следующий байт

Если первый байт равен 00, то затем идет счетчик, показывающий, сколько за ним следует неповторяющихся данных.

Данные методы, как правило, достаточно эффективны для сжатия растровых графических изображений (BMP, PCX, TIF, GIF), т.к. последние содержат достаточно много длинных серий повторяющихся последовательностей байтов.

Недостатком метода RLE является достаточно низкая степень сжатия.

Алгоритм Хаффмана

Сжимая файл по алгоритму Хаффмана первое, что мы должны сделать - прочитать файл полностью и подсчитать, сколько раз встречается каждый символ из расширенного набора ASCII.

Если мы будем учитывать все 256 символов, то для нас не будет разницы в сжатии текстового и EXE файла.

После подсчета частоты вхождения каждого символа, необходимо просмотреть таблицу кодов ASCII и сформировать бинарное дерево.

Арифметическое кодирование

Арифметическое кодирование является методом, позволяющим упаковывать символы входного алфавита без потерь при условии, что известно распределение частот этих символов, и оно является наиболее оптимальным, т.к. достигается теоретическая граница степени сжатия.

Предполагаемая требуемая последовательность символов при сжатии методом арифметического кодирования рассматривается как некоторая двоичная дробь из интервала [0, 1). Результат сжатия представляется как последовательность двоичных цифр из записи этой дроби.

Идея метода состоит в следующем: исходный текст рассматривается как запись этой дроби, где каждый входной символ является "цифрой" с весом, пропорциональным вероятности его появления. Этим объясняется интервал, соответствующий минимальной и максимальной вероятностям появления символа в потоке.

Алгоритм декодирования работает аналогично кодирующему. На входе и идет разбиение интервала.

Продолжая этот процесс, мы однозначно декодируем все символы. Для того, чтобы декодирующий алгоритм мог определить конец цепочки, мы можем либо передавать ее длину отдельно, либо добавить к алфавиту дополнительный уникальный символ - "конец цепочки".

Алгоритм Лемпеля-Зива-Велча (Lempel-Ziv-Welch - LZW)

Данный алгоритм отличают высокая скорость работы как при упаковке, так и при распаковке, достаточно скромные требования к памяти и простая аппаратная реализация.

Предположим, что у нас имеется словарь, хранящий строки текста и содержащий порядка от 2-х до 8-ми тысяч пронумерованных гнезд. Запишем в первые 256 гнезд строки, состоящие из одного символа, номер которого равен номеру гнезда.

Алгоритм просматривает входной поток, разбивая его на подстроки и добавляя новые гнезда в конец словаря. Прочитаем несколько символов в строку s и найдем в словаре строку t - самый длинный префикс s.

Пусть он найден в гнезде с номером n. Выведем число n в выходной поток, переместим указатель входного потока на length(t) символов вперед и добавим в словарь новое гнездо, содержащее строку t+c, где с - очередной символ на входе (сразу после t). Алгоритм преобразует поток символов на входе в поток индексов ячеек словаря на выходе.

При практической реализации этого алгоритма следует учесть, что любое гнездо словаря, кроме самых первых, содержащих цепочки с одним символом, хранит копию некоторого другого гнезда, к которой в конец приписан один символ. Вследствие этого можно обойтись простой списочной структурой с одной связью.

Недостаток: низкая степень сжатия по сравнению со схемой двухступенчатого кодирования.

Двухступенчатое кодирование. Алгоритм Лемпеля-Зива

Гораздо большей степени сжатия можно добиться при выделении из входного потока повторяющихся цепочек - блоков, и кодирования ссылок на эти цепочки с построением хеш-таблиц от первого до n-го уровня.

Метод, о котором и пойдет речь, принадлежит Лемпелю и Зиву и обычно называется LZ-compression.

Суть его состоит в следующем: упаковщик постоянно хранит некоторое количество последних обработанных символов в буфере. По мере обработки входного потока, вновь поступившие символы попадают в конец буфера, сдвигая предшествующие символы и вытесняя самые старые.

Размеры этого буфера, называемого также скользящим словарем (sliding dictionary), варьируются в разных реализациях кодирующих систем.

Экспериментальным путем установлено, что программа LHarc использует 4-килобайтный буфер, LHA и PKZIP - 8-ми, а ARJ - 16-килобайтный.

Затем, после построения хеш-таблиц алгоритм выделяет (путем поиска в словаре) самую длинную начальную подстроку входного потока, совпадающую с одной из подстрок в словаре, и выдает на выход пару (length, distance), где length - длина найденной в словаре подстроки, а distance - расстояние от нее до входной подстроки (то есть фактически индекс подстроки в буфере, вычтенный из его размера).

В случае, если такая подстрока не найдена, в выходной поток просто копируется очередной символ входного потока.

В первоначальной версии алгоритма предлагалось использовать простейший поиск по всему словарю. Однако в дальнейшем, было предложено использовать двоичное дерево и хеширование для быстрого поиска в словаре, что позволило на порядок поднять скорость работы алгоритма.

Таким образом, алгоритм Лемпеля-Зива преобразует один поток исходных символов в два параллельных потока длин и индексов в таблице (length + distance).

Очевидно, что эти потоки являются потоками символов с двумя новыми алфавитами, и к ним можно применить один из упоминавшихся выше методов (RLE, кодирование Хаффмана или арифметическое кодирование).

Так мы приходим к схеме двухступенчатого кодирования - наиболее эффективной из практически используемых в настоящее время. При реализации этого метода необходимо добиться согласованного вывода обоих потоков в один файл. Эта проблема обычно решается путем поочередной записи кодов символов из обоих потоков.

Перечень программ сжатия с кратким указанием алгоритмов их работы

PKPAK 3.61:

Метод Packed - алгоритм RLE.

Метод Crunched - алгоритм LZW.

Метод Squashed - двухпроходное статическое кодирование Хаффмана.

PKZIP 1.10:

Метод Shrinked - модифицированный алгоритм LZW с частичной очисткой словаря и переменной длиной кода.

Метод Imploded - модифицированный алгоритм Лемпеля-Зива и статическое кодирование Хаффмана.

LHArc:

Алгоритм Лемпеля-Зива и динамическое кодирование Хаффмана.

LHA:

Алгоритм Лемпеля-Зива и статическое кодирование Хаффмана.

ARJ:

Алгоритм Лемпеля-Зива и оригинальный метод кодирования.

Алгоритмы сжатия с потерями. Сжатие графики

Растровые изображения представляют собой двумерный массив чисел - пикселей, а изображения можно подразделить на две группы: с палитрой и без нее. У первых в пикселе хранится число - индекс в некотором одномерном векторе цветов, называемом палитрой (из 16 и 256 цветов).

Изображения без палитры бывают в какой-либо системе цветопредставления и в градациях серого. При использовании некой системы цветопредставления каждый пиксель является структурой, полями которой являются компоненты цвета (например, RGB и CMYK).

На заре компьютерной эры для сжатия графики применялись традиционные алгоритмы, рассмотренные выше. С появлением новых типов изображений эти алгоритмы утратили эффективность. Многие изображения практически не сжимались, хотя обладали явной избыточностью. Тогда и появились алгоритмы с потерей информации. Как правило, в них можно задавать коэффициент сжатия.

Алгоритмы сжатия с потерями не рекомендуется использовать при сжатии изображений, которые затем будут предназначены для печати с высоким качеством или для обработки с помощью ПО распознавания образов.

Фрактальное сжатие

Так называемые фрактальные алгоритмы обеспечивают степень сжатия изображения до 1:2000 (формат FIF). Кроме того, при разархивации изображение можно масштабировать. Уникальность этих алгоритмов в том, что изображение не дробится на квадраты и учитывается не близость цветов в локальной области, а подобие разных по размеру областей изображения.

Фрактальные алгоритмы ориентированы на полноцветные изображения и изображения в градациях серого. Они требуют огромных вычислительных мощностей при архивации, зато распаковка менее ресурсоемка, чем JPEG.

За годы с момента возникновения первой программы данного типа написаны сотни различных архиваторов, поддерживающих различные форматы архивов. На сегодняшний день самые распространенные:

ZIP-формат был разработан PKWARE;

RAR-формат был разработан Евгением Рошалем, автором одноименного архиватора, благодаря удобному интерфейсу архиватора одновременно с хорошим сжатием завоевал популярность.

Программы-архиваторы для Windows

Программа-архиватор WinZip

WinZip, наверное, самый популярный архиватор, имеет встроенную поддержку разархивирования.CAB-файлов и файлов популярных "интернет-форматов", таких как TAR, GZip, UUencode, BinHex и MIME. Разархивирование файлов ARJ, LZH и ARC поддерживается через соответствующие архиваторы. WinZip прост и удобен в работе, имеет интуитивно понятный интерфейс, позволяющий даже начинающим пользователям работать с ним без подготовки. К программе можно подключить внешнюю антивирусную программу для проверки файлов архивов на вирусы. Архиватор может работать в двух стилях: Wizard (мастер, помощник) и Classic (стандартный, классический). Стиль Wizard для тех, кто еще не освоился с архиватором или любит работать пошагово, отвечая на соответствующие вопросы программы.

Поддержка перетаскивания файлов в/из архива, а также интеграция с проводником, делают WinZip очень удобным в работе архиватором. По нажатию правой кнопки мыши в проводнике вызывается контекстно-зависимое меню, настраиваемое в опциях. Пункты меню позволяют добавить файлы в архив, создать новый архив, разархивировать файлы из архива, создать самораспаковывающийся архив, заархивировать файлы и отправить по электронной почте, используя установленный по умолчанию почтовый клиент.

Если файл, на котором нажимают кнопку, является ZIP-архивом, то меню в проводнике будет выглядеть так:

Рис.1

По умолчанию WinZip ассоциирует себя со следующими расширениями файлов:

Рис.2

WinZip поддерживает создание многотомных архивов.

Последняя версия: WinZip 17.0 (Build 10381) - 6 февраля 2013 года.

Программа-архиватор WinRAR

Наверное, второй по популярности архиватор после WinZip, а в России наверняка даже его опережает. По этой причине рассмотрим его отдельно (см. раздел 2.4.).

Последняя версия: 4.20 (14 июня 2012).

Бета-версия: 5.0 beta 4 (20 мая 2013 года).

Программа-архиватор PowerArchiver 2001

PowerArchiver 2001 имеет встроенную поддержку создания/извлечения множества различных типов архивов, в том числе ZIP, 7z и Tar. Кроме того, в нём есть возможность извлечения архивов RAR, ACE и многих других.

Основные функции:

создание и монтирование ISO файлов;

окно предварительного просмотра содержимого архива;

запись CD/DVD/Blu-ray;

полная поддержка Windows 7;

встроенный FTP клиент;

передовой модуль архивирования;

расширенный планировщик заданий;

сжатие 7-Zip;

быстрое извлечение RAR архивов;

обратная совместимость со старыми форматами архивов.

Интеграция в проводник с настраиваемым меню:

Рис.3

На архивных файлах всплывающее по нажатию правой кнопки мыши меню выглядит следующим образом:

Рис.4

А такой вид оно имеет при нажатии и выделении на файлах других форматов:

Рис.5

Последняя версия PowerArchiver 2001: 13.03.01 (22 января 2013).

Программа-архиватор WinAce

WinAce - архиватор файлов для Windows, включающий собственный формат «ACE» и имеющий поддержку других широко распространенных форматов архивов, таких как ZIP, RAR и MS-CAB.

Интеграция с проводником: наличие всплывающих контекстных меню по нажатию правой кнопки мыши и дополнительная закладка при просмотре свойств файлов (только для архивов ACE и ZIP):

Рис.6

Рис.7

На данный момент последней является версия WinAce 2.69 (23.11.2007).

Программа-архиватор 7-Zip

7-Zip - это сравнительно малоизвестный архиватор, обеспечивающий довольно высокую степень сжатия для формата ZIP и имеющий также свой формат 7z с высокой степенью сжатия. Ко всему прочему, 7-Zip является бесплатным. Поддерживает несколько алгоритмов сжатия и множество форматов данных, включая собственный формат 7z c высокоэффективным алгоритмом сжатия LZMA. Программа разрабатывается с 1999 года. Основной платформой является Windows (в том числе Windows CE), где доступны две версии программы: с графическим интерфейсом и версия для командной строки. Консольная версия была портирована сообществом разработчиков для систем стандарта POSIX под общим названием p7zip.

7-Zip является победителем SourceForge.net Community Choice Awards2007 года в категориях «Лучший проект» и «Лучший технический дизайн».

Интегрируется в проводник, добавляя простое меню из трех пунктов:

Рис.8

Рис.9

Последняя версия - 7-Zip 9.30 alpha (26 октября 2012 года).

Дополнительные возможности архиваторов

Кроме файла специального типа в большинстве современных архиваторов создается и саморазворачивающийся архив в виде EXE-файла, запуск которого приводит к распаковке архива. Для оформления такого архива в WinZIP 2.6 требуется выбрать "Make.EXE file" в меню "Actions". Применение саморазворачивающегося архива упрощает работу. Но если к вам попал EXE-файл сомнительного происхождения, предположительно саморазворачивающегося архива, и если такой файл на самом деле является программой, зараженной вирусом, то при его запуске могут быть непредсказуемые последствия. Поэтому эти файлы лучше все-таки распаковывать при помощи архиватора. Вообще, из соображений безопасности лучше полностью отказаться от саморазворачивающихся архивов.

Некоторые архиваторы, например, соответствующая утилита, встроенная в Norton Commander, организуют разбивку получающегося архива на несколько файлов с длиной, равной емкости дискеты, что позволяет использовать архиватор для быстрого и удобного резервного копирования. Однако если повредить информацию на одной из дискет, то невозможно будет провести распаковку всего архива. Поэтому с точки зрения надежности лучше создавать для каждой дискеты независимый архив.

Информацию в архиве можно защитить паролем и просмотреть список находящихся в нем файлов, но при этом нельзя будет производить над ними операции. Распаковка защищенного архива возможна только при вводе правильного пароля. При коммерческом распространении программ через Internet защита архива паролем широко используется. Можно бесплатно скачать архивированные файлы программы, но пароль для их распаковки вы получите тогда, когда оплатите покупку программы. По сравнению со специальными утилитами шифрования архиваторы слабо обеспечивают защиту информации от взлома, но вместе с тем в большинстве случаев предоставляемых архиватором возможностей оказывается вполне достаточно.

Современной тенденцией в развитии архиваторов является введение в них дополнительных сервисных возможностей, непосредственно не связанных с процессами сжатия и распаковки информации. Но они автоматизируют операции после работы архиватора. Так, к архиватору можно подключить внешнюю антивирусную программу, и тогда распаковываемые архивы автоматически будут проверяться на наличие вирусов. Некоторые программы электронной почты требуют предварительной специальной обработки присоединяемого файла. Архиватор может автоматически осуществлять такую обработку создаваемого архива.

Программа WinRAR

Архивация данных как таковая возникла в 1991 году под эгидой юной американской компании Nico Mark Computing Inc. Утилита, выпущенная на рынок, имела знакомое всем название Zip. Программа умела упаковывать файлы любых форматов в формат Zip, при этом можно было сжимать как отдельные файлы, так и целые каталоги или их части. Благодаря тому, что утилита появилась одной из первых и к тому же была достаточно удачной разработкой, она завоевала большую популярность. Чуть позже появился целый ряд других архиваторов и проблем у разработчиков.

Примерно в это же время начал свою программистскую карьеру Евгений Рошал - отец архиватора RAR, программы WinRAR и менеджера FAR. Вот что писал Евгений в одном из интервью интернет сообществу: «Идея создать RAR возникла давно, году в 91-ом. Но первая попытка к осязаемому результату не привела. Через год-два я занялся этим опять, и на этот раз более успешно. Первой версией RAR, которую я рискнул отдать нескольким своим знакомым, был RAR 0.1, выпущенный в марте 1993. Потом были версии 0.9, 1.0, 1.1, 1.15, и тому подобные, с вариациями алгоритма сжатия. Но реально RAR пошел в распространение осенью 1993 после выхода версии 1.30.»

И все это буйство программистской мысли крутилось и развивалось под DOSом, пока не пришла эра Windows. А именно в 1995 году Microsoft активно распространяет Windows 95. Новая операционная система привнесла в индустрию как программный, так и аппаратный простор для творчества. Наиболее верно предугадали поведение рынка в компании WinZip Computing Inc. (именно они создали версию Zip-а для Windows) и, конечно же, наш соотечественник, автор версии RAR-а для Windows -- Евгений Рошал. Так в сети уже можно было свободно скачать WinRAR и WinZip. Просуществовали они недолго, но в силу ряда причин достойной конкуренции в мире Windows им так никто и не составил.

WinRAR впоследствии переплюнул всех своих конкурентов. Он полностью стал поддерживать форматы RAR и ZIP, а так же все доступные форматы сжатия и архивации данных, созданные с помощью других программных продуктов (7z, JAR, UUE, GZ, LZH, CAB, ARJ, TAR, ACE, BZ2, ISO, Z).

Рис.10

Для работы с этими архивами не нужны никакие дополнительные программы - у архивов появилось расширение.exe, что привнесло в использование утилиты полную самодостаточность на любой машине. То есть независимо от операционной системы, будь это Windows, DOS, OS/2, Linux, FreeBSD, MacOSX или Pocket PC. WinZip же таким разнообразием похвастаться не может. И это является несомненным плюсом этой программы.

Программа WinRAR является достаточно мощным средством для создания архивных файлов различных форматов. Среди них следует выделить возможность работы с архивами ZIP и RAR. К положительным особенностям этой программы следует отнести удобный пользовательский интерфейс, прозрачность выполнения действий, возможность создания самораспаковывающихся и многотомных архивов.

В программе реализован оригинальный алгоритм компрессии, позволяющий хорошо сжимать файлы, особенно выполняемые, библиотеки и большие текстовые файлы, а также специальный алгоритм для сжатия мультимедиа-файлов.

В программе поддерживается возможность создания непрерывных (solid) архивов, с увеличением степени сжатия на 10-50%, особенно для большого количества файлов; создания многотомных и самораспаковывающихся архивов. WinRAR интегрируется в проводник, при нажатии правой кнопкой мыши на поддерживаемом типе архива возникает контекстное меню:

Рис.11

WinRAR также позволяет защищать архивы от повреждений путем сохранения избыточной информации, закрывать архивы от изменений, архивировать с паролем, а также добавлять в архивы комментарий (с поддержкой ESC-последовательностей ANSI) и запись о создателе (только для зарегистрированных пользователей).

Основные возможности:

создание архивов форматов RAR и ZIP;

распаковка файлов формата ACE, UUE, BZIP2, JAR, ISO, 7z, z, GZ, TAR, LZH, CAB, ARJ;

возможность шифрования архивов с использованием алгоритма AES (Advanced Encryption Standard) с длиной ключа 128 бит (256 бит в версии 5), при этом в качестве ключа шифрования используется хеш пароля с использованием алгоритма SHA-1;

наличие специальных алгоритмов, оптимизированных для текста и графики (для мультимедиа сжатие можно использовать только с форматами RAR);

поддержка технологии перетаскивания (drag & drop);

возможность работы с файлами размером до 8,589 млрд. (примерно 8x109) гигабайт;

создание самораспаковывающихся, непрерывных и многотомных

архивов;

добавление в архивы дополнительной информации для восстановления архива в случае его повреждения, в том числе создание специальных томов восстановления, позволяющих восстановить многотомный архив при повреждении частей с информациейя;

полная поддержка файловой системы NTFS и имён файлов в Юникоде;

поддержка командной строки;

способность осуществлять непрерывное архивирование, что обеспечивает более высокую степень сжатия по сравнению с обычными методами сжатия, особенно при упаковке большого количества небольших файлов однотипного содержания;

обеспечение поддержки многотомных архивов, то есть осуществление разбивки архива на несколько томов (например, для записи большого архива на диски), при самораспаковывающемся архиве первый том имеет расширение EXE;

обеспечение восстановления физически поврежденных архивов;

предназначенный для новичков режим Мастер (Wizard), с помощью которого можно легко осуществить все операции над архивами.

WinRAR имеет и другие дополнительные функции. WinRAR способен создать архив в двух различных форматах: RAR и ZIP.

Формат RAR превосходит ZIP, ARJ и LZH по эффективности сжатия, однако в наибольшей степени преимущество этой технологии проявляется в случае “непрерывных” архивов, которые не допускают внесение изменений и обрабатываются довольно медленно.

Существует две версии RAR для Windows:

версия с графическим пользовательским интерфейсом - WinRAR.EXE;

консольная версия RAR.EXE, пульт линии команды (способ текста) версия - Rar.exe

Окно архиватора напоминает системную утилиту “Мой компьютер”, архивы выглядят и ведут себя подобно обычным папкам. Пополнять архивы и извлекать из них объекты можно с помощью перетаскивания. Для просмотра упакованных файлов в программе имеется встроенный модуль визуализации, но можно подключать и внешнюю утилиту просмотра. Программа снабжена весьма обстоятельной справочной системой.

Утилита Е. Рошаля компактна, удобна, в достаточной мере универсальна, ее цена не такая привлекательная, как у WinZip, но меньше, чем у других, например, ZIP Explorer Pro и Zip Magic, так что для многих WinRAR может стать наилучшим выбором.

Заключение

Мир не стоит на месте, появляются новые программы для архивации, совершенствуются старые. Алгоритмы сжатия информации активно улучшаются, и современные архиваторы позволяют сжимать данные гораздо более эффективно, чем их предшественники. Однако наиболее продвинутые, с точки зрения сжатия информации, программы не всегда являются и самыми многофункциональными, а значит и наиболее распространенными.

Выбирая архиватор, не стоит руководствоваться только скоростью работы и обеспечиваемым коэффициентом сжатия. Необходимо, чтобы он обладал развитым и удобным оконным интерфейсом и располагал большим количеством дополнительных возможностей. Немаловажно при выборе архиватора учитывать распространенность и возможную дальнейшую поддержку авторами новых версий.

В данной курсовой была достигнута главная цель - изучение архивации данных и средств ее осуществления - путем последовательного решения приведенных в начале работы задач. Были рассмотрены такие понятия, как «архивация данных», «архиватор», алгоритмы сжатия информации, а так же приведен перечень программ-архиваторов, один из которых был отдельно проанализирован.

Так же во время работы над курсовой работой активно использовались знания, полученные на уроках информатики, по использованию программы Microsoft Office.

Список используемой литературы

1. Ватолин Д., Ратушняк А., Смирнов М., Юкин В. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео. -- М.: ДИАЛОГ-МИФИ, 2002. -- 384 с. -- ISBN 5-86404-170-Х

2. Воловник А. «Знакомьтесь, информационные технологии». СПб. БХВ-Петербург. 2006г.

3. Поваляев. Е. «Архиваторы». КомпьютерПресс №2 2007г.

4. Сеннов А. «Курс практической работы на ПК» СПб. БХВ-Петербург. 2005г.

Приложение I

Таблица1. Сравнение функциональных возможностей архиваторов

Формат, функция

WinZIP 8.1

WinRAR 2.90

PowerArchiver 2001 7.02.08

WinAce Archiver 2.04

7-Zip 2.30 Beta 12

ZIP

Полная

Полная

Полная

Полная

Полная

RAR

Нет

Полная

Распаковка

Распаковка

Распаковка

ACE

Нет

Распаковка

Распаковка

Полная

Нет

Другие

XXe, BinHex, MIME

-

XXE

-

7z

Поддержка многотомных архивов

ZIP

RAR

ZIP

ACE, ZIP, CAB

Нет

Поддержка создания Solid архивов

Нет

RAR

Нет

ACE

7z

Встроенная

Windows

Windows и DOS

Windows

Windows и DOS

Windows

Поддержка внешнего антивируса

Да

Нет

Да

Да

Нет

Поддержка работы в командной строке

через WinZip Command Line Support Add-On

Полная

Основные операции. Полная - через Power Archiver Command Line Support Add-On

Полная

Полная

Поддержка комментариев в архивах

ASCII для ZIP

ASCII и ANSI для RAR и ZIP

ASCII для ZIP

ASCII, ANSI и HTML

Нет

Размещено на Allbest.ru

...

Подобные документы

  • Общее понятие архивации и архивного файла. Описание и характеристика архиваторов MS DOS, ARJ,RAR, Windows, WinRAR, WinZip. Сравнительный анализ программ-архиваторов Windows и экономическая оценка их использования. Охрана труда при работе с компьютером.

    дипломная работа [1,6 M], добавлен 27.07.2010

  • Общее понятие об архивации данных. Перечень наиболее популярных программ-архиваторов. Разархивирование самораспаковывающегося архива. Особенности копирующей, ежедневной и разностной архивации. Общее понятие о разархивировании (распаковке) файлов.

    презентация [879,8 K], добавлен 23.12.2012

  • Общее понятие архивации. Особенности программ архиваторов. Основные методы сжатия информации. Методические основы изучения темы "Архивация данных и сжатие информации" на уроках информатики в базовом курсе. Разработка блока уроков по сжатию информации.

    курсовая работа [3,0 M], добавлен 03.06.2012

  • Исследование основных видов программ-архиваторов. Сжатие файлов при архивации. Показатель степени сжатия файлов. Оценка функциональности самых популярных программ-упаковщиков. Технические характеристики процессов сжатия. Методы архивации без потерь.

    реферат [1,6 M], добавлен 05.12.2013

  • Понятие процесса архивации файлов. Программы, осуществляющие упаковку и распаковку файлов. Защита информации от несанкционированного доступа. Самораспаковывающиеся архивы. Основные характеристики программ-архиваторов. Распространенные алгоритмы сжатия.

    презентация [801,6 K], добавлен 23.10.2013

  • Программы для создания архивов. Эффективность сжатия данных как важнейшая характеристика архиваторов. Основные методы сжатия данных. Характеристика программы для упаковки текстов и программ WinRar. Распаковка файлов, упаковка файлов и папок в общий архив.

    реферат [21,0 K], добавлен 05.04.2010

  • Утилиты архивации для создания резервных копий файлов путем помещения их в архив в сжатом виде. Операции над архивами. Алгоритмы архивации. Универсальные алгоритмы уплотнения. Формат задания команд. Степень сжатия файлов. Основные виды архиваторов.

    презентация [241,0 K], добавлен 13.08.2013

  • Архивация данных как сжатие одного или более файлов с целью экономии памяти. Степень сжатия разных файлов. Названия программ-архиваторов и их возможности. Формирование таблицы "Ведомость расчета заработной платы" в Microsoft Excel. Фильтрация записей.

    контрольная работа [1,7 M], добавлен 12.02.2013

  • Основные методы сжатия компьютерных файлов: кодирование длин серий, словарный и энтропийный методы, контекстное моделирование, фильтрация, сортировки блока данных, сегментирование. Классификация программ - архиваторов, форматы и способы создания архивов.

    контрольная работа [125,6 K], добавлен 09.03.2012

  • Виды архиваторов. Использование программ, сжимающих один или несколько файлов в единый файл-архив. Размещение информации на носителях внешней памяти в более компактном виде. Создание самораспаковывающегося архива. Процесс сжатия текстовых файлов.

    презентация [492,6 K], добавлен 22.12.2014

  • Раскрытие цели сжатия файлов и характеристика назначения архиваторов как программ, осуществляющих упаковку и распаковку файлов в архив для удобства переноса и хранения. Основные типы архиваторов: файловые, программные, дисковые. Метод сжатия без потерь.

    презентация [217,8 K], добавлен 05.04.2011

  • Изучение понятия архивации, сжатия файлов с целью экономии памяти и размещения сжатых данных в одном архивном файле. Описания программ, выполняющих сжатие и восстановление сжатых файлов в первоначальном виде. Основные преимущества программ-упаковщиков.

    контрольная работа [534,7 K], добавлен 11.01.2015

  • Проведение исследования программ–архиваторов, позволяющих уменьшить размер файла для экономии места на диске. Установка архиватора BreeZip и WinRAR. Особенность разархивации самых различных видов архивных файлов. Средства архивирования в Unix–системах.

    отчет по практике [1,4 M], добавлен 08.01.2023

  • Операционная система MS-DOS: история и характеристика. Обзор стандартных программ операционной системы Windows. Способы запуска программ. Служебные приложения Windows и их назначение: диспетчер задач, проверка, очистка, дефрагментация и архивация диска.

    реферат [221,4 K], добавлен 06.01.2015

  • Правовые основы защиты информации на предприятии. Анализ среды пользователей. Автоматизированная система предприятия. Краткие сведения об операционной системе Windows XP. Классификация троянских программ. Способы защиты операционной системы Windows XP.

    дипломная работа [187,3 K], добавлен 14.07.2013

  • Ознакомление с историей развития компьютеров. Понятие данных и программ. Рассмотрение операционной системы как комплекса программ, обеспечивающих взаимодействие частей компьютера между собой, а аткже пользователя и компьютера. Особенности систем Windows.

    презентация [1,4 M], добавлен 13.01.2015

  • Описание устройств ввода графической, звуковой информации, их назначение, классификация, конструкция, характеристики. Графические планшеты, сканнеры. Анализ способов представления и кодирования информации. Программные средства для архивации данных.

    контрольная работа [31,2 K], добавлен 22.11.2013

  • Краткие теоретические сведения о методах защиты информации и ограничения доступа к персональному компьютеру. Способы ограничения доступа к информации в файле в офисных программах MS Word, MS Excel. Зашифровка данных с помощью архиваторов и системы EFS.

    методичка [753,5 K], добавлен 15.07.2014

  • Теоретические положения использования архиваторов. Основные возможности программы WinRar и ее ограничения. Режимы управления файлами и архивами. Поддержка технологии перетаскивания. Тестовые примеры использования WinRar. Использование контекстных меню.

    реферат [654,9 K], добавлен 22.11.2009

  • Права доступа к файлам и управление ими и другими атрибутами. Значения прав доступа для файлов и директорий. Набор файловых флагов. Команды управления процессами в операционной системе UNIX. Опции и значения программ архивации и сжатия - tar и gzip.

    контрольная работа [234,4 K], добавлен 16.01.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.