Конспект урока по Информатике «Архиваторы. Архивы и архивирование: назначение, термины, определения. Назначение и основные понятия WinRar WinZip Другие форматы архивов Сравнительные характеристики. Презентация на тему архиваторы

Архиватор - это специализированная программа, предназначенная для компрессии файлов, т.е. уменьшение их размера или занимаемого ими дискового пространства. Архив - файл, создаваемый архиватором. Архивация - процесс сжатия информации. После сжатия размера, файл может быть существенно уменьшен - архивный файл. Перед использованием такого файла, его нужно разархивировать 2


Виды архивов: 1. Непрерывный архив - это архив с расширением.rar упакованный специальным способом, при котором все сжимаемые файлы рассматриваются как один последовательный поток данных. Непрерывная архивация поддерживается только в формате RAR, для формата ZIP такого типа архива не существует. Некоторые недостатки непрерывной архивации: обновление непрерывных архивов происходит медленнее, чем обычно; чтобы извлечь один файл из непрерывного архива приходится анализировать все предыдущие; если в непрерывном архиве какой-либо файл окажется поврежденным, то не удастся извлечь все файлы, следующие после него. Поэтому при сохранении непрерывного архива рекомендуется добавлять информацию для восстановления. Непрерывные архивы предпочтительно использовать в тех случаях, когда: архив предполагается редко обновлять; планируется чаще распаковывать весь архив; нужно достичь более плотной степени сжатия, даже в ущерб скорости. 3


Виды архивов: 2. Тома - это фрагменты архива, состоящие из нескольких частей. Тома поддерживаются только в формате.rar. Тома используются для сохранения большого архива на нескольких сменных носителях. Уже созданные многотомные архивы не допускают изменения. Для распаковки томов необходимо начинать извлечение с первого тома. Тома для восстановления представляют собой особый файл с расширением.rev создаваемый WinRAR и служат для воссоздания отсутствующих и поврежденных томов в многотомном архиве. Чтобы WinRAR воссоздал недостающие и поврежденные тома необходимо щелкнуть мышью на файле.rev. Если WinRAR при распаковке не находит следующего тома, но обнаруживает необходимое число файлов.rev, то он воссоздает недостающие тома автоматически. 4


Виды архивов: 3. Самораспаковывающийся архив - это архив, к которому присоединен исполняемый модуль. Этот модуль позволяет извлекать файлы простым запуском архива, как обычной программой. Самораспаковывающиеся архивы, как и любые другие исполняемые файлы обычно имеют расширение.exe. Самораспаковывающиеся архивы удобны в тех случаях, когда нужно передать архив, но нет уверенности, что у получателя есть соответствующий архиватор для распаковки. 5




7-Zip довольно популярный архиватор. В первую очередь, этот архиватор привлекателен своим собственным форматом 7z. Формат 7z имеет наивысшую степень сжатия и отлично подходит для архивации больших объемов информации (например, особо крупных программ или игр). 7-Zip поддерживает все популярные форматы архивов: 7z, ZIP, CAB, RAR, ARJ, GZIP, LZH, CHM, BZIP2, TAR, CPIO, RPM и DEB. Стоит обратить внимание на нередкие ситуации, в которых степень сжатия форматов ZIP и GZIP этим архиватором значительно выше, чем у конкурентов. 7


Архиватор. Помимо поддержки ряда популярных форматов имеет свой собственный формат ACE. Иногда использование этого формата предпочтительнее перед всеми остальными, так как в некоторых случаях процент сжатия чуть выше. Архивирует в: ACE, ZIP, LHA, MS-CAB, JAVA JAR, GZip, TAR, GZippedTar. Извлекает из: ACE, ZIP, LHA, RAR, MS-CAB, ARC, ARJ, GZip, TAR, ZOO, JAR, ISO, BZip2. Поддерживает многотомные архивы в форматах: ACE, ZIP, CAB. Так же умеет создавать самораспаковывающиеся архивы в форматах ACE и ZIP. Плюс к этому программа умеет просматривать графические файлы, MS Excel-таблицы, документы MS Word, HTML- страницы и ASCII файлы. WinAce


ExtractNow это небольшая утилита для распаковки архивов. ExtractNow служит для быстрой распаковки нескольких архивов нажатием всего одной кнопки. Это удобно в случаях, когда пользователю необходимо регулярно распаковывать много заархивированных файлов. Для этого нужно просто перетащить архивы, которые требуется распаковать, в окно программы и нажать кнопку Extract. Программа поддерживает все популярные форматы архивов: zip, rar, 7z, bzip2, arj, cab, iso, chm, tar, gzip, а также множество менее популярных. ExtractNow не архиватор и создание архивов не поддерживает. Скромные возможности программы ограничиваются лишь вышеуказанной функцией распаковки. Собственно больше ничего программа делать не умеет. ExtractNow


Достаточно мощный и полностью бесплатный архиватор. Программа поддерживает работу со всеми популярными форматами архивов и некоторыми образами дисков. Помимо основных функций для создания и распаковки архивов, IZArc поддерживает: шифрование, создание многотомных архивов (и слияние частей), создание самораспаковывающихся архивов, включает функции поиска архивов по выбранному формату, умеет восстанавливать поврежденные архивы, конвертирует различные форматы между собой, имеет поддержку комментариев и прочее. IZArc имеет простенький и удобный интерфейс и поддерживает интеграцию в контекстное меню Windows. IZArc поддерживает следующие форматы архивов: 7-ZIP, A, ACE, ARC, ARJ, B64, BH, BIN, BZ2, BZA, C2D, CDI, CAB, CPIO, DEB, ENC, GCA, GZ, GZA, HA, IMG, ISO, JAR, LHA, LIB, LZH, MBF, MDF, MIM, NRG, PAK, PDI, PK3, RAR, RPM, TAR, TAZ, TBZ, TGZ, TZ, UUE, WAR, XXE, YZ1, Z, ZIP, ZOO. IZArc


PeaZip это удобный, достаточно мощный и полностью бесплатный архиватор. PeaZip поддерживает распаковку 150 различных форматов архивов. Умеет создавать архивы в следующих форматах: 7z, FreeArc"s arc/wrc, sfx (7z and arc), bz2, gz, paq/lpaq/zpaq, pea, quad/balz, split, tar, upx, zip. В программе имеется масса опций, как для создания архивов, так и для работы с уже готовыми. Поддерживается несколько типов шифрования. PeaZip


ZipGenius бесплатный архиватор ZipGenius это полностью бесплатный архиватор. Важно заметить, что программа абсолютна бесплатна не только для домашнего, но и для корпоративного использования. ZipGenius имеет стандартный для архиватора функционал и не включает никаких особенных функций, но со своей основной задачей справляется не хуже прочих. Программа умеет работать со всеми популярными форматами архивов. Этот архиватор имеет несложный, традиционный для такого типа программ, интерфейс, поддерживает интеграцию в операционную систему, поддерживает проверку архивов внешним антивирусом, включает функции восстановления поврежденных архивов и содержит ряд сопутствующих мелких удобств. ZipGenius


WinZip это программа, получившая всемирную популярность, из-за того, что явилась первым архиватором с графическим интерфейсом. WinZip и по сей день имеет самый симпатичный и продвинутый в функциональном плане интерфейс с массой удобных возможностей для работы с архивами. Программа поддерживает большинство популярных форматов архивации, в том числе и самые востребованные: ZIP, RAR, GZIP, 7Z, ARJ, ARC, CAB, LZH, TAR, MIME, Unix Compress, Uuencode, Xxencode, BinHex. Среди дополнительных возможностей присутствует инструмент для резервного копирования, функции шифрования, отправка архивов по электронной почте и прочее. WinZip 20 13


PowerArchiver это мощный архиватор с продвинутым интерфейсом и широким ассортиментом дополнительных функций. Данный архиватор поддерживает все востребованные форматы архивов, в том числе и, конечно же, самые популярные ZIP, RAR, 7z и TAR. Кроме архивов, программа поддерживает работу с образами дисков и различными текстовыми и графическими форматами. Разработчики заявляют, что PowerArchiver способен обеспечить более высокую скорость работы основных операций, за счет поддержки многоядерных процессоров (по сравнению с прочими популярными программами, прирост в скорости может достигать 300%400%). Помимо стандартных операций с архивами, PowerArchiver поддерживает и такие особенности как запись дисков, виртуальный CD-привод, FTP-клиент, функции резервного копирования, поддержку просмотра текстовых и графических файлов и целый набор сопутствующих мелочей для удобной работы. При всех достоинствах и функциональной насыщенности PowerArchiver она довольно дорогостоящая PowerArchiver


WinRAR это самый популярный архиватор в мире. Оно и понятно, алгоритм сжатия формата RAR по праву считается одним из лучших, а удобный интерфейс, поддержка всех востребованных форматов архивации и общее, очень высокое, качество не оставляет шансов конкурентам. WinRAR имеет полную поддержку форматов RAR и ZIP (создание архивов, распаковка и дополнительные операции), а также может распаковывать архивы всех прочих популярных форматов: 7Z, ACE, ARJ, BZ2, CAB, GZ, JAR, LZH, TAR, UUE, Z и ISO. Кроме того, программа позволяет создавать самораспаковывающиеся архивы типа SFX, а также многотомные архивы, которые состоят из нескольких частей. Также нужно отметить, что WinRAR поддерживает работы с архивами и файлами практически неограниченного размера, а количество файлов содержащихся в архиве также неограниченно. Кроме простых операций создания архивов и работы с готовыми архивами, WinRAR имеет ряд сопутствующих функций: шифрование архивов с помощью алгоритма AES, поддержка восстановления поврежденных архивов в форматах RAR и ZIP и конвертирование форматов архивов. WinRAR


КАК РАБОТАТЬ С АРХИВАТОРОМ Для начала вам нужно купить или скачать архиватор, после чего установить себе на ПК. Это достаточно просто. 1. СОЗДАНИЕ АРХИВА С ПОМОЩЬЮ WINRAR Для примера создадим архив из папки, внутри которой находятся нужные нам файлы, например старые фотографии, которые мы не хотим удалять, но и хранить их надоело. Допустим, что это папка Foto1 расположенная у нас на рабочем столе. 16


17




Одним из наиболее широко распространенных видов сервисных программ являются программы, предназначенные для архивации, упаковки файлов путем сжатия хранимой в них информации. Архиватор - программа, осуществляющая объединение нескольких файлов в один архив или серию архивов, для удобства переноса или хранения. Многие архиваторы используют сжатие без потерь для уменьшения размера архива.

Программы, осуществляющие упаковку и распаковку файлов, называются программами-архиваторами


Метаданные -структурированные данные, представляющие собой характеристики описываемых сущностей для целей их идентификации, поиска, оценки, управления ими.

  • Простейшие архиваторы просто последовательно объединяют содержимое файлов в архив. Кроме него, архив должен также содержать информацию об именах файлов и длине оригиналов для их восстановления. Большинство архиваторов также сохраняют метаданные файлов, предоставляемые операционной системой, такие, как время создания и права доступа.

Программа, создавая архив, обрабатывает как текстовые файлы, так и бинарные файлы.

  • Текстовые файлы всегда сжимаются в несколько раз (в зависимости от архиватора). Что же касается бинарных файлов, то здесь все зависит от их характера. Может быть сжато в десятки раз, но могут быть и случаи, когда сжатие почти не происходит. Сжатие данных обычно происходит значительно медленнее, чем обратная операция.

  • Текстовый файл - разновидность файла, содержащая текстовые данные, как правило организованные в виде строк. Текстовый файл, как и прочие файлы, хранится в файловой системе. Текстовый файл может содержать не только чистый текст, но и производные форматы - к примеру, HTML-текст.
  • Текстовым файлам противопоставляются двоичные (бинарные) файлы, в которых информация организована по иным принципам.

24- битное изображение:

  • Двоичный (бинарный) файл - в широком смысле: последовательность произвольных байтов. В узком смысле слова двоичные файлы противопоставляются текстовым файлам. При этом с точки зрения технической реализации на уровне аппаратуры, текстовые файлы являются частным случаем двоичных файлов, и, таким образом, в широком значении слова под определение «двоичный файл» подходит любой файл.

Характеристики архиваторов - обратно зависимые величины. Чем больше скорость сжатия, тем меньше степень сжатия, и наоборот.

  • Характеристики архиваторов:
  • По степени сжатия
  • По скорости сжатия
  • Первые всегда сжимаются в несколько раз.Что же касается бинарных файлов, то здесь все зависит от их характера. Может быть сжато в десятки раз, но могут быть и случаи, когда сжатие почти не происходит. Сжатие данных обычно происходит значительно медленнее, чем обратная операция. Большие по объему архивные файлы могут быть размещены на нескольких дисках (томах). Такие архивы называются многотомными .
  • Том - это составная часть многотомного архива. Создавая архив из нескольких частей, можно записать его части на несколько дискет.

WinRAR - один из самых известных архиваторов.

  • В настоящее время применяется несколько десятков программ-архиваторов, которые отличаются перечнем функций и параметрами работы, однако лучшие из них имеют примерно одинаковые характеристики. Из числа наиболее популярных программ можно выделить:
  • ARJ, РКРАК, LHA, ICE, HYPER, ZIP, РАК, ZOO, EXPAND, разработанные за рубежом, а также AIN и RAR, разработанные в России. Обычно упаковка и распаковка файлов выполняются одной и той же программой, но в некоторых случаях это осуществляется разными программами, например, программа PKZIP производит упаковку файлов, a PKUNZIP - распаковку файлов.
  • Программы-архиваторы позволяют создавать и такие архивы, для извлечения из которых содержащихся в них файлов не требуются какие-либо программы, так как сами архивные файлы могут содержать программу распаковки. Такие архивные файлы называются самораспаковывающимися.

Необходимость архивации связана также с необходимостью резервного копирования информации на диски и дискеты с целью сохранения ценной информации и программного обеспечения компьютера для защиты от повреждения и уничтожения,умышленного или случайного, под действием компьютерного вируса.

14.11.16

Архивация


  • Что такое файл?
  • Какие существуют типы файлов?
  • Как определить размер файла?
  • Перечислить единицы измерения информации.
  • Какие существуют носители информации?
  • Какие виды компьютерных программ вы знаете?

Архивация

Архивация – это упаковка (сжатие) файла или группы файлов с целью уменьшить место, занимаемое ими на диске.

Архиватор – это программа, позволяющая за счёт применения специальных методов сжатия информации создавать копии файлов меньшего размера, а также объединять копии нескольких файлов в один архивный файл, из которого можно при необходимости извлечь файлы в их первоначальном виде.

Архивация – процесс сжатия данных.


  • создавать rar-архивы и извлекать из них файлы;
  • создавать самораспаковывающиеся архивы – архивный файл в этом случае будет иметь расширение exe и запускается как обычная программа. Файлы из такого архива могут быть извлечены на любом компьютере путём запуска программы;
  • создавать многотомные архивы, что позволяет разместить большой архив на нескольких носителях ограниченной емкости.
  • устанавливать пароль на архив – при этом посторонний сможет лишь просмотреть список файлов архива, но не сможет распаковать сжатые данные;
  • уменьшить размер файла для отправки по e-mail, обеспечивает степень сжатия до 95 %.

  • файлы
  • папки
  • диски

Назначение архивации

Сжатие файлов с целью экономии памяти

Сжатие файлов и папок необходимо для

  • их транспортировки, для резервного копирования, для обмена информацией по сети Интернет. Уплотнение дисков
  • их транспортировки,
  • для резервного копирования,
  • для обмена информацией по сети Интернет. Уплотнение дисков применяют для повышения эффективности использования их рабочего пространства, обычно для дисков недостаточной ёмкости.

Типы архиваторов

Файловые архиваторы

Упаковывают один или несколько файлов в единый архивный файл, размер которого, как правило, меньше, чем суммарный размер исходных файлов, но воспользоваться запакованными программами или данными, пока они находятся в архиве, нельзя, пока они не будут распакованы. Для распаковки архивного файла обычно используется тот же самый архиватор.

Программные архиваторы

Позволяют упаковать за один прием один единственный файл - исполняемую программу ЕХЕ-типа, но зато так, что заархивированная программа будет сразу после ее запуска на исполнение самораспаковываться в оперативной памяти и тут же начинать работу.

Дисковые архиваторы

Позволяют программным способом увеличить доступное пространство на жестком диске. Типичный дисковый архиватор представляет собой резидентный драйвер, который незаметно для пользователя архивирует любую записываемую на диск информацию и распаковывает ее обратно при чтении. Однако операции чтения/записи файлов несколько замедляются, поскольку процессору требуется время для упаковки и распаковки.


Распространенные архиваторы

Существуют разные программы-архиваторы, отличающиеся форматом архивных файлов, скоростью работы, степенью сжатия файлов при помещении в архив, удобством использования. Наиболее распространенные программы-архиваторы имеют приблизительно одинаковые возможности и ни одна из них не превосходит другие по всем параметрам: одни программы работают быстрее, другие обеспечивают лучшую степень сжатия файлов. Даже если сравнивать программы только по степени сжатия, то среди них нет лидера: разные файлы лучше сжимаются разными программами.


Принцип работы архиваторов

основан на поиске в файле "избыточной" информации и последующем ее кодировании с целью получения минимального объема. Самым известным методом архивации файлов является сжатие последовательностей одинаковых символов . Например, внутри вашего файла находятся последовательности байтов, которые часто повторяются. Вместо того, чтобы хранить каждый байт, фиксируется количество повторяемых символов и их позиция. Например, архивируемый файл занимает 15 байт и состоит из следующих символов:

B B B B B L L L L L A A A A A

В шестнадцатеричной системе это будет

42 42 42 42 42 4C 4C 4C 4C 4C 41 41 41 41 41

Архиватор может представить этот файл в следующем виде (шестнадцатеричном):

01 05 42 06 05 4C 0A 05 41

Это значит: с первой позиции 5 раз повторяется символ "B", с позиции 6 пять раз повторяется символ "L" и с позиции 11 пять раз повторяется символ "A". Для хранения файла в такой форме потребуется всего 9 байт, что на 6 байт меньше исходного.

Описанный метод является простым и очень эффективным способом сжатия файлов.


Принцип работы архиваторов

Более изощренный метод сжатия данных - это так называемый оптимальный префиксный код и, в частности, кодирование символами переменной длины (алгоритм Хаффмана). Код переменной длины позволяет записывать наиболее часто встречающиеся символы и группы символов всего лишь несколькими битами, в то время как редкие символы и фразы будут записаны более длинными битовыми строками. Например, в любом английском тексте буква E встречается чаще, чем Z, а X и Q. Таким образом, используя специальную таблицу соответствия, можно закодировать каждую букву Е меньшим числом бит и использовать более длинный код для более редких букв.

Некоторые архиваторы работают на основе алгоритма Лемпела-Зива. Эти архиваторы классифицируются как адаптивные словарные кодировщики , в которых текстовые строки заменяются указателями на идентичные им строки , встречающиеся ранее в тексте. Например, все слова какой-нибудь книги могут быть представлены в виде номеров страниц и номеров строк некоторого словаря.


Методы уплотнения информации

Алгоритм

Алгоритм Хафмана

Алгоритм

или Основные алгоритмы сжатия


Алгоритм RLE

использует принцип выявления повторяющихся последовательностей и замены их простой структурой, в которой указывается код данных и коэффициент повтора.

При сжатии записывается последовательность из двух повторяющихся величин: повторяемого значения и количества его повторений.

Пример

Исходная последовательность: 3, 3, 12, 12, 12, 0, 0, 0, 0. Сжатая информация: 3, 2, 12, 3, 0, 4. Коэффициент сжатия: 6/9*100% = 67%.

Алгоритм RLE (Run-Length Encoding) Говоря об алгоритмах сжатия, будем иметь в виду обратимые алгоритмы.


Алгоритм KWE

предполагает использование словаря, в котором каждому слову соответствует двухбайтовый код. Эффективность сжатия увеличивается с ростом объёма кодируемого текста.

Алгоритм KWE (Keyword Encoding)


Алгоритм Хафмана

предполагает кодирование не байтами, а битовыми группами. В нем можно выделить 3 основные этапа:

  • Выявляется частота повторения каждого из встречающихся символов.
  • Чем чаще встречается символ, тем меньшим количеством битов он кодируется.
  • К закодированной последовательности прикладывается таблица соответствия.


Степень сжатия зависит от

Используемого архиватора

Метода сжатия

Типа

исходного файла


  • Архив - это файл, содержащий в себе один или несколько файлов в сжатом (упакованном виде). Имена файлов архивов могут иметь расширения. zip , arj , rar , arc и др. в зависимости от типа архиватора, в котором они были созданы.
  • Архиватор - специальная программа, с помощью которой можно сжимать файлы, размещать «длинные» архивы на дискетах, просматривать содержание архивов, контролировать их целостность, распаковывать архивы и т.п.
  • Архивы создаются с целью уменьшения объема первоначального файла (экономится место на диске) и возрастания скорости копирования (особенно при пересылке по Интернету и электронной почте).
  • Самораспаковывающийся архив - это исполняемая программа (файл.ехе), которая включает в себя одновременно как архив, так и программу для его распаковки. Это особенно выгодно, когда неизвестно, есть ли соответствующая программа архивации на компьютере, на котором предстоит распаковка.
  • Распределенные архивы – предполагается передача большого объема информации на носителях малой емкости.

Обратимость сжатия

Если при сжатии данных происходит изменение их содержания, метод сжатия необратим.

Этот метод называют методом сжатия с регулируемой потерей информации.


Форматы сжатия без потери информации

Форматы сжатия с потерей информации

  • JPG- графика
  • MPG- видео
  • MP3- звук
  • GIF, TIF, PCX
  • ZIP, ARJ, RAR

  • Что такое архивация?
  • Для чего необходима архивация?
  • Почему есть возможность уменьшать размер файлов?
  • Какие файлы не имеет смысла архивировать?
  • Почему перед пересылкой текстового файла по электронной почте имеет смысл предварительно его упаковать в архив?
  • Что такое архиватор?
  • Перечислить типы архиваторов.
  • Какие 3 принципа работы архиваторов Вам известны?
  • Что значит многотомный архив?
  • Что такое самораспаковывающийся архив?
  • Что такое степень сжатия файла?
  • Для чего нужно резервное копирование?
  • Что такое разархивация?

Архивация - это сжатие одного или более файлов с целью экономии памяти и размещение сжатых данных в одном архивном файле.

Архивация данных - это уменьшение физических размеров файлов, в которых хранятся данные, без значительных информационных потерь.

Архивация проводится в следующих случаях:

- необходимо создать резервные копии наиболее ценных файлов

- необходимо освободить место на диске

- необходимо передать файлы по E-mail

Основным недостатком архивов является невозможность прямого доступа к данным. Их сначала необходимо извлечь из архива или распаковать.

Операция распаковки, впрочем, как и упаковки, требует некоторых системных ресурсов. Это не мгновенная операция. Поэтому архивы в основном применяют со сравнительно редко

Методы сжатия архиваторов.

Кодирование длин серий (RLE - сокращение от run - length encoding - кодирование длин серий).

Последовательная серия одинаковых элементов данных заменяется на два символа: элемент и число его повторений. Широко используется как дополнительный, так и промежуточный метод. В качестве самостоятельного метода применяется, например, в графическом формате BMP .

_________________________________________________________________________

Предположим, есть некоторый фрагмент данных:

В фрагменте наблюдается определенная закономерность. Последовательность "110 " повторяется четыре раза подряд. Таким образом появляется возможность заменить вышеуказанный фрагмент следующей последовательностью:

КЛЮЧ\повтор\повтор\повтор\

Где под ключом обозначается участок 110, а символ повтора означает, что на его месте должен находиться тот ключ, что и в предыдущем. Если условно сказать, что повтор обозначается как 1 ,

то исходный фрагмент преобразуется в:

В результате из последовательности длиной двенадцать бит получается последовательность в шесть бит. То есть применение

алгоритма кодирования позволило сжать исходный файл в два

Словарный метод (LZ - сокращение от Lempel Ziv - имена авторов).

Наиболее распространенный метод. Используется словарь, состоящий из последовательностей данных или слов. При сжатии эти слова заменяются на их коды из словаря. В наиболее распространенном варианте реализации в качестве словаря выступает сам исходный блок данных.

Основным параметром словарного метода является размер словаря. Чем больше словарь, тем больше эффективность. Однако для неоднородных данных чрезмерно большой размер может быть вреден, так как при резком изменении типа данных словарь будет заполнен неактуальными словами. Для эффективной работы данного метода при сжатии требуется дополнительная память. Приблизительно на порядок больше, чем нужно для исходных данных словаря. Существенным преимуществом словарного метода

Энтропийный метод (Huffman - кодирование Хаффмена, Arithmetic coding - арифметическое кодирование)

В этом методе элементы данных, которые встречаются чаще, кодируются при сжатии более коротким кодом, а более редкие элементы данных кодируются более длинным кодом. За счет того, что коротких кодов значительно больше, общий размер получается меньше исходного.

Широко используется как дополнительный метод. В качестве самостоятельного метода применяется, например, в графическом формате JPG .

Метод контекстного моделирования (CM - сокращение от context modeling - контекстное моделирование).

В этом методе строится модель исходных данных. При сжатии очередного элемента данных эта модель выдает свое предсказание или вероятность. Согласно этой вероятности, элемент данных кодируется энтропийным методом. Чем точнее модель будет соответствовать исходным данным, тем точнее она будет выдавать предсказания, и тем короче будут кодироваться элементы данных.

Для построения эффективной модели требуется много памяти. При распаковке приходится строить точно такую же модель. Поэтому скорость и требования к объему оперативной памяти для упаковки и распаковки почти одинаковы. В данный момент методы контекстного моделирования позволяют получить наилучшую степень сжатия, но отличаются чрезвычайно низкой скоростью. PPM (PPM - Prediction by Partial Matching - предсказание по

частичному совпадению).

Подвид контекстного моделирования. Предсказание

выполняется на основании определенного количества

Метод сортировки блока данных (BWT - сокращение от Burrows Wheeler Transform - по имени авторов).

Это особый вид или группа преобразований, в основе которых лежит сортировка . Такому преобразованию можно подвергать почти любые данные. Сортировка производится над блоками, поэтому данные предварительно разбиваются на части. Основным параметром является размер блока, который подвергается сортировке. Для распаковки данных необходимо проделать почти те же действия, что и при упаковке. Поэтому скорость и требования к оперативной памяти почти одинаковы. Архиваторы, которые используют данный метод, обычно показывают высокую скорость и степень сжатия для текстовых данных.

Предварительные преобразования или фильтрация.

Данные методы служат не для сжатия, а для представления информации в удобном для дальнейшего сжатия виде.

Например, для несжатых мультимедиа данных характерны плавные изменения уровня сигнала. Поэтому для них применяют дельта- преобразование, когда вместо абсолютного значения берется относительное.

Существуют фильтры для текста, исполняемых файлов, баз данных и другие.

Сегментирование.

Это предварительная разбивка на однородные части. Затем эти части кодируются по отдельности или группами.

Существует большое количество методов сжатия. Каждый метод обычно ориентирован на один вид или группу реальных данных. Хорошие результаты показывает комплексное использование методов.

Особенности данных.

Степень сжатия в основном зависит от исходных данных.

Хорошо сжимаются почти все предварительно

несжатые данные.

Ограниченно сжимаются несжатый звук (WAV), сложные несжатые изображения (BMP).

Не сжимаются почти все уже сжатые данные,

например, архивы (ZIP , CAB), сжатые документы (PDF),

сжатая графика и видео (JPG , GIF , AVI , MPG), сжатый звук

Программы архиваторы.

Архиваторы – это программы (комплекс программ) выполняющие сжатие и восстановление сжатых файлов в первоначальном виде. Процесс сжатия файлов называется архивированием. Процесс восстановления сжатых файлов – разархивированием.

Современные архиваторы отличаются используемыми алгоритмами, скоростью работы, степенью сжатия (WinZip 9.0, WinAce 2.5, PowerArchiver 2003 v.8.70, 7Zip 3.13, WinRAR 3.30, WinRAR 3.70 RU).

Другие названия архиваторов: утилиты - упаковщики, программы - упаковщики, служебные программы, позволяющие помещать копии файлов в сжатом виде в архивный файл.

Следует различать

- программу-архиватор,

- формат архивов и

Методы сжатия.

Кроме собственно сжатия данных, современные архиваторы обеспечивают некоторые дополнительные функции.

Можно выделить несколько основных:

- сжатие некоторых файлов и целых директорий;

- создание самораспаковывающихся (SFX) архивов. То есть для распаковки архива программа-архиватор не требуется;

- изменение содержимого архива;

- шифрование содержимого архива;

- информация для восстановления архива при частичном повреждении и возможность

восстановления поврежденных архивов;

- разбивка архива на несколько частей или томов;

- консольная версия программы для работы из командной строки;

Ноутбук