Ћекции.ќрг


ѕоиск:




 атегории:

јстрономи€
Ѕиологи€
√еографи€
ƒругие €зыки
»нтернет
»нформатика
»стори€
 ультура
Ћитература
Ћогика
ћатематика
ћедицина
ћеханика
ќхрана труда
ѕедагогика
ѕолитика
ѕраво
ѕсихологи€
–елиги€
–иторика
—оциологи€
—порт
—троительство
“ехнологи€
“ранспорт
‘изика
‘илософи€
‘инансы
’ими€
Ёкологи€
Ёкономика
Ёлектроника

 

 

 

 


јрхиваторы и архивы




јрхиватор Ч программа, осуществл€юща€ объединение нескольких файлов в один архив или серию архивов, дл€ удобства переноса или хранени€. ћногие архиваторы используют сжатие без потерь дл€ уменьшени€ размера архива

ѕростейшие архиваторы просто последовательно объедин€ют содержимое файлов в архив.  роме него, архив должен также содержать информацию об именах файлов и длине оригиналов дл€ их восстановлени€. Ѕольшинство архиваторов также сохран€ют метаданные файлов, предоставл€емые операционной системой, такие, как врем€ создани€ и права доступа.

ѕрограмма, создава€ архив, обрабатывает как текстовые файлы.

“екстовый файл Ч разновидность файла, содержаща€ текстовые данные, как правило, организованные в виде строк. “екстовый файл, как и прочие файлы, хранитс€ в файловой системе.

ќрганизаци€ текстового файла

“екстовый файл представл€ет собой последовательность символов (принадлежащих некому набору символов). —имволы сгруппированы в строки (англ. lines, rows). ¬ современных системах строки раздел€ютс€ переводом строки, хот€ в прошлом примен€лось хранение строк в виде записей посто€нной или переменной длины.

»ногда конец текстового файла, особенно если в файловой системе не хранитс€ информаци€ о размере файла, также отмечаетс€ одним или более специальными знаками, известными как маркеры конца файла.

ѕреимущества текстового файла

‘ормат текстового файла крайне прост, и его можно измен€ть текстовым редактором Ч стандартной программой, присутствующей во всех ќ—.

“екстовые файлы, особенно если речь идЄт об однобайтных кодировках вроде ASCII, не подвержены многим проблемам, характерным дл€ других форматов файлов. “ак, дл€ них не важна разница в пор€дке байтов или длине машинного слова на разных платформах.

Ѕолее того, если повреждение данных (англ.) случитс€ в текстовом файле, в этом случае обычно легче восстановитьс€ и продолжить обработку остального содержимого[источник не указан 135 дней]. ¬се стандартные системы управлени€ верси€ми рассчитаны на текстовые файлы и с двоичными файлами могут работать только как с единым целым.

Ќедостатки текстового файла

Ќедостатком текстовых файлов €вл€етс€ их низка€ информационна€ энтропи€ [источник не указан 135 дней] Ч эти файлы занимают больше места, нежели минимально необходимо.

Ќекоторые операции с текстовыми файлами чрезвычайно неэффективны. Ќапример, если в файле встретитс€ число, машина должна будет перевести его в свой внутренний формат, вызвав (сравнительно) сложную процедуру конвертации числа. „тобы перейти на 1000-ю строку, требуетс€ считать 999 строк, идущих до неЄ. —ложно заменить одну строку другой, и т. д. ѕоэтому при работе с большими объЄмами данных текстовые файлы примен€ют только как промежуточный формат, обеспечивающий интероперабельность.

ƒвоичный (бинарный) файл Ч в широком смысле: последовательность произвольных байтов. Ќазвание св€зано с тем, что байты состо€т из бит, то есть двоичных (англ. binary) цифр.

¬ узком смысле слова двоичные файлы противопоставл€ютс€ текстовым файлам. ѕри этом с точки зрени€ технической реализации на уровне аппаратуры, текстовые файлы €вл€ютс€ частным случаем двоичных файлов, и, таким образом, в широком значении слова под определение Ђдвоичный файлї подходит любой файл.

ѕервые всегда сжимаютс€ в несколько раз (в зависимости от архиватора). „то же касаетс€ бинарных файлов, то здесь все зависит от их характера. ћожет быть сжато в дес€тки раз, но могут быть и случаи, когда сжатие почти не происходит. —жатие данных обычно происходит значительно медленнее, чем обратна€ операци€.

’арактеристики архиваторов:

1. ѕо степени сжати€

2. ѕо скорости сжати€

’арактеристики архиваторов Ч обратно зависимые величины. “о есть, чем больше скорость сжати€, тем меньше степень сжати€, и наоборот.

Ќе нужно путать архиватор с архивом файлов.

јрхив Ч файл, содержащий в себе информацию из одного или нескольких, иногда сжатых (без потерь), других файлов. явл€етс€ результатом работы программы-архиватора.

¬иды архивов

—хема совместного использовани€ архиватора и компрессора

‘айл, составленный из одного или нескольких файлов и метаданных. —оздаютс€, например, программой tar. »ногда используютс€ совместно с программами сжати€ дл€ получени€ архивов, обычно имеющих расширени€ типа Ђ.tar.gzї или Ђ.tar.lzmaї.

‘айл, содержащий ровно один сжатый файл. „асто встречаетс€ в UNIX-подобных ќ—: compress, gzip, bzip2, freeze, lzma. »спользуютс€ самосто€тельно или вместе с программами типа tar дл€ получени€ архивов, обычно имеющих расширени€ типа Ђ.tar.gzї или Ђ.tar.bz2ї.

Ќекоторые архиваторы и форматы архивов объедин€ют эти две функции в произвольном пор€дке Ч например, 7z, ARJ, ZIP. ¬ таких случа€х, если сжатие производитс€ после объединени€, архив называетс€ Ђнепрерывнымї. Ёто позвол€ет уменьшить размер полученного архива, но затрудн€ет восстановление при повреждении данных.

»ме€ архив, можно получить исходный файл с помощью соответствующей программы распаковки (иногда объединЄнной с программой дл€ создани€ архивов).

—ам архив может состо€ть из нескольких файлов дл€ облегчени€ хранени€ и переноса большого количества данных при ограничени€х на размер одной части Ч например, носител€ данных, или сообщени€ e-mail. “акой архив называетс€ многотомным.

  архиву может быть присоединЄн исполн€емый код, который при выполнении распаковывает архив.  од может быть полнофункциональной программой распаковки этого формата архивов. “акой архив называетс€ самораспаковывающимс€ (англ. self-extracting, иногда сокращЄнно ЂSFXї).

ƒанные в архиве могут быть зашифрованы каким-либо способом. ѕри использовании универсальных архиваторов обычно используетс€ просто шифрование с паролем. ѕри последовательном использовании tar, gzip и GnuPG результирующий файл иногда имеет расширение.tar.gz.gpg.

ћетаданные

јрхив почти всегда содержит метаданные. Ќапример:

1. »мена файлов (кроме некоторых программ сжати€ одиночных файлов Ч например, gzip, где в качестве имени файла используетс€ им€ архива без расширени€, добавленного такой программой)

2. »дентификаторы владельцев, групп, и т. п. файлов, и их прав

3. –азмеры файлов

4. ƒаты изменени€, создани€ файлов

5.  онтрольные суммы файлов дл€ проверки правильности распаковки

6. –азмер и контрольные суммы архива

7. »збыточные данные дл€ восстановлени€ данных при повреждении

8. ÷ифрова€ подпись создател€ архива.





ѕоделитьс€ с друзь€ми:


ƒата добавлени€: 2015-01-29; ћы поможем в написании ваших работ!; просмотров: 1396 | Ќарушение авторских прав


ѕоиск на сайте:

Ћучшие изречени€:

Ќаука Ч это организованные знани€, мудрость Ч это организованна€ жизнь. © »ммануил  ант
==> читать все изречени€...

442 - | 382 -


© 2015-2023 lektsii.org -  онтакты - ѕоследнее добавление

√ен: 0.011 с.