Comprimir archivos en Linux: ZIP y algunas cosas que no te esperas

La entrada de hoy versa sobre el programa ZIP, popular programa y formato de compresión. Pero no hablaremos de sus usos más habituales, como la compresión y descompresión. Para ello ya realizamos una entrada al respecto. Hablaremos de otras opciones y como nos pueden ayudar.

El artículo es una adaptación del publicado en Networkworld.com por Sandra Henry-Stocker.

Algunos de nosotros hemos estado comprimiendo archivos en sistemas UNIX y GNU/Linux durante muchas décadas, para así mantener espacio disponible en disco y organizar los ficheros. Aún así, hay algunas variaciones interesantes sobre la compresión que no todos hemos probado. Por lo tanto, en esta publicación, veremos la compresión y descompresión estándar, así como otras opciones interesantes de compresión.

Comprimir archivos den Linux: ZIP y algunas cosas que no te esperas

Uso básico del comando ZIP

Primero, veamos el uso básico del comando zip. Utiliza esencialmente el mismo algoritmo de compresión de gzip, pero hay un par de diferencias importantes. Por un lado, el comando gzip se usa solo para comprimir un solo archivo donde zip puede comprimir archivos y unirlos en un archivo. Por otro lado, el comando gzip se cierra “en su lugar”. En otras palabras, deja un fichero comprimid, no el fichero original, junto con la copia comprimida.

Veamos un ejemplo del uso de gzip:

1
2
3
$ gzip onefile
$ ls -l
-rw-rw-r-- 1 shs shs 10514 Jan 15 13:13 onefile.gz

Y aquí veamos el uso de zip. Observe cómo este comando requiere que se proporcione un nombre para el fichero comprimido donde gzip simplemente utiliza el nombre del fichero original y agrega la extensión “.gz”

1
2
3
4
5
6
7
$ zip twofiles.zip file*
  adding: file1 (deflated 82%)
  adding: file2 (deflated 82%)
$ ls -l
-rw-rw-r-- 1 shs shs 58021 Jan 15 13:25 file1
-rw-rw-r-- 1 shs shs 58933 Jan 15 13:34 file2
-rw-rw-r-- 1 shs shs 21289 Jan 15 13:35 twofiles.zip

Tenga en cuenta también que los ficheros originales todavía están allí.

La cantidad de espacio en disco que se guarda (es decir, el grado de compresión obtenido) dependerá del contenido de cada fichero. La variación en el seguimiento ejemplo es considerable.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
$ zip mybin.zip ~/bin/*
  adding: bin/1 (deflated 26%)
  adding: bin/append (deflated 64%)
  adding: bin/BoD_meeting (deflated 18%)
  adding: bin/cpuhog1 (deflated 14%)
  adding: bin/cpuhog2 (stored 0%)
  adding: bin/ff (deflated 32%)
  adding: bin/file.0 (deflated 1%)
  adding: bin/loop (deflated 14%)
  adding: bin/notes (deflated 23%)
  adding: bin/patterns (stored 0%)
  adding: bin/runme (stored 0%)
  adding: bin/tryme (deflated 13%)
  adding: bin/tt (deflated 6%)

El comando unzip

El comando Unzip recuperará el contenido de un fichero con extensión zip y , como es probable que sospeche, dejará el fichero zip intacto, mientras que un comando gunzip similar dejaría solo fichero sin comprimir.

1
2
3
4
5
6
7
8
$ unzip twofiles.zip
Archive:  twofiles.zip
  inflating: file1
  inflating: file2
$ ls -l
-rw-rw-r-- 1 shs shs 58021 Jan 15 13:25 file1
-rw-rw-r-- 1 shs shs 58933 Jan 15 13:34 file2
-rw-rw-r-- 1 shs shs 21289 Jan 15 13:35 twofiles.zip

El comando zipcloak

El comando zipcloak cifra un fichero zip, solicitándole que ingrese una contraseña dos veces (para ayudar a asegurar que no lo haga) y deja el fichero en su lugar. Puede esperar que el tamaño del archivo varíe un poco del original.

1
2
3
4
5
6
7
8
9
10
11
$ zipcloak twofiles.zip
Enter password:
Verify password:
encrypting: file1
encrypting: file2
$ ls -l
total 204
-rw-rw-r-- 1 shs shs 58021 Jan 15 13:25 file1
-rw-rw-r-- 1 shs shs 58933 Jan 15 13:34 file2
-rw-rw-r-- 1 shs shs 21313 Jan 15 13:46 twofiles.zip   <== slightly larger than
                                                           unencrypted version

Tenga en cuenta que los archivos originales todavía se encuentran sin cifrar.

El comando zipdetails

El comando zipdetails te mostrará detalles: muchos detalles sobre un fichero comprimido, probablemente mucho más de lo que te interesa absorber. A pesar de que estamos viendo un archivo cifrado, zipdetails muestra los nombres de los ficheros junto con las fechas de modificación del archivo, la información del usuario y del grupo, los datos de la longitud del archivo, etc. Recuerde que esto es todo “metadatos”. No vemos el contenido de los archivos.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
$ zipdetails twofiles.zip
 
0000 LOCAL HEADER #1       04034B50
0004 Extract Zip Spec      14 '2.0'
0005 Extract OS            00 'MS-DOS'
0006 General Purpose Flag  0001
     [Bit  0]              1 'Encryption'
     [Bits 1-2]            1 'Maximum Compression'
0008 Compression Method    0008 'Deflated'
000A Last Mod Time         4E2F6B24 'Tue Jan 15 13:25:08 2019'
000E CRC                   F1B115BD
0012 Compressed Length     00002904
0016 Uncompressed Length   0000E2A5
001A Filename Length       0005
001C Extra Length          001C
001E Filename              'file1'
0023 Extra ID #0001        5455 'UT: Extended Timestamp'
0025   Length              0009
0027   Flags               '03 mod access'
0028   Mod Time            5C3E2584 'Tue Jan 15 13:25:08 2019'
002C   Access Time         5C3E27BB 'Tue Jan 15 13:34:35 2019'
0030 Extra ID #0002        7875 'ux: Unix Extra Type 3'
0032   Length              000B
0034   Version             01
0035   UID Size            04
0036   UID                 000003E8
003A   GID Size            04
003B   GID                 000003E8
003F PAYLOAD
 
2943 LOCAL HEADER #2       04034B50
2947 Extract Zip Spec      14 '2.0'
2948 Extract OS            00 'MS-DOS'
2949 General Purpose Flag  0001
     [Bit  0]              1 'Encryption'
     [Bits 1-2]            1 'Maximum Compression'
294B Compression Method    0008 'Deflated'
294D Last Mod Time         4E2F6C56 'Tue Jan 15 13:34:44 2019'
2951 CRC                   EC214569
2955 Compressed Length     00002913
2959 Uncompressed Length   0000E635
295D Filename Length       0005
295F Extra Length          001C
2961 Filename              'file2'
2966 Extra ID #0001        5455 'UT: Extended Timestamp'
2968   Length              0009
296A   Flags               '03 mod access'
296B   Mod Time            5C3E27C4 'Tue Jan 15 13:34:44 2019'
296F   Access Time         5C3E27BD 'Tue Jan 15 13:34:37 2019'
2973 Extra ID #0002        7875 'ux: Unix Extra Type 3'
2975   Length              000B
2977   Version             01
2978   UID Size            04
2979   UID                 000003E8
297D   GID Size            04
297E   GID                 000003E8
2982 PAYLOAD
 
5295 CENTRAL HEADER #1     02014B50
5299 Created Zip Spec      1E '3.0'
529A Created OS            03 'Unix'
529B Extract Zip Spec      14 '2.0'
529C Extract OS            00 'MS-DOS'
529D General Purpose Flag  0001
     [Bit  0]              1 'Encryption'
     [Bits 1-2]            1 'Maximum Compression'
529F Compression Method    0008 'Deflated'
52A1 Last Mod Time         4E2F6B24 'Tue Jan 15 13:25:08 2019'
52A5 CRC                   F1B115BD
52A9 Compressed Length     00002904
52AD Uncompressed Length   0000E2A5
52B1 Filename Length       0005
52B3 Extra Length          0018
52B5 Comment Length        0000
52B7 Disk Start            0000
52B9 Int File Attributes   0001
     [Bit 0]               1 Text Data
52BB Ext File Attributes   81B40000
52BF Local Header Offset   00000000
52C3 Filename              'file1'
52C8 Extra ID #0001        5455 'UT: Extended Timestamp'
52CA   Length              0005
52CC   Flags               '03 mod access'
52CD   Mod Time            5C3E2584 'Tue Jan 15 13:25:08 2019'
52D1 Extra ID #0002        7875 'ux: Unix Extra Type 3'
52D3   Length              000B
52D5   Version             01
52D6   UID Size            04
52D7   UID                 000003E8
52DB   GID Size            04
52DC   GID                 000003E8
 
52E0 CENTRAL HEADER #2     02014B50
52E4 Created Zip Spec      1E '3.0'
52E5 Created OS            03 'Unix'
52E6 Extract Zip Spec      14 '2.0'
52E7 Extract OS            00 'MS-DOS'
52E8 General Purpose Flag  0001
     [Bit  0]              1 'Encryption'
     [Bits 1-2]            1 'Maximum Compression'
52EA Compression Method    0008 'Deflated'
52EC Last Mod Time         4E2F6C56 'Tue Jan 15 13:34:44 2019'
52F0 CRC                   EC214569
52F4 Compressed Length     00002913
52F8 Uncompressed Length   0000E635
52FC Filename Length       0005
52FE Extra Length          0018
5300 Comment Length        0000
5302 Disk Start            0000
5304 Int File Attributes   0001
     [Bit 0]               1 Text Data
5306 Ext File Attributes   81B40000
530A Local Header Offset   00002943
530E Filename              'file2'
5313 Extra ID #0001        5455 'UT: Extended Timestamp'
5315   Length              0005
5317   Flags               '03 mod access'
5318   Mod Time            5C3E27C4 'Tue Jan 15 13:34:44 2019'
531C Extra ID #0002        7875 'ux: Unix Extra Type 3'
531E   Length              000B
5320   Version             01
5321   UID Size            04
5322   UID                 000003E8
5326   GID Size            04
5327   GID                 000003E8
 
532B END CENTRAL HEADER    06054B50
532F Number of this disk   0000
5331 Central Dir Disk no   0000
5333 Entries in this disk  0002
5335 Total Entries         0002
5337 Size of Central Dir   00000096
533B Offset to Central Dir 00005295
533F Comment Length        0000
Done

El comando zipgrep

El comando zipgrep usará una función de tipo grep para localizar contenido particular en sus archivos comprimidos. Si el archivo está cifrado, deberá ingresar la contraseña provista para el cifrado de cada archivo que desee examinar. Si solo desea verificar el contenido de un solo fichero del archivo comprimido, agregue su nombre al final del comando zipgrep como se muestra a continuación.

1
2
3
$ zipgrep hazard twofiles.zip file1
[twofiles.zip] file1 password:
Certain pesticides should be banned since they are hazardous to the environment.

El comando zipinfo

El comando zipinfo proporciona información sobre el contenido de un archivo comprimido, ya sea cifrado o no. Esto incluye los nombres de archivos, tamaños, fechas y permisos.

1
2
3
4
5
6
$ zipinfo twofiles.zip
Archive:  twofiles.zip
Zip file size: 21313 bytes, number of entries: 2
-rw-rw-r--  3.0 unx    58021 Tx defN 19-Jan-15 13:25 file1
-rw-rw-r--  3.0 unx    58933 Tx defN 19-Jan-15 13:34 file2
2 files, 116954 bytes uncompressed, 20991 bytes compressed:  82.1%

El comando zipnote

Si hablamos de zipnote, vemos que se puede utilizar para extraer comentarios de archivos zip o agregarlos. Para mostrar los comentarios, simplemente inicie el nombre del archivo con el comando. Si no se han agregado comentarios anteriormente, verá algo como esto:

1
2
3
4
5
6
$ zipnote twofiles.zip
@ file1
@ (comment above this line)
@ file2
@ (comment above this line)
@ (zip file comment below this line)

Si desea agregar comentarios, escriba la salida del comando zipnote en un archivo:

1
$ zipnote twofiles.zip > comments

A continuación, edite el fichero que acaba de crear e inserte sus comentarios sobre las líneas (comentarios sobre esta línea). Luego agrega los comentarios usando un comando zipnote como este:

1
$ zipnote -w twofiles.zip < comments

El comando zipsplit

El comando zipsplit se puede usar para dividir un fichero zip en múltiples archivos zip, cuando el archivo original es demasiado grande, tal vez porque está intentando agregar uno de los archivos a una pequeña unidad de almacenamiento. La forma más fácil de hacer esto parece ser especificar el tamaño máximo para cada una de las partes del archivo comprimido. Este tamaño debe ser lo suficientemente grande para acomodar el archivo incluido más grande.

1
2
3
4
5
6
7
8
$ zipsplit -n 12000 twofiles.zip
2 zip files will be made (100% efficiency)
creating: twofile1.zip
creating: twofile2.zip
$ ls twofile*.zip
-rw-rw-r-- 1 shs shs  10697 Jan 15 14:52 twofile1.zip
-rw-rw-r-- 1 shs shs  10702 Jan 15 14:52 twofile2.zip
-rw-rw-r-- 1 shs shs  21377 Jan 15 14:27 twofiles.zip

Observe cómo los archivos extraídos se denominan secuencialmente “twofile1” y “twofile2”.

Conclusión

El comando zip, junto con algunos de otros programas similares, proporcionan un gran control sobre cómo generar y trabajar con archivos comprimidos.

Espero que el artículo os haya parecido de interés.

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

ACEPTAR
Aviso de cookies