¿Qué formato es zip?
¿Qué es el formato zip? El formato de archivo ZIP es un formato de archivo de compresión de datos y almacenamiento de documentos. Su predecesor es Deflate, inventado por Phil Katz.
Lo lanzó en enero de 1989. el formato. ZIP suele utilizar la extensión ".zip" ZIP suele utilizar la extensión ".zip" y su formato MIME es aplicación/zip. Actualmente, el formato ZIP es uno de varios formatos de compresión convencionales; sus competidores incluyen el formato RAR y el formato de código abierto 7z. Desde el punto de vista de la comparación de rendimiento, la tasa de compresión de los formatos RAR y 7z es mayor que la del formato ZIP, y 7-Zip se utiliza gradualmente en más campos porque proporciona herramientas de compresión gratuitas. Microsoft tiene soporte integrado para el formato zip a partir del sistema operativo Windows ME, de modo que incluso si el usuario no tiene un software de descompresión instalado en la computadora, puede abrir y crear formatos zip OS X y los sistemas operativos populares Linux. También proporciona soporte para formatos zip similares. Por lo tanto, si desea distribuir y difundir archivos a través de Internet, el formato zip suele ser la opción más común.
Introducción técnica
ZIP es un formato de archivo bastante simple que comprime cada archivo individualmente. La compresión de archivos individualmente permite la recuperación de archivos independientes sin leer datos adicionales, en teoría, este formato permite el uso de diferentes algoritmos para diferentes archivos. Independientemente del método utilizado, una advertencia sobre el formato es que cuando contiene muchos archivos pequeños, el archivo tar será mucho más grande que cuando se comprime en un solo archivo (un ejemplo típico en sistemas tipo Unix es el paquete comprimido común tar.gz, que consiste en un paquete comprimido TAR usando compresión gzip).
Los estatutos de ZIP establecen que los archivos se pueden almacenar sin compresión o utilizando un algoritmo de compresión diferente. Pero en aplicaciones prácticas, ZIP casi siempre utiliza el algoritmo DEFLATE de Katz.
ZIP admite contraseñas simples basadas en un sistema de cifrado simétrico que ha conocido fallas graves, ataques de texto sin formato, ataques de diccionario y ataques de fuerza bruta.
Recientemente, ZIP ha agregado algunas funciones nuevas, incluidos nuevos métodos de compresión y cifrado, pero estas nuevas funciones no son compatibles con muchas tareas y no se utilizan ampliamente.
Desventajas:
Debido a su temprana aparición en el mercado, los archivos Zip actuales tienen muchas desventajas que no se pueden ignorar en comparación con otros formatos de compresión.
Dado que no es compatible con Unicode, es difícil compartir recursos, especialmente en las culturas del este de Asia; la relación de compresión no se puede comparar con 7z y no admite la reparación de registros de recuperación (como WinRAR). , lo que también contribuyó a su caída.
Métodos de compresión
Los métodos disponibles son los siguientes:
Contracción (Método 1)
La contracción es una variante del ajuste menor LZW , también afectado por problemas de patentes de LZW. No ha quedado claro si la patente cubre la funcionalidad anti-contracción, pero algunos proyectos de código abierto como Info-ZIP han decidido pecar de cautelosos y no incluir soporte anti-contracción en sus estructuras predeterminadas.
Reducción de tamaño (métodos 2 a 5)
La reducción implica comprimir una combinación de secuencias de bytes repetidas y luego aplicar una codificación basada en probabilidad al resultado.
Implosión (Método 6)
La implosión implica comprimir una secuencia repetitiva de bytes usando una ventana deslizante y luego comprimir el resultado usando múltiples árboles de Shannon-Fano.
Tokenización (Método 7)
El número de métodos para la tokenización está reservado; la normativa PKWARE no define un algoritmo para ello.
Deflate y Deflate mejorado (Métodos 8 y 9)
Estos métodos utilizan el conocido algoritmo Deflate. Enhanced Deflate permite ventanas de hasta 64K.
Enhanced Deflate permite ventanas de hasta 64K. Enhanced Deflate es ligeramente mejor a la hora de hacer el trabajo, pero no cuenta con un apoyo tan amplio.
El tamaño de comparación de Deflate es 52,1 MiB (probado usando pkzip para Windows, versión 8.00.0038)
El tamaño de comparación de Deflate mejorado es 52,8 MiB (probado usando pkzip para Windows, version 8.00) .0038)
Imploding de la biblioteca de compresión de datos PKWARE (Método 10)
Imploding de la biblioteca de compresión de datos PKWARE (especificación oficial del formato ZIP) no proporciona más información al respecto.
El tamaño comparativo es 61,6MiB (probado usando pkzip para Windows, versión 8.00.0038, modo binario seleccionado)
Método 11
Este método está reservado por PKWARE .
Bzip2 (Método 12)
Este método utiliza el conocido algoritmo bzip2. Este algoritmo es más eficiente que desinflar, pero no es compatible con la herramienta (basada en Windows).
El tamaño comparativo es 50,6MiB (probado usando pkzip para Windows, versión 8.00.0038)