Introducción a los formatos de compresión de vídeo HD
Esta es una forma de codificación más antigua, un estándar de compresión lanzado en 1994 por el Grupo de Expertos en Imágenes en Movimiento (MPEG).
Debido a la baja relación de compresión, ya es relativamente raro. Generalmente, el tamaño de una película de 120 minutos a 1080p en este formato es de aproximadamente 30G. MPEG-4 se usa principalmente en HDTVrip y es raro usar la compresión de video MPEG-4 directamente en HDTV. La codificación MPEG-4 de HDTVrip puede entenderse como: reducir el archivo HDTV original a un cierto tamaño en proporción, para reducir el tamaño del archivo y facilitar la transmisión sin que el efecto de la imagen sea inferior al del DVD. Se puede decir que este formato de codificación busca lograr un equilibrio entre el efecto de la imagen y el tamaño del archivo.
Debido a disputas entre varios grupos empresariales, el estándar MPEG-4 es relativamente confuso. Los estándares comunes basados principalmente en MPEG-4 incluyen DivX y XviD.
DivX es una tecnología de compresión multimedia digital similar al MP3 inventada por DivXNetworks. Desde que Divx se convirtió más tarde en un software comercial, su desarrollo se vio muy restringido, su rendimiento fue relativamente pobre y gradualmente quedó en desventaja frente a la competencia.
XviD es un decodificador multimedia MPEG-4 de código abierto, escrito en base a OpenDivX. XviD fue desarrollado por un grupo de desarrolladores voluntarios originales de OpenDivX después de que OpenDivX dejara de desarrollarse en julio de 2001, y se utiliza ampliamente. Una película de 720p de 90 minutos tiene aproximadamente 4,3G y la imagen es de 80~90 de 1080p normal.
MPEG-4 tiene muchas ventajas. Su tasa de compresión puede superar las 100 veces y al mismo tiempo mantener una excelente calidad de sonido e imagen; puede utilizar la menor cantidad de datos para obtener la mejor calidad de imagen para satisfacer las necesidades de aplicaciones de baja tasa de bits; es más adecuado para servicios AV interactivos y monitoreo remoto; Los detalles son los siguientes:
1. Codificación de formas
Para obtener información de formas, primero debemos analizar y segmentar los gráficos, segmentar cada objetivo que represente contenido diferente y luego usar formas para representarlos. La información de forma suele estar representada por un
plano alfa binario. El plano Alfa binario se puede codificar aritméticamente con información de proximidad (CAE); el plano Alfa en escala de grises se puede codificar con compensación de movimiento más transformación DCT similar a la codificación de texturas.
Las transformaciones utilizadas para la compresión de imágenes incluyen la transformada de Forier discreta (DFT), la transformada de wavelet discreta (DWT), la descomposición de valores singulares (SVD), la transformada K-L, la transformada de Walsh, la transformada de Hadamard, la transformada de Harr, la transformada Slant, transformada de coseno discreta (DCT). Entre ellas, la transformada K-L tiene la mejor descorrelación y DCT es la transformación más conveniente que se acerca al efecto de la transformada K-L. Al igual que MPEG-1/2, MPEG-4 también eligió DCT. Generalmente, los métodos de codificación entrópica utilizados para la compresión de datos incluyen codificación Huffman, cuantificación vectorial, codificación aritmética, codificación de longitud de ejecución, codificación LZW, etc. Para la codificación de texturas, MPEG-4 optó por realizar codificación de programación híbrida (VLC) en codificación de longitud de ejecución, cuantificación de vectores y codificación de Huffman. La codificación de texturas requiere transformación DCT, cuantificación, predicción DC/AC, escaneo y codificación VLC basada en Hufman.
2. Estimación y compensación de movimiento
MPEG-4 proporciona tecnología de compensación y estimación de movimiento basada en bloques para utilizar de manera efectiva la redundancia temporal del contenido de video en cada VOP. En general, la estimación y compensación del movimiento puede verse como una extensión de las técnicas de coincidencia de bloques para secuencias de imágenes con formas arbitrarias. El proceso de coincidencia de bloques se utiliza para macrobloques estándar; el error de predicción se codifica junto con el vector de movimiento de macrobloque utilizado para la predicción; el modo de compensación de movimiento avanzado admite compensación de movimiento de bloques superpuestos y puede codificar vectores de movimiento de bloques de 8 × 8.
Para lograr una alta eficiencia de codificación para la estimación del movimiento, cuanto más similares sean la imagen predicha y la imagen predicha, mejor, por lo que se debe realizar una compensación antes de la estimación del movimiento. Los MB en el límite objetivo se llenan primero horizontalmente y luego verticalmente, y los MB restantes completamente fuera del VOP se llenan con expansión.
3. Codificación de textura
La textura se refiere a la información de la imagen que queda después de la compensación de movimiento de imágenes I-VOP y P/B-VOP. Las texturas generalmente se comprimen y se codifican con entropía en el dominio de transformación. Se han publicado ediciones cuasi formales: Estándar de codificación de compresión de imágenes fijas (JPEG); Estándar de codificación de compresión de almacenamiento audiovisual digital (MPEG-1); Estándar universal de codificación de compresión de imágenes de video (MPEG-2).
Posteriormente, el grupo de expertos en MPEG anunció oficialmente la versión MPEG-4 (ISO/IEC14496) V1.0 en febrero de 1999. A finales del mismo año, también se completó la versión MPEG-4V2.0 y se convirtió oficialmente en un estándar internacional a principios de 2000. El estándar MPEG-4 integra muchas aplicaciones multimedia en un marco completo, con el objetivo de proporcionar algoritmos y herramientas estándar para entornos de aplicaciones y comunicaciones multimedia, estableciendo así un algoritmo que pueda usarse ampliamente en la transmisión, el almacenamiento y la recuperación de datos multimedia. El formato está unificado y los decodificadores se pueden configurar en el sitio de acuerdo con los diferentes requisitos de la aplicación. También se pueden agregar módulos de algoritmos nuevos y efectivos al sistema de codificación abierta en cualquier momento. Para permitir el acceso al contenido de vídeo, MPEG-4 propuso el concepto de "objeto de vídeo".
4. Flexibilidad
El grupo de expertos MPEG ha lanzado el esquema de codificación MPEG-7 y el estándar de marco multimedia MPEG-21 que admiten específicamente información multimedia y se basan en la recuperación de contenido. Además, el nuevo estándar H.264 desarrollado conjuntamente por ITU-T y MPEG es el último algoritmo de codificación de vídeo. Para reducir la tasa de bits y obtener la mejor calidad de imagen posible, el estándar H.264 aprovecha los puntos fuertes del MPEG-4, tiene una mayor relación de compresión y una mejor adaptabilidad de canales, y seguramente ganará terreno en el campo del vídeo digital. comunicación y almacenamiento. Tiene una amplia gama de aplicaciones y su potencial de desarrollo es ilimitado.
La flexibilidad del vídeo incluye flexibilidad de espacio y flexibilidad de tiempo. Se pueden obtener diferentes resoluciones espaciales mediante extensión y flexibilidad espacial, y se pueden obtener diferentes resoluciones temporales mediante extensión y flexibilidad de tiempo. Cada tipo de estiramiento y flexión tiene múltiples capas. Cuando solo hay dos capas, alta y baja, la capa inferior se refiere a la capa básica y la capa alta se refiere a la capa de refuerzo.
5. Evitar errores
Un error de bit en el código VLC provocará una pérdida de sincronización y la compensación de movimiento provocará una transmisión de error. La prevención de errores MPEG-4 tiene tres aspectos: resincronización, recuperación de datos y ocultación de errores. La resincronización se refiere a la tecnología de resincronizar el decodificador y el flujo de código después de que se detecta el error. En términos generales, este método descarta datos entre el punto de sincronización antes del error y el punto de sincronización reconstruido. Sin embargo, estos datos descartados se pueden recuperar y ocultar el error utilizando otras técnicas. Las herramientas de recuperación de datos se utilizan para recuperar datos descartados después de que se restablece la sincronización entre el decodificador y el tren codificado. Estas herramientas no utilizan simplemente la recuperación de código tolerante a errores, sino que utilizan un método para evitar errores, es decir, utilizan palabras de código VLC reversibles para la codificación VLC. Los errores están ocultos y se pueden manejar fácilmente después de que la resincronización los localice de manera efectiva. Para mejorar aún más la capacidad de ocultación de errores, es necesario aumentar la capacidad de localización de errores. En particular, se puede utilizar la segmentación de datos para mejorar la capacidad de localización de errores.
En resumen, para satisfacer las necesidades de diversas aplicaciones, el estándar MPEG-4 tiene un amplio alcance de uso y una amplia adaptabilidad y escalabilidad. El nombre completo es VC-1 Video Codec 1, que es un sistema de códec de vídeo desarrollado por Microsoft. VC-1 es el último formato de codificación de alta definición reconocido, pero debido a los antecedentes de Microsoft, este formato de codificación no se puede ignorar. En comparación con MPEG2, VC-1 tiene una relación de compresión más alta, pero en comparación con H.264, los cálculos de codificación y decodificación son ligeramente menores. En la actualidad, VC-1 puede tener un mejor equilibrio. Generalmente, una película de 1080p y 120 minutos pesa aproximadamente 26G.