Red de conocimiento informático - Consumibles informáticos - Formato de codificación de codificación de audio

Formato de codificación de codificación de audio

Este es un formato de archivo de audio antiguo desarrollado por Microsoft. WAV es un formato de archivo que cumple con la especificación riff (Formato de archivo de intercambio de recursos). Todos los wavs tienen un encabezado de archivo que contiene los parámetros de codificación de la transmisión de audio. WAV no tiene reglas estrictas y rápidas para codificar transmisiones de audio. Además de PCM, casi todas las codificaciones que admiten la especificación ACM pueden codificar transmisiones de audio WAV. Muchos amigos no tienen este concepto. Tomemos AVI como ejemplo, porque AVI y WAV son muy similares en estructura de archivos, pero AVI solo tiene una transmisión de video. Hay muchos tipos de AVI a los que estamos expuestos, por lo que a menudo necesitamos instalar algunos decodificadores para ver algunos AVI. El DivX al que estamos expuestos es un tipo de codificación de vídeo. AVI puede usar la codificación DivX para comprimir la transmisión de video; por supuesto, también puede usar otra compresión de codificación. De manera similar, WAV también puede usar una variedad de codificaciones de audio para comprimir su flujo de audio, pero generalmente usamos WAV cuyo flujo de audio ha sido modulado por código de pulso, pero esto no significa que WAV solo pueda usar modulación de código de pulso, y la codificación MP3 también puede ser utilizado en WAV. Al igual que AVI, podrás disfrutar de estos wavs siempre que instales el códec correspondiente.

Bajo la plataforma Windows, WAV basado en modulación de código de pulso es el formato de audio mejor admitido y puede ser perfectamente compatible con todo el software de audio. Debido a que puede cumplir con los requisitos de alta calidad de sonido, WAV es también el formato preferido para la edición y creación de música, y es adecuado para guardar materiales musicales. Por lo tanto, WAV basado en modulación de código de impulsos se utiliza como formato intermedio, que a menudo se utiliza para la interconversión de otras codificaciones, como MP3 a WMA. MP3 es actualmente el formato de compresión de audio más popular y ampliamente aceptado por todos. Varios productos de software relacionados con MP3 están surgiendo uno tras otro, y más productos de hardware están comenzando a admitir MP3. Muchos de los reproductores de VCD/DVD que podemos comprar admiten MP3, y también hay más reproductores de MP3 portátiles, etc. Aunque varios músicos importantes están extremadamente disgustados con este formato abierto, no pueden evitar la supervivencia y difusión de este formato de compresión de audio. MP3 ha estado en desarrollo durante 10 años. Es la abreviatura de MPEG (Moving Picture Experts Group) Audio Layer-3 y es un esquema de codificación derivado de MPEG1. Fue desarrollado con éxito en 1993 por el Instituto Fraunhofer IIS de Alemania y Thomson Corporation. MP3 puede alcanzar una asombrosa relación de compresión de 12:1 y mantener una calidad de sonido audible básica. En una época en la que los discos duros eran caros, los usuarios aceptaron rápidamente el MP3. Con la popularidad de Internet, cientos de millones de usuarios aceptaron el MP3. Cuando se lanzó por primera vez la tecnología de codificación MP3, en realidad era muy imperfecta. Debido a la falta de investigaciones sobre el sonido y la audición humana, los primeros codificadores de MP3 casi siempre codificaban de forma tosca, dañando gravemente la calidad del sonido. Con la introducción continua de nuevas tecnologías, la tecnología de codificación de mp3 se ha mejorado una y otra vez, incluidas dos mejoras técnicas importantes.

Acerca de VBR

VBR: una característica interesante de los archivos MP3 es que se pueden leer y reproducir al mismo tiempo, lo que también está en línea con las características más básicas de los medios de transmisión por secuencias. . Es decir, el reproductor puede reproducir en cualquier lugar que lea, incluso si el archivo está parcialmente dañado, sin leer previamente todo el contenido del archivo. Aunque el mp3 puede tener un encabezado de archivo, no es muy importante para los archivos en formato mp3. Precisamente gracias a esta característica, cada segmento y cada cuadro de un archivo MP3 puede tener una velocidad de datos promedio independiente sin necesidad de un esquema de decodificación especial. Entonces surgió una tecnología llamada VBR (Variable bitrate), que permite que cada segmento o incluso cada cuadro de un archivo MP3 tenga una tasa de bits separada. La ventaja de esto es limitar el tamaño del archivo al máximo y al mismo tiempo garantizar la calidad del sonido. Las ventajas de esta técnica son claras, pero es realmente difícil de usar porque requiere que el codificador sepa cómo asignar la tasa de bits a cada clip, lo cual es como un muñeco para un codificador sin análisis de forma de onda. Así, la tecnología VBR no pareció deslumbrante tan pronto como apareció.

A través de investigaciones acústicas a largo plazo, los expertos han descubierto que existe un efecto de enmascaramiento en el oído humano. Una señal sonora es en realidad una onda de energía que viaja a través del aire u otros medios.

La respuesta más directa del oído humano a la cantidad de energía sonora, es decir, el volumen o la presión sonora, es oír el sonido. Lo llamamos sonoridad y la unidad de sonoridad es decibel (dB). Incluso los sonidos con el mismo volumen se perciben con diferentes tamaños debido a las diferentes frecuencias. La frecuencia de 4000 Hz es la más fácil de escuchar para el oído humano. Ya sea que la frecuencia aumente o disminuya, todos sentirán que el sonido se ha vuelto más pequeño incluso si el volumen es el mismo. Pero cuando el volumen baja a cierto nivel, la gente ya no puede oírlo y cada frecuencia tiene un valor diferente.

Se puede observar que esta curva tiene básicamente forma de V. Cuando la frecuencia supera los 15000 Hz, la gente sentirá que el sonido es muy pequeño. Muchas personas con problemas de audición no pueden oír la frecuencia de 20.000 Hz en absoluto, por muy fuerte que sea el sonido. Cuando el oído humano escucha dos sonidos de diferente frecuencia y volumen al mismo tiempo, el de menor volumen también será ignorado. Por ejemplo, nos resulta difícil escuchar el sonido del ventilador de refrigeración del ordenador durante el día, pero por la noche se convierte en una fuente de ruido. Según este principio, el codificador puede filtrar muchos sonidos inaudibles para simplificar la complejidad de la información y mejorar la relación de compresión sin reducir significativamente la calidad del sonido. Este efecto de enmascaramiento se denomina efecto de enmascaramiento simultáneo. Pero el sonido A será bloqueado por el sonido B. Si A está dentro del rango de enmascaramiento centrado en B, el enmascaramiento será más obvio. Este rango se denomina ancho de banda crítico. El ancho de banda crítico es diferente para cada frecuencia. Cuanto mayor sea la frecuencia, más amplio será el ancho de banda crítico.

Frecuencia (Hz) Ancho de banda crítico (Hz) Frecuencia (Hz) Ancho de banda crítico (Hz)

Basándose en este efecto, los expertos han diseñado un modelo psicológico de la audición humana. Después de la introducción de la codificación mp3 en este modo, se desencadenó una revolución en la calidad del sonido. La tecnología de codificación MP3 siempre ha sido conocida por su mala calidad de sonido, pero esta reputación ha ido desapareciendo gradualmente. En este punto, la tecnología VBR que ha sido enterrada brilla intensamente, sumada a la aplicación de modelos mentales, tiene una fuerte tentación y letalidad.

Durante mucho tiempo, mucha gente tiene una mala impresión del MP3 y cada vez más gente piensa que la mejor calidad de sonido de WMA es mejor que la de MP3. Esta afirmación es incorrecta. A velocidades de bits medias y altas, el MP3 correctamente codificado es mucho mejor que el WMA y puede acercarse mucho a la calidad de sonido del CD. Con un soporte de hardware deficiente, no mucha gente puede notar la diferencia entre los dos. Esto no es un cuento de hadas. Aunque en el pasado se podían distinguir fácilmente los MP3 y los CD escuchando a ciegas, ahora es difícil garantizar que se puedan distinguir correctamente. Debido a que MP3 es una codificación excelente, fue enterrado antes. Hay una codificación de audio en Internet llamada Ogg Vorbis, ¡conocida como el asesino del MP3! ¿De dónde vino Ogg Vorbis? OGG es el nombre del proyecto de un enorme plan de desarrollo multimedia que implicará el desarrollo de codificación para vídeo y audio. ¡El propósito de todo el proyecto OGG es proporcionar una solución de codificación multimedia completamente gratuita para cualquier persona! La creencia de OGG es: ¡apertura! ¡gratis! Vorbis es el nombre de un playboy en la novela de fantasía de Terry Platt "Little Gods". Este término se convirtió en el nombre oficial de la codificación de audio en el proyecto OGG. En la actualidad, Vorbis se ha desarrollado con éxito y se ha desarrollado el codificador.

Ogg Vorbis es un esquema de codificación de audio de alta calidad. Los datos oficiales muestran que Ogg Vorbis puede lograr una mejor calidad de sonido que el MP3 con una velocidad de datos relativamente baja. Ogg Vorbis también es mucho más avanzado que el MP3 que se desarrolló con éxito en los años 1990. Puede admitir múltiples canales. ¿Qué quiere decir esto? Esto significa que Ogg Vorbis puede codificar todos los canales con soporte para SACD, DTSCD y DVD Audio (aún no), a diferencia de MP3 que sólo codifica dos canales. El auge de la música multicanal ha traído cambios revolucionarios en la apreciación de la música, especialmente cuando se escuchan sinfonías, lo que traerá una mayor sensación de presencia. Este cambio revolucionario va más allá de la adaptabilidad del MP3.

Al igual que MP3, Ogg Vorbis es una codificación de audio flexible y abierta. Cuando el esquema de codificación es fijo, la calidad del sonido se puede ajustar significativamente y se pueden mejorar nuevos algoritmos. Entonces su calidad de sonido será cada vez mejor. Al igual que MP3, Ogg Vorbis se parece más a un marco de codificación de audio que puede mejorarse continuamente mediante la introducción de nuevas tecnologías.

Al igual que MP3, OGG es compatible con VBR. Como se mencionó anteriormente, los archivos WAV modulados por código de pulso son el formato con mejor calidad de sonido. En la plataforma Windows, todo el software de audio puede brindarle soporte. Hay muchas funciones en WinAPI proporcionadas por Windows que pueden reproducir wav directamente. Por lo tanto, al desarrollar software multimedia, WAV suele utilizarse ampliamente como efectos de sonido de eventos y música de fondo. WAV modulado por código de pulso puede lograr la mejor calidad de sonido con la misma frecuencia de muestreo y tamaño de muestra, por lo que también se usa ampliamente en edición de audio, edición no lineal y otros campos.

Características: Muy buena calidad de sonido, respaldado por una gran cantidad de software.

Adecuado para: desarrollo multimedia y conservación de materiales musicales y de efectos sonoros. La relación de compresión de MP3 es muy buena y el MP3 codificado con LAME con velocidad de bits media y alta está muy cerca del archivo WAV de origen. Con los parámetros adecuados, el MP3 codificado con LAME es perfecto para apreciar la música. Debido a que el MP3 existe desde hace mucho tiempo y su calidad de sonido y relación de compresión son bastante buenas, muchos juegos también usan MP3 para efectos de sonido de eventos y música de fondo. Casi todos los programas de edición de audio conocidos también son compatibles con mp3, que se puede utilizar como wav. Sin embargo, debido a la pérdida de codificación mp3, la calidad del sonido disminuirá drásticamente después de varias ediciones. El MP3 no es adecuado para guardar materiales, pero sí es excelente como demostración del trabajo. MP3 tiene una larga historia y buena calidad de sonido. Es una de las codificaciones con pérdida más utilizadas. En Internet se puede encontrar una gran cantidad de recursos mp3 y los reproductores MP3 están cada vez más de moda. Muchos VCDPlayer, DVDPlayer e incluso teléfonos móviles pueden reproducir mp3, que es uno de los códigos mejor compatibles. MP3 no es perfecto y no funciona bien a velocidades de bits más bajas. MP3 también tiene las características básicas de los medios de transmisión y se puede reproducir en línea.

Características: buena calidad de sonido, alta relación de compresión, amplio soporte de software y hardware y amplia aplicación.

Adecuado para: Adecuado para personas exigentes en apreciación musical. Ogg es una codificación con gran potencial y tiene un rendimiento sorprendente en varias velocidades de bits, especialmente en velocidades de bits medias y bajas. Además de una buena calidad de sonido, ogg es una codificación completamente gratuita, lo que sienta una buena base para que Ogg reciba más soporte. Ogg tiene un algoritmo excelente que puede lograr una mejor calidad de sonido con una velocidad de bits menor. Ogg a 128 kbps es mejor que mp3 a 192 kbps o velocidades de bits incluso superiores. Los agudos de Ogg tienen un cierto sabor metálico, por lo que este defecto de Ogg quedará expuesto al codificar algunos instrumentos solistas con requisitos de alta frecuencia. Ogg tiene las características básicas de la transmisión de medios, pero no tiene soporte de software de servicio de medios, por lo que no se puede realizar la transmisión digital basada en OGG. El soporte actual de Ogg no es lo suficientemente bueno, ni el software ni el hardware pueden igualar el mp3.

Características: Puede lograr una mejor calidad de sonido que MP3 a velocidades de bits más bajas y tiene un buen rendimiento a velocidades de bits altas, medias y bajas.

Adecuado para: mejor calidad de sonido, menos espacio de almacenamiento (en comparación con MP3). Al igual que Ogg, el competidor de MPC es el mp3. A velocidades de bits medias y altas, MPC puede lograr una mejor calidad de sonido que sus competidores. A velocidades de bits medias, MPC funciona tan bien como Ogg. A velocidades de bits altas, el rendimiento del MPC es aún más decepcionante. La ventaja de calidad de sonido del MPC se refleja principalmente en la parte de alta frecuencia. La alta frecuencia del MPC es mucho más delicada que la del MP3 y no tiene el sabor metálico del OGG. Actualmente es la codificación con pérdida más adecuada para la apreciación musical. Debido a que todos son códigos nuevos, similares a Ogg, también carecen de soporte extenso de software y hardware. MPC tiene una buena eficiencia de codificación y el tiempo de codificación es mucho más corto que OGG y Lame.

Características: A velocidades de bits medias y altas, la codificación con pérdida tiene la mejor calidad de sonido y, a velocidades de bits altas, el rendimiento de alta frecuencia es excelente.

Adecuado para: Disfrutar de la música con la mejor calidad de sonido ahorrando mucho espacio. Muchos amigos también adoran WMA desarrollado por Microsoft. A velocidades de bits bajas, tiene una calidad de sonido mucho mejor que el mp3. La aparición de WMA eliminó inmediatamente la alguna vez popular codificación VQF. WMA con experiencia en Microsoft ha recibido un buen soporte de software y hardware, por lo que Windows Media Player puede reproducir WMA y escuchar estaciones de radio digitales basadas en tecnología de codificación WMA.

Debido a que el reproductor existe en casi todas las PC, cada vez más sitios web de música están dispuestos a utilizar WMA como su primera opción para escuchar en línea. Además de un buen entorno de soporte, WMA también funciona bastante bien a velocidades de bits de 64-128 kbps. Aunque muchos amigos con requisitos altos no quedaron satisfechos, más amigos con requisitos bajos aceptaron esta codificación y WMA rápidamente se hizo popular.

Características: La calidad del sonido a velocidades de bits bajas es difícil de igualar.

Adecuado para: configuración de radio digital, escucha en línea y apreciación musical menos exigente. Como versión mejorada de mp3, mp3PRO ha mostrado una calidad de sonido bastante buena, con agudos completos. Aunque mp3PRO se inserta durante la reproducción mediante tecnología SBR, la experiencia auditiva real es bastante buena. Aunque parece un poco delgado, no tiene rival en el mundo de los 64 kbps e incluso supera al MP3 a 128 kbps. Es una pena que el rendimiento de baja frecuencia de mp3PRO sea tan pobre como el de mp3. Afortunadamente, la interpolación de alta frecuencia de SBR puede encubrir más o menos este defecto, por lo que la debilidad de baja frecuencia de mp3PRO no es tan obvia como la de WMA. Puedes sentir esto profundamente cuando usas el interruptor PRO del reproductor de audio RCA mp3PRO para cambiar entre el modo PRO y el modo normal. En términos generales, el mp3PRO de 64kbps alcanza el nivel de calidad de sonido de un mp3 de 128kbps, con una ligera ventaja en la parte de altas frecuencias.

Características: Rey de la calidad de sonido a baja tasa de bits.

Adecuado para: apreciación musical menos exigente. Una nueva codificación de audio sin pérdidas que puede proporcionar una relación de compresión de 50-70, que no vale la pena mencionar en comparación con la codificación con pérdidas, pero es una gran ayuda para los amigos que buscan una calidad de sonido perfecta. APE puede ser verdaderamente sin pérdidas, no sólo el sonido no tiene pérdidas, sino que también tiene una mejor relación de compresión que formatos similares sin pérdidas.

Características: Muy buena calidad de sonido.

Adecuado para: apreciación y colección de música de la más alta calidad.