Red de conocimiento informático - Material del sitio web - ¿Qué es el "formato de audio" en las computadoras? Explíquelo con un ejemplo.

¿Qué es el "formato de audio" en las computadoras? Explíquelo con un ejemplo.

Primero conozca algunos términos:

Frecuencia de muestreo:

El sistema de audio digital reproduce el sonido original convirtiendo la forma de onda del sonido en una serie de datos binarios. El equipo utilizado para implementar este paso es un convertidor analógico/digital (A/D), que muestrea ondas sonoras a una velocidad de decenas de miles de veces por segundo. Cada muestra registra el estado de la onda sonora analógica original en un momento determinado. , que se llama para muestras.

Al conectar una serie de muestras, se puede describir una onda sonora. El número de muestras por segundo se denomina frecuencia de muestreo o tasa de muestreo, y la unidad es HZ (Hercios). Cuanto mayor sea la frecuencia de muestreo, mayor será la frecuencia de las ondas sonoras que se pueden describir. Para cada sistema de muestreo, se asigna un determinado bit de almacenamiento (número de bits) para expresar el estado de amplitud de la onda de sonido, lo que se denomina resolución de muestreo o precisión de muestreo. Cada vez que se agrega un bit, se expresa el número de estados. la amplitud de la onda de sonido se duplica y agregue 6 dB de estado de rango dinámico, es decir, un rango dinámico de 6 dB. Un sistema de audio digital de 2 bits puede expresar miles de estados, es decir, un rango dinámico de 12 dB, y así sucesivamente. Si continúa aumentando el número de bits, la precisión del muestreo aumentará muy rápidamente. Se puede calcular que 16 bits pueden expresar 65536 estados, correspondientes a 96 dB, mientras que 20 bits pueden expresar 1048576 estados, correspondientes a 120 dB. 24 bits pueden expresar hasta 16777216 estados. Correspondiente a un rango dinámico de 144 dB, cuanto mayor sea la precisión del muestreo, más delicada será la restauración de la onda sonora. (Nota: el rango dinámico se refiere al rango de sonido desde el más débil al más fuerte) El rango de audición del oído humano suele ser de 20 HZ ~ 20 KHZ.

Según el teorema de muestreo de NYQUIST, el muestreo al doble de la frecuencia de una onda sinusoidal puede restaurar completamente la forma de onda. Por lo tanto, la frecuencia de muestreo de una onda de grabación digital está directamente relacionada con, por ejemplo, si se utiliza un. frecuencia de muestreo de 44,1 KHZ para el muestreo, puede restaurar una frecuencia de hasta 22,05 KHZ ----- este valor es ligeramente superior al límite auditivo del oído humano (Nota: MD se puede grabar, por ejemplo, la frecuencia de muestreo. de R900 es de 44,1 KHZ y tiene un convertidor de frecuencia de muestreo que puede convertir la entrada de 32 KHz/44,1 KHZ/48 KHZ en la frecuencia de muestreo estándar de la máquina de 44,1 KHZ. La frecuencia de restauración es suficiente para grabar y reproducir verdaderamente el sonido de todos en el mundo. Se puede distinguir, por lo que la especificación de muestreo del audio del CD se define como 16 bits. Incluso si la grabación de 16 bits realmente se realiza utilizando componentes electrónicos de alta precisión que son casi imposibles de fabricar en la vida real en el entorno más ideal, aún se verá afectada. Afectados por problemas como el filtrado y el posicionamiento específico del sonido, las personas aún pueden detectar una ligera distorsión, por lo que muchos sistemas de audio digital profesionales han utilizado 18 bits o incluso 24 bits para la grabación y reproducción.

Métodos de muestreo existentes:

MP3: El nombre completo de MP3 debe ser archivo de audio MPEG1 Layer-3. MPEG (Moving Picture Experts Group) se traduce como Moving Picture Experts Group en chino, refiriéndose específicamente al estándar de compresión de audio y video en movimiento. El archivo es el estándar MPEG1. La parte de sonido también se llama capa de audio MPEG. Se divide en tres capas según la calidad de la compresión y la complejidad de la codificación, a saber, Capa-1, Capa2 y Capa3, y corresponden a los tres archivos de sonido de. MP1, MP2 y MP3 respectivamente, y según diferentes El propósito es utilizar diferentes niveles de codificación. Cuanto mayor sea el nivel de codificación de audio MPEG, más complejo será el codificador y mayor será la tasa de compresión de MP1 y MP2. son 4:1 y 6:1-8:1 respectivamente, mientras que MP3 La relación de compresión es tan alta como 10:1-12:1, lo que significa que un minuto de música con calidad de CD requiere 10 MB de espacio de almacenamiento sin compresión, pero sólo alrededor de 1 MB después de la codificación de compresión MP3.

Sin embargo, MP3 utiliza un método de compresión con pérdida para las señales de audio. Para reducir la distorsión del sonido, MP3 adopta una "tecnología de codificación sensorial", es decir, al codificar, el archivo de audio se somete primero a un análisis de espectro y luego se utiliza un filtro. filtre el nivel de ruido y luego, a través de la cuantificación, cada bit restante se dispersa y organiza, y finalmente se forma un archivo MP3 con una relación de compresión más alta, de modo que el archivo comprimido pueda lograr un efecto de sonido más cercano a la fuente de sonido original. durante la reproducción. (Otro MP3PRO: el codificador mp3PRO divide la grabación de audio en dos partes: la parte mp3 y la parte PRO. La parte mp3 analiza la información de la banda de baja frecuencia (Banda de baja frecuencia) y la codifica en el flujo de datos habitual del archivo mp3. Esto hace que la codificación El codificador puede concentrarse en codificar información menos útil y obtener resultados de codificación de mejor calidad. Al mismo tiempo, esto también garantiza la compatibilidad de los archivos mp3PRO con reproductores de mp3 antiguos. La parte PRO analiza la información de la banda de alta frecuencia (Banda de alta frecuencia). y codificarlo en una parte del flujo de datos mp3, que generalmente se ignora en el antiguo decodificador de mp3. El nuevo decodificador mp3PRO utilizará efectivamente esta parte del flujo de datos para convertir los dos segmentos (banda de alta frecuencia y banda de baja frecuencia). ) se combinan para producir una banda de audio completa para lograr el efecto de una calidad de sonido mejorada.

WMA: WMA es el formato de archivo codificado por Windows Media Audio. en el mercado independiente, ¡pero en la red! El competidor es Real Networks, una empresa muy conocida en el mercado de los medios online. Microsoft afirma que WMA puede lograr una calidad de sonido cercana a la del CD a una velocidad de bits de sólo 64 kbps. A diferencia de las codificaciones anteriores, WMA admite la función anticopia. Admite agregar protección a través de Windows Media Rights Manager, que puede limitar el tiempo de reproducción, los tiempos de reproducción e incluso las máquinas de reproducción, etc. WMA admite la tecnología de transmisión, es decir, reproducir mientras se lee, por lo que WMA puede realizar fácilmente la transmisión en línea. Dado que es una obra maestra de Microsoft, Microsoft ha agregado soporte para WMA en Windows con excelentes características técnicas. El formato es aceptado por cada vez más personas.

WAV: Es un formato de archivo de audio antiguo desarrollado por Microsoft. WAV es un formato de archivo que cumple con la especificación de formato de archivo de intercambio de recursos PIFF. Todos los WAV tienen un encabezado de archivo que contiene los parámetros de codificación de la transmisión de audio. WAV no tiene reglas estrictas para codificar transmisiones de audio. Además de PCM, casi todas las codificaciones que admiten la especificación ACM pueden codificar transmisiones de audio WAV. Muchos amigos no tienen este concepto. Usemos AVI como ejemplo, porque AVI y WAV son muy similares en estructura de archivos, pero AVI solo tiene una transmisión de video más. Hay muchos tipos de AVI a los que estamos expuestos, por lo que a menudo necesitamos instalar algún Decode para ver algunos DivX, a los que estamos más expuestos, es una codificación de video que AVI puede usar codificación DivX para comprimir la transmisión de video. Por supuesto, también se pueden utilizar otros métodos de compresión de codificación. De manera similar, WAV también puede usar una variedad de codificaciones de audio para comprimir su transmisión de audio. Sin embargo, lo que comúnmente vemos son WAV cuyas transmisiones de audio están codificadas por PCM. Sin embargo, esto no significa que WAV solo pueda usar codificación MP3. También se puede utilizar en WAV, al igual que AVI, siempre que esté instalado el Decode correspondiente, podrás disfrutar de estos WAV. En la plataforma Windows, WAV basado en codificación PCM es el mejor formato de audio compatible y puede ser perfectamente compatible con todo el software de audio. Dado que puede cumplir con requisitos de calidad de sonido más altos, WAV también es el formato preferido para editar y crear música. material musical. Por lo tanto, WAV basado en codificación PCM se utiliza como formato intermediario y, a menudo, se utiliza en la conversión mutua de otras codificaciones, como MP3 a WMA.

Ogg Vorbis: ¡Conocido como el asesino del MP3! ¿Cuál es el origen de Ogg Vorbis? OGG es el nombre del proyecto de un enorme plan de desarrollo multimedia, que implicará el desarrollo de codificación en aspectos como vídeo y audio. ¡El propósito de todo el plan del proyecto OGG es proporcionar una solución de codificación multimedia completamente gratuita para cualquier persona! La creencia de OGG es: ¡ABIERTO! ¡GRATIS! La palabra Vorbis es el nombre de un personaje 'playboy' de la novela de fantasía Small Gods de Terry Plattschild. Este término se convirtió en el nombre oficial de la codificación de audio en el proyecto OGG. En la actualidad, Vorbis se ha desarrollado con éxito y se ha desarrollado un codificador. Ogg Vorbis es un esquema de codificación de audio de alta calidad. Los datos oficiales muestran que Ogg Vorbis puede lograr una mejor calidad de sonido que MP3 a una velocidad de datos relativamente baja. La codificación de Ogg Vorbis también es mucho más avanzada que la del MP3 que se desarrolló con éxito en la década de 1990. Puede admitir múltiples canales. Esto significa que Ogg Vorbis puede codificar todos los canales con el soporte de software de extracción SACD, DTSCD y DVD AUDIO (actualmente no existe tal software), en lugar de MP3, que solo puede codificar 2 canales. El auge de la música multicanal ha traído cambios revolucionarios en la apreciación de la música, especialmente al escuchar sinfonías, traerá una mayor sensación de presencia. El MP3 no puede adaptarse a este cambio revolucionario. Al igual que MP3, Ogg Vorbis es una codificación de audio abierta y flexible que puede ajustar significativamente la calidad del sonido y mejorar el nuevo algoritmo una vez que se ha corregido el esquema de codificación. Por lo tanto, su calidad de sonido mejorará cada vez más. Al igual que MP3, Ogg Vorbis es más como un marco de codificación de audio que puede introducir continuamente nuevas tecnologías y mejorarlas gradualmente. Al igual que MP3, OGG también es compatible con VBR.

RA: RA es el formato RealAudio. Este es un formato al que los internautas están muy expuestos. La mayoría de los sitios web de música utilizan RealAudio para escuchar en línea. Este formato está completamente dirigido al mercado de medios. Funciones ricas. El mayor punto brillante es que este formato puede controlar su propia velocidad de bits de acuerdo con el ancho de banda de la audiencia, mejorando la calidad del sonido tanto como sea posible y garantizando la suavidad. RA puede admitir múltiples codificaciones de audio, incluido ATRAC3. Al igual que WMA, RA no solo admite lectura y reproducción, sino que también admite el uso de un protocolo especial para ocultar la dirección de red real del archivo, permitiendo así la reproducción en línea sin descargarlo. Esto es muy importante para las compañías discográficas y las empresas de venta de discos. Con la vigorosa promoción de todas las partes, RA y WMA son actualmente los formatos de medios de audio más populares utilizados para escuchar en línea en Internet.

APE: APE es un formato de compresión sin pérdidas proporcionado por Monkey's Audio. Monkey's Audio proporciona compatibilidad con el complemento Winamp, lo que significa que el archivo comprimido ya no es un formato de compresión simple, sino un formato de archivo de audio que se puede reproducir como MP3. La relación de compresión de este formato es mucho menor que la de otros formatos, pero puede no tener pérdidas, por lo que se ha ganado el favor de muchos usuarios entusiastas. Entre los muchos esquemas de compresión sin pérdidas existentes, APE es un formato con un rendimiento sobresaliente, una relación de compresión satisfactoria y una velocidad de compresión rápida, que se ha convertido en la única opción para que muchos amigos se comuniquen en privado sobre la música febril.

ACC: AAC (Advanced Audio Coding) es una tecnología proporcionada por Dolby Laboratories a la comunidad musical. AAC afirma que "puede alojar hasta 48 canales de pistas de audio, con una frecuencia de muestreo de 96 KHz, y puede proporcionar programas de música de 5.1 canales con una calidad equivalente a la transmisión del ITU-R a una velocidad de datos de 320 Kbps". En comparación con el MP3, su calidad de sonido es mejor y puede ahorrar aproximadamente un 30% de espacio de almacenamiento y ancho de banda. Es una tecnología desarrollada cumpliendo con las especificaciones MPEG-2.

ATRAC 3/ATRAC 3 plus: ATRAC3 (AdaptiveTransformAcousticCoding3) fue desarrollado por Sony Corporation de Japón. Es una versión mejorada de ATRAC utilizada por MD por su tasa de compresión (aproximadamente 2 veces la de ATRAC) y su sonido. La calidad es bastante similar a la del MP3. Los principios de compresión incluyen enmascaramiento simultáneo, enmascaramiento temporal y curvas de volumen igual, que son más o menos las mismas que las del MP3. La función de protección de derechos de autor de ATRAC3 utiliza OpenMG. En la actualidad, los reproductores portátiles correspondientes a ATRAC3 son principalmente productos propios de Sony. Sin embargo, la empresa firmó un acuerdo de licencia de patente con fabricantes de semiconductores como Fujitsu, Hitachi, NEC, Rohm, Sanyo y TI en febrero de 2000 para fabricar y vender LSI para ATRAC3.