Red de conocimiento informático - Descarga de software - ¿Cuál es la relación entre la tecnología de procesamiento de voz y la calidad del sonido en las conferencias telefónicas?

¿Cuál es la relación entre la tecnología de procesamiento de voz y la calidad del sonido en las conferencias telefónicas?

En comparación con los puentes de teleconferencia tradicionales, controlar el eco y el retraso cuando se transmite voz a través de redes IP es la tecnología clave de VoIP. La ruta de medios para una llamada de telefonía IP se puede representar en la Figura 6-1, que no incluye terminales PSTN ni ISDN. Cuando un teléfono RDSI funciona interactivamente a través de una puerta de enlace, la situación se replica ligeramente, como se muestra en la Figura 6-2. Cuando la interfaz de la puerta de enlace está conectada a una red analógica, la interfaz del usuario a la red solo necesita dos líneas en la mayoría de los casos (se requiere un par de líneas para las señales de entrada y salida, en este caso, cuatro cables/dos). Se requiere un circuito híbrido de cables, como se muestra en la Figura 6-3. En el sistema VOIP, los factores que causan la degradación de la calidad de la voz son:

(1) Pérdida de paquetes, retraso y fluctuación de la red IP. Esto provocará que la calidad del audio de la conferencia telefónica se degrade.

(2) Retraso de extremo a extremo y pérdida de fotogramas causada por el jitter buffering. Esto provocará grandes retrasos en las conferencias telefónicas.

(3) Eco acústico provocado por la interfaz de sonido. El eco también es un indicador de evaluación importante para los sistemas de conferencias telefónicas.

El contenido relevante de la tecnología de control de calidad de voz en redes telefónicas se describe completamente en las recomendaciones de la UIT. Aquí discutimos principalmente los aspectos de la calidad de voz que afectan la percepción del usuario final, en la mayoría de los casos, de los circuitos conmutados tradicionales. Teléfonos y actuales La mayor parte de la telefonía IP es igual. Sin embargo, las redes de telefonía IP tienen algunos factores especiales, como grandes retrasos, fluctuaciones y pérdidas, por lo que se necesita un nuevo marco para evaluar la calidad de la voz. Este trabajo está siendo estudiado en ESTI

TIPHON (Grupo de Trabajo 5).

1. Eco en la red telefónica

2. El eco más importante en la red telefónica es el eco de la voz, es la propia voz retardada del hablante. Varios ecos son causados ​​por ecos eléctricos o ecos acústicos del receptor. Si el eco del hablante se refleja en 2 palabras, también afectará al receptor. Esto ocurre cuando el receptor escucha la voz del hablante dos veces: primero como una señal grande y luego como una señal débil que se retrasa durante mucho tiempo. Esta es la respuesta recíproca.

(1) Eco híbrido

El circuito híbrido se utiliza para la conversión de dos o cuatro líneas y también es muy común en puentes de conferencias telefónicas analógicas, como se muestra en la Figura 6-4. . Entre ellos, Zref se utiliza para igualar la impedancia característica de la línea de conferencia telefónica con el fin de suprimir el eco del discurso, de modo que el hablante apenas pueda escuchar su propia voz en su receptor.

De hecho, la impedancia característica de la línea de dos hilos nunca puede igualarse completamente, por lo que parte de la señal de entrada se retroalimentará a la señal de salida. Esta señal espuria es un eco mixto. Por un lado, hará que la señal circule entre los dos amplificadores. Si el retraso en el camino es de unos 20 ms, provocará un "efecto iglesia". Para evitar la inestabilidad de la red, la señal en la ruta de cuatro cables debe reducirse al menos 6 dB. Zref

Por otro lado, una llamada de conferencia no coincidente retroalimenta todas las señales entrantes en la red para que el hablante al otro lado de la línea escuche su propia voz después de un tiempo de ida y vuelta.

En muchos países, las redes de transmisión están compuestas íntegramente por líneas de cuatro hilos. La conversión de segunda línea a cuarta línea se produce sólo cuando la central local conecta el teléfono analógico. Debido a que no hay demora en el eco que regresa al teléfono desde el interruptor, no hay impacto. Por otro lado, el eco generado por un extremo del teléfono se notará inmediatamente cuando regrese a través de la red hasta el otro extremo del teléfono, con un tiempo de ida y vuelta de aproximadamente 50 ms.

(2) Eco acústico

El eco acústico se refiere a la retroalimentación de parte de la señal sonora al receptor en el mismo lado. Un "teléfono manos libres" común es un altavoz con cancelación de eco acústico, mientras que un "teléfono de conferencia" es un altavoz sin cancelación de eco acústico. Los teléfonos de conferencia comunes incluyen el tipo extendido, el tipo estándar, Soundstation2, el teléfono de conferencia Octopus, Meeteasy, Konftel, Yinwang y otras marcas de Polycom.

El eco acústico típico es una señal espuria de aproximadamente 10 a 15 dB por debajo del nivel de una persona que habla por un micrófono o utiliza un dispositivo acoplador de llamada de conferencia, similar a un eco mixto. Este tipo de eco acústico, que es varias veces mayor, no atraerá la atención de las personas si su retraso es inferior a 29 ms; si es de 40 ms, entonces la sala de conferencias al otro lado de la línea sonará como si la otra parte estuviera hablando en un tono; bueno, si el tiempo de ida y vuelta supera los 40 ms, la situación será peor.

Una forma sencilla de suprimir el ruido acústico es utilizar auriculares, pero con el equipo adecuado, incluso un altavoz puede mantener la energía de los ecos espurios por debajo de los 45 dB de la señal de la persona que llama. La recomendación G.168 de la UIT proporciona algunos indicadores recomendados para pruebas típicas de trayectoria de eco.

Por lo general, es imposible que un cancelador de eco elimine tanto los ecos acústicos como los ecos eléctricos al mismo tiempo, porque las trayectorias de los ecos acústicos varían tanto que es difícil encontrar un método de adaptación dinámica para los ecos sintetizados. . Para el cancelador de eco especial de la UIT, el rendimiento del G.168 puede no ser suficiente. Nuevas palabras Hay una nueva recomendación G.168 que ha entrado en vigor y parte de ella ha sido implementada por algunos fabricantes. Esta propuesta incluye algunas funciones útiles, como la capacidad de detener la cancelación del eco cuando se detectan tonos de inversión de fase procedentes de módems de alta velocidad. Los valores típicos de atenuación del eco acústico en los equipos de teleconferencia actuales son: 10-15 dB para teléfonos con altavoz y 35-40 dB para teléfonos con altavoz o teléfonos con auriculares de alta calidad. El acoplador de llamadas de conferencia y el procesador de audio pueden eliminar eficazmente el eco y los aullidos de las llamadas de conferencia, garantizando una calidad de voz clara en las llamadas de conferencia. El sistema es estable.