Red de conocimiento informático - Aprendizaje de código fuente - El principio del control por voz inteligente

El principio del control por voz inteligente

Principio del control por voz:

La arquitectura general del sistema de control por voz consta de un módulo de recopilación de voz, un módulo de preprocesamiento de voz, un módulo de entrenamiento de voz y un módulo de reconocimiento de voz. , un módulo de indicaciones de voz y un módulo de control de salida.

(1) Módulo de adquisición de voz

El módulo de adquisición de voz completa principalmente funciones como acondicionamiento de señal y adquisición de señal. Convierte la señal de voz original en una secuencia de pulsos de voz, por lo que este módulo. Incluye principalmente procesos de procesamiento de señal/sonido, como conversión eléctrica, acondicionamiento de señal y muestreo.

(2) Módulo de preprocesamiento de voz

La función principal del módulo de preprocesamiento de voz es filtrar señales de interferencia, extraer vectores de características de voz y cuantificar las características de voz extraídas. vectores en vector de características de voz estándar, por lo que este módulo incluye principalmente procesos de procesamiento de señales de voz, como preprocesamiento de voz, extracción de características y cuantificación de vectores.

(3) Módulo de entrenamiento de voz

La función principal del módulo de entrenamiento de voz es realizar estadísticas de probabilidad sobre los vectores estándar de características de voz recopilados y extraídos varias veces para extraer las mejores características de voz. Los vectores estándar del hablante evitan que las imprecisiones en la extracción de parámetros de características afecten el efecto de reconocimiento de voz debido a factores como el estado de ánimo del hablante, el entorno y otros factores. Por lo tanto, este módulo incluye principalmente procesos de procesamiento como estadísticas de probabilidad y evaluación de parámetros, y se implementa. utilizando un modelo de Markov oculto (modelo HMM).

(4) Módulo de reconocimiento de voz

La función principal del módulo de reconocimiento de voz es comparar el vector de características de voz estándar recopilado con el modelo de voz en la biblioteca de plantillas de voz para determinar la función de comando de voz actual, por lo que este módulo incluye principalmente dos procesos: comparación de vectores y evaluación de parámetros.

(5) Módulo de mensajes de voz

La función principal del módulo de mensajes de voz es solicitar al usuario que realice operaciones relevantes o explicar la función actualmente completada en función de los resultados del reconocimiento de voz. Por lo tanto, este módulo incluye principalmente llamadas a archivos de recursos de voz, conversión D/A, amplificación de señal y otros procesos de procesamiento de voz.

(6) Módulo de control de salida

La función principal del módulo de control de salida es emitir las señales de control correspondientes basadas en los resultados del reconocimiento de voz para realizar el control por voz de aparatos de oficina como Lámparas, televisores y ventiladores, por lo que este módulo incluye principalmente controlador de señal, controlador de salida y objeto controlado.

(7) Biblioteca de plantillas de voz

La función principal de la biblioteca de plantillas de voz es almacenar el mejor vector de características de voz estándar después del entrenamiento.