Red de conocimiento informático - Material del sitio web - ¿Qué significa el cambio anti-hora de la huella de voz?

¿Qué significa el cambio anti-hora de la huella de voz?

Me dedico a la identificación de huellas de voz. Esta ciencia forense también se llama identificación de identidad fonética e identificación fonética forense, todas las cuales se incluyen en la categoría de examen e identificación de voz. Me encontré con el caso de los cambiadores de voz y finalmente llegué a la conclusión de que eran idénticos (el proceso no se muestra).

Para tomar prestada mi respuesta en "¿Se puede identificar la imitación de la voz?", primero debemos introducir la especificidad de la voz y la estabilidad de la voz (este es el principio básico de la identificación de huellas vocales. Existen diferentes estilos. en varios libros de texto, pero todos hablan de lo mismo. La primera lección que les enseño a los estudiantes es que memoricen este principio):

La particularidad del habla, los órganos articulatorios se dividen en sistema supraglótico. y sistema laríngeo, sistema subglótico, cada uno tiene su propio conjunto de órganos articuladores, y sus formas y estructuras son diferentes. Cada pronunciación requiere de la cooperación y el movimiento simultáneo de muchos órganos articuladores. Esto determina las propiedades físicas del habla (también conocidas como los cuatro elementos del habla): calidad del sonido, duración del sonido, intensidad del sonido y tono. Estas cantidades físicas varían de persona a persona, por lo que las voces presentan diferentes características de huella de voz en el mapa de huellas de voz. En función de estos parámetros característicos de la huella de voz, no solo podemos distinguir las voces, sino también identificar las voces de la misma persona.

Estabilidad de la voz. Una vez que el órgano de pronunciación de una persona madura, su estructura anatómica y su estado fisiológico son estables. Además, los hábitos de habla del hablante y otros atributos sociales y psicológicos del habla hacen que la pronunciación básica de palabras con el mismo contenido de texto sea pronunciada por todos en diferentes momentos. son estables e inmutables. Por lo tanto, se puede pensar en el tracto vocal humano como una bocina en los instrumentos de viento. Aunque el trombón y la corneta son bocinas, debido a la diferente forma y longitud del tracto vocal, la calidad del sonido que producen también es diferente.

Los métodos actuales de identificación de huellas de voz se pueden dividir simplemente en dos tipos:

El primero es la "identificación manual" comúnmente utilizada en la práctica judicial de mi país: los peritos tasadores se basan en métodos fonéticos

La segunda es la dirección de desarrollo futuro de la "identificación automática": la computadora utiliza algoritmos para simular la extracción, entrenamiento y comparación de características acústicas por parte del oído humano.

Entonces, ¿qué es un "cambiador de voz"? Un cambiador de voz es una herramienta que cambia el timbre y el tono del audio de entrada y emite el audio modificado (Enciclopedia Baidu). De hecho, también está la velocidad del sonido, que la Enciclopedia Baidu omite. Además, no es necesario mencionar el volumen del sonido, que se puede cambiar sin un cambiador de voz. Entonces, entre los cuatro elementos del habla, la calidad del sonido (es decir, el timbre), el tono (correspondiente al tono), la intensidad del sonido (es decir, el volumen del sonido) y la duración del sonido (correspondiente al tono). velocidad del sonido) han cambiado. Las propiedades físicas del habla han cambiado. ¿Cómo identificarlo?

No pienses tan bien en el “cambiador de voz”

En términos de identificación, ¿no es el “cambiador de voz” solo un canal? La definición de canal es el canal a través del cual se transmiten las señales. Nuestra identificación se llama identificación de huellas de voz. De hecho, lo que analizamos y probamos no es la voz humana real, sino la grabación humana: se pueden considerar varios equipos de grabación. como canales Varios métodos de codificación también pueden considerarse canales y todos cambian la señal de voz. Por ejemplo: los walkie-talkies y los teléfonos se consideran canales. Su voz se transmite a través del walkie-talkie y su sentido del oído se ha distorsionado. Ya ha sentido el impacto del canal en la señal de voz. Los "cambiadores de voz" actualmente disponibles en el mercado, ya sean hardware o software, cambian principalmente la frecuencia fundamental, convirtiendo una voz grave (voz masculina) en una voz aguda (voz femenina, voz infantil). (En cuanto a cambiar el timbre, por un lado, el timbre debe haber cambiado. Después de volver a muestrear y cambiar la frecuencia fundamental, las características pico que reflejan el timbre deben haber cambiado. Por otro lado, las características pico del timbre (El cambio es un cambio general y la relación relativa entre ellos puede considerarse sin cambios). Por supuesto, para ser precisos, es solo la llamada voz masculina, voz femenina, voz de niño y voz de anciano. nuestro sentido del oído y la comprensión social. La voz no es una característica sexual y no diferencia entre hombres y mujeres, sólo estadísticamente. Un contraejemplo es "Zheng Haixia", una persona alta con cuerdas vocales largas y gruesas (correlación positiva). Busca en Internet y escúchalo. ¿Crees que es un niño o una niña? Además, en la caricatura, Conan usó un cambiador de voz para convertirlo mágicamente en Mouri Kogoro. En realidad, no puede ser tan preciso y lograr resultados tan buenos. En teoría, un cambiador de voz instantáneo con un efecto tan bueno solo puede hacerlo. lograrse recopilando cantidades masivas de datos acústicos de Kogoro Mori.

B "Voice Changer" cambia las propiedades físicas del habla, pero no cambia las características acústicas en todos los sentidos de identificación.

El método de identificación fonética manual comúnmente utilizado mencionado anteriormente, su principal ventaja es que puede distinguir "características avanzadas de huellas de voz" que son difíciles de reconocer para las computadoras, como acentos dialectales, modismos, palabras redundantes, defectos del habla y características prosódicas. ¿Cómo es esto "avanzado"? Entre nosotros, los conocidos, primero distinguimos la voz de una persona a través de estas características; los programas de imitación también prestan gran atención a estas características. Pero son difíciles de reconocer para las computadoras y se denominan "funciones de alto nivel". Sí, el oído humano es el instrumento de identificación de huellas vocales más sofisticado. Las "características de huellas de voz de bajo nivel" con las que los no profesionales no están familiarizados, como: vibración máxima y frecuencia fundamental, son las más "familiares" para las computadoras, incluso la intensidad del sonido, la duración del sonido, VOT, etc., son reconocidas por. computadoras.

C "Voice Changer" cambia las propiedades físicas de la voz y se puede utilizar el mismo método para cambiar la muestra durante el muestreo de identificación.

Ya sea identificación manual o identificación automática, todos los casos se registran mediante grabaciones - "Materiales de búsqueda" y las grabaciones del sospechoso - "muestras" para comparar. Dado que el cambiador de voz es un "material de prueba" que ha sido modificado por ciertas configuraciones, entonces se pueden usar las mismas configuraciones para cambiar la "muestra". Como se mencionó anteriormente, un cambiador de voz es un canal generalizado. Ha habido casos en los que el tasador creía que la voz se había distorsionado porque se trataba de un "cambiador de voz", y había que restaurar la voz anterior a través de la señal antes de realizar la tasación. Este tipo de pensamiento, y mucho menos la restauración de canales, no se puede restaurar sin cambios con la tecnología actual, principalmente porque no hemos considerado cuál de las grabaciones que analizamos no es el resultado del procesamiento de señales a través del canal. No importa cuán alta sea la frecuencia de muestreo y cuán fina sea la precisión, sigue siendo el resultado de cambios discretos. ¿Puede realmente ser lo mismo que una señal continua como la voz humana? Todos pasan por el mismo canal y se someten a procesamiento de señal, pero las diferencias son diferentes en tamaño y tienen diferentes efectos de escucha.

Pregunta 2: ¿Es cierto que "las ondas sonoras son como huellas dactilares y pueden identificarse sin importar cómo cambien"?

Respuesta: No.

El término "onda de sonido" es incorrecto. Cada vez que escucho la palabra "onda de sonido" pienso en murciélagos. Este es un término que suelen utilizar los no profesionales. Las personas que se dedican a la profesión de "identificación de huellas vocales" saben mucho sobre identificación, tienen un conocimiento superficial de la física y el procesamiento de señales y casi no comprenden los murciélagos y otras criaturas. En la práctica judicial, ya se trate de jueces, fiscales o investigadores de los órganos de seguridad pública, nuestras opiniones profesionales son la autoridad. En cuanto a los profesores de distintas facultades de derecho, pueden tener opiniones diferentes, pero ellos tienen la última palabra, ¿y los jueces qué? Para responder a esta pregunta con precisión, busqué en Baidu. Los artículos que aparecieron allí fueron escritos por mí, por mis profesores o por colegas que conozco. En otras palabras, estas interpretaciones relevantes sobre Baidu son engañosas o incluso contradictorias. proviene de nuestras diferentes interpretaciones y expresiones de una misma cosa. El término "huella de voz" fue definido por los primeros tasadores cuando esta tecnología de ciencia forense se introdujo en China en la década de 1980. Este título se basa en comparar el atlas fonético utilizado en los métodos de identificación fonética con el atlas de "huellas dactilares". Es fácil de entender y se utiliza habitualmente. "Identificación de huellas de voz" es el nombre colectivo de toda la identificación de voz, incluida la identificación de la identidad de la voz, la verificación de la autenticidad de las grabaciones, la reducción del ruido de la voz y la mejora de la relación ruido-ruido, etc., y también se refiere a la identificación de la identidad de la voz individualmente. "Voiceprint" es la abreviatura del mapa de voz, que es la base principal para la identificación y también es el nombre general de la voz como característica biométrica; Se han desarrollado los métodos de identificación actuales. El método de análisis de características acústicas basado en espectrograma no es el único método de identificación, por lo que es más exacto llamarlo "identificación de voz forense" y más conveniente llamarlo "identificación de huellas de voz". En resumen, puedes llamarlo como quieras, pero no se puede llamar "onda de sonido" porque "forma de onda de sonido" se refiere a otra cosa.

Una "onda sonora" es diferente de una "huella de voz"

Debido a diferencias en la traducción y la comprensión, probablemente proviene de las palabras ondas sonoras, espectro, voz, formante, intensidad, tasador Si hablamos de ondas sonoras, definitivamente nos referimos al diagrama de forma de onda (ver Figura 1), que se refiere precisamente a la intensidad en la identificación de huellas vocales mediante métodos fonéticos, no es la característica principal la característica principal es el pico de vibración formante (. ver Figura 2).