Red de conocimiento informático - Material del sitio web - ¿Cuál es el principio del reconocimiento facial basado en una red neuronal convolucional profunda?

¿Cuál es el principio del reconocimiento facial basado en una red neuronal convolucional profunda?

Su esencia es el reconocimiento de patrones, que abstrae la realidad en números que las computadoras pueden entender.

Si una imagen tiene 256 colores, entonces cada píxel de la imagen tiene un valor entre 0 y 255, por lo que la imagen se puede convertir en una matriz.

¿Cómo identificar patrones en esta matriz? Utilice una matriz relativamente pequeña para barrer de izquierda a derecha y de arriba a abajo en esta matriz grande. Para cada bloque de matriz pequeño, puede contar el número de veces que aparece cada color de 0 a 255. Exprese las características de este bloque. De esta manera, a través de este "escaneo", se obtiene otra característica de la matriz que consta de muchos bloques de matriz pequeños.

Esta matriz es más pequeña que la matriz original, ¿verdad? ¡Así es!

Luego, para esta matriz más pequeña, realizamos los pasos anteriores nuevamente y "condensamos" las características, lo que en otro sentido significa abstraer las características.

Finalmente, después de muchas abstracciones, la matriz original se convierte en una matriz unidimensional por unidimensional, que es un número.

Diferentes imágenes, como un gato, un perro y un oso, terminarán con números diferentes. Entonces puedes abstraer un gato, un perro, un oso en un número, como 0,34, 0,75, 0,23, y el propósito de esto es permitir que la computadora entre y lo reconozca directamente.

Los principios de rostros, expresiones y edades son similares, excepto que el número inicial de muestras será muy grande. Al final, una imagen específica se abstrae en un número a través de una matriz, porque la computadora. sólo sabe números.

Pero las funciones abstractas son diferentes y los efectos logrados serán diferentes.