Red de conocimiento informático - Conocimiento de la instalación - Construya una red neuronal convolucional ResNet

Construya una red neuronal convolucional ResNet

En 2015, el equipo de He Kaiming en Microsoft Research Asia lanzó una red neuronal convolucional especial: la red neuronal residual (ResNet). Antes de la aparición de las redes neuronales residuales, las redes neuronales más profundas solo tenían entre veinte y treinta capas. Sin embargo, este tipo de red neuronal puede alcanzar fácilmente cientos o incluso miles de capas en los experimentos y no requiere demasiado tiempo de entrenamiento. Gracias a esto, la precisión del reconocimiento de imágenes ha mejorado significativamente. El modelo incluso ganó el campeonato en clasificación, localización y detección de imágenes en el concurso ImageNet ese mismo año. Lograr resultados tan excelentes en competiciones internacionales demuestra que la red neuronal residual es un modelo práctico y excelente. En el experimento de clasificación binaria de perros y gatos de este estudio, el modelo de clasificación también se construyó sobre la base de la red neuronal residual.

Este artículo aplicará el conjunto de datos de perros y gatos de Kaggle a los modelos de red ResNet-18 y ResNet-50. Resnet se utiliza para explorar la precisión de las redes neuronales convolucionales utilizadas actualmente. La Figura 4-1 muestra el diagrama de estructura de red clásico de ResNet-ResNet-18.

ResNet-18 está compuesto por BasicBlock. En la Figura 4-2, también podemos saber que los modelos de red ResNet con 50 capas o más están compuestos por BottleBlock. A continuación, debemos colocar el conjunto de datos preprocesados ​​en los modelos Resnet-18 y ResNet-50 existentes para el entrenamiento. Primero, recortamos la imagen de entrenamiento en un tamaño cuadrado de 96x96 mediante el preprocesamiento de imágenes mencionado anteriormente, y luego la ingresamos en nuestro modelo. Aquí presentamos la estructura del modelo de red de ResNet-18, porque la estructura de ResNet50 es similar al modelo ResNet-34 del Capítulo 5.

La estructura del modelo de ResNet-18 es: la primera capa es un núcleo de convolución de 7 × 7, la matriz de características de entrada es, después del núcleo de convolución es 64, el tamaño del paso es 2 y el Se obtiene la matriz de características de acceso. La segunda capa comienza con una capa de agrupación de 3×3, seguida de 2 estructuras residuales. La matriz de características de entrada al principio es y la forma de la matriz de características de salida es , pero la rama principal y el acceso directo deben tener la misma forma de matriz de características de salida, por lo que la altura y el ancho de la matriz de características se reducen de 56 estableciendo el intervalo de la rama principal a 2 mitad de 28, y luego cambie la profundidad de la matriz de características a través de 128 núcleos de convolución. Sin embargo, el atajo aquí agrega un núcleo de convolución 1x1 con un paso de 2. A través de este lapso, el ancho y la altura de la matriz de características de entrada se reducen a la mitad del original. Al mismo tiempo, a través de 128 núcleos de convolución, la profundidad de la matriz de características de entrada también se convierte en 128. 128], la forma de salida. La matriz de características lo es, pero la rama principal y las matrices de características de salida del acceso directo deben tener la misma forma, por lo que al usar una rama principal de 2, la altura y el ancho de la matriz de características se reducen de 14 a la mitad del original, lo que es 7. El uso de 128 núcleos de convolución puede cambiar la profundidad de la matriz de características. Sin embargo, el atajo aquí es agregar un núcleo de convolución 1 × 1, y el intervalo también es 2. A través de este intervalo, el ancho y el alto de la matriz de características de entrada también se reducen a la mitad del original y, al mismo tiempo, Se pasan 256 núcleos de convolución. Cambiar la profundidad de la matriz de características de entrada también pasa a ser 256. La cuarta capa tiene dos estructuras residuales. Después del mismo proceso de cambio que el anterior, se obtiene la matriz de características de salida. En la quinta capa, hay 2 estructuras residuales. Después del mismo proceso de cambio anterior, la matriz de características de salida es. A esto le sigue la agrupación promedio y las capas completamente conectadas.