Red de conocimiento informático - Problemas con los teléfonos móviles - R-CNN, R-CNN rápido, R-CNN más rápido, YOLO: resumen de algoritmos de detección de objetos

R-CNN, R-CNN rápido, R-CNN más rápido, YOLO: resumen de algoritmos de detección de objetos

Enlace de referencia

El siguiente es el texto original del algoritmo involucrado en este artículo:

Una de las soluciones más sencillas es extraer diferentes regiones de interés. A partir de la imagen, estas regiones se clasifican utilizando CNN para detectar la presencia de objetos en estas regiones.

Sin embargo, los objetos a detectar pueden existir en diferentes ubicaciones de la imagen y tener diferentes relaciones de aspecto. Por lo tanto, el método anterior necesita seleccionar una gran cantidad de áreas y requiere una gran cantidad de cálculos.

Por ello, se han desarrollado métodos como R-CNN, Fast R-CNN, Faster R-CNN, YOLO, etc. para encontrar objetos de forma rápida y precisa.

Para resolver el problema anterior de la necesidad de seleccionar una gran cantidad de regiones, Ross Girshick et al propusieron un método: utilizar la búsqueda selectiva para extraer 2000 regiones de la imagen, estas regiones se denominan "región". propuestas".

Con este enfoque, no necesitamos clasificar una gran cantidad de regiones y solo necesitamos procesar 2000 regiones. Estas 2000 regiones se encontraron utilizando el siguiente algoritmo de búsqueda selectiva:

Este artículo presentará el algoritmo de búsqueda selectiva en detalle.

Pasos de RCNN:

Problemas con R-CNN:

Varias mejoras para R-CNN rápido:

Anterior Los autores de esto El artículo (R-CNN) resolvió algunas de las deficiencias de R-CNN y creó un algoritmo de detección de objetos más rápido, llamándolo R-CNN rápido. Su enfoque es similar al algoritmo R-CNN.

Fast R-CNN es más rápido porque:

Fast R-CNN es más rápido:

De la figura anterior, se puede deducir que Fast R-CNN es significativamente más rápido que R-CNN durante el entrenamiento y las pruebas. Por lo tanto, las propuestas de región se convierten en el cuello de botella del rápido algoritmo R-CNN, afectando su rendimiento.

Desventajas de los dos algoritmos anteriores:

La búsqueda selectiva requiere mucho tiempo

Los dos algoritmos anteriores (R-CNN y Fast R-CNN) utilice la búsqueda selectiva para encontrar sugerencias regionales.strong>.

Mejoras en Fast R-CNN:

No es necesario realizar una búsqueda selectiva para encontrar propuestas regionales

Usar la red para encontrar propuestas regionales

p > Por lo tanto, Ren Shaoqing y otros propusieron un algoritmo de detección de objetos que cancela el algoritmo de búsqueda selectiva y permite que la red aprenda las propuestas de región. Deje que la red conozca las recomendaciones del área.

Pasos de R-CNN más rápidos:

Comparación de tiempo:

El R-CNN más rápido es el más rápido y se puede utilizar para la detección de objetos en tiempo real

Desventajas de los algoritmos anteriores:

No es necesario ver el gráfico completo al generar regiones. En realidad, es más probable que algunas partes del gráfico contengan objetos.

Todos los algoritmos de detección de objetos anteriores utilizaban regiones para localizar objetos en imágenes. La red no verá la imagen completa. En su lugar, se utilizan las partes de la imagen que tienen una alta probabilidad de contener objetos.

La idea de YOLO:

Utilizar redes separadas para predecir la probabilidad de que aparezcan objetos en cuadros delimitadores y cuadros delimitadores.

YOLO o Solo miras una vez es un Este algoritmo de detección de objetos es muy diferente del algoritmo basado en regiones mencionado anteriormente.

En YOLO, una única red convolucional predice (1) un cuadro delimitador y (2) la probabilidad de clase de que un objeto esté dentro del cuadro delimitador.

Los pasos específicos de YOLO:

El principio de funcionamiento de YOLO es:

Las ventajas y desventajas de YOLO: