Red de conocimiento informático - Material del sitio web - Cómo comparar el rendimiento del algoritmo de coincidencia de imágenes SIFT, SURF y Harris-SIFT

Cómo comparar el rendimiento del algoritmo de coincidencia de imágenes SIFT, SURF y Harris-SIFT

La coincidencia SIFT (transformación de características invariantes de escala, transformación de características invariantes de escala) es un algoritmo de visión por computadora que se utiliza para detectar y describir características locales en imágenes. Busca valores extremos en la escala espacial. y extraer sus invariantes de posición, escala y rotación. Este algoritmo fue publicado por David Lowe en 1999 y fue perfeccionado y resumido en 2004. Su ámbito de aplicación incluye reconocimiento de objetos, percepción y navegación de mapas de robots, unión de imágenes, creación de modelos 3D, reconocimiento de gestos, seguimiento de imágenes y comparación de acciones.

La descripción y detección de características de imágenes locales pueden ayudar a identificar objetos. Las características SIFT se basan en algunos puntos de interés de apariencia local en el objeto y son independientes del tamaño y la rotación de la imagen. La tolerancia a la luz, el ruido y los ligeros cambios en el ángulo de visión también es bastante alta. Según estas características, son muy destacados y relativamente fáciles de recuperar. En una base de datos de características grande, los objetos se identifican fácilmente y la identificación errónea es rara. La tasa de detección de oclusión parcial de objetos utilizando la descripción de características SIFT también es bastante alta, e incluso más de tres características de objetos SIFT son suficientes para calcular la posición y orientación. En las condiciones actuales de velocidad del hardware informático y base de datos de funciones pequeñas, la velocidad de reconocimiento puede acercarse a la operación en tiempo real. Las funciones SIFT tienen una gran cantidad de información y son adecuadas para realizar coincidencias rápidas y precisas en bases de datos masivas.

2. Las principales características de las funciones SIFT

Teóricamente, SIFT es un invariante similar, es decir, es invariante a los cambios y rotaciones de escala de la imagen. Sin embargo, debido al procesamiento especial de muchos detalles al construir funciones SIFT, SIFT tiene una gran adaptabilidad a deformaciones complejas de imágenes y cambios de iluminación. Al mismo tiempo, la velocidad de cálculo es relativamente rápida y la precisión de posicionamiento es relativamente alta. Por ejemplo:

Utilizando el operador DOG para detectar puntos clave en un espacio de múltiples escalas, en comparación con el método de detección tradicional basado en el operador LOG, la velocidad de operación se acelera enormemente;

Posicionamiento preciso de puntos clave No solo mejora la precisión, sino que también mejora en gran medida la estabilidad de los puntos clave;

Al construir el descriptor, las características estadísticas de la subregión, en lugar de un solo píxel, se utilizan como base. objeto de investigación, que mejora la deformación local de la imagen; Adaptabilidad;