Red de conocimiento informático - Material del sitio web - ¿Cómo combinar diferentes escalas?

¿Cómo combinar diferentes escalas?

En primer lugar, la coincidencia de puntos característicos (puntos de esquina)

La coincidencia de imágenes se puede aplicar en muchas situaciones, como seguimiento de objetivos, detección, reconocimiento, empalme de imágenes, etc., y la tecnología central de coincidencia de puntos de esquina. es la coincidencia de puntos de esquina. La llamada coincidencia de puntos de esquina se refiere a encontrar la correspondencia entre los píxeles característicos entre dos imágenes, determinando así la relación posicional entre las dos imágenes.

La coincidencia de puntos de esquina se puede dividir en los siguientes cuatro pasos:

1. Extracción del detector: busque los píxeles más identificables (puntos de esquina) en las dos imágenes que se van a combinar, por ejemplo. , los puntos de borde de objetos ricos en texturas.

2. Extraiga descriptores: para los puntos de esquina detectados, utilice algunas características matemáticas para describirlos, como histogramas de gradiente y características binarias aleatorias locales. Los métodos de extracción comúnmente utilizados para detectores y descriptores incluyen sift, harris, surf, fast, agast, brisk, freak, brisk, brief/orb, etc.

3. Coincidencia: determine la correspondencia entre cada punto de esquina en las dos imágenes a través del descriptor de cada punto de esquina, como flann.

4. Eliminación de ruido: elimine los valores atípicos que coincidan incorrectamente y conserve los puntos coincidentes correctos. Los métodos más utilizados incluyen KDTREE, BBF, Ransac, GTM, etc.

En segundo lugar, se propuso el método de coincidencia SIFT

Para eliminar los puntos clave que no tienen relación de coincidencia debido a la oclusión de la imagen y la confusión del fondo, Lowe, el autor de SIFT, propuso un método para comparar la distancia del vecino más cercano y el método de coincidencia SIFT de la distancia del vecino más bajo: tome un punto clave SIFT en una imagen y encuentre los dos primeros puntos clave con la distancia euclidiana más cercana en otra imagen. Entre estos dos puntos clave, si la relación entre la distancia más cercana dividida por la siguiente distancia más cercana es menor que un cierto umbral T, entonces se aceptará el par de puntos coincidentes. Porque para los desajustes, debido a la alta dimensionalidad del espacio de características, puede haber muchos otros desajustes a distancias similares, por lo que su proporción es relativamente alta. Obviamente, si se reduce el umbral de proporción t, el número de puntos de coincidencia SIFT se reducirá, pero será más estable, y viceversa.

Lowe recomienda un umbral de relación de 0,8, pero el autor comparó un gran número de dos imágenes con proporciones, rotaciones y cambios de brillo arbitrarios. Los resultados muestran que la relación es 0. Cuatro a cero. 6. Hay muy pocos puntos coincidentes menores que 0. 4, y hay una gran cantidad de puntos coincidentes falsos mayores que 0. 6. Por lo tanto, el autor recomienda los siguientes principios para comparar valores:

Relación = 0,4: para coincidencias de alta precisión

Relación = 0,6: el número de coincidencias; puntos requiere más coincidencias;

Relación = 0,5: en términos generales.

Tercer código de coincidencia SIFT común

1 de la caja de herramientas Sift en vlfeat, vl_ubcmatch.c utiliza una distancia euclidiana ordinaria para la coincidencia (este código SIFT fue aportado por Andrea.

p>

Vidardi).

2. El código C++ de Lowe's utiliza la distancia euclidiana, pero en el código de Matlab, para acelerar los cálculos, se utilizan ángulos vectoriales para aproximar la distancia euclidiana: Primero El vector de características SIFT de 128 dimensiones se normaliza a un vector unitario (cada número se divide por la raíz cuadrada de la suma de cuadrados), luego el valor del coseno del ángulo del vector se obtiene mediante el producto escalar y finalmente el coseno inverso (acos función) se utiliza para obtener el ángulo del vector. Los experimentos muestran que el método de Lowe es muy correcto y requiere mucho tiempo.

De manera similar, la función knnsearch también se puede usar para encontrar el punto más cercano y el siguiente punto más cercano: los resultados obtenidos por knnsearch usando la distancia euclidiana son casi los mismos que los obtenidos por el método de aproximación más bajo, que simplemente confirma la precisión de la simulación de la distancia euclidiana.

3.OpenSIFT de Rob Hess utiliza KDTREE para optimizar la coincidencia.

4. CSDN master v_JULY_v implementa KDTREE+BBF para optimizar la coincidencia SIFT y eliminar coincidencias falsas: desde el algoritmo K vecino más cercano y la medición de distancia hasta el algoritmo KDTREE y SIFT+BBF.

- Método estructural, método algorítmico - Blog Channel-CSDN.NET.

5. Hay muchos tipos de coincidencia SIFT implementada por características2d en OpenCV: descriptor vectorial, BF Matcher (comparador de descriptores de fuerza bruta), Ferndescriptor, OnewayDescriptor, FlannBasedMatcher, etc. En la actualidad, solo sé que se utiliza knnsearch, que proporciona una variedad de métodos de alcance, no conozco las diferencias específicas.