Cómo realizar la agregación de k-medias en vectores de características obtenidos de SIFT
?¿Preguntas sobre la agrupación de k-medias después de SIFT?
Estoy haciendo un modelo de bolsa de palabras. Elegí SIFT SVM, que implica análisis de conglomerados. Quiero utilizar el algoritmo K-means para la agrupación. La pregunta es, supongamos que utilicé 100 imágenes de aprendizaje para la extracción de características SIFT. Cada imagen es un vector de N*128, y cada imagen tiene diferentes puntos de características N
Por lo tanto, al realizar la agrupación de K-medias, ¿debería hacerlo? agrupar cada imagen individualmente, o debería integrar el espacio de características de 100 imágenes en (N1 N2 ... N100)*12. .N100)*128 matriz y luego realizar la agrupación.
Porque estoy usando la función kmeans que viene con matlab. Si es el segundo caso, después de agrupar, suponiendo que la partícula k es 300, entonces quiero obtener los valores que pertenecen a cada imagen. en cada imagen ¿Cómo realizar el número de puntos característicos de los puntos de masa?
Además: la función kmeans que viene con MATLAB se describe a continuación:
[IDX, C] = kmeans(X, k) devuelve k clústeres en el formato k-by- matriz p C Ubicación del punto central.
[IDX, C, sumd] = kmeans(X, k) devuelve la suma de las distancias desde los puntos del grupo hasta el punto central en el vector sumd de 1 por k.
[IDX,C,sumd,D] = kmeans(X,k) devuelve la distancia desde cada punto a cada punto central en la matriz D de n por k.
Ayer vi el algoritmo de agrupamiento y no sé mucho al respecto. Espero que puedan darme algún consejo, gracias ~~
Este niño, tú. Obviamente no tienes una comprensión real del modelo BoW, pero tampoco puedes entenderlo. Le sugiero que primero comprenda BoW, lo combine con BoW y luego intente comprender BoF. Esto hace que sea más fácil de entender. En primer lugar, me gustaría señalarles dos cuestiones. Primero, no es suficiente usar 100 imágenes para el aprendizaje automático. Se necesitan al menos 200 imágenes para lograr resultados cualitativos. En segundo lugar, incluso si solo usa 100 imágenes, use la función kmeans que viene con matlab. 2G y el sistema win7 definitivamente causarán un problema sin Memeroy. Se puede calcular aproximadamente el tamaño de esas matrices. Se estima que es setecientos u ochocientos M. Es imposible asignar toda la memoria a matlab. El sistema ocupa mucho y definitivamente habrá un problema de desbordamiento de memoria. /p>
ksignifica que idx registra cada Las etiquetas de agrupación de cada punto también registran el número de puntos clave obtenidos para cada imagen por adelantado, de modo que el número de puntos característicos correspondientes a cada imagen se pueda encontrar en un bucle
kmeans idx registra el número de puntos clave para cada agrupación de puntos.