Red de conocimiento informático - Consumibles informáticos - Clasificación no supervisada

Clasificación no supervisada

La clasificación no supervisada significa que las personas no aplican ningún conocimiento previo al proceso de clasificación por adelantado, sino que solo se basan en las reglas de distribución de las características espectrales de los datos de las imágenes de teledetección, basándose en la estructura de los datos de la imagen. en sí (características estadísticas) y la distribución del grupo de puntos naturales, de acuerdo con la similitud del vector de valores de brillo de la muestra que se dividirá en el espacio espectral multidimensional, el programa de computadora resume automáticamente los parámetros de clasificación, es decir, las características de los naturales. agrupación para una clasificación "ciega". El resultado de la clasificación solo distingue diferentes categorías, pero no determina los atributos de las categorías. Los atributos de sus categorías se determinan mediante interpretación visual o investigación de campo después de la clasificación. La clasificación no supervisada también se denomina análisis de agrupamiento (cluster). Los métodos utilizados incluyen el reconocimiento de patrones, el agrupamiento de sistemas, el método de división y el agrupamiento dinámico.

Entre ellos, el más práctico es el clustering dinámico. Primero selecciona varios vectores medios como "semillas" según la experiencia y los números de clasificación, establece un lote de centros iniciales, realiza una clasificación aproximada preliminar y luego prueba los resultados de la clasificación de acuerdo con los parámetros especificados (umbrales) y modifica y ajusta gradualmente los centros de clasificación, y luego reclasificar y fusionar o dividir las clases en función de varias estadísticas discretas (como el error cuadrático medio, etc.) y estadísticas de separabilidad entre diferentes categorías (como la distancia estandarizada entre clases, etc.); centro, Hasta que el resultado de la clasificación sea razonable. En la agrupación dinámica, el centro del grupo y el número de clasificaciones se pueden ajustar automáticamente de acuerdo con las características espectrales objetivas y el efecto de clasificación es generalmente mejor. Sin embargo, el significado exacto de los resultados de la clasificación (atributos de las categorías) debe analizarse por separado. de estudios de campo o condiciones del terreno existentes. Utilice los datos para determinar sus tipos de características. A continuación se toman el método ISODATA y el método K-Means como ejemplos para mostrar el proceso de procesamiento.

1. Método ISODATA

ISODATA también se denomina algoritmo iterativo de análisis de datos autoorganizado. Su esencia es analizar continuamente los parámetros de clasificación (como la media, la desviación estándar y el inter). -media de clase de cada categoría) durante el proceso de clasificación, etc.), y finalmente construir la función discriminante requerida mediante métodos como división de clases, fusión de clases y eliminación de clases. La implementación del método ISODATA incluye principalmente los siguientes pasos (Figura 4-23):

(1) Determinar el número inicial de categorías y centros de categorías. La determinación inicial del número de categorías y centros de categorías es bastante arbitraria, ya que no existe conocimiento previo, solo se puede ajustar gradualmente en el futuro. Generalmente, se puede determinar en función de las características de distribución estadística de los datos originales.

(2) Calcule la distancia entre cada vector de píxeles y el centro de cada categoría, y asigne el vector de píxeles a la categoría con la distancia más pequeña.

(3) Calcular el vector medio de la nueva categoría.

(4) Determine si el nuevo centro de categorías ha cambiado.

(5) Cuando el nuevo centro de categorías cambie, reemplace el centro antiguo con la nueva media y regrese al paso (2) para continuar el ciclo de iteración; cuando el nuevo centro de categorías ya no cambie, detenga la iteración; y generar resultados de clasificación.

2. Método K-Means

La idea básica del método K-Means es mover iterativamente el centro de cada categoría de referencia (categoría inicial) hasta obtener el mejor resultado de agrupación. obtenido. La determinación del nuevo centro de categoría se basa en el principio de que la suma de las distancias al cuadrado desde todos los píxeles de la categoría hasta el centro de categoría es la más pequeña. Este principio no es fundamentalmente diferente del enfoque ISODATA.

La clasificación no supervisada no requiere muestras de entrenamiento por adelantado, por lo que la velocidad de procesamiento es más rápida y objetiva, y puede proporcionar una referencia para seleccionar muestras de entrenamiento para la clasificación supervisada. Generalmente se realiza antes de la clasificación supervisada intencionada.