¿Qué es el algoritmo de agrupamiento medio?
El algoritmo de agrupamiento medio agrupa las muestras en k grupos (grupos).
La idea del algoritmo K-means es simple: para un conjunto dado de muestras, el conjunto de muestras se divide en K grupos según la distancia entre las muestras. Deje que los puntos del grupo estén conectados lo más estrechamente posible y la distancia entre grupos sea lo más grande posible. En el algoritmo K-Mean real, generalmente ejecutamos el gráfico cy el gráfico d varias veces para lograr la clasificación óptima final.
En términos de expresión de datos
Suponiendo que la agrupación se divide en $(C_1, C_2, .... ...C_k)$$, entonces nuestro objetivo es minimizar el cuadrado Error E: $$ E = \sum\limits_{i=1}^k\sum\limits_{x \in C_i}|x-\mu_i||_2^2$$.
Entre ellos, $$\mu_i$$ es el vector promedio del cluster $$C_i$, a veces también llamado centro de masa, y su expresión es: $$\mu_i = \frac{1}{ |C_i |}\sum\limits_{x \in C_i}x$$ .