¿Cómo utilizar el software SPSS para realizar análisis de conglomerados?
¿Cómo hacer un análisis de clusters de sistemas?
El análisis de conglomerados es un método para simplificar los datos mediante el modelado de datos. "Los pájaros del mismo plumaje se juntan y las personas se juntan" es la mejor interpretación del análisis de conglomerados. Desde una perspectiva analítica, el análisis de conglomerados se puede dividir en dos tipos: uno es el agrupamiento por muestras (o casos). El representante de este tipo de agrupamiento es el método de agrupamiento de K-medias; el otro es el agrupamiento por variables (o títulos). ) agrupación, el representante de este tipo de agrupación es la agrupación jerárquica (agrupación de sistemas). El método de agrupación específico se resume en la siguiente tabla:
Antecedentes del caso: actualmente hay 8 jueces que califican a 300 jugadores, siendo la puntuación más baja de 1 punto y la puntuación más alta de 10 puntos; 8 jueces, para identificar el tipo de estilo del árbitro. Hay 8 columnas de datos para un total de 8 árbitros y 300 filas. Dado que todas las puntuaciones son del 1 al 10 y las unidades de las 8 columnas de datos son todas iguales, no es necesario estandarizar los datos antes del análisis (por supuesto, no hay problema con la estandarización).
Operación
Este caso involucra un total de 8 títulos. La captura de pantalla de la operación de SPSSAU es la siguiente:
SPSSAU se agrupará en 3 categorías de forma predeterminada y presentará el contenido. table Como resultado, si desea más categorías, puede configurarlas usted mismo.
Resultados de salida de SPSSAU
SPSSAU generará primero la descripción básica de los elementos de agrupación, luego generará la afiliación a la categoría de agrupación de cada elemento y generará un dendrograma, de la siguiente manera:
La tabla anterior muestra la situación básica de un total de ***8 elementos de análisis (es decir, 8 datos de referencia), incluida la media, el valor máximo o mínimo, la mediana, etc., para tener una visión general del datos básicos. En general, las puntuaciones de los ocho jueces estuvieron básicamente por encima de los 8 puntos en promedio.
La agrupación total de *** se divide en 3 categorías, así como las relaciones correspondientes entre elementos de análisis específicos. Como se muestra en la tabla anterior, se puede ver en la tabla anterior que el árbitro 8 está solo como categoría, los árbitros 5, 3 y 7 están agrupados en una categoría y los árbitros 1, 6, 2 y 4 son uno; categoría.
La relación correspondiente entre las categorías de agrupamiento y los elementos de análisis se puede obtener en la tabla anterior, y también puede ver el dendrograma de agrupamiento para obtener más información. En cuanto a cómo se deben llamar las categorías de agrupación, debe nombrarlas por separado según las situaciones correspondientes.
La imagen de arriba es una visualización de un dendrograma de agrupamiento. El dendrograma de agrupamiento utiliza un método de representación gráfica para mostrar el proceso específico de agrupamiento; el número en la fila superior es solo una unidad de escala, que representa la distancia relativa; un nodo representa un proceso de enfoque.
Al interpretar el diagrama de árbol, se recomienda dibujar una línea vertical separada y luego ver las categorías correspondientes en varias categorías, así como la relación correspondiente entre cada categoría y los elementos de análisis. Por ejemplo, en la imagen de arriba, la línea vertical roja eventualmente se dividirá en 3 categorías; la primera categoría corresponde al árbitro 8; la segunda categoría corresponde a los árbitros 5, 3 y 7 y la tercera categoría corresponde a los árbitros 1, 6, 2 y 4.
Por supuesto, también puede considerar dividirlo en dos categorías durante el análisis. En este caso, solo necesita mover las líneas verticales en consecuencia, como se muestra a continuación:
La figura anterior. muestra que solo está dividido en dos categorías. Si se agrupa en 2 categorías, entonces el árbitro 8 será una categoría separada; los árbitros 5, 4, 7, 1, 6, 2 y 4 se agruparán en una categoría separada; .
Si se agrupa en cuatro categorías; como se puede ver en la imagen de arriba, obviamente ya no es apropiado. La razón es que las líneas verticales son difíciles de distinguir en cuatro categorías. Esto significa que hay dos categorías que deberían ser más adecuadas juntas (Árbitro 1 y 6/2/4 en la imagen de arriba, pero si se dividen en 4 categorías, el Árbitro 1 estará en una categoría separada en este momento); Entonces, dibujar líneas verticales no puede distinguir categorías.
Así, a partir de un análisis exhaustivo, la agrupación final en tres categorías es la más adecuada.