¿Qué tipos de métodos de tiempo compartido de datos comúnmente utilizados en el análisis discriminante se pueden dividir según diferentes criterios discriminantes?
También conocido como análisis de conglomerados y análisis de grupos de puntos. Técnica de análisis multivariado que clasifica los objetos de investigación según sus características, dividiendo a los individuos con propiedades similares en una categoría, de modo que los individuos del mismo tipo tienen un alto grado de homogeneidad y los individuos de diferentes tipos tienen un alto grado de heterogeneidad. Según los diferentes objetos de clasificación, se divide en agrupación de muestras y agrupación de variables.
2. Análisis discriminante
Es un medio técnico de discriminación y agrupación estadística. Con base en la información conocida de una determinada variable de agrupación y las otras variables multivariadas correspondientes de un cierto número de casos, determine la relación cuantitativa entre la agrupación y otras variables multivariadas, establezca una función discriminante y luego use esta relación cuantitativa para clasificar las variables. Los casos pertenecientes a la agrupación de otros tipos de agrupación desconocidos se clasifican en grupos.
La variable dependiente o criterio discriminante en el análisis discriminante es una variable categórica fija, mientras que la variable independiente o variable predictiva es básicamente una variable de distancia fija. Según los diferentes tipos y métodos de discriminación, se puede dividir en múltiples categorías de discriminación y categorías de discriminación jerárquica. El proceso de análisis discriminante consiste en establecer una combinación lineal de variables independientes (u otras funciones no lineales) para que pueda distinguir mejor varias categorías de variables dependientes.
2. La diferencia entre análisis de conglomerados y análisis discriminante
1. Diferentes ideas básicas
(1) La idea básica del análisis de conglomerados
Estudiamos que existen diferentes grados de similitud (grado de similitud) entre muestras o indicadores (variables), por lo que necesitamos encontrar algunos indicadores que puedan medir la similitud de muestras o indicadores en función de varios valores de observación. de varias muestras, para determinar el grado de similitud. Encuentre algunas estadísticas que midan específicamente la similitud entre muestras o indicadores y utilice estas estadísticas como base para dividir los tipos. Agregar algunas muestras (o indicadores) con mayor similitud en una categoría, y agregar otras muestras (o indicadores) con menor similitud en otra categoría, clasificar muestras (o indicadores) estrechamente relacionados en unidades pequeñas y clasificar muestras (o indicadores) distantes; en unidades grandes. Clasificar hasta que todas las muestras (o indicadores) estén agregadas.
(2) La idea básica del análisis discriminante
Establecer una regla de clasificación compuesta por indicadores numéricos, es decir, una función discriminante, para datos de clasificación conocida, y luego aplicar dicha regla a clasificaciones desconocidas de muestras a clasificar. Se puede ver a partir de la idea básica de que en el análisis de conglomerados, se desconocen las categorías a las que pertenecen todas las muestras o individuos y, en general, se desconoce el número de categorías. La base del análisis son los datos originales y no hay información previa sobre las categorías. como referencia.