Red de conocimiento informático - Problemas con los teléfonos móviles - R en acción 68 Notas de autoestudio: diagramas de correlación y diagramas de mosaico

R en acción 68 Notas de autoestudio: diagramas de correlación y diagramas de mosaico

Preparación de datos

La función corrgram() en el paquete corrgram.

corrgram(x, order=, panel=, text.panel=, diag.panel=)

donde x es un marco de datos con una observación por fila. Cuando orden = VERDADERO, la matriz de correlación se reordenará utilizando el análisis de componentes principales de las variables

, lo que hará que el patrón de relaciones entre variables binarias sea más obvio. Las opciones del panel establecen el tipo de elemento utilizado para los paneles fuera de la diagonal. Puede utilizar las opciones panel.inferior y panel.superior para establecer el tipo de elementos debajo y encima de la diagonal principal respectivamente. Las opciones text.panel y diag.panel controlan el tipo de elemento diagonal principal.

En la parte inferior del triángulo, de forma predeterminada, el azul y una línea diagonal desde la esquina inferior izquierda hasta la esquina superior derecha indican que las dos variables de la celda están correlacionadas positivamente. Por el contrario, el rojo y una línea diagonal desde la parte superior izquierda hasta la inferior derecha indican que las variables están correlacionadas negativamente. Cuanto más oscuro sea el color y mayor la saturación, más fuerte será la correlación entre las variables. Las celdas con correlaciones cercanas a 0 son esencialmente incoloras. Las celdas triangulares de arriba muestran la misma información en formato de gráfico circular. El color funciona de la misma manera que el anterior, pero el tamaño de la correlación se muestra mediante el tamaño del relleno del gráfico circular. Una correlación positiva llenará el pastel en el sentido de las agujas del reloj desde la dirección de las 12 en punto, mientras que una correlación negativa llenará el pastel en el sentido contrario a las agujas del reloj.

Se pueden especificar cuatro colores usando la función colorRampPallette().

La función colorRampPalette admite la creación personalizada de una serie de degradados de color.

Un diagrama de mosaico es una representación gráfica de datos categóricos que utiliza una lista de columnas para observar la relación entre dos o más variables categóricas.

La gráfica completa tiene un valor de probabilidad de 1 tanto para el largo como para el ancho, y está dividida en rectángulos, cada uno con longitudes de lados proporcionales a la distribución de probabilidad de la variable categórica asociada.

En un gráfico de mosaico, el área de los rectángulos anidados es proporcional a la frecuencia de la celda, que es la frecuencia en la tabla de concatenación multidimensional. El color y/o el sombreado pueden representar los valores residuales del modelo ajustado.

La función mosaico() en el paquete vcd puede dibujar gráficos de mosaico

La función mosaico() se puede llamar de la siguiente manera

mosaico(tabla)

Entre ellos, la tabla es la forma de matriz de la lista.

o

mosaico(fórmula, datos=)

donde la fórmula es una expresión R estándar y los datos se establecen en un marco de datos o una tabla.

shade=TRUE coloreará el gráfico según los residuos de Pearson del modelo ajustado.

legend=TRUE mostrará una leyenda para los residuos.

Explicación del gráfico: el gráfico 3 refleja la proporción de valores v1 grandes de la variedad a en relación con la variedad b en 2021, siendo la variedad a mayor que la variedad b. En 2020, los valores de v1 de las dos variedades están equilibrados; la proporción de valores de v1 grandes en 2020 es que el valor de N1 es mayor que el valor de N2, y los dos niveles de nitrógeno están equilibrados en 2021. p>

Referencias: