Red de conocimiento informático - Problemas con los teléfonos móviles - rVisualización de datos 10: Enjambre de abejas

rVisualización de datos 10: Enjambre de abejas

No sé de dónde viene el nombre Bee Map, pero supongo que es porque el paquete que dibuja este mapa se llama beeswarm.

Primero echemos un vistazo a cómo se ve un mapa de abejas.

Se ve muy similar a nuestro diagrama de puntos anterior. Podemos comparar visualmente el mismo conjunto de gráficos sobre datos de cáncer de mama dibujados por jitter y point (parámetros predeterminados) en beeswarm y ggplot:

Se puede encontrar que beeswarm refleja muy bien la distribución de los datos, y Es más claro e intuitivo. Los dos últimos dificultan la obtención de información rápidamente, los puntos en el diagrama de puntos son demasiado densos y la distribución de la fluctuación está demasiado dispersa. Esta es también la razón por la que muchos artículos científicos eligen diagramas de colonias de abejas. En una muestra pequeña, quizás los métodos de fluctuación o de puntos también puedan transmitir el mensaje que queremos transmitir. Pero cuando el tamaño de la muestra es grande, ninguno de los métodos de dibujo es adecuado. Los diagramas de colonias de abejas también se utilizan en situaciones con muestras grandes. No solo puede reflejar la situación específica de cada muestra, sino también ver la situación general.

Este diagrama utiliza dos paquetes diferentes. La razón de esto es que el paquete comúnmente utilizado para hacer mapas de abejas se llama "enjambre de abejas", pero sus hábitos de dibujo son ligeramente diferentes a los de ggplot. Como antes usé ggplot para hacer dibujos, también explicaré otro paquete llamado "ggbeeswarm" basado en ggplot.

Nota: Si el paquete R correspondiente no está instalado, instálelo primero.

1) ¿Qué formato de datos se requiere?

Esta vez, utilizamos los datos de mama del paquete Beeswarm.

* * *Hay 286 muestras, la información específica es la siguiente:

Estado del receptor de estrógeno (factor negativo, positivo)

ESR 1: VSG 1 expresión genética (número)

erbb 2: expresión del gen erbb 2 (número)

time_survival: tiempo en meses (número)

event_survival: evento de codificación: 0 = truncamiento, 1 = transferencia (número)

2) ¿Cómo dibujar?

Primero utiliza el paquete Beeswarm.

Puedes ver que a diferencia de ggplot que proporciona x= e y= específicos, este paquete usa la fórmula:

Ejemplo: p~grp

Entonces es equivalente a que x sea grp y y sea p.

Además, muchos detalles de los dibujos fueron modificados de manera inconsistente.

Pch es el estilo del punto seleccionado. Diferentes números representan círculos sólidos, círculos huecos, triángulos, triángulos invertidos, etc.

Pwcol se utiliza para establecer el color. Como puede ver, el motivo de 1 aquí es que event_survival contiene un valor de 0. Si no sumas 1 no habrá color, es decir, estas muestras no se podrán ver.

La etiqueta se utiliza para modificar la etiqueta del eje X.

Luego usa la función de leyenda para agregar una leyenda.

Entonces echemos un vistazo a otro paquete r, ggbeeswarm.

Compartir visual de datos R anteriores

rData Visualización 9: Gráfico Lollipop

rData Visualización 8: Gráfico piramidal y gráfico de desviación

rData Visualización 7: Gráfico de burbujas

rVisualización de datos 6: Gráfico de áreas

rVisualización de datos 5: Mapa de calor

rVisualización de datos 4: Gráficos PCA y PCoA

rVisualización de datos 3: gráfico de barras/cuadrados

rVisualización de datos 2: diagrama de caja

rVisualización de datos 1: mapa de volcanes