rVisualización de datos 10: Enjambre de abejas
Primero echemos un vistazo a cómo se ve un mapa de abejas.
Se ve muy similar a nuestro diagrama de puntos anterior. Podemos comparar visualmente el mismo conjunto de gráficos sobre datos de cáncer de mama dibujados por jitter y point (parámetros predeterminados) en beeswarm y ggplot:
Se puede encontrar que beeswarm refleja muy bien la distribución de los datos, y Es más claro e intuitivo. Los dos últimos dificultan la obtención de información rápidamente, los puntos en el diagrama de puntos son demasiado densos y la distribución de la fluctuación está demasiado dispersa. Esta es también la razón por la que muchos artículos científicos eligen diagramas de colonias de abejas. En una muestra pequeña, quizás los métodos de fluctuación o de puntos también puedan transmitir el mensaje que queremos transmitir. Pero cuando el tamaño de la muestra es grande, ninguno de los métodos de dibujo es adecuado. Los diagramas de colonias de abejas también se utilizan en situaciones con muestras grandes. No solo puede reflejar la situación específica de cada muestra, sino también ver la situación general.
Este diagrama utiliza dos paquetes diferentes. La razón de esto es que el paquete comúnmente utilizado para hacer mapas de abejas se llama "enjambre de abejas", pero sus hábitos de dibujo son ligeramente diferentes a los de ggplot. Como antes usé ggplot para hacer dibujos, también explicaré otro paquete llamado "ggbeeswarm" basado en ggplot.
Nota: Si el paquete R correspondiente no está instalado, instálelo primero.
1) ¿Qué formato de datos se requiere?
Esta vez, utilizamos los datos de mama del paquete Beeswarm.
* * *Hay 286 muestras, la información específica es la siguiente:
Estado del receptor de estrógeno (factor negativo, positivo)
ESR 1: VSG 1 expresión genética (número)
erbb 2: expresión del gen erbb 2 (número)
time_survival: tiempo en meses (número)
event_survival: evento de codificación: 0 = truncamiento, 1 = transferencia (número)
2) ¿Cómo dibujar?
Primero utiliza el paquete Beeswarm.
Puedes ver que a diferencia de ggplot que proporciona x= e y= específicos, este paquete usa la fórmula:
Ejemplo: p~grp
Entonces es equivalente a que x sea grp y y sea p.
Además, muchos detalles de los dibujos fueron modificados de manera inconsistente.
Pch es el estilo del punto seleccionado. Diferentes números representan círculos sólidos, círculos huecos, triángulos, triángulos invertidos, etc.
Pwcol se utiliza para establecer el color. Como puede ver, el motivo de 1 aquí es que event_survival contiene un valor de 0. Si no sumas 1 no habrá color, es decir, estas muestras no se podrán ver.
La etiqueta se utiliza para modificar la etiqueta del eje X.
Luego usa la función de leyenda para agregar una leyenda.
Entonces echemos un vistazo a otro paquete r, ggbeeswarm.
Compartir visual de datos R anteriores
rData Visualización 9: Gráfico Lollipop
rData Visualización 8: Gráfico piramidal y gráfico de desviación
rData Visualización 7: Gráfico de burbujas
rVisualización de datos 6: Gráfico de áreas
rVisualización de datos 5: Mapa de calor
rVisualización de datos 4: Gráficos PCA y PCoA
rVisualización de datos 3: gráfico de barras/cuadrados
rVisualización de datos 2: diagrama de caja
rVisualización de datos 1: mapa de volcanes