¿Cómo dibujar un gráfico de columnas en PythonK?
Antes de presentar ggplot2, permítanme presentarles al autor Hadley Wickham. Hadley (Departamento de Estadística de la Universidad de Rice: Facultad)
recibió un doctorado de la Universidad Estatal de Iowa, una de las mejores universidades en estadística, y su tesis doctoral fue Herramientas prácticas para
explorar datos. y modelos trata sobre su tesis doctoral "Herramientas prácticas para datos y modelos". Su tesis doctoral "Herramientas prácticas para explorar datos y modelos" trata sobre la visualización de datos y el análisis exploratorio de datos. Actualmente es profesor asistente adjunto en la Universidad Rice y también científico jefe del famoso entorno de desarrollo integrado en lenguaje R RStudio. Hadley goza de una gran reputación entre los usuarios del lenguaje R. La versión básica del lenguaje R no es muy buena, pero Hadley tiene una serie de trabajos excelentes. La versión base de R no era muy buena, pero la serie de excelentes trabajos de Hadley mejoró enormemente R
R. Cuando Hadley desarrolla un paquete de software, primero lanzará una versión. Si cree que esta versión no es lo suficientemente buena y la actualiza, lanzará una nueva versión y la reemplazará con la versión anterior. Agregue el número 2 después del nombre. tenemos reshape2 y
ggplot2.
ggplot2 está basado en el libro "Grammar of Graphics" de Leland Wilkinson. La teoría, tomando sus siglas y agregando trama, se llama ggplot. Un gráfico estadístico es una asignación de datos a propiedades gráficas (como el color, la forma o el tamaño de objetos geométricos como puntos, líneas o cuadrados), que puede incluir transformaciones estadísticas de los datos (como promedios o varianzas). y luego, en un sistema de coordenadas específico, trace este mapeo para obtener el gráfico que necesitamos. El gráfico también puede tener facetas, que generan gráficos sobre diferentes subconjuntos de datos. El proceso de dibujar gráficos usando ggplot2 es un proceso de selección de objetos geométricos, propiedades gráficas y transformaciones estadísticas apropiadas para mostrar completamente la información contenida en los datos.
Se necesita algo de tiempo para comenzar con ggplot2, pero una vez que domines la sintaxis de gráficos en ggplot2, creo que sentirás la elegancia de la sintaxis.
En la siguiente sección, asumo que el lector ya tiene un conocimiento básico del lenguaje R, por lo que no presentaré conceptos básicos como DataFrame.
Instalar ggplot2 no es diferente a instalar cualquier otro paquete de R, simplemente ejecute la línea install.packages("ggplot2") en la consola de R o use el mouse si está usando RStudio Install desde la lista de paquetes.
Primero, introduzcamos algunos conceptos básicos de ggplot2. Entre paréntesis están los nombres de los parámetros que ggplot2 necesita usar al asignar valores a dichas propiedades
Propiedades gráficas (aes) coordenadas verticales y horizontales, tamaño de punto, color, color de relleno, etc.
Objeto de geometría (geom_) Las propiedades gráficas especificadas anteriormente deben representarse en un objeto de geometría para que sean visibles para el usuario.
Estos objetos pueden ser puntos, líneas o barras
Transformación estadística (stat_), como promedio, varianza, etc., utilizada cuando necesitamos mostrar ciertas propiedades estadísticas de variables
Estadísticas Transformar(stat_)