Métodos básicos de análisis estadístico organizados con R
Frente a una gran cantidad de datos, a menudo resulta deslumbrante. Pero a través de algunos gráficos y operaciones simples, puede aprender más sobre las características de los datos. R proporciona muchas funciones para la descripción de datos, mediante las cuales se puede realizar un análisis preliminar simple de los datos.
Función R para obtener estadísticas descriptivas
(1) Funciones estadísticas comunes (el parámetro x es un vector)
media (x): media
mediana (x): mediana
sd (x): desviación estándar
var (x): varianza
suma (x) : Suma
mín (x): suma(x). /p>
min(x): valor mínimo
max(x): valor máximo
rango(x): rango de valores
...etc.
(2) función resumen(); proporciona el valor mínimo, el cuartil inferior, la mediana, la media, el cuartil superior y el valor máximo.
(2) función apply() o sapply: calcula cualquier estadística descriptiva especificada por los parámetros.
Uso de Sapply(): sapply(x, FUNC, opciones), x es el marco de datos a procesar, FUNC es la función especificada por el usuario, como suma(), max(), media (), etc., las opciones especificadas se pasarán a FUNC.
(3) Paquete Hmisc en la función describe(): devuelve el número de variables y valores observados, el número de valores faltantes y valores únicos, media, cuartil, cinco valores máximos y cinco valores a valor mínimo.
(4) La función stat.desc() en el paquete de software pastecs puede calcular una gran cantidad de estadísticas descriptivas.
(5) El paquete de software psych también proporciona describe() función, que puede calcular el número de valores no perdidos, media, desviación estándar, mediana, media truncada, desviación mediana absoluta, valor mínimo, valor máximo, rango de valores, asimetría, curtosis, etc.