Red de conocimiento informático - Aprendizaje de código fuente - Descripción estadística (medición) de los datos

Descripción estadística (medición) de los datos

1. Media aritmética

Función R: media()

2. Mediana

Todas las observaciones están ordenadas de pequeña a grande, y la del medio se llama mediana .

Cuando el número de observaciones es un número impar, la mediana es la primera observación.

Cuando el número de observaciones es un número par, la mediana es la suma de las dos; las observaciones ocuparon el primer lugar.

Función R: mediana( )

3. El punto medio de un conjunto de datos se llama moda, representado por

4. Media geométrica

Representado por G, si hay n observaciones en los datos. Si hay n observaciones en la información, la fórmula de cálculo es:

Cálculo en lenguaje R: exp^(mean( log (x)))? El valor inferior predeterminado de la función log() en lenguaje R es e

5. Promedio ponderado (promedio ponderado)

En una muestra con N observaciones, el número de observaciones aparece una vez, el número de observaciones aparece una vez y el número de observaciones aparece una vez. El número de aparece una vez y luego:

6. Media geométrica ponderada:

Cálculo en lenguaje R: exp^(sum(f*log( x))/sum. ( f))

1. Rango (rango)

También conocido como rango completo, es la diferencia entre el valor máximo y el valor mínimo en los datos de muestra, generalmente expresado en lenguaje R

Cálculo en lenguaje R: max(data) - min(data)

2. Varianza (varianza)

También llamada media cuadrática (MS)

Fórmula de varianza de muestra:

Fórmula de varianza de población:

Función R: var()

3. Desviación estándar (Sd)

Desviación estándar muestral:

Desviación estándar poblacional:

Desviación estándar muestral:

Desviación estándar poblacional:

Rango intercuartil (IQR)

IQR=P75?P25

Es adecuado para distribuciones asimétricas o distribuciones con información desconocida, porque no se ve afectado por datos extremadamente grandes o pequeños en ambos extremos. El rango intercuartil es más estable que el rango porque no se ve afectado por datos extremadamente grandes o pequeños en ambos extremos, pero aún no tiene en cuenta la variabilidad de cada observación. Suele utilizarse junto con la mediana, que combina el valor medio de los datos y el grado de variación, escrito como M(P25, P75)

Función R: cuantil. >

5. Coeficiente de variación (CV)

Se utiliza cuando las unidades de medida son diferentes o las medias son muy diferentes

.