¿Cuáles son los indicadores para medir la tendencia central y la tendencia de dispersión de los datos, y cuáles son sus respectivas manifestaciones?
Los indicadores de medición de la tendencia de dispersión incluyen rango completo, relación de valores atípicos, dispersión de cuartil, desviación media, desviación estándar y coeficiente de dispersión, entre los cuales la desviación estándar es el más importante. Una expresión es qué tan lejos está cada valor de variable de su valor central, otra característica importante de la distribución de datos.
Datos ampliados:
Desviación estándar de tendencia discreta:
La desviación promedio se mide en valor absoluto, lo que evita la cancelación mutua de desviaciones positivas y negativas. pero es un inconveniente de operar. En términos generales, la varianza se puede utilizar para medir la dispersión de un conjunto de datos. La varianza suele representarse con la letra σ2.
Para que la unidad de la estadística sea consistente con la unidad del valor observado, la varianza generalmente se eleva al cuadrado para obtener la desviación estándar σ, que también se llama error cuadrático medio. Por definición, la varianza y la desviación estándar reflejan un cierto grado de desviación del centro representado por un conjunto de datos de su media. Por definición, una distribución con una desviación estándar (o varianza) pequeña debe concentrarse cerca de la media, y viceversa.
La desventaja de la desviación estándar es que es más complicada de calcular. La desviación estándar también se calcula en base a todos los datos, pero también se ve afectada por los valores extremos. El cálculo de la desviación estándar es más conveniente que la desviación promedio, por lo que la desviación estándar es la estadística más utilizada para describir la tendencia de dispersión de los datos.
En estadística, solemos utilizar σ2 y σ para representar la varianza y la desviación estándar de la población respectivamente. Cuando el número de individuos en una población es grande y desea estimar la desviación estándar de la población mediante muestreo, debe calcular la varianza y la desviación estándar de la muestra. Sólo necesitamos hacer algunos ajustes a las fórmulas para calcular la varianza poblacional y la desviación estándar.
El concepto de desviación estándar juega un papel importante en la estadística. Para cualquier población, después de determinar la desviación estándar, podemos determinar con precisión con qué frecuencia las unidades de la población caen dentro de un cierto rango a cada lado de la media. En el caso de una distribución normal, en la siguiente sección introduciremos la magnitud y el significado de la probabilidad de que los datos caigan dentro de un cierto rango.