Red de conocimiento informático - Conocimiento informático - Cómo calcular intervalos de confianza

Cómo calcular intervalos de confianza

Al realizar experimentos, no importa cuán precisas sean las condiciones experimentales, es imposible evitar la influencia de la interferencia aleatoria, por lo que los errores siempre existen y son inevitables. Al realizar experimentos científicos, tome múltiples medidas y promedielas. En las mediciones realizadas en experimentos científicos siempre se añade un rango de medición.

La idea central de las estadísticas: utilizar información de muestra para estimar la información de la población

Anteriormente utilizamos el valor preciso dado por la muestra para estimar la población. Este tipo de estimación puntual es. valioso, pero puede haber errores, porque habrá errores cuando hay estimaciones. Los errores son inevitables, pero se pueden reducir.

Error de punto (valor exacto) gt; error de intervalo (rango)

Estimación de puntos

[Error en la carga de la imagen...(image-491647-1618377925287) ]

El eje horizontal de la figura es el valor promedio de diferentes muestras, de pequeñas a grandes, y la línea de puntos roja representa el promedio general requerido. Suponiendo que el proceso de muestreo se repite 5 veces, hay 5. muestras, y se pueden calcular 5 La estimación puntual de la media muestral, que es el punto azul que representa la muestra general.

[Error en la carga de la imagen... (image-2e6bd9-1618377925287)]

Si hay muchos puntos azules en la imagen, entonces cada punto azul es una estimación puntual de la población. Ante tantas estimaciones puntuales, no podemos juzgar cuál es mejor, es decir, no podemos conocer la precisión de la estimación y, a la inversa, no podemos conocer el rango de error. Para resolver el problema de la estimación puntual, necesitamos utilizar la estimación por intervalos.

Si desea conocer la altura promedio de los hombres en todo el país, solo puede utilizar el método de muestreo para estimar la información general utilizando información de muestra. Seleccione aleatoriamente una muestra de hombres adultos en todo el país. El promedio de esta muestra es el promedio general. Cuando hay múltiples estimaciones puntuales para múltiples muestras, es imposible determinar qué estimación puntual tiene un rango de error menor para la estimación general, por lo que se utiliza la estimación de intervalo para resolver este problema.

Por ejemplo, si la altura promedio nacional de los hombres adultos se encuentra dentro del intervalo de 165 cm a 175 cm [165, 175], entonces este intervalo se denomina intervalo de confianza.

El intervalo de confianza es un método de estimación de intervalos en estadística. Se llama intervalo de confianza porque los valores exactos de a y b dependen de qué tan seguros queremos estar de que el intervalo contiene la media poblacional. Utilice [a, b] para representar el intervalo dentro del cual se encuentra la estimación muestral de la media poblacional. está ligado a errores.

[Error en la carga de la imagen... (image-d127cf-1618377925287)]

Hay cinco muestras y la media general de la muestra es el punto azul en la imagen de arriba. Hay alguna manera de construir el intervalo de confianza de la media de la población de la muestra, por lo que la media de las cinco muestras tiene cinco intervalos de confianza, es decir, las líneas horizontales amarillas y rojas en la figura. En cuanto a cuál es mejor, no lo sabemos. saber. Todavía no lo sabemos, pero en comparación con la estimación puntual, dado que se trata de una estimación de intervalo construida con un nivel de confianza de 95, podemos estar seguros de que todas las líneas horizontales del gráfico contienen la media poblacional, excepto la línea horizontal roja, lo cual no es así. ¿Qué tan confiable es esta conclusión? Es decir, si hay 100 muestras y se pueden construir 100 de esos intervalos, aproximadamente 95 de ellos contendrán la media poblacional. Esto también explica qué es la confianza.

El nivel de confianza se refiere a la probabilidad de que la media poblacional esté contenida; por ejemplo, un nivel de confianza de 95 significa que si hay 100 muestras y se pueden construir 100 de esos intervalos, entonces son 95. la probabilidad contiene la media poblacional. Entonces, esto significa que si tomas una muestra solo una vez, la probabilidad de que esta muestra contenga la media poblacional también es 95.

1. Determine el problema a resolver

Estime la información general con base en la información de la muestra

2. Encuentre la media muestral y el error estándar muestral

p>

Cuando el tamaño de la muestra es mayor que 30, la distribución muestral se ajusta al teorema del límite central, es decir, la distribución muestral es una distribución normal

Se desconoce la desviación estándar de la población, pero la La desviación estándar de la muestra se puede utilizar para estimar la desviación estándar de la población y también la desviación estándar, pero el error estándar se calcula sobre todas las "medias de la muestra", el error estándar se utiliza para medir todas las "medias de la muestra", se utiliza el error estándar. para medir todas las "medias muestrales", se utiliza el error estándar. El error estándar es una medida de todas las "medias muestrales". "

3. Determine el nivel de confianza

El nivel de confianza a adoptar depende enteramente de la situación específica y también depende del nivel de confianza que significa la declaración de la población contenida en tiene el intervalo.

Cuanto mayor sea el nivel de confianza, más amplio será el intervalo y mayor será la probabilidad de que el intervalo de confianza contenga la media general

[Error en la carga de la imagen... (image-55c4ad-1618377925287)]

Según el teorema del límite central, no importa qué distribución obedezca la población, la media de cualquier muestra se distribuirá normalmente alrededor de la media poblacional, por lo que la línea vertical roja en la mitad de la figura es la media poblacional, mientras que según la regla general de la distribución normal, la media muestral de 95 estará dentro de dos errores estándar. Según la regla general de la distribución normal, la media muestral de 95. caerá dentro de dos errores estándar

4. Los valores de los límites superior e inferior del intervalo de confianza

Los límites superior e inferior de ba en la figura anterior son simétricamente. distribuido de acuerdo con la media general Para encontrar a, puede encontrar la distancia desde la media en la figura anterior. El error estándar es solo unas pocas puntuaciones estandarizadas. Simplemente encuentre la puntuación estandarizada correspondiente a a. ¿Cómo encontrar el valor z?

La siguiente figura muestra cómo encontrar el valor z

Según el teorema del límite central, la media muestral es aproximadamente igual. a la media poblacional

a= gran media - |z|* error estándar

b. = gran media |z|* error estándar

Cuando la muestra el tamaño es menor que 30, la distribución muestral se ajusta a la distribución t, que es muy similar a la distribución normal, con una curva más plana y dos colas prominentes

[Error en la carga de la imagen..( image-89cbb1-1618377925287)]

n en la figura anterior se refiere al tamaño de la muestra y df se refiere al grado de libertad

El intervalo de confianza de la muestra pequeña es solo ligeramente diferente del intervalo de confianza de la muestra grande, es decir, la tabla consultada en el tercer paso es diferente

La t en la fórmula del intervalo de confianza se refiere a su valor absoluto, la fórmula de corrección es como | siguiente:

a=media poblacional-|t|*error estándar

b=media poblacional|t|*error estándar

El grado de libertad es Se refiere al tamaño de las muestras seleccionables, menos el número de muestras que no fueron seleccionadas en la última selección, dejando solo una muestra.

Por ejemplo: hay cuatro tipos de frutas y eliges comer una. todos los días, el cuarto día, solo hay un tipo de fruta para comer y no hay otra opción en este momento, por lo que el grado de libertad es 3.