Red de conocimiento informático - Aprendizaje de código fuente - La mejor respuesta al salario docente

La mejor respuesta al salario docente

Ideas para resolver problemas 1) Primero, al observar los datos en la tabla y dibujar el diagrama de dispersión relevante, se puede ver que existe una relación lineal obvia con La influencia de también es lineal, entonces este es un modelo de regresión lineal múltiple. El modelo de regresión es

En la fórmula, , ,..., son todos parámetros desconocidos que no tienen nada que ver con estos factores, llamados coeficientes de regresión, y son errores aleatorios.

La regresión lineal múltiple se implementa utilizando la caja de herramientas estadísticas de matlab y el comando regress. El método utilizado es el método de mínimos cuadrados y la programación es

[b,bint,r,rint. ,stats ]=regress(z,x)

b,bint es la estimación del coeficiente de regresión y su intervalo de confianza, r.rint es el residual y su intervalo de confianza, stats son las estadísticas utilizadas para probar la regresión modelo, Hay cuatro valores, es decir, obtenidos mediante programación

b =

1.0e+003 *

1.1276

0.0027

0,0409

-0,0135

0,1604

0,0313

0,0769

-0,0012

bint =

1.0e+003 *

1.0174 1.2378

0.0023 0.0031

- 0.1021 0.1839

-0,1638 0,1369

0,0772 0,2436

-0,0855 0,1482

-0,1673 0,3211

-0,1276 0,1252

stats =

1.0e+004 *

0.0001 0.0045 0.0000 5.2969

Se puede observar en los resultados que: además de Por encima de los coeficientes de regresión, otros coeficientes de regresión Los intervalos de confianza de todos incluyen el punto cero, y la distancia entre el lado derecho del intervalo y el punto cero es muy cercana, y los coeficientes de regresión no son significativos. Estos factores no considerados pueden eliminarse en consecuencia. , y sólo se pueden establecer modelos sobre jornada laboral y nivel educativo. El modelo de jornada laboral y nivel educativo es el siguiente:

, y se resuelve mediante programación:

[b,bint,r,rint,stats]=regress(y,x)

b =

1.0e+003 *

1.1442

0.0027

0.0027

0.0027

1.1442

0.0027

0.0027

0.0027

0.1913

bint =

1.0e+003 *

1.0623 1.2260

0.0024 0.0031

0.1521 0.2306

estadísticas =

1.0e+004 *

0.0001 0.0164 0.0000 5.0933

Así se obtiene el modelo de regresión:

Para este problema, al resolver el problema Durante el proceso, se utilizó rcoplot (r, rint) para dibujar los residuos de la siguiente manera:

Se encontraron anomalías en los grupos de datos 43, 47, 52, 60, 61, 67 y 90 ; excluido

Excluye los nuevos datos de los grupos 41, 44, 54, 72, 75, 80 y 83 para dibujar un gráfico:

Excluye los datos de los grupos 50, 54, y 63 para dibujar un gráfico:

Excluyendo los datos del grupo 68, obtenemos: