Cómo utilizar la programación spss para implementar análisis de regresión lineal
El análisis de regresión lineal tiene mucho contenido, como la prueba de bondad de ajuste de la ecuación de regresión, la prueba de significancia de la ecuación de regresión, la prueba de significancia del coeficiente de regresión, el análisis residual, la variable problemas de detección y selección de variables. Problema lineal multi***.
Ver imagen para su funcionamiento. El análisis de regresión suele requerir múltiples operaciones experimentales para llegar a un mejor modelo. Seleccionar "Entrar" en "Método" significa que todas las variables independientes ingresan al modelo. Actualmente, no se ha considerado el tema de la multiplexación de variables. Primero debemos observar el análisis de resultados preliminares antes de considerar la cuestión de la multiplexación de variables.
Al observar el coeficiente de determinación ajustado de 0,924, la bondad de ajuste es alta y hay menos variables inexplicables.
Si la probabilidad de la prueba de significancia de la ecuación de regresión es 0, que es menor que el nivel de significancia 0,05, entonces se considera que los coeficientes son 0 al mismo tiempo. La relación lineal entre la variable explicada. y toda la variable explicativa es significativa, y se puede establecer una ecuación lineal.
En la tabla de coeficientes, podemos observar el valor de probabilidad en la prueba de significancia del coeficiente de regresión. Si el nivel de significancia es 0,05, excepto el "número de años-persona invertidos", todas las demás variables lo son. mayor que el nivel de significancia. Estas variables se retienen en es incorrecto en la ecuación. Entonces el modelo no es utilizable y debería ser remodelado.
Vea la imagen de la operación de remodelación. Se utiliza el método de "selección retrospectiva". Las variables eliminadas en orden son el número de monografías, el número de años-persona invertidos en títulos profesionales senior. inversión en investigación científica, el número de premios y el número de artículos. El resultado final del modelo es "número de proyectos establecidos = -94,524 0,492x número de años-persona invertidos".
Análisis residual:
Como se puede ver en el diagrama P-P, no hay una diferencia significativa entre los datos originales y la distribución normal, y los residuos cumplen con los requisitos previos de la distribución lineal. modelo.
A partir de la distancia de Cook (0,041 es menor que 1) y el valor de la variable índice de apalancamiento no existe diferencia significativa.
Los puntos residuales se distribuyen aleatoriamente alrededor de la línea 0.