Red de conocimiento informático - Problemas con los teléfonos móviles - ¿Cómo hacer que los valores de y en la regresión logística sean continuos usando el lenguaje r?

¿Cómo hacer que los valores de y en la regresión logística sean continuos usando el lenguaje r?

1. Diferentes conceptos:

(1) El modelo de regresión lineal múltiple puede considerarse como una extensión directa del modelo lineal simple. Un modelo lineal con dos o más variables independientes es un modelo de regresión lineal múltiple.

(2) La logística pertenece a la regresión probabilística no lineal y es un método de análisis multivariado que estudia la relación entre valores de observación dicotómicos (que se pueden ampliar a multidivididos) y ciertos factores que influyen.

2. Características de las variables

Variable de respuesta para análisis de regresión múltiple: 1; variable numérica (distribución normal): 2 o más, preferiblemente las variables numéricas también pueden ser categóricas desordenadas; variables o variables ordenadas.

Variables temáticas utilizadas para el análisis de regresión logística: 1; variables dicotómicas (distribución binomial), variables multicategóricas desordenadas/ordenadas; variables independientes: 2 o más variables numéricas, variables dicotómicas, multicategóricas desordenadas/ordenadas; variables categóricas.

Modelo de regresión general LogitP= (muestra) coeficiente de regresión parcial se refiere al cambio de una unidad de una variable independiente que causa la variable dependiente al controlar o deducir la influencia de otros factores (todas las demás variables independientes permanecen sin cambios) El tamaño promedio del cambio en Y.

Indica que después de controlar otros factores, o por ejemplo, después de restar los efectos de otros factores (todas las demás variables independientes son fijas), cuando un factor cambia en una unidad, el evento indicador de efecto ocurre o no ocurrir El valor del cambio logarítmico en la relación de probabilidades (el cambio promedio en logitP), es decir, lnOR.

3. Condiciones aplicables LÍNEA:

1.L: lineal: variable independiente X Existe una relación lineal con la variable de respuesta Y

2. I:

3. N: Normalidad: el error aleatorio (es decir, residual) e obedece; el valor medio de cero, distribución normal con una varianza de 2;

4. E: varianzas iguales: para todas las variables independientes X, las varianzas de los residuos e son iguales.

Los valores observados (casos) son independientes entre sí; si hay variables numéricas, deben estar cercanas a la distribución normal (no pueden desviarse seriamente de la distribución normal; las variables dicotómicas obedecen a la misma); distribución binomial; debe haber un tamaño de muestra suficiente; LogitP tiene una relación lineal con las variables independientes.