Prueba de heterocedasticidad ¿Cuál es la conclusión del experimento?
3. Un método común para corregir la heteroscedasticidad utilizando mínimos cuadrados ponderados es el método de mínimos cuadrados ponderados, que es uno de los métodos de mínimos cuadrados generalizados. El método específico es: si la desviación estándar del modelo en ? es ?, multiplicar el modelo original por Todas las condiciones clásicas, de modo que el modelo anterior satisfará todas las condiciones clásicas de un modelo lineal, según las cuales los parámetros se estiman utilizando el mínimo. ¿Método de los cuadrados? 1.2.3 Principio experimental Este experimento todavía se lleva a cabo mediante un modelo de regresión lineal binaria ficticia. Como en el Experimento 1 de este capítulo, primero establecemos los parámetros de regresión de un modelo de regresión lineal binaria y tomamos los valores de muestra de las variables explicativas. Dado que se trata de un modelo heterocedástico, la varianza del término de error aleatorio ya no se puede especificar, pero podemos especificar la varianza del término de error aleatorio en función de los valores de las variables explicativas. De esta forma, en general, podemos tener una comprensión completa del modelo. Luego, usamos Matlab para simular el muestreo aleatorio. Para cada muestra aleatoria simulada obtenida, utilizamos el método de mínimos cuadrados ordinarios y el método de mínimos cuadrados ponderados para obtener dos estimaciones de parámetros de modelo diferentes, que se registran como. Repita el muestreo y la estimación simulados anteriores. , obtendremos la estimación de mínimos cuadrados ordinarios ? y la estimación de mínimos cuadrados ponderados ? para cada parámetro del modelo, respectivamente. A través de estas dos muestras, podemos explorar las propiedades estadísticas del estimador de mínimos cuadrados ordinarios y del estimador de mínimos cuadrados ponderado, y analizar sus propiedades y diferencias similares. 1.2.4 Procedimientos y pasos experimentales 1. Diseño del programa A continuación se completará el proceso experimental programando un programa Matlab simple. El procedimiento se divide en las siguientes partes: (1) El primer paso es establecer los parámetros básicos del modelo y los valores muestrales de las variables explicativas, similar a los pasos correspondientes del Experimento I.
El segmento del programa Matlab es el siguiente: clearn=20;beta0=10;beta1=5;beta2=-3;x1=15*rand(n,1)+1;x2=10*rand( n,1)+1 ;e= unos(n,1); El segmento del programa Matlab es el siguiente:
b0=[];b1=[];b2=[];sigma=[];c0=[];c1=[];c2=[]; XX=X ./[x1,x1,x1];times=5000;for j=1:timesuu=normrnd(0,se,n,1);u=2*x1.*uu;Y=betabeta1* x1+beta2 *x2+u;[b,bint,r]= regresión(Y,X);b0=[b0;b(1)];b1=[b1;b(2)];b2=[b2; b(3 )];sigma=[sigma,sum(r.^2)/(n-3)];YY=Y./x1;[c,bint,r]=regreso(YY,XX);c0= [c0; c(1)]. c1=[c1;c(2)]; c2=[c2;c(3)]; explicación del código final: "b0=[];b1=[];b2=[] ;sigma1= []; "Genere cuatro vectores dinámicos con dimensiones variables, almacenando respectivamente la estimación de mínimos cuadrados ordinarios generada por cada muestreo y ? donde ? es el residual de la regresión de mínimos cuadrados ordinarios. "c0=[];c1=[];c2=[];sigma2=[]; "Genere vectores dinámicos de cuatro dimensiones variables, almacenando respectivamente las estimaciones de mínimos cuadrados ponderados generadas por cada muestreo, ¿de dónde provienen los residuos mínimos ponderados? regresión cuadrada. "XX=X./[x1,x1,x1]; " significa dividir los elementos de cada vector columna de la matriz X por los elementos del vector columna correspondiente X1 para obtener la matriz. "times=5000; "Establezca el número de muestreos y regresiones repetidos, que se pueden establecer en otros números enteros según sea necesario; "uu=normrnd(0,1,n,1); "Genera aleatoriamente una distribución aleatoria simple de N(0). ,1) Las muestras constituyen un vector de columna de n dimensiones. "u=2*X1.*uu" significa generar un vector de columna de n dimensiones u, cuyos elementos son el producto de los elementos correspondientes del vector de columna X1 y uu multiplicados por 2, es decir, esto significa que los errores aleatorios no están correlacionados entre sí, pero su desviación estándar sí. "Y=betabeta1*x1+beta2*x2+u; "Utilice el vector generado anteriormente para generar una muestra simulada de la variable explicativa Y: Esta es una muestra simulada de un modelo de regresión lineal binaria con heterocedasticidad, la desviación estándar de el error aleatorio Relacionado con la variable explicativa x1. "[b,bint,r]=regress(Y,X); "Realizar una regresión de mínimos cuadrados ordinaria en Y en el vector. "b0=[b0;b(1)]; "Coloque los valores ? en la tabla numérica b0 uno por uno, de modo que b0 se convierta en un vector de columna de doble dimensión al final del ciclo. "b1=[b1;b(2)]; "Guarde los valores "..." uno por uno en la tabla numérica b1, de modo que b1 se convierta en un vector de columna de doble dimensión al final del ciclo. "b2=[b2;b(3)]; "Guarde el valor ? en la tabla numérica b2 columna por columna, de modo que b2 se convierta en un vector de columna de doble dimensión al final del ciclo. "sigma=[sigma,sum(r.^2)/(n-3)]; "Los valores ? calculados a partir de los residuos de regresión se almacenan columna por columna en la tabla numérica sigma. "YY=Y./x1; "Divida los componentes del vector Y por los componentes correspondientes del vector x1 para obtener el vector de columna YY, es decir?"[c,bint,r]=regress(YY,XX); "Par YY XX realiza una regresión de mínimos cuadrados ordinarios (consulte la construcción de XX en la sección anterior) y obtiene los parámetros de resultado estimados. De hecho, la regresión de mínimos cuadrados ordinarios de YY en XX en este momento es exactamente la regresión de mínimos cuadrados ordinarios en el modelo lineal, porque la desviación estándar de ?
, por lo que el modelo anterior es equivalente a que la estimación de mínimos cuadrados ordinarios del modelo sea la estimación de mínimos cuadrados ponderada del modelo original. Por lo tanto, c en el comando anterior es el vector de estimación de mínimos cuadrados ponderado de los parámetros de regresión del modelo original y r es el vector de columna residual. "c0=[c0;c(1)]; "Guarde los valores de ? en la tabla numérica c0 uno por uno, de modo que c0 se convierta en un vector de columna de doble dimensión al final del ciclo; c1;c(2) ]; "Guarde los valores de ? en la tabla numérica c1 uno por uno, de modo que c1 se convierta en un vector de columna de doble dimensión al final del ciclo;" 3)]; "Almacenar los valores de ? columna por columna En la tabla digital c2, c2 se convierte en un vector de columna de doble dimensión al final del ciclo.
2. Genere los resultados experimentales. Después de ejecutar el programa anterior, las muestras de las estimaciones de mínimos cuadrados ordinarios de los parámetros de regresión del modelo se almacenan en los vectores b0, b1 y b2; los parámetros de regresión del modelo son Las muestras de se almacenan en los vectores c0, c1 y c2. Al mismo tiempo, los residuos ? y ? de todos los datos calculados en función de los residuos de los dos métodos de estimación se almacenan en los vectores sigma1 y sigma2. respectivamente. Los valores de todos estos vectores se guardarán temporalmente en la memoria y podremos usar los comandos correspondientes de Matlab para generar los diversos resultados que queramos. Cabe señalar que los siguientes resultados son los resultados de un solo experimento (una sola ejecución del programa anterior. Cada ejecución del programa cambiará el valor de la variable explicativa y la muestra aleatoria de la variable explicativa, por lo que su experimento). Los resultados serán ligeramente diferentes de los siguientes resultados. Hay diferencias. (1) Valores de las variables explicativas Utilice el comando [x1,x2] para generar directamente los valores de las variables explicativas generadas en el programa (organizadas en la siguiente tabla). No hay cambios en el valor de la variable explicativa en el muestreo repetido de la variable explicativa.
x1 x2
10.1281 2.2105
1.2364 5.5075
1.2453 8.1588
3.8511 9.9284
9.8038 3.731
1.8637 3.5477
6.5135 9.656
10.4718 3.3235
11.7645 9.0487
11.39 10.084
2.2612 3.3189
7.8153 3.3931
7.6274 1.4975
6.2988 1.7838
3.3041 7.4082
11.1347 2.9089
11.4882 9.4387
11.9126 2.739
8.1758 2.7079
9.3226 10.943
(2) Incluso bajo condiciones de heterocedasticidad Abajo , "..." siguen siendo estimaciones insesgadas, respectivamente. Al final de la ejecución del programa anterior, utilice el siguiente comando de MATLAB: b_theo=[beta0,beta1,beta2]mean_b_ols=[mean(b0),mean(b1),mean(b2)] mean_b_wols=[mean(c0), media(c1), media(c2)] El primer comando genera el valor del parámetro de regresión preestablecido del modelo, representado por b_theo; el segundo comando genera el promedio de muestra de la estimación de mínimos cuadrados ordinarios del parámetro de regresión, representado por media_b_ols; salidas del tercer comando El comando genera la media muestral de la estimación de mínimos cuadrados ponderada del parámetro de regresión, representada por mean_b_wols.
Al ejecutar los comandos anteriores se obtendrá: b_theo =10 5 -3mean_b_ols =9.8762 5.0029 -2.9843mean_b_wols =9.9659 4.9989 -2.9954 Los resultados experimentales muestran que la estimación de mínimos cuadrados ordinarios y los mínimos cuadrados ponderados del parámetro de regresión ? Las estimaciones son todas estimaciones imparciales.
(3) Cuando hay heterocedasticidad en el modelo, si se ignora la heterocedasticidad, la matriz de varianza-covarianza de la matriz de estimación de mínimos cuadrados ordinarios todavía se usa para estimar la varianza del término de error aleatorio, y luego se usa la matriz. para estimar la matriz de varianza-covarianza de una matriz, ¿esta estimación es insesgada? Para hacer esto, usamos el siguiente comando de Matlab: fangcha_est_ols=mean(sigma);cov_b_est_ols=fangcha_est_ols*(inv(X'*X))cov_b_sample_ols=cov([b0,b1,b2])Explicación del código: "fangcha_est_ols=mean (sigma1 ); "Calcule el valor promedio de la matriz ? producida por el estimador de mínimos cuadrados ordinarios y asígnelo a la variable fangcha_est_ols. "cov_b_est_ols=fangcha_est_ols*(inv(X'*X)) "¿Calcular y generar la matriz? La media de la matriz está representada por "cov_b_est_ols". "cov_b_sample_ols=cov([b0,b1,b2]) "Calcule y genere la matriz de varianza-covarianza de muestra de los vectores b0, b1, b2, es decir, ? La matriz de varianza-covarianza de muestra de los vectores b0, b1, b2, que es,? representa es "cov_b_sample_ols". El resultado de salida es: cov_b_est_ols =27.0496 -1.8265 -1.8278-1.8265 0.2447 0.0037-1.8278 0.0037 0.3235cov_b_sample_ols =18.1221 -0.9746 -2.2516-0.9746 0.19 69 0.2 Experimento 2 Heterocedasticidad y sus propiedades
1.2.1 Propósito de el experimento
Ya sabemos que en condiciones clásicas, la estimación MCO de los parámetros de regresión del modelo lineal es la estimación lineal insesgada con varianza mínima. La heterocedasticidad de los términos de error aleatorio es una situación común en los modelos de regresión lineal donde no se cumplen las condiciones clásicas. ¿Cómo cambian las propiedades estadísticas de las estimaciones de mínimos cuadrados ordinarios (MCO) de los parámetros del modelo cuando la heterocedasticidad está presente en el modelo en comparación con cuando se cumplen las condiciones clásicas? ¿Cómo entender y captar estos cambios? ¿Cómo corregir problemas de heterocedasticidad en la estimación de modelos?
Página 1
Esta práctica de laboratorio ayudará a los estudiantes a comprender el concepto de heterocedasticidad en sí, las propiedades de las estimaciones OLS de los parámetros del modelo en presencia de heterocedasticidad y el método de mínimos cuadrados ponderados.
1.2.2 Antecedentes experimentales y bases teóricas
1. Heteroscedasticidad
Este experimento utiliza el modelo de regresión lineal binaria como ejemplo para ilustrar. Modelo de regresión lineal
,?
Supongamos que el modelo satisface todos los supuestos clásicos excepto "homoscedasticidad":
(1) ?(2) El modelo satisface Todos los supuestos clásicos excepto la "homoscedasticidad":