La diferencia entre el método de variable instrumental y el método de doble diferencia
Los métodos que les contaré hoy son los dos métodos más populares en el campo de la investigación empírica microscópica, uno se llama método de variable instrumental y el otro se llama método de doble diferencia. Todos estos métodos de identificación causal tienen una característica común, es decir, necesitamos encontrar algo exógeno (influencia) y luego establecer una cadena causal. Además de los dos métodos anteriores, la estimación del punto de interrupción (RDD) también es muy popular, pero sus escenarios de aplicación requieren más datos de investigación y antecedentes institucionales. No lo presentaré hoy.
El objetivo principal de la conferencia de hoy es combinar un método específico con mi investigación. Que todos sepan cómo encontrar materiales durante el proceso (de investigación), encontrar los antecedentes institucionales correspondientes y establecer una base de datos para la identificación causal después de que planteemos una pregunta y comencemos a investigar.
A continuación, combinaré los tres estudios mencionados anteriormente para presentar específicamente cómo utilizamos este método.
En primer lugar, hablamos del estudio de las externalidades del capital humano. En otras palabras, cuando los estudiantes universitarios están juntos, se produce un efecto de desbordamiento de conocimientos y se forma un mecanismo de aprendizaje mutuo. El problema es que es discutible si este fenómeno existe. Algunos dicen que existe, otros dicen que no existe.
Cuando fui profesor visitante en la Universidad de Harvard en 2011-2012, cooperé con el famoso economista urbano Glazer. En ese momento, le dije a Glaeser que quería realizar esa investigación utilizando datos chinos. Después de escucharlo, definitivamente fue muy bueno, así que hagamos este estudio juntos. ¿Qué tipo de investigación es esta? Quiero encontrar un shock exógeno, o una variable instrumental, que afectará el nivel educativo en el punto de partida inicial de cada ciudad, y esta variable no afectará directamente los ingresos de todos.
¿Cuál es la idea central del método de la variable instrumental? La cadena causal central que queremos establecer es que si el nivel de educación per cápita de quienes nos rodean es alto, entonces mi nivel de educación será mayor. En otras palabras, mi nivel de ingresos es alto no sólo por mi alto nivel educativo, sino también por el alto nivel educativo de los demás. Entonces a este tiempo se le llama externalidad del capital humano.
Pero en este momento, también hay un problema. El nivel educativo de quienes me rodean tiene que ver con muchos otros factores. ¿Cuál es la idea de variables instrumentales? Encontramos un factor, que es un shock completamente exógeno. Afectará mi variable explicativa, que es el nivel educativo per cápita de otras personas que acabo de mencionar, pero no afectará mi nivel educativo ni afectará directamente mis ingresos. Entonces, en este momento, hemos establecido una cadena causal. Nuevamente, la variable instrumental que encontramos afecta el nivel educativo promedio de la ciudad, y el nivel educativo promedio de la ciudad afecta mis ingresos como individuo. Si esta cadena causal es cierta, todo el estudio está completo.
Entonces, ¿cuál es la cuestión clave? ¿Puedes encontrar un factor que afecte el nivel educativo promedio en una ciudad pero que no afecte directamente los niveles de ingresos individuales? Ésta es la clave de nuestra investigación. Esta es una foto para ti. Hay muchos números en la imagen. Describe tal evento histórico. En 1952 ocurrió algo que tuvo un profundo impacto en la educación superior en China: la reestructuración de departamentos.
¿Qué es el ajuste departamental? Tomemos como ejemplo la Universidad de Zhejiang. Antes de 1952, la Universidad de Zhejiang era una institución integral. Después de 1952, la Universidad de Zhejiang se convirtió en una institución centrada en la ciencia y la ingeniería. Muchas materias de artes liberales se han trasladado a otras instituciones, y algunas ciencias naturales de la Universidad de Zhejiang, especialmente matemáticas, también se han trasladado a Fudan y otras instituciones. Este es un ajuste departamental. Esta política tiene un trasfondo muy importante: nuestros responsables políticos quieren construir una universidad al estilo soviético. Después de 1952, había muy pocas universidades integrales en China. Como la Universidad de Zhejiang, la Universidad de Tsinghua, la Universidad Jiao Tong de Shanghai, etc. , todos fueron víctimas de este movimiento y se convirtieron en la Universidad de Ciencia y Tecnología, influencia que aún existe en la actualidad.
Para nuestra investigación, un trasfondo muy importante es que la adaptación de universidades y departamentos entre ciudades está involucrada en este movimiento. Muchos científicos, incluidos estudiantes universitarios, equipos experimentales e incluso bibliotecas. Por ejemplo, muchos departamentos de la Universidad de Zhejiang se mudaron a Shanghai, y muchos profesores famosos de la Universidad Jiaotong de Shanghai se mudaron a Xi'an y se convirtieron en los primeros científicos famosos de la Universidad Jiaotong de Xi'an.
Permítanme darles este ejemplo para recordarles que muchas veces, cuando hacemos investigaciones en ciencias sociales, no sólo necesitamos estar familiarizados con los métodos, sino que los métodos no le ayudarán automáticamente a realizar la investigación. La aplicación del método implica mucho conocimiento histórico y antecedentes institucionales. Si no entendiéramos la historia de este ajuste institucional, no pensaríamos en utilizar este enfoque. Después de aprender el método de la variable instrumental, la computadora le ayudará a operar todos los procesos. Lo que realmente le permite utilizar el método de variables instrumentales son sus otros conocimientos de ciencias sociales, incluido el conocimiento histórico.
Volviendo a nuestra imagen, ¿cuáles son los números en esta imagen? Se trata de nuestro proceso de recopilación de datos. No sólo es necesario conocer el historial, sino que también es necesario pensar en cómo recopilar estos datos. ¿De dónde vienen estos datos? En ese momento encontramos un libro que registraba la historia de cada universidad en China. Para cada universidad involucrada en 1952, definitivamente presentaremos en detalle qué departamento de esta escuela se mudó a otros lugares y qué departamento se mudó desde afuera. Hicimos un trabajo muy duro, tomando a mis estudiantes, clasificando la historia de cada escuela y luego contando cuántos departamentos de la escuela se habían mudado y a dónde se habían mudado, y establecimos una base de datos.
Los números que vemos en esta imagen ahora representan el número de departamentos que entran o salen de cada ciudad. Y lo resumió al nivel provincial y dibujó un mapa en consecuencia. Los tonos de color indican el grado de movimiento hacia afuera y hacia adentro. Un punto importante es que encontrarás que no hay ningún patrón en los tonos de color. Esto demuestra que existe una fuerte aleatoriedad en este asunto. Este es el método de variable instrumental del que quiero hablar. A continuación quiero hablar del segundo estudio.
Método de la doble diferencia
Primero déjame explicarte qué es el método de la doble diferencia. Hay un problema muy grande en la investigación de las ciencias sociales. En palabras del antiguo filósofo griego: "No se puede bañarse dos veces en el mismo río". ¿Cuál es la situación ideal para encontrar la causa? Sólo sé cómo sería si no hubiera experimentado estas cosas en ese momento.
Por ejemplo, recientemente algunas personas fueron engañadas cuando iban a la universidad (como el incidente de Goujian), lo que tuvo un impacto en sus vidas. No tenemos forma de saber cómo habría sido si hubiera ido a la universidad. No se puede repetir. Entonces, ¿qué debemos hacer? Tenemos que encontrar una manera de descubrir si podemos encontrar un Zhang Li Sansi que sea exactamente igual a la persona que nos importa (la persona que está siendo reemplazada) en varias experiencias. Todo el mundo sabe que esto es difícil. Si puede encontrarlo, podrá ver si la persona (encontrada) fue a la universidad y se convirtió en científico con un salario mensual de 50.000. Entonces puedo comparar sus resultados con los resultados que enfrento hoy y saber qué diferencia hay para mí si no voy a la universidad. Ésta es la idea de la doble diferencia.