Red de conocimiento informático - Problemas con los teléfonos móviles - recode, un artefacto de clasificación de variables numéricas en Stata

recode, un artefacto de clasificación de variables numéricas en Stata

Cuando vi por primera vez el comando de recodificación, pensé que era solo una pequeña herramienta para cambiar valores faltantes. A menudo lo vemos mostrado así:

Su función es equivalente a:

Cuando aprendí sobre recodificar nuevamente, me di cuenta de que este pequeño comando no es tan simple. Una vez que domines la recodificación, ¡trabajar con variables numéricas no será fácil! A continuación le daré una explicación completa del comando de recodificación.

La sintaxis completa del comando recode es la siguiente:

Entre ellas, varlist es una o más variables que queremos cambiar; erule es la regla que especificamos cambiar, en el forma de nuevo valor = valor antiguo. Puede especificar varias reglas al mismo tiempo, cada regla está entre paréntesis y separada por espacios si y en son declaraciones de filtro condicionales y de rango, que se pueden agregar libremente según el propósito, finalmente, hay algunas opciones importantes, que son: Se discutirá más adelante. Haga una introducción.

Nota: 1/5 en el comando de recodificación es diferente de 1/5 en la notación de matriz Stata. En notación de matriz, 1/5 se refiere a los cinco números enteros 1, 2, 3, 4 y 5, pero en el comando de recodificación, 1/5 incluye todos los números reales en el intervalo cerrado del 1 al 5. ?

?Además, también podemos representar valores numéricos utilizando valores mínimos y máximos, y representar valores numéricos en los lados izquierdo y derecho del signo igual.

Para ilustrar mejor la forma de una regla que contiene palabras clave, primero escribamos algunas variables y valores en el comando de entrada:

Para mostrarle cómo funciona, aquí le presentamos una explicación rápida. complemento para introducir dos opciones simples pero muy importantes:

La primera es la opción generar(), que genera el nombre de la nueva variable. La segunda es la opción prefix(), que agrega un prefijo a la nueva variable. Sin estas dos opciones, el comando de recodificación cambiará los datos iniciales, lo cual es un inconveniente, por lo que se recomienda agregar una de estas dos opciones al usar el comando de recodificación. ?

?Por ejemplo, cambie de 1 a 5 en los datos originales a 0 y almacene el valor modificado en una nueva variable con el prefijo del nombre de variable original "new_".

En este punto, el conjunto de datos se ve así:

Las reglas en el comando de recodificación se especifican ordenadas. De izquierda a derecha, una vez que se especifica un valor anteriormente en una regla para realizar algún tipo de cambio, si ese valor se especifica nuevamente más adelante en la regla, el valor se ignorará. Tome los datos anteriores como ejemplo:

En el comando de recodificación, si agrega declaraciones if o in para limitar el rango de cambios de valores observados, los valores fuera del rango faltarán en las nuevas variables generadas. . Por ejemplo, especifique los valores en las tres primeras filas para cambiarlos en consecuencia:

Al observar el conjunto de datos, puede ver que a todos los valores fuera de las tres primeras filas les faltarán valores. Agregar la opción copyrset en este momento copiará las observaciones fuera de rango sin cambios en la nueva variable.

La opción label() es el alma del comando recode. Es precisamente por la opción label() que recode es digno del título de herramienta de clasificación. En el tweet anterior "Obtenga una vista clara de sus datos: Introducción al comando de etiqueta", presentamos cómo usar el comando de etiqueta para etiquetar valores. Generalmente dividido en dos pasos, primero use la etiqueta definir para definir la etiqueta del valor y luego use la etiqueta para etiquetar el valor. ¡El comando de recodificación es un comando simple de una línea que maneja ambos pasos!