¿Cómo hacer que el coeficiente de correlación de Pearson muestre asteriscos en stata?
1. Ajuste el formato de la variable:
formato x1 %10.3f --Fije el ancho de la columna de El ancho de la columna de --Fije el ancho de la columna de x1 a 10, tome tres decimales y agregue separadores de miles p>
formato x1 %10.3gc --Fija el ancho de columna de x1 a 10, toma tres dígitos significativos, agrega separador de miles
formato x1 %-10.3gc --Fija el ancho de columna de x1 a 10, tome tres dígitos significativos, agregue un separador de miles y agregue "-" para indicar la alineación a la izquierda.
2. Fusionar datos:
Utilice "C:\Documents and Settings\xks\desktop\2006.dta", borre
fusionar utilizando "C: \Documents and Settings\xks\desktop\1999.dta"
--Fusionar los datos de 1999 y 2006 en el orden natural de disposición de las muestras (observaciones)
Utilice "C:\Documents and Settings\xks\desktop\2006.dta", borre
ID de combinación usando "C:\Documents and Settings\xks\desktop\1999.dta", clasificación única< / p>
--Fusionar datos de 1999 y 2006 por la identificación de variable única (única) para fusionar y ordenar (ordenar) las identificaciones al fusionar
Recomendó el primer método.
3. Seleccionar muestras aleatoriamente:
Muestra 50
Seleccione aleatoriamente el 50% de las muestras en los casos de observación y elimine las muestras restantes
Muestra 50, count
Seleccione aleatoriamente 50 muestras de los casos de observación y elimine las muestras restantes
En tercer lugar, vea y edite los datos:
Examine x1 x2 si x3>3 (según el listado Abrir el visor de datos según las variables y condiciones enumeradas)
Editar x1 x2 si x3>3 (Abrir el editor de datos según las variables y condiciones enumeradas)
5. Fusión de datos (merge) y expansión (append)
Fusionar significa que el número de muestras permanece sin cambios, pero agregar algunas variables nuevas significa que el número total de muestras aumenta, pero el número; de variables permanece sin cambios.
Fusión uno a uno:
Los datos provienen de examw1 y examw2 en el tutorial de stata
Paso 1: Ordene examw1 por los tres códigos v001 a v003. Y cree una base de datos temporal tempw1
Borrar
Utilice "t:\statatut\exampw1.dta"
su - resumir
sort v001 v002 v003
guardar tempw1
Paso 2: Realizar la misma operación para examw2
Borrar
Utilice "t:\ statatut \exampw2.dta"
su
Ordenar v001 v002 v003
Guardar tempw2
Paso 3: Utilice la base de datos tempw1 para fusionar con tempw2:
Borrar
Usar tempw1
Usar tempw2 para fusionar v001 v002 v003
Paso 4: Ver el estado de la fusión data :
ta _merge - abreviatura de -tabulate _merge
su
Paso 5: Limpiar la base de datos temporal y eliminar _merge para evitar futuros errores al fusionar nuevas variables
Borrar tempw1. dta
Eliminar tempw2.dta
Eliminar _merge
Anexo de extensión de datos:
Derivado de fac19 y newfac en los datos del tutorial de stata p>
Borrar
Usar "t:\statatut\fac19.dta"
ta región
añadir usando "t:\ statatut\newfac"
ta región
Después de la fusión, el tamaño de la muestra aumenta, pero el número de variables permanece sin cambios
Sexto, dibuja el gráfico
Diagrama de tallo y hoja:
Tallo x1, línea (2) (Dibuje un diagrama de tallo y hoja de x1, dividiendo cada decil del tallo en dos segmentos, con la primera mitad entre 0 y 4. segunda mitad varía de 5 a 9)
Tallo x1, ancho (2) (dibuja un diagrama de tallo-hoja de x1, dividiendo cada decil del tallo en cinco segmentos para mostrar,
tallo x1,redondo(100) (divide x1 entre 100, luego dibuja un diagrama de tallo y hojas de x1)
Gráfico histórico
Usar base de datos automática
Figura histórica mpg, frecuencia discreta normal xlabel(1(1)5)
(Discreta significa que la variable es discontinua, frecuencia significa la frecuencia de visualización. normal (curva de distribución normal, xlabel establece el eje x , 1 y 5 son valores extremos, (1) es la unidad)
Precio de histograma, norma de fracción
(fracción significa que el eje y muestra decimales. Además de la frecuencia y fracción, este comando también se puede reemplazar por "función". Para porcentaje, el comando se puede reemplazar por "porcentaje" y para densidad, el comando se puede reemplazar por "densidad";
precio de histograma, porcentaje por (extranjero)
(de acuerdo con la variable Clasificación "extranjero", dibuje el "precio" de muestras de diferentes categorías, las dos imágenes están organizadas en filas izquierda y derecha)
histograma mpg, discreto por (extranjero, col(1))
(según la variable Clasificación "extranjero", extrae los "mpg" de muestras de diferentes categorías).