Cómo usar Stata para hacer gráficos
//conferencia 6
cd /Victor/stata
Utilice "nei_sample.dta", borre
editar código postal
/split por defecto divide basado en espacios prefijo de código auxiliar y dice en qué se dividen estas cadenas (por observación)
split facilityname_origin, generate(varnew) parse(、
dividir código postal, generar(zipnew) parse(-)//En la línea 2894, algunas cadenas sin guiones necesitan extraer los primeros cinco
//Dividir la cadena por algunos símbolos
Editar zipcode
ayuda substr?
//Interceptación
gen zip5=substr(zipcode, 1, 5)
/ Generar zip5, lo que significa interceptar los primeros cinco dígitos del código postal e interceptar cinco dígitos a partir del primer dígito
editar código postal zip5 si longitud(zip5) ~=5?
/// Mostrar zip5 y Código postal con una longitud distinta de 5
editar zip5
gen len_cn = ustrlen(zipcode)?
// Generar longitud de cadena china
editar fips
gen fips2 = substr(fips, 1, 2)
editar fips2
gen fips3 = substr(fips, 3, 3) p> p>
editar fips2 fips3
destring fips2, reemplazar force
destring fips3, reemplazar force
//Carácter a valor
tostring fips2 fips3, reemplazar fuerza
//numérico a carácter
editar fips2 fips3
reemplazar fips2="0" fips2 si longitud(fips2) == 1
reemplazar fips3="0" fips3 si longitud(fips3)==2
reemplazar fips3="00" fips3 si longitud(fips3)==1
//Completo con cero para hacer cinco
ayudaduplicados
//Observaciones duplicadas
ordenar nuevoid
informe duplicado nuevoid año
/reportar observaciones duplicadas
//las copias representan cuántas hay en estos datos a*** =1 significa que no hay duplicados
4541 solo una observación newid
etiqueta duplicada newid año、gen(dup)
// los datos se hicieron más pequeños porque algún newid corresponde a más de un sic
reforma long so2 co nox voc nh3, i(newid sic) j(year)?
// Al hacer esto, puedes convertirlo en un panel equilibrado que sea ancho primero y luego largo (significativo)
usar nei_sample, borrar
retener so2 co nox voc nh3 año newid
eliminar duplicados año newid, forzar
reformar amplio so2 co nox voc nh3 , i (newid) j(año)
reshape long so2 co nox voc nh3, i(newid) j(time)//tres mil aproximadamente se convirtieron en diez mil aproximadamente
* pesado Cada negocio después de su conformación tiene observaciones en cada año desde 1990 hasta 2011, lo que obliga a equilibrar los datos
ren?(so2 co nh3 nox voc) (pol1 pol2 pol3 pol4 pol5)
/
*muestra
renombrar so2 pu1
renombrar co pu2
renombrar nox pu3
renombrar voc pu4
renombrar nh3 pu5
// Dibuja un diagrama de dispersión sin coordenadas y un diagrama de dispersión con escalas de coordenadas pero sin líneas de coordenadas debajo
mpg de dispersión peso, yscale(off)
// Sin eje y
peso de mpg de dispersión, yscale(noline) xscale(noline)
// Eliminar línea de coordenadas, mantener la escala
ayuda axis_label_options
sysuse auto, clear
describir
suma
// Lo siguiente son, respectivamente, Trazar un diagrama de dispersión de los valores de mpg y los valores de peso, con cinco marcas de 10 en el eje aproximado
peso de mpg disperso
peso de mpg disperso, ylabel(#5) xlabel (#5)
peso de mpg disperso、ylabel(#10) ylabel(#10) xlabel(#10)
peso de mpg disperso、ylabel(10(5)45) xlabel (1500 1970 2500(1000)4500)
//Personalizar regla
peso de mpg disperso, ytick(#10) xtick(#15)
/ / Traza el eje x con aproximadamente 15 ticks y y con aproximadamente 10 ticks
s
peso catter mpg, ymlabel(##5) xmtick(##10)
// También se marcan marcas de escala pequeña y se marcan 10 escalas pequeñas entre las escalas principales del eje x
Peso mpg del gráfico de puntos dispersos, ymlabel(##5) xmlabel(##10)
// Al dibujar un diagrama de dispersión de series temporales, hay un problema con el etiquetado de escala del eje p>
sysuse uslifeexp, clear
dispersar el año, c(l)
dispersar el año, c(l) xlabel(#10, grid)
// grid, Conectar con líneas
dispersar el año, c(l) xlabel(1900(10)2000, grid)
dispersar el año, c(l) xlabel(1900 1918 1936 1950( 20)2000, nogrid)
dispersar el año, lcolor(amarillo) c(l) xlabel(1900 1918 1936 1950(20)2000, nogrid)
línea del año, lcolor (azul marino) lpattern(punto)
sysuse uslifeexp, clear
dispersión del año, c(l) xlabel(1990 1918 1940(20)2000, grid) legend(on)
label var le_male "Hombres, esperanza de vida promedio"
Gráfico de dispersión le_male le_female año, legend(label(1 "masculino") label(2 "female "))