Conclusión del análisis de SPSS
La interfaz SAS 8.2 tiene tres ventanas una al lado de la otra (o en cascada) en el medio. La ventana llamada Editor de programas (etiquetada Editor) se utiliza para ingresar declaraciones SAS y toda la programación se realiza en esta ventana, por lo que debe estar familiarizado con ella.
(1) Conjuntos de datos y bibliotecas
Las operaciones estadísticas se realizan sobre datos. Los archivos de datos en SAS se denominan conjuntos de datos y los conjuntos de datos están contenidos en diferentes bibliotecas (entiéndalo provisionalmente como. una base de datos.) En, las bibliotecas SAS se dividen en permanentes y temporales. Como su nombre lo indica, los conjuntos de datos que existen en una biblioteca permanente son permanentes (siempre que no los elimine), mientras que los conjuntos de datos en una biblioteca temporal se eliminan automáticamente cuando sale de SAS. En cuanto al concepto de biblioteca en SAS, la forma más sencilla de entenderlo es un directorio, un directorio que almacena conjuntos de datos.
La estructura del conjunto de datos es completamente equivalente a la tabla de datos que habitualmente entendemos y consta de campos y registros. En estadística, estamos acostumbrados a referirnos a los campos como variables. En lo sucesivo, se entiende que los campos y las variables son lo mismo. Hay muchas formas de crear un conjunto de datos. Existen métodos especiales de lectura de datos en las operaciones de programación para crear un conjunto de datos, pero los datos deben ingresarse en el campo, lo que requiere mucho tiempo y mano de obra. Si la cantidad de datos es grande, le recomiendo que primero utilice otros métodos para crear el conjunto de datos; de lo contrario, la mayoría de las declaraciones del programa se desperdiciarán al ingresar datos.
¿Existen otros métodos? No sé si estás buscando otros libros o recursos. O puedes esperar, planeo publicar un libro sobre las operaciones de SAS dentro de unos años.
(2) Descripción general del programa SAS
Al igual que otros lenguajes informáticos, el lenguaje SAS (llamado SCL, lenguaje de componentes SAS) también tiene su propio vocabulario (es decir, palabras clave) y sintaxis. Las palabras clave, los nombres, los caracteres especiales y los operadores se organizan de acuerdo con reglas de sintaxis para formar una declaración SAS, y varias declaraciones SAS que realizan una función completa constituyen un programa SAS.
Un programa SAS consta de varios pasos y algunas declaraciones de control, que generalmente incluyen pasos de datos y pasos de proceso. Cualquier combinación entre ellos puede convertirse en un programa SAS. cumple una función completa. Normalmente, los programas SAS también incluyen declaraciones completas que controlan ciertas opciones, variables o el entorno en el que se ejecuta el programa a lo largo del programa SAS.
Las declaraciones de un programa SAS generalmente comienzan con una palabra clave y terminan con un punto y coma. Una declaración puede ocupar más de una línea (cada vez que SAS ve un punto y coma, tratará todo antes y después del punto y coma anterior. como una declaración, independientemente de en cuántas líneas se encuentren). Las declaraciones SAS no distinguen entre mayúsculas y minúsculas, por lo que depende de usted decidir si las letras están en mayúsculas o minúsculas. Las declaraciones SAS no distinguen entre mayúsculas y minúsculas, por lo que puede decidir el caso de las letras según sus preferencias personales.
1. Defina el nombre de la biblioteca (etiqueta de la biblioteca)
Para guardar datos valiosos y facilitar las operaciones, el autor está acostumbrado a especificar el nombre de la biblioteca y su ruta (directorio). Debido a que el sistema SAS ya tiene una biblioteca permanente (SASUSER), tanto el nombre de la biblioteca como la ruta correspondiente son demasiado engorrosos e inconvenientes de usar. Los datos utilizados en el programa se pueden guardar permanentemente en la ruta para garantizar su reutilización en el futuro. La declaración que especifica el nombre de la biblioteca es una declaración completa con el siguiente formato:
Libname nombre de la biblioteca 'ruta';
Por ejemplo, si especificamos el nombre de la biblioteca "a" y el ruta "e": \data\", la declaración SAS se verá así:
libname a 'e:\data\';
2. Paso de datos
En SAS, el paso de datos comienza con declaraciones de datos, que se utilizan para crear y manipular conjuntos de datos.
La declaración de datos comienza con la palabra clave "datos" y tiene el siguiente formato:
nombre del conjunto de datos de datos
Por ejemplo: datos a.case; se creará un caso llamado case; en la biblioteca un conjunto de datos SAS.
El conjunto de datos especificado por la declaración de datos generalmente adopta el formato de "nombre de la biblioteca. Nombre del conjunto de datos", o también puede aparecer solo como "nombre del conjunto de datos". En este caso, el sistema del conjunto de datos es el predeterminado. a los datos establecidos en la biblioteca temporal, se eliminarán después de salir del sistema.
La declaración de datos tiene dos funciones importantes, una es marcar el comienzo del paso de datos y la otra es nombrar el conjunto de datos SAS que se creará.
Además de las declaraciones de datos, los pasos de datos generalmente incluyen declaraciones de archivo, declaraciones de entrada y declaraciones de líneas de datos. Los diferentes métodos de entrada de datos tienen diferentes métodos de uso.
Existen dos métodos comunes de entrada de datos en programas SAS: lectura de archivos externos y entrada directa.
(1) Lectura desde un archivo externo
Si los datos ya están contenidos en un archivo externo (archivo de texto o archivo de datos), puede utilizar este método para ingresar los datos en el archivo del conjunto de datos.
Después de la declaración de datos presentada anteriormente, escriba la siguiente declaración:
infile opción "ubicación y nombre del archivo externo"
nombre de variable de entrada 1 nombre de variable; 2... Nombre de variable n;
La declaración infile se utiliza para leer datos de un archivo externo y debe aparecer antes de la declaración de entrada. Su función es especificar un archivo externo que contiene datos sin procesar.
La declaración de entrada se utiliza para indicar al sistema cómo leer cada registro de datos. Su función principal es leer la columna de datos especificada por la declaración, definir el nombre de la variable para el campo de datos correspondiente y determinar el modo de lectura de la variable.
Por ejemplo:
libname a 'e:\data\';
data a.student
infile 'e: \' data\student.txt';
ingrese nombre altura peso;
El programa anterior ingresa los datos en el archivo de texto "student.txt" en "e:\data \" directorio en el archivo de datos.
El programa anterior ingresa los datos en el archivo de texto "student.txt" en el directorio "e:\data\" en el conjunto de datos Student, que se almacena en "e:\data\". directorio.
(2) Entrada directa
Este método de entrada es adecuado para situaciones en las que la cantidad de datos es pequeña o el operador tiene una gran voluntad. Escriba la siguiente declaración después de la declaración de datos:
Ingrese el nombre de la variable 1 el nombre de la variable 2... el nombre de la variable n;
líneas de datos (en versiones anteriores de la tarjeta, las dos se pueden usar indistintamente en la nueva versión)
...datalines;
...datalines; (en versiones anteriores era...(datalines)
.. ....(data líneas)
;
La declaración de líneas de datos se utiliza para ingresar datos directamente y marca el comienzo de un bloque de datos.
Nota: Aquí las líneas de datos deben. Por supuesto, también puede usar comas y otras cosas para separar los datos aquí, porque los diferentes métodos de separación requieren las opciones de control correspondientes para las declaraciones de entrada, que discutiremos en el próximo capítulo. Lo discutiremos más adelante, pero ahorremos algo de esfuerzo aquí. Además, no puede agregar un punto y coma directamente después de ingresar la línea de datos como otras declaraciones, sino que debe ingresar un punto y coma al comienzo de otra línea, para que SAS piense eso. esto es ingresar datos originales, no hacer nada más.
Por ejemplo
libname a 'e:\data\';
data a.student;
Ingrese nombre $ altura peso ; (El símbolo $ después del nombre indica que el nombre de la variable es una variable de carácter)
datalines;
Linda 171 51
Mary 168 50
Selinna 169 49
;
El programa anterior creará directamente el archivo de conjunto de datos del estudiante, que se almacena en el directorio "e:\data\".
3. Pasos del proceso
Los pasos del proceso del programa SAS representan un proceso de procesamiento, como clasificación, prueba t, análisis de varianza, etc. Los pasos del programa comienzan con la palabra clave proc, seguida del nombre del programa para distinguir los diferentes pasos del programa y terminan con la palabra clave ejecutar.
El formato general es el siguiente:
lista de opciones de nombre de procedimiento
... (otras declaraciones
). .....(otras declaraciones);
ejecutar;
Los programas SAS implican cientos de procedimientos y hay docenas de procedimientos comúnmente utilizados para implementar funciones estadísticas. La siguiente tabla (Tabla 1.1) enumera los nombres de los procedimientos almacenados más utilizados y las funciones que pueden realizar, para que pueda prepararse con anticipación.
Tabla 1.1 Procedimientos almacenados de uso común y sus funciones
Nombre del procedimiento almacenado
Función
Ordenar
Como La variable especificada ordena el conjunto de datos especificado
Imprimir
Emite la lista de datos en el conjunto de datos
Tabulación
Tabulación por categoría especificada variable. Resuma los datos de la tabla según las variables categóricas especificadas
Medias
Realice una descripción estadística simple de las variables numéricas especificadas
Frec.
Realizar una descripción estadística simple de la variable categórica especificada
Ttest
Realizar una prueba t en la variable especificada
Anova
Realizar una prueba t en la variable especificada Realizar análisis de varianza en variables
npar1way
Realizar pruebas no paramétricas en variables especificadas
Reg
Realizar análisis de regresión en variables específicas
Corr
Realizar análisis de correlación en variables especificadas
Discriminante
Realizar análisis discriminante en las variables especificadas
Clúster
Realizar análisis de conglomerados en variables especificadas
Gráfico
Trazado bajo para dibujar gráficos estadísticos de baja resolución p>
4. Varios procesos importantes de uso común
Antes de ingresar al contenido de implementación de funciones estadísticas generales, los procesos relacionados con el preprocesamiento de datos y la ejecución de funciones públicas importantes deben dominarse de antemano. Hay algunos procesos importantes de uso común. Tenga una discusión.
(1) Proceso de conjunto de datos para operar archivos SAS
El proceso de conjunto de datos es una herramienta para administrar operaciones en archivos de datos. Utilizándolo, podemos lograr las siguientes funciones:
<. p>Copiar archivos SAS de una biblioteca a otra;Cambiar el nombre de los archivos SAS;
Reparar archivos SAS dañados;
Eliminar archivos SAS;
Enumere todos los archivos SAS en una biblioteca SAS específica;
Enumere los atributos del conjunto de datos SAS, como la hora de la última modificación, si los datos están comprimidos, si los datos están indexados, etc.
Realizar operaciones para establecer contraseñas en archivos SAS;
Agregar registros a conjuntos de datos SAS;
Cambiar propiedades de conjuntos de datos SAS y propiedades de variables en los datos set ;
Crear o eliminar índices para conjuntos de datos SAS;
Crear y administrar archivos de verificación para conjuntos de datos SAS;
Crear o eliminar integridad para conjuntos de datos SAS regla.
El formato general del procedimiento almacenado del conjunto de datos es el siguiente:
proc datasets lt; lista de opcionesgt;
edad nombre de archivo actual lista de nombres de archivos relacionados. lt;/lista de opcionesgt;;
append base=nombre del conjunto de datos lt; datos=nombre del conjunto de datos otras opcionesgt;
auditar nombre del archivo lt;; ; otro código ;gt;
cambiar nombre de archivo antiguo1=nuevo nombre de archivo1 lt;...nombre de archivo antiguo=nuevo nombre de archivo; lt;lista de opciones
contenido lt;datos=nombre del conjunto de datos; lt; Otras opciones>
copiar = etiqueta de biblioteca lt; Otras opciones>
excluir nombre de archivo lt; con declaraciones seleccionadas aparecen al mismo tiempo)
select filename lt; otras opciones gt;; (Esta declaración solo puede aparecer después de la declaración de copia y no puede aparecer al mismo tiempo que la declaración de exclusión)
Eliminar nombre de archivo lt; Otras opciones >
intercambiar nombre de archivo1=intercambiar nombre de archivo 1 lt; ... .filename n=intercambiar nombre de archivo lt; lista de opciones gt; modificar nombre de archivo lt; p>
p>
reparar nombre de archivo lt;lista de otras opcionesgt;
guardar nombre de archivo lt;lista de otras opcionesgt ;
guardar nombre de archivo lt;lista de otras opcionesgt;;
guardar nombre de archivo lt; intercambiar nombre de archivo lt; >
ejecutar;
¿Es demasiado engorroso? Estoy un poco impaciente. Pero todavía tengo que escribir, ¡y ya lo he escrito! No puedo soportar desperdiciarlo, al menos puedo usarlo para enriquecerlo y expandirlo. Como a todos, si lo encuentra demasiado aburrido, puede omitir esta parte y volver a ella cuando quiera usarla. A continuación, presentaré cada opción y declaración una por una, y explicaré su significado y cómo usarlas.
El significado y uso de las opciones después de la declaración proc datasets se muestran en la siguiente tabla (Tabla 1.2).
Tabla 1.2 El significado y uso de las opciones después de la declaración de conjuntos de datos proc
Opciones
Significado y uso
alter=contraseña de protección de conversión
p>
El archivo SAS establecerá una contraseña para la operación de conversión para verificar la legitimidad de la operación, y el código solo se ejecutará si la contraseña es correcta. detalles/nodetalles
Controla si se muestra información detallada de los archivos SAS. El primero se muestra y el segundo no. El valor predeterminado es el último
force
gennum=
Controla cómo se procesa el conjunto de datos derivados, el signo igual seguido de all, hist, revert o entero
kill
La opción eliminará todos los archivos de la biblioteca a procesar, la
library=library tag
debe usarse con precaución para especificar la biblioteca a procesar. Biblioteca a procesar
memtype=tipo de membresía
Especifica el tipo de miembro de la biblioteca (tipo de archivo) que se procesará; el valor predeterminado es all
nolist
Deshabilite la visualización del directorio de archivos procesados en el archivo de registro
nowarn
Deshabilite la visualización del directorio de archivos procesados si se producen las siguientes condiciones, por ejemplo, el archivo especificado en la declaración no existe, suprime la visualización del directorio de archivos procesados. El archivo especificado en la declaración no existe, etc., suprime la visualización de mensajes de error y obliga al programa a continuar con la ejecución
pw=contraseña de operación
Utilizando el archivo SAS configurado con la contraseña de operación puede verificar la legalidad de la operación (incluye archivos protegidos de lectura, escritura y conversión)