Red de conocimiento informático - Problemas con los teléfonos móviles - Cómo utilizar spss

Cómo utilizar spss

Si tienes que preocuparte por instalar y abrir el software, te aconsejo que compres un juego de "Creación del mundo" de Hong En y lo calentes primero.

En el medio de la interfaz SAS 8.2 hay tres ventanas una al lado de la otra (o apiladas). La ventana llamada Editor de programas (la etiqueta de la ventana es Editor) se utiliza para ingresar todas las operaciones de programación. Se completa dentro de esta ventana, por lo que primero debes familiarizarte con él.

(1) Conjunto de datos (conjunto de datos) y biblioteca

Las operaciones estadísticas se basan en datos. El archivo que contiene datos en SAS se denomina conjunto de datos y el conjunto de datos se incluye en. En diferentes bibliotecas (entendámoslo como bases de datos por el momento). Las bibliotecas en SAS se dividen en dos tipos: permanentes y temporales. Como su nombre lo indica, el conjunto de datos que existe en la biblioteca permanente existe permanentemente (siempre que no lo elimine), mientras que el conjunto de datos en la biblioteca temporal se elimina automáticamente después de salir de SAS. En cuanto al concepto de biblioteca en SAS, la comprensión más simple es un directorio, un directorio que almacena conjuntos de datos.

La estructura del conjunto de datos es exactamente la misma que generalmente entendemos como una tabla de datos. Está compuesta por campos y registros, en el siguiente contenido estamos acostumbrados a llamar a los campos. , nos referiremos a campos y variables. ¡Simplemente entiéndalo como lo mismo! Hay muchas formas de crear un conjunto de datos. Existen métodos especiales de lectura de datos en las operaciones de programación para crear un conjunto de datos, pero los datos deben ingresarse en el sitio, lo que requiere mucho tiempo y mano de obra. Si la cantidad de datos es grande, le recomiendo que primero utilice otros métodos para construir el conjunto de datos; de lo contrario, la mayoría de las declaraciones del programa se desperdiciarán en la entrada de datos.

¿Cuáles son otros métodos? ¿Le gustaría consultar otros libros o información? De lo contrario, ¿puedes esperar un momento? Planeo publicar una guía completa de operación de SAS dentro de unos años.

(2) Descripción general del programa SAS

Al igual que otros lenguajes informáticos, el lenguaje SAS (llamado lenguaje SCL, SAS Component Language) también tiene su propio vocabulario (es decir, palabras clave) y gramática. Las palabras clave, los nombres, los caracteres especiales y los operadores se organizan de acuerdo con reglas gramaticales para formar una declaración SAS, y varias declaraciones SAS que realizan funciones completas constituyen un programa SAS.

Los programas SAS incluyen múltiples pasos y algunas declaraciones de control. Generalmente, incluyen pasos de datos y pasos de proceso. Cualquier combinación entre ellos puede convertirse en un programa SAS. para realizar una función completa. Por lo general, los programas SAS también incluyen algunas declaraciones completas para controlar ciertas opciones, variables o el entorno en el que se ejecuta el programa a lo largo de todo el programa SAS.

Las declaraciones de los programas SAS generalmente comienzan con palabras clave y terminan con un punto y coma. Una declaración puede ocupar varias líneas (cada vez que SAS ve un punto y coma, agregará todas las declaraciones antes y después del punto y coma anterior. tratados como una sola declaración, independientemente de en cuántas líneas diferentes se encuentren). Las declaraciones SAS no distinguen entre mayúsculas y minúsculas. Puede decidir si desea utilizar letras mayúsculas o minúsculas según sus preferencias personales.

1. Definición del nombre de la biblioteca (etiqueta de la biblioteca)

Para guardar datos valiosos y facilitar la operación, estoy acostumbrado a especificar mi propio nombre de biblioteca y su ruta (directorio). porque La biblioteca permanente existente (SASUSER) en el sistema SAS es demasiado engorrosa e incómoda de usar, independientemente del nombre de la biblioteca o su ruta correspondiente. Los datos utilizados en el programa se pueden guardar permanentemente en esta ruta para garantizar que se puedan reutilizar en el futuro. La declaración que especifica el nombre de la biblioteca es una declaración completa y su formato es el siguiente:

Nombre de la biblioteca 'ruta'

Por ejemplo, el nombre de la biblioteca que especificamos es "; a" y la ruta es: "e :\data\", la declaración SAS es la siguiente:

libname a 'e:\data\';

2. Paso de datos

El paso de datos de SAS comienza con Comienza con la declaración de datos, que se utiliza para crear y procesar conjuntos de datos. La declaración de datos comienza con la palabra clave "datos" y tiene el siguiente formato:

nombre del conjunto de datos de datos

Por ejemplo: datos a.case creará un SAS denominado case en; biblioteca a Conjunto de datos, después de ejecutar la declaración, puede ver el caso del archivo del conjunto de datos recién creado en el directorio correspondiente a la biblioteca a.

El conjunto de datos especificado por la declaración de datos generalmente aparece en el formato "nombre de la biblioteca.nombre del conjunto de datos", o también puede aparecer como un "nombre del conjunto de datos" separado. valores predeterminados del sistema Es un conjunto de datos en la base de datos temporal y se eliminará después de salir del sistema.

La declaración de datos tiene dos funciones importantes: marcar el comienzo del paso de datos y nombrar el conjunto de datos SAS que se creará.

Además de las declaraciones de datos, los pasos de datos generalmente incluyen declaraciones de archivo, declaraciones de entrada y declaraciones de líneas de datos. Se utilizan de manera diferente según diferentes métodos de entrada de datos.

Los programas SAS tienen dos métodos de entrada de datos comunes: la lectura de archivos externos y la entrada directa.

(1) Método de lectura de archivos externos

Si los datos ya están incluidos en un archivo externo (archivo de texto o archivo de datos), puede utilizar este método para ingresar los datos en el archivo de conjunto de datos.

Después de la declaración de datos presentada anteriormente, escriba la siguiente declaración:

infile 'La ubicación y el nombre del archivo externo'

nombre de la variable de entrada 1; Nombre de variable 2...Nombre de variable n;

La declaración infile se utiliza para leer datos de un archivo externo y debe aparecer antes de la declaración de entrada. Su función es especificar un archivo externo que contiene datos sin procesar.

La declaración de entrada se utiliza para indicar al sistema cómo leer cada registro de datos. Sus funciones principales son: leer las columnas de datos especificadas por la declaración, definir nombres de variables para los campos de datos correspondientes y determinar el modo de lectura de las variables.

Por ejemplo:

libname a 'e:\data\';

data a.student

infile 'e: \ data\student.txt';

ingrese nombre altura peso;

El programa anterior ingresa los datos en el archivo de texto "student.txt" en el directorio "e:\data \" En el conjunto de datos del estudiante, el conjunto de datos se almacena en el directorio "e:\data\".

(2) Método de entrada directa

Utilice este método de entrada cuando la cantidad de datos sea pequeña o el operador tenga mucha fuerza de voluntad. Escriba la siguiente declaración después de la declaración de datos:

p>

Ingrese nombre de variable 1 nombre de variable 2 ... nombre de variable n;

líneas de datos (en la versión anterior eran tarjetas, pero en la nueva versión ambas son intercambiables)

… … … … (fila de datos)

… … … … (fila de datos)

… … … … (fila de datos)

;

La declaración de líneas de datos se utiliza para ingresar datos directamente y marca el comienzo de un bloque de datos.

Nota: Los datos en las filas de datos aquí están separados por espacios. Por supuesto, también pueden separarse por otras cosas, como comas. Debido a que las declaraciones de entrada requieren opciones de control correspondientes bajo diferentes métodos de separación, las discutiremos más adelante, así que guardemos nuestros esfuerzos aquí. Además, después de ingresar la línea de datos, no puede agregar directamente un punto y coma después como otras declaraciones, sino comenzar una nueva línea e ingresar el punto y coma, de modo que SAS piense que esto está ingresando datos originales y no está haciendo nada más.

Por ejemplo:

libname a 'e:\data\';

datos a.student

nombre de entrada $ altura; peso ; (El símbolo $ después del nombre indica que el nombre de la variable es una variable de carácter)

datalines

Linda 171 51

Mary 168 50

Selinna 169 49

;

El programa anterior creará directamente el archivo de conjunto de datos del estudiante, que se almacena en el directorio "e:\data\".

3. Paso del proceso

El paso del proceso del programa SAS representa un proceso de procesamiento, como clasificación, prueba T, análisis de varianza, etc. El paso del procedimiento comienza con la palabra clave proc, seguida del nombre del procedimiento para distinguir los diferentes pasos del programa y termina con la palabra clave ejecutar.

El formato general es el siguiente:

lista de opciones de nombre de procedimiento

...(otras declaraciones); ..(other Statement);

run;

Hay cientos de procedimientos involucrados en los programas SAS, y hay docenas de procedimientos comúnmente utilizados para implementar funciones estadísticas. Los usados ​​son Los nombres de los procesos y las funciones que pueden lograr se enumeran en la siguiente tabla (Tabla 1.1), para que pueda prepararse con anticipación.

Tabla 1.1 Nombres de procesos de uso común y sus funciones

Nombre del proceso

Función

Ordenar

Especificará El conjunto de datos se ordena por la variable especificada

Imprimir

Emite la lista de datos en el conjunto de datos

tabular

Los datos son clasificadas según las variables especificadas se clasifican y resumen en forma de tablas

Medias

Una descripción estadística simple de las variables numéricas especificadas

Frec.

La descripción estadística simple especificada de variables categóricas

Ttest

Realizar prueba t en variables especificadas

Anova

Realizar varianza en variables especificadas Análisis

npar1way

Realizar pruebas no paramétricas en las variables especificadas

Reg

Realizar análisis de regresión en las variables especificadas

Corr

Realizar análisis de correlación en las variables especificadas

Discrim

Realizar análisis discriminante en las variables especificadas

Clúster

p>

Realizar análisis de conglomerados en variables específicas

Gráfico

Dibujar un gráfico estadístico de baja resolución

4 Varios procesos importantes de uso común

Antes de ingresar al contenido de la implementación de funciones estadísticas generales, es necesario que todos dominen de antemano el proceso de preprocesamiento de datos y la ejecución de funciones públicas importantes. procesos importantes. Tener una discusión.

(1) El proceso de conjuntos de datos para operar archivos SAS

El proceso de conjuntos de datos es una herramienta para administrar y operar archivos de datos. Podemos usarlo para lograr las siguientes funciones:

Copiar archivos SAS de una biblioteca a otra;

Cambiar el nombre de los archivos SAS;

Reparar archivos SAS dañados

Eliminar archivos SAS; >

Enumere todos los archivos SAS en una determinada biblioteca SAS;

Enumere los atributos de un conjunto de datos SAS, como la hora de la última modificación, si los datos están comprimidos, si los datos son índice, etc. .;

Establecer contraseñas para archivos SAS;

Agregar registros al conjunto de datos SAS

Agregar los atributos del conjunto de datos SAS y el contenido del; conjunto de datos Modificar las propiedades de las variables

Crear o eliminar índices para conjuntos de datos SAS

Crear y administrar archivos de verificación para conjuntos de datos SAS

Crear o eliminar las reglas de integridad de SAS para conjuntos de datos.

El formato general del proceso de conjuntos de datos es el siguiente:

proc datasets

lista de nombres de archivos de edad relacionados con el nombre de archivo actual<; /lista de opciones>;

añadir base=nombre del conjunto de datos;

nombre del archivo de auditoría<(contraseña de operación)>; ;>

cambiar nombre de archivo antiguo 1 = nombre de archivo nuevo 1 <...nombre de archivo antiguo n = nombre de archivo nuevo n>

contenido ; nombre> ;

copiar=etiqueta de biblioteca ;

excluir nombre de archivo (Esta declaración solo puede aparecer después de la declaración de copia y no puede aparecer al mismo tiempo que la declaración de selección)

seleccione el nombre del archivo (Esta declaración solo puede aparecer después de la declaración de copia y no puede aparecer al mismo tiempo que la declaración de exclusión)

eliminar nombre de archivo ;

p>

nombre de archivo de intercambio 1 = nombre de archivo de intercambio 1 <… nombre de archivo n = nombre de archivo de intercambio n>

modificar el nombre del archivo ;

;

reparar el nombre del archivo ;

guardar nombre de archivo ;

ejecutar;

¿No es demasiado complicado? Pero todavía tengo que escribir, ¡y ya lo he escrito! No soporto desperdiciarlo, al menos se puede usar para completar los números y ampliar el espacio. Como a todos, puedes saltarte esta parte si te resulta molesta. No es demasiado tarde para revisarla cuando quieras usarla. A continuación me tomaré la molestia de presentarles el significado y el uso de cada opción y cada declaración.

El significado y el uso de cada opción después de la declaración de conjuntos de datos de proceso se muestran en la siguiente tabla (Tabla 1.2).

Tabla 1.2 El significado y uso de cada opción después de la declaración de conjuntos de datos proc

Opciones

El significado y uso

alter=conversion contraseña de protección

Cuando el archivo SAS está configurado con una contraseña de operación de conversión, se utiliza para verificar la legalidad de la operación. El código se ejecutará solo cuando la contraseña sea correcta

. detalles/nodetalles

SAS relacionado con el control Si se muestra o no la información detallada del archivo, se muestra la primera, no se muestra la segunda, el valor predeterminado es el último

force

Esta opción tiene dos funciones: (1) En el paso del proceso La ejecución del programa aún se fuerza cuando hay un error en la declaración (2) En la declaración append, cuando las variables del; dos conjuntos de datos no son exactamente iguales, la ejecución de la declaración de adición aún es forzada.

gennum=

Controla el método de procesamiento del conjunto de datos derivados, el signo igual puede ser todo, hist, revertir o un determinado número entero

kill

p >

Esta opción significa eliminar todos los archivos de la biblioteca que se van a procesar y debe usarse con precaución

library=etiqueta de biblioteca

Se usa para especificar la biblioteca que se va a procesar. procesado

memtype=tipo de miembro

Especifica el tipo de miembro de la biblioteca (tipo de archivo) para el procesamiento, el valor predeterminado es todos (todos los tipos)

nolist

En La visualización del directorio de archivos procesados ​​está prohibida en el archivo de registro

nowarn

Cuando el archivo especificado en la declaración no existe, el mensaje de error está prohibido se muestre y el programa se vea obligado a continuar ejecutándose

pw=Contraseña de operación

Verifique la legalidad de la operación al configurar la contraseña de operación para archivos SAS (incluidos archivos protegidos contra lectura y escritura). y archivos protegidos contra conversión)

read=Contraseña de protección de lectura

Verifique la legalidad de la operación al establecer una contraseña de protección de lectura para archivos SAS

La declaración de edad se utiliza para cambiar el nombre de archivos en lotes De acuerdo con el orden del archivo actual y los archivos relacionados, el siguiente es El nombre del archivo se cambia al archivo anterior, con el resultado de que el último archivo se elimina y el nombre del archivo actual se descarta. .

Eso es todo lo que sé sobre esta afirmación, y es una conclusión extraída a través de experimentos, pero todavía siento que no la entiendo correctamente. Si alguien tiene algún consejo, no dude en ilustrarme.

La instrucción append realiza la función de agregar registros al conjunto de datos. La opción "base=nombre del conjunto de datos" se usa para especificar el conjunto de datos al que se agrega el registro y "datos=nombre del conjunto de datos". especifica la ubicación del registro que se agregará. El conjunto de datos. Si se omite esta opción, el valor predeterminado es el conjunto de datos actual (el conjunto de datos de la última operación).

La declaración de auditoría se usa para verificar archivos, generar archivos de verificación y administrarlos; la declaración de cambio reemplaza el nombre del archivo antiguo con un nombre de archivo nuevo; la declaración de contenido se usa para mostrar cada elemento de los datos especificados; set o el atributo del conjunto de datos actual; la declaración de copia se usa para copiar los archivos correspondientes en la biblioteca actual a la biblioteca especificada, la opción "out=library tag" se usa para especificar la biblioteca de destino a la que se enviará el archivo. copiado; la declaración de eliminación se utiliza para eliminar el archivo especificado; la función del estado disponible es retener el archivo especificado y eliminar todos los demás archivos de la biblioteca actual;

(2) El proceso de clasificación para ordenar registros en archivos de datos

La función del proceso de clasificación es ordenar los registros en el conjunto de datos especificado de acuerdo con las variables especificadas. Dado que muchos procesos necesitan ordenar registros de conjuntos de datos, por ejemplo, cuando hay una declaración by (utilizada para dividir el archivo de datos en varias partes) en el paso del proceso, los datos deben ordenarse primero de acuerdo con las variables después de la por declaración, entonces ordenar El proceso es muy útil y de uso muy común.

El formato general del proceso de clasificación es el siguiente:

lista de opciones de clasificación proc

por nombre de variable 1 ;

run;

El significado y el uso de cada opción después de la instrucción proc sort se muestran en la siguiente tabla (Tabla 1.3).

Tabla 1.3 El significado y uso de cada opción después de la declaración proc sort

Opciones

El significado y uso

data=data nombre del conjunto

Se utiliza para especificar el conjunto de datos que se procesará mediante el proceso de clasificación. Si se omite, el valor predeterminado es el conjunto de datos creado o procesado más recientemente

copia de fecha

<. p>Esta opción especifica que no cambiará Ordenar los archivos según la fecha de creación y modificación del archivo

out=nombre del conjunto de datos

Los archivos ordenados se almacenarán con el formato especificado nombre del archivo sin ninguna modificación de los archivos originales, si esta opción no está disponible, el archivo original se sobrescribirá

sortseq=sort by

Especifique los criterios para ordenar las variables de caracteres<. /p>

reverse/equals/noequals

Especifique el método de clasificación en los datos de salida. Los tres medios para invertir el orden de las variables de caracteres y mostrarlas. El orden permanece sin cambios dentro de cada nivel. la variable de clasificación, y se permite que el orden cambie dentro de cada nivel de la variable de clasificación

nodupkey/noduprecs

Especifique el método de eliminación de variables duplicadas. El primero significa eliminar registros. con valores de variables de clasificación duplicados, y este último significa eliminar todos los registros con valores de variables duplicados

sortsize=

Se utiliza para especificar el tamaño de la memoria máxima disponible después del signo igual. el valor y la unidad que indican el tamaño de la memoria, como 10 m

force

Se utiliza para forzar un proceso de clasificación duplicada (clasificación de archivos indexados)

tagsort

tagsort

Especifica que solo las variables de clasificación y los números de registro se almacenan en un archivo temporal para reducir el uso de espacio en disco< La instrucción /p>

by se utiliza para especificar la variable por la que se ordenará. La variable puede ser numérica. o carácter. A partir de entonces se pueden especificar múltiples variables. El proceso de clasificación ordena según la primera variable y luego ordena según las variables inferiores. La opción descendente/ascendente se puede utilizar antes de cada variable en la declaración by para especificar el método de clasificación (orden descendente o ascendente). El estado predeterminado es orden ascendente.

(3) El proceso de impresión de salida y visualización de archivos de datos

La función del proceso de impresión es mostrar los registros de los datos SAS establecidos en el dispositivo de salida (pantalla de visualización) de cierta manera. Mostrar todas o parte de sus variables. Con este proceso, puede crear una variedad de formularios, desde listas simples hasta informes que resumen datos.

El formato general del proceso de impresión es el siguiente:

lista de opciones de impresión proc

por nombre de variable 1 ;

nombre de la variable pageby;

nombre de la variable sumby

nombre de la variable de suma; name;

var nombre de variable;

run;

El significado y el uso de las opciones que puede seguir la declaración proc print se muestran en la tabla. a continuación (Tabla 1.4)

Tabla 1.4 El significado y el uso de las opciones después de la declaración proc print

Opciones

El significado y el uso

contents=text

Se utiliza para especificar contenido html. El texto de identificación del enlace que apunta a la salida en el archivo, que puede ser cualquier texto después del signo igual

data=nombre del conjunto de datos.

Especifique el conjunto de datos que se procesará y el archivo del conjunto de datos después del nombre del signo igual

doble

Especifica insertar una línea en blanco entre registros adyacentes

n=string

Al final del informe o por El número de registros mostrados se muestra al final de cada agrupación horizontal de la variable, y se identifica con una cadena después de la signo igual

noobs

Deshabilita la visualización de números de registro en el informe

obs=encabezado de columna

El encabezado de columna utilizado para especificar la columna donde se encuentra el número de registro

redondo

Redondea variables numéricas sin formato, formateadas uniformemente como un valor decimal con dos lugares decimales

filas=página

Especifica el formato de la página. Actualmente 'página' es el único valor disponible para esta opción, lo que indica que en cada página se muestra solo una fila de valores variables para un registro, es decir, se muestran tantos registros como sea posible. en una fila

ancho=ancho de columna

Especifique el ancho de la columna. Los valores posibles son 'completo', 'mínimo', 'uniforme', 'uniformby', etc. .,

heading=direction

El valor puede ser v (vertical) o h (horizontal), lo que indica la orientación de visualización del encabezado de la columna (horizontal o vertical)

etiqueta

Especifica que el ID de la variable debe usarse como título de la columna correspondiente; de ​​lo contrario, el nombre de la variable debe usarse como título de la columna

split=character

p>

En primer lugar, esta opción especifica que el identificador de variable se utiliza como encabezado de columna y el carácter especificado se utiliza como símbolo para ajustar la línea del encabezado de columna

elemento estilo=tipo

Especifica la posición deseada en una ubicación específica en el informe Elementos de tipo de aplicación (involucra mucho contenido, se omiten detalles)

La declaración by se usa de la misma manera en todos los procesos, es decir , el conjunto de datos se divide en varios conjuntos de datos pequeños para su procesamiento respectivamente. La declaración pageby se utiliza para controlar el modo de visualización de las variables al cambiar de página. Para las variables especificadas posteriormente, el mismo valor no se mostrará en diferentes páginas cuando el registro de un determinado valor de la variable no se puede mostrar en la parte restante. de la página, luego el primer registro de este valor se mostrará en una nueva línea. La función de la declaración sumby es similar a la declaración pageby, excepto que la acción de cambio de página se reemplaza por una suma y el valor total de la variable var se calcula para cada valor de la variable especificada. La función de la declaración de identificación es utilizar el valor de la variable especificada en lugar del número de registro para identificar cada registro. La declaración de suma se usa para especificar las variables que se sumarán en el informe y la declaración var se usa para especificar las variables que se mostrarán en el informe.

El proceso anterior es relativamente común y se utiliza con frecuencia. Es necesario comprenderlo de antemano para facilitar el progreso del contenido que se analiza más adelante.

Para ahorrar espacio, aquí no se muestran ejemplos. El contenido es demasiado aburrido y los posibles errores son inevitables, así que tengan paciencia conmigo.

Permítanme presentarles brevemente la situación general del funcionamiento de un programa SAS como este. Si hablo demasiado, me temo que no tendrá paciencia para seguir leyendo.

Me gustaría presentar más contenido en ejemplos prácticos, para que todos puedan tener una buena experiencia personal, quedar profundamente impresionados y sentirse cómodos de usar en la práctica.