Manual SAS AGRARIA 2008

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 11

Universidad Nacional Agraria la Molina

Facultad de Zootecnia

“Aplicaciones del SAS en la


Investigación Científica”

Por:
Ph. D. Enrique Flores Mariazza .
Mg. Sc. Gustavo Gutierrez Reynoso.

Laboratorio de Utilización de Pastizales

La Molina – 2008

1. INTRODUCCIÓN AL SAS.
El sistema SAS (Satatistical Analysis System), es un sistema integrado de
aplicaciones, que proporciona un procesamiento completo y capacidades de
análisis de datos provenientes de experimentos, censos, encuestas e información
proveniente de fuentes físicas, biológicas y socio económicas. SAS esta dividido
en módulos según las necesidades del usuario. Los principales módulos son:
SAS/BASE. Es el fundamento y núcleo del sistema SAS, es una
herramienta de propósito general para manejo de datos, análisis y reporte,
permite la obtención de histogramas, ploteo. Correlaciones, promedios, etc.
SAS/STAT. Permite realizar análisis estadísticos tales como análisis de
regresión, análisis de variancia, análisis multivariado, etc.
SAS/ETS. Para modelos econométricos, análisis de series de tiempo y
plantación.

1.1 Inicio de una Sesión.


Para empezar a trabajar con el SAS, primero cargamos el programa:

El programa siempre se inicia mostrando la ventana del editor y la barra de


menú tal como se muestra en la siguiente figura:
En la ventana Editor se ingresa el archivo de datos el mismo que es que es
guardado como un archivo “*.dat”, el nombre del archivo de datos es
importante para ser referido en el archivo SAS (archivo de programa), para
luego ejecutar el programa.

2. ELEMENTOS DEL SAS.

2.1 Ventanas (Windows).


Las ventanas son sectores, en los cuales se divide la pantalla para facilitar la
presentación simultanea de archivos, comandos y resultados.
SAS presenta tres ventanas principales:
o Ventana EDITOR. Ingreso de datos y programación de comandos.
o Ventana LOG. Muestra el archivo de ejecución de SAS, ubicando
errores en la sintaxis de los comandos.
o Ventana OUPUT. Muestra los resultados de los procedimientos
ejecutados.
También presenta 2 ventanas secundarias:
o Ventana Results. Muestra las carpetas de resultados creadas en el
Fichero de SAS.
o Ventana Explorer. Muestra las carpetas de programación temporal
en SAS.

2.2 Comandos Usados en la Creación de Archivos SAS.


DATA : Genera un directorio de trabajo temporal.
INFILE : Indica la ruta o directorio para ubicar el archivo de variables
contenido en el archivo de datos.
INPUT : Nombra y ubica las variables contenidas en el archivo de datos,
cuando las variables contienen caracteres alfanuméricos se debe usar el
signo $ después del nombre de la variable.
RUN : Ejecuta los comandos previamente establecidos.

2.3 Operaciones Básicas y Exploración de Datos con Archivo SAS.


Las variables de un archivo de datos, pueden ser usadas para crear nuevas
variables empleando operadores matemáticos los cuales son:
Operaciones Símbolo Ejemplo SAS
2
Potencia ** Y=X Y=X**2;
Multiplicación * Y=AxB Y=A*B;
División / G=H/I G=H/I;
Adición + R=S+T R=S+T;
Sustracción - U=V-X U=V-X;

Para un análisis exploratorio y estadístico de datos, podemos usar


comúnmente los siguientes procedimientos:
PROC PRINT : Impresión de datos.
PROC FREQ : Frecuencia de las variables.
PROC MEANS : Calculo de estadísticos elementales de un factor.
PROC PLOT : Plotea de variables X e Y en abscisas y ordenadas.
PROC TABULATE : Tabula variables por criterios de clasificación.
PROC GCHART : Realiza gráficos resúmenes.
PROC UNIVARIATE : Análisis de parámetros estadísticos de un solo factor.
PROC ANOVA : Análisis de variancia balanceado.
PROC GLM : Análisis de variancia y regresión no balanceado.
PROC SORT : Ordenación de datos.
PROC REG : Análisis de regresión.

3. ESTRUCTURA DEL PROGRAMA SAS.

La estructura característica de todo Programa SAS, esta dada por su organización


en tres partes o bloques.

a) Bloque de definiciones.
Contiene aquellos comandos, que definen el archivo de datos y la forma como
debe estar organizada a la salida de los resultados.

b) Bloque de archivo.
Define la forma como están ordenada la entrada de las variables en el archivo
de datos.

c) Bloque de diseño estadístico.


La programación propiamente dicha del modelo que deseamos ejecutar,
depende del diseño propuesto.

A continuación se muestra un ejemplo de un programa SAS. Utilizado para


encontrar el efecto parcial de la edad, longitud de mecho y peso vivo sobre el peso
de vellón en alpacas.

a) Bloque de DATA ALPACA;


INFILE 'A:REGM.DAT';
definiciones OPTION NODATE NOCENTER NONUMBER LS=72 PS=60;
TITLE'INFLUENCIA DE LA EDAD, LONGITUD DE
MECHA Y PESO VIVO SOBRE EL PESO DE VELLON';
INPUT ARETE PEVE EDAD LM PVI;
b) Bloque de archivo PROC PRINT;
RUN;
c) Bloque de diseño PROC REG;
MODEL PVE=EDAD LM PVI;
estadístico RUN;
QUIT;

Para poder ejecutar el archivo SAS se debe pulsar el botón del icono esto
hace que automáticamente se generen las ventanas LOG y OUPUT.
4. BASE DE DATOS.

Una base de datos es una colección de información organizada y presentada para


servir a un propósito específico. Algunos ejemplos de base de datos son: La guía
telefónica, diccionarios, enciclopedias, etc.; los cuales tienen en común la
información organizada, presentado de una manera que facilita su ubicación a
través de una clave o código. En otras palabras, la información que se puede
presentar como cuadros (filas, columnas) pueden ser una base de datos.

4.1 Introducción al Análisis de Datos.


Los datos para ser procesados deben estar organizados, es necesario tener
presente algunos conceptos básicos:

Valor: Es la medida asignada a cada objeto.


Ejemplo: Peso vivo 50.0
Peso de Vellón 2.0

Variable: Son todos los valores de una misma medida, los que forman
una columna.
Del ejemplo anterior:
Peso vivo es una variable
Peso de vellón es una variable

Después que la información ha sido colectada y registrada, se esta listo para


el análisis de datos. Verificando primero su hay errores, usando análisis
exploratorio o imprimiendo los resultados.

Registro u observación:
Conjunto de valores de datos que contienen la información de un individuo u
objeto con sus diferentes variables.
Ejemplo:
Animal Peso Vivo Peso Vellón
0001 50.00 2.00
0002 55.00 2.10
4.2 Estructura de Registro.
Es el ancho o número de campos que tiene un registro.
Animal 4
Peso vivo 5
Peso de vellón 4

4.3 Creación de un Archivo de Datos.


Para crear un archivo de datos lo hacemos con el EDITOR, el SAS tiene su
editor, en el cual se van a digitar los datos ordenados.
Cada variable debe ir separada por lo menos de un espacio en blanco.
Ejemplo:
H0001 6.0 25.5
H0002 7.0 30.0
H0003 5.8 29.0
H0004 7.5 34.5

En este archivo de datos, se presenta la información de número de animal


(alpaca), peso al nacimiento (kg) y peso al destete (kg).
Una vez terminada la digitación de los datos se procede a grabar este
archivo, lo cual se puede realizarse de dos maneras.
1. Usando el comando FILE.
FILE’A:ALPACA.DAT’

2. Usando la barra menú FILE, opción SAVE AS....., Luego guardar y se


especifica la ubicación y nombre del archivo.

Estos datos son grabados para ser usados posteriormente en el


procedimiento SAS.
5. MANEJO DE ARCHIVOS.

En SAS existen varias formas de manejar los archivos. Pero la ejecución,


procedimientos y resultados son los mismos.

5.1 Acceso al archivo.


Usando la barra menú FILE, la opción OPEN para abrir el archivo y se
especifica la ubicación y nombre del archivo.

5.2 Leer datos externos.


Al crear un archivo en el programa SAS, los datos pueden encontrarse en un
archivo externo tal como se ha presentado en el ejemplo con el archivo
REGM.DAT, es fundamental indicar en el INFILE la ubicación de los datos.
5.3 Leer datos internos.
Al crear un archivo en el programa SAS, los datos pueden encontrarse en el
archivo del programa SAS, en este caso se hace uso de la sentencia CARDS,
para indicar el comienzo de los datos, que una ve finalizada irán en una línea
con (;).
SI tomamos el mismo ejemplo, el programa SAS quedaría como:

DATA ALPACA;
OPTION NODATE NOCENTER NONUMBER LS=72 PS=60;
TITLE'INFLUENCIA DE LA EDAD, LONGITUD DE MECHA Y PESO VIVO SOBRE
EL PESO DE VELLON';
INPUT ARETE PVE EDAD LM PVI;
CARDS;
1 1.8 3 10 61
2 1.5 3 11 58
3 1.3 3 16 60
4 2.6 3 12 63
5 2.6 3 12 63
6 2.1 4 12 60
7 1.8 4 17 60
8 2.0 4 10 72
9 1.8 4 9 58
10 2.7 4 10 60
11 2.9 5 17 68
12 3.3 5 16 65
13 3.1 5 16 60
14 2.2 5 14 60
15 3.3 5 19 58
16 1.8 6 16 59
17 2.6 6 12 60
18 2.7 6 16 45
19 2.7 6 15 70
20 3.1 6 12 66
21 2.6 7 15 65
22 2.1 7 14 68
23 1.9 7 13 70
24 2.2 7 14 60
25 3.3 7 17 55
26 2.2 8 19 68
27 1.8 8 16 64
28 2.7 8 17 60
29 2.0 8 11 62
30 1.6 8 10 68
;
PROC PRINT;
RUN;
PROC REG;
MODEL PVE=EDAD LM PVI;
RUN;
QUIT;
6. EJECUCIÓN DE UN PROGRAMA SAS.

La ejecución de un programa SAS se realiza desde la ventana editor, la cual debe


contener el programa a ejecutar.

Estando activada la ventana EDITOR se hace clic en el icono y se genera


los resultados de la ventana OUTPUT los mismos que para el ejemplo seria los
siguientes:
En la Primera parte muestra el listado correspondiente al procedimiento PROC
PRINT, el cual contiene 30 observaciones.

INFLUENCIA DE LA EDAD, LONGITUD DE MECHA Y PESO VIVO SOBRE EL PESO DE VELLÓN

Obs ARETE PVE EDAD LM PVI

1 1 1.8 3 10 61
2 2 1.5 3 11 58
3 3 1.3 3 16 60
4 4 2.6 3 12 63
5 5 2.6 3 12 63
6 6 2.1 4 12 60
7 7 1.8 4 17 60
8 8 2.0 4 10 72
9 9 1.8 4 9 58
10 10 2.7 4 10 60
11 11 2.9 5 17 68
12 12 3.3 5 16 65
13 13 3.1 5 16 60
14 14 2.2 5 14 60
15 15 3.3 5 19 58
16 16 1.8 6 16 59
17 17 2.6 6 12 60
18 18 2.7 6 16 45
19 19 2.7 6 15 70
20 20 3.1 6 12 66
21 21 2.6 7 15 65
22 22 2.1 7 14 68
23 23 1.9 7 13 70
24 24 2.2 7 14 60
25 25 3.3 7 17 55
26 26 2.2 8 19 68
27 27 1.8 8 16 64
28 28 2.7 8 17 60
29 29 2.0 8 11 62
30 30 1.6 8 10 68
La segunda parte muestra el análisis de variancia de la variable dependiente PVE
(peso de vellón) y los parámetros estimados de las variables edad, longitud de
mecha y peso vivo.

INFLUENCIA DE LA EDAD, LONGITUD DE MECHA Y PESO VIVO SOBRE EL PESO DE VELLÓN

The REG Procedure


Model: MODEL1
Dependent Variable: PVE

Analysis of Variance

Sum of Mean
Source DF Squares Square F Value Pr > F

Model 3 1.34835 0.44945 1.45 0.2514


Error 26 8.06531 0.31020
Corrected Total 29 9.41367

Root MSE 0.55696 R-Square 0.1432


Dependent Mean 2.34333 Adj R-Sq 0.0444
Coeff Var 23.76785

Parameter Estimates

Parameter Standard
Variable DF Estimate Error t Value Pr > |t|

Intercept 1 1.68865 1.38252 1.22 0.2329


EDAD 1 -0.00373 0.06487 -0.06 0.9546
LM 1 0.07340 0.03893 1.89 0.0706
PVI 1 -0.00559 0.01997 -0.28 0.7819

También podría gustarte