Conceptos Basicos A 37666 Completo

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 49

mailxmail - Cursos para compartir lo que sabes

Conceptos bsicos de estadstica


Autor: Mario Blacutt Mendoza

mailxmail - Cursos para compartir lo que sabes

Presentacin del curso


Este es un curso de estadstica bsica est dirigido principalmente a la aplicacin por profesionales, estudiantes y hombres de negocios. Particularmente, para administradores, economistas, psiclogos, socilogos y, en general, para todas las personas que deseen contar con un instrumento gil y oportuno para usar e interpretar datos. En este primer curso aprenderemos conceptos relacionados con la variable y la escala de medida. A continuacin profundizaremos en los conceptos relativos a la recoleccin de datos, tales como la muestra las encuestas, etc. Seguidamente analizaremos las diferentes medidas de tendencia central, como son la mediana aritmtica, la mediana aritmtica ponderada, la media geomtrica, la mediana y las varianzas, entre otras. Es importante conocer estas medidas ya que nos aportarn datos muy valiosos a la hora de analizar los resultados de una encuesta. Finalmente atenderemos la distribucin de frecuencias y las grficas que nos van a permitir transmitir de una manera muy visual y atractiva las conclusiones extradas de los datos estadsticos. Tambin haremos una pincelada a la probabilidad.

mailxmail - Cursos para compartir lo que sabes

1. Conceptos fundamentales de estadstica


Variable Una variable es una magnitud que vara pero, en todo caso, que puede ser medida, manipulada, controlada o simplemente tomada en cuenta tal como est. Las variables pueden estar relacionadas con otras variables y cambiar de acuerdo con la modificacin de alguna; desde esta ptica, las variables se clasificarn en dependientes e independientes. Una variable ser considerada dependiente, en el marco de un estudio concreto si su magnitud cambia debido a los cambios de otra u otras variables. Por ejemplo, el consumo es una variable que est relacionada al ingreso; si el ingreso aumenta, el consumo de un bien determinado tambin aumentar, aunque no se puede saber, a priori, en cunto. En este caso, dentro del marco del estudio concreto que estamos realizando, el Ingreso sera la variable independiente, pues cambia sin estar ligado a otra, se reitera, para los efectos del anlisis concreto. Las variables independientes pueden ser manipuladas por el diseador de un estudio estadstico para ver reaccionara la variable dependiente en la realidad, cuando se produzcan variaciones en el Ingreso. Escalas de medida Las variables se dividen en tres grandes grupos: Cuantitativas, Categricas y de Intervalo. Variables cuantitativas son las que conocemos como variables numricas; son este tipo de variables las que generalmente se usa en los estudios estadsticos, pues son las que varan en su magnitud. Variables categricas, son las que conocemos como variables cualitativas; ahora bien, las variables categricas se dividen en dos grandes ramas: las variables nominales y las variables ordinales. Variables nominales son aqullas que no pueden ser clasificadas ni en una magnitud cuantitativa ni en una magnitud de jerarqua; por ejemplo, las categoras

mailxmail - Cursos para compartir lo que sabes

de gnero; varn, mujer, son variables de tipo nominal. Variables ordinales, son las que aceptan una jerarquizacin de importancia; el ingreso familiar, por ejemplo, es una variable nominal, puesto que puede ser calificado de acuerdo a un orden, v.g, descendente. Variables de intervalo, son las que nos permiten expandir un tanto el radio de las variables numricas; por ejemplo, el promedio del ingreso semanal de un grupo de estudiantes puede encontrarse entre $30 y 32. Relacin de las variables Desde el punto de vista de la relacin, hay tres clases de variables. Variables dependientes: son las que cambian debido a que otra variable o variables tambin han cambiado. Variables Independientes, son las que cambian sin depender del cambio de otras. Una de las principales tareas del estadstico en este campo es establecer cules sern las variables independientes y cules las dependientes en el anlisis concreto que debe realizar. En otros captulos ms avanzados veremos que una variable X puede cambiar de magnitud si cambia una variable Y; el mismo tiempo, sta cambia cuando cambia la primera.

Variables neutras son las que no estn relacionadas con ninguna otra. Hay dos requerimientos sobre las variables: que obedezcan a una teora pre establecida o a una hiptesis racional, lgico y que el grado de relacin entre ellas sea suficientemente slido. Por ejemplo, puede suceder que los precios en Espaa cambien en relacin directa con los nacimientos en Corea; esta aparente relacin no es aceptable, puesto que no hay ninguna teora cientfica que la avale. La relacin entre el consumo y el ingreso es una relacin que proviene de una teora. Una vez que aceptamos tericamente la relacin entre dos variables, toca establecer cundo esa relacin es slida; para ello se cuenta con un estadstico denominado valor p.

mailxmail - Cursos para compartir lo que sabes

denominado valor p. El valor p Estima la significancia estadstica de una relacin al mostrarnos que las relaciones observadas pueden deberse al azar o a la existencia de una verdadera relacin entre las variables que estamos estudiando. El valor p nos cuantifica la probabilidad de que estemos cometiendo un error al interpretar una relacin; esta cuantificacin est directamente relacionada con el grado de confianza que deseamos de los resultados. Como se ver despus, por lo general decimos que aceptamos un error del 5% en el grado de relacin de las variables; el valor p ser el que determine si los resultados estn o no dentro de ese margen de error. El 5%, que escribimos 0.05 nos dice que de 100 casos corremos el riesgo de que tomemos por ciertos 5 casos que son errados; el concepto del valor p se asentar a medida que los vayamos usando. Todos estos datos son computados por el SPSS; pero podemos adelantar que mientras ms numerosa es la muestra en la que trabajamos ms explcita se har la relacin o neutralidad de las variables. En la anterior afirmacin tambin estamos adelantando algo que luego ser analizado con mayor detalle: los estudios estadsticos se basan, en la gran mayora de los casos en muestras tomadas de alguna poblacin. Tambin nos enteraremos, en el captulo relativo a la Muestra, que los elementos de una poblacin, de la que extraemos la muestra, estn distribuidos de diferentes maneras, pero que habr una que nos interesar. Esa distribucin se llama Distribucin Normal, y es la que se apega ms a la forma en que los sucesos se distribuyen en la realidad que deseamos analizar. Por otra parte, la Estadstica en general se divide en Estadstica Descriptiva e Inferencia Estadstica. La Estadstica Descriptiva usa grficas, tablas y diagramas para conocer las caractersticas ms importantes de los datos con los cuales debemos trabajar; es con el estudio de esta rama que empezamos este curso. Esta parte de la Estadstica nos ilustra sobre las medidas denominadas de

mailxmail - Cursos para compartir lo que sabes

Esta parte de la Estadstica nos ilustra sobre las medidas denominadas de tendencia central, tales como la media aritmtica, la mediana, la moda; muy pronto nos haremos expertos en estos y otros temas. Tambin se ocupa de mostrar las medidas de dispersin: la varianza, la desviacin tpica, las diferentes distribuciones de cada conjunto de datos. Seguiremos con lo concerniente al muestreo y, finalmente, terminaremos este primer curso test de hiptesis material para el que se reserva la Inferencia Estadstica. La metodologa La parte terica del curso se limitar a ofrecer los conceptos y exponer algunos ejemplos muy sencillos para mostrar lo que har la computadora por nosotros, cuando le pidamos resultados sobre el anlisis de datos. Por esa razn, este curso de Estadstica Aplicada I, incluir tambin la enseanza del uso del programa de estadstica SPSS, versin 19; en realidad, estaremos aprendiendo un par de materias al mismo tiempo. En virtud de que se trata de un curso de Estadstica Aplicada orientado a resolver los problemas prcticos que se presentan todos los das, no habr demostraciones matemticas; la operatividad la realiza el SPSS.

mailxmail - Cursos para compartir lo que sabes

2. La Recoleccin de datos
Datos, son la materia prima de las operaciones a la Estadstica. Informacin, pero los datos por s solos nada nos dicen; para que sean tiles al objetivo propuesto es preciso que los agrupemos y sistematicemos de la manera adecuada; es decir, que los convirtamos en informacin. Las fuentes de datos pueden provenir de registros que tienen otras instituciones; tambin de la recopilacin directa que realizamos; en este ltimo caso, uno de los medios ms conocidos es la encuesta. Los datos que recopilamos y sistematizamos, sobre la base de mtodos ya conocidos, nos permiten hacer suposiciones sobre las causas y los efectos de los fenmenos que observamos en la realidad. Por otra parte, nos sirven para establecer tendencias sobre los comportamientos de las personas, objetos y fenmenos, tendencias que son muy tiles, pues sus resultados nos orientan para obrar adecuadamente. Una investigacin sobre las preferencias por nuestros productos y la competencia que se debe enfrentar debe acudir a las tcnicas estadsticas para lograr ese conocimiento y aplicar las polticas necesarias. El concepto de Poblacin En la disciplina estadstica, la Poblacin es el total de los elementos potencialmente observables; v.g. el nmero de familias tienen un ingreso que les permite satisfacer sus necesidades bsicas. Con el objeto de lograr esos datos exactos, es posible que se formule el programa para realizar un censo nacional de todos los habitantes que hay en la nacin, en todos y cada una de las regiones que lo componen En la disciplina estadstica muy raras veces se usa la Poblacin, pues es muy difcil llegar a ella; adems, es cara; ms bien, se usa lo que se llama la Muestra. La Muestra Es una parte, proporcionalmente pequea de la Poblacin, la que, utilizando las tcnicas que aprenderemos en este curso, representa todas las caractersticas de

mailxmail - Cursos para compartir lo que sabes

la Poblacin. Hay varias maneras de lograr los datos que necesitamos en una muestra; nosotros usaremos la encuesta. La encuesta, es la recopilacin sistematizada de datos que luego transformaremos en informacin til. Una aclaracin: en vez de ensear primero el manejo del SPSS y luego empezar con los temas del curso, ms bien iremos aprendiendo ambos sobre la marcha; esto es, Aprenderemos haciendo. Elaboracin de la hoja de encuesta en SPSS Supongamos que el gerente de la empresa quiere averiguar nuestros conocimientos en la elaboracin de hojas de encuesta, utilizando mtodos computarizados, por medio de una prueba a la vista Supongamos que nos deja a libre arbitrio el nombre de las columnas, pero quiere estar seguro de que vamos a incluir diferentes clases de variables: desde variables nominales hasta variables de escala. Es en ese momento en que empezamos a explayarnos sobre la materia, para lo cual, acudiremos a nuestro irremplazable amigo el SPSS, el que nos acompaar a lo largo de ste y otros cursos. El gerente, al pedirnos que realicemos una tarea como sa, nos da una gran oportunidad para explicarle, paso a paso, lo que estaremos haciendo para cumplir el mandato Para ello, hacemos click en el nombre del programa, el que debe estar en la seccin archivos con el nombre de IBM SPSS Statistics, versin 19; al hacer el click respectivo, aparecern dos archivos. Escogeremos el segundo de ellos: IBM SPSS Statistics 19; luego de la espera correspondiente, cuya duracin depender de la potencia del equipo que se tiene, aparecer una hoja de dilogo. En esa hoja habr una pregunta en el lado izquierdo: Qu desea hacer? En el lado derecho aparecern cuatro opciones; en esta oportunidad, haremos click click en la tercera opcin: introducir los datos; una vez que hemos escogido la opcin, pulsamos Aceptar.

mailxmail - Cursos para compartir lo que sabes

opcin, pulsamos Aceptar. De inmediato se muestra ante nosotros una hoja con celdas constituidas por columnas y filas. Esa hoja se llama el Editor de Pantalla o Pantalla de Datos. En ella veremos que hay columnas y filas; en la parte superior de cada una de las columnas se lee la misma palabra: var, que es la abreviacin de variable. Es una invitacin para que pongamos los nombres de las variables que vamos a utilizar. Para ello, bajamos la vista y vemos que en la parte inferior de la hoja hay dos casillas: una, con la leyenda Vista de datos y la otra: Vista de Variables; tambin observamos que Vista de datos tiene un fondo a color. Eso quiere decir, que actualmente estamos en la seccin de Vista de Variables que es la que nos presentar los nombres de las variables y los registros correspondientes. Nuestra primera tarea ser poner nombres a las columnas y registrar los datos que nos interesen. Pulsemos Vista de Variables; la hoja que veamos cambiar a una nueva. Esta nueva hoja s tiene nombres en las columnas, las que usaremos de la siguiente manera. Nuestra primera variable se llamar sexo, porque define el gnero de las personas encuestadas. Ahora bien, vemos que la variable sexo no es una variable cuantitativa, sino, cualitativa, pero el SPSS la va a transformar para que nos sirva en nuestra tarea de hacer clculos. En consecuencia, en la primera casilla de la izquierda de Vista de Variables, anotamos la palabra sexo Inmediatamente, las dems casillas horizontales de la misma fila se llenan por defecto. Nosotros vamos a la segunda casilla, donde dice numrico, al pulsar esa casilla, aparece una pequea fila de puntos suspensivos; pulsamos esa pequea fila

mailxmail - Cursos para compartir lo que sabes

casilla, aparece una pequea fila de puntos suspensivos; pulsamos esa pequea fila y se nos presente un cuadro de dilogo. En ese cuadro hay opciones para los tipos de variables que vamos a necesitar; en este caso, nos es til, la opcin Numrico, que ya estaba registrada por defecto; pulsamos Numrico y aceptamos. La tercera columna de Vista de Variables dice Anchura, lo que nos indica cun ancho ha de ser el espacio que ocupar el nombre de la variable sexo; por defecto aparece 8 , pero nosotros queremos cambiar a 6. Pulsamos en 8 y se nos aparecen dos flechas: la de arriba para aumentar el ancho y la de abajo, para reducirlo; como la palabra sexo es ms bien corta, pulsamos la inferior hasta que aparezca 6. Hacemos exactamente lo mismo para los decimales; no los necesitamos, presionamos hasta 0. Seguimos en la misma fila y llegamos a la casilla Etiqueta. El nombre que pondremos a sexo en esta casilla ser ms formal, puesto que ser ese nombre (etiqueta) que se mostrar en el informe final; en la casilla debajo de Etiqueta escribimos Sexo (con mayscula) Una vez realizada estas operaciones nos encontramos con la casilla Valores; aqu es donde convertiremos esta variable sexo, que es cualitativa, en una cuantitativa, asignndole un valor numrico. Ahora nos corresponde convertir una variable categrica nominal en una variable cuantitativa.

10

mailxmail - Cursos para compartir lo que sabes

3. Elaboracin del Formulario de Encuesta


Vamos a identificar al sexo femenino con el nmero 0 y al masculino con el nmero 1. Para convertir la variable cualitativa sexo en una variable cuantitativa, pulsamos la casilla que registra la palabra Valores; aparecern tres puntos suspensivos en fila; hacemos click en ellos. Al hacerlo, veremos un cuadro de dilogo; en la casilla donde dice Valor inscribimos un 0. En la casilla donde dice Etiqueta, registramos la palabra mujer; y pulsamos Aadir. Aadir. Al hacerlo, veremos que en el cuadro inferior aparece 0 = mujer. Aceptamos; la casilla Valores est vaca Inscribimos en ella el nmero 1, y en la casilla Etiqueta registramos la palabra hombre. Pulsamos Aadir y en el cuadro aparecer 1 = Hombre. Aceptamos De ahora en adelante, el SPSS registrar con esos nmeros el sexo de las personas encuestadas. Pasamos a la pantalla Vista de datos, pulsando la casilla del mismo nombre, al pie de la hoja. All vemos que la primera columna ya tiene un nombre: sexo. Si queremos conocer el nombre que ir en el Informe Final, apuntamos con el cursor la casilla sexo. En unos segundos aparecer la palaba Sexo, que es el nombre formal de la casilla. Supongamos que el gerente general quiere constatar las caractersticas que tiene la variable sexo. Haremos click en la casilla Vista de variables, que est al final de la hoja y volvemos a la hoja anterior.

11

mailxmail - Cursos para compartir lo que sabes

El nombre de la variable es sexo; el tipo es numrico; la anchura es de 6 espacios, tiene 0 decimales Luego hacemos click en la siguiente casilla, lo que nos lleva al cuadro de dilogo que ya conocemos. En l, constatamos que el nmero 0 identifica a mujer y el 1 se reserva para hombre. hombre. Supongamos que hemos cometido un error y anotamos 3 para hombre. En el cuadro de dilogo aparecer lo siguiente: Valor 3; Etiqueta hombre y en el cuadro tendremos: 0 = mujer; 3 = hombre. Es preciso que modifiquemos la ltima entrada. Hacemos click en el dato 3 = hombre en el cuadro inferior; de inmediato se activar la casilla eliminar. El dato equivocado se elimina y procedemos a modificarlo de acuerdo con los valore que habamos asignado a cada gnero. Ahora nos toca registrar las particularidades de la variable Edad. Este procedimiento es mucho ms fcil, porque la Edad es una variable cuantitativa, no hay necesidad de hacer ninguna modificacin. Vamos a la hoja Vista de variables y hacemos click en la casilla que est debajo de sexo. All anotamos: edad, dejamos la palabra que ya est all Numrico, escogemos una anchura de 4 y en la siguiente casilla anotamos 0 para el nmero de decimales. En la casilla que corresponde a Etiqueta anotamos Edad en aos cumplidos y dejamos Ninguna en Valores puesto que la variable es cuantitativa. Ya tenemos registrada la segunda variable; vamos a Vista de datos; pulsamos unos segundos con el cursor en la casilla edad y el nombre formal, la Etiqueta, nos dice que la variable se llama Edad en aos cumplidos. La tercera variable que nos interesa, segn la encuesta virtual que estamos haciendo, ser Estado Civil.

12

mailxmail - Cursos para compartir lo que sabes

Consideramos que hay cinco categoras: Soltero, Casado, Divorciado, Viudo, Conviviente. Cada una de estas variables, al igual que sexo, es cualitativa, por lo que realizamos las mismas operaciones que hicimos para sexo. Vamos a Vista de variables y pulsamos en la casilla que est debajo de edad; all anotamos la siguiente palabra: estci, que significa Estado Civil; la razn por la que recurrimos a la abreviacin ser dada despus. Vamos a suponer los cinco estados civiles siguientes, en ese orden: soltero, casado, divorciado, viudo y conviviente La variable estci ser numrica con 6 espacios, 2 decimales y la Etiqueta: Estado Civil. Llegamos a Valores; pulsamos la casilla correspondiente donde dice Ninguna. Aparecern los tres puntos, para ser pulsados por el cursor y tener acceso al cuadro de dilogo. Tal como hicimos antes, en la casilla Valor escribimos 1, en la casilla Etiqueta, registramos soltero, pulsamos la casilla Aadir y aceptamos. Procedemos a llenar la casilla Valor con el nmero 2 y la casilla Etiqueta con la palabra casado Pulsamos Aadir y aceptamos; as, hasta que tengamos los cinco estados civiles que hemos establecido. Observemos que tanto la variable sexo como la de estado civil slo nos permite una opcin: hombre o mujer, en el primer caso y cualquiera de los cinco estados civiles, en el segundo. En la siguiente variable, idiomas que habla, tendremos ms de una opcin. Establezcamos los siguientes idiomas: Espaol, Ingls, Alemn y Francs. En virtud de que tenemos ms de una opcin, cada idioma tendr su columna por separado Empezamos con Espaol; esp, numrico, 8, 0, Espanol (sin la )

13

mailxmail - Cursos para compartir lo que sabes

Lo mismo para todos los dems idiomas. Ahora archivamos estos datos en el archivo que hemos escogido para el efecto Ahora vamos a realizar una pequea prueba para ver si el diseo de la hoja de encuesta es correcto. Para ello, hacemos haciendo click en Vista de datos y llenamos cinco filas con datos supuestos. Recordemos que cada fila es una hoja de encuesta que los encuestadores nos han entregado. Tomamos la primera hoja hipottica y llenamos la primera fila con los datos inventados. Una vez que llenamos los datos supuestos, archivamos todo en el archivo que hemos abierto. En este caso el nombre del archivo que hemos habilitado es: ESTADISTICA APLICADA EJERCICIO 1.sav Ahora bien, una vez que el gerente ha visto que podemos usar el SPSS, nos confa la tarea de analizar las caractersticas principales del personal de la empresa en la que trabajamos. Esas caractersticas incluyen estimar la media aritmtica de los sueldos, la mediana, la varianza, la desviacin estndar, los intervalos de confianza, la probabilidad de que el resultado sea cierto y otros. Todo eso lo har la computadora; pero nosotros tenemos que conocer los conceptos de lo que se nos pide y, claro, interpretar los resultados que el SPSS nos brindar al respecto.

14

mailxmail - Cursos para compartir lo que sabes

4. Medidad de Tendencia Central I


Una medida es de tendencia central se define como el punto medio de una distribucin; de inmediato vemos las ms importantes con unos breves ejemplos manuales para tener idea de lo que hace el SPSS. La Media Aritmtica Generalmente la conocemos como el promedio de una serie de datos. Supongamos que deseamos saber el promedio de la edad de 6 personas que estn en un consultorio mdico. Para sacar ese promedio, simplemente sumamos las edades de todos y cada y dividimos el resultado entre 6, que es el nmero de personas que nos interesa. Media aritmtica = (40 + 34 +28 + 10 + 23 + 50)/6 = 30.83 El resultado nos dice que la media aritmtica o promedio de las edades de las seis personas es 30.83 aos. Si queremos saber el ingreso promedio de cinco amigos que desean ir al cine, preguntamos a cada uno cuanto tiene y luego hacemos lo mismo que en el caso anterior: Media aritmtica = (4 + 20 + 12 + 9 + 13)/5 = 11,60 El resultado dir que, en promedio, cada uno tiene 11 dlares con 60 centavos. Ese es el concepto fundamental de la media aritmtica, no importa cun pequea o grande pueda ser el conjunto de datos que se nos presente, la media aritmtica siempre tendr la misma definicin: Ser la suma de todos los valores, dividida entre el nmero de casos. Usando el lenguaje matemtico, tendremos: X* = X i / n En esta igualdad, X* es la media aritmtica de la muestra que hemos tomado; Xi, son los valores que sern sumados; n es el nmero de observaciones. Tomaremos un ejemplo cualquiera

15

mailxmail - Cursos para compartir lo que sabes

X* = (9 +7 + 7 + 6+ 4+ 4 + 2)/7 = 5.6 En este ejemplo, hay dos valores repetidos (el 7) pero eso no importa, igual se lo toma en cuenta como cualquiera de los dems valores. En los libros de Estadstica se pone ejemplos sobre las formas de estimar la media aritmtica cuando los datos estn ordenados o estn desordenados; esto no tiene importancia para el SPSS. Despus aprenderemos a usar rangos, pero eso ser cuando ya sepamos desenvolvernos mejor. Ventajas y desventajas de la media aritmtica Su principal caracterstica es que un solo nmero representa a un conjunto de datos; por otra parte es un concepto con el que todos estamos familiarizados y cada conjunto de datos tiene una sola media. Tambin porque permite realizar comparaciones de medias de varios conjuntos de datos. Pero tambin tiene desventajas; v.g. puede haber valores extremos que no son representativos del conjunto de los datos que estamos tomando en cuenta. Derivemos la media aritmtica de los siguientes datos, los que representan los ingresos mensuales de 7 personas que trabajan en una empresa determinada. 2400, 3200, 2580, 3260, 2500, 2840, 19000 La media aritmtica ser: X* = (2400 + 3200 + 2580 + 3260 + 2500 + 2840 + 19000)/ = 5111 De inmediato nos damos cuenta de que la media est muy influida por el ingreso de 19000 En este caso, ser ms til calcular la media anulando el valor extremo. Para un conjunto grande de datos, la computadora La media aritmtica ponderada Tomemos el siguiente ejemplo (del libro Estadstica para Administradores Levin y. Rubin)

16

mailxmail - Cursos para compartir lo que sabes

Tipo de trabajo No calificado Semicalificado Calificado

Salario por hora Sillas 5 7 9 1 2 5

Mesas 4 3 3

Observemos que el costo por producto incluye diferentes grados de calificacin de la mano de obra. Ahora bien, si utilizramos la media aritmtica simple, tendramos que salario promedio sera: X* = (5 + 7 + 9)/3 = $7 Si aplicamos ese salario promedio para estimar el costo de los sillas, veramos que la produccin de este producto toma 5 hs. de trabajo no calificado; 2 hs. de semi calificado y 5 hs. de calificado En consecuencia, estimaramos el costo de producir una silla sera: 7(1 + 2 + 5) = $56 El costo de producir mesas sera: 7(4 + 3 + 3) = $70 Pero estos costos no sera los reales, puesto que el nmero de horas de cada categora de trabajo vara en la produccin de las sillas y mesas. El costo promedio correcto de la produccin de sillas es: (5 x 1) + (7 x 2) + ( 9 x 5) = $64 En razn de que se invirtieron 8 horas de trabajo, el costo promedio del trabajo por hora es: 64/8 = $8 por hora de trabajo. En el caso de las mesas: (5 x 4) + ( 7 x 3) + (9 x 3) = $68 Como se invirtieron 10 hs. de trabajo en la produccin de mesas, el promedio salarial sera: 68/10 = $6.8 por hora de trabajo. La media geomtrica Se usa, principalmente, para estimar los promedios de cantidades que

17

mailxmail - Cursos para compartir lo que sabes

Se usa, principalmente, para estimar los promedios de cantidades que cambian con el tiempo. Por ejemplo, tomemos una cuenta de ahorro que paga intereses. Si dejamos el dinero depositado por algunos aos, sin retirar, a una tasa anual determinada, el depsito inicial se ir acumulando, de tal manera que cada nuevo monto sumar los intereses y as sucesivamente. Supongamos que dejamos $ 1000 en una caja de ahorros a una tasa anual de 10%. Al final del primer ao se tendr un monto de $1100, es decir, los $1000 originales ms el 10% que es $100. Al final del segundo ao, tendremos una ganancia del 10% de $1100, ya no de 1000. Nuestra cuenta acumulada a fines del segundo ao ser 1100 x 0.10 = 110, los que sumados a los $1100 que ya tenamos, nos dar un total de 1210 y as sucesivamente. Pero hay todava otros estadsticos de tendencia central.

18

mailxmail - Cursos para compartir lo que sabes

5. Medidad de Tendencia Central II


La Mediana Es el valor que est ms al centro de un conjunto de datos ordenados de menor a mayor. Tomemos los siguientes datos ordenados de menor a mayor, los que representan los ingresos semanales de 11 personas tomados al azar como una muestra: 120, 140, 200, 240, 260, 380,450, 500, 630, 700, 750 De acuerdo con la definicin dada, la Mediana ser $380, pues ese monto est exactamente al medio del conjunto de datos de la muestra. Nos damos cuenta de ello, porque constatamos que hay cinco observaciones a la izquierda de la Mediana y cinco a la derecha; esa simetra se da porque el nmero total de observaciones es impar Si agregamos un dato ms a la muestra, tendremos: 120, 140, 200, 240, 260, 380, 390, 450, 630, 700, 750, 780 Vemos que el nmero de datos de la muestra es par (12) por lo que para calcular la Mediana tendremos que usar una frmula en la que n = nmero de datos. Mediana = (n + 1)/2 = (12 + 1)/2 = 13/2 = 6.5 El resultado, 6.5, nos indica que es preciso sacar la media de los datos sexto y sptimo de la serie. El sexto dato es 380; el sptimo es 450; la media aritmtica de ambos: (380 + 450)/2 = $415 El SPSS Calcular inmediatamente la Mediana de series de prcticamente cualquier tamao. Ventajas de la Mediana A diferencia de la media aritmtica, la mediana no est influida por los valores extremos.

19

mailxmail - Cursos para compartir lo que sabes

La Moda La moda el valor que ms se repite en el conjunto de datos; tomemos los datos utilizados en la mediana, pero lo transformemos de tal manera que el valor 260 se repite dos veces; en ese caso la Moda ser 260. 120, 140, 200, 240, 260, 260, 380, 390, 450, 630, 700, 750, 780 La Moda no es muy utilizada; pero puede aplicarse cuando vemos valores repetidos en la muestra. Cuando lleguemos al captulo de las distribuciones, haremos una comparacin entre la media aritmtica, la mediana y la moda, con relacin a la posicin central que ocupan en una grfica de distribucin. Mientras tanto, diremos que no hay reglas generales que nos permitan escoger alguna de ellas; en todo caso diremos que la media aritmtica es la medida de tendencia central ms usada. La Media Armnica Tambin se la conoce como H, de una cantidad de nmeros y es igual al recproco de la media aritmtica. La media armnica resulta poco influida por la existencia de determinados valores mucho ms grandes que el conjunto de los otros, pero es muy sensible a valores mucho ms pequeos. Tales son las medidas de tendencia central ms importantes. Medidas de dispersin Si las medidas de tendencia central nos sirven para identificar un valor que se acerque ms al centro de una serie de datos; las medidas de dispersin nos muestran el grado en que se alejan del centro. El Rango: Es la diferencia entre el valor ms alto y el ms pequeo de los datos. Acudamos otra vez a las serie de datos utilizados para calcular la Mediana: el rango 780 120 = 660 120, 140, 200, 240, 260, 260, 380, 390, 450, 630, 700, 750, 780

20

mailxmail - Cursos para compartir lo que sabes

Medidas de desviacin promedio Estas medidas nos sirven para calcular la desviacin promedio que hay entre los valores de una serie de datos y una medida de tendencia central. (Estos ejemplos son slo conceptuales, pues el SPSS las calcula) La Varianza: Concepto Es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica. La varianza de la muestra se representa por S2 Para aclarar el concepto, tomemos los siguientes datos: 2, 4, 6, 8, 10 La media aritmtica ser: (2 + 4 + 6 + 8 + 10)/5 = 30/5 = 6 Ahora bien, tomemos los datos originales vemos que el valor 2 se desva en 4 de la media aritmtica que (2 - 6 = - 4): el valor 4 se desva en - 2 unidades: (4 6 = - 2) el valor 6 no se desva de la media aritmtica Pero el valor 8 s se desva en 2 (8 6 = 2) que es una desviacin positiva Si deseramos sacar la media aritmtica de estas desviaciones nos encontraramos que su valor sera 0, pues los valores positivos anularan a los negativos. Para calcular la varianza y eliminar este problema no tomamos en cuenta la desviacin simple de cada observacin con la media aritmtica, sino que recurrimos a elevar cada desviacin al cuadrado. Los hacemos as, porque una cantidad elevada el cuadrado, ya sea positiva o negativa, siempre nos dar un resultado positivo, que es lo que se busca. La suma de los cuadrados de esas diferencias ser dividida por el nmero de observaciones (5) menos 1, lo que nos dar la varianza = S2 S2 = [(2 6)2 + (4 6)2 (6 6)2 + (8 6)2 + (10 6)2]]/(5 1) S2 = [(-4)2 + (-2)2 + (0)2 + (2)2 + (4)2]4 = [(16 + 4 + 4 + 16)]/4 = 40/4= 10 En consecuencia diremos que la varianza de la Muestra es 10

21

mailxmail - Cursos para compartir lo que sabes

La Desviacin Tpica de la Muestra = s Es la raz cuadrada de la Varianza: s = raz cuadrada de S2 En este caso, s = raz cuadrada de 10 = 3.16 Como al principio tuvimos que elevar las diferencias al cuadrado para obtener el estadstico denominado La Varianza, ahora hacemos la operacin inversa y sacamos la raz cuadrada de S2. Las medidas de tendencia central y de dispersin son los estadsticos bsicos de la Estadstica. Por supuesto, son tambin los ms usados en todos los niveles. Este ejercicio, fcil, se vuelve complicado cuando la muestra tiene, digamos, 20000 observaciones. Calcular una muestra para esos valores es una de las tareas ms simples que realiza el SPSS

22

mailxmail - Cursos para compartir lo que sabes

6. El Uso del SPSS


Una vez definidas conceptualmente las medidas de tendencia central y las medidas de dispersin, vamos al SPSS para aprender cmo las obtenemos. Supongamos que deseamos saber las medidas de tendencia central y de dispersin de los sueldos actuales que reciben los empleados de la empresa donde trabajamos. Abrimos el SPSS, pulsamos la tecla registrar datos del cuadro de dilogo; una vez que tenemos el editor de datos, pulsamos archivo, para abrir Employee dadt.sav del archivo que viene con el SPSS 19. Una vez que tenemos en la pantalla los datos de Empoyee data.sav, colocamos el cursor en cada uno de los ttulos de las columnas para saber cules datos muestran los salarios actuales de los empleados Cuando apuntamos el cursor en la columna salary vemos que el nombre formal es Current Salary. Es de esa columna que deseamos pedirle al SPSS que calcule las medidas deseadas. Pero, de entrada tenemos un problema; los salarios estn registrados con el signo $ = dlar; para calcular sin problemas los indicadores que deseamos, vamos a cambiar los datos al tipo Numrico. Para eso, vamos a Vista de Variables; encontramos la variable salary y vemos que est con tipo dlar. Hacemos click en la casilla que dice Dlar en la columna Tipo, ingresamos al cuadro de dilogo y all vemos que, efectivamente, la variable salary est medida en Dlar; pulsamos Numrico y aceptamos. Volvemos a Vista de datos y vemos que el signo Dlar ($) ha desaparecido; ahora podemos instruirle al SPSS que nos calcule los indicadores que deseamos sobre la variable salary. En el men superior pulsamos en Analizar, se nos presentar un cuadro de opciones; pulsamos Estadsticos Descriptivos; a la derecha aparecer otro cuadro, del cual escogemos Descriptivos

23

mailxmail - Cursos para compartir lo que sabes

del cual escogemos Descriptivos Se nos presentar un cuadro con todas las variables de Employee data.sa y un cuadro en blanco a la derecha; pulsamos en Current salary, inmediatamente pulsamos la flecha que apunta a ese cuadro. La variable Current salary ya est en el cuadro blanco; pulsamos options y en el cuadro que aparece, escogemos: Rango, Salario Mnimo, Salario Mximo, Media Aritmtica, Desviacin Tpica y Varianza Volvemos al anterior cuadro de dilogo y pulsamos aceptar; se nos presentar el Editor con los datos. Para ver los resultados, vamos al men superior del Editor y pulsamos Ventana. Aparecern dos lneas: escogemos la primera que dice Resultados; as nos trasladamos hasta la hoja de resultados en la que vemos una pequea tabla, la que se muestra a continuacin.

Estadsticos descriptivos N N vlido (segn lista) Rango Mnimo Mximo Media Desv. tp. Varianza Current Salary 4 7 4 119250 15750 135000 34419,57 17075,661 2,916E8 474

N significa el nmero de observaciones, en este caso nos dice que en la empresa hay 474 empleados y que el SPSS los ha tomado a todos; el Rango, es decir, la diferencia entre el salario mayor y el menor, es $473 El Salario Mnimo es $15740 al ao; el mximo es $135000; la Media aritmtica o el promedio de los salarios es $34419.57; la desviacin tpica es 17075.661 y la Varianza tiene un valor de 29160000. Supongamos ahora que deseamos saber los mismos estadsticos pero para los salarios que los empleados ganaban al momento de ser contratados por la empresa. Para volver al cuadro de datos, pulsamos Ventana en el men superior y escogemos la opcin adecuada. Pero ahora nos encontramos que en el cuadro derecho an est la variable

24

mailxmail - Cursos para compartir lo que sabes

Pero ahora nos encontramos que en el cuadro derecho an est la variable salary Hacemos click en la variable salary, pulsamos la flecha, la que ahora indica la direccin opuesta, y la variable salary vuelve a formar parte de las variables consignadas en el cuadro izquierdo. Pulsamos la columna donde se registra salbegin que tiene el nombre formal de Beginning Salary y repetimos el proceso anterior; la tabla de resultados es:

Estadsticos descriptivos N Beginning Salary N vlido (segn lista) Rango Mnimo Mximo Media 79980 Desv. tp. Varianza

4 7 4 70980 9 0 0 0 474

17016,09 7870,638 61946944,959

Una comparacin de los promedios salariales entre ambas dimensiones, los salarios actuales y los que se reciban al comienzo nos muestra una gran diferencia: 34419 para los primeros y 17016 para los otros. A medida que avancemos con el programa podremos establecer si la diferencia de dos promedios es o no significativa; lo que es muy til en una investigacin de tipo estadstico. Borrar informacin de la Pantalla de Resultados Cada vez que deseamos tener una nueva pantalla de resultados, borramos las que se encuentran en ella; lo hacemos de dos maneras: llevando el cursor a la izquierda y pulsando el botn de Resultado. Con esa instruccin, el SPSS borrar todos los elementos que constan en la pantalla. Si deseamos borrar slo uno o algunos elementos de la pantalla, vamos tambin a la izquierda y pulsamos cada uno de los elementos que deseamos borrar. Sin embargo, la manera ms prctica es hacer click en los elementos que ya no necesitamos y apretar la tecla suprimir en el teclado de nuestra computadora. El Coeficiente de Variacin

25

mailxmail - Cursos para compartir lo que sabes

Es la relacin entre la desviacin tpica y la media de la muestra: s/X* Tomemos la desviacin tpica de la tabla de Begining salary que es 7870 y la media, 17016 El coeficiente de variacin ser 7870/17016 = 0,462 Si deseamos expresar este coeficiente en porcentaje, lo multiplicamos por 100 = 46.62 % Por lo general, se usa este coeficiente para comparar la variabilidad que tienen diferentes unidades de medida; supongamos que se desea comparar el grado de variabilidad de dos poblaciones La primera poblacin tiene datos referidos al ingreso y la segunda a los aos de educacin; en este caso, se usar el Coeficiente de Variacin de cada una sobre los datos de sus medias y desviaciones tpicas. La diferencia entre ambos coeficientes nos podr dar alguna informacin relevante.

26

mailxmail - Cursos para compartir lo que sabes

7. Distribucin de Frecuencias
Una distribucin de frecuencias es una tabla en la que organizamos los datos dividindolos en Clases o grupos que describen alguna caracterstica de los datos. Si no dividimos los datos en grupos o clases, entonces, cuando pidamos, v.g, las frecuencias de los salarios, el SPSS nos dar un cuadro con el salario de cada uno de los empleados. Si la fbrica tiene 2000 empleados, tendremos un cuadro de 2000 salarios; pero, cuando necesitamos las medidas de tendencia central o cualquier otra, el SPSS acudir a los datos originales, no a los grupos. A no ser que, por alguna razn, necesitemos la media u otro estadstico de los grupos. Una distribucin de frecuencias muestra el nmero de observaciones del conjunto de datos que caen en cada una de las clases en las que hemos dividido los datos originales. Para hacerlo, utilizaremos el SPSS y el archivo Employee.sav. Vamos a construir el cuadro de frecuencias del salario actual de los empleados de la empresa Lo que debemos hacer es tomar una variable y sobre ella crear otra variable que nos permita clasificar los datos en clases, de este modo podremos iniciar la tarea de disear un cuadro de frecuencias. Men Principal Transformar; en el cuadro que aparece escogemos Recodificar en distintas variables. Cuando se abre el cuadro de dilogo vemos dos pantallas. La pantalla de la izquierda contiene todas las variables; escogemos Current Salaly y la trasladamos a la pantalla de la derecha, haciendo click en la flecha de direccin. Una vez en la casilla, vemos que la variable Current Salalry ha cambiado a salary, que es el nombre que aparece al comienzo de la columna respectiva, mientras que Current Salary, es la etiqueta formal.

27

mailxmail - Cursos para compartir lo que sabes

En el cuadro aparece un signo de interrogacin despus de salary, eso significa que el SPSS nos pide dar un nuevo nombre a la variable que vamos a recodificar. En la parte derecha hay dos casillas: una que dice nombre y la otra etiqueta; entramos a nombre y registramos el nombre que deseamos ponerle a la nueva variable: rsalary (Podra ser cualquier otro) En la casilla Etiqueta ponemos el nombre formal Salario Actual. Pulsamos la casilla Cambiar y la nueva variable aparece en la pantalla donde est la variable salary. La nueva variable rsalary ocupa el lugar donde estaba el signo de interrogacin. Con esa operacin hemos estructurado una nueva variable, rsalary, sobre la base de la variable salary, desde este momento, el SPSS tratar a la nueva variable como independiente. En la parte inferior hay una casilla que dice Valores antiguos y nuevos; la pulsamos y se nos presenta un cuadro de dilogo; ste cuadro es el que nos ayudar a dividir nuestros datos en clases. Vamos a dividir los datos en cuatro clases; para ello pulsamos el botn que dice: rango, en la parte izquierda del cuadro; al hacerlo, se habilitarn dos casillas en blanco. En la primera registramos 15000 (el valor mnimo de los salarios) en la casilla que est debajo, escribimos 35000; luego vamos a la parte superior derecha para pulsar el botn de valor y en la casilla anotamos 1. Click en Aadir y en la casilla inferior aparece 15000 trhu 45000 1. Esto quiere decir que la primera de nuestras clases incluirn todos los valores desde 15000 hasta 25000. Otra vez vamos a la izquierda click rango y anotamos 45001 en la casilla de abajo. Vamos a la casilla inferior, donde dice hasta y anotamos 75000. Nos trasladamos al lado derecho Valor, anotamos 2 en la casilla

28

mailxmail - Cursos para compartir lo que sabes

respectiva click en Aadir. En la pantalla inferior aparecer un nuevo registro despus del anterior. Esta vez con la leyenda que dice: 45001 thru 75000 2. Repetimos la operacin para la tercera clase: anotamos 75001 en la casilla rango y 105000 en la que dice thru; vamos al lado derecho, pulsamos el botn valor y anotamos 3 en la casilla; luego pulsamos Aadir. La tercera clase aparece en la parte de abajo con la leyenda: 105001 thru 135000 anotamos 4 OK. Manchamos current salary de la pantalla, pulsamos la flecha direccional y la devolvemos a la izquierda. En la ltima columna de la pantalla de datos aparecern los intervalos codificados 1, 2, 3 y 4, de acuerdo con los valores de cada rango salarial. Pero, lo que deseamos es que en la Pantalla de Datos aparezcan los intervalos, tales como 15000 45000 para todos los rangos que hemos recodificado. Para ello vamos a la seccin Vista de Datos, al final de la misma est la variable creada rsalary; hacemos click en la columna Cambios e iniciamo el proceso de recodificacin, tal como lo hicimos en Transform En la columna Valores correspondiente a la variable creada rsalary, aparece el rtulo Ninguna Hacemos click en los puntos y se nos presente un cuadro de dilogo. En la casilla Valor anotamos 1 y en la que dice Etiqueta registramos 15000 45000, pulsamos Aadir y esta primera clase aparece registrada en la pantalla; hacemos lo mismo con 45001 75000. Seguimos dando los mismos intervalos anteriores; estamos recodificando la nueva variable rsalary, cuyo nombre formal Salario Actual incluimos en la casilla correspondiente a la columna Etiqueta. Continuamos del mismo modo, variando las clases de 75001 en 105000 hasta llegar a la ltima, la clase nmero que ser 105001 135000; aceptamos y en la pantalla de datos tendremos los intervalos creados. Hay dos cosas que es necesario tener en cuenta; primero, luego de que la

29

mailxmail - Cursos para compartir lo que sabes

Hay dos cosas que es necesario tener en cuenta; primero, luego de que la primera clase 15000 25000 ha sido registrada, la siguiente empieza con 25001, para no repetir el valor de 25000; lo mismo con las dems. Frecuencias Lo primero que deseamos saber es cuntas observaciones se incluyen en cada intervalo. En la pantalla de Vista de datos, vamos al men superior y pulsamos Analizar Analizar; se abrir el cuadro de opciones; de all escogemos Estadsticos Descriptivos Frecuencias.

Se abre el cuadro en el que la lista de variables est a la izquierda; si a la derecha todava figura la variable que habamos transformado, current salary, la manchamos con el mouse y la trasladamos a la izquierda. Hacemos click en la variable Salario actual y con la flecha de direccin la llevamos a la derecha. Aceptamos; en la pantalla de Resultados aparece el cuadro de frecuencias con las clases respectivas. Este es el cuadro que nos servir para disear nuestra primera distribucin de frecuencias. Eso es lo que haremos en el prximo captulo.

30

mailxmail - Cursos para compartir lo que sabes

8. Estructurar una Distribucin de Frecuencias


El cuadro que aparece en la pantalla de resultados nos muestra el nmero total de casos, 474, y el nmero de observaciones clasificados por los grupos salariales que habamos estructurado. La clasificacin de los salarios en clases, con los rangos determinados, nos permite no slo saber cuntas personas hay en cada clase, sino que podemos graficar con mayor claridad los datos que usemos. Hacemos click en el cuadro, pulsamos el botn derecho del mouse y escogemos copy, y posteamos en la presente pgina de manera tal que podamos realizar las modificaciones necesarias.

Salario Actual Frecuencia Porcentaje 15000 45000 45001 75000 Vlidos 7 5 0 0 1 105000 105001 135000 Total 391 66 15 2 474 82,5 13,9 3,2 ,4 100,0 Porcentaje vlido 82,5 13,9 3,2 ,4 100,0 Porcentaje acumulado 82,5 96,4 99,6 100,0

Para formular nuestro cuadro de distribucin de frecuencias, reemplazamos el ttulo Porcentaje vlido por Probabilidad y anulamos la ltima columna haciendo click con el botn derecho del mouse Delete Cells En las opciones que aparecen hacemos click en Delete Entire Colum; ponemos el ttulo Distribucin de Frecuencias de los salarios; el cuadro queda estructurado de la siguiente manera Distribucin de Frecuencias de los Salarios

Frecuencia Porcentaje Probabilidad 15000 - 45000 391 82,5 31 0,825

mailxmail - Cursos para compartir lo que sabes

45001 - 75000

66

13,9 3,2 ,4 100,0

0,139 0,032 0,004 100,0

Vlidos 75001 - 105000 1 5 105001 - 135000 2 Total 474

El cuadro de probabilidad resulta de la divisin entre 100 de todos y cada uno de los datos que aparecen como porcentaje en la tabla anterior. Los datos de la nueva tabla se interpretan de la siguiente manera En la empresa hay 391 empleados que ganan un salario comprendido entre 15000 45000; lo que representa una porcentaje del 82.5% La probabilidad de que escojamos a uno de ellos, de entre todos los empleados, es 0,825 En la empresa hay 66empleados que perciben un salario comprendido entre 45001 75000 y constituyen el 13,9% del total; la probabilidad de que escojamos a uno de ellos es 0,139; y as con los dems registros. El total de las probabilidades suma 1, tal como se ve en la tabla; cada probabilidad se obtiene dividiendo el porcentaje respectivo entre 100; para los decimales se usa la coma. Grficas de las distribuciones de frecuencias. A continuacin mostraremos las principales grficas que representan a los datos inscritos en una tabla de frecuencia; las grficas son muy necesarias para darnos una imagen ms rpida de la informacin. El Histograma Es una de las grficas ms conocidas; consiste en una serie de rectngulos cuya anchura la distancia que existen entre las dos cantidades que estructuran una clase. Para obtener el Histograma respectivo, vamos al M e n P r i n c i p a l G r f i c a s Cuadros de dilogos antiguos Histograma Antes de cerrar vemos en la parte superior derecha la casilla Ttulos: hacemos click y en la primera lnea escribimos Salarios Actuales; en la segunda, Niiveles Salariales Estratificados.

32

mailxmail - Cursos para compartir lo que sabes

La clase 1 (15000 45000) est representada por la base de un rectngulo. La altura de cada rectngulo seala el nmero de frecuencias que se encuentran entre ese intervalo A la derecha del histograma se muestra la media, la desviacin tpica y el nmero total de empleados. El histograma, como veremos, es til para el tcnico, pero no es muy claro para los ejecutivos. El Histograma es una grfica muy til, especialmente cuando queremos comprobar si la distribucin de una variable se aproxima a la distribucin normal, tal como veremos en otro captulo. As, las clases simplemente estn representadas por nmeros, los que no dice mucho cuando deseamos presentar un informe a los ejecutivos de la empresa. Para presentar un informe ms claro a los ejecutivos, recurrimos a la grfica de barras. El SPSS nos presenta varias opciones de grficas, las que iremos usando y aprendiendo a disearlas a medida que vamos avanzando en el curso y tocamos nuevo temas que exigen otros usos del SPSS. En el prximo captulo usaremos las grficas de barras.

33

mailxmail - Cursos para compartir lo que sabes

34

mailxmail - Cursos para compartir lo que sabes

9. Grficas
Para obtener las barras de frecuencias, pulsamos Grficas en el Men Principal; elegimos Cuadros de dilogos antiguos Barras Simple Definir No. De Casos Introducimos Salario Actual en la casilla que dice Definir sectores por; en la parte superior derecha hacemos click en Ttulos; all escribimos: Salarios Actuales en la Primera Lnea y Salarios Actuales Estratificados.

Copiamos la grfica y vemos que nos ha dado los intervalos y las frecuencias de cada uno anotando el intervalo en cada caso; no slo como categoras 1, 2, . Si se quiere cambiar las caractersticas del grfico, por ejemplo, el color, la textura, la letra. Hacemos doble click en la grfica de barras; aparecer un nuevo men; escogemos editar y all elegimos la opcin que nos parezca ms adecuada. Otra grfica muy til es la de Sectores (Pie)

35

mailxmail - Cursos para compartir lo que sabes

Grficas Cuadros de dilogos antiguos Sectores Ttulos; la grfica que aparece en el cuadro de resultados muestra los datos que le habamos pedido; la traemos a la presente pgina a travs de Copy. Podemos cambiar todo lo que nos parezca, haciendo doble clik en la torta del cuadro de resultados. Observemos cmo vamos aprendiendo Estadstica y, al mismo tiempo, el uso del SPSS; me pareci ms conveniente este mtodo de aprender sobre la marcha en vez de dar un curso completo de una sola vez. Cuando terminemos el curso de Estadstico, en todos sus niveles, ste es el primero de ellos, habremos concluido tambin con el aprendizaje del SPSS en todo lo que se refiere al campo concreto de la Estadstica. Podemos lograr un resultado ms completo a travs del Men Grficas Generador de Grficas

36

mailxmail - Cursos para compartir lo que sabes

Se nos presenta una pantalla blanca, bajo de la cual hay varias opciones de grficas. Escogemos la de barras, se nos presentar una advertencia, aceptamos y se nos presenta un cuadro con una pantalla blanca arriba y varios modelos de grficas, abajo. Pero, en vez de hacer click en la grfica de barras, ms bien la arrastramos hasta la pantalla blanca. Del mismo modo, de la casilla de archivos a la derecha, hacemos click en la variable Salarios Actuales y la arrastramos hasta el eje de las abscisas de la grfica de barras. Dejamos disponible el eje de la ys para que consigne las frecuencias (Recuento) de los intervalos. En la casilla de ttulos ponemos los mismos de la anterior barra. Tambin hacemos clic propiedades del elemento para especificar lo que deseamos; luego hacemos clic Opciones y all, escogemos en Nota al pie del espacio inferior, la que aparece como el error aceptado. En ese cuadro vemos la presencia de unas figuritas extraas, cuyo significado

37

mailxmail - Cursos para compartir lo que sabes

aprenderemos luego.

38

mailxmail - Cursos para compartir lo que sabes

10. Probabilidad
Introduccin Los principales precursores del clculo de probabilidades fueron Jacob Bernoulli (1674-1705) Abraham de Moivre (1667-1754) Thoma Bayes (1702-1761) y Joseph Lagrange (1736-1813) La teora de la probabilidad es la base es la base de las investigaciones estadsticas en las investigaciones de las ciencias sociales y en la toma de decisiones. En realidad, las llamadas leyes en las ciencias sociales no son sino tendencias estadsticas en el tiempo, las que pueden ser estimados con un grado de probabilidad. Conceptos bsicos Probabilidad es la posibilidad cuantificada de que algo suceda Evento: Uno ms de los posibles resultados de hacer algo Si lanzamos una moneda al aire, saldr cruz o cara, cada resultado es considerado un evento. Experimento, la actividad que produce un evento; en este caso, el lanzar la moneda. Cul ser la probabilidad de que una moneda, al ser lanzada, caiga y nos muestre cara? ser o 05. Espacio muestral: al lanzar la moneda el espacio muestral es: {cara, cruz} Si dos eventos pueden ocurrir al mismo tiempo, entonces decimos que los eventos no son mutuamente excluyentes; si dos eventos no pueden ocurrir simultneamente sern mutuamente excluyentes. La probabilidad de sacar una carta de un paquete de 52 cartas, ser 1/52 La de sacar una reina ser 4/52, pues existen cuatro reinas en el mazo. La de sacar un trbol ser 13/52, pues hay 13 trboles en un mazo. La probabilidad de sacar una carta roja es 26/52, dado que hay 26 cartas

39

mailxmail - Cursos para compartir lo que sabes

rojas. La probabilidad de sacar un as al lanzar un dado es 1/6, porque hay seis nmeros y un solo as. Del mismo modo con los otros nmeros. Probabilidad Clsica La probabilidad de que un evento ocurra es definida del siguiente modo: E = F/(T) E = Evento; F nmero de casos favorables; T, el total de casos En los ejemplos de las cartas, el nmero favorable de sacar una reina era 4 y el total de casos, 52 En el ejemplo de los dados, el nmero favorable de sacar un as es 1 y el total de casos es 6. La probabilidad clsica nos dice que los resultados posibles deben ser iguales entre s. La probabilidad clsica es conocida tambin como probabilidad a priori, porque los resultados puede ser conocidos de antemano, tal como sucede con los experimentos de las cartas o los dados. Frecuencia relativa de la presentacin Es el porcentaje del resultado de casos favorables de un experimento con relacin al total de casos. Probabilidades subjetivas Se basan en las creencias de las personas que disean el experimento; sera la probabilidad asignada a un evento por parte de un individuo. La probabilidad subjetiva es til cuando no hay antecedentes para establecer una probabilidad objetiva Cul es la probabilidad de que un reactor atmico a ser instalado en cierto lugar irradie radiactividad? Dado que no existe un antecedente, entonces se recurrir a las suposiciones y

40

mailxmail - Cursos para compartir lo que sabes

al sentido comn. Los responsables de tomar decisiones en una empresa usan la subjetividad para los casos nicos que se presentan a diario en asuntos de mercado, precios, insumos y otros similares. Reglas de la Probabilidad Los siguientes smbolos son los que mayormente se utilizan en el clculo de probabilidades: P(A) = Es la probabilidad de que el evento A suceda. Si puede llevarse a cabo slo un evento, la probabilidad ser sencilla; esta clase de probabilidad tambin es conocida como probabilidad marginal o incondicional. Si hay un sorteo para ganar un premio y el total de casos es 60, la probabilidad de que alguien saque el nmero premiado es 1/60 = 0,0167; en este caso, slo un participante puede ganar. Eventos mutuamente excluyentes Hay casos en los que pueden realizarse dos eventos: uno o el otro Supongamos que hay 5 candidatos a un cargo pblico y que todos tienen los mismos mritos. Si utilizamos el concepto marginal de probabilidad, diremos que la probabilidad de que uno de ellos sea elegido ser 1/5; pero, si estamos interesados en saber la probabilidad de dos candidatos, la cosa cambia. Supongamos que tenemos un inters especial en saber las probabilidades de que Juan Monasterios o Mara Zeballos ganen el concurso de mritos; en este caso tenemos dos eventos que se suman entre s. Diremos que la probabilidad de Juan es de 1/5 y la de Mara tambin es 1/5; entonces de probabilidad de que alguno de los dos sea elegido ser 1/5 + 1/5 = 2/5 = 0,40 En el primer caso, el de que uno de los cinco gane, la probabilidad ser P(A) = 1/5 = 0,20 En el segundo caso, la probabilidad se representar del siguiente modo: P(A o

41

mailxmail - Cursos para compartir lo que sabes

En el segundo caso, la probabilidad se representar del siguiente modo: P(A o B) que suceda uno de los dos Para mostrar grficamente lo que la suma de probabilidades significa, los tericos recurren a los smbolos de los conjuntos en matemticas; esos smbolos son muy tiles en la tarea de comprender los teoremas. Tomemos la siguiente tabla, del libro de Levin y Rubin, en la que se consigna datos sobre el nmero de hijos

Nmero de hijos 5 6 o ms Proporcin de familias

Que tienen esa cantidad 0.15 0.10 0.05 De hijos

0.05

0.10

0.30

0.25

En el cuadro anterior tenemos una muestra para establecer las probabilidades de que una familia tenga un nmero determinado de hijos; v. g: la probabilidad de que una familia no tenga hijos es 0.05. La probabilidad de que una familia tenga 4 hijos es 0.15 y as sucesivamente. Ahora deseamos saber la probabilidad de que una familia del pueblo donde se hizo la encuesta tenga 4 o ms hijos; de inmediato nos damos cuenta de que ya no estamos hablando de un solo evento sino de varios.

42

mailxmail - Cursos para compartir lo que sabes

11. Probabilidad en varios eventos


La condiciones del anterior captulo se representan de la siguiente manera: P(4,5,6 o ms) = P(4) + P(5) + P(6 o ms) = 0.5 + 0.10 + 0.05 = 0.30 Ahora ingresamos a una situacin que puede darse en muchas oportunidades. Supongamos que deseamos obtener un diez o un trbol de un mazo de 52 cartas; en este caso, debemos tener en cuenta que tambin podemos sacar un diez de trbol. Nos damos cuenta que sacar un diez o trbol no son eventos mutuamente excluyentes, debido a que hay la probabilidad conjunta de un diez y un trbol al mismo tiempo. Debemos ajustar la ecuacin para evitar el conteo doble, es decir, hay que reducir la probabilidad de obtener ambos eventos juntos cuando deseamos saber la probabilidad de un as o un corazn. De este modo tendremos: P(diez) + P(trbol) P(diez y trbol) 4/52 + 13/52 1/52 = 16/52 = 4/13 Otro ejemplo; los empleados de la empresa han elegido a 5 de ellos para que los representen en el consejo de administracin; los perfiles de los elegidos son: Hombre, edad 30 Hombre Mujer Mujer Hombre 32 45 20 40

Una vez elegidos, los cinco deciden, a su vez, elegir un portavoz Cul ser la probabilidad de que la persona elegida sea mujer o tenga una edad por encima de 35 aos?

43

mailxmail - Cursos para compartir lo que sabes

P(mujer o mayor a 35) = P(mujer) + P(mayor a 35) P(mujer y mayor a 35) = 2/5 + 2/5 1/5 = 3/5 = 0.60 Probabilidad bajo condiciones de independencia estadstica En primer lugar, definiremos el concepto de Independencia Dos eventos sern estadsticamente independientes entre s cuando el evento o resultado de uno de ellos no tiene influencia en el resultado o evento del otro. Existen tres tipos de probabilidad independiente: Marginal, Conjunta, Condicional Probabilidades marginales en condiciones de independencia Vimos que una probabilidad es marginal o incondicional cuando es la representacin simple de un evento; v.g el lanzamiento de una moneda normal tendr un evento: cara o cruz, con una probabilidad de 0,5 c/u. No importa cuntas veces lancemos la moneda, la probabilidad de que salga cara o cruz ser la misma; cada lanzamiento es nico y no tiene influencia sobre el prximo lanzamiento. Probabilidades conjuntas bajo condiciones de independencia estadstica La probabilidad de dos o ms eventos independientes que se presentan juntos es el producto de sus probabilidades marginales. Usando la simbologa aprendida, representamos ese caso de la siguiente manera: P(AB) = P(A) x P(B) P(AB) = probabilidad de que ambos eventos se presenten juntos o probabilidad conjunta de A y B P(A) = probabilidad marginal de que se presente el evento A

P(B) = probabilidad marginal de que se presente el evento B Ejemplos Cul es la probabilidad cruz, cara y cruz, en ese orden, en tres lanzamientos consecutivos de una moneda? El resultado ser: 0.5 x 0.5 x 0.5 = 0.125.

44

mailxmail - Cursos para compartir lo que sabes

Cul es la probabilidad de obtener cruz, cruz y cara, en ese orden luego de tres lanzamientos consecutivos? 0.5 x o.5 x 0.5 = 0.125 Cul es la cara de obtener al menos dos caras en 3 lanzamientos consecutivos? Estamos ante el caso mixto de probabilidad de eventos mutuamente excluyentes, las que son aditivas (la probabilidad de obtener una cara ms la probabilidad de obtener otra cara) y un evento independiente. Para visualizar mejor este proceso, tomemos la tabla 4.2 del texto de Levin y Rubin, en la que se descomponen todas las probabilidades posibles de los eventos que conforman el total del experimento Denominaremos cara = H; cruz = T

Un lanzamiento H1 0,5 T1 0,5

Dos lanzamientos H1,H2 0.25 H1,T2 0.25 T1,H2 0.25 T1.Y2 0.25

Tres lanzamiento H1, H2, H3 0.125 H1, H2, T3 0.125 H1, T2, H3 T1, H3, H3 0.125 0.125 H1, T2, T3 0.125 T1, H2, T3 0.125 T1, T2, H3 0.125 T1, T2, T3 0.125 1000

R. Posibles Probalilidad R. Posibles Probabilidad R. Posibles Probabilidad

En la parte superior del cuadro se registra los tres lanzamientos de la moneda. H1 significa cara y T1 es igual a Cruz En el primer lanzamiento los posibles resultados son o una cara (H1) o una cruz (T1) y la probabilidad para cada uno de estos resultados, tal como vimos es 0.5. Tomemos en cuenta que 1 y 2 representan el primer y el segundo lanzamiento, en todos los casos Cuando lanzamos la moneda por segunda vez, nos trasladamos a la columna

45

mailxmail - Cursos para compartir lo que sabes

Dos lanzamientos. Los resultados posibles son: el primer lanzamiento fue cara (H1) y el segundo tambin (H2) Vemos que los eventos del segundo lanzamiento estn ligados a los eventos que resultaron en el primero. El segundo evento posible en la columna del segundo lanzamiento es H1, T2, esto asume que en el primer lanzamiento sali una cara (H1) y en el segundo lanzamiento sali una cruz (T). El tercer evento muestra que en el primer lanzamiento se obtuvo una cruz (T1) y en el segundo, cara (H2) El cuarto evento muestra que en el primer lanzamiento sali cruz (T1) y en el segundo, cara (H2) Las probabilidades en cada caso son 0.25, que resultan de cara = probabilidad de 0.5 cruz = probabilidad de 0.5 La probabilidad, digamos del primer evento del segundo lanzamiento H1,H2 es 0.5 x 0.5 = 0.25 Lo mismo con las dems probabilidades En la columna del tercer lanzamiento se anotan, como en las dos anteriores, los respectivos eventos; v.g en el primer lanzamiento se obtuvo una cara (H1) en el segundo tambin (H2) y en el tercero, una cruz (T3). La probabilidad de este evento ser 0.5 x 0.5 x 0.5 = 0,125 El mismo razonamiento para los siguientes eventos, hasta que agotamos todas las probabilidades posibles de los tres lanzamientos de la moneda. Ahora ya podemos responder a la pregunta que nos hicimos al iniciar este captulo: Cul es la probabilidad de obtener cruz, cruz y cara, en ese orden luego de tres lanzamientos consecutivos? La pregunta ya nos hace saber que se trata de un experimento de tres lanzamientos; en nuestra tabla vemos que los eventos que la pregunta exige son: T1, T2, T3 = 0.125

46

mailxmail - Cursos para compartir lo que sabes

Estos ejercicios nos muestran lo que hace la computadora, en el programa SPSS, cuando le pedimos que calcule las probabilidades de un problema en el que estamos interesados. Probabilidades condicionales Hasta ahora vimos dos clases de probabilidad: la probabilidad marginal (o incondicional) y la probabilidad conjunta; la probabilidad marginal se representa por (PA) y la conjunta por P(AB) La Probabilidad Condicional que analizaremos ahora se representa por P(A/B) que muestra dos eventos: A, el primer evento y B, el segundo. De esta manera, la Probabilidad Condicional P(A/B) representa el caso en que el segundo evento B ocurre luego que el primero, A, ya ha tenido lugar. Es decir, nos dice cul ser la probabilidad del evento B una vez que el evento A ya ocurri. Antes de continuar, recordemos que para dos eventos independientes, A y B, la ocurrencia de A nada tiene que ver con el la ocurrencia del evento B. As la probabilidad de lograr una cara en un segundo lanzamiento de la moneda, despus de que el primer lanzamiento dio como resultado, seguir siendo 0.5, debido a que ambos eventos son independientes. A continuacin disearemos una pequea ayuda-memoria para eventos estadsticamente independientes. Vemos all que la probabilidad marginal, llamada tambin incondicional es (PA) La probabilidad Conjunta de dos eventos independientes estadsticamente es P(AB) = P(A) x P(B) La probabilidad condicional P(A/B) es P(B)

47

mailxmail - Cursos para compartir lo que sabes

Tipo de Probabilidad Marginal Conjunta Condicional

Smbolo P(A) P(AB) P(A/B)

Frmula P(A) P(A) x P(B) P(B)

Probabilidad Condicional Bajo Dependencia Estadstica Antes de proponer la definicin formal, vayamos a un ejemplo ilustrativo. Hay una caja que contiene diez bolas de colores distribuidas de la manera siguiente: Tres bolas son de color y tienen puntos Una es de color y tiene franjas Dos son grises y tienen puntos Cuatro son grises y tienen franjas Siguiendo a Levin y Rubin, hacemos un pequeo cuadro para visualizar mejor las condiciones del problema La distribucin de las diez bolas

Evento 1 2 3 4 5 6 7

Probabilidad del Evento 0.1 0.1 (De color y con puntos) 0,1 0.1 (De color y con franjas) 0.1 (Grises y con puntos) 0.1 0.1 48

mailxmail - Cursos para compartir lo que sabes

8 9 10

0.1 (Grises y con franjas) 0.1 0.1

Como hay diez bolas, la probabilidad de sacar una cualquiera de ella es 1/10 = 0.10 Supongamos que alguien saca una bola de color: cul es la probabilidad de que sta tenga puntos? Simblicamente, el problema puede representarse como P(D/C), es decir cul es la probabilidad de que la bola tenga puntos (D) dado que es de color (C)? (Vemos que D representa una bola con puntos, C, de color) La probabilidad de que la bola que se sac era de color, queremos saber la probabilidad de que, siendo de color, tenga puntos; para ello, ignoramos las bolas grises, pues no cumplen con ninguna condicin dada. Slo tomaremos en cuenta las que restan; hay cuatro bolas de color, tres de las cuales tienen puntos y la cuarta tiene franjas; con esa informacin slo tenemos que encontrar las probabilidades sencillas. Es decir, la probabilidad de que la bola tenga puntos y de que tenga franjas; para ello nos damos cuenta que el total de bolas que tienen color son 4 y las que tienen color y puntos son tres. Por lo tanto, la probabilidad de una bola a color con puntos es = = 0.75 La probabilidad de color con franjas es = =0.25; ambas suman 1. En el prximo captulo veremos la frmula general sobre la probabilidad condicional salto de capitulo}

49

También podría gustarte