Clase Estadistica PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 53

M en E ISC Antolín Robles Garay

Introducción
¿Qué es la estadística?
Es una Ciencia que explica y provee de
herramientas para trabajar con datos, ha
experimentado un gran desarrollo a lo largo
de los últimos años.

¿En qué áreas se aplica la estadística?


Se aplica en todas las áreas del saber, por ejemplo en Sociología,
Educación, Psicología, Administración, Economía, Medicina, Ciencias Políticas, entre
otras.

Ejemplos de su aplicación son:


1) En Administración de Empresas: la estadística se utiliza para evaluar un
producto antes de comercializarlo.
2) En Economía: para medir la evolución de los precios mediante números
índice o para estudiar los hábitos de los consumidores a través de encuestas
de presupuestos familiares. 1
Ejemplos de
Estadística

Introducción aplicación
3) En Ciencias Políticas: para conocer las preferencias de los electores antes de
una votación mediante sondeos y así orientar las estrategias de los candidatos.

4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre


temas de actualidad.

5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del
comportamiento humano (por ejemplo los test que se aplican a los candidatos
para un cargo en una empresa).

6) En Medicina: uno entre muchos usos de la estadística, es para determinar el


estado de salud de la población.

En general en las Ciencias Sociales, la estadística se emplea para medir las


relaciones entre variables y hacer predicciones sobre ellas.

2
Etapas de un
estudio estadístico
Introducción

Un análisis estadístico se lleva a cabo siguiendo las etapas habituales en el


llamado método científico cuyas etapas son:

1) Planteamiento del problema: consiste en definir el objetivo de la


investigación y precisar el universo o población.
2) Recogida de la información: consiste en recolectar los datos necesarios
relacionados al problema de investigación.
3) Análisis descriptivo: consiste en resumir los datos disponibles para extraer la
información relevante en el estudio.
4) Inferencia estadística: consiste en suponer un modelo para toda la población
partiendo de los datos analizados para obtener conclusiones generales.
5) Diagnóstico: consiste en verificar la validez de los supuestos del modelo que
nos han permitido interpretar los datos y llegar a conclusiones sobre la
población

3
Actividad 1
Introducción

Cómo funciona el método científico


http://hipertextual.com/2015/06/funciona-metodo-cientifico

Realizar un ensayo
de una cuartilla formato APA

4
Esquema ESTADÍSTICA DESCRIPTIVA
de las etapas de un (Tablas, Gráficos, Medidas
Introducción estudio estadístico Descriptivas, etc.)

AREA DE INTERES

Tema de Investigación
-Antecedentes Previos
-Objetivos Muestra
¿Población o Muestra?
-Preguntas de Investigación
Población INFERENCIA ESTADÍSTICA
-Posibles Hipótesis
-Unidad de Análisis
-Población
Probabilidad
-Variables
5
Introducción

La estadística descriptiva es la rama de


las matemáticas que recolecta, presenta y
caracteriza un conjunto de datos (por ejemplo,
edad de una población, altura de los estudiantes
de una escuela, temperatura en los meses de
verano, etc.) con el fin de describir
apropiadamente las diversas características de
ese conjunto.

6
Introducción

La inferencia estadística es el conjunto de


métodos y técnicas que permiten inducir, a partir de la
información empírica proporcionada por una muestra,
cual es el comportamiento de una determinada
población con un riesgo de error medible en términos de
probabilidad

7
Introducción

Adolphe Quetelet (1796-1874)

La Estadística es la ciencia que se encarga de recolectar


datos de una población o muestra.
Los conceptos estadísticos se han trabajado intuitivamente
desde la antigüedad, las primeras culturas recopilaban datos
poblacionales por medio de censos como los realizados en
Egipto por Moisés (según consta la Biblia) y el
empadronamiento que fue efectuado por los romanos en
Judea.
A partir del siglo XIX, entre otros, con el aporte de Adolphe
Quetelet (1796-1874), se crearon diferentes métodos de cálculo de
probabilidades para determinar y analizar el tipo de datos que regulan
algunos fenómenos.
8
Distribución binomial
conceptos
básicos Estadístico
Introducción

Estadística
Muestreo
Combinatoria
Regresión Varianza
Diseño experimental
estadística
Análisis de series temporales

Media
Probabilidad Prueba de χ²
Variable aleatoria Estadística
Censo inferencial
Rango
Varianza con Población
probabilidad Error
Distribución normal estadístico

Frecuencia Estadística Variable estadística


Parámetro estadístico Descriptiva
Desviación Grados de libertad
estándar Distribución t
Muestra
9
Actividad en clase y colaborativa actividad2
Ejemplos de
problemas
Introducción a estudiar

1) Se quiere determinar si existe discriminación salarial debida al sexo de la persona


empleada.
2) Se quiere determinar el perfil de los trabajadores en términos de condiciones
económicas en diferentes comunidades.
3) Se quiere estudiar el consumo de las personas de una zona determinada en
cuanto a vestuario, alimentación, ocio y vivienda.
4) Se quiere determinar las tallas estándar en vestuario para mujeres.
5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los
trabajadores de distintas empresas de San Juan del Rio..
6) Se quiere determinar el perfil sociodemográfico de los estudiantes de UTSJR.
7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de
UTSJR , y si éste tiene alguna relación con su edad u otras características.

10
Resumen de algunos
conceptos planteados
en la Introducción
Introducción

• VARIABLE: Es lo que se va a medir y representa una característica de la UNIDAD DE ANÁLISIS.


¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos , objetos , Unidades de Análisis de una
Población o una Muestra

• POBLACIÓN : Es el total de unidades • MUESTRA: Es un conjunto de


de análisis que son tema de estudio. unidades de análisis provenientes
de una población.

Muestra: 60 trabajadores de
empresas de comunicación
Población: Muestra
Unidad de análisis:
Trabajador de empresa de
“Las personas que trabajan en comunicación
empresas de comunicación” Variables: sexo, edad, salario,
Nº de horas de trabajo, etc.

11
Las variables cualitativas se refieren
a características o cualidades que no pueden
Conceptos ser medidas con números.

Variable cualitativa nominal


Una variable cualitativa nominal presenta modalidades no
numéricas que no admiten un criterio de orden.
Por ejemplo: El estado civil, con las siguientes modalidades: soltero, casado,
separado, divorciado y viudo.

Variable cualitativa ordinal o variable cuasicuantitativa


Una variable cualitativa ordinal presenta modalidades no
numéricas, en las que existe un orden.
Por ejemplo:
La nota en un examen: suspenso, aprobado, notable, sobresaliente.
Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ...
Medallas de una prueba deportiva: oro, plata, bronce.
12
Una variable cuantitativa es la que se expresa
mediante un número, por tanto se pueden
Conceptos realizar operaciones aritméticas con ella.

Variable discreta
Una variable discreta es aquella que solo puede tomar un número
finito de valores entre valores cualesquiera de una característica.
El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Variable continua
Una variable continua es aquella que puede tomar un número
infinito de valores entre valores cualesquiera de una
característica.
La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
En la práctica medimos la altura con dos decimales, pero
también se podría dar con tres decimales.
13
TIPOS DE
Conceptos VARIABLES

Variables Cuantitativas Variables Cualitativas


CONTINUA DISCRETA ORDINAL
NOMINAL
Intervalo

Toma valores enteros Característica o cualidad


cuyas categorías no tienen
Ejemplos: Número de Hijos, Número de un orden preestablecido.
empleados de una empresa, Número de
asignaturas aprobadas en un semestre, Ejemplos: Sexo, Deporte
etc. Favorito, etc.

Característica o cualidad cuyas


Toma cualquier valor dentro de un intervalo categorías tienen un orden
Ejemplos: Peso; Estatura; Temperatura, etc. preestablecido.
Ejemplos: Calificación (S, N, A);
Unidad de Medida: Gramos o Kilos para la variable
Peso; Grados C o F para Temperatura Grado de Interés por un tema, etc.
14
Frecuencia
Desde un conjunto de unidades, corresponde al
Conceptos Número o Porcentaje de veces que se presenta una
característica.

Variable Variable
Cualitativa Cuantitativa

NOMINAL CONTINUA

ORDINAL DISCRETA

Frecuencia Absoluta (F) Frecuencia Relativa (f)

Frecuencia Absoluta Frecuencia Relativa


Acumulada (FAA) TIPO Acumulada (fra)
FRECUENCIA

la frecuencia (o frecuencia absoluta) de un evento x, es el número de veces ni que dicho


evento se repite durante un experimento o muestra estadística1 . Comúnmente, la distribución
de la frecuencia suele visualizarse con el uso de histogramas.
15
Frecuencia absoluta
Tipos de un valor de la variable estadística X

de Frecuencia
Conceptos

Es el número de veces que aparece ese valor en el estudio.

Se suele denotar por Fi a la frecuencia absoluta del valor


X = xi de la variable X.

Dada una muestra de N elementos, la suma de todas las


frecuencias absolutas debe dar
el total de la muestra estudiada N.

16
Frecuencia relativa
Tipos
Conceptos de Frecuencia fi
Es el cociente entre la frecuencia
absoluta y el tamaño de la
muestra (N).

siendo el fi para todo el conjunto i. Se presenta en una tabla o


nube de puntos en una distribución de frecuencias.
Si multiplicamos la frecuencia relativa por 100 obtendremos el
porcentaje o tanto por ciento (pi)

17
Frecuencia
Tipos absoluta acumulada
de Frecuencia
Conceptos
Ni
total de las frecuencias absolutas para todos los eventos
iguales o anteriores que un cierto valor, en una lista
ordenada de eventos.

Frecuencia relativa acumulada


Fi
cociente entre la frecuencia
absoluta acumulada y el total de la
muestra.

18
Tipos Supongamos estos
de Frecuencia
Conceptos datos

18, 13, 12, 14, 11, 08, 12, 15, 05, 20, 18, 14, 15, 11, 10, 10, 11, 13.
Entonces:
La frecuencia absoluta de 11 es 3, pues 11 aparece 3 veces.
La frecuencia relativa de 11 es 0.17, porque corresponde a la
división 3/18 ( 3 de las veces que aparece de las 18 notas que
aparecen en total).
La frecuencia absoluta acumulada para el valor 11 es 7, porque
hay 7 valores menores o iguales a 11.
La frecuencia relativa acumulada para el valor 11 es 0.38, porque
corresponde a la división 7/18 (frecuencia absoluta acumulada
dividida entre el número total de muestras).
19
Problema de Investigación: Unidad de Análisis: Industria
Se quiere establecer el perfil automotriz
de las industrias Automotriz Población: Industrias de
Conceptos en función de algunas
características.
Automotriz del país

Variables
- Tipo de Industria: se clasifica en industria tipo A, B, C o D. (cualitativa nominal)
- Nº de Empleados: se refiere al número de empleados en las líneas de producción. (cuantitativa
discreta)
- Superficie: se refiere a los metros cuadrados (unidad de medida) disponibles para las áreas de
producción. (cuantitativa continua)
- Calificación: calificación realizada por una institución pública sobre cumplimiento de ciertos
estándares (Muy Bien, Bien, Regular, Mal). (cualitativa ordinal)

Industria nº Tipo Nº Empleados Superficie Calificación


1 A 100 1000,6 Muy Bien
2 B 150 1200,4 Bien
. . . . .
. . . . .
. . . . .
299 D 250 800,3 Mal
300 C 300 4000,2 Regular
20
TABLAS DE
Conceptos FRECUENCIA
EJEMPLO

(1)

Tipo de Frecuencia Frecuencia Porcentaje


Industria Absoluta (Fj) Relativa (fj) (%)
A
B
C
D
Total 300 1 100

21
TABLAS DE
Conceptos FRECUENCIA
EJEMPLO

(2)

Frec. Frec.Relativa Frec. Absol. Frec. Relat.


Calificación Absoluta (Fj) (fj) o % Acum. (FAAj) Acum. (fraj) o %
Muy Bien
Bien
Regular
Mal 300 1 (o 100)
Total 300 1 (o 100)

22
TABLAS DE
Conceptos FRECUENCIA
EJEMPLO

(4)
Superficie Frec. Frec.Relativa Frec. Absol. Frec. Relat.
(mt2) Absoluta (Fj) (fj) o % Acum. (FAAj) Acum. (fraj) o %
<200
[200-400[
.
.
[50000-5200] 300 1 (o 100%)
Total 300 1 (o 100%)

23
TABLAS DE
Conceptos FRECUENCIA
EJEMPLO

(3)

Numero de Frec. Frec.Relativa Frec. Absol. Frec. Relat.


Empleados Absoluta (Fj) (fj) o % Acum. (FAAj) Acum. (fraj) o %
<100
[100-150[
.
.
[950-1000] 300 1 (o 100%)
Total 300 1 (o 100%)

24
Elementos de una tabla de frecuencia

Conceptos cuando la variable es continua (x)

Centro
Intervalo de clase Amplitud F f FAA fra
[LI1 ; LS1 [
I1 c1 a1
[LI2 ; LS2 [ I2 c2 a2
.
.
[LIk ; LSk] Ik ck ak n 1
Total n 1

cj = (LIj) + LSj )/2 aj = (LSj – LIj))

25
Ejercicio:
Confección de una tabla de frecuencia para
Conceptos una variable continua

Los datos corresponden a la edad de los Realice la siguiente actividad


hijos de los trabajadores de una empresa
10,5 10,7 9,5 10,5 11,8 11,2 1) Construya un Diagrama de Tallo y Hoja
12,0 10,3 13,5 12,3 10,6 9,8 2) ¿Cuál es la variable?; ¿Cuál es la Unidad de
10,7 11,5 11,1 10,6 9,3 12,9 análisis?; ¿Cuánto vale n?; ¿Cuál es el rango
10,4 7,5 10,2 8,7 10,9 9,9 de la variable?.
11,7 10,3 10,6 10,5 11,9 11,0
3) Sobre una Tabla de frecuencia: ¿Cuántos
13,9 10,6 10,0 10,8 10,6 - intervalos podría construir?; ¿Cuál es la
7,3 8,0 8,5 12,5 9,7 - amplitud de cada intervalo?; ¿Cuántas
medidas de frecuencia puede obtener para
Datos ordenados de menor a mayor cada intervalo?.
7,3 9,7 10,4 10,6 11,1 12,3 4) Construir tabla de frecuencia para la
7,5 9,8 10,5 10,6 11,2 12,5 variable: Intervalos, centro de clase,
8,0 9,9 10,5 10,7 11,5 12,9 amplitud, frecuencias.
8,5 10,0 10,5 10,7 11,7 13,5
8,7 10,2 10,6 10,8 11,8 13,9
9,3 10,3 10,6 10,9 11,9 - Diagrama de Tallo y Hoja: permite organizar los
9,5 10,3 10,6 11,0 12,0 -
datos de una variable medida sobre un conjunto de
individuos. Su utilidad viene dada cuando no
contamos con herramientas automáticas para
ordenar los datos.

26
Gráfico de
Sectores
Circulares
Distribución de las unidades de

Conceptos
análisis de acuerdo a variable 1
(de Torta)
TIPOS DE GRÁFICOS D
10% A
20%

C
40% B
30%

Distribución de las unidades de análisis de


acuerdo a variable 1

D A
10% 20%
Distribución de las unidades de
análisis de acuerdo a variable 1

D A
10% 20%

C B
C
40% 30% 40%
B
30%

27
Estadística

TIPOS DE GRÁFICOS 2. Gráfico de Barras

Numero de unidades de análisis Proporción de unidad de análisis de acuerdo a


variable 1
de acuerdo a variable 1

D
500

variable 1
400 C
300

B
200

100 A

0
0 0,2 0,4 0,6 0,8 1
A B C D
Proporción de unidad de análisis
variable 1
-Este tipo de gráfico se utiliza generalmente para
Porcentaje de unidad de análisis de acuerdo a representar la frecuencia de las categorías de una
variable 1
variable cualitativa.
D -Cuando una variable es cuantitativa se puede utilizar
este tipo de gráfico sólo si la variable se ha
variable 1

C
transformada en categorías.
B
-Hay distintas versiones de estos gráficos (por ejemplo
A
en Excel), y en algunos casos son muy útiles para
0 20 40 60 80 100 describir el comportamiento de una variable en distintos
% unidad de análisis grupos. 28
Estadística

TIPOS DE GRÁFICOS 3. Histograma


Histograma
Histograma
Distribución de los hijos de trabajadores
de la empresa de acuerdo a edad - Permite la representación de
15
la frecuencia de una variable
Cuantitativa.
Frecuencia

10

- El eje x se refiere a la

5
variable.
- El eje y se refiere a la
0
frecuencia (Nº , %).
7 8 9 10 11 12 13 14

edad
edad - Cada barra representa la
frecuencia de la variable en la
Ejemplo
población en estudio (o la
En el gráfico se puede observar el número de muestra).
hijos , de menor edad (7-8 años), las de mayor
edad (13-14 años); y además que la mayoría de -El histograma se puede
hijos de los trabajadores están entre los 10 y 12 construir desde los datos de la
años. tabla de frecuencia de la
variable en estudio.
29
Estadística

TIPOS DE GRÁFICOS 5. Polígono de Frecuencia

Distribución de los hijos de trabajadores


de la empresa de acuerdo a edad
15
-Esta representación se basa en
el Histograma.
-Sólo es útil para variables
Frecuencia

10

edad cuantitativas.

5
-El eje x se refiere a la
variable.
0

7 8 9 10 11 12 13 14
- El eje y se refiere a la
edad frecuencia (Nº , %).
-Los puntos que permiten la
unión de las líneas representa
el centro de clase (o marca de
clase).

30
Estadística

TIPOS DE GRÁFICOS 5. Diagrama de Caja

Edad de las personas que se realizaron


angioplastía entre 1980 y 2000
100

90

80

70

60 - Permite identificar gráficamente la


mediana, los cuartiles 1 y 3
Edad

50
(percentiles 25 y 75), mínimo y
40 máximo de una variable.
30 - Sólo es útil para variables
20 cuantitativas.
10 -El eje x permite identificar la
0 poblacion en estudio.
N= 584 1473
- El eje y representa los valores de la
Mujeres Hombres
variable en estudio. 31
Estadística

TIPOS DE GRÁFICOS 6. Otros

Número de alumnos matriculados en la Número de alumnos matriculados en la


Carrera A según año de ingreso Carrera B según año de ingreso

100 100
Nº de alumnos

Nº de alumnos
80 80
60 60
40 40
20 20
0 0
1998 1999 2000 2001 2002 2003 1998 1999 2000 2001 2002 2003
año de ingreso año de ingreso

Número de alumnos matriculados en las Carreras


según año de ingreso
Nº de alumnos
200
Nº de alumnos

año de ingreso Carrera A Carrera B


1998 60 80 150
1999 55 70
100
2000 80 50
2001 40 60 50
2002 68 50
2003 70 75 0
1998 1999 2000 2001 2002 2003

Carrera B año ingreso


Carrera A 32
Estadística

NOTACION
Variables Cuantitativas

x  variable xi  valor de la variable en el individuo i


OBSERVACIONES
y  variable y  valor de la variable en el individuo i i  1,...,n
* El Tipo de Gráficoi seleccionado va a depender de la variable en estudio.
* El Gráfico debe contener un a,Título
b, c : constantes
General y la identificación de cada
eje (variable en estudio y frecuencia).
n n n n
 c *c Enocasiones
 c  nc  cxmás
resulta i  cx 1    cx
ilustrativo un c xi que 
n gráfico  x1 de
xi tabla
una   xn 2 2 2

i 1 frecuencia. i 1 i 1 i 1

n n
* Al igual que las tablas, los gráficos deben n
ser auto-explicativos.
 (axi  b) (ax1  b)    (axn  b)  a xi  b 2
( xi )  ( x1    xn ) 2
i 1 i 1 i 1

n
 ( xi  yi )  ( x1  y1 )    ( xn  y n )
i 1

n
 ( xi yi )  ( x1 y1 )    ( xn y n )
i 1
33
Estadística

-Media Aritmética (Promedio)


MEDIDAS DE TENDENCIA CENTRAL -Mediana
-Moda

Datos Cuantitativos Datos Cuantitativos ordenados de menor a mayor


x x Mediana
x1 Media Aritmética o Promedio x(1) M E  x( k ) Si n es impar
n
x2 x( 2)
 xi ME 
x( k )  x( k 1) Si n es par
 x i 1  2
xn n x(n) x( k )  dato del centro

Datos Moda
Cualitativos y Cuantitativos M o " el dato que más se repite"

34
Estadística

-Percentil (ejemplo: 25, 50, 75)


Percentiles, Deciles o Cuartiles -Decil (ejemplo: 4, 5, 8)
-Cuartil (ejemplo: 1, 2, 3)

Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los n
datos están ordenados de Menor a Mayor
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.
El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.
El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64. 35
Estadística

-Rango
MEDIDAS DE DISPERSIÓN -Varianza
-Desviación Estándar

Datos Cuantitativos Varianza


x Rango n n
1 n
x1  ( xi  x ) 2
 x  ( xi ) 2
2

R  max( xi )  min( xi ) s 2  i 1
i
1 n 2
  xi  x 2
n i 1
 i 1

x2 n n n i 1

Desviación Típica o Estándar
xn
s  s2

Comparación entre Variables


Coeficiente de Variación
Se refiere al comportamiento de las variables cuantitativas en un
s
grupo. Por ejemplo: Si se tiene un conjunto de personas a las que cv 
se les mide Estatura, Peso, Edad: Entre estas variables ¿cuál x
presenta mayor variación? 36
Estadística

-Asimetría
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento

Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias
es la simetría y el apuntamiento o kurtosis.

 (x
i 1
i  x)3 Si CA=0 si la distribución es simétrica alrededor de la media.
Si CA<0 si la distribución es asimétrica a la izquierda
Coeficiente de Asimetría CA  Si CA>0 si la distribución es asimétrica a la derecha
n  s3

 ( xi  x ) 4
- Si CAp=0 la distribución se dice normal (similar
a la distribución normal de Gauss) y recibe el
i 1
Coeficiente de Apuntamiento CAp  nombre de mesocúrtica.
n  s4 - Si CAp>0, la distribución es más puntiaguda que
la anterior y se llama leptocúrtica, (mayor
concentración de los datos en torno a la media).
- Si CAp<0 la distribución es más plana y se
llama platicúrtica.

37
Estadística

-Asimetría
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento

Ejemplos Histogramas con distinta asimetría y apuntamiento

14 30 6

12 5

10
20 4

8
3

10 2
4

1 Desv. típ. = 2,42


2 Desv. típ. = 1,67 Desv. típ. = ,64
Media = 3,9 Media = 0,0 Media = 5,2

N = 30,00 N = 30,00 0 N = 28,00


0 0
1,0 2,0 3,0 4,0 5,0 6,0 7,0 -1,0 0,0 1,0 2,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0

V2 V4 V5

38
Estadística

-Asimetría
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento

Ejemplos

Datos Histograma Medidas descriptivas


16

1 4 4 Media 3,9
14
1 4 4 Mediana 4

1 4 5
12 Moda 4

2 4 5 10
Desviación estándar 1,67

2 4 6 Varianza de la muestra 2,78


8
2 4 6 kurtosis -0,43
6
2 4 6 Coeficiente de asimetría -0,02

3 4 6 4 Rango 6

3 4 7 Desv. típ. = 1,77 Mínimo 1


2
Media = 5,4
4 4 7 Máximo 7
0 N = 66,00
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 Cuenta 30

V1

39
Estadística

Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento


para datos Agrupados (tabla de frecuencias)

Tabla de frecuencia (para variable cuantitativa) 2) La Desviación típica para datos


Centro agrupados esta dada por:
Intervalo de clase Amplitud F f FAA fra
k

 (c
n1 f1
I1 c1 a1
sc  j  xc ) 2 f j
I2 c2 a2 n2 f2 j 1
.
.    
Ik ck ak nk fk n 1 3) El Coeficiente de Asimetría para
Total n 1
datos agrupados esta dado por:
k

Sea cj la marca de clase (o centro de clase) y fj la  (c


j 1
j  xc ) 3 f j
frecuencia relativa de la clase j, donde j=1, 2,…, k. CAc 
s c3
1) La Media para datos agrupados es igual a la
suma de los productos de las marcas de clase 4) El Coeficiente de apuntamiento para
por sus frecuencias relativas, de la forma: datos agrupados esta dada por:
k

 (c  xc ) 4 f j
k
Media c  xc   c j f j j
j 1
j 1 CAp c 
s c4
40
Estadística

Descripción de 2 variables cualitativas

Problema Distribución conjunta


Interesa estudiar cual es el Tabla 1 Actividad
principal medio de transporte Transporte Estudia Pensionado Trabaja
preferido por un grupo de
personas a la hora de dirigirse Autobus 5 7 0
al centro comercial. Bicicleta 3 3 2
Caminar 2 5 2
Para esto se consultó a cada
Coche 5 4 5
persona sobre la actividad a la
que se dedicaba y el medio de Metro 6 7 4
transporte preferido.
Transporte Nº %
Autobus 12 20,0 Actividad Nº %

Bicicleta 8 13,3
Estudia 21 35,0

Caminar 9 15,0
Pensionado 26 43,3

Coche 14 23,3
Trabaja 13 21,7

Metro 17 28,3
TOTAL 60 100

TOTAL 60 100

41
Estadística

Descripción de 2 variables cualitativas

Distribución conjunta
Nº de personas
Tabla 2 Actividad

Transporte Estudia Pensionado Trabaja TOTAL


Autobus 5 7 0 12
Bicicleta 3 3 2 8
Caminar 2 5 2 9
Coche 5 4 5 14
Metro 6 7 4 17
TOTAL 21 26 13 60

Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)

42
Estadística

Descripción de 2 variables cualitativas

Distribución conjunta
Nº de personas y % respecto de tipo de Transporte
Tabla 3 Actividad

Transporte Estudia Pensionado Trabaja TOTAL


Autobus 5 7 0 12
% 41,7 58,3 0 100
Bicicleta 3 3 2 8
% 37,5 37,5 25 100
Caminar 2 5 2 9
% 22,2 55,6 22,2 100
Coche 5 4 5 14
% 35,7 28,6 35,7 100
Metro 6 7 4 17
% 35,3 41,2 23,5 100
TOTAL 21 26 13 60
% 35 43,3 21,7 100

43
Estadística

Descripción de 2 variables cualitativas

Distribución conjunta
Nº de personas y % respecto de tipo de Actividad
Tabla 4 Actividad

Transporte Estudia Pensionado Trabaja TOTAL


Autobus 5 7 0 12
% 23,8 26,9 0 20
Bicicleta 3 3 2 8
% 14,3 11,5 15,4 13,3
Caminar 2 5 2 9
% 9,5 19,2 15,4 15
Coche 5 4 5 14
% 23,8 15,4 38,5 23,3
Metro 6 7 4 17
% 28,6 26,9 30,8 28,3
TOTAL 21 26 13 60
% 100 100 100 100

44
Estadística

- Covarianza Datos
MEDIDAS DE ASOCIACIÓN LINEAL
- Correlación Cuantitativos

x
x1 Recordemos que: Hasta ahora hemos estudiado las medidas tendencia
central (Media, Mediana, Moda) y dispersión
x2 (Varianza y Desviación Estándar) para una Variable
 Cuantitativa (x).
xn

Covarianza: Es una medida de Variabilidad Conjunta entre dos variables (x1 , x2) o bien (x , y)
1 n
x y cov( x , y )   ( xi  x )( yi  y )
y( 1 ) n i 1
x(1)
y( 2 ) Si Cov(x,y) es positiva: la asociación entre x e y es directamente proporcional,
x( 2 ) es decir que cuando x aumenta y también aumenta; y viceversa.
 
Si Cov(x,y) es negativa: la asociación entre x e y es inversamente proporcional,
x(n) y( n )
es decir que cuando x aumenta y disminuye; y viceversa.
Si Cov(x,y) es cero: no existe asociación entre x e y.
45
Estadística

- Covarianza Datos
MEDIDAS DE ASOCIACIÓN LINEAL
- Correlación Cuantitativos

Correlación: Se refiere al grado de asociación entre dos variables (x1 , x2) o bien (x , y)
Coeficiente de Correlación de Pearson (r): Mide el grado de Asociación Lineal
entre dos variables Cuantitativas
n
 xi yi  nxy
x y
cov( x , y )
x(1) y( 1 ) r 1  r  1
sx s y r  i 1
x( 2 ) y( 2 ) ( n  1 )s x s y
 
Si r es positivo: la asociación entre x e y es directamente proporcional, es decir que
x(n) y( n ) cuando x aumenta y también aumenta; y viceversa. Si r=1: la asociación lineal es
perfecta.
Si r es negativo: la asociación entre x e y es inversamente proporcional, es decir
que cuando x aumenta y disminuye; y viceversa. Si r=-1: la asociación lineal es
perfecta.
Si r es cero: no existe asociación entre x e y.

46
Estadística

EJEMPLO : Representación gráfica de las variables x e y

r=1 r=-1

47
Estadística

Datos Cuantitativos

REGRESION LINEAL SIMPLE


Objetivo 1 Objetivo 2
Determinar si dos variables están x y Estudiar si los valores de una
asociadas y en qué sentido se da x(1) y( 1 ) variable pueden ser utilizados para
la asociación. predecir el valor de la otra
x( 2 ) y( 2 )
 
x(n) y( n )
Determinar si existe relación Estudiar la dependencia de una
entre las variables x e y: variable respecto de la otra:
Coeficiente de Correlación Modelo de Regresión
Términos
Variable Respuesta (=variable dependiente)
Variable Explicativa (=variable Independiente)
Relación Lineal (modelo lineal)
Parámetros (intercepto y pendiente)
Intercepto (respuesta media)
Pendiente (efecto de la variable explicativa sobre la respuesta)
Error (residuo)
48
Estadística

Datos Cuantitativos
REGRESION LINEAL SIMPLE
x y
x(1) y( 1 ) Notación
x( 2 ) y( 2 ) Variable Respuesta: y
  Variable Explicativa: x
y( n ) Modelo de Regresión Lineal Simple: yi=+xi+ei
x(n)
Intercepto: 
Pendiente: 
Error: e
Modelo Estimado
(recta de regresión) Método de Estimación: Mínimos Cuadrados
a  y  bx
n n n
yˆ  a  bx
Residuos o Errores
n xy   xi  yi ei  yi  yˆ i
b i 1 i 1 i 1
2
n
 n 
n  x    xi 
2

i 1  i 1 
49
Estadística

REGRESION LINEAL SIMPLE

MODELO DE REGRESIÓN LINEAL SIMPLE


yi=+xi+ei

DATOS MODELO ESTIMADO


x y
y( 1 )
yˆ  a  bx
x(1)
x( 2 ) y( 2 )
  ESTIMADORES ERRORES
x(n) y( n ) a  y  bx ei  yi  yˆ i
n n n
n xy   xi  yi
b i 1 i 1 i 1
2
n
 
n
n  x 2    xi 
i 1  i 1 
50
Estadística

REGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple


Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.
niño edad (meses) talla (cm)
i xi yi
y=talla / x=edad / n=14
1 3 55
2 6 68 14
3
4
5
5
64
66
 yi  956 y  68 ,3 s y  5,6
i 1
5 3 62 14
6 4 65
 xi  84 x  6 sx  2
7 9 74 i 1
8 8 75 cov( x, y )  9,07 rxy  0,88
9 9 73
10 7 69 14 14
11 6 73  xi y i  5863  xi2  556
12 5 68 i 1 i 1
13 8 73
14 6 71

51
Estadística

REGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple


Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.

Modelo Estimado
yˆ  a  bx

b  2,44 a  53,64
yˆ  53 ,64  2,44 x

Interpretación de los resultados


- Existe asociación o dependencia entre la Talla del niño y la edad (r=0,88); a
medida que la edad aumenta la talla aumenta.
- Desde los resultados del modelo de regresión lineal simple, se tiene que la talla
media de un niño es de 53,64 cm. Cuando la edad del niño (meses) aumenta en
una unidad la talla se incrementa en 2,44 cm.
52
Estadística

REGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple


Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.

niño edad (meses) talla (cm) Talla estimada error


i xi yi ŷi ei 14

1 3 55 61,0 -6,0  ( yi  yi ) 2  402,86


i 1
2 6 68 68,3 -0,3 14 14
3 5 64 65,8 -1,8  ( y i  yˆ i ) 2   ei2 92,7
4 5 66 65,8 0,2 i 1 i 1

5 3 62 61,0 1,0
6 4 65 63,4 1,6
7 9 74 75,6 -1,6 Bondad de Ajuste del Modelo
8 8 75 73,2 1,8 R2 = 0,77
9 9 73 75,6 -2,6
10 7 69 70,7 -1,7 De acuerdo al coeficiente de
11 6 73 68,3 4,7 determinación, el modelo ajustado
12 5 68 65,8 2,2 a los datos es adecuado (R2
13 8 73 73,2 -0,2
cercano a 1)
14 6 71 68,3 2,7

53

También podría gustarte