Clase Estadistica PDF
Clase Estadistica PDF
Clase Estadistica PDF
Introducción
¿Qué es la estadística?
Es una Ciencia que explica y provee de
herramientas para trabajar con datos, ha
experimentado un gran desarrollo a lo largo
de los últimos años.
Introducción aplicación
3) En Ciencias Políticas: para conocer las preferencias de los electores antes de
una votación mediante sondeos y así orientar las estrategias de los candidatos.
5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del
comportamiento humano (por ejemplo los test que se aplican a los candidatos
para un cargo en una empresa).
2
Etapas de un
estudio estadístico
Introducción
3
Actividad 1
Introducción
Realizar un ensayo
de una cuartilla formato APA
4
Esquema ESTADÍSTICA DESCRIPTIVA
de las etapas de un (Tablas, Gráficos, Medidas
Introducción estudio estadístico Descriptivas, etc.)
AREA DE INTERES
Tema de Investigación
-Antecedentes Previos
-Objetivos Muestra
¿Población o Muestra?
-Preguntas de Investigación
Población INFERENCIA ESTADÍSTICA
-Posibles Hipótesis
-Unidad de Análisis
-Población
Probabilidad
-Variables
5
Introducción
6
Introducción
7
Introducción
Estadística
Muestreo
Combinatoria
Regresión Varianza
Diseño experimental
estadística
Análisis de series temporales
Media
Probabilidad Prueba de χ²
Variable aleatoria Estadística
Censo inferencial
Rango
Varianza con Población
probabilidad Error
Distribución normal estadístico
10
Resumen de algunos
conceptos planteados
en la Introducción
Introducción
Muestra: 60 trabajadores de
empresas de comunicación
Población: Muestra
Unidad de análisis:
Trabajador de empresa de
“Las personas que trabajan en comunicación
empresas de comunicación” Variables: sexo, edad, salario,
Nº de horas de trabajo, etc.
11
Las variables cualitativas se refieren
a características o cualidades que no pueden
Conceptos ser medidas con números.
Variable discreta
Una variable discreta es aquella que solo puede tomar un número
finito de valores entre valores cualesquiera de una característica.
El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Variable continua
Una variable continua es aquella que puede tomar un número
infinito de valores entre valores cualesquiera de una
característica.
La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
En la práctica medimos la altura con dos decimales, pero
también se podría dar con tres decimales.
13
TIPOS DE
Conceptos VARIABLES
Variable Variable
Cualitativa Cuantitativa
NOMINAL CONTINUA
ORDINAL DISCRETA
de Frecuencia
Conceptos
16
Frecuencia relativa
Tipos
Conceptos de Frecuencia fi
Es el cociente entre la frecuencia
absoluta y el tamaño de la
muestra (N).
17
Frecuencia
Tipos absoluta acumulada
de Frecuencia
Conceptos
Ni
total de las frecuencias absolutas para todos los eventos
iguales o anteriores que un cierto valor, en una lista
ordenada de eventos.
18
Tipos Supongamos estos
de Frecuencia
Conceptos datos
18, 13, 12, 14, 11, 08, 12, 15, 05, 20, 18, 14, 15, 11, 10, 10, 11, 13.
Entonces:
La frecuencia absoluta de 11 es 3, pues 11 aparece 3 veces.
La frecuencia relativa de 11 es 0.17, porque corresponde a la
división 3/18 ( 3 de las veces que aparece de las 18 notas que
aparecen en total).
La frecuencia absoluta acumulada para el valor 11 es 7, porque
hay 7 valores menores o iguales a 11.
La frecuencia relativa acumulada para el valor 11 es 0.38, porque
corresponde a la división 7/18 (frecuencia absoluta acumulada
dividida entre el número total de muestras).
19
Problema de Investigación: Unidad de Análisis: Industria
Se quiere establecer el perfil automotriz
de las industrias Automotriz Población: Industrias de
Conceptos en función de algunas
características.
Automotriz del país
Variables
- Tipo de Industria: se clasifica en industria tipo A, B, C o D. (cualitativa nominal)
- Nº de Empleados: se refiere al número de empleados en las líneas de producción. (cuantitativa
discreta)
- Superficie: se refiere a los metros cuadrados (unidad de medida) disponibles para las áreas de
producción. (cuantitativa continua)
- Calificación: calificación realizada por una institución pública sobre cumplimiento de ciertos
estándares (Muy Bien, Bien, Regular, Mal). (cualitativa ordinal)
(1)
21
TABLAS DE
Conceptos FRECUENCIA
EJEMPLO
(2)
22
TABLAS DE
Conceptos FRECUENCIA
EJEMPLO
(4)
Superficie Frec. Frec.Relativa Frec. Absol. Frec. Relat.
(mt2) Absoluta (Fj) (fj) o % Acum. (FAAj) Acum. (fraj) o %
<200
[200-400[
.
.
[50000-5200] 300 1 (o 100%)
Total 300 1 (o 100%)
23
TABLAS DE
Conceptos FRECUENCIA
EJEMPLO
(3)
24
Elementos de una tabla de frecuencia
Centro
Intervalo de clase Amplitud F f FAA fra
[LI1 ; LS1 [
I1 c1 a1
[LI2 ; LS2 [ I2 c2 a2
.
.
[LIk ; LSk] Ik ck ak n 1
Total n 1
25
Ejercicio:
Confección de una tabla de frecuencia para
Conceptos una variable continua
26
Gráfico de
Sectores
Circulares
Distribución de las unidades de
Conceptos
análisis de acuerdo a variable 1
(de Torta)
TIPOS DE GRÁFICOS D
10% A
20%
C
40% B
30%
D A
10% 20%
Distribución de las unidades de
análisis de acuerdo a variable 1
D A
10% 20%
C B
C
40% 30% 40%
B
30%
27
Estadística
D
500
variable 1
400 C
300
Nº
B
200
100 A
0
0 0,2 0,4 0,6 0,8 1
A B C D
Proporción de unidad de análisis
variable 1
-Este tipo de gráfico se utiliza generalmente para
Porcentaje de unidad de análisis de acuerdo a representar la frecuencia de las categorías de una
variable 1
variable cualitativa.
D -Cuando una variable es cuantitativa se puede utilizar
este tipo de gráfico sólo si la variable se ha
variable 1
C
transformada en categorías.
B
-Hay distintas versiones de estos gráficos (por ejemplo
A
en Excel), y en algunos casos son muy útiles para
0 20 40 60 80 100 describir el comportamiento de una variable en distintos
% unidad de análisis grupos. 28
Estadística
10
- El eje x se refiere a la
Nº
5
variable.
- El eje y se refiere a la
0
frecuencia (Nº , %).
7 8 9 10 11 12 13 14
edad
edad - Cada barra representa la
frecuencia de la variable en la
Ejemplo
población en estudio (o la
En el gráfico se puede observar el número de muestra).
hijos , de menor edad (7-8 años), las de mayor
edad (13-14 años); y además que la mayoría de -El histograma se puede
hijos de los trabajadores están entre los 10 y 12 construir desde los datos de la
años. tabla de frecuencia de la
variable en estudio.
29
Estadística
10
edad cuantitativas.
Nº
5
-El eje x se refiere a la
variable.
0
7 8 9 10 11 12 13 14
- El eje y se refiere a la
edad frecuencia (Nº , %).
-Los puntos que permiten la
unión de las líneas representa
el centro de clase (o marca de
clase).
30
Estadística
90
80
70
50
(percentiles 25 y 75), mínimo y
40 máximo de una variable.
30 - Sólo es útil para variables
20 cuantitativas.
10 -El eje x permite identificar la
0 poblacion en estudio.
N= 584 1473
- El eje y representa los valores de la
Mujeres Hombres
variable en estudio. 31
Estadística
100 100
Nº de alumnos
Nº de alumnos
80 80
60 60
40 40
20 20
0 0
1998 1999 2000 2001 2002 2003 1998 1999 2000 2001 2002 2003
año de ingreso año de ingreso
NOTACION
Variables Cuantitativas
i 1 frecuencia. i 1 i 1 i 1
n n
* Al igual que las tablas, los gráficos deben n
ser auto-explicativos.
(axi b) (ax1 b) (axn b) a xi b 2
( xi ) ( x1 xn ) 2
i 1 i 1 i 1
n
( xi yi ) ( x1 y1 ) ( xn y n )
i 1
n
( xi yi ) ( x1 y1 ) ( xn y n )
i 1
33
Estadística
Datos Moda
Cualitativos y Cuantitativos M o " el dato que más se repite"
34
Estadística
Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los n
datos están ordenados de Menor a Mayor
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.
El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.
El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64. 35
Estadística
-Rango
MEDIDAS DE DISPERSIÓN -Varianza
-Desviación Estándar
R max( xi ) min( xi ) s 2 i 1
i
1 n 2
xi x 2
n i 1
i 1
x2 n n n i 1
Desviación Típica o Estándar
xn
s s2
-Asimetría
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento
Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias
es la simetría y el apuntamiento o kurtosis.
(x
i 1
i x)3 Si CA=0 si la distribución es simétrica alrededor de la media.
Si CA<0 si la distribución es asimétrica a la izquierda
Coeficiente de Asimetría CA Si CA>0 si la distribución es asimétrica a la derecha
n s3
( xi x ) 4
- Si CAp=0 la distribución se dice normal (similar
a la distribución normal de Gauss) y recibe el
i 1
Coeficiente de Apuntamiento CAp nombre de mesocúrtica.
n s4 - Si CAp>0, la distribución es más puntiaguda que
la anterior y se llama leptocúrtica, (mayor
concentración de los datos en torno a la media).
- Si CAp<0 la distribución es más plana y se
llama platicúrtica.
37
Estadística
-Asimetría
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento
14 30 6
12 5
10
20 4
8
3
10 2
4
V2 V4 V5
38
Estadística
-Asimetría
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento
Ejemplos
1 4 4 Media 3,9
14
1 4 4 Mediana 4
1 4 5
12 Moda 4
2 4 5 10
Desviación estándar 1,67
3 4 6 4 Rango 6
V1
39
Estadística
(c
n1 f1
I1 c1 a1
sc j xc ) 2 f j
I2 c2 a2 n2 f2 j 1
.
.
Ik ck ak nk fk n 1 3) El Coeficiente de Asimetría para
Total n 1
datos agrupados esta dado por:
k
(c xc ) 4 f j
k
Media c xc c j f j j
j 1
j 1 CAp c
s c4
40
Estadística
Bicicleta 8 13,3
Estudia 21 35,0
Caminar 9 15,0
Pensionado 26 43,3
Coche 14 23,3
Trabaja 13 21,7
Metro 17 28,3
TOTAL 60 100
TOTAL 60 100
41
Estadística
Distribución conjunta
Nº de personas
Tabla 2 Actividad
Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)
42
Estadística
Distribución conjunta
Nº de personas y % respecto de tipo de Transporte
Tabla 3 Actividad
43
Estadística
Distribución conjunta
Nº de personas y % respecto de tipo de Actividad
Tabla 4 Actividad
44
Estadística
- Covarianza Datos
MEDIDAS DE ASOCIACIÓN LINEAL
- Correlación Cuantitativos
x
x1 Recordemos que: Hasta ahora hemos estudiado las medidas tendencia
central (Media, Mediana, Moda) y dispersión
x2 (Varianza y Desviación Estándar) para una Variable
Cuantitativa (x).
xn
Covarianza: Es una medida de Variabilidad Conjunta entre dos variables (x1 , x2) o bien (x , y)
1 n
x y cov( x , y ) ( xi x )( yi y )
y( 1 ) n i 1
x(1)
y( 2 ) Si Cov(x,y) es positiva: la asociación entre x e y es directamente proporcional,
x( 2 ) es decir que cuando x aumenta y también aumenta; y viceversa.
Si Cov(x,y) es negativa: la asociación entre x e y es inversamente proporcional,
x(n) y( n )
es decir que cuando x aumenta y disminuye; y viceversa.
Si Cov(x,y) es cero: no existe asociación entre x e y.
45
Estadística
- Covarianza Datos
MEDIDAS DE ASOCIACIÓN LINEAL
- Correlación Cuantitativos
Correlación: Se refiere al grado de asociación entre dos variables (x1 , x2) o bien (x , y)
Coeficiente de Correlación de Pearson (r): Mide el grado de Asociación Lineal
entre dos variables Cuantitativas
n
xi yi nxy
x y
cov( x , y )
x(1) y( 1 ) r 1 r 1
sx s y r i 1
x( 2 ) y( 2 ) ( n 1 )s x s y
Si r es positivo: la asociación entre x e y es directamente proporcional, es decir que
x(n) y( n ) cuando x aumenta y también aumenta; y viceversa. Si r=1: la asociación lineal es
perfecta.
Si r es negativo: la asociación entre x e y es inversamente proporcional, es decir
que cuando x aumenta y disminuye; y viceversa. Si r=-1: la asociación lineal es
perfecta.
Si r es cero: no existe asociación entre x e y.
46
Estadística
r=1 r=-1
47
Estadística
Datos Cuantitativos
Datos Cuantitativos
REGRESION LINEAL SIMPLE
x y
x(1) y( 1 ) Notación
x( 2 ) y( 2 ) Variable Respuesta: y
Variable Explicativa: x
y( n ) Modelo de Regresión Lineal Simple: yi=+xi+ei
x(n)
Intercepto:
Pendiente:
Error: e
Modelo Estimado
(recta de regresión) Método de Estimación: Mínimos Cuadrados
a y bx
n n n
yˆ a bx
Residuos o Errores
n xy xi yi ei yi yˆ i
b i 1 i 1 i 1
2
n
n
n x xi
2
i 1 i 1
49
Estadística
51
Estadística
Modelo Estimado
yˆ a bx
b 2,44 a 53,64
yˆ 53 ,64 2,44 x
5 3 62 61,0 1,0
6 4 65 63,4 1,6
7 9 74 75,6 -1,6 Bondad de Ajuste del Modelo
8 8 75 73,2 1,8 R2 = 0,77
9 9 73 75,6 -2,6
10 7 69 70,7 -1,7 De acuerdo al coeficiente de
11 6 73 68,3 4,7 determinación, el modelo ajustado
12 5 68 65,8 2,2 a los datos es adecuado (R2
13 8 73 73,2 -0,2
cercano a 1)
14 6 71 68,3 2,7
53