Estadística
Estadística
Estadística
Matemática
Estadística
3
ÍNDICE
1. Población y muestra.............................................. 6
2. Estadística Descriptiva ......................................... 9
Ejercicios 2-1 ........................................................ 12
Hoja de respuestas 2-1 ........................................ 16
3. Amplitud de una variable................................... 21
4. Intervalos de clase............................................... 25
5. Gráficos. Histogramas, polígonos de
frecuencia, tortas, barras......................................... 30
6. Medidas de centralización ( de posición o de
tendencia central)..................................................... 39
7. Moda ..................................................................... 44
8. estadística. Ejercicios ......................................... 47
Hoja de respuestas ............................................... 50
9. Medidas de dispersión (o de desviación) ......... 53
10. Desviación Media.............................................. 56
11. Desviación estándar (s) .................................... 61
12. Varianza.............................................................. 64
13. Distribución normal - curva de Gauss.......... 69
Ejercicios 13-1...................................................... 75
Hoja de respuestas 13-1 ...................................... 78
14. Correlación......................................................... 80
14.1 ¿Cómo se calcula el coeficiente de
correlación lineal? ............................................... 92
4
14.2 Ejercicios ...................................................... 98
15. Media, Moda y Mediana................................. 103
5
1. POBLACIÓN Y MUESTRA
Por ejemplo:
Si se efectúa un censo ganadero
población el conjunto de
animales
6
población el conjunto de
salarios
Población Total de
personas existentes
7
Para que los estudios realizados sobre la
población sean válidos, la muestra debe ser repre-
sentativa de la población. Por ejemplo, si se quiere
estudiar la incidencia del mal de Chagas en la Pro-
vincia del Chaco, y se toma una muestra de pobla-
ción perteneciente sólo a la ciudad de Resistencia,
el estudio estadístico no es válido, ya que se está
estudiando sólo individuos de la zona metropoli-
tana, dejando de lado la zona rural. En este caso se
dice que la muestra no es representativa de la po-
blación.
EJERCICIOS
8
2. ESTADÍSTICA DESCRIPTIVA
9
Ciencia que utiliza conjuntos de datos
numéricos para obtener a partir de ellos
inferencias basadas en el cálculo de pro-
babilidades.
El lenguaje de la estadística
Vamos precisar algunos términos propios del
lenguaje estadístico:
10
Carácter estadístico: Cada una de las propie-
dades (aspectos) que pueden estudiarse en los
individuos de una población recibe el nombre de
carácter.
Un carácter puede ser cuantitativo si se puede
medir.
Un carácter es cualitativo si no se puede me-
dir, o sea se puede comparar.
11
EJERCICIOS 2-1
EJERCICIO 1
12
EJERCICIO 2
EJERCICIO 3
13
a- Completá la tabla dada
b- Calculá la moda, media y mediana
c- Graficá
EJERCICIO 4
14
EJERCICIO 5
a- Completá la tabla
b- Calculá la media de los libros leídos por per-
sona
c- Calculá la varianza y desvío estándar.
d- Realizá el grafico de tortas o circular.
15
HOJA DE RESPUESTAS 2-1
EJERCICIO 1
a-
Longitud de Marca o Frecuencia Frecuencia Marca de
las varillas intervalo Relativa clase x
(en m) de clase frecuencia
50-59 54,5 4 0,111 218
60-69 64,5 6 0,166 387
70-79 74,5 12 0,333 894
80-89 84,5 10 0,277 845
90-99 94,5 4 0,111 378
Total 36 0,998 2722
b-
La media aritmética es 75,6 m
La mediana se encuentra en el intervalo 70-79;
es exactamente 76 m
La moda es la longitud de varillas de 70-79
16
c-
15
10
0
50-59 60- 69 70- 79 80-89 90-99
EJERCICIO 2
a-
Resultados 30-32 33-35 36-38 39-41 42-44 45-47 48-50
F (EE.UU.) 5 5 10 15 40 15 10
Punto medio 31 34 35 40 43 46 49
b-
Poligono de frecuencia (Capacidad de alumnos
de matemática)
45
40
35
30
25
20
15
10
5
0
30-32 33-35 36-38 39-41 42-44 45-47 48-50
17
c- La varianza es 13,3 m y el desvío estándar
es 3,6 m
EJERCICIO 3
a-
KG. 140-144 145-149 150-154 155-159 160-164 165-169
Frecuencia 5 7 10 16 8 4
Frecuencia 0,1 0,14 0,2 0,32 0,16 0,08
relativa
b-
La moda es el intervalo 155-159
La media aritmética es 154,7 Kg.
La mediana es 155,75 Kg.
c-
20
15
10
0
140-144 145-149 150-154 155-159 160-164 165-169
18
EJERCICIO 4
a- X=9
b- El valor menor valor que puede tomar x es
9
c- El mayor valor positivo de x es 15
EJERCICIO 5
a-
Nº de 0 1 2 3 4 5 6 7 8
libros
Frecuencia 5 5 6 9 11 7 4 2 1
Frecuencia 0,1 0,1 0,12 0,18 0,22 0,14 0,08 0,04 0,02
relativa
b- La media es 3,38
c- La varianza es 1,26 y el desvío estándar es
1,12
19
d-
20
3. AMPLITUD DE UNA VARIABLE
Amplitud:
Es la diferencia entre el valor máximo y
mínimo que puede tomar la variable
Amplitud = xmáx - xmin
EJEMPLO 1
21
Nº de hijos fi
xi
0 2
1 5
2 7
3 4
4 1
5 1
EJEMPLO 2
22
Temperaturas fi
15º 12
16,5º 5
17,2º 8
17,5º 7
18,2º 1
EJEMPLO 3:
23
Salarios ($) Frecuencias
50 – 69,99 5
70 – 89,99 12
90 – 109,99 10
110 – 129,99 15
130 – 149,99 18
150 – 169,99 31
170 – 189,99 35
24
4. INTERVALOS DE CLASE
EJEMPLO 1
25
Primer paso:
● Calculamos la amplitud
A = xmax - xmin
A= 147 –124
A= 23
Segundo paso:
● Determinamos el número de intervalos
Como la muestra tiene 24 individuos, se de-
terminarán 6 intervalos de amplitud 4 ya que
23
≅4
6
Tercer paso:
● Determinamos los intervalos.
El primer intervalo se toma a partir del valor
mínimo. Para evitar que los extremos del intervalo
coincidan con un valor de la variable se los define
restando media unidad del último decimal.
26
124 – 0,5=123, 5
123,5 + 4 = 127,5
27
EJEMPLO 2
Primer paso:
● Calculamos la amplitud.
A = xmax - xmin
A = 97 – 57
A = 40
Segundo paso:
● Determinamos el número de intervalos
40
= 8 . Formamos 5 intervalos de ampli-
5
tud 8.
28
Tercer paso:
● Determinamos los intervalos.
56,5 – 64,5 4
64,5 – 72,5 6
72,5 – 79,5 11
79,5 –87,5 7
87,5 – 95,5 2
95,5 - 103,5 2
29
5. GRÁFICOS. HISTOGRAMAS, PO-
LÍGONOS DE FRECUENCIA, TOR-
TAS, BARRAS
HISTOGRAMAS
EJEMPLO:
30
Altura Cantidad de árboles
60-62 5
63-65 18
66-68 42
69-71 27
72-74 8
Total 100
31
POLÍGONOS DE FRECUENCIAS
Polígono de frecuencias:
Es un gráfico de línea trazado sobre los pun-
tos medios. Se obtiene uniendo los puntos me-
dios de los lados opuestos a las bases de los rec-
tángulos en el histograma; incluyendo el anterior
al primero y el posterior al segundo.
32
EJEMPLO:
33
GRAFICO DE TORTA
EJEMPLO:
34
Zonas Superficies
11,7
África
Asia 10,4
Europa 1,9
Norteamérica 9,4
Oceanía 3,3
Sudamérica 6,9
Centroamérica 7,9
35
51,7 millones 360º
1,9 millones x = 13º 13´
(Europa)
36
GRAFICO DE BARRAS
EJEMPLO:
Tierra 18,5
Marte 15,0
Júpiter 8,1
Saturno 6,0
Urano 4,2
Neptuno 3,4
Plutón 3,0
37
Gráfico de barras
38
6. MEDIDAS DE CENTRALIZA-
CIÓN ( DE POSICIÓN O DE TEN-
DENCIA CENTRAL)
39
EJEMPLO 1
2 9 20
3 5 25
4 10 35
5 12 47
6 3 50
Total 50
40
Como la frecuencia acumulada es 25 le co-
rresponde el número de dado 3. Entonces la me-
diana es 3.
EJEMPLO 2
60 – 69,99 10 18
70 – 79,99 16 34
80 – 89,99 14 48
90 – 99,99 10 58
100 – 109,99 5 63
110 – 119, 99 2 65
Total 65
41
n 65
Como = = 32,5 .
2 2
Como 32,5 está contenido en la frecuencia
acumulada 34, la mediana está en el intervalo 70 –
79,99.
42
Reemplazando en la fórmula:
n 65
− F1 − 18
M = L1 + 2 .c = 70 + 2 .9,99 ⇒ M = $79,06
f mediana 16
Gráficamente
En un histograma
Sueldos de em pleados
20 l 50 – 59,99
15 60 – 69,99
em pleados 10 70 – 79,99
5 80 – 89,99
0 90 – 99,99
1 100 – 109,99
sueldos 110 – 119, 99
m
43
7. MODA
44
Moda
El dato que se repite más veces, es decir, el de
mayor frecuencia, es la moda. Tiene la ventaja de
que es una medida que también es válida para
datos no numéricos. Es muy común y se utiliza
cotidianamente para describir la tendencia en el
vestuario de cada año.
Ejemplo
En la siguiente tabla, x i = 2 tiene la mayor
frecuencia, f i = 7.
xi fi
0 2
1 5
2 7 La moda es 2
3 4
45
4 1
5 1
Σ 20
Ejemplos
46
8. ESTADÍSTICA. EJERCICIOS
EJERCICIO 1
a- La media aritmética.
b- La mediana.
c- La moda.
d- El rango.
EJERCICIO 2
a- La media aritmética.
b- La mediana.
47
c- La moda.
d- El rango
EJERCICIO 3
a- La media aritmética.
b- La mediana.
c- La moda.
d- El rango.
EJERCICIO 4
48
a- La media aritmética.
b- La mediana.
c- La moda.
EJERCICIO 5
a- La media aritmética.
b- La mediana.
c- El rango.
49
HOJA DE RESPUESTAS
EJERCICIO 1
EJERCICIO 2
50
EJERCICIO 3
a- X = 1,682
b- Mediana = 1,68
c- Moda = 1,72
d- Rango = 0,24
EJERCICIO 4
a- 35,2
b- 29
c- 83
51
EJERCICIO 5
52
9. MEDIDAS DE DISPERSIÓN (O
DE DESVIACIÓN)
Me
53
Me
Desviación media =
∑ x−x
n
∑ (x )
2
i −x fi
s=
n
54
● la varianza
∑ (x )
2
2 i −x fi
s =
n
55
10. DESVIACIÓN MEDIA
Recordá que:
Desviación
56
La desviación no es una medida, son muchas
medidas, pues cada valor de la variable lleva aso-
ciada su correspondiente desviación, por lo que
precisaremos una medida que resuma dicha in-
formación. Si sumamos las desviaciones con res-
pecto de la media podríamos obtener una estima-
ción de la cantidad característica de desviación con
respecto a la media. Entonces,dividiendo por n
(número de observaciones), tendríamos una me-
dida análoga a la medid aritmética, excepto que
representaría la dispersión promedio de las califi-
caciones con respecto a la media.
Pero, teniendo en cuenta las características
de la media, encontramos una seria dificultad: la
suma de las desviaciones de todos los valores ob-
tenidos con respecto a la media, debe valer cero.
Así, si definimos la desviación media como esta
suma dividida por n, la desviación media tendría
que ser cero.
57
Recordá que:
( )
de medidas respecto del cual la suma de las
desviaciones es igual a cero: Σ x − x = 0
Desviación media
Σx−x
dm =
n
58
Referencias:
Σ: sumatoria
x : media aritmética
n: número de observaciones
dm =
Σ f x−x( )
n
Ejemplo
● Hallá la desviación media de los nú-
meros 2, 3, 6, 8, 11.
59
2 + 3 + 6 + 8 + 11
Media aritmética = x = =6
5
Desviación media =
2 − 6 + 3 − 6 + 6 − 6 + 8 − 6 + 11 − 6
dm =
5
−4 + −3 + 0 + 2 + 5
dm =
5
4+3+0+ 2+5
dm =
5
dm = 2,8
60
11. DESVIACIÓN ESTÁNDAR (S)
s=
(
Σ xi − x )
2
n
Para datos presentados en forma de distribu-
ción de frecuencia, la fórmula de la desviación
estándar es:
s=
( )
2
Σ xi − x . f
n
Recordá que:
61
Observación:
Dos distribuciones de datos pueden tener la mis-
ma media y ser muy diferentes.
Ejemplo
x x−x (x − x )2
9 4 16
8 3 9
7 2 4
7 2 4
7 2 4
5 0 0
5 0 0
5 0 0
5 0 0
4 -1 1
4 -1 1
3 -2 4
3 -2 4
2 -3 9
1 -4 16
62
● Con estos datos recopilamos la siguiente
información:
Σ x = 75 (
Σ x−x =0 )
(
Σ x−x )2
= 72 n = 15 x=5
s=
(
Σ xi − x )
2
63
12. VARIANZA
s =
2 (
Σ xi − x )2
64
Cálculo de la Varianza en una serie de fre-
cuencias
s =
2 (
Σ xi − x . f )
2
s =
2 (
Σ xm − x . f i) 2
65
En todos los casos: xi: es el i-ésimo dato
: es la media aritmética para datos no agru-
pados
n: es el número de datos
Σ: sumatoria
66
EJEMPLO 1
5 9 12 7 15 3
SOLUCIÓN
67
● Llegando entonces a que la varianza para
este conjunto de datos es 16.58.
68
13. DISTRIBUCIÓN NORMAL -
CURVA DE GAUSS
Media
69
Este gráfico se denomina campana de Gauss
(debido a su forma acampanada) o distribución
normal. La distribución de muchas variables pa-
rece seguir la curva normal. Por ejemplo, caracte-
res de individuos (personas, animales, plantas) de
una misma especie (altura, peso). También hay
variables discretas que tienen una distribución
parecida, como el número de caras al lanzar un
cierto número de monedas.
2
1 x−µ
−
1 2 σ
f ( x) = e
σ 2π
70
La gráfica de estas funciones tiene forma de
campana con un eje de simetría. Las funciones de
este tipo están completamente determinadas por
su media µ, y su desviación típica, σ.
71
EJEMPLO
72
En inglés
72 puntos
µ=65
En Historia
72 puntos
µ=65
73
En Inglés, muy pocos superaron el 72 %, por
lo tanto, se trata de un resultado muy bueno.
74
EJERCICIOS 13-1
EJERCICIO 1
EJERCICIO 2
EJERCICIO 3
75
profesor quiere poner sobresaliente a un 15% de
la clase
! ¿A partir de qué nota debe poner sobresa-
liente?
EJERCICIO 4
76
EJERCICIO 5
77
HOJA DE RESPUESTAS 13-1
EJERCICIO 1
a- 0,0968
b- 0,1587
c- 0,6207
EJERCICIO 2
0,5859
EJERCICIO 3
z − 6,4
P(Z ≤ z)=0,85 ⇒ z ' = ⇒ z = 7,96,
por lo tanto la nota debe ser 8.1,5
EJERCICIO 4
a- 955
b- 308
78
c- 988
EJERCICIO 5
0,0281
79
14. CORRELACIÓN
80
Para que exista este tipo de relación debe
haber una función que, conocida una de las varia-
bles, me permite calcular aproximadamente la
otra, esto se cumple en los tres primeros ejemplos,
cuando exista dicha relación diremos que las va-
riables están correlacionadas o que hay correla-
ción entre ellas.
DIAGRAMAS DE DISPERSIÓN
81
Formamos con ellos pares ordenados (x , y ), la
primera coordenada corresponde a una variable y
la segunda a la otra, por ejemplo, las x correspon-
derán a las alturas de los padres y las y a las de sus
hijos; o las x a la nota de matemática y la y a la de
física; etc.
82
EJEMPLOS
1.
1.200.000
1.000.000
800.000
600.000
400.000
200.000
0
83
2.
10
0
0 10 20 30 40
Punt o s
84
3.
300.000
250.000
200.000
150.000
100.000
50.000
85
COVARIANZA Y COEFICIENTE DE CORRELA-
CIÓN
Desvío típico
∑x i
2
2
σx = i =1
−x
n
∑y i
2
2
σy = i =1
−y
n
Donde xi e yi son cada uno de los datos de ca-
86
Covarianza
∑ (x i − x )( y i − y)
σ xy = i =1
n
Notemos, a partir de la fórmula, que si la ma-
yoría de los valores de x e y son, para cada par de
datos, superiores los dos o inferiores los dos a las
respectivas medias, esto implica que:
87
cada variable, o por algún dato demasiado alejado
del centro de gravedad. Para corregir estas defi-
ciencias se define el coeficiente de correlación
lineal.
σ xy
ρ=
σ xσ y
Observaciones:
88
# Si ρ es muy próximo a cero no hay corre-
lación lineal entre los datos.
CORRELACIÓN NO LINEAL
89
El siguiente gráfico muestra la relación entre la in-
versión en publicidad de una empresa y sus ventas.
Se observa que la publicidad hace aumentar las ven-
tas, pero no indefinidamente ni de forma lineal.
Las variables están fuertemente relacionadas pero la
nube no se ajusta a una recta: se trata de un caso de
correlación no lineal.
RECTA DE REGRESIÓN
90
los puntos de la muestra. Esta recta se conoce
como recta de regresión y su ecuación es :
σ xy
y−y= (x − x)
σx
91
14.1 ¿CÓMO SE CALCULA EL CO-
EFICIENTE DE CORRELACIÓN
LINEAL?
Recordá que:
σx y
r=
σx . σ y
• Si r es 1 (o próximo a 1), la depen-
dencia es funcional (o casi funcional):
los puntos están alineados (o casi ali-
neados).
92
Cálculo de r
Ejemplo
En un experimento sobre la distancia de fre-
nado de un auto dependiendo de su velocidad, se
obtuvieron los siguientes datos:
Velocidad 70 50 45 120 85 65
(km/h)
Distancia 32 18 19 43 35 34
(m)
Solución
1º Paso: Antes, debemos calcular previamente
x, y, σ x , σ y , σ xy
n n
∑ (xi − x )( yi − y ) = ∑ xi yi − x .y
1 1
σx y =
n i =1
n i =1
93
∑x
1 2
σx = i − x2
n
∑y
1 2
σy = i − y2
n
Si llamamos x a la velocidad e y a la distan-
cia. Entonces, obtenemos que:
x = 72 ,5
y = 30 ,16
2º Paso: Reemplazando en las fórmulas los
datos y los promedios, calculamos
$ Desviación típica de x:
∑x
1 2
σx = i − x2
n
σ x = 24 ,95
$ Desviación típica de y:
∑y
1 2
σy = i − y2
n
σ y = 8,93
$ La covarianza es:
94
n n
∑ (xi − x )( yi − y ) = ∑ xi yi − x .y
1 1
σx y =
n i =1
n i =1
σ xy = 201,91
95
determinada, generando así el criterio intuitivo de
correlación con una recta, parábola, exponencial,
etc.
Estas correlaciones son confirmadas o no por
el cálculo de los coeficientes en cada caso.
50
45
40
35
30
25
20
15
10
5
0
0 20 40 60 80 100 120 140
Rectas de regresión
Cuando existe correlación entre dos variables
–cuanto más fuerte mejor- es útil trazar la recta
que “mejor se ajuste” a los puntos de la nube.
Esta recta llamada recta de regresión de y sobre x,
tiene la siguiente ecuación:
96
σx y
y− y = (x − x )
σ 2x
202,91
y − 30,16 = (x − 72,5)
(24,95)2
y − 30,16 = 0,32(x − 72,5)
y = 0,32 x − 23,2 + 30,16
y = 0,32 x + 6,96
50
45
40
35
30
25
20
15
10
5
0
0 20 40 60 80 100 120 140
97
14.2 EJERCICIOS
EJERCICIO 1
Matemática 2 2 4 4 4 5 6 6 7 8 9 9
Física 2 4 3 4 6 7 5 6 8 7 7 10
98
EJERCICIO 2
Diámetro 10 15 16 21 30 25 30 35
(cm)
Edad 4 8 12 18 22 26 30 32
(años)
99
EJERCICIO 3
Longitud 50 52 55 58 61 62 65
(cm)
Peso (Kg.) 3,3 3,9 4,5 5,2 5,6 6,2 6,7
EJERCICIO 4
100
trabajo de Ciencias Naturales. En la tabla, se en-
cuentran los datos:
Peso 42 43 47 50 55 60 65 70
(Kg.)
Altura 140 155 158 145 150 155 162 160
(cm)
EJERCICIO 5
101
Planeta Distancia (106 Período (años)
Km.)
Mercurio 58 0,24
Tierra 150 1
102
15. MEDIA, MODA Y MEDIANA
103
EJEMPLO
Media =
Moda
104
Por ejemplo, si evaluamos estadísticamente los
colores de los autos que salen de una concesiona-
ria podremos ver cual de ellos tiene mas frecuen-
cia de venta, lo que establecerá lo que denomina-
mos moda.
EJEMPLO
105
A
Notas Frecuencia
2 3
3 4
5 1
7 2
8 6
9 2
10 4
Total 22
Moda A = 6
Notas Frecuencia
5 5
6 6
7 7
8 3
9 1
total 22
Moda B = 7
106
• La moda siempre es uno de los valores
registrados.
• Cuando en el conjunto de observaciones
hay una sola moda, se dice que la distribu-
ción es unimodal.
• Si hay dos valores con la misma frecuencia
máxima la distribución se llama bimodal
• La moda no necesariamente coincide con
la media aritmética.
MEDIANA
107
Dicho de otra manera, es el valor donde por
encima de él se encuentra el 50% del total y por
debajo el otro 50%.
Ejemplo
Mediana = $ 5 000
108
HOJA DE RESPUESTAS
EJERCICIO 1
a- El coeficiente de correlación es r = 0, 84
12
10
0
0 1 2 3 4 5 6 7 8 9 10
109
EJERCICIO 2
EJERCICIO 3
8
7
6
5
peso
4
3
2
1
0
0 10 20 30 40 50 60 70
longitud
110
b- r = 0, 995
c- Como r > 0 la nube es ascendente y la co-
rrelación positiva. Por lo tanto es los pun-
tos están alineados o casi alineados.
d- La ecuación de la recta es y = 0, 22 x – 7,
772
e- Grafica de la ecuación lineal:
8
7
6
5
peso
4
3
2
1
0
0 10 20 30 40 50 60 70
longitud
EJERCICIO 4
111
b- La recta de regresión lineal es y = 0, 47 x
– 127, 7. Su grafica es:
165
160
155
altura
150
145
140
135
0 10 20 30 40 50 60 70 80
peso
EJERCICIO 5
a- La tabla es la siguiente:
112
140,6596 470910952
865,5364 2918076589
b- El coeficiente de correlación es r = 0, 99
113