1er PYE
1er PYE
1er PYE
SECRETARIA ACADEMICA
CECYT “WILFRIDO MASSIEU PÉREZ”
Probabilidad y Estadística
6º. Semestre
GUÍA DE APRENDIZAJE
ESTADISTICA
Es la ciencia de la recopilación,
clasificación
Presentación e interpretación de
datos
Se clasifica
DESCRIPTIVA INFERENCIAL
DATOS: Conjunto de valores de la variable medidos a partir de cada uno de los elementos
de una población o muestra.
REPRESENTACIONES TALLO-HOJA
Ordenar datos es forma una lista de ellos en un orden dado de acuerdo con su valor
numérico, los valores de los datos se utilizan parar efectuar tal ordenación. El tallo se
forma con el (los) primer(os) dígito(s) del dato, mientras que la hoja se forma con los
demás dígitos siguientes.
Por ejemplo, el valor numérico 458 se dividiría en 45-8 como se muestra a continuación.
45 8
Utilizados en la ordenación Mostrados en la representación
82 74 88 66 58 74 78 84 96 76
62 68 72 92 86 76 52 76 82 78
Por simple inspección notemos que los datos varían dentro de los grupos 50, 60, 70, 80,
90, de tal forma que el primer digito de cada dato debe utilizarse como tallo y el segundo
como hoja, es decir:
5 2 8
6 2 6 8
7 2 4 4 6 6 6 8 8
8 2 2 4 6 8
9 2 6
8 23 18 22 22 15 21 23 25 18 24
22 21 37 19 22 22 12 27 16 26 32
6726 6796 6946 6197 6368 6437 6434 6740 6886 6197
6582 6297 6811 6102 6261 6919 6086 6320 6139 6420
Construya una representación tallo-hoja para estos datos. (Utilícense los dos primeros
dígitos como tallo, y los dos dígitos sucesivos como hojas)
Una lista de un conjunto de datos muy extensa, no indica nada al momento de analizarla,
es por ello que algunas ocasiones es más sencillo condensar los datos en una forma más
manejable, es entonces cuando recurrimos a realizar una distribución de frecuencia.
r
i=
nc
de no ser entero el resultado, se redondea al entero superior la cual
altera el rango, por lo que ajustamos la formula anterior.
Nuevo rango = i nc
Ejemplo.
24
i = = 4 iniciando con el dato 8 y sumando 4 obtenemos 12 lo cual representa el
6
primer intervalo y se continua de la misma forma, esto es:
Las tres formas de gráficas más usadas son histogramas, polígonos de frecuencia y
distribuciones de frecuencias acumuladas (ojiva).
a) Sus bases sobre un eje horizontal (X) con centros en las marcas de clase (x) y
longitud igual al tamaño de los intervalos de clase.
Polígono de Frecuencia.
Grafica Circular.
Ejemplo:
Una muestra de diez cines en una gran área metropolitana dio el número total de películas
exhibidas la semana anterior. Calcule la media de las películas proyectadas.
61
X = = 6.1 películas.
60
n
− f acum (i −1)
Md = Li + 2 A
f mediana
Donde:
f acum (i −1)
= frecuencia acumulada anterior al intervalo mediano.
[ 21 - 31 ] 25 20 28
[ 32 - 42 ] 35 14 42
[ 43 - 53 ] 45 8 50
[ 54 - 64 ] 55 2 52
[ 65 - 75 ] 65 2 54
[ 76 - 86 ] 75 1 55
55 enfermos
atendidos
n
Determinemos el dato medio de los datos, como n = 55 entonces = 27.5
2
Sustituyendo tenemos
27.5 − 8
Md = 21 + 10 = 30.75
20
Δf i
Mo = Li + A
Δf i + Δf s
Donde
f m − f ( m−1)
Mo = Li + A
2 f m − f (m−1) − f (m+1)
Donde
Δf i = f m − f ( m −1)
Δf s = f m − f ( m −1)
Por lo que basta sustituir estos valores en una de ellas para encontrar la otra expresión.
Ejemplo:
[ 21 - 31 ] 25 20
[ 32 - 42 ] 35 14
[ 43 - 53 ] 45 8
[ 54 - 64 ] 55 2
[ 65 - 75 ] 65 2
[ 76 - 86 ] 75 1
55 enfermos
atendidos
Identificamos que
Li = 21 Δ i = 20 − 8 = 12 Δ s = 20 − 14 = 6 A = 10
Sustituyendo tenemos
12
Mo = 21 + 10 = 27.66
12 + 6
MEDIDAS DE DISPERSION.
Al grado en que los datos numéricos tienden a extenderse alrededor de un valor medio se
le llama variación o dispersión de los datos. Se utilizan distintas medidas de dispersión, las
más empleadas son el rango, la desviación media, la desviación típica y la varianza.
n −
∑ fi xi − x
i=1
DM = n
∑ fi
i=1
2
n
⎛ −⎞
∑ fi ⎜⎝ xi − x ⎟⎠
i=1
s = n
∑ fi
i=1
−
x − x ⎛ −⎞
2
⎛ −⎞
⎛ −⎞
2
Altura x ⎜ x − x⎟ f f ⎜ x − x⎟ f⎜ x − x ⎟
(pulgadas) ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
[ 60 – 62 ] 61 -6.45 41.6025 5 32.25 208.0125
226.5
DM = = 2.26 pulgadas
100
852 .75
s = = 8.5275 = 2.92 pulgadas
100
s2 = 8.5275
MEDIDAS DE POSICIÓN.
CUARTILES
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro
partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente
la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto
(25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual
o por debajo del cual quedan las tres cuartas partes (75%) de los datos.
Q1 Q2 Q3
k
∑f − fa
Q k = Li + 4 A
fk
Donde:
k = 1, 2, 3
[ 21 - 31 ] 25 20 28
[ 32 - 42 ] 35 14 42
[ 43 - 53 ] 45 8 50
[ 54 - 64 ] 55 2 52
[ 65 - 75 ] 65 2 54
[ 76 - 86 ] 75 1 55
55 enfermos
atendidos
, ∑
f 55
k=1 = = 13.75 lo cual se encuentra en la segunda clase.
4 4
L2 = 21 fa = 28 f2 = 20 A = 10 sustituyendo
13.75 − 28
Q1 = 21 + 10 = 13.875
20
DECILES
Los decíles son los nueve valores que dividen al conjunto de datos ordenados en diez
partes porcentualmente iguales.
Hay nueve decíles denotados usualmente D1, D2,.., D9 El quinto decíl es precisamente la
mediana.
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D1 D2 D3 D4 D5 D6 D7 D8 D9
k
∑f − fa
Dk = Li + 10 A
fk
k = 1,...,9
[ 21 - 31 ] 25 20 28
[ 32 - 42 ] 35 14 42
[ 43 - 53 ] 45 8 50
[ 54 - 64 ] 55 2 52
[ 65 - 75 ] 65 2 54
[ 76 - 86 ] 75 1 55
55 enfermos
atendidos
k∑ f 6(55 )
k = 6 , = = 33 lo cual se encuentra en la tercera clase.
10 10
L2 = 32 fa = 42 f2 = 14 A = 10 sustituyendo
33 − 42
D6 = 32 + 10 = 24.857
14
PERCENTILES
Hay nueve decíles denotados usualmente P1, P2,.., P99 El 50º percentil es precisamente la
mediana.
1% 1% 1% ::::: 1% 1% 1% 1%
k
∑f − fa
Pk = Li + 100 A
fk
Donde:
k = 1,...,99
[ 21 - 31 ] 25 20 28
[ 32 - 42 ] 35 14 42
[ 43 - 53 ] 45 8 50
[ 54 - 64 ] 55 2 52
[ 65 - 75 ] 65 2 54
[ 76 - 86 ] 75 1 55
k∑ f 83(55 )
k = 83 , = = 45.65 lo cual se encuentra en la cuarta clase.
100 100
L2 = 43 fa = 50 f2 = 8 A = 10 sustituyendo
45.65 − 50
D6 = 43 + 10 = 37.56
8
EJERCICIO 1
Los miembros de una cooperativa de viviendas tienen las siguientes edades:
42 60 60 38 60 63 21 66 56 57 51 57 44 45 35
30 35 47 53 49 50 49 38 45 28 41 47 42 53 32
54 38 40 63 48 33 35 61 47 41 55 53 27 20 21
42 21 39 39 34 45 39 28 54 33 35 43 48 48 27
53 30 29 53 38 52 54 27 27 43 28 63 41 23 58
56 59 60 40 24
EJERCICIO 2.
Una compañía de transmisiones electrónicas registro como sigue el número de recibos de
servicios prestados por cada una de sus 20 sucursales en el último mes:
808 641 628 731 641 446 342 545 910 568
335 459 727 848 229 347 309 649 575 757
La compañía piensa que una tienda realmente no puede esperar alcanzar financieramente
el punto de equilibrio con menos de 456 servicios prestados mensualmente. Además su
política es dar un bono financiero al gerente que genere más de 683 servicios al mes.
Disponga los datos en una arreglo e indique cuántas sucursales no están consiguiendo el
punto de equilibrio y cuántas ganan el bono
EJERCICIO 3.
77 18 63 84 38 54 50 59
54 56 36 50 50 34 44 41
58 58 53 62 62 43 52 53
63 62 62 61 61 52 60 60
45 66 83 63 63 58 61 71
MEDIDAS DE FORMA
MEDIDAS DE ASIMETRIA