Resumen y Ejercicios de Estadística Unidimensional
Resumen y Ejercicios de Estadística Unidimensional
Resumen y Ejercicios de Estadística Unidimensional
Nociones de estadística.
Estadística.-
De forma sencilla podemos decir que la Estadística es la ciencia que tiene como objetivo reunir la
información que, tras ser organizada, analizada e interpretada, facilita la toma de decisiones futuras.
Llamamos variable estadística a cada una de las características que pueden estudiarse de la
población.
Las variables estadísticas pueden ser fundamentalmente de dos tipos:
Cualitativas: Expresan una cualidad y. no se pueden medir numéricamente. Ejemplos: color preferido de un
grupo de gente; tipo de música que te gusta; problema medio ambiental que te preocupa más, etc.
Cuantitativas: Pueden expresarse mediante números. A su vez, las variables cuantitativas se pueden
clasificar en:
Discretas: cuando toman valores aislados. Por ejemplo: número de hermanos (puede ser 1,
2, 3...., etc.).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la
velocidad de un vehículo puede ser 58,2 km/h, 80,69 km/h...etc.
Al conjunto total de personas o de objetos de los que nos interesa conocer una determinada
opinión o característica es a lo que llamamos población.
Por ejemplo, si estudiamos en una ciudad la preferencia sobre programas de T.V, la población sería
el total de los habitantes de dicha ciudad; pero preguntar a toda la población normalmente es imposible,
así que habrá que elegir un grupo que la represente de forma adecuada.
Al grupo elegido para que responda al cuestionario o del que se van a recoger determinados
datos, se le denomina muestra. Tamaño de la muestra es el número de elementos que compone la
muestra.
Una vez determinados los conceptos de población y muestra, nos queda también otro
interesante, que es el de individuo.
A cualquier elemento de la población que se estudia, le llamamos individuo.
Pág- 1 -
I.E.S. Luis Carrillo de Sotomayor (Baena)
1º Bachillerato CCSS Semipresencial. Nociones de estadística.
Una tabla de frecuencias sirve para relacionar los distintos resultados de la variable con la cantidad
de veces que han aparecido dichos resultados. Su Valores de Frecuencia Frecuencia Porcentaje
forma general es la siguiente: la variable absoluta relativa (%)
.
fi
xi fi hi pi=100 hi
Se ha empleado esta simbología: N
Valores de la variable: la propiedad que se mide, ya sea cualidad o número.
Frecuencia absoluta: número de veces que se repite un dato. Se representa por fi .(Nota: la suma de los
elementos de esta columna será “N”, número total de datos).
Frecuencia relativa: la proporción de un dato en el total (realmente es el “tanto por uno”). Se representa por
hi. (Nota: la suma de los elementos de esta columna será “1”).
Porcentaje o tanto por ciento (%): significado semejante a la frecuencia relativa pero expresando en “tanto
por ciento”. (Nota: la suma de los elementos de esta columna será “100”)
Frecuencia absoluta acumulada: calcula la frecuencia absoluta de un valor más la de todos los que están
antes de él. Se representa por Fi .
Frecuencia relativa acumulada: calcula la frecuencia relativa de un valor más la de todos los anteriores. Se
representa por Hi .
Tanto por ciento acumulado: calcula el tanto por ciento de un valor más el de todos los anteriores.
Estudio de una variable cualitativa.- Este caso está más limitado en cuánto a los cálculos.
Tipo de programa fi hi %
Deportivo 5 0,25 25%
Informativo 3 0,15 15%
Series 6 0,30 30%
Debate 2 0,10 10%
Concurso 4 0,20 20%
20 1 100,00% Para la
gráfica
hemos utilizado el “diagrama de barras”.
Estudio de una variable cuantitativa discreta
Veamos un ejemplo, también resuelto: En un Centro de educación secundaria se pregunta a 40 alumnos por
el número de hermanos que tienen; el resultado es el siguiente:
1,1,1,2,3,4,4,2,0,0,0,1,2,1,0,1,0,2,3,1,0,0,0,1,1,2,3,3,2,1,1,1,0,0,0,3,0,1,1,3
Pág- 2 -
I.E.S. Luis Carrillo de Sotomayor (Baena)
1º Bachillerato CCSS Semipresencial. Nociones de estadística.
La tabla (con la simbología explicada) queda así. (Importante: comprobar los resultados en cursiva).
xi fi hi % f
0 12 0,30 30%
1 14 0,35 35%
2 6 0,15 15%
3 6 0,15 15%
4 2 0,05 5%
40 1 100%
Una variable cuantitativa continua puede tomar todos los valores reales comprendidos entre un
valor inicial y un final; por eso estos valores los vamos a agrupar en intervalos, que expresan valores
comprendidos entre dos extremos, que por convenio vamos a suponer cerrado (incluye extremo) por la
izquierda, abierto (no incluye extremo) por la derecha, o sea: [--,--) .
Llamaremos amplitud de un intervalo a la distancia existente entre sus extremos.
Además para cálculos posteriores será necesario usar un representante de cada intervalo, al que
llamaremos marca de clase y será el punto medio del intervalo (equivale al “xi” para cálculos).
Según lo anterior, la tabla de frecuencias para una variable cuantitativa continua tiene la siguiente estructura:
Todo esto mejor tratarlo con un ejemplo: preguntamos a 30 personas por su peso y se obtiene:
70, 50, 60, 75, 72, 65, 55, 68, 73, 80, 64, 71, 63, 71, 59, 61, 63, 72, 60, 77, 62, 64, 70, 52, 64, 71,
53, 65, 79, 66.
En este caso los datos se podrían Intervalo Marca de clase F. Absoluta F. Relativa Porcentaje
organizar en seis intervalos de 5 kg fi
de amplitud, resultando la tabla [ --, -- ) xi fi hi %
N
adjunta.
[50,55) 52,5 3 0,10 10%
[55, 60) 57,5
[60, 65)
(Debe completarse la tabla anterior [ )
con los datos que faltan: ¡manos a la
obra!) [ )
[75, 80 ] 77,5
-- -- 30
Parámetros o estadísticos de centralización.-
Trabajar con una tabla es complejo y tedioso por lo que es más conveniente la introducción de
nuevos parámetros que nos permitan resumir la información que contienen esas tablas.
Las medidas, parámetros o estadísticos de centralización, son aquellos valores en torno a los
cuales están agrupados los datos. Son los valores centrales del conjunto de valores recogidos y representan
de forma global a toda la población o muestra.
Nota: La determinación de estas medidas no tiene sentido para variables cualitativas (exceptuando la moda).
Pág- 3 -
I.E.S. Luis Carrillo de Sotomayor (Baena)
1º Bachillerato CCSS Semipresencial. Nociones de estadística.
x1 x 2 .... x N i xi f i
x
N N
Atención: cuando los datos están agrupados en intervalos utilizamos las marcas de clase, para xi.
fi
Otro ejemplo, ahora con [ --, -- ) xi fi hi pi=100 hi xi fi
intervalos: N
Preguntamos a 30 personas [50,55) 52,5 3 0,10 10% 157,5
por su peso y se obtiene:
[55, 60)
(Este ejercicio ya se trató en clase,
en la página 3). [60, 65)
Se le añade la columna y se
hacen las operaciones.
[ )
La media sería: [ )
[75, 80 ]
x kg
-- --
b) Mediana.
Si suponemos que los datos están ordenados, llamaremos mediana al valor que ocupa el lugar
central de esos datos una vez ordenados de menor a mayor, es decir el valor que tiene por delante la mitad
de los valores y por detrás la otra mitad. Se pueden distinguir dos casos:
--Cuando hay número impar de datos: la mediana será el valor que ocupe el lugar central. (Ejemplo:
de la serie de notas 2, 4, 4, 4, 5, 7, 9, 9, 10, la mediana es 5.)
--Cuando hay un número par de datos: habrá dos datos centrales; en este caso la mediana será la
media aritmética de los dos valores centrales. (Ejemplo: de la serie de notas 2, 4, 4, 4, 5, 7, 9, 9, la mediana
es 4,5 media entre los valores 4 y 5).
Por ejemplo: xi fi hi % xi fi
En el caso ya tratado (el del número de hermanos), 0 12 0,3 30% 0
tenemos un número par de datos (40); los datos centrales 1 14 0,35 35% 14
corresponderían a los lugares 20 y 21, que ambos 2 6 0,15 15% 12
corresponden al valor xi=1, por tanto la mediana es 1. 15% 18
3 6 0,15
(Se comprueba calculando las frecuencias absolutas acumuladas) 4 2 0,2 5% 8
40 1 100% 52
En el caso en que los datos estén agrupados en intervalos la mediana estará en uno de los intervalos.
(En este caso sólo indicaremos el intervalo correspondiente a la mediana es…)
Pág- 4 -
I.E.S. Luis Carrillo de Sotomayor (Baena)
1º Bachillerato CCSS Semipresencial. Nociones de estadística.
Dado un conjunto de datos estadísticos llamaremos moda al valor que más se repite. (O de otra forma el dato
que tiene mayor frecuencia absoluta).
La moda puede ser única (unimodal) o no (bimodal, trimodal, …, multimodal).
En el caso de variables continuas, los datos vendrán agrupados en intervalos, en nuestra tabla de
valores podremos identificar el intervalo modal. (intervalo con mayor frecuencia absoluta)
Tipo de programa fi hi %
Deportivos 5 0,25 25%
Informativos 3 0,15 15%
Series 6 0,30 30%
Debates 2 0,10 10%
Concursos 4 0,20 20%
20 1 100,00%
Son valores que indican lo concentrados o dispersos que están los valores entre sí. Los más importantes son:
(A)Se llama RECORRIDO a la diferencia entre el valor más grande y el más pequeño que se ha recogido.
Nos da una primera idea de si los datos están agrupados o están muy separados, al menos los valores
menores y mayores.
Como ejemplo, siguiendo el anterior del número de hermanos, el recorrido sería R=4-0=4
(B)Se define el parámetro DESVIACIÓN MEDIA como la suma de las diferencias entre los valores y la
media, en valor absoluto, dividido por el número total de valores. Si los datos son aislados la desviación
media vendría dada por la expresión:
En caso de tablas de frecuencias, la única diferencia es que hay que multiplicar cada diferencia por la
cantidad de veces que aparece, es decir, su frecuencia.
(C)Se define la VARIANZA como la media aritmética de los cuadrados de las diferencias entre los valores
de la variable y la media estadística. Suele representarse por s²:
Pág- 5 -
I.E.S. Luis Carrillo de Sotomayor (Baena)
1º Bachillerato CCSS Semipresencial. Nociones de estadística.
Y para aquellos valores que están agrupados en una tabla de frecuencias basta multiplicar cada diferencia al
cuadrado por su frecuencia:
[1 0, 20 ) 15 1 15 22 5
[2 0, 30 ) 25 8 20 0 50 00
[3 0, 40 ) 35 10 35 0 12 25 0
[4 0, 50 ) 45 9 40 5 18 22 5
[5 0, 60 55 8 44 0 24 20 0
[6 0, 70 ) 65 4 26 0 16 90 0
[7 0, 80 ) 75 2 15 0 11 25 0
42 18 2 0 8 80 50
Pág- 6 -
I.E.S. Luis Carrillo de Sotomayor (Baena)
1º Bachillerato CCSS Semipresencial. Nociones de estadística.
(E)Se define el COEFICIENTE DE VARIACIÓN como el cociente entre la desviación típica y la media.
Este parámetro no refiere a ninguna medida. Por ello permite comparar datos
correspondientes a elementos distintos.
(A)Los CUARTILES dividen a la distribución de valores ordenados en cuatro partes iguales. Son:
Q1: primer cuartil, tiene el 25% de los datos delante de él y el 75% detrás.
Me: segundo cuartil, que coincide con la mediana. Tiene el 50% de los datos delante y el otro 50% detrás.
Se define el recorrido intercuartílico a la diferencia entre el tercer y el primer cuartil. Un estudio conjunto
del recorrido y del recorrido intercuartílico da información sobre la dispersión de la muestra. Si el recorrido
general es grande pero el intercuartílico pequeño, indica que hay valores extremos. Si ambos son grandes los
datos son dispersos y si ambos son pequeños los datos están agrupados respecto a los valores centrales.
luego Q1 = 2, luego Me = 3,
y por tanto Q3 = 4
Para hallarlos hay que dividir el número total de datos (N) entre 100 y multiplicarlo por el orden del percentil
que se busca y después hallar que valor iguala o sobrepasa a esa cantidad.
En la tabla de las frecuencias acumuladas usada en el ejercicio anterior, hallamos los percentiles pedidos.
y entonces el P12 = 1
Como quizás te hayas dado cuenta en el ejercicio anterior, el percentil 50 coincide con la mediana y, de
forma análoga, P25 = Q1 y P75 = Q3.
Pág- 7 -
I.E.S. Luis Carrillo de Sotomayor (Baena)
1º Bachillerato CCSS Semipresencial. Nociones de estadística.
1.- Dada la siguiente tabla de frecuencias contesta las cuestiones que se plantean:
x f F h
1 1
2 3
3 9 0,10
4 6
5 9
6 32
7 38
8 5
9 47
10
4.- Se ha preguntado a un grupo de 30 alumnos por el número de materias suspensas y han contestado:
1 1 2 3 2 6 0 0 1 0
4 5 0 0 0 3 2 1 3 1
1 1 0 1 2 0 0 5 4 2
Completa la tabla.
xi fi hi Pi (%) Fi Hi %Acumulado
0
1
2
3
4
5
6
----
5.-. El peso de los treinta alumnos de un grupo queda recogido en intervalos que se indican:
Peso xi fi hi Pi (%) Fi Hi %Acumulado
[45-55) 2
[55-65) 12
[65-75) 10
[75-85) 3
[85-95) 2
[95-105] 1
6.- En una empresa de telefonía están interesados en saber el número de teléfonos que se tienen las familias.
Se hace una encuesta obteniendo como respuestas: 2 2 1 2 3 4 3 2 4 3 4 3 3 1 2 3 2 3 2 3
a) Señala el tipo de variable. Y elabora una tabla, que incluya junto a la variable las frecuencias absolutas y
relativas y el porcentaje.
b) Halla la media, la mediana y la moda.
c) ¿Qué porcentaje de familias tienen un solo teléfono? ¿Qué porcentaje de familias tienen 3 ó más?
7.-Se les pregunta a los alumnos por el tiempo que tardan en llegar de su casa al autobús escolar:
a) Señala el tipo de variable y elabora una tabla, que incluya los datos habituales.
b) Halla la media y la varianza, e indica los intervalos de la mediana y la moda.
Pág- 9 -
I.E.S. Luis Carrillo de Sotomayor (Baena)
1º Bachillerato CCSS Semipresencial. Nociones de estadística.
fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
9.- Sea una distribución estadística que viene dada por la siguiente tabla:
Xi: 61 64 67 70 73
fi: 5 18 42 27 8
Calcular:
Xi fi
1 2
2 4
3 2
4 6
5 4
6 2
7 2
8 2
Pág- 10 -