Resumen y Ejercicios de Estadística Unidimensional

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 10

I.E.S.

Luis Carrillo de Sotomayor (Baena)


1º Bachillerato CCSS Semipresencial. Nociones de estadística.

Nociones de estadística.
Estadística.-

De forma sencilla podemos decir que la Estadística es la ciencia que tiene como objetivo reunir la
información que, tras ser organizada, analizada e interpretada, facilita la toma de decisiones futuras.

Términos de interés en el estudio estadístico.

La estadística descriptiva se encarga de recoger, organizar, expresar gráficamente y resumir los


datos que se han recogido. En ella construiremos tablas de frecuencias, agrupando los datos, los
representaremos gráficamente y calcularemos parámetros que nos indicarán claramente como se han
distribuido los datos recogidos. La estudiaremos este curso.
La estadística inferencial o inferencia estadística estudia las regularidades en los datos recogidos,
elaborando conclusiones futuras, permitiendo una toma de decisiones más efectiva. La bondad de esas
deducciones se miden en forma probabilística, es decir, estudiaremos la probabilidad de acertar eligiendo una
opción u otra. También estudia si se puede generalizar el estudio hecho de unos datos a toda la población. Se
estudiará en 2º de bachillerato.

Llamamos variable estadística a cada una de las características que pueden estudiarse de la
población.
Las variables estadísticas pueden ser fundamentalmente de dos tipos:
Cualitativas: Expresan una cualidad y. no se pueden medir numéricamente. Ejemplos: color preferido de un
grupo de gente; tipo de música que te gusta; problema medio ambiental que te preocupa más, etc.

Cuantitativas: Pueden expresarse mediante números. A su vez, las variables cuantitativas se pueden
clasificar en:
Discretas: cuando toman valores aislados. Por ejemplo: número de hermanos (puede ser 1,
2, 3...., etc.).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la
velocidad de un vehículo puede ser 58,2 km/h, 80,69 km/h...etc.

Veamos ahora a quienes va dirigido el estudio estadístico.

Al conjunto total de personas o de objetos de los que nos interesa conocer una determinada
opinión o característica es a lo que llamamos población.

Por ejemplo, si estudiamos en una ciudad la preferencia sobre programas de T.V, la población sería
el total de los habitantes de dicha ciudad; pero preguntar a toda la población normalmente es imposible,
así que habrá que elegir un grupo que la represente de forma adecuada.
Al grupo elegido para que responda al cuestionario o del que se van a recoger determinados
datos, se le denomina muestra. Tamaño de la muestra es el número de elementos que compone la
muestra.
Una vez determinados los conceptos de población y muestra, nos queda también otro
interesante, que es el de individuo.
A cualquier elemento de la población que se estudia, le llamamos individuo.

Organización de datos: tabla de frecuencias.


Recogidos los datos debemos organizarlos para su interpretación; recurrir a tablas es la opción más
extendida y eficaz, ya que los hace más comprensibles y facilita los cálculos.

Pág- 1 -
I.E.S. Luis Carrillo de Sotomayor (Baena)
1º Bachillerato CCSS Semipresencial. Nociones de estadística.

Una tabla de frecuencias sirve para relacionar los distintos resultados de la variable con la cantidad
de veces que han aparecido dichos resultados. Su Valores de Frecuencia Frecuencia Porcentaje
forma general es la siguiente: la variable absoluta relativa (%)
.
fi
xi fi hi  pi=100 hi
Se ha empleado esta simbología: N
Valores de la variable: la propiedad que se mide, ya sea cualidad o número.
Frecuencia absoluta: número de veces que se repite un dato. Se representa por fi .(Nota: la suma de los
elementos de esta columna será “N”, número total de datos).
Frecuencia relativa: la proporción de un dato en el total (realmente es el “tanto por uno”). Se representa por
hi. (Nota: la suma de los elementos de esta columna será “1”).
Porcentaje o tanto por ciento (%): significado semejante a la frecuencia relativa pero expresando en “tanto
por ciento”. (Nota: la suma de los elementos de esta columna será “100”)
Frecuencia absoluta acumulada: calcula la frecuencia absoluta de un valor más la de todos los que están
antes de él. Se representa por Fi .
Frecuencia relativa acumulada: calcula la frecuencia relativa de un valor más la de todos los anteriores. Se
representa por Hi .
Tanto por ciento acumulado: calcula el tanto por ciento de un valor más el de todos los anteriores.

Presentación de los datos: las gráficas


Tras la recogida de datos, su ordenación y cuantificación, es útil la representación gráfica, ésta nos
permite con un simple vistazo obtener información relevante de la población o la muestra. Hay distintos tipos
de representación de datos, dependiendo de qué tipo de carácter estemos estudiando
Gráfica Tipo de datos
Diagrama de sectores Caracteres cualitativos y cuantitativos
Diagrama de barras y polígono frecuencias Caracteres cualitativos y cuantitativos discretos
Histograma Caracteres cuantitativos continuos
Pictograma Caracteres cualitativos y cuantitativos

Estudio de una variable cualitativa.- Este caso está más limitado en cuánto a los cálculos.

Un ejemplo resuelto: Se pregunta a 20 personas, sobre el tipo de programa televisivo preferido.


(En la tabla adjunta se indican: número de respuestas de cada opción (ni) y se han deducido las frecuencias
relativas (fi) y los porcentajes (pi).

Tipo de programa fi hi %
Deportivo 5 0,25 25%
Informativo 3 0,15 15%
Series 6 0,30 30%
Debate 2 0,10 10%
Concurso 4 0,20 20%
20 1 100,00% Para la
gráfica
hemos utilizado el “diagrama de barras”.
Estudio de una variable cuantitativa discreta
Veamos un ejemplo, también resuelto: En un Centro de educación secundaria se pregunta a 40 alumnos por
el número de hermanos que tienen; el resultado es el siguiente:
1,1,1,2,3,4,4,2,0,0,0,1,2,1,0,1,0,2,3,1,0,0,0,1,1,2,3,3,2,1,1,1,0,0,0,3,0,1,1,3

Ahora contamos, ordenamos los datos y construimos la tabla estadística.

Pág- 2 -
I.E.S. Luis Carrillo de Sotomayor (Baena)
1º Bachillerato CCSS Semipresencial. Nociones de estadística.

La tabla (con la simbología explicada) queda así. (Importante: comprobar los resultados en cursiva).

xi fi hi % f
0 12 0,30 30%
1 14 0,35 35%
2 6 0,15 15%
3 6 0,15 15%
4 2 0,05 5%
40 1 100%

Estudio de una variable cuantitativa continua.

Una variable cuantitativa continua puede tomar todos los valores reales comprendidos entre un
valor inicial y un final; por eso estos valores los vamos a agrupar en intervalos, que expresan valores
comprendidos entre dos extremos, que por convenio vamos a suponer cerrado (incluye extremo) por la
izquierda, abierto (no incluye extremo) por la derecha, o sea: [--,--) .
Llamaremos amplitud de un intervalo a la distancia existente entre sus extremos.
Además para cálculos posteriores será necesario usar un representante de cada intervalo, al que
llamaremos marca de clase y será el punto medio del intervalo (equivale al “xi” para cálculos).

Según lo anterior, la tabla de frecuencias para una variable cuantitativa continua tiene la siguiente estructura:

Todo esto mejor tratarlo con un ejemplo: preguntamos a 30 personas por su peso y se obtiene:
70, 50, 60, 75, 72, 65, 55, 68, 73, 80, 64, 71, 63, 71, 59, 61, 63, 72, 60, 77, 62, 64, 70, 52, 64, 71,
53, 65, 79, 66.
En este caso los datos se podrían Intervalo Marca de clase F. Absoluta F. Relativa Porcentaje
organizar en seis intervalos de 5 kg fi
de amplitud, resultando la tabla [ --, -- ) xi fi hi  %
N
adjunta.
[50,55) 52,5 3 0,10 10%
[55, 60) 57,5
[60, 65)
(Debe completarse la tabla anterior [ )
con los datos que faltan: ¡manos a la
obra!) [ )
[75, 80 ] 77,5
-- -- 30
Parámetros o estadísticos de centralización.-

Trabajar con una tabla es complejo y tedioso por lo que es más conveniente la introducción de
nuevos parámetros que nos permitan resumir la información que contienen esas tablas.
Las medidas, parámetros o estadísticos de centralización, son aquellos valores en torno a los
cuales están agrupados los datos. Son los valores centrales del conjunto de valores recogidos y representan
de forma global a toda la población o muestra.
Nota: La determinación de estas medidas no tiene sentido para variables cualitativas (exceptuando la moda).

Las más importantes son:


a) Media aritmética (o simplemente “media”).

Pág- 3 -
I.E.S. Luis Carrillo de Sotomayor (Baena)
1º Bachillerato CCSS Semipresencial. Nociones de estadística.

Es el promedio aritmético de las observaciones, es decir, el cociente entre la suma de todos


los datos y el número de ellos N. Si xi es el valor de la variable y fi su frecuencia absoluta entonces

x1  x 2  ....  x N i xi f i
x 
N N
Atención: cuando los datos están agrupados en intervalos utilizamos las marcas de clase, para xi.

Volvamos a un ejemplo ya tratado en clase para obtener la media (ejercicio pág. 3)


En un centro de educación secundaria se pregunta a 40 alumnos por el número de hermanos que
tienen, el resultado es el siguiente:
xi fi hi % xi fi
1,1,1,2,3,4,4,2,0,0,0,1,2,1,0,1,0,2,3,1,
0,0,0,1,1,2,3,3,2,1,1,1,0,0,0,3,0,1,1,3 0 12 0,30 30% 0
1 14 0,35 35% 14
A dicha tabla le añadimos una columna a la derecha, el 2 6 0,15 15% 12
producto ordenado de columnas (xi fi) y la suma 3 6 0,15 15% 18
La media será: 4 2 0,05 5% 8
52 40 1 100% 52
x   1, 3 hermanos
40
(Importante: comprobar los resultados en cursiva).

fi
Otro ejemplo, ahora con [ --, -- ) xi fi hi  pi=100 hi xi fi
intervalos: N
Preguntamos a 30 personas [50,55) 52,5 3 0,10 10% 157,5
por su peso y se obtiene:
[55, 60)
(Este ejercicio ya se trató en clase,
en la página 3). [60, 65)
Se le añade la columna y se
hacen las operaciones.
[ )
La media sería: [ )
[75, 80 ]
x  kg
-- --
b) Mediana.
Si suponemos que los datos están ordenados, llamaremos mediana al valor que ocupa el lugar
central de esos datos una vez ordenados de menor a mayor, es decir el valor que tiene por delante la mitad
de los valores y por detrás la otra mitad. Se pueden distinguir dos casos:
--Cuando hay número impar de datos: la mediana será el valor que ocupe el lugar central. (Ejemplo:
de la serie de notas 2, 4, 4, 4, 5, 7, 9, 9, 10, la mediana es 5.)
--Cuando hay un número par de datos: habrá dos datos centrales; en este caso la mediana será la
media aritmética de los dos valores centrales. (Ejemplo: de la serie de notas 2, 4, 4, 4, 5, 7, 9, 9, la mediana
es 4,5 media entre los valores 4 y 5).

Por ejemplo: xi fi hi % xi fi
En el caso ya tratado (el del número de hermanos), 0 12 0,3 30% 0
tenemos un número par de datos (40); los datos centrales 1 14 0,35 35% 14
corresponderían a los lugares 20 y 21, que ambos 2 6 0,15 15% 12
corresponden al valor xi=1, por tanto la mediana es 1. 15% 18
3 6 0,15
(Se comprueba calculando las frecuencias absolutas acumuladas) 4 2 0,2 5% 8
40 1 100% 52

En el caso en que los datos estén agrupados en intervalos la mediana estará en uno de los intervalos.
(En este caso sólo indicaremos el intervalo correspondiente a la mediana es…)
Pág- 4 -
I.E.S. Luis Carrillo de Sotomayor (Baena)
1º Bachillerato CCSS Semipresencial. Nociones de estadística.

c) Moda. (En este caso, puede aplicarse también a variables cualitativas).

Dado un conjunto de datos estadísticos llamaremos moda al valor que más se repite. (O de otra forma el dato
que tiene mayor frecuencia absoluta).
La moda puede ser única (unimodal) o no (bimodal, trimodal, …, multimodal).

En el caso de variables continuas, los datos vendrán agrupados en intervalos, en nuestra tabla de
valores podremos identificar el intervalo modal. (intervalo con mayor frecuencia absoluta)

-Siguiendo con el ejemplo anterior (número de hermanos) la moda xi fi hi % xi fi


será 1, pues corresponde al dato que se repite más veces (14 veces). 0 12 0,30 30% 0
1 14 0,35 35% 14
-También vamos a incluir el ejemplo de variable cualitativa del 2 6 0,15 15% 12
principio, donde fácilmente se deduce que la moda corresponde al 3 6 0,15 15% 18
tipo de programa “Series”. (ha contestado el mayor número de
4 2 0,05 5% 8
personas, 6).
40 1 100% 52

Tipo de programa fi hi %
Deportivos 5 0,25 25%
Informativos 3 0,15 15%
Series 6 0,30 30%
Debates 2 0,10 10%
Concursos 4 0,20 20%
20 1 100,00%

Parámetros o estadísticos de dispersión.-

Son valores que indican lo concentrados o dispersos que están los valores entre sí. Los más importantes son:

(A)Se llama RECORRIDO a la diferencia entre el valor más grande y el más pequeño que se ha recogido.
Nos da una primera idea de si los datos están agrupados o están muy separados, al menos los valores
menores y mayores.
Como ejemplo, siguiendo el anterior del número de hermanos, el recorrido sería R=4-0=4

(B)Se define el parámetro DESVIACIÓN MEDIA como la suma de las diferencias entre los valores y la
media, en valor absoluto, dividido por el número total de valores. Si los datos son aislados la desviación
media vendría dada por la expresión:

En caso de tablas de frecuencias, la única diferencia es que hay que multiplicar cada diferencia por la
cantidad de veces que aparece, es decir, su frecuencia.

(C)Se define la VARIANZA como la media aritmética de los cuadrados de las diferencias entre los valores
de la variable y la media estadística. Suele representarse por s²:

Pág- 5 -
I.E.S. Luis Carrillo de Sotomayor (Baena)
1º Bachillerato CCSS Semipresencial. Nociones de estadística.

Y para aquellos valores que están agrupados en una tabla de frecuencias basta multiplicar cada diferencia al
cuadrado por su frecuencia:

. O de forma más fácil:

Calculamos la media y la varianza en el siguiente ejemplo:


xi fi xi.fi xi².fi

[1 0, 20 ) 15 1 15 22 5

[2 0, 30 ) 25 8 20 0 50 00

[3 0, 40 ) 35 10 35 0 12 25 0

[4 0, 50 ) 45 9 40 5 18 22 5

[5 0, 60 55 8 44 0 24 20 0

[6 0, 70 ) 65 4 26 0 16 90 0

[7 0, 80 ) 75 2 15 0 11 25 0

42 18 2 0 8 80 50

Pág- 6 -
I.E.S. Luis Carrillo de Sotomayor (Baena)
1º Bachillerato CCSS Semipresencial. Nociones de estadística.

(D)Se define la DESVIACIÓN TÍPICA como la raíz cuadrada de la varianza:

(E)Se define el COEFICIENTE DE VARIACIÓN como el cociente entre la desviación típica y la media.

Este parámetro no refiere a ninguna medida. Por ello permite comparar datos
correspondientes a elementos distintos.

Parámetros o estadísticos de posición.-


Son aquellos que dividen a los datos obtenidos en partes proporcionales, de forma que cada parte tenga el
mismo número de elementos. Para poder hacerlo necesitamos que los datos estén ordenados de menor a
mayor. Los hay de dos tipos: cuartiles y percentiles.

(A)Los CUARTILES dividen a la distribución de valores ordenados en cuatro partes iguales. Son:

Q1: primer cuartil, tiene el 25% de los datos delante de él y el 75% detrás.

Me: segundo cuartil, que coincide con la mediana. Tiene el 50% de los datos delante y el otro 50% detrás.

Q3: Deja delante de él el 75% de la distribución y detrás el 25%.

Se define el recorrido intercuartílico a la diferencia entre el tercer y el primer cuartil. Un estudio conjunto
del recorrido y del recorrido intercuartílico da información sobre la dispersión de la muestra. Si el recorrido
general es grande pero el intercuartílico pequeño, indica que hay valores extremos. Si ambos son grandes los
datos son dispersos y si ambos son pequeños los datos están agrupados respecto a los valores centrales.

luego Q1 = 2, luego Me = 3,

y por tanto Q3 = 4

(B)Son los PERCENTILES los parámetros que


dividen el conjunto ordenado de valores en 100 partes
iguales. Así, el percentil 34, tiene delante el
34% y detrás el 66% restante.

Para hallarlos hay que dividir el número total de datos (N) entre 100 y multiplicarlo por el orden del percentil
que se busca y después hallar que valor iguala o sobrepasa a esa cantidad.
En la tabla de las frecuencias acumuladas usada en el ejercicio anterior, hallamos los percentiles pedidos.

y entonces el P12 = 1

y entonces P50 =3 luego el P67 = 4

Como quizás te hayas dado cuenta en el ejercicio anterior, el percentil 50 coincide con la mediana y, de
forma análoga, P25 = Q1 y P75 = Q3.
Pág- 7 -
I.E.S. Luis Carrillo de Sotomayor (Baena)
1º Bachillerato CCSS Semipresencial. Nociones de estadística.

U3.T1 Y 2 EJERCICIOS DE ESTADÍSTICA UNIDIMENSIONAL

1.- Dada la siguiente tabla de frecuencias contesta las cuestiones que se plantean:

a) El número de hogares con 3 teléfonos es de .

b) El porcentaje de familias con 4 teléfonos es de un %.

c) La proporción de hogares con menos de 5 teléfonos es de .

d) El número de hogares con 4 o más teléfonos es de .

e) % es el porcentaje de familias con menos de 4 teléfonos.

2.- Rellena los datos que faltan en la siguiente tabla:

x f F h

1 1

2 3

3 9 0,10

4 6

5 9

6 32

7 38

8 5

9 47

10

TOTAL *** ***


Pág- 8 -
I.E.S. Luis Carrillo de Sotomayor (Baena)
1º Bachillerato CCSS Semipresencial. Nociones de estadística.

3.- Indica el tipo de variable estadística que se estudia en cada caso:


a.- Número de hijos. b.- Profesión de la madre.
c.- Longitud del pie. d.- Número de veces que vas a cine anualmente.
e.- Tiempo dedicado a estudiar. f.- Tipo de revista preferida.
g.- Peso de los pollos en una granja.

4.- Se ha preguntado a un grupo de 30 alumnos por el número de materias suspensas y han contestado:
1 1 2 3 2 6 0 0 1 0
4 5 0 0 0 3 2 1 3 1
1 1 0 1 2 0 0 5 4 2
Completa la tabla.
xi fi hi Pi (%) Fi Hi %Acumulado
0
1
2
3
4
5
6
----
5.-. El peso de los treinta alumnos de un grupo queda recogido en intervalos que se indican:
Peso xi fi hi Pi (%) Fi Hi %Acumulado
[45-55) 2
[55-65) 12
[65-75) 10
[75-85) 3
[85-95) 2
[95-105] 1

a) Completa la tabla anterior. (ojo con la marca de clase).


b) Indica el intervalo de la mediana y el de la moda. También el valor de la media.

6.- En una empresa de telefonía están interesados en saber el número de teléfonos que se tienen las familias.
Se hace una encuesta obteniendo como respuestas: 2 2 1 2 3 4 3 2 4 3 4 3 3 1 2 3 2 3 2 3
a) Señala el tipo de variable. Y elabora una tabla, que incluya junto a la variable las frecuencias absolutas y
relativas y el porcentaje.
b) Halla la media, la mediana y la moda.
c) ¿Qué porcentaje de familias tienen un solo teléfono? ¿Qué porcentaje de familias tienen 3 ó más?

7.-Se les pregunta a los alumnos por el tiempo que tardan en llegar de su casa al autobús escolar:

a) Señala el tipo de variable y elabora una tabla, que incluya los datos habituales.
b) Halla la media y la varianza, e indica los intervalos de la mediana y la moda.

Pág- 9 -
I.E.S. Luis Carrillo de Sotomayor (Baena)
1º Bachillerato CCSS Semipresencial. Nociones de estadística.

8.- Calcular el percentil 35 y 60 de la distribución de la tabla:

fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65

9.- Sea una distribución estadística que viene dada por la siguiente tabla:

Xi: 61 64 67 70 73

fi: 5 18 42 27 8

Calcular:

(A) La moda, mediana y media. (B) El recorrido, varianza y desviación típica.

10.- Calcular los cuartiles y los percentiles 30 y 65 en:

Xi fi
1 2
2 4
3 2
4 6
5 4
6 2
7 2
8 2

Calcula también la media, la desviación típica y el coeficiente de variación

Pág- 10 -

También podría gustarte