Bloque 7 Tema 3 Ámbito Científico Tecnológico
Bloque 7 Tema 3 Ámbito Científico Tecnológico
Bloque 7 Tema 3 Ámbito Científico Tecnológico
BLOQUE 7
SOMOS LO QUE COMEMOS: LAS PERSONAS Y LA
SALUD
Según la Encuesta Nacional de Salud del año 2017 el INE (Instituto Nacional
de Estadística), en los grupos de edad de 18 a 64 años, un 44,3% de hombres y
un 30,0% de mujeres padecen sobrepeso y un 18,2% de hombres de 18 y más
años y un 16,7% de mujeres padecen obesidad.
IMPORTANTE
Empezando a adquirir vocabulario
A la característica o cualidad que queremos estudiar la llamaremos variable
estadística.
EJERCICIO RESUELTO
Caso práctico
Otros ejemplos de variable estadística
El "tiempo dedicado a desayunar" sería una variable estadística. Te ofrecemos
otros ejemplos:
● La marca de cereales para el desayuno.
● El número de horas de sueño.
● El color de los ojos.
● La estatura.
● El número de libros leídos el último mes.
Pero no todas las variables estadísticas son iguales. Las hay básicamente de
dos clases, según el tipo de datos que estudiemos:
Variables cuantitativas: son aquellas que pueden medirse numéricamente. Por
ejemplo, "el tiempo dedicado a desayunar", (que puede expresarse en número de
minutos).
Piensa ahora en qué diferencia hay entre medir el número de veces que se comen
legumbres a la semana y el peso. ¿A que uno no come 3'4567 veces legumbres?
3
¡o come 3 veces o 4! Pero sí podemos pesar 69'658 kg. Por eso se distingue entre
variables cuantitativas continuas y discretas:
● Variable discreta: cuando no puede tomar ningún valor entre
dos valores consecutivos. Un ejemplo sería el número de hijos.
¡Tenemos 1, 2 o 3...pero nunca 1'7!
● Variable continua: cuando puede tomar cualquier valor
dentro de un intervalo, así que debemos agruparlas en
intervalos. Por ejemplo, cómo son demasiadas las posibles
respuestas si preguntamos a muchas personas su peso,
agrupamos las respuestas en intervalos: El número de personas
que pesan "de 50 hasta 60 kilogramos", "de 60 hasta 70
kilogramos", etc.
IMPORTANTE
Recuerda:
4
Hay variables estadísticas cuantitativas (que pueden ser discretas o continuas) y
cualitativas.
ACTIVIDAD DE LECTURA
a. De la lista de variables que has visto en los ejemplos del "Ejercicio resuelto",
señala aquellas que son cuantitativas e indica cuáles de ellas son continuas.
b. Escribe un ejemplo, distinto a los vistos, de variable cualitativa y otro de
variable cuantitativa. Pero que estén relacionadas con el desayuno.
RESPUESTAS:
a. Son cuantitativas el número de horas de sueño, la estatura y el número de
libros leídos el último mes. De estas variables, sólo la estatura es de tipo
continuo.
b. Aunque podríamos idear muchos ejemplos, como variable cuantitativa
podemos escoger el número de calorías consumidas en el desayuno, y como
variable cualitativa el tipo de café que nos gusta (sólo, con leche, cortado,
capuchino, etc).
IMPORTANTE
EJERCICIO RESUELTO
En nuestra nota de prensa…
En el caso de nuestra nota de prensa, la población P es el conjunto de todos los
españoles y N es el número de habitantes de España.
IMPORTANTE
● Una muestra es una parte de la población sobre la que estudiaremos la
variable estadística.
● El número de individuos de la muestra es el tamaño muestral o de la
muestra, n.
6
Pero pensemos un poco…
ACTIVIDAD DE LECTURA
Autoevaluación
CURIOSIDAD
Si tuvieras que escoger una muestra de toda la población de Cádiz para averiguar,
con un margen de error pequeño, qué tanto por ciento de gaditanos comen
legumbres al menos dos veces por semana, ¿A cuántas personas diferentes le
preguntarías? ¿a 1000?, ¿a 5000?, ¿a 10000?...
¡Ten en cuenta que la población de Cádiz a 1 de enero de 2019 era según el INE
de 116.027 habitantes!
¿Quieres sorprenderte?, pues sigue leyendo…
7
¡Bastaría con preguntarle a 383 personas! y eso con un error de tan solo el
5%, es decir, que estamos casi seguros en un 95% (No podemos estar seguros al
100%, ya que no vamos a preguntarles a todos los gaditanos). Increíble, ¿verdad?
Eso sí, bien escogidos.
Pero lo más curioso es que si Cádiz tuviese 100 habitantes, entonces el tamaño de
la muestra tendría que ser de 80 personas. Para 1000 habitantes se necesita una
muestra de 278 personas. Para 10000 habitantes la muestra debe ser de 370. ¡Qué
poco va aumentando! Para 100000, sólo se necesitan 383.
Y eso, ¿por qué es así? Porque hay una fórmula matemática de estadística que lo
deduce y que como asusta un poco no voy a enseñártela. En su lugar, seguro que
te es más fácil utilizar esta calculadora.
.
→Obtención directa: los datos se observan directamente sobre los
individuos, específicamente para el estudio.
8
Seguramente los datos se ajustarán a nuestros deseos pero costará más
obtenerlos.
● A veces se hará midiendo la característica en los individuos (por
ejemplo, la estatura…)
● A veces se hará mediante cuestionarios que los encuestados
responden…
Debemos tener en cuenta que las preguntas de nuestra encuesta pueden
influir en nuestra investigación.
EJERCICIO RESUELTO
Por ejemplo:
Respuesta:
9
Por tanto es preferible la segunda pregunta, aunque con ella se corre un riesgo:
puede que las respuestas obtenidas sean demasiado diferentes entre sí y la
información sea poco útil… ¿y si todos responden una cosa diferente?
¿Podríamos extraer alguna conclusión?
IMPORTANTE
Podemos obtener la información por observación directa o indirecta.
10
Nota:
En matemáticas para representar un elemento en general que pertenezca a un
conjunto de elementos ordenados, se usa el subíndice i. Así un valor genérico del
conjunto x1, x2, ..., x4, se representará como xi, donde el subíndice i puede tomar
los valores 1, 2, ..., 4 (o los que haya, claro)
IMPORTANTE
La frecuencia absoluta de un valor xi de la variable es el número de veces que se
ha observado dicho valor y se representa ni.
Si sumas todas las frecuencias absolutas debes obtener el valor de n.
Por ejemplo, la frecuencia absoluta del valor x 1=0 es 4 (4 vecinos han respondido
0 minutos).
Es decir n1=4. Sólo hay que saber contar…
COMPRUEBA LO APRENDIDO
Autoevaluación
Ahora indica tú la frecuencia absoluta del resto de los valores de la variable:
Recuerda, sólo hay que contar las veces que se repite cada valor, las veces que
nos han respondido cada cantidad de minutos.
n1 = 4
n2 = _3__
11
n3 = _2__
n4 = __1_
y todas las frecuencias absolutas deben sumar n= _10__
IMPORTANTE
La frecuencia relativa de un valor de la variable es su frecuencia absoluta
dividida por el número de observaciones. Para el valor xi se representa fi.
Así, como n1 = 4, entonces f1 = 4:10 = 0.4. (la frecuencia absoluta del valor x1=0
dividida entre 10 los vecinos encuestados).
NOTA: La frecuencia relativa nos da la misma información que un "tanto por
ciento" o %, pero en este caso expresado en "tanto por uno".
En nuestro ejemplo los vecinos respondieron que no desayunaban con una
frecuencia relativa de 0.4. Es decir, el 40% de los vecinos no desayunan.
COMPRUEBA LO APRENDIDO
Autoevaluación
Ahora indica tú la frecuencia relativa de cada valor de la variable:
f1 = 4:10 = 0.4.
f2 = 0.3
f3 = 0.2
12
f4 = 0.1
y las frecuencias relativas deben sumar 1
CURIOSIDAD
Y todavía puede ser útil usar más tipos de frecuencias…
Tenemos las frecuencias absolutas (y relativas) acumuladas para la que tenemos
que ordenar los valores de menor a mayor:
La frecuencia absoluta (o relativa) acumulada de un valor es la suma de todas
las frecuencias absolutas (o relativas) de todos los valores MENORES O
IGUALES QUE DICHO VALOR.
Se representan como las anteriores pero con mayúscula.
Por ejemplo, la frecuencia absoluta acumulada del valor 9 minutos es la suma de
las frecuencias absolutas de los valores 0, 5 y 9.
COMPRUEBA LO APRENDIDO
Autoevaluación
¿Serías capaz tu solito/a de calcular las frecuencias absolutas y relativas
ACUMULADAS de los valores de nuestra variable? Seguro que sí.
Fíjate en el valor de la última frecuencia en ambos casos. ¿Te suena de algo?
Frecuencias absolutas acumuladas:
N1= 4 ; N2=7 ; N3= 9 ; N4= 10
13
Y todos estos númeracos ¿para qué los hacemos? Pues con un único objetivo:
para tener los datos bien ordenaditos, porque con todos estos números
podemos hacer la TABLA DE FRECUENCIAS de nuestra variable.
IMPORTANTE
Para hacer una tabla de frecuencias…
Se pone una primera columna con los valores de la variable y después una
columna con cada tipo de frecuencia (y la suma o total en las no acumuladas), en
nuestro caso:
Frecuencias Frecuencias
Valores de la
Frecuencias Frecuencias absolutas relativas
variable
absolutas: ni relativas: fi acumuladas: acumuladas:
(minutos): xi
Ni Fi
x1=0 n1=4 f1=0,4 N1=4 F1=0,4
x2=5 n2=3 f2=0,3 N2=7 F2=0,7
x3=9 n3=2 f3=0,2 N3=9 F3=0,9
x4=15 n4=1 f4=0,1 N4=10 F4=1
total 10 1
Aunque, utilizando los símbolos con los que se representa cada cosa, basta
escribir esto:
xi ni fi Ni Fi
0 4 0,4 4 0,4
5 3 0,3 7 0,7
9 2 0,2 9 0,9
14
15 1 0,1 10 1
total 10 1
ACTIVIDAD DE LECTURA
Autoevaluación
RESPUESTA:
1. Algunas conclusiones que podríamos sacar son las siguientes:
○ El 40% (4 de 10 encuestados) de los vecinos NO desayuna. Es
la respuesta más frecuente (repetida).
○ Sólo 1 de 10 dedica más de 10 minutos al desayuno (sólo el
10% de los vecinos).
○ 7 de los 10 vecinos encuestados dedica 5 minutos o menos a su
desayuno (esto lo hace el 70% de los vecinos).
○ Por tanto, parece claro que el tiempo dedicado es por lo general
insuficiente para un desayuno de calidad.
2. La tabla quedaría así:
15
xi ni fi Ni Fi
0 6 0.24 6 0.24
1 7 0.28 13 0.52
2 7 0.28 20 0.8
3 3 0.12 23 0.92
4 2 0.08 25 1
total 25 1
Diagrama de Barras:
Un diagrama de barras de una variable estadística se hace de forma muy sencilla.
Por pasos, tras hacer la tabla de frecuencias:
● Primero dibujamos dos ejes de coordenadas.
● Después colocamos los valores de la variable en el eje x. Deben ser
valores de variable discreta.
● Por último levantamos una barra sobre cada valor. ¿Hasta qué altura?
Hasta lo que indiquen las frecuencias (absolutas o relativas).
Por ejemplo, en el caso anterior, a partir de la tabla podemos obtener el
diagrama de barras siguiente:
16
IMPORTANTE
Así que
Un diagrama de barras se construye dibujando barras sobre los valores que midan
lo que indiquen las frecuencias absolutas (o relativas).
Diagrama de sectores
Un diagrama de sectores es un círculo dividido en sectores cuya área será tanto
mayor cuanto mayor sea la frecuencia del valor que representa.
Dibujamos un círculo.
Lo dividimos en tantos sectores circulares ("quesitos") como valores que
queremos representar. Pero claro, al valor con mayor frecuencia le corresponderá
una parte más grande ¿verdad?
Para cada valor su sector tendrá un ángulo PROPORCIONAL a su frecuencia.
¿Que te has asustado? Vamos a ver cómo hacerlo, que es fácil, sólo hay que
hacer una "regla de tres". El círculo abarca 360º, ¿verdad? Pues bien:
● Repartimos los 360º entre el total de respuestas que, en nuestro
ejemplo, es 10 → 360º : 10 = 36º grados para respuesta.
● Si cada respuesta se representa con un sector ("quesito") de 36º el valor
0 que se repitió en cuatro respuestas se representará con un sector de 4
x 36 = 144º. Y así con el resto de valores.
17
Haciendo esto, obtenemos el siguiente diagrama de sectores:
Valores Frecuencia
0 4
5 3
9 2
Imagen elaboración propia
IMPORTANTE
Recuerda:
Para saber el ángulo que tiene que ocupar cada sector, dividimos 360º entre el
número de respuestas y multiplicamos lo obtenido por la frecuencia absoluta de
cada valor.
REFLEXIONA
18
A la hora de hacer una representación gráfica, no hay que olvidar que su objetivo
es facilitar la comprensión de la información.
Por eso hay que tener cuidado a la hora de elegir el tipo de gráfico y el diseño del
mismo.
Los gráficos circulares presentan una serie de inconvenientes, por los que no
siempre es aconsejable su uso.
En este enlace se te explican algunos de ellos:
Las tartas son para el postre: 5 razones por las que no uso gráficos
circulares
Observa ahora el gráfico inferior. ¿Qué problema de los que se mencionan en el
texto del enlace presenta?
Pictograma
En este caso representamos cada valor con un dibujo alusivo cuyo TAMAÑO
dependerá de la frecuencia absoluta (o relativa) del valor.
Por ejemplo, ya que estamos con el tiempo dedicado a desayunar,
representaremos cada valor con una taza, que será más grande para las respuestas
más frecuentes y menor para las respuestas menos frecuentes.
19
CURIOSIDAD
Pero cuidado
Si con tamaño nos referimos al área, entonces a doble frecuencia no corresponde
doble tamaño, sino 4 veces el tamaño, porque la relación es cuadrática (un área se
calcula elevando al cuadrado una longitud) y el dibujo obtenido no se
corresponderá con los datos.
Por tanto, tenemos que dejar claro a qué nos referimos con tamaño. Podemos
quedar en que a doble, triple… frecuencia corresponda doble, triple… altura del
dibujo por ejemplo.
Histograma
Un histograma es muy similar a un diagrama de barras, solo que se usa para
variables cuyos datos se agrupan en intervalos. Por ejemplo, si preguntamos a
nuestros vecinos si están apuntados a algún gimnasio o club deportivo, la tabla de
frecuencias por intervalo de edades puede ser:
110 1
¿Has visto algo nuevo en esta tabla? Seguro que te has dado cuenta de que en la
primera columna no aparecen datos concretos de años, sino los intervalos en que
agrupamos los valores y las frecuencias absolutas se refieren al número de
personas cuya edad está dentro del intervalo correspondiente.
Pues bien, para hacer el histograma:
Primero dibujamos dos ejes de coordenadas.
Después colocamos los intervalos en el eje X.
Por último levantamos un rectángulo sobre cada intervalo. ¿Hasta qué edad?
Pueden ocurrir dos cosas:
● Que todos los intervalos tengan la misma amplitud (como en nuestro
caso, que todos "van de 10 en 10")
● Que haya intervalos más amplios que otros. Este caso lo dejaremos de
momento.
En el primer caso, la altura del rectángulo será la indicada por la frecuencia
(absoluta o relativa) correspondiente.
21
En nuestro ejemplo quedaría así:
EJERCICIO RESUELTO
Autoevaluación
Realiza los gráficos estadísticos que puedas para la variable trabajada en la
anterior autoevaluación. Te recordamos la tabla de frecuencias:
xi ni fi Ni Fi
0 6 0.24 6 0.24
1 7 0.28 13 0.52
2 7 0.28 20 0.8
3 3 0.12 23 0.92
22
4 2 0.08 25 1
total 25 1
Respuesta:
Como los valores no están agrupados en intervalos, podríamos hacer los gráficos
siguientes:
DIAGRAMA DE BURBUJAS
Otro gráfico muy utilizado es el de burbujas. Muy parecido a los pictogramas
pero situados en unos ejes.
En el siguiente ejemplo se refleja la información de una encuesta que se ha hecho
a la totalidad de los niños de un colegio.
Se pretendía saber cuántas veces a la semana consumen habitualmente golosinas.
Y estas fueron sus respuestas:
23
¿No te parece que toman demasiadas golosinas?
CURIOSIDAD
Interesantes ejemplos gráficos
En este enlace tienes una amena e interesante infografía sobre el gasto medio por
familia y persona.
Es una encuesta del Instituto nacional de estadística donde puedes comparar en
qué gastamos nuestro dinero entre las distintas comunidades autónomas. Fíjate en
los euros que empleamos en alimentación.
24
Te vamos a contar más sobre ella y sobre alguna otra cosa… y haremos algunas
cuentas
La media aritmética
IMPORTANTE
Se llama media aritmética de una variable aleatoria a la suma de todos los
valores observados dividida por el total de observaciones.
CURIOSIDAD
¿Qué ocurriría si…?
25
¿Qué ocurriría con la media anterior si un vecino tardarse dos horas en tomarse
su café y sus tostadas?
A la suma anterior tendríamos que añadir 120 minutos y obtendríamos 168, ahora
dividimos entre el número de vecinos encuestados (que serían 11) y… SALE
UNA MEDIA DE MÁS DE 15 MINUTOS.
¡Ya quisieran las demás tener tanto tiempo para desayunar! Se ha triplicado la
media anterior.
Como ves, los “valores extraños” pueden producir medias extrañas que no
reflejan realmente la realidad.
Para terminar ¿se te ocurre cómo calcular la media aritmética cuando la variable
está agrupada en intervalos? Es fácil ¿no? Pues en vez de los valores tomamos
las marcas de clase.
EJERCICIO RESUELTO
Caso práctico
Un caso especial:
¿Cuánto vale la media si todas las respuestas son iguales? Piensa un poco.
Por ejemplo, si todos los vecinos hacen el mismo número de comidas diarias (4),
la media de comidas diarias es justo eso, 4 comidas.
¡Haz la cuenta y verás que no es magia!
Moda
¿Qué quiere decir que un color está de moda? Pues que la mayoría de la gente se
viste con ese color. ¿Qué significa que está de moda desayunar cereales? Que la
mayoría de la gente toma cereales…
26
Y así podemos seguir.
¿Cuál será la moda de una variable estadística?
Efectivamente, acertaste
IMPORTANTE
La moda de una variable estadística es el valor más frecuente, el más repetido
en las respuestas… el de mayor frecuencia absoluta (o relativa).
COMPRUEBA LO APRENDIDO
Rellenar huecos
Lea el párrafo que aparece abajo y complete las palabras que faltan.
Autoevaluación
¿Cuál es la moda en nuestro estudio del tiempo dedicado a desayunar?
De las distintas respuestas una se repitió más que las demás:5
minutos dedicados.
CURIOSIDAD
Piensa un momento
¿Crees que puede haber más de una moda en una variable estadística?
Te ayudamos a pensarlo con una pequeña pista: sacude tu memoria… ¿te suena
esto?
27
Efectivamente, puede haberla. Observa en la gráfica que hay dos valores con
frecuencias iguales y ningún otro valor más frecuente; ambos serán moda. Así
podemos tener variables unimodales (con una moda), bimodales (con dos
modas, como en el gráfico)... y hasta polimodales o multimodales (con varias
modas).
COMPRUEBA LO APRENDIDO
Autoevaluación
a. Calcula la media aritmética y la moda para la variable trabajada en las
anteriores autoevaluaciones. Te recordamos la tabla de frecuencias:
xi ni fi Ni Fi
0 6 6:25= 0.24 6 0.24
1 7 7:25= 0.28 13 0.52
2 7 7:25= 0.28 20 0.80
3 3 3:25= 0.12 23 0.92
4 2 2:25= 0.08 25 1
Totales n = 25 1
28
Cálculo de la media de la variable:
- Calculamos multiplicamos la marca de clase por las frecuencias absolutas:
- (0 x 6 = 0) + (1 x 7 = 7) + (2 x 7 = 14) + (3 x 3 = 9) + (4 x 2 = 8)=
- (0 + 7 + 14 + 9 + 8) = 38.
- Y lo dividimos entre la muestra n = 25.
- 38 : 25 = 1,52
- Y resuelta 1,52.
Valores
Frecuenci Frecuenc
de la Marca Frecuenci Frecuenci
as ias
variable de clase as as
absolutas relativas
(edad (edad en absolutas relativas
acumulad acumula
en años) ni fi
as Ni das Fi
años) Ii
267 n = 110 1
EJERCICIO RESUELTO
Observa los datos recogidos en estos dos estudios estadísticos:
Variable 1:
30
NIVEL DE SATISFACCIÓN CON LA IMAGEN CORPORAL EN
CIERTA CIUDAD
● Población: habitantes de Megusto con edades entre 11 y 40 años.
● Muestra: 230 habitantes de diversas edades, estamentos sociales y
profesiones.
● Pregunta: ¿Qué nivel de satisfacción con su imagen tiene usted (de 0 a
10)?
31
Cálculo de la media de la variable 1:
- Calculamos primero la columna 3 (media aritmética):
- (0 + 20 + 30 + 6 + 4 + 380 + 234 + 14 + 48 + 27 + 100) = 863
- Y lo dividimos entre la muestra n = 230.
- Y resuelta 3.75.
Variable 2:
INFLUENCIA DE LOS CÁNONES DE BELLEZA IMPUESTOS POR LA
SOCIEDAD COMO CAUSA DE LA ANOREXIA Y/O LA BULIMIA
RESPUESTA:
1. Para saber la frecuencia que falta sólo hay que recordar que si las
sumamos TODAS debe salirnos 230 (el total de observaciones). Como
las demás suman 229, sólo una persona ("la número 230") responde 10.
2. Vamos allá:
○ Variable 1: Nivel de satisfacción con la imagen personal
33
■ La media vale:
(0·56 + 1·20 + 2·15 + 3·2 + 4·10 + 5·76 + 6·39 + 7·2
+ 8·6 + 9·3 + 10·10) : 230
(0+20+30+6+40+380+234+14+48+27+100) : 230 =
809 : 230 = 3,75.
■ La moda es 5, cuya frecuencia 76 es la mayor.
34
¿Crees que en ambos casos las medias aritméticas son igual de
representativas?
La verdad es que no… Fíjate bien en los diagramas de barras y observa que los
datos no están "distribuidos" de la misma manera en los dos ejemplos.
Ahora vas a estudiar que es posible expresar matemáticamente eso de "lo
distribuidos que están los datos". Los tres números que vas a aprender a calcular
(la varianza, la desviación típica y el coeficiente de variación) indican lo
agrupados o alejados que están los valores respecto de la media, y por tanto
qué media da información más fiable sobre los datos.
35
Por ejemplo: En la variable 1 quien ha respondido 10 se ha alejado mucho de la
media 3.75. En cambio, los 12 que han respondido 3 o 4 se han acercado
bastante a la media. Cuanto más valores cercanos a la media tengamos, más
"fiable" es nuestra media ¿verdad?
Existen dos números (parámetros estadísticos) que nos ayudan a MEDIR esta
cercanía de los datos a la media, es decir, a medir la dispersión de los datos.
Uno es la varianza, que es la media de las distancias de los valores a la media,
al cuadrado.
¿Que te da miedo tanta palabrería…? Pues fíjate bien cómo no es para tanto…
Se hace así:
● Se calcula la distancia de cada valor a la media, sencillamente
restándole al valor la media (para el valor 10 será 10 - 3,75 = 6,25)
● Se elevan esas distancias al cuadrado (así, 6,252 = 39,0625)
● Y se hace la media de los resultados como si fuesen valores (las
frecuencias serán las originales)
Y si no te gusta el método anterior, ¡Hay otro mejor!
● Eleva los valores de la variable al cuadrado.
● Haz la media de los resultados obtenidos.
● Eleva la media de la variable al cuadrado y réstalo del resultado
anterior.
EJERCICIO RESUELTO
Caso práctico
Por ejemplo:
Para la variable 1…
Los valores al cuadrado son:
02 = 0, 12 = 1, 22 = 4, 32 = 9, 42 = 16, 52 = 25, 62 = 36, 72 = 49, 82 = 64, 92 = 81,
102 = 100.
CURIOSIDAD
Muy MUY importante
Como es una media de “números al cuadrado” y las cosas al cuadrado son
siempre positivas:
LA VARIANZA ES SIEMPRE POSITIVA
Una varianza negativa es considerada un “delito matemático”; si te aparece
alguna revisa tus cálculos porque te has equivocado seguro.
37
COMPRUEBA LO APRENDIDO
Autoevaluación
1. El valor correcto de la varianza de la variable 2 (con dos decimales) es:
2,70.
2. El valor correcto de la desviación típica de la variable 2 es: 1,64.
Coeficiente de variación
Con los cálculos anteriores...
¿Podemos saber qué media de las dos anteriores es más "fiable"?
Las dos variables tratan cosas muy diferentes, y no podemos establecer la
comparación. A priori puede parecer que la segunda variable tiene los datos
MENOS DISPERSOS O MÁS AGRUPADOS, ya que su desviación típica es
menor… ¿y si una variable estuviese medida en mm y la otra en número de
sillas? Está claro que la comparación no es posible… ¿o sí?
Pues con los datos que hemos calculado no, pero sí con otro parámetro
estadístico, es decir, otro "numerajo". Pero no te preocupes, es el coeficiente de
variación y para calcularlo basta dividir la desviación típica entre la media.
En el ejemplo que estamos desarrollando…
El coeficiente de variación de la variable 1 vale:
2,13107954 : 3,75 = 0,568287877.
COMPRUEBA LO APRENDIDO
Autoevaluación
El valor correcto del coeficiente de variación de la variable 2 es (con 2
decimales) 0,19 .
Por tanto, ahora sí podemos asegurar que los datos de la variable 2 están
mucho más cercanos a la media, la cual es, por tanto, más representativa y
fiable.
38
PARA SABER MÁS…
Las dos variables vistas están relacionadas con trastornos relativos a la
alimentación.
Para saber más sobre anorexia y bulimia puedes visitar los enlaces siguientes:
● Geosalud.
● Tú eres más que una imagen.
● Adaner.
Ya sabes hacer muchas cosas con nuestros datos, pero no tiene sentido que nos
pongamos a hacer cuentas y gráficos perdiéndonos entre números y tablas
simplemente porque sí.
Ten presente que se trata de dar respuesta a lo que queríamos saber extrayendo
conclusiones:
Las tablas de frecuencias y los gráficos tienen por objetivo organizar y facilitar
la visualización de los datos.
La media aritmética indica un valor representativo de la variable, que resume la
información de los datos recogidos y se interpreta en la realidad concreta que
estamos estudiando.
39
La varianza y desviación típica nos dicen cómo están agrupados los datos
respecto de la media. Permiten saber hasta qué punto la media aritmética da una
buena información de la realidad estudiada.
EJERCICIO RESUELTO
Por ejemplo:
Caso práctico
Por ejemplo:
Imaginemos que estudiamos la dieta de 8 personas y extraigamos conclusiones a
partir de los datos. Hemos estudiado dos variables: la cantidad de calorías
ingeridas por persona y día y el % de grasas ingeridas.
Supongamos que, después de hacer todos los cálculos de nuestro estudio, estos
son los resultados que hemos obtenido:
La media de calorías ingeridas por persona y día son 1800 kcal, con
una moda de 1810 kcal y una desviación típica de 50 kcal.
Respuesta:
Respecto a las calorías ingeridas, los valores de la media y la desviación típica
nos dicen que la mayoría ingiere entre 1750 y 1850 kcal diarias, siendo el
valor más repetido 1810 kcal. Podemos interpretar que estas 8 personas tienen
un consumo de calorías diarias razonablemente sano (acercándose a bajo),
siendo su comportamiento muy parecido (puesto que hay poca variación entre las
respuestas).
Respecto del % de grasas ingeridas, si bien no ingieren demasiadas calorías
(como hemos visto antes) el porcentaje medio de grasas en su alimentación es
demasiado elevado.
40
Sin embargo, la desviación típica indica que las respuestas están entre 23% y
57%, lo que refleja que hay grandes diferencias entre unas personas y otras.
Algunas cuidan la cantidad de grasa en su dieta pero otras hacen un consumo
peligroso para la salud.
Hay mucha disparidad en las respuestas:
EJERCICIO RESUELTO
Otro ejemplo:
Variable: Índice de masa corporal (IMC) (para saber qué es el índice de masa
corporal o IMC mira éste enlace)
41
Población: niños de nuestro país.
Muestra: 200 niños seleccionados al azar.
IMC Frecuencia
absoluta
25-29,9 66
30-34,9 16
35-39,9 1
40 o mayor 1
¿Qué podemos decir a la vista de los datos? Seguro que se te ocurren muchas
cosas, y eso que aún no hemos hecho ni una cuenta. Casi a simple vista, vemos
que…
Respuesta:
● 110 niños (el 55%) tienen un IMC saludable,entre 18,5 y 24,9
● un 3% tiene un peso demasiado bajo,
● y un 9% (18 de los 200) tienen obesidad.
Además, el IMC medio es 24,51, es decir, normal cercano al sobrepeso.
(Hemos tomando como marcas de clase en los intervalos extremos la media de
las 6 respuestas para el intervalo "menor que 18,5", que es 18 y la respuesta en el
intervalo "40 o mayor", que ha sido 40).
Parece claro que todos tenemos que poner de nuestra parte, y las autoridades
sanitarias, para cuidar la alimentación de los niños, ya que un niño obeso es un
joven enfermo. Las prisas, el trabajo, la comodidad no pueden ganar la batalla a
la dedicación y el interés por lo que nuestros niños comen.
Ya ves. Se pueden sacar muchas conclusiones, a veces de gran importancia
social, con un estudio estadístico… ¡y eso que sólo hemos metido un pie en el
mundo de la Estadística!
42
EJERCICIO RESUELTO
Autoevaluación
Caso práctico
Autoevaluación
Ahora extrae tú tus propias conclusiones, sin hacer nuevos cálculos, sobre:
1. El estudio sobre el número de piezas de fruta.
2. Las variables 1 y 2 que estudiaste en el apartado anterior.
Respuesta:
1. Posibles conclusiones son:
○ El número medio de piezas de fruta consumidas al día es 1,52.
○ Las respuestas más frecuente son 1 y 2 piezas de fruta.
○ Más de la mitad (52%) toma una o ninguna pieza de fruta.
○ Sólo un 20% toma 3 o más piezas.
○ Se debe promover un mayor consumo de frutas como parte de
una alimentación completa y sana. Debemos sustituir por fruta
la bollería industrial, perjudicial para nuestra salud y calidad de
vida.
2. Veamos:
○ Variable 1:
■ Por término medio la puntuación de la imagen
personal es 3,51, lo que indica bajo nivel de
autoestima respecto del aspecto físico.
■ La puntuación más frecuente es 5, indicada por 103
de los 230 encuestados.
■ Casi el 45% "suspende" su imagen.
■ Sólo el 0.52% está satisfecho con su imagen
(puntuándola con 7 o más).
■ Se deben promover patrones de belleza saludables y
realistas, ya que los actuales producen frustración y
baja autoestima respecto del aspecto físico.
○ Variable 2:
■ El nivel medio es 8,56.
■ La respuesta más frecuente es 10.
43
■ Un elevado porcentaje (superior al 90%, 208 de los
230 encuestados) atribuye una gran importancia como
causa de su enfermedad (respondiendo 7 o más)
■ Sólo un 0.34% atribuye un nivel de importancia
inferior a 5.
■ Parece claro que la influencia de los cánones de
belleza promovidos socialmente es un factor
importante en la aparición de trastornos alimentarios,
por tanto todos los componentes de la sociedad
deberían tomar medidas al respecto, para que
disminuyan los casos de éstas enfermedades.
Para si quieres ahorrarte hacer todas las cuentas, y además representar los datos
en una bonita gráfica, lo mejor es usar una hoja de cálculo. En estos vídeos te
enseñan su funcionamiento.
¿Te parece difícil? Ya sabes que, al principio, casi todo lo es. Pero si practicas un
poco, verás que no es para tanto y, sobre todo , te ahorrarás tanto cálculos que, al
final, estarás encantado de haber aprendido a manejarla.
Para ayudarte a dar tus primeros pasos, ¿te acuerdas del estudio del consumo
semanal de golosinas de los niños de un colegio? Esta es su hoja de cálculo en
excel y así se vería en versión libre en formato ods.
7. ¿Y SI LA INFORMACIÓN NO ES FIABLE?
Constantemente estás recibiendo información en gráficos pero muchos están
manipulados voluntariamente. Fíjate en el siguiente caso extraído del periódico
eldiario.es
44
En un programa de televisión se usó el gráfico de la izquierda con la evolución
del paro registrado en el año 2013. El eje estaba tan cortado que parecía que el
paro se había reducido a casi cero durante esos meses. En este caso puedes
comprobar lo importantísimo que es usar la escala adecuada en cada eje.
Observa estos dos diagramas de barras. En ambas tablas los porcentajes son los
mismos (27 % prefiere Sociales, algo menos del doble que el 15 % que prefiere
Mates). Sin embargo en la primera gráfica (¡ precisamente la que la hoja de
cálculo de Google ofrece por defecto! ) el porcentaje de preferencias de las
Sociales sobre las Mates parece ser siete u ocho veces mayor.
CURIOSIDAD
Sin embargo, los gráficos han evolucionado muchísimo con la tecnología y su
utilidad es enorme. En el siguiente enlace del periódico El mundo puedes ver un
comparativa de las leches de España realizada por la OCU.
8. RESUMEN.
IMPORTANTE
En este tema se trabajan los aspectos más importantes relacionados con la
Estadística, una parte de las Matemáticas que se ocupa de estudiar grandes
45
cantidades de datos sobre un tema concreto. Verás desde cómo se hace una
encuesta hasta cómo hacer cuentas con los datos y sacar conclusiones. Aplicamos
las técnicas de la estadística a ejemplos sobre alimentación saludable y al análisis
crítico de la información presentada con gráficos.
IMPORTANTE
A lo que queremos estudiar lo llamamos variable estadística
Las variables cuantitativas pueden ser discretas (número de libros leídos el
último mes) o continuas (la estatura).
Las variables que no se expresan numéricamente se llaman cualitativas (tipo de
café que se consume en el desayuno).
¿Qué o quiénes son los que queremos analizar?
La muestra se debe escoger con cuidado para que sea representativa.
IMPORTANTE
¿Cómo obtenemos los datos?
Los datos pueden obtenerse de manera directa o indirecta.
La obtención directa puede hacerse por medición o cuestionario.
¿Qué hacemos con los datos obtenidos?
Los datos obtenidos se organizan en una tabla de frecuencias (a veces los datos se
agrupan en intervalos).
Tendremos frecuencias absolutas (ni = número de veces que se ha observado el
valor xi) y frecuencias relativas (fi = ni/n donde n es el número total de
observaciones).
46
IMPORTANTE
Representamos los datos con gráficos
IMPORTANTE
Números que nos resumen la información de todos los datos
Con los datos podemos obtener valores que representan información sobre los
datos recogidos. Los más importantes son:
IMPORTANTE
Sacamos información a partir del estudio estadístico.
Por último, no olvidemos que el objetivo es interpretar los datos y extraer
información sobre la variable estudiada.
Los cálculos realizados nos llevan a valores que debemos interpretar.
Cuidado con los engaños intencionados de la información que recibimos a través
de los medios de comunicación.
47
9. PARA APRENDER… HAZLO TÚ.
En este tema has aprendido a hacer estudios estadísticos. Ahora vas a poner en
práctica lo aprendido y... lo que aún no hayas entendido, te quedará más claro
después de estudiar las siguientes actividades.
ACTIVIDAD DE LECTURA
Actividad de lectura
Se ha realizado el siguiente estudio estadístico:
Se han seleccionado al azar 25 personas que hacen algún tipo de dieta estricta,
tipo "milagro", (de distinto sexo, edad, condición social).
Sobre esa muestra se ha estudiado el % de reducción de vitaminas que sufren
como consecuencia de su dieta, siendo los resultados:
10%, 50%, 72%, 30%, 40%, 65%, 24%, 8%, 45%, 30%, 45%, 67%, 76%, 81%,
23%, 43%, 12%, 58%, 32%, 66%, 34%, 23%, 34%, 71%, 15%.
1. Realiza la tabla completa de frecuencias (agrupa los datos en
intervalos de amplitud razonable para tu trabajo).
2. Realiza el correspondiente histograma.
3. ¿Cuál es el intervalo modal?
4. ¿Qué porcentaje medio de vitaminas se pierde?
5. Halla la varianza, desviación típica y el coeficiente de variación.
6. Extrae conclusiones a partir de los datos sobre las dietas "milagro" y
las consecuencias para la salud.
RESPUESTA:
Vamos allá…
48
a. Tabla de frecuencias:
Aunque no es la única opción, vamos a agrupar los datos en intervalos de
amplitud 20 aproximadamente:
80-100 1 0.04 25 1
Suma 25 1
total:
b. Histograma:
c. Intervalo modal:
El intervalo modal es 20-39, cuya frecuencia absoluta vale 8 y es superior a
las demás.
49
d. Porcentaje medio de vitaminas que se pierde:
Lo que nos están pidiendo aquí es, sencillamente, que calculemos la media
de la variable.
Para hacer la media, necesitamos un representante de cada intervalo:
tomaremos, como es habitual, el punto medio. Así, los representantes son:
9,5 - 29,5 - 49,5 - 69,9 - 89,5 (que hemos calculado sumando los valores de
los extremos de cada intervalo y dividiendo entre 2 los resultados)
Usando estas marcas de clase y las frecuencias absolutas calculamos la
media:
Luego calculamos la desviación típica; solo hay que hacer la raíz cuadrada al
resultado anterior:
50
f. Por tanto, la desviación típica es 22,55 %
Por último, dividiendo la desviación típica entre la media obtenemos el
coeficiente de variación:
ACTIVIDAD DE LECTURA
Queremos saber si el consumo habitual de "comida basura" influye en la
obesidad, en la población Andaluza.
51
Actividad de lectura
Queremos saber si el consumo habitual de "comida basura" influye en
la obesidad, en la población Andaluza.
RESPUESTA:
Veamos lo bien que lo has hecho…
1. Para saber la influencia de la comida basura en los casos de obesidad en
Andalucía, es obvio que no bastará con preguntar a sólo 10 personas,
es una muestra insuficiente. Si preguntamos a 10 personas, la
población a estudiar debe ser más reducida. Una población adecuada
puede ser, por ejemplo, las personas de nuestro vecindario que comen
un considerable número de veces "comida basura". Además, debemos
seleccionar a los 10 entrevistados al azar.
2. Los valores obtenidos oscilan entre 28 y 41, siendo el IMC medio de 34,3.
52
3. 7 de las 10 las personas encuestadas tienen un IMC igual o mayor que
30, lo que indica que son obesas. Las otras tres padecen sobrepeso no
muy lejano a la obesidad. Además, el IMC medio revela claramente las
malas consecuencias de la comida basura frecuentemente ingerida.
4. Por tanto, y aunque se podrían (y deberían) tener más factores y cálculos
en cuenta, con la información vista parece bastante claro que las
personas asiduas a la "comida basura" sufre obesidad, con los
graves problemas que ello conlleva.
53