Taller de Variable

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 12

UNIVERSIDAD DE PAMPLONA ESTADISTICA

DESCRIPTIVA

1. En los siguientes ejemplos, determinar:


a) Cuál es la/s variable/s en estudio y de qué tipo son cada una de ellas
(discreta, continua, cualitativa, cuantitativa).
b) Cuál es la muestra y cuál es la población de la que proviene.

1.1 En el boletín del Instituto de Oceanografía se publicó un trabajo sobre el


crecimiento de la dorada en el Mar Menor. El mismo estaba basado en
la observación de 135 ejemplares de dicha especie.

c) Variable: crecimiento de la dorada


Tipo: Cuantitativa Continua
b) Población: total de dorada del mar
Muestra: 135 doradas del mar

1.1 En el vivero se midió la altura de ocho abedules a las tres semanas de


darle un determinado fertilizante.

a) Variable: Altura delos abedules


Tipo: cuantitativa continua
b) Población: total e abedules de tres semanas de vivero
Muestra: Ocho abedules de tres semanas de vivero

1.2 Se capturaron 30 truchas hembras y se las pesó, luego se determinó el


número de huevos que contenían.

a) Variable: Peso de las truchas


Tipo: Cuantitativa continua
b) Población: Truchas hembras
Muestra: 30 truchashembras

1.3 Se realizo una muestra de 30 cerdos tomados de diferentes


establecimientos elegidos al azar para determinar la presencia de
Triquinosis.

a) Variable: Presencia de triquinosis


Tipo: Cualitativa nominal
b) Población: Cerdos de distinto establecimiento
Muestra: 30 cerdos de distintos establecimientos

1.4 Se telefoneó a 10 localidades de la comarca andina para informarse


sobre el número de enfermos de Hepatitis.

a) Variable: Número de enfermos de hepatitis


Tipo: Cuantitativa discretas

1
b) Población: Localidades de la comarca
Muestra: 10 localidades de la comarca

1.5 Se analizaron los saldos de 200 cuentas corrientes de empresas en el


Banco R.

a) Variable: Saldos de las cuentas


Tipo: Cuantitativa continua
b) Población:Cuentas corrientes de empresas en el banco R.
Muestra: 200 cuentas corrientes de empresas en el banco R.

1.6 Se realizó un estudio del nivel de ingresos de la población de Bariloche


en base a una muestra aleatoria de 5000 residentes.

a) Variable: Ingresos
Tipo: Cuantitativa Continua
b) Población: Población de Bariloche
Muestra: 5000 residentes de la población de Bariloche2. En cada uno de
los siguientes estudios decir cuál es la variable en estudio, clasificarla y
dar una idea posible de tabulación de la información obtenida

2. En cada uno de los siguientes estudios decir cuál es la variable en estudio,


clasificarla y dar una idea posible de tabulación de la información obtenida

2.1 Se comparó la ganancia de peso de cuatro grupos de cerdos sometidos


a tres dietas diferentes y a una dieta normal (control).

a) Variable: Peso
b) Tipo: cuantitativa continua

2.2 Determinación del número de infectados por muestra. Cada muestra


tiene 5 individuos y en total se tienen 100 muestras.

a) Variable: Número de afectados de la muestra


b) Tipo: cuantitativa discreta

2.3 Relación entre la cantidad de inscriptos y egresados por año en los


últimos diez años en una determinada Universidad Nacional.

a) Variable: inscritos.
b) Tipo: Cuantitativa discretas.
c) Variable: Ingresados
d) Tipo: Cuantitativadiscretas.

2.4 Determinación de la fecundidad diaria de dos muestras de 25 hembras


de Desophila Melanogaster cada una, estando dada la fecundidad por
el número de huevos depositados por hembra y por día durante los
primeros 14 días de vida. Cada una de las muestras pertenece a las
cepas SS y NS respectivamente.

a) Variable: Estado de la fecundidad de huevos


b) Tipo: Cuantitativa discretas.

2
2.5 Relación entre el ancho y el largo del caparazón de una muestra de
tortugas.
a) Variable: Ancho de la del caparazón.
b) Tipo: Cuantitativa continua

3. Una empresa dedicada a la actividad turística está planeando realizar un proyecto de


inversión en San Carlos de Bariloche y solicita su asesoramiento para obtener
información sobre la situación hotelera de dicho municipio en el año 2009 (Tabla eoh-
2009_Bariloche.xls).

Para ello desea saber:


a) El valor medio mensual y la varianza de establecimientos hoteleros de 1 y 2
estrellas.
b) El valor medio mensual y la varianza de establecimientos “para-hoteleros”.

Para las categorías anteriores (“establecimientos hoteleros de 1 y 2 estrellas” y “para-


hoteleros”):
c) Determinar el valor medio mensual de plazas disponibles por establecimiento.
d) Determinar el valor medio mensual de plazas ocupadas por establecimiento.

e) A su vez, la empresa interesada desea saber los siguientes datos:

Porcentaje de Ocupación Cantidad de Meses


de las Habitaciones o (frecuencia absoluta)
Unidades en
Frecuencia Relativa
Establecimientos
Hoteleros de 1 y 2
Estrellas
[0 – 25)
[25 – 50)
[50 – 75)
[75 -100)

En base a la tabla anterior:


f) Realizar el histograma y el polígono de frecuencias.
g) Calcular la media, mediana, modo y desvío.
h) Determinar el intervalo de las categorías
i) Dado que es un/a excelente conocedor/a de la materia, particularmente de “estadística
descriptiva” ¿cómo sugeriría agrupar los datos de la tabla anterior? Represente dicha
tabla teniendo en cuenta que deseamos presentar los datos en 3 clases.

En base a la tabla del acápite (i):


j) Realizar el histograma, el polígono de frecuencias y la ojiva.
k) Calcular la media, mediana, modo y desvío.
l) Determinar la amplitud de variación de la distribución
m) Definir el tipo de asimetría que presenta la distribución.
n) Definir el tipo de Curtosis que presenta la distribución.
o) Calcular el valor del percentil 60.
p) Calcular el valor del decil 8.
q) Calcular el valor del 1º cuartil.

3
4. Una consultoría ha realizado una pequeña encuesta acerca del tipo de conexión a
Internet que posee un grupo de 100 personas, cuyas respuestas han sido las siguientes:

Adsl Inalámbrica Telefónica Cable modem


42 30 16 12

a) Realice el histograma de frecuencias absolutas simples y relativas.


b) ¿Qué proporción de usuarios utiliza Adsl o Inalámbrica?

5. En una empresa de Servicios Informáticos se obtuvieron los siguientes valores, que


representan las edades de 10 empleados de la misma:

29 56 34 27 32 26 31 32 28 58

a) Calcular las medidas de centralización (media aritmética, mediana y moda)


b) ¿Cuál de las tres medidas es la menos representativa de los datos? ¿Por qué?
c) Calcular el desvío típico (o estándar) y la varianza
d) Interpretar el significado del desvío en el problema.

6. Los datos siguientes corresponden al número de ordenadores portátiles vendidos


trimestralmente por distintas tiendas informáticas de una franquicia:

12 18 35 35 36 36 37 37 38 38 38 38
38 39 39 39 39 40 40 41 41 42 42 47

a) Realice una tabla simple de frecuencias

b) Determine el numero medio, modal y mediano del numero de portátiles vendidos


trimestralmente por una tienda de esta franquicia. Interprete cada una.

c) La franquicia quiere premiar al 25% de las tiendas que mas ventas tengan en
portátiles. ¿Cuál será el número de portátiles a vender por una tienda para
beneficiarse de este premio?

d) Calcule el coeficiente de variación e interprete el resultado.

7. Se ha controlado la capacidad en Gb. de 50 PCs, obteniéndose los siguientes resultados:

Capacidad (Gb) Número


De 1 a 20 6
De 21 a 40 10
De 41 a 60 20
De 61 a 80 9
De 81 a 100 5

a) Hallar la media aritmética.


NOTA: Al cargar la planilla, emplear una columna para los límites inferiores y otra
para los superiores, a fin de poder usarlos para los cálculos necesarios.
b) Hallar el desvío y la varianza.
c) Construir el histograma de frecuencias.
d) ¿Qué porcentaje de PC’s tienen una capacidad inferior a 61 Gb?
e) ¿Qué porcentaje de PC’s tienen una capacidad superior a 40 Gb?
f) ¿Qué porcentaje de PC’s tienen una capacidad entre 41 y 80 Gb?

4
8. Las siguientes medidas corresponden a los tiempos de respuesta en un sistema
Cliente/Servidor para 50 peticiones de datos:

Tiempo (segundos)
1,56 1,59 1,63 1,62 1,47 1,57 1,60 1,54 1,56 1,65
1,61 1,59 1,51 1,62 1,50 1,62 1,59 1,62 1,54 1,62
1,53 1,49 1,57 1,54 1,68 1,52 1,62 1,59 1,49 1,53
1,59 1,58 1,57 1,47 1,65 1,53 1,59 1,56 1,54 1,64
1,55 1,59 1,53 1,56 1,58 1,52 1,63 1,56 1,62 1,53
a) Confeccionar la tabla de frecuencias absolutas, relativas, acumuladas y relativas
acumuladas.
b) Calcular la media, mediana y moda.
c) Histograma de frecuencias.
d) Histograma de frecuencias relativas.
e) Ojiva creciente.
f) Ojiva decreciente.
g) Ojiva creciente porcentual.
h) Ojiva decreciente porcentual.

9. La siguiente información corresponde a la cantidad de infracciones de tránsito diarias


durante 30 días en S. C. de Bariloche.

7, 5, 8, 6, 7, 4, 3, 6, 7, 9, 10, 6, 7, 5, 9, 4, 7, 5, 8, 9, 7, 6, 8, 5, 8, 7, 7, 8, 8, 6

a) Indique unidad estadística. Defina la variable en estudio, tipo y campo de


variación.
b) Construya la tabla de frecuencia.
c) Grafique las distribuciones halladas.
d) Calcule analíticamente la media, modo y mediana. Interprete.
e) Calcule e interprete el intervalo x  S ( x) ; x  S ( x) . Donde s(x) es el desvío
típico.
f) Calcule e interprete el Q1

10. La fabricación de arandelas de distinto diámetro presenta la siguiente distribución


diaria:

Diámetro en mm Cantidad de Arandelas


[5;10) 500
[10;15) 1200
[15; 20) 1500
[20;25) 2000
[25;30) 1800
[30;35) 600
[35;40) 400

a) Calcular la media aritmética.


b) Calcular la mediana y el modo.
c) Calcular la varianza y desviación típica.

11. Los siguientes datos corresponden al salario mensual (en $) de un grupo de 50 obreros:

5
153 134 146 138 132 137 143 125 145 145
123 131 148 122 138 120 144 139 138 124
131 142 135 146 137 126 138 136 141 143
132 134 152 137 142 117 137 144 128 137
141 148 128 151 138 136 138 140 133 132

a) Calcular las medidas de centralización.


b) ¿Cuál de las tres medidas es la menos representativa de los datos? ¿Por qué?
c) Calcular el desvío estándar y la varianza.
d) Calcule Q1 y Q3. Interprete el intervalo [Q1 ; Q3]
e) Calcule el salario promedio mensual de los trabajadores suponiendo un aumento
de $30 en el sueldo de cada uno de ellos.
f) Ídem al punto anterior suponiendo un aumento del 25% sobre los sueldos
originales.
g) Si otro grupo de obreros tiene un sueldo mensual promedio de 120$ y un desvío
típico de 9$. Cuál de los dos grupos es más homogéneo. ¿Por qué?
h) Realice el cuadro de frecuencias, pero agrupando los datos según los criterios
vistos.
i) Para los datos agrupados, calcular la media, mediana y moda.
j) Grafique el Histograma para las frecuencias simples de los datos agrupados.

12. Un odontólogo atendió la siguiente cantidad de pacientes diarios durante los últimos 10
días:

18 11 15 14 9 20 17 14 12 16

a) Definir unidad estadística y la variable en estudio.


b) Calcular e interpretar: el modo, la mediana y la media.
c) Calcular: la variancia y el desvío estándar.

13. Los siguientes datos representan el número de bovinos que nacieron vivos en 30
estancias de Chubut:

20 21 22 23 21 24 23 24 22 22 22 23 21 23 22
23 23 22 24 24 25 25 23 21 25 20 20 24 22 23

a) Indique unidad estadística. Defina la variable en estudio, tipo y campo de variación.


b) Construir la tabla de frecuencias. Representar.
c) Calcular e interpretar: el modo, la mediana, la media.
d) Calcular: la variancia y el desvío estándar.
e) Determine el tipo de asimetría de la distribución.

14. Una empresa de taxis registró los siguientes kilometrajes recorridos por sus 8
automóviles para cubrir viajes, en la sucursal de la zona A, durante el último mes:

5516 7820 3010 8294 5232 5780 6548 4500

El titular de la empresa opina que el rendimiento de dicha sucursal es algo irregular y


que podría ser optimizado lanzando una campaña publicitaria en dicha zona. Para

6
comparar se basa en los registros de la sucursal B, que el mes pasado arrojó un
promedio de 7600 km y un desvío estándar de 1200 km.

a) Indique cuál de las dos sucursales tiene kilometraje más homogéneos y si la opinión
del titular es aceptable.

15. En un estudio realizado en una colonia de vacaciones se registró el ingreso diario de


turistas en un período. Los datos fueron ordenados en la siguiente tabla:

N0 turistas 50-55 55-60 60-65 65-70 70-75 75-80 80-85


N0 de días 4 6 18 13 8 6 5

a) En cuántos días se registró un ingreso de cómo máximo 75 turistas?


b) En qué porcentaje de días se registró un ingreso superior a 65 turistas?
c) Calcule el promedio y el desvío estándar.
d) Calcule la mediana. Interprete.
e) Calcule el intervalo [Q1; Q3]. Interprete.
f) Calcule el modo. Interprete.
g) Cuál es el valor de la variable superado por el 20% de las observaciones.
h) Determine el tipo de asimetría de la distribución.

16. - De una muestra hecha a 50 familias, se sabe que 5 de ellas tiene un solo hijo, que 8 de
ellas tiene a lo sumo un hijo, que 8 de ellas tiene por lo menos 5 hijos, que ninguna de
ellas tiene m ás de 6 hijos, que el 12% de ellas tiene 5 hijos, que 33 familias tiene menos
de 4 hijos, que el 38% tiene no más de 2hijos, Construya la tabla de frecuencia.

17. Representar mediante un diagrama de caja la siguiente información que corresponde a


pulsaciones cardíacas de 42 personas participantes de un programa de entrenamiento:

52 56 60 60 92 78
69 60 60 60 76 76
64 64 64 64 78 78
64 64 66 66 80 84
66 66 66 72 88 78
72 72 72 72 78 84
72 72 72 78 80 80

18. Analice, en los siguientes casos, la variación conjunta de las componentes de las
variables bidimensionales a través del coeficiente “covarianza” y correlación.

Espesor de la cáscara de naranjas y contenido de jugo de las mismas (en cm3)


Orden observ.(i) 1 2 3 4 5 6 7 8 9 10
Espesor (X en mm) 7 6 5 6 5 6 4 3 2 2
Jugo ( Y en cm3) 2 3 4 5 5 5 6 6 7 9

a) Construya la tabla de desvíos y productos de desvíos


b) Calcule la covarianza por definición. Interprete.
c) Grafique los datos en un diagrama de dispersión.
d) Confeccione la tabla de contingencia para los datos

7
19. La siguiente tabla corresponde al salario de los empleados de una agencia de viajes y la
cantidad de años que lleva en servicio.

a) Defina la unidad estadística, la variable en studio y el tipo y campo de variación.


b) Confecciner la tabala de contingencia
c) Calcular la covarianza.

Salario \ Antigüedad [0 – 5) [5 – 10) [10 – 15) [15 – 20) [20 o más

[300 – 400) 10 9 3 2 1

[400 – 500) 6 12 13 6 2

[500 – 600) 1 5 12 5 3

[600 o más 2 3 2 2 1

20. Los siguientes diagramas de caja corresponden la resistencia a la compresión de cuatro


diferentes técnicas de mezclado en la elaboración de hormigón.
a) Analice el diagrama de cada técnica y describa cada una de ellas. Tenga en cuenta:
posición, dispersión y simetría. Utilice los diagramas para comparar las técnicas

entre sí
b) Indique las similitudes y diferencias que observa en las diferentes técnicas de
mezclado. Los siguientes diagramas de caja corresponden el efecto de las burbujas
de aire sobre la resistencia del asfalto. Las burbujas se controlan en tres niveles:
bajo, medio y alto. a) Ídem inciso a) del ejercicio anterior. b) Ídem inciso b) del
ejercicio anterior.

8
EJERCICIOS OPCIONALES

1. Se desea saber sobre la intensidad con que trabaja una estación de comunicación.
Para ello se realizó una muestra aleatoria, donde se obtuvieron los siguientes datos
expresados como bytes/minuto :

56 58 53 74 27
47 40 101 57 72
51 67 31 52 21
44 49 27 63 43

En función de ello se dese saber:


a) El valor medio de bytes/minuto. b) La mediana
c) El rango de variabilidad d) La varianza y coeficiente de variación

2. De los datos del ejercicio anterior:


a) confeccione la siguiente tabla de frecuencias

Frecuencia Frecuencia
Frecuencia Frecuencia
Absoluta relativa
Intervalos Absoluta Relativa
acumulada Acumulada
fi fi en %
fac fac en %

[ 20 - 34 ]
[ 35 - 49 ]
[ 50 - 64 ]
[ 65 - 79 ]
[ 80 - 94 ]
[ 95 - 109 ]

b) Realice el Histograma y el polígono de frecuencias para los datos agrupados.


c) Completar el siguiente cuadro:

Frecuencia
Valor medio del Frecuencia
relativa
Intervalos intervalo Absoluta (xmi)* fi
Acumulada
(xmi) fi
fac en %

[ 20 - 34 ]
[ 35 - 49 ]
[ 50 - 64 ]
[ 65 - 79 ]
[ 80 - 94 ]
[ 95 - 109 ]

d) Obtener la media muestral para los daos agrupados:


e) Calcular la varianza muestral para datos agrupados
f) Determinar el intervalo que contiene la mediana:
g) Obtener la Mediana para los datos agrupados:
h) Determinar el intervalo modal (aquel que contiene el modo):
i) Obtener el modo:
j) ¿Cuál es el valor del tercer cuartil?
k) ¿Cuál es el valor del séptimo decil?
l) ¿Cuál es el valor del percentil 60?

9
3. Una empresa desea analizar el amperaje máximo que soporta un tipo de resistencia
que es suministrada por un proveedor. Para ello se sometieron a prueba diez
unidades cuyos resultados arrojaron lo siguiente:

1,87 A 1,52 A 2A 1,55 A 1,85 A


1,71 A 1,68 A 1,78 A 1,56 A 1,6 A

Obtener:
a) Calcular la media muestral
b) Calcular la mediana
c) Obtener la varianza
d) Calcular el coeficiente de variación.

4. De los datos del ejercicio anterior,


a) completar el siguiente cuadro:

Frecuencia Frecuencia
Frecuencia Frecuencia
Absoluta Acumulada
Intervalos Absoluta Relativa
acumulada Relativa
fi fi en %
fac fac en %
[ 1,5A - 1,6A )
[ 1,6A - 1,7A )
[ 1,7A - 1,8A )
[ 1,8A - 1,9A )
[ 1,9A - 2A )
[ 2A - 2,1A )

Para los datos agrupados, obtener:


b) La media muestral:
c) La varianza muestral:
d) Determinar el intervalo que contiene la mediana:
e) Obtener la Mediana.

5. Se realizó un examen parcial a 44 alumnos cuyos resultados se exponen en el


siguiente cuadro de frecuencias.
a) Rellenar las columnas vacías
b) Calcular la media, mediana y modo

Cantidad
Nota de xi * f i
( xi  x ) 2 * f i
(X) alumnos
(fi)
1 2
2 5
3 7
4 14
5 6
6 5
7 2
8 0
9 2
10 1
10
Suma

Donde: x = Nota de Examen;


fi = frecuencia absoluta
x = media poblacional
c) Calcular la varianza, el desvío y el coeficiente de variación.
d) Calcular la asimetría mediante el coeficiente Pearson y tipificar la misma
e) ¿Cuál es el valor del segundo cuartil?
f) ¿Cuál es el valor del sexto decil?
g) ¿Cuál es el valor del percentil 75?

6. Se desea comparar el impacto en la emisión de dióxido de azufre (SO 2) entre dos


procesos productivos. Para ello se realizaron muestras de aire en cada proceso,
obteniéndose los siguientes datos (en ppm):

Proceso A Proceso B
12,88 13,87
10,99 11,72
14,75 12,67
8,23 10,67
10,57 6,18
10,11 3,22
13,15 5,82
12,91 24,74
11,34 6,24
15,97 18,33

Los resúmenes estadísticos en ambos proceso son los siguientes:

Proceso A Proceso B
 

Media 12,09 Media 11,35


Error típico 0,73 Error típico 2,07
Mediana 12,11 Mediana 11,20
Desviación estándar 2,30 Desviación estándar 6,55
Varianza de la muestra 5,28 Varianza de la muestra 42,92
Curtosis -0,23 Curtosis 0,55
Coeficiente de asimetría 0,10 Coeficiente de asimetría 0,88
Rango 7,75 Rango 21,52
Mínimo 8,23 Mínimo 3,22
Máximo 15,97 Máximo 24,74
Suma 120,90 Suma 113,47
Cuenta 10,00 Cuenta 10,00
Cuartil 1 10,67 Cuartil 1 6,20
Cuartil 3 13,09 Cuartil 3 13,57
En base a la información disponible realizar los diagrama de caja de cada proceso.

7. Una empresa de colectivos urbanos registró la cantidad de pasajeros transportados


durante 50 viajes; con el siguiente resultado:

11
55 54 55 55 54 53 55 52 53 53
54 52 55 57 55 56 56 56 55 56
52 55 53 58 56 59 55 55 53 55
54 54 54 56 55 54 55 54 53 54
53 55 53 53 54 56 57 53 54 55

a) Calcular las medidas de centralización (media, mediana y moda).


b) ¿Cuál de las tres medidas es la menos representativa de los datos? ¿Por qué?
c) Calcular el desvío estándar y la varianza.
d) Interpretar el significado del desvío en el problema.
e) Calcular las frecuencias simples y relativas
f) Calcular las frecuencias acumuladas simples y relativas
g) Realizar el histograma y polígono de frecuencias para las frecuencias relativas.

8. Un avión realiza un viaje entre dos ciudades en un tiempo promedio de 3 hs con un


desvío estándar de 0.5 hs. Un tren realiza el mismo trayecto con un promedio de 24
hs. con un desvío estándar de 1.2 hs. ¿Cuál de los dos medios de transporte es más
puntual?.

9. La tabla siguiente muestra el gasto semanal en fotocopias (en centavos) de 70


secundarios del mismo colegio.

15 210 350 525 50 210 360 550 100 215 370 550 110 215 380 575
115 215 400 600 115 220 410 600 115 220 410 650 120 225 430 700 125
245 455 700 140 250 475 730 140 250 480 760 150 275 500 800 150
280 500 900 165 280 500 1000 175 285 510 1000 185 300 510 1190 200
300 520 200 325 520

a) Calcular media, desvío estándar, cuartiles y el rango intercuartílico.


b) Construir un diagrama de cajas.
c) Hacer un histograma de los datos.

10. Una empresa fracciona azúcar en bolsas y sachets. Las bolsas tienen un peso
promedio de 50 Kg. con un desvío estándar de 0.5 kg.; y los sachets tiene un peso
promedio de 5 gs. con un desvío de 0.9 gs. Cuál de los dos procesos es más variable?.

11. Los datos de una muestra de sueldos anuales de profesores y médicos de cierta ciudad
dan los siguientes resultados: para los profesores un promedio de 1600$ y un desvío
estándar de 200$; y para los médicos un promedio de 2300$ y un desvío estándar de
400$. Cuales son los sueldos que tienen más variabilidad.?

12. Si la media y la desviación estándar calculadas de una muestra grande cuya


distribución es aproximadamente simétrica son 10 y 3 respectivamente; use la regla
empírica para responder lo siguiente:
a) ¿Qué porcentaje de las mediciones se encuentran entre 7 y 10 inclusive?
b) ¿Qué porcentaje de las mediciones son mayores que 16?
c) ¿Y menores que cuatro?

12

También podría gustarte