Tarea 4 - EST I

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 11

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL

FACULTAD DE CIENCIAS NATURALES Y MATEMATICAS

ESTADISTICA I

Nombres: Edinson Ismael Carrasco Maldonado Fecha: 30/05/2021

Paralelo: 5 – ESTG1036

Profesores: Dalton Geovanny Noboa Macias

Tarea 4. Estadística Descriptiva Multivariada

Tema 1.
Se entrevista a seis personas y se les pregunta en ese orden:
X = edad en añ os
Y= nú mero de hijos que tiene
Z= nú mero de añ os de educació n formal que posee
Los resultados se muestran en la siguiente matriz de datos:

X Y Z
23.6 0 15
41.3 2 10
33.2 2 14
28.5 1 17
21.6 0 15
36.7 3 17

Realice en Rstudio lo siguiente:


a) Determine la media de cada variable aleatoria

Solució n:
b) Determine la varianza de cada variable aleatoria

Solució n:

c) Determine la matriz de varianzas y covarianzas Σ xyz y la matriz de


correlación r x , y , z

Solució n:

d) Analice la matriz de correlación r x , y , z calculada en el literal c)

Solució n:

 Entre x, y existe una relació n estadística positiva entre ambas variables


siendo que, mientras una variable aumenta, la otra también lo hace.
 Entre x, z no tienen una relació n estadística.
 Entre y, z existe una relació n estadística negativa entre las variables, es
decir, mientras una de ellas aumenta, la otra variable disminuye.

Tema 2.
A un grupo de 15 estudiantes universitarios se le formula tres preguntas: la
primera X1, su edad en añ os; la segunda, X2, el tiempo en minutos que emplean
diariamente para actualizar su espacio en “redes sociales” a las que está n suscritos;
y, la tercera X3, el nú mero de fotografías que han “subido” y puesto a consideració n
de sus contactos en la red social, en los ú ltimos dos meses. Los resultados se
muestran en la siguiente matriz de datos:

Realice en Rstudio lo siguiente:

Para la muestra trivariada calcule el Vector de medias, la Matriz de Covarianzas y


la Matriz de Correlació n. Determine los valores numéricos de los deciles primero al
noveno, así como el primer y tercer cuartil de las tres variables. Construya un
Diagrama de cajas para cada variable. Interprete los resultados.

Solució n:
Interpretación de los resultados:

Guiándonos del vector de medias decimos:

 El promedio de la edad de los estudiantes (x1) es de 20.23 añ os, mientras


que su tiempo promedio empleado en redes sociales (x2) es de 25.53
minutos y finalmente, que el numero promedio de fotos subidas a sus redes
sociales suscritas(x3) es de 59.80.

Teniendo en cuenta la matriz de correlación para un mejor análisis tenemos:

 Entre x1 y x2 existe una relació n estadística negativa entre las variables, es


decir, mientras una de ellas aumenta, la otra variable disminuye.

 Entre x1 y x3 no poseen una relació n estadística.

 Finalmente, entre x2, x3 existe una relació n estadística positiva entre


ambas variables; si una variable aumenta, la otra también lo hace.

Haciendo uso de los datos de los cuartiles esta el hecho de que:

 Al menos el 25% de los estudiantes tienen una edad menor o igual a 18.70
añ os; usan una cantidad de minutos actualizando su espacio en redes
sociales menor o igual a 15.5 minutos y suben un numero de fotografías a
las mismas menor o igual a 41.5

 Al menos el 75% de los estudiantes tienen una edad mayor o igual a 18.70
añ os; usan una cantidad de minutos actualizando su espacio en redes
sociales mayor o igual a 15.5 minutos y suben un numero de fotografías a
las mismas mayor o igual a 41.5

 Al menos el 75% de los estudiantes tienen una edad menor o igual a 20.75
añ os; usan una cantidad de minutos actualizando su espacio en redes
sociales menor o igual a 33 minutos y suben un numero de fotografías a las
mismas menor o igual a 68.5

 Al menos el 25% de los estudiantes tienen una edad mayor o igual a 20.75
añ os; usan una cantidad de minutos actualizando su espacio en redes
sociales mayor o igual a 33 minutos y suben un numero de fotografías a las
mismas mayor o igual a 68.5
Observando los diagramas de caja podemos decir que:

 La variable de edad en añ os presenta una distribució n asimetría positiva y


posee solo valor aberrante que es 26.3.

 La variable de minutos empleado en redes sociales posee una distribució n


asimétrica negativa y no tiene valores aberrantes.

 La variable de fotografías subidas en redes sociales posee una distribució n


asimétrica negativa y no tiene valores aberrantes.

Tema 3.

En Rstudio de forma matricial, calcule el Vector de Medias y la Matriz de Varianza y


Covarianza para la siguiente muestra tetravariada:
Tema 4.

A fin de controlar “en línea” la calidad de un producto, se monitorea un proceso


productivo cada hora, durante veinte horas, tomando una muestra de tamañ o 5 de
la característica que define la calidad(variables), obteniéndose de esta manera las
siguientes veinte muestras:

Nú mero de la
X1 X2 X3 X4 X5
muestra
1 14 11 19 17 8
2 15 20 8 14 12
3 15 14 19 19 20
4 11 19 22 13 11
5 13 9 16 16 13
6 6 10 18 21 9
7 11 17 17 19 15
8 11 15 12 24 6
9 8 17 8 22 16
10 14 16 16 22 11
11 12 19 17 18 19
12 3 9 13 12 14
13 12 15 12 17 26
14 14 20 20 12 20
15 15 14 17 24 18
16 14 10 14 16 11
17 17 21 16 20 19
18 16 13 11 10 16
19 11 18 14 20 17
20 17 17 8 9 13

Realice en Rstudio:

a) Organice los datos en una matriz de datos.

Solució n:
b) Calcule el Vector de medias.

Solució n:
c) Realice un Diagrama de Cajas para cada variable (característica de
calidad)

Solució n:
d) Calcule la Matriz de Covarianzas.

Solució n:

e) Calcule la Matriz de Correlación. Indique la dupla(s) de variables


presentan mayor correlación.

Solució n:

La dupla que presenta mayor correlació n es la de (x1,x2).

También podría gustarte