DEBERCAP1
DEBERCAP1
DEBERCAP1
14 / 06 / 2022
NRC 1509
Deber 1
12. Los valores de densidad relativa anexos de varios tipos de madera utilizados en la
construcción aparecieron en el artículo (“Bolted Connection Design Values Based on European
Yield Model”, J. of Structural Engr., 1993: 2169 -2186): 0.31 0.35 0.36 0.36 0.37 0.38 0.40 0.40
0.40 0.41 0.41 0.42 0.42 0.42 0.42 0.42 0.43 0.44 0.45 0.46 0.46 0.47 0.48 0.48 0.48 0.51 0.54
0.54 0.55 0.58 0.62 0.66 0.66 0.67 0.68 0.75 Construya una gráfica de tallos y hojas con tallos
repetidos y comente sobre cualquier característica interesante de la gráfica. (realizar en R)
Al haber realizado la gráfica, se observa que la mayoría de los valores de densidad relativa se
encuentran entre 0.40 y 0.44 (tercera fila en la gráfica), y por lo tanto, se podría interpretar que la
mayor parte de los tipos de madera usados para la construcción se encuentran en este rango. Por
otro lado, pocos tipos de madera tienen valores de 0.31 y 0.75, lo cual puede decir que son los de
menor y mayor durabilidad respectivamente.
13. Las propiedades mecánicas permisibles para el diseño estructural de vehículos aeroespaciales
metálicos requieren un método aprobado para analizar estadísticamente datos de prueba empíricos.
El artículo (“Establishing Mechanical Property Allowables for Metals”, J . of Testing and
Evaluation , 1998: 293-299) utilizó los datos anexos sobre resistencia a la tensión última (lb/pulg2
) como base para abordar las dificultades que se presentan en el desarrollo de dicho método. 122.2
124.2 124.3 125.6 126.3 126.5 126.5 127.2 127.3 127.5 127.9 128.6 128.8 129.0 129.2 129.4 129.6
130.2 130.4 130.8 131.3 131.4 131.4 131.5 131.6 131.6 131.8 131.8 132.3 132.4 132.4 132.5 132.5
132.5 132.5 132.6 132.7 132.9 133.0 133.1 133.1 133.1 133.1 133.2 133.2 133.2 133.3 133.3 133.5
133.5 133.5 133.8 133.9 134.0 134.0 134.0 134.0 134.1 134.2 134.3 134.4 134.4 134.6 134.7 134.7
134.7 134.8 134.8 134.8 134.9 134.9 135.2 135.2 135.2 135.3 135.3 135.4 135.5 135.5 135.6 135.6
135.7 135.8 135.8 135.8 135.8 135.8 135.9 135.9 135.9 135.9 136.0 136.0 136.1 136.2 136.2 136.3
136.4 136.4 136.6 136.8 136.9 136.9 137.0 137.1 137.2 137.6 137.6 137.8 137.8 137.8 137.9 137.9
138.2 138.2 138.3 138.3 138.4 138.4 138.4 138.5 138.5 138.6 138.7 138.7 139.0 139.1 139.5 139.6
139.8 139.8 140.0 140.0 140.7 140.7 140.9 140.9 141.2 141.4 141.5 141.6 142.9 143.4 143.5 143.6
143.8 143.8 143.9 144.1 144.5 144.5 147.7 147.7
a) Construya una gráfica de tallos y hojas de los datos eliminando (truncando) los dígitos de
décimos y luego repitiendo cada valor de tallo cinco veces (una vez para las hojas 1 y 2, una
segunda vez para las hojas 3 y 4, etc.). ¿Por qué es relativamente fácil identificar un valor de
resistencia representativo? (realizar en R) Sugerencia: use la librería aplpack y el comando
stem.leaf(). Para truncar los datos use el comando trunc()
Al haber realizado la gráfica de tallo y hojas, se tiene una clara idea sobre los datos que tienen la
mayor frecuencia. Por otra parte, si el valor de resistencia representativo es el que tiene la mayor
aproximación al valor real de la medida de datos, entonces se puede obtener un valor medio de
este conjunto que equivale apróximadamente a 134.9 al calcular su media aritmética y visualmente
este valor se halla en la séptima fila de la gráfica, que cuenta con la mayor cantidad de datos.
Valor medio del conjunto de datos:
b) Construya un histograma utilizando clases de ancho igual con la primera clase que tiene un
límite inferior de 122 y un límite superior de 124. Enseguida comente sobre cualquier característica
interesante del histograma. (realizar en R)
Después de realizar un histograma de cada clase con una amplitud de valor 2, se puede observar
de manera general que la mayoría de los valores de resistencia se encuentran dentro del intervalo
semiabierto (132, 134], lo cual nos puede indicar que, al incluir al valor de 134, el valor medio
del conjunto de datos (134.9) es parte de este intervalo, y al igual que en la gráfica de tallo y
hojas, también pertenece a los datos de mayor frecuencia.
20. El artículo (“Determination of Most Representative Subdi- vision”, J . of Energy Engr ., 1993:
43-55) dio datos sobre varias características de subdivisiones que podrían ser utilizados para
decidir si se suministra energía eléctrica con líneas elevadas o líneas subterráneas. He aquí los
valores de la variable x longitud total de calles dentro de una subdivisión: 1280 5320 4390 2100
1240 3060 4770 1050 360 3330 3380 340 1000 960 1320 530 3350 540 3870 1250 2400 960 1120
2120 450 2250 2320 2400 3150 5700 5220 500 1850 2460 5850 2700 2730 1670 100 5770 3150
1890 510 240 396 1419 2109
a) Construya una gráfica de hojas y tallos con las milésimas como el tallo y las centésimas como
las hojas y comente sobre algunas características de la gráfica. (realizar en R)
Luego de haber realizado una gráfica de tallo y hojas, se puede observar que una parte de los
datos se encuentra entre 100 – 900, por lo que esto indica que los valores de longitud de algunas
calles no superan el valor de 1000. Sin embargo, el diagrama también señala que la mayoría de
longitudes sí son mayores a 1000, pues la frecuencia de todos estos valores es mayor que la
frecuencia de datos entre 100 – 900.
b) Construya un histograma con los límites de clase, 0, 1000, 2000, 3000, 4000, 5000 y 6000.
¿Qué proporción de subdivisiones tienen una longitud total menor que 2000? ¿Entre 2000 y
4000? ¿Cómo describiría la forma del histograma? (realizar en R)
Ya que en este histograma los límites de cada clase van de 1000 en 1000, los intervalos para cada
uno de estos límites fueron: [0;1000), [1000;2000), [2000;3000), [3000;4000), [4000;5000) y
[5000;6000]. Al observar el gráfico, se puede concluir que hay una proporción (12+11/47) =
23/47 = 48.9% de subdivisiones con longitud menor a 2000 y una proporción (10+7+2/47) =
19/47 = 40.43% de subdivisiones con longitud entre 2000 y 4000. Para concluir, visualmente es
notorio que los datos van disminuyendo hacia la derecha, y por tanto, se presenta un sesgo
positivo.
b) Determine la mediana muestral de cada muestra. ¿Cómo se comparan? ¿Por qué es la mediana
de la muestra urbana (muestra U) tan diferente de la media de dicha muestra? (realizar en R)
Con el anterior código de R, se calcularon las medianas de las muestras U y C
respectivamente. Se observa que la mediana de U tiene un valor de 17 y la mediana de C
un valor de 8.9. La razón por la que se obtuvieron estos resultados se debe a que, tanto la
muestra U como la muestra C, difieren en sus cantidades de datos y los valores que estos
tienen (Por ejemplo: la muestra U tiene menos datos que la muestra C, pero algunos de
sus valores son incluso mucho más altos que el mayor valor en la muestra C).
De la misma forma, lo anteriormente mencionado puede haber causado una incidencia en
la mediana de la muestra U para que no se asimile a su media (como pasó en la muestra
C), pues al tener valores muy grandes como 80 entre sus últimos datos, la media (medida
de tendencia central no robusta) trata de calcular un valor promedio de U y se ve
afectada por este tipo de valores.
c) Calcule la media recortada de cada muestra eliminando la observación más pequeña y grande.
¿Cuáles son los porcentajes de recorte correspondientes? ¿Cómo se comparan los valores de estas
medias recortadas a las medias y medianas correspondientes? (realizar en R)
MUESTRA U
% Recorte = 9.09%
MUESTRA C
% Recorte = 6.67%
Se observa que después de eliminar los valores de 0.3 y 21.0, se obtuvo una media
recortada de 8.24, el cual es un resultado con un valor cercano a la media y mediana.
A diferencia de la muestra U, los datos de la muestra C no eran igual de dispersos, por lo
que el valor de su media normal no fue afectado por valores atípicos y estuvo más
cercano al valor de la mediana desde un principio.
39. La propagación de grietas provocadas por fatiga en varias partes de un avión ha sido el tema
de extensos estudios en años recientes. Los datos adjuntos se componen de vidas de propagación
(horas de vuelo/104 ) para alcanzar un tamaño de agrietamiento dado en orificios para sujetadores
utilizados en aviones militares (“Statistical Crack Propagation in Fastener Holes ander Spectrum
Loading”, J. Aircraft , 1983: 1028-1032):
0.736 0.863 0.865 0.913 0.915 0.937 0.983 1.007 1.011 1.064 1.109 1.132 1.140 1.153 1.253 1.394
a) Calcule y compare los valores de la media y mediana muestrales. (realizar en R)
Se puede observar que los valores de vidas de propagación están muy cercanos al 1, por lo cual es
un resultado lógico que el valor de la media muestra sea apróx. igual a 1.03, y además es mayor
que el valor de 1.009 correspondiente a la mediana muestral.
b) ¿En cuánto se podría disminuir la observación muestral más grande sin afectar el valor de la
mediana? (realizar en R)
Al ir disminuyendo 1.394 (valor más grande del conjunto de datos), se observa que al dejarlo en
1.011, el resultado de la mediana muestral permanece intacto. Por lo tanto, al calcular la
diferencia entre el valor original 1.394 y 1.011 se obtiene: 1.394 – 1.011 = 0.383 y esto implica
que, para que la mediana no cambie, el máximo valor que se le puede quitar a 1.394 es 0.383.
45. Se determinó el valor del módulo de Young (GPa) de placas fundidas compuestas de ciertos
sustratos intermetálicos y se obtuvieron las siguientes observaciones muestrales (“Strength and
Modulus of a Molybdenum-Coated Ti- 25A1-10Nb-3U-1Mo Intermetallic”, J. of Materials Engr.
and Performance , 1997: 46-50): 116.4 115.9 114.6 115.2 115.8
a) Calcule la media y las desviaciones de la media. (realizar en R) Use el comando mean() y sd()
Media = 115.58
Con los datos obtenidos en el cálculo de las desviaciones estándar de la media, se calcula la
desviación estándar y varianza muestral usando la fórmulas que se conocen de cada una
∑(𝑥𝑖 −𝑥̅ )2 ∑(𝑥𝑖 −𝑥̅ )2
(𝒔=√ y 𝒔𝟐 = ):
𝑛−1 𝑛−1
Desviación: s = 0.694
Varianza: s2 = 0.482
56. Se determinó la cantidad de contaminación por aluminio (ppm) en plástico de cierto tipo con
una muestra de 26 probetas de plástico y se obtuvieron los siguientes datos (“The Log-normal
Distribution for Modeling Quality Data when the Mean Is Near Zero”, J. of Quality Technology ,
1990: 105-110):
30 30 60 63 70 79 87 90 101 102 115 118 119 119 120 125 140 145 172 182 183 191 222 244 291
511
Construya una gráfica de caja que muestre valores apartados y comente sobre sus características.
(realizar en R)
Valor atípico: 511
Al realizar la gráfica de boxplot se observa que la mayoría de los valores de cantidad de aluminio
se encuentran entre 30 y 291 (valor máximo y valor mínimo), sin embargo, fue sencillo
identificar visualmente que 511 es el único dato mucho mayor que el máximo de 291. En
general, con la ayuda de la gráfica se podría concluir que hubo una probeta con una notable
cantidad de contaminación por aluminio.
57. Se seleccionó una muestra de 20 botellas de vidrio de un tipo particular y se determinó la
resistencia a la presión interna de cada botella. Considere la siguiente información parcial sobre la
muestra: Mediana = 202.2, Cuarto Inferior = 196.0, Cuarto Superior = 216.8. Las tres
observaciones más pequeñas: 125.8 188.1 193.7. Las tres observaciones más grandes: 221.3
230.5 250.2
a) ¿Hay valores apartados en la muestra? ¿Algunos valores apartados extremos? (realizar en R)
Luego de calcular el límite inferior y superior con los datos dados por el enunciado, es posible
identificar si algunos de los valores en las observaciones más pequeñas o grandes se consideran
como datos apartados. En consecuencia, se puede observar que, de las observaciones, únicamente
125.8 (menor a límite inferior 164.8) y 250.2 (mayor a límite superior 248) son datos apartados
pero no apartados extremos (ninguna observación es menor a Q1-3RIC o mayor a Q3+3RIC).
b) Construya una gráfica de caja que muestre valores apartados y comente sobre cualesquiera
características interesantes. (realizar a mano)
Como se observa en el dibujo, no hay la presencia de ningún dato apartado extremo, y con lo que
se había mencionado en el inciso a), solo 125.8 y 250.2 son datos apartados (no apartados
extremos) que también son el valor mínimo y máximo respectivamente.