DEBERCAP1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 17

Daniela Jiménez (00322800)

14 / 06 / 2022
NRC 1509

Deber 1

12. Los valores de densidad relativa anexos de varios tipos de madera utilizados en la
construcción aparecieron en el artículo (“Bolted Connection Design Values Based on European
Yield Model”, J. of Structural Engr., 1993: 2169 -2186): 0.31 0.35 0.36 0.36 0.37 0.38 0.40 0.40
0.40 0.41 0.41 0.42 0.42 0.42 0.42 0.42 0.43 0.44 0.45 0.46 0.46 0.47 0.48 0.48 0.48 0.51 0.54
0.54 0.55 0.58 0.62 0.66 0.66 0.67 0.68 0.75 Construya una gráfica de tallos y hojas con tallos
repetidos y comente sobre cualquier característica interesante de la gráfica. (realizar en R)

Al haber realizado la gráfica, se observa que la mayoría de los valores de densidad relativa se
encuentran entre 0.40 y 0.44 (tercera fila en la gráfica), y por lo tanto, se podría interpretar que la
mayor parte de los tipos de madera usados para la construcción se encuentran en este rango. Por
otro lado, pocos tipos de madera tienen valores de 0.31 y 0.75, lo cual puede decir que son los de
menor y mayor durabilidad respectivamente.
13. Las propiedades mecánicas permisibles para el diseño estructural de vehículos aeroespaciales
metálicos requieren un método aprobado para analizar estadísticamente datos de prueba empíricos.
El artículo (“Establishing Mechanical Property Allowables for Metals”, J . of Testing and
Evaluation , 1998: 293-299) utilizó los datos anexos sobre resistencia a la tensión última (lb/pulg2
) como base para abordar las dificultades que se presentan en el desarrollo de dicho método. 122.2
124.2 124.3 125.6 126.3 126.5 126.5 127.2 127.3 127.5 127.9 128.6 128.8 129.0 129.2 129.4 129.6
130.2 130.4 130.8 131.3 131.4 131.4 131.5 131.6 131.6 131.8 131.8 132.3 132.4 132.4 132.5 132.5
132.5 132.5 132.6 132.7 132.9 133.0 133.1 133.1 133.1 133.1 133.2 133.2 133.2 133.3 133.3 133.5
133.5 133.5 133.8 133.9 134.0 134.0 134.0 134.0 134.1 134.2 134.3 134.4 134.4 134.6 134.7 134.7
134.7 134.8 134.8 134.8 134.9 134.9 135.2 135.2 135.2 135.3 135.3 135.4 135.5 135.5 135.6 135.6
135.7 135.8 135.8 135.8 135.8 135.8 135.9 135.9 135.9 135.9 136.0 136.0 136.1 136.2 136.2 136.3
136.4 136.4 136.6 136.8 136.9 136.9 137.0 137.1 137.2 137.6 137.6 137.8 137.8 137.8 137.9 137.9
138.2 138.2 138.3 138.3 138.4 138.4 138.4 138.5 138.5 138.6 138.7 138.7 139.0 139.1 139.5 139.6
139.8 139.8 140.0 140.0 140.7 140.7 140.9 140.9 141.2 141.4 141.5 141.6 142.9 143.4 143.5 143.6
143.8 143.8 143.9 144.1 144.5 144.5 147.7 147.7
a) Construya una gráfica de tallos y hojas de los datos eliminando (truncando) los dígitos de
décimos y luego repitiendo cada valor de tallo cinco veces (una vez para las hojas 1 y 2, una
segunda vez para las hojas 3 y 4, etc.). ¿Por qué es relativamente fácil identificar un valor de
resistencia representativo? (realizar en R) Sugerencia: use la librería aplpack y el comando
stem.leaf(). Para truncar los datos use el comando trunc()

Al haber realizado la gráfica de tallo y hojas, se tiene una clara idea sobre los datos que tienen la
mayor frecuencia. Por otra parte, si el valor de resistencia representativo es el que tiene la mayor
aproximación al valor real de la medida de datos, entonces se puede obtener un valor medio de
este conjunto que equivale apróximadamente a 134.9 al calcular su media aritmética y visualmente
este valor se halla en la séptima fila de la gráfica, que cuenta con la mayor cantidad de datos.
Valor medio del conjunto de datos:

b) Construya un histograma utilizando clases de ancho igual con la primera clase que tiene un
límite inferior de 122 y un límite superior de 124. Enseguida comente sobre cualquier característica
interesante del histograma. (realizar en R)

Después de realizar un histograma de cada clase con una amplitud de valor 2, se puede observar
de manera general que la mayoría de los valores de resistencia se encuentran dentro del intervalo
semiabierto (132, 134], lo cual nos puede indicar que, al incluir al valor de 134, el valor medio
del conjunto de datos (134.9) es parte de este intervalo, y al igual que en la gráfica de tallo y
hojas, también pertenece a los datos de mayor frecuencia.

20. El artículo (“Determination of Most Representative Subdi- vision”, J . of Energy Engr ., 1993:
43-55) dio datos sobre varias características de subdivisiones que podrían ser utilizados para
decidir si se suministra energía eléctrica con líneas elevadas o líneas subterráneas. He aquí los
valores de la variable x longitud total de calles dentro de una subdivisión: 1280 5320 4390 2100
1240 3060 4770 1050 360 3330 3380 340 1000 960 1320 530 3350 540 3870 1250 2400 960 1120
2120 450 2250 2320 2400 3150 5700 5220 500 1850 2460 5850 2700 2730 1670 100 5770 3150
1890 510 240 396 1419 2109
a) Construya una gráfica de hojas y tallos con las milésimas como el tallo y las centésimas como
las hojas y comente sobre algunas características de la gráfica. (realizar en R)

Luego de haber realizado una gráfica de tallo y hojas, se puede observar que una parte de los
datos se encuentra entre 100 – 900, por lo que esto indica que los valores de longitud de algunas
calles no superan el valor de 1000. Sin embargo, el diagrama también señala que la mayoría de
longitudes sí son mayores a 1000, pues la frecuencia de todos estos valores es mayor que la
frecuencia de datos entre 100 – 900.

b) Construya un histograma con los límites de clase, 0, 1000, 2000, 3000, 4000, 5000 y 6000.
¿Qué proporción de subdivisiones tienen una longitud total menor que 2000? ¿Entre 2000 y
4000? ¿Cómo describiría la forma del histograma? (realizar en R)
Ya que en este histograma los límites de cada clase van de 1000 en 1000, los intervalos para cada
uno de estos límites fueron: [0;1000), [1000;2000), [2000;3000), [3000;4000), [4000;5000) y
[5000;6000]. Al observar el gráfico, se puede concluir que hay una proporción (12+11/47) =
23/47 = 48.9% de subdivisiones con longitud menor a 2000 y una proporción (10+7+2/47) =
19/47 = 40.43% de subdivisiones con longitud entre 2000 y 4000. Para concluir, visualmente es
notorio que los datos van disminuyendo hacia la derecha, y por tanto, se presenta un sesgo
positivo.

34. La exposición a productos microbianos, especialmente endotoxina, puede tener un impacto en


la vulnerabilidad a enfermedades alérgicas. El artículo (“Dust Sampling Methods for Endotoxin-
An Essential, But Underestimated Issue”, Indoor Air , 2006: 20-27) consideró temas asociados
con la determinación de concentración de endotoxina. Los siguientes datos sobre concentración
(EU/mg) en polvo asentado de una muestra de hogares urbanos y otra de casas campes- tres fueron
amablemente suministrados por los autores del artículo citado.
U: 6.0 5.0 11.0 33.0 4.0 5.0 80.0 18.0 35.0 17.0 23.0
C: 4.0 14.0 11.0 9.0 9.0 8.0 4.0 20.0 5.0 8.9 21.0 9.2 3.0 2.0 0.3
a) Determine la media muestral de cada muestra. ¿Cómo se comparan? (realizar en R) Pista:
Puede comparar con una resta.
La media de la muestra U es de 21.54545, mientras que la media de la muestra C es de 12.98545.
A pesar de que la muestra U cuenta con una menor cantidad de datos que la muestra C, tiene un
valor mucho más grande en su media debido a que tiene datos más altos que la alteran
notablemente. Asimismo, se comprueba que la diferencia entre las 2 medias es de 12.98545, lo
cual indica que hay una cierta dispersión entre datos.

b) Determine la mediana muestral de cada muestra. ¿Cómo se comparan? ¿Por qué es la mediana
de la muestra urbana (muestra U) tan diferente de la media de dicha muestra? (realizar en R)
 Con el anterior código de R, se calcularon las medianas de las muestras U y C
respectivamente. Se observa que la mediana de U tiene un valor de 17 y la mediana de C
un valor de 8.9. La razón por la que se obtuvieron estos resultados se debe a que, tanto la
muestra U como la muestra C, difieren en sus cantidades de datos y los valores que estos
tienen (Por ejemplo: la muestra U tiene menos datos que la muestra C, pero algunos de
sus valores son incluso mucho más altos que el mayor valor en la muestra C).
 De la misma forma, lo anteriormente mencionado puede haber causado una incidencia en
la mediana de la muestra U para que no se asimile a su media (como pasó en la muestra
C), pues al tener valores muy grandes como 80 entre sus últimos datos, la media (medida
de tendencia central no robusta) trata de calcular un valor promedio de U y se ve
afectada por este tipo de valores.
c) Calcule la media recortada de cada muestra eliminando la observación más pequeña y grande.
¿Cuáles son los porcentajes de recorte correspondientes? ¿Cómo se comparan los valores de estas
medias recortadas a las medias y medianas correspondientes? (realizar en R)

MUESTRA U

 Al calcular la media de la muestra U luego de haber suprimido el menor y mayor valor


(4.0 y 80.0), se obtiene un valor de 17.
Cálculo porcentaje de recorte:

% Recorte = 9.09%

 Se observa que después de eliminar el último valor de 80 para calcular la media


recortada, el resultado obtenido es 17 y esto nos indica que, al haber suprimido un valor
que alteraba notablemente a la media normal, se consiguió el mismo valor de la mediana.

MUESTRA C

 Al calcular la media de la muestra C luego de haber suprimido el menor y mayor valor


(0.3 y 21.0), se obtiene un valor de 8.24.
Cálculo porcentaje de recorte:

% Recorte = 6.67%
 Se observa que después de eliminar los valores de 0.3 y 21.0, se obtuvo una media
recortada de 8.24, el cual es un resultado con un valor cercano a la media y mediana.
A diferencia de la muestra U, los datos de la muestra C no eran igual de dispersos, por lo
que el valor de su media normal no fue afectado por valores atípicos y estuvo más
cercano al valor de la mediana desde un principio.

39. La propagación de grietas provocadas por fatiga en varias partes de un avión ha sido el tema
de extensos estudios en años recientes. Los datos adjuntos se componen de vidas de propagación
(horas de vuelo/104 ) para alcanzar un tamaño de agrietamiento dado en orificios para sujetadores
utilizados en aviones militares (“Statistical Crack Propagation in Fastener Holes ander Spectrum
Loading”, J. Aircraft , 1983: 1028-1032):
0.736 0.863 0.865 0.913 0.915 0.937 0.983 1.007 1.011 1.064 1.109 1.132 1.140 1.153 1.253 1.394
a) Calcule y compare los valores de la media y mediana muestrales. (realizar en R)

Se puede observar que los valores de vidas de propagación están muy cercanos al 1, por lo cual es
un resultado lógico que el valor de la media muestra sea apróx. igual a 1.03, y además es mayor
que el valor de 1.009 correspondiente a la mediana muestral.

b) ¿En cuánto se podría disminuir la observación muestral más grande sin afectar el valor de la
mediana? (realizar en R)
Al ir disminuyendo 1.394 (valor más grande del conjunto de datos), se observa que al dejarlo en
1.011, el resultado de la mediana muestral permanece intacto. Por lo tanto, al calcular la
diferencia entre el valor original 1.394 y 1.011 se obtiene: 1.394 – 1.011 = 0.383 y esto implica
que, para que la mediana no cambie, el máximo valor que se le puede quitar a 1.394 es 0.383.

45. Se determinó el valor del módulo de Young (GPa) de placas fundidas compuestas de ciertos
sustratos intermetálicos y se obtuvieron las siguientes observaciones muestrales (“Strength and
Modulus of a Molybdenum-Coated Ti- 25A1-10Nb-3U-1Mo Intermetallic”, J. of Materials Engr.
and Performance , 1997: 46-50): 116.4 115.9 114.6 115.2 115.8
a) Calcule la media y las desviaciones de la media. (realizar en R) Use el comando mean() y sd()

Media = 115.58

Cálculo de desviaciones estándar de la media:


b) Use las desviaciones calculadas en el inciso a) para obtener la varianza muestral y la desviación
estándar muestral. (realizar en R)

Con los datos obtenidos en el cálculo de las desviaciones estándar de la media, se calcula la
desviación estándar y varianza muestral usando la fórmulas que se conocen de cada una
∑(𝑥𝑖 −𝑥̅ )2 ∑(𝑥𝑖 −𝑥̅ )2
(𝒔=√ y 𝒔𝟐 = ):
𝑛−1 𝑛−1

Desviación: s = 0.694
Varianza: s2 = 0.482

56. Se determinó la cantidad de contaminación por aluminio (ppm) en plástico de cierto tipo con
una muestra de 26 probetas de plástico y se obtuvieron los siguientes datos (“The Log-normal
Distribution for Modeling Quality Data when the Mean Is Near Zero”, J. of Quality Technology ,
1990: 105-110):
30 30 60 63 70 79 87 90 101 102 115 118 119 119 120 125 140 145 172 182 183 191 222 244 291
511
Construya una gráfica de caja que muestre valores apartados y comente sobre sus características.
(realizar en R)
Valor atípico: 511

Al realizar la gráfica de boxplot se observa que la mayoría de los valores de cantidad de aluminio
se encuentran entre 30 y 291 (valor máximo y valor mínimo), sin embargo, fue sencillo
identificar visualmente que 511 es el único dato mucho mayor que el máximo de 291. En
general, con la ayuda de la gráfica se podría concluir que hubo una probeta con una notable
cantidad de contaminación por aluminio.
57. Se seleccionó una muestra de 20 botellas de vidrio de un tipo particular y se determinó la
resistencia a la presión interna de cada botella. Considere la siguiente información parcial sobre la
muestra: Mediana = 202.2, Cuarto Inferior = 196.0, Cuarto Superior = 216.8. Las tres
observaciones más pequeñas: 125.8 188.1 193.7. Las tres observaciones más grandes: 221.3
230.5 250.2
a) ¿Hay valores apartados en la muestra? ¿Algunos valores apartados extremos? (realizar en R)

Luego de calcular el límite inferior y superior con los datos dados por el enunciado, es posible
identificar si algunos de los valores en las observaciones más pequeñas o grandes se consideran
como datos apartados. En consecuencia, se puede observar que, de las observaciones, únicamente
125.8 (menor a límite inferior 164.8) y 250.2 (mayor a límite superior 248) son datos apartados
pero no apartados extremos (ninguna observación es menor a Q1-3RIC o mayor a Q3+3RIC).
b) Construya una gráfica de caja que muestre valores apartados y comente sobre cualesquiera
características interesantes. (realizar a mano)

Como se observa en el dibujo, no hay la presencia de ningún dato apartado extremo, y con lo que
se había mencionado en el inciso a), solo 125.8 y 250.2 son datos apartados (no apartados
extremos) que también son el valor mínimo y máximo respectivamente.

60. Se obtuvieron observaciones de resistencia al estallamiento (lb/pulg2 ) tanto con soldaduras de


cierre de toberas de prueba como con soldaduras para toberas de envases de producción (“Proper
Procedures Are the Key to Welding Radioactive Waste Cannisters”, Welding J ., agosto de 1997:
61-67).
Prueba: 7200 6100 7300 7300 8000 7400 7300 7300 8000 6700 8300
Envase: 5250 5625 5900 5900 5700 6050 5800 6000 5875 6100 5850 6600
Construya una gráfica de caja comparativa y comente sobre las características interesantes (el
artículo citado no incluía tal gráfica, pero los autores comentaron que habían visto uno.) (realizar
en R)
Como se observa en la gráfica de boxplot, mientras que en los datos de resistencia de soldadura
de prueba no se encuentra ningún valor atípico, en los datos de resistencia correspondientes a las
soldaduras para toberas de envase se presentaron 2 valores atípicos: 5250 (menor que límite
inferior de 5625) y 6600 (mayor que límite superior de 6100).
En conclusión, la gráfica nos indica directamente que una observación de las soldaduras para
toberas de envase tiene una resistencia mucho menor que las demás y otra, que en cambio, tiene
la resistencia más alta que destaca entre el resto de observaciones.
* La corrosión del acero de refuerzo es un problema serio en estructuras de concreto localizadas
en ambientes afectados por condiciones climáticas severas. Por esa razón, los investigadores han
estado estudiando el uso de barras de refuerzo hechas de un material compuesto. Se realizó un
estudio para desarrollar indicaciones para adherir barras de refuerzo reforzadas con fibra de vidrio
a concreto (“Design Recommendations for Bond of GFRP Rebars to Con- crete”, J . of Structural
Engr. , 1996: 247-254). Considérense las siguientes 48 observaciones de fuerza adhesiva medida:
11.5 12.1 9.9 9.3 7.8 6.2 6.6 7.0 13.4 17.1 9.3 5.6 5.7 5.4 5.2 5.1 4.9 10.7 15.2 8.5 4.2 4.0 3.9 3.8
3.6 3.4 20.6 25.5 13.8 12.6 13.1 8.9 8.2 10.7 14.2 7.6 5.2 5.5 5.1 5.0 5.2 4.8 4.1 3.8 3.7 3.6 3.6 3.6
Generar un histograma de densidad (realizar en R)
Al analizar las gráficas, se observa que el histograma presenta un sesgo a la derecha o positivo y
visualmente es fácil reconocer que la mayoría de las barras de refuerzo sometidas al control
presentan valores de fuerza adhesiva en el intervalo 3.4 - 8.1.

También podría gustarte