Clase Nº1 - Ing. Materiales
Clase Nº1 - Ing. Materiales
Clase Nº1 - Ing. Materiales
Estadística:
Es la ciencia que proporciona técnicas y métodos para organizar y resumir una gran cantidad de datos obtenidos de la
realidad, e inferir conclusiones respecto de ellos. El campo de la Ciencia Estadística está dividido en 2 grandes áreas:
Estadística Descriptiva y Estadística Inferencial.
Estadística Descriptiva:
Es la ciencia que nos brinda un conjunto de métodos para recolectar, presentar y caracterizar un conjunto de
datos, un estudio estadístico se considera Descriptivo cuando se analiza y describe solamente al conjunto de datos y
no hace generalizaciones.
Ejemplo:
- Describir las características de un conjunto de 40 barras de acero producidas por una Empresa Metal-Mecánica en el
mes de diciembre del 2014.
Estadística Inferencial:
Es la ciencia que nos brinda los métodos para tomar decisiones en situaciones de incertidumbre y nos permite
generalizar los resultados de una muestra hacia una población.- se basa en métodos probabilísticos.
CONCEPTOS BASICOS
Población o universo
La población es el conjunto de elementos que poseen una característica o más características comunes que deben
ser precisadas en el tiempo, en el espacio. Un universo o población debe ser inconfundible.
b) Para realizar generalizaciones inferenciales se debe distinguir también 2 tipos de universo; universo
objetivo y universo muestral:
1
i) Universo objetivo
Está conformado por todos los elementos sin limitaciones a través del tiempo y del espacio, que
constituye el objetivo final de la generalización inferencial científica. Es el conjunto universal de todos los
elementos a que se refiere el dominio de estudio.
ii) Universo muestral
Es un subconjunto del universo objetivo que está claramente delimitado en el espacio y en el
tiempo; De sus elementos, en la práctica, se obtiene la muestra para realizar la investigación. Al número de
elementos se denota con N .
Algunas veces tanto el universo objetivo como el universo muestral son similares, no existe mayor dificultad
para inferir de la muestra hacia cualesquiera de ellos.
Muestra :
Una muestra estadística, o simplemente muestra, es una parte o subconjunto del universo muestral pero
elegida con técnicas especiales que permiten asegurar que sea representativa y adecuada.
a) Representativa
Porque la muestra refleja las mismas características de la población muestral y solamente deben diferir en el
tamaño. Se dice que la muestra es una población en miniatura. Se piensa que para asegurar la
representatividad de una muestra se debe evitar la tendencia o sesgo, utilizando métodos aleatorios. Entre
los métodos aleatorios más usados podemos señalar :
i) Método de la rifa :
Sea :
Población muestral : N
Muestra : n
Se puede usar el siguiente procedimiento :
- Se enumeran los elementos de la población : 1, 2, 3, . . . , N
- Se enumeran N papelitos y se van eligiendo uno a uno (sin remplazo) -hasta completar n papelitos.
- Dichos elementos del universo constituyen los elementos de la muestra.
- Obtener los datos de los elementos.
Ejemplo :
Sea una población hipotética de 15 individuos donde se desea conocer si posee o no posee una
determinada característica de interés).
Se desea extraer una muestra de tamaño 5.
1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15
Se eligen 5 papelitos al azar uno por uno
1 2 3 4 5 6 7 ... 15
si 5
no no3 si 12 no 1 10
2
ii) Método de Tabla de Números Aleatorios ( Tippett )
- Se enumeran los elementos de la población : 1, 2, 3, . . . , N.
- En una tabla de números aleatorios se identifica un dígito por cualquier método aleatorio y luego se toman
tantos dígitos como dígitos tenga el tamaño de la población N.
- Se recorre la tabla hacia abajo (arriba) hasta captar tantos números como sea el tamaño de la muestra.
- Dichos números en la población constituyen los elementos de la muestra. Los elementos que se repiten o
mayores de N se desprecian.
Ejemplo hipotético :
N = 800 n = 25
Xi : X1 , X2 , X3 , X4 , X5 , . . . , X800
- Se elige un punto al azar de la tabla de números aleatorios
- Se toman números de 3 dígitos ( N = 800 tiene 3 dígitos ).
- Se recorre la tabla hacia abajo
- Se identifican 25 números muestrales y se los ubica en la población
- Dichos elementos constituyen la muestra.
b) Adecuada
Una muestra es adecuada si tiene un tamaño óptimo que permite asegurar la existencia de las mismas
características del universo y que las generalizaciones sean válidas.
Si una muestra es pequeña los resultados tienen relativa validez y si es muy grande puede que haya un
dispendio de recursos. El tamaño de muestra n, se obtiene con fórmulas del Muestreo.
Tipos de muestreo.
Aleatorio - Cuando se selecciona al azar y cada miembro tiene igual oportunidad de ser incluido.
Estratificado - Cuando se subdivide en estratos o subgrupos según las variables o características que se pretenden
investigar. Cada estrato debe corresponder proporcionalmente a la población.
Sistemático - Cuando se establece un patrón o criterio al seleccionar la muestra. Ejemplo: se entrevistará una familia
por cada diez que se detecten.
D a t o e s t a d í s ti c o :
E s c a d a u n o d e l o s r e g i s t r o s c u a n ti t a ti v o s o c u a l i t a ti v o s ( v a l o r e s o c a t e g o r í a s ) q u e s e h a n
o b t e n i d o a l r e a l i z a r u n e s t u d i o e s t a d í s ti c o .
3
Variable:
Cada uno de los rasgos o característica de los elementos de una población y que varían de un individuo a otro (salario,
color de ojos, sexo, número de hijos).
Las variables pueden corresponder a cuatro niveles de medición:
Escalas de medición de variables :
Escala Nominal:
Las categorìas de la variable no tienen orden o jerarquía (lo que indica solamente diferencias en una o mas
características), son mutuamente excluyentes, por lo tanto, un elemento pertenece a una sola categoría y exhaustivas,
por lo que cada elemento de la población debe aparecer en una categoría. Ejm :
La variable sexo cuya categorías son :
- Masculino
- Femenino
Escala Ordinal:
Las categorías de la variable son mutuamente excluyentes y exhaustivas y se ordenan de acuerdo con las características
particulares que poseen (categorías jerárquicas). Ejm:
Variable : Calificación dada al profesor del curso de Geoestadística :
Categorías:
- Muy mala (1)
- Mala (2)
- Regular (3)
- Buena (4)
- Muy buena (5)
Podemos concluir que la calificación buena con código (4) es mejor que la calificación mala con código (2), pero no
podemos decir que es el doble de buena basándonos en los códigos.
Escala de Intervalo:
Incluye todas las características del nivel ordinal, pero además la diferencia entre los valores es de tamaño constante
(intervalos iguales entre categorías o valores), lo que permite realizar operaciones aritméticas básicas. Sin embargo el
cero en la medición, es un cero arbitrario, no es real se asigna arbitrariamente a una categoría el valor de cero y a partir
de esta se construye la escala
Ejm: La temperatura ambiental, la diferencia entre 25ºC y 20ºC de temperatura es la misma que entre 55ºC y 50ºC y el
cero en las escalas Centígrada y Fahrenheit es diferente.
Escala de Razón:
Presenta todas las características del nivel de intervalos (intervalos iguales entre las categorías y la aplicación de
operaciones aritméticas básicas) y además el cero es real y absoluto (no es arbitrario) lo que implica que hay un punto
en la escala donde no existe la propiedad. Ejm :
4
Variable :
Ingreso familiar mensual en la ciudad de Trujillo.
Tipos de Variables
Las variables pueden ser cualitativas o cuantitativas. Generalmente se utiliza el término “modalidad” cuando hablamos
de caracteres cualitativos y el término “valor” cuando estudiamos caracteres cuantitativos. Una variable no es sino el
conjunto de las distintas modalidades o valores que toma un carácter. Para representar una variable de utilizan letras
mayúsculas X, Y, Z, ect.
Variables cuantitativas:
Las que pueden expresarse numéricamente (temperatura, salario, número de goles en un partido). Se pueden
cuantificar los resultados experimentales por medio de instrumentos adoptando unidades de medida para valorar los
diferentes resultados. Variables cuantitativas según el tipo de valores que pueda tomar pueden ser discretas o
continuas:
a) Variables discretas:
Son el resultado de contar y sólo toman valores enteros (número de hijos).
b) Variables continuas:
Son el resultado de medir, y pueden contener decimales (temperatura, peso, altura). Se pueden subdividir a
voluntad. Pueden tomar, entonces, cualquier valor dentro de un intervalo.
8.9
1 9.06 46 9.59 91 9.04 136 8.67 181 8.88 226 8.28 271 9.70 316 1
9.1
2 7.97 47 8.46 92 8.41 137 8.29 182 9.27 227 8.60 272 8.50 317 6
10.3 8.8
3 8.98 48 9.32 93 3 138 9.14 183 8.21 228 8.85 273 9.57 318 4
8.4
4 9.88 49 9.20 94 8.78 139 9.52 184 9.45 229 8.28 274 8.79 319 9
9.5
5 8.97 50 9.02 95 8.94 140 9.25 185 8.65 230 8.66 275 9.53 320 8
5
8.4
6 9.31 51 8.76 96 7.74 141 9.42 186 8.62 231 9.25 276 9.27 321 2
9.2
7 8.33 52 9.50 97 9.08 142 9.54 187 8.77 232 8.53 277 9.54 322 5
9.7
8 8.68 53 8.89 98 8.60 143 8.89 188 9.03 233 9.57 278 9.36 323 5
9.2
9 8.60 54 8.97 99 8.66 144 8.71 189 9.19 234 8.70 279 9.18 324 6
8.8
10 9.27 55 9.59 100 8.87 145 9.41 190 9.09 235 9.06 280 8.43 325 3
8.5
11 8.09 56 8.53 101 9.51 146 9.28 191 8.52 236 9.09 281 9.35 326 7
9.0
12 8.93 57 8.76 102 8.68 147 9.15 192 9.14 237 8.19 282 8.68 327 7
10.0 9.2
13 8.33 58 9.92 103 8.95 148 4 193 9.24 238 9.10 283 8.60 328 5
10.0 8.6
14 9.12 59 8.96 104 9.34 149 8.61 194 8.83 239 1 284 9.21 329 8
8.3
15 9.18 60 7.82 105 9.08 150 8.95 195 8.18 240 9.56 285 8.68 330 0
8.7
16 8.14 61 8.92 106 9.55 151 9.51 196 8.86 241 9.28 286 9.17 331 4
8.5
17 8.39 62 8.73 107 8.54 152 8.03 197 8.94 242 9.00 287 8.86 332 1
8.8
18 9.56 63 8.64 108 9.64 153 8.98 198 9.03 243 8.80 288 9.65 333 2
9.1
19 8.59 64 8.86 109 9.89 154 7.89 199 8.14 244 8.72 289 8.23 334 0
8.9
20 9.44 65 8.48 110 8.73 155 9.25 200 9.60 245 9.39 290 9.28 335 2
9.5
21 9.12 66 8.81 111 8.64 156 8.73 201 9.90 246 8.34 291 8.89 336 2
8.4
22 9.32 67 8.49 112 9.27 157 9.92 202 8.96 247 9.50 292 8.36 337 3
9.1
23 9.67 68 9.82 113 8.99 158 8.89 203 9.57 248 8.58 293 9.64 338 9
8.0
24 8.65 69 8.98 114 8.55 159 8.28 204 9.04 249 8.25 294 8.75 339 9
10.0 9.6
25 9.69 70 8.86 115 8.85 160 8.90 205 4 250 9.41 295 8.61 340 3
10.0 9.2
26 8.66 71 8.57 116 8.13 161 8.81 206 8.56 251 3 296 9.23 341 5
8.7
27 9.23 72 8.99 117 8.57 162 8.99 207 9.49 252 9.12 297 8.74 342 8
9.2
28 9.64 73 8.48 118 8.60 163 8.53 208 8.05 253 9.11 298 9.21 343 1
8.4
29 8.61 74 8.40 119 8.58 164 9.31 209 8.79 254 8.94 299 8.86 344 3
8.9
30 9.45 75 8.60 120 9.76 165 9.56 210 9.38 255 8.59 300 8.92 345 2
8.6
31 9.41 76 9.25 121 9.54 166 8.40 211 8.91 256 9.37 301 9.16 346 5
9.8
32 9.47 77 9.17 122 8.79 167 8.88 212 9.69 257 9.06 302 9.01 347 7
7.8
33 9.77 78 9.17 123 9.23 168 8.77 213 9.74 258 8.76 303 8.42 348 8
34 9.93 79 9.33 124 8.87 169 8.92 214 8.97 259 9.33 304 9.35 349 8.6
6
5
9.2
35 8.82 80 9.72 125 8.95 170 9.08 215 8.49 260 9.17 305 8.55 350 1
9.1
36 8.99 81 9.03 126 9.08 171 8.32 216 9.49 261 8.65 306 8.53 351 1
8.6
37 9.68 82 9.09 127 8.70 172 8.80 217 9.55 262 9.05 307 8.59 352 2
9.5
38 9.24 83 9.01 128 8.89 173 8.57 218 8.30 263 9.10 308 8.61 353 2
10.9 9.2
39 8.25 84 4 129 9.18 174 8.78 219 8.66 264 9.08 309 9.14 354 9
10.0 8.5
40 6 85 8.32 130 9.07 175 9.07 220 8.98 265 9.23 310 9.28 355 7
8.8
41 9.78 86 8.85 131 8.71 176 8.43 221 9.04 266 9.49 311 9.65 356 3
10.0 10.0 9.1
42 3 87 9.24 132 9.70 177 9.91 222 9.23 267 9.23 312 2 357 2
9.4
43 8.68 88 9.05 133 8.42 178 8.99 223 9.14 268 9.46 313 8.87 358 0
8.3
44 9.06 89 9.66 134 8.66 179 8.74 224 9.41 269 8.70 314 9.83 359 8
9.4
45 8.37 90 9.47 135 9.16 180 7.97 225 9.33 270 8.94 315 8.64 360 7
7
8
1
9 85976 24511 53129 88631 32217 40349 03172 69496 64587 39035
2
0 07961 41764 89380 41582 49521 51781 24691 07085 35175 19440
2
1 78001 98277 76476 55472 86748 85176 21844 69680 00511 29706
2
2 45719 26360 32990 62802 22094 89906 13277 02580 64084 37183
2
3 45801 25340 74840 69958 97570 37331 67436 76782 82781 67115
2
4 44887 94539 39935 11169 94132 15973 35541 23155 45469 29343
2
5 61522 95401 65440 22363 21273 20055 02775 25238 83805 68731
2
6 50917 37933 15101 07785 06662 79602 22160 18149 47513 76348
2
7 82131 20194 22619 13798 16150 65802 67061 08819 32471 73353
2
8 42928 97309 05253 94778 18045 64136 90256 59210 83007 98778
2
9 61630 71453 63561 17121 23636 11198 43222 23898 43541 00684
3
0 12078 65027 57917 86427 35836 19964 22124 82550 40863 01737
3
1 25072 95537 67885 07187 69349 70017 96632 69816 26139 73280
3
2 43830 65030 15087 04438 37860 49535 11572 55941 76316 89160
3
3 64783 98900 77455 12906 02777 52720 94884 09788 03267 66436
3
4 79533 93394 94862 76737 78983 78490 91738 78332 56821 16079
3
5 45589 12188 92852 41688 21293 23260 27843 54092 .09973 87241
3
6 43021 58330 90545 32080 00284 96708 76256 65754 56361 89743
3
7 24648 57783 42213 14990 34958 37161 76451 11381 36419 68392
3
8 16001 38688 72907 41599 43423 48922 30342 63049 56344 12398
3
9 14241 94163 84694 39780 93003 79146 48231 54439 22051 14912
4
0 09697 50620 14099 10821 75438 77581 22698 12224 10748 04322
4
1 98987 15323 15446 89754 02863 08568 36669 79276 85787 91491
4
2 49734 74306 83106 47269 94395 02943 88989 82503 49507 27472
4
3 94680 12985 29284 04828 49274 87876 32923 04137 59140 47343
4
4 71758 34257 46911 09202 34934 05837 50570 89867 07526 89374
4
5 18365 51733 83620 65486 34138 06533 11816 59813 49750 15462
8
4
6 14441 04492 73227 85535 99890 72732 63555 80983 63616 17532
4
7 81035 63111 43783 75241 72969 97173 94909 98898 17493 90782
4
8 78377 87689 82819 99792 29651 98393 99131 13125 73457 25603
4
9 90165 24222 67318 97027 09903 52528 99162 21542 49860 16614
5
0 63606 43611 03945 39045 27999 86552 62027 93852 18893 65073
PRESENTACIÓN DE DATOS
Cuando se capta un conjunto de datos, estos se encuentran de manera desordenada lo que no permite observar
las características más saltantes. Un conjunto de datos debe presentarse en :
9
1. Tablas de distribución de frecuencias:
Es un arreglo adecuado de agrupación de datos en intervalos o categorías que permite una mejor
comprensión de las características en estudio.
En caso sea una variable numérica se recomienda que el número de intervalos (m) oscile entre 5 y 12, ( 5 m
12 ), auxiliándose de la propuesta de Sturges:
m = 1 + 3.32 log n
Ejm. Si n = 120 m = 1 + 3.32 log 120
m= 8
Ejemplo.- Construir una tabla completa de distribución de frecuencias en base a los siguientes datos
que corresponden al peso de varillas de acero producidas por una industria siderúrgica 2015, de donde
se obtuvo una muestra aleatoria de 40 varillas cuyo peso en kilogramos fueron los siguientes:
22.3 15.8 18.4 22.7 19.6 15.8 26.4 17.3 15.2 23.9
24.8 22.7 18.0 20.5 11.0 18.5 23.0 24.6 20.1 16.2
8.3 12.9 12.3 22.3 13.4 17.9 12.2 13.4 15.1 19.1
22.1 17.8 19.4 20.7 18.6 18.8 24.4 17.3 14.2 23.9
Tabla 01
Distribución de frecuencias
hi Hi
' ' Yi fi Fi % %
[Y i−1 −Y i )
100.00
Para el caso de variable cualitativa se debe distribuir de acuerdo a las categorías; En caso que hubieran muchas
categorías arreglar de acuerdo a las más frecuentes, Ejm.
Definir la variable:
10
X: Peso de una barra de acero
Hallar el rango (R )
R= Xmax- Xmin
R=26.4-8.3
R=18.1
m = 1 + 3.32 log n
n: Tamaño de muestra
m=6.31
m’=6
Amplitud de intervalo (c) (Redondear a unidad inmediata superio
c=R/m
C=18.1/6
C’=3.1
Error de redondeo
R’=c’*m’
= 3.1*6
R’=18.6
Tabla 1
Distribución de frecuencias de 40 varillas de acero según el peso. Empresa Metal Mecánica A, 2014.
11
6 23.6 26.7 6 40 15.0 100
Total 40 - 100.0 -
Fuente:
22.3 15.8 18.4 22.7 19.6 15.8 26.4 17.3 15.2 23.9
24.8 22.7 18.0 20.5 11.0 18.5 23.0 24.6 20.1 16.2
8.3 12.9 12.3 22.3 13.4 17.9 12.2 13.4 15.1 19.1
22.1 17.8 19.4 20.7 18.6 18.8 24.4 17.3 14.2 23.9
hi%: Frecuencia relativa simple porcentual Hi%: Frecuencia relativa acumulada porcentual
Nota:
Si se usa intervalos semiabiertos por la derecha el último intervalo se considera cerrado.
Si se usa intervalos semiabiertos por la izquierda el primer intervalo se considera cerrado.
Tabla 02
Distribución de 540 botes de basura, según tipo de residuo que clasificaría. Ciudad X, 2015.
Tipo de residuo Nº %
Vidrio 447
Pilas 329
Papel y cartón 498
Materia orgánica 253
Plástico y metal 397
2. Representaciones Gráficas
a) Histograma de Frecuencias
Conformado por barras rectangulares unidas sobre el eje x (eje y). Muy usado para representar
variables cuantitativas.
12
Figura 01.-
b) Polígono de Frecuencias
Es una línea poligonal cerrada que une los puntos medios de los techos de los rectángulos el
histograma, se usa para comparar dos o más distribuciones.
%
c) Gráfico de Barras
Masculino Femenino
Conformado por barras perpendiculares al eje x no unidas. Se usa generalmente para representar
variables cualitativas.
Figura03.- Distribución de 540 botes de basura, según tipo de residuo en la Ciudad X, 2005.
13
d) Gráfico de Sector (Torta)
Es un gráfico circular distribuido en sectores. Se usa para representar las componentes de un total,
Ejm:
Figura 04.- Distribución de frecuencias relativas porcentuales de 540 personas según percepción de principal
fuente de contaminación. Ciudad A, 2014.
Ejercicio Nro 01
Representar los datos de la tabla obtenida en la pregunta 8), mediante:
a. Histograma de frecuencias
b. Polígono de frecuencias
c. Ojiva “mayor que”
d. Interpretar cada uno de los gráficos.
ANÁLISIS DE DATOS
Es una medida que evalúa el rendimiento promedio de un conjunto de datos. La media muestral se denota por:
x =
∑ xi
n
b) MEDIANA:
14
Es aquel valor que se encuentra ubicado en el punto central del conjunto de datos ordenados. Generalmente
distribuye a los datos en 2 grupos iguales.
Ejemplo:
Si Me = 1000 soles de ingreso familiar mensual de trabajadores de una empresa X, 50% de los trabajadores
ganan menos de 1000 soles y el otro 50% ganan 1000 soles o más.
c) MODA
Es el valor de la variable que presenta la mayor frecuencia. Muy usado para variables cualitativas.
MEDIDAS DE DISPERSIÓN
a) DESVIACION ESTANDAR
Es una medida que evalúa la variabilidad o dispersión de los datos respecto a su promedio.
S =
√ (∑ x 2i -
( n-1 )
Es decir mide el acercamiento o alejamiento entre los datos.
n x 2)
Muchos resultados quedan expresados mediante su media y desviación, así por ejemplo para el ingreso familiar
promedio:
15
x ± 2 DE : Incluye aproximadamente al 95% de los datos.
16