Clase Nº1 - Ing. Materiales

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 16

CURSO DE ESTADÍSTICA APLICADA A LAS CIENCIAS E INGENIERÍA

Estadística:
Es la ciencia que proporciona técnicas y métodos para organizar y resumir una gran cantidad de datos obtenidos de la
realidad, e inferir conclusiones respecto de ellos. El campo de la Ciencia Estadística está dividido en 2 grandes áreas:
Estadística Descriptiva y Estadística Inferencial.
Estadística Descriptiva:
Es la ciencia que nos brinda un conjunto de métodos para recolectar, presentar y caracterizar un conjunto de
datos, un estudio estadístico se considera Descriptivo cuando se analiza y describe solamente al conjunto de datos y
no hace generalizaciones.
Ejemplo:
- Describir las características de un conjunto de 40 barras de acero producidas por una Empresa Metal-Mecánica en el
mes de diciembre del 2014.
Estadística Inferencial:
Es la ciencia que nos brinda los métodos para tomar decisiones en situaciones de incertidumbre y nos permite
generalizar los resultados de una muestra hacia una población.- se basa en métodos probabilísticos.

CONCEPTOS BASICOS
Población o universo
La población es el conjunto de elementos que poseen una característica o más características comunes que deben
ser precisadas en el tiempo, en el espacio. Un universo o población debe ser inconfundible.

El definir correctamente el universo, es condición indispensable para:


- Seleccionar la muestra
- Realizar las generalizaciones inferenciales
a) Para seleccionar la muestra es necesario distinguir 2 tipos de poblaciones: población homogénea y población
heterogénea.
i) Población homogénea
Cuando la variable en estudio no presenta variabilidad, es decir que es relativamente uniforme.
ii ) Población heterogénea
Cuando está formado por elementos en los que la variable de interés no es homogénea y presenta muchas veces la
posibilidad de distribuirlo en grupos homogéneos.

b) Para realizar generalizaciones inferenciales se debe distinguir también 2 tipos de universo; universo
objetivo y universo muestral:

1
i) Universo objetivo
Está conformado por todos los elementos sin limitaciones a través del tiempo y del espacio, que
constituye el objetivo final de la generalización inferencial científica. Es el conjunto universal de todos los
elementos a que se refiere el dominio de estudio.
ii) Universo muestral
Es un subconjunto del universo objetivo que está claramente delimitado en el espacio y en el
tiempo; De sus elementos, en la práctica, se obtiene la muestra para realizar la investigación. Al número de
elementos se denota con N .
Algunas veces tanto el universo objetivo como el universo muestral son similares, no existe mayor dificultad
para inferir de la muestra hacia cualesquiera de ellos.
Muestra :
Una muestra estadística, o simplemente muestra, es una parte o subconjunto del universo muestral pero
elegida con técnicas especiales que permiten asegurar que sea representativa y adecuada.
a) Representativa
Porque la muestra refleja las mismas características de la población muestral y solamente deben diferir en el
tamaño. Se dice que la muestra es una población en miniatura. Se piensa que para asegurar la
representatividad de una muestra se debe evitar la tendencia o sesgo, utilizando métodos aleatorios. Entre
los métodos aleatorios más usados podemos señalar :
i) Método de la rifa :
Sea :
Población muestral : N
Muestra : n
Se puede usar el siguiente procedimiento :
- Se enumeran los elementos de la población : 1, 2, 3, . . . , N
- Se enumeran N papelitos y se van eligiendo uno a uno (sin remplazo) -hasta completar n papelitos.
- Dichos elementos del universo constituyen los elementos de la muestra.
- Obtener los datos de los elementos.
Ejemplo :
Sea una población hipotética de 15 individuos donde se desea conocer si posee o no posee una
determinada característica de interés).
Se desea extraer una muestra de tamaño 5.
1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15
Se eligen 5 papelitos al azar uno por uno

1 2 3 4 5 6 7 ... 15

si 5
no no3 si 12 no 1 10

2
ii) Método de Tabla de Números Aleatorios ( Tippett )
- Se enumeran los elementos de la población : 1, 2, 3, . . . , N.
- En una tabla de números aleatorios se identifica un dígito por cualquier método aleatorio y luego se toman
tantos dígitos como dígitos tenga el tamaño de la población N.
- Se recorre la tabla hacia abajo (arriba) hasta captar tantos números como sea el tamaño de la muestra.
- Dichos números en la población constituyen los elementos de la muestra. Los elementos que se repiten o
mayores de N se desprecian.

Ejemplo hipotético :
N = 800 n = 25
Xi : X1 , X2 , X3 , X4 , X5 , . . . , X800
- Se elige un punto al azar de la tabla de números aleatorios
- Se toman números de 3 dígitos ( N = 800 tiene 3 dígitos ).
- Se recorre la tabla hacia abajo
- Se identifican 25 números muestrales y se los ubica en la población
- Dichos elementos constituyen la muestra.

b) Adecuada
Una muestra es adecuada si tiene un tamaño óptimo que permite asegurar la existencia de las mismas
características del universo y que las generalizaciones sean válidas.
Si una muestra es pequeña los resultados tienen relativa validez y si es muy grande puede que haya un
dispendio de recursos. El tamaño de muestra n, se obtiene con fórmulas del Muestreo.

Tipos de muestreo.
Aleatorio - Cuando se selecciona al azar y cada miembro tiene igual oportunidad de ser incluido.
Estratificado - Cuando se subdivide en estratos o subgrupos según las variables o características que se pretenden
investigar. Cada estrato debe corresponder proporcionalmente a la población.
Sistemático - Cuando se establece un patrón o criterio al seleccionar la muestra. Ejemplo: se entrevistará una familia
por cada diez que se detecten.

D a t o e s t a d í s ti c o :
E s c a d a u n o d e l o s r e g i s t r o s c u a n ti t a ti v o s o c u a l i t a ti v o s ( v a l o r e s o c a t e g o r í a s ) q u e s e h a n
o b t e n i d o a l r e a l i z a r u n e s t u d i o e s t a d í s ti c o .

3
Variable:
Cada uno de los rasgos o característica de los elementos de una población y que varían de un individuo a otro (salario,
color de ojos, sexo, número de hijos).
Las variables pueden corresponder a cuatro niveles de medición:
Escalas de medición de variables :
Escala Nominal:
Las categorìas de la variable no tienen orden o jerarquía (lo que indica solamente diferencias en una o mas
características), son mutuamente excluyentes, por lo tanto, un elemento pertenece a una sola categoría y exhaustivas,
por lo que cada elemento de la población debe aparecer en una categoría. Ejm :
La variable sexo cuya categorías son :
- Masculino
- Femenino
Escala Ordinal:
Las categorías de la variable son mutuamente excluyentes y exhaustivas y se ordenan de acuerdo con las características
particulares que poseen (categorías jerárquicas). Ejm:
Variable : Calificación dada al profesor del curso de Geoestadística :
Categorías:
- Muy mala (1)
- Mala (2)
- Regular (3)
- Buena (4)
- Muy buena (5)
Podemos concluir que la calificación buena con código (4) es mejor que la calificación mala con código (2), pero no
podemos decir que es el doble de buena basándonos en los códigos.

Escala de Intervalo:
Incluye todas las características del nivel ordinal, pero además la diferencia entre los valores es de tamaño constante
(intervalos iguales entre categorías o valores), lo que permite realizar operaciones aritméticas básicas. Sin embargo el
cero en la medición, es un cero arbitrario, no es real se asigna arbitrariamente a una categoría el valor de cero y a partir
de esta se construye la escala
Ejm: La temperatura ambiental, la diferencia entre 25ºC y 20ºC de temperatura es la misma que entre 55ºC y 50ºC y el
cero en las escalas Centígrada y Fahrenheit es diferente.

Escala de Razón:
Presenta todas las características del nivel de intervalos (intervalos iguales entre las categorías y la aplicación de
operaciones aritméticas básicas) y además el cero es real y absoluto (no es arbitrario) lo que implica que hay un punto
en la escala donde no existe la propiedad. Ejm :
4
Variable :
Ingreso familiar mensual en la ciudad de Trujillo.

Tipos de Variables
Las variables pueden ser cualitativas o cuantitativas. Generalmente se utiliza el término “modalidad” cuando hablamos
de caracteres cualitativos y el término “valor” cuando estudiamos caracteres cuantitativos. Una variable no es sino el
conjunto de las distintas modalidades o valores que toma un carácter. Para representar una variable de utilizan letras
mayúsculas X, Y, Z, ect.

Variables cualitativas (o categóricas):


Aquellas que no aparecen en forma numérica, sino como categorías o atributos (sexo, profesión, color de ojos). Las
variables cualitativas sólo pueden ser nominales u ordinales.

Variables cuantitativas:
Las que pueden expresarse numéricamente (temperatura, salario, número de goles en un partido). Se pueden
cuantificar los resultados experimentales por medio de instrumentos adoptando unidades de medida para valorar los
diferentes resultados. Variables cuantitativas según el tipo de valores que pueda tomar pueden ser discretas o
continuas:

a) Variables discretas:
Son el resultado de contar y sólo toman valores enteros (número de hijos).
b) Variables continuas:
Son el resultado de medir, y pueden contener decimales (temperatura, peso, altura). Se pueden subdividir a
voluntad. Pueden tomar, entonces, cualquier valor dentro de un intervalo.

Ejercicio Nro 01.-


Seleccionar una muestra aleatoria de tamaño 15 de los datos de la población adjunta.
a) Usando la tabla de números aleatorios
b) Usando el comando aleatorio.entre del Microsoft Excel
ANEXO 1

8.9
1 9.06 46 9.59 91 9.04 136 8.67 181 8.88 226 8.28 271 9.70 316 1
9.1
2 7.97 47 8.46 92 8.41 137 8.29 182 9.27 227 8.60 272 8.50 317 6
10.3 8.8
3 8.98 48 9.32 93 3 138 9.14 183 8.21 228 8.85 273 9.57 318 4
8.4
4 9.88 49 9.20 94 8.78 139 9.52 184 9.45 229 8.28 274 8.79 319 9
9.5
5 8.97 50 9.02 95 8.94 140 9.25 185 8.65 230 8.66 275 9.53 320 8
5
8.4
6 9.31 51 8.76 96 7.74 141 9.42 186 8.62 231 9.25 276 9.27 321 2
9.2
7 8.33 52 9.50 97 9.08 142 9.54 187 8.77 232 8.53 277 9.54 322 5
9.7
8 8.68 53 8.89 98 8.60 143 8.89 188 9.03 233 9.57 278 9.36 323 5
9.2
9 8.60 54 8.97 99 8.66 144 8.71 189 9.19 234 8.70 279 9.18 324 6
8.8
10 9.27 55 9.59 100 8.87 145 9.41 190 9.09 235 9.06 280 8.43 325 3
8.5
11 8.09 56 8.53 101 9.51 146 9.28 191 8.52 236 9.09 281 9.35 326 7
9.0
12 8.93 57 8.76 102 8.68 147 9.15 192 9.14 237 8.19 282 8.68 327 7
10.0 9.2
13 8.33 58 9.92 103 8.95 148 4 193 9.24 238 9.10 283 8.60 328 5
10.0 8.6
14 9.12 59 8.96 104 9.34 149 8.61 194 8.83 239 1 284 9.21 329 8
8.3
15 9.18 60 7.82 105 9.08 150 8.95 195 8.18 240 9.56 285 8.68 330 0
8.7
16 8.14 61 8.92 106 9.55 151 9.51 196 8.86 241 9.28 286 9.17 331 4
8.5
17 8.39 62 8.73 107 8.54 152 8.03 197 8.94 242 9.00 287 8.86 332 1
8.8
18 9.56 63 8.64 108 9.64 153 8.98 198 9.03 243 8.80 288 9.65 333 2
9.1
19 8.59 64 8.86 109 9.89 154 7.89 199 8.14 244 8.72 289 8.23 334 0
8.9
20 9.44 65 8.48 110 8.73 155 9.25 200 9.60 245 9.39 290 9.28 335 2
9.5
21 9.12 66 8.81 111 8.64 156 8.73 201 9.90 246 8.34 291 8.89 336 2
8.4
22 9.32 67 8.49 112 9.27 157 9.92 202 8.96 247 9.50 292 8.36 337 3
9.1
23 9.67 68 9.82 113 8.99 158 8.89 203 9.57 248 8.58 293 9.64 338 9
8.0
24 8.65 69 8.98 114 8.55 159 8.28 204 9.04 249 8.25 294 8.75 339 9
10.0 9.6
25 9.69 70 8.86 115 8.85 160 8.90 205 4 250 9.41 295 8.61 340 3
10.0 9.2
26 8.66 71 8.57 116 8.13 161 8.81 206 8.56 251 3 296 9.23 341 5
8.7
27 9.23 72 8.99 117 8.57 162 8.99 207 9.49 252 9.12 297 8.74 342 8
9.2
28 9.64 73 8.48 118 8.60 163 8.53 208 8.05 253 9.11 298 9.21 343 1
8.4
29 8.61 74 8.40 119 8.58 164 9.31 209 8.79 254 8.94 299 8.86 344 3
8.9
30 9.45 75 8.60 120 9.76 165 9.56 210 9.38 255 8.59 300 8.92 345 2
8.6
31 9.41 76 9.25 121 9.54 166 8.40 211 8.91 256 9.37 301 9.16 346 5
9.8
32 9.47 77 9.17 122 8.79 167 8.88 212 9.69 257 9.06 302 9.01 347 7
7.8
33 9.77 78 9.17 123 9.23 168 8.77 213 9.74 258 8.76 303 8.42 348 8
34 9.93 79 9.33 124 8.87 169 8.92 214 8.97 259 9.33 304 9.35 349 8.6
6
5
9.2
35 8.82 80 9.72 125 8.95 170 9.08 215 8.49 260 9.17 305 8.55 350 1
9.1
36 8.99 81 9.03 126 9.08 171 8.32 216 9.49 261 8.65 306 8.53 351 1
8.6
37 9.68 82 9.09 127 8.70 172 8.80 217 9.55 262 9.05 307 8.59 352 2
9.5
38 9.24 83 9.01 128 8.89 173 8.57 218 8.30 263 9.10 308 8.61 353 2
10.9 9.2
39 8.25 84 4 129 9.18 174 8.78 219 8.66 264 9.08 309 9.14 354 9
10.0 8.5
40 6 85 8.32 130 9.07 175 9.07 220 8.98 265 9.23 310 9.28 355 7
8.8
41 9.78 86 8.85 131 8.71 176 8.43 221 9.04 266 9.49 311 9.65 356 3
10.0 10.0 9.1
42 3 87 9.24 132 9.70 177 9.91 222 9.23 267 9.23 312 2 357 2
9.4
43 8.68 88 9.05 133 8.42 178 8.99 223 9.14 268 9.46 313 8.87 358 0
8.3
44 9.06 89 9.66 134 8.66 179 8.74 224 9.41 269 8.70 314 9.83 359 8
9.4
45 8.37 90 9.47 135 9.16 180 7.97 225 9.33 270 8.94 315 8.64 360 7

TABLA DE NÚMEROS ALEATORIOS


1--5 6--10 11--15 16--20 21--25 26--30 31--35 36--40 41--45 46--50
1 59041 10706 42715 45369 20161 95481 81682 28493 44979 34967
2 03237 38461 21761 37937 12507 92038 17506 69240 20659 83730
3 10457 80468 69690 62704 05066 05225 36545 70799 43374 31514
4 68328 61663 75251 42887 84364 61446 42687 84788 64565 72132
5 40923 31458 99289 23884 40583 92199 24136 79590 61176 61624
6 18052 70915 14334 01685 17711 72639 06248 56028 33245 31158
7 41863 44201 69762 51072 93794 79050 28939 95785 74461 08345
8 51722 58881 47781 41418 54328 12919 80250 82957 87584 24899
9 95511 17642 38459 37467 10417 74350 84885 31493 06219 10980
1
0 90967 39889 34943 38615 82568 83226 69870 76030 53162 39891
1
1 78905 04637 20204 26411 37160 15392 82985 91243 85017 29406
1
2 73251 84987 93828 72313 52660 69959 56068 70262 92885 44337
1
3 17154 03514 20720 75049 35025 59163 55209 21094 48538 23724
1
4 09544 36878 49909 78549 83066 51359 53797 04629 48954 24451
1
5 59999 12073 75906 65125 73799 32018 11397 59929 93497 98145
1
6 59617 32850 63353 82875 49509 39554 61124 56633 98558 76068
1
7 43794 25596 93171 02868 46571 34004 46151 20224 89805 07182
1 02969 19315 74767 03875 99606 61333 32542 59419 56780 55304

7
8
1
9 85976 24511 53129 88631 32217 40349 03172 69496 64587 39035
2
0 07961 41764 89380 41582 49521 51781 24691 07085 35175 19440
2
1 78001 98277 76476 55472 86748 85176 21844 69680 00511 29706
2
2 45719 26360 32990 62802 22094 89906 13277 02580 64084 37183
2
3 45801 25340 74840 69958 97570 37331 67436 76782 82781 67115
2
4 44887 94539 39935 11169 94132 15973 35541 23155 45469 29343
2
5 61522 95401 65440 22363 21273 20055 02775 25238 83805 68731
2
6 50917 37933 15101 07785 06662 79602 22160 18149 47513 76348
2
7 82131 20194 22619 13798 16150 65802 67061 08819 32471 73353
2
8 42928 97309 05253 94778 18045 64136 90256 59210 83007 98778
2
9 61630 71453 63561 17121 23636 11198 43222 23898 43541 00684
3
0 12078 65027 57917 86427 35836 19964 22124 82550 40863 01737
3
1 25072 95537 67885 07187 69349 70017 96632 69816 26139 73280
3
2 43830 65030 15087 04438 37860 49535 11572 55941 76316 89160
3
3 64783 98900 77455 12906 02777 52720 94884 09788 03267 66436
3
4 79533 93394 94862 76737 78983 78490 91738 78332 56821 16079
3
5 45589 12188 92852 41688 21293 23260 27843 54092 .09973 87241
3
6 43021 58330 90545 32080 00284 96708 76256 65754 56361 89743
3
7 24648 57783 42213 14990 34958 37161 76451 11381 36419 68392
3
8 16001 38688 72907 41599 43423 48922 30342 63049 56344 12398
3
9 14241 94163 84694 39780 93003 79146 48231 54439 22051 14912
4
0 09697 50620 14099 10821 75438 77581 22698 12224 10748 04322
4
1 98987 15323 15446 89754 02863 08568 36669 79276 85787 91491
4
2 49734 74306 83106 47269 94395 02943 88989 82503 49507 27472
4
3 94680 12985 29284 04828 49274 87876 32923 04137 59140 47343
4
4 71758 34257 46911 09202 34934 05837 50570 89867 07526 89374
4
5 18365 51733 83620 65486 34138 06533 11816 59813 49750 15462
8
4
6 14441 04492 73227 85535 99890 72732 63555 80983 63616 17532
4
7 81035 63111 43783 75241 72969 97173 94909 98898 17493 90782
4
8 78377 87689 82819 99792 29651 98393 99131 13125 73457 25603
4
9 90165 24222 67318 97027 09903 52528 99162 21542 49860 16614
5
0 63606 43611 03945 39045 27999 86552 62027 93852 18893 65073

PROCEDIMIENTO DE PRESENTACIÓN, PROCESAMIENTO Y ANÁLISIS DE DATOS


Una vez obtenidos los datos a utilizar en la investigación estos son codificados (de ser necesario) y
guardados en un archivo en forma de matriz de datos usando algún paquete para crear base de datos (EXCEL, VISUAL
FOXPRO, ACCES, etc.) para que el investigador los procese con la ayuda de algún paquete estadístico (SPSS,
STATISTICA, STATGWIN, MINITAB, etc.) y luego los analice.
En la actualidad el procesamiento de datos se lleva a cabo por computadora ya no se hace en forma manual,
especialmente si hay una cantidad considerable de datos.
TIPO DE ANÁLISIS DE DATOS :
El tipo de análisis a utilizar depende del:
- Nivel de medición de las variables
- Tipo de estudio
- El interés del investigador.
Entre los principales métodos estadísticos de análisis tenemos :
- Distribución de frecuencias
- Medidas estadísticas de tendencia central, de dispersión, de forma.
- Razones y tasas
- Pruebas paramétricas: prueba t de student, análisis de varianza, etc.
- Pruebas no paramétricas: pruba ji-cuadrado, Kruskal Wallis, etc.
- Análisis de regresión
- Análisis correlación
- Análisis multivariado.

PRESENTACIÓN DE DATOS
Cuando se capta un conjunto de datos, estos se encuentran de manera desordenada lo que no permite observar
las características más saltantes. Un conjunto de datos debe presentarse en :

- Tablas de distribución de frecuencias


- Gráficas o figuras
- Medidas de resumen.

9
1. Tablas de distribución de frecuencias:
Es un arreglo adecuado de agrupación de datos en intervalos o categorías que permite una mejor
comprensión de las características en estudio.
En caso sea una variable numérica se recomienda que el número de intervalos (m) oscile entre 5 y 12, ( 5  m
 12 ), auxiliándose de la propuesta de Sturges:

m = 1 + 3.32 log n
Ejm. Si n = 120  m = 1 + 3.32 log 120
m= 8

Ejemplo.- Construir una tabla completa de distribución de frecuencias en base a los siguientes datos
que corresponden al peso de varillas de acero producidas por una industria siderúrgica 2015, de donde
se obtuvo una muestra aleatoria de 40 varillas cuyo peso en kilogramos fueron los siguientes:

22.3 15.8 18.4 22.7 19.6 15.8 26.4 17.3 15.2 23.9
24.8 22.7 18.0 20.5 11.0 18.5 23.0 24.6 20.1 16.2
8.3 12.9 12.3 22.3 13.4 17.9 12.2 13.4 15.1 19.1
22.1 17.8 19.4 20.7 18.6 18.8 24.4 17.3 14.2 23.9

Tabla 01
Distribución de frecuencias

hi Hi
' ' Yi fi Fi % %
[Y i−1 −Y i )

100.00

Para el caso de variable cualitativa se debe distribuir de acuerdo a las categorías; En caso que hubieran muchas
categorías arreglar de acuerdo a las más frecuentes, Ejm.

Definir la variable:

10
X: Peso de una barra de acero

Xmin=8.3 Xmax: 26.4

Hallar el rango (R )

R= Xmax- Xmin

R=26.4-8.3

R=18.1

Número de intervalos (m) (Fórmula de Sturges)

m = 1 + 3.32 log n
n: Tamaño de muestra
m=6.31
m’=6
Amplitud de intervalo (c) (Redondear a unidad inmediata superio

c=R/m

C=18.1/6

C’=3.1

Error de redondeo

R’=c’*m’

= 3.1*6

R’=18.6

E= R’-R =18.6 - 18.1 =0.5

Xmin’= 8.1 Xmax’=26.7

Construcción de los intervalos

Tabla 1

Distribución de frecuencias de 40 varillas de acero según el peso. Empresa Metal Mecánica A, 2014.

[Xi-1 – Xi> Conteo fi Fi hi% Hi%


1 8.1 11.2 2 2 5.0 5.0
2 11.2 14.3 6 8 15.0 20.0
3 14.3 17.4 / 7 15 17.5 37.5
4 17.4 20.5 / 11 26 27.5 65.0
5 20.5 23.6 // 8 34 20.0 85.0

11
6 23.6 26.7 6 40 15.0 100
Total 40 - 100.0 -

Fuente:

22.3 15.8 18.4 22.7 19.6 15.8 26.4 17.3 15.2 23.9
24.8 22.7 18.0 20.5 11.0 18.5 23.0 24.6 20.1 16.2
8.3 12.9 12.3 22.3 13.4 17.9 12.2 13.4 15.1 19.1
22.1 17.8 19.4 20.7 18.6 18.8 24.4 17.3 14.2 23.9

fi: Frecuencia absoluta simple

Fi: Frecuencia absoluta acumulada

hi%: Frecuencia relativa simple porcentual Hi%: Frecuencia relativa acumulada porcentual

Nota:
Si se usa intervalos semiabiertos por la derecha el último intervalo se considera cerrado.
Si se usa intervalos semiabiertos por la izquierda el primer intervalo se considera cerrado.

Tabla 02
Distribución de 540 botes de basura, según tipo de residuo que clasificaría. Ciudad X, 2015.

Tipo de residuo Nº %
Vidrio 447
Pilas 329
Papel y cartón 498
Materia orgánica 253
Plástico y metal 397

TOTAL 540 100.0

2. Representaciones Gráficas
a) Histograma de Frecuencias
Conformado por barras rectangulares unidas sobre el eje x (eje y). Muy usado para representar
variables cuantitativas.

12
Figura 01.-

b) Polígono de Frecuencias
Es una línea poligonal cerrada que une los puntos medios de los techos de los rectángulos el
histograma, se usa para comparar dos o más distribuciones.
%

Figura 02: Distribución de frecuencias de la variable X, según sexo…

c) Gráfico de Barras
Masculino Femenino
Conformado por barras perpendiculares al eje x no unidas. Se usa generalmente para representar
variables cualitativas.

Figura03.- Distribución de 540 botes de basura, según tipo de residuo en la Ciudad X, 2005.

13
d) Gráfico de Sector (Torta)
Es un gráfico circular distribuido en sectores. Se usa para representar las componentes de un total,
Ejm:

Figura 04.- Distribución de frecuencias relativas porcentuales de 540 personas según percepción de principal
fuente de contaminación. Ciudad A, 2014.
Ejercicio Nro 01
Representar los datos de la tabla obtenida en la pregunta 8), mediante:
a. Histograma de frecuencias
b. Polígono de frecuencias
c. Ojiva “mayor que”
d. Interpretar cada uno de los gráficos.

ANÁLISIS DE DATOS

MEDIDAS DE TENDENCIA CENTRAL

Son de mucha utilidad las siguientes:

a) MEDIA ARITMÉTICA O PROMEDIO:

Es una medida que evalúa el rendimiento promedio de un conjunto de datos. La media muestral se denota por:

x =
∑ xi
n
b) MEDIANA:

14
Es aquel valor que se encuentra ubicado en el punto central del conjunto de datos ordenados. Generalmente
distribuye a los datos en 2 grupos iguales.
Ejemplo:

Si Me = 1000 soles de ingreso familiar mensual de trabajadores de una empresa X, 50% de los trabajadores
ganan menos de 1000 soles y el otro 50% ganan 1000 soles o más.

c) MODA

Es el valor de la variable que presenta la mayor frecuencia. Muy usado para variables cualitativas.

Ejemplo : Grupo sanguíneo : Mo = O, el tipo de sangre más frecuente es el grupo O.

MEDIDAS DE DISPERSIÓN

a) DESVIACION ESTANDAR

Es una medida que evalúa la variabilidad o dispersión de los datos respecto a su promedio.

S =
√ (∑ x 2i -
( n-1 )
Es decir mide el acercamiento o alejamiento entre los datos.
n x 2)

Muchos resultados quedan expresados mediante su media y desviación, así por ejemplo para el ingreso familiar
promedio:

Ciudad A : x ± DE = 1000  120

Ciudad B : x ± DE = 1000  200


En ambas ciudades se observa igual ingreso familiar mensual promedio pero mayor variabilidad muestran los
ingresos de la ciudad B.

x ± DE : Incluye aproximadamente al 69% de los datos.

15
x ± 2 DE : Incluye aproximadamente al 95% de los datos.

b) COEFICIENTE DE VARIACION (C.V)


Es un coeficiente adimensional que permite comparar la variabilidad de dos o más distribuciones de
frecuencia aunque las variables se encuentren en diferentes unidades. Ejm. Se puede comparar la
variabilidad de la temperatura (grados) con la variabilidad de la humedad (%).
S
C . V% = −
x 100
X
La media aritmética debe ser diferente de cero.

16

También podría gustarte