Apuntes Estadistica
Apuntes Estadistica
Apuntes Estadistica
ESTADISTICAS APLICADAS
Trabajos/ Tareas.
1
¿Qué es la estadística aplicada?
Es la ciencia que estudia un conjunto de datos numéricos para obtener inferencias basadas en el
calculo de probabilidades. La estadística no es un concepto perteneciente a la cuestión de calidad
sino una disciplina de la misma, esta disciplina científica se ocupa de la obtención, orden y análisis de
un conjunto de datos, con el fin de obtener explicaciones y predicciones sobre fenómenos
observados.
La estadística consiste en métodos, procedimientos y formulas que permiten recolectar información
para luego ser analizados y extraer de ellos conclusiones relevantes. Se puede decir que es la ciencia
de los datos y que su principal objetivo es mejorar la comprensión de los hechos a partir de la
información disponible.
2
ALUMNOS DE UN SALON
7
0
MUJERES HOMBRES
MUJERES HOMBRES
Si conviene saber que la estadística no es una rama de las matemáticas que si utiliza herramientas
de las matemáticas del mismo modo que lo hace la física, la química, la ingeniería, la economía, etc.
Pero eso no las hace ser parte de las matemáticas, es cierto que tienen una relación estrecha pero
la estadística y las matemáticas son disciplinas diferentes.
“Elementos de la estadística”
Los principales elementos de la estadística son:
1. POBLACION: Grupo de individuos que presentan o podrían presentar un rasgo característico
común que se desea investigar.
2. MUESTRA: Es un subgrupo de datos extraídos de una población que debe representar
adecuadamente la totalidad del grupo.
3. PARAMETRO: Son medidas que ofrecen información sobre el centro de conjunto de datos
(medidas de tendencia central), otra sobre dispersión o variabilidad (medidas de dispersión) y
otras sobre la posición de un valor (medidas de posición como los percentiles).
4. EXPERIMENTO: Proceso o actividad llevada a cabo de forma intencional ara obtener una serie
de datos paratífica o refutar una hipotaxis.
5. VARIABLE: La característica o cualidad de una muestra o población a la cual se le puede
asignar un valor.
*TAREA*
¿POR QUÉ ES IMPORTANTE LA ESTADÍSTICA EN LA CARRERA DE PSICOLOGIA?
Nos permite conocer las características individuales de los pacientes y sus padecimientos para un
mejor diagnóstico.
TIPOS DE ESTADISTICAS
3
Los tipos de estadísticas se pueden subdividir en dos grandes ramas.
• ESTADISTICA DESCRIPTIVA
Se refiere a los métodos de recolección organización, resumen y presentación de un conjunto de
datos, se trata principalmente de describir las características fundamentales de todos los datos
y para ello se suele utilizar, indicadores, gráficas y tablas.
Las estadísticas descriptivas se encargan de recoger, almacenar y ordenar parámetros básicos
sobre un conjunto de datos y su propio nombre lo indica ósea trata de describir algo. Pero no lo
describe cualquier forma sino de manera cuantitativa.
4
6. PSICOLOGO: la utilizamos para medir y comparar la conducta, actitudes, inteligencia del
nombre.
7. DEMOGRAFICO: registro de hechos de la vida diaria como nacimientos, defunciones,
matrimonios, divorcios.
8. INDUSTRIAS: se utiliza en control de calidad.
9. BIOLOGICA: la utilizamos para el estudio de las reacciones de las plantas, animales y
diferentes periodos ambientales.
10. SALUD: se utiliza por técnicos para planear la localización e infraestructura de hospitales,
diagnósticos y localización de distintas fuentes de una enfermedad, así como las
características de su población.
11. AGENCIAS GUBERNAMENTALES: se utilizan para planes y programas de un futuro.
12. DERECHO: se utiliza para descripción de documentos notariales.
ESTADISTICABINFERENCIAL
Se trata de un paso mas haya de la manera de descripción se refiere a los métodos utilizados para
poder hacer predicciones, generalizaciones y obtener conclusiones a partir de los datos analizados,
teniendo en cuenta el grado de incertidumbre existente.
La estadística emplea usualmente mecanismos que nos permiten llevar acabo dichas deducciones
tales como: pruebas de estimulación puntual, pruebas de hipotesis, pruebas paramétricas o no
paramétricas. Por ende, la estadística inferencial es sumamente útil en el análisis de poblaciones y
tendencias para hacerse una idea posible de las acciones posibles, de las mismas condiciones
específicas, no significa que las pruebas puedan predecir fielmente un resultado o que estemos en
presencia de una ciencia exacta, pero si de una aproximación posible al resultado final.
CAMPOS DE APLICACIÓN DE ESTADISTICA INFERENCIAL
1. SONDEO DE TENDENCIA DE VOTO: la utilizamos ante una elección importante, diversas
encuestas de opinión pública, para recabar datos relevantes y después hacer la muestra
analizase y desglosada de deducir un favoritismo.
2. ANALISIS DE MERCADEO: a menudo las empresas contratan a otras empresas de marketing,
para que análisis sus dichos de mercado, diferenciales otra vez a través de herramientas.
3. EPIDEOMOLOGIA MEDICA: se utiliza para la determinación de una población en una o más.
*TAREA*
¿Cómo influye el conocimiento de estadística inferencial y descriptiva en nuestra carrera?
La estadística en psicología permite validar o rechazar los conjeturos de la estadística descriptiva.
De esta manera se podría decir que la E. inferencial es la parte de la estadística que se ocupa de
generalizar resultados a partir de los resultados obtenidos en una muestra.
La estadística inferencial se divide en 2 tipos:
A. ESTADISTICA PARAMETRICA: que se caracteriza porque asume que los datos tienen una
determinada distribución con parámetros que deberían cumplirse.
5
B. ESTADISTICA NO PARAMETRICA: en ella no es posible asumir ningún tipo de distribución
subyacente en los datos ni tampoco un parámetro especifico.
Visto desde un punto de vista conceptual la media aritmética es el centro de los datos en un sentido
numérico ya que intenta equilibrarlos por exceso o por defecto. Es decir, que si sumamos todos los
datos nos da cero.
𝑛
I=𝑛 1 (𝑥1−𝑋̅ )=0
1. EJEMPLO:
Encontrar la media aritmética de las sig edades de los animales
ANIMAL Y EDAD ANIMAL Y EDAD
Perro:2 años Araña:7 años
Oso: 3 años Ratón: 2 años
Mosca: 3 años Gato: 2 años
Zorro: 5 años Perico: 1 año
Entonces nuestra media es la misma que el promedio solo que lo representamos con 𝑋̅
6
2. EJEMPLOS
Reliza la media de la siguiente lista de edades:
1. 3, 4, 5, 6, 8
2. 1, 6, 8, 9
4. 2, 1, 5, 3, 4, 8, 9, 5, 7, 5
5. 5, 7, 6, 4, 3, 8, 7
3. EJEMPLO
Carlos a jugado a los bolos con su hermano Roberto 4 veces y estas son sus puntuaciones en cada
uno de sus partidos
7
En la:
#1 ha sido igual a 5
#2 ha sido 4 veces la primera
#3 ha sido igual a la primera
#4 ha sido el doble
MEDIANA
La mediana es el elemento de un conjunto de datos ordenados (𝑋1, )𝑋2… Xn) que dejan a izquierda y
derecha a esos valores, la mediana es representada con (Me) si el conjunto de datos no esta
ordenado debemos ordenar todo número ascendente a sea de menos a mayor, es decir la
mediana es el valor del conjunto tanto el valor 50%de los elemtos son menores o iguales y el otro
50% son mayores o iguales.
8
Siendo nuestra formula
𝑋2𝑛 si es par
𝑛−2
(𝑋 [ ] + 𝑋[𝑛 − 1]) sí es impar (N)
2
Donde (X) es igual a la lista ordenada de valores del conjunto de todos de mayor a menor.
(N) es igual al numero de valores del conjunto de datos.
EJEMPLO:
Si ocurriera que no son iguales y la lista fuera
1, 1, 1, 1, 2, 4, 4, 4, 4, 5
6
Me=2=3
3. EJEMPLO:
Encuentra la media de la estatura en (cm) de un grupo de 16 amigos
AMIGOS ORDENADO
150 150
160 151
164 157
157 157
183 159
163 160
182 161
170 163
159 163
157 164
151 170
161 172
9
163 173
178 178
173 182
172 183
Me=163
4. EJEMPLO:
Encuentra la mediana del número de veces que va al cine en un mes cada persona de un grupo
de 11 amigos
PERSONAS:
2, 0, 2, 3, 1, 1, 2, 3, 1, 1, 3
0, 1, 1, 1, 1, 2, 2, 2, 3, 3, 3
Me=2
5. EJEMPLO:
Encuentra la mediana de las veces que se cepilla maría los dientes al día dúrate dos semanas
Días
1, 1, 2, 2, 3, 3, 3, 3, 2, 4, 2, 2, 5, 1
1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 5
Me=2
10
MODA
La moda es el valor mas repetitivo del conjunto de datos, es decir, el valor cuya frecuencia relativa es
mayor. En un conjunto puede hacer mas de una moda y esto ocurre cuando dos o más números
están con la misma frecuencia y se llamara bimoda o puede haber multimoda si se repiten la misma
cantidad veces siendo este el máximo numero de veces del conjunto, también puede darse el caso a
la inversa que en una muestra no haya moda por la ausencia de la repetición de los datos a esto le
llamamos amodal.
El signo es: Mo
1. EJEMPLO:
Daniela ha anotado el numero de partidas de parchís que ha jugado cada día durante una semana.
1, 2, 2, 2, 3, 4, 21 Lunes =1
Martes =2
Mo=2
Miércoles= 3
1, 2, 3, 6, 0, 4 Jueves =2
Viernes =2
Mo= X imodal Sábado =4
1, 2, 2, 3, 3, 4, 21 Domingo= 21
• 5,3,6,5,4,5,2,8,6,5,4,8,3,4,5,4,8,2,5,4
5=6 3=2 6=2 4=5 2=2 8=2 Mo= 5
11
• 3,5,8,6,7,7
Mo=7
• 1,8,2,3,5,6,8,2,7
Mo=2,8
3. Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de sus consultas
en el momento de andar por primera vez.
MESES NIÑOS
9 1
10 4
11 9
12 16
13 11
14 8
15 1
4. Calcular la moda de la distribución estadística que viene dada por la siguiente tabla
INTERVALO FRE-ABSOLUTA
(60-63) 5
(63-66) 18
(66-69) 42
(69-72) 27
(72-75) 8
Mo=66-69
5. Calcular la moda de la siguiente tabla que viene dada por los siguientes datos de edad
EDADES FRE-ABSOLUTA
6-12 8
12-15 12
15-18 45
18-23 18
23-25 17
12
6. Calcula la moda de la siguiente tabla
4-8 1
8-12 2
12-15 1
15-19 4
19-21 1
21-23 1
DISTRIBUCION DE FRECUENCIAS
La tabla de frecuencia son la ordenación de los datos estadísticos asignados a cada dato de
frecuencia y pueden ser con variables discretas o continuas.
FRECUENCIA ABSOLUTA
Es la media estadística que nos da información acerca de la cantidad de veces que se repite un
suceso al realizar un numero determinado de experimentos aleatorios. Esta medida se
representa mediante las letras (fi)
(f) se refiere a la frecuencia
(i) se refiere a la realización de encima del experimento aleatorio. Ósea la frecuencia absoluta es
el número de veces que se repite este elemento.
La frecuencia absoluta es utilizada en frecuencias y es muy útil para una población o muestra. Esta
medida se puede utilizar con variables cualitativas siempre que esta se pueda ordenar.
1. EJEMPLO
Calcular la (fi) de la siguiente muestra
Si la frecuencia no es
1,1,2,4,2,1,4 N=7 o igual al número de
datos, algo está mal y
1=3 debemos revisar los
2=2 datos y sumas
4=2
Se determina con:
Fi/n o hi
Para calcular la frecuencia relativa es necesario calcular la frecuencia absoluta, por que sin ella no
podríamos obtener la frecuencia relativa.
13
Su fórmula de cálculo es la siguiente
hi= fi/n
donde (hi) es igual a la frecuencia relativa de observaciones enésima y (fi) es igual a la frecuencia
absoluta de la observación enésima y (n) es igual al total de observaciones de la muestra.
1. EJEMPLO (serie de muestra)
1,1,2,4,2,1,4
N=7
Fi Fi/n
1 3 3/7 0.428
2 2 2/7 0.285
4 2 2/7 0.285
=7 =0.99
2. EJEMPLO
Sacar la frecuencia relativa de la siguiente 2 19 19_/125 0.152
tabla 3 25 25/125 0.2
4 12 12/125 0.096
fi fi/n 5 23 23/125 0.184
3 2 2/30 0.066 6 15 15/125 0.12
4 4 4/30 o.133 7 8 8/125 0.064
5 6 6/30 0.2 8 16 16/125 0.128
6 7 7/30 o.233 =125 =1.576
7 5 5/30 0.166
8 3 3/30 0.1
9 2 2/30 0.066 4. EJEMPLO (HELADOS)
10 1 2/30 0.033 Helados fi fi/n
=30 =0.997 chocolate 12 12/36 0.333
Arroz 8 8/38 0.222
3. EJEMPLO Frutos 6 6/36 0.166
Vainilla 6 6/36 0.166
fi fi/n granada 4 4/36 0.111
1 7 7/125 0.056 =36 =0.998
14
12 6 6/30 0.2
14 3 3/30 0.1
5. EJEMPLO 16 2 2/30 0.066
fi fi/n 18 2 2/30 0.066
11 6 6/26 0.230 =30 =0.998
12 11 11/26 0.423 MO=6
13 7 7/26 0.269
14 2 2/26 0.076 7. EJEMPLO
=26 =0.998
Mo=11 fi fi/n
Física 4 4/28 0.142
Matemática 3 3/38 0.107
6. EJEMPLO Estadística 2 2/28 0.071
Fi fi/n Informática 7 7/28 0.25
4 3 3/30 0.1 Español 8 8/28 0.285
6 4 4/30 0.133 Ingles 4 4/28 0.142
8 4 4/30 0.133 =28 =0.997
10 6 6/30 0.2 Mo=7
8. EJEMPLO
Fi fi/n
1.50 cm 3 3/10 0.3
1.60 cm 2 2/10 0.2
1.70 cm 5 5/10 0.5
=10 =1
Mo=5
FRECUENCIA ACUMULADA
El resultado de la suma sucesivamente de las frecuencias absoluta o relativas es nuestra frecuencia
acumulada t esto se obtiene colocando en la tabla los datos ordenados y tabulados, ósea
simplemente de ir sumando una clase o un grupo de muestras con la anterior, o sea el primero con
el segundo y tercero y así sucesivamente hasta llegar a acumular del primer grupo hasta el último,
esto quiere decir, que es la suma de frecuencias absoluta inmediata, superior o igual.
La frecuencia acumulada se denota como (f)
15
1. EJEMPLO 3 17 42
4 20 62
Fr F 5 7 69
1 3 3 6 12 81
2 2 5 7 15 96
4 2 7 8 18 114
=7 =114
2. EJEMPLO 6. EJEMPLO
fr F fr F
5 4 4 1 0 0
6 3 7 2 2 2
7 2 9 3 1 3
8 7 16 4 2 5
9 8 24 5 2 7
10 4 28 6 1 8
=28 7 2 11
8 4 15
3. EJEMPLO 9 1 16
10 4 20
fr F =20
lunes 132 132
Martes 96 228
Miércoles 48 276 7. EJEMPLO
Jueves 125 401 fr F
Viernes 160 561 2 2 2
Sábado 380 941 3 3 5
Domingo 59 1000 4 3 8
=1000 5 6 14
6 4 18
4. EJEMPLO 7 2 20
8 2 22
fr F 9 2 24
0 4 4 10 1 25
1 8 12 =25
2 8 20
3 6 26
4 3 29 8. EJEMPLO
5 2 31 fr F
=31 0-10 5 5
10-20 15 20
20-30 25 45
5. EJEMPLO
30-40 30 75
fr F 40-50 45 120
1 10 10 50-60 55 175
2 15 25 =175
16
TIPOS DE FRECUENCIAS ACUMULADAS
1. ABSOLUTA
2. RELATIVA
La frecuencia absoluta acumulada es la suma de todas las frecuencias absolutas de estudio. Que es
igual a la frecuencia acumulada.
La frecuencia relativa acumulada se calcula con el coeficiente de frecuencia absoluta de algún valor
o de población del muestral entre el total de valores que componen la población o muestra. Para
hallar la frecuencia relativa acumulada se toman las frecuencias de (f/n).
También se pueden dar en porcentajes.
1. EJMEPLO
De la siguiente tabla sacra la frecuencia relativa acumulada
f f/n F f/n
1 3 3/7 3 3/7
2 2 2/7 5 5/7
3 2 2/7 7 7/7
2. EJEMPLO
Se realizo una encuesta de 100 personas y se les pregunto su estado civil los cuales presentaron los
siguientes resultados
f f/n F f/n
Solteros 22 22/100 0.22 22/100
Casados 45 45/100 0.45 45/100
Divorciados 20 20/100 0.2 20/100
Viudos 8 8/100 0.08 8/100
Otros 5 5/100 o.05 5/100
=100 =1
17
3. EJEMPLO
Durante el mes de julio en una ciudad se registraron las siguientes temperaturas maximas
32,31,28,28,33,32,30,30,31,31,31,27,28,29,32,31,31,30,30,29,29,30,30,31,30,31,34,33,33,29,29
F f/n F f
27 1 1/31 0.03 1 1/31
28 2 2/31 0.06 3 3/31
29 6 6/31 0.19 9 9/31
30 7 7/31 0.22 16 16/31
31 8 8/31 0.25 24 24/31
32 3 3/31 0.09 27 27/31
33 3 3/31 0.09 30 30/31
34 1 1/31 0.03 31 31/31
=31 =0.96
4. EJEMPLO
Los pesos de 65 empleados de una fábrica vienen dados por la siguiente tabla
Pesos fi f/n F
50-60 8 8/65 8
60-70 10 10/65 18
70-80 16 16/65 34
80-90 14 14/65 48
90-100 10 10/65 58
100-110 5 5/65 63
110-120 2 2/65 65
=65
5. EJEMPLO
En una organización de la ciudad se recopilaron los datos de una votación para elegir el
representante de una comunidad.
fi f/n F
Guillermo 18 18/60 18
cristina 30 30/60 48
Marcelo 12 12/60 60
=60
6. EJEMPLO
El alcande desea implementar un peague para eso le piden a un funcionario que recoja los datos del
numero de votos que pasan en horas de la mañana.
47,52,65,53,50,49,35,49,48,61,42,39,51,42,39,49,54,42,59,54,55,57,52,47,47,50,51,49,49,47
18
fi f/n F
35 1 1/30 1
39 2 2/30 3
42 3 3/30 6
47 4 4/30 10
48 1 1/30 11
49 5 5/30 16
50 2 2/30 18
51 2 2/30 20
52 2 2/30 22
53 1 1/30 23
54 2 2/30 25
55 1 1/30 26
57 1 1/30 27
59 1 1/30 28
61 1 1/30 29
65 1 1/30 30
=30
MEDIDAS DE DISPERCION
Tratan a través del calculo de diferentes formulas de arrojar un valor numérico que ofrezca
informar sobre el grado de variabilidad de una variable, o sea las de dispersión son números que
indican si una variable se mueve mucho, poco, maso menos que otra. La razón de ser este tipo de
medidas es conocer de manera resumida una característica de variable estudiada, en este sentido
debe ser acompañada de medidas de tendencia central y que juntas ofrecen información que
después podemos utilizar para comparar y si fuera preciso, para tomar decisiones.
Estas son las 4 medidas más importantes de dispersión
RANGO: es un valor numérico que indica las diferencia entre el valor máximo y mínimo de una
población o muestra estadística y suele ser utilizado para obtener la otra, total es decir, si tenemos
una muestra con observaciones para la anf de los dos números su formula esta dada por:
R=Max-Min
R: rango
Max: valor máximo de la muestra de población
Min: valor mínimo de la muestra de población
X: variable sobre la que se pretende calcular esta medida
Para ello es necesario ordenar los valores de mayor a menor o viceversa y así sabemos los valores
solo aplica la formula.
19
1. EJEMPLO
Si tenemos una muestra de 2 observaciones y sean 10 y 100 euros el rango será:
R=Max-Min R=100-10 R=90
2. EJEMPLO
Supongamos que tenemos una empresa y produce microchips para luego venderlos a las
principales marcas de computadoras, esta empresa encara un economista y realiza un estudio
sobre la evaluación de las ventas para posteriormente ofrecer consejos y mejoren los resultados que
se pide y se calcule el rango de producción microchip.
20
5. De las edades de los profesores de equis colegio sacar el rango de edades
NOMBRES EDADES NOMBRES EDADES
Manuel 23 Mateo 28
Carlos 36 Erick 43
Andy 45 Sebastián 32
Noemi 28 Carmen 50
Leonardo 28 Fabiola 23
Cipriano 42 Alejandra 45
mariana 38 julia 28
maría 36
R=50-23 R=27
VARIANZA
La varianza es la medida de dispersión que representa la variabilidad de una serie de datos respecto
a su media. Formalmente se calcula como la suma de los residuos al cuadrado divididos entre el total
de observaciones. También se puede calcular como la desviación típica al cuadrado entendiendo
como residuo a la diferencia entre valor de la variable en un momento y el valor medio de toda la
variable. La variable en estadística es muy importante ya que se trata de una medida sencilla pero
que aportan mucha información sobre una variable en concreto de la muestra o población. La
variancia siempre es mayor o igual a cero. Al elevarse los residuos al cuadrado es matemáticamente
imposible que la varianza salga negativa así que no puede ser menor que cero.
FORMULAS
Donde:
X: es igual a la variable sobre la que se pretende calcular
𝑋1: observación del numero de la variable
N: número de observaciones
𝑋̅: medida o promedio de la variable de (X)
1. EJEMPLO
Sacar la varianza de las siguientes edades de 5 niños sobre la fórmula de población.
1 5
2 6
3 6
4 7
5 8
21
2. EJEMPLO
Sacar la varianza de la siguiente muestra el peso de 3 chicos
Juan 52kg
Karla 55kg
Lucas 58kg
3. De la serie de datos sobre el salario de 5 personas y que cada uno tiene un salario diferente,
calcular la varianza (sobrepoblación)
Juan 1.500 euros
Pepe 1.200 euros
Miguel 1.300 euros
José 1.700 euros
Mateo 1.800 euros
22
DESVIACION TIPICA
La desviación típica es otra medida que ofrece in formación de la dispersión respecto a la media, su
cálculo es exactamente el mismo procedimiento de la varianza, pero realizando la raíz cuadrada del
resultado dado por la siguiente formula
1. EJEMPLO
Un profesor enseña a dos grandes grupos de introducción al marketing y selecciona aleatoriamente
una muestra de calificaciones de los exámenes realizados por dos grupos, encuentra la desviación
típica de cada muestra. (DESVIACIO DE POBLACION Y MUETRAL)
GRUPOS:
1.- 50,60,70,80,90
𝑋𝑖 (𝑋1 (𝑋1
− 𝑋̅)2 − 𝑋̅)2
50 −202 400
60 −102 100
70 02 0
80 102 100
90 400
202
=60 =1000
23
2.- 72,68,70,74,66
𝑋𝑖 (𝑋1 (𝑋1
− 𝑋̅)2 − 𝑋̅)2
72 22 4
68 −22 4
70 02 0
74 42 16
66 16
−42
=0 =40
2. EJEMPLO
El tiempo en segundos que tardaron todos los empleados del área de producción en realizar una
tarea es:
23,35,14,37,28,45,12,40,27,13,26,25,37,20,29,49,40,13,27,16,40,20,13,66
3. EJEMPLO
85,86,100,76,81,93,84,99,71,96,93,85,81,87,99
24
4. EJEMPLO
9,7,10,8,9,7,8,9
COEFICIENTE DE VARIACION
Es una medida estadística que nos informa acerca de la dispersión relativa de un conjunto de
datos, es decir nos informa igual que otras medidas si la variable se mueve mucho, poco o mas
que otras. Su cálculo se obtiene de dividir la desviación típica/ estándar entre el valor absoluta de
la media de conjunto y por lo general se expresan en porcentaje para su mayor comprensión.
Donde su fórmula es:
𝑆𝑥
𝐶𝑣 =
|𝑥̅ |
Donde
X: es igual a la variable sobre la que se pretende calcular la varianza
SX: es la desviación típica de la variable (X)
𝑥̅ : es la media de la variable (X) en valor absoluto con (𝑥̅ = 0)
1. EJEMPLO
Una población de alumnos tiene una estatura media de 1.60 cm con una desviación estándar de
16cm, estos mismos alumnos tienen un peso medio de 70kg con una desviación estándar de 14kg
¿Cuál de las dos variables representa mayor variabilidad relativa?
25
CV>Ch
2. EJEMPLO
Pensemos que en una población de elefantes y otra de ratones, la población de elefantes tiene un
peso medio de 5,000kg y una desviación típica de 400kg y la población de ratones tiene un peso
medio de 15g y una desviación típica de 5g
ESTIMACION ESTADISTICA
Este termino indica que a partir de la observación en una muestra o un resumen estadístico con las
medidas que conocemos descriptivas que se generaliza dicho resultado muestral a la población total,
de modo que lo estimado es un valor generalizado a la población.
METODOS DE ESTIMACION
▪ METODO POR ANALOGIA: consiste en aplicar la misma expresión formal del parámetro de
población o la muestra, generalmente estos estimadores son de cómoda operatividad, pero
muestran en ocasiones sesgos o resultados no eficientes, para muestra de tamaños grandes al
cumplir por ello propiedades de consistencia muestrales.
▪ METODO DE LOS MOMENTOS: consiste en tomar como estimadores en los momentos de la
población a los momentos de muestra, podríamos decir que son casos particulares del método
de analogía en términos operativos consiste en resolver un sistema de equivalencia entre unos
adecuados momentos empíricos muestrales y teóricos poblacionales.
26
VARIANZA
1. EJEMPLO: Se midieron los pesos en kg de un grupo de 6 personas, se desea saber el
coeficiente de varianza.
45kg
62kg
38kg
55kg
48kg
52kg
2. EJEMPLO
Conocer el coeficiente de varianza
85
62
88
55
98
52
75
70
76
77
=738
27
EJEMPLO DE METODOS DE ESTIAMCION
El abdomen de un cangrejo de mar esta integrado por 7 segmentos expuestos paralelamente. En los
machos se suelen apreciar unciones entre los segmentos 3,4,5 se considera la variable aleatoria (x)
es el numero de segmentos mencionados, esta variable puede tomar las variables 0,1, que se
fusionan los segmentos 3,4 o 4 y 5 y dos o que se fusionan los tres segmentos entre sí. A través de
diversas consideraciones sobre la genética de la población de los cangrejos, se llega a la conclusión
de que las probabilidades asociadas a esta variable son de la forma siguiente.
𝑎=1
P(X=0) = 𝑎(𝑎+1)
𝑎−1
P(X=1) =𝑎+1
1
P(X=2) = 𝑎 a>1
En una muestra de 100 cangrejos que se han encontrado 18 sin funciones, 43 que presentan una
función y 39 que presentan dos funciones. Utilizando esta información para obtener un valor
aproximadamente de (A)
28
El cerebro de los humanos esta formado por 4 segmentos, el cerebro de las mujeres suele tener
mayor capacidad que la de un hombre y esto es por el segmento 2,3 y 4, si consideramos la variable
aleatoria X= numero de segmento con mayor capacidad.
Se puede tomar el valor de 0, 1 y el 2 con la información anterior se llegara a la conclusión de la
probabilidad de las variables.
P (x=0)=a-1 / a (a+1)
P (x=0)= a-1 / a+1
P (x=2)= 1 / a, a > 1
En una muestra de 250 mujeres que se han encontrado 91 con 2 segmentos, 85 que funcionan 3
segmentos y 74 que funcionan todos.
Sacar el valor de (a)= Muestra: 250 mujeres
Resolución del problema:
29
Resolución del problema:
30
En un hospital se estudia los embarazos de mujeres por edades, en los siguientes características se
manejan 3 segmentos, donde 15 a 35 años la mayoría son partos naturales de 35 a 49 parto normal
y cesárea y de 49 a 60+ parto cesárea.
Considerando nuestra variable aleatoria X Nuestro valor 0= Normal. 1= Normal y Cesárea, 2= Cesárea
Donde concluimos que las probabilidades son las siguientes:
*
En una muestra de 1,000 mujeres se han encontrado 350 parto normal, 50 parto N y C. y 150 parto C.
Utiliza esta información para el valor aproximado de (A) por los métodos de:
• Analogía
• Momento
• Máxima verosimilitud
31
Permutación y combinación.
P permutación
Varianza
Las permutaciones se refieren a la acción de organizar todos los miembros de un conjunto en algún
tipo de orden o secuencia eso significa si un conjunto ya está ordenado el proceso de organizar sus
elementos permutan. En la permutación si es importante organizar los elementos.
Tipos de permutación
Lineal circular con elementos repetitivos
Permutación lineal
Ejercicios
Ejemplo-1 En la clase hay 4 alumnos se requiere formar 4 equipos de 3 personas
Ejemplo-2 5 estudiantes compiten en una carrera de 100 metros de cuántas maneras quedar en las
posiciones que llega
32
Ejemplo-6 Si tengo 4 colores diferentes cuantas banderas de 2 colores se formarán
Permutación circular.
Es cuando nos permite ordenar alrededor de un objeto. En estás ordenaciones no hay ni un primer n
último elemento para calcular el número de permutaciones circulares basta con fijar uno de ellos y
así n-1 restante se podrían ordenar de diferentes maneras.
Formula Pc=(n-1)!
Ejemplos.
Ejemplo-1 De cuántas maneras podemos ordenar a 5 personas que van jugar cartas alrededor de
una mesa circular.
Ejemplo-2 En una excursión nos piden acomodar 8 niños alrededor de la fogata de cuántas distintas
maneras se pueden acomodar.
Ejemplos-3 en un hospital se hace una mesa redonda de 6 médicos para debatir el estado de un
enfermo de cuántas maneras posibles pueden estar acomodados alrededor de la mesa.
33
PERMUTACIONES CON REPETICIONES
La permutación con una repetición o más se usa cuando en un total de n elementos el primero se
repite o veces otro se repite v veces o c veces para calcular el número de permutaciones o
elementos se usa la siguiente fórmula.
PE= n!
a! b! c!
Ejemplo: Cuántas palabras distintas se pueden formar con la palabra MATEMÁTICAS
Pe=11! = 21
3!*2!*2!
6 5 4 = 120 n!=6
123
234
345
456
56
6
34
2. Si tengo 20 colores distintos ¿Cuántas banderas de 2 colores se harán?
20-19=380 n!=2
CIRCULAR
4. Si tengo a 7 abogados de cuentas maneras los puedo poner en una mesa redonda.
Pc=(7-1)! Pc=6! Pc= 6*5*4*3*2*1= 120
35
REPETICIÓN
Cuántas palabras se pueden formar con las siguientes palabras
MANZANA
Pe= 7! Pe= 7*6*5*4*3*2*1 = 5040 = 420
3! 2! 3*2 12
BORRADOR
Pe= 8! Pe= 8*7*6*5*4*3*2*1 = 40320 = 3,360
3! 2! 3*2 12
PARALELO
Pe= 8! Pe= 8*7*6*5*4*3*2*1 = 40320 = 10,080
2! 2! 2*2 4
DIAGRAMAS
Pe= 9! Pe= 9*8*7/*6*5*4*3*2*1 = 362,880 = 60.480
3! 3* 6
ORNITORRINCO
Pe= 12! Pe= 12*11*10*9*8*7*6*5*4*3*2*1 = 479.001,600 = 19,958,400
3! 2! 2! 3*2*2 24
36
La combinación de permutación
n!
Ckn =
[n − K]! K!
N= Total de elementos
K= Elementos por grupo
Ej: Cuantos son los posibles partidos para definir partidas de subcampeón/campeón, donde tenemos
4 equipos distintos.
N= 4 k= 2
4! 4 × 3 × 2 × 1 24
C24 = = = =6
[4 − 2]! k! (2)! 2! 4
Ej: En una clase hay 35 equipos de 3 personas, ¿Cuántos equipos se pueden formar?
N=35 k=3
35! 35 × 34 × 33 × 32 39,720
C335 = = =
(35 − 3)! 3! 32! 3! 6
C335 = 6,545
37
En una clase hay 5 alumnos, se deben formar equipos de 3 personas, ¿Cuántos equipos diferentes se
pueden formar?
En una clase hay 50 alumnos y se requiere formar equipos de 5 personas, ¿cuántos se pueden
formar?
En la clase de educación física haremos equipos de 4 personas ¿cuántos equipos podremos hacer si
somos 40 personas?
¿Necesitamos pintar un salón y para hacerlo debemos comprar 3 botes de pintura con el fin de
cubrir todas las paredes, en la tienda de pintura tienen problemas con el proveedor y solo hay 7
botes, no importa de qué color quedan las paredes, ‘cuantas mezclas pueden hacer?
38
Grafica de puntos
Es una representación gráfica de datos que usualmente nos representan con un dibujo o patrones
determinados, estas estructuras de datos relacionan toda la información.
GRAFICO DE PUNTOS: son útiles para mostrar datos cuantitativos de una forma organizada, usan
varios puntos para representar los datos a lado de eje ordinal, es similar a un gráfico de líneas.
Ósea se crea visualizando un campo de cadena de caracteres en el eje “Y” y de un campo numérico
índice con una estadística en el eje “x” y cada valor de la categoría se representa mediante un punto
individual.
Ej: La edad de 14 niños es representada con el siguiente listado para obtener el rango de edades:
7,5,9,5,7,7,6,9,9,9,10,12,12,7.
Edad Frecuencia
5 2
6 1
7 4
8 0
9 4
10 1
11 0
12 2
39
Ej: Teniendo los siguientes datos realiza la tabla de puntos:
0=6 11=4
1=2 12=1
2=3
3=5
4=2
5=5
6=0
7=0
8=2
9=3
10=7
¿Cuál es la media de la tabla?
¿de estos todos cual es el que mas se repite?
¡cual es el rango de estos datos?
¿Cuántos datos tenemos menos que 5?
Ej: En colegio se preguntan a los estudiantes que cuantos programas ven el fin de semana. El
resultado es:
4 programas con las siguientes respuestas: 12,9,5,7.
Programas Frecuencia
1 12
2 9
3 5
4 7
40
En una encuesta se pregunto cuanto tiempo se toman las personas para desayunar…Datos:
Minutos: 9,10,11,12,13,14,15
Personas:2,7,4,1,7,6,5
(representar con la grafica de puntos).
Algunas personas no tienen acceso a la electricidad. Se realizo una encuesta de muchos países con
los siguientes resultados:
Pais Acceso a electricidad(%) Poblacion
Abgelia 99.4%
Angola 37.8%
Argentina 97.2%
Peru 99.4%
Venezuela 59.6%
41
Diagrama de caja
Es un diagrama utilizado para representar una variable cuantitativa está herramienta nos permite
realizar a través de los cuartiles y como está distribuida su grado de asimetría sus valores estaremos
la posición de media…etc se consideran como gráficas de caja o bigote.
● Rectángulo delimitado por el primer y tercer cuartil (Q1, Q3) dentro de la caja una línea indica
dónde se encuentra la media (Q2).
● Dos brazos uno donde empieza y acaba en el mínimo(menor dato) y el otro que empieza en
el Q3 (cuartil) y termina en el elemento máximo.
● Los datos atípicos que son los valores distintos que no cumplen ciertos requisitos
heterogeneidad de los datos
Pasos
1. Ordenar los datos
4. Se calculan los límites admisión inferior y superior (Liy La). Para limitar las variables extremas.
Li-Q1-1.5•QR
Ls-Q3+1.5•QR
Los límites marcarán los datos de la variable, dónde los puntos que sean menores Li (X<Li) o mayores
que Ls (X>Ls) son valores extremos que no están en el intervalo.
42
Ejemplo: El dueño de un restaurante desea saber más acerca de los lugares de origen de sus clientes,
un día decidió recolecta información acerca de los distintos que en millas recorría la gente para
llegar así restaurante la gente responde las siguientes distancia:
14,6,3,2,4,15,11,8,1,7,2,1,3,4,10,22,20 el quiere crear un gráfica que el permita poner el rango de la distancia y
la mediana de sus clientes recorren (gráfica de caja o bigote)
Mi 1
Q1 2.5
Q2 6
Q3 12.5
Max 22
Mi 6
Q1 7
Q2 9
Q3 11
Max 12
Representante los siguientes datos utilizando el diagrama de caja: 2,4,6,6,7,8,8,9,10,12
Mi 2
Q1 6
Q2 8
Q3 9
Max 12
43
Grafica la caja con los datos de forma vertical: 10,20,30,40,50,60,70,80,90
Mi 10
Q1 25
Q2 50
Q3 75
Max 90
44
Gráfica histograma
Es la representación de un grupo estadístico agrupado en intervalos numéricos o en función de los
valores absolutos.
Este gráfico permite como se distribuyen los datos de una muestra estadística
O población todo esto al respecto de una variable numérica. En el histograma se utilizan barras
cuyas altura depende de la frecuencia de los datos que corresponde al eje y por lo tanto en eje X
observamos la variable del estudio por lo tanto debemos recordar en estadística la frecuencia es la
cantidad de que se repite un suceso de los elementos.
Ejemplo
Supongamos que tenemos los siguientes datos de un salón de universidad, el dato estadístico será de
la estatura de los estudiantes.
Estatura fi/fn
-1.50 2
1.50-1.60 12
1.60-1.70 20
1.70-1.80 22
1.80-1.90 10
>1.90 2
45
DIAGRAMA DE SECTORES
Sirve para representar datos estadísticos que quedan representados en forma de sectores cada
dato queda representado en un sector el cual es proporcionado
Se puede usar para un determinado grupo de datos.
Una ves que tenemos la frecuencia debemos calcular el ángulo correspondiente a cada dato, a
mayor frecuencia el sector será mas alto y a menor frecuencia el sector será mas bajo.
FÓRMULA:
F=frecuencia, N=numero de datos, 360˚=el total del círculo o suma de los sectores
Los ángulos nos sirven para calcular el porcentaje (%)
FÓRMULA:
Ejemplo #1
Realiza un diagrama de sectores de los siguientes datos no agrupados:
1,1,3,3,1,4,5,5,2,4,2,3,2,4,2
#2
Datos agrupados al tiempo que tardan unos alumnos en minutos de su casa al colegio
Tiempo # de
minutos alumnos
0-5 2
5-10 11
10-15 13
15-20 6
20-25 3
25-30 1
46
#3
En una clase de 30 alumnos: 12 juegan baloncesto, 3 natación, 9 futbol y el resto no hacen deporte
#4
Se realiza una encuesta a los alumnos de 2do frado para saber cuales son los libros que más les
gusta leer para poder engrandecer la biblioteca con nuevos libros: a 3 les gusta la poesía,24 el terror,
30 las aventuras, 21 el misterio y 12 el teatro
¿A cuántos se les realizo la encuesta?
¿Cuántos prefieren el terror?
¿Cuáles son los que más les gustan?
47
DISTRIBUCION MARGINAL
La probabilidad marginal le permite obtener probabilidades totales. Es cuando nos interesa conocer
la distribución un componente por separado. Sin tener en cuenta a otro componente a esta variable
se le llama distribución marginal.
Ejemplo #1
Si tenemos un estudio del tiempo de minutos en que un estudiante se dedica a estudiar para una
prueba de 0 a 60 y tenemos sus calificaciones de 0 a 100, con la siguiente tabla ¿cuál sería su
distribución marginal?
#2
Cuál es la distribución marginal entre hombres y mujeres de acuerdo a la siguiente tabla de acuerdo
a sus calificaciones.
10-2.5 2.5-5 5-7.5 7.5-10
Hx 3 12 6 15 =36
My 5 20 10 25 =60
=8 =32 =16 =40 =96
48