Qumio
Qumio
Qumio
“Herramientas
estadísticas aplicadas
en laboratorios de
ensayo” Docente:
Javier Rodríguez Calzado
• Definición de Estadística
Recopilar Presentar
Organizar
datos datos Analizar
datos
datos
Subdivisión de la estadística
Estadistica
Descriptiva Analítica
Media varianza
mediana Desviación estándar
Moda Máx.-mín
ESTADÍSTICA DESCRIPTIVA
CONCEPTOS
Población
parámetro
probabilidad inferencia
Estadístico
Muestra
(data)
CONCEPTOS
Continua
De razón
Cuantitativa
Discreta De intervalos
Variable
Nominal
Cualitativa
Ordinal
VARIABLES Y ESCALAS DE
MEDICIÓN
Variable Cuantitativa o Numérica
Característica de los individuos de la muestra que puede medirse
con un instrumento y lleva asociada una unidad de medida.
• Discreta: cuando no admiten siempre un valor intermedio
entre dos cualesquiera de sus valores.
• Continua: cuando admiten una modalidad intermedia entre
dos cualesquiera de sus modalidades, p.e. peso X de un niño
al nacer.
VARIABLES Y ESCALAS DE
MEDICIÓN
Variable Cualitativa
Característica que recoge una cualidad de los individuos de
la muestra. No puede medirse con un instrumento ni lleva
asociada una unidad de medida.
• Nominales: Si sus valores no se pueden ordenar
• Ordinales: Si sus valores se pueden ordenar
CONCEPTOS
Ejemplo:
Diagramas de barras
• Alturas proporcionales a las frecuencias
(absoluta o relativa)
• Se pueden aplicar también a variables
discretas
Pictogramas
• Fáciles de entender.
• El área de cada modalidad debe ser
proporcional a la frecuencia. ¿De los dos, cuál
es incorrecto?.
GRÁFICOS PARA VARIABLES
CUANTITATIVAS
Son diferentes en función de que las 400
419
375
Recuento
215
relativas. 200
127
100
Número de hijos
indicar los valores que no son
250
posibles
200
Recuento
• Histogramas para v. continuas 150
Um … bueno
... es ... ellos
son ...
ejem plos
ORGANIZACIÓN DE DATOS
6
Género Frec.
5
Hombre 4 4
2
Mujer 6 1
0
Hombre Mujer
TABLA DE DISTRIBUCIÓN DE
FRECUENCIAS
8
7
7
6
6
Frecuencia Absoluta
5
4
4
3
2
2
1
1
0
819.71 - 830.16 - 840.61 - 851.06 - 861.51 -
830.16 840.61 851.06 861.51 871.96
Peso de tabletas en mg (Intervalos de clase)
TABLA DE DISTRIBUCIÓN DE
FRECUENCIAS
VARIABLE CUANTITATIVA DISCRETA
¿Cuántos individuos tienen menos
de 2 hijos? Número de hijos
Porcent. Porcent.
• frec. Abs. sin hijos Frec. (válido) acum.
+ 0 419 27,8 27,8
1 255 16,9 44,7
frec. Abs. con 1 hijo 2 375 24,9 69,5 ≥50%
= 419 + 255 3 215 14,2 83,8
= 674 individuos 4 127 8,4 92,2
5 54 3,6 95,8
¿Qué porcentaje de individuos tiene 6 24 1,6 97,3
6 hijos o menos? 7 23 1,5 98,9
Ocho+ 17 1,1 100,0
• 97,3% Total 1509 100,0
¿Qué cantidad de hijos es tal que al
menos el 50% de la población tiene
una cantidad inferior o igual?
• 2 hijos
DISTRIBUCIÓN DE
FRECUENCIAS
Una vez colectados los datos, deben ser arreglados u
ordenados de tal manera que permita determinar con
rapidez los valores de las mediciones y otros aspectos
acerca de los datos. Para lo cual es necesario utilizar una
tabla de distribución de frecuencias y/o un gráfico que
describa adecuadamente las características más
importantes.
DISTRIBUCIÓN DE
FRECUENCIAS
Histogramas
Nos Permite inferir en el comportamiento de la población a través
de la gráfica de los datos colectados
HERRAMIENTAS INFORMÁTICAS
Ejemplo
MEDIDAS DE TENDENCIA
CENTRAL Y DE DISPERSIÓN
∑x i ∑x i
μ= i =1
x= i =1
N n
La Mediana (Me) Me = X n +1
Ejemplo: 2
Item (X) X1 X2 X3 X4 X5
Valor 32 41 52 55 59
Q1 Q2 Q3
∑ (x − x)
N n
∑ (x − μ)
2 2
i i
σ2 = i =1
s2 = i =1
N n -1
Desviación estándar
Coeficiente de variabilidad (CV)
MEDIDAS DE LOCALIZACIÓN
** *
Interpretación
La distribución de los datos puede ser:
• Asimétrica hacia la derecha, si Me está próxima a Q1.
• Asimétrica hacia la izquierda, si Me está próxima a Q3.
• Simétrica, si Me está al centro.
Si la caja es alargada, hay variabilidad en el conjunto de
datos.
Un dato se considera atípico si es mayor que el límite
superior o si es menor al límite inferior.
Función de distribución de
probabilidades
0.2
0.18
0.16
0.14
0.12
f(x)
0.1
0.08
0.06
0.04
0.02
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29
n
DISTRIBUCIÓN DE
PROBABILIDAD (DP)
f(x)
0.35
0.3
µ=5
0.25
σ = 1.2
0.2
0.15
0.1
0.05
0 Título del eje
0 1 2 3 4 5 6 7 8 9 10 11
DISTRIBUCIÓN NORMAL
Características:
de Ocurrencia
1,0 µ±1σ 68,3%
1,96 µ ± 1,96 σ 95% 0.242
Unidades mg
(x − µ)
Z=
σ
Estandarizado
unidades Z
DISTRIBUCIÓN NORMAL
VISUALMENTE:
• Histograma
• Box plot
• Gráfico en papel de probabilidad
• Gráfica de Frecuencia acumulativa
NUMÉRICAMENTE:
• Curtosis
• Asimetría
ESTADÍSTICOS:
• Kolmogorov-Smirnov
• Anderson Darling
• Shapiro-Wilk´s (Muestras < 30)
• Prueba de Lilliefors
INICIO
FLUJOGRAMA NORMALIDAD
Datos Orignales
Prueba de
Normalidad:
- AD
- RJ
- KS
Transformación Box-
Cox: Transfor
¿Tiene No - Raiz cuadrada No ¿Tiene No ¿Tiene No
Distribució Distribució mación Distribució
- Inverso 1/x
n Normal? n Normal? JOHNS n Normal?
- Logaritno
Neperiano ON
- Logaritmo base 10
SI SI SI
Pruebas Pruebas Pruebas
Paramétricas Paramétricas Paramétricas
Pruebas NO IDENTIFICAR EL
Paramétricas; TIPO DE
El distribucion al que
DISTRIBUCIÓN DE
se asemeja
PROBABILIDAD
ASOCIADO
FIN
PRUEBA DE NORMALIDAD O
BONDAD DE AJUSTE
71
AJUSTE DE DATOS CON OTRAS
DISTRIBUCIONES DE
PROBABILIDAD
MINITAB
DISTRIBUCIÓN MUESTRAL DE LA
MEDIA
https://www.youtube.com/watch?v=xZmFqLHIFJk
DISTRIBUCIÓN T DE STUDENT
n k n−k
P[ X = k ] = p q , 0 ≤ k ≤ n
k
Media: μ = n p Varianza: σ2 = n p q
DISTRIBUCIÓN BINOMIAL
Tipos de estimaciones
A) Estimación puntual
Ejemplo:
Para la evaluación de 20 unidades del lote, la media es
49,8 mg, el mejor estimador del verdadero valor de la
media del lote es 49,8 mg.
INFERENCIA ESTADÍSTICA …
= x ±Zo σ
√n
INFERENCIA ESTADÍSTICA …
LSC
µ Intervalo
x De Confianza
95%
LIC
1 2 3 4 5 6 7 8
Número de Muestras
Para un intervalo de confianza de 95 % 19 de 20 de tales
intervalos incluirán la verdadera media µ.
INFERENCIA ESTADÍSTICA …
x = ± Zo σ
√n
x-µ
pero Z =
σ -Z0 Z0
n
P − Z0 ≤ Z ≤ Z0 = 1−α
x−µ
P − Z 0 ≤ ≤ Z0 = 1−α
σx
σ σ
P x − Z0 ≤ µ ≤ x + Z0 = 1−α
n n
INFERENCIA ESTADÍSTICA …
IC = x± Z o σ / √n Zo = Z (α/2)
x
IC = ± Zo S / √n Zo = Z (α/2)
x
C. Cuando la σ2 es desconocida y muestra es pequeña (n<30)
IC = x± t o S / √n to = t (α/2, n-1)
INFERENCIA ESTADÍSTICA …
α/2
α/2
X21 X22
INFERENCIA ESTADÍSTICA …
IC (π) = p ± Zo p ( 1 – p) Zo = Z (α/2)
n
-Z0 Z0
INFERENCIA ESTADÍSTICA …
Intervalos de Confianza
PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS
Ho : µ = µ 0 Ho : µ ≤ µ 0 Ho : µ ≥ µ 0
H1 : µ ≠ µ 0 H1 : µ > µ 0 H1 : µ < µ 0
α/2 (1 - α) α/2
Zona de
Aceptación
-Z0 Z0
PRUEBA DE HIPÓTESIS …
α/2 (1 - α) α/2
Zona de
Aceptación
-Z0 Z0
PRUEBA DE HIPÓTESIS …
Zona de rechazo
Hp µ ≤ µo (1 - α)
si Hp es cierta α
Ha µ > µo
µo
PRUEBA DE HIPÓTESIS …
Tipos de prueba
a) Prueba bilateral o de dos extremos: la hipótesis
planteada se formula con la igualdad
Ejemplo
α/2 (1 - α) α/2
Hp : µ = 200 Zona de
Aceptación
Ha : µ ≠ 200
-Z0 Z0
PRUEBA DE HIPÓTESIS …
α
α (1 - α) (1 - α)
PRUEBA DE HIPÓTESIS …
p > α NO rechazar Ho
COMPARACIÓN DE
MEDIAS
COMPARACIÓN DE MEDIAS
Procedimiento:
1. Formulación de la Hipótesis
2. Nivel de significación (α)
3. Selección y cálculo de la prueba estadística
4. (Z, t, X2 ó F)
5. Regiones críticas
6. Desición estadítica
7. Conclusiones
8. Los supuestos son:
• la población está normalmente distribuida.
• la muestra ha sido seleccionada al azar.
PRUEBA DE UNA SOLA MEDIA …
Regiones críticas
Hp: µ = µo
Prueba bilateral
Ha: µ1 ≠ µo
α/2 (1 - α) α/2
Zona de Zona de Zona de
rechazo Aceptación rechazo
-Z0 Z0 Hp: µ ≤ µo
Prueba unilateral Ha: µ1 ≥ µo
α
Zona de Hp: µ ≥ µo
Aceptación Zona de
Ha: µ1 ≤ µo
(1 - α) rechazo
PRUEBA DE UNA SOLA MEDIA …
x -µ
Ζtcc =
σx
s /√n
CASO II: Comparación de dos medias independientes
Formulación de hipótesis
Prueba bilateral Prueba unilateral
Hp: µ1 − µ2 = µo Hp: µ1 − µ2 ≤ µo
Ha: µ1 − µ2 ≠ µo Ha: µ1 − µ2 ≥ µo
Hp: µ1 − µ2 ≥ µo
µ1 x
1 Ha: µ1 − µ2 ≤ µo
µ2 x
2
COMPARACIÓN DE DOS MEDIAS
INDEPENDIENTES
x1 − x 2
Zc =
s12 s22
+
n1 n2
COMPARACIÓN DE DOS MEDIAS
INDEPENDIENTES
(n1 − 1) s + (n2 − 1) s
2 2
s =
2 1 2
n1 + n2 − 2
p
COMPARACIÓN DE DOS MEDIAS
INDEPENDIENTES
F2 = F(1 - α/2, n1 - 1, n2 - 1)
α/2
α/2
Fc = s21
s 22
F1 F2
Prueba para la comparación de medias de muestras
relacionadas
Media muestral Media Hipotética
Estudios clínicos Cada paciente toma la droga en
diferentes momentos (estudio cruzado)
Cada paceinte toma cada droga
simultáneamente, p.e. un unguento es
aplicado a diferentes partes de un
mismo cuerpo.
Desarrollo analítico El mismo analista ensaya todas las
muestras
Cada laboratorio ensaya todas las
muestras en un estudio colaborativo
Cada método es aplicado a una muestra
homogénea
Estudios de estabilidad Ensayos en determinados tiempos del
mismo recipiente o envase
COMPARACIÓN DE MUESTRAS
RELACIONADAS
Formulación de hipótesis
Prueba bilateral Prueba unilateral
Hp: µ1 − µ2 = µo Hp: µ1 − µ2 ≤ µo
Ha: µ1 − µ2 ≠ µo Ha: µ1 − µ2 ≥ µo
Hp: µ1 − µ2 ≥ µo
Ha: µ1 − µ2 ≤ µo
Prueba estadística
HERRAMIENTAS INFORMÁTICAS
H o : µ1 = µ 2 = µ3 = ...
Donde µ1 es el promedio de un tratamiento
ANOVA es una técnica que separa la variabilidad total
en componentes:
SUPOSICIONES DEL ANOVA
Regla de decisión
Zona de
Aceptación
Ho
Zona de
Rechazo Ho
F tabla
ANOVA DE UNA VÍA
ANÁLISIS DE VARIANZA
Origen de Promedio de
Suma de Grados de Valor crítico
las los F Probabilidad
cuadrados libertad para F
variaciones cuadrados
Entre grupos 2.86666667 2 1.43333333 0.28330893 0.75549876 3.35413083
Dentro de los 136.6 27 5.05925926
Total 139.466667 29
LINEALIDAD E INTERVALO
LINEALIDAD E INTERVALO
RANGO
¿CÓMO PROBAR LA
LINEALIDAD?
Intercepto
y
y = bx + a
Pendiente
x
ESTADÍSTICA DE LA LINEALIDAD …
ŷ
Ecuación de recta: = bx +a
Excel como herramienta útil para graficar: Gráfico de
XY (Dispersión)
La pendiente (b) relacionada con la sensibilidad.
Intercepto (a) relacionada con el Error sistemático.
Coeficiente de correlación lineal de Pearson (r): es
útil para determinar si hay relación lineal entre dos
variables.
1. EL COEFICIENTE DE
CORRELACIÓN (R)
Se usa para medir la intensidad de la asociación entre
dos variables.
Coeficiente de correlación (r) > 0,999 n∑ xi yi − (∑ xi )(∑ yi )
r=
y determinación (r2) > 0,990
[n∑ x − (∑ x ) ][n∑ y − (∑ y ) ]
2
i i
2 2
i i
2
12
y = 43.211x - 78.897
10 R² = 0.9746
8
r=0.9872
Respuesta
y = 6.6197x - 9.5701
2 R² = 0.9809
r=0.9904
0
1.850 1.900 1.950 2.000 2.050 2.100
Log (Conc)
2. EVALUACIÓN DEL MRLS:
ANÁLISIS DE VARIANZA ANOVA:
1. Homogeneidad de Varianzas
negativos 5
Residuos
0
-15
•Los residuales tienen todos -20
valor absoluto
•Los residuales no muestran
tendencias
2. EVALUACIÓN DEL MRLS: RESIDUOS -
VALIDACIÓN DE SUPUESTOS ANÁLISIS DE
RESIDUALES
RESULTADOS
S yx2
3. EVALUACIÓN DE LA RECTA:
PRUEBA DE LINEALIDAD
lectura(respuesta ) sf
f = CV = *100
concentración f
b
texp = b ± t * Sb
Sb
3. EVALUACIÓN DE LA RECTA:
PRUEBA DE PROPORCIONALIDAD
texp =
a a ± t * Sa
Sa
a Sa
Inferior Superior
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%
95.0% 95.0%
Intercepción -0.99855413 4.304370996 -0.23198607 0.820160715 -10.2975823 8.30047404 -10.2975823 8.30047404
Variable X 1 10772.85111 20.12784363 535.2213237 1.27703E-29 10729.36755 10816.33467 10729.36755 10816.33467
b
Sb
COMPARACIÓN DE 2 RECTAS
REGRESIÓN
Cuando se compara una nueva metodología con uno tradicional,
es necesario comparar su comportamiento en la dosis respuesta.
Regresión Lineal Múltiple
Problemas: Linealidad de la dosis respuesta, Paralelismo de ambas
metodologías, Determinación de la concentración relativa
Recta A: Ya = αa + βa X
Recta B: Yb = αb + βb X
¿Las dos rectas tienen la misma pendiente? (hipótesis de
paralelismo): Ho: βa = βb
¿Las dos rectas tienen el mismo valor de origen?:
Ho: αa = αb
¿Las dos rectas coinciden?:
Ho: βa = βb = βT
Ho: αa = αb = α T
COMPARACIÓN DE 2 RECTAS
REGRESIÓN
Curso
“Herramientas
Estadísticas Aplicadas a
Laboratorios de Ensayo”