Clase 6
Clase 6
Clase 6
De acuerdo a Tukey (1977), El análisis exploratorio de datos (EDA), según unos, nueva rama
de la estadística, según otros, una extensión de la estadística descriptiva, propugna un cambio
de actitud y de enfoque metodológico ante el análisis de datos.
El EDA propugna que previo a cualquier análisis estadístico, es necesario un examen
cualitativo de los datos, hay que comprender y reflexionar sobre la información que ellos
contienen.
La estadística descriptiva clásica se ocupa de describir los datos a través de gráficos y de
algunas medidas de tendencia central y de dispersión.
El EDA tiene los mismos objetivos pero además pretende detectar anomalías o errores en las
distribuciones univariantes de los datos. También intenta descubrir patrones o modelos.
El EDA potencializa los índices de forma, y la utilización de gráficos, prácticamente, como
un índice más, una gráfica bien realizada puede ser mas informativa que un conjunto de
números.
Sirven para:
- Evaluar la calidad y consistencia de la información
- Investigar la distribución de las variables de interés.
- Investigar adherencia a las suposiciones estadísticas necesarias, en etapas posteriores
del análisis.
- Resumir información mediante diferentes estadísticos y gráficos.
Cómo se Construye?
Los valores del tallo se escriben hacia abajo
en columna y los valores hoja van a la
derecha en fila de los valores del tallo.
En Resúmen:
En los dos cuadros: determinar cuales son los números de la serie:
Boxplot:
El nombre original del gráfico introducido por Jhon Tukey en 1977 es Box and
whisker plot, es decir, diagrama de caja y bigote. En efecto, el gráfico consiste
en un rectángulo (caja) de cuyos lados superior e inferior se derivan
respectivamente, dos segmentos: uno hacia arriba y uno hacia abajo (bigotes).
La caja y los bigotes están ubicados paralelos a un eje rotulado, que en este caso
está en la escala del 1 al 5 e indica el puntaje obtenido en una pregunta según la
opinión de los estudiantes que llenaron el instrumento de opinión.
1.-Límite superior: Es el extremo superior del bigote. Las opiniones por encima
de este límite se consideran atípicas.
2.-Tercer cuartil (Q3): Por debajo de este valor se encuentran como máximo el
75% de las opiniones de los estudiantes.
3.-Mediana: Coincide con el segundo cuartil. Divide a la distribución en dos
partes iguales. De este modo, 50% de las observaciones están por debajo de la
mediana y 50% está por encima.
4.-Primer cuartil (Q1): Por debajo de este valor se encuentra como máximo el
25% de las opiniones de los estudiantes
5.-Límite inferior: Es el extremo inferior del bigote. Las opiniones por debajo
de este valor se consideran atípicas.
6.-Valores atípicos: Opiniones que están apartadas del cuerpo principal de datos.
Pueden representar efectos de causas extrañas, opiniones extremas o en el caso de
la tabulación manual, errores de medición o registro.
7.-Media aritmética: Es lo que tradicionalmente se conoce como promedio.
Originalmente no forma parte del boxplot, sin embargo, se consideró su inclusión
para dar una idea del puntaje general obtenido por pregunta. Actualmente se
trabaja en la elaboración de estadísticos más representativos que la media
aritmética para describir el conjunto de datos.
Ejemplo:
Sobre la construcción de los límites y los valores atípicos.
Tukey (1997) sugiere una regla sencilla para determinar los límites de los bigotes. Tomando
en cuenta que el Rango Intercuartílico (RI) es la diferencia entre el Tercer y el Primer Cuartil,
tenemos que existen límites interiores y límites exteriores.
MUESTREO
Inferencia Estadística:
La distribución es la distribución de un
estadístico a lo largo
muestral........ de un infinito
número de muestras
https://slideplayer.es/slide/4148529/
DISTRIBUCION DE MUESTREO
Lista de Empleados
N = Población del estudio
n = Número de elementos en la muestra
Muestra aleatoria
de tamaño n
Ejemplo:
n = Número de elementos en la
muestra Lista de Empleados
Estratos
Deseamos n = 20
• Ω1: {1,2,3,4,5,6}
• Para el lanzamiento de una moneda dos veces, el espacio muestral es:
• Ω2: {(C,C);(C,S);(S,C);(S,S)}
Sucesos ó Eventos
• Subconjunto de un espacio muestral.
• A los sucesos normalmente se los denota por letras mayúsculas, tales como
A, B, C, etc.
• Ejemplo
• A= en los dos lanzamientos sale por lo menos una cara.
• Ω2: {(C,C);(C,S);(S,C);(S,S)}
A: {(C,C);(C,S);(S,C)}
Sucesos elementales.
- Son los resultados posibles del experimento, tal que:
1º) Siempre ocurre alguno de ellos.
2º) Son mutuamente excluyentes.
• Ejemplo
Al lanzar un dado:
{1,1},{1,2},{1,3}…,{4,6},{5,6},{6,6}
Suceso Seguro:
Ejemplo
Al lanzar un dado:
A={1,2,3,4,5,6}
Sucesos Imposible:
Ejemplo
A=Ф={ }
Es la medida de incertidumbre que asociamos a los sucesos del espacio
muestral.
Es un valor numérico que representa la oportunidad o posibilidad de que
un evento en particular ocurra.
Pr ob a b il id ad Ob jet i v a .
• Clásica o a Priori.
• Axiomático.
P r obabi l i dad Su bjet i v a .
Desventajas:
• Son difíciles de defender cuando son puestas en
duda.
• Difícil de identificar los sesgos del informante.
• Sea el suceso o evento A del espacio muestral (Ω); la probabilidad de A
denotada por P(A) es la razón entre el número de resultados favorables al
suceso A y el número total de resultados del espacio muestral (casos posibles).
Ejemplo 01: Determinar la probabilidad de obtener un número par, cuando se tira un dado.
Experimento Aleatorio:
Ω= {1,2,3,4,5,6} n(Ω)= 6
𝟑
Suceso A: 𝑷 = = 𝟎. 𝟓𝟎 ≠ 𝟓𝟎%
𝟔
A = Lanza un dado y que salga un número par: A = { 2, 4, 6}
n(A )= 3
Ejemplo 02: Determinar la probabilidad de obtener un número par mayor a cuatro, cuando
se tira un dado.
Ejemplo 03: Determinar la probabilidad de obtener un número par mayor o igual a cuatro,
cuando se tira un dado.
Ejemplo 03: Determinar la probabilidad de obtener un número par menor a tres, cuando se
tira un dado.
Ejemplo 04:
• Si se lanza una moneda tres veces . ¿Cuál es la probabilidad de …?
Obtener exactamente dos caras
n(A )= 3 𝟑
𝑷 = = 𝟎. 𝟑𝟕𝟓 ≠ 𝟑𝟕. 𝟓%
𝟖
Obtener al menos dos caras
𝟒
n(A )= 4 𝑷 = = 𝟎. 𝟓𝟎 ≠ 𝟓𝟎%
𝟖
No obtener ninguna cara
n(A )= 1 𝟏
𝑷= = 𝟎. 𝟏𝟐𝟓 ≠ 𝟏𝟐. 𝟓%
𝟖
Experimento Aleatorio:
Ω=
n(Ω)= 8
Ejemplo:
1.- La probabilidad de un suceso A es un valor comprendido entre cero y uno.
0 P (A) 1
2.- La probabilidad del suceso seguro E, que ocurre siempre, es uno.
P (E) = 1
3.- Si A y B son sucesos mutuamente excluyentes y los unimos, la probabilidad del
suceso compuesto por esa unión es igual a la suma de las probabilidades de
A y de B.
P (A+B) = P (A) + P (B)