Estadistica
Estadistica
Estadistica
Variable Aleatoria
Una variable aleatoria es una función que asigna un valor, usualmente numérico, al
resultado de un experimento aleatorio. Por ejemplo, los posibles resultados de tirar un dado
dos veces: (1, 1), (1, 2), etc. o un número real (p.e., la temperatura máxima medida a lo
largo del día en una ciudad concreta).
Los valores posibles de una variable aleatoria pueden representar los posibles resultados
de un experimento aún no realizado, o los posibles valores de una cantidad cuyo valor
actualmente existente es incierto (p.e., como resultado de medición incompleta o
imprecisa). Intuitivamente, una variable aleatoria puede tomarse como una cantidad cuyo
valor no es fijo pero puede tomar diferentes valores; una distribución de probabilidad se usa
para describir la probabilidad de que se den los diferentes valores. En términos formales
una variable aleatoria es una función definida sobre un espacio de probabilidad.
Valor Esperado
Si X es una variable aleatoria que toma valores {x1, x2, x3,…xn} y sea p(x) la función de
probabilidad de esta variable, entonces la esperanza se calcula como:
E(x)=x1∙P(x1)+x2∙P(x2)+⋯+xn∙P(xn)
Varianza
La Varianza (o Variancia) es una medida estadística de la dispersión (variabilidad) que
se define como la media aritmética del cuadrado de las desviaciones de las muestras
respecto a la media. La Varianza se representa mediante el símbolo griego sigma al
cuadrado (σ2) .
Valor Esperado
Para una variable aleatoria absolutamente continua, la esperanza se calcula mediante la
integral de todos los valores y la función de densidad f(x):
:
Varianza
Es, por tanto, el promedio teórico de las desviaciones cuadráticas de los diferentes
valores que puede tomar la variable respecto de su valor medio teórico o esperanza.
Distribución Discreta
Una distribución discreta describe la probabilidad de ocurrencia de cada valor de una
variable aleatoria discreta. Una variable aleatoria discreta es una variable aleatoria que tiene
valores contables, tales como una lista de enteros no negativos.
Características:
Binominal
Binomial negativa
Es una distribución de probabilidad discreta que incluye a la distribución de Pascal.
Es una ampliación de las distribuciones geométricas, utilizada en procesos en los cuales
se ve necesaria la repetición de ensayos hasta conseguir un número de casos favorables
(primer éxito).
Ejemplo:
Si la probabilidad de que un niño expuesto a una enfermedad contagiosa la contraiga es
0,40, ¿Cuál es la probabilidad de que el décimo niño expuesto a la enfermedad sea el
tercero en contraerla?
En este caso, X es el número de niños expuestos a la enfermedad hasta encontrar el tercero
en contraer la enfermedad.
La solución es:
Geométrica
En teoría de probabilidad y estadística, la distribución geométrica es cualquiera de las
dos distribuciones de probabilidad discretas siguientes:
Hipergeométrica
En teoría de la probabilidad la distribución hipergeométrica es una distribución discreta
relacionada con muestreos aleatorios y sin reemplazo. Suponga que se tiene una población
de N elementos de los cuales, d pertenecen a la categoría A y N-d a la B. La distribución
hipergeométrica mide la probabilidad de obtener x (0≤x≤d) elementos de la categoría A en
una muestra sin reemplazo de n elementos de la población original.
Poisson
Es una distribución de probabilidad discreta que expresa, a partir de una frecuencia
de ocurrencia media, la probabilidad de que ocurra un determinado número de eventos
durante cierto período de tiempo. Concretamente, se especializa en la probabilidad de
ocurrencia de sucesos con probabilidades muy pequeñas, o sucesos "raros".
Ejemplo:
Si el 2% de los libros encuadernados en cierto taller tiene encuadernación defectuosa,
para obtener la probabilidad de que 5 de 400 libros encuadernados en este taller tengan
encuadernaciones defectuosas usamos la distribución de Poisson. En este caso
concreto, k es 5 y, λ, el valor esperado de libros defectuosos es el 2% de 400, es decir, 8.
Por lo tanto, la probabilidad buscada es:
❑ 2
❑ PA =π r
Distribución Continua
Una distribución continua describe las probabilidades de los posibles valores de una
variable aleatoria continua. Una variable aleatoria continua es una variable aleatoria con
un conjunto de valores posibles (conocido como el rango) que es infinito y no se puede
contar.
Características:
Es generada por una variable continua (x). Es una variable que puede tomar tanto
valores enteros como fraccionarios.
Las probabilidades asociadas a cada uno de los valores que toma x deben ser
mayores o iguales a cero. Dicho de otra forma, la función de densidad de
probabilidad deberá tomar solo valores mayores o iguales a cero.
La sumatoria de las probabilidades asociadas a cada uno de los valores que toma x
debe ser igual a 1. El área definida bajo la función de densidad de
probabilidad deberá ser de 1.
Aplicación: puede describir la distribución del peso de hombres adultos. Por ejemplo,
usted puede calcular la probabilidad de que un hombre pese entre 160 y 170 libras.
Gamma
La distribución gamma es una distribución continua que se define por sus
parámetros de forma y escala. La distribución gamma de 3 parámetros se define por sus
parámetros de forma, escala y valor umbral.
Ejemplo: ingresos familiares, edad del hombre en contraer matrimonio por primera
vez, flujos máximos
Beta
La distribución beta es posible para una variable aleatoria continua que toma valores
en el intervalo [0,1], lo que la hace muy apropiada para modelar proporciones. La
distribución beta es posible para una variable aleatoria continua que toma valores en el
intervalo [0,1], lo que la hace muy apropiada para modelar proporciones.
Ejemplo: proporción de horas que duerme un individuo o la proporción de cierto
elemento de un compuesto químico.
Log-normal
Es una distribución de probabilidad de una variable
aleatoria cuyo logaritmo está normalmente distribuido. Es decir, si X es una variable
aleatoria con una distribución normal, entonces exp(X) tiene una distribución log-normal.
La base de una función logarítmica no es importante, ya que log a X está distribuida
normalmente si y solo si logb X está distribuida normalmente, solo se diferencian en un
factor constante.
Ejemplo: En la hidrología, se utiliza la distribución log-normal para analizar variables
aleatorias como valores máximos de la precipitación y la descarga de ríos, y además para
describir épocas de sequía
T de Student
Es una distribución de probabilidad que surge del problema de estimar la media de
una población normalmente distribuida cuando el tamaño de la muestra es pequeña.
Aparece de manera natural al realizar la prueba t de Student para la determinación de las
diferencias entre dos varianzas muestrales y para la construcción del intervalo de
confianza para la diferencia entre las partes de dos poblaciones cuando se desconoce
la desviación típica de una población y esta debe ser estimada a partir de los datos de una
muestra.
Ejemplo: El test de posición de muestra única por el cual se comprueba si la media de una
población que se conoce posee una distribución normal, tiene un valor especificado en
una hipótesis nula.
Chi Cuadrada
En estadística, la distribución de Pearson, llamada también ji cuadrada(o) o chi
cuadrado(a) (χ²), es una distribución de probabilidad continua con un parámetro que
representa los grados de libertad de la variable aleatoria