Estadistica Inferencial

Está en la página 1de 13

Nombre:

Apellido:
Ing: Chicnader Enzon Xavier
Curso: Tercero
Paralelo:” A”
Materia: Estadística inferencial
Tarea investigativa
Realizar un resumen de los siguientes temarios:

a) Pruebas de hipótesis de una muestra.

Una prueba de hipótesis es una regla que especifica cuando se puede aceptar o
rechazar una afirmación sobre una población dependiendo de la evidencia
proporcionada por una muestra de datos.

Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la
hipótesis nula y la hipótesis alternativa. La hipótesis nula es la afirmación que se
está comprobando.

Normalmente la hipótesis nula es una afirmación de "sin efecto" o "sin diferencia".


La hipótesis alternativa es la afirmación que se desea ser capaz de concluir que es
verdadera basándose en la evidencia proporcionada por los datos de la muestra.

Basándose en los datos de la muestra, la prueba determina cuando rechazar la


hipótesis nula. Se utiliza un p-valor, para realizar esa determinación. Si el p-valor
es menos que el nivel de significación (conocido como α o alfa), entonces se
puede rechazar la hipótesis nula.

Un error común suele ser que las pruebas de hipótesis estadísticas están
diseñadas para seleccionar la más probable de dos hipótesis. Sin embargo, al
diseño una prueba de hipótesis, se configura la hipótesis nula como la que se
quiere rechazar. Dado que se fija que el nivel de significación sea pequeño antes
del análisis (normalmente, un valor de 0.05 funciona correctamente), Cuando se
rechaza la hipótesis nula, se tiene una prueba estadística de que la alternativa es
cierta. Por el contrario, si no se rechaza la hipótesis nula, no se tiene prueba
estadística de que la hipótesis nula sea cierta. Esto es debido a que no se ha
fijado la probabilidad de que se acepte falsamente que la hipótesis nula sea
pequeña.

. (1) Que es una hipótesis


Es decir, una hipótesis es una afirmación que puede o no ser cierta. Sin embargo, se
formula en base a un indicio o a una serie de hechos, a los cuales se puede añadir
determinados supuestos.

La hipótesis puede fundamentarse en la evidencia científica o un conjunto de argumentos


que cuenten con sustento. De otro modo, no tendría sentido iniciar un trabajo de análisis al
respecto.

Cabe destacar que la hipótesis es un elemento esencial en el método científico, pues se


parte de una hipótesis para, a través de la experimentación, comprobarla o refutarla.

Vale aclarar, sin embargo, que el uso de las hipótesis no solo se enmarca en el contexto
académico, sino en el ámbito cotidiano. Por ejemplo, si un grupo de amigos queda para
reunirse en una cafetería y uno está tardando en llegar, los que ya se encuentran
congregados podrían lanzar hipótesis de lo que podría haber pasado (un accidente, tráfico
vehicular inesperado, la persona decidió a último minuto que no iba a asistir, etc).

Características de las hipótesis

Las hipótesis deben de reunir las siguientes características generales:

• Las variables con las que se quiere probar una hipótesis deben de ser reales y tener
relación con dicha hipótesis. Por ejemplo, volviendo al ejemplo de la quedada
entre amigos, si un amigo se retrasa o no aparece, el motivo no puede tener
relación con que haya habido un incendio en el pueblo de al lado de la ciudad en la
que vive.
• Para que una hipótesis sea probada debe de estar fundamentada en circunstancias
que puedan ser observadas y no sean fruto de la imaginación.
• Las variables sobre las que se fundamenta una hipótesis deben de poder ser
cuantificadas y estudiadas.
• Cuanta más variables contemple una hipótesis, mayor será la dificultad para
probarla.
• Las hipótesis deben de poder ser tanto aprobadas como rechazadas, si sólo
contemplan una de estas opciones, no puede ser consideradas hipótesis.
Tipos de hipótesis

Según la manera en la que fue formulada, una hipótesis puede ser:

• Inductiva: Resulta de un proceso de análisis que va de lo particular (un caso


concreto) a lo general. Por ejemplo, si a la llegada de un turista a una ciudad una
persona se da cuenta de que los bares y restaurantes cierran puntual a las 12 am,
puede sugerir como hipótesis que existe una ley que ordena el cierre de dichos
locales a partir de la medianoche.
• Deductivas: Son aquellas que se estudian mediante el método deductivo, es decir,
cuando se va de lo general (como leyes o principios) a lo particular (la realidad de
un caso concreto). Por ejemplo, sabemos que no existen vuelos directos entre
Madrid e Iquitos en Perú. Entonces, si Mariana nos cuenta que viajó el mes pasado

• desde Madrid hasta Iquitos, la hipótesis más razonable es que en el trayecto (vía
aérea) haya hecho escalas.
• Analógicas: Parten de comparaciones. Por ejemplo, Marco viajó ocho horas en bus
desde Madrid hasta Barcelona, parando dos veces durante el trayecto. Entonces,
meses después, si un amigo le cuenta que hará la misma ruta, Marco pensará que
durante dicho viaje también harán un par de paradas.

Por otro lado, los tipos de hipótesis respecto a su alcance pueden ser:

•Generales: Son aplicables para todos los casos involucrados. Se dividen en:
o Universales: Son planteamientos para todo el universo estudiado. Por
ejemplo, la hipótesis de que una enfermedad podría haberse transferido de
animales a personas.
o Probabilísticas: Se expresan como una posibilidad o como un porcentaje.
Por ejemplo, si, en base a los datos históricos, se espera que la gran
mayoría de los alumnos de secundaria aprueben el curso de geografía.
• Particulares: Aplican para un caso singular. Por ejemplo, cuando planteo como
hipótesis que Carlos se contagió de gripe porque su padre, que vive con él, había
estado también con gripe unos días antes.

Hipótesis en estadística

En estadística, tenemos dos tipos de hipótesis:

• Hipótesis nula: Es la afirmación que el investigador pretende rechazar.


• Hipótesis alternativa: Es la conclusión a la que el investigador quiere llegar.
Nos quedarán estos conceptos más claros con el siguiente ejemplo.

¿Cómo se formula una hipótesis?

Antes de poder formular ninguna hipótesis el investigador o investigadores deben de llevar


a cabo un proceso de documentación. A lo largo de este proceso, deberán de recopilar
información para poder extraer las conclusiones que se tomarán como hipótesis.

Una vez recogida la información necesaria, será estudiada para plantear cuáles son los
motivos que han causado que se produzca dicha situación. Por ejemplo, si queremos saber
por qué los embalses de una comarca se encuentran al 50%, tendremos que obtener datos
acerca de las lluvias a lo largo del año, de la evolución del regadío, del consumo de los
hogares, etc.

Por último, en función a estos datos, se plantearán las hipótesis correspondientes para
intentar probarlas.

(2) Que es la prueba de hipótesis


Una prueba de hipótesis es una regla que especifica si se puede aceptar o rechazar
una afirmación acerca de una población dependiendo de la evidencia
proporcionada por una muestra de datos.

Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la
hipótesis nula y la hipótesis alternativa. La hipótesis nula es el enunciado que se
probará. Por lo general, la hipótesis nula es un enunciado de que "no hay efecto" o
"no hay diferencia". La hipótesis alternativa es el enunciado que se desea poder
concluir que es verdadero de acuerdo con la evidencia proporcionada por los datos
de la muestra.

Con base en los datos de muestra, la prueba determina si se puede rechazar la


hipótesis nula. Usted utiliza el valor p para tomar esa decisión. Si el valor p es
menor que el nivel de significancia (denotado como α o alfa), entonces puede
rechazar la hipótesis nula.

Un error común de percepción es que las pruebas estadísticas de hipótesis están


diseñadas para seleccionar la más probable de dos hipótesis. Sin embargo, al
diseñar una prueba de hipótesis, establecemos la hipótesis nula como lo que
queremos desaprobar. Puesto que establecemos el nivel de significancia para que
sea pequeño antes del análisis (por lo general, un valor de 0.05 funciona
adecuadamente), cuando rechazamos la hipótesis nula, tenemos prueba estadística
de que la alternativa es verdadera. En cambio, si no podemos rechazar la hipótesis
nula, no tenemos prueba estadística de que la hipótesis nula sea verdadera. Esto se
debe a que no establecimos la probabilidad de aceptar equivocadamente la
hipótesis nula para que fuera pequeña.

Entre las preguntas que se pueden contestar con una prueba de hipótesis están las
siguientes:

• ¿Tienen las estudiantes de pregrado una estatura media diferente de 66 pulgadas?


• ¿Es la desviación estándar de su estatura igual a o menor que 5 pulgadas?
• ¿Es diferente la estatura de las estudiantes y los estudiantes de pregrado en
promedio?
• ¿Es la proporción de los estudiantes de pregrado significativamente más alta que la
proporción de las estudiantes de pregrado?

(3) Prueba de significancia de una y de dos colas


En las pruebas de significación estadística, una prueba de una cola y una prueba
de dos colas son formas alternativas de calcular la significación estadística de
un parámetro inferido de un conjunto de datos, en términos de una estadística de
prueba . Una prueba de dos colas es apropiada si el valor estimado es mayor o
menor que un cierto rango de valores, por ejemplo, si un examinado puede
obtener una puntuación por encima o por debajo de un rango específico de
puntuaciones. Este método se utiliza para nulas. Pruebas y si el valor estimado
existe en las áreas críticas, se acepta la hipótesis alternativa sobre la hipótesis
nula. Una prueba de una cola es apropiada si el valor estimado puede desviarse
del valor de referencia en una sola dirección, izquierda o derecha, pero no en
ambas. Un ejemplo puede ser si una máquina produce más del uno por ciento de
productos defectuosos. En esta situación, si el valor estimado existe en una de las
áreas críticas unilaterales, dependiendo de la dirección de interés (mayor o menor
que), se acepta la hipótesis alternativa sobre la hipótesis nula. Los nombres
alternativos son de un solo lado y de dos lados pruebas; la terminología "cola" se
utiliza porque las porciones extremas de las distribuciones, donde las
observaciones conducen al rechazo de la hipótesis nula, son pequeñas y, a
menudo, "cola" hacia cero como en la distribución normal , coloreadas en amarillo
o "curva de campana", en la foto de la derecha y de color verde.
Las pruebas de una cola se utilizan para distribuciones asimétricas que tienen una
sola cola, como la distribución chi-cuadrado , que son comunes en la medición
de bondad de ajuste , o para un lado de una distribución que tiene dos colas,
como la normal. distribución , que es común en la estimación de la ubicación; esto
corresponde a especificar una dirección. Las pruebas de dos colas solo son
aplicables cuando hay dos colas, como en la distribución normal, y corresponden a
considerar cualquier dirección como significativa. [1] [2]

En el enfoque de Ronald Fisher , la hipótesis nula H 0 se rechazará cuando


el valor p del estadístico de prueba sea suficientemente extremo (en relación con
la distribución muestral del estadístico de prueba ) y, por lo tanto, se considere
improbable que sea el resultado del azar. Esto generalmente se hace comparando

el valor p resultante con el nivel de significancia especificado, denotado por , al


calcular la significación estadística de un parámetro . En una prueba de una cola,
"extremo" se decide de antemano como si significa "suficientemente
pequeño" o "suficientemente grande"; los valores en la otra dirección se
consideran no significativos. Se puede informar que la probabilidad de cola
izquierda o derecha como el valor p de una cola, que en última instancia
corresponde a la dirección en la que el estadístico de prueba se desvía de
H 0. [3] En una prueba de dos colas, "extremo" significa " ya sea suficientemente
pequeño o suficientemente grande ", y los valores en cualquier dirección se

consideran significativos. [4] Para una estadística de prueba dada, hay una única
prueba de dos colas y dos pruebas de una cola, una para cada dirección. Cuando

se proporciona un nivel de significancia , las regiones críticas existirían en los

dos extremos de la distribución con un área de cada uno para una prueba de
dos colas. Alternativamente, la región crítica existiría únicamente en el extremo de

una cola con un área de para una prueba de una cola. Para un nivel de
significancia dado en una prueba de dos colas para un estadístico de prueba, las
pruebas de una cola correspondientes para el mismo estadístico de prueba se
considerarán dos veces más significativas (la mitad del valor p ) si los datos están
en la dirección especificada por la prueba, o no es significativo en absoluto ( p -

valor anterior ) si los datos están en la dirección opuesta a la región crítica


especificada por la prueba.

(4) Pruebas de la media de una población


La prueba t de una muestra es una prueba de hipótesis estadística que se usa para establecer
si la media poblacional desconocida es diferente de un valor específico.
¿Cuándo puedo usar esta prueba?
Puede usar esta prueba en datos continuos. Sus datos deben ser una muestra aleatoria de
una población normal.

¿Y si mis datos no tienen una distribución próxima a la normal?


Si los tamaños de sus muestras son muy pequeños, es posible que no pueda hacer la prueba
de normalidad. Puede que deba basarse en su comprensión de los datos. Si no puede
suponer normalidad de forma segura, puede efectuar una prueba no paramétrica que no
asume la normalidad.
Uso de la prueba t de una muestra.

En las secciones a continuación comentamos qué necesitamos para efectuar la prueba,


cómo comprobar nuestros datos, cómo llevar a cabo la prueba, comprender sus resultados y
detalles estadísticos.

¿Qué necesito?

Para la prueba t de una muestra, necesitamos una variable.

También tenemos la idea, o hipótesis, de que la media poblacional tiene cierto valor. He
aquí dos ejemplos:

• Un hospital toma una muestra aleatoria de medidas de colesterol en hombres. Estos


pacientes están atendidos por problemas distintos al colesterol. No están bajo medicación
por colesterol alto. El hospital pretende averiguar si la media poblacional desconocida de
colesterol de sus pacientes es distinta del nivel objetivo de 200 mg.
• Medimos los gramos de proteínas en una muestra de barritas energéticas. La etiqueta
declara que las barritas tienen 20 gramos de proteína. Queremos averiguar si esto es
correcto o no.
Suposiciones de la prueba t de una muestra

Para realizar una prueba válida necesitamos valores que sean:


• Independientes (los valores no guardan relación entre sí).
• Continuos.
• Obtenidos de una muestra aleatoria de la población.
Además, se asume que la población tiene distribución normal.

Ejemplo de prueba t de una muestra

Imaginemos que tenemos una muestra aleatoria de 31 barritas energéticas de diferentes


tiendas para representar al conjunto de barritas energéticas disponibles para el consumidor
general. Las etiquetas de estas barritas sostienen que cada una contiene 20 gramos de
proteínas.

Tabla 1: Gramos de proteína en una muestra aleatoria de barritas energéticas

Barrita energética - Gramos de proteína

20,70 27,46 22,15 19,85 21,29 24,75

20,75 22,91 25,34 20,33 21,54 21,08

22,14 19,56 21,10 18,04 24,12 19,95


19,72 18,28 16,26 17,46 20,53 22,12

25,06 22,44 19,08 19,88 21,39 22,33 25,79

Si observa la tabla de arriba verá que algunas barritas tienen menos de 20 gramos de
proteínas. Otras tienen más. Podría suponer que los datos apoyan la idea de que las
etiquetas son correctas. Otros podrían discrepar. La prueba estadística ofrece un método
robusto para tomar la decisión, de manera que todas las personas tomen la misma decisión
partiendo del mismo conjunto de datos.

Comprobar los datos

Vamos a empezar por responder lo siguiente: ¿Es la prueba tde una muestra un método
adecuado para evaluar si estas barritas tienen 20 gramos de proteínas? La siguiente lista
repasa los requisites de la prueba.

• Los valores de datos son independientes. Los gramos de proteínas de una barrita no
dependen de los de ninguna otra. Un ejemplo de valores dependientes sería si
reuniéramos barritas de un mismo lote de producción. Una muestra de un mismo lote es
representativa de dicho lote, no de las barritas energéticas en general.
• Los valores de datos son gramos de proteína. Las medidas son continuas.
• Asumimos que las barritas suponen una única muestra aleatoria de la población de
barritas energéticas disponibles para el consumo general (por ejemplo, una mezcla de
multitud de barritas).
• Asumimos que la población de la que estamos tomando la muestra tiene una distribución
normal, y para muestras grandes podemos comprobar dicha suposición.

Decidimos que la prueba t es un método adecuado.

Antes de pasar al análisis, debemos echar un vistazo rápido a los datos. En la siguiente
figura se muestran histogramas y estadísticas de resumen de las barritas energéticas.
(5) Valor p en la prueba de hipótesis
Al probar hipótesis en las que la estadística de prueba es discreta, la región crítica se puede
elegir de forma arbitraria y determinar su tamaño. Si es demasiado grande, se
puede reducir al hacer un ajuste en el valor crítico. Puede ser necesario aumentar
el tamaño de la muestra para compensar la disminución que ocurre de manera
automática en la potencia de la prueba (probabilidad de rechazar H o dado que una
alternativa específica es verdadera).

Por generaciones enteras de análisis estadístico, se ha hecho costumbre elegir un


nivel de significancia de 0.05 ó 0.01 y seleccionar la región crítica en
consecuencia. Entonces, por supuesto, el rechazo o no rechazo estricto de
Ho dependerá de esa región crítica. En la estadística aplicada los usuarios han
adoptado de forma extensa la aproximación del valor P. La aproximación se

diseña para dar al usuario una alternativa a la simple conclusión de "rechazo" o


"no rechazo".

La aproximación del valor P como ayuda en la toma de decisiones es bastante


natural pues casi todos los paquetes de computadora que proporcionan el cálculo
de prueba de hipótesis entregan valores de P junto con valores de la estadística
de la prueba apropiada.

• Un valor P es el nivel (de significancia) más bajo en el que el valor


observado de la estadística de prueba es significativo.
• El valor P es el nivel de significancia más pequeño que conduce al rechazo
de la hipótesis nula Ho.
• El valor P es el mínimo nivel de significancia en el cual H o sería rechazada
cuando se utiliza un procedimiento de prueba especificado con un conjunto
dado de información. Una vez que el valor de P se haya determinado, la
conclusión en cualquier nivel particular resulta de comparar el valor P
con

1. Valor P  rechazar Ho al nivel .


2. Valor P >  No rechazar Ho al n ivel
(6) Prueba de la media poblacional
La prueba t de una muestra es una prueba de hipótesis estadística que se usa para establecer
si la media poblacional desconocida es diferente de un valor específico.

¿Cuándo puedo usar esta prueba?


Puede usar esta prueba en datos continuos. Sus datos deben ser una muestra aleatoria de
una población normal.

¿Y si mis datos no tienen una distribución próxima a la normal?


Si los tamaños de sus muestras son muy pequeños, es posible que no pueda hacer la prueba
de normalidad. Puede que deba basarse en su comprensión de los datos. Si no puede

suponer normalidad de forma segura, puede efectuar una prueba no paramétrica que no
asume la normalidad.
Uso de la prueba t de una muestra.

En las secciones a continuación comentamos qué necesitamos para efectuar la prueba,


cómo comprobar nuestros datos, cómo llevar a cabo la prueba, comprender sus resultados y
detalles estadísticos.

¿Qué necesito?

Para la prueba t de una muestra, necesitamos una variable.

También tenemos la idea, o hipótesis, de que la media poblacional tiene cierto valor. He
aquí dos ejemplos:

• Un hospital toma una muestra aleatoria de medidas de colesterol en hombres. Estos


pacientes están atendidos por problemas distintos al colesterol. No están bajo medicación
por colesterol alto. El hospital pretende averiguar si la media poblacional desconocida de
colesterol de sus pacientes es distinta del nivel objetivo de 200 mg.
• Medimos los gramos de proteínas en una muestra de barritas energéticas. La etiqueta
declara que las barritas tienen 20 gramos de proteína. Queremos averiguar si esto es
correcto o no.
Suposiciones de la prueba t de una muestra

Para realizar una prueba válida necesitamos valores que sean:

• Independientes (los valores no guardan relación entre sí).


• Continuos.
• Obtenidos de una muestra aleatoria de la población.
Además, se asume que la población tiene distribución normal.

(7) Pruebas relacionadas con proporciones


Cuando el objeto del muestreo es evaluar la validez de una afirmación con respecto a la
proporción de una población, es adecuado utilizar una prueba de una muestra. La

metodología de prueba depende de si el número de observaciones de la muestra es


grande o pequeño. Con muestras de más de 20 observaciones, la distribución normal es
aceptable; con tamaños más pequeños de muestras se deberá utilizar la distribución
binomial. En primer lugar, se considerará el caso de la muestra grande y después el de la
muestra pequeña. Como se habrá observado anteriormente, las pruebas de grandes
muestras de medias y proporciones son bastante semejantes. De este modo, los valores
estadísticos de prueba para ambos tipos miden la desviación de un valor estadístico de
muestra a partir de un valor propuesto. Y ambas pruebas se basan en la distribución
normal estándar para valores críticos. Quizá la única diferencia real entre las ambas radica
en la forma como se obtiene la desviación estándar de la distribución de muestreo.
PRUEBA DE PROPORCIONES DE k MUESTRAS La finalidad de una prueba de k muestras es
evaluar la aseveración que establece que todas las k muestras independientes provienen
de poblaciones que presentan la misma proporción de algún elemento. De acuerdo con
esto, las hipótesis nula y alternativa son H0: Todas las proporciones de la población son
iguales. H1: No todas las proporciones de la población son iguales. Considérese por
ejemplo el siguiente caso. Un centro comercial compró y plantó 720 bulbos de tulipán de
cuatro colores, para sus jardines: blancos 200
rojos 160
amarillos 240
morados 120
720

Por desgracia, no todos florecieron. El centro comercial quiere determinar si los “fracasos”
eran independientes del color (es decir, si todas las proporciones de la población son
iguales) antes de comprar más bulbos de tulipán. Cada color se puede considerar como
una población, y los bulbos de cada color, como una muestra de cada una de las
poblaciones. Los resultados muestrales (florecer respecto de no florecer) se pueden
obtener a partir de datos proporcionados por el jardinero. Los resultados han sido

ordenados en una tabla de 2 por k (2 x k): 2 filas y k columnas, una columna para cada
muestra. Las k muestras se listan en hileras, y los resultados muestrales en columnas

También podría gustarte