Trabajo Estadistica Inferencial FINAL
Trabajo Estadistica Inferencial FINAL
Trabajo Estadistica Inferencial FINAL
Integrantes:
- VEGA PONTE EDWIN GERMAN
Turno: NOCHE
2019- II
ÍNDICE
ÍNDICE ................................................................................................................................................... 2
1. INTRODUCCION .......................................................................................................................... 4
2. OBJETIVO DEL TRABAJO APLICADO .................................................................................... 5
3. MARCO TEORICO DEFINICIONES ......................................................................................... 5
3.1. Estadística...................................................................................................................................... 5
3.1.1. Estadística Descriptiva ......................................................................................................... 5
3.1.2. Estadística inferencial .......................................................................................................... 6
3.2. Población........................................................................................................................................ 6
3.3. Muestra ........................................................................................................................................... 6
3.4. Variable .......................................................................................................................................... 6
3.4.1. Tipos de variable ................................................................................................................... 6
3.4.1.1. Variables Numéricas: ....................................................................................................... 6
3.4.1.2. Variables Categóricas: ..................................................................................................... 7
3.5. Datos............................................................................................................................................... 7
3.5.1. Datos Internos: ...................................................................................................................... 7
3.5.2. Datos Externos: estos datos pueden ser de dos tipos: .................................................. 7
3.6. Presentación de Datos ................................................................................................................. 7
3.7. Experimento ................................................................................................................................... 8
3.8. Muestreo ........................................................................................................................................ 8
3.9. Métodos de Muestreo .................................................................................................................. 8
3.9.1. Censo...................................................................................................................................... 8
3.9.2. Población................................................................................................................................ 8
3.10. Medidas de Centralización .................................................................................................. 9
3.10.1. Media Aritmética. .............................................................................................................. 9
3.10.2. Mediana .............................................................................................................................. 9
3.10.3. La moda.............................................................................................................................. 9
3.11. Medidas de Variabilidad o Dispersión Absolutas............................................................. 9
3.11.1. Rango ................................................................................................................................. 9
3.11.2. Desviación Media ............................................................................................................ 10
3.11.3. Varianza: .......................................................................................................................... 10
3.11.4. Desviación típica o Standard: ....................................................................................... 10
4. CARACTERISTICAS DE BASE DE DATOS .......................................................................... 11
4.1 Población:........................................................................................................................... 11
4.2 Muestra: .............................................................................................................................. 11
4.3 Unidad de análisis: ........................................................................................................... 11
4.4 Variables: ........................................................................................................................... 11
Tipo de Variables:......................................................................................................................... 11
5. ELABORACIÓN DE TABLAS DE FRECUENCIA PARA CADA VARIABLE DE
ESTUDIO. ............................................................................................................................................ 12
5.1. Variable Cualitativa Nominal .............................................................................................. 12
5.2. Variable Cuantitativa-Continua ......................................................................................... 13
6. MEDIDAS DE TENDENCIA CENTRAL .................................................................................. 15
7. MEDIDAS DE DISPERSIÓN..................................................................................................... 15
8. CÁLCULOS.................................................................................................................................. 16
8.1 Intervalo de confianza para la medía de una población: ............................................. 16
8.2 Intervalo de confianza para las medias de dos poblaciones. .................................... 17
8.3 Prueba de hipótesis para la media de una población .................................................. 19
8.4 Prueba de hipótesis para dos medias poblacionales .................................................. 20
8.5 Intervalo de confianza para la proporción de una población .................................... 21
8.6 Intervalo de confianza para las proporciones de dos poblaciones ......................... 22
8.7 Prueba de hipótesis para la proporción de una población. ....................................... 23
8.8 Prueba de hipótesis para las proporciones de dos poblaciones. ............................ 25
8.9 Intervalo de confianza para la varianza de una población.......................................... 26
8.10 Intervalo de confianza para la razón de dos varianzas poblacionales .................. 27
8.11 Prueba de hipótesis para la varianza de una población ........................................... 28
8.12 Prueba de hipótesis para la razón de dos varianzas poblaciones. ........................ 29
8.13 Prueba de bondad de ajuste. Para una distribución Binomial o Poisson ............ 31
8.14 Prueba de independencia. ................................................................................................. 33
9. CONCLUSIONES Y RECOMENDACIONES ......................................................................... 35
ANEXOS .............................................................................................................................................. 36
A.- MODELO DE ENCUESTA ..................................................................................................... 37
B.- BASE DE DATOS .................................................................................................................... 38
1. INTRODUCCION
En la actualidad, Los medios de transporte son el canal para interconectar las ciudades
de nuestro país. Sin embargo, la actualidad afirma que el sistema de medios de
transporte es de bajo estándar y de ello parte muchas quejas de los usuarios.
Por ello, decidimos analizar la opinión y uso que le da el estudiante de la UTP para
comparar y analizar su comportamiento frente a los medios de transporte más
utilizados en nuestra capital.
2. OBJETIVO DEL TRABAJO APLICADO
Objetivo general
Objetivos Específicos
Tener presente que medio de transporte es el más popular entre los alumnos
encuestados.
3.1. Estadística
Es la rama de las matemáticas que se ocupa de recolectar, organizar, presentar,
analizar e interpretar datos para ayudar a una toma de decisiones más efectiva. La
estadística se clasifica en dos grandes ramas la estadística descriptiva y la estadística
inferencial
3.2. Población
Se le llama Población a la cantidad total de cualquier conjunto completo de datos,
objetos, individuos o resultados que tengan alguna característica en común que se va
a observar o analizar en un problema o experimento. Denotaremos al tamaño de la
población por “N”.
3.3. Muestra
Se le llama Muestra a cualquier subconjunto de elementos de la población. El interés
de la Estadística es proporcionar métodos que permitan elegir una muestra de datos
representativos destinado a suministrar información acerca de una población, será
fundamental que los elementos deben tener todas las características de la población.
Denotamos al tamaño de la muestra por “n”
3.4. Variable
Se le llama Variable a la cualidad o cantidad medible de cualquier suceso o acción que
presente o experimente un cambio, la podemos representar mediante un símbolo (X,
Y, Z,α, β, γ, δ) y al cual se le puede asignar un valor cualquiera de un conjunto
determinado de datos.
3.5. Datos
Se le llama Datos a las agrupaciones de cualquier número de observaciones
relacionadas. Para que se considere un dato estadístico debe tener dos
características:
3.8. Muestreo
Se llama Muestreo al estudio que se hace de una población por medio de muestras
representativas, debidamente elegidas de manera que posea todas las características
de una población y de tamaño determinado según la precisión que de ella se quiere
obtener en las decisiones y conclusiones estadísticas posteriores.
3.9.1. Censo
Llamamos Censo al método de recolección de datos mediante el cual la información
se obtiene del estudio de todos los elementos que componen a la población o universo
bajo estudio.
3.9.2. Población
Una Población es Finita cuando existe una cantidad determinada de elementos por
analizar; esto es, una cantidad de elementos, numerable y que en determinado
momento finaliza.
3.10. Medidas de Centralización
De los muchos aspectos de los datos, que intentamos representar numéricamente con
estadísticas, dos son los más importantes:
3.10.2. Mediana
En esta medida, los datos u observaciones equidistantes o que se encuentran más en
medio de todo el conjunto de datos. La mediana del ejemplo anterior, sería el valor que
deja a la mitad de los datos por encima de dicho valor, y a la otra mitad por debajo, es
decir el 50 % por arriba y el 50% por debajo del conjunto de datos. Si la media y la
mediana son iguales, la distribución o conjunto de datos de la variable es simétrica.
Sin embargo, la media es muy sensible a la variación de las puntuaciones, y la mediana
es menos sensible a dichos cambios
3.10.3. La moda
Se suele definir como el valor más frecuente. En el caso de una variable no agrupada,
es el valor de la variable que más se repite.
3.11.1. Rango
Es una medida razonable de Variabilidad llamada también en algunas ocasiones
amplitud y que se obtiene restando el valor más bajo de un conjunto de observaciones
del valor más alto.
3.11.2. Desviación Media
Se define como la media de las diferencias en valor absoluto de los valores de la
variable a la media (D:M); es decir, que se define como desvió que es la diferencia que
se observa entre la variable y la media aritmética.
3.11.3. Varianza:
Cuyo símbolo es (S2), es la media de las desviaciones al cuadrado, calculada usando
n o n-1 como divisor.
4.1 Población:
Estudiantes de la UTP de los turnos mañana, tarde y noche en el ciclo 2019-II
4.2 Muestra:
60 estudiantes de la UTP del ciclo 2019-II en Sede – Lima norte.
4.4 Variables:
- Edad
- Genero
- Distrito donde vive
- Grado de instrucción
- Tipo de medio de transporte utiliza
- Gasto promedio mensual en uso de transporte
- Calificación de tránsito
- Tiempo diario usado en el transporte
Tipo de Variables:
Fuente: Propia
Fuente: Propia
11
9
6
5
4
3
[30.0 - 54.3> [54.3 - 78.6> [78.6 - 102.9> [102.9 - 127.1> [127.1 - 151.4> [151.4 - 175.7> [175.7 - 200.0]
𝟑𝟎−𝟐𝟐
Mediana: Me = 𝟓𝟒. 𝟑 + 𝟐𝟒. 𝟑 ∗ ( )= 71.96
𝟏𝟏
𝟐𝟐−𝟎
Moda: Mo = 𝟑𝟎 + 𝟐𝟒. 𝟑 ∗ ((𝟐𝟐−𝟎)+(𝟑𝟑−𝟐𝟐))= 46.19
7. MEDIDAS DE DISPERSIÓN
𝟐
(𝒙𝒊−𝑿) 𝟐𝟐,𝟗𝟓𝟐.𝟒
Varianza: 𝑺𝟐 = ∑ 𝒏−𝟏 = 𝟔𝟎−𝟏
= 389.02
𝟐
(𝒙𝒊−𝑿)
Desv. Estándar: 𝑺 = √∑ 𝒏−𝟏
√𝟑𝟖𝟗. 𝟎𝟐 = 19.72
𝟏𝟗.𝟕𝟐
Coef. De variación: 𝐶𝑉 = 𝟖𝟒.𝟔𝟓 ∗ 𝟏𝟎𝟎 = 23.30%
Formula 8.1 Calculo del intervalo de confianza para la media de una población
DATOS:
̅ =84.65
𝑿
n=60
s=19.72
1-α=95%, α =0.05, α/2=0.025, 1- α/2= 0.975
De la tabla de Distribución Normal Estándar Z (0.075) = 1.96
[79.66≤ 𝝁 ≤89.64]
79.66 84.64
+ 4592 3362
(93.1 − 76.2) (1.96)√ +
− 30 30
INTERPRETACIÓN:
Con un nivel de confianza del 95% existe evidencia estadística para afirmar que el
gasto promedio de los hombres es similar al de las mujeres, ya que no tiene una
diferencia significativa.
8.3 Prueba de hipótesis para la media de una población
Se sabe que promedio poblacional del gasto de los limeños es de 200.0 soles, para
ello se tomó una muestra de 60 estudiantes de la UTP sede Lima Norte, encontrando
un gasto promedio de 84.65 soles con una desviación de 19.72 ¿Se puede inferir con
un nivel de significancia de 5% que el gasto de los estudiantes de la UTP es menor al
promedio poblacional de gasto de los limeños?
DATOS:
Población: Muestra:
µ=200.0 𝑥̅ = 84.65
s=19.72
n=60
1) Planteo de Hipótesis
H0: µ ≥ 200
H1: µ < 200
3) Estadístico de Prueba:
𝑥̅ − 𝜇
𝑍𝑐 =
𝑆
𝑛
Reemplazando los datos en la fórmula:
84.65 − 200
Z= = −45.31
19.72
√60
4) Región de aceptación o rechazo
De la tabla de Distribución Normal Estándar: Z(α)= Z(0.05)= - 1.64
5) Decisión:
Como Zc ε RR, entonces se rechaza Ho
6) INTERPRETACIÓN:
Con un nivel de significancia de 5% existe evidencia estadística para afirmar que el
gasto de los estudiantes de la UTP es menor al gasto poblacional de los limeños.
DATOS:
X1=1235 X2=1085
S1=456 S2=252
n1=30 n2=30
1) Planteo de Hipótesis
H0= µ1 ≤ µ2
H1= µ1 > µ2
2) Nivel de significancia:
α = 0.05
3) Estadístico de Prueba:
(𝟏𝟐𝟑𝟓 − 𝟏𝟎𝟖𝟓) − (𝟎)
𝒁𝒄 = = 𝟏. 𝟓𝟕𝟕
𝟐 𝟐
√𝟒𝟓𝟔 + 𝟐𝟓𝟐
𝟑𝟎 𝟑𝟎
Z(1- α) = 1.645
5) Decisión:
Como Z=1.577 cae en la zona de aceptación Zc ε RA, entonces se Acepta Ho
6) INTERPRETACIÓN:
Con un nivel de significancia de 5% existe evidencia estadística para afirmar que el
promedio del gasto de los hombres es mayor al gasto de las mujeres.
DATOS:
p = 0.56 q = 0.44
(1 - α) = 95
α = 0.05
α/2 = 0.025
Z(0.25) = 1.96
0.56∗0.44 0.56∗0.44
0.56 – 1.96 √ < 𝜋 < 0.56 + 1.96 √
60 60
0.434 ≤ 𝜋 ≤ 0.685
INTERPRETACIÓN:
Ahora compararemos la proporción de los que usan Metropolitano y los que usan
transporte público. Realizamos 2 muestras aleatorias, cada una de 30 personas, si las
muestras revelan que 16 prefieren usar Metropolitano, y, por otro lado, 5 usan
Transporte público. ¿Se puede inferir que existe una diferencia significativa en los que
usan Metropolitano y los que usan Transporte público, con un nivel de confianza del
95%?
n1 = 30 n2 = 30
q1 = 0.47 q2 = 0.83
(1 - α) = 0.95
α = 0.05
α/2 = 0.025
Z α/2 =∓ 1.96
+ 𝟎.𝟓𝟑∗𝟎.𝟒𝟕 𝟎.𝟏𝟕∗𝟎.𝟖𝟑
IC (𝝅𝟏 − 𝝅𝟐 )=[(𝟎. 𝟓𝟑 − 𝟎. 𝟏𝟕) 𝟏. 𝟗𝟔√ 𝟑𝟎 + 𝟑𝟎 ]
−
IC (𝝅𝟏 − 𝝅𝟐 ) = [𝟎. 𝟏𝟑𝟔 ; 𝟎. 𝟓𝟖𝟑]
INTERPRETACIÓN:
DATOS:
n=60
P0 =0.5
P=32/60= 0.533
1 Planteo de Hipótesis
Ho: P≤0.5
H1: P>0.5
2 Nivel de Significancia
α = 0.05
3 Estadístico Prueba
Reemplazando los datos en la fórmula:
0.033
√ 0.50(1 − 0.50)
𝑧= = 0.46
60
5 Decisión
Como Z=0.46 cae en la zona de aceptación Se Acepta Ho
INTERPRETACIÓN:
Se dice que los estudiantes se movilizan con transporte público en lugar de taxi.
Sacamos 2 muestras aleatoria de 30 cada uno, en el primer grupo, 16 de ellos usan
transporte público; y en la segunda muestra 5 usan taxi. ¿Se puede concluir que
prefieren el transporte público en lugar de taxi?
DATOS:
N1=30 N2=30
1 Planteo de Hipótesis
Ho: P1≤P2
H1: P1>P2
2 Nivel de significancia
α = 0.05
3 Estadístico Prueba
𝟏𝟔 + 𝟓
𝑷𝑪 = = 𝟎. 𝟑𝟓
𝟑𝟎 + 𝟑𝟎
𝟎. 𝟓𝟑 − 𝟎. 𝟏𝟕
𝒁= = 𝟐. 𝟗𝟐𝟑
√𝟎. 𝟑𝟓 ∗ 𝟎𝟔𝟓 ( 𝟏 + 𝟏 )
𝟑𝟎 𝟑𝟎
4 Región de aceptación o rechazo
1.645
5 Decisión
INTERPRETACIÓN:
DATOS:
S= 36 (1- α) =0.95
n=30 α=0.05
INTERPRETACIÓN:
Hay un 95% de confianza de que la varianza de los gastos mensuales de los hombres
cae entre 822.01 y 2342.12 soles.
Con los datos de la muestra podemos analizar la razón de la varianza de los gastos
mensuales de los hombres y mujeres en Lima.
DATOS:
S1= 46 S2= 25
n=30 n=30
α=0.05
α/2 =0.025
Con un nivel de confianza del 95% el cociente de varianzas del gasto mensual de
hombres y mujeres está comprendido entre 1,611 y 7,11.
Un investigador nos dice que la varianza de los gastos en los hombres está en
aumento, teniendo una varianza poblacional de 131887.144, ¿qué tan cierto puede ser
lo que dice el investigador?
σ2 = 131887.144
1 Planteo de Hipótesis
Ho: σ2 ≤ 131887.144
H1: σ2 ˃ 131887.144
2 Nivel de significancia
α = 0.05
3 Estadístico Prueba
(𝟑𝟎 − 𝟏)(𝟒𝟓𝟔)𝟐
𝐱𝟐 = = 𝟒𝟓. 𝟕𝟕𝟐
𝟏𝟑𝟏𝟖𝟖𝟕. 𝟏𝟒𝟒
X2=42.557
5 Decisión
INTERPRETACIÓN:
Un investigador nos dice que existe más variabilidad en los gastos de los hombres que
en las mujeres, teniendo los datos de la muestra, ¿podríamos concluir eso?
DATOS:
n1 = 30 n2 = 30
1 Planteo de hipótesis
2 Nivel de significancia
α = 0.05
3 Estadístico Prueba
F = 1.861
5 Decisión
INTERPRETACIÓN:
Un estudio nos dice que la cantidad de Buses de transporte público se ajusta a una
distribución binomial. Analizaremos el caso de las 60 personas encuestadas:
Nº de Buses Frecuencia
0 10
1 29
2 16
3 5
1 Planteo de Hipótesis
2 Nivel de Significancia
α = 0.05
3 Estadístico Prueba
XiFi 0 ∗ 10 + 1 ∗ 29 + 2 ∗ 16 + 3 ∗ 5
∑ = = 2,26
N 60
3p = 2,26
p= 0,42
q= 0,58
3
P (x=0) = ( ) (0,42)0 ∗ (0,58)3=0,2
0
3
P (x=1) = ( ) (0,42)1 ∗ (0,58)2=0,42
1
3
P (x=2) = ( ) (0,42)2 ∗ (0,58)1=0,31
2
3
P (x=3) = ( ) (0,42)3 ∗ (0,58)0=0,07
3
5 Decisión X2=5.99
1
INTERPRETACIÓN:
Existe relación entre la situación laboral y los turnos de estudio de los alumnos de la
UTP? Use alfa 5%
𝐻0 :No existe relación entre la situación laboral y los turnos de estudio (Independencia).
𝐻1 : Existe relación entre la situación laboral y los turnos de estudio (No independencia).
TURNO
SITUACION DIA TARDE NOCHE TOTAL
TRABAJAN 30(46.6) 40(33.3) 70(60) 140
NO TRABAJAN 40(23.3) 10(16.6) 20(30) 70
TOTAL 70 50 90 210
gl=2
INTERPRETACION:
A un nivel de significancia del 5%, Existe evidencia estadística para Rechazar Ho.
Existe relación entre la situación laboral y los turnos de estudios de los estudiantes de
la UTP.
9. CONCLUSIONES Y RECOMENDACIONES
Como primera conclusión nos damos cuenta que la mayoría de los estudiantes de UTP
sede Arequipa – Lima Norte prefieren usar el Metropolitano.
Con nuestra prueba de hipótesis para la media de los gastos entre los hombres y las
mujeres, nos damos cuenta que el gasto, independientemente de la actividad que
desarrollan, es mayor en los hombres que en las mujeres.
Existe mayor variabilidad en los gastos de los hombres que de las mujeres.
Se recomienda hacer un estudio a mayor intensidad acerca del uso del Metropolitano,
ya que es un medio de transporte masivo y por ende reduce las posibilidades de robos
y accidentes de tránsito dentro del sistema, debido al uso de corredores exclusivos,
sistema de velocidad controlada, pilotos profesionales, servicio policial permanente y
cámaras de video-vigilancia al interior de los buses y en las estaciones y terminales.
ANEXOS
A.- MODELO DE ENCUESTA
_________________________________________________________
a) SI
b) NO
a) PREGRADO REGULAR
b) PREGRADO CGT
c) POSTGRADO
a) TAXI
b) TRANSPORTE PUBLICO
c) METROPOLITANO
d) TAXI COLECTIVO
e) AUTO PROPIO
f) OTRO
_________________________________________________________
a) MUY BUENA
b) BUENA
c) REGULAR
d) MALA
e) MUY MALA
____________________________________
B.- BASE DE DATOS
Taxi
1 VEGA PONTE EDWIN GERMAN M SI Colectivo 150 Mala 1 hora
2 SAMAR VENTOCILLA JANSEN F NO Otro 30 Regular 10 min
AVILA TAMAYO JASSON Transporte
3 CHRISTIAN M NO Público 80 Mala 30 min
ROLANDO THOMAS POVIS Transporte
4 BAZAN M NO Público 50 Regular 45 min
5 OYAGUE LEON, BRANDON M SI Metropolitano 30 Mala 1 hora
GAMARRA BOHORQUEZ Transporte
6 BRIGITTE F SI Público 120 Regular 30 min
ROSA LINDA CHALCO
7 VIZCARRA F SI Metropolitano 50 Buena 15 min
8 DITA TANTARICO LORENZO F SI Metropolitano 60 Buena 15 min
MICHAEL JUNIOR ROBLES
9 PONCE M SI Taxi 60 Mala 30 min
MELISSA FIORELLA SUCNO Transporte
10 CERNA F NO Público 120 Mala 45 min
MARILYN EDUARDA RAMON Taxi
11 RAMOS F NO Colectivo 60 Regular 45 min
Transporte
12 LILY LUANNA AYALA LOZANO F SI Público 90 Mala 45 min
VERÓNICA LUZ CARREÑO
13 CARRASCO F SI Auto Propio 60 Regular 30 min
JUAN MANUEL LAURENTE Transporte
14 CHIUYARE M SI Público 200 Buena 30 min
MADELINE GUERRERO
15 FONTENLA F NO Metropolitano 180 Regular 45 min
ALEXIS VLADISLAC CANCHO Transporte
16 GUTIERREZ M SI Público 170 Regular 45 min
ALEJANDRO JHONATAN Taxi
17 SOTAYA HUAMAN M NO Colectivo 110 Mala 1 hora
ADDERLY SAMIRI TERRONES Taxi
18 MAYTA F SI Colectivo 30 Regular 10 min
EDSON EMMANUEL URIBE Transporte
19 VILLAFUERTE M SI Público 80 Mala 30 min
Transporte
20 GUILLERMO RAFAILE RUPAY M SI Público 50 Regular 45 min
KENYI OSCAR DAMIAN M Transporte
21 FERNANDEZ SI Público 30 Mala 1 hora
RICARDO LEONARDO Taxi
22 MENDOZA LOPEZ M SI Colectivo 150 Mala 1 hora
Transporte
23 MARINA CARRION CANSINO F SI Público 30 Regular 10 min
Transporte
24 ROSA LUZ VALERIO URBANO F NO Público 60 Mala 30 min
MILAGROS STHEFANNY CRUZ Transporte
25 HERRERA F SI Público 50 Regular 45 min
LIDIA MAYOMI PALACIOS Taxi
26 NAJARRO F NO Colectivo 150 Mala 1 hora
Taxi
27 YENIT AYDEE MENDOZA CRUZ F SI Colectivo 30 Regular 10 min
Medio de Gasto Calificación tiempo
Apellidos y Nombres SEXO Trabajas
transporte mensual tránsito demora
Transporte
58 ROCIO ELIZABETH DIAZ FARRO F SI Público 170 Buena 30 min
PERCY GERARDO APOLINARIO
59 TOLEDO M SI Metropolitano 160 Regular 45 min
ALBER LEONCIO FLORES Transporte
60 ROJAS M SI Público 170 Regular 45 min