Trabajo Estadistica Inferencial FINAL

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 40

“ESTUDIO DE LOS GASTOS MENSUALES EN LOS

TRANSPORTE MÁS USADOS POR LOS ESTUDIANTES DE LA


UNIVERSIDAD TECNOLOGICA DE PERÚ – UTP SEDE LIMA
NORTE EN EL 2019”

Integrantes:
- VEGA PONTE EDWIN GERMAN

- RONCEROS APAZA CHRISTIAN RICARDO

Asignatura: ESTADISTICA INFERENCIAL

Docente: PAZ RUBIO, DEYANIRA ELIZABETH

Turno: NOCHE

2019- II
ÍNDICE
ÍNDICE ................................................................................................................................................... 2
1. INTRODUCCION .......................................................................................................................... 4
2. OBJETIVO DEL TRABAJO APLICADO .................................................................................... 5
3. MARCO TEORICO DEFINICIONES ......................................................................................... 5
3.1. Estadística...................................................................................................................................... 5
3.1.1. Estadística Descriptiva ......................................................................................................... 5
3.1.2. Estadística inferencial .......................................................................................................... 6
3.2. Población........................................................................................................................................ 6
3.3. Muestra ........................................................................................................................................... 6
3.4. Variable .......................................................................................................................................... 6
3.4.1. Tipos de variable ................................................................................................................... 6
3.4.1.1. Variables Numéricas: ....................................................................................................... 6
3.4.1.2. Variables Categóricas: ..................................................................................................... 7
3.5. Datos............................................................................................................................................... 7
3.5.1. Datos Internos: ...................................................................................................................... 7
3.5.2. Datos Externos: estos datos pueden ser de dos tipos: .................................................. 7
3.6. Presentación de Datos ................................................................................................................. 7
3.7. Experimento ................................................................................................................................... 8
3.8. Muestreo ........................................................................................................................................ 8
3.9. Métodos de Muestreo .................................................................................................................. 8
3.9.1. Censo...................................................................................................................................... 8
3.9.2. Población................................................................................................................................ 8
3.10. Medidas de Centralización .................................................................................................. 9
3.10.1. Media Aritmética. .............................................................................................................. 9
3.10.2. Mediana .............................................................................................................................. 9
3.10.3. La moda.............................................................................................................................. 9
3.11. Medidas de Variabilidad o Dispersión Absolutas............................................................. 9
3.11.1. Rango ................................................................................................................................. 9
3.11.2. Desviación Media ............................................................................................................ 10
3.11.3. Varianza: .......................................................................................................................... 10
3.11.4. Desviación típica o Standard: ....................................................................................... 10
4. CARACTERISTICAS DE BASE DE DATOS .......................................................................... 11
4.1 Población:........................................................................................................................... 11
4.2 Muestra: .............................................................................................................................. 11
4.3 Unidad de análisis: ........................................................................................................... 11
4.4 Variables: ........................................................................................................................... 11
Tipo de Variables:......................................................................................................................... 11
5. ELABORACIÓN DE TABLAS DE FRECUENCIA PARA CADA VARIABLE DE
ESTUDIO. ............................................................................................................................................ 12
5.1. Variable Cualitativa Nominal .............................................................................................. 12
5.2. Variable Cuantitativa-Continua ......................................................................................... 13
6. MEDIDAS DE TENDENCIA CENTRAL .................................................................................. 15
7. MEDIDAS DE DISPERSIÓN..................................................................................................... 15
8. CÁLCULOS.................................................................................................................................. 16
8.1 Intervalo de confianza para la medía de una población: ............................................. 16
8.2 Intervalo de confianza para las medias de dos poblaciones. .................................... 17
8.3 Prueba de hipótesis para la media de una población .................................................. 19
8.4 Prueba de hipótesis para dos medias poblacionales .................................................. 20
8.5 Intervalo de confianza para la proporción de una población .................................... 21
8.6 Intervalo de confianza para las proporciones de dos poblaciones ......................... 22
8.7 Prueba de hipótesis para la proporción de una población. ....................................... 23
8.8 Prueba de hipótesis para las proporciones de dos poblaciones. ............................ 25
8.9 Intervalo de confianza para la varianza de una población.......................................... 26
8.10 Intervalo de confianza para la razón de dos varianzas poblacionales .................. 27
8.11 Prueba de hipótesis para la varianza de una población ........................................... 28
8.12 Prueba de hipótesis para la razón de dos varianzas poblaciones. ........................ 29
8.13 Prueba de bondad de ajuste. Para una distribución Binomial o Poisson ............ 31
8.14 Prueba de independencia. ................................................................................................. 33
9. CONCLUSIONES Y RECOMENDACIONES ......................................................................... 35
ANEXOS .............................................................................................................................................. 36
A.- MODELO DE ENCUESTA ..................................................................................................... 37
B.- BASE DE DATOS .................................................................................................................... 38
1. INTRODUCCION

En la actualidad, Los medios de transporte son el canal para interconectar las ciudades
de nuestro país. Sin embargo, la actualidad afirma que el sistema de medios de
transporte es de bajo estándar y de ello parte muchas quejas de los usuarios.

Por ello, decidimos analizar la opinión y uso que le da el estudiante de la UTP para
comparar y analizar su comportamiento frente a los medios de transporte más
utilizados en nuestra capital.
2. OBJETIVO DEL TRABAJO APLICADO

Objetivo general

 El objetivo de esta encuesta es analizar el comportamiento del consumo de los


medios de transporte por los alumnos de la UTP sede – Lima Norte.

Objetivos Específicos

 Conocer el medio de transporte más usado para el traslado de los alumnos de la


UTP.

 Saber si existen diferencias entre el uso de medios de transporte en referencia al


género.

 Tener presente que medio de transporte es el más popular entre los alumnos
encuestados.

3. MARCO TEORICO DEFINICIONES

3.1. Estadística
Es la rama de las matemáticas que se ocupa de recolectar, organizar, presentar,
analizar e interpretar datos para ayudar a una toma de decisiones más efectiva. La
estadística se clasifica en dos grandes ramas la estadística descriptiva y la estadística
inferencial

3.1.1. Estadística Descriptiva


Conjunto de métodos para organizar, resumir y presentar los datos de manera
informativa.
3.1.2. Estadística inferencial
Conjunto de métodos probabilísticos y estadísticos utilizados para saber algo acerca
de un todo, basándose en una pequeña parte de este.

3.2. Población
Se le llama Población a la cantidad total de cualquier conjunto completo de datos,
objetos, individuos o resultados que tengan alguna característica en común que se va
a observar o analizar en un problema o experimento. Denotaremos al tamaño de la
población por “N”.

3.3. Muestra
Se le llama Muestra a cualquier subconjunto de elementos de la población. El interés
de la Estadística es proporcionar métodos que permitan elegir una muestra de datos
representativos destinado a suministrar información acerca de una población, será
fundamental que los elementos deben tener todas las características de la población.
Denotamos al tamaño de la muestra por “n”

3.4. Variable
Se le llama Variable a la cualidad o cantidad medible de cualquier suceso o acción que
presente o experimente un cambio, la podemos representar mediante un símbolo (X,
Y, Z,α, β, γ, δ) y al cual se le puede asignar un valor cualquiera de un conjunto
determinado de datos.

3.4.1. Tipos de variable


Para su estudio, las variables aleatorias se han clasificado según la naturaleza de los
valores que toman en:

3.4.1.1. Variables Numéricas:


- Variables Numéricas Discretas.

- Variable Numérica Continua


3.4.1.2. Variables Categóricas:
- Variables Categóricas Nominales

- Variables Categóricas Ordinales

3.5. Datos
Se le llama Datos a las agrupaciones de cualquier número de observaciones
relacionadas. Para que se considere un dato estadístico debe tener dos
características:

- Que sean comparables entre sí.

- Que tengan alguna relación.

La recolección de información o recopilación de datos estadísticos se divide en:

3.5.1. Datos Internos:


Son aquellos datos que no necesitan de observaciones adicionales al experimento; es
decir, no es necesario buscar características que proporcionen información adicional
acerca del experimento.

3.5.2. Datos Externos: estos datos pueden ser de dos tipos:


- Datos Bibliográficos: son aquellos ya conocidos y que podemos encontrar
fácilmente utilizando bibliografía, registros, actas, etcétera, como los datos
históricos, censos y otros.

- Datos Originales: son aquellos que podemos obtener mediante métodos de


recolección, como las encuestas, plebiscitos, referéndum, y nos proporcionan
datos reales y certeros.

3.6. Presentación de Datos


Después de la organización de los datos, la información se resume en Tablas
Estadísticas con base en arreglos formados de renglones y columnas, adecuados
según cronología, geografía, análisis cuantitativo o cualitativo.
3.7. Experimento
Se le llama Experimento a toda acción o prueba que se realiza con el fin de observar
su resultado. Existen dos tipos de experimentos, que son:

- Experimento Determinista: son aquéllos en los que se puede predecir con


certeza su resultado antes de que éste se presente

- Experimento Aleatorio, Probabilista, casual o de azar: hablar de aleatorio,


probabilista, casual o azar es hablar de algo que está determinado a la suerte.
Así, decimos que un Experimento Aleatorio ocurre cuando no es posible
asegurar el resultado que se va a presentar

3.8. Muestreo
Se llama Muestreo al estudio que se hace de una población por medio de muestras
representativas, debidamente elegidas de manera que posea todas las características
de una población y de tamaño determinado según la precisión que de ella se quiere
obtener en las decisiones y conclusiones estadísticas posteriores.

3.9. Métodos de Muestreo

3.9.1. Censo
Llamamos Censo al método de recolección de datos mediante el cual la información
se obtiene del estudio de todos los elementos que componen a la población o universo
bajo estudio.

3.9.2. Población
Una Población es Finita cuando existe una cantidad determinada de elementos por
analizar; esto es, una cantidad de elementos, numerable y que en determinado
momento finaliza.
3.10. Medidas de Centralización
De los muchos aspectos de los datos, que intentamos representar numéricamente con
estadísticas, dos son los más importantes:

3.10.1. Media Aritmética.


La medida más evidente que podemos calcular para describir un conjunto de
observaciones numéricas es su valor medio. La media no es más que la suma de todos
los valores de una variable dividida entre el número total de datos de los que se
dispone.

3.10.2. Mediana
En esta medida, los datos u observaciones equidistantes o que se encuentran más en
medio de todo el conjunto de datos. La mediana del ejemplo anterior, sería el valor que
deja a la mitad de los datos por encima de dicho valor, y a la otra mitad por debajo, es
decir el 50 % por arriba y el 50% por debajo del conjunto de datos. Si la media y la
mediana son iguales, la distribución o conjunto de datos de la variable es simétrica.
Sin embargo, la media es muy sensible a la variación de las puntuaciones, y la mediana
es menos sensible a dichos cambios

3.10.3. La moda
Se suele definir como el valor más frecuente. En el caso de una variable no agrupada,
es el valor de la variable que más se repite.

3.11. Medidas de Variabilidad o Dispersión Absolutas

3.11.1. Rango
Es una medida razonable de Variabilidad llamada también en algunas ocasiones
amplitud y que se obtiene restando el valor más bajo de un conjunto de observaciones
del valor más alto.
3.11.2. Desviación Media
Se define como la media de las diferencias en valor absoluto de los valores de la
variable a la media (D:M); es decir, que se define como desvió que es la diferencia que
se observa entre la variable y la media aritmética.

3.11.3. Varianza:
Cuyo símbolo es (S2), es la media de las desviaciones al cuadrado, calculada usando
n o n-1 como divisor.

3.11.4. Desviación típica o Standard:


Cuyo símbolo es (S), es simplemente la raíz cuadrada de la varianza. La varianza y la
desviación miden la dispersión promedio alrededor de la media; es decir, como las
observaciones mayores fluctúan por encima de ésta y como las s observaciones
menores se distribuyen por debajo de ésta como medidas de variabilidad más
importantes.
4. CARACTERISTICAS DE BASE DE DATOS

4.1 Población:
Estudiantes de la UTP de los turnos mañana, tarde y noche en el ciclo 2019-II

4.2 Muestra:
60 estudiantes de la UTP del ciclo 2019-II en Sede – Lima norte.

4.3 Unidad de análisis:


Un estudiante de la UTP del Ciclo 2019-II en Sede – Lima norte.

4.4 Variables:
- Edad
- Genero
- Distrito donde vive
- Grado de instrucción
- Tipo de medio de transporte utiliza
- Gasto promedio mensual en uso de transporte
- Calificación de tránsito
- Tiempo diario usado en el transporte

Tipo de Variables:

Variables Tipos de variable


Edad Cuantitativa discreta
Genero Cualitativa nominal
Distrito en donde vive Cualitativa nominal
Grado de instrucción Cualitativa ordinal
Tipo de medio transporte que
Cualitativa nominal
utiliza
Gasto mensual en uso de
Cuantitativa continua
transporte
Calificación de orden de
Cuantitativa continua
transito
Tiempo aproximado de
Cualitativa continua
demora en transporte

Tabla 4.1 Tipos de variables estudiadas


5. ELABORACIÓN DE TABLAS DE FRECUENCIA PARA CADA
VARIABLE DE ESTUDIO.

5.1. Variable Cualitativa Nominal

Pregunta: ¿Qué medio de transporte prefiere usar el alumno?

MEDIOS DE TRANSPORTE fi Fi hi Hi hi (%)


TAXI 3 3 0.050 0.050 5%
TRANSPORTE PUBLICO 29 32 0.483 0.533 48%
METROPOLITANO 15 47 0.250 0.783 25%
TAXI COLECTIVO 9 56 0.150 0.933 15%
AUTO PROPIO 3 59 0.050 0.983 5%
OTRO 1 60 0.017 1.000 2%
60

Tabla 5.1 tabla de Frecuencias de medios de transportes más utilizados

Fuente: Propia

Grafico 5.1 Diagrama de Barras de medios de transportes más utilizados

Del gráfico de frecuencias podemos interpretar

 Del total de estudiantes encuestados 48% prefieren usar el Transporte Publico.


 Del total de estudiantes encuestados 25% prefieren usar el Metropolitano.
 Del total de estudiantes encuestados 15% prefieren usar el Taxi Colectivo.
 Del total de estudiantes encuestados 5% prefieren usar su Auto Propio.
 Del total de estudiantes encuestados 5% prefieren usar Taxi.
 Del total de estudiantes encuestados 2% prefieren usar otros medios de
transporte.

5.2. Variable Cuantitativa-Continua

Pregunta: ¿Cuánto gasta mensualmente en el uso de transporte hacia la UTP?

Paso 1: Hallar el rango R = 200-30=170


Paso 2: Hallar el número de intervalos K = 1+3.322xlog(50)=6.64 =7
Paso 3: Hallar la amplitud C = R/K = 24.3

Gasto mensual xi Xi fi Fi hi Hi Pi (%) Xi*fi (X-Xi)2 fi*(X-Xi)2


[30.0 - 54.3> 42.2 22 22 0.37 0.37 36.67 927.3 1,806.3 39,737.5
[54.3 - 78.6> 66.5 11 33 0.18 0.55 18.33 731.0 331.2 3,643.6
[78.6 - 102.9> 90.8 9 42 0.15 0.70 15.00 816.8 37.2 334.9
[102.9 - 127.1> 115.0 6 48 0.10 0.80 10.00 690.0 921.1 5,526.7
[127.1 - 151.4> 139.3 5 53 0.08 0.88 8.33 696.3 2,981.2 14,905.8
[151.4 - 175.7> 163.6 4 57 0.07 0.95 6.67 654.2 6,225.2 24,900.8
[175.7 - 200.0] 187.9 3 60 0.05 1.00 5.00 563.6 10,650.2 31,950.7
60 100 5079.0 22,952.4 121,000.1

Tabla 5.2 tabla de Frecuencias de gastos mensuales en el transporte

Fuente: Propia

Gasto promedio mensual de alumnos de la UTP Norte


22

11
9
6
5
4
3

[30.0 - 54.3> [54.3 - 78.6> [78.6 - 102.9> [102.9 - 127.1> [127.1 - 151.4> [151.4 - 175.7> [175.7 - 200.0]

Grafico 5.2 Diagrama de Barras de gastos mensuales en el transporte


Grafico 5.3 Histograma de gastos mensuales en el transporte (Geogebra)

Del gráfico podemos interpretar

 Del total de estudiantes encuestados, 22 gastan entre [30.0 a 54.3> soles en el


uso de transporte.
 Del total de estudiantes encuestados, 11 gastan entre [54.3 a 78.6> soles en el
uso de transporte.
 Del total de estudiantes encuestados, 9 gastan entre [78.6 a 102.9> soles en el
uso de transporte.
 Del total de estudiantes encuestados, 6 gastan entre [102.9 a 127.1> soles en el
uso de transporte.
 Del total de estudiantes encuestados, 5 gastan entre [127.1 a 151.4> soles en el
uso de transporte.
 Del total de estudiantes encuestados, 4 gastan entre [151.4 a 175.7> soles en el
uso de transporte.
 Del total de estudiantes encuestados, 3 gastan entre [175.7 a 200.0] soles en el
uso de transporte.
6. MEDIDAS DE TENDENCIA CENTRAL
𝒇𝒊∗𝒙𝒊 𝟓,𝟎𝟕𝟗.𝟒
Media: ̅ =∑
𝑿 = = 84.6
𝒏 𝟔𝟎
El promedio de gasto de los alumnos encuestados es de 84.6 soles.

𝟑𝟎−𝟐𝟐
Mediana: Me = 𝟓𝟒. 𝟑 + 𝟐𝟒. 𝟑 ∗ ( )= 71.96
𝟏𝟏

El 50% de alumnos encuestados tienen menos de 71.96 de gasto en


soles Y el otro 50% supera los 71.96 de gasto en soles.

𝟐𝟐−𝟎
Moda: Mo = 𝟑𝟎 + 𝟐𝟒. 𝟑 ∗ ((𝟐𝟐−𝟎)+(𝟑𝟑−𝟐𝟐))= 46.19

La cantidad de gasto más recurrente de los estudiantes encuestados


es de 46.19 soles.

7. MEDIDAS DE DISPERSIÓN
𝟐
(𝒙𝒊−𝑿) 𝟐𝟐,𝟗𝟓𝟐.𝟒
Varianza: 𝑺𝟐 = ∑ 𝒏−𝟏 = 𝟔𝟎−𝟏
= 389.02

Significa que 389.02 soles es las desviaciones cuadráticas.

𝟐
(𝒙𝒊−𝑿)
Desv. Estándar: 𝑺 = √∑ 𝒏−𝟏

√𝟑𝟖𝟗. 𝟎𝟐 = 19.72

Significa que 20.89 soles es la dispersión promedio de todos los


puntos de los datos alrededor de su media.

𝟏𝟗.𝟕𝟐
Coef. De variación: 𝐶𝑉 = 𝟖𝟒.𝟔𝟓 ∗ 𝟏𝟎𝟎 = 23.30%

Significa que su desviación estándar mide un 23.30% respecto a su


media.
8. CÁLCULOS

8.1 Intervalo de confianza para la medía de una población:

Se extrajo una muestra aleatoria de 60 estudiantes de la UTP, los cuales fueron


encuestados para conocer cuánto es el gasto mensual en el uso de transporte
vehicular. En Lima Norte, se obtuvo una media de 84.65, con una desviación estándar
muestral de 19.72. Se quiere calcular un intervalo de confianza del 95% para la media
de la población.

Varianza poblacional desconocida y tamaño de muestra grande (n>=30):

Formula 8.1 Calculo del intervalo de confianza para la media de una población

DATOS:
̅ =84.65
𝑿
n=60
s=19.72
1-α=95%, α =0.05, α/2=0.025, 1- α/2= 0.975
De la tabla de Distribución Normal Estándar Z (0.075) = 1.96

Reemplazando los datos a la fórmula:


19.72 19.72
IC: 84.65 − 1.96 × ≤ µ ≤ 84.65 + 1.96 ×
√60 √60

[79.66≤ 𝝁 ≤89.64]
79.66 84.64

Grafico 8.1 Intervalo de confianza para la media de la población (Geogebra)


INTERPRETACIÓN:
Con un nivel de confianza del 95% existe evidencia estadística para afirmar que la
media poblacional del gasto en medios de transporte de las personas encuestadas
está comprendida entre 79.66 y 89.64 soles

8.2 Intervalo de confianza para las medias de dos poblaciones.

Se necesita determinar si hay diferencia entre el gasto de los hombres y mujeres en


Lima. Por lo cual, se sabe que las desviaciones muéstrales son 459 y 336
respectivamente. Para eso se usa dos muestras aleatorias de 30 hombres y 30
mujeres y la media del gasto fue de 76.2 y 93.1 respectivamente. Se requiere
determinar un intervalo de confianza del 95% para determinar si la media de los gastos
de los hombres es mayor al de las mujeres.

Varianza poblacional desconocida y tamaño de muestra grande (n>=30):

Formula 8.2 Calculo del intervalo de confianza para la media de dos


poblaciones
DATOS:
Ҳ=76.2 𝑿𝟐 =93.1
S1= 459 S2= 336
n1=30 n2=30
α= 95%, α =0.05, (1- α/2)=0.975
De la tabla de Distribución Normal Estándar Z (0.075) = 1.96

Remplazando los datos en la fórmula:

+ 4592 3362
(93.1 − 76.2) (1.96)√ +
− 30 30

[−186.66 ≤ µ1 − µ2 ≤ 220.46] , (µ1 = µ2)

INTERPRETACIÓN:
Con un nivel de confianza del 95% existe evidencia estadística para afirmar que el
gasto promedio de los hombres es similar al de las mujeres, ya que no tiene una
diferencia significativa.
8.3 Prueba de hipótesis para la media de una población
Se sabe que promedio poblacional del gasto de los limeños es de 200.0 soles, para
ello se tomó una muestra de 60 estudiantes de la UTP sede Lima Norte, encontrando
un gasto promedio de 84.65 soles con una desviación de 19.72 ¿Se puede inferir con
un nivel de significancia de 5% que el gasto de los estudiantes de la UTP es menor al
promedio poblacional de gasto de los limeños?

DATOS:
Población: Muestra:
µ=200.0 𝑥̅ = 84.65
s=19.72
n=60

1) Planteo de Hipótesis
H0: µ ≥ 200
H1: µ < 200

2) Nivel de significancia: α = 0.05

3) Estadístico de Prueba:
𝑥̅ − 𝜇
𝑍𝑐 =
𝑆
𝑛
Reemplazando los datos en la fórmula:
84.65 − 200
Z= = −45.31
19.72
√60
4) Región de aceptación o rechazo
De la tabla de Distribución Normal Estándar: Z(α)= Z(0.05)= - 1.64

5) Decisión:
Como Zc ε RR, entonces se rechaza Ho

6) INTERPRETACIÓN:
Con un nivel de significancia de 5% existe evidencia estadística para afirmar que el
gasto de los estudiantes de la UTP es menor al gasto poblacional de los limeños.

8.4 Prueba de hipótesis para dos medias poblacionales

Se necesita saber si los gastos mensuales de 30 mujeres y 30 hombres son diferentes,


para ello se obtuvo una media de 1235 y 1085 con una desviación de 456 y 252
respectivamente. ¿ se podrá afirmar que 𝜇1 > 𝜇2?

Usar nivel de significancia de 5%

DATOS:
X1=1235 X2=1085
S1=456 S2=252
n1=30 n2=30
1) Planteo de Hipótesis
H0= µ1 ≤ µ2
H1= µ1 > µ2

2) Nivel de significancia:
α = 0.05

3) Estadístico de Prueba:
(𝟏𝟐𝟑𝟓 − 𝟏𝟎𝟖𝟓) − (𝟎)
𝒁𝒄 = = 𝟏. 𝟓𝟕𝟕
𝟐 𝟐
√𝟒𝟓𝟔 + 𝟐𝟓𝟐
𝟑𝟎 𝟑𝟎

4) Región de aceptación o rechazo

Z(1- α) = 1.645
5) Decisión:
Como Z=1.577 cae en la zona de aceptación Zc ε RA, entonces se Acepta Ho

6) INTERPRETACIÓN:
Con un nivel de significancia de 5% existe evidencia estadística para afirmar que el
promedio del gasto de los hombres es mayor al gasto de las mujeres.

8.5 Intervalo de confianza para la proporción de una población

En una muestra aleatoria de 60 habitantes de Lima, el 56 % son habitantes que usan


Metropolitano para movilizarse. Vamos a calcular el intervalo de confianza para la
proporción de la población de todos los habitantes que usan Metropolitano, con un
nivel de confianza del 95 %.

DATOS:

p = 0.56 q = 0.44

(1 - α) = 95
α = 0.05
α/2 = 0.025
Z(0.25) = 1.96

0.56∗0.44 0.56∗0.44
0.56 – 1.96 √ < 𝜋 < 0.56 + 1.96 √
60 60

0.434 ≤ 𝜋 ≤ 0.685
INTERPRETACIÓN:

El intervalo de confianza para la proporción de todas las personas encuestadas que


usan Metropolitano ∈ [0.434; 0.685].

8.6 Intervalo de confianza para las proporciones de dos


poblaciones

Ahora compararemos la proporción de los que usan Metropolitano y los que usan
transporte público. Realizamos 2 muestras aleatorias, cada una de 30 personas, si las
muestras revelan que 16 prefieren usar Metropolitano, y, por otro lado, 5 usan
Transporte público. ¿Se puede inferir que existe una diferencia significativa en los que
usan Metropolitano y los que usan Transporte público, con un nivel de confianza del
95%?

Metropolitano Transporte Público

p1 = 16/30 = 0.53 p2 = 5/30 = 0.17

n1 = 30 n2 = 30

q1 = 0.47 q2 = 0.83

(1 - α) = 0.95

α = 0.05

α/2 = 0.025

Z α/2 =∓ 1.96

+ 𝟎.𝟓𝟑∗𝟎.𝟒𝟕 𝟎.𝟏𝟕∗𝟎.𝟖𝟑
IC (𝝅𝟏 − 𝝅𝟐 )=[(𝟎. 𝟓𝟑 − 𝟎. 𝟏𝟕) 𝟏. 𝟗𝟔√ 𝟑𝟎 + 𝟑𝟎 ]

IC (𝝅𝟏 − 𝝅𝟐 ) = [𝟎. 𝟏𝟑𝟔 ; 𝟎. 𝟓𝟖𝟑]

INTERPRETACIÓN:

Entonces el intervalo de confianza al 95 % es: [0.136 ≤ π₁ – π₂ ≤ 0.583], dado que el


intervalo de confianza no contiene al cero debemos concluir que las proporciones son
diferentes π₁ ≠π₂ y se concluye que π₁ ˃π₂. Esto quiere decir que si prefieren usar el
Smartphone.

8.7 Prueba de hipótesis para la proporción de una población.

Sabiendo que la proporción poblacional de los habitantes usan Transporte Público es


del 50%. Un estudio nos dice que los que usan Metropolitano es más del 50%.
Tomamos una muestra de 60 y nos dio que 32 usan Transporte publico ¿Se puede
decir que más de la mitad usan Transporte público?

Usar nivel de significancia de 5%.

DATOS:

n=60

P0 =0.5

P=32/60= 0.533

1 Planteo de Hipótesis

Ho: P≤0.5
H1: P>0.5

2 Nivel de Significancia
α = 0.05

3 Estadístico Prueba
Reemplazando los datos en la fórmula:
0.033
√ 0.50(1 − 0.50)
𝑧= = 0.46
60

4 Región de aceptación o rechazo

5 Decisión
Como Z=0.46 cae en la zona de aceptación Se Acepta Ho

INTERPRETACIÓN:

Con un nivel de significancia de 5% no existe evidencia estadística para afirmar que


más del 50% de los de los estudiantes utilizan Transporte público.
8.8 Prueba de hipótesis para las proporciones de dos poblaciones.

Se dice que los estudiantes se movilizan con transporte público en lugar de taxi.
Sacamos 2 muestras aleatoria de 30 cada uno, en el primer grupo, 16 de ellos usan
transporte público; y en la segunda muestra 5 usan taxi. ¿Se puede concluir que
prefieren el transporte público en lugar de taxi?

Usar nivel de significancia de 5%

DATOS:

Transporte público: TAXI:


𝑿𝟏 = 16 𝑿𝟐 = 5

N1=30 N2=30

P1= 16/30=0.53 P2=5/30= 0.17

1 Planteo de Hipótesis

Ho: P1≤P2
H1: P1>P2

2 Nivel de significancia
α = 0.05

3 Estadístico Prueba

Reemplazando los datos en la fórmula:

𝟏𝟔 + 𝟓
𝑷𝑪 = = 𝟎. 𝟑𝟓
𝟑𝟎 + 𝟑𝟎

𝟎. 𝟓𝟑 − 𝟎. 𝟏𝟕
𝒁= = 𝟐. 𝟗𝟐𝟑
√𝟎. 𝟑𝟓 ∗ 𝟎𝟔𝟓 ( 𝟏 + 𝟏 )
𝟑𝟎 𝟑𝟎
4 Región de aceptación o rechazo

1.645

5 Decisión

Como Z=2.923 no cae en la zona de aceptación Se rechaza Ho

INTERPRETACIÓN:

Con un nivel de significancia de 5% existe evidencia estadística para afirmar que


efectivamente existen más personas que usan Transporte público.

8.9 Intervalo de confianza para la varianza de una población

Cambiando de estadístico, ahora queremos saber cuál es el intervalo de confianza


para la varianza del gasto mensual de los hombres, teniendo una muestra de 30.

DATOS:

S= 36 (1- α) =0.95

n=30 α=0.05

gl= 30-1=29 α/2=0.025

A (1- α/2) =0.975


𝛼
𝑋 2 (1 − , 𝑛 − 1) = 45.722
2
𝛼
𝑋 2 ( 2 , 𝑛 − 1) = 16.047
(29)(36)2 (29)(36)2
≤ σ2 ≤
45.722 16.047
822.01 ≤ 𝝈𝟐 ≤ 2342.12

INTERPRETACIÓN:

Hay un 95% de confianza de que la varianza de los gastos mensuales de los hombres
cae entre 822.01 y 2342.12 soles.

8.10 Intervalo de confianza para la razón de dos varianzas


poblacionales

Con los datos de la muestra podemos analizar la razón de la varianza de los gastos
mensuales de los hombres y mujeres en Lima.

DATOS:

S1= 46 S2= 25

n=30 n=30

α=0.05

α/2 =0.025

A (1- α/2) =0.975

𝑺𝟐𝟏 𝟏 𝝈𝟐𝟏 𝑺𝟐𝟏 𝜶


𝟐 𝜶 < 𝟐 < 𝟐 𝑭(𝟏 − , 𝒏𝟐 − 𝟏, 𝒏𝟏 − 𝟏)
𝑺𝟐 𝑭 (𝟏 − , 𝒏𝟏 − 𝟏, 𝒏𝟐 − 𝟏) 𝝈𝟐 𝑺𝟐 𝟐
𝟐
Reemplazando en la formula:

𝟒𝟔𝟐 𝟏 𝝈𝟐𝟏 𝟒𝟔𝟐


∗ < < ∗ 𝟐. 𝟏𝟎𝟏
𝟐𝟓𝟐 𝟐. 𝟏𝟎𝟏 𝝈𝟐𝟐 𝟐𝟓𝟐
Entonces el intervalo de confianza para la razón de 2 varianzas a un 95% es:
𝝈𝟐𝟏
𝟏, 𝟔𝟏𝟏 < 𝟐 < 𝟕, 𝟏𝟏
𝝈𝟐
INTERPRETACIÓN:

Con un nivel de confianza del 95% el cociente de varianzas del gasto mensual de
hombres y mujeres está comprendido entre 1,611 y 7,11.

8.11 Prueba de hipótesis para la varianza de una población

Un investigador nos dice que la varianza de los gastos en los hombres está en
aumento, teniendo una varianza poblacional de 131887.144, ¿qué tan cierto puede ser
lo que dice el investigador?

Usar nivel de significancia de 5%

σ2 = 131887.144

s2= 4562 = 207936

1 Planteo de Hipótesis

Ho: σ2 ≤ 131887.144
H1: σ2 ˃ 131887.144

2 Nivel de significancia

α = 0.05

3 Estadístico Prueba

Reemplazando los datos en la fórmula:

(𝟑𝟎 − 𝟏)(𝟒𝟓𝟔)𝟐
𝐱𝟐 = = 𝟒𝟓. 𝟕𝟕𝟐
𝟏𝟑𝟏𝟖𝟖𝟕. 𝟏𝟒𝟒

x2(1- α, v) = x2(0.95, 29) = 42.557


4 Región de aceptación o rechazo

X2=42.557
5 Decisión

Como 𝐱 𝟐 =45.772 no cae en la zona de aceptación Se rechaza Ho

INTERPRETACIÓN:

Con un nivel de significancia de 5% existe evidencia estadística para afirmar que


concluimos que el investigador tiene la razón.

8.12 Prueba de hipótesis para la razón de dos varianzas


poblaciones.

Un investigador nos dice que existe más variabilidad en los gastos de los hombres que
en las mujeres, teniendo los datos de la muestra, ¿podríamos concluir eso?

Usar nivel de significancia de 5%

DATOS:

𝑺𝟐𝟏 =4562 𝑺𝟐𝟐 = 2522

n1 = 30 n2 = 30

1 Planteo de hipótesis

Ho: σ12≤ σ22


H1: 𝝈𝟐𝟏 > 𝝈𝟐𝟐

2 Nivel de significancia

α = 0.05
3 Estadístico Prueba

Reemplazando los datos en la fórmula:


𝟒𝟓𝟔𝟐
𝑭= = 𝟑. 𝟐𝟕𝟒
𝟐𝟓𝟐𝟐

4 Región de Aceptación o Rechazo

F (α, v1, v2) = f (0.05, 29,29) = 1.861

F = 1.861

5 Decisión

Como f= 3.274 no cae en la zona de aceptación Se rechaza Ho

INTERPRETACIÓN:

Con un nivel de significancia de 5% existe evidencia estadística para afirmar que el


gasto de los hombres tiene mayor variación que el gasto de las mujeres.
8.13 Prueba de bondad de ajuste. Para una distribución Binomial o
Poisson

Un estudio nos dice que la cantidad de Buses de transporte público se ajusta a una
distribución binomial. Analizaremos el caso de las 60 personas encuestadas:

Usar nivel de significancia de 5%

Nº de Buses Frecuencia
0 10
1 29
2 16
3 5

1 Planteo de Hipótesis

Ho: La cantidad de Buses que realizaron se ajusta a una distribución binomial.


H1: La cantidad de Buses no se ajusta a una distribución binomial.

2 Nivel de Significancia

α = 0.05

3 Estadístico Prueba

XiFi 0 ∗ 10 + 1 ∗ 29 + 2 ∗ 16 + 3 ∗ 5
∑ = = 2,26
N 60

3p = 2,26

p= 0,42

q= 0,58
3
P (x=0) = ( ) (0,42)0 ∗ (0,58)3=0,2
0
3
P (x=1) = ( ) (0,42)1 ∗ (0,58)2=0,42
1
3
P (x=2) = ( ) (0,42)2 ∗ (0,58)1=0,31
2
3
P (x=3) = ( ) (0,42)3 ∗ (0,58)0=0,07
3

Clase (Xi) Oi Pi Ei Xc2


0 10 0.2 12 0.3
1 29 0.42 25.2 0.57
2 16 0.31 18.6 0.36
3 5 0.07 4.2 0.15
total 60 1 60 1.38

4 Región de Aceptación o Rechazo

Para hallar x2 de la tabla:

G.L. = k-1-m = 4-1-1 = 2

α = 0.05, 1-α = 0.95

x2(α, gl) = x2(0.95, 2) = 5.991

5 Decisión X2=5.99
1

Como x2= 1.38 cae en la zona de aceptación Se Acepta Ho

INTERPRETACIÓN:

Con un nivel de significancia de 5% existe evidencia estadística para afirmar que la


cantidad de Buses se ajusta a una distribución binomial.
8.14 Prueba de independencia.

En un estudio hecho a la UTP, se obtuvo un conjunto de datos para determinar si la


proporción de alumnos que trabajan era la misma durante el día, la tarde o la noche.
Se encontrar los siguientes datos.

Existe relación entre la situación laboral y los turnos de estudio de los alumnos de la
UTP? Use alfa 5%

𝐻0 :No existe relación entre la situación laboral y los turnos de estudio (Independencia).

𝐻1 : Existe relación entre la situación laboral y los turnos de estudio (No independencia).

TURNO
SITUACION DIA TARDE NOCHE TOTAL
TRABAJAN 30(46.6) 40(33.3) 70(60) 140
NO TRABAJAN 40(23.3) 10(16.6) 20(30) 70
TOTAL 70 50 90 210

70∗140 50∗140 90∗140


E1= 210
= 46.6 E2= 210
= 33.3 E3= 210
= 60

70∗70 50∗70 90∗70


E4= = 23.3 E5= = 16.6 E6= = 30
210 210 210

𝑋2 (30−46.6)2 (40−33.3)2 (70−6𝑂)2 (40−23.3)2 (10−16.6)2 (20−30)2


𝐶= + + + + + =26,85
46.6 33.3 60 23.3 16.6 30

gl= (2-1)(3-1) 26.85

gl=2
INTERPRETACION:

A un nivel de significancia del 5%, Existe evidencia estadística para Rechazar Ho.
Existe relación entre la situación laboral y los turnos de estudios de los estudiantes de
la UTP.
9. CONCLUSIONES Y RECOMENDACIONES

 Como primera conclusión nos damos cuenta que la mayoría de los estudiantes de UTP
sede Arequipa – Lima Norte prefieren usar el Metropolitano.

 Con nuestra prueba de hipótesis para la media de los gastos entre los hombres y las
mujeres, nos damos cuenta que el gasto, independientemente de la actividad que
desarrollan, es mayor en los hombres que en las mujeres.

 La mayor tendencia de uso es el Metropolitano.

 Existe mayor variabilidad en los gastos de los hombres que de las mujeres.

 Se recomienda realizar mantenimientos preventivos y predictivos a los buses del


Metropolitano mensualmente. Esto le asegurará que su servicio no seguirá teniendo
problemas sobrepasando los límites permisibles de peso en cuanto a su media
poblacional.

 Se recomienda hacer un estudio a mayor intensidad acerca del uso del Metropolitano,
ya que es un medio de transporte masivo y por ende reduce las posibilidades de robos
y accidentes de tránsito dentro del sistema, debido al uso de corredores exclusivos,
sistema de velocidad controlada, pilotos profesionales, servicio policial permanente y
cámaras de video-vigilancia al interior de los buses y en las estaciones y terminales.
ANEXOS
A.- MODELO DE ENCUESTA

Edad: ……………………. Genero: ………………………….

1.- Distrito donde vive:

_________________________________________________________

2.- ¿Trabaja actualmente?

a) SI

b) NO

3.- Modalidad de estudio:

a) PREGRADO REGULAR
b) PREGRADO CGT
c) POSTGRADO

4.- ¿Qué medio de transporte usualmente usa para movilizarse a la UTP?

a) TAXI
b) TRANSPORTE PUBLICO
c) METROPOLITANO
d) TAXI COLECTIVO
e) AUTO PROPIO
f) OTRO

5.- ¿Cuánto dinero gasta aproximadamente al mes?

_________________________________________________________

6.- ¿Cómo calificaría el orden de transito?

a) MUY BUENA
b) BUENA
c) REGULAR
d) MALA
e) MUY MALA

7.- ¿Cuánto tiempo aproximadamente demora en su ruta camino a la UTP?

____________________________________
B.- BASE DE DATOS

Medio de Gasto Calificación tiempo


Apellidos y Nombres SEXO Trabajas
transporte mensual tránsito demora

Taxi
1 VEGA PONTE EDWIN GERMAN M SI Colectivo 150 Mala 1 hora
2 SAMAR VENTOCILLA JANSEN F NO Otro 30 Regular 10 min
AVILA TAMAYO JASSON Transporte
3 CHRISTIAN M NO Público 80 Mala 30 min
ROLANDO THOMAS POVIS Transporte
4 BAZAN M NO Público 50 Regular 45 min
5 OYAGUE LEON, BRANDON M SI Metropolitano 30 Mala 1 hora
GAMARRA BOHORQUEZ Transporte
6 BRIGITTE F SI Público 120 Regular 30 min
ROSA LINDA CHALCO
7 VIZCARRA F SI Metropolitano 50 Buena 15 min
8 DITA TANTARICO LORENZO F SI Metropolitano 60 Buena 15 min
MICHAEL JUNIOR ROBLES
9 PONCE M SI Taxi 60 Mala 30 min
MELISSA FIORELLA SUCNO Transporte
10 CERNA F NO Público 120 Mala 45 min
MARILYN EDUARDA RAMON Taxi
11 RAMOS F NO Colectivo 60 Regular 45 min
Transporte
12 LILY LUANNA AYALA LOZANO F SI Público 90 Mala 45 min
VERÓNICA LUZ CARREÑO
13 CARRASCO F SI Auto Propio 60 Regular 30 min
JUAN MANUEL LAURENTE Transporte
14 CHIUYARE M SI Público 200 Buena 30 min
MADELINE GUERRERO
15 FONTENLA F NO Metropolitano 180 Regular 45 min
ALEXIS VLADISLAC CANCHO Transporte
16 GUTIERREZ M SI Público 170 Regular 45 min
ALEJANDRO JHONATAN Taxi
17 SOTAYA HUAMAN M NO Colectivo 110 Mala 1 hora
ADDERLY SAMIRI TERRONES Taxi
18 MAYTA F SI Colectivo 30 Regular 10 min
EDSON EMMANUEL URIBE Transporte
19 VILLAFUERTE M SI Público 80 Mala 30 min
Transporte
20 GUILLERMO RAFAILE RUPAY M SI Público 50 Regular 45 min
KENYI OSCAR DAMIAN M Transporte
21 FERNANDEZ SI Público 30 Mala 1 hora
RICARDO LEONARDO Taxi
22 MENDOZA LOPEZ M SI Colectivo 150 Mala 1 hora
Transporte
23 MARINA CARRION CANSINO F SI Público 30 Regular 10 min
Transporte
24 ROSA LUZ VALERIO URBANO F NO Público 60 Mala 30 min
MILAGROS STHEFANNY CRUZ Transporte
25 HERRERA F SI Público 50 Regular 45 min
LIDIA MAYOMI PALACIOS Taxi
26 NAJARRO F NO Colectivo 150 Mala 1 hora
Taxi
27 YENIT AYDEE MENDOZA CRUZ F SI Colectivo 30 Regular 10 min
Medio de Gasto Calificación tiempo
Apellidos y Nombres SEXO Trabajas
transporte mensual tránsito demora

SEBASTIAN GONZALO Transporte


28 SAAVEDRA ASCORNAO M SI Público 60 Mala 30 min
WALTHER GONZALO MINAYA Transporte
29 ESPINOZA M SI Público 50 Regular 45 min
RONALD LEONARDO MOLINA Transporte
30 GOMEZ M SI Público 30 Mala 1 hora
ERICK OLIVER JAIMES M Transporte
31 VALDIVIA SI Público 120 Regular 30 min
GIUSSEPI JESUS TORRES
32 CORREA M SI Taxi 90 Mala 30 min
MIRYAM LUCERO SOTO Transporte
33 SANCHEZ F NO Público 120 Mala 45 min
JUAN ALCIDES ALDUNATE
34 RIVERA M SI Metropolitano 30 Regular 45 min
JOHANNA DEL CARMEN VELA Transporte
35 ABARCA F NO Público 90 Mala 45 min
YULIANA JUDITH ORDOÑEZ
36 CHANCA F SI Auto Propio 30 Regular 30 min
CESAR ALDAIR GONZALES Transporte
37 MALLA M SI Público 200 Buena 30 min
Taxi
38 LUIS ANTONNY NUÑEZ LOPEZ M SI Colectivo 150 Mala 1 hora
LESLI YANINA ESPINOZA
39 DELGADO F NO Auto Propio 30 Regular 10 min
ANTONY CHICLAYO M Transporte
40 RODRIGUEZ SI Público 80 Mala 30 min
ROBERTO CARLOS PACHECO Transporte
41 FERNANDEZ M NO Público 50 Regular 45 min
DANUSKA YAMILE FARFAN Taxi
42 MARTINEZ F SI Colectivo 150 Mala 1 hora
MARIA ANTUANETH MICHCA
43 MAGUIÑA F SI Metropolitano 60 Regular 10 min
Transporte
44 WENDY LIZETH YANA PORRAS F SI Público 50 Buena 15 min
SARA SOFIA DEL CARMEN
45 NUÑEZ NUÑEZ F SI Metropolitano 50 Buena 15 min
KENYI IVANA OBREGON
46 SOMOZA F SI Metropolitano 50 Buena 15 min
JORGE HUMBERTO CALDERON Transporte
47 PONTE M SI Público 50 Buena 30 min
ALVARO ALBERTO TADEO Transporte
48 GONZALES RUIZ M SI Público 60 Buena 30 min
49 DANAE VILLANUEVA CAMPOS F NO Metropolitano 60 Buena 15 min
ROMINA VICTORIA CORDOVA Transporte
50 SANCHEZ F SI Público 50 Buena 15 min
ALEJANDRO JESÚS VILCA
51 MENDEZ M NO Metropolitano 80 Buena 15 min
52 CARMEN ROSA SIHUI SANCHEZ F SI Metropolitano 80 Buena 15 min
MINOSHKA IVONNE FIGUEROA
53 SANCHEZ F SI Taxi 60 Mala 30 min
ANDY SABINO YCHPAS Transporte
54 TRUJILLO M SI Público 120 Mala 45 min
PAOLO JUNIOR CARRION
55 VALVERDE M NO Metropolitano 30 Regular 45 min
56 JOSE LUIS REGALADO RAMOS M SI Metropolitano 90 Mala 45 min
57 BETSY SOFIA REYNA RIOS F NO Metropolitano 60 Regular 30 min
Medio de Gasto Calificación tiempo
Apellidos y Nombres SEXO Trabajas
transporte mensual tránsito demora

Transporte
58 ROCIO ELIZABETH DIAZ FARRO F SI Público 170 Buena 30 min
PERCY GERARDO APOLINARIO
59 TOLEDO M SI Metropolitano 160 Regular 45 min
ALBER LEONCIO FLORES Transporte
60 ROJAS M SI Público 170 Regular 45 min

También podría gustarte