Sesión 7 Diagrama de Dispersión...
Sesión 7 Diagrama de Dispersión...
Sesión 7 Diagrama de Dispersión...
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Técnicas e
Instrumentos para
la Investigación
SESIÓN 07:
Diagrama de dispersión y
Coeficiente de correlación lineal de Pearson.
Modelo de regresión lineal simple.
Coeficiente de determinación.
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
RESULTADO DE
CONTENIDOS/TEMÁTICA EVIDENCIAS DE APRENDIZAJE
APRENDIZAJE
Y=β0 + β1 X + e
Donde:
β0 = intersección de la línea
β1 = pendiente de la línea
e = Error de estimación
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Estimación de parámetros
En mayoría de los casos b0 y b1 no se conocen y se estiman a
partir de las observaciones de las muestras, por medio de la
ecuación:
^ =𝑎+𝑏 𝑋
𝑌 𝑖 𝑖
( ∑ 𝑿𝒊)( ∑ 𝒀𝒊)
𝑺 𝑪 𝒙𝒚 =∑ 𝑿 𝒊 𝒀 𝒊 −
𝒏
Variable dependiente o
Variable independiente o
de criterio
predictiva
^ =𝒂+𝒃 𝑿
𝒀 𝒊 𝒊
Intersección de la Pendiente de la línea
línea
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Error Estándar
√ ∑ 𝒚 − 𝜷𝟎 ∑ 𝒚 − 𝜷𝟏 ∑ 𝒙𝒚
𝟐
𝑺𝒚 .𝒙=
𝒏−𝟐
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
𝑺 𝑪 𝒙𝒚
𝑹=
√𝑺 𝑪 𝒙 𝑺 𝑪 𝒚
𝑆 𝐶 𝑥𝑦 =∑ 𝑋 𝑖 𝑌 𝑖 −
(∑ 𝑋𝑖)( ∑ 𝑌𝑖)
𝑛 𝑆𝐶 𝑥=∑ 𝑋 −¿¿ 2
𝑖 𝑆𝐶 𝑦 =∑ 𝑌 −¿¿2
𝑖
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Grado de correlación
Los datos se muestran como un conjunto de puntos, cada uno con el valor de
una variable que determina la posición en el eje horizontal (x) y el valor de la otra
variable determinado por la posición en el eje vertical (y)
Correlación positiva fuerte: A un crecimiento
Correlación negativa fuerte: A un
de X (causa) corresponde un crecimiento de
crecimiento de X se observa una
Y(efecto). Controlando la evolución de los
tendencia a disminuir de Y.
valores de X, quedan controlados los
valores de Y. Correlación negativa moderada: A un
Correlación positiva débil: A un crecimiento crecimiento de X se observa una
de X se observa una tendencia a crecer de tendencia a disminuir de Y, pero se
Y, pero se presume que existen muchas presume que existen otras causas de
otras causas de dependencia. dependencia.
Correlación negativa débil: A un
Correlación nula: no existe relación lineal
crecimiento de X se observa una
ninguna, las variables X e Y no se
tendencia a disminuir de Y, pero se
relacionan.
presume que existen muchas otras
causas de dependencia.
Técnicas e
Programa de Investigación
Instrumentos para
Correlación Lineal - Tendencias Formativa
la Investigación
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Coeficiente de determinación
100 (%)
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Caso de aplicación:
Gráfico de dispersión:
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Explicación de la actitud hacia la ciudad de residencia
Tiempo de
Número de Actitud hacia
residencia X.Y X2 Y2
participante la ciudad (Y)
(X)
1 10 6 60 100 36
2 12 9 108 144 81
3 12 8 96 144 64
4 4 3 12 16 9
5 12 10 120 144 100
6 6 4 24 36 16
7 8 5 40 64 25
8 2 2 4 4 4
9 18 11 198 324 121
10 9 9 81 81 81
11 17 10 170 289 100
12 2 2 4 4 4
Totales 112 79 917 1350 641
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
𝒃=
𝑆𝐶 𝑥𝑦
=𝟎 . 𝟓𝟖𝟗𝟕 ∑ 𝑋 𝑖 =9.33 𝑌=
∑ 𝑌 𝑖 =6.58
𝑆𝐶 𝑥 𝑋= 𝑛
𝑛
^ =𝒂+𝒃 𝑿
𝒀 ^ =1.0793 + 0.5897 𝑋
𝑌
𝒊 𝒊 𝑖 𝑖
√ ∑ 𝒚 −𝒂 ∑ 𝒚 −𝒃∑ 𝒙𝒚
𝟐
𝑺𝒚 .𝒙=
𝒏−𝟐
Desviación
estándar
𝑆𝑦 . 𝑥=
√641 −1.0793 ( 79 ) − 0.5897(917)
12 −2
=𝟏 .𝟐𝟐𝟑
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
𝑆 𝐶 𝑥𝑦
𝑅= -
√ 𝑆𝐶𝑥 𝑆𝐶 𝑦
179.67
𝑅= =0.9361
√304.67 ×120.92
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
100 (%)
100 (%)
100 (%)
%
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Calculando en Excel por el gráfico de dispersión
Ir a insertar, elegir
gráfico de
dispersión
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Seleccionar los
rangos de la
variable (x) , (y)
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Elegir en diseño
rápido la opción
“diseño 9”
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
12
f(x) = 0.589715536105033 x + 1.07932166301969 Obtenemos el
10
R² = 0.876241692517196 modelo de
regresión lineal y
8 el coeficiente de
determinación
Axis Title
0
0 2 4 6 8 10 12 14 16 18 20
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Calculando en Excel por análisis de datos
Elegimos la opción
análisis de datos
En el menú
escogemos
regresión
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Elegimos los
rangos Y , X
podemos colocar
rótulos para titular
nuestros
resultados.
Elegimos el rango
de salida donde
saldrán los
resultados y
aceptamos.
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
ANÁLISIS DE VARIANZA
Total de la muestra
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F
Regresión 1 105.952225 105.952225 70.8026564 7.5452E-06
Residuos 10 14.964442 1.4964442
Total 11 120.916667
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95.0%Superior 95.0%
Intercepción 1.07932166 0.74335121 1.45196731 0.17715225 -0.57696806 2.73561138 -0.57696806 2.73561138
Tiempo de residencia (X) 0.58971554 0.07008382 8.41443144 7.5452E-06 0.43355904 0.74587203 0.43355904 0.74587203
𝒃 𝒂
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Editamos y
rotulamos en vista
de variables
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Elegimos
regresión/lineales
Elegimos variable
dependiente e
independiente
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Escogemos
estimaciones y
ajuste del modelo/
continuar
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Elegimos la variable
dependiente
(DEPENDENT) y
ajuste de la variable
predictora
(*ADJPRED)
Técnicas e
Programa de Investigación
Comparando resultados Formativa
Instrumentos para
la Investigación
Coeficiente de
correlación de
Pearson
Error estándar
Coeficiente de
determinación
𝒃 𝒂
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Gráfico de dispersión
12
También nos
10
muestra el grafico
Actitud hacia la ciudad
8 de dispersión
6
0
0 2 4 6 8 10 12 14
Elegimos
correlacionar /
bivariadas
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Elegimos las
variables
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
Correlación de
Pearson para
variables
paramétricas
Correlación
significativa,
(P<0.05) evidencia
estadística para
rechazar H0
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
1. Los datos de la producción de trigo en toneladas (X) y el precio del kilo de harina en
soles (Y) en la década de los 80 en Lima fueron:
2. Los gastos semanales de publicidad y las ventas de una empresa en dólares, para una muestra
de 10 semanas son:
Gastos sem 41 54 63 54 48 46 62 61 64 71
x public
Ventas 1250 1380 1425 1425 1450 1300 1400 1510 1575 1650
seman
Tiempo de 3 3 3 4 4 5 5 5 6 6 7 8
estudio
Calificación 9 1 11 12 15 14 16 15 18 16 15 17
2
6. La materia prima que se usa en la elaboración de una fibra sintética se almacena en un local que no
tiene control de humedad. Las mediciones de la humedad relativa en el local y del contenido de humedad
de una muestra de la materia prima (ambos en porcentajes) durante 12 días, dieron los
siguientes resultados.
Contenido
de
a)Realice un diagrama de dispersión e indique Humedad humedad
¿Sugiere la gráfica una asociación lineal? (X) (Y)
b)Realice la ecuación de regresión 42 12
35 8
c)Interprete la pendiente, realice un pronóstico 50 14
d)Calcule e interprete el coeficiente de correlación 43 9
e)Calcule e interprete el coeficiente de determinación 48 11
62 16
f)Calcular e interpretar el error estándar de estimación
31 7
36 9
44 12
39 10
55 13
48 11
Técnicas e
Programa de Investigación
Instrumentos para
Formativa
la Investigación
7. El siguiente conjunto de datos se ha tomado sobre grupos de trabajadoras de. Cada grupo está
formado por trabajadores de la misma profesión, en cada uno de los veinticuatro grupos muestreados se
han observado dos variables: el índice de estandarizado de consumo de cigarrillos (x) y el índice de
muertes por cáncer de pulmón (Y) variable dependiente. Se desea estudiar la relación entre estas dos
variables.
8. El director de una escuela está interesado en relacionar dos variables en los estudiantes y
ha tomado como información los resultados de la prueba de habilidad y del puntaje obtenido
en el examen de admisión, los cuales se muestran a continuación
9. Una cadena de restaurantes de comida rápida decide llevar a cabo un experimento para
medir la influencia sobre las ventas del gasto en publicidad. En 8 regiones del país, se
realizaron diferentes variaciones relativas en el gasto en publicidad, comparado con el año
anterior, y se observaron las variaciones en los niveles de ventas resultantes. La tabla
adjunta muestra los resultados.
10. Una compañía de seguros considera que el número de vehículos (y) que circulan por
una determinada autopista a más de 120 km/h , puede ponerse en función del número de
accidentes (x) que ocurren en ella. Durante 7 días obtuvo los siguientes resultados:
Accidentes xi 5 7 5 3 2 1 9
Vehículos yi 15 18 13 11 10 8 20
REFERENCIAS