0% encontró este documento útil (0 votos)
243 vistas46 páginas

Sesion 11 PDF

Este documento trata sobre correlación y regresión lineal simple. Explica conceptos como diagrama de dispersión, coeficiente de correlación de Pearson, y modelo de regresión lineal simple. Incluye un ejemplo para calcular el coeficiente de correlación entre el número de llamadas telefónicas realizadas por vendedores y la cantidad de copiadoras vendidas.
Derechos de autor
© © All Rights Reserved
Formatos disponibles
Descargue como PDF, TXT o lea en línea desde Scribd
Descargar como pdf o txt
0% encontró este documento útil (0 votos)
243 vistas46 páginas

Sesion 11 PDF

Este documento trata sobre correlación y regresión lineal simple. Explica conceptos como diagrama de dispersión, coeficiente de correlación de Pearson, y modelo de regresión lineal simple. Incluye un ejemplo para calcular el coeficiente de correlación entre el número de llamadas telefónicas realizadas por vendedores y la cantidad de copiadoras vendidas.
Derechos de autor
© © All Rights Reserved
Formatos disponibles
Descargue como PDF, TXT o lea en línea desde Scribd
Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1/ 46

SESIÓN 11

CORRELACIÓN Y
REGRESIÓN LINEAL SIMPLE

Dirección de Investigación

Dr. Frey Chávez Pinillos


[email protected]

2018-II
TEMATICA:
CONTENIDO:
Aplicaciones con el diagrama de dispersión. Coeficiente de
correlación lineal de pearson. Modelo de regresión lineal
simple (Uso de software estadístico o EXCEL).

CAPACIDADES
Analiza el coeficiente de correlación de pearson para dos
variables cuantitativas y los coeficientes para el modelo de
regresión lineal simple.

PRODUCTOS ACADÉMICOS
Informe de aplicación sobre diagrama de dispersión .
A TOMAR EN CUENTA

PARA PRUEBA PARAMETRICA


1° Correlación de Pearson

PARA PRUEBA NO PARAMETRICA


1° Correlación Rho de Spearman
DIAGRAMAS DE
DISPERSION
¿QUÉ ES UN GRAFICO DE DISPERSION?

Se trata de una representación gráfica del grado de


relación entre dos variables cuantitativas.
Es decir entre la variable respuesta(y) y la variable
independiente (x)
DIAGRAMA DE DISPERSION:

Es un tipo de diagrama matemático que


utiliza las coordenadas cartesianas para
mostrar los valores de dos variables para
un conjunto de datos.
Los datos se muestran como un conjunto
de puntos, cada uno con el valor de una
variable que determina la posición en el
eje horizontal y el valor de la otra variable
determinado por la posición en el eje
vertical.
NUBE DE PUNTOS O DIAGRAMA DE DISPERSIÓN.

1° Correlación directa o positiva

La recta correspondiente a la nube de puntos de


la distribución es una recta creciente.
2º Correlación inversa 3º Correlación nula
o negativa

En este caso se dice que las


La recta correspondiente a la
variables son encorraladas y la
nube de puntos de la distribución es
nube de puntos tiene una forma
una recta decreciente.
redondeada.
COEFICIENTE DE CORRELACIÓN

Es el estudio de relación
que existe entre las
variables dependientes e
independientes.
COEFICIENTE DE
CORRELACIÓN

El Coeficiente de Correlación (r):


requiere variables medidas en escala de intervalos o de
proporción, que Varía entre -1 y 1.
• Valores de -1 ó 1 indican correlación perfecta.
• Valor igual a 0 indica ausencia de correlación.
• Valores negativos indican una relación lineal
inversa
• valores positivos indican una relación lineal
directa
EJEMPLOS DE GRAFICAS DE CORRELACIÓN

CORRELACION POSITIVA PERFECTA CORRELACIÓN NEGATIVA PERFECTA


10 10
9 9; 9 9
8 8
7 7
6 6
5 5
4 4
3 3
2 2
1 1
0 0
0 2 4 6 8 10 0 2 4 6 8 10 12

CORRELACIÓN NULA
10
9
8
7
6
5
4
3
2
1
0
0 2 4 6 8 10
Escalas de correlación

Valor del Coeficiente de Grado de Correlación entre las


Pearson variables
Menor de 0,4 Correlación positiva mala
0,4 a 0,69 Correlación positiva regular
0,7 a 1 Correlación positiva buena
-1 a - 0.7 Correlación negativa buena
- 0.69 a - 0,4 Correlación negativa regular
Mayor de - 0,4 Correlación negativa mala
FORMULA QUE NOS PERMITEN HALLAR EL COEFICIENTE DE
CORRELACIÓN “r” DE PEARSON

n( ΣXY )  ( ΣX)( ΣY )
   
r
n(ΣX 2
)  ( ΣX)2 n ΣY 2 - ΣY 2

n = es el número de pares de observaciones.


∑X = es la suma de los valores de la variable X.
∑Y = es la suma de los valores de la variable Y.
(∑X2) = es la suma de los cuadrados de los valores de la variable X.
(∑X)2 = es el cuadrado de la suma de los valores de la variable X.
(∑Y2) = es la suma de los cuadrados de los valores de la variable Y.
(∑Y)2 = es el cuadrado de la suma de los valores de la variable Y.
∑XY = suma de los productos de X y Y.
EJEMPLO

El gerente de ventas de la compañía Copiar Sales of


América empresa que tiene una gran fuerza de ventas en
todo Estados Unidos y Canadá, desea determinar si
existe una relación entre el número de llamadas
telefónicas de ventas hechas en un mes, y la cantidad de
copiadoras vendidas durante ese lapso. El gerente
selecciona al azar una muestra de 10 representantes, y
determina el número de tales llamadas que hizo cada uno
el mes anterior y la cantidad de productos vendidos.
LLAMADAS Y COPIADORAS VENDIDAS POR LOS
10 REPRESENTANTES

REPRESENTANTE NUMERO DE NUMERO DE

COPIADORAS VENDIDAS “Y”


DE VENTAS LLAMADAS “x”
TOM KELLER 20 30
JEFF HALL 40 60
BRIAN VIROST 20 40
GREG FISH 30 60
SUSAN WELLCH 10 30
CARLOS RAMIREZ 10 40
RICH NILES 20 40
MIKE KIEL 0 50
MARK REYNOLDS 20 30
SONI JONES 30 70
TOTAL 220 450
Diagrama de Dispersión
80

70

60
COPIADORAS VENDIDAS

50

40

30

20

10

0
0 5 10 15 20 25 30 35 40 45
LLAMADAS
LLAMADAS A CLIENTES REALIZADAS Y COPIADORAS
VENDIDAS POR LOS 10 VENDEDORES DE LA MUESTRAS

NUMERO DE
REPRESENTANTE NUMERO DE COPIADORAS
X2 Y2 xy
DE VENTAS LLAMADAS VENDIDAS
TOM KELLER 20 30 400 900 600
JEFF HALL 40 60 1600 3600 2400
BRIAN VIROST 20 40 400 1600 800
GREG FISH 30 60 900 3600 1800
SUSAN WELLCH 10 30 100 900 300
CARLOS RAMANIREZ 10 40 100 1600 400
RICH NILES 20 40 400 1600 800
MIKE KIEL 20 50 400 2500 1000
MARK REYNOLDS 20 30 400 900 600
SONI JONES 30 70 900 4900 2100

TOTAL 220 450 5600 22100 10800


CALCULA EL COEFICIENTE DE CORRELACIÓN “r”

n( ΣXY )  ( ΣX )(ΣY )
r
n(ΣX 2
  
)  ( ΣX ) 2 n ΣY 2 - ΣY 
2

10(10800)  220( 450)


r
10(5600)  (220)  1022100 - 450 
2 2

r = 0.759
interpretación

• El coeficiente de correlación es igual


a 0.759
• Es positivo de manera que hay una
relación directa entre el numero de
llamadas a clientes y la cantidad de
copiadoras vendidas
COEFICIENTE DE DETERMINACION 𝑹𝟐

Su propósito es predecir futuros resultados


o probar una hipótesis

Determina la proporción de variación de


los resultados que puede explicarse por el
modelo

En una regresión lineal simple es el cuadrado


del coeficiente de correlación de Pearson
Método de calcularlo

Elevar al cuadrado el coeficiente de


correlación
r = 0.759

R  (0.759)  0.576081  57.6081%


2 2

Interpretación: El 57.61% de la
variación en el número de llamadas
se explica por la variación de número
de copiadoras vendidas
REGRESION
LINEAL
DEFINICIÓN

Técnica
estadística

ANÁLISIS utilizada
DE
REGRESIÓN
LINEAL

Para Relación entre


estudiar: variables cuantitativas
Ejemplo:

• El precio de venta (VD; Y) depende del precio de costo de un artículo


(VI; X).

• El tiempo de servicios (VD; Y) de un trabajador depende de su edad (VI;


X).

• El consumo familiar (VD; Y) está en función del ingreso familiar (VI; X).
Clases de regresión lineal:

Clases de regresión
lineal:

Regresión lineal Regresión lineal


simple múltiple
Regresión lineal simple:

• Este tipo se presenta cuando una variable independiente


ejerce influencia sobre otra variable dependiente. Ejemplo:
Y = f(x).
• Es una ecuación que define la relación lineal entre dos
variables donde una variable depende de la otra variable.
Se puede decir que Y depende de X.
Y = f(X)
Como Y depende de X, entonces:
Y es la variable dependiente, explicativa o
de predicción .
X es la variable independiente o variable respuesta.
PRINCIPIO DE MINIMOS CUADRADOS

Técnica empleada para


obtener la ecuación de
regresión, minimizando
la suma de los
cuadrados de las
distancias verticales
entre los valores
verdaderos de Y y los
valores pronosticados
de Y.
FORMA GENERAL DE LA ECUACION DE
REGRESIÒN SIMPLE

Y =a+bX

En general, los valores de a y b en la


ecuación de regresión se denominan
coeficientes de regresión estimados,
o también coeficientes de regresión.
𝑛 Σ𝑋𝑌 −(Σ𝑋)(Σ𝑌)
b=
𝑛 Σ𝑋 2 −(Σ𝑋)2

Donde:
X es el valor de la variable independiente.
Y es el valor de la variable dependiente.
n es el numero de elementos en la muestra.
Y =a+bX

a: Es la ordenada en el origen o intercepto

b: Es la pendiente de la recta
Interpretación de los coeficientes

Y´=a+bX

a: Es el valor promedio de la variable respuesta


(y) cuando la variable predictora (x) se mantiene
constante.

b: Es el cambio del valor medio de la variable


respuesta (y) por unidad de cambio de (x).
Ejemplo

En la empresa Copiar Sales of América, el gerente de


ventas recopilo información respecto al número de
llamadas telefónicas hechas y la cantidad de
copiadoras vendidas, para una muestra de 10
representantes de ventas. El gerente de esa área, le
gustaría ofrecer información específica referente a la
relación entre el número de llamadas y la cantidad de
productos vendidos. Utilice el método de mínimos
cuadrados para determinar la ecuación lineal.
Representantes de ventas Llamadas de Copiadoras XY
ventas (X) vendidas (Y)

CINTHIA 20 30 400 900 600

CAROLINA 40 60 1600 3600 2400

JOSE LUIS 20 40 400 1600 800

CARLOS 30 60 900 3600 1800

MILAGROS 10 30 100 900 300

MALENA 10 40 100 1600 400

BRYAN 20 40 400 1600 800

ANGEL 20 50 400 2500 1000

BEATRIZ 20 30 400 900 600

ANTONIO 30 70 900 4900 2100

TOTAL 220 450 5600 22100 10800


Hallando “b”

𝑛 Σ𝑋𝑌 −(Σ𝑋)(Σ𝑌)
b=
𝑛 Σ𝑋 2 −(Σ𝑋)2
10 10800 −(220)(450)
b=
10 5600 −(220)2
108000−99000
b=
56000−48400
9000
b=
7600
b=1.1842
El número de fotocopiadoras vendidas se
incrementará en 1.18 por cada llamada de
venta adicional.
Hallando “a”
Σ𝑌 Σ𝑋
a= -b
𝑛 𝑛
450 220
a= − (1.1842)
10 10
a=45-(1.1842)22
a=18.9476
:El número promedio de fotocopiadoras vendidas es 18.95
cuando la cantidad de llamadas de ventas se mantiene
constante.
Por tanto, la ecuación de regresión
es:
Y’=a+b(x)
Y’=18.9476+1.1842(X)
70

60 y`=18,9476+1,1842x

50

40
Valores Y
30 Lineal (Valores Y)

20

10

0
0 10 20 30 40 50
De modo que si un vendedor hace 20 llamadas
telefónicas, puede esperarse que venda :

Y’=18.9476+1.1842(X)
Y’=18.9476+1.1842(20)
Y’=42.6316
El error de estándar de estimación
.

ejemplo

El ejemplo que se relaciona con la


empresa sales of América. La gerente de
ventas determino que la ecuación de
regresión de mínimos cuadrados era
y’=18.9476+ 1.1842x donde y se refiere al
número de copiadoras vendidas y X a la
cantidad de llamadas telefónicas hechas.
Evalué el error estándar de estimación.
Representantes de ventas Llamadas de Copiadoras XY
ventas (X) vendidas (Y)

CINTHIA 20 30 400 900 600

CAROLINA 40 60 1600 3600 2400

JOSE LUIS 20 40 400 1600 800

CARLOS 30 60 900 3600 1800

MILAGROS 10 30 100 900 300

MALENA 10 40 100 1600 400

BRYAN 20 40 400 1600 800

ANGEL 20 50 400 2500 1000

BEATRIZ 20 30 400 900 600

ANTONIO 30 70 900 4900 2100

TOTAL 220 450 5600 22100 10800


Ingreso (x) A. familiar(y) X.Y 2 2 ^
48 24 1152
x
2304 576
y Y
23.6

Ejemplo 40

30
18

9
720

270
1600

900
324

81
16.6

7.9

39 14 546 1521 196 15.8

46 22 1012 2116 484 21.9

42 22 924 1764 484 18.4


Determinar el 27 4 108 729 16 5.3
coeficiente de 36 13 468 1296 169 13.1
correlación, 34 10 340 1156 100 11.4
determinación 46 20 920 2116 400 21.9

32 12 384 1024 144 9.6

42 18 756 1764 324 18.4

40 16 640 1600 256 16.6


Modelo de
regresión 32 8 256 1024 64 9.6
Ingreso y 27 6 162 729 36 5.3
ahorro familiar 561 216 8658 21643 3654 216
de 15
trabajadores
Resolver los dos siguientes ejercicios y
entregar con la rubrica 11
•Una empresa de refrescos está analizando
el efecto de su última campaña publicitaria.
Se escogieron personas al azar y se les llamó
para preguntarles cuántas latas de refresco
habían comprado la semana anterior y cuántos
anuncios del refresco habían visto u oído durante el mismo período.
Los datos fueron los siguientes:
•Graficar el diagrama de dispersión
•Hallar e interpretar el valor del coeficiente de correlación

X (anuncios) 3 7 4 2 0 4 1 2

Y (latas 11 18 9 4 7 6 3 8
compradas)
•Una compañía administra a sus vendedores una prueba de
adiestramiento de ventas antes de permitirles salir a trabajar.
La administración de la compañía está interesada en determinar
la correlación entre las calificaciones de la prueba y las
ventas hechas por esos vendedores al final de un año de trabajo.
Los siguientes datos se recolectaron de 10 agentes de
ventas que han estado en el campo durante un año.

Vendedor A B C D E F G H I J
Calificación de la 2.6 3.7 2.4 4.5 2.6 5.0 2.8 3.0 4.0 3.4
prueba
Número de 95 140 85 180 100 195 115 136 175 150
unidades vendidas
GRACIAS

Oficina de Investigación

También podría gustarte