0% encontró este documento útil (0 votos)
249 vistas

Correlacion

Este documento introduce los conceptos de correlación y regresión lineal. Explica cómo medir el grado de relación entre dos variables usando el coeficiente de correlación de Pearson y desarrollar una ecuación de regresión para estimar los valores de una variable en función de la otra. Finalmente, propone un ejercicio práctico para analizar la relación entre las ventas de una bebida y su publicidad mediante un diagrama de dispersión, el cálculo de la recta de regresión y la clasificación del tipo de correlación.

Cargado por

DarmelysAlcalá
Derechos de autor
© © All Rights Reserved
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
249 vistas

Correlacion

Este documento introduce los conceptos de correlación y regresión lineal. Explica cómo medir el grado de relación entre dos variables usando el coeficiente de correlación de Pearson y desarrollar una ecuación de regresión para estimar los valores de una variable en función de la otra. Finalmente, propone un ejercicio práctico para analizar la relación entre las ventas de una bebida y su publicidad mediante un diagrama de dispersión, el cálculo de la recta de regresión y la clasificación del tipo de correlación.

Cargado por

DarmelysAlcalá
Derechos de autor
© © All Rights Reserved
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 10

Profesora: Maria Eugenia Lozada

Correlación y Regresión Lineal

INTRODUCCIÓN ________________________________________________________

El objetivo de este correo es analizar el grado de la relación existente entre


variables utilizando modelos matemáticos y representaciones gráficas. Así pues, para
representar la relación entre dos o más variables desarrollaremos una ecuación que
permitirá estimar una variable en función de la otra.

Por ejemplo, ¿en qué medida, un aumento de los gastos en publicidad hace
aumentar las ventas de un determinado producto?, ¿cómo representamos que la bajada
de temperaturas implica un aumento del consumo de la calefacción?...

A continuación, estudiaremos dicho grado de relación entre dos variables en lo que


llamaremos análisis de correlación. Para representar esta relación utilizaremos una
representación gráfica llamada diagrama de dispersión y, finalmente, estudiaremos un
modelo matemático para estimar el valor de una variable basándonos en el valor de otra,
en lo que llamaremos análisis de regresión.

OBJETIVOS _____________________________________________________________

• Aprender a calcular la correlación entre dos variables


• Saber dibujar un diagrama de dispersión
• Representar la recta que define la relación lineal entre dos variables
• Saber estimar la recta de regresión
• Realizar inferencia sobre los parámetros de la recta de regresión
• Predecir la variable independiente en función de la variable dependiente mediante la
recta de regresión

CONOCIMIENTOS PREVIOS ______________________________________________

Es recomendable haber leído, previamente, los correos


Profesora: Maria Eugenia Lozada

Correlación y Regresión Lineal

CONCEPTOS FUNDAMENTALES__________________________________________

 Definición de Correlación Lineal

La correlación trata de establecer la relación o dependencia que existe entre las dos
variables que intervienen en una distribución bidimensional.

Es decir, determinar si los cambios en una de las variables influyen en los cambios de la
otra. En caso de que suceda, diremos que las variables están correlacionadas o que hay
correlación entre ellas.

 Tipos de correlación

a) Correlación Directa:

La correlación directa se da cuando al aumentar una de las variables la otra aumenta. En


este caso la relación tiene un valor positivo significa que a valores altos en una variable
corresponden valores altos en la otra variable.

b) Correlación Inversa:

La correlación inversa se da cuando al aumentar una de las variables la otra disminuye.


En este caso la relación tiene signo negativo significa que las variables están relacionadas
de manera inversa de modo que cuando el valor aumenta en una, disminuye en la otra.

CONCEPTOS FUNDAMENTALES__________________________________________

c) Correlación Nula

La correlación nula se da cuando no hay dependencia entre las variables. En este caso se dice
que no hay una correlación lineal

Representación grafica
Profesora: Maria Eugenia Lozada

Correlación y Regresión Lineal

Correlación N ula Correlación D irecta Correlación Invers a

 Definición Regresión

Proceso general que consiste en predecir una variable a partir de otra mediante
medios estadísticos, utilizando datos anteriores

Recta de Regresión

Se llama así a la recta que atraviesa la nube de puntos y que mejor se ajusta a ellos. Si
llegamos a conocer esa ecuación, podremos llegar a estimar valores de”y” desconocidos a
partir de valores de “x” conocidos. La ecuación de una recta, ecuación de estimación o de
regresión es:

Dónde:
Y = es la variable dependiente
a = es el punto de intersección en y
b = es la pendiente de la recta. Si b es positiva (+) indica un una correlación directa; si b es
negativa (-) la correlación es inversa
X = La variable dependiente
Profesora: Maria Eugenia Lozada

Correlación y Regresión Lineal

Nota: Para determinar la ecuación de regresión es necesario calcular a y b, con las formulas
a continuación

Donde: es la media de las X, es decir la sumatoria de todos los valores de X


entre el número de datos y es la media de las Y es decir la sumatoria de todos los
valores de y dividido entre el número de datos.

CONCEPTOS FUNDAMENTALES__________________________________________

 Coeficiente de correlación de Pearson (Ґ)

Este coeficiente nos informa del grado de relación entre dos variables. El coeficiente Ґ
será positivo si la relación es positiva (al aumentar x aumenta y), y Ґ será negativo en el caso
contrario (si al aumentar x, disminuye y).

Coeficiente de Interpretación
correlación
1.00 Correlación Perfecta
0.80 a 0.99 Una alta relación de dependencia o correlación fuerte
0.60 a 0.79 Una relación entre moderada a acentuada
0.40 a 0.59 Una mediana relación
0.20 a 0.39 Una ligera relación o correlación débil
0.00 a 0.19 Una relación fortuita o insignificante

Ejercicio_________________________________________________________________
Profesora: Maria Eugenia Lozada

Correlación y Regresión Lineal

Zippy Cola está estudiando el efecto de su última campaña publicitaria. Se


escogieron personas al azar y se les llamó para preguntarles cuántas latas de Zippy Cola
habían comprado la semana anterior y cuántos anuncios de Zippy cola habían leído o visto
la semana anterior.

X (números de anuncios) 3 7 4 2 0 4 1 2
y(latas compradas) 11 18 9 4 7 6 3 8

a. Construya el diagrama de dispersión, concluya


b. Desarrolle la ecuación de estimación que mejor se ajuste a los datos
c. Construya la recta de regresión.
d. Clasifique el tipo de correlación que rige el comportamiento o dependencia de las
variables observadas.
e. Mediante la ecuación de regresión prediga el valor del número de latas compradas
por una persona que leyó 5 anuncios.
f. Una persona compro 10 latas de Zippy, estime cuantos anuncios leyó
g. Calcule el valor del coeficiente de Pearson. Concluya

Ejercicio propuesto del Libro Estadística para Administradores de Richard Levín

Solución ________________________________________________________________
Profesora: Maria Eugenia Lozada

Correlación y Regresión Lineal

Cálculos:

Multiplicar columna 1 Elevar al


por columna 2 cuadrado la Elevar al cuadrado la
Columna 1 Columna 2

N° N° latas
anuncios Y XY X² Y²
X
3 11 33 9 121
7 18 126 49 324
4 9 36 16 81
2 4 8 4 16
0 7 0 0 49
4 6 24 16 36
1 3 3 1 9
2 8 16 4 64
23 66 246 99 700

ES DECIR LAS VALROES TOTALES (SUMATORIAS) POR COLUMNAS SON


LOS SIGUIENTES:
∑X=23
∑Y=66
Profesora: Maria Eugenia Lozada

Correlación y Regresión Lineal

∑XY=246
∑X²=99
∑Y²=700

a. Construcción del diagrama de dispersión. ( A cada valor de x se asocia con el


valor de y para crear cada uno de los puntos)

Conclusión:
Se observa una Correlación Directa
Profesora: Maria Eugenia Lozada

Correlación y Regresión Lineal

b. Desarrolle la ecuación de estimación que mejor se ajuste a los datos

Tenemos que la ecuación de estimación es:

 Cálculo de la pendiente de la recta (b):

Donde

5
y

Luego se susitutye en la formaula cada valor

 Cálculo de del punto de corte con el eje “Y” (a):


Profesora: Maria Eugenia Lozada

Correlación y Regresión Lineal

Finalmente sustituyendo los valores de a y b en la ecuación de regresión tenemos que:

c. Construya la Recta de Regresión

Utilizamos la ecuación de regresión para trazar la recta. Para esto, seleccionamos dos
valores cualquiera de X se recomienda tomar el valor mayor y menor de X en la tabla de
datos. Donde está la X se coloca el numero o valor que vamos a sustituir

Tenemos que:

Para X1 = 0

Para X2 = 7

Obtenemos un valore de Y para cada valor de X, estos pares de valores se grafican sobre la
grafica de dispersión y obtenemos:
X1= 0 X2= 7
Y1 = 3,33 Y2 = 15,3

d. Clasifique el tipo de correlación que rige el comportamiento o dependencia de las


variables observadas.
Profesora: Maria Eugenia Lozada

Correlación y Regresión Lineal

Ya que b es mayor que cero ( , entonces podemos afirmar que existe


una correlación directa es decir que a medida que las personas lean mas anuncios de
Zipp Cola, comprara mas y viceversa.

e. Mediante la ecuación de regresión prediga el valor del número de latas compradas


por una persona que leyó 5 anuncios.
X= 5 ; Y= ? : se sustituye X en la ecuación de regresión

Aproximadamente 12

Conclusión: Se estima que para una persona que leyó 5 anuncios, comprara 12 latas
de Zipp Cola

f. Una persona compro 10 latas de Zippy, Cola estime cuantos anuncios leyó
Se despeja de la ecuación de regresión X
Y=10; X=?

Aproximadamente 4

Conclusión: Se estima que una persona que haya comprado 10 lata de Zipp Cola
debe haber leído 4 anuncios.

g. Calcule el valor del coeficiente de Pearson. Concluya

Conclusión: Existe una moderada correlación lineal entre el número de anuncios


leído y el número de latas compradas, es decir que a mayor anuncio leído mayor
será el número de datos comprados.

También podría gustarte