Ejercicios de Correlación y Regresión Lineal Carlosmartinez
Ejercicios de Correlación y Regresión Lineal Carlosmartinez
Ejercicios de Correlación y Regresión Lineal Carlosmartinez
RA 50 82 64 50 63 81 80 72 72 69
RE 32 60 44 38 49 63 59 63 69 63
continúan retirados
No 19 11
orientados
orientados 12 8
Aprobados Reprobados
12 08
11 04
08 10
09 11
10 06
07 06
05 09
09 11
5. La cátedra de Estadística Aplicada a la Educación desea saber si existe
alguna relación entre el género de sus estudiantes y las calificaciones
obtenidas en el segundo parcial. Con base en los resultados obtenidos
concluya si existe alguna relación entre las variables consideradas.
F 15 14 18 11 15 16 10 18 16 17 17 11 17 15
M 10 15 11 09 11 13 14 11 12 14 13 15 10 14
CALIFICACIONES
Matemática 12 18 09 15 14 12 10 18 17 07
s
Física 13 14 16 08 19 06 20 13 14 17
5) Se desea conocer el grado de correlación entre las posiciones que ocupan 10 estudiantes de
una institución educativa en las pruebas de 100 metros y 200 metros, en vías de establecer
criterios de optimización en el uso de los atletas en futuras competiciones.
POSICIÓN
Estudiant 100 metros 200 metros
e
Quevedo 1 2
Rodríguez 2 1
Álvarez 3 3
Millán 4 6
Pérez 5 5
Alcántara 6 4
Fiorile 7 8
Carreras 8 7
a) Calcule e interprete el Coeficiente de Correlación adecuado.
b) Considera que los atletas que consiguieron las primeras cinco posiciones
en los 100 metros tienen posibilidades de estar entre los primeros cinco
puestos en la prueba de 200 metros.
6) Se desea determinar el grado de asociación entre el rendimiento académico
de 100 estudiantes de la Facultad de Ciencias de la UCV respecto a la
procedencia del tipo de plantel del grupo de estudiantes seleccionados.
Rendimiento Académico
Bueno Regular Deficiente
Tipo Oficial Público 16 14 5
de
Plantel Subsidiado 23 13 4
Privado 19 1 5
a) Aplique el Coeficiente de Correlación adecuado y razone su escogencia.
b) Interprete el resultado y en función de esto concluya.
7) Se desea estudiar la relación entre el gusto por las matemáticas y el gusto
por la lectura de 200 niños del 4to grado de varias instituciones de Fe y
Alegría de Ciudad Bolívar para el período 2002-01.
Gusto por las matemáticas
Si No
Gusto por Si 55 60
la lectura No 35 50
a) Aplique el Coeficiente de Correlación adecuado y razone su escogencia.
c) Interprete y concluya el resultado.
UNIVERSIDAD CENTRAL DE VENEZUELA
Profesora: Rosa Fiorile Flora
PARTE B
1. Un profesor de Estadística I desea conocer si existe relación entre el promedio de nota que sus alumnos
obtuvieron en los diversos trabajos de aplicación realizados durante el semestre y la nota definitiva de la
asignatura. A partir de los resultados obtenidos realice lo siguiente:
a- Analice la relación entre las variables a partir del diagrama de dispersión.
b- Calcule e interprete el valor del coeficiente de correlación más adecuado.
c- ¿Cuál seria la nota definitiva obtenida por un estudiante que en su promedio de notas de los trabajos de
aplicación obtuvo 17 ptos?.
d- Interprete el resultado obtenido en la pregunta anterior haciendo uso del error de estimación.
e- ¿Qué porcentaje de la variación total es explicado por la regresión de Y sobre X? Analice su resultado.
Notas Definitivas:
06 16 10 10 10 11 12 10 10 04 04 07 11 08 11 12 09 03 08 10 11 06 05 09 04 10 03 04 10 12
Promedio de trabajos:
09 16 12 11 10 15 14 13 13 10 03 12 11 06 12 14 12 13 10 13 15 07 12 11 07 13 03 04 14 13
_ Σ XY= 3040
PARTE C
2. Un profesor de Estadística I desea conocer si existe relación entre el promedio de nota que sus alumnos
obtuvieron en los diversos trabajos de aplicación realizados durante el semestre y la nota definitiva de la
asignatura. A partir de los resultados obtenidos realice lo siguiente:
Nota Definitiva 06 16 10 10 10 11 12 10 10 04
Promedio Trabajos 09 16 12 11 10 15 14 13 13 10
_ Σ XY= 1273
PARTE D:
Se le suministran tres situaciones problemáticas en las que debe realizar un análisis de correlación, escoja de
las tres solo una resuélvalo e interprete su resultado:
1. La siguiente tabla muestra la calificación total de un examen de Estadística (X) y la obtenida en el ítem 8, por una muestra de 10
estudiantes:
X: 13 8 14 13 10 9 12 11 13 11
Y: 1 0 0 1 0 0 1 1 1 0
Con base en estos resultados, realice los cálculos pertinentes y diga qué puede concluir en relación a la capacidad de discriminación del
ítem 8.
2. Un docente de Escuela Básica desea saber si existe alguna relación entre el orden en que sus alumnos entregan una prueba de
Lenguaje y los resultados obtenidos en la misma. Las calificaciones y el orden fueron los siguientes:
Orden de entrega 1 2 3 4 5
Calificaciones 15 17 13 8 10
3. Dos ítems X y Y, forman parte de un test de 100 ítems. La respuesta al ítem X es acertado por 100 y errado por 125 estudiantes de un
grupo de 225. El ítem Y lo resuelven 135, fallando 90 de la misma muestra. 80 de los 225 estudiantes resolvieron correctamente
ambos ítems. Utilizando el coeficiente apropiado, determine si hay relación en los resultados de ambos ítems. Justifique el coeficiente
utilizado.
PERÍODO 2001-2002
PARTE A
Seleccione la respuesta que complete correctamente la proposición numerada. Debe colocar en el paréntesis la letra que corresponda a la
respuesta seleccionada. Valor 1/ 2 subtotal 5 ptos.
Proposición Respuestas
1. Al calcular el Coeficiente de Correlación entre dos variables se a. múltiples
obtiene información sobre... ( ) b. en un nivel cuantitativo
3. Al medir el grado o intensidad de la correlación su resultado c. Positivo o negativo
podría ser... ( )
4. Cuando seleccionamos el Coeficiente de Correlación más d. la existencia de la relación
adecuado a una situación determinada, lo primero que debemos lineal entre las variables
considerar es... ( ) e. continuas
11. Los posibles resultados del sentido de la correlación pueden ser... k. R punto Biserial
( )
12. El Coeficiente PHI se utiliza para obtener información sobre el l. la relación causa efecto
grado y sentido de la relación existente entre variables de tipo... entre las dos variables
( )
13. Cuando dos variables en estudio están medidas en escala ordinal m. Spearman
el coeficiente de correlación más adecuado es... ( )
14. En el caso de las variables cuantitativas, el Diagrama de n. el grado y el sentido de la
Dispersión es de gran utilidad , ya que permite visualizar .( ) relación existente
o. están perfectamente
correlacionadas
PARTE B
1. El profesor Diosdado del Curso de Políticas Educativas de la Escuela de Educación de la UCV desea determinar la
relación de las notas definitivas con las notas del segundo parcial, por lo que necesita la ayuda de los alumnos de
Estadística Aplicada a la Educación para resolver sus inquietudes.
Notas II 12 10 10 09 15 17 19 07 05 15
parcial
Nota 11 12 12 08 13 17 20 10 07 17
definitivas
Facultad de Humanidades y Educación
Escuela de Educación
a. Representar la información en un diagrama de dispersión y analizar a través de éste la relación entre las variables. (1 pto)
b. Calcular e interpretar el Coeficiente de Correlación más adecuado y razonar su escogencia. (2 ptos)
c. De ser posible ajustar los datos a una línea recta. (1.5 ptos)
d. Determinar si el ajuste es bueno. (2.5 ptos)
e. Estimar cual podría ser la nota definitiva de un alumno que obtuvo 13 en el segundo parcial . (1 pto)
PARTE C
1. El profesor Diosdado también necesita saber si el orden en que sus alumnos entregaron el segundo parcial
esta relacionado con los resultados que obtuvieron en el mismo.
Orden de 4 6 8 7 5 3 2 10 9 1
entrega
II parcial 12 10 10 09 15 17 19 07 05 15
El profesor desea que usted:
a. Calcule el coeficiente de Correlación más adecuado (2 ptos)
b. Justifique las razones por las que usted considera que es el Coeficiente más adecuado. (1 pto)
2. El profesor José Vicente le comentó al Profesor Diosdado que él presumía que el ítem 10 relacionado con
la situación de PDVSA tiene una alta capacidad de discriminación en relación con las notas obtenidas en el II
parcial, el Prof. Diosdado no esta de acuerdo, por lo que se necesita que usted ayude a determinar quien tiene
la razón . No olvide que estos profesores son muy exigentes, por lo que deberá dar los argumentos necesarios
que justifiquen su posición a partir de la siguiente información. ( 3 ptos)
II parcial 12 10 10 09 15 17 19 07 05 15
Item 10 1 1 0 0 1 1 1 0 0 1
0: no acertó el ítem 10
1 : acertó el ítem 10
Análisis Bivariante
conjunta. Se puede hacer a niveles descriptivos e inferenciales. Se realizan dos tipos de análisis: correlación y
Correlación:
Indica que si X tiene relación con Y, y Y tiene que ver con X, la relación es en ambos sentidos biunívoca.
Determina la fuerza de la relación entre dos o más variables. Es una técnica o herramienta estadística para la
estimación del grado de asociación lineal entre variables.
1. Análisis lógico:
a. Identificación y n° de variables
b. Nivel, escala y tipo de variable.
c. Relación lógica o teórica entre las variables.
valor Interpretación
1 Muy alta
0.90 Alta
0.75 Media alta
0.5 Media
0.25 Media baja
0.10 Baja
0 despreciable
Signo: indica la dirección de la relación entre las variables, cuando es + la relación es directa, para
– la relación es inversa.
- +
Utiliza el nivel de medida de intervalo y razón que indica la asociación lineal entre dos variables. Es una
estrategia para calcular la asociación con variables de intervalo o de razón, que está asociada con la
regresión lineal.
-1 rxy +1
Covarianza:
Facultad de Humanidades y Educación
Escuela de Educación
Indica la asociación de variables con su signo. Es el promedio de los productos de las diferencias de los
valores a su media. La covarianza solo puede ser interpretada en nivel de razón (cero absoluto) para adaptar
el coeficiente a un nivel de medida de intervalo, Pearson encontró que si divide a la covarianza entre el
producto de las desviaciones típicas se obtiene una adaptación al coeficiente de correlación.
Amón (1978) plantea que la correlación entre X y Y es positiva cuando X y Y covarían en el mismo sentido, es
decir cuando a estar por encima de la media en X corresponde estar, también por encima de la media en Y, y
cuando esta por debajo de la media en X corresponde estar por debajo de la media en Y. La correlación entre
X y Y es negativa cuando covarían en sentido opuesto. La correlación será nula cuando no covarían en
ninguno de los dos sentidos (pp. 180).
Formulas de cálculo:
Zy
Zy Zy
-+ ++
-+ ++ ++
-+
Zx Zx Zx
-- +- -- +- -- +-
Indica el grado de asociación lineal entre dos variables ordinales. El coeficiente se calcula asignando a cada
valor de las variables, el rango correspondiente en función a las magnitudes medidas y el valor del
coeficiente dependerá de la diferencia entre los rangos que se consideren (Hamdam, 1994. pp. 93).
Facultad de Humanidades y Educación
Escuela de Educación
Es importante destacar que los valores de Spearman son sistemáticamente un poco inferiores a los
correspondientes valores de Pearson, pero la diferencia máxima, que ocurre cuando ambos coeficientes se
cercan a 0,50, es inferior a 0,02 (Gilford, 19 .pp. 267).
Al introducir una variable X, cuantitativa continua y otra variable Y dicotómica, el calculo del grado de
asociación entre las variables se realiza a través del coeficiente de correlación punto biserial
Regresión:
Es una expresión de la naturaleza básica de la relación entre variables dependiente e independiente. Indica la
cantidad en que Y cambiará cuando la variable independiente X varíe una unidad.
La regresión es un método para predecir el valor de la variable Y a partir del valor de la variable X a través del
ajuste a una relación funcional lineal que representa una línea de regresión sobre la cual caen los valores
predichos de Y a partir de los valores observados de X.
b: pendiente.
Es la magnitud de cambio de Y cuando X cambia una unidad.
a: intercepto.
Es el punto donde la pendiente corta al eje de Y.
Cuando se trata de construir una línea lo mejor posible para predecir Y en función de X se
compensan los errores en sentido vertical (byx).
Cuando se busca una línea que prediga lo mejor posible a X conociendo a Y se compensan los
errores en sentido horizontal (bxy)
Solo coinciden las dos rectas cuando la correlación es perfecta.
La diferencia entre (Yi – Ŷ) es el residuo o el error, entre lo que Y vale en realidad, Yi, y el valor que se predijo
por medio del modelo de regresión, Ŷ.
Cuando se realiza la regresión a partir del origen el intercepto vale cero, ya que la línea de regresión corta al
eje de Y donde él corta al eje de X, quedando: Y = bx
Para ello se debe lograr que la media y la desviación de ambas variables sean iguales X = Y y Sx = Sy. Se
expresan los valores de X y los valores de Y en Z: con media 0 y desviación 1.
ANÁLISIS BIVARIANTE
Es un análisis estadístico considerándose simultáneamente dos variables, que han de estar consideradas de
forma conjunta: una variable dependiente y una variable independiente.
Regresión:
Es una expresión de la naturaleza básica de la relación entre la variable dependiente e independiente.
Indica la cantidad en que Y cambiara cuando la variable independiente X varíe una unidad.
La regresión lineal intenta reflejar la relación entre X y Y por medio de una recta
Y (directa o +)
aumenta
X
Y (nula)
Aumenta es igual
Y (inversa o -)
disminuye
a b c
a) indica que a medida que aumenta una variable, aumenta la otra (directa o positiva)
b) indica que a medida que aumenta una variable, disminuye la otra (inversa o negativa)
c) no existe ninguna relación entre las dos variables
Magnitud
Sentido
2 Intervalo / Continua o
Razón Discreta
-1 ª 1
Magnitud
Sentido
1 Razón / Continua o
Intervalo Discreta
1 Ordinal Múltiple
0 a 1Magnitud -1 a 1
Continua
1 Intervalo
Dicotómica
1 Nominal
Cualitativas
Magnitud
Sentido
2 Ordinales Múltiples
0 a 1 Magnitud 0 a 1
2 nominales Dicotómica
s
Cualitativas Múltiples
0 a 1Magnitud
(nominales y
ordinales)
FORMULAS DE REGRESIÓN
Pendiente de la línea de Y a X
Intercepto de Y a partir de X
St = desviación total
p = proporción de éxito
q = proporción de fracaso
Coeficiente Phi
a b a+b
c d c+d
a+c b+d N
Coeficiente de Contingencia
Elaborado por: María Eugenia D’Aubeterre
Cátedra de Métodos Cuantitativos
Fo = frecuencia observada
Fe = frecuencia esperada