Ejercicios de Correlación y Regresión Lineal Carlosmartinez

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 20

EJERCICIOS DE CORRELACIÓN Y REGRESIÓN LINEAL

1. En dos exámenes distintos que le realizaron a un mismo salón, se anotó


el orden de entrega de los mismos. En base a los resultados concluya, si
el orden de entrega del examen es típico para cada examen o si en
cambio depende más de la persona que esta respondiendo el examen.

sujeto Examen 1 Examen 2


1 1 3
2 5 7
3 2 1
4 3 2
5 7 6
6 8 8
7 4 4
8 6 5

2. Un investigador quiere conocer la asociación entre el puntaje de


razonamiento abstracto y el puntaje de razonamiento espacial, en un
grupo de 10 personas.

RA 50 82 64 50 63 81 80 72 72 69
RE 32 60 44 38 49 63 59 63 69 63

3. Un autor investiga sobre el éxito de sus estrategias de orientación


vocacional. Para eso registra los datos de 30 jóvenes que orientó y de 20
que no fueron orientados y les pregunto si aun continúan la carrera que
seleccionaron al ingresar a la universidad. Concluya al respecto.

continúan retirados
No 19 11
orientados
orientados 12 8

4. Se compararon las notas en Estadística en un grupo de alumnos que


aprobaron unos y reprobaron otros, el tercer parcial de Sociología.
Evalué la relación entre las dos variables con los datos que se presentan
a continuación:

Aprobados Reprobados
12 08
11 04
08 10
09 11
10 06
07 06
05 09
09 11
5. La cátedra de Estadística Aplicada a la Educación desea saber si existe
alguna relación entre el género de sus estudiantes y las calificaciones
obtenidas en el segundo parcial. Con base en los resultados obtenidos
concluya si existe alguna relación entre las variables consideradas.

F 15 14 18 11 15 16 10 18 16 17 17 11 17 15
M 10 15 11 09 11 13 14 11 12 14 13 15 10 14

6. Se quiere ver si existe relación entre la mención cursada en bachillerato


y el puntaje obtenido en el curso de Sociología. De 110 mujeres, 90
están aplazadas, de ellas 70 estudiaron en Ciencias y el resto en
Humanidades. De los hombres que son 40, 25 estudiaron en
Humanidades y 12 están aprobados. De respuestas a la primera
interrogante.

7. Se busca establecer si hay relación entre el puntaje de la parte teórica


del 1er parcial de Estadística y la parte practica del mismo.

T 2 2,5 1,5 1,5 3 2 3 2,5


P 2 1 2 1 4 3,5 5 1

a. Si un alumno obtuviera en teoría 5 puntos ¿Cuánto se


espera que obtenga en la parte practica?
b. Un alumno que obtuvo una calificación de 2,5 puntos en
la práctica ¿Cuánto se espera que halla obtenido en la
parte teórica?

GUÍA DE EJERCICIOS PRÁCTICOS DE ESTADÍSTICA II.

1) Complete las siguientes expresiones:

a) Al calcular el Coeficiente de Correlación entre dos variables se obtiene


información sobre: ____________________________.
b) El grado de asociación entre dos variables se puede determinar a través
de los coeficientes: _______________________________.
c) Al medir el grado o intensidad de la correlación su resultado podría ser:
_______________________.
d) Cuando seleccionamos el coeficiente de correlación más adecuado a una
situación determinada, lo primero que debemos considerar es:
__________________________.
e) El Coeficiente de Contingencia se utiliza para obtener información sobre
el grado de asociación existente entre variables de tipo:
_________________________.
f) Es condición fundamental para aplicar el coeficiente de Pearson que las
variables estén medidas en: ________________________________.
g) El Coeficiente de Correlación Lineal se aplica cuando se mide en:
_____________________.
h) Los posibles valores que se pueden obtener del Coeficiente de
Correlación son: _________________.
i) Cuando dos variables en estudio están mediadas en escala ordinal el
coeficiente de correlación más adecuado es:
____________________________.
j) En el caso de las variables cuantitativas, el diagrama de dispersión es de
gran utilidad ya que permite visualizar:
____________________________.
k) El Coeficiente R punto Biserial se utilizar para obtener la relación
existente entre variables de tipo: ________________________.
l) El coeficiente PHI se utiliza para obtener información sobre el grado de
asociación existente entre variables de tipo:
_________________________.
m) Los posibles resultados del sentido de la correlación pueden ser:
____________________.

2) Responda a los siguientes planteamientos:


a) Si el valor del Coeficiente de Correlación entre los exámenes de
Matemáticas y de Castellano es de –0,85, alguien que hiciera muy mal el
examen de Castellano probablemente saldría de qué forma en el otro
examen.
b) Si en una institución educativa el coeficiente de correlación entre los
resultados de una prueba final de un grupo de estudiantes y su sexo es de
–0,25; ¿Cuál sería su conclusión.
c)   0,79 es la correlación existente entre las posiciones que ocupan veinte
estudiantes en las calificaciones de Estadísticas 1 y Métodos
Estadísticos. Interprete dicho resultado.
d) Se aplicó el Coeficiente PHI para estudiar el grado de asociación entre el
gusto por el alcohol y el gusto por el tabaco en un grupo de estudiantes
de la UCV arrojando un valor de   0,68 . Interprete dicho resultado.
3) Se tienen los datos correspondientes a las calificaciones de 12 estudiantes
de la U. E. Antonio Nicolás Briceño del 2do año del Ciclo Diversificado en las
pruebas de Matemáticas y Física.

CALIFICACIONES
Matemática 12 18 09 15 14 12 10 18 17 07
s
Física 13 14 16 08 19 06 20 13 14 17

a) Representa la información en un diagrama de dispersión y analiza a


través de éste la relación entre los resultados de las pruebas aplicadas.
b) Calcule el Coeficiente de Correlación más adecuado y razone su
escogencia.
c) Interprete el resultado del coeficiente obtenido.

4) Se quiere estudiar si existe relación entre los resultados obtenidos en


Estadística 1 y el sexo de los estudiantes. Para ello usted debe utilizar el
coeficiente de correlación que considere adecuado e interpretar dicho valor en
vías de esclarecer el problema en estudio.

SEXO Calificación SEXO Calificación


M 13 F 14
F 09 F 17
F 19 F 11
M 15 M 15
M 14 F 08
F 08 F 20
M 07 M 15

5) Se desea conocer el grado de correlación entre las posiciones que ocupan 10 estudiantes de
una institución educativa en las pruebas de 100 metros y 200 metros, en vías de establecer
criterios de optimización en el uso de los atletas en futuras competiciones.
POSICIÓN
Estudiant 100 metros 200 metros
e
Quevedo 1 2
Rodríguez 2 1
Álvarez 3 3
Millán 4 6
Pérez 5 5
Alcántara 6 4
Fiorile 7 8
Carreras 8 7
a) Calcule e interprete el Coeficiente de Correlación adecuado.
b) Considera que los atletas que consiguieron las primeras cinco posiciones
en los 100 metros tienen posibilidades de estar entre los primeros cinco
puestos en la prueba de 200 metros.
6) Se desea determinar el grado de asociación entre el rendimiento académico
de 100 estudiantes de la Facultad de Ciencias de la UCV respecto a la
procedencia del tipo de plantel del grupo de estudiantes seleccionados.

Rendimiento Académico
Bueno Regular Deficiente
Tipo Oficial Público 16 14 5
de
Plantel Subsidiado 23 13 4
Privado 19 1 5
a) Aplique el Coeficiente de Correlación adecuado y razone su escogencia.
b) Interprete el resultado y en función de esto concluya.
7) Se desea estudiar la relación entre el gusto por las matemáticas y el gusto
por la lectura de 200 niños del 4to grado de varias instituciones de Fe y
Alegría de Ciudad Bolívar para el período 2002-01.
Gusto por las matemáticas
Si No
Gusto por Si 55 60
la lectura No 35 50
a) Aplique el Coeficiente de Correlación adecuado y razone su escogencia.
c) Interprete y concluya el resultado.
UNIVERSIDAD CENTRAL DE VENEZUELA
Profesora: Rosa Fiorile Flora

Algunas Actividades de estudio


PARTE A
Instrucciones : Selecciona la respuesta que mejor responda la pregunta o complete la proposición
numerada. Encierre en un círculo la letra que aparece a la izquierda da la seleccionada.
1. Al calcular el valor del Coeficiente de 2. Los posibles resultados del sentido de la
Correlación entre dos variables, se obtiene correlación pueden ser:
información sobre: a. Positivo o negativo.
a. La relación causa - efecto entre las dos b. Cualquier valor entre 0 y 1.
variables. c. Inverso o negativo.
b. El grado en que las dos variables están d. Cualquier valor entre +1 y –1.
relacionadas. e. Directo o positivo.
c. El grado y el sentido de la relación 3. Al medir el grado o intensidad de la
existente. correlación, su resultado podría ser:
d. El sentido de la relación. a. Positivo o negativo.
e. La dependencia o independencia de las b. Cualquier valor entre 0 y 1.
variables. c. Inverso o negativo.
d. Cualquier valor entre +1 y –1. 10. La fracción Σ (Y-Y)2 representa:
e. Directo o positivo. Σ (Y-Y)2
4. La condición que debe cumplirse entre las a. La fracción de la variación total de Y que
variables para que sea aceptable el ajuste de una no se explica por el modelo de regresión.
recta de regresión es: b. La fracción de la variación total de Y que
a. Independencia. se explica por el modelo de regresión.
b. Causalidad. c. La fracción de variación total de Y que fue
c. Dependencia. causada por los cambios de X.
d. Linealidad. d. La variación total.
5. Un coeficiente de correlación igual a 11. El coeficiente “C” de Contingencia es de gran
0,90 indica que: utilidad para evaluar la relación entre las
a. La variable X produce los cambios en las variables, cuando:
variables Y. a. Tenemos un número de datos mayor a 50.
b. La variable Y puede ser conocida a partir b. Las variables están en escala nominal-
de valores X. dicotómica.
c. Existe una estrecha relación inversa entre c. Tenemos un número de datos mayor a 25.
las variables. d. Las variables están en escala nominal-
d. Existe un fuerte grado de asociación entre múltiple.
las variables. e. Tenemos tablas 3 x 3.
e. La covarianza es igual a 0,90. 12. Para que la ecuación de estimación sea un
6. Si el error típico de estimación de la recta de estimador perfecto de la variable dependiente,
¿Cuál de estos enunciados deberá ser
regresión SY/X es igual a cero quiere decir que las
verdadero?:
variables : a. El error estándar de la estimación es cero
a. No están correlacionadas. b. Todos los puntos de datos se hallan sobre
b. Son independientes. la línea de regresión
c. Están correlacionadas suavemente. c. El coeficiente de determinación es –1
d. Están perfectamente correlacionadas. d. Todas las anteriores
e. Tienen una correlación positiva. e. a y b pero no c.
7. Si el valor del coeficiente de correlación entre
dos pruebas de conocimiento A y B, es de –0,95, 13. Cuando seleccionamos el Coeficiente de
alguien que hiciera muy bien la prueba A, Correlación más adecuado a una situación
probablemente obtendría en la prueba B determinada, lo primero que debemos considerar
resultados: es:
a. Muy malos. a. La facilidad de los cálculos.
b. Malos. b. El nivel de medición alcanzado en las
c. Muy buenos. variables.
d. Regulares. c. La intensidad de la relación entre las
e. Excelentes. variables.
8. Cuando una de las variables en estudio está d. El sentido de la relación.
medida en escala nominal – dicotómica, y la otra e. El número de casos.
es continua, el coeficiente de correlación más
adecuado es: 14. En el caso de variables cuantitativas, el
a. Phi. Diagrama de Dispersión es de gran utilidad, ya
b. Spearman. que permite visualizar:
c. r punto biserial. a. El valor exacto del coeficiente de
d. Pearson. correlación.
e. Contingencia. b. La relación entre los valores altos y bajos.
9. Es condición fundamental para aplicar el c. La existencia de relación lineal entre las
coeficiente de correlación de Pearson que las variables.
variables estén medidas: d. La variable dependiente y la
a. En escala ordinal. independiente.
b. En nivel cuantitativo. e. Los valores de las dos series de datos.
c. Una en escala de intervalos y otra ordinal.
d. Una en escala de intervalos y otra nominal.
e. En nivel cualitativo.
Facultad de Humanidades y Educación
Escuela de Educación

PARTE B

1. Un profesor de Estadística I desea conocer si existe relación entre el promedio de nota que sus alumnos
obtuvieron en los diversos trabajos de aplicación realizados durante el semestre y la nota definitiva de la
asignatura. A partir de los resultados obtenidos realice lo siguiente:
a- Analice la relación entre las variables a partir del diagrama de dispersión.
b- Calcule e interprete el valor del coeficiente de correlación más adecuado.
c- ¿Cuál seria la nota definitiva obtenida por un estudiante que en su promedio de notas de los trabajos de
aplicación obtuvo 17 ptos?.
d- Interprete el resultado obtenido en la pregunta anterior haciendo uso del error de estimación.
e- ¿Qué porcentaje de la variación total es explicado por la regresión de Y sobre X? Analice su resultado.

Notas Definitivas:
06 16 10 10 10 11 12 10 10 04 04 07 11 08 11 12 09 03 08 10 11 06 05 09 04 10 03 04 10 12

Promedio de trabajos:
09 16 12 11 10 15 14 13 13 10 03 12 11 06 12 14 12 13 10 13 15 07 12 11 07 13 03 04 14 13

Y= 8,53 SY = 3,19 Σ Y= 2490 Σ Y2= 256

_ Σ XY= 3040

X= 10,93 SX = 3,43 Σ X= 3490 Σ X2= 328

PARTE C

2. Un profesor de Estadística I desea conocer si existe relación entre el promedio de nota que sus alumnos
obtuvieron en los diversos trabajos de aplicación realizados durante el semestre y la nota definitiva de la
asignatura. A partir de los resultados obtenidos realice lo siguiente:

a- Analice la relación entre las variables a partir del diagrama de dispersión.


b- Calcule e interprete el valor del coeficiente de correlación más adecuado.
c- ¿Cuál seria la nota definitiva obtenida por un estudiante que en su promedio de notas de los trabajos de
aplicación obtuvo 17 ptos?.
d- Interprete el resultado obtenido en la pregunta anterior haciendo uso del error de estimación.
e- ¿Qué porcentaje de la variación total es explicado por la regresión de Y sobre X? Analice su resultado.
Facultad de Humanidades y Educación
Escuela de Educación

Nota Definitiva 06 16 10 10 10 11 12 10 10 04

Promedio Trabajos 09 16 12 11 10 15 14 13 13 10

Y= 9.9 SY = 3,05 Σ Y= 99 Σ Y2= 1073

_ Σ XY= 1273

X= 12.3 SX = 2,91 Σ X= 123 Σ X2= 1561

PARTE D:

Se le suministran tres situaciones problemáticas en las que debe realizar un análisis de correlación, escoja de
las tres solo una resuélvalo e interprete su resultado:

1. La siguiente tabla muestra la calificación total de un examen de Estadística (X) y la obtenida en el ítem 8, por una muestra de 10
estudiantes:

X: 13 8 14 13 10 9 12 11 13 11
Y: 1 0 0 1 0 0 1 1 1 0

Con base en estos resultados, realice los cálculos pertinentes y diga qué puede concluir en relación a la capacidad de discriminación del
ítem 8.

2. Un docente de Escuela Básica desea saber si existe alguna relación entre el orden en que sus alumnos entregan una prueba de
Lenguaje y los resultados obtenidos en la misma. Las calificaciones y el orden fueron los siguientes:

Orden de entrega 1 2 3 4 5
Calificaciones 15 17 13 8 10

Se desea que usted:

a. Calcule e interprete el coeficiente de correlación más adecuado.


b. Justifique las razones que lo hicieron optar por ese coeficiente de correlación.

3. Dos ítems X y Y, forman parte de un test de 100 ítems. La respuesta al ítem X es acertado por 100 y errado por 125 estudiantes de un
grupo de 225. El ítem Y lo resuelven 135, fallando 90 de la misma muestra. 80 de los 225 estudiantes resolvieron correctamente
ambos ítems. Utilizando el coeficiente apropiado, determine si hay relación en los resultados de ambos ítems. Justifique el coeficiente
utilizado.

UNIVERSIDAD CENTRAL DE VENEZUELA


FACULTAD DE HUMANIDADES Y EDUCACIÓN
ESCUELA DE EDUCACIÓN
CATEDRA DE METODOS CUANTITATIVOS
ESTADÍSTICA APLICADA A LA EDUCACIÓN
Facultad de Humanidades y Educación
Escuela de Educación

PERÍODO 2001-2002

III EXAMEN PARCIAL (PROPUESTA)

PARTE A

Seleccione la respuesta que complete correctamente la proposición numerada. Debe colocar en el paréntesis la letra que corresponda a la
respuesta seleccionada. Valor 1/ 2 subtotal 5 ptos.

Proposición Respuestas
1. Al calcular el Coeficiente de Correlación entre dos variables se a. múltiples
obtiene información sobre... ( ) b. en un nivel cuantitativo
3. Al medir el grado o intensidad de la correlación su resultado c. Positivo o negativo
podría ser... ( )
4. Cuando seleccionamos el Coeficiente de Correlación más d. la existencia de la relación
adecuado a una situación determinada, lo primero que debemos lineal entre las variables
considerar es... ( ) e. continuas

6. Es condición fundamental para aplicar el coeficiente de Pearson f. cualquier valor entre –1 y


que las variables estén medidas... ( ) 1
7. Si el error típico de estimación de la recta de regresión Sy/x es g. cualitativo
igual a cero quiere decir que las variables.... ( ) h. discretas

9. El Coeficiente de Contingencia se utiliza para obtener i. el nivel de medición


información sobre el grado y sentido de la relación existente entre alcanzado en las variables
variables de tipo... ( ) j. dicotómicas

11. Los posibles resultados del sentido de la correlación pueden ser... k. R punto Biserial
( )
12. El Coeficiente PHI se utiliza para obtener información sobre el l. la relación causa efecto
grado y sentido de la relación existente entre variables de tipo... entre las dos variables
( )
13. Cuando dos variables en estudio están medidas en escala ordinal m. Spearman
el coeficiente de correlación más adecuado es... ( )
14. En el caso de las variables cuantitativas, el Diagrama de n. el grado y el sentido de la
Dispersión es de gran utilidad , ya que permite visualizar .( ) relación existente
o. están perfectamente
correlacionadas

PARTE B

1. El profesor Diosdado del Curso de Políticas Educativas de la Escuela de Educación de la UCV desea determinar la
relación de las notas definitivas con las notas del segundo parcial, por lo que necesita la ayuda de los alumnos de
Estadística Aplicada a la Educación para resolver sus inquietudes.

Notas II 12 10 10 09 15 17 19 07 05 15
parcial
Nota 11 12 12 08 13 17 20 10 07 17
definitivas
Facultad de Humanidades y Educación
Escuela de Educación

Para satisfacer al profesor usted deberá:

a. Representar la información en un diagrama de dispersión y analizar a través de éste la relación entre las variables. (1 pto)
b. Calcular e interpretar el Coeficiente de Correlación más adecuado y razonar su escogencia. (2 ptos)
c. De ser posible ajustar los datos a una línea recta. (1.5 ptos)
d. Determinar si el ajuste es bueno. (2.5 ptos)
e. Estimar cual podría ser la nota definitiva de un alumno que obtuvo 13 en el segundo parcial . (1 pto)

PARTE C

1. El profesor Diosdado también necesita saber si el orden en que sus alumnos entregaron el segundo parcial
esta relacionado con los resultados que obtuvieron en el mismo.

Orden de 4 6 8 7 5 3 2 10 9 1
entrega
II parcial 12 10 10 09 15 17 19 07 05 15
El profesor desea que usted:
a. Calcule el coeficiente de Correlación más adecuado (2 ptos)
b. Justifique las razones por las que usted considera que es el Coeficiente más adecuado. (1 pto)

2. El profesor José Vicente le comentó al Profesor Diosdado que él presumía que el ítem 10 relacionado con
la situación de PDVSA tiene una alta capacidad de discriminación en relación con las notas obtenidas en el II
parcial, el Prof. Diosdado no esta de acuerdo, por lo que se necesita que usted ayude a determinar quien tiene
la razón . No olvide que estos profesores son muy exigentes, por lo que deberá dar los argumentos necesarios
que justifiquen su posición a partir de la siguiente información. ( 3 ptos)

II parcial 12 10 10 09 15 17 19 07 05 15
Item 10 1 1 0 0 1 1 1 0 0 1
0: no acertó el ítem 10
1 : acertó el ítem 10

Análisis Bivariante

Es un análisis considerándose simultáneamente 2 variables, que han de estar consideradas de forma

conjunta. Se puede hacer a niveles descriptivos e inferenciales. Se realizan dos tipos de análisis: correlación y

regresión. Ambos se aplican para formar lineales o curvilíneas.

Correlación:
Indica que si X tiene relación con Y, y Y tiene que ver con X, la relación es en ambos sentidos biunívoca.
Determina la fuerza de la relación entre dos o más variables. Es una técnica o herramienta estadística para la
estimación del grado de asociación lineal entre variables.

X aumenta, Y aumenta (relación directa y positiva)


X aumenta, Y no se modifica (no existe relación)
X aumenta, Y disminuye (relación directa y negativa)

Pasos para el análisis de correlación


Facultad de Humanidades y Educación
Escuela de Educación

1. Análisis lógico:
a. Identificación y n° de variables
b. Nivel, escala y tipo de variable.
c. Relación lógica o teórica entre las variables.

2. Concepción del diagrama de dispersión:


a. Es un diagrama bajo ejes cartesianos en donde X se coloca en las ordenadas y Y en las
abscisas.
b. Es un conjunto de puntos que se obtienen por pares ordenados, tantos puntos como par de
datos hay.
c. Las variables deben estar en un nivel cuantitativo.
d. Se busca ver si la relación que existe entre las variables se representa por una línea recta o no.
Se representa en un plano como se ubican los puntos en el espacio. Indicara si existe una
relación, y como es la relación. Toda nube de puntos que sea avalada tiende a expresar una
relación lineal entre las variables. Mientras más concentrados estén los puntos alrededor de
una línea recta la relación será mas fuerte.

3. Calculo de coeficiente de correlación.

4. Interpretación de los resultados.

 Tamaño, monto o valor: +1 y –1 indica la fuerza de la asociación.

valor Interpretación
1 Muy alta
0.90 Alta
0.75 Media alta
0.5 Media
0.25 Media baja
0.10 Baja
0 despreciable

 Signo: indica la dirección de la relación entre las variables, cuando es + la relación es directa, para
– la relación es inversa.

- +

Correlación producto momento de Pearson.

N: numero de pares asociados

Utiliza el nivel de medida de intervalo y razón que indica la asociación lineal entre dos variables. Es una
estrategia para calcular la asociación con variables de intervalo o de razón, que está asociada con la
regresión lineal.
-1 rxy +1

Covarianza:
Facultad de Humanidades y Educación
Escuela de Educación

Indica la asociación de variables con su signo. Es el promedio de los productos de las diferencias de los
valores a su media. La covarianza solo puede ser interpretada en nivel de razón (cero absoluto) para adaptar
el coeficiente a un nivel de medida de intervalo, Pearson encontró que si divide a la covarianza entre el
producto de las desviaciones típicas se obtiene una adaptación al coeficiente de correlación.

Amón (1978) plantea que la correlación entre X y Y es positiva cuando X y Y covarían en el mismo sentido, es
decir cuando a estar por encima de la media en X corresponde estar, también por encima de la media en Y, y
cuando esta por debajo de la media en X corresponde estar por debajo de la media en Y. La correlación entre
X y Y es negativa cuando covarían en sentido opuesto. La correlación será nula cuando no covarían en
ninguno de los dos sentidos (pp. 180).

Formulas de cálculo:

Factores de los que depende rxy

1. Variabilidad del grupo:


El coeficiente de correlación de Pearson queda reducido al restringir la variabilidad del grupo en una
variable (o en las dos)
2. Influjo de una tercera variable
Con frecuencia variables ajenas a las consideradas también pueden influir sobre la asociación observada

Graficas de dispersión o dispersigrama.


En un grafica de dispersión, cada marca (punto o raya) representa la intersección de dos valores, hay una
marca para cada par de observaciones de los temas. El propósito principal de la grafica de dispersión es
mostrar de manera grafica la relación entre dos variables.

Zy
Zy Zy
-+ ++
-+ ++ ++
-+

Zx Zx Zx

-- +- -- +- -- +-

rxy = -1 rxy = 0 rxy = +1

Correlación ordinal de Spearman.

Indica el grado de asociación lineal entre dos variables ordinales. El coeficiente se calcula asignando a cada
valor de las variables, el rango correspondiente en función a las magnitudes medidas y el valor del
coeficiente dependerá de la diferencia entre los rangos que se consideren (Hamdam, 1994. pp. 93).
Facultad de Humanidades y Educación
Escuela de Educación

Es importante destacar que los valores de Spearman son sistemáticamente un poco inferiores a los
correspondientes valores de Pearson, pero la diferencia máxima, que ocurre cuando ambos coeficientes se
cercan a 0,50, es inferior a 0,02 (Gilford, 19 .pp. 267).

Correlación punto biserial

X es la variable cuantitativa continua y Y es la dicotómica


p es la proporción de personas con una de las dos modalidades posibles en la variable Y.
q es la proporción de personas con la otra modalidad.
Xp es la media en X de las personas cuya proporción es p.
Xq es la media en X de las personas cuya proporción es q.
X es la media en X de todas las personas
Sx es la desviación típica de todas las personas.

Al introducir una variable X, cuantitativa continua y otra variable Y dicotómica, el calculo del grado de
asociación entre las variables se realiza a través del coeficiente de correlación punto biserial

Regresión:
Es una expresión de la naturaleza básica de la relación entre variables dependiente e independiente. Indica la
cantidad en que Y cambiará cuando la variable independiente X varíe una unidad.

La regresión es un método para predecir el valor de la variable Y a partir del valor de la variable X a través del
ajuste a una relación funcional lineal que representa una línea de regresión sobre la cual caen los valores
predichos de Y a partir de los valores observados de X.

b: pendiente.
Es la magnitud de cambio de Y cuando X cambia una unidad.

a: intercepto.
Es el punto donde la pendiente corta al eje de Y.

 Cuando se trata de construir una línea lo mejor posible para predecir Y en función de X se
compensan los errores en sentido vertical (byx).
 Cuando se busca una línea que prediga lo mejor posible a X conociendo a Y se compensan los
errores en sentido horizontal (bxy)
 Solo coinciden las dos rectas cuando la correlación es perfecta.

Método de los mínimos cuadrados


Da lugar a una recta que hace mínimos los cuadrados de las distancias verticales desde cada punto
representativo de una observación a la recta, es decir, tomando en cuenta que Yi es un valor observado real
de la variable Y, mientras que Ŷ es un valor de recta predicho por la ecuación, se calcula la diferencia vertical
entre Yi y Ŷ, esta diferencia se eleva al cuadrado (Yi – Ŷ) 2 para cada valor y luego se suman Σ(Yi – Ŷ) 2 el
resultado obtenido es el numero mas pequeño que se puede obtener si se suman estas desviaciones
verticales elevadas al cuadrado entre los puntos y cualquier otra recta.

La diferencia entre (Yi – Ŷ) es el residuo o el error, entre lo que Y vale en realidad, Yi, y el valor que se predijo
por medio del modelo de regresión, Ŷ.

Regresión a partir del origen


Facultad de Humanidades y Educación
Escuela de Educación

Cuando se realiza la regresión a partir del origen el intercepto vale cero, ya que la línea de regresión corta al
eje de Y donde él corta al eje de X, quedando: Y = bx

Para ello se debe lograr que la media y la desviación de ambas variables sean iguales X = Y y Sx = Sy. Se
expresan los valores de X y los valores de Y en Z: con media 0 y desviación 1.

Se pueden generar 3 coeficientes más:

Coeficiente de determinación rxy2


Se lee como porcentaje. Proporción de la varianza de Y que es explicada por X

Coeficiente de no determinación (1 – rxy2)


Indica la proporción de varianza de Y que no es explicada por X. Es el porcentaje de la variación de la variable
dependiente que no es explicada por la variación de la variable independiente.

Coeficiente de alineación o residual (1 – rxy2)


Indica la proporción de la desviación típica que es error de estimación.

ANÁLISIS BIVARIANTE

Es un análisis estadístico considerándose simultáneamente dos variables, que han de estar consideradas de
forma conjunta: una variable dependiente y una variable independiente.

Se pueden realizar dos tipos de análisis lineal:


Correlación lineal:
Determina la fuerza de la relación entre dos o mas variables. Modelo estadístico para la estimación del
grado de asociación entre dos o mas variables.
Indica si X tiene relación con Y, y si Y tiene que ver con X, la relación es biunívoca.

Regresión:
Es una expresión de la naturaleza básica de la relación entre la variable dependiente e independiente.
Indica la cantidad en que Y cambiara cuando la variable independiente X varíe una unidad.
La regresión lineal intenta reflejar la relación entre X y Y por medio de una recta

Y (directa o +)
aumenta
X
Y (nula)
Aumenta es igual

Y (inversa o -)
disminuye

a b c
a) indica que a medida que aumenta una variable, aumenta la otra (directa o positiva)
b) indica que a medida que aumenta una variable, disminuye la otra (inversa o negativa)
c) no existe ninguna relación entre las dos variables

Elaborado por: María Eugenia D’Aubeterre


Cátedra de Métodos Cuantitativos
CUADRO COMPARATIVO DE LOS COEFIENTES DE CORRELACIÓN

Características PEARSON SPEARMAN PUNTO BISERIAL PHI CONTINGENCIA


y Condiciones

Nivel / Escala / Cuantitativo Cuantitativo / Cuantitativo / Cualitativo Cualitativo


Tipo Intervalo / razón cualitativo cualitativo Nominal Nominales / ordinales
Continua / discretas Ordinal / intervalo / Intervalo continua Dicotómica múltiples
razón Nominal dicotómica

Rango del entre entre entre entre entre


Coeficiente -1 y 1 -1 y 1 -1 y 1 0y1 0y1
Formas de
calculo

Precauciones No implica la Los empates entre Difiere de acuerdo


al interpretar existencia de un rangos disminuyen con el numero de
Restricciones y vinculo causal el coeficiente. La categorías en que se
limitaciones heterogeneidad y la distribuya la variable
n modifican al
coeficiente
Análisis de Si, solo con una No No No No
regresión relación lineal de
moderada a fuerte
Información Sentido y magnitud Sentido y magnitud Sentido y magnitud Magnitud Magnitud
que suministra
Observaciones La relación de las dos Mide las diferencias Mide la fuerza de la Mide la fuerza cuando El valor del
series de valores de entre los rangos que relación lineal solo ambas variables son coeficiente no tiene
las variables se consideren. Mide cuando una de las dicotómicas. Tablas fin va de 0 a infinito,
consideradas se la fuerza cuando los variables es cuadradas 2 x 2 por ello se realiza la
establece a través de valores están dicotómica y esto corrección a la escala
un argumento lineal ordenados en rangos limita al coeficiente. de Pearson (Cc)

Elaborado por: María Eugenia D’Aubeterre


Cátedra de Métodos Cuantitativos
NIVEL ESCALA TIPO FORMULA INFO.
Cuantitativas

Magnitud
Sentido
2 Intervalo / Continua o
Razón Discreta

-1 ª 1
Magnitud
Sentido
1 Razón / Continua o
Intervalo Discreta
1 Ordinal Múltiple

0 a 1Magnitud -1 a 1
Continua
1 Intervalo
Dicotómica
1 Nominal
Cualitativas

Magnitud
Sentido
2 Ordinales Múltiples

0 a 1 Magnitud 0 a 1
2 nominales Dicotómica
s

Cualitativas Múltiples

0 a 1Magnitud
(nominales y
ordinales)

FORMULAS DE REGRESIÓN

Modelo lineal general o ecuación de la línea recta de Y a partir de X

Pendiente de la línea de Y a X

Intercepto de Y a partir de X

Elaborado por: María Eugenia D’Aubeterre


Cátedra de Métodos Cuantitativos
Error típico de estimación

Elaborado por: María Eugenia D’Aubeterre


Cátedra de Métodos Cuantitativos
Análisis de Correlación Lineal

Coeficiente Producto Momento de Pearson

Nivel de medida: Cuantitativo


Escala de medición: intervalo y razón (condición para las dos variables)
Interpretación: sentido y magnitud.

Coeficiente Rangos de Spearman

Nivel de medida: Cuantitativo / Cualitativo


Escala de medición: 1era variable de Razón, Intervalo u Ordinal múltiple
2da variable Ordinal múltiple
Interpretación: Sentido y magnitud.

Coeficiente Punto Biserial

St = desviación total
p = proporción de éxito
q = proporción de fracaso

Nivel de medida: Cuantitativo / Cualitativo


Escala de medición: 1era variable: Intervalo Continua
2da variable: Nominal Dicotómica
Interpretación: sentido y magnitud.

Coeficiente Phi

a b a+b
c d c+d
a+c b+d N

Nivel de medida: Cualitativo (tablas 2 x2)


Escala de medición: Nominal Dicotómica (condición para las dos variables)
Interpretación: Magnitud.

Coeficiente de Contingencia
Elaborado por: María Eugenia D’Aubeterre
Cátedra de Métodos Cuantitativos
Fo = frecuencia observada
Fe = frecuencia esperada

fe = total de la casilla en horizontal . total de la casilla en vertical


total
de datos (N)

Nivel de medida: Cualitativo


Escala de medición: cualitativas múltiples (ordinales o Nominales)
Interpretación: Magnitud.

Elaborado por: María Eugenia D’Aubeterre


Cátedra de Métodos Cuantitativos

También podría gustarte