Bidimensional Datos Cuantitativos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 15

DISTRIBUCIÓN DE

FRECUENCIAS
BIDIMENSIONALES
Estudio de variables cuantitativas

Profesora: Ana Ruiz


Hemos preguntado a un grupo de individuos por el número de hijos que tienen, variable X, y cuántas ausencias al lugar
de trabajo han tenido en el último mes, variable Y. Las respuestas obtenidas son las siguientes:
Frecuencias absolutas Frecuencias relativas 𝑘 ℎ
conjuntas conjuntas
Xi Yj nij fij
෍ ෍ 𝑛𝑖𝑗 = 𝑛
0 0 5 0,09
1 0 3 0,05
𝑖=1 𝑗=1
3 0 1 0,02
4 0 4 0,07
𝑛𝑖𝑗
𝑓𝑖𝑗 =
1 1 7 0,12 𝑛
2 1 6 0,10
3 1 3 0,05 𝑘 ℎ
4 1 5 0,09
෍ ෍ 𝑓𝑖𝑗 = 1
0 2 1 0,02
1 2 4 0,07
𝑖=1 𝑗=1
2 2 7 0,12
3 2 12 0,21 Para tener la información más resumida y
n=58 1
organizada vamos a construir una tabla
de doble entrada.
Profesora: Ana Ruiz
Tabla de doble entrada con frecuencias
absolutas conjuntas (nij) Tabla de doble entrada con frecuencias
relativas conjuntas (fij)

X/Y 0 1 2 n(X)
X/Y 0 1 2 f(X)
0 5 0 1 6
0 0,09 0,00 0,02 0,10
1 3 7 4 14 1 0,05 0,12 0,07 0,24
2 0 6 7 13 2 0,00 0,10 0,12 0,22
3 1 3 12 16 3 0,02 0,05 0,21 0,28

4 4 5 0 9 4 0,07 0,09 0,00 0,16

n(Y) 13 21 24 n=58 f(Y) 0,23 0,36 0,41 1,00

Profesora: Ana Ruiz


Xi ni Ni fi Fi 𝑋ത = 0 ∙ 0,10 + 1 ∙ 0,24 + 2 ∙ 0,22 + 3 ∙ 0,28 + 4 ∙ 0,16
0 6 6 0,10 0,10 = 2,16 ℎ𝑖𝑗𝑜𝑠

1 14 20 0,24 0,34 𝑀𝑒 = 2 ℎ𝑖𝑗𝑜𝑠 18


16

2 13 33 0,22 0,57 14

𝑀𝑜 = 3 ℎ𝑖𝑗𝑜𝑠 12
10
3 16 49 0,28 0,84 8
6
4 9 58 0,16 1,00 4
2

n=58 1,00 0
0 1 2 3 4

Yj nj Nj fj Fj
0 ∙ 13 + 1 ∙ 21 + (2 ∙ 24)
𝑌ത = = 1,19 𝑎𝑢𝑠𝑒𝑛𝑐𝑖𝑎𝑠
58
0 13 13 0,23 0,23
𝑀𝑒 = 1 𝑎𝑢𝑠𝑒𝑛𝑐𝑖𝑎 30

1 21 34 0,36 0,59 25
20
𝑀𝑜 = 2 𝑎𝑢𝑠𝑒𝑛𝑐𝑖𝑎𝑠 15

2 24 58 0,41 1,00 10
5
0
0 1 2
n=58 1,00 Profesora: Ana Ruiz
Frecuencias condicionadas I

X/y=0 ni/y=0 fi/y=0


X/Y 0 1 2 n(X) 0 5 0,38
1 3 0,23
0 5 0 1 6
2 0 0
1 3 7 4 14 3 1 0,08
4 4 0,31
2 0 6 7 13 13 1
3 1 3 12 16
0∙5 + 1∙3 + 2∙0 + 3∙1 +(4∙4)

4 4 5 0 9 𝑋/y=0 =
13
= 1,69 ℎ𝑖𝑗𝑜𝑠

n(Y) 13 21 24 n=58 Mo/y=0= 0 hijos

Profesora: Ana Ruiz


Frecuencias condicionadas II

X/y=1 ni/y=1 fi/y=1


X/Y 0 1 2 n(X) 0 0 0
1 7 0,33
0 5 0 1 6
2 6 0,29
1 3 7 4 14 3 3 0,14
4 5 0,24
2 0 6 7 13 21 1
3 1 3 12 16
0∙0 + 1∙7 + 2∙6 + 3∙3 +(4∙5)

4 4 5 0 9 𝑋/y=1 =
21
= 2,29 ℎ𝑖𝑗𝑜𝑠

n(Y) 13 21 24 n=58 Mo/y=1= 1 hijo

Profesora: Ana Ruiz


Frecuencias condicionadas III

X/y=2 ni/y=2 fi/y=2


X/Y 0 1 2 n(X) 0 1 0,04
1 4 0,17
0 5 0 1 6
2 7 0,29
1 3 7 4 14 3 12 0,50
4 0 0
2 0 6 7 13 24 1
3 1 3 12 16
0∙1 + 1∙4 + 2∙7 + 3∙12 +(4∙0)

4 4 5 0 9 𝑋/y=2 =
24
= 2,25 ℎ𝑖𝑗𝑜𝑠

n(Y) 13 21 24 n=58 Mo/y=2= 3 hijos

Profesora: Ana Ruiz


Calcular la distribución de la variable
Frecuencias condicionadas IV número de hijos, su media aritmética y
su moda cuando se ha faltado al trabajo
alguna vez en el último mes.

X/Y 0 1 2 n(X) X/y>0 ni/y>0 fi/y>0


0 1 0,02
0 5 0 1 6 1 11 0,25
2 13 0,29
1 3 7 4 14 3 15 0,33
4 5 0,11
2 0 6 7 13 45 1
3 1 3 12 16
0∙1 + 1∙11 + 2∙13 + 3∙15 +(4∙5)

4 4 5 0 9 𝑋/y>0 =
45
= 2,27 ℎ𝑖𝑗𝑜𝑠

n(Y) 13 21 24 n=58 Mo/y>0=3 hijos

Profesora: Ana Ruiz


Frecuencias condicionadas V. EJERCICIO

X/Y 0 1 2 n(X) Calcular la distribución de la variable número de


ausencias al trabajo y su media aritmética
0 5 0 1 6
cuando:
1 3 7 4 14 a) No se tienen hijos

2 0 6 7 13 b) Se tiene 1 hijo
c) Se tienen 2 hijos
3 1 3 12 16 d) Se tienen 3 hijos
4 4 5 0 9 e) Se tienen 4 hijos
f) Cuando se tienen 2 hijos o más.
n(Y) 13 21 24 n=58

Profesora: Ana Ruiz


Independencia estadística I
Dos variables son estadísticamente independientes si y sólo si
se cumple la Condición Necesaria y Suficiente de
independencia estadística para todos los valores de la tabla:
X/Y 0 1 2 n(X)
𝑛(𝑥)∙𝑛(𝑦) 𝑛 𝑥 = 𝑛𝑖.
0 5 0 1 6 𝑛𝑖𝑗 = ∀𝑖𝑗 𝑛 𝑦 = 𝑛.𝑗
𝑛
𝑓 𝑥 = 𝑓𝑖.
1 3 7 4 14 𝑓𝑖𝑗 = 𝑓 𝑥 ∙ 𝑓 𝑦 ∀𝑖𝑗 𝑓 𝑦 = 𝑓.𝑗

2 0 6 7 13 𝑛(𝑥1 )∙𝑛(𝑦1 ) 6∙13


𝑛11 = 5= 5 ≠ 1,34
𝑛 58
3 1 3 12 16
No se cumple la CNyS y las variables NO son
4 4 5 0 9 estadísticamente independientes. Es decir,
n(Y) 13 21 24 n=58 existe relación entre ellas.

Profesora: Ana Ruiz


Independencia estadística II
X/Y 5 10 15 n(X) Vamos a comprobar si las variables son
3 2 6 4 12 estadísticamente independientes o no. Para ello
vamos a comprobar la CNyS de independencia
5 4 12 8 24 estadística.

n(Y) 6 18 12 36
𝑛(𝑥1 )∙𝑛(𝑦1) 𝑛(𝑥1 )∙𝑛(𝑦2 ) 𝑛(𝑥1 )∙𝑛(𝑦3 ) 𝑛(𝑥2 )∙𝑛(𝑦1)
𝑛11 = 𝑛12 = 𝑛13 = 𝑛21 =
𝑛 𝑛 𝑛 𝑛
𝑛(𝑥2 )∙𝑛(𝑦2) 𝑛(𝑥2 )∙𝑛(𝑦3)
𝑛22 = 𝑛23 =
𝑛 𝑛

12∙6 12∙18 12∙12 24∙6 24∙18 24∙12


2= 6= 4= 4= 12 = 8=
36 36 36 36 36 36

2=2 6=6 4=4 4=4 12 = 12 8=8

Se cumple la CNyS para todos los valores de la tabla y por tanto, las variables SON
Profesora: Ana Ruiz
estadísticamente independientes.
ASOCIACIÓN DE VARIABLES CUANTITATIVAS I
Si no se cumple la CNyS de independencia estadística, las variables
están relacionadas. Ahora hay que ver qué tipo de relación tienen. En
X/Y 0 1 2 n(X) este curso sólo vamos a ver la relación lineal.
0 5 0 1 6 El estadístico que nos va a decir si existe relación lineal es la Covarianza:
1 3 7 4 14
σ𝑘𝑖=1 σℎ𝑗=1(𝑋𝑖 − 𝑋)(𝑌
ത 𝑗 − 𝑌)𝑛
ത 𝑖𝑗
2 0 6 7 13 𝑠𝑥𝑦 = =⋯=
𝑛−1
3 1 3 12 16 σ𝑘𝑖=1 σℎ𝑗=1 𝑋𝑖 𝑌𝑗 𝑛𝑖𝑗 − 𝑛𝑋ത 𝑌ത
4 4 5 0 9 =
𝑛−1
n(Y) 13 21 24 n=58 𝑆𝑋𝑌 = 0 𝐴𝑢𝑠𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙

𝑆𝑋𝑌 > 0 𝑅𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎 𝑜 𝑑𝑖𝑟𝑒𝑐𝑡𝑎

𝑆𝑋𝑌 < 0 𝑅𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑖𝑛𝑣𝑒𝑟𝑠𝑎 𝑜 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑎

Profesora: Ana Ruiz


ASOCIACIÓN DE VARIABLES CUANTITATIVAS II
Xi Yj nij 𝑋 − 𝑋ത ∙ 𝑌 − 𝑌ത ∙ 𝑛𝑖𝑗
0 0 5 (0-2,16) ∙ (0-1,19) ∙ 5
1 0 3 (1-2,16) ∙ (0-,19) ∙3
3 0 1 (3-2,16) ∙ (0-1,19) ∙1
4 0 4 (4-2,16) ∙(0-1,19) ∙4
1 1 7 (1-2,16) ∙(1-1,19) ∙7
2 1 6 (2-2,16) ∙(1-1,19) ∙6
3 1 3 (3-2,16) ∙(1-1,19) ∙3
4 1 5 (4-2,16) ∙(1-1,19) ∙5
0 2 1 (0-2,16) ∙(2-1,19) ∙1
1 2 4 (1-2,16) ∙(2-1,19) ∙4
2 2 7 (2-2,16) ∙(2-1,19) ∙7
3 2 12 (3-2,16) ∙(2-1,19) ∙12
n=58 Total=8,48

8,48
𝑠𝑋𝑌 = = 0,15 > 0. 𝐸𝑥𝑖𝑠𝑡𝑒 𝑎𝑠𝑜𝑐𝑖𝑎𝑐𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎
58 − 1 Profesora: Ana Ruiz
ASOCIACIÓN DE VARIABLES CUANTITATIVAS III
Una vez sabemos que existe asociación lineal positiva o negativa, hay que ver cuál es el grado de intensidad de
la relación. Para ello, vamos a utilizar el coeficiente de Correlación de Pearson.

𝑆𝑋𝑌
𝑟𝑋𝑌 = 𝑆 −1 < 𝑟𝑋𝑌 < 1 𝑟𝑋𝑌 = 0 𝐴𝑢𝑠𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙
𝑋 ∙𝑆𝑌

𝑟𝑋𝑌 = 1 𝑅𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑑𝑖𝑟𝑒𝑐𝑡𝑎 𝑚á𝑥𝑖𝑚𝑎

𝑟𝑋𝑌 = −1 𝑅𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑖𝑛𝑣𝑒𝑟𝑠𝑎 𝑚á𝑥𝑖𝑚𝑎

Asociación lineal
positiva en grado alto
𝑟𝑋𝑌 = 0,9
Ausencia de relación lineal Asociación lineal inversa en
𝑟𝑋𝑌 =0
Profesora: Ana Ruiz
grado medio 𝑟𝑋𝑌 = −0,7
ASOCIACIÓN DE VARIABLES CUANTITATIVAS IV
Xi ni Ni fi Fi
0 6 6 0,10 0,10 𝑋ത = 0 ∙ 0,10 + 1 ∙ 0,24 + 2 ∙ 0,22 + 3 ∙ 0,28 + 4 ∙ 0,16 = 2,16 ℎ𝑖𝑗𝑜𝑠
1 14 20 0,24 0,34 ((0 − 2,16)2 ∙ 6) + ( 1 − 2,16)2 ∙ 14 + ( 2 − 2,16)2 ∙ 13 + ( 3 − 2,16)2 ∙ 16 + ((4 − 2,16)2 ∙ 9)
2 13 33 0,22 0,57 𝑆𝑋2 =
58 − 1
3 16 49 0,28 0,84
4 9 58 0,16 1,00 𝑆𝑋2 = 1,56 ℎ𝑖𝑗𝑜𝑠 2 𝑆𝑋 = 𝑆𝑋2 = 1,56 = 1,25 ℎ𝑖𝑗𝑜𝑠
n=58 1,00

Yj nj Nj fj Fj 0 ∙ 13 + 1 ∙ 21 + (2 ∙ 24)
𝑌ത = = 1,19 𝑎𝑢𝑠𝑒𝑛𝑐𝑖𝑎𝑠
58
0 13 13 0,23 0,23
((0 − 1,19)2 ∙ 13) + ( 1 − 1,19)2 ∙ 21 + ( 2 − 1,19)2 ∙ 24
1 21 34 0,36 0,59 𝑆𝑌2 = = 2,05 𝑎𝑢𝑠𝑒𝑛𝑐𝑖𝑎𝑠 2
58 − 1
2 24 58 0,41 1,00
𝑆𝑋 = 𝑆𝑋2 = 2,05 = 1,43 ausencias
n=58 1,00
𝑠𝑥𝑦 0,15
𝑟𝑋𝑌 = 𝑠 = (1,25)∙(1,43) = 0,08. Existe una relación lineal positiva en grado muy bajo entre el número de hijos
𝑥 ∙𝑠𝑦
y las ausencias al lugar de trabajo para los individuos de esta muestra.
Profesora: Ana Ruiz

También podría gustarte