Tema2 Estadistica Bidimensional
Tema2 Estadistica Bidimensional
Tema2 Estadistica Bidimensional
Parte I
Estadística bidimensional
1. Variable bidimensional
Dos variables X e Y están relacionadas estadísticamente cuando conocida la primera se puede estimar aproximadamente
el valor de la segunda. Por ejemplo:
La estatura y el peso de unos jugadores de un equipo de baloncesto.
Calicaciones en Física y Matemáticas de los alumnos de una clase.
Ingresos y gastos de una familia.
Producción y ventas de una fábrica.
Gastos en publicidad y benecios de una empresa.
Variable estadística bidimensional: Una variable bidimensional es una variable en la que cada individuo está
denido por un par de caracteres, (X, Y). Estos dos caracteres son a su vez variables estadísticas en las que sí existe
relación entre ellas, una de las dos variables es la variable independiente y la otra variable dependiente.
Distribuciones bidimensionales: Son aquellas en las que a cada individuo le corresponden los valores de dos variables,
las representamos por el par (xi , yi ).
Las tablas de frecuencia pueden darse de dos maneras:
Tablas simples o marginales: Recogen en las o columnas las frecuencias de los datos.
Tablas de doble entrada: Recoge en cada casilla la frecuencia correspondiente a cada la y cada columna de
los valores de cada variable.
Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama nube
de puntos o diagrama de dispersión. Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos
lo mejor posible, llamada recta de regresión.
Media de la variable Y: P
yi · fi
y= (2)
N
Varianza de la variable X:
[email protected]
Matemáticas aplicadas a las ciecias sociales I
x2i · fi
P
σx2 = − x2 (3)
N
Varianza de la variable Y:
yi2 · fi
P
σy2 = − y2 (4)
N
[email protected]
Matemáticas aplicadas a las ciecias sociales I
Se nota el alto grado de correlación lineal Se nota el altísimo grado de correlación lineal
negativa (porque se agrupan los datos a una positiva (porque se agrupan los datos a una recta
recta con pendiente negativa), por tanto la de pendiente positiva), por tanto la covarianza
covarianza debe ser negativa. El coeciente de debe ser positiva. El coeciente de correlación
correlación lineal toma valores cercanos a -1, por lineal toma valores cercanos a 1, la correlación es
tanto la correlación es fuerte e inversa, y será fuerte y directa, y será tanto más fuerte cuanto
tanto más fuerte cuanto más se aproxime a −1. más se aproxime a 1.
Se nota que los datos están muy dispersos por lo Se nota que los datos están bastante dispersos
que no existe prácticamente corelación y por por lo que la correlación es poca y negativa, por
tanto la covarianza debe ser un valor próximo a tanto la covarianza debe ser un valor negativo.
cero.
Se nota que los valores están muy dispersos (no se paroximan a una recta), no existe prácticamente
correlación y por tanto la covarianza y coeciente de correlación toma valores cercanos a 0, la
correlación es débil.
La recta de regresión de Y sobre X se utiliza para estimar los valores de la Y a partir de los de la X.
σxy
y−y = · (x − x) (7)
σx2
[email protected]
Matemáticas aplicadas a las ciecias sociales I
2. Ficha de problemas
1. El número de horas de estudio de una materia y la calicación obtenida en un examen de 8 personas es:
x: Horas de estudio 20 16 34 23 27 32 18 22
y: Calicación obtenida 6.5 6 8.5 7 9 9.5 5 8
2. Encuestadas 50 personas sobre el número de horas que duermen y el número de horas que ven la televisión, se obtuvieron
los siguientes datos:
Nº horas dormidas 6 7 8 9 10
Nº de horas de TV 4 3 3 2 1
Frecuencias 3 16 20 10 1
3. -Se ha medido el peso (X) y la estatura en centímetros (Y) de los alumnos de una clase. Su peso medio ha sido de 56
kg con una desviación típica de 2.5 kg. La ecuación de la recta de regresión que relaciona la estatura y el peso es:
y = 1,8 · x + 62
a) La pendiente de esa recta es positiva, ¾qué signica esto?
b) ¾Cuál sería el centro de gravedad? Señálalo sobre la gráca correspondiente.
c) ¾Cuál es la estatura media de esos alumnos?
d) ¾Qué estatura puede estimarse en un alumno que pesa 64 kg?
e) ¾Y si pesara 44 kg?
4. Una compañía discográca ha recopilado la siguiente información sobre el número de conciertos dados durante el
verano por 15 grupos musicales y las ventas de discos de estos grupos(expresadas en miles de discos):
5. --En dos estudios realizados sobre los datos de una variable bidimensional, las rectas de regresión fueron las siguientes:
a ) Primer estudio:
b ) Segundo estudio:
8. Para cada una de las variables bidimensionales siguientes, se ha hecho un estudio para investigar la correlación existente
entre los datos recogidos. Los coecientes de correlación obtenidos han sido:
a ) Horas diarias que ve la televisión un alumno y asig- d ) Nota nal de matemáticas y nota nal de lengua de
naturas aprobadas en una evaluación. 1º bachillerato.
b ) Peso de un recién nacido y color de sus ojos.
c ) Número de partidos ganados y número de canastas e ) Espacio recorrido por un coche en un tiempo deter-
conseguidas por un equipo de baloncesto. minado y velocidad del mismo en dicho tiempo.
9. Tenemos dos variables aleatorias bidimensionales representadas por estas nubes de puntos:
b ) Ahora decide cuáles son las ecuaciones de las dos rectas de regresión correspondientes. Justica tu respuesta.
10. Práctica a ordenador. La distribución bidimensional que se obtiene al estudiar la estatura y el peso de 10 personas
es:
Peso ( kg) 70 65 85 60 70 75 90 80 60 70
Estatura (cm) 175 160 180 155 165 180 185 175 160 170