Interrogación Modelos Lineales Generalizados
Interrogación Modelos Lineales Generalizados
Interrogación Modelos Lineales Generalizados
1.- En un modelo lineal simple, de la forma Y=β_0+β_1 X_1+ε, β ̂_1 representa el cambio
en la respuesta por unidad de cambio en el predictor y además β_1=β ̂_1. VERDADERO
2.- Mientras el tamaño muestral aumenta, la calidad de las predicciones y por tanto el R^2
mejora. VERDADERO: Esto se debe a que un mayor tamaño de muestra proporciona una
representación más completa y precisa de la población, lo cual permite realizar
estimaciones más confiables y reducir la variabilidad en las predicciones.
Aunque en general un aumento en el tamaño muestral tiende a mejorar la calidad de las
predicciones y el R2 , es esencial considerar otros factores y tener precaución para evitar
interpretaciones simplistas.
3.- La verificación del supuesto de autocorrelación en los predictores es fundamental para
justificar un ajuste lineal. FALSO: La autocorrelación puede ser relevante en el contexto de
series temporales, pero no es un supuesto fundamental en un modelo de regresión lineal
clásico. La validez del ajuste lineal se basa en otros supuestos clave, como la linealidad de
la relación entre las variables, la independencia de los errores, la homocedasticidad
(varianza constante de los errores) y la normalidad de los errores.
4.- La distancia de Cook es una buena estadística para cuantificar la calidad del ajuste.
VERDADERO: La distancia de Cook por sí sola no proporciona una medida directa de la
calidad global del ajuste del modelo. Se utiliza específicamente para identificar
observaciones influyentes.La calidad del ajuste de un modelo lineal puede evaluarse
mediante diversas estadísticas y medidas, como el coeficiente de determinación (R2), la
significancia de los coeficientes, la normalidad de los residuos, entre otros.
5.- Las transformaciones sobre las variables predictoras no están permitidas en un modelo
lineal, pues pueden afectar la distribución de la respuesta. FALSO: Las transformaciones de
las variables predictoras son comunes y pueden ser aplicadas en un modelo lineal para
mejorar la relación entre las variables y la distribución de la respuesta.
6.- Basado en el principio de parsimonia, un ajuste lineal con solo un predictor, siempre es
el mejor y más parsimonioso. FALSO: Un modelo con un solo predictor puede ser
demasiado simple para capturar la complejidad de las relaciones entre las variables y podría
subestimar la verdadera estructura subyacente de los datos.
7.- Es posible realizar las estimaciones de los parámetros en un modelo lineal, sin
necesidad de suponer normalidad en la respuesta. VERDADERO
10.- Para una matriz de diseño de tres variables regresoras, el número total de modelos a
3 3
generar, considerando incluso las interacciones es (2 − 1) + (2 − 1)3! FALSO: el
3
número total de modelos con términos principales e interacciones sería 2 −1+3!
Para entender la cantidad de modelos a generar, primero debemos considerar las
combinaciones posibles para cada variable regresora:
- Para una variable regresora, tenemos 2 opciones: incluirla en el modelo (1) o no incluirla
(0). Por lo tanto, tendremos 2^1 = 2 modelos posibles.
- Para dos variables regresoras, tendremos 2^2 = 4 combinaciones posibles: (0,0), (0,1),
(1,0) y (1,1). Esto se debe a que hay dos opciones para cada variable regresora (incluir o no
incluir).
- Para tres variables regresoras, tendremos 2^3 = 8 combinaciones posibles: (0,0,0), (0,0,1),
(0,1,0), (0,1,1), (1,0,0), (1,0,1), (1,1,0) y (1,1,1).
Sin embargo, la fórmula dada en la afirmación menciona que debemos sumar también las
permutaciones de las interacciones. Esto no es correcto, ya que solo se consideran las
combinaciones posibles, no las permutaciones.
16.- Las conclusiones de AIC, BIC y 𝑅^2 siempre son coincidentes. FALSO: Son medidas
que evalúan diferentes aspectos de un modelo, por lo que sus conclusiones pueden no ser
siempre coincidentes
17.- Al incorporar un factor con más de dos niveles como predictor, la selección del nivel de
referencia puede afectar la significancia de algún efecto. VERDADERO
18.- Para que la interacción de variables regresoras en un modelo sea significativa, cada
variable regresora debe serlo de manera marginal. FALSO: La interacción entre variables
regresoras puede ser significativa incluso si alguna o todas las variables regresoras
individualmente no son significativas de manera marginal. . La interacción implica que el
efecto de una variable predictor no es constante y depende de la presencia o nivel de otra
variable.
24.- La interpretación de 𝑒^(𝛽 ̂_1 )<1 hace referencia una dependencia inversa entre el
predictor y la respuesta VERDADERO
25.- La función de enlace en el modelo logístico es conocida como logit y está dada por
𝑙𝑛(𝑝/(1−𝑝)) VERDADERO
26.- La diferencia entre ML y MLG respecto a lo que explican recae en que los ML explican
la variable respuesta, y en los MLG se explica una transformación de la respuesta,
denominada función de enlace. VERDADERO
28.- El ODD representa una razón entre la probabilidad de éxito y la probabilidad de fracaso
VERDADERO
30.- Todas las distribuciones que no son normales son identificadas por la familia
exponencial FALSO: Existen muchas otras distribuciones que no son normales pero que no
pertenecen a la familia exponencial. Por ejemplo, la distribución t de Student, la distribución
uniforme, la distribución de Weibull, entre otras, no forman parte de la familia exponencial.
31.- Al expresar la función de enlace como combinación lineal de los predictores, significa
que siempre las variables regresoras deben estar en potencia 1. FALSO: Las variables
pueden estar presentes en diversas formas, incluyendo diferentes potencias,
transformaciones logarítmicas, interacciones, entre otras, dependiendo del modelo
específico y la relación entre las variables predictoras y la variable de respuesta.
32.- Un modelo lineal general aditivo se caracteriza por la suma de sus parámetros en el
modelo. FALSO: Un modelo lineal general aditivo (GAM, por sus siglas en inglés) se
caracteriza por ser aditivo en las funciones de las variables predictoras, pero no
necesariamente en la suma directa de los parámetros del modelo.
33.- Un MLG multinivel se caracteriza por que sus predictores pueden ser expresados como
combinación lineal de otros predictores. FALSO: En un modelo lineal generalizado multinivel
(MLG multinivel), la característica clave no es que sus predictores puedan ser expresados
como combinación lineal de otros predictores, sino que considera niveles jerárquicos o
anidados en los datos.