Credit Value
Credit Value
Credit Value
Deuda de la
Incumplimiento Nivel Años con el Años en la Ingresos del Razón de la Tarjeta de
Edad empleador Dirección Hogar Deuda/Ingre
de pago (Default) Educativo actual Actual (Miles $) sos ( %) crédito
(Miles $)
Otras
Deuda
(Miles $)
5.01
4
2.17
0.82
3.06
2.16
16.67
1.24
3.28
2.15
0.09
0.94
2.47
3.01
5.4
3.4
3.81
4.29
2.91
0.34
0.51
1.82
2.17
2.24
2.64
3.49
3.92
9.74
7.59
5.05
0.32
1.17
0.84
2.87
0.94
5.65
2.13
4.58
2.77
1.54
1.71
2.91
0.94
4.36
0.75
0.94
1.14
2.58
1.62
2.9
2.58
1.99
3.68
0.61
2.11
1.82
1.3
0.59
1.01
7.28
0.62
1.65
1.98
1.69
1.16
9.72
1.29
1.67
1.05
3.15
3.45
4.99
8.22
1.24
0.68
8.4
0.1
0.98
0.76
0.56
0.36
4.91
3.58
1.35
0.76
6.45
0.97
5.73
0.7
2.67
1.37
1.34
4.22
0.75
1.98
1.65
1.39
2.87
0.52
1.55
1.95
2.13
0.79
2.39
7.82
0.47
3.58
2.21
3.02
3.43
1.45
3.38
1.01
8.5
3.64
1.16
1.92
1.45
2.37
0.87
2.17
1.32
7.55
1.7
0.48
1.2
7.82
0.38
1.88
2.44
0.47
1.34
5.54
5.77
0.8
0.8
2.57
0.69
1.14
1.28
1.55
5.16
4.66
2.13
3.22
1.04
2.85
0.73
2.09
1.8
7.68
2.48
2.42
1.55
2.72
4.69
1.51
2.59
2.65
0.86
0.89
3.05
1.49
0.74
2.41
13.05
2.11
1.29
0.39
1.43
1.58
2.87
0.65
2.67
1.01
1.55
2.96
2.02
1.53
5.89
1.74
2.31
1.49
1.36
5.59
1.19
3.66
4.83
1.05
7.76
1.82
1.12
2.32
0.25
2.7
0.89
0.82
0.83
2.84
4.05
0.52
5.08
3.44
2.58
2.89
4.4
1.02
0.16
4.05
0.58
12.42
2.35
1.07
1.42
3.85
1.85
2.22
14.45
0.75
3.98
0.47
1.2
10.18
10.75
8.2
1.04
4.26
0.54
0.91
2.32
7.57
2.64
0.2
0.82
0.17
0.64
2.43
1.25
1.99
5.82
3.35
1.65
0.94
7.39
3.05
5.29
0.56
2.35
6.19
8.16
12.66
8.36
0.58
1.29
1.44
5.23
1.37
4.01
1
2.56
5.14
2.06
1.74
3.81
1.52
0.78
1.32
5.5
1.56
0.75
4.98
0.11
1.77
7.29
1.96
1.68
1.69
0.59
0.18
1.48
1
5.26
5.03
2.03
2.4
1.63
0.99
3.79
1.05
1.49
1.23
1.26
3.38
0.45
1.57
1.88
1.06
1.37
0.8
0.52
12.08
4.56
2.95
0.98
2.52
0.15
6.02
9.5
0.47
1.46
6.67
1.94
1.43
2.57
2.15
2.42
6.24
1.07
1.91
0.96
0.82
4.66
0.35
0.97
4.16
17.2
12.71
0.33
2.32
2
0.17
0.94
0.57
3.32
7.73
1.66
3.97
2.42
3.73
3.54
1.8
0.62
1.15
27.03
5.39
2.53
0.46
2.45
0.24
1.09
0.22
2.36
0.37
4.08
4.58
7.75
3.17
2.09
9.04
0.47
0.55
0.19
2.69
1.9
0.74
0.46
0.89
0.56
2.26
1.45
3.02
1.72
0.81
14.72
1.07
0.29
1.61
0.42
2.08
0.34
1.61
9.29
3.36
0.65
5.25
4.35
0.91
3.43
0.9
2.55
2.79
0.75
0.84
6.56
7.91
3.99
3.62
1.48
1.33
0.73
1.37
0.45
1.95
15.41
3.14
6.22
1.05
3.95
1.11
1.3
1.4
9.39
1.13
1.31
3.82
3.25
0.86
1.28
8.13
11.87
1.73
3.14
0.92
1.16
5.07
0.49
0.35
0.2
1
8.63
9.25
0.89
3.43
1.8
5.71
1.56
0.05
7.04
0.68
1.27
9.2
2.28
11.04
3.39
12.96
4.18
0.71
0.92
2.63
1.87
4.66
1.88
2.47
2.01
2.62
1.74
9.56
2.22
1.87
0.5
0.56
2.14
0.61
1.14
4.03
2.72
23.1
1.26
9.97
0.61
2.95
1.32
2.65
0.52
1.01
4.86
2.58
2
18.27
4.99
1.17
1.63
1.63
1.1
6.26
0.88
0.99
5.8
1.33
0.19
1.28
20.62
7.04
4.36
1.84
1.15
4.12
9.7
2.89
2.51
Logit, Probit/Normit, Tobit: Variables Dependientes Limitadas utilizando Estimación por Máxima Verosimilitud
Las Variables Dependientes Limitadas describen las situaciones donde la variable dependiente contiene datos que están limitados en alcance y rango, como binarias (0 o 1), truncadas,
ordenadas o datos censurados. Por ejemplo, dado un conjunto de variables independientes (p.ej., edad, ingreso, educación, cupo de tarjeta de crédito o tenencia de préstamo
hipotecario), podemos calcular la probabilidad de incumplimiento utilizando la estimación de máxima verosimilitud (MLE – por sus siglas en ingles). La respuesta o variable dependiente
Y es binaria, es decir, puede tener solamente dos posibles resultados que denotaremos como 1 y 0 (p.ej., Y puede representar la ausencia/presencia de una condición especifica,
cumplimiento/incumplimiento de un préstamo previo, éxito/fracaso de algunos dispositivos, respuesta si/no en estudios, etc.). También tenemos un vector de variables independientes o
regresores de X, los cuales se asumen con influencia en el resultado Y. Una típica aproximación con una regresión de mínimos cuadrados ordinarios es incorrecta porque los errores de
la regresión son heteroscedasticos y no normales; y los resultados estimados de probabilidad resultantes serian valores sin sentido sobre 1 o debajo de 0. MLE se ocupa de estos
problemas de análisis utilizando una rutina de optimización iterativa que maximiza la función logarítmica de verosimilitud cuando las variables dependientes son limitadas.
Una regresión Logit o Logística es usada para predecir la probabilidad de ocurrencia de un evento para datos ajustados a una curva logística. Esto es generalizado en el modelo lineal
utilizado para la regresión binomial. MLE aplicado en un análisis logístico multivariado binario es usado para modelar variables dependientes para determinar la probabilidad esperada de
éxito de pertenecer a un cierto grupo. Los coeficientes estimados por el modelo Logit son cocientes logarítmicos de probabilidad, y no pueden interpretarse directamente como
probabilidades. Un rápido calculo es requerido primero y luego la aproximación es sencilla.
Específicamente, el modelo Logit es especificado como Estimado Y= LN[Pi/(1–Pi)] o en cambio, , Pi = EXP(Estimado Y)/(1+EXP(Y Estimado)), y los coeficientes βi son cocientes
logarítmicos de probabilidad, a fin de tomar el antilogaritmo o EXP(βi) obtenemos los cocientes de probabilidad de Pi/(1–Pi). Esto significa que un incremento en una unidad de βi
incrementa la probabilidad en este monto. Finalmente, la tasa de cambio en la probabilidad dP/dX = βiPi(1–Pi). El Error Estándar mide la precisión de los coeficientes, y la t-estadística
son los coeficientes de cada Coeficiente respecto a sus errores estándar, los cuales son usados en la prueba de hipótesis para calcular el nivel de significancia de cada parámetro
estimado. Para estimar la probabilidad éxito de pertenecer a un grupo especifico (p. ej., predecir si un fumador desarrollara complicaciones pulmonares dado el monto de cigarrillos
consumidos por año), simplemente calcule el valor Estimado Y utilizando los coeficientes MLE. Por ejemplo, si el modelo es Y = 1.1 + 0.005 (Cigarrillos) entonces para una persona que
fume paquetes de cigarrillos por año tiene un Y Estimado de 1.1 + 0.005(100) = 1.6. Después, calcule la inversa del antilogaritmo para el valor encontrado previamente de probabilidad
EXP(Y Estimado)/[1 + EXP(Y Estimado)] = EXP(1.6)/(1+ EXP(1.6)) = 0.8320. Por lo tanto una persona tiene un 82.20% de probabilidad de desarrollar algun tipo de complicación
pulmonar en vida.
Un modelo Probit (algunas veces conocido como modelo Normit) es una alternativa popular de especificación para un modelo binario en cual emplea una función probit utilizando una
estimación de máxima verosimilitud y la aproximación es llamada regresión probit. Los modelos de regresión Probit o Logistica tienden a producir predicciones similares, donde los
parámetros estimados en una regresión logística son entre 1.6 y 1.8 veces más altos que los correspondientes a los coeficientes de un modelo Probit. La elección de un modelo Probit o
Logit es enteramente relacionado con la conveniencia particular, y la principal distinción entre ambos se basa en el hecho que la distribución logística tiene una mayor curtosis (colas
gordas) para tener en cuenta en los valores extremos. Por ejemplo, suponga que una familia tiene la decisión de adquirir una vivienda y su respuesta es una variable binaria (comprar o
no comprar la vivienda) y depende de una serie de variables independientes Xi como son el ingreso, la edad, tal que Ii = β0 + β1X1 +...+ βnXn, donde el mayor valor de li, significa una
mayor probabilidad de ser propietario de la vivienda. Para cada familia, existe un umbral crítico I*, donde si es superado la casa es comprada por alguien más, es decir, la cas ano es
comprada, y la probabilidad de salida (P) se asume distribuida normalmente, tal que Pi=CDF(I) utilizando una función de distribución acumulada normal estándar (CDF). Por lo tanto, usa
los coeficientes estimados exactamente igual a los de un modelo de regresión, utilizando el valor Estimado Y, y aplicar la distribución normal estándar (usted puede usar la función Excel
DISTR.NORM.ESTAND o la herramienta de Análisis de Distribución seleccionando la distribución Normal y ajustando la media en 0 y la desviación estándar en 1). Finalmente, para
obtener un Probit o unidad de probabilidad, defina li + 5 (esto es porque siempre la probabilidad Pi < 0.5, el estimado li es negativo, debido al hecho que la distribución normal es
simétrica alrededor de una media de cero).
El modelo Tobit (Tobit Censurado) es un método de modelación biométrica y econométrica usada para describir la relación entre una variable dependiente no-negativa Yi y una o más
variables independientes Xi. Un modelo Tobit es un modelo econométrico en el cual la variable dependiente es censurada; esto es, la variable dependiente es censurada porque los
valores debajo de cero no son observados. El modelo Tobit asume que existe una variable inobservable latente Y*. Esta variable es linealmente dependiente de las variables Xi vía un
vector de coeficientes βi, que determina sus interrelaciones. En adición, el término del error Ui está distribuido normalmente para capturar la influencia aleatoria en esta relación. La
variable observable Yi es definida como la igualdad de la variable latente siempre que las variables latentes sean superiores a cero y Yi es asumido como cero en otro caso. Esto es, Yi =
Y* si Y* > 0 y Yi = 0 si Y* = 0. Si el parámetro de relación βi es estimado utilizando una regresión de mínimos cuadrados ordinarios de los observados Yi en Xi, los estimadores de la
regresión calculada son inconsistentes y el coeficiente de la pendiente se encuentra insesgada hacia abajo y el intercepto insesgado hacia arriba. Únicamente el MLE podría ser
consistente para un modelo Tobit. En el modelo Tobit, se tiene un complemento estadístico llamado Sigma, el cual e equivalente al error estándar de la estimación en una regresión de
mínimos cuadrados ordinarios y los coeficientes estimados son usados en el mismo sentido que en el análisis de regresión.
Resultados
H0 > 5% se acepta
Ha <= 5% significativa
Modelo de Máxima Verosimilitud: LOGIT, PROBIT, TOBIT
LOGIT & PROBIT
Deuda de la
Incumplimiento Nivel Años con el Años en la Razón de la Tarjeta de Otras
Edad empleador Dirección Deuda/Ingre Deuda
de pago (Default) Educativo actual Actual sos ( %) crédito (Miles $)
(Miles $)
Las Variables Dependientes Limitadas describen las situaciones donde la variable dependiente contiene datos que están limitados en alcance y rango, como binarias (0 o 1), truncadas,
ordenadas o datos censurados. Por ejemplo, dado un conjunto de variables independientes (p.ej., edad, ingreso, educación, cupo de tarjeta de crédito o tenencia de préstamo
hipotecario), podemos calcular la probabilidad de incumplimiento utilizando la estimación de máxima verosimilitud (MLE – por sus siglas en ingles). La respuesta o variable dependiente
Y es binaria, es decir, puede tener solamente dos posibles resultados que denotaremos como 1 y 0 (p.ej., Y puede representar la ausencia/presencia de una condición especifica,
cumplimiento/incumplimiento de un préstamo previo, éxito/fracaso de algunos dispositivos, respuesta si/no en estudios, etc.). También tenemos un vector de variables independientes o
regresores de X, los cuales se asumen con influencia en el resultado Y. Una típica aproximación con una regresión de mínimos cuadrados ordinarios es incorrecta porque los errores de
la regresión son heteroscedasticos y no normales; y los resultados estimados de probabilidad resultantes serian valores sin sentido sobre 1 o debajo de 0. MLE se ocupa de estos
problemas de análisis utilizando una rutina de optimización iterativa que maximiza la función logarítmica de verosimilitud cuando las variables dependientes son limitadas.
Una regresión Logit o Logística es usada para predecir la probabilidad de ocurrencia de un evento para datos ajustados a una curva logística. Esto es generalizado en el modelo lineal
utilizado para la regresión binomial. MLE aplicado en un análisis logístico multivariado binario es usado para modelar variables dependientes para determinar la probabilidad esperada de
éxito de pertenecer a un cierto grupo. Los coeficientes estimados por el modelo Logit son cocientes logarítmicos de probabilidad, y no pueden interpretarse directamente como
probabilidades. Un rápido calculo es requerido primero y luego la aproximación es sencilla.
Específicamente, el modelo Logit es especificado como Estimado Y= LN[Pi/(1–Pi)] o en cambio, , Pi = EXP(Estimado Y)/(1+EXP(Y Estimado)), y los coeficientes βi son cocientes
logarítmicos de probabilidad, a fin de tomar el antilogaritmo o EXP(βi) obtenemos los cocientes de probabilidad de Pi/(1–Pi). Esto significa que un incremento en una unidad de βi
incrementa la probabilidad en este monto. Finalmente, la tasa de cambio en la probabilidad dP/dX = βiPi(1–Pi). El Error Estándar mide la precisión de los coeficientes, y la t-estadística
son los coeficientes de cada Coeficiente respecto a sus errores estándar, los cuales son usados en la prueba de hipótesis para calcular el nivel de significancia de cada parámetro
estimado. Para estimar la probabilidad éxito de pertenecer a un grupo especifico (p. ej., predecir si un fumador desarrollara complicaciones pulmonares dado el monto de cigarrillos
consumidos por año), simplemente calcule el valor Estimado Y utilizando los coeficientes MLE. Por ejemplo, si el modelo es Y = 1.1 + 0.005 (Cigarrillos) entonces para una persona que
fume paquetes de cigarrillos por año tiene un Y Estimado de 1.1 + 0.005(100) = 1.6. Después, calcule la inversa del antilogaritmo para el valor encontrado previamente de probabilidad
EXP(Y Estimado)/[1 + EXP(Y Estimado)] = EXP(1.6)/(1+ EXP(1.6)) = 0.8320. Por lo tanto una persona tiene un 82.20% de probabilidad de desarrollar algun tipo de complicación
pulmonar en vida.
Un modelo Probit (algunas veces conocido como modelo Normit) es una alternativa popular de especificación para un modelo binario en cual emplea una función probit utilizando una
estimación de máxima verosimilitud y la aproximación es llamada regresión probit. Los modelos de regresión Probit o Logistica tienden a producir predicciones similares, donde los
parámetros estimados en una regresión logística son entre 1.6 y 1.8 veces más altos que los correspondientes a los coeficientes de un modelo Probit. La elección de un modelo Probit o
Logit es enteramente relacionado con la conveniencia particular, y la principal distinción entre ambos se basa en el hecho que la distribución logística tiene una mayor curtosis (colas
gordas) para tener en cuenta en los valores extremos. Por ejemplo, suponga que una familia tiene la decisión de adquirir una vivienda y su respuesta es una variable binaria (comprar o
no comprar la vivienda) y depende de una serie de variables independientes Xi como son el ingreso, la edad, tal que Ii = β0 + β1X1 +...+ βnXn, donde el mayor valor de li, significa una
mayor probabilidad de ser propietario de la vivienda. Para cada familia, existe un umbral crítico I*, donde si es superado la casa es comprada por alguien más, es decir, la cas ano es
comprada, y la probabilidad de salida (P) se asume distribuida normalmente, tal que Pi=CDF(I) utilizando una función de distribución acumulada normal estándar (CDF). Por lo tanto, usa
los coeficientes estimados exactamente igual a los de un modelo de regresión, utilizando el valor Estimado Y, y aplicar la distribución normal estándar (usted puede usar la función Excel
DISTR.NORM.ESTAND o la herramienta de Análisis de Distribución seleccionando la distribución Normal y ajustando la media en 0 y la desviación estándar en 1). Finalmente, para
obtener un Probit o unidad de probabilidad, defina li + 5 (esto es porque siempre la probabilidad Pi < 0.5, el estimado li es negativo, debido al hecho que la distribución normal es
simétrica alrededor de una media de cero).
El modelo Tobit (Tobit Censurado) es un método de modelación biométrica y econométrica usada para describir la relación entre una variable dependiente no-negativa Yi y una o más
variables independientes Xi. Un modelo Tobit es un modelo econométrico en el cual la variable dependiente es censurada; esto es, la variable dependiente es censurada porque los
valores debajo de cero no son observados. El modelo Tobit asume que existe una variable inobservable latente Y*. Esta variable es linealmente dependiente de las variables Xi vía un
vector de coeficientes βi, que determina sus interrelaciones. En adición, el término del error Ui está distribuido normalmente para capturar la influencia aleatoria en esta relación. La
variable observable Yi es definida como la igualdad de la variable latente siempre que las variables latentes sean superiores a cero y Yi es asumido como cero en otro caso. Esto es, Yi =
Y* si Y* > 0 y Yi = 0 si Y* = 0. Si el parámetro de relación βi es estimado utilizando una regresión de mínimos cuadrados ordinarios de los observados Yi en Xi, los estimadores de la
regresión calculada son inconsistentes y el coeficiente de la pendiente se encuentra insesgada hacia abajo y el intercepto insesgado hacia arriba. Únicamente el MLE podría ser
consistente para un modelo Tobit. En el modelo Tobit, se tiene un complemento estadístico llamado Sigma, el cual e equivalente al error estándar de la estimación en una regresión de
mínimos cuadrados ordinarios y los coeficientes estimados son usados en el mismo sentido que en el análisis de regresión.
Resultados
H0 > 5% se acepta
Ha <= 5% significativa
Modelo de Máxima Verosimilitud: LOGIT, PROBIT, TOBIT
LOGIT & PROBIT
Deuda de la
Incumplimiento Años con el Años en la Razón de la Tarjeta de Otras
Edad empleador Dirección Deuda/Ingre Deuda
de pago (Default) actual Actual sos ( %) crédito (Miles $)
(Miles $)
Las Variables Dependientes Limitadas describen las situaciones donde la variable dependiente contiene datos que están limitados en alcance y rango, como binarias (0 o 1), truncadas,
ordenadas o datos censurados. Por ejemplo, dado un conjunto de variables independientes (p.ej., edad, ingreso, educación, cupo de tarjeta de crédito o tenencia de préstamo
hipotecario), podemos calcular la probabilidad de incumplimiento utilizando la estimación de máxima verosimilitud (MLE – por sus siglas en ingles). La respuesta o variable dependiente
Y es binaria, es decir, puede tener solamente dos posibles resultados que denotaremos como 1 y 0 (p.ej., Y puede representar la ausencia/presencia de una condición especifica,
cumplimiento/incumplimiento de un préstamo previo, éxito/fracaso de algunos dispositivos, respuesta si/no en estudios, etc.). También tenemos un vector de variables independientes o
regresores de X, los cuales se asumen con influencia en el resultado Y. Una típica aproximación con una regresión de mínimos cuadrados ordinarios es incorrecta porque los errores de
la regresión son heteroscedasticos y no normales; y los resultados estimados de probabilidad resultantes serian valores sin sentido sobre 1 o debajo de 0. MLE se ocupa de estos
problemas de análisis utilizando una rutina de optimización iterativa que maximiza la función logarítmica de verosimilitud cuando las variables dependientes son limitadas.
Una regresión Logit o Logística es usada para predecir la probabilidad de ocurrencia de un evento para datos ajustados a una curva logística. Esto es generalizado en el modelo lineal
utilizado para la regresión binomial. MLE aplicado en un análisis logístico multivariado binario es usado para modelar variables dependientes para determinar la probabilidad esperada de
éxito de pertenecer a un cierto grupo. Los coeficientes estimados por el modelo Logit son cocientes logarítmicos de probabilidad, y no pueden interpretarse directamente como
probabilidades. Un rápido calculo es requerido primero y luego la aproximación es sencilla.
Específicamente, el modelo Logit es especificado como Estimado Y= LN[Pi/(1–Pi)] o en cambio, , Pi = EXP(Estimado Y)/(1+EXP(Y Estimado)), y los coeficientes βi son cocientes
logarítmicos de probabilidad, a fin de tomar el antilogaritmo o EXP(βi) obtenemos los cocientes de probabilidad de Pi/(1–Pi). Esto significa que un incremento en una unidad de βi
incrementa la probabilidad en este monto. Finalmente, la tasa de cambio en la probabilidad dP/dX = βiPi(1–Pi). El Error Estándar mide la precisión de los coeficientes, y la t-estadística
son los coeficientes de cada Coeficiente respecto a sus errores estándar, los cuales son usados en la prueba de hipótesis para calcular el nivel de significancia de cada parámetro
estimado. Para estimar la probabilidad éxito de pertenecer a un grupo especifico (p. ej., predecir si un fumador desarrollara complicaciones pulmonares dado el monto de cigarrillos
consumidos por año), simplemente calcule el valor Estimado Y utilizando los coeficientes MLE. Por ejemplo, si el modelo es Y = 1.1 + 0.005 (Cigarrillos) entonces para una persona que
fume paquetes de cigarrillos por año tiene un Y Estimado de 1.1 + 0.005(100) = 1.6. Después, calcule la inversa del antilogaritmo para el valor encontrado previamente de probabilidad
EXP(Y Estimado)/[1 + EXP(Y Estimado)] = EXP(1.6)/(1+ EXP(1.6)) = 0.8320. Por lo tanto una persona tiene un 82.20% de probabilidad de desarrollar algun tipo de complicación
pulmonar en vida.
Un modelo Probit (algunas veces conocido como modelo Normit) es una alternativa popular de especificación para un modelo binario en cual emplea una función probit utilizando una
estimación de máxima verosimilitud y la aproximación es llamada regresión probit. Los modelos de regresión Probit o Logistica tienden a producir predicciones similares, donde los
parámetros estimados en una regresión logística son entre 1.6 y 1.8 veces más altos que los correspondientes a los coeficientes de un modelo Probit. La elección de un modelo Probit o
Logit es enteramente relacionado con la conveniencia particular, y la principal distinción entre ambos se basa en el hecho que la distribución logística tiene una mayor curtosis (colas
gordas) para tener en cuenta en los valores extremos. Por ejemplo, suponga que una familia tiene la decisión de adquirir una vivienda y su respuesta es una variable binaria (comprar o
no comprar la vivienda) y depende de una serie de variables independientes Xi como son el ingreso, la edad, tal que Ii = β0 + β1X1 +...+ βnXn, donde el mayor valor de li, significa una
mayor probabilidad de ser propietario de la vivienda. Para cada familia, existe un umbral crítico I*, donde si es superado la casa es comprada por alguien más, es decir, la cas ano es
comprada, y la probabilidad de salida (P) se asume distribuida normalmente, tal que Pi=CDF(I) utilizando una función de distribución acumulada normal estándar (CDF). Por lo tanto, usa
los coeficientes estimados exactamente igual a los de un modelo de regresión, utilizando el valor Estimado Y, y aplicar la distribución normal estándar (usted puede usar la función Excel
DISTR.NORM.ESTAND o la herramienta de Análisis de Distribución seleccionando la distribución Normal y ajustando la media en 0 y la desviación estándar en 1). Finalmente, para
obtener un Probit o unidad de probabilidad, defina li + 5 (esto es porque siempre la probabilidad Pi < 0.5, el estimado li es negativo, debido al hecho que la distribución normal es
simétrica alrededor de una media de cero).
El modelo Tobit (Tobit Censurado) es un método de modelación biométrica y econométrica usada para describir la relación entre una variable dependiente no-negativa Yi y una o más
variables independientes Xi. Un modelo Tobit es un modelo econométrico en el cual la variable dependiente es censurada; esto es, la variable dependiente es censurada porque los
valores debajo de cero no son observados. El modelo Tobit asume que existe una variable inobservable latente Y*. Esta variable es linealmente dependiente de las variables Xi vía un
vector de coeficientes βi, que determina sus interrelaciones. En adición, el término del error Ui está distribuido normalmente para capturar la influencia aleatoria en esta relación. La
variable observable Yi es definida como la igualdad de la variable latente siempre que las variables latentes sean superiores a cero y Yi es asumido como cero en otro caso. Esto es, Yi =
Y* si Y* > 0 y Yi = 0 si Y* = 0. Si el parámetro de relación βi es estimado utilizando una regresión de mínimos cuadrados ordinarios de los observados Yi en Xi, los estimadores de la
regresión calculada son inconsistentes y el coeficiente de la pendiente se encuentra insesgada hacia abajo y el intercepto insesgado hacia arriba. Únicamente el MLE podría ser
consistente para un modelo Tobit. En el modelo Tobit, se tiene un complemento estadístico llamado Sigma, el cual e equivalente al error estándar de la estimación en una regresión de
mínimos cuadrados ordinarios y los coeficientes estimados son usados en el mismo sentido que en el análisis de regresión.
Resultados
H0 > 5% se acepta
Ha <= 5% significativa
Modelo de Máxima Verosimilitud: LOGIT, PROBIT, TOBIT
LOGIT & PROBIT
Deuda de la
Incumplimiento Años con el Años en la Razón de la Tarjeta de
Edad empleador Dirección Deuda/Ingre
de pago (Default) actual Actual sos ( %) crédito
(Miles $)
1 41 17 12 9.3 11.36
0 27 10 6 17.3 1.36
0 40 15 14 5.5 0.86
0 41 15 14 2.9 2.66
1 24 2 0 17.3 1.79
0 41 5 5 10.2 0.39
0 39 20 9 30.6 3.83
0 43 12 11 3.6 0.13
1 24 3 4 24.4 1.36
0 36 0 13 19.7 2.78
0 27 0 1 1.7 0.18
0 25 4 0 5.2 0.25
0 52 24 14 10 3.93
0 37 6 9 16.3 1.72
0 48 22 15 9.1 3.7
1 36 9 6 8.6 0.82
1 36 13 6 16.4 2.92
0 43 23 19 7.6 1.18
0 39 6 9 5.7 0.56
0 41 0 21 1.7 0.1
0 39 22 3 3.2 1.15
0 47 17 21 5.6 0.59
0 28 3 6 10 0.43
0 29 8 6 9.8 0.4
1 21 1 2 18 0.24
0 25 0 2 17.6 2.14
0 45 9 26 6.7 0.71
0 43 25 21 16.7 0.95
0 33 12 8 18.4 3.08
0 26 2 1 14.2 0.2
0 45 3 15 2.1 0.11
0 30 1 10 10.5 1.14
0 27 2 7 6 0.72
0 25 8 4 14.4 1.02
0 25 8 1 2.9 0.08
0 26 6 7 26 6.05
0 30 10 4 16.1 1.41
0 32 12 1 14.4 3.2
1 28 1 8 17.1 1.34
0 45 23 5 4.2 0.56
0 23 7 2 6.6 0.34
0 34 17 3 8 1.81
0 42 7 23 4.6 0.94
0 39 19 5 13.1 1.93
1 26 0 0 7.5 0.3
0 21 0 1 6.8 0.15
0 35 13 15 4.5 0.43
0 47 4 2 10.4 0.12
1 23 0 2 11.4 0.78
0 35 18 2 7.4 0.21
1 34 2 11 12.6 0.57
0 46 1 12 14 0.81
1 46 16 18 12.9 3.03
0 38 3 18 3.7 0.31
0 40 3 2 9.5 0.55
1 37 1 3 15.1 1.8
0 35 9 1 5 0.4
0 39 16 13 2.4 1.06
0 40 18 6 2.5 1.49
0 50 10 20 12.2 2.48
0 31 9 10 2.4 0.05
1 29 13 1 7.4 1.46
0 37 4 0 12.4 0.87
0 33 4 9 7 2.16
0 26 5 7 7.8 1.02
1 32 11 6 23.3 7.76
1 28 2 3 6.4 0.19
0 39 19 8 9.1 2.52
1 28 8 3 8.2 1.49
1 29 1 2 18.6 0.57
0 34 3 8 23.1 1.4
0 28 5 9 23.8 3.1
0 47 26 21 12.8 4.58
0 43 1 5 10.6 1.52
0 41 13 10 1.7 0.07
0 47 13 25 23.8 3.74
0 24 2 1 0.6 0.03
0 29 1 9 6.7 0.16
0 33 14 2 2.6 0.2
0 36 15 10 3.2 0.69
1 26 4 3 10.5 2.47
0 31 11 12 17 2.74
0 37 7 3 19.6 2.7
0 35 4 16 11 1.84
0 26 4 3 5.4 0.32
0 40 10 15 18.8 2.01
1 29 5 4 12.4 3.49
0 37 5 17 24.6 1.41
0 32 12 12 2.9 0.12
1 23 0 1 27.7 2.04
0 32 3 10 6.2 0.05
1 25 1 6 11.4 0.37
0 38 5 5 10.6 1.5
1 32 0 6 5.8 0.3
1 41 2 0 26.3 1.96
0 36 17 6 4.4 0.73
0 42 13 0 3.3 1.32
0 41 14 8 7.3 0.93
0 29 4 9 6.3 0.68
1 38 4 6 9.3 1.33
0 39 22 9 2.6 0.99
0 36 6 9 8.3 0.03
0 33 8 7 5.8 0.78
0 42 21 11 3.1 1.37
0 41 22 17 23.6 9.88
0 40 8 17 3.6 0.53
1 53 9 18 11.2 2.02
0 28 4 7 13.5 1.3
0 36 12 13 7.9 1.72
0 34 9 13 10.1 1.12
0 45 2 5 4.9 0.46
0 38 6 0 8.9 0.27
0 21 0 2 7.7 0.83
0 42 12 11 21.4 2.41
0 52 16 25 8.6 1.87
0 25 4 6 5.2 0.55
0 34 9 9 6.2 2.11
0 40 15 16 3.4 1.03
1 31 0 4 12.8 1.09
1 25 1 0 6.7 0.47
0 45 12 19 9.5 1.34
1 23 3 0 8.4 0.28
1 34 6 3 35.3 1.98
1 31 2 4 12.7 1.09
0 28 5 9 2.8 0.14
0 41 7 11 4.4 0.69
1 39 7 2 13 1.02
0 29 9 3 1.4 0.13
0 21 5 1 9 0.37
0 41 19 2 5.8 1.51
0 26 1 7 2.9 0.31
0 33 5 10 12.9 0.98
0 45 18 19 17.4 0.55
0 39 17 20 13.7 2.45
0 24 7 2 6.3 0.52
0 29 6 7 2.2 0.45
0 27 1 0 12.4 0.29
0 40 13 2 5.9 0.96
0 29 8 10 6.7 0.47
1 29 4 3 6.6 1.16
1 24 0 2 16 1.01
1 27 9 6 17.8 2.85
0 41 16 22 4.4 1.28
0 31 11 8 9.1 0.14
0 41 16 17 5.4 0.45
0 42 5 3 3.4 0.36
0 28 1 3 12.4 0.38
0 30 2 8 10 1.77
0 30 11 1 8.4 0.68
0 31 8 4 8 1.72
0 45 15 14 18.1 1.55
1 43 13 23 6.1 2.15
0 36 4 10 16.3 1.33
0 28 8 6 7.2 0.61
0 27 3 5 13.2 1.63
0 36 13 3 19.2 2.8
0 33 12 11 11.3 2.1
1 54 9 2 14.8 1.56
1 33 9 4 13.8 1.35
0 31 9 5 4.5 0.31
0 21 4 0 8.9 1.42
0 28 5 9 8.7 0.77
1 31 2 1 6.8 0.28
0 32 8 6 4.1 0.33
1 35 1 8 12.5 0.59
1 40 13 11 18.9 6.23
1 22 4 2 15.6 1.64
0 39 4 9 6.5 1.18
0 41 14 3 1.7 0.35
0 34 16 9 4 1.73
0 29 7 9 9.7 0.55
0 31 4 10 11.3 0.29
1 32 1 0 4.8 0.31
0 32 14 7 8.8 3.75
0 33 6 14 7.5 0.57
0 26 6 0 10.3 0.72
0 21 1 1 17.3 0.16
0 28 7 2 7 0.36
0 37 13 5 8.9 0.6
1 33 2 14 22.9 2.12
0 39 12 10 5 0.56
0 40 8 19 5.6 0.88
0 45 16 21 3 0.91
0 27 10 6 6.5 0.85
0 28 0 7 24.2 1.42
0 39 13 9 8 0.97
1 40 14 21 15 2.79
0 27 11 8 16.9 4.64
0 36 1 4 9.3 0.43
0 55 19 2 15.6 4.4
1 27 4 3 13.2 1.09
0 30 1 8 11 0.75
1 36 10 0 11.2 0.82
1 31 1 6 2.5 0.28
0 33 13 2 7.2 0.18
0 30 4 0 4.2 0.5
1 24 1 0 5.9 0.24
0 33 9 10 4.3 0.38
0 50 8 27 6.9 0.4
1 31 6 6 23.1 3.34
0 28 3 7 4.1 0.26
1 44 8 10 6.1 0.28
0 48 3 23 9.8 0.97
0 36 0 17 9.7 0.33
0 29 7 1 5.5 0.57
0 40 17 11 6 2.56
0 33 7 6 6 0.54
0 26 6 6 1 0.14
0 36 14 11 7.2 1.78
0 26 6 0 1.9 0.09
0 40 16 6 12.1 1.61
1 44 5 3 9 1.97
0 29 1 10 4.5 0.28
1 35 5 3 5.4 0.58
0 34 16 3 10.4 3.95
0 34 12 8 6.7 1.3
0 46 14 25 10.2 1.35
0 41 21 22 12.2 3.24
1 27 7 8 4 0.45
1 27 0 6 8 1.62
0 28 11 6 2.4 0.11
0 48 0 27 10.8 0.85
0 48 17 26 12 3.38
1 29 5 6 19.9 3.18
1 43 9 5 20.4 4.04
0 23 5 2 7.9 0.3
0 29 10 8 18.1 3.7
0 40 5 6 1.9 0.88
0 22 0 3 5.6 0.21
0 23 7 3 14.4 0.85
0 46 9 10 15.3 1.61
1 55 3 11 8 0.56
0 38 8 16 0.6 0.03
0 35 5 1 2.8 0.1
0 30 11 9 0.9 0.07
0 24 7 0 6.5 0.53
0 26 4 3 9.5 0.23
1 32 2 11 9.1 0.12
0 37 11 4 3.5 0.63
1 39 6 19 19.9 2.54
0 30 4 4 18.3 0.49
0 30 10 11 9.5 2.06
0 32 7 10 4.3 0.43
0 54 21 20 14.4 9.6
0 27 3 4 13.3 1.6
0 31 12 4 23.7 2.06
0 39 15 16 1.8 0.14
0 31 5 3 14.1 1.18
0 35 15 11 18.5 1.21
0 35 10 16 13.3 4.87
0 46 22 17 11.1 3.32
1 33 13 3 21.3 2.71
0 35 13 3 1.9 1.42
0 35 1 1 7.9 0.37
0 38 5 13 9 0.45
0 41 19 1 7.8 2.25
0 38 18 19 4.5 0.61
0 34 2 14 13.2 1.14
0 51 16 25 4.4 2.6
0 34 10 2 9.5 0.57
0 47 15 1 24.5 2.21
0 34 8 6 5.4 2.16
0 27 8 7 11.9 0.4
1 52 9 11 19.2 0.8
0 39 9 6 5 0.23
0 33 7 0 6.4 0.63
0 34 0 1 7.2 0.19
1 31 9 7 14.6 3.11
0 28 2 9 15.2 0.87
0 39 19 16 3.7 0.92
0 51 22 23 7.6 4.14
0 22 4 1 1.2 0.08
0 27 6 4 10.4 0.93
0 32 16 10 21 0.69
0 28 6 7 7.2 0.77
1 27 1 0 10.3 0.38
1 26 2 6 13.6 1.58
0 32 14 0 2.4 0.27
1 30 0 11 3.7 0.45
0 39 13 1 8.9 1.9
1 31 11 6 4.8 0.35
1 34 15 2 24.7 4.37
0 31 8 3 12.6 0.13
0 29 1 7 10.4 0.57
0 29 9 0 13.9 1.07
0 35 9 16 7.6 0.65
0 29 11 7 6 0.93
1 38 2 16 22.7 1.21
0 35 16 15 3.4 0.18
0 29 11 5 6.1 0.71
0 23 3 4 4.4 0.26
0 33 9 8 5.5 0.5
0 51 19 25 2.8 1.07
0 24 4 2 2.6 0.1
1 31 10 12 9.8 3.24
0 45 10 14 5.4 0.93
0 29 3 1 9 0.47
0 34 0 10 17.1 2.05
1 25 4 5 5 0.55
0 37 20 2 1.9 0.54
1 47 29 18 25.3 20.56
0 43 6 24 9.6 0.62
0 47 22 19 5.5 1.51
0 24 6 2 5.2 0.11
0 27 5 1 6.3 2.21
0 25 9 4 1.2 0.07
0 36 11 12 14.7 0.45
0 39 16 20 19.4 1.56
0 26 10 1 7.1 1.31
0 41 4 19 10.1 1.06
1 39 19 15 27.1 9.59
0 37 18 8 12.1 4.59
1 29 2 0 14.4 0.59
0 42 6 9 11.6 1.02
0 31 1 6 11.1 1.07
0 36 4 15 17.3 0.52
0 39 16 4 20 4.16
0 23 0 2 6.7 0.47
0 39 4 15 7 0.4
1 27 4 1 3.1 0.28
0 24 8 4 5 0.38
1 27 3 4 11 0.29
0 41 16 22 1.6 0.43
1 38 0 8 8.1 0.9
1 40 5 12 16.4 1.58
1 54 25 12 26.5 14.6
0 40 12 6 17.4 2.77
0 40 2 4 3.7 0.85
0 29 1 8 8 0.16
0 30 8 6 12 0.76
0 29 1 1 1.1 0.03
1 29 3 3 2.4 0.26
1 28 2 4 2.5 0.46
0 28 0 5 10.4 0.64
0 39 16 9 14.3 5
0 32 11 2 3.3 0.09
0 36 7 16 15.4 2.65
0 39 20 12 8.2 0.77
1 28 6 8 19.8 5.57
1 28 4 2 14.2 0.44
0 46 6 19 12.2 1.99
0 30 4 8 6.5 0.35
0 39 15 19 4.9 0.42
1 40 5 3 16 8.17
0 44 18 4 13.4 4.52
1 30 0 8 16.6 0.62
0 24 3 0 4.3 0.36
0 32 10 13 11.3 1.17
0 29 3 8 2.6 0.15
0 40 2 1 3.8 0.28
0 41 8 21 0.7 0.09
0 22 1 3 18.6 0.81
0 38 10 8 1.2 0.04
0 37 6 13 8.5 1.19
1 41 18 6 15.7 6.57
1 41 7 6 14.5 0.37
1 39 2 15 23.1 1.92
1 24 0 2 16.1 0.32
0 32 9 10 23 2.69
0 21 0 1 7.7 1.53
0 29 13 7 2.3 0.07
0 35 14 3 0.8 0.47
0 29 6 7 18.1 1.11
0 41 2 22 6.7 0.11
1 37 0 18 12.9 1.58
0 32 3 13 1.9 0.43
0 36 5 12 8.1 0.73
0 39 18 9 2.1 0.37
0 36 18 9 11.2 5.25
0 46 22 4 2.3 0.83
0 34 13 11 9.6 1.88
0 27 7 4 9.1 0.64
0 43 8 11 3.3 0.68
1 33 14 8 41.3 15.02
0 39 20 17 1.4 0.34
0 29 1 4 2.5 0.13
0 34 7 15 6.4 0.95
0 26 1 0 4.9 0.61
0 31 15 2 4.8 0.8
0 26 10 6 2.7 0.31
0 28 12 7 7.7 1.85
1 48 13 20 30.8 6.11
1 39 2 12 16 4
0 37 3 3 3.7 0.28
1 52 9 0 9.4 1.33
0 48 3 11 21.3 1.4
0 26 7 3 5.1 0.21
0 46 15 0 3.1 0.48
0 31 7 10 4.9 0.23
0 34 13 8 6.1 0.86
0 40 22 4 3.6 0.63
1 24 2 5 6.4 0.27
0 33 2 14 3.1 0.53
1 53 5 29 17.3 6.94
1 47 9 1 20.1 2.54
0 35 5 5 13 0.17
0 34 14 8 17 1.14
0 49 11 5 10.1 2.46
0 26 0 7 9.3 1.27
1 23 2 2 9.6 0.8
0 23 0 4 8.7 0.45
0 38 4 13 1.6 0.44
0 28 5 2 8.3 1.12
1 30 0 8 29.7 3.9
0 34 18 10 15.4 2.1
0 50 16 14 11.1 1.66
0 29 12 2 6.7 1.63
0 42 0 9 6.6 0.28
0 31 13 12 5 0.24
0 39 10 4 4.8 0.18
0 45 21 26 3 2.56
0 45 22 24 11.7 1.26
0 36 14 17 5.7 1.89
1 25 0 6 12.1 1.6
1 29 1 7 21.2 2.33
0 30 8 4 6.4 0.33
0 31 1 1 4.5 0.22
0 43 4 2 4.6 0.05
1 32 11 4 23.8 5.44
0 47 19 7 30.1 3.18
1 46 1 15 14.8 1.38
0 43 16 10 4.1 0.26
0 48 3 7 7 0.76
0 30 8 7 2.8 0.55
1 23 0 4 18.4 0.82
0 36 8 0 1.6 0.02
0 20 0 1 2.3 0.04
0 43 16 7 0.4 0.16
1 23 2 1 4.5 0.12
0 41 21 2 20.5 6.95
1 34 12 5 25.1 7.82
0 50 11 5 4.8 0.83
0 40 9 4 6.6 0.79
1 29 0 8 12.9 1.04
0 39 9 16 18.7 4.76
0 24 1 2 5.7 0.84
0 27 0 5 1.1 0.13
0 40 18 14 6.6 3.33
0 32 8 2 3.7 0.98
0 39 16 12 3.7 0.69
0 40 22 1 14.6 5.4
0 32 10 11 9.1 1.54
0 39 23 1 18.9 3.13
1 24 3 3 28.9 2.68
1 43 18 14 6.5 16.03
0 56 11 20 15 4.67
0 32 5 9 4.5 0.33
0 42 7 12 10.2 1.63
1 46 3 13 13.2 3.04
1 31 2 2 16.4 1.74
0 43 25 16 2.6 1.64
0 28 6 9 11.5 0.65
0 39 11 17 12.9 2.56
0 39 0 8 7.9 1.07
1 37 1 14 16.1 2.69
0 30 0 11 12 0.3
0 37 9 16 5.9 0.89
0 22 4 3 17.5 0.23
0 50 1 26 14.3 1.85
0 30 10 2 4.4 0.34
0 39 8 0 4 0.28
1 21 0 2 12.5 0.49
0 31 9 2 2.6 0.12
0 31 9 1 5.8 0.6
0 48 0 23 22.3 2.66
0 28 4 1 23.8 1.09
1 47 16 26 17.6 15.79
0 27 6 1 4.4 0.24
0 29 6 10 18.4 1.99
1 21 2 0 4.5 0.29
1 29 7 5 19.8 1.01
1 24 0 3 6.6 0.59
0 44 12 3 9.7 0.36
0 22 1 0 4.4 0.27
0 38 13 0 2.4 0.41
0 52 12 16 7.7 0.99
1 25 3 2 16.3 0.35
0 25 5 5 10.9 0.4
0 51 27 21 11.5 0.82
0 38 21 16 16.5 4.58
0 44 9 20 5.2 0.55
1 24 2 3 9.7 0.89
0 34 5 3 7.3 0.78
0 25 6 2 4.5 0.07
1 45 5 17 10.5 3.61
0 34 4 10 5.8 0.57
1 27 2 8 5.7 0.32
1 33 10 13 20.9 6.11
1 35 0 16 15 1.97
0 50 15 31 1.1 0.47
0 33 13 13 3.6 0.23
1 41 13 13 25.2 2.32
1 28 0 2 33.3 2.28
1 38 12 14 16 5.72
1 25 3 2 17.8 1.01
1 47 4 9 7.1 1.19
0 30 12 9 7.2 2.94
0 44 12 5 13 1.48
1 25 0 2 18.9 0.51
1 41 6 0 19.5 4.51
Logit, Probit/Normit, Tobit: Variables Dependientes Limitadas utilizando Estimación por Máxima Verosimilitud
Las Variables Dependientes Limitadas describen las situaciones donde la variable dependiente contiene datos que están limitados en alcance y rango, como binarias (0 o 1), truncadas,
ordenadas o datos censurados. Por ejemplo, dado un conjunto de variables independientes (p.ej., edad, ingreso, educación, cupo de tarjeta de crédito o tenencia de préstamo
hipotecario), podemos calcular la probabilidad de incumplimiento utilizando la estimación de máxima verosimilitud (MLE – por sus siglas en ingles). La respuesta o variable dependiente
Y es binaria, es decir, puede tener solamente dos posibles resultados que denotaremos como 1 y 0 (p.ej., Y puede representar la ausencia/presencia de una condición especifica,
cumplimiento/incumplimiento de un préstamo previo, éxito/fracaso de algunos dispositivos, respuesta si/no en estudios, etc.). También tenemos un vector de variables independientes o
regresores de X, los cuales se asumen con influencia en el resultado Y. Una típica aproximación con una regresión de mínimos cuadrados ordinarios es incorrecta porque los errores de
la regresión son heteroscedasticos y no normales; y los resultados estimados de probabilidad resultantes serian valores sin sentido sobre 1 o debajo de 0. MLE se ocupa de estos
problemas de análisis utilizando una rutina de optimización iterativa que maximiza la función logarítmica de verosimilitud cuando las variables dependientes son limitadas.
Una regresión Logit o Logística es usada para predecir la probabilidad de ocurrencia de un evento para datos ajustados a una curva logística. Esto es generalizado en el modelo lineal
utilizado para la regresión binomial. MLE aplicado en un análisis logístico multivariado binario es usado para modelar variables dependientes para determinar la probabilidad esperada de
éxito de pertenecer a un cierto grupo. Los coeficientes estimados por el modelo Logit son cocientes logarítmicos de probabilidad, y no pueden interpretarse directamente como
probabilidades. Un rápido calculo es requerido primero y luego la aproximación es sencilla.
Específicamente, el modelo Logit es especificado como Estimado Y= LN[Pi/(1–Pi)] o en cambio, , Pi = EXP(Estimado Y)/(1+EXP(Y Estimado)), y los coeficientes βi son cocientes
logarítmicos de probabilidad, a fin de tomar el antilogaritmo o EXP(βi) obtenemos los cocientes de probabilidad de Pi/(1–Pi). Esto significa que un incremento en una unidad de βi
incrementa la probabilidad en este monto. Finalmente, la tasa de cambio en la probabilidad dP/dX = βiPi(1–Pi). El Error Estándar mide la precisión de los coeficientes, y la t-estadística
son los coeficientes de cada Coeficiente respecto a sus errores estándar, los cuales son usados en la prueba de hipótesis para calcular el nivel de significancia de cada parámetro
estimado. Para estimar la probabilidad éxito de pertenecer a un grupo especifico (p. ej., predecir si un fumador desarrollara complicaciones pulmonares dado el monto de cigarrillos
consumidos por año), simplemente calcule el valor Estimado Y utilizando los coeficientes MLE. Por ejemplo, si el modelo es Y = 1.1 + 0.005 (Cigarrillos) entonces para una persona que
fume paquetes de cigarrillos por año tiene un Y Estimado de 1.1 + 0.005(100) = 1.6. Después, calcule la inversa del antilogaritmo para el valor encontrado previamente de probabilidad
EXP(Y Estimado)/[1 + EXP(Y Estimado)] = EXP(1.6)/(1+ EXP(1.6)) = 0.8320. Por lo tanto una persona tiene un 82.20% de probabilidad de desarrollar algun tipo de complicación
pulmonar en vida.
Un modelo Probit (algunas veces conocido como modelo Normit) es una alternativa popular de especificación para un modelo binario en cual emplea una función probit utilizando una
estimación de máxima verosimilitud y la aproximación es llamada regresión probit. Los modelos de regresión Probit o Logistica tienden a producir predicciones similares, donde los
parámetros estimados en una regresión logística son entre 1.6 y 1.8 veces más altos que los correspondientes a los coeficientes de un modelo Probit. La elección de un modelo Probit o
Logit es enteramente relacionado con la conveniencia particular, y la principal distinción entre ambos se basa en el hecho que la distribución logística tiene una mayor curtosis (colas
gordas) para tener en cuenta en los valores extremos. Por ejemplo, suponga que una familia tiene la decisión de adquirir una vivienda y su respuesta es una variable binaria (comprar o
no comprar la vivienda) y depende de una serie de variables independientes Xi como son el ingreso, la edad, tal que Ii = β0 + β1X1 +...+ βnXn, donde el mayor valor de li, significa una
mayor probabilidad de ser propietario de la vivienda. Para cada familia, existe un umbral crítico I*, donde si es superado la casa es comprada por alguien más, es decir, la cas ano es
comprada, y la probabilidad de salida (P) se asume distribuida normalmente, tal que Pi=CDF(I) utilizando una función de distribución acumulada normal estándar (CDF). Por lo tanto, usa
los coeficientes estimados exactamente igual a los de un modelo de regresión, utilizando el valor Estimado Y, y aplicar la distribución normal estándar (usted puede usar la función Excel
DISTR.NORM.ESTAND o la herramienta de Análisis de Distribución seleccionando la distribución Normal y ajustando la media en 0 y la desviación estándar en 1). Finalmente, para
obtener un Probit o unidad de probabilidad, defina li + 5 (esto es porque siempre la probabilidad Pi < 0.5, el estimado li es negativo, debido al hecho que la distribución normal es
simétrica alrededor de una media de cero).
El modelo Tobit (Tobit Censurado) es un método de modelación biométrica y econométrica usada para describir la relación entre una variable dependiente no-negativa Yi y una o más
variables independientes Xi. Un modelo Tobit es un modelo econométrico en el cual la variable dependiente es censurada; esto es, la variable dependiente es censurada porque los
valores debajo de cero no son observados. El modelo Tobit asume que existe una variable inobservable latente Y*. Esta variable es linealmente dependiente de las variables Xi vía un
vector de coeficientes βi, que determina sus interrelaciones. En adición, el término del error Ui está distribuido normalmente para capturar la influencia aleatoria en esta relación. La
variable observable Yi es definida como la igualdad de la variable latente siempre que las variables latentes sean superiores a cero y Yi es asumido como cero en otro caso. Esto es, Yi =
Y* si Y* > 0 y Yi = 0 si Y* = 0. Si el parámetro de relación βi es estimado utilizando una regresión de mínimos cuadrados ordinarios de los observados Yi en Xi, los estimadores de la
regresión calculada son inconsistentes y el coeficiente de la pendiente se encuentra insesgada hacia abajo y el intercepto insesgado hacia arriba. Únicamente el MLE podría ser
consistente para un modelo Tobit. En el modelo Tobit, se tiene un complemento estadístico llamado Sigma, el cual e equivalente al error estándar de la estimación en una regresión de
mínimos cuadrados ordinarios y los coeficientes estimados son usados en el mismo sentido que en el análisis de regresión.
Resultados
H0 > 5% se acepta
Ha <= 5% significativa
Modelo de Máxima Verosimilitud
LOGIT
Deuda de la
Incumplimiento Años con el Años en la Razón de la
empleador Dirección Deuda/Ingre Tarjeta de
de pago (Default) actual Actual sos ( %) crédito
(Miles $)
1 17 12 9.3 11.36
0 10 6 17.3 1.36
0 15 14 5.5 0.86
0 15 14 2.9 2.66
1 2 0 17.3 1.79
0 5 5 10.2 0.39
0 20 9 30.6 3.83
0 12 11 3.6 0.13
1 3 4 24.4 1.36
0 0 13 19.7 2.78
0 0 1 1.7 0.18
0 4 0 5.2 0.25
0 24 14 10 3.93
0 6 9 16.3 1.72
0 22 15 9.1 3.7
1 9 6 8.6 0.82
1 13 6 16.4 2.92
0 23 19 7.6 1.18
0 6 9 5.7 0.56
0 0 21 1.7 0.1
0 22 3 3.2 1.15
0 17 21 5.6 0.59
0 3 6 10 0.43
0 8 6 9.8 0.4
1 1 2 18 0.24
0 0 2 17.6 2.14
0 9 26 6.7 0.71
0 25 21 16.7 0.95
0 12 8 18.4 3.08
0 2 1 14.2 0.2
0 3 15 2.1 0.11
0 1 10 10.5 1.14
0 2 7 6 0.72
0 8 4 14.4 1.02
0 8 1 2.9 0.08
0 6 7 26 6.05
0 10 4 16.1 1.41
0 12 1 14.4 3.2
1 1 8 17.1 1.34
0 23 5 4.2 0.56
0 7 2 6.6 0.34
0 17 3 8 1.81
0 7 23 4.6 0.94
0 19 5 13.1 1.93
1 0 0 7.5 0.3
0 0 1 6.8 0.15
0 13 15 4.5 0.43
0 4 2 10.4 0.12
1 0 2 11.4 0.78
0 18 2 7.4 0.21
1 2 11 12.6 0.57
0 1 12 14 0.81
1 16 18 12.9 3.03
0 3 18 3.7 0.31
0 3 2 9.5 0.55
1 1 3 15.1 1.8
0 9 1 5 0.4
0 16 13 2.4 1.06
0 18 6 2.5 1.49
0 10 20 12.2 2.48
0 9 10 2.4 0.05
1 13 1 7.4 1.46
0 4 0 12.4 0.87
0 4 9 7 2.16
0 5 7 7.8 1.02
1 11 6 23.3 7.76
1 2 3 6.4 0.19
0 19 8 9.1 2.52
1 8 3 8.2 1.49
1 1 2 18.6 0.57
0 3 8 23.1 1.4
0 5 9 23.8 3.1
0 26 21 12.8 4.58
0 1 5 10.6 1.52
0 13 10 1.7 0.07
0 13 25 23.8 3.74
0 2 1 0.6 0.03
0 1 9 6.7 0.16
0 14 2 2.6 0.2
0 15 10 3.2 0.69
1 4 3 10.5 2.47
0 11 12 17 2.74
0 7 3 19.6 2.7
0 4 16 11 1.84
0 4 3 5.4 0.32
0 10 15 18.8 2.01
1 5 4 12.4 3.49
0 5 17 24.6 1.41
0 12 12 2.9 0.12
1 0 1 27.7 2.04
0 3 10 6.2 0.05
1 1 6 11.4 0.37
0 5 5 10.6 1.5
1 0 6 5.8 0.3
1 2 0 26.3 1.96
0 17 6 4.4 0.73
0 13 0 3.3 1.32
0 14 8 7.3 0.93
0 4 9 6.3 0.68
1 4 6 9.3 1.33
0 22 9 2.6 0.99
0 6 9 8.3 0.03
0 8 7 5.8 0.78
0 21 11 3.1 1.37
0 22 17 23.6 9.88
0 8 17 3.6 0.53
1 9 18 11.2 2.02
0 4 7 13.5 1.3
0 12 13 7.9 1.72
0 9 13 10.1 1.12
0 2 5 4.9 0.46
0 6 0 8.9 0.27
0 0 2 7.7 0.83
0 12 11 21.4 2.41
0 16 25 8.6 1.87
0 4 6 5.2 0.55
0 9 9 6.2 2.11
0 15 16 3.4 1.03
1 0 4 12.8 1.09
1 1 0 6.7 0.47
0 12 19 9.5 1.34
1 3 0 8.4 0.28
1 6 3 35.3 1.98
1 2 4 12.7 1.09
0 5 9 2.8 0.14
0 7 11 4.4 0.69
1 7 2 13 1.02
0 9 3 1.4 0.13
0 5 1 9 0.37
0 19 2 5.8 1.51
0 1 7 2.9 0.31
0 5 10 12.9 0.98
0 18 19 17.4 0.55
0 17 20 13.7 2.45
0 7 2 6.3 0.52
0 6 7 2.2 0.45
0 1 0 12.4 0.29
0 13 2 5.9 0.96
0 8 10 6.7 0.47
1 4 3 6.6 1.16
1 0 2 16 1.01
1 9 6 17.8 2.85
0 16 22 4.4 1.28
0 11 8 9.1 0.14
0 16 17 5.4 0.45
0 5 3 3.4 0.36
0 1 3 12.4 0.38
0 2 8 10 1.77
0 11 1 8.4 0.68
0 8 4 8 1.72
0 15 14 18.1 1.55
1 13 23 6.1 2.15
0 4 10 16.3 1.33
0 8 6 7.2 0.61
0 3 5 13.2 1.63
0 13 3 19.2 2.8
0 12 11 11.3 2.1
1 9 2 14.8 1.56
1 9 4 13.8 1.35
0 9 5 4.5 0.31
0 4 0 8.9 1.42
0 5 9 8.7 0.77
1 2 1 6.8 0.28
0 8 6 4.1 0.33
1 1 8 12.5 0.59
1 13 11 18.9 6.23
1 4 2 15.6 1.64
0 4 9 6.5 1.18
0 14 3 1.7 0.35
0 16 9 4 1.73
0 7 9 9.7 0.55
0 4 10 11.3 0.29
1 1 0 4.8 0.31
0 14 7 8.8 3.75
0 6 14 7.5 0.57
0 6 0 10.3 0.72
0 1 1 17.3 0.16
0 7 2 7 0.36
0 13 5 8.9 0.6
1 2 14 22.9 2.12
0 12 10 5 0.56
0 8 19 5.6 0.88
0 16 21 3 0.91
0 10 6 6.5 0.85
0 0 7 24.2 1.42
0 13 9 8 0.97
1 14 21 15 2.79
0 11 8 16.9 4.64
0 1 4 9.3 0.43
0 19 2 15.6 4.4
1 4 3 13.2 1.09
0 1 8 11 0.75
1 10 0 11.2 0.82
1 1 6 2.5 0.28
0 13 2 7.2 0.18
0 4 0 4.2 0.5
1 1 0 5.9 0.24
0 9 10 4.3 0.38
0 8 27 6.9 0.4
1 6 6 23.1 3.34
0 3 7 4.1 0.26
1 8 10 6.1 0.28
0 3 23 9.8 0.97
0 0 17 9.7 0.33
0 7 1 5.5 0.57
0 17 11 6 2.56
0 7 6 6 0.54
0 6 6 1 0.14
0 14 11 7.2 1.78
0 6 0 1.9 0.09
0 16 6 12.1 1.61
1 5 3 9 1.97
0 1 10 4.5 0.28
1 5 3 5.4 0.58
0 16 3 10.4 3.95
0 12 8 6.7 1.3
0 14 25 10.2 1.35
0 21 22 12.2 3.24
1 7 8 4 0.45
1 0 6 8 1.62
0 11 6 2.4 0.11
0 0 27 10.8 0.85
0 17 26 12 3.38
1 5 6 19.9 3.18
1 9 5 20.4 4.04
0 5 2 7.9 0.3
0 10 8 18.1 3.7
0 5 6 1.9 0.88
0 0 3 5.6 0.21
0 7 3 14.4 0.85
0 9 10 15.3 1.61
1 3 11 8 0.56
0 8 16 0.6 0.03
0 5 1 2.8 0.1
0 11 9 0.9 0.07
0 7 0 6.5 0.53
0 4 3 9.5 0.23
1 2 11 9.1 0.12
0 11 4 3.5 0.63
1 6 19 19.9 2.54
0 4 4 18.3 0.49
0 10 11 9.5 2.06
0 7 10 4.3 0.43
0 21 20 14.4 9.6
0 3 4 13.3 1.6
0 12 4 23.7 2.06
0 15 16 1.8 0.14
0 5 3 14.1 1.18
0 15 11 18.5 1.21
0 10 16 13.3 4.87
0 22 17 11.1 3.32
1 13 3 21.3 2.71
0 13 3 1.9 1.42
0 1 1 7.9 0.37
0 5 13 9 0.45
0 19 1 7.8 2.25
0 18 19 4.5 0.61
0 2 14 13.2 1.14
0 16 25 4.4 2.6
0 10 2 9.5 0.57
0 15 1 24.5 2.21
0 8 6 5.4 2.16
0 8 7 11.9 0.4
1 9 11 19.2 0.8
0 9 6 5 0.23
0 7 0 6.4 0.63
0 0 1 7.2 0.19
1 9 7 14.6 3.11
0 2 9 15.2 0.87
0 19 16 3.7 0.92
0 22 23 7.6 4.14
0 4 1 1.2 0.08
0 6 4 10.4 0.93
0 16 10 21 0.69
0 6 7 7.2 0.77
1 1 0 10.3 0.38
1 2 6 13.6 1.58
0 14 0 2.4 0.27
1 0 11 3.7 0.45
0 13 1 8.9 1.9
1 11 6 4.8 0.35
1 15 2 24.7 4.37
0 8 3 12.6 0.13
0 1 7 10.4 0.57
0 9 0 13.9 1.07
0 9 16 7.6 0.65
0 11 7 6 0.93
1 2 16 22.7 1.21
0 16 15 3.4 0.18
0 11 5 6.1 0.71
0 3 4 4.4 0.26
0 9 8 5.5 0.5
0 19 25 2.8 1.07
0 4 2 2.6 0.1
1 10 12 9.8 3.24
0 10 14 5.4 0.93
0 3 1 9 0.47
0 0 10 17.1 2.05
1 4 5 5 0.55
0 20 2 1.9 0.54
1 29 18 25.3 20.56
0 6 24 9.6 0.62
0 22 19 5.5 1.51
0 6 2 5.2 0.11
0 5 1 6.3 2.21
0 9 4 1.2 0.07
0 11 12 14.7 0.45
0 16 20 19.4 1.56
0 10 1 7.1 1.31
0 4 19 10.1 1.06
1 19 15 27.1 9.59
0 18 8 12.1 4.59
1 2 0 14.4 0.59
0 6 9 11.6 1.02
0 1 6 11.1 1.07
0 4 15 17.3 0.52
0 16 4 20 4.16
0 0 2 6.7 0.47
0 4 15 7 0.4
1 4 1 3.1 0.28
0 8 4 5 0.38
1 3 4 11 0.29
0 16 22 1.6 0.43
1 0 8 8.1 0.9
1 5 12 16.4 1.58
1 25 12 26.5 14.6
0 12 6 17.4 2.77
0 2 4 3.7 0.85
0 1 8 8 0.16
0 8 6 12 0.76
0 1 1 1.1 0.03
1 3 3 2.4 0.26
1 2 4 2.5 0.46
0 0 5 10.4 0.64
0 16 9 14.3 5
0 11 2 3.3 0.09
0 7 16 15.4 2.65
0 20 12 8.2 0.77
1 6 8 19.8 5.57
1 4 2 14.2 0.44
0 6 19 12.2 1.99
0 4 8 6.5 0.35
0 15 19 4.9 0.42
1 5 3 16 8.17
0 18 4 13.4 4.52
1 0 8 16.6 0.62
0 3 0 4.3 0.36
0 10 13 11.3 1.17
0 3 8 2.6 0.15
0 2 1 3.8 0.28
0 8 21 0.7 0.09
0 1 3 18.6 0.81
0 10 8 1.2 0.04
0 6 13 8.5 1.19
1 18 6 15.7 6.57
1 7 6 14.5 0.37
1 2 15 23.1 1.92
1 0 2 16.1 0.32
0 9 10 23 2.69
0 0 1 7.7 1.53
0 13 7 2.3 0.07
0 14 3 0.8 0.47
0 6 7 18.1 1.11
0 2 22 6.7 0.11
1 0 18 12.9 1.58
0 3 13 1.9 0.43
0 5 12 8.1 0.73
0 18 9 2.1 0.37
0 18 9 11.2 5.25
0 22 4 2.3 0.83
0 13 11 9.6 1.88
0 7 4 9.1 0.64
0 8 11 3.3 0.68
1 14 8 41.3 15.02
0 20 17 1.4 0.34
0 1 4 2.5 0.13
0 7 15 6.4 0.95
0 1 0 4.9 0.61
0 15 2 4.8 0.8
0 10 6 2.7 0.31
0 12 7 7.7 1.85
1 13 20 30.8 6.11
1 2 12 16 4
0 3 3 3.7 0.28
1 9 0 9.4 1.33
0 3 11 21.3 1.4
0 7 3 5.1 0.21
0 15 0 3.1 0.48
0 7 10 4.9 0.23
0 13 8 6.1 0.86
0 22 4 3.6 0.63
1 2 5 6.4 0.27
0 2 14 3.1 0.53
1 5 29 17.3 6.94
1 9 1 20.1 2.54
0 5 5 13 0.17
0 14 8 17 1.14
0 11 5 10.1 2.46
0 0 7 9.3 1.27
1 2 2 9.6 0.8
0 0 4 8.7 0.45
0 4 13 1.6 0.44
0 5 2 8.3 1.12
1 0 8 29.7 3.9
0 18 10 15.4 2.1
0 16 14 11.1 1.66
0 12 2 6.7 1.63
0 0 9 6.6 0.28
0 13 12 5 0.24
0 10 4 4.8 0.18
0 21 26 3 2.56
0 22 24 11.7 1.26
0 14 17 5.7 1.89
1 0 6 12.1 1.6
1 1 7 21.2 2.33
0 8 4 6.4 0.33
0 1 1 4.5 0.22
0 4 2 4.6 0.05
1 11 4 23.8 5.44
0 19 7 30.1 3.18
1 1 15 14.8 1.38
0 16 10 4.1 0.26
0 3 7 7 0.76
0 8 7 2.8 0.55
1 0 4 18.4 0.82
0 8 0 1.6 0.02
0 0 1 2.3 0.04
0 16 7 0.4 0.16
1 2 1 4.5 0.12
0 21 2 20.5 6.95
1 12 5 25.1 7.82
0 11 5 4.8 0.83
0 9 4 6.6 0.79
1 0 8 12.9 1.04
0 9 16 18.7 4.76
0 1 2 5.7 0.84
0 0 5 1.1 0.13
0 18 14 6.6 3.33
0 8 2 3.7 0.98
0 16 12 3.7 0.69
0 22 1 14.6 5.4
0 10 11 9.1 1.54
0 23 1 18.9 3.13
1 3 3 28.9 2.68
1 18 14 6.5 16.03
0 11 20 15 4.67
0 5 9 4.5 0.33
0 7 12 10.2 1.63
1 3 13 13.2 3.04
1 2 2 16.4 1.74
0 25 16 2.6 1.64
0 6 9 11.5 0.65
0 11 17 12.9 2.56
0 0 8 7.9 1.07
1 1 14 16.1 2.69
0 0 11 12 0.3
0 9 16 5.9 0.89
0 4 3 17.5 0.23
0 1 26 14.3 1.85
0 10 2 4.4 0.34
0 8 0 4 0.28
1 0 2 12.5 0.49
0 9 2 2.6 0.12
0 9 1 5.8 0.6
0 0 23 22.3 2.66
0 4 1 23.8 1.09
1 16 26 17.6 15.79
0 6 1 4.4 0.24
0 6 10 18.4 1.99
1 2 0 4.5 0.29
1 7 5 19.8 1.01
1 0 3 6.6 0.59
0 12 3 9.7 0.36
0 1 0 4.4 0.27
0 13 0 2.4 0.41
0 12 16 7.7 0.99
1 3 2 16.3 0.35
0 5 5 10.9 0.4
0 27 21 11.5 0.82
0 21 16 16.5 4.58
0 9 20 5.2 0.55
1 2 3 9.7 0.89
0 5 3 7.3 0.78
0 6 2 4.5 0.07
1 5 17 10.5 3.61
0 4 10 5.8 0.57
1 2 8 5.7 0.32
1 10 13 20.9 6.11
1 0 16 15 1.97
0 15 31 1.1 0.47
0 13 13 3.6 0.23
1 13 13 25.2 2.32
1 0 2 33.3 2.28
1 12 14 16 5.72
1 3 2 17.8 1.01
1 4 9 7.1 1.19
0 12 9 7.2 2.94
0 12 5 13 1.48
1 0 2 18.9 0.51
1 6 0 19.5 4.51
Logit, Probit/Normit, Tobit: Variables Dependientes Limitadas utilizando Estimación por Máxima Verosimilitud
Las Variables Dependientes Limitadas describen las situaciones donde la variable dependiente contiene datos que están limitados en alcance y rango, como binarias (0 o 1), truncadas, ordenadas o datos censurados. Por
ejemplo, dado un conjunto de variables independientes (p.ej., edad, ingreso, educación, cupo de tarjeta de crédito o tenencia de préstamo hipotecario), podemos calcular la probabilidad de incumplimiento utilizando la
estimación de máxima verosimilitud (MLE – por sus siglas en ingles). La respuesta o variable dependiente Y es binaria, es decir, puede tener solamente dos posibles resultados que denotaremos como 1 y 0 (p.ej., Y puede
representar la ausencia/presencia de una condición especifica, cumplimiento/incumplimiento de un préstamo previo, éxito/fracaso de algunos dispositivos, respuesta si/no en estudios, etc.). También tenemos un vector de
variables independientes o regresores de X, los cuales se asumen con influencia en el resultado Y. Una típica aproximación con una regresión de mínimos cuadrados ordinarios es incorrecta porque los errores de la regresión
son heteroscedasticos y no normales; y los resultados estimados de probabilidad resultantes serian valores sin sentido sobre 1 o debajo de 0. MLE se ocupa de estos problemas de análisis utilizando una rutina de optimización
iterativa que maximiza la función logarítmica de verosimilitud cuando las variables dependientes son limitadas.
Una regresión Logit o Logística es usada para predecir la probabilidad de ocurrencia de un evento para datos ajustados a una curva logística. Esto es generalizado en el modelo lineal utilizado para la regresión binomial. MLE
aplicado en un análisis logístico multivariado binario es usado para modelar variables dependientes para determinar la probabilidad esperada de éxito de pertenecer a un cierto grupo. Los coeficientes estimados por el modelo
Logit son cocientes logarítmicos de probabilidad, y no pueden interpretarse directamente como probabilidades. Un rápido calculo es requerido primero y luego la aproximación es sencilla.
Específicamente, el modelo Logit es especificado como Estimado Y= LN[Pi/(1–Pi)] o en cambio, , Pi = EXP(Estimado Y)/(1+EXP(Y Estimado)), y los coeficientes β i son cocientes logarítmicos de probabilidad, a fin de tomar el
antilogaritmo o EXP(βi) obtenemos los cocientes de probabilidad de Pi/(1–Pi). Esto significa que un incremento en una unidad de βi incrementa la probabilidad en este monto. Finalmente, la tasa de cambio en la probabilidad
dP/dX = βiPi(1–Pi). El Error Estándar mide la precisión de los coeficientes, y la t-estadística son los coeficientes de cada Coeficiente respecto a sus errores estándar, los cuales son usados en la prueba de hipótesis para
calcular el nivel de significancia de cada parámetro estimado. Para estimar la probabilidad éxito de pertenecer a un grupo especifico (p. ej., predecir si un fumador desarrollara complicaciones pulmonares dado el monto de
cigarrillos consumidos por año), simplemente calcule el valor Estimado Y utilizando los coeficientes MLE. Por ejemplo, si el modelo es Y = 1.1 + 0.005 (Cigarrillos) entonces para una persona que fume paquetes de cigarrillos
por año tiene un Y Estimado de 1.1 + 0.005(100) = 1.6. Después, calcule la inversa del antilogaritmo para el valor encontrado previamente de probabilidad EXP(Y Estimado)/[1 + EXP(Y Estimado)] = EXP(1.6)/(1+ EXP(1.6)) =
0.8320. Por lo tanto una persona tiene un 82.20% de probabilidad de desarrollar algun tipo de complicación pulmonar en vida.
Un modelo Probit (algunas veces conocido como modelo Normit) es una alternativa popular de especificación para un modelo binario en cual emplea una función probit utilizando una estimación de máxima verosimilitud y la
aproximación es llamada regresión probit. Los modelos de regresión Probit o Logistica tienden a producir predicciones similares, donde los parámetros estimados en una regresión logística son entre 1.6 y 1.8 veces más altos
que los correspondientes a los coeficientes de un modelo Probit. La elección de un modelo Probit o Logit es enteramente relacionado con la conveniencia particular, y la principal distinción entre ambos se basa en el hecho que
la distribución logística tiene una mayor curtosis (colas gordas) para tener en cuenta en los valores extremos. Por ejemplo, suponga que una familia tiene la decisión de adquirir una vivienda y su respuesta es una variable
binaria (comprar o no comprar la vivienda) y depende de una serie de variables independientes Xi como son el ingreso, la edad, tal que Ii = β0 + β1X1 +...+ β nXn, donde el mayor valor de li, significa una mayor probabilidad de ser
propietario de la vivienda. Para cada familia, existe un umbral crítico I*, donde si es superado la casa es comprada por alguien más, es decir, la cas ano es comprada, y la probabilidad de salida (P) se asume distribuida
normalmente, tal que P i=CDF(I) utilizando una función de distribución acumulada normal estándar (CDF). Por lo tanto, usa los coeficientes estimados exactamente igual a los de un modelo de regresión, utilizando el valor
Estimado Y, y aplicar la distribución normal estándar (usted puede usar la función Excel DISTR.NORM.ESTAND o la herramienta de Análisis de Distribución seleccionando la distribución Normal y ajustando la media en 0 y la
desviación estándar en 1). Finalmente, para obtener un Probit o unidad de probabilidad, defina li + 5 (esto es porque siempre la probabilidad Pi < 0.5, el estimado li es negativo, debido al hecho que la distribución normal es
simétrica alrededor de una media de cero).
El modelo Tobit (Tobit Censurado) es un método de modelación biométrica y econométrica usada para describir la relación entre una variable dependiente no-negativa Yi y una o más variables independientes Xi. Un modelo
Tobit es un modelo econométrico en el cual la variable dependiente es censurada; esto es, la variable dependiente es censurada porque los valores debajo de cero no son observados. El modelo Tobit asume que existe una
variable inobservable latente Y*. Esta variable es linealmente dependiente de las variables X i vía un vector de coeficientes βi, que determina sus interrelaciones. En adición, el término del error Ui está distribuido normalmente
para capturar la influencia aleatoria en esta relación. La variable observable Yi es definida como la igualdad de la variable latente siempre que las variables latentes sean superiores a cero y Yi es asumido como cero en otro
caso. Esto es, Yi = Y* si Y* > 0 y Yi = 0 si Y* = 0. Si el parámetro de relación βi es estimado utilizando una regresión de mínimos cuadrados ordinarios de los observados Yi en X i, los estimadores de la regresión calculada son
inconsistentes y el coeficiente de la pendiente se encuentra insesgada hacia abajo y el intercepto insesgado hacia arriba. Únicamente el MLE podría ser consistente para un modelo Tobit. En el modelo Tobit, se tiene un
complemento estadístico llamado Sigma, el cual e equivalente al error estándar de la estimación en una regresión de mínimos cuadrados ordinarios y los coeficientes estimados son usados en el mismo sentido que en el
análisis de regresión.
Resultados
-0.8833 -0.2296 -0.0734 0.0831 0.5723 70% recuperacion del 70% de los creditos que podrian estar