Proyecto Final

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 45

ESTIMACIÓN DEL PRECIO COMERCIAL PARA INMUEBLES

RESIDENCIALES DE LA LOCALIDAD DE SUBA. AÑO 2011,


ESTRATOS 2 Y 3

Autores:
Paula Nicole Becerra Quintero
Sergio Steven Castellanos Ruíz
Jimmy Hernando Suárez Quintero

Presentado a:
PhD. Carlos E. Melo M.

Universidad Distrital Francisco José de Caldas


Facultad de Ingeniería
Ingeniería Catastral y Geodesia
Econometría
Bogotá D. C, Colombia

2020

1
Tabla de contenido

1. INTRODUCCIÓN ............................................................................................................... 5
2. JUSTIFICACIÓN ................................................................................................................ 5
3. OBJETIVOS ....................................................................................................................... 6
3.1 Objetivo general............................................................................................................ 6
3.2 Objetivos específicos .................................................................................................... 6
4. MARCO TEÓRICO ............................................................................................................ 6
4.1 Estado del arte............................................................................................................... 6
4.2 Metodologías valuatorias .............................................................................................. 9
4.2.1. Método de comparación o de mercado ....................................................................... 9
4.2.2. Método de capitalización de rentas o ingresos ............................................................ 9
4.2.3. Método de costo de reposición ................................................................................... 9
4.3 Estadística descriptiva ................................................................................................... 9
4.3.1. Métodos gráficos para la caracterización de un conjunto de datos ............................... 9
4.3.2. Métodos numéricos para la caracterización de un conjunto de mediciones ................ 10
4.4 Conceptos básicos de econometría .............................................................................. 10
4.4.1 Tipo de información ............................................................................................. 10
4.5 Regresión .................................................................................................................... 11
4.5.1 Origen histórico ................................................................................................... 11
4.5.2 Interpretación de una regresión ............................................................................ 11
4.6 Modelo de regresión múltiple ...................................................................................... 11
4.7 Modelos espaciales dinámicos ..................................................................................... 11
4.8 Mínimos cuadrados ordinarios (MCO) ........................................................................ 12
4.9 Estadísticos de prueba ................................................................................................. 12
4.10 Estadísticos globales ................................................................................................... 13
4.11 Supuestos .................................................................................................................... 13
4.11.1 Normalidad .......................................................................................................... 13
4.11.2 Homocedasticidad ................................................................................................ 14
4.11.3 No multicolinealidad ............................................................................................ 15
4.12 Transformación Box-Cox ............................................................................................ 15

2
4.13 Variables Dummy o Dicotómicas ................................................................................ 16
4.14 Selección mejor modelo .............................................................................................. 16
4.15 Regresión Stepwise ..................................................................................................... 16
4.16 Análisis de residuales .................................................................................................. 17
4.17 Validación cruzada dejando uno fuera (Leave – one – out) .......................................... 18
4.18 Regresión geográficamente ponderada (GWR) por sus siglas en ingles. ...................... 18
5. METODOLOGÍA.............................................................................................................. 18
5.1 Área de Estudio ........................................................................................................... 18
5.2 Materiales ................................................................................................................... 18
Descripción de las Variables ............................................................................................. 19
Variables Dummy. ............................................................................................................. 20
Rango de las variables ....................................................................................................... 21
5.3 Método ....................................................................................................................... 21
6. RESULTADOS ................................................................................................................. 23
6.1 Análisis exploratorio de los datos ................................................................................ 23
6.2 Modelamiento econométrico ....................................................................................... 25
6.3 Correcciones ............................................................................................................... 26
6.4 Modelamiento espacial ................................................................................................ 31
6.4.1 Análisis de conectividad....................................................................................... 31
6.4.2 I de Moran ........................................................................................................... 34
6.4.3 Modelo autorregresivo de regresión espacial de orden 1. ...................................... 34
6.4.4 Modelo de regresión con dependencia espacial en la perturbación aleatoria o modelo
del error espacial................................................................................................................ 35
6.4.6 Regresión Geográficamente ponderada GWR (por sus siglas en inglés) ............... 37
7. CONCLUSIONES ............................................................................................................. 44
8. REFERENCIAS ................................................................................................................ 44

Índice de Tablas
Tabla 1. Hipótesis nula de los estadísticos de prueba ................................................................. 12

3
Tabla 2 Variables seleccionadas para el estudio. ........................................................................ 20
Tabla 3 Codificación Dummy para la variable Ubicación lote ................................................... 20
Tabla 4 Codificación Dummy para la variable Influencia vía ..................................................... 21
Tabla 5 Rango de las variables del modelo ................................................................................ 21
Tabla 6.Resumen de medidas estadísticas de la variable Precio Oferta ....................................... 24
Tabla 7 Estimación del modelo de regresión obtenido por StepWise (step1) .............................. 25
Tabla 8 Estimación del modelo de regresión transformado step1t .............................................. 26
Tabla 9 Estimación del modelo de regresión transformado step1B ............................................. 27
Tabla 10 Estimación del modelo de regresión transformado step1BL ........................................ 28
Tabla 11 Estimación del modelo de regresión transformado con anamorfosis gaussiana step1G 29
Tabla 12 Estimación del modelo de regresión transformado con anamorfosis gaussiana step2G 30
Tabla 13.Correlograma I Moran K Vecinas ............................................................................... 33
Tabla 14. Estimación del modelo autorregresivo de regresión espacial de orden 1 ..................... 34
Tabla 15. Estimación del Modelo de regresión con dependencia espacial en la perturbación
aleatoria o modelo del error espacial ......................................................................................... 35
Tabla 16. comparación de modelos espaciales ........................................................................... 37

Índice de Ilustraciones
Ilustración 1.Diagrama de flujo del método aplicado ................................................................. 22
Ilustración 2.Histograma, Boxplot y Gráfico Q-Q, Precio Oferta ............................................... 23
Ilustración 3.Dispersograma Precio oferta - Área de construcción ............................................. 24
Ilustración 4.Test de normalidad para el modelo de regresión step1 ........................................... 25
Ilustración 5.Test de normalidad para el modelo de regresión step1t .......................................... 26
Ilustración 6.Transformación BoxCox modelo de regresión step1 .............................................. 27
Ilustración 7.Test de normalidad para el modelo de regresión step1B ........................................ 28
Ilustración 8.Test de normalidad para el modelo de regresión step1BL ...................................... 28
Ilustración 9.Transformación Gaussiana a la variable POFERTA .............................................. 29
Ilustración 10.Test de normalidad para el modelo de regresión step2G ...................................... 30
Ilustración 11.Gráfico Histograma y Gráfico Q-Q de los Residuos del Modelo Estimado ......... 31
Ilustración 12.test Breusch-pagan .............................................................................................. 31
Ilustración 13.Correlograma por distancias I de Moran .............................................................. 32
Ilustración 14.Correlaciones rangos de distancias ...................................................................... 32
Ilustración 15.Correlograma por k vecinos más cercanos I de Moran ......................................... 32
Ilustración 16.Mapa de conectividad ......................................................................................... 33
Ilustración 17.Test global de autocorrelación I de Moran ........................................................... 34
Ilustración 18.Estadistica I de Moran ......................................................................................... 35
Ilustración 19. estadística I de Moran ........................................................................................ 36
Ilustración 20.Estimación del Modelo mixto autorregresivo regresivo cruzado de regresión
espacial ..................................................................................................................................... 36

4
Ilustración 21.Correlación entre ESTRATOD Y POFERTATR, Correlación ÁREA Y
POFERTATR ........................................................................................................................... 38
Ilustración 22.Correlación entre TIPOINM Y POFERTATR, Correlación X Y POFERTATR 38
Ilustración 23.Correlación entre WCTR Y POFERTATR, Correlación COCTR Y POFERTATR
................................................................................................................................................. 39
Ilustración 24. Selección del modelo por AICc y gráfico visual ................................................. 39
Ilustración 25. Salida gráfica de la regresión geográficamente ponderada .................................. 40
Ilustración 26. Estadistico t Y Pvalor de la variable ÁREA ........................................................ 41
Ilustración 27.Estadistico t Y Pvalor de la variable ESTRATOD ............................................... 41
Ilustración 28.Estadistico t Y Pvalor de la variable TIPOINM ................................................... 42
Ilustración 29.Estadistico t Y Pvalor de la variable X ................................................................ 42
Ilustración 30.Estadistico t Y Pvalor de la variable COCTR ...................................................... 43
Ilustración 31.Estadistico t Y Pvalor de la variable WCTR ........................................................ 43

1. INTRODUCCIÓN

El presente informe se realiza con el objetivo de determinar el precio comercial para inmuebles
residenciales de la localidad de Suba, correspondientes a los estratos socioeconómicos 2 y 3 en el
año 2011; haciendo uso de un modelo econométrico en el cual se tienen en cuenta variables
cualitativas y cuantitativas, tales como el estrato, área total construida, número de baños, tipo de
inmueble, y otras que se nombrarán más adelante en este mismo texto. El documento se encuentra
distribuido en varias partes: En la primera parte se hará una contextualización de estudios similares
en otros lugares del mundo, analizando tanto las variables independientes que allí se proponen
como los métodos de recolección de datos expuestos; en la segunda parte, se reunirá información
documental como soporte conceptual de la teoría que se utilizó para el planteamiento del problema
y una breve descripción de la normatividad catastral; en la tercera parte, se realizarán cálculos
básicos de inferencia estadística con los correspondientes datos de la muestra; más adelante, se
propone un modelo que represente de manera afín los datos recogidos y se analizarán los supuestos
que los residuos deben cumplir.

2. JUSTIFICACIÓN

En el ámbito profesional y académico, los ingenieros e ingenieras catastrales y geodestas recurren


a la econometría para realizar análisis cuantitativos de diferentes fenómenos económicos o de su
interés para analizar y modelar variables que ellos consideren influyentes (mediante conocimientos
previos) en la variable respuesta. Se hace uso de esta rama de la economía con el fin de estudiar,
examinar, comparar, proponer y predecir datos importantes en la determinación de políticas

5
catastrales o geodésicas; buscando generar las soluciones más óptimas a un problema planteado.
El presente documento tiene implicaciones catastrales, relacionadas con el valor de las
construcciones en función del uso del suelo reglamentado por las normas urbanísticas vigentes en
el distrito de Bogotá para el año 2011. La proposición de un modelo que determine el precio
comercial para inmuebles residenciales de estratos 2 y 3 en la localidad de Suba, puede facilitar el
análisis del mercado inmobiliario en dicha zona y promover la compra y venta de los inmuebles,
además de servir como soporte para la implementación de políticas gubernamentales en los
terrenos estudiados.

3. OBJETIVOS

3.1 Objetivo general

 Realizar un modelamiento econométrico que permita una correcta estimación del precio
comercial de los predios pertenecientes a los estratos 2 y 3 de la localidad de Suba en el
año 2011.
3.2 Objetivos específicos

 Generar propuestas basadas en el estado del arte y las dinámicas del mercado inmobiliario
local para la inclusión de nuevas variables significativas al modelo, con el objetivo de
determinar el precio comercial de un inmueble.
 Analizar la relación econométrica entre el precio comercial y variables físicas y
socioeconómicas del mercado inmobiliario.
 Evaluar el modelamiento considerando el ajuste de los datos a la realidad de la estimación
del precio oferta.

4. MARCO TEÓRICO

4.1 Estado del arte

La determinación del precio de los bienes inmuebles es un asunto muy importante alrededor del
mundo. El terreno se considera un recurso limitado y por lo tanto, demanda una óptima gestión del
mismo, con el objetivo de brindar bienestar a la población que habita en las zonas determinadas.
Sin embargo, el planteamiento de un modelo que ponga en consideración variables apropiadas y
necesarias para el cálculo del precio no es tarea sencilla.
Partiendo de la hipótesis de que una vivienda es un bien inmueble heterogéneo y que se puede
avaluar por su utilidad producto de sus características, se establece que el precio oferta es un precio
hedónico, es decir, se asume que el precio de dicho bien puede ser descompuesto en función de

6
sus atributos y, por tanto, se puede asignar un precio implícito a cada uno de dichos atributos, los
cuales dependen de sus cantidades asociadas y quedan revelados por las personas al ejercer
transacciones de mercado, ya que en ellas puede observarse los precios de productos diferenciados
así como las diferentes cantidades de atributos que el bien posee (Rosen, 1974).
En este documento se utiliza análisis espacial para tener en cuenta tanto la heterogeneidad como
la dependencia en los precios de la tierra, es decir, implica que las formas funcionales y los
parámetros varían según la ubicación y no son homogéneos en todo el conjunto de datos
(Hannonen, 2008). Por otro lado, dependencia indica que los precios de la tierra varían en función
de la distancia a determinadas zonas comerciales o al centro de la ciudad.
Se ha realizado una gran cantidad de investigaciones acerca de los precios de terrenos residenciales
en los últimos años. Por ejemplo, un estudio utilizó un sistema asistido por computador para
predecir los precios de los terrenos urbanos en las áreas metropolitanas de Tokio; basándose en
encuestas gubernamentales de precios de la tierra en 2006, donde se analizaron variables
demográficas y ambientales como la densidad de población, el nivel de urbanización y el tiempo
hasta la estación de metro más cercana, como producto final se generó un mapa de precios de la
tierra en Tokio (Tsutsumi, 2011).
En los estudios realizados hasta ahora, variables como la densidad de población, la proximidad a
colegios y demás servicios, la contaminación atmosférica, el ruido relacionado con el tráfico y los
accidentes automovilísticos se han relacionado con frecuencia en los precios de los bienes
inmuebles de uso residencial. Por ejemplo, en un análisis espacial de los precios de la tierra en
Bélgica, los investigadores concluyeron que la alta densidad de población refuerza la competencia
por la tierra y es sinónimo de altos precios de los inmuebles (Goffette-Nagot, Reginster y Thomas,
2011). Otro estudio que analiza los precios de la tierra en Colombia, encontró que existe una
relación significativa entre el precio del suelo y la densidad de población urbana, ya que a mayor
densidad se ejerce una presión sobre el suelo que se puede consumir, lo que lleva a un incremento
en los precios de este; se tienen en cuenta otras variables explicativas como la distancia de cada
centro urbano a la capital del departamento o a la ciudad de influencia económica más cercana,
cuanto más lejos se ubique del centro menor será el precio; se incluye la cobertura en el nivel
educativo de primaria o el número de instituciones educativas oficiales; se involucra una
característica climática propia de los municipios: una variable dummy que indica si el municipio
se encuentra en un piso térmico frío (Enríquez et al, 2013).
Se encontraron evidencias en la vinculación de las comodidades urbanas como las escuelas e
instalaciones deportivas con los precios de los inmuebles. Al analizar la relación entre la facilidad
de acceso a las escuelas y universidades, se encontró que aumentan los precios de la tierra y
vivienda en los alrededores de los centros educativos (Franklin y Wadell, 2003). La especificación
del modelo hedónico para este estudio se formuló de la siguiente forma:
𝑙𝑛(𝑃𝑟𝑖𝑐𝑒𝑖,𝑦 ) = 𝐵0,𝑦 + 𝐵1,𝑦 𝑋𝑖,𝑦 + 𝐵2,𝑦 𝑌𝑖,𝑦 + 𝐵3,𝑦 𝐴𝑖,𝑦 + 𝑒𝑖,𝑦

7
Donde
𝑃𝑟𝑖𝑐𝑒𝑖,𝑦 : Precio de venta para la propiedad i en el año y

𝑋𝑖,𝑦 : Un vector de atributos estructurales para la propiedad i en el año y

𝑌𝑖,𝑦 : Un vector de atributos espaciales para la propiedad i en el año y

𝐴𝑖,𝑦 : Un vector de atributos de accesibilidad para la propiedad i en el año y

𝐵0,𝑦 , 𝐵1,𝑦 , 𝐵2,𝑦 , 𝐵3,𝑦 ∶ Coeficientes estimados asociados a cada variable

𝑒𝑖,𝑦 : un término de error que se supone que es independiente entre las observaciones y se distribuye
de forma idéntica de una distribución normal con media cero y varianza constante.
En términos de accesibilidad, el modelo tiene en cuenta el estado del sistema de transporte regional
y la distribución de población y empleo; en lo estructural, se aprecia la calidad de la construcción
del bien inmueble y su tamaño; por último, los atributos espaciales tenidos en cuenta son la
proximidad a los Distritos Centrales de Negocios y las instituciones educativas. De la forma
funcional del modelo propuesto se evidencia que a medida que una de las variables dependientes
aumenta o disminuye, el precio de venta de la propiedad corresponde a este cambio en términos
porcentuales.
Por otro lado, los estudios sobre la calidad del aire y las instalaciones de contaminación tóxica
generalmente han encontrado una influencia negativa en los precios de los bienes inmuebles. Un
ejemplo de ello es el estudio de Brainard, Jones, Bateman, Lovett y Fallon (2002), donde
encontraron una asociación negativa entre los niveles Monóxido de Carbono CO y Dióxido de
Nitrógeno NO2 presentes en el aire y varios índices de tierras en Reino Unido. Otro estudio,
también de Reino Unido investigó el impacto de los vertederos en los precios de la vivienda por
distancia del vertedero y edad de este. Se concluyó que los rellenos sanitarios tuvieron un impacto
negativo en los precios y que tuvo una afectación de hasta 1 km. También se demostró
empíricamente que la contaminación del aire causada por los incineradores tuvo un efecto negativo
en los precios de la vivienda hasta 1.6 km de distancia del incinerador (Pragnell, 2003).
De la revisión bibliográfica anterior se concluyen y se tienen en cuenta las siguientes
consideraciones para un cálculo más acertado del precio oferta de los bienes inmuebles con destino
económico residencial:
 La densidad de población urbana tiene una relación positiva con los precios de los bienes
inmuebles.
 La accesibilidad a instituciones educativas y demás servicios tiene una influencia positiva
en los precios de los bienes inmuebles.
 Altos niveles de polución en el aire y otros factores contaminantes tienen una influencia
negativa en el cálculo de los precios de los bienes inmuebles residenciales.

8
4.2 Metodologías valuatorias

El mercado transaccional de bienes inmuebles hace uso de metodologías valuatorias para la


determinación del precio comercial de estos. Dicha determinación de los avalúos comerciales sirve
de base para la compra y venta de bienes inmuebles, la gestión de créditos hipotecarios, el
desarrollo de proyectos estatales de infraestructura, entre otros. Dentro de la legislación
colombiana se pueden identificar en la actualidad cuatro técnicas, enfoques o metodologías
valuatorias contenidas en la Resolución 620 de 2008 del Instituto Geográfico Agustín Codazzi:
4.2.1. Método de comparación o de mercado
Esta es una técnica que busca determinar el valor comercial de un predio, en base a estudios de
mercado como las ofertas o transacciones realizadas en un determinado periodo de tiempo y en
predios con características similares que asemejan el comportamiento de las variables que
determinan el precio del bien objeto del avalúo.

4.2.2. Método de capitalización de rentas o ingresos


Esta técnica busca obtener el precio de un bien estimando las rentas o ingresos que obtendría el
bien objeto de avalúo u otros bienes comparables por sus características físicas, ubicación y uso;
a lo largo de su vida útil, y trayendo la suma de estas rentas al valor presente.

4.2.3. Método de costo de reposición


En este método se estima el valor de construcción del inmueble a precios de hoy y se resta la
depreciación acumulada de la construcción, para finalmente adicionarle al valor antes obtenido el
valor del terreno.
4.3 Estadística descriptiva

La estadística se define como “rama de las matemáticas que estudia la recolección, análisis,
interpretación y presentación de masas de información numérica” (Merriam-Webster, Inc. 1984).
La rama de la estadística que presenta técnica para descubrir conjuntos de mediciones se llama
estadística descriptiva, esta consiste en aplicar procedimientos para resumir y describir las
características importantes de un conjunto de mediciones mediante medidas de resumen, tablas o
gráficos.

4.3.1. Métodos gráficos para la caracterización de un conjunto de datos


Los gráficos son medios convenientes para representar datos, se emplean para tener una
representación visual de la totalidad de la información recolectada. Existen diferentes tipos de
gráficos, la utilización de estos depende de la naturaleza de la variable que se haya medido. Por
ejemplo, los gráficos de torta se suelen utilizar para representar frecuencias relativas (relación entre
la frecuencia absoluta y el número total de datos) cuando los datos no son numéricos, se construye
un círculo que luego se divide en sectores, uno por cada valor diferente de datos; también existen

9
los histogramas, que muestran gráficamente las frecuencias de los datos que aparecen dentro de
los intervalos de clase, para la realización de estos diagramas se usan variables cuantitativas
(Canavos, 1988).
4.3.2. Métodos numéricos para la caracterización de un conjunto de mediciones
El objetivo de estos cálculos es sintetizar un conjunto de datos y derribar las limitaciones que
presentan los métodos gráficos. Los estadísticos son magnitudes numéricas cuyos valores están
determinados por los datos.
4.3.2.1 Medidas de tendencia central
 Media: Localiza el centro de la distribución de datos, en un conjunto de n mediciones es
calculada como la suma de las respuestas medidas divididas entre n.
 Mediana: Es el valor de la variable que ocupa la posición central cuando los datos se
organizan de forma ascendente o descendente.
 Moda: Es el valor de la variable que se presenta con mayor frecuencia en un conjunto de
datos.
4.3.2.2 Medidas de variabilidad o dispersión
Estas medidas entregan información sobre la variación de la variable. Tienen el objetivo de resumir
en un solo valor la dispersión que tiene un conjunto de datos.
 Rango: Es la diferencia entre el valor máximo y el valor mínimo de los datos.
 Varianza: Se define como la “media” de los cuadrados de las desviaciones respecto a la
media aritmética.
 Desviación estándar: Es la raíz cuadrada positiva de la varianza, se mide en las mismas
unidades que los datos originales. Si los valores tienden a centrarse alrededor de la media,
la distribución tiene una desviación estándar pequeña, por el contrario, si están distribuidos
lejos de la media, la desviación estándar posee valores más altos (Canavos, 1988).
4.4 Conceptos básicos de econometría

Econometría significa medición económica. Sin embargo, el alcance de esta disciplina es más
amplio, puede definirse como el resultado de cierta perspectiva sobre el papel que juega la
economía, consiste en la aplicación de la estadística matemática a la información económica para
dar soporte empírico a los modelos construidos por la economía matemática y obtener resultados
numéricos (Cosío Pascal, E, 1969).
4.4.1 Tipo de información
 Información de corte transversal: Consiste en datos de una o más variables recopilados
en el mismo momento del tiempo (Gujarati y Porter, 2009).

10
4.5 Regresión

4.5.1 Origen histórico


Francis Galton planteó que, a pesar de la tendencia de los padres de estatura alta a procrear hijos
altos y los padres de estatura baja, hijos bajos, la estatura promedio de los niños de padres de una
estatura determinada tendía a desplazarse, o “regresar”, a la estatura promedio de la población total
(Gujarati y Porter, 2009).
4.5.2 Interpretación de una regresión
Trata del estudio de la dependencia de una variable respecto de una o más variables con el
objetivo de estimar o predecir la media o valor promedio poblacional en términos de los valores
conocidos de las variables explicativas o independientes (Gujarati y Porter, 2009).
4.6 Modelo de regresión múltiple

El análisis de regresión múltiple permite controlar de forma óptima los factores que afectan en
forma simultánea la variable a responder, pues incorpora un análisis ceteris paribus, que además
posibilita la creación de modelos para estimar la variable dependiente. Su expresión formal está
dada por:

𝑦 = 𝛽0 + 𝛽1𝑥1 + 𝛽2𝑥2 + ⋯ + 𝛽𝑘𝑥𝑘 + 𝜇

Donde y es la variable explicada, 𝛽0 es el intercepto, 𝛽1 es el parámetro asociado a 𝑥1, 𝛽2 es el


parámetro asociado a 𝑥2, y así sucesivamente. (Wooldridge, 2010).

4.7 Modelos espaciales dinámicos

También llamados modelos de dependencia espacial pueden interpretarse como modelos de


regresión lineal que consideran explícitamente la existencia del efecto espacial de dependencia o
autocorrelación.
El modelo general espacial se expresa como:

𝑦 = 𝜌𝑊1𝑦 + 𝑋𝛽1 + 𝑊2𝑅𝛽2 + 𝜀

Donde 𝑦 es el vector de la variable explicada, 𝑊1𝑦 es el retardo espacial de la variable de estudio,


𝑋 es una matriz de variables independientes no rezagadas espacialmente, 𝑅 es una matriz de
variables explicativas no necesariamente con los mismos elementos de X rezagadas espacialmente,
los parámetros 𝜆 𝑦 𝜌 miden el grado de la dependencia espacial con 𝜇 ~ 𝑁 (0, Ω), Ω es matriz de
covarianza generalizada con elementos en la diagonal dados por Ω𝑖𝑖 = h𝑖(𝑧𝛼)h𝑖. (Payares García
& Quintero Alonso, 2018).
A partir de esta especificación se genera el modelo a concernencia:

11
 Modelo del rezago espacial
𝑦 = 𝜌𝑊𝑦 + 𝑋𝛽 + 𝜇

𝜇~ 𝑁 (0, Ω)

4.8 Mínimos cuadrados ordinarios (MCO)

Es un método que permite obtener estimaciones de los parámetros desconocidos del modelo. Estos
pueden interpretarse como los coeficientes de las variables respuesta o los términos que
fundamentan la matriz de covarianzas de los errores.

En el caso general, con k variables independientes, se encuentran las estimaciones 𝛽0, 𝛽1, 𝛽2, …,
𝛽𝑘 en la ecuación:

𝑦 = 𝛽0𝑥0 + 𝛽1𝑥1 + 𝛽2𝑥2 + ⋯ + 𝛽𝑘𝑥𝑘

Definiendo el vector de parámetros, como:

𝛽 = (𝑋′𝑋)−1𝑋′𝑌

4.9 Estadísticos de prueba

Son variables aleatorias que se calculan a partir de datos de muestra y se utilizan en una prueba
de hipótesis. Se pueden utilizar los estadísticos de prueba para rechazar o no la hipótesis nula.

Estadístico Ecuación Hipótesis nula


Normal 𝜇 − 𝜇0 𝐻0 ∶ 𝜇 = 𝜇0
𝑍=
𝜎𝑥̅
T – Student 𝜇 − 𝜇0 𝐻0 ∶ 𝜇 = 𝜇0
𝑡=
𝑆/√𝑛
F de Fisher 𝐶𝑀𝑀 𝐻0 ∶ 𝜎12 = 𝜎22
𝐹=
𝐶𝑀𝐸
Valor-p 𝑣𝑎𝑙𝑜𝑟 − 𝑝 = 𝑃 (𝑊 ≤ 𝑤0) 𝐻0 ∶ 𝑝𝑣 > 𝛼
Tabla 1. Hipótesis nula de los estadísticos de prueba

12
4.10Estadísticos globales

Para determinar si la configuración espacial de las unidades espaciales se encuentra distribuida


aleatoriamente o presenta algún tipo de patrón se realiza el análisis de la autocorrelación espacial
global (Baronio, Vianco, & Rabanal, 2012). El contraste utilizado para realizar dicho análisis fue:
 El Test I de moran permite medir la autocorrelación espacial con base en las localizaciones
y los valores de las variables, evalúa si el patrón presente se encuentra agrupado, disperso
o aleatorio en el espacio (Chasco Yrigoyen, 2003)

𝑁 ∑𝑁 𝑁
𝑖=1 ∑𝑖=1 𝑊𝑖𝑗 (𝑦𝑖 − 𝑦
̅)(𝑦𝑖 − 𝑦̅)
𝐼= 𝑁
𝑆0 ∑𝑖=1(𝑦𝑖 − 𝑦̅)

Donde 𝑁, es la cantidad de observaciones o tamaño muestral, 𝑊𝑖𝑗 es el elemento de la matriz


𝑊 de pesos espaciales, 𝑆0 es el factor de escala igual a la suma de los elementos de la matriz
𝑊 y 𝑦̅ el valor esperado de la variable 𝑦.
4.11Supuestos
La expresión del modelo de regresión lineal múltiple muestra que y depende de las 𝑋𝑘 ′𝑠y de µ. Por
consiguiente, debe especificarse la forma como se crean o se generan las variables explicativas y
la perturbación para realizar alguna inferencia estadística sobre la variable explicada. Debido a lo
anterior, las dependientes y el término de error deben cumplir con unos supuestos para no
interpretar erróneamente los estimados de la regresión (Gujarati y Porter, 2009).

4.11.1 Normalidad
Supuesto del modelo lineal clásico que establece que el error (o variable dependiente) tiene una
distribución normal, condicional en las variables explicativas y está distribuido normalmente, con
media cero y varianza:

𝜎2: 𝜇 ~ 𝑁 (0, 𝜎2)


y condicionalmente en los valores muestrales de las variables independientes

𝛽𝑗 ~ 𝑁 (𝛽𝑗, 𝑉𝑎𝑟(𝛽𝑗)

Con el supuesto de normalidad, se derivan fácilmente las distribuciones de probabilidad de los


estimadores de MCO, pues una propiedad de la distribución normal es que cualquier función lineal
de variables normalmente distribuidas estará también distribuida normalmente.
Causas
 El modelo no tiene una forma funcional adecuada
 Existencia de observaciones heterogéneas, puede ser como consecuencia de errores en la
recolección de los datos

13
 Omisión de variables regresoras
Formas de detección
 Método gráfico: Box-Plot, Q-Q Plot, histogramas.
 Test de Shapiro-Wilk
Soluciones
 Remover datos atípicos o extremos
 Transformación Box-Cox
Algunas consecuencias
 Los estadísticos t Student y F de Fisher pueden no seguir las distribuciones t y F.
 Problemas en pruebas de hipótesis y predicciones
4.11.2 Homoscedasticidad
Homoscedasticidad, o igual (homo) dispersión (cedasticidad), es decir, igual varianza. Es este un
supuesto clásico del modelo de regresión lineal, se refiere a que todas las perturbaciones que
aparecen en la función de regresión poblacional tienen la misma varianza, es decir, un número
constante igual a 𝜎 2 (Gujarati y Porter, 2009).
Sin embargo, el incumplimiento del supuesto es cuando la condición anterior no se cumple y la
varianza es distinta para cada error.
Causas
 Con base en los modelos de aprendizaje de los errores, a medida que la gente aprende,
disminuyen sus errores con el tiempo.
 Las técnicas de recolección de datos.
 Una forma funcional inadecuada.
 Omisión de variables independientes importantes.

Formas de detección
 Cuando el modelo indica curtosis alta
 Mediante el análisis de los errores calculando 𝑒𝑖2 = 𝛼0 + 𝛼1𝑥𝑖1 + 𝛼2𝑥𝑖2 + 𝛼3𝑥𝑖21 + 𝛼4𝑥𝑖22 +
⋯ + 𝛼𝑛𝑥𝑖𝑛2 + 𝜇.
 Por medio de pruebas, tales como: White, Breusch Pagan y Goldfiel Quandt.
Soluciones
 Transformación Box Cox
 Econometría espacial
Consecuencias

14
 Intervalos de confianza más grandes para los parámetros y las predicciones.
 Posibles errores en las pruebas de hipótesis de los parámetros.
 El estadístico Fc muy pequeño y por lo tanto, posibilidad de cometer errores tipo II.
4.11.3 No multicolinealidad
La multicolinealidad aparece cuando las variables explicativas de un modelo econométrico están
correlacionadas entre sí. Una consecuencia es que el sistema de ecuaciones normales está mal
definido.
Causas
Existen diversas fuentes de multicolinealidad. Como afirman Montgomery y Peck, la
multicolinealidad puede deberse a los siguientes factores:

 El método de recolección de información. Por ejemplo, la obtención de muestras en un


intervalo limitado de valores tomados por las regresoras en la población.
 Restricciones en el modelo o en la población objeto de muestreo.
 Especificación del modelo. Por ejemplo, la adición de términos polinomiales a un modelo
de regresión, en especial cuando el rango de la variable X es pequeño.
 Un modelo sobre determinado. Esto sucede cuando el modelo tiene más variables
explicativas que el número de observaciones.
 Si se incluyen variables dicotómicas debe hacerse dejando una categoría base.
 Otra razón de presencia de multicolinealidad, sobre todo en los datos de series de tiempo,
puede ser que las regresoras del modelo compartan una tendencia común; es decir, que
todas aumenten o disminuyan a lo largo del tiempo.

4.12 Transformación Box-Cox


El análisis de regresión lineal clásico se basa en los supuestos de que el término de error es aditivo,
sigue una distribución normal y tiene varianza constante. Cuando estas hipótesis se incumplen,
frecuentemente se diseña un nuevo modelo que cumpla con las características del modelo original
y satisfaga todos los supuestos por medio de la aplicación de una transformación adecuada a los
datos o filtrando algunos que resultan sospechosos de ser atípicos. Es frecuente que el camino
elegido por muchos investigadores sea la Transformación de Box-Cox.
La transformación Box-Cox consiste en suponer que existe un valor de 𝜆 tal que:

𝑦 λ−1
𝑇(λ) = { λ 𝑠𝑖 λ ≠ 0
𝑙𝑛(𝑦) 𝑠𝑖 λ = 0

15
4.13 Variables Dummy o Dicotómicas
Suelen indicar la presencia o ausencia de una “cualidad” o atributo, como femenino o masculino,
negro o blanco, católico o no católico, demócrata o republicano, son variables en escala nominal
esencialmente. Una manera de “cuantificar” tales atributos es mediante variables artificiales que
toman los valores 0 o 1, donde 1 indica la presencia (o posesión) de ese atributo y 0 su ausencia.
Para usar las variables Dummy se debe tener en cuenta lo siguiente:

 Si la variable cualitativa tiene m categorías, se deben crear solo m-1 categorías para evitar
un problema de colinealidad. Con la categoría omitida se crea la llamada “categoría base”.
 El valor del intercepto 𝛽0 representa el valor medio de la categoría de comparación.
 La elección de la categoría base queda a criterio del investigador, por lo general, se usa una
de los extremos para facilitar la comparación de las otras.
 Se puede crear un modelo sin intercepto, incluyendo todas las categorías y sin temor a tener
problemas de multicolinealidad.
4.14 Selección mejor modelo
El establecer una ecuación de regresión para una respuesta Y en términos de unos predictores o
regresores (𝑋1,… , 𝑋𝑝) que pueden ser transformaciones de las variables explicativas originales
(𝑍1, … , 𝑍𝑞) sintetiza dos criterios opuestos, lo que se denomina criterio de parsimonia:

 La ecuación tiene que ser útil para finalidades predictivas, de manera que se incluirán tantas
regresoras como sea necesario para que los valores ajustados sean fiables.
 Los modelos con muchos regresores tienen un alto coste de obtención y mantenimiento de
la información, de manera que el modelo debe incluir el mínimo de regresores necesario.
(Montero Mercadé, 2012)
Un buen modelo, debe mostrar un análisis de los residuos satisfactorio y un estudio de los valores
influyentes, es deseable la consecución de modelos sin residuos atípicos, ni valores influyentes a
posteriori.
4.15 Regresión Stepwise
Procedimiento de selección de la mejor ecuación de regresión (mejor modelo), parte de un conjunto
reducido de regresores y lo va engrandeciendo hasta hallar el modelo satisfactorio. Las etapas
pueden resumirse en los siguientes puntos:

 Seleccionar el regresor más correlacionado con la variable de respuesta 𝐘, sea 𝐱𝐦. Calcular
la ecuación de regresión.
 Para cada regresor i no incluido hasta el momento, se calcula el coeficiente de correlación
parcial con la variable de respuesta 𝐘 (técnicamente supone calcular la correlación entre
los residuos del modelo actual y los residuos de una ecuación de regresión auxiliar que
especifica como variable repuesta el regresor i no presente en el modelo).

16
 Se selecciona el regresor con coeficiente de correlación parcial más elevado, sea 𝐱𝐦 y se
recalcula la ecuación de regresión con el modelo incrementado, aceptando el nuevo
regresor 𝐱𝐦 si el estadístico de Fisher para el contraste de la hipótesis nula H0 ∶ β0 = 0, sea
Fm es superior a un cierto valor de referencia mínima de la ley de Fisher correspondiente
denominado “F to enter”: 𝐹̅𝛽.
Si 𝐹𝑚 > 𝐹̅𝛽 entonces se incluye el regresor m-ésimo en el modelo. (Montero Mercadé,
2012).
4.16 Análisis de residuales
El análisis de los residuos constituye una herramienta práctica para la validación de las hipótesis
aparentemente muy teóricas de la regresión lineal y, por tanto, para garantizar las propiedades
estadísticas de los estimadores del modelo asumido:

Sea el modelo con variable de respuesta continua,

𝑌 = 𝜇 + 𝜀 = 𝑋𝛽 + 𝜀
Donde los errores son insesgados, de varianza constante, no correlacionados y distribuidos
normalmente:

𝜀 = 𝑁 (0, 𝜎2𝑰n)

Los residuos son las diferencias entre los valores observados y los valores ajustados por el modelo:

𝑒 = 𝑌 − 𝑌′ = (𝐼 − H)
La varianza del residuo i-ésimo es

𝑉[𝑒𝑖] = 𝜎2(1 − H𝑖𝑖)

Donde 𝑃𝑖𝑖 es el elemento i-ésimo de la matriz de proyección H. (Montero Mercadé, 2012)

 El residuo estandarizado 𝒅𝒊 se define como el residuo dividido por su desviación tipo:


𝑒𝑖
𝑑𝑖 =
𝑠√1 − h𝑖𝑖

El análisis de los residuos permite concluir si las hipótesis asumidas son correctas o no (y por qué
no lo son), se realiza con base en herramientas gráficas de la estadística descriptiva:
 Histograma de los residuos: Se persigue apreciar que estén centrados en el cero y que su
distribución sea aproximadamente normal. Un Box-Plot puede ayudar a identificar los
outliers de los residuos.
 También se puede emplear un Normla Probability Plot de los residuos estandarizados
(recta de Henry) (Montero Mercadé, 2012).

17
4.17 Validación cruzada dejando uno fuera (Leave – one – out)
La validación cruzada dejando uno fuera o Leave – one – out implica separar los datos de
forma que para cada iteración tengamos un solo dato de prueba y todo el resto de los datos
para entrenamiento.
El error se calcula como el promedio de los errores cometidos:

Si 𝑀𝑆𝐸𝑖 = (𝑦𝑖 − 𝑦𝑖)2 donde 𝑦𝑖 es la predicción para 𝑦𝑖, entonces se define el error por:
𝑁
1
𝑐𝑣 = ∑ 𝑀𝑆𝐸𝑖
𝑁
𝑖=1

La estimación del error no tiende a ser muy variable dependiendo de cuáles datos quedan en
la tabla de aprendizaje y cuáles en la tabla de testing, es decir, la estimación del error es mucho
más estable (Rodríguez).
4.18 Regresión geográficamente ponderada (GWR) por sus siglas en ingles.
Es la que se basa en el análisis local realizado a partir del muestreo global al modelo
geográficamente ponderado, se puede le puede ajustar un modelo de regresión en cada ubicación
de observación en el conjunto de datos, aunque las ubicaciones de calibración del modelo no están
restringidas a ubicaciones de observación (Fischer & Getis, 2010), se expresa de la siguiente
manera:
𝑝−1

𝑦𝑖 = 𝛽𝑖0 + ∑ 𝛽𝑖𝑘 𝑥𝑖𝑘 + 𝜀𝑖


𝑘−1

Donde 𝑦𝑖 : Valor de la variable endógena en el punto i.


𝛽𝑖0 : Intersección.
𝛽𝑖𝑘 : Coeficiente de la regresión.
𝑥𝑖𝑘 : Valor de la covariable en la ubicación i
𝜀𝑖 : Error aleatorio.

5. METODOLOGÍA
5.1 Área de Estudio
La información suministrada se recolectó en el área urbana de la localidad número 11 (Suba) en la
ciudad de Bogotá D.C. (Colombia).
5.2 Materiales
Para desarrollar el trabajo se obtuvo como insumo una base de datos en Excel proporcionada por
el Observatorio Inmobiliario Catastral (OIC) de la Unidad Administrativa Especial de Catastro
Distrital UAECD con información que corresponde a una muestra de datos de corte transversal,

18
compuesta por 963 ofertas de venta de viviendas de estrato 2 y 3 tomadas en el año 2011 en la
localidad de Suba.
Descripción de las Variables
La selección de las variables explicativas deriva de la representatividad de los atributos en el
análisis del precio oferta como un precio hedónico.
La descripción y el renombramiento de las variables que se utilizaran, se expone en la tabla 1.
Variable Descripción Renombramiento
Precio oferta Precio de la oferta de venta de la vivienda, en pesos POFERTA
colombianos (Variable de razón).

Coordenada X Coordenada del predio en el eje de las abscisas X


proyectadas MAGNA ciudad Bogotá (Variable de
razón).
Coordenada Y Coordenada del predio en el eje de las ordenadas Y
proyectadas MAGNA Ciudad Bogotá (Variable de
razón).
Sistema de Sometidos bajo régimen de propiedad horizontal o TIPOINM
construcción vivienda unifamiliar o bifamiliar con código
estandarización de 0 o 1 respectivamente (Variable
nominal).
Área Se entiende por área construida la parte edificada, es AREA
construida decir, la suma de la superficie de los pisos excluyendo
azoteas y
áreas sin techar (Variable de razón).
Alcobas Número de alcobas de la vivienda (Variable ordinal). ALCO
Baños Número de cuartos de baño de la vivienda (variable WC
ordinal).
Cocinas Número de cocinas de la vivienda (Variable ordinal) COC
Ubicación lote Posición del predio dentro de la manzana pueden ser UBICL
esquinero, medianero, medianero con dos frentes,
cabecero de manzana, manzanero, al fondo de calle sin
salida e interior sin acceso propio. Variable nominal por
código que va de 1 a 8 en el orden ya mencionado.

19
Estrato Nivel de clasificación por estratificación socioeconómica ESTRATO
de Bogotá, para esta muestra de la base de datos
solamente se tiene para estratos 1 y 2 (Variable ordinal).
Influencia vía Referido a la cercanía de la vivienda a las vías de acceso, INFLVIA
estandarizado por códigos del 0 al 4 que corresponde en
ese orden a vías sin influencia, local, zonal o intermedia,
arterial complementaria, arterial básico o principal
(Variable nominal).
Tabla 2 Variables seleccionadas para el estudio.

Variables Dummy.
Para el análisis de los modelos se identificaron las variables cualitativas de estrato, influencia vía,
y ubicación del lote. Para evaluar la influencia de cada una de las categorías de las variables sobre
el precio oferta se tienen en cuenta las siguientes consideraciones:
 Ubicación del lote: Se categoriza en tres atributos (medianero, manzanero y esquinero),
se toma como categoría base medianero y se codifica así:
MANZANEROC ESQUINEROC
Esquinero 0 1
Medianero 0 0
Manzanero 1 1
Tabla 3 Codificación Dummy para la variable Ubicación lote

Entonces para la interpretación de las estimaciones, se puede considerar que por ejemplo
cuando las nuevas variables MANZANEROC y ESQUINEROC tomen como valores 0, la
ubicación del lote es Medianero.
 Influencia vía: Se categoriza en cuatro atributos (local, intermedia, arterial
complementaria y arterial principal), se toma como categoría base arterial y se codifica
así:
INLOCAL ININT INCOMP
Local 0 0 0
Intermedia 1 0 1
Arterial complementaria 0 1 0
Arterial principal 1 1 1

20
Tabla 4 Codificación Dummy para la variable Influencia vía

Para la interpretación es el mismo análisis de la anterior categorización, sin embargo,


tendiendo cuenta que en este caso son tres variables las que se tienen que definir.
 Estrato: Se categoriza en dos atributos (estrato 2 y estrato 3), por lo que se codifica como
0 y 1 respectivamente, asignando estrato 2 como categoría base y renombrando la
variable como ESTRATOD.
Rango de las variables
Renombramiento Rango
POFERTA (35000000;1300000000)
X (94114.918; 103451.237)
Y (110052.801;119152.278)
TIPOINM 0y1
AREA (20.72;513.9)
ALCO {1, 2, …, 23}
WC {1, 2, …, 8}
COC {1, 2, …, 7}
MANZANEROC 0y1
ESQUINEROC 0y1
INLOCAL 0y1
ININT 0y1
INCOMP 0y1
ESTRATOD 0y1
Tabla 5 Rango de las variables del modelo

5.3 Método
Con este trabajo se busca estimar un modelo de regresión múltiple que contribuya a la predicción
del precio oferta de un inmueble; para cumplir con este objetivo se debe identificar y modelar el
cambio de la variable endógena producido por las variables explicativas, teniendo en cuenta la
naturaleza de los datos y empleando transformaciones y estadísticos adecuados que permitan dar
una consistencia solida al uso del modelo estimado. En el gráfico 1 se presenta el flujo del trabajo
para el tratamiento y análisis de la información.

21
Ilustración 1.Diagrama de flujo del método aplicado

22
6. RESULTADOS

6.1 Análisis exploratorio de los datos


Para examinar si la variable respuesta sigue una distribución normal, se analizan los diferentes
gráficos como histograma, diagrama de distribución empírica y diagrama de caja de la variable.
También, se expone en la Tabla 4 un resumen de las medidas de tendencia central de la variable
endógena

Ilustración 2.Histograma, Boxplot y Gráfico Q-Q, Precio Oferta

El precio oferta presenta asimetría unimodal a la derecha ya que los valores tienden a reunirse a la
izquierda de la media (Gráfico 2). Tiene un valor de la media de 123’891.416 y mediana
105’000.000, el valor de la curtosis muestra una concentración de valores
en torno a la media. Se observa que en el gráfico Q-Q los puntos no se ajustan a una recta, donde
se concluye que la distribución tiende a ajustarse a una distribución con otra forma funcional (Log).
El Box-Plot expone que el precio oferta de las viviendas tiene demasiados datos atípicos, lo que
explica las inconsistencias en la distribución de los datos, adicionalmente esta caja no es simétrica
respecto a la mediana ya que los datos se ubican encima de ésta.

23
Medida estadística Precio oferta
Mínimo 35000000
Máximo 1300000000
Media 123891416
Mediana 105000000
Desviación estándar 87006082
Asimetría 5.521004
Kurtosis 52.23482
Coeficiente variación promedio (%) 70.22769
Tabla 6.Resumen de medidas estadísticas de la variable Precio Oferta

A continuación, el grafico de correlación entre el precio oferta y el área de construcción, permite


ver que se presenta una correlación de 0.6853, lo que permite entender que la variable Área de
construcción permite describir de buena manera el Precio oferta de los predios, sin embargo, tiende
a disminuir a medida que crece el área de construcción, por lo que también se puede decir que los
datos se dispersan en esa dirección.

Ilustración 3.Dispersograma Precio oferta - Área de construcción

Finalmente, en un dispersograma se evidencia la distribución de los precios oferta, teniendo en


cuenta las variables espaciales (coordenada X y coordenada Y) con el fin de entender la distancia
a las que se encuentran unos registros de los otros elementos de estudio, que en este caso son los
predios. Se concluye que, a partir del gráfico, los elementos tienden a concentrarse en una sola
región y esto puede generar efectos de relación espacial y a posteriori problemas en el
modelamiento econométrico clásico.

24
6.2 Modelamiento econométrico
Teniendo como principal objetivo explicar la variable endógena (precio oferta), se busca estipular
que variables exógenas son más significativas e influyentes para dar una especificación adecuada
a la predicción. Para tal objetivo se utiliza StepWise en ambas direcciones a un nivel de
significancia de p < 0.05 y con criterio de (BIC), método que ayuda a determinar cuál es la mejor
combinación posible entre las variables explicativas.

Tabla 7 Estimación del modelo de regresión obtenido por StepWise (step1)

𝑃𝑂𝐹𝐸𝑅𝑇𝐴 = 𝛽0 + 𝛽1𝑥 + 𝛽2𝐴𝑅𝐸𝐴 + 𝛽3𝐶𝑂𝐶 + 𝛽4𝑊𝐶 + 𝛽5𝑇𝐼𝑃𝑂𝐼𝑁𝑀 + 𝛽6𝐸𝑆𝑇𝑅𝐴𝑇𝑂𝐷 + 𝛽7𝐼𝑁𝐿𝑂𝐶𝐴𝐿 + 𝛽8𝐸𝑆𝑄𝑈𝐼𝑁𝐸𝑅𝑂𝐶

Al aplicar StepWise se obtiene que el modelo que se aprecia anteriormente fue el de menor AIC =
34314.95, por lo tanto, es el mejor modelo seleccionado, donde las variables TIPOINM y
ESQUINEROC no son significativas estadísticamente, ya que su P-valor > 0.05.
Por otra parte, al aplicar el test de Shapiro –Wilk se rechaza la hipótesis nula de normalidad, pues
el P-valor = 2.2e- 16, lo que traduce a que no hay normalidad, por ello no se justifica realizar un
test para revisar la heterocedasticidad, además este modelo presenta una asimetría en los residuos
de 5.5539.

Ilustración 4.Test de normalidad para el modelo de regresión step1

25
6.3 Correcciones
De partida se propuso hacer una transformación logarítmica a la variable respuesta, pues
conociendo la naturaleza de los datos se esperaría una mejor estimación del modelo seleccionado
por StepWise. El resultado fue:

Tabla 8 Estimación del modelo de regresión transformado step1t

log(𝑃𝑂𝐹𝐸𝑅𝑇𝐴) = 𝛽0 + 𝛽1 𝑥 + 𝛽2 𝐴𝑅𝐸𝐴 + 𝛽3 𝐶𝑂𝐶 + 𝛽4 𝑊𝐶 + 𝛽5 𝑇𝐼𝑃𝑂𝐼𝑁𝑀 + 𝛽6 𝐸𝑆𝑇𝑅𝐴𝑇𝑂𝐷 + 𝛽7 𝐼𝑁𝐿𝑂𝐶𝐴𝐿+ 𝛽8𝐸𝑆𝑄𝑈𝐼𝑁𝐸𝑅𝑂𝐶

En este modelo solo existe una variable no significativa estadísticamente la cual es


MANZANEROC, pero este modelo también presenta problemas, porque la prueba de Shapiro-
Wilk arroja un P-valor = 2.619e-12 lo que indica que no hay normalidad, nuevamente no se realiza
un test de heterocedasticidad, el modelo cuenta con una asimetría en los residuos de 0.6306.

Ilustración 5.Test de normalidad para el modelo de regresión step1t

Entonces se procede a realizar la transformación Box Cox al modelo seleccionado, el resultado


fue:

26
Ilustración 6.Transformación BoxCox modelo de regresión step1

λ = -0.2848233
𝑃𝑂𝐹𝐸𝑅𝑇𝐴λ−1
Y ya que λ ≠ 0 se realizó la transformación potencial 𝑊 = λ
, y se estimó el modelo:

Tabla 9 Estimación del modelo de regresión transformado step1B

𝑊= 𝛽0 + 𝛽1𝑥 + 𝛽2𝐴𝑅𝐸𝐴 + 𝛽3𝐶𝑂𝐶 + 𝛽4𝑊𝐶 + 𝛽5𝑇𝐼𝑃𝑂𝐼𝑁𝑀 + 𝛽6𝐸𝑆𝑇𝑅𝐴𝑇𝑂𝐷 + 𝛽7𝐼𝑁𝐿𝑂𝐶𝐴𝐿 + 𝛽8𝐸𝑆𝑄𝑈𝐼𝑁𝐸𝑅𝑂𝐶

Este modelo presenta dos variables no significativas estadísticamente, INLOCAL y


ESQUINEROC, en cuanto a la prueba de Shapiro-Wilk muestra que no hay normalidad, sin
embargo, al compararlo con los anteriores modelos se encuentra una mejora en la distribución, ya
que el test arroja un P-valor = 3.117e-09 y por lo tanto se ha acercado a la tendencia de normalidad.
Teniendo en cuenta la anormalidad que se presenta de nuevo, no se considera la aplicación de un
test para heterocedasticidad, este modelo además presenta una asimetría en los residuos de -0.538.

27
Ilustración 7.Test de normalidad para el modelo de regresión step1B

Posteriormente se generó un modelo contrastando la transformación potencial realizada a la


variable endógena con las variables explicativas que podían ser transformadas por el logaritmo
natural, el resultado fue:

Tabla 10 Estimación del modelo de regresión transformado step1BL

𝑊= 𝛽0 + 𝛽1 log(𝑥) + 𝛽2 log(𝐴𝑅𝐸𝐴) + 𝛽3 log(𝐶𝑂𝐶) + 𝛽4 log(𝑊𝐶) + 𝛽5 𝑇𝐼𝑃𝑂𝐼𝑁𝑀 + 𝛽6 𝐸𝑆𝑇𝑅𝐴𝑇𝑂𝐷 + 𝛽 7𝐼𝑁𝐿𝑂𝐶𝐴𝐿 + 𝛽8𝐸𝑆𝑄𝑈𝐼𝑁𝐸𝑅𝑂𝐶

El modelo presenta un R ajustado optimo, los parámetros que no son significativos


estadísticamente son TIPOINM, INLOCAL y MANZANEROC, en cuanto a normalidad el test de
Shapiro-Wilk presenta un P-valor = 8.963e-10 lo que quiere decir que aún no hay normalidad; en
este no se aplica un test para la heterocedasticidad ya que tampoco sería coherente, en este modelo
se obtiene una asimetría en los residuos de -0.453.

Ilustración 8.Test de normalidad para el modelo de regresión step1BL

Finalmente se optó por realizar la transformación Gaussiana (Anamorfosis) en dos fases. Primero
a la variable respuesta, obteniendo como resultado:

28
Ilustración 9.Transformación Gaussiana a la variable POFERTA

Tabla 11 Estimación del modelo de regresión transformado con anamorfosis gaussiana step1G

𝑃𝑂𝐹𝐸𝑅𝑇𝐴R = 𝛽0 + 𝛽1𝑥 + 𝛽2𝐴𝑅𝐸𝐴 + 𝛽3𝐶𝑂𝐶 + 𝛽4𝑊𝐶 + 𝛽5𝑇𝐼𝑃𝑂𝐼𝑁𝑀 + 𝛽6𝐸𝑆𝑇𝑅𝐴𝑇𝑂𝐷 + 𝛽7𝐼𝑁𝐿𝑂𝐶𝐴𝐿 + 𝛽8𝐸𝑆𝑄𝑈𝐼𝑁𝐸𝑅𝑂𝐶


𝑃𝑂𝐹𝐸𝑅𝑇𝐴𝑇𝑅 = 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑡𝑟𝑎𝑛𝑠𝑓𝑜𝑟𝑚𝑎𝑑𝑎 𝑐𝑜𝑛 𝑎𝑛𝑎𝑚𝑜𝑟𝑓𝑜𝑠𝑖𝑠 𝑔𝑎𝑢𝑠𝑠𝑖𝑎𝑛𝑎

Entre las variables no significativas estadísticamente para este modelo tenemos INLOCAL Y
ESQUINEROC, en cuanto al R cuadrado da más de un cincuenta por ciento, lo que da a
entender que el modelo es explicado adecuadamente por dichas variables exógenas, pero una
vez más el test de Shapiro-Wilk arrojo un P-valor = 9.174e-05, rechazando la hipótesis nula
y concluyendo que no hay normalidad, como es de suponerse tampoco se aplica un test para
la heterocedasticidad, el modelo presenta una asimetría en los residuos de -0.138.
Y luego se transformaron las variables COCINAS y WC, para proceder con la estimación de
un modelo que resulto:

29
Tabla 12 Estimación del modelo de regresión transformado con anamorfosis gaussiana step2G

𝑃𝑂𝐹𝐸𝑅𝑇𝐴R = 𝛽0 + 𝛽1𝑥 + 𝛽2𝐴𝑅𝐸𝐴 + 𝛽 3𝐶𝑂𝐶TR + 𝛽4𝑊𝐶TR + 𝛽 5𝑇𝐼𝑃𝑂𝐼𝑁𝑀 + 𝛽6𝐸𝑆𝑇𝑅𝐴𝑇𝑂𝐷 + 𝛽7𝐼𝑁𝐿𝑂𝐶𝐴𝐿 + 𝛽8𝐸𝑆𝑄𝑈𝐼𝑁𝐸𝑅𝑂𝐶

𝑃𝑂𝐹𝐸𝑅𝑇𝐴𝑇𝑅 = 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑡𝑟𝑎𝑛𝑠𝑓𝑜𝑟𝑚𝑎𝑑𝑎 𝑐𝑜𝑛 𝑎𝑛𝑎𝑚𝑜𝑟𝑓𝑜𝑠𝑖𝑠 𝑔𝑎𝑢𝑠𝑠𝑖𝑎𝑛𝑎


WC𝑇𝑅 = 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑡𝑟𝑎𝑛𝑠𝑓𝑜𝑟𝑚𝑎𝑑𝑎 𝑐𝑜𝑛 𝑎𝑛𝑎𝑚𝑜𝑟𝑓𝑜𝑠𝑖𝑠 𝑔𝑎𝑢𝑠𝑠𝑖𝑎𝑛𝑎
COC𝑇𝑅 = 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑡𝑟𝑎𝑛𝑠𝑓𝑜𝑟𝑚𝑎𝑑𝑎 𝑐𝑜𝑛 𝑎𝑛𝑎𝑚𝑜𝑟𝑓𝑜𝑠𝑖𝑠 𝑔𝑎𝑢𝑠𝑠𝑖𝑎𝑛𝑎

Donde se concluyó que las variables no significativas estadísticamente para este modelo
fueron INLOCAL Y ESQUINEROC, con un R igual a 0.6512 da a entender que el modelo es
explicado adecuadamente por dichas variables exógenas, pero esta vez el test de Shapiro-Wilk
arrojo un P-valor = 0.0005466, donde claramente la tendencia de anormalidad disminuye y
aun rechazando la hipótesis nula y concluyendo que no hay normalidad, se encuentra que al
realizar esta transformación, como resultado obtenemos el modelo más cercano a la
normalidad. Como es de suponerse tampoco se aplica un test para la heterocedasticidad, y se
obtiene para el modelo una asimetría en los residuos de -0.094.

Ilustración 10.Test de normalidad para el modelo de regresión step2G

Después de realizar las diferentes transformaciones se logró ver que sucesivamente los residuos
del modelo iban acercándose a la asimetría, pasando de un valor de 5.5539 a uno de -0.094, en
consideración a que la muestra es grande y apoyándose en el teorema de limite central se tiene que
la muestra ya tiende a la normalidad a pesar de que el test de Shapiro-Wilk arroje un Pvalor
significativo de 0.0005466 rechazando la hipótesis nula de normalidad, los resultados que muestra
el modelo presentado en la tabla 10 respecto a los residuos se muestra en el siguiente gráfico.

30
Ilustración 11.Gráfico Histograma y Gráfico Q-Q de los Residuos del Modelo Estimado

Como se ve en el Q-Q plot al estar los datos cerca de la línea base se puede decir que los residuos
provienen de una población con distribución normal, por otro lodo el histograma muestra que la
distribución de los residuos tiende a estar equilibrada a izquierda y derecha respecto a la media.
Después de asumir normalidad en los residuos se procede a evaluar el test de Heteroscedastisidad
Brush-Pagan en el modelo de la tabla 10 el cual arroja un resultado de un Pvalor=7.899e-09
significativo estadísticamente, lo que significa que se rechaza la hipótesis nula de la
homoscedastisidad y se concluye entonces la presencia de heterocedasticidad, el resultado
mostrado en R se muestra en la siguiente figura.

Ilustración 12.test Breusch-pagan

6.4 Modelamiento espacial


Después de evaluar la heterocedastisidad y saber la existencia de esta en el modelo, se cree que
esta puede ser debido a la existencia de autocorrelación espacial, por ello se recurrió a analizar la
naturaleza de la variable que responden a la variable endógena, teniendo en cuenta sus
características espaciales.
6.4.1 Análisis de conectividad
De partida se hizo el análisis de autocorrelación espacial, aplicando el método I de Moran por
medio del correlograma obtenido por distancias entre los primeros 20 vecinos, el cual resultó:

31
Ilustración 13.Correlograma por distancias I de Moran

Ilustración 14.Correlaciones rangos de distancias

Donde se concluye que en las conexiones que se encuentren dentro de los intervalos de distancias
del gráfico anterior, se detecta autocorrelación espacial.
Y a partir de los k vecinos más cercanos por medio del I de Moran, se definieron 15 vecinos como
referencia y se obtuvo:

Ilustración 15.Correlograma por k vecinos más cercanos I de Moran

32
Tabla 13.Correlograma I Moran K Vecinas

Según el grafico del correlograma se observa que existe correlación de orden 1 hasta 9 y
correlación de orden del 1 hasta el 15
Lo que permitió determinar que existe autocorrelación espacial en los datos, y la salida gráfica de
las conexiones entre cada región y sus vecinos más cercanos se puede apreciar como:

Ilustración 16.Mapa de conectividad

33
Bajo la afirmación de la existencia de relación espacial se calculó la matriz W de pesos espaciales,
la cual introduce la dependencia entre las unidades y permite especificar un modelo espacial
óptimo.

6.4.2 I de Moran
Para la prueba de autocorrelación espacial de la variable respuesta, por medio del estadístico global
I de Moran se utilizó la matriz de pesos espaciales y se encontró que:

Ilustración 17.Test global de autocorrelación I de Moran

Como se esperaba por las anteriores pruebas, la variable endógena tiene una estructura de
dependencia espacial ya que el estadístico I de Moran es significativo y su P-valor es menor al 5%.

6.4.3 Modelo autorregresivo de regresión espacial de orden 1.

Este modelo rezaga la variable respuesta precio oferta considerando la influencia espacial teniendo
en cuenta la matriz de pesos.

Tabla 14. Estimación del modelo autorregresivo de regresión espacial de orden 1

𝑃𝑂𝐹𝐸𝑅𝑇𝐴𝑇𝑅 = 𝜌𝑊𝑃𝑂𝐹𝐸𝑅𝑇𝐴 + 𝛽1𝑥 + 𝛽2𝐴𝑅𝐸𝐴 + 𝛽3𝐶𝑂𝐶𝑇𝑅 + 𝛽4𝑊𝐶𝑇𝑅 + 𝛽5𝑇𝐼𝑃𝑂𝐼𝑁𝑀 + 𝛽6𝐸𝑆𝑇𝑅𝐴𝑇𝑂𝐷 +


𝛽7𝐼𝑁𝐿𝑂𝐶𝐴𝐿+𝛽8𝐸𝑆𝑄𝑈𝐼𝑁𝐸𝑅𝑂𝐶

34
𝑃𝑂𝐹𝐸𝑅𝑇𝐴𝑇𝑅 = 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑡𝑟𝑎𝑛𝑠𝑓𝑜𝑟𝑚𝑎𝑑𝑎 𝑐𝑜𝑛 𝑎𝑛𝑎𝑚𝑜𝑟𝑓𝑜𝑠𝑖𝑠 𝑔𝑎𝑢𝑠𝑠𝑖𝑎𝑛𝑎
𝐶𝑂𝐶𝑇𝑅 = 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑡𝑟𝑎𝑛𝑠𝑓𝑜𝑟𝑚𝑎𝑑𝑎 𝑐𝑜𝑛 𝑎𝑛𝑎𝑚𝑜𝑟𝑓𝑜𝑠𝑖𝑠 𝑔𝑎𝑢𝑠𝑠𝑖𝑎𝑛𝑎
𝑊𝐶𝑇𝑅 = 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑡𝑟𝑎𝑛𝑠𝑓𝑜𝑟𝑚𝑎𝑑𝑎 𝑐𝑜𝑛 𝑎𝑛𝑎𝑚𝑜𝑟𝑓𝑜𝑠𝑖𝑠 𝑔𝑎𝑢𝑠𝑠𝑖𝑎𝑛𝑎
𝑊𝑃𝑂𝐹𝐸𝑅𝑇𝐴 = 𝑅𝑒𝑡𝑎𝑟𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑣𝑙𝑒 𝑒𝑛𝑑𝑜𝑔𝑒𝑛𝑎

Al aplicar el anterior modelo espacial se puede ver que 𝜌 es significativo estadísticamente, en este
modelo aún hay autocorrelacion en los residuos con un Pvalor=7.8733E-08 rechazando la hipótesis
nula de no autocorrelacion dada por el test del I de Moran, que da un Pvalor=4.751e-08 como se
muestra en la siguiente figura.

Ilustración 18.Estadistica I de Moran

6.4.4 Modelo de regresión con dependencia espacial en la perturbación aleatoria o


modelo del error espacial.

Este modelo rezaga los errores considerando la influencia espacial teniendo en cuenta la matriz de
pesos.

Tabla 15. Estimación del Modelo de regresión con dependencia espacial en la perturbación aleatoria o modelo del error
espacial

POFERTATR = β1x + β2AREA + β3COCTR + β4WCTR + β5TIPOINM + β6ESTRATOD


+ β7INLOCAL + β8ESQUINEROC
POFERTATR = Variable transformada con anamorfosis gaussiana
COCTR = Variable transformada con anamorfosis gaussiana
WCTR = Variable transformada con anamorfosis gaussiana
Wu = Retardo en el error
WAREA = Retardo en la varible area
𝑢 = 𝜆Wu + ε
𝜀~𝑁(0, ∇2 𝐼)

35
En el modelo anterior se observa que dos de las variables no son significativas estadística mente,
las cuales son INLOCAL y ESQUINEROC, debido a que su Pvalor >0.05, por otro lado el 𝜆 fue
significativo estadísticamente, y el test del I moran arroja que no hay autocorrelacion espacial,
gracias a que se puede aceptar la hipótesis nula porque el Pvalor> 0.05 como se muestra en la
siguiente figura.

Ilustración 19. estadística I de Moran

6.4.5 Modelo mixto autorregresivo regresivo cruzado de regresión espacial

Se toma el área como la variable a retardar por su alta influencia en la variable respuesta como se
muestra a continuación.

Ilustración 20.Estimación del Modelo mixto autorregresivo regresivo cruzado de regresión espacial

POFERTATR = = ρWPOFERTA + β1x + β2AREA + β3COCTR + β4WCTR + β5TIPOINM + β6ESTRATOD


+ β7INLOCAL + β8ESQUINEROC
POFERTATR = Variable transformada con anamorfosis gaussiana
COCTR = Variable transformada con anamorfosis gaussiana
WCTR = Variable transformada con anamorfosis gaussiana
WPOFERTA = Retardo en la variable endogena
WAREA = Retardo en la varible area

El anterior modelo espacial presenta un 𝜌 estadísticamente significativo y dos variables


INLOCAL y ESQUINEROC estadísticamente no significativas, en este modelo ya no hay

36
autocorrelacion espacial en los residuos ya que el Pvalor =0.75073, no rechazando la hipótesis nula
de no autocorrelacion espacial, dada por el test del I de Moran que cuenta con un Pvalor=0.3604,
sin embargo con este modelo no se ha conseguido homocedastisidad, ya que el test de Brush-Pagan
da un Pvalor=7.836e-10 con lo que se rechaza la hipótesis nula, concluyendo que hay
heterocedasticidad.

Tabla 16. comparación de modelos espaciales

En la tabla anterior se muestra un breve resumen de los modelos espaciales aplicados hasta el
momento y se observa que en el modelo autorregresivo en el error y el mixto se ha podido erradicar
el problema de autocorrelacion espacial, sin embargo ninguno de estos muestra homoscedastisidad
en los errores, como lo demuestra un Pvalor< 0.05 en la prueba de Breusch-Pagan mostrada en la
tabla para cada uno de los modelos, ello conduce a pensar que hay variabilidad en el espacio
geográfico lo que generaría “no estacionariedad paramétrica”, basados en esto, se procede a
realizar un modelo de regresión geográficamente ponderada GWR por sus siglas en ingles que
permita ver la influencia local.

6.4.6 Regresión Geográficamente ponderada GWR (por sus siglas en inglés)

Para facilitar el análisis espacial visualmente, se procede a delimitar la localidad de Bosa y


posteriormente a generar áreas respecto a cada ubicación en el espacio con la técnica de los
polinomios de voronoi, aplicada en el software Arcgis.

Seguidamente se utiliza el programa Rstudio para el análisis, se emplea el modelo en donde se


transforman las variables POFERTA, COC y WC con anamorfosis gaussiana y se elimina las dos
variables que globalmente no son estadísticamente significativas, en primera instancia se realiza
la correlación entre la variable respuesta contra cada una de las variables explicativas con el fin de
ver la influencia o efecto sobre la variable endógena como se muestra a continuación.

37
Ilustración 21.Correlación entre ESTRATOD Y POFERTATR, Correlación ÁREA Y POFERTATR

En la anterior imagen se observa que la variable ESTRATOD, en una alta proporción tiene
correlación negativa respecto a la variable endógena ya que hay varias zonas con valores cercanos
a menos uno, en cuanto a el ÁREA, la correlación tiende a ser positiva ya que las zonas en su
mayoría se acercan a uno positivo.

Ilustración 22.Correlación entre TIPOINM Y POFERTATR, Correlación X Y POFERTATR

En la imagen anterior se puede ver que la variable explicativa TIPOINM tiende una correlación
positiva en las zonas donde predomina el color rojo, pero también hay correlación negativa en las
zonas donde predomina el blanco, para la variable X en la mayoría de las zonas hay correlación
moderada o casi nula.

38
Ilustración 23.Correlación entre WCTR Y POFERTATR, Correlación COCTR Y POFERTATR

En la imagen anterior se observa que la variable WCTR tiende a una correlación entre media y alta
o sea positiva con una gran parte de las zonas próximas a uno, en cuanto a la variable COCTR, se
observa una correlación positiva, negativa y moderada en las zonas de color rojo, amarillo y blanco
respectivamente.
Selección del modelo
La selección del modelo se hace mediante el índice AIC más pequeño, como se puede ver en el
grafico siguiente, se toma el modelo 21 que cumple con la condición de mínimo, este modelo es
generado por la función model.selection.gwr en R. En el modelo que se obtiene no se elimina
ningún variable, también la selección se puede hacer visualmente, teniendo en cuenta la imagen
de la derecha en donde los puntos más cercanos al centro y con un radio mayor, significan que son
las variables que explica mejor a la variable endógena en distintas direcciones.

Ilustración 24. Selección del modelo por AICc y gráfico visual

39
El modelo de regresión geográficamente ponderado GWR por sus siglas en inglés, estimado en R
se muestra a continuación.

Ilustración 25. Salida gráfica de la regresión geográficamente ponderada

La estimación mostrada en la figura anterior fue realizada utilizando un núcleo kernel de


𝑑𝑖𝑗
(− )
ponderación exponencial dado por 𝑊𝑖𝑗 = 𝑒 𝛾 en donde 𝛾 es el ancho de banda del núcleo γ
que controla el rango y la disminución de la correlación espacial (Fischer & Getis, 2010), en este
caso el ancho de banda optimo fue 𝛾 = 18, en cuanto al R cuadrado ajustado ha aumentado la
presencia de las seis variables y ha explicado el modelo en un 76% en comparación a la regresión
global con las mismas variables que explican un 64%.

A continuación, se mostrará cada una de las variables utilizada en el modelo con el fin de mirar
el efecto espacial, teniendo la distribución en el espacio por zonas del estadístico t y Pvalor a la
derecha e izquierda respectivamente.

40
Ilustración 26. Estadistico t Y Pvalor de la variable ÁREA

En la imagen anterior se puede observar que a un nivel de significancia del Pvalor< 0.05 la variable
explicativa del AREA, contribuye en un alto porcentaje en las diferentes zonas, sin embargo, esta
no es significativa alrededor de las zonas del centro, lo que da a pensar en forma local que la
variable en esa zona no tiene un peso muy relevante dentro de las regresiones parciales que se
puedan estimar.

Ilustración 27.Estadistico t Y Pvalor de la variable ESTRATOD

En la imagen anterior se puede observar que a un nivel de significancia del Pvalor< 0.05 la variable
explicativa del ESTRATOD en zonas nor-orientales, occidentales y algunas zonas hacia el centro
no son significativas estadísticamente, se pensaría que el resto de las zonas si sea estadísticamente
significativo.

41
Ilustración 28.Estadistico t Y Pvalor de la variable TIPOINM

En la imagen anterior se puede observar que a un nivel de significancia del Pvalor< 0.05 la variable
explicativa del TIPOINM ES no significativa en las zonas del norte y un poco en las zonas del
occidente, en el resto de las zonas es significativas.

Ilustración 29.Estadistico t Y Pvalor de la variable X

En la imagen anterior se puede observar que a un nivel de significancia del Pvalor< 0.05 la variable
explicativa X no es estadísticamente significativa en algunas zonas centrales, algunas zonas nor-
occidentales, algunas zonas nor-orientales y en algunas zonas del sur.

42
Ilustración 30.Estadistico t Y Pvalor de la variable COCTR

En la imagen anterior se puede observar que a un nivel de significancia del Pvalor< 0.05 la variable
explicativa de COCTR, es no significativa estadísticamente en la parte occidental, sur-occidental,
hacia el centro y en algunas zonas del sur oriente, en las demás zonas se tiene significancia
estadística.

Ilustración 31.Estadistico t Y Pvalor de la variable WCTR

En la imagen anterior se puede observar que a un nivel de significancia del Pvalor< 0.05 la
variable explicativa de WCTR, es no significativa estadísticamente en algunas zonas
occidentales, sur-occidentales y nor-orientales, sim embargo en gran parte de las zonas son
significativas estadísticamente.

43
7. CONCLUSIONES

Generar un modelo econométrico acorde a la realidad, implica tomar muchas decisiones que son
cruciales para un planteamiento adecuado, sin embargo, hay varias variables que no se pueden
considerar, porque no se cuenta con ellas o porque no son medibles, por lo tanto, no se puede
modelar estrictamente en la realidad.

Por otro lado, al observar la base de datos, se apreció que había cambios bruscos manteniendo
algunas variables constantes por ejemplo para un precio oferta de 65000000 pesos manteniendo
contante estrato, ubicación, y la influencia a la vía se ve que el área de dos observaciones con ese
precio es 86.1 y 47.5 lo cual es evidentemente casi el doble, por lo tanto, dichas observaciones
pueden dar a entender que no hay estacionariedad paramétrica.

Considerar la variación en el espacio es importante, porque al realizar estimaciones econométricas


se va a contar con mayor precisión a la hora de generar predicciones, en contraste con la realidad.

Las estimaciones de los modelos espaciales mostraron mejores resultados, sin embargo, al realizar
un análisis local en cambio de uno global, se logra llegar a mejores ajustes, ya que la influencia en
el espacio es más fuerte y los factores de ponderación se hacen más rígidos.

8. REFERENCIAS

Baronio, A., Vianco, A., & Rabanal, C. (2012). Una introducción a la econometría espacial.
CANAVOS, G. (1988) Probabilidad y Estadística. Aplicaciones y Métodos. México: McGraw-
Hill.

Cosío Pascal, E. (1969). Gerhard Tintner. Methodology of mathematical economics and


econometrics. Chicago: University of Chicago Press, 1968. 113 p.. Estudios Demográficos y
Urbanos, 3(02), 240-241

Enríquez Sierra, Hernán, Barreto Nieto, Carlos, Correa Caro, Carolina, & Campo Robledo, Jacobo.
(2013). Precio del suelo y regalías en Colombia: un análisis espacial para los municipios
productores de petróleo. Desarrollo y Sociedad (71).

Fischer, M. M., & Getis, A. (Eds.). (2010). Handbook of Applied Spatial Analysis: Software Tools,
Methods and Applications.
Franklin, J., & Waddell, P. (2003, January 8–12). A hedonic regression of home prices in King
county, Washington, using activity-specific accessibility measures. Proceedings of the
transportation research board 82nd annual meeting. Washington, DC.

44
Goffette-Nagot, F., Reginster, I., & Thomas, I. (2011). Spatial analysis of residential land prices
in Belgium: Accessibility, linguistic border, and environmental amenities. Regional Sciences.

Gujarati, D. N., & Porter, D. C. (2009). Econometría: Damodar N. Gujarati y Dawn C. Porter
(5a.ed.--.). México: McGraw Hill.

Hannonen, M. (2008). Predicting urban land prices: A comparison of four approaches.


International Journal of Strategic Property Management.

Merriam-Webster, Inc. (1984). Webster's ninth new collegiate dictionary. Springfield, Mass:
Merriam-Webster

Montero Mercadé, L. (2012). MÈTODES DE CAPTACIÓ, ANÀLISI I INTERPRETACIÓ DE


DADES. Catalunya: Departament d’Estadística i Investigació Operativa.
Payares García, D. E., & Quintero Alonso, N. B. (2018). Análisis epidemiológico-espacial de
los determinantes de la neumonía en Bogotá (2004-2014). Bogotá D.C.: Universidad
Distrital Francisco José Caldas.
Pragnell, M. (2003). The economic impact of an EfW incinerator in Newhaven.
Rodriguez, O. (s.f.). Validación Cruzada y Remuestreo .

S. Rosen. (1974). “Hedonic prices and implicit markets: Product Differentiation in pure
competition”
Journal of Political Economy. The University of Chicago Press

Tsutsumi, M., Shimada, A., & Murakami, D. (2011). Land price maps of Tokyo metropolitan area.
Procedia – Social and Behavioral Sciences

Wooldridge, J. M. (2010). Introducción a la econometría, un enfoque moderno. . México, D.F.:


Cengage Learning.

45

También podría gustarte