Geodupmdee
Geodupmdee
Geodupmdee
ADVERTIMENT. La consulta d’aquesta tesi queda condicionada a l’acceptació de les següents condicions d'ús: La difusió
d’aquesta tesi per mitjà del servei TDX (www.tdx.cat) ha estat autoritzada pels titulars dels drets de propietat intel·lectual
únicament per a usos privats emmarcats en activitats d’investigació i docència. No s’autoritza la seva reproducció amb
finalitats de lucre ni la seva difusió i posada a disposició des d’un lloc aliè al servei TDX. No s’autoritza la presentació del
seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant al resum de presentació
de la tesi com als seus continguts. En la utilització o cita de parts de la tesi és obligat indicar el nom de la persona autora.
ADVERTENCIA. La consulta de esta tesis queda condicionada a la aceptación de las siguientes condiciones de uso: La
difusión de esta tesis por medio del servicio TDR (www.tdx.cat) ha sido autorizada por los titulares de los derechos de
propiedad intelectual únicamente para usos privados enmarcados en actividades de investigación y docencia. No se
autoriza su reproducción con finalidades de lucro ni su difusión y puesta a disposición desde un sitio ajeno al servicio
TDR. No se autoriza la presentación de su contenido en una ventana o marco ajeno a TDR (framing). Esta reserva de
derechos afecta tanto al resumen de presentación de la tesis como a sus contenidos. En la utilización o cita de partes de
la tesis es obligado indicar el nombre de la persona autora.
WARNING. On having consulted this thesis you’re accepting the following use conditions: Spreading this thesis by the
TDX (www.tdx.cat) service has been authorized by the titular of the intellectual property rights only for private uses placed
in investigation and teaching activities. Reproduction with lucrative aims is not authorized neither its spreading and
availability from a site foreign to the TDX service. Introducing its content in a window or frame foreign to the TDX service is
not authorized (framing). This rights affect to the presentation summary of the thesis as well as to its contents. In the using
or citation of parts of the thesis it’s obliged to indicate the name of the author.
Análisis Geoestadı́stico Espacio
Tiempo Basado en Distancias y
Splines con Aplicaciones
350
300
Z
250
200
60
50
80
40
60
30
40
20
Y 20
10
X
Doctorando:
Director: Tutor:
Universidad de Barcelona
Facultad de Biologı́a
Programa de Doctorado en Estadı́stica
Departamento de Estadı́stica
Barcelona, Mayo de 2012
Agradecimientos
Lista de figuras vi
Lista de tablas x
Abreviaturas 1
Introducción 2
Objetivos 12
1.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.2.2 El covariograma . . . . . . . . . . . . . . . . . . . . . . . 21
1.2.3 El variograma . . . . . . . . . . . . . . . . . . . . . . . . 22
1.2.4 El correlograma . . . . . . . . . . . . . . . . . . . . . . . 23
i
ii CONTENIDO
2.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.4 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
Referencias 165
A Programación en R 179
vii
viii LISTA DE FIGURAS
3.11 Gráfica de circulo de contenido de calcio con las lı́neas que de-
limitan las sub-regiones (lugares de muestreo) . . . . . . . . . . 95
5.2 RMSPE para los escenarios espacio-temporales simulados con 6 tiempos . . 141
5.3 RMSPE para los escenarios espacio-temporales simulados con 10 tiempos . 142
xi
xii LISTA DE TABLAS
1
2 ABREVIATURAS
Introducción
3
4 INTRODUCCIÓN
contemplan una serie de pasos (Isaaks & Srisvastava 1989), que comienzan con
el análisis estructural, el cual se realiza en el análisis del variograma (Samper
& Carrera 1993), obteniendo en lo posible un modelo de variograma teórico
(esférico, exponencial, gaussiano, circular o de Matern, entre otros que están
disponibles), el cual es usado en la interpolación de la variable en los sitios no
muestreados, para producir mapas que finalmente suelen ser empleados para
análisis y toma de decisiones.
Muchos métodos tales como: suavizamiento kernel (Wand & Jones 1995),
polinomios locales (Cleveland 1979, Fan & Gijbels 1996), wavelet (Donoho
& Johnstone 1994), regresión splines (Wand 2000), y suavizamientos splines
(Craven & Wahba 1979, Chen 2007), han sido propuestos para estimar y se-
leccionar curvas en modelos de regresión. Los resultados obtenidos por estos
investigadores son útiles para la geoestadı́stica ya que ofrecen la posibilidad de
ser considerados en el modelamiento de las superficies a interpolar e inclusive
en los ajustes de la correlación espacial, especı́ficamente en el modelamiento
del variograma.
Por otra parte, las funciones de base radial (RBF) tales como la multi-
cuadrática (multiquadratic, MQ) o completamente regularizada spline (com-
pletely regularized spline, CRS) son útiles en la construcción de modelos
digitales de elevación (Digital Elevation Models, DEM), como se muestra
en (Mitás̆ová & Hofierka 1993). Una variación de la función MQ se llama
la inversa multicuadrática (inverse multiquadratic, IMQ), introducida por
(Hardy & Gopfert 1975). En Späh (1969) se describe un método que per-
mite evitar puntos de inflexión y contiene splines cúbicos como un caso espe-
cial, utilizando interpolación spline cúbica y exponencial (EXP). Más tarde,
el spline capa delgada (thin plate spline, TPS) se introdujo en el diseño
geométrico por (Duchon 1976), y la aproximación de Gauss (GAU) utilizada
por (Schagen 1979) es una variante popular del TPS. Por último, (Mitás̆ &
Mitás̆ová 1988, Mitás̆ová & Hofierka 1993, Mitás̆ová & Mitás̆ 1993) desarrollan
la formulación de la spline con tensión (spline with tensión, ST), e implemen-
tan un algoritmo de segmentación con un tamaño flexible de la superposición
del vecindario.
En Lloyd (2010) se muestra como las funciones splines caso capa delgada
son muy relevantes en la predicción espacial, a su vez se asocia al método
kriging universal; los resultados allı́ son utilizados adicionándole la tendencia
desde el enfoque de los métodos basados en distancias. Además, los splines son
utilizados en el modelamiento de la función de covarianza y de semivarianza,
tal como se indica en el trabajo desarrollado por Garcı́a-Soidán et al. (2012).
En este trabajo aplican la técnica de las series de Fourier para estimar la
función de covarianza de un proceso aleatorio estacionario de segundo orden, se
menciona el trabajo en la estimación de la covarianza no paramétrica empı́rica
desarrollada por Cressie (1993) y el estimador de tipo kernel propuesto en Hall
& Patil (1994).
Objetivos Generales
Objetivos Especı́ficos
13
14 OBJETIVOS
1.1 Introducción
contemplan una serie de pasos (Isaaks & Srisvastava 1989), que van desde el
análisis estructural, el cual se realiza en el análisis del variograma (Samper
& Carrera 1993), obteniendo en lo posible un modelo de variograma teórico
(esférico, exponencial, gaussiano, circular o de Matérn, entre otros que están
disponibles), el cual es usado en la interpolación de la variable en los sitios no
muestreados.
Var(Z(s)) = C(0) = σ 2 , ∀s ∈ D,
1.2 Análisis geoestadı́stico tradicional 19
1.2.2 El covariograma
1.2.3 El variograma
Una condición necesaria que debe cumplir el variograma es que debe ser
una función condicionalmente definida negativa, esto es,
n X
X n
ϕi ϕj 2γ(si − sj ) ≤ 0 (1.4)
i=1 j=1
2γ(h)
lim =0
h→∞ h2
1.2.4 El correlograma
C(h)
ρ(h) =
C(0)
donde N (h) denota todos aquellos pares (si , sj ) para los que si − sj = h y
|N (h)| denota el cardinal de N (h). Obsérvese que no es necesario estimar la
media µ del proceso.
Debido a que (1.5) es esencialmente una media muestral, tiene todas las
desventajas asociadas comúnmente a este tipo de estimadores como la no ro-
bustez. Se trata de un estimador no paramétrico que es óptimo cuando se
dispone de una malla regular de muestreo que sea representativa y la dis-
tribución es normal. No obstante, en la práctica el empleo de este estimador
26 Capı́tulo 1. Conceptos básicos del análisis de datos geoestadı́sticos
n
1
P
donde Ẑ = n
Z(si ) es un estimador de la media µ del proceso y N (h) se
i=1
define como antes.
2.0
con Efecto pepita
1.5
c0 si h > 0
Variograma
1.0
γ(h) =
0.5
0 si h = 0
0.0
0.0 0.2 0.4 0.6 0.8 1.0
Distancia
1.0
0.8
Variograma
h
c0 + cs si 0 ≤ h ≤ al
0.6
al
γ(h) =
meseta
0.4
Lineal
c + c si h > al
0.2
0 s
0.0
0.0 0.2 0.4 0.6 0.8 1.0
Distancia
1.0
0 si h = 0
0.8
Variograma
Esférico
0.6
3 h 1 h 3
γ(h) = c0 + cs 2 ( as ) − 2 ( as ) si 0 ≤ h ≤ as
0.4
0.2
c + c si h > as
0 s
0.0
0.0 0.2 0.4 0.6 0.8 1.0
Distancia
Exponencial
1.0
0.8
c0 + cs 1 − exp(−3h/ae )
Variograma
si h > 0
0.6
γ(h) =
0.4
0 si h=0
0.2
0.0
0.8
c0 + cs 1 − exp(−3h2 /ag 2 )
Variograma
si h>0
0.6
γ(h) =
0.4
0 si h=0
0.2
0.0
0 si h=0
1.0
0.8
c0 + cs 1 − 2 cos−1 ( h )−
Variograma
Circular
0.6
π ac
γ(h) =
0.4
q
2h h
πa (1 − a )
2 si 0 ≤ h ≤ ac
0.2
c c
0.0
c0 + cs si h > ac
0.0 0.2 0.4 0.6 0.8 1.0
Distancia
1.5
Efecto agu-
1.0
sin(h)
Variograma
c0 + cs 1 − si h>0
h
γ(h) =
0.5
0 si h = 0
jero
0.0
2.0
con Efecto pepita
1.5
Covariograma
0 si h > 0
1.0
C(h) =
0.5
c si h = 0
0
0.0
0.0 0.2 0.4 0.6 0.8 1.0
Distancia
1.0
0.8
Covariograma
h
cs 1 −
si 0 ≤ h ≤ al
0.6
al
C(h) =
meseta
0.4
Lineal
0 + c si h > al
0.2
s
0.0
0.0 0.2 0.4 0.6 0.8 1.0
Distancia
1.0
c + cs si h = 0
0.8
0
Covariograma
Esférico
0.6
C(h) = cs 1 − 32 ( ah ) + 12 ( ah )3
si 0 ≤ h ≤ as
0.4
s s
0.2
0 si h > as
0.0
0.0 0.2 0.4 0.6 0.8 1.0
Distancia
1.2
Exponencial
1.0
0.8
Covariograma
cs exp(−3h/ae ) si h>0
0.6
C(h) =
0.4
c + c si h=0
0 s
0.2
0.0
0.8
Covariograma
C(h) =
0.4
c + c si h = 0
0 s
0.2
0.0
c0 + cs si h = 0
1.0
0.8
Covariograma
c1 2 cos−1 ( h )+
Circular
π ac
0.6
C(h) = q
0.4
2h h
πac (1 − ac )2 si 0 ≤ h ≤ ac
0.2
0.0
0 si h > ac
0.0 0.2 0.4 0.6 0.8 1.0
Distancia
Efecto agu-
1.0
Covariograma
cs sin(h)
si h > 0
0.5
h
γ(h) =
c + c si h = 0
jero
0 s
0.0
siendo γ̂ = [γ̂(h1 ), . . . , γ̂(hn )]0 y γ(ϑ) = [γ(h1 , ϑ), . . . , γ(hn , ϑ)]0 . Un problema
que presenta este procedimiento es que en este caso las estimaciones están
correladas y tienen varianzas diferentes.
siendo W (ϑ) una matriz diagonal cuyos elementos son las varianzas de γ̂, las
cuales pueden aproximarse bajo la hipótesis que el proceso es gaussiano y las
estimaciones son incorreladas por 2γ(hj , ϑ)2 /N (hj ), con N (hj ) el número de
1.5 Estimación de los parámetros del variograma 31
localizaciones a distancia hj . Por tanto, los pesos de (1.7) vendrán dados por
wj = N (hj )/(2γ(hj , ϑ)2 ).
En general, los tres estimadores OLS, WLS y GLS aparecen en orden cre-
ciente de eficiencia pero decreciente en simplicidad, siendo la estimación por
mı́nimos cuadrados ponderados la más utilizada en la práctica estadı́stica de-
bido a la facilidad de su implementación y a las ventajas computacionales que
presenta. No obstante, presenta inconvenientes prácticos como, por ejemplo,
depende de las estimaciones del semivariograma, son correladas, muy sensibles
a la selección de las distancias y las regiones de tolerancia utilizadas para su
cálculo.
Z s = V θ̃ + εs (1.9)
+ log(|V 0 Σ−1
ϑ V |) + (n − p)log(2π) (1.12)
+ log(|V 0 Σ−1
ϑ V |) + (n − p)log(2π) (1.13)
Se parte del problema de la predicción del proceso original Z(·) sobre una
determinada localización s0 ∈ D, esto es, de la predicción puntual sin con-
siderar error de medida y luego se generalizan los resultados obtenidos para
problemas más generales. El predictor que el kriging utiliza para la predicción
de Z(s0 ) es un predictor lineal de los datos
n
X
Ẑ(s0 ) = ϕi Z(si ) = ϕ0 Z s (1.14)
i=1
donde
n
!2 n n
!2
X X X
Z(s0 ) − ϕi Z(si )) = ϕi Z(s0 ) − ϕi Z(si )
i=1 i=1 i=1
n
!2
X
= ϕi (Z(s0 ) − Z(si ))
i=1
n X
X n
= ϕi ϕj [Z(s0 ) − Z(si )][Z(s0 ) − Z(sj )]
i=1 j=1
[Z(si ) − Z(sj )]2 =[Z(si ) − Z(s0 ) + Z(s0 ) − Z(sj )]2 = [Z(si ) − Z(s0 )]2
+ [Z(sj ) − Z(s0 )]2 − 2[Z(si ) − Z(s0 )][Z(sj ) − Z(s0 )]
36 Capı́tulo 1. Conceptos básicos del análisis de datos geoestadı́sticos
n
!2 " n X
n
#
X X
E Z(s0 ) − ϕi Z(si ) =E ϕi ϕj (Z(s0 ) − Z(si ))(Z(s0 ) − Z(sj ))
i=1 i=1 j=1
n
X X n X n
=2 ϕi E[Z(s0 ) − Z(si )]2 /2 − ϕi ϕj E[Z(si ) − Z(sj )]2 /2
i=1 i=1 j=1
la siguiente expresión
2 0 (1 − 10 Γ−1 γ)2
−1
σ̂KO (s0 ) =γ Γ γ −
10 Γ−1 1
n
X Xn X n
=2 ϕi γ(s0 − si ) − ϕi ϕj γ(si − sj ) (1.20)
i=1 i=1 j=1
(1.26)
Sea Ẑ[i] (si ) el valor predicho a partir de la validación cruzada, y sea σ̂[i] (si )
la predicción para la desviación estándar en la localización si , con estos es-
tadı́sticos se construyen los siguientes contrastes de bondad de ajuste:
n
P
donde Z̄ = Z(sj )/n
j=1
Para un modelo que provea predicciones exactas, el MPE deberı́a ser cer-
cano a cero, el RMSPE y el ASE deberı́an ser tan pequeños como sea posible
(lo cual es recomendable cuando se comparan modelos), y el RMSSPE deberı́a
ser cercana a 1. El término error de predicción es usado para las diferencias
entre la predicción y el valor observado actual. Para un modelo que provea
predicciones exactas, el MPE deberı́a ser cercano a 0 si las predicciones son
42 Capı́tulo 1. Conceptos básicos del análisis de datos geoestadı́sticos
2.1 Introducción
En los últimos años esta área ha tomado gran relevancia y viene ex-
44 Capı́tulo 2. Conceptos básicos del análisis espacio-temporal, de distancias y funciones de bases radial
básicos sobre distancias Euclidianas muy útiles para cuando se tienen variables
explicativas continuas, categóricas, binarias, e inclusive una mezcla de todas
las anteriores. Finalmente, en la Sección 2.8 se concluye este capı́tulo con una
pequeña revisión sobre funciones de base radial espacial que son extendibles
a funciones de base radial espacio-temporales y se utilizan en los siguientes
capı́tulos de este trabajo.
Estacionarias
Completamente simétricas
Separables
Una condición necesaria y suficiente para que una función C((si , ti ), (sj , tj ))
de valores reales definida sobre Rd × R sea una función de covarianza es que
sea simétrica y definida positiva, esto es,
n X
X n
ϕi ϕj C((si , ti ), (sj , tj )) ≥ 0 (2.1)
i=1 j=1
n X
X n
ϕi ϕj γ((si , ti ), (sj , tj )) ≤ 0
i=1 j=1
Sea C(·) una función definida positiva en Rd × R, el modelo métrico esta como
(Dimitrakopoulos & Luo 1994)
Este modelo de covarianza estacionaria fue introducido por Rouhani & Hall
(1989) y consiste en considerar la covarianza espacio-temporal del proceso como
la suma de las covarianzas espaciales y temporales. Este modelo esta dado por
γ(h, u) = [k2 + k1 Ct (0)]γs (h) + [k3 + k1 Cs (0)]γt (u) + k1 γs (δs )γt (δt )
p
X
µ(si , ti ) = θk fk (si , ti ), (si , ti ) ∈ Rd × R (2.4)
k=0
1 − 10 Σ−1
ϑ c
2
σ̂OK (s0 , t0 ) = C(0, 0) − ϕ0 c + 0 −1
(2.8)
1 Σϑ 1
Se supone que la media del proceso µ(s, t), aunque desconocida, es una com-
binación lineal de funciones conocidas o covariables ligadas a las localizaciones
espacio-temporales. Esto es
p
X
µ(si , ti ) = θk vk (si , ti ) = v 0 (si , ti )θ̃ (2.9)
k=0
donde v(si , ti ) es el vector formado por los valores de las p + 1 variables ex-
plicativas incluyendo el intercepto, las cuales son consideradas en la i-ésima
localización espacio-temporal, con v0 (s, t) = 1, y θ̃ es un vector de p + 1
parámetros desconocidos. Se denotara por V la matriz n × (p + 1) cuyo (i, j)-
ésimo elemento es vj (si , ti ), i = 1, . . . , n, j = 0, 1 . . . , p.
Ẑ(s0 , t0 ) = ϕ̂0 V
donde h
0 −1
i0 −1
ϕ̂0 = c + V V 0 Σ−1 0 −1
ϑ V v(s 0 , t0 ) − V Σϑ c Σϑ (2.10)
siendo Σϑ la matriz n × n cuyo (i, j)-ésimo elemento es C(si − sj , ti − tj ) y
c es el vector de dimensión n cuyo i-ésimo elemento es C(s0 − si , t0 − ti ). El
error cuadrático medio asociado a este predictor viene dado por
0 −1 0
σ̂U2 K (s0 , t0 ) =C(0, 0) − c0 Σ−1
ϑ c + v(s0 , t0 ) − V Σϑ c ×
−1
V 0 Σ−1 v(s0 , t0 ) − V 0 Σ−1
ϑ V ϑ c (2.11)
un número real δ(wi , wj ) = δij , que cumple con las siguientes propiedades
básicas:
i. δij ≥ 0.
ii. δii = 0.
i. 0 ≤ mij ≤ mii = 1.
y
p
δij = 1 − mij (2.14)
donde c1 , c2 , c3 , c4 son las frecuencias de (1, 1), (1, 0), (0, 1) y (0, 0), respec-
tivamente. Note que p = c1 + c2 + c3 + c4 . Estas similaridades pueden ser
transformadas en distancias utilizando (2.13) o (2.14).
De otro lado cuando las variables son mixtas: continuas, binarias o cuali-
tativas, entonces es adecuado utilizar la similaridad de Gower (1968) y Gower
(1971):
p1
P |vil −vjl |
1− Gl
+ c1 + ω
l=1
mij = (2.17)
p1 + (p2 − c4 ) + p3
Una vez se utiliza alguna de las anteriores distancias según los intereses del
investigador, se realiza la descomposición espectral con la finalidad de realizar
el modelo de regresión basado en distancias. En este sentido, sea An×n = (aij )
la matriz con elementos aij = −δij2 /2, y sea B = HAH donde H = I − n1 110
es la matriz centrada, con I una matriz identidad n × n y 1 un vector de unos
n × 1. Además, B es una matriz semidefinida positiva (Mardia et al. 2002) de
rango k, entonces la matriz X de coordenadas principales se puede obtener a
partir de la siguiente descomposición espectral
B = HAH = U ΛU 0 = XX 0 (2.18)
Z = β0 1 + Xβ + e (2.19)
k
X
Z = β0 1 + βi Xi + e (2.20)
i=1
podrı́a haber perdido una variable predictiva importante (véase Cuadras &
Fortiana (1993) para una discusión de este problema).
donde k ∗ es tal que 1 − c(i) esté muy próximo a 0. Esto es, el corte en k ∗
es tal que, a la derecha de k ∗ el gráfico está muy próximo al eje horizontal,
indicando que las dimensiones superiores no deben ser tenidas en cuenta. La
dimensión principal 1 ≤ i ≤ k ∗ debe ser seleccionada si se aprecia una caı́da
entre el punto (i − 1, 1 − c(i − 1)) y el (i, 1 − c(i − 1)). Entonces la dimensión
i es aceptada o rechazada según si ri2 o λi sean grandes o pequeños.
En esta sección se realiza un breve estudio teórico sobre las funciones de base
radial aplicadas al problema de interpolación espacial.
Una variante de la TPS que usa la función base spline regularizada, se deno-
mina CRS y viene dada por
∞
X (−1)k (η · δ)2k
φ(δ) = − = ln(η · δ/2)2 + E1 (η · δ/2)2 + CE
k=1
k!k
Una de las funciones de base radial más popular, junto con la TPS, es la
Gaussiana. Schagen (1979) fue el primero en usar la Gaussiana como función
de base radial. Esta función esta dada por
2
φ(δ) = e−ηδ
3.1 Introducción
donde v(si ) = (v1 (si ), . . . , vp (si ))0 es un vector que contiene variables explica-
tivas asociadas a la localización espacial si , θ0 es el parámetro desconocido
asociado al intercepto y θ = (θ1 , . . . , θp )0 es un vector de parámetros descono-
cidos.
Z s = 1θ0 + V θ + εs (3.3)
B = HAH = U ΛU 0 = XX 0
Z s = 1β0 + Xβ + εs (3.4)
r(Z s , X1 ) > · · · > r(Z s , Xk ) > r(Z s , Xk+1 ) > · · · > r(Z s , Xn−1 ) (3.5)
n
Z 0s Xi Xi0 Z s
donde r2 (Z s , Xi ) =
P
n 2
, i = 1, . . . , n − 1, con Z̄ = Z(sj )/n.
[Z(sj )−Z̄ ]
P
λi j=1
j=1
β̂i p
ti = λi (n − k − 1), i = 1, . . . , n − 1 (3.6)
kZ s − β̂0 1 − X β̂k2
donde β̂0 = Z̄, β̂ = Λ−1 X 0 Z s y β̂i es la i-ésima componente de β̂. Ası́, ti sigue
una distribución t-student con (n − k − 1) grados de libertad.
i
rj2 λj
P
j=1
c(0) = 0, c(i) = n−1
i = 1, . . . , n − 1 (3.7)
rj2 λj
P
j=1
1 X
γ̂(h) = [ε̂(si ) − ε̂(sj )]2
2N (h)
N (h)
donde ϕr ∈ R, r = 1, . . . , n.
Por lo tanto, supóngase que un nuevo individuo (n+1) es observado con sus
respectivas variables explicativas mixtas, es decir v(s0 ) = (v1 (s0 ), . . . , vp (s0 ))0
es conocido. Entonces, las distancias entre el nuevo individuo y cada uno de
los individuos involucrados en el modelo propuesto en (3.2) se pueden calcular
como δ0i = δ (v(s0 ), v(si )), i = 1, . . . , n. A partir de estas distancias, se
puede hacer una predicción usando un resultado de Gower (1971) y Cuadras
2 2 0
& Arenas (1990), que relaciona el vector δ 0 = (δ01 , . . . , δ0n ) de cuadrados
de las distancias con el vector x(s0 ) = (x1 (s0 ), . . . , xk (s0 ))0 de coordenadas
principales asociado al nuevo individuo mediante la expresión
2
δ0i = [x(s0 ) − x(si )]0 [x(s0 ) − x(si )]
Pn
donde el vector de coeficientes ϕ = (ϕ1 , . . . , ϕn )0 satisface que i=1 ϕi = 1.
Este predictor cumple la condición de insesgamiento, la cual esta dada por la
siguiente expresión
E Ẑ(s0 ) = E(ϕ0 Z s ) = ϕ0 E(Z s ) = ϕ0 X β̃ = E (Z(s0 ))
donde x(s0 ) = (1, x0 (s0 ))0 = (1, x1 (s0 ), . . . , xk (s0 ))0 es un vector formado
por 1 y las coordenadas principales del nuevo individuo x(s0 ), con x(s0 ) =
(x1 (s0 ), . . . , xk (s0 ))0 . A partir de (3.11) se tiene ϕ0 X = x0 (s0 ). La
condición (3.11) garantiza que el predictor sea insesgado y de mı́nima vari-
anza (Cressie 1993).
donde Σϑ es una matriz n×n cuyo (i, j)-ésimo término es C (ε(si ), ε(sj )), σ 2 =
C(0) y c es un vector de dimensión n cuyo i-ésimo elemento es C (ε(s0 ), ε(sj )).
En cada uno de los escenarios y con las simulaciones realizadas, los modelos
teóricos fueron ajustados a los variogramas experimentales mediante máxima
3.3 Estudio de simulación y discusión 83
De acuerdo con la Tabla 3.2 y las Figuras 3.2 y 3.3, el método DBUK
es mejor que el método UK porque bajo τ12 = 0 y τ22 = 1, los promedios de
RMSPE son 13.7% y 14.6%, respectivamente, mayores en UK que en DBUK.
84 Capı́tulo 3. Modelo DB para la predicción espacial con tendencia
Tabla 3.2: Promedios de RMSPEs bajo los métodos UK y DBUK para los escena-
rios presentados en la Tabla 3.1 en el Caso 1 (sin omisión de variable)
Modelos de variograma
Parámetros Exponencial Matérn Gaussiano Esférico
del modelo (κ = 1.5)
τ2 σ2 φ n UK DBUK UK DBUK UK DBUK UK DBUK
1 5 9 14 19 24 29 34 39 44 49 54 59 64 69 74 79 84 89 94
1 5 9 14 19 24 29 34 39 44 49 54 59 64 69 74 79 84 89 94
1 5 9 14 19 24 29 34 39 44 49 54 59 64 69 74 79 84 89 94
1 5 9 14 19 24 29 34 39 44 49 54 59 64 69 74 79 84 89 94
Tabla 3.3: Promedios de RMSPEs bajo los métodos UK y DBUK para los escena-
rios presentados en la Tabla 3.1 en el Caso 2 (con una variable omitida)
Modelos de variograma
Parámetros Exponencial Matérn Gaussiano Esférico
del modelo (κ = 1.5)
τ2 σ2 φ n UK DBUK UK DBUK UK DBUK UK DBUK
3.4 Aplicaciones
1 5 9 14 19 24 29 34 39 44 49 54 59 64 69 74 79 84 89 94
1 5 9 14 19 24 29 34 39 44 49 54 59 64 69 74 79 84 89 94
1 5 9 14 19 24 29 34 39 44 49 54 59 64 69 74 79 84 89 94
1 5 9 14 19 24 29 34 39 44 49 54 59 64 69 74 79 84 89 94
nales, y el segundo, DBUK usando (3.4) con las coordenadas principales gene-
radas a partir de las variables mixtas. En el último método, tal como se hizo
en el proceso de simulación, se emplea el criterio (3.5) para hacer la primera
3.4 Aplicaciones 89
45 135 45 135
+ +
8
var1 12 var1 12
6
+ ++
2e+05 10 2e+05 10
+ +++ ++
8 + 8
6 ++ + +
+ +
1e+05 ++ 1e+05 +
semivariance
semivariance
+ ++ +
+ ++ + + ++ + ++
6
+ + 6 + +
++ + +
dy
dy
0e+00 4 0e+00
++ +++ +
4 + ++++ 4 4
−1e+05 ++ −1e+05
2 2 ++
−2e+05 + −2e+05 +
2 0
0 2
−2e+05 0e+00 2e+05 −2e+05 0e+00 2e+05
dx dx
distance distance
resultados que WLS1, con M SE = 1.035 para los residuos en el modelo clásico,
y M SE = 0.797 para los residuos en DB (ver Figura 3.8).
10
10
8
8
Semivariance
Semivariance
6
6
4
4
2
2
Distance Distance
(a) Regresión lineal cuadrática (método clásico) (b) Regresión lineal (método DB)
Figura 3.8: Variograma experimental de media recortada para los residuos, ajus-
tando un modelo de Matérn por WLS, OLS y REML
Una vez que los variogramas fueron definidos, estos fueron utilizados en el
krigeado para la generación de los mapas de predicciones de la temperatura
media terrestre y de las varianzas de los errores predichos. En el caso DBUK, se
consideraron las coordenadas principales de la muestra y los puntos adicionales
generados por el sistema de coordenadas original (wx y wy ). Posteriormente,
se calcularon las predicciones teniendo en cuenta el sistema de coordenadas
originales y los resultados obtenidos se presentan en la Figura 3.9, en cual se
observa una alta coincidencia entre los métodos UK y DBUK.
Figura 3.10: Mapas de predicción de las varianzas del error para la temperatura
media diaria terrestre en Croacia
métodos, se dejan fijos los valores empı́ricos de los parámetros asociados a los
modelos de variograma.
5800
5600
R1
R2
5400
Y Coord
5200
R3
5000
4800
X Coord
Figura 3.11: Gráfica de circulo de contenido de calcio con las lı́neas que delimitan
las sub-regiones (lugares de muestreo)
La Tabla 3.4 contiene los valores de los parámetros ajustados del vario-
grama esférico y dos veces el log de la verosimilitud (2 log L), tanto para el
método propuesto (DB) como para el método clásico. En el caso de DB, las
coordenadas principales se construyeron utilizando las variables: coordenadas
espaciales y la variable nominal que define la sub-región (la altitud no es con-
siderada, al no existir información en los puntos no muestreados, esto con el
fin de producir el mapa que se muestra más adelante). Los resultados presen-
tados en la Tabla 3.4(a) muestran un aumento constante en 2 log L cuando se
incrementa el número de coordenadas principales. Hay un aumento significa-
tivo en 2 log L ya que va desde -1272.03 hasta -1178.80 cuando el número de
coordenadas principales va de 0 a 18. La Tabla 3.4(b) muestra los valores de
2 log L en el caso clásico; es claro que 2 log L aumenta cuando se considera la
96 Capı́tulo 3. Modelo DB para la predicción espacial con tendencia
Tabla 3.4: Comparación entre los métodos DB y clásico con los valores de
los parámetros ajustados del variograma esférico utilizando máxima
verosimilitud
(a) Método DB
Número de coordenadas principales
τ2 σ2 φ 2logL
con remoción tendencia DB
α0 23.23 111.69 244.90 -1272.03
2 0 87.08 107.65 -1260.00
4 0 80.56 102.50 -1253.61
8 0 67.48 89.39 -1236.01
17 0 51.29 83.11 -1193.20
18 0 46.98 81.52 -1178.80
Figura 3.13. En esta, se observa que hay una reducción en las desviaciones
estándar en el método DBUK con respecto al método UK. Los resultados de la
validación cruzada se muestran en la Tabla 3.5, en donde se resalta un aumento
98 Capı́tulo 3. Modelo DB para la predicción espacial con tendencia
de alrededor del 10% del método DBUK propuesto sobre el método UK clásico.
UK DBUK DBUK-UK
RMSPE 7.734 7.011 -0.723
R2 0.510 0.566 0.056
4.1 Introducción
métodos locales.
o en forma matricial,
g s = Fs ν s + Φ s ω s (4.2)
n
X Z
2
[Z(si ) − g(si ))] + ρ Jm (g(s))ds (4.3)
i=1 R2
L(ν s , ω s ) =(Z s − Fs ν s − Φs ω s )0 (Z s − Fs ν s − Φs ω s ) + ρω 0s Φs ω s
=Z 0s Z s − 2Z 0s Fs ν s − 2Z 0s Φs ω s + ν 0s Fs0 Fs ν s + 2ω 0s Φ0s Fs ν s
+ ω 0s Φ0s Φs ω s + ρω 0s Φs ω s
se encuentra que
∂L(ν s , ω s )
= −2Fs0 Z s + 2Fs0 Fs ν s + 2Fs0 Φs ω s =0
∂ν s
Fs ν s + Φs ω s =Z s (4.4)
∂L(ν s , ω s )
= −2Φ0s Z s + 2Φ0s Fs ν s + 2Φ0s Φs ω s + 2ρΦ0s ω s =0
∂ω s
Fs ν s + (Φs + ρI)ω s =Z s (4.5)
Noté aquı́ que si Φs es definida positiva entonces hay unicidad de los coe-
ficientes en el interpolador ĝ(si ). Con el fin de generalizar los interpoladores,
es necesario considerar las formas más generales de las matrices definidas po-
sitivas.
Fs ν s + Φs (Φs + ρI)−1 (Z s − Fs ν s ) =Z s
I − Φs (Φs + ρI)−1 Fs ν s = I − Φs (Φs + ρI)−1 Z s
(4.7)
Observe que
−1
1
I − Φs (Φs + ρI)−1 = = ρ(Φs + ρI)−1
I + Φs (4.8)
ρ
4.2 Modelo geoestadı́stico basado en distancias con funciones de base radial 105
Fs0 ν s = 0
Una vez se han estimado los parámetros ν s y ω s , se pueden discutir las técnicas
espaciales para predecir el valor de un campo aleatorio en una nueva loca-
lización espacial, s0 , a partir de las observaciones cercanas, y en donde se
106 Capı́tulo 4. Modelo DB para la predicción espacial utilizando RBF
ln(η · δ/2)2 + E1 (η · δ/2)2 + CE si δ 6= 0, η > 0
φ(δ) =
0 si δ = 0
CRS
donde ln es el logaritmo natural, E1 (x) es la función integral exponencial
y CE es la constante de Euler.
ln(η · δ/2) + K0 (η · δ) + CE si δ 6= 0
φ(δ) =
0 si δ = 0
ST
donde K0 (x) es la función modificada de Bessel y CE es la constante de
Euler.
Por lo tanto, al igual que en la Sección 3.2, supóngase que un nuevo in-
dividuo (n + 1) es observado con sus respectivas variables explicativas mix-
tas, es decir v(s0 ) = (v1 (s0 ), . . . , vp (s0 ))0 es conocido. Entonces, las distan-
cias entre el nuevo individuo y cada uno de los individuos involucrados en
el modelo propuesto en (3.2) se pueden calcular como δ0i = δ (v(s0 ), v(si )),
i = 1, . . . , n. A partir de estas distancias, se puede hacer una predicción
usando un resultado de Gower (1971) y Cuadras & Arenas (1990), que rela-
2 2 0
ciona el vector δ 0 = (δ01 , . . . , δ0n ) de cuadrados de las distancias con el vector
x(s0 ) = (x1 (s0 ), . . . , xk (s0 ))0 de coordenadas principales asociado al nuevo in-
4.2 Modelo geoestadı́stico basado en distancias con funciones de base radial 107
2
δ0i = [x(s0 ) − x(si )]0 [x(s0 ) − x(si )]
sujeto a la condición
n
X
ϕi fl (si ) = ϕ0s f s = fl (s0 ), l = 0, . . . , k
i=1
2
y el error cuadrático medio de la predicción del krigeado, σK , al utilizar la
aproximación con funciones de base radial esta dado por
h i2
2
σK (s0 ) =E Ẑ(s0 ) − Z(s0 )
n X
n n
∼
X X
=− ϕi ϕj φ(si − sj ) + 2 ϕi φ(si − s0 )
i=1 j=1 i=1
∼
= − ϕ0s Φs ϕs + 2ϕ0s φ0 (4.12)
X n
n X n
X Z
l(ϕs , αs ) = ϕi ϕj φ(si − sj ) − 2 ϕi φ(si − s0 ) + ρ Jm (g(s))ds
i=1 j=1 i=1 R2
k n
!
X X
+2 αl ϕi fl (si ) − fl (s0 )
l=0 i=1
Por otro lado, para obtener una expresión aproximada del error cuadrático
de la predicción, se premultiplica la parte superior de (4.13) por ϕ0s y se en-
cuentra que ϕ0s (Φs + ρI)ϕs + ϕ0s Fs αs = ϕ0s φ0 , éste término se reemplaza en la
expresión (4.12) y se llega a
2
σK (s0 ) ∼
= − ϕ0s Φs ϕs + 2ϕ0s φ0
∼
= − ϕ0s φ0 + ρϕ0s ϕs + ϕ0s Fs αs + 2ϕ0s φ0
∼
=ϕ0s φ0 + ρϕ0s ϕs + f 0s (s0 )αs
n n k
∼
X X X
2
σ
bK (s0 ) = bi φ(si − s0 ) + ρ
ϕ b2i
ϕ + α
bl fl (s0 ) (4.15)
i=1 i=1 l=0
Tabla 4.3: Escenarios espaciales simulados (los números naturales en las últimas
cinco columnas (de 1 a 120) representan el número del escenario)
Para cada conjunto de datos simulados, se evaluó la calidad del ajuste me-
diante el RMSPE obtenido por el método LOOCV. Los resultados se presentan
en las Tablas 4.4 y 4.5. Inicialmente se consideró un parámetro positivo para
ρ, pero los valores de RMSPE no mostraron diferencias significativas con los
obtenidos cuando ρ = 0; en particular, cuando fueron utilizadas las funciones
112 Capı́tulo 4. Modelo DB para la predicción espacial utilizando RBF
Las Tablas 4.4 y 4.5 muestran los valores promedios de RMSPE para los
120 casos descritos en la Tabla 4.3 en 100 simulaciones por caso. El método
DBSIRBF funciona bien para vecindarios grandes, lo que indica una ganancia
(vista en un decrecimiento) de 70% de los valores promedios de RMSPE cuando
nh = 32 con respecto a nh = 8. Sin embargo, cuando j = 3 los valores
promedios de RMSPE fueron 1.92 veces mayores que los obtenidos cuando
j = 1. Al tener en cuenta el parámetro η, en general se presenta una ligera
reducción de 4.8% en los valores promedios de RMSPE cuando η = 0.01,
comparado con η = 0.1.
Por otro lado, analizando las formas genéricas, los valores más bajos de
4.3 Estudio de simulación y discusión 113
4
6
8
10
4
6
8
10
3
4
5
6
7
8
9
4
6
8
10
12
4
6
8
10
12
14
16
97 73 49 25 1
98 74 50 26 2
99 75 51 27 3
103 79 55 31 7
104 80 56 32 8
105 81 57 33 9
109 85 61 37 13
110 86 62 38 14
111 87 63 39 15
115 91 67 43 19
Nivel de ruido
116 92 68 44 20
117 93 69 45 21
0
20
40
60
80
0
20
40
60
80
0
20
40
60
80
0
20
40
60
80
0
20
40
60
80
97 73 49 25 1
98 74 50 26 2
99 75 51 27 3
103 79 55 31 7
104 80 56 32 8
105 81 57 33 9
109 85 61 37 13
110 86 62 38 14
111 87 63 39 15
115 91 67 43 19
116 92 68 44 20
Función de diseño
117 93 69 45 21
0
50
100
150
200
0
50
100
150
200
0
50
100
150
200
0
50
100
150
200
0
50
100
150
200
97 73 49 25 1
98 74 50 26 2
99 75 51 27 3
103 79 55 31 7
104 80 56 32 8
105 81 57 33 9
109 85 61 37 13
4.3 Estudio de simulación y discusión
110 86 62 38 14
111 87 63 39 15
115 91 67 43 19
116 92 68 44 20
Variación espacial
117 93 69 45 21
2
4
6
8
10
12
14
4
6
8
10
12
14
16
5
10
15
4
6
8
10
12
14
5
10
15
20
97 73 49 25 1
98 74 50 26 2
99 75 51 27 3
103 79 55 31 7
104 80 56 32 8
105 81 57 33 9
109 85 61 37 13
110 86 62 38 14
111 87 63 39 15
115 91 67 43 19
116 92 68 44
115
20
1.8
1.9
2.0
2.1
1.6
1.8
2.0
2.2
2.4
2.6
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.5
3.0
3.5
2
4
6
8
10
12
100 76 52 28 4
101 77 53 29 5
102 78 54 30 6
106 82 58 34 10
107 83 59 35 11
108 84 60 36 12
112 88 64 40 16
113 89 65 41 17
114 90 66 42 18
118 94 70 46 22
Nivel de ruido
119 95 71 47 23
Capı́tulo 4.
120 96 72 48 24
1.60
1.65
1.70
1.75
1.80
1.85
1.90
1.6
1.8
2.0
2.2
2.4
2.6
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.5
3.0
3.5
2
4
6
8
10
100 76 52 28 4
101 77 53 29 5
102 78 54 30 6
106 82 58 34 10
107 83 59 35 11
108 84 60 36 12
112 88 64 40 16
113 89 65 41 17
114 90 66 42 18
118 94 70 46 22
119 95 71 47 23
Función de diseño
120 96 72 48 24
1.7
1.8
1.9
2.0
2.1
2.2
1.6
1.8
2.0
2.2
2.4
2.6
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.0
2.5
3.0
3.5
2
4
6
8
10
100 76 52 28 4
101 77 53 29 5
102 78 54 30 6
106 82 58 34 10
107 83 59 35 11
108 84 60 36 12
112 88 64 40 16
113 89 65 41 17
114 90 66 42 18
118 94 70 46 22
119 95 71 47 23
Variación espacial
120 96 72 48 24
1.8
1.9
2.0
2.1
2.2
1.6
1.8
2.0
2.2
2.4
2.6
2.8
1.4
1.6
1.8
2.0
2.2
2.5
3.0
3.5
2
4
6
8
10
12
100 76 52 28 4
101 77 53 29 5
102 78 54 30 6
Modelo DB para la predicción espacial utilizando RBF
106 82 58 34 10
107 83 59 35 11
108 84 60 36 12
112 88 64 40 16
113 89 65 41 17
114 90 66 42 18
118 94 70 46 22
119 95 71 47 23
4.4 Aplicación
Optimización
RBF optim bobyqa
η RMSPE η ρ iter RMSPE
EXP 0.03 7.32 0.03 0.00 234 7.32
MQ 0.00 7.38 0.00 0.00 19 7.38
IM 27.36 7.30 27.36 0.00 45 7.30
TPS 0.81 7.62 0.20 1.24 23 7.61
CRS 0.10 7.33 0.30 2.38 31 7.33
ST 0.08 7.34 0.58 2.04 34 7.33
GAU 0.20 8.01 0.20 1.00 28 8.01
se observa que las funciones de base radial que mejor trabajan en el método
propuesto son la EXP y la CRS mostrando los valores de RMSPE más bajos.
Como detalle práctico, las funciones de optimización usadas para ρ y η fueron
“bobyqa” del paquete “minqa” y “optim” del paquete “stats” del programa R
Development Core Team (2012), dependiendo del método que proporcionara
resultados más estables. Esta información también se muestra en la Tabla 4.6.
Los mapas de predicción correspondientes se muestran en la Figura 4.3(b)-(h).
4.4 Aplicación 119
5800
5600
R1
R2
5400
Y Coord
5200
R3
5000
4800
X Coord
5.1 Introducción
Por otro lado, las funciones de base radial tales como la multicuadrática o
spline completamente regularizado son útiles en la construcción de modelos di-
gitales de elevación (DEM), como se muestra en (Mitás̆ová & Hofierka 1993).
Una variación de la función multicuadrática se llama la multicuadrática in-
versa, introducida por (Hardy & Gopfert 1975). En Späh (1969) se describe
un método que permite evitar puntos de inflexión y contiene splines cúbicos
como un caso especial, utilizando interpolación spline cúbica y exponencial.
Más tarde, la spline capa delgada se introdujo en el diseño geométrico por
(Duchon 1976) y la aproximación Gaussiana utilizada por (Schagen 1979)
se presenta como una variante popular de la TPS. Por último, (Mitás̆ &
Mitás̆ová 1988, Mitás̆ová & Hofierka 1993, Mitás̆ová & Mitás̆ 1993) desarro-
llan la formulación del spline con tensión e implementan un algoritmo de seg-
mentación con un tamaño flexible en la superposición del vecindario.
donde v(si , ti ) = (v1 (si , ti ), . . . , vp (si , ti ))0 es un vector que contiene varia-
bles explicativas asociadas a la localización espacio-temporal (si , ti ), θ0 es el
parámetro desconocido asociado al intercepto y θ = (θ1 , . . . , θp )0 es un vector
de parámetros desconocidos.
Pp
o alternativamente por la distancia absoluta δij2 = vl (si , ti ) − vl (sj , tj ).
l=1
Entonces, en el caso de sólo disponer información de las coordenadas espacio-
temporales, (wx , wy , t), las distancias espacio-temporales estarán dadas por
q
δij = (wxi − wxj )2 + (wyi − wyj )2 + (ti − tj )2
k
X n
X
g(si , ti ) = νl Xl (si , ti ) + ωj φ(si − sj , ti − tj ), i = 1, . . . , n
l=0 j=1
5.2 Modelo espacio-temporal basado en distancias con tendencia lineal local 127
o en forma matricial,
g st = X st ν st + Φst ω st (5.5)
donde Pst es el espacio que genera Φst y kPst ĝst k2 = hPst ĝst , Pst ĝst i =
ω 0st q st q 0st ω st = ω 0st Φst ω st con Φst = q st q 0st . Por lo tanto,
Noté aquı́ que si Φst es definida positiva entonces hay unicidad de los coe-
ficientes en el interpolador ĝ(si , ti ). El problema es cómo construir una forma
funcional φ(si , ti ) con la condición apropiada de definida positiva. Con el fin de
generalizar los interpoladores, es necesario considerar las formas más generales
de las matrices definidas positivas.
Definición 5.1. Sean 1, X1 , . . . , Xk funciones linealmente independientes de
valor-real definidas sobre Rd × R y sea Φst una matriz simétrica real. Luego,
Φst es definida positiva con respecto a 1, X1 , . . . , Xk si y sólo si para todos los
n P
n
conjuntos de puntos (s1 , t1 ), . . . , (sn , tn ) en Rd ×R se tiene que
P
qi qj φ(si −
i=1j=1
sj , ti − tj ) ≥ 0 para todo qi (i = 1, . . . , n), donde qi es un escalar (no todos
Pn
cero), y tales que Xl (sj )qj = 0 para l = 1, . . . , k.
j=1
Observe que
−1
1
I − Φst (Φst + ρI)−1 = = ρ(Φst + ρI)−1
I + Φst (5.11)
ρ
5.2 Modelo espacio-temporal basado en distancias con tendencia lineal local 129
X 0st ν st = 0
Proposición 5.1. Sea Φst +ρI definida positiva y todos los conjuntos de puntos
(s1 , t1 ), . . . , (sn , tn ) en Rd × R, luego la matriz
!
Φst + ρI X st
X 0st 0
es no singular.
lo cual implica que U10 (Φst + ρI)U1 + U10 X st U2 = U10 (Φst + ρI)U1 = 0 lo cual
contradice el carácter de definido positivo de (Φst + ρI) a menos que U1 sea
un vector cero. Si U1 es el vector cero, entonces (Φst + ρI)U1 = 0 y de
aquı́, (Φst + ρI)U1 + X 0st U2 = X 0st U2 = 0, pero las funciones matriciales
escalares (X st esta asociada a la tendencia) son linealmente independientes, y
ası́, X 0st U2 = 0 implica que U2 = 0. Dado que U1 y U2 son vectores cero, la
matriz original debe ser no singular.
2
donde δst = q12 δs2 + q22 δt2 , q1 , q2 ∈ R son las constantes que definen la métrica
espacio-temporal, δs y δt son las usuales distancias Euclidianas en espacio y
tiempo, respectivamente. Este modelo supone la misma estructura de depen-
dencia en el espacio y el tiempo, y sólo permitir cambios en el rango de las
dos funciones de covarianza. Algunas aplicaciones de este modelo se pueden
encontrar en Armstrong & Hubert (1993) y Snepvangers & Huisman (2003).
ln(η · δst /2)2 + E1 (η · δst /2)2 + CE si δst 6= 0, η > 0
φ(δst ) =
CRS 0 si δst = 0
sujeto a
n
X
ϕi xl (si , ti ) = ϕ0st Xl = xl (s0 , t0 ), l = 0, . . . , k
i=1
donde ϕst = (ϕ1 , . . . , ϕn )0 , Z st = (Z(s1 , t1 ), . . . , Z(sn , tn ))0 y Xl = (xl (s1 , t1 ),
. . . , xl (sn , tn )).
∼
=ϕ0st Φst ϕst − 2ϕ0st φ0 (5.17)
5.2 Modelo espacio-temporal basado en distancias con tendencia lineal local 133
l(ϕst , αst ) = ϕ0st (Φst + ρI) ϕst − 2ϕ0st φ0 + 2α0st (X 0st ϕst − x(s0 , t0 ))
Resolviendo el sistema, los coeficientes para ϕst y αst están dadas por
−1
b 0st ={φ0 + X st X 0st (Φst + ρI)−1 X st
ϕ [x(s0 , t0 )
− X 0st (Φst + ρI)−1 φ0 ]}0 (Φst + ρI)−1 (5.19)
−1
b st = − X 0st (Φst + ρI)−1 X st x(s0 , t0 ) − X 0st (Φst + ρI)−1 φ0
α
Por otro lado, para obtener una expresión aproximada del error cuadrático
de la predicción, se premultiplica la parte superior de (5.18) por ϕ0s y se en-
cuentra que ϕ0st (Φst + ρI)ϕst + ϕ0st X st αst = ϕ0st φ0 , éste término se reemplaza
134 Capı́tulo 5. Modelo DB para la predicción espacio-temporal usando funciones de base radial
Una vez estimados ϕst y αst en (5.19), una expresión aproximada del error
cuadrático de la predicción estimado se puede escribir como
n n k
∼
X X X
2
σ
bK (s0 , t0 ) = bi φ(si − s0 , ti − t0 ) + ρ
ϕ b2i
ϕ + α
bl xl (s0 , t0 ) (5.20)
i=1 i=1 l=0
Para cada conjunto de datos simulados, se evaluó la calidad del ajuste con
el RMSPE obtenido mediante el método de validación cruzada (leave-one-out).
Los resultados se muestran en las Tablas 5.4 y 5.5. Inicialmente se consideró
usar un parámetro positivo para ρ, pero los valores de RMSPE no mostraron
diferencias significativas con los obtenidos cuando ρ = 0; en particular, cuando
las funciones de base radial MQ, EXP, CRS y GAU fueron utilizadas.
Las Tablas 5.4 y 5.5 muestran los valores medios de RMSPEs obtenidos
de 100 simulaciones por caso y para los 80 casos descritos en la Tabla 5.3.
El método DBSTIRBF funciona bien para vecindarios grandes, lo que indica
5.3 Estudio de simulación y discusión 137
250 1.54 1.58 1.56 1.55 1.54 1.42 1.53 1.29 1.46 1.41
150 2.55 2.54 2.55 2.55 2.55 3.43 3.56 3.56 3.56 3.55
8
250 1.75 1.74 1.74 1.74 1.74 1.67 11.77 11.85 11.77 5.03
3
150 1.59 1.78 1.44 1.61 1.57 1.48 1.72 1.35 1.54 1.46
32
250 1.54 1.58 1.55 1.55 1.54 1.44 1.53 1.38 1.48 1.44
150 2.49 2.48 2.52 2.48 2.49 2.60 8.05 8.13 8.06 2.60
8
250 1.71 1.71 1.70 1.71 1.70 1.64 1.66 2.10 1.66 1.63
1
150 1.82 1.79 1.54 1.78 1.56 1.74 1.74 1.39 1.74 1.48
32
250 1.59 1.58 1.56 1.58 1.54 1.52 1.52 25.56 1.52 1.41
0.1
150 2.55 2.54 2.58 2.54 2.55 3.45 3.56 3.64 3.56 3.45
8
250 1.75 1.74 1.74 1.74 1.74 1.92 5.69 11.84 5.69 1.92
3
150 1.82 1.79 1.52 1.78 1.57 1.72 1.72 1.44 1.72 1.46
32
250 1.59 1.58 1.56 1.58 1.53 1.53 1.53 1.49 1.53 1.44
250 1.45 1.54 1.39 1.48 1.44 1.50 1.57 1.51 1.53 1.50
150 2.55 3.35 3.34 3.34 2.94 2.60 2.59 2.60 2.59 2.60
8
250 1.88 3.05 3.04 3.04 2.02 1.80 1.81 1.81 1.81 1.81
3
150 1.55 1.85 1.37 1.64 1.53 1.56 1.76 1.44 1.60 1.55
32
250 1.52 1.64 1.41 1.57 1.51 1.50 1.57 1.51 1.53 1.50
150 3.00 3.77 3.81 3.77 3.01 2.60 2.60 2.64 2.60 2.61
8
250 1.74 1.78 1.78 1.79 1.75 1.83 1.84 1.83 1.84 1.83
1
150 1.73 1.73 1.48 1.73 1.48 1.78 1.77 1.53 1.76 1.55
32
250 1.53 1.53 1.52 1.53 1.44 1.57 1.57 1.55 1.57 1.50
0.1
150 2.57 3.36 3.42 3.35 2.56 2.59 2.59 2.62 2.59 2.59
8
250 1.94 3.04 3.17 3.05 1.95 1.81 1.81 1.80 1.81 1.80
3
150 1.83 1.84 1.52 1.84 1.52 1.78 1.77 1.53 1.76 1.55
32
250 1.64 1.64 1.58 1.64 1.51 1.57 1.57 1.55 1.57 1.49
pequeño fue el construido con la MQ, mientras que con CRS mostró una vez
más el RMSPE más alto, iii) en términos de variación espacio-temporal, el valor
promedio de RMSPE más bajo se observó con la MQ, mientras que la TPS
ha mostrado una vez los valores medios de RMSPE más altos, y iv) en el caso
función de varianza el método DBSTIRBF con mejores resultados en términos
de promedios de RMSPE fue el construido con la CRS, y otra vez, el método
DBSTIRBF construido con la función TPS muestra los peores resultados.
5.4 Aplicación
5
4.0
2.5
2.5
3.5
4
MQ
3.0
2.0
3 2.0
2.5
2.0
2
1.5 1.5
1.5
1
11
13
15
11
13
15
11
13
15
11
13
15
2.8 12
2.8
7
2.6
10
2.6
6
TPS
2.4
2.4
8
5
2.2 2.2
6
4
2.0 2.0
4 3
1.8
1.8
2
2
1.6
1.6
17
19
21
23
25
27
29
31
17
19
21
23
25
27
29
31
33
17
19
21
23
25
27
29
31
17
19
21
23
25
27
29
31
12
2.5 10
6 2.5
CRS
8
5
2.0
2.0
6 4
3
4
1.5
1.5
2
2
33
35
37
39
41
43
45
47
35
37
39
41
43
45
47
33
35
37
39
41
43
45
47
33
35
37
39
41
43
45
47
2.8 12
7
2.6
10
6 2.5
2.4
8
ST
5
2.2
2.0 6 4 2.0
1.8
4 3
1.6
2
2 1.5
1.4
49
51
53
55
57
59
61
63
49
51
53
55
57
59
61
63
49
51
53
55
57
59
61
63
49
51
53
55
57
59
61
63
12
7
2.5 10 6
2.5
EXP
8 5
2.0 4
6 2.0
3
4
1.5 2 1.5
2
65
67
69
71
73
75
77
79
65
67
69
71
73
75
77
79
65
67
69
71
73
75
77
79
65
67
69
71
73
75
77
79
Figura 5.2: RMSPE para los escenarios espacio-temporales simulados con 6 tiempos
142 Capı́tulo 5. Modelo DB para la predicción espacio-temporal usando funciones de base radial
1.9 2.4
2.2
2.0
MQ
1.8 2.2
2.0
1.8
1.8
1.6
1.6
1.6
1.6
1.5
1.4 1.4
1.4
1.4
2
10
12
14
16
10
12
14
16
10
12
14
16
10
12
14
16
25 2.4
4.5
1.9
TPS
4.0
20 2.2
3.5
1.8
15 2.0
3.0
1.7
10 2.5
1.8
2.0
1.6
5
1.6
1.5
18
20
22
24
26
28
30
32
18
20
22
24
26
28
30
32
18
20
22
24
26
28
30
32
18
20
22
24
26
28
30
32
2.4
4.5
25
1.9
CRS
4.0 2.2
20
1.8 3.5
2.0
15 3.0
1.7 1.8
2.5
10
1.6
1.6
2.0
5
1.4
1.5 1.5
34
36
38
40
42
44
46
48
34
36
38
40
42
44
46
48
34
36
38
40
42
44
46
48
34
36
38
40
42
44
46
48
25 2.4
4.5
1.9
4.0
20 2.2
ST
1.8 3.5
15 2.0
3.0
1.7
2.5 1.8
10
1.6
2.0
1.6
5
1.5 1.5
1.4
50
52
54
56
58
60
62
64
50
52
54
56
58
60
62
64
50
52
54
56
58
60
62
64
50
52
54
56
58
60
62
64
2.4
4.0
1.9
EXP
10
2.2
3.5
1.8
8
2.0
3.0
1.7
6
1.8
2.5
1.6
4
2.0 1.6
1.5
2
1.5 1.4
1.4
66
68
70
72
74
76
78
80
66
68
70
72
74
76
78
80
66
68
70
72
74
76
78
80
66
68
70
72
74
76
78
80
Figura 5.3: RMSPE para los escenarios espacio-temporales simulados con 10 tiempos
5.4 Aplicación 143
la siguiente expresión
T(7am) + T(1pm) + 2 · T(9pm)
∆T =
4
Funciones geoestadı́sticas y
funciones de base radial en el
programa R: Paquete geospt
6.1 Introducción
10.39 10.65 10.36 9.58 10.66 8.92 7.8 7.84 9.03 8.6
20
9.79 9.06 10.7 11.21 8.98 9.27 8.19 7.88 7.61 8.2 8.77
10.74 12.8 10.03 9.36 8.57 9.01 9.04 7.28 9.58 9.69 9.96 9.91
11.21 9.89 10.34 8.2 9.82 10.06 8.58 8.89 8.64 7.04 8.81 7.95
9.97 9.7 9.84 10.29 9.84 10.01 9.01 7.68 9.25 7.83 9.14 7.63 9.07
15 11.17 10.14 9.93 10.27 10.21 11.09 10.63 8.82 10.18 9.34 8.61
9.92 10.82 11.65 8.96 9.88 8.9 10.18 9.34 10.56 9.06
10.21 10.73 9.46 9.35 9.78 10.38 9.79 8.91 9.22 11.43
12.5 9.63 10.82 10.12 9.4 9.48 10.99 9.92 7.85 8.21
y
9.92 11.05 10.11 11.46 10.41 8.45 8.9 8.07 7.96 7 7.9
11.31 9.41 9.37 11.21 9.93 10.7 9.27 9.28 10.13 8.61 8.78
10
11.15 9.91 10.17 10.55 11.61 9.16 10.04 11.19 8.1 11.3
10.01 8.23 11.04 10.28 13.07 10.47 11.58 9.46 8.54 10.87
5 10 15
Figura 6.1: Ubicación espacial de una muestra de cenizas de carbón (coal-ash), las
unidades están en % en ubicaciones reorientadas (Cressie, 1993)
1
que se ilustrará sobre las diferencias norte-sur de los datos de coal-ash Con-
centrados sobre la fila j de la grilla, para alguna otra fila, k por ejemplo, hay
un cierto número Njk , de diferencias de datos definidas, cuyas localizaciones
están a una distancia h =| j − k | en la dirección norte-sur. Sea Y jk la media
de estas | dif erencias |1/2 , promediadas sobre los Njk términos, y se define:
1 X
Yh = | Zi − Zj |1/2 (6.1)
| N (h) |
N (h)
Pjk = Y jk − Y h (6.2)
2
1.0
2.0
6 2 6
22 2
0.8
6 6
1.5
6 3 23 14 8 2 6 6
6
6 8
8 2
22 2
0.6
6 6 6
6 8 6 6
1.0
6 6 6
6 6 6 2 6
12 6 6 12
23 23
6 2
0.4
9 8 2 23 6
8 6 6
6 22 6 10
3
Q(jk)
P(jk)
2 22 6
0.5
2
8 2
0.2
0.0
0.0
−0.5
−0.2
−1.0
21
21 21
−0.4
21
1 3 5 7 9 11 13 15 17 19 21 23 1 3 5 7 9 11 13 15 17 19 21 23
están en (%coalash)1/2
Una modificación adicional del pocket plot serı́a graficar valores normali-
zados de Pjk , el gráfico puede ser obtenido a partir de:
( ! )
1/2 Y jk
Qjk =Njk −1 (6.3)
Yh
Función pocket.plot()
152 Capı́tulo 6. Funciones geoestadı́sticas y funciones de base radial en el programa R: Paquete geospt
library(gstat)
library(geospt)
data(coalash)
pocket.plot(coalash,"PPR",coalash$x,coalash$y,coalash$coalash, F)
library(sgeostat)
data(maas)
maas.point <- point(maas)
maas.pair <- pair(maas.point, num.lags=24, maxdist=2000)
maas.v <- est.variograms(maas.point,maas.pair,’zinc’,trim=0.1)
maas.v
data(meuse)
coordinates(meuse) <- ~x+y
m <- vgm(.59, "Sph", 874, .04)
# leave-one-out cross validation:
6.2 Implementación de funciones geoestadı́sticas en R 155
data(preci)
attach(preci)
# optimal eta
tab <- rbf.tcv(eta=0.1461, z=prec, coordinates=preci[,2:3],
n.neigh=9, func="TPS")
criterio.cv(tab)
10
8
6
4
ETA
Función Descripción
Extrae un resumen de valores estadı́sticos obtenidos de
criterio.cv()
LOOCV: M P E, ASEP E, RM SP E, M SP E, RM SSP E, R2 .
Calcula el variograma experimental: clásico, robusto, mediana,
est.variograms()
y media recortada (Cressie 1993, Bárdossy 2001)
Gráfica el pockeplot de probabilidad o varianza estandarizada
pocketplot()
en las direcciones sur-norte y este-oeste, (ver (Cressie 1993))
Extrae las predicciones a partir de las funciones: gau-
ssiana (GAU ), exponencial (EXPON ), trigonométrica (TRI )
rbf() spline capa delgada (TPS ), spline completamente regularizada
(CRS ), spline con tensión (ST ), inversa multicuadrática (IM ),
y multicuadrática (MQ)
rbf.cv() Genera un valor de RM SP E, resultado de LOOCV
Genera un valor numérico, obtenido de la función de base radial
generado a partir de; una distancia, un parámetro eta (η) de
RBF.phi()
suavizamiento, y una función ´´GAU”,´´EXPON”, ´´TRI”,
´´TPS”, ´´CRS”, ´´ST”, ´´IM” or ´´M”
Genera una tabla con las coordenadas de los datos, la
predicción, los valores observados, los residuos, la varianza de
rbf.tcv()
predicción, y el zscore (residual divido por el error estándar) de
la variable analizada, los cuales están asociados a la LOOCV
Genera un gráfico que describe el comportamiento del
graph.rbf() parámetro eta optimizado, asociado con la función de base ra-
dial
library(gstat)
library(geoR)
# Consideramos los datos "dif.IDSTA3" de la aplicación del Capı́tulo 3
Datos <- read.table(".../dif.IDSTA3.txt", header=T, sep="",dec = ",")
readShapePoly(file(".../croatia.shp")
rbf.cv(eta=0.0001, z=Datos$TEMP, coordinates=Datos[,3:4], n.neigh=15,
func="M")
1.873115
# prediction case a grid of points
pts <- spsample(croatia.shp, n=70000, type="regular")
pred.rbf <- rbf(eta=0.0001, z=Datos$TEMP, coordinates=Datos[,3:4],
newdata=pts@coords, n.neigh=15, func="M")
coordinates(pred.rbf) = c("x", "y")
6.2 Implementación de funciones geoestadı́sticas en R 159
4900000
4800000
4700000
7.1 Conclusiones
161
162 Capı́tulo 7. Conclusiones y futuras lı́neas de investigación
Por otro lado, los métodos propuestos en esta investigación con funciones
de base radial consideraron estacionariedad e isotropı́a. En los resultados pre-
7.2 Futuras lı́neas de investigación 163
laciones y datos reales, para valorar sus ventajas o desventajas con respecto a
los métodos kriging espaciales y espacio-temporales.
Referencias
165
166 REFERENCIAS
Baxter, B. (1992), The interpolation theory of radial basis functions, PhD the-
sis, Department of Applied Mathematics and Theoretical Physics, Uni-
versity of Cambridge.
Bivand, R., Pebesma, E. & Rubio, V. (2008), Applied Spatial Data Analysis
with R, Springer, New York.
Chen, C. (2007), Model selection for curve and surface fitting using generalized
degrees of freedom, PhD thesis, Institute of Statistical, National Central
University, Jhongli-Taiwan.
Chen, L., Fuentes, M. & Davis, J. M. (2006), ‘Spatial temporal statistical mo-
delling and prediction of environmental processes’, Hierarchical Modelling
for the Environmental Sciences, Oxford Univ. Press pp. 121–144.
Craven, P. & Wahba, G. (1979), ‘Smoothing noisy data with spline functions:
estimating the correct degree of smoothing by the method of generalized
cross-validation’, Numerische Mathematik 31, 377–403.
Cressie, N. (1993), Statistics for Spatial Data, Revised Edition. John Wiley &
Sons Inc., New York.
Cuadras, C. & Arenas, C. (1990), ‘A distance based regression model for pre-
diction with mixed data’, Communications in Statistics A - Theory and
Methods 19, 2261–2279.
Efron, B., Johnstone, I., Hastie, T. & Tibshirani, R. (2004), ‘Least angle
regression’, Annals of Statistics 32, 407–499.
Fan, J. & Gijbels, I. (1996), Local Polynomial Modelling and Its Applications,
Chapman and Hall, London.
Finkenstädt, B., Held, L. & Isham, V. (2006), Statistical Methods for Spatio-
Temporal Systems, Chapman & Hall/CRC Monographs on Statistics &
Applied Probability.
Gomez, M. & Hazen, K. (1970), Evaluating sulfur and ash distribution in coal
seems by statistical response surface regression analysis, Technical report,
U.S. Bureau of Mines Report RI 7377.
Hengl, T., Heuvelink Gerard, B. M., Perčec Tadić, M. & Pebesma, E. J. (2012),
‘Spatio-temporal prediction of daily temperatures using time-series of
MODIS LST images’, Theoretical and Applied Climatology 107, 1-2, 265–
277.
Hiebl, J., Auer, I., Böhm, R., Schöner, W., Maugeri, M., Lentini, G., Spinoni,
J., Brunetti, M., Nanni, T. Perčec Tadić, M., Bihari, Z., Dolinar, M.
& Müller-Westermeier, G. (2009), ‘A high-resolution 1961-1990 monthly
temperature climatology for the greater alpine region’, Meteorologische
Zeitschrift 18, 507–530.
Holland, D., Saltzman, N., Cox, L. H. & Nychka, D. (1999), Spatial predic-
tion of sulfur dioxide in the eastern United States, Technical report, In
GeoENV II - Geostatistics for Environmental Applications, 65-76, Kluwer
Academic Publ., Dordrecht.
Johnston, K., Ver, J., Krivoruchko, K. & Lucas, N. (2001), Using ArcGIS
Geostatistical Analysis, ESRI.
Joseph, V. R., Hung, Y. & Sudjianto, A. (2008), ‘Blind kriging: A new method
for developing metamodels.’, Journal of Mechanical Design 3, 31–102.
Lloyd, C. D. (2010), Local Models for Spatial Analysis, second edn, Taylor &
Francis Group, Boca Raton-Florida.
Myers, D. (1992), ‘Kriging, cokriging, radial basic functions and the role of
positive definiteness’, Computers Mathematical Application 24, 139–148.
Myers, D., De Iaco, S., Posa, D. & De Cesare, L. (2002), ‘Space-time radial
basis functions’, Computers and Mathematics with Applications 43, 539–
549.
Myers, D. & Journel, A. (1990), ‘Variograms with zonal anisotropies and non-
invertible kriging systems’, Mathematical Geology 22, 779–785.
REFERENCIAS 175
Sacks, J., Welch, W., Mitchell, T. J. & Wynn, H. P. (1989), ‘Design and
analysis of computer experiments’, Statistical Science 4, 409–423.
Santner, T., Williams, B. & Notz, W. (2003), The Design and Analysis of
Computer Experiments, Springer-Verlag, New York.
Tibshirani, R. (1996), ‘Regression shrinkage and selection via the lasso’, Royal
Statistics Society 58, 267–288.
REFERENCIAS 177
van de Kassteele, J., Stein, A., Dekkers, A. & Velders, G. (2009), ‘External
drift kriging of NOx; concentrations with dispersion model output in a
reduced air quality monitoring network’, Environmental and Ecological
Statistics 16, 321–339.
Wand, M. & Jones, M. (1995), Kernel Smoothing, Chapman and Hall, New
York.
Ye, J., Lazar, N. & Li, Y. (2011), ‘Sparse geostatistical analysis in clustering
fMRI time series’, Journal of Neuroscience Methods 199(2), 336–345.
Programación en R
180 APÉNDICE
assign("krige.u.db",
function(z, trend, ValoresPropios, coordinates, newdata, n.neigh,
modelo.cov, cov.pars){
So <- newdata
So <- as.data.frame(cbind(x=So[1],y=So[2]))
coordinates(So) <- c("x", "y")
s <- coordinates
dist.So <- spDists(So,s)
remove("newdata")
vec.orden <- order(dist.So)
dist.vec.cerca <- dist.So[vec.orden[1:n.neigh]]
m.dist.vec <- spDists(s)[vec.orden[1:n.neigh], vec.orden[1:n.neigh]]
b <- diag(tcrossprod(trend))
A.2 Funciones implementadas y utilizadas en los Capı́tulos 4 y 5 181
radial func.
assign("rbf.t",
function(eta, z, coordinates, trend, nd.trend, n.neigh, func){
if(func=="TPS") library(limSolve)
rbf.pred <- as.data.frame(matrix(NA,nrow= nrow(nd.trend), ncol=4))
colnames(rbf.pred) <- c("x","y","var1.pred","var1.var")
assign("rbf.tr",
function(eta, z, coordinates, trend, nd.trend, rho, n.neigh, func){
rbf.pred <- matrix(NA,nrow= nrow(newdata), ncol=4)
rbf.t0 <-function(eta, z, coordinates, trend, nd.trend, rho, n.neigh, func){
newdata <- nd.trend[1:2]
t.newdata <- nd.trend[-c(1,2)]
dist.newdata <- as.numeric(Dis(coordinates,newdata))
neigh.orden <- order(dist.newdata)
dist.vec.cerca <- dist.newdata[neigh.orden[1:n.neigh]]
trend <- trend[neigh.orden[1:n.neigh],]
m.dist.vec <- as.matrix(dist(coordinates[neigh.orden[1:n.neigh],]))
phi <- RBF.phi(m.dist.vec,eta,func)
PHI.Matriz <- rbind(as.matrix(cbind((phi+rho*diag(n.neigh)), 1, trend)),
as.matrix(cbind(rbind(1,t(trend)),matrix(0,ncol=(ncol(trend)+1),
nrow=(ncol(trend)+1)))))
b <- RBF.phi(dist.vec.cerca,eta,func)
PHI.Vector <- as.matrix(c(b,1,t.newdata))
W.fbr <- solve(PHI.Matriz, PHI.Vector)
RBF.pred <- W.fbr[1:n.neigh]%*%z[as.numeric(colnames(phi))]
A <- (as.matrix(cbind((phi+rho*diag(n.neigh)),1,trend))%*%solve(PHI.Matriz))
[,1:n.neigh]
#GCV<-(t((diag(nrow(A))-A)%*%z[as.numeric(colnames(phi))])%*%((diag(nrow(A))
#-A)%*%z[as.numeric(colnames(phi))])/n.neigh)/((sum(diag(diag(nrow(A))/
#n.neigh)))^2)
RBF.var <- (t((diag(nrow(A))-A)%*%z[as.numeric(colnames(phi))])%*%
((diag(nrow(A))-A)%*%z[as.numeric(colnames(phi))]))/(sum(diag(
diag(nrow(A)))))
cbind(newdata[1],newdata[2],RBF.pred,RBF.var)
}
rbf.pred <- apply(nd.trend, 1, rbf.t0, eta=eta, z=z, trend=trend,
coordinates=coordinates,rho=rho, n.neigh=n.neigh, func=func)
rbf.pred <- as.data.frame(t(rbf.pred))
names(rbf.pred) <- c("x","y","var1.pred","var1.var")
rbf.pred
}
)
184 APÉNDICE
assign("rbf.t.cvop",
function(param, z, coordinates, trend, n.neigh, func){
eta <- param[1]
rho <- param[2]
nt <- data.frame(coordinates,trend)
rbf.pred <- as.data.frame(matrix(NA,nrow= length(z), ncol=4))
colnames(rbf.pred) <- c("x","y","var1.pred","var1.var")
for(i in 1:(length(z))){
rbf.pred[i,3] <- rbf.tr(eta, z, coordinates=coordinates[-i,], trend=trend[-i,],
nd.trend=nt[i,], rho, n.neigh, func)[,3]
}
RMSPE <- sqrt(sum((rbf.pred$var1.pred-z)^2)/length(z))
RMSPE
}
)
assign("rbf.t.tcv",
function(eta, z, coordinates, trend, n.neigh, func){
nt <- data.frame(coordinates,trend)
rbf.pred <- as.data.frame(matrix(NA,nrow= length(z), ncol=8))
colnames(rbf.pred) <- c("var1.pred","var1.var","observed","residual",
A.2 Funciones implementadas y utilizadas en los Capı́tulos 4 y 5 185
"zscore","fold","x","y")
for(i in 1:(length(z))){
rbf.pred[i,1] <- rbf.t(eta=eta, z, coordinates=coordinates[-i,],
trend=trend[-i,], nd.trend=nt[i,], n.neigh, func)[,3]
rbf.pred[i,6] <- i
}
rbf.pred[,3]<- z
rbf.pred[,7:8]<-coordinates
rbf.pred[,4]<- rbf.pred[,3]-rbf.pred[,1]
rbf.pred
}
)
assign("rbf.trst",
function(eta, z, coordinates, trend, nd.trend, rho, n.neigh, func){
library(limSolve)
rbf.pred <- matrix(NA,nrow= nrow(trend), ncol=5)
rbf.t0 <-function(eta, z, coordinates, trend, nd.trend, rho, n.neigh, func){
newdata <- nd.trend[1:3]
t.newdata <- nd.trend[-c(1:3)]
dist.newdata <- as.numeric(Dis(coordinates,newdata))
vec.orden <- order(dist.newdata)
dist.vec.cerca <- dist.newdata[vec.orden[1:n.neigh]]
trend <- trend[vec.orden[1:n.neigh],]
m.dist.vec <- as.matrix(dist(coordinates[vec.orden[1:n.neigh],] ))
186 APÉNDICE
assign("rbf.st.cvop",
function(param, z, coordinates, trend, n.neigh, func){
eta <- param[1]
rho <- param[2]
nt <- data.frame(coordinates,trend)
rbf.pred <- as.data.frame(matrix(NA,nrow= length(z), ncol=5))
colnames(rbf.pred) <- c("x","y","t","var1.pred","var1.var")
for(i in 1:(length(z))){
rbf.pred[i,4] <- rbf.trst(eta, z, coordinates=coordinates[-i,],
trend=trend[-i,], nd.trend=nt[i,], rho, n.neigh, func)[,4]
}
RMSPE <- sqrt(sum((rbf.pred$var1.pred-z)^2)/length(z))
RMSPE
A.3 Programación capitulo 3 187
}
)
assign("rbf.st.tcv",
function(eta, z, coordinates, trend, rho, n.neigh, func){
nt <- data.frame(coordinates,trend)
rbf.pred <- as.data.frame(matrix(NA,nrow= length(z), ncol=9))
colnames(rbf.pred) <- c("var1.pred","var1.var","observed","residual",
"zscore","fold","x","y","t")
for(i in 1:(length(z))){
rbf.pred[i,1:2] <- rbf.trst(eta=eta, z, coordinates=coordinates[-i,],
trend=trend[-i,], nd.trend=nt[i,], rho, n.neigh, func)[,4:5]
rbf.pred[i,6] <- i
}
rbf.pred[,3]<- z
rbf.pred[,5]<- (z-mean(z))/sqrt(rbf.pred[,2])
rbf.pred[,7:9]<-coordinates
rbf.pred[,4]<- rbf.pred[,3]-rbf.pred[,1]
rbf.pred
}
)
library(gstat)
library(geoR)
library(ade4)
library(cluster)
library(rgdal)
library(splancs)
library("sp")
library("maptools")
#-------------------------------------------------------------------------
#### SIMULACIÓN 1: GRF SIN OMISIÓN DE VARIABLE, UNIVERSAL KRIGING DB ####
#-------------------------------------------------------------------------
###################################################
### CONSTRUCCION GRAFICO REGIONES ####
###################################################
par(mfrow=c(1,1), mar=c(5,5,4,4))
plot(sppo, ylim=c(0,1), xlab="x", ylab="y")
marcas <- seq(0,1,0.1)
axis(side=2, at=marcas)
axis(side=1, at=marcas, xlab = "x")
names <- unlist(lapply(slot(sppo,"polygons"), function(x) slot(x,"ID")))
text(coordinates(sppo), labels=names)
text(0.5,-0.1, "X", cex=1)
title(xlab="X")
title(ylab="Y")
# points(sim$coords, cex= 0.4) # Correr esto una vez se tenga las
# coordenadas de una simulación
A.3 Programación capitulo 3 189
##########################################
### CALCULO AREAS POLIGONOS ####
##########################################
areapl(p1)
areapl(p2)
areapl(p3)
getClass("Polygon")
areas <- sapply(slot(sppo,"polygons"),function(x) sapply(slot(x,"Polygons"),
slot, "area"))
str(areas)
porc.area1 <- areas[1]/sum(areas) # Para el caso es la misma area
porc.area2 <- areas[2]/sum(areas)
porc.area3 <- areas[3]/sum(areas)
100*areas[1]
50*areas[2]
50*areas[3]
###################################################################
########### SIMULACIÓN SIN OMISIÓN DE VARIABLE GRF ###########
###################################################################
#___________________
# Valores parámetros
set.seed(127)
sim <- grf(N,nsim=105,grid= "irreg",cov.model=cov.model,xlims=c(0, 1),
lambda=lambda, ylims = c(0, 1), cov.pars=cov.pars0)
set.seed(127)
V1 <- rbinom(N, size=1, prob=p)
sim$data<-B0+B1*V1+B2*V2*sim$coords[,1]+B3*V3*sim$coords[,2]+sim$data
##########################################################################
####### CONSTRUCCION COORDENADAS PRINCIPALES Y KRIGEADO DB ######
##########################################################################
Delt<-daisy(Data.sim,type=list(asymm=c("V1","V2","V3")),metric="gower")
class(Delt)
is.euclid(Delt^(1/2))
A.3 Programación capitulo 3 191
for(i in 1:100){
names(o)
o1<-o[o$CorrCuad>0.007,]
Xr.sim <- X[,o1$ID]
rdb.sim <- lm(sim$data[,i] ~ Xr.sim)
model.db.sim <- summary(rdb.sim)
x <- sim$coords[,1]
y <- sim$coords[,2]
z <- sim$data[,i]
dXr.sim <- data.frame(x,y,z,Xr.sim)
sim.gd <- as.geodata(dXr.sim, coords.col = 1:2, data.col = 3,
covar.col=4:(ncol(Xr.sim)+3))
############################################################################
########## CONSTRUCCION KRIGEADO UNIVERSAL CLASICO ###########
############################################################################
tabla.sim[i,]<- c(i,m5.sim1$sigmasq,m5.sim1$phi,m5.sim1$tausq,m5.sim1$kappa,
MPE,ASEPE,RMSPE,R2,m4.db.sim0$sigmasq,m4.db.sim0$phi,m4.db.sim0$tausq,
kappa=m4.db.sim0$kappa,MPEdb,ASEPEdb,RMSPEdb,R2db,AIC(m5.sim),
AIC(m4.db.sim),ncol(Xr.sim))
}
tabla.sim
}
tabla1.s.o<-UKDB.sim(N=50,nsim=100,nugget=0,range1=0.15,sill=1,ang=0,anis=1,
kappa1=0.5,lambda=1,modelo.cov="Mat",cov.model="matern",p=0.4)
tabla2.s.o<-UKDB.sim(N=100,nsim=100,nugget=0,range1=0.15,sill=1,ang=0,anis=1,
kappa1=0.5,lambda=1,modelo.cov="Mat",cov.model="matern",p=0.4)
tabla3.s.o<-UKDB.sim(N=150,nsim=100,nugget=0,range1=0.15,sill=1,ang=0,anis=1,
kappa1=0.5,lambda=1,modelo.cov="Mat",cov.model="matern",p=0.4)
tabla4.s.o<-UKDB.sim(N=50,nsim=100,nugget=0,range1=0.15,sill=1,ang=0,anis=1,
kappa1=3/2,lambda=1,modelo.cov="Mat",cov.model="matern",p=0.4)
194 APÉNDICE
tabla5.s.o<-UKDB.sim(N=100,nsim=100,nugget=0,range1=0.15,sill=1,ang=0,anis=1,
kappa1=3/2,lambda=1,modelo.cov="Mat",cov.model="matern",p=0.4)
tabla6.s.o<-UKDB.sim(N=150,nsim=100,nugget=0,range1=0.15,sill=1,ang=0,anis=1,
kappa1=3/2,lambda=1,modelo.cov="Mat",cov.model="matern",p=0.4)
.
.
.
tabla94.sim<-UKDB.sim(N=50,nsim=100,nugget=1,range1=0.6,sill=2,ang=0,anis=1,
kappa1=0,lambda=1,modelo.cov="Sph",cov.model="spherical",p=0.4)
tabla95.sim<-UKDB.sim(N=100,nsim=100,nugget=1,range1=0.6,sill=2,ang=0,anis=1,
kappa1=0,lambda=1,modelo.cov="Sph",cov.model="spherical",p=0.4)
tabla96.sim<-UKDB.sim(N=150,nsim=100,nugget=1,range1=0.6,sill=2, ang=0,anis=1,
kappa1=0,lambda=1,modelo.cov="Sph",cov.model="spherical",p=0.4)
#------------------------------------------------------------------------
### SIMULACIÓN 2: GRF CON OMISIÓN DE VARIABLE, UNIVERSAL KRIGING DB ###
#------------------------------------------------------------------------
set.seed(127)
sim <- grf(N,nsim=105,grid="irreg",cov.model=cov.model,xlims=c(0, 1),
lambda=lambda, ylims = c(0, 1), cov.pars=cov.pars0)
set.seed(127)
V1 <- rbinom(N, size=1, prob=p)
sim$data <-B0+B1*V1+B2*V2*sim$coords[,1]+B3*V3*sim$coords[,2]+sim$data
#########################################################################
######## CONSTRUCCION COORDENADAS PRINCIPALES Y KRIGEADO DB ########
#########################################################################
for(i in 1:100){
ValoresPropios <- mds$eig
CorrCuadrado <- as.vector(cor(sim$data[,i],X)^2)
Porc.Inercia <- ValoresPropios/length(CorrCuadrado)
o<-data.frame(1:length(CorrCuadrado),round(ValoresPropios[1:length
(CorrCuadrado)],10),round(CorrCuadrado,10),round(Porc.Inercia[1:
length(CorrCuadrado)],10))
names(o)<-c("ID", "ValoresProp", "CorrCuad", "Porc.Inercia")
196 APÉNDICE
names(o)
o1<-o[o$CorrCuad>0.007,]
Xr.sim <- X[,o1$ID]
rdb.sim <- lm(sim$data[,i] ~ Xr.sim)
model.db.sim <- summary(rdb.sim)
x <- sim$coords[,1]
y <- sim$coords[,2]
z <- sim$data[,i]
dXr.sim <- data.frame(x,y,z,Xr.sim)
sim.gd <- as.geodata(dXr.sim, coords.col = 1:2, data.col = 3,
covar.col=4:(ncol(Xr.sim)+3))
## Create a formula for a model with a large number of variables:
xnam <- paste("X", 1:ncol(Xr.sim), sep="")
fmla <- as.formula(paste(" ~ ", paste(xnam, collapse= "+")))
try({m4.db.sim <- likfit(sim.gd, trend=fmla, cov.model= cov.model,
ini = c(sill,range1), kappa=kappa1, nug=nugget, messages=F)})
ls()
f <- ifelse(ls() %in% "m4.db.sim",1,0)
w <- sum(f)
phid <- ifelse(w==0,range1,m4.db.sim$phi)
sigmasqd <- ifelse(w==0,sill,m4.db.sim$sigmasq)
tausqd <- ifelse(w==0,nugget,m4.db.sim$tausq)
kappad <- ifelse(w==0,kappa,m4.db.sim$kappa)
m4.db.sim0 <- likfit(s100, ini=c(0.5, 0.5), fix.nug = TRUE)
m4.db.sim0$phi <- phid
m4.db.sim0$sigmasq <- sigmasqd
m4.db.sim0$tausq <- tausqd
m4.db.sim0$kappa <- kappad
AICdb <- ifelse(f==1, "NA", AIC(m4.db.sim))
vuk.db.sim<-vgm(m4.db.sim0$sigmasq,modelo.cov,m4.db.sim0$phi,
m4.db.sim0$tausq, kappa=m4.db.sim0$kappa)
g1.db.sim <- gstat(id = "z", formula = z~X1, locations = ~x+y,
model=vuk.db.sim, data = dXr.sim)
## Create a formula for a model with a large number of variables:
A.3 Programación capitulo 3 197
g1.db.sim$data$z$formula<-as.formula(paste("z~",paste(xnam,collapse="+")))
kcv.db.sim <- gstat.cv(g1.db.sim,nfold=N)
MPEdb <- mean(kcv.db.sim$residual)
ASEPEdb <- mean(sqrt(kcv.db.sim$z.var))
RMSPEdb <- sqrt(sum(kcv.db.sim$residual^2)/length(kcv.db.sim$residual))
resid.mean.sim <- dXr.sim$z- mean(dXr.sim$z)
R2db <- 1- sum((kcv.db.sim$residual)^2)/sum(resid.mean.sim^2)
#########################################################################
########### CONSTRUCCION KRIGEADO UNIVERSAL CLASICO ############
#########################################################################
tabla.sim[i,]<-c(i,m5.sim1$sigmasq,m5.sim1$phi,m5.sim1$tausq,m5.sim1$kappa,
MPE,ASEPE,RMSPE,R2,m4.db.sim0$sigmasq,m4.db.sim0$phi,m4.db.sim0$tausq,
kappa=m4.db.sim0$kappa,MPEdb,ASEPEdb,RMSPEdb,R2db,AIC(m5.sim),
AIC(m4.db.sim), ncol(Xr.sim))
}
tabla.sim
}
tabla1.c.o<-UKDB.sim(N=50,nsim=100,nugget=0,range1=0.15,sill=1,ang=0,anis=1,
kappa1=0.5,lambda=1,modelo.cov="Mat",cov.model="matern",p=0.4)
tabla2.c.o<-UKDB.sim(N=100,nsim=100,nugget=0,range1=0.15,sill=1,ang=0,anis=1,
kappa1=0.5,lambda=1,modelo.cov="Mat",cov.model="matern",p=0.4)
tabla3.c.o<-UKDB.sim(N=150,nsim=100,nugget=0,range1=0.15,sill=1,ang=0,anis=1,
kappa1=0.5,lambda=1,modelo.cov="Mat",cov.model="matern",p=0.4)
tabla4.c.o<-UKDB.sim(N=50,nsim=100,nugget=0,range1=0.15,sill=1,ang=0,anis=1,
kappa1=3/2,lambda=1,modelo.cov="Mat",cov.model="matern",p=0.4)
tabla5.c.o<-UKDB.sim(N=100,nsim=100,nugget=0,range1=0.15,sill=1,ang=0,anis=1,
kappa1=3/2,lambda=1,modelo.cov="Mat",cov.model="matern",p=0.4)
tabla6.c.o<-UKDB.sim(N=150,nsim=100,nugget=0,range1=0.15,sill=1,ang=0,anis=1,
kappa1=3/2,lambda=1,modelo.cov="Mat",cov.model="matern",p=0.4)
.
.
.
tabla94.c.o<-UKDB.sim(N=50,nsim=100,nugget=1,range1=0.6,sill=2,ang=0,anis=1,
kappa1=0,lambda=1,modelo.cov="Sph",cov.model="spherical",p=0.4)
tabla95.c.o<-UKDB.sim(N=100,nsim=100,nugget=1,range1=0.6,sill=2,ang=0,anis=1,
kappa1=0,lambda=1,modelo.cov="Sph",cov.model="spherical",p=0.4)
tabla96.c.o<-UKDB.sim(N=150,nsim=100,nugget=1,range1=0.6,sill=2,ang=0,anis=1,
kappa1=0,lambda=1,modelo.cov="Sph",cov.model="spherical",p=0.4)
#------------------------------------------------------------------------
#### CAPITULO 3: KRIGING UNIVERSAL DB VS KRIGING UNIVERSAL CLASICO ####
#------------------------------------------------------------------------
A.3 Programación capitulo 3 199
#--------------------------------------------------
## A. APLICACIÓN TEMPERATURA CROATIA 01-12-2008 ##
#--------------------------------------------------
library(sp)
library(maptools)
library(gstat)
library(fields)
library(rgdal)
library(lattice)
library(spatstat)
library(RSAGA)
library(cluster)
utm33 <- "+proj=utm +zone=33 +ellps=WGS84 +datum=WGS84 +units=m +no_defs"
# --------------------------------------------------------------
# STEP 1: Importación de los datos y formateo (estandarización);
# --------------------------------------------------------------
# convert to lines:
rsaga.geoprocessor(lib="shapes_lines",module=0,param=list(LINES=
"borders.shp", POLYGONS="countries_s.shp"))
# import country borders:
borders <- readOGR(".", "borders")
names(dif.IDSTA3)
# Import grids:
grids <- readGDAL("HRdem.asc")
names(grids@data)[1] <- "HRdem"
for(j in c("HRdsea", "HRtwi")){
grids@data[,j] <- readGDAL(paste(j, ".asc", sep=""))$band1
}
proj4string(grids) <- CRS(utm33)
# create dummy grids (Lat/Lon):
grids.ll <- spTransform(grids[1], CRS("+proj=longlat +datum=WGS84"))
grids$Lat <- grids.ll@coords[,2]
grids$Lon <- grids.ll@coords[,1]
str(grids@data)
# spplot(grids["Lat"])
lat.c <- mean(grids.ll@coords[,2])
# ---------------------------------------------------------
# STEP 2: importación de las grillas y derivación de INSOL;
# ---------------------------------------------------------
# ---------------------------------------------------------
# STEP 3: Generación mapa de ubicación estaciones y geodata;
# ---------------------------------------------------------
#---------------------------------------------------------------------------
#STEP 4: Calculo de coordenadas principales y regresión basada en distancias
#---------------------------------------------------------------------------
abline(v=2,lty=2,col="blue")
names(o)
o1<-o[o$CorrCuad>0.007,]
Xr <- X[,o1$ID]
rdb <- lm(y ~ Xr)
summary(rdb)
rdb1<-lm(y~dif.IDSTA3$X+dif.IDSTA3$Y+I(dif.IDSTA3$X^2)+I(dif.IDSTA3$Y^2)+
dif.IDSTA3$Y*dif.IDSTA3$X)
summary(rdb1)
dif.IDSTA3$residuos <- rdb$residuals
midataframe3<-data.frame(Xr,midataframe[,3])
names(midataframe3)<-c("X1","X2","X3","X4","X5","X6","X7","X8","X9","X10",
"X11","X12","X13","X14","X15","TEMP")
# ---------------------------
# STEP 5: Ajuste Variogramas;
# ---------------------------
library(sgeostat)
# library(geospt) # No seria necesario cargar "sgeostat"
midataframe <- data.frame(dif.IDSTA3[,c(3,4,17)])
names(midataframe) <- c("x", "y", "r")
P.L.point <- point(midataframe)
P.L.pair <- pair(P.L.point,num.lags=40,maxdist=200000)
#El parametro trim se utiliza para calcular la media recortada
P.L.v <- est.variograms(P.L.point,P.L.pair,"r",trim=0.1)
A.3 Programación capitulo 3 205
###################
##ESFERICO CLASICO
###################
library(gstat)
y <- data.frame (P.L.v$n, P.L.v$bins, P.L.v$classic, dir.hor, dir.ver, id)
names(y) <- c("np", "dist", "gamma", "dir.hor","dir.ver","id")
class(y) <- c("variogram","gstatVariogram","data.frame")
############################################################
# Mejores Modelos Exponencial Robusto por OLS (CME=0.7951) #
# Matern Media recortada WLS (CME=0.7968) #
############################################################
# --------------------------------------------------------------------
# STEP 6: Calculo de las coordenadas principales de nuevos individuos;
# --------------------------------------------------------------------
x <- dif.IDSTA3$X
y <- dif.IDSTA3$Y
puntos <- expand.grid(x=seq(min(x),max(x),1500), y=seq(min(y),max(y),1500))
plot(puntos)
xy = puntos[c("x", "y")]
coordinates(puntos) = xy
coordinates(puntos) <- c("x","y")
gridded(puntos) <- TRUE
tendencia <- Xr[,1:2]
tabla2<-x.news(ValoresPropios,SpatialPoints(coordenadas),
tendencia,df.pts[1,])
tabla <- apply(df.pts,1,tabla1)
tablaa <- data.frame(t(tabla))
names(tablaa)<-c("x","y")
library(maptools)
croatia.shp <- readShapePoly("D:/...../croatia.shp")
# Grilla generada dentro del borde de Croacia
pts <- spsample(croatia.shp, n=70000, type="regular")
df.pts <- as.matrix(pts)
names(df.pts) <- c("x", "y")
# ---------------------------------------------
# STEP 7: Generación de mapas de interpolación;
# ---------------------------------------------
So <- newdata
So <- as.data.frame(cbind(x=So[1],y=So[2]))
coordinates(So) <- c("x", "y")
s <- coordenadas
dist.So <- spDists(So,s)
remove("newdata","var.reg")
vec.orden <- order(dist.So)
dist.vec.cerca <- dist.So[vec.orden[1:n.vec]]
m.dist.vec <- spDists(s)[vec.orden[1:n.vec], vec.orden[1:n.vec]]
b <- diag(tcrossprod(tendencia))
x.new<-(1/2)*(diag(length(ValoresPropios[1:ncol(tendencia)]))*(ValoresPropios
[1:ncol(tendencia)]^(-1)))%*% crossprod(tendencia,b-as.numeric(dist.So)^2)
one = rep(1,length(dist.vec.cerca))
tend <- as.matrix(tendencia[vec.orden[1:n.vec],])
cov.0 <- cov.spatial(0, cov.model= modelo.cov, cov.pars =cov.pars)
m.cov<-cov.spatial(m.dist.vec, cov.model= modelo.cov, cov.pars=cov.pars)
v <- cov.spatial(dist.vec.cerca, cov.model= modelo.cov, cov.pars = cov.pars)
m.cov.k <- rbind(as.matrix(cbind(m.cov,one,tend)),as.matrix(cbind(rbind(one,
t(tend)),matrix(0,ncol=(ncol(tend)+1),nrow=(ncol(tend)+1)))))
m.cov.k.i <- solve(m.cov.k)
v.ko <- c(v,1,x.new)
Pesos.ko <- m.cov.k.i%*%v.ko
KUpr <- z[vec.orden[1:n.vec]]%*%Pesos.ko[1:length(dist.vec.cerca)]
KUvr <- cov.0-v.ko%*%Pesos.ko
remove("dist.So","vec.orden","dist.vec.cerca","m.dist.vec","b","x.new",
"one","tend","cov.0","m.cov","v","m.cov.k","m.cov.k.i","v.ko","Pesos.ko",
"ValoresPropios","tendencia","coordenadas","n.vec","modelo.cov","cov.pars",
"s","So")
data.frame(KUpr,KUvr)
}
krige.u.bd1 <- function(newdata){
krige.u.bd(var.reg=dif.IDSTA3$TEMP, tendencia, ValoresPropios, coordenadas,
newdata=newdata, n.vec=10, modelo.cov="exponential", cov.pars)
}
So <- c(671155.2,5083499)
So = as.data.frame(cbind(x=So[1],y=So[2]))
#coordinates(So) <- c("x", "y")
krige.u.bd0 <- krige.u.bd1(newdata=puntos[1,]) # prueba funcionamiento
210 APÉNDICE
gridded(krige.u2)<-TRUE
spplot(krige.u1["var1.pred"], cuts=10, col.regions=bpy.colors(100), main =
"Interpolaciones de Kriging Universal\n Orden 1 de la Temperatura",scales=
list(draw=T),xlab="Este (m)",ylab="Norte (m)",key.space=list(space="right",
cex=0.6))
A.3 Programación capitulo 3 211
spplot(kud.MDTEMP["var1.var"],cuts=20,col.regions=bpy.colors(100), main =
"Interpolaciones de Varianza Kriging Universal\n DB de la Temperatura
2008-12-01",scales=list(draw=T), xlab="Este (m)", ylab="Norte (m)",
key.space=list(space= "right", cex=0.6))
#-------------------------
## B. Aplicación "ca20" ##
#-------------------------
212 APÉNDICE
# ---------------------------------------------------------
# STEP 1: Preparación de la muestra, pixelado de puntos
# para los mapas y generación shapefile;
# ---------------------------------------------------------
library(geoR)
library(fields)
library(cluster)
library(minqa)
data(ca20)
### define 5 m grid, and select points within study area ###
# pixelado de puntos:
gr <- pred_grid(ca20$borders,by=5)
gr0 <- polygrid(gr,borders=ca20$border,bound=T)
#---------------------------------------------------------------------------
#STEP 2: Calculo de coordenadas principales y regresión basada en distancias
#---------------------------------------------------------------------------
# No se considera altitud, dado que no se dispone de esta variable en los
# puntos no muestreados
(CorrCuadrado1)],10),round(CorrCuadrado1,10),round(Porc.Inercia1[1:
length(CorrCuadrado1)],10))
names(o1)<-c("ID", "ValoresProp1", "CorrCuad1", "Porc.Inercia1")
names(o1)
o2<-o1[o1$CorrCuad1>0.007,]
Xr1 <- Xa[,o2$ID]
rdb1 <- lm(ca20$data ~ Xr1[,1:17])
model.db1 <- summary(rdb1)
plot(0:18,1-c.pred1,
xlab="Number Principal Coordinates",
ylab="1 - Predictability",
# main=c("No Predictability Principal Coordinates"),
cex.main=1.2, col.main=4, ylim=c(0,1), xlim=c(0,18), type="l")
abline(v=4,lty=2,col="blue")
# ----------------------------------------
# STEP 3: Ajuste del modelo de variograma;
# ----------------------------------------
# --------------------------------------------------------------------
# STEP 4: Calculo de las coordenadas principales de nuevos individuos;
# --------------------------------------------------------------------
# Nuevos individuos ubicados sobre el pixelado del mapa
# ---------------------------------------------
A.3 Programación capitulo 3 217
par(mfrow=c(1,1), mar=c(5,5,4,4))
image(data.frame(df.pts[,1:2],mpred@data$ca20.pred),zlim=
c(min(mpred@data$ca20.pred),max(mpred@data$ca20.pred)), col=
terrain.colors(100),axes=T,xlab="East (m)",ylab="North (m)", cex=0.6)
polygon(ca20$reg1)
polygon(ca20$reg2)
polygon(ca20$reg3)
image.plot(legend.only=TRUE,legend.width=1.3,legend.mar=3.5,legend.shrink=1,
col=terrain.colors(100), zlim=c(16,81))
# _____________________________________________________
# Predicciones con el variograma obtenido en el caso DB
vuk.db1<-vgm(m5.db1$sigmasq,"Sph",m5.db1$phi,m5.db1$tausq,kappa=m5.db1$kappa)
g1.db1 <- gstat(id="ca20",formula= ca20~X1+X2+X3+X4+X5+X6+X7+X8+X9+X10+X11+
X12+X13+X14+X15+X16+X17,locations=~x+y,model=vgm(m5.db1$sigmasq,"Sph",
m5.db1$phi,m5.db1$tausq,kappa=m5.db1$kappa), data = dXr1)
tablaa1 <- tablaa
names(tablaa1) <- c("X1","X2","X3","X4","X5","X6","X7","X8","X9","X10","X11",
"X12","X13","X14","X15","X16","X17")
trendb1 <- data.frame(tablaa1,df.pts[,1:2])
mpredb1 <- predict.gstat(g1.db1, trendb1)
kcv.ca20db1 <- gstat.cv(g1.db1,nfold=178)
RMSPE.UKdb1<-sqrt(sum(kcv.ca20db1$residual^2)/length(kcv.ca20db1$residual))
resid.mean1 <- dXr1$ca20- mean(dXr1$ca20)
# Valoración método:
R2db1 <- 1- sum((kcv.ca20db1$residual)^2)/sum(resid.mean1^2)
polygon(ca20$reg1)
polygon(ca20$reg2)
polygon(ca20$reg3)
image.plot(legend.only=TRUE,legend.width=1.3,legend.mar=3.5,legend.shrink=1,
col=terrain.colors(100), zlim=c(15,81))
par(mfrow=c(1,1), mar=c(5,5,4,4))
image(data.frame(df.pts[,1:2],mpredb1@data$ca20.var), zlim=
c(min(mpredb2@data$ca20.var),max(mpredb2@data$ca20.var)),col=
terrain.colors(100),axes=T, xlab="East (m)", ylab = "North (m)", cex=0.6)
polygon(ca20$reg1)
polygon(ca20$reg2)
polygon(ca20$reg3)
library(fields)
image.plot(legend.only=TRUE,legend.width=1.3,legend.mar=3.5,legend.shrink=1,
col=terrain.colors(100), zlim=c(-0.3,9.5))
______________________________________________________________
######### CAPITULO 4: SIMULACIÓN FBR ESPACIAL ##########
______________________________________________________________
library(gstat)
library(geoR)
library(cluster)
library(maptools)
library(rgdal)
library(outliers)
###################################################
### CONSTRUCCION GRAFICO REGIONES ####
###################################################
par(mfrow=c(1,1), mar=c(5,5,4,4))
plot(sppo, ylim=c(0,1), xlab="x", ylab="y")
marcas <- seq(0,1,0.1)
#box(lty = ’solid’, col = ’blue’, lwd=2, mar=c(5,5,5,5))
axis(side=2, at=marcas)
axis(side=1, at=marcas, xlab = "x")
names <- unlist(lapply(slot(sppo,"polygons"), function(x) slot(x,"ID")))
text(coordinates(sppo), labels=names)#, cex=0.6)
text(0.5,-0.1, "X", cex=1)
title(xlab="X")
title(ylab="Y")
# Tama~
nos muestrales
Muestra1 <- c(13,17,20) # Regiones 1,2 y 3 respectivamente # 50 datos
Muestra2 <- c(25,35,40) # 100 datos
Muestra3 <- c(28,52,60) # 150 datos
##########################################################################
#### PROGRAMA SIMULACION EN LAS REGIONES Y VARIABLE BINOMIAL GRF ####
##########################################################################
# Funciones escenarios
fx <- function(x){
fx <- 1.5*dnorm((x-0.35)/0.15)-dnorm((x-0.8)/0.04)
fx
}
fxy
}
_____________________________________________________
############ VALORES PARAMETROS #############
_________________________________________________________
########### Factor: Generic Form ##############
# N: Tama~
nos de muestra 50,100 y 150 datos
# nsim: número de simulaciones, en general 100
# eta: parámetro de suavizamiento en la optimización de la función de
# base radial (FBR), 0.01 y 0.1
# n.neigh: número de vecinos para la validacion cruzada, en este caso el
# número de nodos en el spline 8 y 32
# func: tipo de FBR (ST, M, TPS, EXP, y CRS)
# j: parámetro asociado a la variacion espacial, 1 y 3
set.seed(127)
sim <- grf(N,nsim=nsim,grid="irreg",cov.model=cov.modelo,xlims=c(0, 1),
lambda=lambdao,
A.4 Programación Capı́tulo 4 223
# Noise Level:
# sim$data <- B0 + B1*V1 + B2*V2*sim$coords[,1] + B3*V3*sim$coords[,2] +
# fx(sim$coords[,1])+fx(sim$coords[,2])+fxy(sim$coords[,1],sim$coords[,2])+
# sigma.j(j)*sim$data
# Design density:
# sim$data <- B0 + B1*V1 + B2*V2*sim$coords[,1] + B3*V3*sim$coords[,2] +
# fx(bjx(j,sim$coords[,1]))+fx(bjx(j,sim$coords[,2]))+fxy(bjx(j,
# sim$coords[,1]), bjx(j,sim$coords[,2])) + 0.1*sim$data
# Spatial variation:
sim$data <- B0 + B1*V1 + B2*V2*sim$coords[,1] + B3*V3*sim$coords[,2] +
fjx(j,sim$coords[,1]) + fjx(j,sim$coords[,2]) + fjxy(j,sim$coords[,1],
sim$coords[,2]) + 0.2*sim$data
# Variance function:
# sim$data <- B0 + B1*V1 + B2*V2*sim$coords[,1] + B3*V3*sim$coords[,2] +
# fx(sim$coords[,1])+fx(sim$coords[,2]) +fxy(sim$coords[,1],sim$coords[,2])+
# (sqrt(vjx(j,sim$coords[,1])+vjx(j,sim$coords[,2])+vjxy(j,sim$coords[,1],
# sim$coords[,2])))*sim$data
######################################################################
######### CONSTRUCCION COORDENADAS PRINCIPALES Y FBR DB ##########
######################################################################
for(i in 1:100){
o<-data.frame(1:length(CorrCuadrado),round(ValoresPropios[1:
length(CorrCuadrado)],10),round(CorrCuadrado,10),round(Porc.Inercia
[1:length(CorrCuadrado)],10))
names(o)<-c("ID", "ValoresProp", "CorrCuad", "Porc.Inercia")
names(o)
o1<-o[o$CorrCuad>0.007,]
Xr.sim <- X[,o1$ID]
rdb.sim <- lm(sim$data[,i] ~ Xr.sim)
model.db.sim <- summary(rdb.sim)
# x <- sim$coords[,1]
# y <- sim$coords[,2]
try({spdb.sim<-rbf.t.tcv(sigma=sigma,z=sim$data[,i], coordinates=sim$coords,
trend=Xr.sim, n.neigh=n.neigh, func=func)})
A.4 Programación Capı́tulo 4 225
#################################################
######### Factor: Noise Level ##########
#################################################
Resultado.simnl<-array(data=NA,c(100,5,5,2,2,3,2),dimnames=list(1:100,c("sim"
,"MPE","RMSPE","R2","No.CP"),c("M","TPS","CRS","ST","EXP"),c("1","3"),
c("0.01","0.1"), c("50","100","150"), c("8","32")))
funci <- c("M","TPS","CRS","ST","EXPON")
for (func in funci)
for (j in c(1,3)) # 4 si, 6 no
for (sigma in c(0.01,0.1))
for (N in c(50,100,150))
for (n.neigh in c(8,32))
Resultado.simnl[,,func,paste(j,sep=""),paste(sigma,sep=""),paste(N,sep=""),
paste(n.neigh,sep="")] <- rbf.sim(N=N, nsim=100, sigma=sigma, n.neigh=
n.neigh,func=func, j=j)
#####################################################
####### Factor: Design density #########
#####################################################
Resultado.simbd<-array(data=NA,c(100,5,5,2,2,3,2),dimnames=list(1:100,c("sim"
,"MPE","RMSPE","R2","No.CP"),c("M","TPS","CRS","ST","EXP"),c("1","3"),
c("0.01","0.1"), c("50","100","150"), c("8","32")))
funci <- c("M","TPS","CRS","ST","EXPON")
for (func in funci)
for (j in c(1,3)) # 4 si, 6 no
226 APÉNDICE
#####################################################
######## Factor: Spatial variation ###########
#####################################################
Resultado.simsv<-array(data=NA,c(100,5,5,2,2,3,2),dimnames=list(1:100,c("sim"
,"MPE","RMSPE","R2","No.CP"),c("M","TPS","CRS","ST","EXP"),c("1","3"),
c("0.01","0.1"), c("50","100","150"), c("8","32")))
funci <- c("M","TPS","CRS","ST","EXPON")
for (func in funci)
for (j in c(1,3))
for (sigma in c(0.01,0.1))
for (N in c(50,100,150))
for (n.neigh in c(8,32))
Resultado.simsv[,,func,paste(j,sep=""),paste(sigma,sep=""),paste(N,sep=""),
paste(n.neigh,sep="")] <- rbf.sim(N=N, nsim=100, sigma=sigma, n.neigh=
n.neigh,func=func, j=j)
#####################################################
######## Factor: Variance function ##########
#####################################################
Resultado.simvf<-array(data=NA,c(100,5,5,2,2,3,2),dimnames=list(1:100,c("sim"
,"MPE","RMSPE","R2","No.CP"),c("M","TPS","CRS","ST","EXP"),c("1","3"),
c("0.01","0.1"),c("50","100","150"), c("8","32")))
funci <- c("M","TPS","CRS","ST","EXPON")
for (func in funci)
for (j in c(1,3))
for (sigma in c(0.01,0.1))
for (N in c(50,100,150))
for (n.neigh in c(8,32))
Resultado.simvf[,,func,paste(j,sep=""),paste(sigma,sep=""),paste(N,sep=""),
paste(n.neigh,sep="")] <- rbf.sim(N=N, nsim=100, sigma=sigma, n.neigh=
n.neigh,func=func, j=j)
A.4 Programación Capı́tulo 4 227
______________________________________________________________
####### CAPITULO 4: APLICACIÓN FBR ESPACIAL "ca20" #########
______________________________________________________________
library(geoR)
library(fields)
library(cluster)
library(minqa)
data(ca20)
# ----------------------------------------------------------------
# STEP 3: Optimización parámetros ETA y RHO en las diferentes FBR;
# ----------------------------------------------------------------
# FBR: Funciones de base radial
#______________________________
# A: Optimización parámetro ETA
#______________________________
# B: Optimización parámetro RHO
P.opt.crs <- bobyqa(c(1, 2), rbf.t.cvop, lower = c(0, 0), upper = c(2, 4),
z=ca20g1$data,coordinates=ca20g1$coords,trend=dXr1[,4:20],n.neigh=177,
func="CRS")
#parameter estimates: 0.329865648310229, 2.38278578402578
#objective: 7.3335085291925
#number of function evaluations: 31
P.opt.st <- bobyqa(c(1, 2), rbf.t.cvop, lower = c(0, 0), upper = c(2, 4),
z=ca20g1$data,coordinates=ca20g1$coords,trend=dXr1[,4:20],n.neigh=177,
func="ST")
#parameter estimates: 0.578017806545431, 2.04092020273964
#objective: 7.33350852919374
#number of function evaluations: 34
P.opt.exp <- bobyqa(c(0, 1), rbf.t.cvop, lower = c(0, 0), upper = c(1, 4),
z=ca20g1$data,coordinates=ca20g1$coords,trend=dXr1[,4:20],n.neigh=177,
func="EXP")
#parameter estimates: 0.0245091649898321, 0
#objective: 7.3174428056804
#number of function evaluations: 234
P.opt.gau <- bobyqa(c(0, 1), rbf.t.cvop, lower = c(0, 0), upper = c(1, 4),
z=ca20g1$data,coordinates=ca20g1$coords,trend=dXr1[,4:20],n.neigh=177,
func="GAU")
#parameter estimates: 0.2, 1
#objective: 8.01272045781122
#number of function evaluations: 28
230 APÉNDICE
P.opt.m <- bobyqa(c(0, 1), rbf.t.cvop, lower = c(0, 0), upper = c(4, 4),
z=ca20g1$data,coordinates=ca20g1$coords,trend=dXr1[,4:20],n.neigh=177,
func="M")
#parameter estimates: 0, 0
#objective: 7.37528496811618
#number of function evaluations: 19
P.opt.mi <- bobyqa(c(10, 1), rbf.t.cvop, lower = c(0, 0), upper = c(200, 4),
z=ca20g1$data,coordinates=ca20g1$coords,trend=dXr1[,4:20],n.neigh=177,
func="IM")
#parameter estimates: 27.3574363334684, 0
#objective: 7.29700064336846
#number of function evaluations: 45
P.opt.tps <- bobyqa(c(0.01, 1), rbf.t.cvop, lower = c(0, 0), upper = c(4, 4),
z=ca20g1$data,coordinates=ca20g1$coords,trend=dXr1[,4:20],n.neigh=177,
func="TPS")
#parameter estimates: 0.198730051128008, 1.24431018941423
#objective: 7.6104081199563
#number of function evaluations: 23
# ------------------------------------------------------------
# STEP 5: Predicciones y generación de mapas de interpolación;
# ------------------------------------------------------------
# Generacion Predicciones IM
IM.p <- rbf.t(eta=27.357, z=ca20g1$data, coordinates=ca20g1$coords,
trend=dXr1[,4:20], nd.trend=newdata, n.neigh=177, func="IM")
gridded(IM.p) = ~x+y
par(mar = c(2.8, 3.1, 0.5, 0.5), mgp = c(1.8, 0.7, 0), mfrow = c(1, 1))
spplot(IM.p["var1.pred"], col.regions=terrain.colors(100), cuts=60,scales=
list(draw =T), xlab="East (m)", ylab = "North (m)",
key.space=list(space="right", cex=0.8), panel = function(...) {
panel.gridplot(...)
sp.polygons(ca20shp1,lwd=1.5)
sp.polygons(ca20shp2,lwd=1.5)
sp.polygons(ca20shp3,lwd=1.5)
})
A.4 Programación Capı́tulo 4 231
# Generacion Predicciones M
M.p <- rbf.t(eta=5.575865e-05, z=ca20g1$data, coordinates=ca20g1$coords,
trend=dXr1[,4:20], nd.trend=newdata, n.neigh=177, func="M")
gridded(M.p) = ~x+y
par(mar = c(2.8, 3.1, 0.5, 0.5), mgp = c(1.8, 0.7, 0), mfrow = c(1, 1))
spplot(M.p["var1.pred"], col.regions=terrain.colors(100), cuts=60,scales=
list(draw =T), xlab="East (m)", ylab = "North (m)",
key.space=list(space="right", cex=0.8), panel = function(...) {
panel.gridplot(...)
sp.polygons(ca20shp1,lwd=1.5)
sp.polygons(ca20shp2,lwd=1.5)
sp.polygons(ca20shp3,lwd=1.5)
})
})
# Generacion Predicciones ST
ST.p <- rbf.t(eta=0.08303821, z=ca20g1$data, coordinates=ca20g1$coords,
trend=dXr1[,4:20], nd.trend=newdata, n.neigh=177, func="ST")
gridded(ST.p) = ~x+y
par(mar = c(2.8, 3.1, 0.5, 0.5), mgp = c(1.8, 0.7, 0), mfrow = c(1, 1))
spplot(ST.p["var1.pred"], col.regions=terrain.colors(100), cuts=60,
scales = list(draw =T), xlab="East (m)", ylab = "North (m)",
key.space=list(space="right", cex=0.8), panel = function(...) {
panel.gridplot(...)
sp.polygons(ca20shp1,lwd=1.5)
sp.polygons(ca20shp2,lwd=1.5)
sp.polygons(ca20shp3,lwd=1.5)
})
sp.polygons(ca20shp2,lwd=1.5)
sp.polygons(ca20shp3,lwd=1.5)
})
______________________________________________________________
######### CAPITULO 5: SIMULACIÓN SPACE-TIME FBR ##########
______________________________________________________________
library(gstat)
library(geoR)
library(RandomFields)
library(cluster)
#library(FD)
library(maptools)
library(rgdal)
library(outliers)
###################################################
### CONSTRUCCION GRAFICO REGIONES ####
###################################################
t <- (1:10)/10
par(mfrow=c(1,1), mar=c(5,5,4,4))
plot(sppo, ylim=c(0,1), xlab="x", ylab="y")
marcas <- seq(0,1,0.1)
axis(side=2, at=marcas)
axis(side=1, at=marcas, xlab = "x")
names <- unlist(lapply(slot(sppo,"polygons"), function(x) slot(x,"ID")))
text(coordinates(sppo), labels=names)#, cex=0.6)
text(0.5,-0.1, "X", cex=1)
title(xlab="X")
title(ylab="Y")
points(x1,y1,cex=0.5)
# Tama~
nos muestrales
# Regiones 1,2 y 3 respectivamente y t.
Muestra1 <- c(6,9,10,6) # 25 datos en el espacio y 6 tiempos
Muestra2 <- c(6,9,10,10) # 25 datos en el espacio y 10 tiempos
#########################################################################
###### PROGRAMA SIMULACION EN LAS REGIONES Y VARIABLE BINOMIAL GRF ######
#########################################################################
# Funciones escenarios:
fx <- function(x){
fx <- 1.5*dnorm((x-0.35)/0.15)-dnorm((x-0.8)/0.04)
fx
}
_____________________________________________________
############ VALORES PARAMETROS #############
_________________________________________________________
########### Factor: Generic Form ##############
# N: Tama~
nos de muestra para T=6 tiempos 150 datos y cuando T=10,
# 250 datos
# nsim: número de simulaciones, en general 100
# eta: parámetro de suavizamiento en la optimización de la función de
# base radial (FBR), 0.01 y 0.1
# n.neigh: número de vecinos para la validacion cruzada, en este caso el
# número de nodos en el spline 8 y 32
# func: tipo de FBR (ST, M, TPS, EXP, y CRS)
# j: parámetro asociado a la variacion espacial, 1 y 3
B0 <- 10; B1<- -4; B2 <- 2; B3 <- -4; B4 <- 3; p <- 0.4
T <- c(1,t,1) ## note necessarily gridtriple definition
ti <- (1:t)/t
ma1=as.matrix(rbind(c(5,0),c(0,0.5)))
model <- list("$", var=1, aniso=ma1, list("gauss"))
set.seed(127)
z <- GaussRF(n=nsim, x=x, y=y, T=T, grid=TRUE, model=model, method="ci",
CE.strategy=1,CE.trials=if (interactive()) 4 else 1)
Z <- matrix(NA,ncol=nsim,nrow=N*t)
for (i in 1:nsim)
Z[,i] <- as.vector(z[,,,i])
set.seed(127)
V1 <- rbinom(N, size=1, prob=p)
# Noise Level:
# Z1 <- B0 + B1*V1 +B2*V2*grilla$x +B3*V3*grilla$y+B4*grilla$t+fx(grilla$x)
# +fx(grilla$y) +fx(grilla$t)+fxy(grilla$x,grilla$y) +fxy(grilla$x,grilla$t)
# +fxy(grilla$y,grilla$t) + fxyt(grilla$x,grilla$y,grilla$t) + sigma.j(j)*Z
# Design density:
# Z1 <- B0 + B1*V1 + B2*V2*grilla$x + B3*V3*grilla$y + B4*grilla$t +
# fx(bjx(j,grilla$x))+fx(bjx(j,grilla$x))+fx(bjx(j,grilla$t))+
238 APÉNDICE
# fxy(bjx(j,grilla$x),bjx(j,grilla$y))+fxy(bjx(j,grilla$x),bjx(j,grilla$t))
# +fxy(bjx(j,grilla$y),bjx(j,grilla$t))+fxyt(bjx(j,grilla$x),bjx(j,grilla$y),
# bjx(j,grilla$t))+0.1*Z
# Spatial variation:
# Z1 <-B0+B1*V1+B2*V2*grilla$x+B3*V3*grilla$y +B4*grilla$t+fjx(j,grilla$x)+
# fjx(j,grilla$y) + fjx(j,grilla$t) + fjxy(j,grilla$x,grilla$y) +
# fjxy(j,grilla$x,grilla$t)+fjxy(j,grilla$y,grilla$t) +
# fjxyt(j,grilla$x,grilla$y,grilla$t)+0.2*Z
# Variance function:
Z1 <-B0+B1*V1+B2*V2*grilla$x+B3*V3*grilla$y+B4*grilla$t+fx(grilla$x) +
fx(grilla$y)+fx(grilla$t)+fxy(grilla$x,grilla$y)+(sqrt(vjx(j,grilla$x) +
vjx(j,grilla$y)+vjx(j,grilla$t)+vjxy(j,grilla$x,grilla$y)+vjxy(j,grilla$x,
grilla$t)+vjxy(j,grilla$y,grilla$t)+vjxyt(j,grilla$x,grilla$y,grilla$t)))*Z
################################################################
###### CONSTRUCCION COORDENADAS PRINCIPALES Y FBR DB #######
################################################################
for(i in 1:nsim){
# x <- sim$coords[,1]
# y <- sim$coords[,2]
# system.time(rbf.st.tcv(eta=0.1,z=Z1[,i],coordinates=grilla[,1:3],trend=
Xr.sim,rho=0, n.neigh=8, func="ST"))
try({spdb.sim <- rbf.st.tcv(eta=eta, z=Z1[,i], coordinates=grilla[,1:3],
trend=Xr.sim, rho=rho, n.neigh=n.neigh, func=func)})
MPE <- mean(spdb.sim$residual)
RMSPE <- sqrt(sum(spdb.sim$residual^2)/length(spdb.sim$residual))
resid.mean.sim <- spdb.sim$observed - mean(spdb.sim$observed)
R2 <- 1- sum((spdb.sim$residual)^2)/sum(resid.mean.sim^2)
__________________________________________________________________
############### Factor: Noise level ##############
__________________________________________________________________
############# Factor: Design density ##############
__________________________________________________________________
########### Factor: Spatial variation ##############
__________________________________________________________________
############ Factor: Variance function ###############
A.5 Programación Capı́tulo 5 241
______________________________________________________________
###### CAPITULO 5: APLICACIÓN SPACE-TIME FBR CROATIA #######
______________________________________________________________
# ------------------------------------------------------------
# STEP 0: Configuración inicial y descarga de los datos:
# ------------------------------------------------------------
library(maptools)
library(gstat)
library(fields)
library(rgdal)
library(lattice)
library(spatstat)
library(RSAGA)
utm33 <- "+proj=utm +zone=33 +ellps=WGS84 +datum=WGS84 +units=m +no_defs"
# --------------------------------------------------------------
# STEP 1: Importación de los datos y formateo (estandarización);
# --------------------------------------------------------------
# convert to lines:
rsaga.geoprocessor(lib="shapes_lines", module=0, param=list(LINES=
"borders.shp", POLYGONS="countries_s.shp"))
# import country borders:
borders <- readOGR(".", "borders")
# Import grids:
grids <- readGDAL("HRdem.asc")
names(grids@data)[1] <- "HRdem"
for(j in c("HRdsea", "HRtwi")){
grids@data[,j] <- readGDAL(paste(j, ".asc", sep=""))$band1
}
proj4string(grids) <- CRS(utm33)
# create dummy grids (Lat/Lon):
grids.ll <- spTransform(grids[1], CRS("+proj=longlat +datum=WGS84"))
grids$Lat <- grids.ll@coords[,2]
grids$Lon <- grids.ll@coords[,1]
str(grids@data)
# spplot(grids["Lat"])
lat.c <- mean(grids.ll@coords[,2])
# ---------------------------------------------------------
# STEP 2: importación de las grillas y derivación de INSOL;
# ---------------------------------------------------------
#------------------------------------------------------------------
#STEP 3: Ordenación de los datos (matriz espacio-tiempo) y gráficos
#------------------------------------------------------------------
library(maptools)
pts <- spsample(croatia.shp, n=25000, type="regular")
df.pts <- as.data.frame(pts)
names(df.pts) <- c("x", "y")
coordinates(df.pts) <- c("x", "y")
IDSTA.OV <- overlay(grids, df.pts)
plot(IDSTA.OV@coords,cex=0.1)
spplot(IDSTA.OV["HRdem"],cex=0.1), at=seq(-15,30,by=45/50), col.regions=
grey(seq(0,1,by=0.02)), sp.layout=list("sp.lines", col="black",
croatia.shp))
IDSTA.OV1 <- data.frame(IDSTA.OV@coords,IDSTA.OV$HRdem,IDSTA.OV$HRdsea,
A.5 Programación Capı́tulo 5 245
IDSTA.OV$HRtwi,
apply(cbind(IDSTA.OV$LST2008_01_01,IDSTA.OV$LST2008_01_09,
IDSTA.OV$LST2008_01_17,IDSTA.OV$LST2008_01_25),1,mean,na.rm=TRUE),
apply(cbind(IDSTA.OV$LST2008_02_02,IDSTA.OV$LST2008_02_10,
IDSTA.OV$LST2008_02_18,IDSTA.OV$LST2008_02_26),1,mean,na.rm=TRUE),
apply(cbind(IDSTA.OV$LST2008_03_05,IDSTA.OV$LST2008_03_13,
IDSTA.OV$LST2008_03_21,IDSTA.OV$LST2008_03_29),1,mean,na.rm=TRUE),
apply(cbind(IDSTA.OV$LST2008_04_06,IDSTA.OV$LST2008_04_14,
IDSTA.OV$LST2008_04_22,IDSTA.OV$LST2008_04_30),1,mean,na.rm=TRUE),
apply(cbind(IDSTA.OV$LST2008_05_08,IDSTA.OV$LST2008_05_16,
IDSTA.OV$LST2008_05_24),1, mean, na.rm = TRUE),
apply(cbind(IDSTA.OV$LST2008_06_01,IDSTA.OV$LST2008_06_09,
IDSTA.OV$LST2008_06_17,IDSTA.OV$LST2008_06_25),1,mean,na.rm=TRUE),
apply(cbind(IDSTA.OV$LST2008_07_03,IDSTA.OV$LST2008_07_11,
IDSTA.OV$LST2008_07_19,IDSTA.OV$LST2008_07_27),1,mean,na.rm=TRUE),
apply(cbind(IDSTA.OV$LST2008_08_04,IDSTA.OV$LST2008_08_12,
IDSTA.OV$LST2008_08_20,IDSTA.OV$LST2008_08_28),1,mean,na.rm=TRUE),
apply(cbind(IDSTA.OV$LST2008_09_05,IDSTA.OV$LST2008_09_13,
IDSTA.OV$LST2008_09_21,IDSTA.OV$LST2008_09_29),1,mean,na.rm=TRUE),
apply(cbind(IDSTA.OV$LST2008_10_07,IDSTA.OV$LST2008_10_15,
IDSTA.OV$LST2008_10_23,IDSTA.OV$LST2008_10_31),1,mean,na.rm=TRUE),
apply(cbind(IDSTA.OV$LST2008_11_08,IDSTA.OV$LST2008_11_16,
IDSTA.OV$LST2008_11_24),1, mean, na.rm = TRUE),
apply(cbind(IDSTA.OV$LST2008_12_02,IDSTA.OV$LST2008_12_10,
IDSTA.OV$LST2008_12_18,IDSTA.OV$LST2008_12_26),1,mean,na.rm=TRUE))
gridded(GrillaDDT) = ~x+y
pdem <- spplot(GrillaDDT["dem"],col.regions=pacol,sp.layout=addCr,cuts=40,
scales = list(draw =T), xlab="East (m)", ylab = "North (m)",
key.space=list(space="right", cex=0.8))
pdsea <- spplot(GrillaDDT["dsea"],col.regions=pacol,sp.layout=addCr,cuts=40,
scales = list(draw =T), xlab="East (m)", ylab = "North (m)",
key.space=list(space="right", cex=0.8))
ptwi <- spplot(GrillaDDT["twi"],col.regions=pacol,sp.layout=addCr,cuts=40,
scales = list(draw =T), xlab="East (m)", ylab = "North (m)",
key.space=list(space="right", cex=0.8))
#---------------------------------------------------------------------------
#STEP 4: Calculo de coordenadas principales y regresión basada en distancias
#---------------------------------------------------------------------------
library(cluster)
length(CorrCuadrado)],10),round(CorrCuadrado,10),round(Porc.Inercia
[1:length(CorrCuadrado)],10))
names(o)<-c("ID", "ValoresProp", "CorrCuad", "Porc.Inercia")
names(o)
o1<-o[o$CorrCuad>0.003,]
#fix(o1)
Xr <- X[,o1$ID]
rdb <- lm(Muestra$MTEMP ~ Xr)
model.db <- summary(rdb)
plot(0:14,1-c.pred[1:15],
xlab="Principal Coordinates",
ylab="1 - Predictability",
main=c("No Predictability Principal Coordinates"),
cex.main=1.2, col.main=4, ylim=c(0,1), xlim=c(0,12), type="l")
abline(v=3,lty=2,col="blue")
# --------------------------------------------------------------------
# STEP 5: Calculo de las coordenadas principales de nuevos individuos;
# --------------------------------------------------------------------
library(gstat)
x.news <- function(ValoresPropios,Data,tendencia,newdata){
Data[length(ValoresPropios)+1, ] <- newdata
d <- as.matrix(gowdis(Data))[-(length(ValoresPropios)+1),
(length(ValoresPropios)+1)]
b <- diag(tcrossprod(tendencia))
x.new <- (1/2)*diag(ValoresPropios[1:ncol(tendencia)]^(-1))%*%t(tendencia)
%*%(b-d)
x.new
}
x.new0
}
# ------------------------------------------------------------
# STEP 6: optimización y generación de mapas de interpolación;
# ------------------------------------------------------------
####################################
# CRS Spline Interpolation MTEMP #
####################################
# Month 1
fbr.pred.CRS<-rbf.trst(eta=0.001,z=Muestra$MTEMP,coordinates=scale(Muestra
[,c(14,15,17)]),trend=Xr,nd.trend=nd.trend1,rho=0,n.neigh=30,func="CRS")
fbr.CRS <- data.frame(Grilla25.m1[,1:2],fbr.pred.CRS[,4:5])
gridded(fbr.CRS) = ~x+y
par(mar = c(2.8, 3.1, 0.5, 0.5), mgp = c(1.8, 0.7, 0), mfrow = c(1, 1))
spplot(fbr.CRS["var1.pred"], col.regions=pal2, cuts=30,scales=list(draw=T),
xlab="East (m)",
ylab = "North (m)", key.space=list(space="right", cex=0.8))
#Month 4
fbr.pred.CRS4 <- rbf.trst(eta=0.001, z=Muestra$MTEMP,
coordinates=scale(Muestra[,c(14,15,17)]),
trend=Xr, nd.trend=nd.trend4, rho=0, n.neigh=30, func="CRS")
fbr.CRS4 <- data.frame(Grilla25.m4[,1:2],fbr.pred.CRS4 [,4:5])
gridded(fbr.CRS4) = ~x+y
par(mar = c(2.8, 3.1, 0.5, 0.5), mgp = c(1.8, 0.7, 0), mfrow = c(1, 1))
spplot(fbr.CRS4["var1.pred"], col.regions=pal2,cuts=30,scales=list(draw=T),
xlab="East (m)",ylab="North (m)",key.space=list(space="right",cex=0.8))
#Month 7
fbr.pred.CRS7 <-rbf.trst(eta=0.001,z=Muestra$MTEMP,coordinates=scale(Muestra
[,c(14,15,17)]),trend=Xr,nd.trend=nd.trend7,rho=0,n.neigh=30,func="CRS")
fbr.CRS7 <- data.frame(Grilla25.m7[,1:2],fbr.pred.CRS7 [,4:5])
#fbr.CRS7@data$var1.pred[fbr.CRS7@data$var1.pred>40] <-
# mean(fbr.CRS7@data$var1.pred[fbr.CRS7@data$var1.pred<40]+9)
gridded(fbr.CRS7) = ~x+y
par(mar = c(2.8, 3.1, 0.5, 0.5), mgp = c(1.8, 0.7, 0), mfrow = c(1, 1))
spplot(fbr.CRS7["var1.pred"], col.regions=bpy.colors(60), cuts=30, scales=
list(draw =T), xlab="East (m)",
ylab = "North (m)", key.space=list(space="right", cex=0.8))
A.5 Programación Capı́tulo 5 251
# Month 10
fbr.pred.CRS10<-rbf.trst(eta=0.001,z=Muestra$MTEMP,coordinates=scale(Muestra
[,c(14,15,17)]),trend=Xr,nd.trend=nd.trend10,rho=0,n.neigh=30,func="CRS")
fbr.CRS10 <- data.frame(Grilla25.m10[,1:2],fbr.pred.CRS10[,4:5])
gridded(fbr.CRS10) = ~x+y
par(mar = c(2.8, 3.1, 0.5, 0.5), mgp = c(1.8, 0.7, 0), mfrow = c(1, 1))
spplot(fbr.CRS10["var1.pred"], col.regions=bpy.colors(60), cuts=30,scales=
list(draw =T), xlab="East (m)", ylab = "North (m)",
key.space=list(space="right", cex=0.8))
## AGREGADO EN UN MAPA
fbr.CRS.A<-data.frame(Grilla25.m10[,1:2],fbr.pred.CRS[,4],fbr.pred.CRS4[,4],
fbr.pred.CRS7[,4],fbr.pred.CRS10[,4])
names(fbr.CRS.A) <- c("x","y","MONTH1","MONTH4","MONTH7","MONTH10")
gridded(fbr.CRS.A) = ~x+y
pr.list <- c("MONTH1","MONTH4","MONTH7","MONTH10")
pr.list1 <- c("a","b","c","d")
par(mar = c(2.8, 3.1, 0.5, 0.5), mgp = c(1.8, 0.7, 0), mfrow = c(1, 4))
fbr.CRS.ag = fbr.CRS
fbr.CRS.ag[["a"]] = fbr.CRS[["var1.pred"]]
fbr.CRS.ag[["b"]] = fbr.CRS4[["var1.pred"]]
fbr.CRS.ag[["c"]] = fbr.CRS7[["var1.pred"]]
fbr.CRS.ag[["d"]] = fbr.CRS10[["var1.pred"]]
g2 <- spplot(fbr.CRS.ag,c("a","b","c","d"),names.attr=c("MONTH 1","MONTH 4",
"MONTH 7","MONTH 10"),as.table=TRUE,col.regions=pal2a,cuts=30,scales=
list(draw =T),xlab="East (m)",ylab="North (m)",key.space=list(space=
"right", cex=0.8))
#spplot(fbr.CRS.A[pr.list], names.attr=c("MONTH 1", "MONTH 4", "MONTH 7",
"MONTH 10"),col.regions=pal2,cuts=30,scales=list(draw=T),xlab="East (m)",
ylab = "North (m)", key.space=list(space="right", cex=0.8))
#xlim=c(450000,600000), ylim=c(4950000,5100000),col.regions=bpy.colors(10)
#####################################
# EXP Spline Interpolation MTEMP #
#####################################
252 APÉNDICE
# Month 1
fbr.pred.EXP <- rbf.trst(eta=0.001, z=Muestra$MTEMP, coordinates=
scale(Muestra[,c(14,15,17)]),trend=Xr,nd.trend=nd.trend1,rho=0,n.neigh=30,
func="EXP")
fbr.EXP <- data.frame(Grilla25.m1[,1:2],fbr.pred.EXP[,4:5])
gridded(fbr.EXP) = ~x+y
par(mar = c(2.8, 3.1, 0.5, 0.5), mgp = c(1.8, 0.7, 0), mfrow = c(1, 1))
spplot(fbr.EXP["var1.pred"],col.regions=pal2,cuts=30,scales=list(draw =T),
xlab="East (m)",
ylab = "North (m)", key.space=list(space="right", cex=0.8))
# Month 4
fbr.pred.EXP4 <- rbf.trst(eta=0.001, z=Muestra$MTEMP, coordinates=
scale(Muestra[,c(14,15,17)]),trend=Xr,nd.trend=nd.trend4,rho=0,n.neigh=30,
func="EXP")
fbr.EXP4 <- data.frame(Grilla25.m1[,1:2],fbr.pred.EXP4[,4:5])
gridded(fbr.EXP4) = ~x+y
par(mar = c(2.8, 3.1, 0.5, 0.5), mgp = c(1.8, 0.7, 0), mfrow = c(1, 1))
spplot(fbr.EXP4["var1.pred"],col.regions=pal2, cuts=30,scales=list(draw =T),
xlab="East (m)",ylab="North (m)",key.space=list(space="right",cex=0.8))
# Month 7
fbr.pred.EXP7 <- rbf.trst(eta=0.001, z=Muestra$MTEMP, coordinates=
scale(Muestra[,c(14,15,17)]),trend=Xr,nd.trend=nd.trend7,rho=0,n.neigh=30,
func="EXP")
fbr.EXP7 <- data.frame(Grilla25.m1[,1:2],fbr.pred.EXP7[,4:5])
gridded(fbr.EXP7) = ~x+y
par(mar = c(2.8, 3.1, 0.5, 0.5), mgp = c(1.8, 0.7, 0), mfrow = c(1, 1))
spplot(fbr.EXP7["var1.pred"],col.regions=terrain.colors(100),cuts=30,scales=
list(draw =T),xlab="East (m)",ylab="North (m)",key.space=list(space="right",
cex=0.8))
# Month 10
fbr.pred.EXP10 <- rbf.trst(eta=0.001, z=Muestra$MTEMP, coordinates=
scale(Muestra[,c(14,15,17)]),trend=Xr,nd.trend=nd.trend10,rho=0,n.neigh=30,
func="EXP")
fbr.EXP10 <- data.frame(Grilla25.m1[,1:2],fbr.pred.EXP10[,4:5])
A.5 Programación Capı́tulo 5 253
gridded(fbr.EXP10) = ~x+y
par(mar = c(2.8, 3.1, 0.5, 0.5), mgp = c(1.8, 0.7, 0), mfrow = c(1, 1))
spplot(fbr.EXP10["var1.pred"],col.regions=terrain.colors(100),cuts=30,scales=
list(draw =T),xlab="East (m)",ylab="North (m)",key.space=list(space="right",
cex=0.8))
## AGREGADO EN UN MAPA
fbr.EXP.A<-data.frame(Grilla25.m10[,1:2],fbr.pred.EXP[,4],fbr.pred.EXP4[,4],
fbr.pred.EXP7[,4],fbr.pred.EXP10[,4])
names(fbr.EXP.A) <- c("x","y","MONTH1","MONTH4","MONTH7","MONTH10")
gridded(fbr.EXP.A) = ~x+y
par(mar = c(2.8, 3.1, 0.5, 0.5), mgp = c(1.8, 0.7, 0), mfrow = c(1, 4))
fbr.EXP.ag = fbr.EXP
fbr.EXP.ag[["a"]] = fbr.EXP[["var1.pred"]]
fbr.EXP.ag[["b"]] = fbr.EXP4[["var1.pred"]]
fbr.EXP.ag[["c"]] = fbr.EXP7[["var1.pred"]]
fbr.EXP.ag[["d"]] = fbr.EXP10[["var1.pred"]]
g5<-spplot(fbr.EXP.ag,c("a","b","c","d"),names.attr=c("MONTH 1","MONTH 4",
"MONTH 7","MONTH 10"),as.table=TRUE,col.regions=pal2a,cuts=30,scales=
list(draw=T),xlab="East (m)",ylab="North (m)",key.space=list(space=
"right", cex=0.8))
Fascículo 2
CURSO DE GEOESTADÍSTICA
Por
Georges MATHERON
1969
Marco ALFARO
2005
Propiedad del Centro de Geoestadística de la Escuela de Minas de París.
Prohibida su venta.
1
CURSO DE GEOESTADISTICA
Tabla de Materias
PREFACIO 3
0 – INTRODUCCION. 4
0-1 Notaciones 4
0-2 Producto de convolución 5
0-3 Geoestadística y Teoría de las variables regionalizadas 6
0-4 Métodos transitivos y Teoría intrínseca 10
3 – EL ESQUEMA ESFERICO. 45
4 – EL KRIGEADO 47
5-0 Introducción 53
5-1 Elección de una ley de corte y de un ritmo anual de
explotación 56
5-2 Reconocimiento óptimo para el dimensionamiento de la
explotación 60
5-3 Optimización secuencial y término del reconocimiento 63
6. EJERCICIOS 70
BIBLIOGRAFIA 77
2
PREFACIO DEL TRADUCTOR
Existen otros manuscritos que he realizado, que iré poco a poco pasando a
formato electrónico, poniéndolos a disposición de la comunidad minera.
M. ALFARO
3
CURSO DE GEOESTADISTICA
0 – INTRODUCCION
∫ f ( x)dx
Por ejemplo, para n = 3 dimensiones, y, designando por (x1, x2, x3) las
tres coordenadas del punto x, esta notación se explicita de la manera
siguiente:
+∞ +∞ +∞
∫ f ( x)dx = ∫
−∞
dx1 ∫ dx2 ∫ f ( x1 , x2 , x3 )dx1dx2 dx3
−∞ −∞
b1 b2
∫ f ( x)dx = ∫ dx ∫ f ( x , x )dx dx
A a1
1
a2
1 2 1 2
Ejemplo: Sea V un volumen, y g(h) = g(h1, h2, h3) una función del vector
h de coordenadas h1, h2, h3 . Sean x = (x1, x2, x3) e y = (y1, y2, y3) el
origen y la extremidad del vector h, es decir h=y-x. El valor medio de la
4
función g(h) cuando los dos puntos x e y recorren (cada uno a su manera)
el volumen V, se escribe:
1
v 2 ∫v ∫v
dx g ( y − x)dy
1
v2 ∫ ∫ ∫ dx dx dx ∫ ∫ ∫ g ( y
v
1 2 3
v
1 − x1 ; y2 − x2 ; y3 − x3 )dy1dy2 dy3
g ( x) = ∫ f1 ( y ) f 2 ( x − y )dy = ∫ f 2 ( y ) f1 ( x − y )dy
g = f1 ∗ f 2
f p ( x0 ) = ∫ p ( y ) f ( x0 + y )dy = ∫ p (− y ) f ( x0 − y )dy
5
Sea p la función transpuesta de la función p (por definición:
p (x)=p(-x)). fp(x0) es el valor en x0 de f* p :
fp = f ∗ p
1
fv = f ∗k
v
representa la ley media de la muestra v tomada en el punto x. De manera
explícita, se tiene:
1
v ∫v
f v ( x) = f ( x + y )dy
Ejemplo 2 (radiactividades)
Ae− λ d ( x − x0 ) / d ( x − x0 ) f ( x)dx
e − λ d ( x − x0 )
A∫ f ( x ) dx
d ( x − x0 )
Esto no es otra cosa que el producto de convolución Af * p (con una
−λd
función p de ponderación p( x) = e / d , la cual es además simétrica, es
decir p = p )
6
fenómeno es regionalizado cuando se desplaza en el espacio, manifestando
una cierta estructura. Las ciencias de la tierra, entre otras, nos
proporcionan numerosos ejemplos. Si f(x) designa el valor en el punto x
de una característica f de este fenómeno, diremos que f(x) es una
variable regionalizada, abreviado, una V.R. Se trata de un término
neutro, descriptivo, anterior, en particular a toda interpretación
probabilística.
Soporte – A menudo, no se conoce f(x), sino más bien su valor medio fv(x)
dentro de la muestra v tomada en el punto x. Esta regularizada fv(x) es
efectivamente más regular que la V.R. f(x). El volumen v se llama soporte
de la V.R. fv, regularizada de f. Otra tarea importante de la teoría de
las variables regionalizadas consistirá entonces en determinar las
características de fv conociendo las de f. Ejemplo: en un depósito,
prever las características de los paneles V’(variable fV’), conociendo las
características de f o de fv (muestras).
7
• teoría intrínseca: se trata de una aplicación de la teoría de las
funciones aleatorias; entonces se introducen interpretaciones
probabilísticas, y además, una cierta hipótesis de estacionaridad
(hipótesis intrínseca)
8
1 - LOS METODOS TRANSITIVOS
⎧1 si x ∈ S
k ( x) = ⎨
⎩0 si x ∉ S
S = ∫ k ( x)dx
Sean entonces dos puntos x y x+h (es decir el conjunto estructurante más
pequeño que podamos imaginar. Consideremos entonces la expresión
k(x)k(x+h): vale 1 si x y x+h pertenecen los dos a S, y 0 en otro caso.
Pero decir que x+h pertenece a S equivale a decir que x pertenece al
trasladado S-h de S según la traslación –h. Se tiene entonces:
9
⎧1 si x ∈ S ∩ S − h
k ( x ) k ( x + h) = ⎨
⎩0 si x ∉ S ∩ S − h
a/ Simetría: K ( h) = K ( − h)
Relaciones: S = K (0)
S 2 = ∫ K (h)dh
10
K (h) = K (0) − δ rDα
a/ Simetría: g ( h) = g ( − h)
g (h) ≤ g (0) = ∫ [ f ( x) ] dx
2
desigualdad:
(2) Q 2 = ∫ g (h)dh
1
∫ [ f ( x + h) − f ( x)] dx
2
g (0) − g (h) =
2
Si f(x) es continua por trozos, g(h) tiene un comportamiento lineal en
una vecindad del origen.
Si f(x) es derivable, g(h) tiene un comportamiento parabólico:
11
A menudo, g(h) no es continuo en h=0: dicho de otra manera, g(0) es mayor
que el límite de g(h) cuando h tiende a 0. Se dice entonces que hay un
efecto de pepita. Más que una discontinuidad verdadera, se trata,
frecuentemente, de una zona de transición muy rápida, la cual,
experimentalmente, se presenta como una discontinuidad.
Caso isótropo. Si g(h) = g(r) solo depende del módulo r = |h| del vector
h, su desarrollo en una vecindad del origen contiene una parte regular
(términos de grado par) y una parte irregular (términos en rλ, λ
diferente de un entero par, eventualmente con términos logarítmicos
r2klog(r)):
K (h) = S − D | h | +...
gp = f * p* f * p = f * f * p* p = fp * fp
12
se puede poner en la forma:
gp = g *P
con P = p * p : entonces el covariograma de la regularizada se obtiene
regularizando g con el covariograma transitivo P de la función de
ponderación p: gp es una función más regular que g, así como fp es más
regular que la V.R. inicial f.
f 2 ( x1 , x2 ) = ∫ f 3 ( x1 , x2 , x3 )dx3
f1 ( x3 ) = ∫∫ f3 ( x1 , x2 , x3 )dx1dx2
log (r ) → π r
r → −r 2log (r )
13
+∞
Q= ∫
−∞
f ( x)dx
p =+∞
Q* ( x0 ) = a ∑ f ( x0 + pa )
p =−∞
a
⎛ ⎞ dx +∞
E (Q* ) = ∫ ⎜ a ∑ f ( x0 + pa ) ⎟ 0 = ∫ f ( x)dx = Q
0⎝ p ⎠ a −∞
a
2 dx0
σ 2 (a) = E (Q*2 ) − Q 2 = ∫ ⎡⎣Q* ( x0 ) ⎤⎦ − Q2
0
a
+∞ +∞
∑∑ f ( x0 + pa ) f ( x0 + qa ) = a 2 ∑∑ f ( x0 + pa ) f ( x0 + pa + ka )
2
⎡⎣Q* ( x0 ) ⎤⎦ = a 2
p =−∞ q =−∞ k p
Integremos de 0 a a. Se tiene:
a a
0 k 0 p
+∞
= a2 ∑ ∫ f ( x0 ) f ( x0 + ka )dx0 = a 2 ∑ g (ka )
k −∞ k
+∞ +∞
(3) σ 2 (a) = a ∑ g (ka ) − ∫ g (h)dh
k =−∞ −∞
14
En el espacio de n dimensiones, se tiene un resultado totalmente análogo.
Por ejemplo, para n=3, y para una malla en forma de paralelepípedo a1 a2 a3
se tiene:
1
−r → a 2
6
r log (r ) → 0.0609a 3
2
1
(4) σ 2 (a) = Aλ a1+ λ = ( Aλ L1+ λ ) 1+ λ
n
Esta varianza está en razón inversa de n1+λ (y no en 1/n como lo habría
sugerido una aplicación errónea de la estadística clásica).
15
Figura 1: Zitterbewegung en la estimación de la superficie de un círculo
de diámetro 1, a partir de una malla cuadrada de lado a. En abscisa, la
malla a. En ordenada, la varianza de estimación correspondiente σ2(a). La
curva en morado representa el valor exacto, calculado a partir de la
fórmula exacta (1-14), la curva en azul representa la fórmula σ2(a) =
0.2276 a3 + 0.0047 a5 obtenida despreciando el Zitterbewegung y reteniendo
los dos primeros términos del desarrollo limitado dado por el principio
de correspondencia (Nota del T.: no corresponde a la figura original, la
cual es en parte errónea).
16
1-4-3 Fórmulas de aproximación para el espacio de dos o tres dimensiones.
K (h) = S − | h | Dα + ...
17
⎛ 3
⎞
σ S2 1 D ⎜ 1 a1 + 0.0609 ⎛ a2 ⎞ ⎟
2
= 3 ⎜ ⎟ ⎟
S 2
S ⎜ 6 a2 ⎝ a1 ⎠ ⎟
n2 ⎜
⎝ ⎠
La varianza es en 1/n3/3, siendo n el número de sondajes positivos. Para
utilizar esta fórmula a partir de los datos disponibles, se puede estimar
S atribuyendo a cada sondaje su rectángulo de influencia, lo que
proporciona:
S = na1a2
σ S2 1 ⎛ N2 N12 ⎞
(6) = ⎜ + 0.061 ⎟ ( N 2 ≤ N1 )
S2 n2 ⎝ 6 N2 ⎠
18
Se lee en la figura:
2D1 = 12 a1 es decir N1 = 6
2D2 = 8 a2 es decir N2 = 4
Por consiguiente:
σ S2 1 ⎡4 36 ⎤ 1.21
2
= ⎢ + 0.061× ⎥ =
S 100 ⎣ 6 4 ⎦ 100
19
2 – TEORIA DE LAS FUNCIONES ALEATORIAS INTRINSECAS
Siempre se puede considerar una realización de una y(x) de una F.A. Y(x)
como una variable regionalizada. Inversamente, se puede interpretar una
V.R. como una realización de una cierta F.A. Y(x): esta interpretación
permite aplicar a las V.R. los resultados de la teoría probabilística de
las F.A.
Observaciones
1/ No se puede afirmar que una V.R. y(x) es una F.A. Esto tendría el
mismo sentido que decir: el número 98 es una V.A. El enunciado correcto
de la hipótesis probabilística de base que deseamos introducir es: y(x)
es una realización de una F.A. Y(x).
2/ Para que esta hipótesis probabilística tenga un sentido real, es
necesario poder reconstituir, al menos en parte, la ley de la F.A. de la
cual suponemos que la V.R. y(x) es una realización, lo cual supone que la
inferencia estadística es posible. Por otra parte, la inferencia
estadística no es, en general, posible si se dispone de una sola
realización y(x) de Y(x) (de la misma manera, no se puede reconstituir la
ley de una V.A. Y a partir de un resultado numérico y=98 de un único
experimento.). Para que la inferencia estadística sea posible, es
necesario introducir hipótesis suplementarias acerca de la F.A. Y(x), de
manera de reducir en número de “parámetros” de los cuales depende la ley
de Y(x). Este es el objetivo de la hipótesis estacionaria que vamos a
definir: una F.A. estacionaria se repite, de una cierta manera, en el
espacio, y, esta repetición hace posible la inferencia estadística a
partir de una realización única. Precisemos ahora esta hipótesis:
20
F.A. estacionaria. – Se dice que una F.A. Y(x) es estacionaria si su ley
es invariante por translación. Dicho de otra manera, si x1, x2, ..., xk
son k puntos de apoyo arbitrarios (k entero cualquiera), las k variables
aleatorias Y(x1), Y(x2), ..., Y(xk) tienen la misma ley de probabilidad
(de k variables) que las k V.A. Y(x1+h), Y(x2+h), ..., Y(xk+h). En
adelante, Y(x) designará una F.A. estacionaria.
m = E[Y ( x)]
21
campo V aumenta. Si las muestras de tamaño v poseen una varianza a priori
finita, ésta debe ser igual al límite cuando V tiende a infinito, de la
varianza experimental σ2(v|V).
Es así como los autores de Africa del Sur (D. G. Krige, etc., ...), a
partir de cientos de miles de muestras tomadas en el gran yacimiento de
oro de Rand, calcularon la varianza de las muestras en paneles cada vez
más grandes, luego en toda una concesión, luego en el yacimiento de Rand
en su conjunto: obtuvieron una relación experimental de la forma:
⎛V ⎞
σ 2 (v | V ) = α log ⎜ ⎟
⎝v⎠
El crecimiento de la varianza se produce siempre según esta ley
logarítmica (fórmula de De Wijs) hasta el último punto experimental, en
el cual V/v es del orden de la decena de billones: Se puede concluir, con
plena seguridad, que, en este caso, no existe una varianza a priori
finita.
La función γ(h):
1
γ ( h) = E ⎡( Y ( x + h) − Y ( x) ) ⎤
2
(2)
2 ⎣ ⎦
22
(3) γ (h) = K (0) − K (h)
Como |K(h)|≤K(0), se tiene γ(h)≤2K(0), de manera que el variograma de una
F.A. estacionaria de orden 2 está necesariamente acotado. Existen
esquemas intrínsecos de uso muy corriente cuyo variograma γ(h) no está
acotado, y que no pueden, por consiguiente, verificar la hipótesis
estacionaria de orden 2 (tienen una varianza a priori infinita). Ejemplo,
esquema de De Wijs (γ(h)=3αlog|h|), esquema lineal (γ(h)=A|h|).
a/ Simetría:
K ( h ) = K ( − h) , γ ( h) = γ ( − h)
Desigualdades:
23
d/ Alcance. En el caso estacionario de orden 2, el alcance a(α) en
una dirección α es el valor de la distancia a partir de la cual, en esta
dirección, Y(x) e Y(x+h) no tienen correlación (o su correlación es
despreciable): K(h)=0 (o ≈0) para |h|≥ a(α).
24
Comportamiento lineal (tangente oblicua en el origen): γ(h) es continuo
en h=0, pero no es derivable en este punto, Y(x) es continua en media
cuadrática, pero no es derivable, luego es menos regular.
γ (r ) = ∑ a2 n r 2 n + ∑ cλ r λ + ∑ c2 n r 2 n log(r )
25
términos logarítmicos del tipo r2nlog(r)). Si no hay parte irregular, la
F.A. sería indefinidamente derivable, luego perfectamente regular. Por
consiguiente solamente la parte irregular representa el grado de
irregularidad de la F.A., y, en esta parte irregular, el término de más
bajo grado es el que juega el papel principal: se puede definir el grado
de regularidad de la F.A. como el grado λ del término irregular
principal. Daremos a continuación algunas indicaciones matemáticas
complementarias.
⎛ ⎡ Y ( x + h) − Y ( x ) ⎤ ⎞
2
Se demuestra que una F.A. intrínseca Y(x) admite una derivada m.c. Y’(x)
si y solo si γ(h) es derivable dos veces en h=0. La derivada segunda
γ”(h) existe entonces para todo h, Y’(x) es estacionaria de orden 2 (aún
en el caso en que Y(x) es solamente intrínseca) y admite como covarianza
la función γ”(h). Análogamente, Y(x) es derivable m.c. n veces si y solo
si la derivada γ(2n)(h) existe en h=0 (existe entonces para todo h).
I = ∫ Y ( x) p ( x)dx
v
26
Se define la integral I como el límite en media cuadrática (si existe) de
las sumas discretas:
n
I n = ∑ Y ( xi ) p ( xi )∆xi
i =1
I 2 = ∫ Y ( x) p ( x)dx ∫ Y ( y ) p ( y )dy
v v
= ∫ p ( x)dx ∫ K ( x − y ) p ( y )dy
v v
Yp ( x) = ∫ Y ( x + x ') p ( x´)dx
27
E ⎡⎣Yp ( x0 )Yp ( x0 + h) ⎤⎦ de Yp ( x0 ) e Yp ( x0 + h)
Se tiene:
Esta fórmula generaliza (4). Para presentarla en una forma más sintética,
hagamos el cambio de variables x=y+z. Queda:
P ( z ) = ∫ p ( y + z ) p( y )dy
y, por consiguiente:
K p (h) = ∫ K (h + z ) P ( z )dz
es decir, utilizando productos de convolución (porque P = P ):
(5’) Kp = K ∗P
(6’) γp =γ ∗P− A
28
La constante A se determina con la condición γp(0)=0. Estas relaciones
(6) y (6’) siguen siendo válidas para cualquier F.A. intrínseca (aún en
el caso en que la covarianza no existe).
A
1
A ∫0
Y2 ( x1 , x2 ) = Y ( x1 , x2 , x3 )dx1dx2 dx3
r1+ λ
r λ → Aλ
A
⎛ ⎛ λ⎞ ⎞
⎜ Γ ⎜1 + ⎟ ⎟
λπ
⎜ Aλ = π tg ⎛⎜ ⎞
r ⎝ 2⎠ ⎟
log (r ) → ⎟
A ⎜ ⎝ 2 ⎠ Γ ⎛1 + 1 + λ ⎞ ⎟
⎜ ⎜ ⎟
⎝ ⎝ 2 ⎠ ⎟⎠
r → − r 2log (r )
1 1
v ∫v v ' ∫v '
Z (v ) = Y ( x)dx ; Z (v ') = Y ( x)dx
29
1
v 2 ∫v ∫v
σ 2 (v ) = dx K ( x − y )dy
1
vv ' ∫v
Z (v) Z (v ') = Y ( x) dx ∫ Y ( y )dy
v'
1 1
σ (v, v ') = ∫ dx ∫ E[Y ( x)Y ( y )]dy =
vv ' v v ' vv ' ∫v ∫v '
dx K ( x − y )dy
1 1 2
2 ∫
dx ∫ K ( x − y )dy + 2 ∫ dx ∫ K ( x − y ) dy −
vv ' ∫v ∫v '
σ E2 = dx K ( x − y )dy
v v v v ' v' v'
2 1 1
(7) σ E2 = ∫ dx ∫ γ ( x − y )dy − 2 ∫ dx ∫ γ ( x − y )dy − 2 ∫ dx ∫ γ ( x − y )dy
vv ' v v v v v v ' v' v'
Se puede demostrar que (7) sigue siendo válida para toda F.A. intrínseca,
luego también en el caso en que K(h) no existe.
Varianza de estimación.
N
1
Z'=
N
∑Y (x )
i =1
i
30
conjunto v’ por sumas discretas sobre los N puntos xi. Se encuentra así
la segunda fórmula fundamental:
2 1 1
(8) σ N2 = ∑ ∫
Nv i v
γ ( xi − x)dx − 2 ∫ dx ∫ γ ( x − y )dy − 2
v v v N
∑∑ γ ( x − x )
i j
i j
2-4-2 Varianza de v en V.
∫
( Z (V ) = (1/ V ) Y ( x) dx es la ley media de V)
V
2 1
VV∫ γ ( x − y )dy − 2 ∫ dy ∫ γ ( y − y ')dy '
V V V
31
1
V 2 V∫ V∫
σ 2 (0 | V ) = dx γ ( x − y )dy
N
1
∑ E ⎡⎣( Z − Z (V ) ) ⎤
2
σ 2 (v | V ) =
N i =1
i ⎦
1 1
2 ∫
(9) σ 2 (v | V ) = dx ∫ γ ( x − y )dxdy − 2 ∫ dx ∫ γ ( x − y ) dxdy
V V V v v v
En particular, se tiene:
(9’) σ 2 (v | V ) = σ 2 (0 | V ) − σ 2 (0 | v)
σ 2 (v | V ) = −σ 2 (V | v)
d/ Relación de aditividad. Sean v, V y V’ tres volúmenes, con, por
ejemplo: v ⊂ V ⊂ V ' . De la relación (9’) se deduce:
σ 2 (v | V ) = σ 2 (0 | V ) − σ 2 (0 | v)
σ 2 (v | V ') = σ 2 (0 | V ') − σ 2 (0 | v)
y por diferencia:
32
La varianza de la muestra v en el campo V’ es igual a la suma de las
varianzas de v en el panel V y del panel V en el campo V’.
1 1
2 ∫
dx ∫ γ ( x − y )dy −
vv ' ∫v ∫v '
σ (v , v ' | V ) = dx γ ( x − y ) dy
V V V
1
N
∑ [Y ( x ) − Z (V )]
i
1 2
σ N2 = σ (0 | V )
N
33
En el caso aleatorio puro, la varianza de estimación es igual a la
varianza de una muestra en el campo V dividida por el número N de
muestras.
1
N
∑ [Y ( x ) − Z (v )]
i
i i
1 2
σ N2 = σ (0 | v)
N
En el caso de la malla aleatoria estratificada, la varianza de estimación
es entonces igual a la varianza de una muestra en su zona de influencia
dividida por el número N de muestras.
1 1
⎡⎣σ 2 (0 | V ) − σ 2 (0 | v) ⎤⎦ = σ 2 (v | V ) ≥ 0
N N
34
– la constante de pepita – que proporciona una suerte de medida global de
la “intensidad” de esta estructura sobrepasada.
γ 1 ( h) = C − C ( h)
γ ( h) = C − C ( h) + γ 2 ( h)
35
1 1
2 ∫
γ p ( h) = dx ∫ C ( x − y )dy − 2 ∫ dx ∫ C (h + x − y )dy
v v v v v v
1
v 2 ∫v ∫v
σ p2 = dx C ( x − y )dy
Por otra parte, por hipótesis, las dimensiones de v son grandes con
respecto a a y se tiene:
∫ C ( x − y)dy = ∫ C (h)dh
(integral extendida a todo el espacio) salvo si x está a una distancia
inferior a a de la frontera de v pero estos puntos ocupan un volumen
despreciable, se puede entonces despreciar su influencia, que es del
orden de a. Queda entonces:
1 1
2 ∫
σ p2 = dx ∫ C (h)dh = ∫ C (h)dh
v v v v
A
σ p2 =
v
y el coeficiente A=∫C(h)dh, que es la covarianza de las micro
estructuras, es el único recuerdo de éstas el cual subsiste a la escala
de los volúmenes v.
1 1
2 ∫
dx ∫ C ( x − y )dy − 2 ∫ dx ∫ C ( x − y )dy
v v v V V V
⎛1 1 ⎞
A⎜ − ⎟
⎝v V ⎠
36
En el caso de la varianza de estimación de V por N muestras de tamaño v,
se encuentra una componente pepítica igual a:
⎛ 1 1⎞
A⎜ − ⎟
⎝ Nv V ⎠
En todos los casos, la varianza debida al efecto de pepita es
inversamente proporcional al volumen de las muestras. Todo ocurre como si
la V.R. admitiera dos componentes independientes, uno muy regular
correspondiente al variograma γ2, el otro completamente aleatorio y
discontinuo el cual considera el efecto de pepita.
h
1
χ (h) = ∫ γ ( x)dx
h0
h h
2 2
2 ∫
F ( h) = x χ ( x)dx = 2 ∫ (h − x)γ ( x)dx
h 0 h 0
σ 2 ( h | L) = F ( L ) − F ( h)
χ(h) permite también el cálculo de covarianzas: La covarianza en L del
segmento h con una de sus extremidades (puntual) es:
σ (0, h | L) = F ( L) − χ (h)
b/ Varianza de extensión elemental. Se llama así a la varianza de
extensión al segmento h de la muestra puntual implantada en el centro del
segmento.
37
Está dada por:
⎛h⎞
(13) σ E2 = 2 χ ⎜ ⎟ − F (h)
⎝ ⎠2
1
∑ (Yi − Zi )
n i
1 1⎡ ⎛a⎞ ⎤
(14) σ N2 = σ E2 = ⎢ 2 χ ⎜ ⎟ − F (a ) ⎥
n n ⎣ 2
⎝ ⎠ ⎦
Se obtiene entonces la varianza de estimación al dividir la varianza de
estimación elemental de una muestra en su zona de influencia por el
número n de muestras.
38
cerrado con n+1 muestras es equivalente al dispositivo centrado con n
muestras.
1
σ E2 ' = 2 χ (h) − F (h) − γ (h)
2
que difiere de la varianza de estimación elemental (13). No se puede
dividir σ2E’ por n, porque los errores parciales cometidos no son
necesariamente independientes (en particular, estos dos segmentos tienen
en común la muestra central).
χb(h): media de γ(x-y), cuando x describe uno de los lados del rectángulo
e y recorre el interior del rectángulo. Se tiene:
h
1
χ b (h) = ∫ γ b ( x)dx
h0
39
h h
2 2
2 ∫
F (b, h) = x χ b ( x)dx = 2 ∫ (h − x)γ b ( x)dx
h 0 h 0
⎛h⎞
(15) σ E2 = 2 χ b ⎜ ⎟ − F (b, h) − γ b (0)
2
⎝ ⎠
c/ Estimación de S por rebanadas paralelas equidistantes.
∑ b (Y − Z )
i i i
∑b i
40
(16) σ 2
=
∑b σ i
2 2
Ei
(∑b )
E 2
i
1
σ E2 = σ E2
n i
(17)
21
σ = σ 2 (a) +
∑ bi σ Ei 2 2
( ∑ bi )
E 2
N
⎛a a⎞
(18) σ E2 = 2Q ⎜ , ⎟ − F (a, a)
2 2
⎝ ⎠
41
Para una malla cuadrada, se puede admitir que los errores cometidos al
estimar cada cuadrado a partir de su sondaje central son independientes.
La varianza de estimación con N sondajes es entonces:
1 2
σ N2 = σE
N
con un σ2E dado por (18).
42
• media de γ(h) en el paralelepípedo rectangular a, b, c: esta
función F(a, b, c) sirve para el cálculo de la varianza de una
muestra en este paralelepípedo.
3 - EL ESQUEMA ESFERICO.
π ⎛ 3 h 1 h3 ⎞
K ( h) = a 3 ⎜1 − + ⎟ si (| h |< a )
6 ⎝ 2 a 2 a3 ⎠
K ( h) = 0 si (| h |≥ a )
⎛ 3 r 1 r3 ⎞
γ (r ) = C ⎜ − 3 ⎟
si r < a
⎝2a 2a ⎠
γ (r ) = 0 si r ≥ a
1 ⎛A h⎞
F⎜ , ⎟
C ⎝a a⎠
43
Observación – A menudo, en las aplicaciones, los fenómenos de transición
están acompañados de un efecto de pepita: se les representará entonces
por un esquema esférico con efecto de pepita C0:
44
Esquema esférico
Varianzas de extensión diversas
45
46
4 - EL KRIGEADO
47
eliminados serán en realidad menos pobres que lo que se había previsto, y
los paneles conservados menos ricos.
Se considera que las leyes de BB’ con explotables, mientras que las leyes
de AA’ son explotables en el segmento CC’. Si nos contentamos con
calcular la media de las leyes BB’ y CC’, estamos seguros de cometer un
error por exceso: porque los trozos AC y C’A’ – pobres por construcción –
tienen una influencia no despreciable sobre el trapecio BB’ CC’. Si fuera
posible dibujar una frontera precisa entre mineral explotable e
inexplotable, en general, la frontera real, no coincidiría con las rectas
BC o B’C’, sino que sería una curva cualquiera, a menudo bastante
irregular, tal como la línea complicada BDEFC. Además en el panel rico
subsistirían enclaves pobres y recíprocamente. En la explotación
estaremos obligados de abandonar ciertas porciones ricas, y de tomar
ciertas partes pobres, y este ensuciamiento traduce de manera concreta la
influencia de los trozos pobres AC y C’A’ sobre el panel rico (como se
trata de un yacimiento homogéneo, y que la frontera precisa de la ley es
dudosa, nosotros hablaremos de krigeado, y no de ensuciamiento.
Emplearemos la palabra ensuciamiento en el caso en el cual los minerales
ricos y pobres son geológicamente heterogéneos, y están separados por una
frontera continua, representable por una curva relativamente regular, tal
como B’D’E’C’, que, por otra parte, no tiene ninguna razón para coincidir
con la recta B’C’). En este caso el krigeado conduce a ponderar las leyes
de BB’, CC’, y de los trozos AC y C’A’ por coeficientes convenientes, que
serían - por ejemplo – 60% para BB’, 27% para CC’ y 13% para los dos
trozos.
48
El efecto esencial de esta ponderación es eliminar – en promedio – un
error sistemático por exceso, luego un error inquietante. Al considerar
este objetivo primordial, la mejora de la precisión propiamente dicha,
aparece como secundaria.
n
(21) Z * = ∑ ai X i
i =1
n
(22) ∑a
i =1
i =1
49
⎧
⎪∑ a jσ i j = σ z xi + λ
⎪ j
(24) ⎨
⎪ a =1
⎪⎩∑
j
j
n −1
(25) an = 1 − ∑ ai
i =1
⎧ n −1
⎪∑ a jσ i j + anσ i n = σ z xi + λ
⎪ j =1
⎨ n −1
⎪ a σ +a σ =σ +λ
⎪⎩∑
j =1
j nj n nn z xn
⎧⎪ Ri j = σ i j − σ n j − σ ni + σ n n
(26) ⎨
⎪⎩ N i = σ z xi − σ z xn − σ i n + σ n n
n −1
(27) ∑a R
j =1
j ij = Ni
50
Los valores así obtenidos se pueden introducir en la expresión (23) de la
varianza de estimación, se obtiene entonces el valor mínimo σ K de la
2
n −1
(28) σ K2 = σ z2 − 2σ z x + σ x2 − ∑ ai N i
n n
i =1
σ E2 = σ z2 − 2σ z x + σ x2
n n
Z * = ∑ ai X i , Z '* = ∑ ai' X i
en que ai y ai’ son las soluciones del sistema (27), para los valores de
los segundos miembros Ni y Ni’ correspondientes a los paneles P y P’. Si
se desea krigear el panel P+P’ constituido por la unión de P con P’
(suponiendo que P y P’ son disjuntos), cuya ley real es:
P P'
Z= z+ z'
P + P' P + P'
51
se obtienen los segundos miembros del sistema al ponderar las covarianzas
por el tamaño de los paneles:
P P'
σzx = σ z xi + σ z ' xi
P+ P' P + P'
es decir efectuando la misma ponderación sobre los segundos miembros.
Resulta entonces que el carácter lineal del sistema de ecuaciones implica
que los coeficientes Ai del krigeado de P+P’ son:
P P'
Ai = ai + ai'
P + P' P + P'
y el estimador toma la forma:
P P' *
Z* = z* + z '
P+ P' P + P'
Dicho en otras palabras, existe la superposición de figuras de krigeado
(con ponderación por los tonelajes). En particular, esta condición se
cumple siempre en el caso de un krigeado completo – es decir en el caso
en que se krigea cada panel con la totalidad de las muestras en el
depósito entero. Luego tenemos el teorema: “los krigeados completos se
pueden superponer”.
1
S ∫∫
Ai = ai ( M )dS
S
52
De su lado, las ecuaciones del krigeado puntual constituyen un caso
particular simple de las ecuaciones generales. Sin embargo, escribiremos
explícitamente estas ecuaciones, en función del variograma γ(h), en el
caso en que se desea estimar la ley Z en el punto z a partir de las leyes
Xi observadas en los puntos xi. El estimador es de la forma:
n
Z * = ∑ ai X i
i =1
⎧ n
⎪∑ a j γ ( xi − x j ) = γ ( z − xi ) + λ
⎪ j =1
⎨ n
⎪ a =1
⎪⎩∑
i =1
i
n −1
∑a R
j =1
j ij = Ni
con:
⎧⎪ Ri j = γ ( xi − x j ) − γ ( xn − x j ) − γ ( xn − xi )
⎨
⎪⎩ N i = γ ( z − xi ) − γ ( xn − z ) − γ ( xn − xi )
5-0 INTRODUCCION.
53
evaluación de los recursos del depósito, en tonelaje y en ley. Sería
deseable conocer perfectamente estos diferentes parámetros. Pero la
información cuesta cara. En particular, los trabajos de reconocimiento
pueden representar un porcentaje no despreciable del total de las
inversiones. Llega un momento en el cual el valor de la información
suplementaria ya no está en razón con su costo. Entre estas dos
situaciones extremas, caracterizadas, una por gastos de investigación
nulos y riesgo de ruina máximo, la otra por una seguridad perfecta y
gastos de investigación infinitos, existe necesariamente una situación de
compromiso correspondiente a un óptimo. Donde se sitúa este óptimo y como
determinarlo, corresponden a las preguntas a las cuales trata de
responder esta última sección. En efecto, nos limitaremos al problema de
la determinación del volumen óptimo de los trabajos de reconocimiento.
Los datos económicos (precios del mineral) se suponen conocidos, igual
que las características técnicas del método de explotación y del
procedimiento de tratamiento retenidos. Estudiaremos en detalle la
influencia de la elección de dos parámetros técnicos muy importantes: el
ritmo anual de explotación, y la ley límite de corte.
54
el balance provisorio del proyecto de explotación construido a partir de
la información disponible a la salida de la primera fase. La de la
tercera se obtiene anticipando, en probabilidad, los resultados de la
segunda fase de trabajos y la decisión a tomar en C’: la esperanza
matemática pone en balance la disminución del riesgo de ruina con el
costo de los trabajos suplementarios. La Geoestadística proporciona, en
cada etapa, una medida objetiva de la información disponible en forma de
varianzas de estimación sobre el tonelaje y la ley, razonamientos simples
permitirán atribuirles una significación económica para luego calcular
numéricamente las diversas esperanzas matemáticas.
Pero esto no es todo. Además del riesgo de ruina, existen otros factores
que influyen sobre el volumen óptimo de los trabajos de reconocimiento.
En efecto, si se ha tomado la decisión de explotar y el riesgo de ruina
ha sido considerado como suficientemente débil, falta preparar un
proyecto de explotación, el mejor posible, el cual considera, en
particular, la elección óptima del ritmo anual de explotación y de la ley
límite. El ritmo óptimo y la ley límite óptima dependen naturalmente de
los recursos del depósito. Un error en la evaluación de los tonelajes y
de las leyes conduce a un dimensionamiento de la explotación que se aleja
del óptimo. Resulta una pérdida, cuyo valor probable puede ser calculado,
y debe ser puesto en balance con el costo de los trabajos suplementarios.
Aún en el caso de estar seguros de la explotabilidad del depósito, puede
suceder que sea interesante hacer más trabajos suplementarios de
reconocimiento, no para evitar un riesgo de ruina despreciable, sino más
bien para elegir el mejor programa de explotación.
55
5-1 ELECCION DE UNA LEY DE CORTE Y DE UN RITMO ANUAL DE EXPLOTACION.
56
se obtendrá una imagen de la variación de T(x) en la zona de leyes de
corte útiles, lo que será suficiente para las aplicaciones prácticas.
d (mT ) dm
(1) x= = m+
dT d (log(T ))
La relación m(T) podrá, a menudo, ser representada por una ecuación muy
simple:
(2) m = α − β log(T )
(3) x = m−β
57
Falta precisar los parámetros económicos útiles. Entre ellos,
distinguiremos principalmente tres: el precio de mercado, los gastos de
explotación anuales y el monto de las inversiones.
(4) V (m) = bm − b0
a1
(5) p (t ) = a0 +
t
Las inversiones agrupan el conjunto de gastos que es necesario realizar
antes de la apertura de la explotación (trabajos mineros preparatorios,
planta de tratamiento, eventualmente: campamento, caminos, vías férreas,
etc...) Se representan por una función creciente del ritmo t, es decir
I(t). Por el contrario, la razón I(t)/t de las inversiones a la
producción anual, es una función decreciente de t. En las aplicaciones se
puede utilizar una función lineal
(6) I (t ) = C0 + C1t
(7) I (t ) = C0 + C1t γ
58
Resulta cómodo incluir un parámetro suplementario, la duración de vida de
la mina N, relacionada con el tonelaje T(m) y al ritmo de explotación t
por medio de la relación siguiente:
T ( m)
(8) N=
t
El resultado de la explotación futura se representa, de manera cómoda,
por la expresión del valor actualizado de los beneficios futuros.
Designando por i a la tasa de actualización, y por Bi al valor
actualizado de los beneficios futuros a esta tasa, se tiene,
evidentemente:
1 − e − iN
(9) Bi = [V (m) − p (t )] t − I (t )
i
y, en el caso particular, muy importante en el cual se toma una tasa i
igual a 0, el beneficio no actualizado toma la forma simple:
En todos los casos, el beneficio puede ser considerado como una función
de los parámetros m y t, o si se prefiere (considerando las ecuaciones
(1), de x y de t, ley de corte y producción anual. Un criterio posible
para guiar la elección de estos dos parámetros consiste en maximizar este
beneficio.
59
⎧ dp dI
⎪⎪T dt + dt = 0
(11) ⎨
⎪x = p
⎪⎩ b
⎧ 1
⎪t = ⎛ a1T ( x) ⎞
1+ γ
⎜
⎪ ⎝ γ C1 ⎠ ⎟
⎨
⎪ 1⎛ a1 ⎞
⎪ x = ⎜ a0 + ⎟
⎩ b⎝ t ⎠
Para γ=1 este sistema proporciona una regla empírica, que se encuentra a
veces en la literatura, según la cual el ritmo de explotación anual debe
ser proporcional a la raíz cuadrada del tonelaje de las reservas.
60
trabajos de reconocimiento sea mínima. Este óptimo tiene el mismo
carácter técnico que en el párrafo anterior: los trabajos de
reconocimiento se consideran aquí como un parámetro técnico auxiliar, el
cual sirve para determinar el tamaño óptimo de la explotación. Entonces
se deberá razonar con una tasa i = 0, como en la sección 6-1. Debido a
que la función aproximada TE(x) conduce a una solución vecina del óptimo
real (t0, x0), esperamos observar una pérdida de segundo orden (lo cual no
significa que esta pérdida sea despreciable) cuyo valor esperado podrá
expresarse en función de las varianzas de estimación del tonelaje y de la
ley.
p 'δ T
δt =
Tp ''+ I ''
1
P = −δ [ (V − p)T − I ] = (Tp '+ I ')δ t + (Tp ''+ I '')δ t 2
2
Según la ecuación (11), el término de primer orden es nulo, porque
estamos cerca del óptimo. Al considerar la expresión de δt, se encuentra:
61
1 p '2
P= (δ T ) 2
2 Tp ''+ I ''
1 p '2
(12) P= σ T2
2 Tp ''+ I ''
Esta pérdida P debe ser puesta en balance con el costo R de los trabajos
de reconocimiento. R es una función decreciente de σ2T. Se obtendrá el
volumen óptimo de reconocimiento al resolver la ecuación:
dR 1 p '2
(13) + =0
dσ T2 2 Tp ''+ I ''
∂R 1 p '2 ∂σ T2
(14) +
∂ui 2 Tp ''+ I '' ∂ui
0.244 D1 D2
n3/ 2 S
siendo n el número de sondajes útiles, S el área mineralizada, D1 y D2 los
diámetros (más generalmente, las variaciones diametrales si el área S no
es convexa) del área mineralizada. Para un contorno elíptico se toma
62
D1 D2 2
= = 1.13
S π
y el primer término se reduce a 0.276/n3/2. El segundo término representa
el error de la potencia media y admite una expresión de la forma A/n,
donde A es ligeramente inferior a la varianza relativa de las potencias
en el depósito, y puede ser considerada como una constante (en realidad
es una función que decrece lentamente con n). Tomaremos un valor
razonable, como A=0.10.
En resumen, la varianza relativa tiene el valor:
σ T2 0.276 A
2
= +
T n3/ 2 n
Respecto de los valores económicos, tomaremos para p(t) e I(t)
expresiones de la forma (5) o (6), y designaremos por C el costo unitario
de sondaje. La suma que se desea minimizar, de la pérdida y del costo de
reconocimiento, se escribe, en función del número n de sondajes como:
1 ⎡ 0.414 A ⎤
a1C1T ⎢ 5 / 2 + 2 ⎥ = C
4 ⎣ n n ⎦
63
1. Se decide no explotar y abandonar el depósito (se cierra)
2. Se decide explotar inmediatamente (2)
3. Se decide hacer una segunda fase de reconocimiento TR2.
64
despreciable, la parte más grande de la varianza de estimación, la cual
proviene de la extensión de las secciones (que se supone conocidas) a sus
rebanadas de influencia a tres dimensiones, extensión sobre la cual la
mayor densidad de percutantes queda sin acción.
4
Dejaremos voluntariamente abierta la pregunta de saber si el beneficio
debe, o no, ser actualizado. En una economía colectivista, sin duda que
no se actualizaría. En economía competitiva, el razonamiento de la
primera parte, aún se aplica, al menos teóricamente: una gran sociedad,
que se fija como objetivo de producir cada año una cantidad ada de metal
al menor costo, debería buscar el mínimo de la suma de los gastos anuales
los cuales contienen los gastos de explotación, las inversiones para
reemplazar los yacimientos que llegan a su agotamiento ese año, y los
trabajos de reconocimiento para preparar el reemplazo de los depósitos
que se agotarán los años próximos. Este punto conduciría, en buena
lógica, a adoptar la expresión no actualizada del beneficio en la
optimización secuencial de los traabajos de reconocimiento (por otra
parte, correlativamente, el parámetro b no correspondería al precio de
mercado, sino más bien a un precio interno, definido, por la Sociedad de
manera, precisamente, de optimizar su programa de producción global).
65
cuenta, para la tercera decisión, el costo de la segunda fase de
reconocimientos TR2, dado que en C, TR2 no ha sido ejecutado).
⎧σ 12 = D 2 ( Z1 − Z )
⎪⎪ 2
⎨σ y = D (Y − Z )
2 *
⎪
⎪⎩σ 1, y = E[( Z1 − Z )(Y − Z )]
*
Z 2 = λY * + (1 − λ ) Z *
D 2 ( Z 2* − Z ) = λ 2σ y2 + 2λ (1 − λ )σ 1, y + (1 − λ ) 2 σ 12
se minimiza para:
σ y2 − σ 1, y σ y2 − σ 1, y
λ= 2 =
σ 1 + σ y2 − 2σ 1, y D 2 ( Z1* − Y * )
y vale entonces:
(15) σ 22 = D 2 ( Z 2* − Z ) = σ 12 − λ 2 D 2 ( Z1* − Y * )
Introduzcamos la varianza:
D 2 ( Z1* − Z 2* ) = λ 2 D 2 ( Z1* − Y * )
66
que representa el error que se comete al estimar el futuro estimador Z*2
(el estimador que se formará una vez efectuada la segunda fase) con la
ayuda del resultado Z*1 de los primeros trabajos. La relación (15) se
escribe:
(16) D 2 ( Z1* − Z 2* ) = σ 12 − σ 22
B = bT ( Z − m0 )
E ( B1 ) = 0
(17)
E ( B2 ) = bT ( Z1* − m0 )
67
costo no debe influenciar esta decisión), y la esperanza del beneficio,
(después de C’) será entonces:
bT ( Z 2* − m0 )
Si al contrario, se tiene
Z 2* < m0
G ( z ) = P ( Z 2* < z )
∞
(18) E ( B3 ) = bT ∫ ( z − m0 )dG ( z ) − R
m0
(5) Como hay varios metales, es más simple razonar directamente sobre
los valores finos contenidos, y no sobre las leyes.
68
proporcionaría una nueva (6) desviación estándar σ2=(1/2)σ1. Se deduce
entonces la desviación estándar σ de la estimación de m2 a partir de m1:
3 2
σ 2 = σ 21 − σ 12 = σ 1 = 0.13
2
El cálculo de las esperanzas (17) y (18) para los tres límites de
explotabilidad conduce a los resultados numéricos siguientes (en unidades
monetarias), razonando en el caso de una ley lognormal:
E(B1) 0 0 0
(6) Se supone que estamos en la zona lineal del variograma, de manera que
la nueva varianza es igual a un cuarto de la antigua.
69
6 EJERCICIOS
3/ Se dispone de n+2 sondajes S0, S1, S2, ...,Sn, Sn+1 en una malla regular,
en la cual el primer y el último sondaje son negativos y los otros
positivos. Se admite que cada una de las dos extremidades del intervalo
del cual se quiere estimar la longitud b puede caer en cualquier parte
del segmento (S0, S1) y (Sn, Sn+1) respectivamente, de manera independiente
una de la otra, con una densidad uniforme. La longitud b es entonces una
variable aleatoria. Probar que E(b)=na; D2(b)=a2/6: se encuentra bien la
varianza de estimación tal como la proporciona la fórmula de
aproximación, pero no se obtiene el término fluctuante.
70
E (Q* ) = ∫ f ( x)dx
E ((Q* ) 2 ) = a1a2 ∫ ( f ( x) ) dx
2
π D3 ⎛ 3 | h | 1 | h |3 ⎞
(Solución: K ( h) = ⎜1 − + ⎟ para h ≤ D.
6 ⎝ 2 D 2 D3 ⎠
Partir de la relación:
π
K ' ( h) =
4
(D 2
− h2 )
π
e integrar, observando que g (0) = D 3 ). Aplicación a la estimación del
6
volumen de esta esfera.
71
hλ 2h λ
χ ( h) = ; F ( h) =
λ +1 (λ + 1)(λ + 2)
2a λ ⎡ 1 1 ⎤ ⎡ 2 1⎤
⎢ λ
− ⎥ ; aλ ⎢ − ⎥
λ +1 ⎣ 2 λ + 2 ⎦ ⎣λ + 2 2⎦
Se tiene: σ2E>σ2E’, para λ>1 e inversamente, con igualdad para λ=1: para
λ>1, alta continuidad y la muestra única pero bien ubicada es superior a
las dos muestras mal ubicadas; para λ<1, estamos próximos del caso
aleatorio puro, y las dos muestras, a pesar de estar mal ubicadas,
proporcionan siempre mejores resultados que la muestra única; para λ=1
los dos dispositivos son equivalentes.
1 2a λ ⎡ 1 1 ⎤
⎢ −
n λ +1 ⎣ 2 λ
λ + 2 ⎥⎦
1 2a λ
n (λ + 1)(λ + 2)
1 2 Lλ
n (λ + 1)(λ + 2)
2 ⎡ 1 1 ⎤ h1+ λ h1+ λ
σ E2 = A − = B
λ + 2 ⎢⎣ 21+ λ λ + 3 ⎥⎦ A A
S 1+ λ
B
L2+ λ
72
Ejercicio 6. Mismo problema que en 5, pero se supone que además las
líneas están estimadas a partir de muestras (canaletas) a la malla a.
Calcular el término de línea.
(Solución:
C 1+ λ 2 ⎡1 1 ⎤
a con C = − )
L λ + 1 ⎣ 2 λ + 2 ⎥⎦
⎢ λ
a 2+λ
B (2 + λ )h1+ λ = λ Ca1+ λ + C (1 + λ )
A0
Y ( x) = ∑ f ( x − xi )
i
73
Ejercicio 9: Esquema esférico de una dimensión – Calcular las funciones
auxiliares del esquema esférico:
3 A 1 A3
γ (A ) = − para A ≤ a 1 para A ≥ a
2 a 2 a3
3 A 1 A3 3a
χ (A ) = − 3
para A ≤ a 1 − para A ≥ a
4a 8a 8A
1 A 1 A3 3 a 1 a2
F (A ) = − para A ≤ a 1 − + para A ≥ a
2 a 20 a 3 4 A 5 A2
b/ Varianza de extensión elemental de una muestra en su segmento b de
influencia, para b≤a y b≥2a . Interpretar.
⎛1 b 3 b3 3 a 1 a2 ⎞
⎜ + 3
y 1− − ⎟
⎝ 4 a 160 a 4 b 5 b2 ⎠
λ 1− λ λ
γ (l ) + γ (l ) + γ (2l ) = χ (l ) + µ
2 2 2
1− λ 1− λ λ
γ (l ) + γ (2l ) + γ (3l ) = 2 χ (2l ) − χ (l ) + µ
2 2 2
⎡1 1 ⎤ 1
λ ⎢ γ (3l ) − γ (2l ) − γ (l ) ⎥ = 2 χ (2l ) − 2 χ (l ) − γ (2l )
⎣2 2 ⎦ 2
4
2α − (2α − 1)
λ= α +1
1 + 2α +1 − 3α
74
Para α=0, λ=1/2 (efecto de pepita puro, el estimador óptimo es la media
aritmética de las 4 muestras). Cuando α aumenta, λ decrece, se anula para
α=1 (propiedad markoviana del variograma lineal) y es negativo para
1<α<2: para α>1, la realización presenta buenas propiedades de
continuidad y el dibujo adjunto hace comprender que, para
(Z1+Z4)/2<(Z2+Z3)/2 (por ejemplo), el estimador debe ser mayor que
(Z2+Z3)/2, luego λ<0:
Sean ZM y ZT las leyes medias de las líneas, sea Z la ley media desconocida
del yacimiento y sean σ2T = D2(Z-ZT) y σ2M = D2(Z-ZM) las varianzas de
estimación del yacimiento por las solas líneas horizontales y las solas
líneas verticales respectivamente. Se admite que (lo cual es verdadero
con una buena aproximación) E[(Z-ZM)(Z-ZT)]=0.
σ T2
λ=
σ + σ M2
2
T
σ M2 σ T2
σ T2 + σ M2
75
(Solución: los ponderadores son de la forma λ y 1-λ debido a la condición
que los pesos suman 1. Partir luego de:
D 2 ( Z − Z * ) = D 2 [λ ( Z − Z M ) + (1 − λ )( Z − ZT )] = λ 2σ M2 + (1 − λ ) 2 σ T2
y minimizar en λ.
76
BIBLIOGRAFIA.
77