TEOREMA DE CAUCHY - mp4 Hoy PDF
TEOREMA DE CAUCHY - mp4 Hoy PDF
TEOREMA DE CAUCHY - mp4 Hoy PDF
Resumen 6
Introducción 7
1
1.5 Sistemas lineales 52
i) Transformada de Fourier 52
ii) Convolución 55
iii) Sistemas lineales 57
iv) Deconvolución 59
2
4 Teoría de inversión en geofísica:
métodos locales vs. métodos globales 89
3
6 Inversión de Funciones de Receptor con
Algoritmos Genéticos y Cristalización Simulada 142
7 Comparación de resultados
con otras fuentes de información geofísica 193
4
Conclusiones y perspectivas 201
Bibliografía 206
Agradecimientos 214
5
Resumen
Este trabajo puede dividirse en dos grandes secciones. Una abarca del capítulo primero al
quinto, y la otra del sexto a las conclusiones. En la primera sección se exponen las bases
teóricas empleadas en la investigación que encierra la segunda. En esta última, se reúne
el tratamiento de los datos a partir de los cuales se desprendieron todos los resultados e
inferencias propuestas y discutidas al final.
En los capítulos teóricos, que son precisamente los que comprende la primer sección, se
expusieron, entre otros temas: la teoría de la elasticidad, la física de las ondas, los
sistemas lineales, la estructura global de nuestro planeta, las funciones de receptor, la
teoría de inversión, la solución de sistemas de ecuaciones, y los métodos de optimación
global utilizados en la investigación (Algoritmos Genéticos y Cristalización Simulada). De
esta manera se conformó un extenso marco teórico que soporta y justifica cada
herramienta utilizada, así como cada supuesto hecho durante la investigación.
A partir de los registros telesísmicos compilados en tres estaciones del Servicio
Sismológico Nacional: Zacatecas (ZAIG), Ciudad Universitaria (CUIG), y Tuzandépetl
(TUIG), se construyeron series de tiempo denominadas “funciones de receptor”, cuya
característica principal es la de poseer exclusivamente la información sísmica proveniente
de la estructura geológica localizada abajo del receptor. Empleando dos esquemas de
optimación global, Algoritmos Genéticos y Cristalización Simulada, se modelaron dichas
funciones resolviendo el problema inverso formulado con esa finalidad. Los resultados
fueron tres diferentes modelos estructurales de velocidades de propagación, espesores
de capas, y relaciones de Poisson para la corteza y el manto superior, uno para cada sitio.
Al final, se compararon entre sí dichos modelos, y con aquéllos propuestos anteriormente
por otros autores para las respectivas regiones de la República Mexicana.
6
Introducción
1
Se les conoce como períodos de ciencia normal, a los lapsos en la historia de la ciencia durante los cuales
los conocimientos aportados fueron desprendidos de un paradigma no cuestionado a lo largo de dichos
períodos (Chalmers, 1982).
7
Lo que distingue a esta investigación del resto son, principalmente, las herramientas
matemáticas con las que fueron modeladas las funciones de receptor. Se trata de dos
esquemas numéricos de optimación global que en los últimos años han cobrado gran
importancia en la resolución de problemas inversos, donde la minimización (o
maximización) de funciones es el objetivo. Dichos métodos se conocen como algoritmos
genéticos (“genetic algorithms”, GA), y cristalización simulada (“simulated annealing”, SA).
Sin lugar a dudas, el auge que a partir de la segunda mitad de este siglo fueron tomando
se debe a la capacidad que ambos tienen para resolver problemas altamente no lineales y
con múltiples soluciones.
En México, uno de los campos que no ha sido agotado desde el punto de vista
sismológico, es la determinación de la estructura cortical en diferentes puntos geográficos
de nuestro país. Es verdad que existen trabajos donde se emplearon múltiples técnicas
para establecer dicha estructura (entre otros: Gomberg et al., 1988; Campillo et al., 1989 y
1996; Valdés-González y Mayer, 1996; Urrutia-Fucugauchi y Flores-Ruiz, 1996). Sin
embargo, la información generada sigue siendo insuficiente. Sobre todo si se sabe que de
un buen modelo cortical dependen muchas cosas, como la localización precisa de los
focos sísmicos, la determinación adecuada de los mecanismos de ruptura, o simplemente
una mejor fundamentación de la evolución tectónica y situación actual de las placas que
interactúan en México. Por todo esto, quedan plenamente justificadas las razones que
motivaron la realización de este trabajo, en el que se estudiaron telesismos registrados en
tres estaciones pertenecientes al Servicio Sismológico Nacional: Zacatecas (ZAIG),
Ciudad Universitaria (CUIG), y Tuzandépetl (TUIG).
Antes de llegar al tratamiento de las observaciones en cada estación, fue necesario hacer
una revisión teórica detenida de todas las implicaciones del fenómeno modelado, así
como de las herramientas matemáticas y numéricas empleadas. De esta manera,
conformado el marco teórico como un preámbulo a la investigación, se llevaron a cabo los
modelados correspondientes a las tres estaciones, confrontando los resultados entre sí, y
con aquéllos anteriormente propuestos por otros autores para cada sitio.
8
1 Aspectos teóricos sobre
la física de las ondas y los
sistemas lineales.
Capítulo 1 1.1 Teoría de esfuerzos
Mn
ρ ( P ) = lim , donde Vn → 0 (1.1-1)
n→∞ Vn
2
Deben considerarse todas las direcciones de aproximación hacia P para verificar la existencia del límite.
10
Capítulo 1 1.1 Teoría de esfuerzos
P Ε2 Ε1 Ε0
Cabe destacar que un medio continuo, para que así lo sea, no depende del hecho de ser
homogéneo o heterogéneo. En el primer caso, se ve que la sucesión de cocientes
implicados en la expresión (1.1-1), conforme Vn tiende a cero, son exactamente iguales
entre sí e iguales al valor del límite. En el segundo caso, el de un material heterogéneo
como lo es la atmósfera, cuya densidad varía con la altura, es claro que no existirán
dichas igualdades. Este hecho, sin embargo, no implica la indefinición del límite. En otras
palabras, en un medio continuo las propiedades intensivas3, como lo son la densidad, el
peso específico, la temperatura, etc. deben cumplir necesariamente con las condiciones
de continuidad y derivabilidad anteriormente descritas (ya sea en el tiempo o en el
espacio, según sea la propiedad en cuestión).
3
Estas propiedades son puntuales, es decir, su valor no depende de la cantidad de substancia presente.
11
Capítulo 1 1.1 Teoría de esfuerzos
Para definir este concepto, imaginemos nuevamente una porción de materia Ε cualquiera
y una subporción delimitada por S contenida en Ε (figura 1.2). Nos interesa expresar la
interacción que existe entre el material contenido dentro de S y el que se encuentra
afuera. Esta interacción se puede dividir en dos tipos: la que es provocada por fuerzas
x2
∆F n
∆S
S
E x1
x3
límite definido dF dS (ecuación 1.1-2) y además que el momento de las fuerzas actuando
n ∆F dF
T = lim = (1.1-2)
∆S → 0 ∆S dS
12
Capítulo 1 1.1 Teoría de esfuerzos
Si agrupamos las nueve componentes que forman a estos vectores, mostradas en dicha
ecuación, se crea una matriz cuadrada de tres por tres que, dadas las leyes de
transformación con las que cumple, constituye un tensor de 2do orden. A éste se le conoce
13
Capítulo 1 1.1 Teoría de esfuerzos
τ km = τ ji ⋅ βkj ⋅ βmi .
A partir de esta entidad matemática (el tensor de esfuerzos), es posible conocer las
tracciones en cualquier parte del medio, siempre y cuando se cumplan los siguientes
supuestos: que los esfuerzos estén definidos en todo el medio y que el campo de
esfuerzos sea continuo.
La fórmula de Cauchy, como se verá en el siguiente apartado, nos va a permitir precisar
dicho estado en cualquier punto.
⎛ n1 n1 n1 ⎞
( )
n1
Ti = ⎜⎝ T1 , T2 , T3 ⎟⎠ = τ n11 , τ n1 2 , τ n1 3
T = ⎜⎝ T , T , T ⎟⎠ = (τ )
n2
⎛ n2 n2
⎞n2
i 1 2 3 n2 1 , τ n2 2 , τ n2 3 (1.1-3)
T = ⎜⎝ T , T , T ⎟⎠ = (τ )
n3
⎛ n3 n3
⎞n3
i 1 2 3 n3 1 , τ n3 2 , τ n3 3
Hay que notar que en la ecuación (1.1-3), las direcciones normales están representadas
por los vectores n1, n2 y n3 a diferencia de como aparecen expresadas en las
componentes del esfuerzo de la figura 1.3, en donde tales direcciones se muestran con
los números 1, 2 ó 3 en el primer dígito de los subíndices de las componentes, por
semejanza con los nombres de los ejes coordenados.
n1 n2 n3
La Fórmula de Cauchy nos dice que si se conocen los esfuerzos Ti , Ti y Ti a través de
tres planos perpendiculares entre sí de un cuerpo, esto es, si se conoce el tensor de
14
Capítulo 1 1.1 Teoría de esfuerzos
Para demostrar esta relación tan simple, la Fórmula de Cauchy, imaginemos los tres
planos perpendiculares antes mencionados y un cuarto plano oblicuo cualquiera con
normal ni, que en conjunto definen un tetraedro como se muestra en la figura 1.4.
Supongamos que las dimensiones de este volumen son infinitesimales por lo que el plano
oblicuo será dS y los tres restantes dS1,
n
Ti
dS2 y dS3 dependiendo del eje coordenado al que sean normales (figura 1.4). Observando
la cara dS1 se ve que ésta es la proyección, sobre el plano coordenado x2-x3, de la
superficie dS. Esto puede escribirse de la siguiente manera:
15
Capítulo 1 1.1 Teoría de esfuerzos
dS 1 = dS ⋅ cos( x1 , ni ) ∴
(1.1-5)
dS 1 = dS ⋅ n1
1
dv = h ⋅ dS (1.1-6)
3
donde h es la distancia en dirección normal del vértice P a la base dS. Las fuerzas, en la
dirección positiva del eje x1 que actúan sobre las tres superficies coordenadas pueden ser
escritas como
F1dS1 = ( −τ 11 + ε 1 ) ⋅ dS1
F1dS2 = ( −τ 21 + ε 2 ) ⋅ dS2 (1.1-7)
F1
dS3
= ( −τ 31 + ε 3 ) ⋅ dS 3
donde τ11, τ21 y τ31 son los esfuerzos en esa dirección que existen en el vértice P opuesto
a dS, y las “ε” están incluidas porque las tracciones están actuando en una posición
infinitesimalmente distante de P y no en P. Por otro lado, la fuerza actuando en el
n
triángulo normal a ni tiene una componente (T1 + ε ) ⋅ dS en dirección positiva del eje x1, y
n d r
∫ T⋅ dS + ∫ X ⋅ dv =
s v dt ∫v
v ⋅ ρ ⋅ dv (1.1-8)
n
donde T representa a las fuerzas superficiales por unidad de área, X representa a las
r
fuerzas de cuerpo por unidad de volumen, v a la velocidad del elemento, y ρ a la masa
por unidad de volumen (densidad). De esta manera, si aplicamos la ecuación (1.1-8) para
16
Capítulo 1 1.1 Teoría de esfuerzos
todas las fuerzas actuando en el elemento, utilizando las ecuaciones (1.1-5), (1.1-6) y
(1.1-7) se tiene que
Dividiendo toda la ecuación entre dS, y tomando el límite cuando h → 0 vemos que todas
las “ε” y algunos términos desaparecen, obteniendo el siguiente resultado
n
T1 = τ 11n1 + τ 21n2 + τ 31n3 (1.1-10)
τ ij = τ ji (1.1-11)
supondremos que un cubo infinitesimal con lados dx1, dx2 y dx3, como el que se muestra
en la figura 1.5, se encuentra en dicho equilibrio. Desarrollaremos la sumatoria de
momentos y la igualaremos con cero. De esta ecuación de equilibrio podremos demostrar
la validez de la equidad (1.1-11). El análisis se llevará a cabo sólo con respecto al eje x3.
Los resultados obtenidos podrán deducirse de manera similar para los otros dos ejes. Los
17
Capítulo 1 1.1 Teoría de esfuerzos
esfuerzos y las fuerzas de cuerpo existentes que producen un momento con respecto al
eje en estudio, se muestran en la figura 1.5. Nótese que la fuerza τ 11 ⋅ dx2 ⋅ dx3 actúa en
∂τ22
τ22 +
∂x2 2 τ + ∂τ21 dx
dx
21
∂x2 2
dx3
∂τ 12
∂τ τ 12 + dx
τ 32 + 32 dx 3 ∂x1 1
∂x 3
∂τ 11
τ 11 + dx
∂x1 1
dx2
∂τ 31
dx1 τ 31 + dx
∂x 3 3
[ ]
el lado izquierdo, mientras que la fuerza τ11 + (∂τ11 ∂x1 ) ⋅ dx1 dx2 ⋅ dx3 actúa en el lado
opuesto, de manera similar que para el resto. Estas expresiones parten de asumir la
continuidad de los esfuerzos en el medio. La fuerza de cuerpo está dada por
X i ⋅ dx1 ⋅ dx2 ⋅ dx3 . Ahora bien, teniendo el cuidado apropiado con las distancias
perpendiculares que separan a cada línea de acción de las fuerza, del eje x3, la ecuación
de equilibrio nos queda:
⎛ ∂τ ⎞ dx dx
− ⎜ τ 11 + 11 dx1 ⎟ dx2 dx3 2 + τ 11dx2 dx3 2 +
⎝ ∂x1 ⎠ 2 2
⎛ ∂τ ⎞ ⎛ ∂τ ⎞
+ ⎜ τ 12 + 12 dx1 ⎟ dx2 dx3dx1 − ⎜ τ 21 + 21 dx2 ⎟ dx1dx3dx2 +
⎝ ∂x1 ⎠ ⎝ ∂x2 ⎠
⎛ ∂τ ⎞ dx dx
+ ⎜ τ 22 + 22 dx2 ⎟ dx1dx3 1 + τ 22 dx1dx3 1 +
⎝ ∂x2 ⎠ 2 2 (1.1-12)
⎛ ∂τ ⎞ dx dx
+ ⎜ τ 32 + 32 dx3 ⎟ dx1dx2 1 + τ 32 dx1dx2 1 +
⎝ ∂x 3 ⎠ 2 2
⎛ ∂τ ⎞ dx dx
− ⎜ τ 31 + 31 dx3 ⎟ dx1dx2 2 + τ 31dx1dx2 2 +
⎝ ∂x3 ⎠ 2 2
dx2 dx
− X 1dx1dx2 dx3 + X 2 dx1dx2 dx3 1 = 0.
2 2
18
Capítulo 1 1.1 Teoría de esfuerzos
Si dividimos toda la ecuación entre dx1 ⋅ dx2 ⋅ dx3 y calculamos los límites cuando
τ12 = τ 21 . (1.1-13)
Como ya se dijo, si se lleva a cabo un análisis semejante con respecto a los otros dos
ejes cartesianos x1 y x2, entonces se llegaría al resultado general expresado en la
ecuación (1.1-11).
19
Capítulo 1 1.2 Teoría de deformaciones
ui = xi − ai . (1.2-2)
20
Capítulo 1 1.2 Teoría de deformaciones
xi = xi (a1 , a2 , a3 )
(1.2-3)
ai = ai ( x1 , x2 , x3 )
ui ( x1 , x2 , x3 ) = xi − ai ( x1 , x2 , x3 ). (1.2-5)
21
Capítulo 1 1.2 Teoría de deformaciones
De las relaciones unívocas entre la posición final e inicial de una partícula, expresadas en
la ecuación (1.2-3), tenemos que
∂xi
dxi = da
∂a j j
(1.2-8)
∂a
dai = i dx j
∂x j
∂ai ∂a j
ds02 = δ ij dai da j = δ ij dx dx
∂xl ∂xm l m
(1.2-9)
∂x ∂x j
ds2 = δ ij dxi dx j = δ ij i da da
∂al ∂am l m
22
Capítulo 1 1.2 Teoría de deformaciones
la diferencia entre estas expresiones puede ser escrita de los dos siguiente modos,
después de haber realizado algunos cambios adecuados en la simbología de los índices.
⎛ ∂xα ∂x β ⎞
ds 2 − ds02 = ⎜⎜ δαβ − ∂ij ⎟⎟ dai da j
⎝ ∂ai ∂a j ⎠
(1.2-9)
⎛ ∂aα ∂a β ⎞
ds 2 − ds02 = ⎜⎜ ∂ij − δαβ ⎟ dx dx
⎝ ∂xi ∂x j ⎟⎠ i j
1⎛ ∂x ∂x ⎞
a) ; E ij = ⎜⎜ δαβ α β − ∂ij ⎟⎟
2⎝ ∂ai ∂a j ⎠
(1.2-9)
1⎛ ∂aα ∂a β ⎞
eij = ⎜⎜ ∂ij − δαβ ⎟
∂xi ∂x j ⎟⎠
b) ;
2⎝
ds 2 − ds02 = 2 ⋅ E ij dai da j
(1.2-10)
ds 2 − ds02 = 2 ⋅ eij dxi dx j .
son simétricos, y serán iguales a cero si ds − ds0 = 0 según las ecuaciones (1.2-10).
2 2
4
El operador delta de Kronecker (δij) es un símbolo cuyo valor será igual a uno si i = j , o igual a cero si i ≠ j .
23
Capítulo 1 1.2 Teoría de deformaciones
uα = xα − aα (1.2-11)
que obteniendo las derivadas parciales en ambos lados de la igualdad y despejando los
términos de “x” y de “a” nos da
∂xα ∂uα
= + δαi ,
∂ai ∂ai
(1.2-12)
∂aα ∂u
= δαi − α
∂xi ∂xi
1 ⎡ ⎛ ∂uα ⎞ ⎛ ∂uβ ⎞ ⎤
Eij = ⎢δαβ ⎜ + δαi ⎟ ⎜⎜ + δβj ⎟⎟ − δij ⎥
2 ⎢⎣ ⎝ ∂ai ⎠ ⎝ ∂a j ⎠ ⎥⎦
(1.2-13)
1 ⎡ ∂u j ∂ui ∂uα ∂uα ⎤
Eij = ⎢ + + ⎥.
2 ⎢⎣ ∂ai ∂a j ∂ai ∂a j ⎥⎦
Haciendo una sustitución similar pero para el tensor de Almansi, queda reducido a lo
siguiente
1⎡ ⎛ ∂u ⎞ ⎛ ∂uβ ⎞⎤
eij = ⎢δij − δαβ ⎜ − α + δαi ⎟ ⎜⎜ − + δβj ⎟⎟ ⎥
2 ⎢⎣ ⎝ ∂xi ⎠ ⎝ ∂x j ⎠ ⎥⎦
(1.2-14)
1 ⎡ ∂u j ∂ui ∂uα ∂uα ⎤
eij = ⎢ + − ⎥.
2 ⎢⎣ ∂xi ∂x j ∂xi ∂x j ⎥⎦
Si uno considera al tensor Euleriano ec. (1.2-14), en donde las componentes del vector
desplazamiento están en función de las coordenadas posteriores a la deformación “xi” y
dichas componentes ui son tales que el valor de sus primeras derivadas es muy pequeño
y por lo tanto los productos de estas derivadas parciales son insignificantes, entonces,
24
Capítulo 1 1.2 Teoría de deformaciones
1 ⎡ ∂u j ∂ui ⎤
eij = ⎢ + ⎥ . (1.2-15)
2 ⎢⎣ ∂xi ∂x j ⎥⎦
Es importante introducir una notación muy usada en el manejo de este tensor. Esta
notación emplea las letras u, v, w para referirse a las tres componentes del vector
desplazamiento u1, u2, u3 respectivamente. De igual forma para las variables
independientes se usa x, y, z en lugar de x1, x2, x3 respectivamente.
25
Capítulo 1 1.3 Teoría de la elasticidad
26
Capítulo 1 1.3 Teoría de la elasticidad
Cijkl = C jikl
(1.3-2)
C 'ijkl = C 'ijlk .
27
Capítulo 1 1.3 Teoría de la elasticidad
La ecuación constitutiva (1.3-4) puede transformarse de tal manera que sean las
deformaciones las que queden expresadas en función de los esfuerzos. En este caso, las
dos constantes elásticas independientes que se acostumbran usar son E y ν tal y como se
ve en la ecuación que sigue:
eij =
1
E
[ ]
(1 + υ )σ ij − υδ ijσ kk . (1.3-5)
5
Las direcciones principales son aquellas en las que deben estar los ejes coordenados para que los esfuerzos
de cizalla se anulen, esto es que σij=0 para toda i ≠ j .
28
Capítulo 1 1.3 Teoría de la elasticidad
∂
∑ F = ∂t (m ⋅ v ) .
i i (1.3-7)
n ∂
∫S
T ⋅ dS + ∫ X ⋅ dV =
V ∂ t ∫V i
v ⋅ ρ ⋅ dV . (repetida 1.3-8)
∫ F ⋅ dS = ∫ (∇ ⋅ F )dV
s V
a la misma integral nos queda, después de agrupar términos, que
⎛ ∂τ ij ⎞ ∂
∫ ⎜⎜ ∂ xj
+ X i ⎟dV = ∫
⎟ V ∂ t
( vi ρ )dV (1.3-9)
⎝ ⎠
V
e igualando los integrandos, ya que ambas integrales están definidas sobre el mismo
volumen, y escribiendo a la derivada de la velocidad como la segunda derivada del
desplazamiento con respecto al tiempo, tenemos finalmente que
∂τ ij ∂ 2 ui
+ Xi = ρ . (1.3-10)
∂ xj ∂ t2
6
No se pierda de vista que la aceleración del cuerpo esta dada por ai = ∂ vi ∂t , que es con la que se
acostumbra expresar dicha Ley.
29
Capítulo 1 1.3 Teoría de la elasticidad
∂τ x ∂τ xy ∂τ xz ∂ 2u
+ + +X =ρ (1.3-11)
∂ x ∂ y ∂ z ∂ t2
y si escribimos los componentes del tensor de esfuerzos, como ya se mencionó antes, tal
cual lo indica la Ley de Hooke (1.3-4), y simultáneamente sustituimos el tensor de
deformaciones infinitesimales (ecuación 1.2-15) para expresar a las deformaciones en
términos de los desplazamientos, entonces tenemos
∂ ⎡ ∂ u ∂ v ∂ w⎤ ∂ ⎡ ⎛ ∂ u ∂ v ⎞⎤ ∂ ⎡ ⎛ ∂ u ∂ w⎞⎤ ∂ 2u
λ + µ + λ + λ + µ ⎜ + ⎟ + µ⎜ + ⎟ + = ρ
∂ x ∂ y ∂ z ⎥⎦ ∂ y ⎢⎣ ⎜⎝ ∂ y ∂ x ⎟⎠⎥⎦ ∂ z ⎢⎣ ⎝ ∂ z ∂ x ⎠⎥⎦
( 2 ) X
∂ x ⎢⎣
(1.3-12)
∂ t2
⎛ ∂ 2u ∂ 2u ∂ 2u ⎞ ⎛ ∂ 2u ∂ 2v ∂ 2w ⎞ ∂ 2u
µ⎜⎜ + + ⎟
2 ⎟
+ (λ + µ )⎜ + + ⎟
⎜ ∂ x 2 ∂ x∂ y ∂ x∂ z ⎟ + X = ρ . (1.3-13)
⎝∂ x ∂ y ∂ z ⎠ ∂ t2
2 2
⎝ ⎠
Si desarrolláramos las otras dos ecuaciones restantes en las direcciones x2 y x3 (que son
muy parecidas a ésta), y las escribimos todas ellas en notación indicial empleando los
subíndices i, j, k, entonces se podrían condensar las tres ecuaciones en una sola. Esta
ecuación general está dada por:
30
Capítulo 1 1.3 Teoría de la elasticidad
∂ 2ui ∂ 2uk ∂ 2u
µ + (λ + µ ) + X i = ρ 2i (1.3-14)
∂ x j∂ x j ∂ xi∂ xk ∂t
pero se acostumbra escribirla empleando el operador nabla7 (∇), siendo ésta la forma
más conocida de la ecuación de Navier:
r ∂ 2 ur
µ∇ 2 ur + ( λ + µ )∇(∇ ⋅ ur ) + X = ρ (1.3-15)
∂ t2
r r r r
donde ∇ 2 u = ∇(∇ ⋅ u ) − ∇ × (∇ × u) . Si despreciamos las fuerzas de cuerpo X
anulándolas, entonces recibe el nombre de ecuación de Navier reducida.
⎛ ∂ ∂ ∂ ⎞
7
Este operador vectorial se define como: ∇ = ⎜ , , ⎟⎟
⎜
⎝ ∂ x1 ∂ x 2 ∂ x 3 ⎠
31
Capítulo 1 1.4 Propagación de ondas
1 ∂ 2Ψ
2 = ∇ Ψ,
2
(1.4-1)
V ∂t
2
Ψ t0 t0+∆t
xo ∆x
x
P0 P1
Fig. 1.7 Cambio de posición por el paso del tiempo de una onda.
Ψ0 = f ( x0 − Vt0 ) .
8
Recibe el nombre de solución de D’Alembert.
32
Capítulo 1 1.4 Propagación de ondas
Ψ1 = f {x0 + ∆x − V (t 0 + ∆t )} .
Dado que la función adquiere el mismo valor (máximo) en las posiciones e instantes
recién mencionados, esto es que Ψ0 = Ψ1 en t=t0 y t= t0+∆t, entonces se puede escribir
que
x0 − Vt 0 = x0 + ∆x − V (t 0 + ∆t )
y por lo tanto que
0 = ∆x − V∆t .
Esto quiere decir que la constante V es igual al cociente del incremento de la distancia
entre el incremento del tiempo ∆x/∆t, que es precisamente la velocidad con que viajó la
forma de onda en el lapso estudiado. Ahora bien, una función g(t+Vt) también es solución
de (1.4-1), y describe una onda que viaja en el sentido negativo del eje x. Por esto, una
solución más general para el caso unidimensional de la ecuación de onda es
Ψ = f ( x − Vt ) + g( x + Vt ) . (1.4-2)
Si pensamos que las ondas descritas por esta ecuación, que viajan en dirección del eje x,
se propagan en un sistema de referencia tridimensional, es claro que el valor de la función
Ψ no depende de la posición en un plano perpendicular a este eje. Por ejemplo, para el
plano x=x0, Ψ = ctte. Esto quiere decir que la función Ψ es igual para cualquier valor de y
o de z. A las ondas que cumplan con esta cualidad se les conoce como ondas planas.
Implícitamente se está suponiendo que la fuente que dio origen a la perturbación se
encuentra infinitamente alejada. A cada uno de los planos, que son perpendiculares al
eje x en este caso particular, se le conoce como frente de onda. Si definimos como la fase
de una onda al argumento (x-Vt), entonces, formalmente podemos decir que, un frente de
onda es aquel plano9 donde el valor de la fase de cierta onda es el mismo.
Hay que notar que la onda está viajando en la dirección normal al frente de onda. Esto
sucederá siempre y cuando el material sea isótropo. A la línea imaginaria que señala esta
dirección se le llama trayectoria de la onda.
9
En nuestro caso que se refiere exclusivamente a ondas planas, ya que también existen ondas esféricas o
cilíndricas cuyos frentes de ondas corresponden a superficies esféricas o cilíndricas respectivamente, que no
estudiaremos.
33
Capítulo 1 1.4 Propagación de ondas
P(x,y,z)
θ z
θ y
θ x
l = cosθ x
m = cosθ y
n = cosθ z
origen y el punto P (figura 1.8) es x’ = lx + my + nz, donde x, y, z son las coordenadas del
punto. Por lo tanto, podemos escribir finalmente la ecuación (1.4-2) de una forma más
general que considere cualquier dirección de propagación como:
Ψ = f ( xl + ym + zn − Vt ) + g ( xl + ym + zn + Vt ) (1.4-3)
Como ya se dijo, las funciones f y g de la ecuación (1.4-3) pueden tomar diversas formas.
Sin embargo, la solución más conveniente es una función exponencial que contenga la
fase que ya establecimos, de la siguiente manera:
Ψ= Ae [
iϖ ( xl + ym+ zn ) /V − t ]
(1.4-4)
34
Capítulo 1 1.4 Propagación de ondas
z z
a) b)
σyy
σyx
y y
x x
35
Capítulo 1 1.4 Propagación de ondas
SH
z
SV
Para facilitar el análisis de las ondas S, y poder entender otros fenómenos más complejos
relacionados con la incidencia crítica10 y postcrítica de ondas en interfases, se ha
convenido descomponer al desplazamiento debido a estas ondas (paralelo al frente de
onda) en dos componentes polarizados perpendicularmente entre sí, como se muestra en
la figura 1.10. Ambos están contenidos en el frente de onda, sin embargo, uno es
horizontal y se llama componente SH. El otro es perpendicular al anterior y se llama
componente SV.
El teorema de Helmholtz establece que un campo vectorial, como lo es el del
r
desplazamiento, puede construirse a partir de un potencial escalar φ y otro vectorial Y ,
de la siguiente manera:
r r r r r
u ( x , t ) = ∇φ ( x , t ) + ∇ × Y ( x , t ) (1.4-5)
10
Ángulo con que incide una onda en una interfase a partir del cual comienzan a aparecer ondas evanecentes,
cuya amplitud decrece con la profundidad y viajan guiadas por la interfase.
36
Capítulo 1 1.4 Propagación de ondas
r
donde cada función de esta ecuación depende de la posición x en el espacio, y del
tiempo t.
El teorema también dice que esta construcción será posible sólo si se conocen tanto la
r
divergencia como el rotacional del campo u , ya que ambos potenciales dependen de
r
dichos valores. Es importante decir que la condición para que el potencial vectorial Y
quede unívocamente definido es que su divergencia sea cero.
En el caso del campo de desplazamiento, si se propagan simultáneamente los dos tipos
de ondas, podemos deducir, con lo que se ha dicho hasta ahora, que se debe cumplir lo
r r
siguiente: ∇ ⋅ u ≠ 0 (por la presencia de ondas P), y que ∇ × u ≠ 0 (por la presencia de
ondas S), lo cual genera un campo vectorial denominado complejo.
Dada la separación de las ondas S en sus componentes SH y SV mencionada antes, el
potencial vectorial, que es el que corresponde a la propagación de ondas tipo S, también
debe separarse en dos partes. Si consideramos la orientación del sistema de referencia
mostrada en la figura 1.10 estas partes son:
r r r
Y ( x , z, t ) = ψ ( x , z, t ) + ∇ × γ ( x , z, t ) (1.4-6)
1 424 3 14 4244 3
Potencial SV Potencial SH
donde
ψ ( x , z , t ) = ( 0, ψ ( x , z , t ), 0)
r
γ ( x , z, t ) = ( 0, γ ( x,z,t ), 0)
r
y
37
Capítulo 1 1.4 Propagación de ondas
Ahora veamos cómo esta ecuación efectivamente define la trayectoria de tiempo mínimo,
siguiendo el ejemplo que muestra la figura 1.11. Ahí se muestra una de las tantas
trayectorias que puede tomar un rayo para viaja de A a C. En este ejemplo tan sencillo, es
posible concluir a simple vista que la trayectoria de tiempo mínimo no es la que está
trazada. La trayectoria de tiempo mínimo (que para este caso correspondería a una de
menor longitud) sería una que estuviera contenida en el plano x-z. Sería parecida a la que
obtendríamos si se recorre el punto intermedio B paralelamente al eje y hasta dicho
11
Superficie que define la frontera entre dos medios con diferentes propiedades elásticas, por ejemplo, con
diferente velocidad de propagación de las ondas.
12
Línea imaginaria perpendicular al frente de onda que define la trayectoria del movimiento ondulatorio.
38
Capítulo 1 1.4 Propagación de ondas
A(0,0,x3)
B(x1’,x2’,0)
C(x1’’,0 ,x3’’)
plano, dada la ubicación de los puntos inicial y final. Esto se puede concluir
matemáticamente empleando la ecuación (1.4-8) de la siguiente manera. Supongamos
que el plano x-y define el contacto entre el medio 1 con velocidad de propagación V1, y el
medio 2 con velocidad V2. Entonces el tiempo total desde A hasta C es
∂T
( x' + x' + x ) + V (( x' '1 − x'1 ) + x'2 + x' '3 ) = 0
x '2 2 2 2 − 21 x '2 1
2 −2
= 2 2
∂ x ' 2 V1 1 2 3 2
lo cual implica que la coordenada x’2 del punto B debe ser cero para que se cumpla la
ecuación, que es justo lo que esperábamos.
Para deducir la Ley de Snell pensemos en la trayectoria que acabamos de encontrar
utilizando el principio de Fermat. Esta trayectoria está contenida en el plano x-z (figura
39
Capítulo 1 1.4 Propagación de ondas
A(0,0, x )
3
i
V1
B( x ' ,0,0)
1
V2
r
donde V1 > V2
1.12). Para este caso, el tiempo que le toma a la onda para propagarse desde A hasta C
está dado por
Si tomamos en esta ocasión al parámetro x’1 para aplicar la ecuación (1.4-8), entonces
tenemos que
( x'
2
1 +x 3)
2 2
1 1 ) + x' '
2 2 2
3
que si sustituimos en la ecuación (1.4-9), tenemos por último la ecuación que expresa a la
Ley de Snell:
40
Capítulo 1 1.4 Propagación de ondas
sen i sen r
= . (1.4-10)
V1 V2
que forme cualquier onda con una interfase y p es una cantidad llamada parámetro de
rayo que se conserva constante en todas las ondas que se estén propagando en un
medio, producto de una misma fuente.
De esta ley pueden derivarse conclusiones de suma importancia fácilmente. Definamos al
ángulo que forma una onda con una interfase, como el ángulo que forman la normal a la
interfase y el rayo de la onda (figura 1.12). Entonces es fácil darse cuenta, a partir de la
Ley de Snell, de que el ángulo entre una onda de cierto tipo y la interfase en la que incide
es igual al ángulo con que se refleja la onda del mismo tipo. O también saber que la onda
refractada (transmitida al otro medio) formará un ángulo mayor que el que formaba la
onda incidente si la velocidad del medio en que se propaga es mayor que la del medio del
cual provino la onda incidente, entre otras conclusiones.
La Ley de Snell puede entenderse físicamente si definimos otro concepto denominado
velocidad de fase. Supongamos una situación en la que un frente de onda incide con una
superficie libre formando un ángulo cualquiera. Para alguien que ve cómo se propaga
dicha onda de cuerpo desde la superficie, la velocidad aparente que muestra la onda es
mayor que la velocidad con la que verdaderamente se propaga en el medio. Esto se
puede ver mejor si se analiza la figura 1.13.
∆xa =V∆t/senγ
r
n γ
Superficie libre.
γ
∆x=V∆t
En esta figura se puede ver a un frente de onda en dos instantes diferentes separados por
un lapso ∆t. Dado que el seno de un ángulo mayor de cero grados y menor de noventa
41
Capítulo 1 1.4 Propagación de ondas
grados siempre es menor uno, entonces la distancia ∆xa=(V∆t / sen γ) siempre será
mayor que la distancia ∆x=V∆t. Por esta razón, y sabiendo que ambas distancias serán
recorridas por el frente de onda en el mismo tiempo ∆t, entonces la velocidad aparente
observada en la superficie xa, llamada velocidad de fase y representada por la letra “c” y
escrita como
V
c= , (1.4-11)
sen γ
es mayor que la velocidad V con que se propaga en ese medio la onda. Si se compara
esta cantidad con las cantidades de la ecuación (1.4-10), podemos concluir que la
velocidad de fase es igual al inverso del parámetro de rayo, esto es que: c = 1 p . Por lo
En este apartado analizaremos lo que sucede con las amplitudes de las ondas asociadas
a la incidencia de una onda SH en una interfase que separa a dos medios elásticos
diferentes. Nos referimos a las relaciones que guardan las amplitudes de las ondas SH
incidente, SH reflejada y SH refractada. Es posible demostrar que sólo son estas tres
ondas las que aparecen en el caso SH con interfase entre dos medios sólidos elásticos.
De esta demostración se hablará al final de este apartado. Regresando a la deducción de
las relaciones entre las amplitudes, emplearemos algunos antecedentes que hasta ahora
se han establecido. Se estudiará exclusivamente el caso más elaborado, el de una
interfase entre dos medios sólidos elásticos. La incidencia de una onda SH en superficies
libres, rígidas o en contacto con fluidos, se omitirán por ser menos complicados y
generales.
Tratándose de una onda plana SH, usar el potencial vectorial (ecuación 1.4-6) para
deducir los coeficientes de reflexión y refracción no es conveniente. Esto se debe a que
42
Capítulo 1 1.4 Propagación de ondas
SHrefractada
γ2 interfase
SHincidente SHreflejada
Las condiciones de frontera que deben cumplirse en la interfase son tales que, tanto el
campo de desplazamientos, como los esfuerzos generados por el medio 1, deben ser
iguales a los generados por el medio 2, esto es que:
v1 = v2 (1.4-12)
y que
σ xy1 = σ xy2 (1.4-13)
todo esto en x = 0.
Los subíndices de (1.4-12) y los superíndices de (1.4-13) se refieren a cada uno de los dos
medios.
43
Capítulo 1 1.4 Propagación de ondas
Proponiendo una expresión para el campo de desplazamiento del medio 1 que sea
solución de la ecuación de onda (1.4-1), tenemos que
⎛ zSenγ 2 − xCosγ 2 ⎞
iω ⎜ t − ⎟
⎝ β2 ⎠
v2 = B1 e . (1.4-15)
14442444
3
Onda SH refractada
⎛ zSenγ 1 ⎞ ⎛ zSenγ 2 ⎞
iω ⎜ t − ⎟ iω ⎜ t − ⎟
⎝ β1 ⎠ ⎝ β2 ⎠
( A1 + A2 ) e = B1 e ,
donde gracias a la Ley de Snell sabemos que β1 Senγ 1 = β2 Senγ 2 = c . Por esta razón,
los argumentos de las exponenciales son iguales, y entonces podemos eliminar las
exponenciales, quedándonos:
( A1 + A2 ) = B1 (1.4-16)
Por otro lado, en una superficie horizontal con respecto al sistema de referencia, como lo
está nuestra interfase en este ejemplo (figura 1.14), los únicos esfuerzos que pueden
existir en ella dado que se propagan sólo ondas SH, son los esfuerzos σxy. Es decir,
aquellos esfuerzos contenidos en un plano perpendicular al eje x y con dirección paralela
al eje y (que no aparece en la figura). Según la ecuación constitutiva que establece la Ley
de Hooke (ecuación 1.3-4):
44
Capítulo 1 1.4 Propagación de ondas
tenemos que el esfuerzo de interés σxy queda definido al particularizar la ecuación anterior
como
σ xy = 2µ ⋅ exy . (1.4-17)
1 ⎡ ∂u j ∂ui ⎤
eij = ⎢ + ⎥ (repetida 1.2-15)
2 ⎢⎣ ∂xi ∂x j ⎦⎥
entonces tenemos que la componente del tensor de deformaciones que nos interesa es
1 ∂v
exy = ⋅ (1.4-18)
2 ∂x
que si sustituimos en (1.4-17) nos queda la expresión que buscamos para el único
esfuerzo que existe en la interfase:
∂v
σ xy = µ ⋅ . (1.4-19)
∂x
Si particularizamos la ecuación (1.4-19) para cada uno de los dos medios, llevamos a
cabo las derivadas parciales de (1.4-14) y (1.4-15) correspondientes como lo indica la
ecuación (14.19), sustituimos en la ecuación (1.4-13) que postula la segunda condición de
frontera y, finalmente factorizamos y reducimos los términos adecuados, tenemos la
ecuación
⎛ zSenγ 1 ⎞ ⎛ zSenγ 2 ⎞
iωµ1Cosγ 1 iω ⎜ t −
⎝ β1 ⎠
⎟ iωµ2 Cosγ 2 iω ⎜ t −
⎝ β2 ⎠
⎟
( A1 - A2 ) e = B1 e . (1.4-20)
β1 β2
45
Capítulo 1 1.4 Propagación de ondas
Por la Ley de Snell, al igual que se hizo para obtener la ecuación (1.4-16), podemos
eliminar las exponenciales. Además, existen otros factores iguales en ambos lados de la
ecuación que también podemos eliminar. Haciendo todo esto, al final nos queda:
⎛ µ β Cosγ 2 ⎞
A1 − A2 = B1 ⎜ 2 1 ⎟ entonces A1 − A2 = K ⋅ B1 . (1.4-21)
⎝ µ1β2 Cosγ 1 ⎠
14 4244 3
K
2 ⋅ A1
B1 = , (1.4-22)
K +1
por otro lado, la amplitud de la onda reflejada se puede expresar de la misma forma como:
⎛ 1− K⎞
A2 = A1 ⎜ ⎟. (1.4-23)
⎝ K + 1⎠
2
Coeficiente de transmision T=
K +1
1− K
Coeficiente de reflexion R=
K +1
y así hemos terminado nuestro ejercicio en donde quedan explícitamente relacionadas las
amplitudes de las ondas.
Retomando el porqué de la existencia exclusiva de estas tres ondas en el ejemplo
anterior, debemos decir que la demostración con la cual se evidencia este hecho se sale
46
Capítulo 1 1.4 Propagación de ondas
del alcance de este trabajo. Sin embargo, el procedimiento es similar al del caso SH con
interfase libre, en donde sólo aparecen la onda SH incidente y la onda SH reflejada.
Analicemos este caso y veamos cómo es condición necesaria la existencia de la onda SH
reflejada para que se cumplan las ecuaciones que rigen este problema:
La condición de frontera que debe cumplirse en la interfase libre es que los esfuerzos
inducidos por el medio sean cero. Imaginemos un sistema de referencia igual al de la
figura 1.14. Encontrando el valor de dicho esfuerzo de manera igual a como se hizo en el
ejercicio anterior, podemos escribir esta condición de frontera considerando únicamente a
la onda incidente, que es la única que con certeza sabemos que existe, como
⎛ zSenγ i − xCosγ i ⎞
iωµCosγ i iω ⎜ t −
β
⎟
σ xy = Ai e ⎝ ⎠
=0 para x = 0. (1.4-24)
β
Para que esta ecuación se cumpla debemos restarle, a su miembro izquierdo, la misma
cantidad algebraica que lo compone. Esto es, debemos suponer forzosamente la
presencia de una segunda onda. Hay dos posibles soluciones, debido a que x=0 en la
ecuación (1.4-24): una que siga en la misma dirección de la onda incidente, y otra que se
refleja hacia abajo. La única solución posible físicamente es la segunda. Forzando a que
la ecuación (1.4-24) se cumpla, tenemos que
⎛ zSenγ i ⎞ ⎛ zSenγ r ⎞
iωµCosγ i iω ⎜ t −
β ⎠
⎟ iωµCosγ r iω ⎜ t −
β ⎠
⎟
σ xy = Ai e ⎝
− Ar e =0 ⎝
(1.4-25)
β β
14444244443
Correspondiente a la onda reflejada
que implícitamente establece una función del desplazamiento asociada a la onda reflejada
igual a:
⎛ zSenγ r + xCosγ r ⎞
iω ⎜ t − ⎟
⎝ β ⎠
v (r )
= Ar e
47
Capítulo 1 1.4 Propagación de ondas
Este apartado es de gran importancia para la justificación teórica del presente trabajo. Los
supuestos de los cuales partimos para llevar a cabo la construcción de una función de
receptor, contemplan primordialmente la incidencia de ondas tipo P en la base de la
corteza terrestre y sus subsecuentes conversiones al refractarse y reflejarse durante su
ascenso hacia la superficie.
En el caso que se va a desarrollar, la onda que incide en la interfase es una onda tipo P.
Las ondas que surgen a partir de dicha incidencia son cuatro: dos reflejadas (una P y otra
SV) y dos refractadas (también una P y otra SV). Si fuera SV la onda incidente,
aparecerían cuatro ondas similares de los mismos tipos en la interfase.
El objetivo del siguiente desarrollo es mostrar la manera en que debe abordarse el manejo
de los dos tipos restantes de ondas de cuerpo. Esto con el fin de obtener las relaciones
que existen entre las amplitudes de dichas ondas. Las ondas P y SV poseen
características diferentes que las ondas tipo SH. Los campos de desplazamiento que
generan, que son perpendiculares entre sí (apartado 1.4-ii) tienen, cada uno, dos
componentes que están íntimamente ligados entre los dos tipos de ondas. Por esta razón,
las funciones que describen dichos desplazamientos son vectoriales a diferencia de la
que define a las ondas SH, que es escalar. De todo esto se desprende la necesidad de
definir primero los potenciales que aparecen en la ecuación (1.4-7) para deducir, a partir
de ellos, los campos del desplazamiento correspondientes a cada medio. Una vez hecho
esto, el resto del desarrollo necesario para encontrar los coeficientes de transmisión y
reflexión en la interfase es exactamente el mismo que para el caso SH. La única
diferencia se encuentra en la condición de frontera en la que los esfuerzos deben
igualarse (ecuación 1.4-27), ya que en este caso son dos componentes del tensor de
esfuerzos los que aparecen en la interacción de los medios.
48
Capítulo 1 1.4 Propagación de ondas
SVrefractada
Prefractada
ηs
ηp interfase
Fig. 1.15 Onda P incidente en una interfase entre dos medios sólidos
elásticos con sus respectivas ondas P y SV reflejadas y transmitidas.
En la figura 1.15 aparecen todas las ondas que deben contemplarse en el problema, y el
sistema de referencia que usaremos. El campo de desplazamiento que existe en ambos
medios tiene solamente las componentes:
r
u = (u,0, w) donde u = u( x , z , t ) y w = w( x , z , t ) .
r r
Si definimos al campo de desplazamiento del medio 1 como u1 y al del medio 2 como u2 ,
entonces tenemos que en la interfase x=0 se deben cumplir las siguientes condiciones de
frontera:
r r
u1 = u2 (1.4-26)
σ xx1 = σ xx2
(1.4-27)
σ xz1 = σ xz2
r r
u1 ( x , z, t ) = ∇φ1 ( x, z, t ) + ∇ × ψ 1 ( x , z, t ) , (1.4-28)
49
Capítulo 1 1.4 Propagación de ondas
⎛ xCosγ s + zSenγ s ⎞
iω ⎜ t − ⎟ r
ψ 1 = A3 e ⎝ β1 ⎠
donde ψ 1 ( x , z , t ) = ( 0,ψ 1 ( x , z , t ),0) .
14442444
3
Onda SV reflejada
r ∂ψ ∂ψ 1 $
∇ × ψ 1 = − 1 i$ + k
∂z ∂x
r ⎧⎪ A1iωCosγ p iω ⎜⎝ t − ⎟⎫
⎛ zSenγ p − xCosγ p ⎞ ⎛ zSenγ p + xCosγ p ⎞ ⎛ zSenγ s + xCosγ s ⎞
α1
⎟
⎠
A2iωCosγ p iω ⎜⎝ t − α1
⎟
⎠ A3iωSenγ s iω ⎜⎝ t − β1 ⎠ ⎪$
u1 = ⎨ e − e − e ⎬i +
⎪⎩ α1 α1 β1 ⎪⎭
⎧⎪ A1iωSenγ p iω ⎛⎜ t − zSenγ p − xCosγ p ⎞⎟ A2iωSenγ p iω ⎛⎜ t − zSenγ p + xCosγ p ⎞⎟ A iωCosγ iω ⎛⎜ t − zSenγ s + xCosγ s ⎞⎟ ⎫⎪
α1 α1 β1
e ⎝ ⎬k$.
⎠
−⎨ − e ⎝ ⎠
+ 3 s
e ⎝ ⎠
⎪⎩ α1 α1 β1 ⎪⎭
⎛ zSenη p − xCosη p ⎞
iω ⎜ t − ⎟
α2
φ2 = B2 e ⎝ ⎠
14442444
3
Onda P refractada
50
Capítulo 1 1.4 Propagación de ondas
⎛ zSenηs − xCosηs ⎞
iω ⎜ t − ⎟ r
ψ 2 = B1 e ⎝ β2 ⎠
donde ψ 2 ( x , z , t ) = ( 0, ψ 2 ( x , z , t ),0)
14442444
3
Onda SV refractada
entonces se puede obtener, de la misma manera que para los potenciales del medio 1, la
siguiente expresión para el campo de desplazamiento del medio 2:
r ⎧⎪ B1iωSenηs iω ⎜⎝ t − ⎟⎫
⎛ zSenηs − xCosηs ⎞ ⎛ zSenη p − xCosη p ⎞
β2
⎟
⎠ B2iωCosη p iω ⎜⎝ t − α2 ⎠ ⎪$
u2 = ⎨ e + e ⎬i +
⎪⎩ β 2 α 2 ⎪⎭
⎧⎪ B iωCosη iω ⎛⎜ t − zSenηs − xCosηs ⎞⎟ B iωSenη iω ⎛⎜ t − zSenηp − xCosηp ⎞⎟ ⎫⎪
β2 α2
e ⎝ ⎬k$.
⎠
+⎨ 1 − e ⎝ ⎠
s 2 p
β α
⎩⎪ 2 2
⎭⎪
Tal y como se mencionó arriba, lo que resta en este desarrollo para terminar de deducir
los coeficientes de reflexión y transmisión, es restringir el problema aplicando las
condiciones de frontera mostradas en las ecuaciones (1.4-26) y (1.4-27). Los
componentes del tensor de esfuerzos deben obtenerse de la misma manera como fueron
obtenidos para el caso SH, empleando la Ley de Hooke y el tensor de deformaciones
infinitesimales. Dado que el principal objetivo de este desarrollo es mostrar el manejo que
debe hacerse de los potenciales para conocer los campos del desplazamiento, entonces
se remite al lector que desee conocer los valores explícitos de los coeficientes
mencionados al libro: Quantitative Seismology Theory and Methods, de Keiiti Aki y Paul G.
Richards, páginas 148-151.
51
Capítulo 1 1.5 Sistemas Lineales
∞
x (t ) = c0 + ∑ cn cos(nω 0 t − θ n )
n =1
donde
a0
c0 =
2
cn = an2 + bn2
⎛ bn ⎞
θ n = tan −1 ⎜ ⎟.
⎝ an ⎠
52
Capítulo 1 1.5 Sistemas Lineales
∞
x (t ) = ∑ cn e i 2πnf0t (1.5-2)
n =1
donde
1
T ∫T
cn = x (t )e −i 2πnf 0t dt . (1.5-3)
La notación empleada en la integral significa que ésta debe evaluarse sobre un período
de la función x (t ) .
De la misma manera como la serie de Fourier descompone en una sumatoria de
funciones cosenoidales a una función periódica, la transformada de Fourier opera sobre
las funciones que transforma. La diferencia fundamental radica en que las funciones que
descompone la transformación no son necesariamente periódicas. Descomponer una
función periódica con una serie de Fourier es equivalente a descomponerla efectuando su
transformación. De hecho, para el caso de funciones periódicas, la serie de Fourier se
puede considerar como un caso especial de la transformada de Fourier. Puede
demostrarse de manera muy simple, empleando el teorema de la convolución, cómo la
transformada de Fourier de una función periódica es un conjunto infinito de funciones
senoidales con una amplitud igual a la que determinan los coeficientes αn propios de la
serie de Fourier. La cantidad de armónicos (funciones senoidales que constituyen la serie)
necesarios para representar dichas funciones por completo es infinita. Sin embargo, como
ya se dijo, la transformación de Fourier13 también puede descomponer funciones no
periódicas, que en el dominio de la frecuencia son funciones continuas definidas para
toda f.
Matemáticamente, la transformación de Fourier se puede deducir a partir de la forma
exponencial compleja de la serie de Fourier (ecuación 1.5-2). Si se sustituye (1.5-3) en
(1.5-2) y se hace tender el período T de la función x (t ) a infinito se está obligando a que
13
Conocida como el espectro de la función, que se encuentra en el dominio de la frecuencia.
53
Capítulo 1 1.5 Sistemas Lineales
dicha función deje de ser periódica, entonces la frecuencia ω 0 = 2πf 0 → 0 . Esto provoca
∞
F (ω ) = ∫ f (t )e −iωt dt (1.5-3)
−∞
F[ x(t)] = X (ω )
de una función f (t ) es cero para todas las frecuencias que no pertenezcan al intervalo
esto es, en f > f c . La segunda restricción es que el periodo de muestreo T cumpla con
que 1 T ≥ 2 f c , es decir, que el lapso que separa a una muestra de la siguiente tome
54
Capítulo 1 1.5 Sistemas Lineales
ii) Convolución.
N −1
y ( kT ) = ∑ x(iT ) h[( k − i )T ]
i=0
(1.5-5)
55
Capítulo 1 1.5 Sistemas Lineales
h(t ) ∗ x (t ) ⇔ H (ω ) ⋅ X (ω ) . (1.5-6)
∞ ∞
⎡∞ ⎤ −iωt
∫ y (t )e
−∞
−iωt
dt = ∫
−∞
⎢ ∫ x (τ )h(t − τ ) dτ ⎥ e dt
⎣−∞ ⎦
∞
⎡∞ ⎤
Y (ω ) = ∫ x (τ ) ⎢ ∫ h(t − τ )e −iωt dt ⎥ dτ . (1.5-7)
−∞ ⎣−∞ ⎦
−∞
∫ h(σ )e −iω ( σ +τ )
dσ = e −iωτ H (ω )
Y (ω ) = ∫ x(τ )e
−∞
−iωτ
H (ω )dτ
(1.5-8)
Y (ω ) = H (ω ) ⋅ X (ω ).
56
Capítulo 1 1.5 Sistemas Lineales
y = H[ x] .
Esto quiere decir que el sistema H opera sobre la señal de entrada x para producir la
respuesta o señal de salida y. Esta operación matemática puede representarse
gráficamente a través de un diagrama de flujo como se muestra en la figura 1.16.
57
Capítulo 1 1.5 Sistemas Lineales
[ ] [ ]
H x1 + x2 = H x1 + H x2 . [ ] (1.5-10)
Un sistema que cumpla con estas dos propiedades, es decir, que sea homogéneo y que
tenga la propiedad de adición, se dice que satisface el principio de superposición.
Entonces, se define como sistema lineal a todo sistema que satisfaga el principio de
superposición.
Supongamos que, tanto las señales de entrada y salida como el sistema, son funciones
continuas en el tiempo. Entonces, se conoce como la respuesta al impulso unitario de un
sistema, a la señal de salida (respuesta) que se tiene si se emplea una función delta de
Dirac δ (t ) como señal de entrada al sistema. Ésta es una caracterización muy importante
y conveniente de un sistema lineal, ya que la respuesta y(t ) de un sistema para
cualquier señal continua de entrada x(t ) está dada por la ecuación (1.5-4), que
Y (ω ) = X (ω ) ⋅ H (ω ) . (1.5-11)
58
Capítulo 1 1.5 Sistemas Lineales
Por otra parte, pero igualmente importante, puede demostrarse que la función de
transferencia H(ω) es igual a la transformada de Fourier de la respuesta al impulso
unitario del sistema. Entonces, el cociente mostrado en la ecuación anterior es de suma
importancia ya que en él se emplean exclusivamente los espectros de las señales de
entrada y salida para conocer al sistema.
iv) Deconvolución.
y ( t ) = x ( t ) * h( t ) . (1.5-13)
Para lograr la remoción del efecto provocado por el sismodetector, requerimos de un filtro
inverso h-1(t) que, convolucionado con la respuesta al impulso unitario del aparato, arroje
una función delta de Dirac:
h −1 (t ) * h(t ) = δ (t ) . (1.5-14)
Esto será posible en la medida que podamos crear el filtro inverso. Utilizando la
transformada de Fourier en la ecuación (1.5-14), tenemos que dicho filtro está dado por
59
Capítulo 1 1.5 Sistemas Lineales
1
H −1 (ω ) ⋅ H (ω ) = 1 ⇒ H −1 (ω ) = . (1.5-16)
H (ω )
Dado que el espectro del filtro inverso es igual al cociente de la unidad dividida entre el
espectro de la respuesta al impulso unitario del sismómetro, entonces, en el dominio de la
frecuencia podemos efectuar la deconvolución deseada y así eliminar el efecto provocado
por el detector de la siguiente manera:
Y (ω )
= X (ω ) (1.5-17)
H (ω )
60
2 Fases sísmicas en el
interior de la Tierra.
Capítulo 2 2.1 Fases sísmicas
Hasta ahora, gran parte del contenido de este trabajo han sido las base teóricas que
soportan el fenómeno de la propagación de ondas elásticas en medios continuos,
homogéneos, e isótropos. Sin embargo, la sismología normalmente trabaja con registros
reales, es decir, con datos provenientes del interior de la Tierra donde estrictamente
ninguno de estos supuestos teóricos se cumple. A pesar de ser así, los sismólogos
utilizan toda esta teoría, junto con su experiencia, para llevar a cabo interpretaciones
confiables y admisibles de los registros sísmicos. Con estas interpretaciones se pretende
obtener información sobre la estructura interna del planeta. Los resultados propuestos en
los capítulos finales de este trabajo están encaminados a esclarecer la composición de la
corteza terrestre bajo la República Mexicana. Estos resultados fueron inferidos a partir del
procesamiento y modelado de una gran cantidad de registros sísmicos, llamados también
sismogramas.
Fig. 2.1 Seis mil tiempos de arribo de fases registradas para diferentes distancias
epicentrales de terremotos someros. Las fases fueron nombradas usando
un trazado convencional de trayectorias a través de la Tierra.
(De Kennett y Engdahl, 1991).
62
Capítulo 2 2.1 Fases sísmicas
63
Capítulo 2 2.2 Modelos globales terrestres
es nuestro planeta. Por esta razón, los sismólogos están preocupados por construir
modelos tridimensionales que permitan conocer la estructura interna con más detalle y a
otras escalas. Cabe señalar que el objetivo central de este trabajo es determinar la
estructura de esa delgada capa superficial, casi cáscara, llamada corteza terrestre, en
algunos sitios de interés de nuestro territorio.
2.3 Nomenclatura de las ondas de cuerpo.
64
Capítulo 2 2.3 Nomenclatura de las ondas de cuerpo
66
Capítulo 2 2.3 Nomenclatura de las ondas de cuerpo
a) b)
Superficie libre
s
p pP
p
Fuente
Fuente sP
P
P
Fig. 2.3 a) Nomenclatura de rayos que depende del ángulo con que salgan de la fuente,
b) geometría de las ondas profundas con sus respectivas nomenclaturas.
Para las ondas de profundidad que posean exclusivamente una sección de su trayectoria,
entre la reflexión en la superficie y el receptor, existen sólo cuatro posibles casos: pP, sS,
pS, y sP.
En los sismos locales y regionales, esto es para ∆ ≤ 13o , se emplea una nomenclatura
especial para describir los recorridos. En la figura 2.4 se muestra un esquema básico de
la estructura de la corteza con diferentes trayectorias. Los arribos de ondas directas son
nombrados como Pg y Sg. Las fases que viajan por debajo del Moho14 o a lo largo de él,
son llamadas Pn y Sn. Las reflexiones en el Moho están etiquetadas como PmP, PmS,
SmP o SmS. Hay que notar que cada una de las secciones de los trayectos está
nombrada y que la m denota la reflexión en el Moho. La discontinuidad que se encuentra
entre la superficie libre y el Moho se conoce con el nombre de discontinuidad de Conrad
(figura 2.4) y aparece en la figura por ser un rasgo estructural que en muchos lugares de
la corteza terrestre se observa. Muchos autores asocian dicha discontinuidad con la
transformación de las rocas debida al metamorfismo regional de las mismas. Los arribos
asociados a esta interfase se denotan como P* y S*.
14
Discontinuidad elástica descubierta por Mohorovicic en 1909 que define el contacto entre la corteza y el
manto.
67
Capítulo 2 2.3 Nomenclatura de las ondas de cuerpo
Receptor
Pg
Fuente
P*
Conrad
ic Pn
PmP
Moho
nombra: PcP, donde la c (core) hace mención al núcleo reflector (ver figura 2.6). Las
reflexiones en la superficie libre no se denotan con ninguna letra. Es preferible denotar
únicamente las secciones previa y posterior a la reflexión en la superficie libre de la
trayectoria, con una P o una S. Este tipo de fases son conocidas como reflexiones de
superficie. Algunas trayectorias comunes que presentan estas fases son: PP, PS, y PPP,
donde los primeros dos casos sufrieron sólo una reflexión, y el tercero dos en la superficie
libre (figura 2.5). Algunas combinaciones que existen de reflexiones en el núcleo y en la
superficie libre pueden ser las siguientes: PcPPcP, ScSScS (ScS2), o ScSScSScS (ScS3).
Si son generadas por fases de profundidad entonces se pueden presentar los casos:
pPcP y sPP, por ejemplo (ver figuras 2.5 y 2.6).
El hecho de que diversas trayectorias puedan existir geométricamente no significa que
todos sus arribos sean detectables. Por ejemplo, el coeficiente de reflexión de una onda P
para una incidencia vertical en el núcleo es casi cero ya que el contraste acústico es
pequeño. Por el contrario, un ángulo de incidencia grande proporciona un coeficiente de
reflexión grande. Otro ejemplo se da en el rango de distancia 103o < ∆ < 140o conocido
como la zona de sombra del núcleo, que es ocasionada por una dramática caída de la
velocidad que aparece yendo de la base del manto hacia el interior del núcleo. Las ondas
68
Capítulo 2 2.3 Nomenclatura de las ondas de cuerpo
de cuerpo que atraviesan el núcleo tienen su propia nomenclatura. Las fases tipo P que
atraviesan el núcleo externo (que es fluido), se denotan con una K (de Kernwellen, que
significa núcleo en alemán). De esta manera, una onda P que llegue hasta el núcleo
externo, lo atraviese, y salga nuevamente como P, se denota por PKP (o abreviado P’ ver
figura 2.6). De forma similar es posible tener fases PKS, SKS, y SKP. Las fases
generadas por ondas tipo P que atraviesan el núcleo interno sólido se denotan con la letra
mayúscula I, por ejemplo, la trayectoria PKIKP (ver figura 2.6); si es una onda S la que
atraviesa el núcleo interno entonces se usa la letra mayúscula J, por ejemplo PKJKP. Una
reflexión exterior en el núcleo interno se refiere con la letra minúscula i, por ejemplo la
trayectoria PKiKP.
La frontera entre el núcleo y el manto es un fuerte reflector tanto por la parte exterior de la
interfase como por la parte interior. Se había visto que una reflexión exterior se denota
como PcP. Pero una reflexión interna en esa frontera sufrida por una ondas P se nombra
con la repetición de la letra mayúscula K de la siguiente manera: PKKP, SKKS, SKKP o
PKKS (ver figura 2.6). Si existen reflexiones múltiples en el interior, la nomenclatura se
69
Capítulo 2 2.3 Nomenclatura de las ondas de cuerpo
70
3 Deconvolución de componentes
(H/V): Funciones de Receptor.
Capítulo 3 3.1 Funciones de receptor
En este trabajo se emplea una técnica específica que permite modelar la estructura
debajo del receptor utilizando las primeras ondas telesísmicas tipo P, y sus conversiones
en la corteza. Para esto, las respuestas de la corteza y del manto superior, contenidas en
las componentes del sismograma, deben aislarse de los efectos proporcionados por la
fuente y el trayecto, que también influyen en la forma del mismo. La eliminación de dichos
efectos indeseados se lleva a cabo con una deconvolución de las componentes del
registro. Antes de explicar ampliamente este procedimiento con el que se ecualizan
varios registros para compensar las diferencias provocadas por las funciones de fuente y
trayecto, se debe entender la naturaleza del fenómeno que va a modelarse.
Al tratarse de telesismos, las distancias epicentrales son considerablemente grandes
∆ ≥ 30o (ver sección 2.1-iii). Por esta razón, el tiempo de viaje y las distancias que
recorren son lo suficientemente grandes para que un tren de ondas P de varios minutos
arribe a la base de la corteza antes que la primer onda tipo S. Además, la energía
liberada en el foco alcanza una profundidad importante en el manto, lo que obliga que el
ángulo de incidencia del frente de onda al llegar a la corteza sea pequeño. Durante su
ascenso a la superficie desde el Moho, existe una reducción paulatina de los ángulos que
se forman entre dicho frente y las diversas interfaces que va atravesando (ver figura 3.1-
a). Así, el desplazamiento en la superficie libre provocado por la incidencia de ondas P,
quedará grabado predominantemente en la componente vertical del sismograma; de igual
forma, el desplazamiento provocado por la incidencia de ondas S (convertidas), quedará
predominantemente en las componentes horizontales del registro.
Antes de proceder con el método, es importante mencionar un procedimiento previo que
debe hacerse con los registros sísmicos. Analizando en planta a un telesismo durante su
recorrido a través de la corteza dentro de un marco de referencia cardinal, vemos que, en
general, la proyección horizontal de su trayectoria (suponiendo paralelismo y
horizontalidad de las capas) forma cierto ángulo, medido desde el norte en dirección de
las manecillas del reloj, con la línea norte-sur del marco de referencia. A este ángulo se le
conoce con el nombre de back-azimuth (figura 3.1-b). Los tres componentes de un
registro corresponden a las direcciones n-s, e-w, y vertical del movimiento. Sin embargo,
el método estudiado requiere de las proyecciones radial y transversal del desplazamiento.
Por esta razón es necesario rotar los componentes horizontales n-s y e-w, a las
direcciones recién mencionadas, ver figura 3.1-b. De esta manera, en un caso ideal
donde incidan ondas P en la base de una estructura de capas planas y horizontales,
únicamente aparecerían arribos de fases en los componentes radial y vertical del
72
Capítulo 3 3.1 Funciones de receptor
a) b) N
Receptor
Radial Transversal
Superficie libre
W E
θ
Moho
α S
Fuente sísmica
Fig. 3.1 a) Frente de onda telesísmico incidiendo con un ángulo pequeño en la base
de la corteza, b) Sistema de referencia cardinal en cuyo origen se encuentra una
estación sísmica, θ es el back-azimuth (siempre medido de esa forma) del
sismo que debe considerarse para rotar los componentes del registro.
Con base en lo anterior, se puede estudiar el método utilizado en este trabajo, el cual
consiste en lo siguiente. Langston en 1979 (Langston, 1979) propuso un procedimiento
para ecualizar la información de diferentes telesismos, eliminando los efectos de fuente y
trayecto que se encuentran en los registros telesísmicos y así construir funciones de
receptor, o series de tiempo que respondan exclusivamente a las fases S convertidas en
la estructura que se encuentra por debajo de la estación.
Teóricamente, los componentes del desplazamiento en el dominio del tiempo generados
por un frente de ondas plano P que incide casi verticalmente en la base de un paquete
estratificado, se pueden expresar de la siguiente manera (Langston, 1979):
DV = I ( t )∗ S ( t )∗ EV ( t )
DR = I ( t )∗ S ( t )∗ E R ( t ) (3.1-1)
DT = I ( t )∗ S ( t )∗ E T ( t )
donde S(t) es la función de fuente en el dominio del tiempo, I(t) es la respuesta al impulso
unitario del instrumento y EV(t), ER(t) y ET(t), son respectivamente las respuestas vertical,
73
Capítulo 3 3.1 Funciones de receptor
EV (t ) ≈ δ (t ) (3.1-2)
donde δ(t) es la función delta de Dirac. Obviamente existen errores en esta aproximación,
sin embargo, éstos son tolerables si se compara con las ventajas que proporciona
(Owens et al., 1983). Si se introduce la suposición (3.1-2) en la componente vertical de
las ecuaciones (3.1-1), tenemos que
DV ( t ) ≈ I ( t )∗ S ( t ) . (3.1-3)
Esta aproximación será más exacta en la medida que no existan contrastes de velocidad
importantes en interfases intermedias del modelo, aproximadamente mayores a 2 Km/s
(Langston, 1979). De existir éstas, generarían fases convertidas y múltiples de
considerable amplitud que harían más complejo al componente vertical del
desplazamiento.
En la ecuación (3.1-1) se supuso que los tres componentes del desplazamiento poseen el
mismo efecto de fuente y de instrumento. Entonces, utilizando la ecuación (3.1-3) se
pueden deconvolucionar estos efectos de los componentes radial y transversal, aislando
las funciones de transferencia, o sistemas, correspondientes a la estructura en las
direcciones horizontales (ver secciones 1.5-iii y 1.5-iv ecuaciones 1.5-12 y 1.5-17). El
cociente espectral que efectúa de manera aproximada esta operación, para las funciones
de transferencia de la estructura en direcciones radial y transversal, es:
74
Capítulo 3 3.1 Funciones de receptor
DR (ω ) D (ω )
E R (ω ) = ≈ R
I (ω ) ⋅ S (ω ) DV (ω )
(3.1-4)
DT (ω ) D (ω )
E T (ω ) = ≈ T
I (ω ) ⋅ S (ω ) DV (ω )
DR (ω )
E ' R (ω ) = ⋅ G(ω ) (3.1-5)
DV (ω )
2
⎡ ⎛ t − t ⎞⎤
G (t ) = ξ exp− ⎢π ⎜ s
⎟⎥ (3.1-6)
⎢⎣ ⎝ p ⎠ ⎥⎦
t
DR (ω ) ⋅ DV (ω )
E ' R (ω ) = ⋅ G (ω ) (3.1-7)
Φ SS (ω )
donde
{ [
Φ SS (ω ) = max DV (ω ) ⋅ DV (ω ), c ⋅ max DV (ω ) ⋅ DV (ω ) . ]}
75
Capítulo 3 3.1 Funciones de receptor
donde Z(t) y R(t) representan los componentes vertical y radial del movimiento
respectivamente, s(t) es la función de fuente, tk es el tiempo con que arriba el k-ésimo
rayo (k=0 es la onda P directa), y la suma hasta n, representa la suma de n rayos que
alcanzan el receptor. La magnitud del k-ésimo rayo en cada componente está dada por zk
y rk. Estos dos componentes, para un modelo simple de una capa horizontal sobre un
semiespacio en el dominio de la frecuencia, y considerando únicamente tres arribos: el de
la onda P directa, el de la conversión Ps, y el del primer múltiple P, se expresan como
[ − iω t
R(ω ) = r0 1 + r$p e p + r$s e − iω ts ] (3.1-8)
[ − iω t
Z (ω ) = z0 1 + z$ p e p + z$s e − iω ts ] (3.1-9)
76
Capítulo 3 3.1 Funciones de receptor
R(ω )
H (ω ) = ,
Z (ω )
y tomando exclusivamente los términos de grado menor que dos de la expansión (1+x)-1 =
1-x+x2-x3+… utilizada para el denominador; se tiene que la función de transferencia en
dirección radial del modelo estudiado H(ω), es
H (ω ) =
r0
z0
[
1 + r$s e −iω ts ,] (3.1-10)
cuya expresión en el dominio del tiempo (ecuación 3.1-11) nos muestra lo que se había
dicho anteriormente del contenido de una función de receptor: es una versión escalada
del componente horizontal correspondiente, con los múltiples P removidos; comparar
ecuación (3.1-10) con ecuación (3.1-8).
h( t ) =
r0
z0
[ ]
δ (t ) + r$sδ (t − t s ) . (3.1-11)
77
Capítulo 3 3.1 Funciones de receptor
Fase
PpPhp
Componente vertical
Componente radial
Fase removida
Función de receptor
Tiempo (seg)
Fig. 3.2 Componentes radial y vertical del desplazamiento para un modelo simple
(ver texto), comparados con la función de receptor obtenida a partir de ellos.
Nótese la remoción de las fases que arribaron como P a la superficie.
Para nombrar con propiedad y sin confusión a cada una de las fases relevantes que
aparecen en una función de receptor se va a seguir, a lo largo del trabajo, la
nomenclatura que aparece en la figura 3.3. En esta figura también se muestran las
trayectorias que describen los rayos asociados a dichas fases. La interfase denominada
“h” podría representar al Moho, interfase que en este trabajo es un objeto de estudio
relevante.
Receptor
Superficie libre
Ondas P
Ondas S
Interfase h
PpPhs PsPhs PsShs Pp Ps
PpShs
78
Capítulo 3 3.1 Funciones de receptor
Si se analiza con cuidado la nomenclatura que aparece en la figura 3.3, las letras
mayúsculas, a excepción de la primera, representan el tipo de onda reflejado en la
superficie libre; las letras minúsculas que suceden a la primera letra, representan al tipo
de onda refractado en la superficie “h”; las letras minúsculas que suceden a la letra “h”,
representan el tipo de onda reflejado en la superficie del mismo nombre; y la primer letra,
que siempre es “P”, representa a la onda incidente del semiespacio.
Vp=8.0 km/s
Vs=4.63 km/s
Onda P Onda P
ρ=3.3 g/cm3
“downdip” “updip”
Fig. 3.4 Modelo de corteza utilizado en el ejemplo para ilustrar los efectos
producidos por la capa inclinada en las funciones de receptor radial
y transversal, (tomado de Cassidy, 1992).
79
Capítulo 3 3.2 Estructuras inclinadas
Para entender con claridad estos efectos, analicemos un caso particular de dos capas
sobre un semiespacio, donde la frontera intermedia está inclinada 15º hacia el este y la
más profunda es horizontal, como se muestra en la figura 3.4.
Las fases que aparecen más adelante en las funciones de receptor sintetizadas para este
ejemplo, serán indicadas de la siguiente manera: con la letra “H”, las fases convertidas en
la frontera horizontal, y con la letra “I”, las convertidas en la frontera inclinada. En
términos generales, la existencia de una interfase inclinada por debajo del detector afecta
a las funciones de receptor de tres maneras diferentes:
1) Las amplitudes y los tiempos de arribo de las fases convertidas Ps dependen
tanto del BAZ (back-azimuth) como del ∆ (distancia epicentral); las ondas P viajando en
dirección “updip”, esto es con un BAZ de 90º en nuestro ejemplo (figura 3.4), generan las
amplitudes y los tiempos de arribo más grandes en las fases Ps (ver figura 3.5); las ondas
P viajando en dirección “downdip”, es decir con un BAZ de 270º (figura 3.4), generan las
amplitudes y tiempos de arribo más pequeños para las fases Ps (ver figura 3.5). La
variación de la amplitud de dichas fases depende principalmente del ángulo de
inclinación de la estructura, mientras que la variación de sus tiempos de arribo depende
tanto del mismo ángulo, como de la profundidad de la interfase. En general, las fases Ps
originadas a grandes profundidades experimentarán grandes variaciones en sus tiempos
Fig. 3.5 Variación azimutal provocada por una interfase inclinada (ver figura 3.4)
en las funciones de receptor radiales y transversales. La letra “P” representa
a la fase P directa, la “I” a la fase Ps convertida en la interfase inclinada,
y la “H” a la fase Ps convertida en la frontera horizontal. La distancia
epicentral utilizada es de ∆ = 45º. (Tomado de Cassidy, 1992).
80
Capítulo 3 3.2 Estructuras inclinadas
de arribo dado un incremento ya sea del BAZ o del ∆. Las variaciones en dichos tiempos
para diferentes BAZ no se aprecian bien en la figura 3.5 ya que la inclinación de la
interfase es pequeña. Además, sólo se presentan las fases directas Ps; la variación
temporal es mucho más notoria en los sucesivos múltiples que no aparecen en dicha
figura.
2) La amplitud de la onda P directa en las funciones de receptor radiales,
depende del BAZ con que incida el frente de ondas en la base de la estructura. Esta
dependencia se hace más clara para inclinaciones mayores de 30º, o para interfases
inclinadas que presenten un contraste acústico importante. Como se puede ver en la
figura 3.5, la amplitud mínima de la onda P directa aparece cuando el frente de ondas
incide en dirección “updip”. Por el contrario, la máxima amplitud aparece cuando viaja en
dirección “downdip”. No hay que perder de vista que esto es así de claro para un modelo
tan simple como el que se está estudiando. Si se tratara de un modelo que tuviera
múltiples interfases inclinadas en diferentes direcciones, el patrón de dependencia sería
mucho más complicado.
3) Las capas inclinadas deflectan las ondas P y S del plano radial-vertical,
introduciendo de esta manera un componente transversal en el movimiento del terreno.
Las amplitudes de la función transversal son cero para incidencias de ondas P en
dirección “updip” o “downdip”, y son máxima en las direcciones perpendiculares a ésta, es
decir, con ΒΑΖ=0º y ΒΑΖ=180º en nuestro ejemplo. Nótese la aparición de los arribos de
la onda P directa y de la conversión Ps en la interfase inclinada, dentro de la función de
receptor transversal (figura 3.5). También es importante distinguir en esa figura que, las
fases Ps convertidas en la interfase horizontal prácticamente no son deflectadas por la
interfase inclinada. De ahí que su efecto en la función de receptor transversal sea
insignificante.
Todos estos efectos que aparecen en las funciones de receptor ante la presencia de
estructuras de este tipo, son una herramienta poderosa para complementar el análisis y
el modelado de estas curvas. Si se dispone de una buena cobertura azimutal, es posible
hacer comparaciones cualitativas entre todas las funciones para deducir la existencia, en
el caso de que así lo indiquen las evidencias, de una estructura más complicada que un
simple modelo de capas paralelas y horizontales. En el modelado de estas funciones
también es de gran importancia identificar el origen de las fases más prominentes que
aparezcan. Esto es, saber la trayectoria que debió tomar cada rayo para generar cada
81
Capítulo 3 3.2 Estructuras inclinadas
una de las fases. Esto reduce la incertidumbre de que el modelo que responda mejor a
las funciones de receptor observadas sea el apropiado.
Como ya se dijo en la sección anterior, resulta importante saber de dónde proviene cada
una de las fases que aparecen en una función de receptor. En una función generada a
partir de un modelo tan simple como el que se usó en la figura 3.2, identificar dichas
fases es sencillo. Sin embargo, para modelos que contengan una mayor cantidad de
capas ya no resulta tan obvio. Por esta razón, y con el afán de aportar más veracidad a
los resultados que del modelado de las observaciones se obtengan, se desarrolló un
programa computacional que permite generar funciones de receptor sintéticas de manera
aproximada, aportando la información necesaria de cada fase que permite identificar su
procedencia. Estas funciones son aproximadas debido a que la cantidad de trayectorias
que considera es limitada, depende de la cantidad de interfases que posea el modelo.
Dichas trayectorias fueron previamente seleccionadas por ser las que, en la mayoría de
los casos, debieran arribar a la superficie libre con mayor amplitud. Cabe destacar que
este algoritmo no fue ideado con la finalidad de introducir otro procedimiento que permita
crear sismogramas sintéticos, equivalente a los propuestos por Haskell (Haskell, 1962) o
Kennett (Kennett, 1983), sino que estuvo basado exclusivamente en consideraciones
físicas que permitieran identificar las fases más relevantes en una función de receptor. A
continuación se describe la manera como funciona este programa.
El programa, nombrado FUNREC, comienza por calcular los tiempos de arribo de cada
una de las fases que fueron seleccionadas utilizando las trayectorias que describen los
rayos correspondientes. Antes de explicar cómo lo hace, es importante decir cuáles son
aquéllas que considera FUNREC. El total de las trayectorias está dividido en cinco grupos
por la semejanza en sus recorridos. Estos recorridos quedan ilustrados en la figura 3.6,
donde aparecen esquemáticamente representados los rayos de las ondas dentro de un
modelo particular de tres capas sobre un semiespacio, con las conversiones que sufren al
reflejarse o refractarse. La trayectoria que se encuentra en cada cuadro, es solamente
una de las que comprenden a cada grupo. Por ejemplo, en el caso de los grupos uno y
dos, el resto de las trayectorias de cada grupo que no aparecen en la figura, son aquellas
donde la conversión de la onda se da en las
82
Capítulo 3 3.3 Identificación de fases
S P P
P S
Moho Moho Moho
GRUPO 4 GRUPO 5
P P P S P
P
Moho Moho
Fig. 3.6 Diagrama que muestra las trayectorias seleccionadas en el programa subdivididas en
cinco grupos. Para cada grupo de ondas aparece sólo una de las trayectorias que
lo comprenden. Para deducir el resto correspondiente a cada grupo, ver texto.
interfases restantes. En el caso de los grupos tres y cuatro, las demás trayectorias son
aquellas donde la segunda reflexión se lleva a cabo en el resto de las interfases. Y
finalmente, en el caso del grupo cinco que es el más grande y complicado, todas las
demás trayectorias que no aparecen son las que sufren la segunda reflexión en las
interfases restantes, sin dejar la conversión posterior que tienen en las sucesivas
interfases suprayacentes.
Cabe destacar que, dentro del resto de las interfases que deben considerarse para
deducir las demás trayectorias, está incluida la que define el contacto de la última capa
con el semiespacio (Moho). Así quedan incluidos los múltiples de primer orden PpPms o
PpSms entre otros. La cantidad de trayectorias está en función de la cantidad de capas
que tenga el modelo. De esta manera, para un modelo que tenga “n” capas, la cantidad
[
de trayectorias consideradas es: 5n + ( n − 1) + ( n − 2) + ... + n − ( n − 1) . No hay que ]
olvidar que en todos los casos, el tipo de onda incidente desde el semiespacio es P, por
las razones que ya fueron argumentadas en la sección (3.1-ii).
Ahora bien, el cálculo de los tiempos de arribo se hace obteniendo el parámetro de rayo
que describen las ondas dentro del modelo a partir de las propiedades elásticas
previamente definidas y del ángulo de incidencia desde el semiespacio. Así, se calculan
83
Capítulo 3 3.3 Identificación de fases
las distancias que recorren las ondas P y S en todas las capas. Conociendo además las
velocidades de propagación α y β en todo el modelo, entonces se dividen las distancias
calculadas entre las velocidades correspondientes para saber los tiempos buscados. Es
importante mencionar la corrección temporal que debe hacerse a los tiempos de arribo de
cada fase por haber comenzado su recorrido a través del modelo en tiempos y sitios
diferentes (ver figura 3.7). La figura 3.7 muestra claramente cómo los múltiplos PsSmp y
PpPmp entran al modelo antes que la fase Pp directa. En el caso del primer múltiple
mencionado, el tiempo ∆t es precisamente el lapso que debe restarse al tiempo total de
recorrido de dicha fase, para que el tiempo relativo entre ella y la onda P directa que
aparezca en la función de receptor sea el correcto. Una corrección similar debe hacerse
para cada una de las otras trayectorias.
El siguiente paso es construir las amplitudes finales para todas las fases, multiplicando
los coeficientes de transmisión y reflexión asociados a cada interfase. Por ejemplo, para
construir la amplitud de la fase directa Ps, se considera una amplitud inicial unitaria para
la onda P incidente del semiespacio, se multiplica dicha amplitud por el coeficiente de
transmisión, entre el semiespacio y la última capa que implica una conversión P-S, se
multiplica el resultado de esa operación por el coeficiente de transmisión S-S entre la
segunda y tercera capa, y se guarda esa cantidad. Nótese que no se multiplicó por el
último coeficiente de transmisión S-S entre la primera y segunda capa. Así como se
Superficie libre
Ondas P
Ondas S
Moho
∆x
∆t =
∆x α3
Fig. 3.7 Figura donde se muestra la corrección temporal para la fase PsSmp. Corrección que
debe aplicarse también a cada una de las otras trayectorias consideradas por FUNREC para
que los tiempos relativos entre las fases dentro de las funciones de receptor sean los
correctos. α3 es la velocidad de propagación para las ondas P en el semiespacio.
mostró para este caso sencillo, se construyen todas las amplitudes restantes, sin incluir el
último coeficiente de transmisión justo antes de llegar al receptor. Todos los coeficientes
que se emplearon fueron calculados a partir de las propiedades elásticas del modelo y de
84
Capítulo 3 3.3 Identificación de fases
Espectros de
los componentes
Serie de impulsos
“ondas P” R
Función de Espectros del
transferencia de sismograma sintético
capa-semiespacio
V
R
Espectros de
los componentes V
Serie de impulsos
“ondas S”
R
Función de
transferencia de
capa-semiespacio
V
Fig. 3.8 Diagrama que esquematiza parte del funcionamiento del programa FUNREC (ver texto).
Partiendo de dos series temporales impulsivas, se generan las componentes radial y
vertical de un sismograma sintético. La parte restante del programa opera
con dichas componentes para generar una función de receptor.
cuestión, se obtienen las cuatro componentes correspondientes a los dos sismogramas
generados, uno para las incidencias S y otro para las incidencias P. Los espectros de los
dos componentes radiales se suman, así como los espectros de los dos componentes
verticales. De esta manera, al final se tienen la componente radial y la componente
85
Capítulo 3 3.3 Identificación de fases
vertical del sismograma sintético para el modelo estratificado, incluyendo solamente las
trayectorias consideradas por FUNREC.
Lo único que resta del programa es, a partir de los componentes radial y vertical del
desplazamiento, construir la función de receptor radial. Esto se lleva a cabo efectuando la
operación mostrada en la ecuación 3.1-5, donde no se incluye el nivel de agua por
tratarse de un problema sintético. En este caso el cociente se comporta de manera
estable.
FUNREC, para elaborar la función de receptor, parte directamente de los espectros de
los componentes. Sin embargo, al igual que en un caso con información real en donde se
tienen inicialmente los componentes en el dominio del tiempo para luego trasladarlos al
dominio de la frecuencia, en la figura 3.9 partimos de los componentes temporales del
sismograma con el fin de esquematizar todo el proceso. En esta figura se muestra
simbólicamente el cociente espectral y el filtrado con el espectro de la campana
gaussiana. Al final, a través de la transformación inversa de Fourier, se obtiene la función
de receptor aproximada que proporciona el programa descrito.
Componente R Espectro de R
FFT
Espectro de gaussiana Función de receptor radial
FFT-1
FFT
Componente V Espectro de V
Fig. 3.9 Diagrama donde se muestra cómo FUNREC lleva a cabo la construcción de la función
de receptor. No utiliza el nivel de agua por tratarse de un caso sintético, donde no existe
inestabilidad del cociente. Comparar este diagrama con la ecuación 3.1-5.
En seguida se muestra una comparación (figura 3.10) entre una función de receptor
obtenida con FUNREC y otra obtenida con el método de las matrices de propagación de
Kennett (Kennett, 1983). Ambas funciones fueron generadas con el mismo modelo,
definido en la tabla 3.1.
En dicha comparación se puede aprecia la enorme semejanza que existe entre las dos
curvas. Esta aproximación será así de buena mientras la complejidad del modelo no sea
muy grande. De lo contrario, los grupos de trayectorias seleccionados comenzarán a ser
86
Capítulo 3 3.3 Identificación de fases
insuficientes para reproducir con tal fidelidad el fenómeno. No hay que perder de vista
que el objetivo de este programa es identificar la procedencia de las fases más
importantes que aparecen en una función de receptor. Por esta razón, FUNREC genera
un archivo donde se especifica el tiempo de arribo para cada fase junto con la amplitud
que posee en el instante previo a incidir, al final de su recorrido, en la primera capa.
Además, a cada pareja tiempo-amplitud la asocia al número de grupo y dentro del grupo,
al número de arribo del que se trate cada pareja. De esta manera se puede saber con
precisión cual fue la trayectoria descrita por todas las fases consideradas.
Tabla 3.1 Modelo de tres capas sobre un semiespacio utilizado para generar las dos
funciones de receptor radiales mostradas en la figura 3.10. Una de ellas construida con
FUNREC y la otra con la técnica de las matrices de propagación de Kennett (Kennett, 1983).
87
Capítulo 3 3.3 Identificación de fases
FUNREC
Kennett
88
4 Teoría de inversión en geofísica:
métodos locales vs. métodos globales.
Capítulo 4 4.1 Determinación de la estructura terrestre
Es importante que el lector tenga claras las dimensiones medias relativas que hay entre
las diferentes capas conocidas del planeta (figura 4.1). Por esta razón, a continuación se
proporcionan las profundidades de las discontinuidades elásticas principales del interior
de la Tierra: en la corteza se puede encontrar la discontinuidad de Conrad entre los 15 y
20 km; contacto entre corteza y manto (Moho) que puede estar entre los 5 y 70 km;
contacto entre manto superior y manto inferior a 660 km; contacto entre manto y núcleo a
2,889 km (discontinuidad en la composición química más importante de la Tierra);
contacto entre núcleo externo y núcleo interno a 5,155 km; por último el centro del planeta
a una profundidad de 6,371 km.
En este capítulo se describirá la manera como pueden utilizarse los registros sísmicos
para determinar modelos estructurales del interior de la Tierra. Se hablará sobre la teoría
de inversión en general, y se abordarán algunos métodos empleados por dicha teoría con
el fin de optimar la búsqueda de los mejores modelos estructurales. Se establecerá
Corteza
Manto superior
Manto inferior
Núcleo externo
Núcleo interno
6,371 km (centro de la Tierra)
5,155 km
2,889 km
660 km
5-70 km
una clasificación de los métodos separándolos en dos grupos: los métodos de inversión
local, y los de inversión global. Quedarán claramente explicadas las diferencias que
existen entre ambos, así como las limitaciones y virtudes que posee cada uno de ellos.
91
Capítulo 4 4.1 Determinación de la estructura terrestre
92
Capítulo 4 4.2 Teoría de inversión
a diferentes profundidades. Queda claro que el problema consiste en ajustar una línea
recta con las observaciones.
Fig. 4.2 Diagramas de flujo de los problemas directos e inversos. Ver texto.
La teoría de inversión en geofísica puede verse como el intento por ajustar la respuesta
matemática de un modelo específico terrestre, con una serie finita de observaciones
obtenidas de la naturaleza. Hay que tener presente que las ecuaciones matemáticas que
definen al modelo dependen de cierto número de parámetros, y que son precisamente
éstos los que deseamos estimar a partir de los datos observados.
Esquemáticamente se pueden representar ambos problemas como se muestra en la
figura 4.2. Es fundamental distinguir que, en la teoría inversa, el fin último es determinar
valores numéricos desconocidos correspondientes a los parámetros que determinan al
modelo, no definir o constituir al modelo en sí.
Lo primero que debe hacerse es establecer la manera como se manejarán por un lado los
datos, y por el otro los parámetros del modelo. Normalmente, los datos no son más que
una sucesión de valores numéricos equidistantes espacial o temporalmente. Por esta
razón es posible manejarlos como si fueran los componentes de un vector de dimensión N
que contuviese toda la serie de N lecturas. De manera similar, los parámetros del modelo
pueden considerarse como las componentes de otro vector de dimensión M.
r
[ ]
Datos: d = d1 , d 2 , d 3 , d 4 ,..., d N .
El principio fundamental del que parte cualquier problema inverso es el siguiente: los
parámetros del modelo y los datos están de alguna forma relacionados. A dicha relación
93
Capítulo 4 4.2 Teoría de inversión
que los vincula se le conoce como modelo. Normalmente, el modelo se expresa a través
de una o más ecuaciones. Estas ecuaciones son a las que deben responder
simultáneamente tanto los datos como los parámetros del modelo.
En problemas reales, los datos y los parámetros del modelo están relacionados de
manera complicada. Sin embargo, en términos generales la relación que guardan puede
escribirse de la siguiente forma:
r r
f1 (d , m ) = 0
r r
f 2 (d , m ) = 0
.
(4.2-1)
.
.
r r
f L (d , m ) = 0 ,
94
Capítulo 4 4.2 Teoría de inversión
Desde ahora hasta que se aborden los problemas altamente no lineales, se estudiarán
exclusivamente los planteamientos de inversión desarrollados a partir de modelos
matemáticos de comportamiento lineal o casi-lineal15, esto es, a partir de modelos que
puedan expresarse, de una forma u otra, a través de un sistema de ecuaciones lineales
como el que se muestra en la ecuación (4.2-1).
En general, las ecuaciones que describen al modelo pueden ser complicadas. Sin
embargo, en muchos problemas toman formas simples que permiten llegar a expresiones
matemáticas que sintetizan fácilmente la relación que guardan los datos con los
parámetros del modelo. La forma implícita lineal es aquella que posee al funcional F
dependiendo intrínsecamente tanto de los datos como de los parámetros:
r
r r r ⎡d ⎤
f (d , m) = 0 = F ⎢ r ⎥ ,
⎣m⎦
donde F es una matriz con dimensión LX(M+N). Por otro lado, está la forma lineal
explícita, en la que los datos pueden quedar como términos independientes del sistema,
acuñándose un nuevo funcional G que opera exclusivamente sobre los parámetros del
modelo:
r r r
f (d , m) = 0 = d - Gm , (4.2-2)
15
Modelos que a través de manipulaciones matemáticas, como lo son las expansiones en series, se comportan
de manera linear y es posible expresarlos como sistemas de ecuaciones lineales.
95
Capítulo 4 4.2 Teoría de inversión
[ ]
d = T1 , T2 , T3 ,..., TN . Asumiendo que (en contraste con el ejemplo de la sección
mencionada) la temperatura varía cuadráticamente con la profundidad, entonces tenemos
que T = a + bz + cz 2 . Por lo tanto, el vector de parámetros del modelo queda definido por
T1 = a + bz 1 + cz 12
T2 = a + bz 2 + cz 22
.
(4.2-3)
.
.
TN = a + bz N + cz 2N .
⎡1 z1 z12 ⎤ ⎡T1 ⎤
⎢ ⎥ ⎢T ⎥
⎢1 z2 z 22 ⎥
⎡a ⎤ ⎢ 2 ⎥
⎢. . . ⎥ ⎢ ⎥ ⎢. ⎥
⎢ ⎥ ⎢ b⎥ = ⎢ . ⎥ .
⎢. . . ⎥
⎢⎣c ⎥⎦ ⎢ ⎥
⎢. . . ⎥ ⎢. ⎥
⎢ ⎥ ⎢ ⎥
⎢⎣1 zN z 2N ⎥⎦ ⎣TN ⎦
Es importante notar que a pesar de que las ecuaciones son lineales en los parámetros del
modelo y en los datos, no lo son en las variables auxiliares “z” que conocemos de
antemano por ser las profundidades a las que fueron hechas las observaciones, lo cual no
impide que podamos desarrollar la ecuación explícita lineal del problema y resolverla.
96
Capítulo 4 4.2 Teoría de inversión
El segundo ejemplo trata de la tomografía acústica. Esta técnica busca determinar el valor
de ciertas propiedades elásticas de un medio heterogéneo en distintos lugares del mismo,
a partir de los tiempos de viaje que registren una serie de ondas propagadas
estratégicamente en su interior. Supongamos que un muro consta de la unión de 16
bloques de igual tamaño (figura 4.2), donde la velocidad de propagación para las ondas
1 2 3 4
5 6 7 8
Fuente
Receptor
acústica
13 14 15 16
[ ]
d = t 1 , t 2 , t 3 ,..., t 8 . El modelo supone que cada bloque está compuesto por un material
homogéneo, y que los tiempos de viaje son proporcionales ya sea al alto o al ancho de
cada bloque, donde la constante de proporcionalidad es la lentitud si. De esta forma se
tiene un total de 16 diferentes parámetros por determinar para conformar el vector
[ ]
m = s1 , s2 , s3 ,..., s16 . Dicho modelo se puede expresar como un sistema de 8 ecuaciones
simultáneas:
97
Capítulo 4 4.2 Teoría de inversión
⎡ h h h h 0 0 0 0 0 0 0 0 0 0 0 0⎤ ⎡s 1 ⎤ ⎡ t 1 ⎤
⎢0 0 0 0 h h h h 0 0 0 0 0 0 0 0 ⎥ ⎢s ⎥ ⎢ t ⎥
⎢ ⎥ ⎢ 2 ⎥ ⎢ 2 ⎥
⎢ . ⎥ ⎢. ⎥ ⎢. ⎥
⎢ ⎥ ⎢ ⎥=⎢ ⎥ ,
⎢ . ⎥ ⎢. ⎥ ⎢. ⎥
⎢ . ⎥ ⎢. ⎥ ⎢. ⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎣0 0 0 h 0 0 0 h 0 0 0 h 0 0 0 h ⎦ ⎣s16 ⎦ ⎣ t 16 ⎦
donde “h” es tanto el ancho como el alto de todos los bloques que forman el muro.
Con estos dos ejemplos quedaron concretamente planteados dos problemas reales de
inversión lineal. A continuación se verá de qué manera es posible obtener alguna solución
o cuando menos alguna información acerca de los parámetros del modelo, fin último de
un proceso de inversión.
98
Capítulo 4 4.3 Solución por mínimos cuadrados
El método más simple para resolver el problema inverso lineal por excelencia, Gm = d,
está basado en mediciones de la dispersión que hay entre los datos observados dobs y los
datos sintetizados dsin = Gmest, a partir de un conjunto de parámetros estimados mest.
Mediante este método se buscan los valores de los parámetros que hagan que los datos
sintetizados sean lo más parecidos a los datos observados. Para poder evaluar este
parecido se define una función de error, o de desajuste, que determina la diferencia que
hay entre cada pareja de datos: e i = d obs
i − d sin
i . El mejor ajuste entre los datos observados
y los datos sintetizados provendrá del conjunto de parámetros que hagan que la función
que aparece en seguida (4.3-1), denominada longitud euclidiana de un vector (en este
caso de “e”), adquiera el valor mínimo:
N
E = ∑ e 2i . (4.3-1)
i =1
La función que se seleccione para evaluar el desajuste entre los datos sintetizados y los
datos reales va a ser determinante en la solución que se obtenga del problema. Por
ejemplo, existe una serie de funciones de este tipo, llamadas también normas, cuya
expresión general es la siguiente:
1
⎡ ⎤n
Norma L n = ⎢∑ |e i |n ⎥ , (4.3-2)
⎣ i ⎦
en donde el valor que adquiera la “n” determinará la norma de la que se trate, ya sea la L1,
L2 o la norma que sea. Si se analiza con cuidado dicha familia de normas, el lector se
dará cuenta que mientras mayor es el orden de la norma, el valor final de ésta se verá
muy afectado por los datos más dispersos, aquellos que se alejen más de la tendencia
general. Por el contrario, si se trata de una norma de orden inferior, como la norma L1 ó la
norma L2, entonces el valor final de la función de error dependerá más equitativamente de
todas las diferencias y no solamente de las de mayor magnitud. Esto quiere decir que, en
el caso donde existan unos cuantos datos dispersos o erróneos, éstos no afectarán de
manera significativa el valor del desajuste que indique la norma. A los métodos de
99
Capítulo 4 4.3 Solución por mínimos cuadrados
inversión capaces de converger hacia una solución sin verse afectados por observaciones
alejadas de la tendencia general se les conoce como métodos robustos.
Siguiendo con la solución por mínimos cuadrados, se decía que ésta parte de la
evaluación de una función de error que habíamos llamado longitud euclidiana del vector
“e”. Si no olvidamos que la respuesta de un modelo a un conjunto de parámetros está
dada por dsin = Gmest, entonces la diferencia que define al vector e puede expresarse
como:
e = Gmest − d obs , (4.3-3)
de tal forma que la longitud euclidiana (ecuación 4.3-1) pueda expresarse a través del
producto interior del vector e que, empleando la ecuación (4.3-3), nos queda:
Si encontramos el valor de los parámetros que hagan que esta función sea mínima,
entonces diremos que ese conjunto de valores es la solución de nuestro problema, ya que
proporciona la respuesta sintética más parecida a los datos observados. El valor mínimo
de la función E se obtiene derivándola con respecto a los parámetros e igualando dicha
expresión con cero, esto es:
∂E
= 0. (4.3-5)
∂m
∂
∂m
( mT G T Gm − d T Gm − mTG T d + d Td) = 0 . (4.3-6)
que expresadas en función de los parámetros del modelo estimados, producen la solución
general por mínimos cuadrados del problema inverso lineal Gm = d:
100
Capítulo 4 4.3 Solución por mínimos cuadrados
m est = [ G T G ] G T d .
-1
(4.3-8)
Un ejemplo que sirve para ilustrar la validez de esta solución podría ser el problema en el
que se desea ajustar una serie de datos con una parábola, situación que ya fue planteada
en uno de los ejemplos de la sección 4.2-iii. Ahí se decía que el sistema de ecuaciones
lineales a resolver para los parámetros era el siguiente:
⎡1 z1 z12 ⎤ ⎡d 1 ⎤
⎢ ⎥ ⎢d ⎥
⎢1 z2 z 22 ⎥
⎡a ⎤ ⎢ 2 ⎥
⎢. . . ⎥ ⎢ ⎥ ⎢. ⎥
⎢ ⎥ ⎢b⎥ = ⎢ . ⎥ , (4.3-9)
⎢. . . ⎥
⎢⎣c ⎥⎦ ⎢ ⎥
⎢. . . ⎥ ⎢. ⎥
⎢ ⎥ ⎢ ⎥
⎢⎣1 zN z 2N ⎥⎦ ⎣d N ⎦
donde a, b y c, que son los parámetros del modelo, corresponden a los coeficientes de la
ecuación cuadrática d i = a + bz i + cz 2i , di son los datos conocidos asociados a las
variables auxiliares zi, que también son conocidas en el problema. Hay que recordar que
el sistema de ecuaciones (4.3-9) proviene de desarrollar, para este problema en
particular, la ecuación general Gm = d.
Construyendo por partes la ecuación (4.3-8) tenemos que
⎡1 z1 z 2N ⎤
⎢ ⎥
⎢1 z2 z 2N ⎥
⎡1 1 . . . 1 ⎤ ⎡N ∑ z i ∑ z 2i ⎤
⎢ ⎥ ⎢. . . ⎥ ⎢ ⎥
G T G = ⎢ z1 z 2 . . . z N ⎥ ⎢ ⎥ = ⎢∑ z i ∑ z 2i ∑ z 3i ⎥ . (4.3-10)
⎢. . . ⎥ ⎢ 2
⎢z2 z2 . . . z2 ⎥
⎢. ∑ z ∑ z 3i ∑ z 4i ⎥⎦
⎣ 1 2 N⎦
. . ⎥ ⎣ i
⎢ ⎥
⎢⎣1 zN z 2N ⎥⎦
101
Capítulo 4 4.3 Solución por mínimos cuadrados
⎡d 1 ⎤
⎢d ⎥
⎡1 1 . . . 1 ⎤ ⎢ 2 ⎥ ⎡∑ d i ⎤
⎢ ⎥⎢. ⎥ ⎢ ⎥
G d = ⎢z 1
T
z 2 . . . z N ⎥ ⎢ ⎥ = ⎢∑ z i d i ⎥ . (4.3-11)
⎢. ⎥
⎢z 2
⎣ 1 z 22 . . . z 2N ⎥⎦ ⎢ ⎥ ⎢⎣ ∑ z i2 d i ⎥⎦
.
⎢ ⎥
⎢⎣d N ⎥⎦
-1
⎡ N ∑ z i ∑ z i2 ⎤ ⎡∑ d ⎤
m
{r
est
= [
G T
G
123 {
]
-1 T
G
r
d =
⎢
⎢
⎢
z z z
⎥ ⎢ i ⎥
∑ i ∑ i ∑ i ⎥ ⎢∑ z i d i ⎥ .
2 3
(4.3-12)
x 4⎥ ⎢ 2 ⎥
A−1 b 2 3
⎢⎣ ∑ z i ∑ z i ∑ z i ⎥⎦ ⎣∑ z i d i ⎦
Está claro que para poder conocer los valores numéricos de los parámetros estimados
(coeficientes de la cuadrática) hace falta sustituir los valores que demandan las matrices
en la ecuación (4.3-12), además de invertir la matriz cuadrada que está contenida en la
solución. Es muy importante notar que, a diferencia del sistema original rectangular
surgido de plantear el problema de inversión en forma matricial (ecuación 4.3-9), la
solución general lograda a través del criterio de mínimos cuadrados (ecuación 4.3-12)
siempre consistirá en un sistema de ecuaciones cuadrado sin importar el problema del
que se trate. Siguiendo la nomenclatura que indican los corchetes en la ecuación anterior,
se puede expresar dicho sistema de ecuaciones de la forma algebraica más habitual:
r r
Ax = b . (4.3-13)
Una de las condiciones necesarias para que la solución del problema inverso lineal
planteada en la sección 4.3 (ecuación 4.3-8) conduzca a un resultado definido y verosímil,
es que el problema tenga solución única. Aunque normalmente son los problemas lineales
los que presentan esta propiedad, existen también otros que aún siendo moderadamente
no lineales son de naturaleza semejante. Para abordar estos problemas existe una serie
de métodos que son capaces de resolverlos explorando muy peculiarmente el dominio de
soluciones. La forma en que dichos métodos encuentran la solución puede visualizarse
mejor si se piensa que operan iterativamente. En ellos, la búsqueda de la solución
comienza en un punto determinado del dominio de soluciones, esto es, proponiendo un
conjunto inicial de valores para las incógnitas (parámetros) del problema, a partir del cual
comenzará su convergencia empleando diferentes criterios de aproximación según sea el
método que esté usándose. En la figura 4.3 se muestra
Solución
Función objetivo
(de error) constante
Parámetro B
xI
xo Ruta de convergencia
Parámetro A
gráficamente la manera como convergen estos métodos que, por depender de una
solución inicial, restringen su búsqueda a las vecindades de dicha solución, es decir, a un
sector muy localizado del amplio dominio de soluciones. De ahí reciben el nombre de
métodos de búsqueda local.
Probablemente la debilidad más importante de estos algoritmos es la dependencia tan
grande que hay entre la solución inicial de la cual parten, y el resultado del proceso. Si se
103
Capítulo 4 4.4 Métodos de búsqueda local
trata de un problema de inversión no lineal con solución no única, es decir, con una
vastedad de mínimos en la función de error, entonces los métodos locales divergirían o se
estancarían en soluciones parciales que se encuentran más cercanas al valor inicial de
los parámetros. Además, la mayoría de los algoritmos ni siquiera pueden enfrentar dichos
problemas ya que parten de expresar al modelo matemático como un sistema de
ecuaciones lineales, lo que es imposible en los casos de funciones fuertemente no
lineales, incluso cuando se linealicen con expansiones truncadas de primer grado ya que
el error por truncamiento es mayor que el orden mismo de la aproximación.
A continuación se estudiarán los métodos numéricos más empleados para resolver el
sistema de ecuaciones del planteamiento por mínimos cuadrados (ecuación 4.3-8),
además de otros diseñados para minimizar la función de error en problemas de inversión
lineales o moderadamente no lineales. Normalmente el método de búsqueda local recibe
el nombre del método numérico que se esté empleando.
Los métodos directos son aquellos que siguen el mismo principio de eliminación, pero
cada uno con peculiaridades que lo distinguen. Por ejemplo, existe un esquema particular
de eliminación sistemática conocido como Eliminación Gaussiana. Dicho esquema de
eliminación realiza los siguientes pasos:
r
1. Aumentar la matriz A de coeficientes n x n con el vector b de términos
independientes para formar una matriz n x (n+1).
2. Intercambiar renglones si es necesario para hacer que el coeficiente a11 sea el
mayor de toda la primer columna.
3. Crear ceros desde el segundo hasta el último renglón en la primera columna,
restando ai1 / a11 veces el primer renglón del i-ésimo renglón.
4. Repetir las mismas operaciones explicadas en los pasos 2 y 3 del segundo
hasta el penúltimo renglón, colocando los coeficientes de mayor magnitud en la
diagonal principal intercambiando renglones (considerando únicamente los
renglones del j hasta el n), y entonces restar aij / ajj veces el j-ésimo renglón del
105
Capítulo 4 4.4 Métodos de búsqueda local
i-ésimo creando ceros en todas las posiciones de la j-ésima columna por debajo
de la diagonal.
5. Una vez que se tiene como resultado una matriz triangular superior, se lleva a
cabo una sustitución hacia atrás para conocer el valor de todas las incógnitas.
106
Capítulo 4 4.4 Métodos de búsqueda local
j −1
lij = aij − ∑ lik ukj , j ≤ i , i = 1,2,..., n
k =1
bi − ∑ k =1 lik b'k
i −1
b'i = , i = 2,3,... n
lii
b'1 = b1 l11 .
En contraste con los métodos directos de eliminación se tienen los métodos indirectos o
iterativos que resuelven los mismos sistemas de ecuaciones pero de una manera más
eficiente, sobre todo si el sistema por resolver es poroso, esto es, si contiene una gran
cantidad de ceros como coeficientes. Dichos métodos, además de ser económicos en
cuanto a memoria de almacenamiento requerida por la computadora, pueden ser
aplicados en la resolución de sistemas de ecuaciones no lineales.
107
Capítulo 4 4.4 Métodos de búsqueda local
El primer método de los que se verán de esta familia se conoce como el método de
Jacobi. En él, para resolver un sistema de N ecuaciones con N incógnitas, se deben
acomodar los renglones del sistema de tal forma que los elementos de mayor amplitud se
encuentren en la diagonal principal de la matriz de coeficientes ampliada. Una vez
reordenado el sistema, se despeja de cada renglón la incógnita situada en la diagonal
principal, quedando el sistema de la siguiente forma matricial:
x ( n+1) = b − Ax ( n ) ,
N a
bi
( n +1)
= − ∑ x (j n ) , n = 1,2,...
ij
xi
aii j =1 aii
j ≠i
La condición suficiente para garantizar la convergencia del método es que el número que
se encuentre en la diagonal principal dentro de cada renglón sea mayor, en valor
absoluto, que la suma del resto de los elementos del mismo renglón. Expresando dicha
condición en forma matemática se tiene
N
aii > ∑ aij , i = 1,2,..., N .
j =1,
j ≠i
Una modificación sencilla de este método conduce a otro conocido como el algoritmo de
Gauss-Seidel. Este algoritmo hace que la convergencia hacia la solución del sistema sea
más rápida. La modificación consiste en calcular la aproximación de la variable en turno
por sustitución, de la misma manera que en el método anterior, pero en este caso
utilizando siempre la aproximación más reciente del resto de las variables que se
requieran. Este proceso iterativo queda matemáticamente expresado como
108
Capítulo 4 4.4 Métodos de búsqueda local
Existe otro método iterativo que converge más rápido que el de Gauss-Seidel. Se conoce
como el método de Relajación, y aunque provee ciertas ventajas, desafortunadamente no
es fácil de adaptar a una aplicación de cómputo. Sin embargo, este método tuvo una gran
importancia histórica por establecer nuevas bases para el desarrollo de otros más
poderosos. Su esencia consiste en mejorar el error que vaya acarreando cada una de las
variables durante el proceso iterativo. En contraste con el método de Gauss-Seidel, en
éste no se despejarán las incógnitas sino que se colocarán todos los términos del sistema
al lado izquierdo, igualándolos con cero. Después, se divide cada una de las ecuaciones
entre su coeficiente más grande (en valor absoluto) cambiándolo a signo negativo en caso
de que no lo sea ya. De esta manera se tiene en cada ecuación a una de las incógnitas
con coeficiente unitario. A continuación se elige un conjunto inicial de valores para las
variables del sistema y se evalúan obteniendo una serie de resultados, que por ser la
primera aproximación, serán diferentes de cero en cada ecuación. A cada uno de éstos se
le llama residuo R. El método recibe el nombre de relajación porque hará los cambios
pertinentes a la variable en cuya ecuación se haya obtenido el residuo más grande con el
fin de hacer que este residuo se relaje, esto es, que valga cero. El valor que debe tomar la
incógnita es precisamente el valor del residuo, ya que con el menos uno que posee como
coeficiente (la variable), en el momento de evaluarla, dicha ecuación valdrá cero mientras
que el resto de las ecuaciones cambiarán sus residuos. El proceso seguirá iterando hasta
lograr que todos valgan cero. Obviamente la solución del sistema serán las cantidades
finales que adopten todas las variables y que hagan que simultáneamente todas las
ecuaciones valgan cero.
A pesar de que el método de relajación no se usa hoy en día, gracias a él se pudo
acelerar la convergencia del método de Gauss-Seidel a través de una Sobrerelajación
del mismo. La relación iterativa general del método de Gauss-Seidel está expresada en la
ecuación (4.4-1). Esta ecuación, factorizando y utilizando una equivalencia algebraica,
puede expresarse como:
1 ⎛ i −1 N ⎞
xi( k +1) = xi( k ) + ⎜ bi − ∑ aij x (j k +1) − ∑ aij x (j k ) ⎟ .
aii ⎝ j =1 j =i ⎠
109
Capítulo 4 4.4 Métodos de búsqueda local
w⎛ i −1 N ⎞
x( k +1)
=x (k )
+ ⎜ bi − ∑ aij x j
( k +1)
− ∑ aij x (j k ) ⎟ .
i i
aii ⎝ j =1 j =i ⎠
Existen métodos iterativos que pueden resolver tanto problemas lineales como
moderadamente no lineales. Con el término moderadamente nos referimos a aquellas
funciones de comportamiento suave, con solución única y que no presentan diversidad de
máximos, mínimos o puntos de inflexión. De lo contrario, a menos que la búsqueda de la
solución se comience en un punto del dominio muy cercano a ella, los métodos
fracasarían estancándose en regiones alejadas de la solución del sistema. Pensemos
primero en el problema unidimensional, donde se debe encontrar la solución de una sola
ecuación, o función no lineal g( x) . Estos métodos comienzan por linealizar el problema.
Dicha función puede aproximarse truncando su expansión de Taylor de la siguiente
manera:
g ( x k +1 ) ≈ g ( x k ) + g '( x k ) ( x k +1 − x k ) .
Dado que se desea encontrar la solución de dicha ecuación, al igualarla a cero resultan
las siguientes expresiones
k +1 k +1 g( x k )
k
g '( x ) ( x − x ) = − g( x ) ⇒ x
k k
=x −
k
(4.4-2)
g '( x k )
que como vemos, proporcionan la siguiente aproximación del valor de la incógnita a partir
de su valor anterior. La forma en que converge dicho método, conocido como el de
Newton, se puede visualizar fácilmente de manera gráfica con un simple análisis de la
expresión anterior (ecuación 4.4-2). Para el caso n-dimensional, es decir para un sistema
de n ecuaciones, la solución queda expresada, por analogía con la ecuación (4.4-2),
110
Capítulo 4 4.4 Métodos de búsqueda local
mediante una matriz Jacobiana “J” que posee las derivadas de las ecuaciones del sistema
con respecto a los parámetros o incógnitas del problema:
J k ( x k +1 − x k ) = − g k , (4.4-3)
J 0 ( x k +1 − x k ) = − g ( x k ) .
( ∆g − J o ∆x)( ∆x ) T
J1 = Jo + .
( ∆x) T ( ∆x )
Este procedimiento es un poco más costoso que el de Newton modificado, que mantiene
fija a la matriz J en Jo.
Con un planteamiento similar al del método de Newton, convirtiendo a la matriz Jacobiana
en un múltiplo de la matriz identidad ( I α ), se llega a una expresión que sintetiza el
algoritmo conocido con el nombre de máxima pendiente (o steepest descent). Este
111
Capítulo 4 4.4 Métodos de búsqueda local
método, utilizado para minimizar funciones como podría ser la del error entre las
observaciones y los sintéticos, determina las sucesivas aproximaciones empleando el
gradiente de la función minimizada, esto es, incrementa los parámetros (incógnitas) en la
dirección hacia la cual decrece más rápidamente la función objetivo. Si la función por
minimizar es P ( xi ) , entonces la expresión iterativa que describe la aproximación del
método es la siguiente:
x k +1 − x k = −α g ( x k ) ⇒ x k +1 = x k − α g ( x k ) ,
donde
∂P
g( xi ) = ∇P( xi ) = ,
∂ xi
y α es un escalar. A pesar de que este método asegura que en cada iteración la
búsqueda encontrará una solución mejor, muchas veces no se alcanza el valor exacto del
mínimo de la función en un tiempo finito. Además, su convergencia es lenta debido a que
muchas veces la dirección de máxima pendiente no es la más eficiente para alcanzar la
solución esperada. Por esta razón, existen otros métodos que suponen que la función
objetivo es perfectamente cuadrática en cada punto, esto les da la capacidad de elegir
direcciones de convergencia d ( x k ) mejores que la que indica el gradiente de la función
− g( x k ) . Tal es el caso del método de gradiente conjugado, uno de los más usados.
Como ya se dijo, en él la dirección de convergencia estará determinada por el vector
definido por d ( x k ) = − g( x k ) + β d ( x k −1 ) , que como se ve, comparándolo con el del
método anterior, posee un término o vector de corrección que involucra un nuevo
parámetro β. Dicho parámetro se define como β = gkT ( gk − gk −1 ) gkT−1 gk −1 debido a que
16
A-ortogonal significa que el producto interior de todos los vectores generados vale cero y que está
ponderado por A de la siguiente forma: (d k ) T Ad k −1 = 0.
112
Capítulo 4 4.4 Métodos de búsqueda local
Como se dijo anteriormente, los últimos cuatro métodos iterativos estudiados son capaces
de resolver problemas moderadamente no lineales. Los métodos de Newton modificado y
de steepest descent usan menos información que el de Newton ya que el primero emplea
sólo a Jo y el segundo sólo g . Por estas razones, su costo computacional, al converger
más lentamente, es mayor que el de los métodos restantes, quasi-Newton y gradiente
conjugado.
En los años 80’s se publicaron trabajos donde la teoría de inversión comenzaba a ser
aplicada al modelado de las novedosas funciones de receptor, técnica propuesta por
Langston en 1979. En ellos se formularon esquemas de inversión lineal para inferir
modelos cuantitativos de la estructura por debajo del receptor. Se usaron pues, métodos
numéricos de búsqueda local como los que se estudiaron en la sección anterior (4.4-i).
La construcción de una función de receptor implica el cálculo de un sismograma sintético,
problema numérico altamente no lineal (Ammon, et al., 1990). Por esta razón, cualquier
planteamiento numérico de búsqueda local para resolver este problema de manera
inversa demanda comenzar el proceso con una solución inicial muy cercana a la solución
“real” del problema (Ammon, et al., 1990; Owens, et al., 1984).
En el trabajo que Owens y compañía llevaron a cabo en 1984, se plantea el proceso
iterativo a partir de una expansión de Taylor truncada, de manera semejante al método
iterativo de Newton explicado en la sección anterior (4.4-i). Ellos minimizan la diferencia
entre la función de receptor observada y la sintética. Esto se puede escribir, después de
linealizar el problema con la expansión antes mencionada, como:
N
∂ Ri
dRi = R obs
− Ri ( pk ) = ∑ dpk ,
k =1 ∂ pk
i
en el dominio del tiempo; la “pk” los parámetros iniciales del modelo; y por último la Riobs la
función de receptor radial observada. En este esquema iterativo de inversión, el conjunto
de parámetros pk es corregido con el incremento dpk sucesivamente, hasta que algún
criterio de convergencia se haya satisfecho. Sin lugar a dudas, este procedimiento
113
Capítulo 4 4.4 Métodos de búsqueda local
d j = Fj [ m] j = 1,2,3,..., N ,
donde dj representa los datos y Fj el funcional que opera sobre los parámetros del modelo
m para generar una forma de onda, entonces la aproximación truncada de dicho funcional
se puede escribir como
[ ]
Fj [ m] ≈ Fj m0 + ( D, δm) ⇒ ( D, δm) ≈ Fj [ m] − Fj [m0 ] , (4.4-4)
( D, m) j ≈ d j − Fj [m0 ] + ( D, m0 ) j . (4.4-5)
Esta nueva ecuación, en contraste con la ecuación (4.4-4), se resuelve para los
parámetros del modelo m y no para el vector de corrección δm. Además, implica una
disminución del trade-off en los parámetros a la hora de minimizar el desajuste de los
datos para diferentes normas. Por último, el método que proponen introduce una
condición que procura la simplicidad de los modelos finales, dado que este criterio (el de
simplicidad) siempre es deseable en una inversión. Para esto se restringe la inversión
empleando una norma de suavidad del modelo (Constable et al., 1987). La aproximación
no anula las discontinuidades de primer orden del modelo, sin embargo, sí produce un
suavizamiento general de las velocidades en el modelo final. Para introducir la condición
114
Capítulo 4 4.4 Métodos de búsqueda local
⎡D ⎤ ⎡r ⎤ ⎡ Dm0 ⎤
⎢σ∆ ⎥ m ≈ ⎢0⎥ + ⎢0 ⎥ , (4.4-6)
⎣ ⎦ ⎣ ⎦ ⎣ ⎦
donde r es el vector residual dado por dj - Fj[mo] y la matriz ∆ contiene las segundas
diferencias del modelo m. El parámetro ajustable σ controla el trade-off entre el ajuste de
las formas de onda y el suavizado del modelo. Para más detalles ver Ammon, et al.
(1990).
A pesar de todo el esfuerzo por mejorar la búsqueda de soluciones para el problema de
inversión de funciones de receptor, inevitablemente el modelo inicial a partir del cual
comenzará a convergir el método, deberá estar muy próximo a la solución “real” del
problema. De lo contrario, el proceso corre el gran riesgo de caer en un mínimo local,
correspondiente a una solución parcial del problema del cual no es capaz de salir.
Todavía en 1997 sigue habiendo intentos por modelar problemas de esta complejidad
empleando métodos locales. En el trabajo de Ozalaybey, et al. (1997) se estudian
simultáneamente la dispersión de ondas superficiales y las funciones de receptor. Aquí,
toman el trabajo de Ammon, et al. (1990) recién abordado, para modificarlo introduciendo
una restricción más, a parte de la del suavizado que ya está contenida. Se trata de
insertar condiciones a priori en el sistema de ecuaciones implícito en la ecuación (4.4-6)
proporcionadas por mediciones de la velocidad de fase de ondas superficiales. Las
nuevas restricciones, una vez introducidas, producen el sistema
⎡D ⎤ ⎡rr ⎤ ⎡ Dm0 ⎤
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢σ∆ ⎥ m ≈ ⎢0 ⎥ + ⎢0 ⎥ , (4.4-7)
⎢⎣ F ⎥⎦ ⎢⎣rc ⎥⎦ ⎢⎣ Fm0 ⎥⎦
115
Capítulo 4 4.4 Métodos de búsqueda local
En los apartados precedentes 4.3 y 4.4 quedó claro que los métodos de optimación local
no son los más apropiados para resolver problemas multiparamétricos no lineales, a pesar
de contar con herramientas para abordarlos (algunos de ellos). La razón fundamental por
la cual sucede esto es precisamente aquella que los distingue, en términos generales, de
los algoritmos de optimación global: durante su búsqueda exploran exclusivamente un
pequeño sector del dominio de soluciones, restringido a la vecindad que circunda la
solución inicial. De ahí se deriva que si la solución “real” del problema, es decir, el mínimo
absoluto de la función objetivo se encuentra alejada del sitio de la solución inicial, jamás
se alcanzará la deseada ya que habrá mínimos relativos interpuestos en su camino,
lugares donde quedarán entrampados inequívocamente estos métodos. Como ya se dijo
en apartados anteriores, los métodos más usados correspondientes a este grupo son la
inversión de matriz implicada en el planteamiento por mínimos cuadrados (apartado
4.3), o los algoritmos que emplean el gradiente de la función objetivo como lo es el de
máxima pendiente (Steepest descent) o el de gradiente conjugado (apartado 4.4-i). En
general, los métodos de búsqueda local explotan la escasa información derivada de la
comparación de una pequeña cantidad de modelos, evitando así una búsqueda extensiva
en el espacio de modelos (Sambridge y Drijkoningen, 1992).
Los métodos de búsqueda global, como su nombre lo indica, exploran todo el dominio de
soluciones a lo largo del proceso de inversión. Hacen un rastreo “global” en el espacio
finito de modelos. De esta manera, a pesar de existir soluciones parciales del problema,
es mayor la probabilidad de que la solución final corresponda al mejor ajuste entre los
datos observados y los datos sintéticos. Esta clase de métodos, en contraste con los
anteriores, no requieren de la información proporcionada por las derivadas de la función
objetivo debido a que en ellos no se linealiza el problema. Por el contrario, los algoritmos
de optimación global emplean procesos estocásticos para explorar el espacio de
soluciones y así encontrar los mejores modelos.
Se conoce como espacio de soluciones de un problema de optimación dado al dominio de
modelos que, acotado previamente, define el rango de variación donde el valor de cada
116
Capítulo 4 4.5 Métodos de búsqueda global
117
Capítulo 4 4.5 Métodos de búsqueda global
119
5 Algoritmos Genéticos
y Cristalización Simulada
como métodos de inversión global.
Capítulo 5 5.1 Algoritmos Genéticos
Hasta el momento el lector debe tener ya una visión general de lo que significa resolver
un problema de inversión, y de las herramientas que normalmente son utilizadas con este
objeto. En el capítulo anterior se estudiaron los conceptos involucrados con este asunto,
deteniéndonos hacia la parte final en los métodos de búsqueda local más importantes, así
como de manera escueta en los de búsqueda global. Fue breve la discusión de los
métodos de optimación global porque precisamente es en este capítulo donde se dará
una explicación más cuidadosa: en primer plano, de Genetic Algorithms (GA) y en
segundo, de Simulated Annealing (SA), ya que fueron los algoritmos empleados en el
desarrollo de esta investigación.
El lector también se preguntará porqué se incluyó el tratamiento de SA en el contenido de
este capítulo cuyo nombre no le hace referencia alguna. La razón es que paralelamente al
modelado de los datos empleando GA, comenzamos a probar este otro método de
optimación. Al ver que la calidad de los resultados era comparable con la que hasta
entonces se tenían, se decidió complementar las inferencias que arrojaran ambos y así
asegurar un poco más la veracidad de nuestras conclusiones.
En las últimas páginas del capítulo 4 señalamos los rasgos que distinguen a los métodos
de búsqueda global de los de búsqueda local. Para esto se utilizó una superficie de costo
(función objetivo17) con espacio de soluciones bidimensional (figura 4.4) que contuviera
dos máximos, uno relativo y otro absoluto. En ella aparece una de las tantas rutas de
aproximación hacia el máximo absoluto que pueden trazarse. Hay que notar que el ajuste
de los modelos que contiene dicha ruta puede comenzar a empeorar, aun cuando los
valores de los parámetros se aproximen sucesivamente a los valores que se encuentran
bajo el máximo absoluto. En esta situación, métodos iterativos de búsqueda local como lo
son “steepest descent” o gradiente conjugado (sección 4.4-i), que se desplazan sobre la
superficie de costo desde un modelo inicial únicamente en la dirección hacia donde
mejora la función de costo, no podrían superar los altibajos que se interpongan entre su
posición dentro del dominio de soluciones y la posición de la solución “real”. Además,
suponiendo que alcanzaran el máximo relativo (solución parcial), les sería imposible
abandonarlo en aras de alcanzar el más alto de todos. Esto debido a que en todas las
direcciones empeora la función de costo.
Entendiendo estas limitaciones, presentes en los métodos de optimación local, es como
se justifica el uso de otro tipo de algoritmos cuya filosofía descanse en ideas y principios
17
Función cuyas ordenadas indican el ajuste que presentan los datos observados y la respuesta sintética de los
diferentes modelos (superficie alabeada figura 4.4) existentes en el dominio de soluciones (plano horizontal
figura 4.4).
122
Capítulo 5 5.1 Algoritmos Genéticos
123
Capítulo 5 5.1 Algoritmos Genéticos
124
Capítulo 5 5.1 Algoritmos Genéticos
algoritmos de optimación más poderosos (Goldberg, 1989; Berg, 1990). Así, GA ha sido
utilizado en diversas áreas de la investigación, tales como la optimación de funciones,
problemas de ordenamiento, y programación automática. En los últimos años se han
realizado numerosos trabajos con GA en el ámbito de la sismología. Stoffa y Sen (1991,
1992), aplicaron GA a la inversión de registros de ondas planas para obtener la estructura
de la velocidad para la propagación de ondas compresionales y de densidades a partir de
datos de reflexión. Por otro lado, Sambridge y Drijkoningen (1992) mostraron el poder de
GA en contraste con el método de Monte Carlo con un problema de optimación
multiparamétrico donde se invierten registros de refracción para obtener modelos
unidimensionales de velocidades. Kennett y Sambridge (1992) resuelven el problema de
la localización hipocentral empleando GA. Además de éstos, existen trabajos
sismológicos aún más recientes. Entre otros, el que realizó Zhou et al. (1995) para
restringir la estructura cercana a la fuente, o el de Yamanaka y Ishida, (1996) donde
invierten las curvas de dispersión de ondas superficiales. Por último, el trabajo que realizó
Shibutani et al. (1996) con GA para invertir funciones de receptor proponiendo un modelo
estructural de la corteza y manto superior, trabajo cuyos objetivos y procedimientos se
asemejan a los que se emplearon en esta investigación.
ii) El método.
(bi − ai )
di = , (5.1-1)
Ni
125
Capítulo 5 5.1 Algoritmos Genéticos
64415 3 448
7448 6447 8 448
6447
0 1 1 1 1 0 0 0 1 1 0 1 0 0 0
Cromosomas
Genes
0 0 1 1 1 1 0 1 0 0 0 0 1 1 0
1442443 1442443 1442443
7 20 6
126
Capítulo 5 5.1 Algoritmos Genéticos
La codificación binaria que se ha descrito es una de tantas posibles de las que se pueden
implantar en diferentes algoritmos genéticos (Holland, 1975). Únicamente los modelos de
la generación inicial son construidos aleatoriamente. Los modelos de todas las
generaciones posteriores se crean a partir de los tres mecanismos evolutivos esenciales:
la selección, la cruza y la mutación.
La secuencia iterativa que comprende el algoritmo se desarrolla en el siguiente orden.
Primero, a cada uno de lo individuos de la población actual (población inicial aleatoria
únicamente en la primer iteración) se le determina su calidad. Para el caso del modelado
inverso de un fenómeno observado, se evalúa, por modelo, el ajuste que poseen su
respuesta sintética empleando el problema directo y los datos observados del fenómeno
que se esté modelando. Es decir, se calcula la función de costo Φ(m) para cada individuo.
De esta manera, una vez que haya terminado el ciclo que asigna una calificación a cada
modelo, se tienen los elementos necesarios para llevar a cabo la selección de los
individuos más aptos, los que poseen mejores ajustes.
Selección.
Φ max Φ ( mk )
Pr ( mk ) = − , (5.1-3)
Q ⋅ (Φ max − Φ prom ) Q ⋅ (Φ max − Φ prom )
127
Capítulo 5 5.1 Algoritmos Genéticos
donde Φmax, y Φprom son las funciones de costo máxima y promedio de la generación, y Q
es la cantidad de individuos de la población.
Para entender el procedimiento de selección podemos imaginar una ruleta como las que
se usan en los casinos. Cada casilla corresponderá a un modelo específico de la
población. La única diferencia consiste en que las dimensiones de las casillas de nuestra
ruleta no son iguales entre sí, se trata de una ruleta sesgada (Goldberg, 1989). Las
dimensiones de las casillas dependerán precisamente de la probabilidad de selección de
cada modelo. Por ejemplo, si la probabilidad de un individuo es del 60%, entonces su
casilla será más grande (proporcionalmente) que la de aquél con probabilidad del 20%. Lo
que hace el algoritmo genético empleado en este ejercicio es correr la ruleta tantas veces
como modelos haya en la población. Así, lo más probable es que aquéllos que tengan una
casilla más grande saldrán ganadores (seleccionados) más veces que los que la tengan
pequeña. Al término de esto, la población seleccionada seguirá siendo de Q modelos. Por
si fuera poco, nuestro algoritmo, en caso de que no seleccione al mejor modelo, se
asegura de incluirlo en la siguiente generación reemplazando al peor de todos. Esto
último, conocido como “selección elite”, fue propuesto por Yamanaka e Ishida (1996).
Otras dos de las expresiones más usadas para determinar la probabilidad de selección de
los modelos (Sambridge y Drijkoningen, 1992) en problemas donde se minimice la función
de desajuste, son:
Pr ( m k ) = a − bΦ ( m k ) , (5.1-4)
Pr ( m k ) = A exp[- B Φ ( m k )] , (5.1-5)
que corresponde a la distribución exponencial. Los valores que acostumbran tomar las
constantes a, b, A y B son los siguientes:
128
Capítulo 5 5.1 Algoritmos Genéticos
donde Φmax, Φprom y Φσ son las funciones de costo máxima, promedio, y la desviación
estándar de todos los desajustes de la población inicial, respectivamente.
Stoffa y Sen (1991) propusieron otro tipo de selección basada en una probabilidad que
denominaron de actualización (update). Este criterio probabilístico es usado para decidir
qué modelos pertenecientes a la generación anterior deben sustituir a ciertos modelos de
la generación actual. El mecanismo es muy sencillo. Para cada modelo actual se compara
su desajuste con el desajuste de un modelo elegido al azar de la generación recién
pasada. Si el desajuste del modelo actual es menor, entonces éste siempre se conserva.
Si no, existe un valor Pu que establece la probabilidad de sustitución del modelo anterior
por el actual. Este procedimiento controla la influencia de los ajustes de generaciones
previas en la población del momento. El valor óptimo al que llegaron Stoffa y Sen para Pu
fue del 90%.
Cruza.
Una vez que se tiene la nueva población de Q modelos seleccionados, se lleva a cabo la
reproducción sexual (cruza) de los individuos. De manera opuesta a la procreación
asexuada, en donde la información genética de un hijo es una réplica exacta de la de un
solo padre, los descendientes derivados de la reproducción sexual poseen información de
ambos padres. En los procesos de reproducción biológica, cada uno de los dos
progenitores aporta una célula llamada gameto, que posee la peculiaridad de contener
únicamente la mitad de la información genética que posee el resto de las células del
organismo. Así, al llevarse a cabo la fecundación, ambos gametos se fusionan para
integrar el cigoto, que en el caso de la mayoría de las especies animales estaría
compuesto por un óvulo y un espermatozoide.
La reproducción sexual tiene la ventaja biológica de promover la variación genética entre
los miembros de una especie, ya que como se dijo, la descendencia es el producto de los
genes aportados por ambos progenitores, en vez de ser la copia genética de un solo
individuo. De una forma muy similar a la que se presenta en el mundo animal sexuado, los
algoritmos genéticos engendran nuevos modelos a partir de la generación progenitora: de
manera aleatoria, se integran Q/2 parejas de individuos, semejantes a la que se muestra
en la figura 5.1. Cada pareja es potencialmente capaz de cruzarse. Para determinar
cuáles de ellas llevarán a cabo la cruza, se le asocia a cada una un número al azar entre
cero y uno. Si dicho número es menor que el valor de Pc (conocido como probabilidad de
129
Capítulo 5 5.1 Algoritmos Genéticos
a)
⎫
0 1 1 1 1 0 0 0 1 1 0 1 0 0 0 ⎪ Partición de los dos
⎪
⎬ cromosomas padres
⎪ en cuatro gametos.
0 0 1 1 1 1 0 1 0 0 0 0 1 1 0 ⎪⎭
Bit aleatorio
de partición.
b)
⎫
0 1 1 1 1 0 0 0 1 0 0 0 1 1 0 ⎪ Intercambio y unión
⎪ de dos gametos,
⎬
⎪ formando dos
0 0 1 1 1 1 0 1 0 1 0 1 0 0 0 ⎪⎭ cigotos hijos.
Si se analizan los 6 bloques binarios resultantes, de cinco genes cada uno (figura 5.2-b),
veríamos que los números decimales correspondientes cambian para cada modelo.
Compárense las cantidades decimales asociadas a la figura 5.1 con las siguientes dos
triadas: para el modelo de arriba se tiene (15,19,6) y para el de abajo (7,4,8).
El propósito de cruzar dos cadenas diferentes en un algoritmo genético es explorar
nuevas regiones del dominio de soluciones donde quizás haya máximos absolutos (figura
4.3). Esto significa que el proceso puede crear un modelo hijo que caiga en una región
externa a la que se esté explorando del dominio, región que forzosamente tendrá una
18
Este valor determina el porcentaje de individuos por generación que se reproducirán.
130
Capítulo 5 5.1 Algoritmos Genéticos
función de costo media cuando menos del orden del promedio correspondiente a la
región de la cual provino el modelo, debido al proceso de selección (Holland, 1992). La
probabilidad de que un hijo caiga afuera de la región a la que pertenecen sus padres
depende de la distancia que haya, dentro de las cadenas binarias de los progenitores,
entre los unos y ceros que definen dicha región. Por ejemplo, el hijo que provenga de una
cadena que muestré la región19 (1 0 * * * *), la abandonará solamente si el bit de cruza
aleatorio cae en la segunda posición de la cadena, una posibilidad entre cinco para
cromosomas que contengan seis genes (Holland, 1992). Esta probabilidad podría ser
mucho menor si la cantidad de bits fuera más grande, digamos de 1000. En este caso se
hablaría de una probabilidad de 1 entre 999, que ya es considerablemente más chica.
Mutación.
19
Donde cada asterisco puede tomar el valor de cero o uno.
20
Un fenotipo es la expresión física o química de los genes en un organismo.
131
Capítulo 5 5.1 Algoritmos Genéticos
suceder, entonces, que la búsqueda migre de una región a otra del espacio de soluciones
(plano horizontal, figura 4.3).
Gen
seleccionado
Cromosoma
1 1 1 1 0 1 1 0 0 0 0 0 0 1 0 original.
Cromosoma
1 1 1 0 0 1 1 0 0 0 0 0 0 1 0 mutado.
Gen
mutado
132
Capítulo 5 5.1 Algoritmos Genéticos
1 M
⎛ σi ⎞
γ = ∑ ⎜⎝ x ⎟,
M i =1 i ⎠
133
Capítulo 5 5.1 Algoritmos Genéticos
Generación Inicial
Aleatoria
Problema Directo
Función de Costo
Selección
valores específicos “ideales” para los parámetros probabilísticos evolutivos que propician
una convergencia adecuada. Estos valores son los siguientes: Pc = 60%, Pm = 1% y Pu >
60%. Sin embargo, también encontraron que a pesar de poderse generalizar la aplicación
de dichos valores, el tamaño de la población es fundamental para favorecer la
134
Capítulo 5 5.1 Algoritmos Genéticos
i) Principios e historia.
135
Capítulo 5 5.2 Cristalización Simulada
ii) El método.
Para entender cabalmente la esencia del método y saber las razones por las que es tan
poderoso, es necesario abordar algunos conceptos básicos de la mecánica estadística.
La mecánica estadística es la principal disciplina abocada a la física de la materia
21
Existen minerales cuya cristalización se da por la precipitación de elementos químicos disueltos en una
solución sin necesidad de que haya una enfriamiento paulatino de la sustancia, v.g. la Calcita, el Yeso, etc..
136
Capítulo 5 5.2 Cristalización Simulada
( ) ( ( ) )
P { ri } = exp − E { ri } k B T , (5.2-1)
({ }) es la energía de la configuración, k
donde E ri B es la constante de Boltzman, y T es la
137
Capítulo 5 5.2 Cristalización Simulada
P( ∆E ) = exp( − ∆E k B T ) , (5.2-2)
que es muy parecida a la definición del factor de probabilidad de Boltzman, ecuación (5.2-
1). Para saber si es o no admitido el cambio de posición que implicó un aumento de la
energía del sistema, se elige aleatoriamente un número entre cero y uno que es
comparado con el valor de la probabilidad correspondiente a ese ∆E. Si es menor dicho
número, se admite el desplazamiento y se considera a la nueva configuración como la
inicial; si es mayor, no es admitido y se regresa a la configuración que se tenía antes del
movimiento. Repitiendo sucesivamente este procedimiento se está simulando el
movimiento térmico de los átomos del sistema (que se encuentra en equilibrio térmico), a
una temperatura fija T dada.
Haciendo una analogía con el problema de inversión, se podrían considerar a los átomos
recién mencionados, como los parámetros del modelo en el problema inverso; y a la
energía del sistema para una configuración cualquiera, como la función de costo
asociada al conjunto de parámetros {ri } dado. De esta manera, con el algoritmo descrito
138
Capítulo 5 5.2 Cristalización Simulada
Boltzman (figura 5.5) y en consecuencia, el tipo de modelos que van siendo aceptados
durante el proceso.
Al disminuir la temperatura se colapsa la distribución de Boltzman.
∆E ∆E ∆E
Fig. 5.5 Funciones probabilísticas de Boltzman para diferentes temperaturas. Nótese cómo
al decrecer la temperatura, las curva se colapsa hacia la parte de menor energía. Esto
implica que, conforme disminuye la temperatura, únicamente las configuraciones que
presenten un incremento pequeño en la energía del sistema serán aceptadas
Si lo que se desea es alcanzar el estado base del sistema, es decir, el estado de menor
energía y mayor ordenamiento, entonces se debe disminuir muy lentamente la
temperatura para simular un proceso cuasiestático. Esto quiere decir en términos
matemáticos que, durante el enfriamiento, nuestro sistema experimente una sucesión de
estados infinitesimalmente alejados del estado de equilibrio térmico. Si esto se logra,
entonces se puede decir que lo más probable es que todas las configuraciones
(combinaciones) adoptadas por nuestros parámetros durante el proceso, correspondan al
estado actual de energía del sistema y no a otros.
Lo que resta por explicar de manera general es la forma como opera el algoritmo que se
empleó específicamente en este trabajo. Aclarar cómo dicho algoritmo lleva a cabo el
proceso de “cristalización” del sistema hasta alcanzar soluciones satisfactorias del
problema inverso. Del mismo modo que en el apartado 5.1-ii se presentó un diagrama de
flujo para GA, en la figura 5.6 se muestra otro correspondiente a SA. En esencia, el
programa consta de tres ciclos anidados. El ciclo externo regula la temperatura del
sistema. Cada vez que se cumple un ciclo de estos, la temperatura del proceso
disminuye al ser multiplicada por un factor 0<RT<1 que normalmente es cercano a 1. De
esta manera se lleva a cabo el enfriamiento paulatino que se desea.
139
Capítulo 5 5.2 Cristalización Simulada
El ciclo intermedio se encarga de actualizar los valores, independientes entre sí, de una
serie de constantes VMi (tantas como parámetros del modelo haya). Dichas constantes
determinan el máximo incremento que podrá tener cada parámetro a la hora de ser
perturbado en el ciclo más interno del proceso. Los valores numéricos que adopten estas
Modelo
Inicial
Perturbación
Ciclo interno VM*Rand
Problema directo
Ciclo intermedio
Función de costo ∆E
⎛ ∆E ⎞ Criterio de Metropolis,
Pr = exp ⎜ ⎟ prob. de Boltzman
⎝ T ⎠
Ciclo externo
Ajuste del incremento por
VM i = f (VM i − 1 , T )
parámetro
Reducción de la
Ti = RT ⋅ Ti −1 temperatura
Fig. 5.6 Diagrama de flujo que describe paso a paso el algoritmo de SA empleado
en esta investigación. Se distinguen los tres ciclos aludidos en el texto, así como
la reducción de la temperatura, el ajuste de las constantes VM, y la asignación
de una probabilidad de permanencia para el modelo actual (únicamente para
los modelos que incrementen la energía del sistema, ver texto).
140
Capítulo 5 5.2 Cristalización Simulada
una nueva configuración del sistema sea muy similar a la cantidad de veces en que sea
aceptada.
Para finalizar, en el ciclo interno del algoritmo se perturban los valores de los parámetros
empleando los factores VMi definidos en el ciclo intermedio (el anterior descrito). La
perturbación de los parámetros se lleva a cabo cuando se multiplica a cada uno por el
resultado del producto de su correspondiente VMi por un valor aleatorio entre menos uno
y uno. Luego se construye la función de receptor sintética para el modelo generado de
esta manera (modelo actual) y se evalúa el cambio de energía en el sistema asociado a
la nueva configuración de los parámetros. Dicha variación de energía está determinada
por el desajuste que presenta la curva sintética con la observada. Si el desajuste decrece
con respecto al anterior, entonces la nueva configuración será aceptada como la actual y
perturbada de la misma manera. En este caso se dice que, al pasar a la configuración
actual de los parámetros, se produjo un decremento en la energía del sistema. Este
decremento ∆E es igual al valor del desajuste. Por el contrario, si la perturbación aleatoria
de los parámetros produjo un crecimiento en el desajuste de las curvas, entonces se dice
que hubo un incremento en la energía del sistema y a dicha configuración se le asigna
una probabilidad de aceptación dada por la distribución de probabilidad de Boltzman
(figura 5.5) en el punto correspondiente al ∆E calculado y a la temperatura a la que se
encuentre el sistema en ese momento.
Estos ciclos se repiten sucesivamente conforme la temperatura del proceso va
disminuyendo. El resultado final es un conjunto de valores para los parámetros cuya
respuesta sintética posee un error satisfactoriamente pequeño. En esencia, todos lo
parámetros y constantes que determinan al proceso de inversión son gobernados por la
reducción paulatina de la temperatura del proceso. Conforme disminuye T, lo que se está
haciendo es permitir variaciones cada vez más pequeñas en los parámetros del modelo.
De esta forma, la búsqueda en el dominio de soluciones que inicialmente se lleva a cabo
en todo el espacio, comienza a converger hacia los sectores donde se encuentren los
modelos asociados a los mínimos absolutos. Una de las virtudes de este método (SA) es
que los valores que van adoptando los parámetros de los modelos, pertenecen al
conjunto de los números reales. Es decir, no están sujetos a un conjunto de valores
producto de una discretización previamente definida, como sí sucede en el método de
GA.
141
6 Inversión de Funciones de
Receptor con Algoritmos Genéticos
y Cristalización Simulada.
Capítulo 6 6.1 Introducción
Todos los temas, conceptos, y métodos desarrollos en el presente trabajo han sido
necesarios para construir el marco teórico que comprende las herramientas empleadas en
la investigación que en este capítulo será ampliamente descrita. Desde la propagación de
ondas, hasta los métodos más vanguardistas del modelado inverso, han sido estudiados
detenidamente con el fin de justificar los recursos utilizados en el procesamiento y
modelado de registros telesísmicos grabados en tres estaciones de banda ancha del
Servicio Sismológico Nacional.
Un breve recorrido por el contenido del trabajo ayudará a refrescar los conceptos
medulares que, hasta ahora, han conformado una serie de elementos teóricos
consecuentes. Es en este capítulo donde termina la argumentación teórica y comienza el
trabajo netamente científico observacional, fundamentado en razonamientos deductivos e
inductivos. Trabajo que aspira aportar conocimientos sobre la estructura de la corteza
continental en México, a partir de las leyes físico-matemáticas que pretenden modelar la
distribución espacial de las propiedades elastodinámicas en el interior de nuestro planeta.
Al inicio se abordó el fenómeno de la física de las ondas, desarrollando todo a partir de la
teoría de esfuerzos, de deformaciones, y finalmente de la teoría de la elasticidad.
También se revisaron los fundamentos matemáticos de los sistemas lineales para
justificar la construcción de una función de transferencia a partir de la deconvolución de
dos señales en el dominio de la frecuencia.
Una vez deducidas las ecuaciones que rigen el comportamiento de las ondas al
propagarse en un medio continuo e incidir en una interfase, se clasificaron las ondas
dependiendo de la trayectoria que hayan descrito al viajar en el interior de la Tierra. De
esta manera se habló de las principales discontinuidades elásticas que posee nuestro
planeta: aquellas que delimitan al núcleo, al manto y a la corteza. Inmediatamente se
expuso de manera extensa las implicaciones teóricas que posee la construcción de una
función de receptor, analizando cuidadosamente cuál es el contenido de dichas funciones,
y que implicaciones se ven reflejadas en su forma dada la presencia de capas inclinadas
en la estructura. En ese capítulo se describió un método desarrollado con el fin de
identificar las fases que se propagan en el interior de una estructura de capas planas.
Herramienta de gran valor para el análisis y entendimiento de las funciones de receptor
modeladas.
Habiendo revisado las bases del fenómeno estudiado en el presente, lo siguiente fue
abordar el amplio espectro de métodos de modelado inverso, empezando por los de
búsqueda local, para terminar con los de búsqueda global. Dos de éstos últimos, el de
143
Capítulo 6 6.1 Introducción
6.1 Introducción.
144
Capítulo 6 6.1 Introducción
145
Capítulo 6 6.1 Introducción
Sierra Madre
Oriental
CUIG
TUIG
Eje Neovolcánico
146
Capítulo 6 6.2 Los datos
La distancia epicentral de todos los eventos procesados para cada estación cae en el
rango de manto, es decir, poseen una distancia en grados de 30º < ∆ < 90º. Se
recuperaron todos los eventos grabados desde 1994 hasta Febrero de 1999. El total de
eventos registrados por estación es de 25 en Ciudad Universitaria (CUIG), 8 en Zacatecas
(ZAIG), y 4 en Tuzandepetl (TUIG). Todos estos fueron seleccionados al descartar
aquellos cuya magnitud, complejidad de la fuente, o relación ruido a señal fueran muy
pequeñas.
Las localizaciones de los registros telesísmicos empleados en la estación CUIG, poseen
una cobertura azimutal que permite agrupar los epicentros en cuatro clusters (grupos)
(figura 6.13). Por otro lado, en la estación ZAIG dicha distribución permitió conformar
solamente tres grupos epicentrales, mostrados en la figura 6.6. Por último, para la
estación restante (TUIG), un solo grupo pudo ser definido (figura 6.18). La idea de agrupar
los eventos en enjambres epicentrales es apilar todas las funciones de receptor de cada
grupo dentro de un limitado intervalo de distancia epicentral y acimutal, evitando grandes
variaciones en los ángulos de incidencia que provocan variaciones no deseadas en las
funciones de receptor. Al llevar a cabo los apilados se elimina el ruido incoherente y se
Estación ZAIG
(Grupo 1 – Sudamérica)
(Grupo 3 – Alaska)
147
Capítulo 6 6.2 Los datos
Estación CUIG
(Grupo 1 – Sudamérica)
(Grupo 3 – Alaska)
(Grupo 4 – Atlántico)
148
Capítulo 6 6.2 Los datos
Estación TUIG
(Grupo 1 – Sudamérica)
149
Capítulo 6 6.3 Selección de modelos considerando el error en los datos
(+) Desviación
Apilado de las estándar
observaciones
Fig. 6.2 En esta figura se aprecia un acercamiento de las curvas hipotéticas que son usadas para
evaluar que tan adentro o que tan afuera se encuentra la curva sintética de la banda de error. Aquí
se aprecian las dos fronteras definidas por la suma y la resta de la desviación estándar a la curva
apilada, la curva apilada observada, y la curva sintetizada a partir de un modelo. Apréciese las
áreas descrita por afuera de la banda entre la curva sintética y la banda de error AE.
150
Capítulo 6 6.3 Selección de modelos considerando el error en los datos
cross (d s , d o )
S ( m s ) = 0 .5 − , (6.3-1)
auto(d s ) + auto(d o )
donde S(m) es la semblanza del modelo actual, auto(ds) y auto(do) son respectivamente las
autocorrelaciones de la señal sintética y la observada, y cross(ds,do) es la croscorrelación
de las dos señales. Mientras más se parezcan las curvas, la semblanza tenderá a cero. Al
igual que en el criterio anterior, en éste se compara la semblanza del modelo examinado
con un valor límite introducido en el archivo de datos. Si este último es mayor que la
semblanza asociada al modelo, entonces este satisfará el segundo criterio.
Todos los modelos que satisfagan simultáneamente ambas exigencias de calidad, serán
almacenados por los programas durante los procesos de inversión. Finalmente, la
solución del modelado de una curva apilada será una nube de modelos conformada por la
fusión del conjunto de modelos seleccionado por GA con el conjunto de modelos
seleccionado por SA. En la totalidad de los casos, estos dos conjuntos de modelos
abarcan prácticamente la misma región del dominio de soluciones, lo cual nos alienta a
pensar que es ahí donde se encuentra el máximo global del espacio de modelos.
151
Capítulo 6 6.4 Inversión sintética
Para verificar la validez y eficacia del método descrito en el apartado anterior, cuyo
objetivo es seleccionar modelos ante la presencia de un error considerable en las
observaciones, en esta sección se presenta una inversión sintética que simula el
problema ante el cuál nos enfrentaremos en el modelado de los datos reales. La prueba
consiste en lo siguiente.
Primero se eligió un modelo de corteza, en este caso el modelo propuesto por M.
Campillo y otros (1996) para el trayecto entre la costa del Pacífico y la Cuenca de México.
Este modelo consta de tres capas sobre un semiespacio. El valor de los parámetros
aparece en la tabla 6.4.
A la función de receptor sintetizada a partir de este modelo se le añadieron cinco cargas
diferentes de ruido armónico y aleatorio para generar cinco funciones de receptor
considerablemente distintas. Estas curvas representan funciones observadas hipotéticas
en una misma estación, provenientes de un mismo azimuth y distancia epicentral. Se dice
que provienen de un mismo azimuth ya que a la hora de calcular los sintéticos se
especificó que los componentes estén rotados a las direcciones radial y transversal
provocando que toda la señal quede contenida en los componentes radial y vertical (esto
por tratarse de un sintético). Y decimos la misma distancia epicentral por haber utilizado el
mismo ángulo de incidencia en la base de la estructura de capas planas y horizontales.
Velocidad Espesor
β (Km/s) h (Km)
Capa 1 3.1 5.0
Para generar las funciones de receptor sintéticas a partir del modelo de Campillo et al., se
utilizó el método de las matrices de propagación de Kennett (Kennett, 1983). Este
152
Capítulo 6 6.4 Inversión sintética
153
Capítulo 6 6.4 Inversión sintética
Se llevaron a cabo dos inversiones paralelas de estas supuestas observaciones. Una con
Algoritmos Genéticos (GA) y otra con el método de Cristalización Simulada (SA). La
parametrización elegida contempló a las velocidades β de las tres capas y con sus
Unión de ambos
conjuntos.
2000 modelos
finales seleccionados.
Fig. 6.4 Resultados de las dos inversiones sintéticas llevadas a cabo con GA y SA.
En cada uno de los dos recuadros que están en la parte superior se muestran
1000 modelos seleccionados por método. En la parte inferior, la nube final de
2000 modelos producto de la fusión de los dos conjuntos antes mencionados.
154
Capítulo 6 6.4 Inversión sintética
respectivos espesores, más la velocidad β del semiespacio. Por lo tanto se tienen siete
parámetros a invertir. Las velocidades α se calcularon considerando al medio como un
Los dos criterios simultáneos de selección impuestos en ambos procesos fueron los
mismos. Para la relación entre las áreas AE y AB (ver sección 6.3) se utilizó el valor
porcentual de 0.2%, y como límite de la semblanza el valor de 0.003. El objetivo central de
esta prueba numérica es recuperar valores para los parámetros muy similares a los del
modelo seleccionado (tabla 6.4). De ahí que éste reciba el nombre de “modelo objetivo”.
Si sucede esto, quedaría mostrada la eficacia y validez del método propuesto para el
modelado de las funciones de receptor.
Las especificaciones empleadas en la inversión con GA fueron las siguientes: 350
modelos por generación, 200 iteraciones, probabilidad de mutación inicial del 10.0%, y
una probabilidad de cruza del 100%. Las especificaciones para la inversión con SA fueron
las siguientes: 50,000 modelos probados, temperatura inicial de 2º, y un factor de
Campillo
vs.
sintético
Profundidad (km)
155
Capítulo 6 6.4 Inversión sintética
156
Capítulo 6 6.5 Estación Zacatecas (ZAIG)
La Sierra Madre Occidental está formada por una extensa meseta volcánica afectada por
grabens y fallas normales que la privan, sobretodo en los flancos, de su apariencia
homogénea y subhorizontal (Morán, et al., 1984). Esta sierra posee dos importantes
secuencia ígneas, cuyo contacto marca un período de calma volcánica. La secuencia más
antigua la forman rocas volcánicas principalmente intermedias y cuerpos ígneos cuyas
edades varían entre 100 y 45 millones de años producto de la orogenia. La secuencia
superior está formada por ignimbritas riolíticas y riodacíticas en posición generalmente
horizontal, con edades que van desde los 34 hasta los 27 millones de años producida por
un periodo extensivo asociado al “basin and ranges”. El complejo superior constituye la
cubierta ignimbrítica continua más extensa en la Tierra, con 250 Km de ancho y más de
1,200 Km de largo.
En la Mesa Central, provincia fisiográfica confinada a ambos lados por la dos sierras
madres, existen numerosos afloramientos de secuencias metamórficas que pueden
corresponder al Triásico o a las postrimerías del Paleozoico. En la parte sur de esta
región, ignimbritas riolíticas del Eoceno y domos con flujos de lavas andesíticas afloran
localmente en Zacatecas, Guanajuato, San Luís Potosí y Aguascalientes (Nieto-
Samaniego et al., 1999) . Estas formaciones constituyen la parte volumétricamente más
importante del vulcanismo del Terciario en la parte sur de la Mesa Central, presentándose
en ocasiones domos de hasta dos kilómetros de espesor.
El basamento de toda esta región pertenece a dos de los más grandes dominios
paleogeográficos: el Terreno Guerrero, y la secuencia sedimentaria de la Sierra Madre
Oriental. El Terreno Guerrero expuesto en la parte sudoeste de la Mesa Central, es una
secuencia tipo flysch volcánica-sedimetaria intercalada con lavas almohadilladas que
muestran un bajo grado de metamorfismo a pesar de su deformación contráctil tan
grande. Siguiendo el trabajo de Nieto-Samaniego y otros (1999), la mesa central presenta
un levantamiento promedio topográfico que sobrepasa al de las dos provincias
adyacentes correspondientes a las dos sierras. De hecho, este levantamiento central es
más pronunciado si se analizan las unidades geológicas expuestas en dichas provincias.
Por ejemplo, en la Mesa Central el basamento mesozoico aflora a una altitud entre los
2,000 y los 2,700 m, mientras que en la Sierra Madre Occidental, afloramientos de la
misma edad se encuentran a 800 m de altitud, dentro de las depresiones más
pronunciadas de la corteza de esta área. La implicación que este hecho tiene en la
morfología del Moho la revelan los datos de gravedad. Éstos indican un adelgazamiento
de la corteza hacia la parte central del altiplano (33 Km), en contraste con los 37 y 41
157
Capítulo 6 6.5 Estación Zacatecas (ZAIG)
kilómetros que muestran bajo la Sierra Madre Oriental y Sierra Madre Occidental
respectivamente (Campos-Enriquez et al., 1994).
En el trabajo de Nieto-Samaniego y colaboradores (1999) se presentan tres estructuras
geológicas para la corteza correspondientes, cada una, a las tres principales provincias
fisiográficas que conforman el norte del país. La estación ZAIG se encuentra en la ciudad
de Zacatecas, es decir, en la provincia de la Sierra Madre Occidental pero muy cerca de
la Mesa Central. Para esta región, en dicho trabajo se propone una corteza superior
constituida, desde la superficie hasta el manto, por 1,000 m de ignimbritas del Mioceno
temprano, 500 m de sedimentos mezclados con material ígneo andesítico del Eoceno-
Oligoceno, 10 km de batolítos silícicos, y ~31 km de cuerpos plutónicos gabroicos,
constituyendo una corteza de aproximadamente 40 km.
Tal y como ya se dijo en la sección 6.2 del presente capítulo, en la estación ZAIG
únicamente se pudieron conformar tres grupos epicentrales. La especificación precisa de
Grupo 3
ZAIG
Grupo 2
Grupo 1
158
Capítulo 6 6.5 Estación Zacatecas (ZAIG)
cada evento registrado en esta estación aparece en la tabla 6.1. La ubicación geográfica
de los epicentros, con relación a la estación, puede verse en la figura 6.6.
Una vez apiladas las trazas correspondientes a cada grupo, resultan seis funciones de
receptor (una radial y una transversal por grupo) con sus respectivas bandas de error
(figura 6.7), calculadas como se explicó en la sección 6.3.
En la tabla 6.5 se muestra información promedio sobre los eventos que comprende cada
grupo. Se puede apreciar cómo el ángulo de incidencia esperado para los tres grupos
difiere considerablemente. Esto se debe a las diferencias en el ∆ y en la profundidad
promedio de las fuentes en cada cluster (grupo).
Sudamérica
Islas Fiji
Alaska
Fig. 6.7 Funciones de receptor apiladas, tanto radiales como transversales, para los tres grupos
analizados en la estación ZAIG. Únicamente las funciones radiales fueron modeladas. Las
funciones transversales sirvieron exclusivamente para el análisis cualitativo de la estructura.
159
Capítulo 6 6.5 Estación Zacatecas (ZAIG)
Los parámetros utilizados para la construcción de las funciones de receptor tanto radiales
como transversales, en analogía con los que se indicaron en la prueba sintética, fueron
los siguientes: tp = 3.0 s, ts = 10.0 s, 0.005 < c < 0.015.
La parametrización de los modelos se determinó a partir de la información preexistente de
la región y de la simplicidad que muestran las funciones de receptor observadas (figura
6.7). Los modelos consisten en tres capas sobre un semiespacio. Los parámetros a
invertir son los tres espesores y velocidades “β ” de las capas, más la velocidad “β ” del
semiespacio. Esto forma un total de siete parámetros por determinar, para definir la
estructura de velocidades de la corteza en el sitio de Zacatecas.
Cada uno de los tres apilados se invirtió inicialmente por separado, tal y como se llevó a
cabo la inversión sintética de la sección 6.4. Las curvas se invirtieron hasta el segundo 35,
no hasta el segundo 40 como aparece en la figura 6.7. Los parámetros de entrada que
requiere cada uno de los dos métodos empleados, GA y SA, tales como la probabilidad de
mutación, la probabilidad de cruza, la temperatura inicial del proceso, el factor de
reducción de la misma, etc., fueron muy similares entre todos los procesos asociados a
los tres grupos, y a su vez, a los especificados claramente en la prueba sintética (sección
6.4).
Profundidad Ángulo de
Delta (∆)
Fuente (km) incidencia
Grupo 1
48º 69 32º
(Sudamérica)
Grupo 2
82º 199 21º
(Islas Fiji)
Grupo 3
66º 53 27º
(Alaska)
Tabla 6.5 Información sobre la ubicación promedio de las fuentes sísmicas de los tres
grupos, con los ángulos de incidencia en la base de la corteza de los frentes de onda,
calculados a partir de las ubicaciones de las fuentes y de un modelo promedio terrestres
Las nubes con 2,000 modelos seleccionados (1,000 por GA y 1,000 por SA) se muestran,
por grupo, en la figura 6.8. En ella también se puede apreciar el espacio de soluciones
explorado por ambos métodos, indicado por las dos líneas discontinuas. Es importante
señalar que dicho espacio fue exactamente el mismo para todos y cada uno de los
procesos de inversión llevados a cabo, independientemente del stack o del método de
modelado del que se trate. También es interesante observar cómo el conjunto de modelos
que define a cada una de las tres nubes no presenta una dispersión importante dentro del
160
Capítulo 6 6.5 Estación Zacatecas (ZAIG)
espacio, por el contrario, define claramente una banda constituida, como ya se sabe, por
la unión de los dos conjuntos generados individualmente por los métodos ya bien
conocidos.
En general, se puede decir que existe una gran semejanza entre las tres nubes mostradas
en la figura 6.8. Esto significa que las funciones de receptor observadas no poseen una
considerable dependencia acimutal. Sin embargo, si se observa detenidamente el
segundo contraste elástico (~12-14 km de profundidad), es claro que su profundidad si
depende levemente del acimut con que haya arribado el frente de onda a la base de la
corteza. Según estos resultados se podría pensar en una cierta inclinación de dicha
interfase en dirección aproximada hacia el norte-noroeste. Este resultado se verifica
cualitativamente con la presencia, en las funciones de receptor transversales, de ciertas
fases coherentes entre las funciones que fueron apiladas, es decir, con arribos cuya
desviación estándar es muy pequeña (ver figura 6.7). Por ejemplo, la fase que aparece
aproximadamente 8 segundos después del primer arribo en los apilados transversales,
indica la presencia de algún agente estructural relativamente somero, por no coincidir con
los tiempos de arribo de las fases convertidas en el Moho (aprox. 5 y 17 s después del
primer arribo), que opere como deflector de las ondas SV, convertidas en esa interfase,
del plano R-Z (Cassidy, 1992).
Fig. 6.8 Resultados finales de las tres inversiones individuales. Cada nube posee 2,000
modelos, 1,000 seleccionados por GA y 1,000 por SA. Las líneas quebradas discontinuas
definen el espacio de soluciones explorado. Dicho espacio es el mismo en los tres grupos.
161
Capítulo 6 6.5 Estación Zacatecas (ZAIG)
Tabla 6.6 Valores que fueron empleados en los procesos de inversión para
seleccionar los modelo que aparecen en la figura 6.8. El valor del área
normalizada se presenta para tener cantidades comparables entre cada
grupo con relación a qué tan estricto fue un criterio con respecto al otro.
Sudamérica (Grupo 1)
Alaska (Grupo 3)
Tiempo (seg)
Fig. 6.9 Ajustes entre las respuestas sintéticas arrojadas por los tres modelos
promedio de las nubes mostradas en la figura 6.8 y los apilados observados.
Estos ajustes son producto de las inversiones individuales de los tres grupos.
162
Capítulo 6 6.5 Estación Zacatecas (ZAIG)
Los criterios que se emplearon para la selección de modelos durante los procesos de
inversión (descritos en la sección 6.3) se muestran en la tabla 6.6.
A continuación, siguiendo el procedimiento que ya fue explicado en el ejercicio sintético
acerca de cómo extraer de cada nube el modelo promedio, se obtuvo éste para los tres
conjuntos mostrados en la figura 6.8 y así calcular su respuesta sintética para compararla
con el apilado correspondiente. Esta comparación se muestra en la figura 6.9, donde se
puede apreciar cómo las respuestas sintéticas abandonan mínimamente las bandas de
error definidas por las líneas discontinuas entorno al stack.
La semejanza que presentan los tres conjuntos de modelos arrojados por los procesos de
modelado individuales nos sugiere realizar una inversión simultánea de las tres funciones
de receptor observadas. Este mecanismo nos permitirá contar con una familia última de
modelos que respondan simultáneamente a las tres observaciones provenientes de
diferentes acimuts. En la siguiente sección se presentan los resultados de este ejercicio.
163
Capítulo 6 6.5 Estación Zacatecas (ZAIG)
164
Capítulo 6 6.5 Estación Zacatecas (ZAIG)
como era de esperarse. Sin embargo, los rasgos de mayor interés como son los arribos
de las fases provenientes del Moho ajustan de manera satisfactoria.
Sudamérica (Grupo 1)
Alaska (Grupo 3)
Tiempo (seg)
Fig. 6.11 Ajustes entre los sintéticos generados con el modelo promedio de la nube final
(figura 6.10) y los tres apilados observados. Cabe señalar que lo único que varía entre los
sintéticos es el ángulo de incidencia en la base del modelo promedio. Este ángulo
depende del grupo que se trate, es decir, del ∆ asociado a éste.
El modelo promedio final con el que se construyó la gráfica anterior, resultado último de la
inversión simultánea de los tres apilados, es la estructura unidimensional propuesta en
este trabajo para el sitio de Zacatecas (ZAIG). Este modelo se muestra en la figura 6.12, y
numéricamente en la tabla 6.8. Se puede ver que existe un contraste de impedancias
importante entre la base de la corteza y el manto superior, rasgo que era de esperarse por
165
Capítulo 6 6.5 Estación Zacatecas (ZAIG)
las amplitudes predominantes que tienen las fases convertidas en dicho contacto sobre
las demás.
Profundidad (km)
En la tabla 6.8 aparecen los valores numéricos del modelo final para el sitio ZAIG
mostrado en la figura 6.12. Las velocidades de propagación para las ondas “P” fueron
calculadas asumiendo un sólido de Poisson, es decir, suponiendo una relación de α =
1.73 β.
Velocidad β Velocidad α
Espesor (km)
(km/s) (km/s)
Capa 1 2.9 3.18 5.51
Capa 2 9.1 3.37 5.84
Capa 3 25.4 3.56 6.17
Semiespacio ∞ 4.23 7.33
Tabla 6.8 Valores numéricos del modelo final para el sitio ZAIG
(figura 6.12). Las velocidades de las ondas “P” fueron calculadas
asumiendo un sólido de Poisson durante las inversiones.
166
Capítulo 6 6.5 Estación Zacatecas (ZAIG)
Este resultado es muy consistente con uno de los trabajos más recientes hecho en esa
región (Nieto-Samaniego, et al., 1999). En el siguiente capítulo se confrontarán y
discutirán brevemente ambos resultados.
167
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
En esta estación se conformaron cuatro “clusters”, cuya información específica por evento
aparece en la tabla 6.2 de la sección 6.2. La información promedio sobre los eventos que
comprende cada grupo se muestra en la tabla 6.9.
Profundidad Ángulo de
Delta (∆) Back Azimuth
Fuente (km) incidencia
Grupo 1
46º 246.0 32º 141º
(Sudamérica)
Grupo 2
87º 347.0 19º 245º
(Islas Fiji)
Grupo 3
71º 31.0 24º 322º
(Alaska)
Grupo 4
50º 9.0 32º 91º
(Atlántico)
Tabla 6.9 Información sobre la ubicación promedio de las fuentes sísmicas de los tres
grupos, con los ángulos de incidencia en la base de la corteza de los frentes de onda,
calculados a partir de las ubicaciones de las fuentes y de un modelo promedio terrestres
168
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
el grupo 2, y ts = 10.0 s y 0.005 < c < 0.015 igualmente para los cuatro grupos. La razón
por la cual se eliminaron más altas frecuencias en las funciones del grupo 2 fue para
eliminar ciertas fases no deseadas que provocaban variaciones considerables en las
funciones apiladas.
La parametrización de los modelos en esta estación fue determinada a partir de la fusión
de dos modelos preexistentes bien conocidos. Campillo et al, (1996) propusieron un
modelo estructural promedio para el trayecto que une la costa de Guerrero y la Ciudad de
México a partir de datos de dispersión de ondas superficiales. Dicho modelo fue el que se
uso en este trabajo para llevar a cabo la prueba sintética (tabla 6.4). Por otro lado, debido
a la falta de resolución local que posee el método que utilizaron, se inserto un paquete
Grupo 3
Grupo 4
CUIG
Grupo 1
Grupo 2
169
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
superficial de muy baja velocidad propuesto por Shapiro y otros (1997). Este paquete
superficial se asocia a toda la acumulación, con aproximadamente 2.0 km de espesor, de
materiales volcánicos: cenizas, piroclastos y derrames lávicos fracturados. Por todo esto,
los modelos propuestos en este trabajo consisten de cuatro capas sobre un semiespacio.
Los parámetros a invertir son los cuatro espesores y velocidades “β ” de las capas, más la
velocidad “β ” del semiespacio. Esto forma un total de nueve parámetros por determinar, y
Sudamérica (Grupo 1)
Alaska (Grupo 3)
Atlántico (Grupo 4)
Fig. 6.14 Funciones de receptor apiladas (líneas continuas) con sus respectivas bandas de error
(líneas discontinuas) para cada uno de los cuatro grupos formados en torno a la estación CUIG.
170
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
El problema consistió, como se verá claramente con las siguientes gráficas, en que esa
paulatina reducción del rigor de los criterios llegó a ser tan baja, que los ajustes arrojados
por el modelo promedio de dicho conjunto son inútiles.
171
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
En la figura 6.16 aparecen dichos ajustes, uno para cada grupo. Del mismo modo que en
ZAIG, la curva sintética de cada ajuste fue creada a partir del mismo modelo estructural
variando únicamente el ángulo de incidencia del frente de ondas en su base. Éste
dependió del grupo del que se haya tratado. El modelo usado es el promedio del conjunto
mostrado en la figura 6.15.
Los peores ajuste de la figura 6.16 son claramente los que corresponden a los grupos 2 y
3. Las líneas discontinuas verticales señalan los tiempos de llegada de los múltiplos
PpPms, tales que son muy semejantes, por un lado, entre los stacks de los grupos 2 y 3, y
por el otro, entre los stacks de los grupos 1 y 4. Los procesos de inversión mostraron que
Profundidad (km)
estas diferencias tan grandes en las llegadas no se pueden justificar con los diferentes
ángulo de incidencia en la base de la estructura. En otras palabras, estos resultados nos
impiden pensar que sólo un modelo estructural de corteza exista dentro del cono sólido
muestreado por los sismos entorno a la estación. Aparentemente existen diferencias
sustanciales en la estructura que dependen del acimut con que arriben los sismos al
receptor.
172
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
Otra evidencia importante que soporta esta hipótesis es la amplitud y polaridades que
tienen ciertas fases en las funciones de receptor transversales (figura 6.14). Dichas
amplitudes son considerablemente mayores que las observadas en la estación ZAIG,
Sudamérica (grupo 1)
Alaska (grupo 3)
Atlántico (grupo 4)
Tiempo (seg)
figura 6.7 (en comparación con las respectivas funciones radiales). Entonces, siguiendo
las implicaciones que deben tener estos hechos (véase capítulo 3, sección 3.2), es
173
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
posible que halla agentes estructurales, tales como la presencia de interfases inclinadas o
irregularidades importantes en el moho que deflecten ciertas ondas convertidas en la
corteza, quedando polarizadas por afuera del plano R-V. Toda esta gama de
observaciones nos obligó a detallar más el análisis de los datos con el fin de obtener
conclusiones mejor justificadas y más precisas. En la siguiente sección se presentan los
resultados arrojados por el modelado de los cuatro grupos de eventos por separado,
incluyendo algunas modificaciones en la parametrización y el espacio de búsqueda del
problema.
Los resultados generados en la sección anterior dieron la pauta para abordar los apilados
por separado. El objetivo principal es llegar a conocer cuatro diferentes modelos
estructurales que respondan, cada uno de ellos, a las observaciones hechas en cada
acimut de entrada al receptor. Inicialmente se llevaron a cabo inversiones de los cuatro
apilados con la misma parametrización diseñada para el modelado simultáneo. Los
resultados fueron hasta cierto punto alentadores. Se encontró que en la parte de la
estructura correspondiente a las velocidades, espesores y contrastes de impedancia en la
corteza, es decir, en las cuatro capas que superyacen al semiespacio, las similitudes
fueron extraordinarias entre los cuatro modelos promedio extraídos de cada stack. Por el
contrario, la profundidad del Moho varió desmesuradamente entre ellos,
aproximadamente 7 km entre el más somero y el más profundo. Considerando las
distancia horizontales que separan al receptor de los puntos en que entran a la corteza los
diferentes frentes de onda de cada grupo, puntos a los que se puede asociar
aproximadamente dicha profundidad, parece demasiado grande el desnivel que presenta
el Moho. En este último aspecto es en el que dejan de ser del todo positivos los
resultados.
Entonces, surgió la idea de contemplar a las velocidades “β ” de los modelos y a la
relación de Poisson “ν ” que guardan la velocidad compresional y la de cizalla, como los
posibles responsables de aquellas diferencias tan importantes en los apilados, y no
únicamente a las discrepancias en las profundidades de las interfases. Esta idea es viable
desde el punto de vista geológico, ya que se trata de una estación ubicada en el corazón
de un enjambre volcánico en plena actividad, que por ende, justifica la existencia de
174
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
cambios súbitos en la constitución física de las rocas del manto superior y corteza
profunda entre dos puntos relativamente cercanos.
Atendiendo a esta realidad geológica, se decidió ampliar hacia abajo el límite inferior para
las velocidades del semiespacio en los procesos de modelado (entre 4.0 y 5.0 km/s, ver
tabla 6.12). Además se invirtió, junto con las velocidades β y los espesores de las 4 capas
del modelo, la relación de Poisson (ν) del semiespacio, modificación que pretende
modelar la constitución elástica de materiales que puedan encontrarse en condiciones de
presión y temperatura diferentes. Bien sabido es, que un material a alta temperatura y
baja presión se comporta como un “semifluido”, y por lo tanto posee una relación de
Poisson más alta que otro material en condiciones normales a esas profundidades.
Por otro lado, siguiendo el trabajo de G. Zandt y C. Ammon (Zandt y Ammon, 1995),
donde se propone un método para establecer la relación de Poisson promedio de la
corteza basado en los tiempos de arribo de las fases P directa, Ps y PpPms convertidas
en el Moho, se calculó dicha relación a partir de las funciones de receptor de los cuatro
grupos. En todos los casos resultó ser considerablemente más elevada (ν ≈ 0.275 ) que la
de un sólido Poissoniano (ν = 0.25 ). Comparando este valor de 0.275 con los que
reportan Zandt y Ammon para diferentes regiones del mundo en el trabajo mencionado
arriba, corresponde perfectamente con los que ellos encontraron para la parte central de
México (ν > 0.27 ). De esta manera se fijó el valor de ν encontrado, durante todos los
procesos de inversión, para las cuatro capas superiores de los modelos probados.
α2 ⎛ 1 −ν ⎞
= 2⎜ ⎟ (6.1)
β2 ⎝ 1 − 2ν ⎠
La relación que guarda ν con el cociente de las dos velocidades de las ondas de cuerpo
se muestra en la ecuación 6.1. De ahí que para el valor de ν obtenido a partir de nuestros
datos (ν ≈ 0.275 ) corresponda una relación entre α y β de: α = 1.8β .
En el caso del semiespacio, el rango de valores para ν que fue explorado es el siguiente:
0.23 < ν < 0.30 .
En la tabla 6.11 aparecen los valores empleados por los dos métodos globales de
inversión, GA y SA, para seleccionar los modelos solución. Claramente, éstos son mucho
más estrictos que los que tuvieron que emplearse con anterioridad en la inversión
simultánea (tabla 6.10, comparar).
175
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
Los rangos de variación para cada parámetro invertido están en la tabla 6.12. Ahí
aparecen los valores de los límites inferior y superior que determinaron dichos rangos, y a
su vez el espacio de soluciones explorado por los métodos de optimación. Para el caso de
las velocidades en el semiespacio puede verse cómo se amplió el rango de búsqueda con
relación al que se usó durante la inversión simultánea (figura 6.15). Además se muestran
los valores que tomaron las relaciones de Poisson también del semiespacio, parámetro
que no fue considerado durante el modelado simultáneo de las cuatro curvas.
Tabla 6.12 Espació de soluciones a través de los límites que definen los rangos de variación
para los parámetros invertidos. (*) En la capa 4, los grupos 2 y 3 variaron su espesor entre
19 y 27 km, mientras que los grupos 1 y 4 variaron su espesor entre 26 y 30 km.
Las nubes de modelos que resultaron de los procesos de inversión, una vez que fueron
sumadas las soluciones arrojadas por los dos métodos de búsqueda tal y como se llevó a
cabo en la prueba sintética de la sección 6.4 (figura 6.4), no mostraron una diferencia
176
Sudamérica (grupo 1) Islas Fiji (grupo 2) Alaska (grupo 3) Atlántico (grupo 4)
Capítulo 6
Profundidad (km)
177
Velocidad “S” (km/s) Velocidad “S” (km/s) Velocidad “S” (km/s) Velocidad “S” (km/s)
Fig. 6.17 Nubes de modelos solución de las cuatro inversiones individuales correspondientes a
los cuatro grupos de sismos modelados. Apréciese la variación en la profundidad del Moho en
función del acimut de cada cluster, las diferencias en las velocidades del semiespacio, y la
similitud que guardan los modelos corticales (cuatro capas superiores) en las cuatro nubes.
6.6 Estación Ciudad Universitaria (CUIG)
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
178
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
Todas estas apreciaciones pueden verse de una manera más inmediata si se extrae de
cada nube su modelo promedio. En la figura 6.18 aparecen dichos modelos, y no aquéllos
que más se les parezcan de su respectiva nube empleando la norma L2, tal y como se
hizo para la estación ZAIG. La razón es porque los modelos promedio presentaron un
mejor ajuste con las observaciones, motivo suficiente para ser éstos los considerados.
En el caso del apilado proveniente del Atlántico, la velocidad promedio para el
semiespacio resultó ser la más baja. Curiosamente la trayectoria que describen los
sismos de este grupo atraviesa la región volcánicamente activa del Popocatépetl. Por otro
lado, la relación de Poisson del semiespacio obtenida para este caso fue la más elevada
ν = 0.295 ± 0.0052 , valor que relaciona a α con β de la siguiente manera: α = 1.85β .
β (km/s) 1.55 ± 0.038 3.14 ± 0.128 3.50 ± 0.070 3.88 ± 0.086 4.80 ± 0.121
Grupo 1
h (km) 1.97 ± 0.094 2.34 ± 0.285 10.79 ± 0.568 27.62 ± 0.979 ∞
(Sudamérica)
ν 0.275 (fijo) 0.275 (fijo) 0.275 (fijo) 0.275 (fijo) 0.273 ± 0.008
β (km/s) 1.59 ± 0.069 3.16 ± 0.095 3.31 ± 0.090 3.79 ± 0.077 4.78 ± 0.131
Grupo 2
h (km) 1.81 ± 0.077 2.39 ± 0.287 10.66 ± 0.588 19.21 ± 0.274 ∞
(Islas Fiji)
ν 0.275 (fijo) 0.275 (fijo) 0.275 (fijo) 0.275 (fijo) 0.290 ± 0.005
β (km/s) 1.52 ± 0.016 3.25 ± 0.053 3.47 ± 0.025 3.88 ± 0.068 4.37 ± 0.147
Grupo 3
h (km) 1.84 ± 0.034 2.08 ± 0.081 10.17 ± 0.143 23.08 ± 0.817 ∞
(Alaska)
ν 0.275 (fijo) 0.275 (fijo) 0.275 (fijo) 0.275 (fijo) 0.269 ± 0.039
β (km/s) 1.58 ± 0.044 2.96 ± 0.054 3.42 ± 0.048 3.88 ± 0.063 4.23 ± 0.102
Grupo 4
h (km) 2.08 ± 0.064 2.39 ± 0.247 10.38 ± 0.337 28.78 ± 0.680 ∞
(Atlántico)
ν 0.275 (fijo) 0.275 (fijo) 0.275 (fijo) 0.275 (fijo) 0.295 ± 0.005
Tabla 6.13 Valores numéricos con sus respectivas desviaciones estándar de los
cuatro modelos promedio mostrados en la figura 6.18. La simbología es la siguiente:
β (velocidad de cortante), h (espesor de la capa), ν (relación de Poisson).
179
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
Sudamérica (grupo 1)
Alaska (grupo 3)
Atlántico (grupo 4)
Tiempo (seg)
Fig. 6.19 Ajustes entre las observaciones de los cuatro grupos (líneas
continuas) y las funciones de receptor sintetizadas (líneas discontinuas) a
partir de los modelos promedio de la figura 6.18 (tabla 6.13). Con líneas
punteadas se indican las bandas de desviación estándar por grupo.
Este valor correspondería a un material cuyas propiedades elásticas son las de un sólido
“semifluido”, probablemente por las temperaturas altas que existen en el manto superior
dentro de una zona con dicha actividad. Además, el modelo solución promedio para este
180
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
grupo, proveniente del Atlántico, muestra la mayor profundidad del Moho (~44 km), hecho
que podría justificarse pensando en una necesaria compensación isostática por debajo de
los elevados volcanes.
En la tabla 6.13 se muestran los valores numéricos de los cuatro modelos promedio con
sus desviaciones estándar, incluyendo la relación de Poisson del semiespacio.
Si se calculan las funciones de receptor sintéticas a partir de los cuatro modelos promedio
y se comparan con las observaciones, claramente encontramos ajustes mucho mejores
que los que se presentaron calculando los sintéticos del modelo promedio único arrojado
por la inversión simultánea (figura 6.16). En la figura 6.19 aparecen los ajustes entre las
observaciones y las respuestas de los cuatro modelos mencionados.
Empleando el programa diseñado para la identificación de fases, que quedó explicado en
la sección 3.3 (capítulo 3), se puede conocer la distancia horizontal que separa al
receptor, en este caso la estación CUIG, del punto en la base de la corteza donde entran
a ella las fases PpPms para cada grupo. Con esa información, más el back-acimut
promedio de cada grupo, se pueden ubicar dentro de un mapa visto en planta dichos
puntos entorno a la estación. Además, es aproximadamente correcto asociar con estos
sitios en la base de la corteza, la profundidad del Moho que indican los modelos
promedio, como se indica en el siguiente esquema (figura 6.20).
Punto en la Receptor
superficie
s
p
Moho
P
Distancia horizontal
Siguiendo la figura 6.20, es claro que la profundidad del Moho no queda completamente
determinada tan sólo por el sitio donde el múltiple PpPms entra a la corteza, sino también
por la reflexión que sufre en el Moho y por otras fases de gran amplitud convertidas ahí
mismo como lo es la fase Ps. Sin embargo, por ser la fase PpPms una de las que arriban
181
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
con mayor amplitud al receptor y con un retraso temporal considerable, es correcto decir
que representa una de las que mayormente contribuyen a la determinación de la
profundidad y contraste acústico del Moho. En otras palabras, esta fase posee una
particular sensibilidad hacia estos dos parámetros. Por estas razones, el mapa de la figura
6.21 mencionado anteriormente tiene un sentido realmente válido, siempre y cuando se
considere a la profundidad del Moho asociada a cada punto, como el “promedio” de dicha
profundidad entre el punto en la superficie y el receptor. Es obvio que la longitud de dicha
distancia dependerá del ángulo de incidencia en la base de la corteza con que arribe el
frente de ondas, y de los contrastes acústicos del modelo empleado.
En la figura 6.21 también se incluye la topografía del terreno para visualizar la localización
de los volcanes y las elevaciones más importantes. De esta manera tener una idea más
clara de la relación que pudiera existir entre las morfologías del Moho y de la superficie de
la Tierra.
2,000 m
(altitud)
Alaska
37.2 km
Atlántico
43.7 km
σ h = 8.05 Km
CUIG
σ h = 7.74 Km
σ h = 1.36 Km
σ h = 5.87 Km
34.1 km 42.7 km 2,000 m
Islas Fiji Sudamérica (altitud)
Fig. 6.21 Vista en planta de la estación CUIG y de las profundidades del Moho asociadas
a los puntos en la base de la corteza donde los múltiplos PpPms entran a la corteza para
cada grupo, empleando los cuatro modelos finales mostrados en la figura 6.18 (ver texto).
Las curvas de nivel muestran la topografía del terreno con un desnivel de 400 m entre
cada una. Las σh representan las desviaciones estándar de las distancias horizontales
a las cuales entraron los múltiples citados a la corteza para cada grupo.
182
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
En la figura 6.22 se integran los resultados obtenidos para el sitio de Ciudad Universitaria
incluyendo en tercera dimensión tanto las topografías del Moho y de superficie, como los
valores para la Relación de Poisson en el manto superior determinados con las
inversiones. Con esta figura se tiene una mejor noción de la distribución espacial del
modelo estructural final que facilita la interpretación geológica de los resultados. Es
importante notar cómo los valores más altos para la Relación de Poisson coinciden con la
dirección (aproximadamente E-W) que describen la Sierra Chichinautzin y los volcanes
activos más cercanos.
Si se consulta la carta gravimétrica de la República Mexicana (de la Fuente, et al., 1994),
difícilmente pueden cuestionarse las profundidades propuestas en este trabajo. En dichas
cartas existen incertidumbres tan grandes, tanto en las correcciones hechas a los datos
como por el mallado de las lecturas, que los valores presentados de anomalía de Bouguer
poseen un error que imposibilita hablar de cambios geológicos tan abruptos como los que
se pretende justificar. Una de las correcciones que no está contemplada por la anomalía
de Bouguer simple (anomalía presentada en dichas cartas), y que es probablemente la
más importante en una región topográficamente caprichosa como la que constituye al Eje
Neovolcánico, es la corrección por rugosidad, llamada también de terreno. Una muestra
de ello es la asociación tan clara que existe entre los mínimos gravimétricos y las partes
topográficamente más altas. No hay que perder de vista que la anomalía simple de
Bouguer sólo contempla la corrección por aire libre (elevación) y la corrección por placa
de Bouguer (por defecto de masa). Si por el contrario se hubieran hecho todas las
correcciones pertinentes (anomalía de Bouguer completa), y a pesar de ello siguieran
existiendo dichas anomalías, entonces sí se podrían asociar, a un nivel regional, con
variaciones en la topografía del Moho consecuencia de una compensación isostática.
En 1996, Urrutia-Fucugaichi y Flores-Ruiz (1996) realizaron un análisis espectral de la
anomalía de Bouguer en el Eje Neovolcánico, para determinar la geometría y profundidad
de las fuentes gravimétricas involucradas con sus observaciones. Una vez determinadas,
a través de una continuación analítica, eliminaron los efectos más someros (residuales)
asociados con las frecuencias más altas de sus espectros para aislar la señal proveniente
de profundidades mayores (efecto regional). Con la señal filtrada, modelaron el espesor
de la corteza empleando un método iterativo por diferencia de densidades (ver
referencia). Su resultado es un mapa de isoprofundidad para esta zona cuya resolución,
desde el punto de vista cuantitativo, es cuestionable. Los expertos en el manejo de
información potencial saben los riesgos y debilidades que existen en el proceso de
183
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
Volcán
Estación CUIG Popocatépetl
(Ciudad de México)
Relación de
Poisson para el
manto superior.
34.1km
37.2km
42.7km 43.7km
Fig. 6.22 Vista tridimensional de la morfología del Moho debajo de la Ciudad de México
interpolando las profundidades arrojadas por las inversiones para cada grupo de eventos.
Además, en tonalidades grises sobre la superficie del Moho, aparecen los valores para la
relación de Poisson en el manto superior también invertidos durante el modelado.
(Figura realizada en colaboración con Arturo Iglesias).
separación de una señal en sus componentes residual y regional, sobre todo cuando no
se cuenta con información absoluta provenientes de la perforación de pozos o de
184
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
experimentos sísmicos (Jacobsen, 1987). En este caso, los perfiles sísmicos empleados
están muy al sur de la zona estudiada. Por otro lado, se encuentra uno de los problemas
más graves que se presentan siempre que se lleva a cabo el modelado de información
gravimétrica. Se trata del acoplamiento de parámetros. El “trade off” de la profundidad, las
densidades, y las dimensiones de las fuentes, inequívocamente provoca la no unicidad de
las soluciones. “Normalmente, las interpretaciones hechas con datos potenciales están
∆t ∆t Sudamérica
29 km (fuente)
Ps Sudamérica
PpPms 498 km (fuente)
Islas Fiji
58 km (fuente)
Islas Fiji
568 km (fuente)
Fig. 6.23 Subapilados para los grupos 1 y 2 según las profundidades de las fuentes de
los mejores eventos registrados. Notar la diferencia en los tiempos de arribo de
las fases Ps y PpPms entre ambos grupos. Las líneas sinuosas discontinuas
representan la desviación estándar de las funciones de receptor apiladas.
185
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
186
Capítulo 6 6.6 Estación Ciudad Universitaria (CUIG)
y empleando los modelos y esquemas matemático que ya fueron expuestos, creemos que
los resultados presentados son los más simples y convincentes.
No se puede dejar de decir que, sin duda, un resultado valioso al que se llegó en este
trabajo es el problema que queda planteado: cómo justificar las observaciones obtenidas
que parecen ser consistentes.
187
Capítulo 6 6.7 Estación Tuzandépetl (TUIG)
En las últimas tres décadas, la región de la Planicie Costera del Golfo se ha convertido, y
en especial las ciudades de Coatzacoalcos y Minatitlán, en un importante centro para la
industria petrolera. Recientemente han ocurrido terremotos con magnitudes hasta de 6.5
Profundidad Ángulo de
Delta (∆) Back Azimuth
Fuente (km) incidencia
Grupo 1
48º 173 32º 149º
(Sudamérica)
TUIG
Grupo 1
188
Capítulo 6 6.7 Estación Tuzandépetl (TUIG)
Los epicentros de los terremotos que fueron empleados en este trabajo aparecen en el
mapa de la figura 6.24.
Las funciones de receptor calculadas a partir de los cuatro registros fueron calculadas con
un periodo para el filtro gaussiano de Tp=2.5s (ver sección 3.1-iii), es decir, se filtraron con
un pasa-bajas con frecuencia de corte de 0.4hz. Los apilados tanto de las funciones de
receptor radiales como de las transversales aparecen en la figura 6.25. Ambas gráficas
están a la misma escala para que las amplitudes sean comparables. La complejidad de
las mismas (gran cantidad de fases), en comparación con las correspondientes a las otras
estaciones, se debe a que su contenido de frecuencias es considerablemente mayor
gracias al filtrado recién descrito.
Componente radial
Apilado radial
Componente tangencial
Apilado transversal
Tiempo (seg)
189
Capítulo 6 6.7 Estación Tuzandépetl (TUIG)
Fig. 6.26 Nube de 2,000 modelos arrojada por los dos métodos de inversión, GA y SA, al invertir
el apilado radial de la figura 6.25. El contraste acústico que sobresale a una profundidad
de aproximadamente 16 km marca el final de los depósitos sedimentarios.
190
Capítulo 6 6.7 Estación Tuzandépetl (TUIG)
a)
Profundidad (km)
b)
Tiempo (seg)
Fig. 6.27 a) Modelo promedio de las inversiones hechas en TUIG del apilado
de sudamérica; b) ajuste de dicho modelo promedio con las observaciones
y las bandas de error (dos líneas finamente discontinuas).
191
Capítulo 6 6.7 Estación Tuzandépetl (TUIG)
Velocidad β Velocidad α
Espesor (km)
(km/s) (km/s)
Capa 1 0.5 1.2 2.08
Capa 2 5.3 1.95 3.38
Capa 3 5.0 2.8 4.85
Capa 4 4.7 2.7 4.68
Capa 5 6.0 3.85 6.67
Capa 6 6.0 4.0 6.93
Semiespacio ∞ 4.75 8.23
Tabla 6.15 Valores numéricos del modelo final para el sitio TUIG
(figura 6.27). Las velocidades de las ondas “P” fueron calculadas
asumiendo un sólido de Poisson durante las inversiones.
El modelo promedio del conjunto mostrado en la figura pasada (de manera explícita en la
tabla 6.15), junto con el ajuste del mismo, se muestran en la figura 6.27. Ahí se puede ver
que dicho modelo, que conserva los rasgos principales de la nube de la cual proviene,
ajusta satisfactoriamente bien con las observaciones. Con esto se quiere decir que este
modelo logra ver prácticamente todos los arribos registrados en los primeros 35 segundos
de la función de receptor observada, a pesar de que las amplitudes, en algunos casos, no
se reproduzcan del todo bien (por ejemplo la onda P directa).
Una comparación de este resultado con otros modelos geofísicos propuestos para la
región se presentan en el próximo capítulo.
192
7 Comparación de resultados
con otras fuentes de
información geofísica.
Capítulo 7 7.1 Comparación en Zacatecas (ZAIG)
En 1975 James E. Fix (Fix, 1975) utilizó una red de sismógrafos instalada en Arizona para
registrar una serie de eventos ocurridos en las cercanías de Chiapas. A partir de los 18
terremotos detectados, Fix conformó seis curvas de dispersión para la velocidad de grupo,
mismas que empleó para el modelado de la estructura de cortante para la corteza y manto
superior, empleando un esquema de inversión por mínimos cuadrados.
A pesar de que en dicha investigación Fix empleó la dispersión de las ondas superficiales
para su modelado, es decir, observaciones sísmicas que acumulan la información
estructural promedio del trayecto entre la fuente y el detector, los dos modelos arrojados
por sus inversiones (uno para ondas de Love y otro para ondas de Rayleigh), no difieren
de manera importante del modelo final propuesto en el presente trabajo. Una comparación
gráfica puede verse en la figura 7.1, donde aparece un solo modelo de Fix producto de
promediar los dos antes mencionados que son muy similares entre sí. En la comparación
de la figura, la similitud más notoria es en las velocidades de las capas. En cuanto a las
diferencias en las profundidades, y en particular la del Moho (alrededor de ~6 km), hay
que recordar que las funciones de receptor modeladas en el presente poseen alta
resolución unidimensional por debajo de la estación, en contraste con el procedimiento de
Fix, por lo que es considerablemente más fiable nuestro resultado en ese aspecto.
Por otro lado, existe un trabajo más reciente desarrollado por Gomberg y compañía
(Gomberg, et al., 1988) en donde empleando nuevamente la dispersión de las ondas
superficiales de Love y de Rayleigh, pero ahora en su velocidad de fase, también
establecen la estructura de la corteza y manto superior. En él utilizan los tiempos de arribo
de algunas fases para restringir el espacio de soluciones en los procesos de inversión, por
mínimos cuadrados, que efectuaron con las curvas de dispersión.
Con un arreglo de tres estaciones localizado al norte de México, se registraron 20 eventos
con diversos azimuts, principalmente provenientes del pacífico sur. Apareando dos de las
tres estaciones de la manera más conveniente, se emplearon los registros para obtener
las curvas para la velocidad de fase. Al final, llegaron a tres modelos estructurales
diferentes debido a la dependencia que existe, cuando se emplea un método de inversión
local como es el caso, entre el modelo inicial y el final (ver capítulo 4). Los modelos
iniciales difirieron en la velocidad para el semiespacio “Sn” con 4.47 km/s, 4.33 km/s y 4.3
km/s. Sin embargo, para facilitar la comparación de sus resultados con el modelo final
obtenido en nuestro trabajo, se redujo la cantidad de capas presentada por Gomberg en
194
Capítulo 7 7.1 Comparación en Zacatecas (ZAIG)
sus modelos finales, a un conjunto que con la menor cantidad de ellas se apegara lo más
posible a los tres modelos simultáneamente. Esta comparación puede verse gráficamente
en la figura 7.1.
⎧ Ignimbritas y sedimentos
⎨ continentales (corteza superior).
⎩
Batolito silícico
(corteza media).
(Fix, 1975)
Profundidad (km)
Plutones gabróicos
(corteza inferior).
(Manto superior).
Fig. 7.1 comparación del modelo propuesto en este trabajo (línea continua)
con tres modelos previos. Dos generados a partir de la dispersión de ondas superficiales
(ver texto), y el otro expresado por las regiones sombreadas (Nieto-Samaniego et al., 1999).
La mayor discrepancia entre los tres modelos de velocidades en la figura 7.1 se encuentra
en las partes superficial y profunda. De los primeros dos trabajos comparativos, las
observaciones empleadas por Gomberg et al. para su modelado, que son la velocidad de
fase con tres estaciones distribuidas al norte de la república, es de mayor confiabilidad
que las empleadas por Fix que modeló la velocidad de grupo para trayectorias demasiado
grandes. Sin embargo, el método de inversión usado por Gomberg, al ser lineal, depende
extraordinariamente del modelo inicial del cual partió cada búsqueda. Por esto, y por
tratarse de la dispersión de las ondas superficiales que inequívocamente se ve afectada
por la totalidad de estructuras que atraviesen las ondas al propagarse, es difícil pensar
que los modelos comparativos correspondan, como sí sucede en el caso de los modelos
195
Capítulo 7 7.1 Comparación en Zacatecas (ZAIG)
196
Capítulo 7 7.2 Comparación en Ciudad Universitaria (CUIG)
197
Capítulo 7 7.2 Comparación en Ciudad Universitaria (CUIG)
parecido con la profundidad del Moho propuesta por Urrutia y Flores es enorme, esta
profundidad es prácticamente la misma que la del modelo obtenido en esta tesis a partir
con conjunto de datos más confiable, el de Sudamérica.
Uno de los resultados importantes del presente trabajo, es que nuestra investigación
revela una posible irregularidad en la forma del Moho. Por lo tanto, es en cierta medida
absurdo reducir dichos resultados a un solo modelo. También hay que tener presente que
de la misma manera como aparecen esas diferencias tan marcadas en cuanto a las
profundidades del Moho y las velocidades del manto superior en los cuatro modelos
finales arrojados por nuestra investigación, se encontró una enorme semejanza entre
estos modelos en sus partes media y superior.
} e
c+d
a
g f
Profundidad (km)
Fig. 7.2 Modelos de corteza propuestos para la parte central de México: a) Modelo propuesto
en este trabajo; b) Campillo et al., 1996; c) Campillo et al., 1989; d) Valdés et al., 1986; e)
Shapiro et al., 1997; f) Urrutia-Fucugauchi y Flores-Ruiz, 1996; g) Iglesias-Mendoza, 2000.
(Consultar texto para explicación).
198
Capítulo 7 7.2 Comparación en Ciudad Universitaria (CUIG)
199
Capítulo 7 7.3 Comparación en Tuzandépetl (TUIG)
Los modelos arrojados por las inversiones hechas en el artículo citado anteriormente se
muestran en la figura 7.3. Es importante decir que aquel resultado derivado de las
funciones de receptor es muy parecido al que se incluye en esta tesis ya que fueron
generados ambos por el autor de la misma a partir de los mismos datos.
a
Profundidad (km)
Fig. 7.3 Comparación de tres modelos para la zona de la Planicie Costera del Golfo (PCG): a)
Modelo cortical propuesto en este trabajo; b) modelo cortical propuesto por Shapiro et al.,
1999; c) Espesor de sedimentos por Camargo-Zanoguera, 1980; (ver texto).
El hecho más importante que revelan estos resultados es que, en contraste con lo que se
creía antes, el depósito sedimentario responsable de la amplificación de las ondas y del
bloque del tren Lg (Shapiro et al., 1999) es considerablemente mayor, aproximadamente
entre 6 y 8 km mayor. Además, es en esa cuenca sedimentaria donde yace gran cantidad
de recursos petroleros por demás importantes para el país.
200
Conclusiones y perspectivas
Conclusiones y perspectivas.
201
Conclusiones y perspectivas
202
Conclusiones y perspectivas
203
Conclusiones y perspectivas
204
Conclusiones y perspectivas
soluciones posibles que satisfagan los criterios de error y, por lo tanto, que respondan a la
incertidumbre en los datos.
205
Referencias
HEMEROGRÁFICAS
• Ammon, C. J. (1985). Time domain teleseismic P waveform modeling and the crust and
upper mantle structure beneath Berkeley, California. M. S. Thesis, State University of
New York, Binghamton, pp. 97.
• Ammon, C. J. (1991). The isolation of receiver effects from teleseismic P waveforms.
Bull. Seis. Soc. Am., 81, 2504-2510.
• Ammon, C. J. y J. E. Vidale. (1993). Tomography without rays. Bull. Seismol. Soc. Am.,
83, 509-528.
• Ammon, C. J., G. E. Randall, y G. Zandt. (1990). On the nonuniqueness of receiver
function inversions. J. Geophys. Res., 95, 15303-15318.
• Ángeles-Aquino, H. J., J. Reyes-Nuñez, J. M. Quezada-Muñetón, y J. J. Meneses-
Rocha. (1994). Tectonic evolution, structural styles, and oil habitat in Campeche Sound,
Mexico. Tranaction of the Gulf Coastal Association of Geological Societies, XLIV.
• Baker, G. E., J. B. Minster, G. Zandt, y H. Gurrola. (1996). Constraints on crustal
structure and complex Moho topography beneath Piñon Flat, California, from
teleseismic receiver functions. Bull. Seismol. Soc. Am., 86, 1830-1844.
• Berg, E. (1990). Simple convergent genetic algorithm for inversion of multiparameter
data: 60th Ann. Internat. Mtg., Soc. Expl. Geophys., Expanded Abstracts, 1126-1128.
• Berteussen, K. A. (1977). Moho depth determination based on spectral ratio analysis of
NORSAR long-period P waves. Phys. Earth Planet Inter., 31, 313-326.
• Bullen, K. E. y Bolt, B. A. (1985). An Introduction to the Theory of Seismology.
Cambridge Univ. Press, New York.
• Bump, H. A., y A. F. Sheehan. (1998). Crustal thickness variations across the northern
Tien Shan from teleseismic receiver functions. Geophys. Res. Lett., 25, 1055-1058.
• Burdick, L. J. y C. A. Langston. (1977). Modeling crustal structure through the use of
converted phase in teleseismic body-wave forms. Bull. Seismol Soc. Am., 67, 677-691.
• Burdick, L. J. y D. V. Helmberger. (1974). Time functions appropriate for deep
earthquakes. Bull. Seismol. Soc. Am., 64, 1419-1428.
• Camargo-Zanoguera, A. (1980). Aplicación de la gravimetría y magnetometría a la
exploración petrolera de las plataformas continentales mexicanas. Boletín de la
Asociación Mexicana de Geólogos Petroleros.
206
Referencias
207
Referencias
• Holland, J. H. (1992). Genetic Algorithms, computer programs that “evolve” in ways that
resemble even their creators do not fully understand. Scientific American, July.
• Jacobsen, B. Holm. (1987). A case for upward continuation as a standard separation
filter for potential-field maps. Geophysics, 52, 1138-1148.
• Jordan, T. H. y L. N. Frazer. (1975). Crustal and upper mantle structure from Sp
phases. J. Geophys. Res., 80, 1504-1518.
• Kennett, B. L. y Engdahl, E. R. (1991). Travel times for global earthquake location and
phase identification. Geophys. J. 105, 427-465.
• Kennett, B. L. y M. S. Sambridge. (1992). Earthquake location – genetic algorithm for
teleseisms. Phys. Earth. Planet. Interiors, 75, 103-110.
• Kennett, B. L. N., (1983). Seismic Wave Propagation in Stratified Media. Cambridge
University Press, Cambridge, England.
• Kirkpatrick, S., C. D. Gelatt, y M. P. Vecchi. (1983). Optimization by simulated
annealing. Science, 220, 671-680.
• Kurita, T. (1973). A procedure for elucidating fine structure of the crust and upper
mantle from seismological data. Bull. Seismol. Soc. Am., 63, 189-204.
• Langston, C. A. (1977). The effect of planar dipping structure on source and receiver
responses for constant ray parameter. Bull. Seismol. Soc. Am., 67, 1029-1050.
• Langston, C. A. (1979). Structure under Mount Rainier, Washington, inferred from
teleseismic body waves. J. Geophys. Res., 84, 4749-4762.
• Langston, C. A. (1981). Evidence for the subducting lithosphere under southern
Vancouver Island and western Oregon from teleseismic P waves conversions. J.
Geophys. Res., 86, 3857-3866.
• Lapp, D. B., R. S. Crosson, y T. J. Owens. (1990). P-waveform analysis for local
subduction geometry south of Puget Sound, Washington. Pure App. Geophys., 133,
349-365.
• Lines, L. R. y S. Treitel. (1984). Tutorial a review of least-squares inversion and its
application to geophysical problems. Geophysical Prospecting, 32, 159-186.
• Lomax, A. y R. Snieder. (1995). The contrast in upper mantle shear-wave velocity
between the East European Platform and tectonic Europe obtained with genetic
algorithm inversion of Rayleigh-wave group dispersion. Geophys. J. Int., 123, 169-182.
• Metropolis, N., A. Rosenbluth, M. Teller, y E. Teller. (1953). Equation of state
calculations by fast computing machines. J. Chem. Phys., 21, 1087-1092.
208
Referencias
209
Referencias
• Phinney, R. A. (1964). Structure of the hearth’s crust from spectral behavior of long-
period body waves. J. Geophys. Res., 69, 2997-3017.
• Pullammanappallil, S. K. y J. N. Louie. (1994). A generalized simulated-annealing
optimization for inversion of first-arrival times. Bull. Seismol. Soc. Am., 84, 1397-1409.
• Rothman, D. H. (1985). Nonlinear inversion, statistical mechanics and residual statics
estimation. Geophysics, 50, 2784-2796.
• Rothman, D. H. (1986). Automatic estimation of large residual statics corrections.
Geophysics, 51, 332-446.
• Sambridge, M. y G. Drijkoningen. (1992). Genetic algorithms in seismic waveform
inversion. Geophys. J. Int., 109, 323-342.
• Sen, M. K. y P. L. Stoffa. (1991). Nonlinear one-dimensional seismic waveform
inversion using simulated annealing. Geophysics, 56, 1624-1638.
• Sen, M. K. y P. L. Stoffa. (1992). Rapid sampling of model space using genetic
algorithms: examples from seismic waveform inversion. Geophys. J. Int., 108, 281-292.
• Sen, M. K., B. B. Battacharya, y P. L. Stoffa. (1993). Nonlinear inversion of resistivity
sounding data. Geophysics, 58, 1-12.
• Shapiro, N. M., M. Campillo, A. Paul, S. K. Singh, D. Jongmans, y F. J. Sánchez-
Sesma. (1997). Surface wave propagation across the Mexican Volcanic Belt and the
origin of the long-period seismic-wave amplification in the Valley of Mexico. Geophys. J.
Int., 128, 151-166.
• Shapiro, N. M., J. Pacheco, S. K. Singh, A. Camargo-Zanoguera, y V. M. Cruz-Atienza.
(1999). Seismic wave propagation across de gulf coastal plain of Veracruz, Tabasco,
and Campeche (Mexico): crustal structure, Lg blockage, and seismic-wave
amplification. (en proceso).
• Shapiro N. M. y S. K. Singh. (1999). A systematic error in estimating surface-wave
group-velocity dispersion curves and a procedure for its correction. Bull. Seismol. Soc.
Am., 89, 1138-1142.
• Shaw, P. R. y J. A. Orcutt. (1985). Waveform inversion of seismic refraction and
applications to young Pacific crust. Geophys. J. R. Astron. Soc., 82, 375-414.
• Shibutani, T., M. Sambridge y B. Kennett. (1996). Genetic algorithm inversion for
receiver functions with application to crust and uppermost mantle structure beneath
Eastern Australia. Geophys. Res. Lett., 23, 1829-1832.
• Singh K. S., E. Mena, y R. Castro. (1988). Some aspects of the source characteristics
and round motion amplification in and near Mexico City from acceleration data of the
210
Referencias
September, 1985, Michoacan, Mexico earthquakes. Bull. Seismol. Soc. Am. 78, 451-
477.
• Singh K. S., R. Quaas, M. Ordaz, F. Mooser, D. Almora, M. Torres y R. Vázquez.
(1995). Is there truly a “hard” rock site in the Valley of Mexico?. Geophys. Res. Lett.,
22, 481-484.
• Stoffa, P. y M. K. Sen. (1992). Seismic waveform inversion using global optimization. J.
Seismic. Exploration, 1, 9-27.
• Stoffa, P. L. y M. K. Sen. (1991). Nonlinear multiparameter optimization using genetic
algorithms: inversion of plane-wave seismograms. Geophysics, 56, 1794-1810.
• Urrutia-Fucugauchi, J. y J. H. Flores-Ruiz. (1996). Bouguer gravity anomalies and
regional crustal structure in central Mexico. Int. Geology Review, 38, 176-194.
• Valdés, C. M., W. D. Mooney, S. K. Singh, R. P. Mayer, C. Lomnitz, J. H. Luetgert, B. T.
Helsley, B. T. R. Lewis y M. Mena. (1986). Crustal structure of Oaxaca, Mexico from
seismic refraction measurements. Bull. Seismol. Soc. Am., 76, 547-564.
• Valdés-González, C. y R. P. Mayer. (1996). Seismic structure between the Pacific coast
and Mexico City from the Petatlán earthquake (Ms=7.6) aftershocks. Geofísica
Internacional, 35, 377-401.
• Vasuadevan, K., W. G. Williams, y W. G. Laidlaw. (1991). Simulated annealing statics
computation using an order-based energy function. Geophysics, 56, 1831-1839.
• Yamanaka, H. y H. Ishida. (1996). Application of genetic algorithms to an inversion of
surface-wave dispersion data. Bull. Seismol. Soc. Am., 86, 436-444.
• Zandt, G. y C. Ammon. (1995). Continental crust composition constrained by
measurements of crustal Poisson’s ratio. Nature, 374, 152-154.
• Zhang, J., y C. A. Langston. (1995). Dipping structure under Dourbes, Belbium,
detected by receiver function modeling and inversion. Bull. Seismol. Soc. Am., 85, 254-
268.
• Zhou, R., F. Tajima, y P. L. Stoffa. (1995). Application of genetic algorithms to constrain
near-source velocity structure for the 1989 Sichuan Earthquakes. Bull. Seismol. Soc.
Am., 85, 590-605.
BIBLIOGRÁFICAS
211
Referencias
212
Referencias
213
Agradecimientos
214
Ingeniería que me aportó, durante la carrera, gran parte de los conocimientos con los que
pude llevar a cabo este trabajo.
Debo decir que esta investigación fue parcialmente patrocinada por el CONACyT, a través
del proyecto 26184-T desarrollado en el Centro de Investigación Sísmica durante los
últimos años.
215