Métodos Matemáticos de La Física (Oscar A. Reula) PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 286

Métodos

matemáticos
para la Física

Oscar A. Reula

Solo con fines educativos


Métodos Matemáticos de la Física

OSCAR REULA

1
2
AGRADECIMIENTOS

En primer lugar quiero agradecer a Gloria Puente, por haberme apoyado


durante todo el tiempo en que escribí estas notas, las cuales tomaron bastante
tiempo de nuestras horas compartidas, en general largas noches. En segundo
lugar a Bernardo González Kriegel quien volcara a LATEX las primeras versio-
nes de estas notas, haciendo un gran trabajo con mucho entusiasmo. También
a Bob Geroch, con quien discutí varios temas de las notas y de quien también
me inspiré a través de sus escritos y libros, no solo en contenido sino también
en estilo. Finalmente a varias camadas de estudiantes que asimilaron estoica-
mente una gran cantidad del material de estos cursos en un tiempo demasiado
corto.

3
4
ÍNDICE GENERAL

1. Conceptos Básicos de Topología 15


1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.1.1. Terminología . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.2. Conceptos Derivados . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.2.1. Mapas continuos . . . . . . . . . . . . . . . . . . . . . . . . 18
1.2.2. Compacidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2. Álgebra Lineal 27
2.1. Espacios Vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.1.1. Covectores y Tensores . . . . . . . . . . . . . . . . . . . . 29
2.1.2. Complexificación . . . . . . . . . . . . . . . . . . . . . . . 32
2.1.3. Espacios cociente . . . . . . . . . . . . . . . . . . . . . . . . 32
2.2. Normas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.2.1. Las normas inducidas en V ⋆ . . . . . . . . . . . . . . . . . 36
2.3. Teoría de Operadores Lineales . . . . . . . . . . . . . . . . . . . . 36
2.3.1. Representación Matricial . . . . . . . . . . . . . . . . . . . 39
2.3.2. Subespacios Invariantes . . . . . . . . . . . . . . . . . . . . 40
2.3.3. Forma Canónica de Jordan . . . . . . . . . . . . . . . . . 49
2.3.4. Relación de Semejanza . . . . . . . . . . . . . . . . . . . . 52
2.4. Operadores Adjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.5. Operadores Unitarios . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.6. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

3. Geometría 65
3.1. Variedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.2. Funciones Diferenciables en M . . . . . . . . . . . . . . . . . . . . 69
3.3. Curvas en M . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.4. Vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.5. Campos Vectoriales y Tensoriales . . . . . . . . . . . . . . . . . . 75
3.5.1. El Corchete de Lie . . . . . . . . . . . . . . . . . . . . . . . 75

5
3.5.2. Difeomorfismos y la Teoría de las Ecuaciones Dife-
renciales Ordinarias . . . . . . . . . . . . . . . . . . . . . . 76
3.5.3. Campos de Covectores y Tensores . . . . . . . . . . . . . 77
3.5.4. La Métrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
3.5.5. Notación de Índices Abstractos . . . . . . . . . . . . . . 81
3.6. Derivada Covariante . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

4. Ecuaciones Diferenciales Ordinarias 89


4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.2. El Caso de una Única Ecuación Ordinaria de Primer Orden . 90
4.2.1. Ecuación Autónoma de Primer Orden . . . . . . . . . . 90
4.2.2. Extendiendo la Solución Local . . . . . . . . . . . . . . . 98
4.2.3. El Caso No-autónomo . . . . . . . . . . . . . . . . . . . . 100
4.3. Reducción a Sistemas de Primer Orden . . . . . . . . . . . . . . 101
4.4. Sistemas de EDO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
4.4.1. Integrales Primeras . . . . . . . . . . . . . . . . . . . . . . . 106
4.4.2. Teorema Fundamental de los Sistemas de EDO . . . . 107
4.4.3. Dependencia en Parámetros, Ecuación de Variaciones 108
4.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

5. Sistemas Lineales 115


5.1. Sistema lineal homogéneo . . . . . . . . . . . . . . . . . . . . . . . 115
5.2. Sistema Lineal Inhomogeneo – Variación de constantes . . . . 118
5.3. Sistemas lineales homogéneos: coeficientes constantes . . . . . 119
5.4. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

6. Estabilidad 131
6.1. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

7. Prueba del Teorema Fundamental 143


7.1. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

8. Elementos Básicos de Análisis Funcional 151


8.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
8.2. Completando un Espacio Normado . . . . . . . . . . . . . . . . . 151
8.3. *Integral de Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . . 153
8.4. Espacios de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
8.5. Serie de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
8.6. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
8.7. Problemas de Series de Fourier . . . . . . . . . . . . . . . . . . . . 182

6
9. Distribuciones 185
9.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
9.2. La derivada de una distribución . . . . . . . . . . . . . . . . . . . . 189
9.3. Nota sobre la completitud de D y su dual D ′ . . . . . . . . . . . 193
9.4. Convergencia y Compacidad Débil . . . . . . . . . . . . . . . . . 194

10. La Transformación de Fourier 197


10.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
10.2. *Propiedades básicas de los Espacios de Sobolev . . . . . . . . . 204

11. Teoría de ecuaciones en derivadas parciales 213


11.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
11.2. La ecuación de primer orden . . . . . . . . . . . . . . . . . . . . . 216
11.2.1. El Problema de Cauchy . . . . . . . . . . . . . . . . . . . . 217
11.3. Clasificación de ecuaciones en derivadas parciales . . . . . . . . 221

12. Ecuaciones Elípticas 227


12.1. La Ecuación de Laplace . . . . . . . . . . . . . . . . . . . . . . . . . 227
12.1.1. Existencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
12.1.2. *Regularidad de las Soluciones . . . . . . . . . . . . . . . 232
12.2. Teorema Espectral . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234

13. Ecuaciones simétrico–hiperbólicas 241


13.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
13.2. Un ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
13.3. Desigualdad de la energía para sistemas simétrico–hiperbólicos 248
13.4. Unicidad de las soluciones . . . . . . . . . . . . . . . . . . . . . . . 251
13.5. Dominio de dependencia . . . . . . . . . . . . . . . . . . . . . . . . 252
13.5.1. Construcción de una superficie característica . . . . . . 253
13.5.2. Dominio de dependencia, ejemplos . . . . . . . . . . . . 257

14. Ecuaciones Parabólicas 261


14.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261
14.2. Unicidad y el Teorema del Máximo . . . . . . . . . . . . . . . . . 263

15. Grupos 267


15.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267
15.2. Isomorfismos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269
15.3. Subgrupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
15.4. La construcción universal . . . . . . . . . . . . . . . . . . . . . . . 270
15.5. Grupos Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271

7
15.5.1. El grupo SO(3). . . . . . . . . . . . . . . . . . . . . . . . . 272
15.6. Cosets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273
15.6.1. Espacios Homogéneos . . . . . . . . . . . . . . . . . . . . 275
15.7. Subgrupos Normales . . . . . . . . . . . . . . . . . . . . . . . . . . 276

16. Preguntas Teóricas de Exámen 279

8
ÍNDICE DE FIGURAS

2.1. Interpretación geométrica del espacio cociente. . . . . . . . . . 34


2.2. Diagrama del operador dual. . . . . . . . . . . . . . . . . . . . . . 56
2.3. Diagrama del operador estrella. . . . . . . . . . . . . . . . . . . . 58
2.4. Vectores normales y tangentes a la esfera. . . . . . . . . . . . . 60

3.1. Un atlas de la esfera. . . . . . . . . . . . . . . . . . . . . . . . . . . 66


3.2. Relación entre cartas. . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.3. Sucesiones en M . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.4. Ejemplo de variedad no–Hausdorff. . . . . . . . . . . . . . . . . 69
3.5. Composición del mapa de una carta con una función. . . . . 70
3.6. La relación entre las fi . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.7. Diferenciabilidad de curvas en M . . . . . . . . . . . . . . . . . . 71
3.8. Definición de vector. . . . . . . . . . . . . . . . . . . . . . . . . . . 75

4.1. Interpretación geométrica de la ecuación f (x) = x 1/2. . . . . 91


4.2. Prueba del Lema 4.1. . . . . . . . . . . . . . . . . . . . . . . . . . . 94
4.3. Prueba de la unicidad de la solución. . . . . . . . . . . . . . . . 94
4.4. Distintas soluciones de la ecuación de crecimiento bacteriano 97
4.5. Unicidad global. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.6. Extendiendo la solución. . . . . . . . . . . . . . . . . . . . . . . . 99
4.7. El péndulo Físico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.8. La variedad Péndulo Físico. . . . . . . . . . . . . . . . . . . . . . 105

6.1. Estabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132


6.2. Péndulo físico con fricción. . . . . . . . . . . . . . . . . . . . . . 134
6.3. La norma ρ(x, x). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

7.1. Entornos usados en la prueba del Teorema Fundamental. . . 148

8.1. Una sucesión de Cauchy. . . . . . . . . . . . . . . . . . . . . . . . 154


8.2. Otra sucesión de Cauchy. . . . . . . . . . . . . . . . . . . . . . . . 154
8.3. Integral de Lebesgue. . . . . . . . . . . . . . . . . . . . . . . . . . . 156

9
8.4. El espacio perpendicular. . . . . . . . . . . . . . . . . . . . . . . . 165
8.5. Ley del paralelogramo. . . . . . . . . . . . . . . . . . . . . . . . . 166

11.1. Curvas características. . . . . . . . . . . . . . . . . . . . . . . . . . 217


11.2. Intersección de soluciones. . . . . . . . . . . . . . . . . . . . . . . 218
11.3. Construyendo la solución a partir de la curva γ . . . . . . . . . 219
11.4. Construyendo la solución local. . . . . . . . . . . . . . . . . . . 223

12.1. La membrana de un tambor. . . . . . . . . . . . . . . . . . . . . . 228


12.2. Problema mixto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229

13.1. Sistema coordenado nulo. . . . . . . . . . . . . . . . . . . . . . . . 242


13.2. Propagación de ondas. . . . . . . . . . . . . . . . . . . . . . . . . . 244
13.3. Solución general homogénea en 1+1 dimensiones. . . . . . . 245
13.4. Solución general inhomogenea. . . . . . . . . . . . . . . . . . . . 246
13.5. Desigualdad de la energía . . . . . . . . . . . . . . . . . . . . . . . 249
13.6. Desigualdad de la energía, vista en perspectiva. . . . . . . . . . 249
13.7. Región en forma de ampolla . . . . . . . . . . . . . . . . . . . . . 252
13.8. Cono característico . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
13.9. Construcción de S y una singularidad en S . . . . . . . . . . . 257
13.10. Dominio de dependencia de un fluido . . . . . . . . . . . . . . . 258

14.1. Condiciones de contorno para la ecuación del calor. . . . . . 261


14.2. Prueba del Lema 14.1 . . . . . . . . . . . . . . . . . . . . . . . . . 265

10
PREFACIO

Estas notas, ahora devenidas en libro, se originaron como un intento de


condensar en un solo lugar un gran conjunto de ideas, conceptos y herra-
mientas matemáticas que considero básicas para la comprensión y el trabajo
diario de un físico en nuestros días.
Usualmente sucede que si un problema es formulado desde una necesi-
dad de origen físico, como por ejemplo la descripción de algún fenómeno
natural, entonces éste está bien formulado, en el sentido de que una solu-
ción razonable al mismo existe. Esta regla ha sido en general muy fructífera
y en particular les ha servido como guía a muchos matemáticos para abrirse
camino en áreas desconocidas. Pero también ha servido, en particular a mu-
chos físicos, para trabajar sin preocuparse demasiado por aspectos formales,
ya sean analíticos, algebraicos o geométricos y poder así concentrarse en as-
pectos físicos y/o computacionales. Si bien esto permite un rápido desarrollo
de algunas investigaciones, a la larga se llega a un estancamiento pues al pro-
ceder de este modo se evita enfrentar problemas que son muy ricos en cuanto
a la conceptualización del fenómeno a describir. Es importante constatar que
el problema formulado tiene una solución matemática y físicamente correcta.
Un ejemplo de esto ha sido el desarrollo, a mediados del siglo pasado,
de la teoría moderna de las ecuaciones en derivadas parciales. Muchas de es-
tas ecuaciones surgieron debido a que describen fenómenos de físicos: trans-
misión del calor, propagación de ondas electromagnéticas, ondas cuánticas,
gravitación, etc. Una de las primeras respuestas matemáticas al desarrollo de
estas áreas fue el teorema de Cauchy-Kowalevski que nos dice que dada una
ecuación en derivadas parciales, (bajo ciertas circunstancias bastante genera-
les) si una función analítica es dada como dato en una hipersuperficie (con
ciertas características), luego existe una solución única en un entorno sufi-
cientemente pequeño de dicha hipersuperficie. Tomó mucho tiempo darse
cuenta que este teorema realmente no era relevante desde el punto de vista de
las aplicaciones físicas: existían ecuaciones admitidas por el teorema tales que
si el dato no era analítico ¡no había solución! Y en muchos casos, si éstas exis-
tían, no dependían continuamente del dato dado, una pequeña variación del

11
dato producía una solución totalmente distinta. Recién a mediados del siglo
pasado se logró un avance sustancial al problema, encontrando que habían
distintos tipos de ecuaciones, hiperbólicas, elípticas, parabólicas, etc. que se
comportaban de manera distinta y esto reflejaba los distintos procesos físicos
que las mismas simulaban. Debido a su relativa actualidad, este conjunto tan
importante de conceptos no forman parte del conjunto de herramientas con
que cuentan muchos de los físicos en actividad ni tampoco se encuentran en
los libros de texto usualmente utilizados en las carreras de grado.
Como el anterior hay muchos ejemplos, en particular la teoría de ecua-
ciones diferenciales ordinarias y la geometría, sin la cual es imposible com-
prender muchas de las teorías modernas, tales como la relatividad, las teorías
de partículas elementales y muchos fenómenos de la física del estado sólido.
A medida que avanza nuestra comprensión de los fenómenos básicos de la
naturaleza más nos damos cuenta que la herramienta más importante para su
descripción es la geometría. Ésta, entre otras cosas, nos permite manejar una
amplia gama de procesos y teorías sin mucho en común entre sí con un con-
junto muy reducido de conceptos, lográndose así una síntesis. Éstas síntesis
son las que nos permiten adquirir nuevos conocimientos, ya que mediante
su adopción dejamos espacio en nuestras mentes para aprender nuevos con-
ceptos, los cuales son a su vez ordenados de manera más eficiente dentro de
nuestra construcción mental del área.
Estas notas fueron originalmente pensadas para un curso de cuatro me-
ses de duración. Pero en realidad se adaptaban más para un curso anual o dos
semestrales. Luego, a medida que se fueron incorporando más temas a las mis-
mas, resultó más y más claro que deben darse en dos cursos semestrales o uno
anual. Básicamente un curso debería contener los primeros capítulos que in-
cluyen nociones de topología, espacios vectoriales, álgebra lineal, finalizando
con la teoría de las ecuaciones en derivadas ordinarias. La tarea se simplifica
considerablemente si los estudiantes han tenido previamente un buen curso
de álgebra lineal. La correlación con las materias de física debería ser tal que
el curso sea previo o concurrente con una mecánica avanzada. Haciendo hin-
capié en la misma sobre el hecho de que en definitiva uno está resolviendo
ecuaciones diferenciales ordinarias con cierta estructura especial. Utilizando
los conceptos del álgebra lineal para encontrar modos propios y la estabilidad
de puntos de equilibrio. Y finalmente utilizando la geometría para describir
aunque más no sea someramente la estructura simpléctica subyacente.
El segundo curso consiste en desarrollar las herramientas para poder dis-
cutir aspectos de la teoría de ecuaciones en derivadas parciales. Debería dar-
se antes o concurrentemente con un curso avanzado de electromagnetismo,

12
donde se debería hacer hincapié en el tipo de ecuaciones que se resuelven (elíp-
ticas, hiperbólicas), y el sentido de sus condiciones iniciales o de contorno,
según corresponda. Usando además en forma coherente el concepto de dis-
tribución, que lejos de ser un concepto matemático abstracto es en realidad
un concepto que aparece naturalmente en la física.
Nada del contenido de estas notas es material original, sí algunas formas
de presentarlo, por ejemplo algunas pruebas más simples que las usuales, o
la forma de integrar cada contenido con los anteriores. Mucho del material
debería ser pensado como una primera lectura o una iniciación al tema y el
lector interesado en profundizar debería leer los libros citados, de los cuales
he extraído mucho material, siendo éstos excelentes y difíciles de superar.

13
14
CAPÍTULO 1

CONCEPTOS BÁSICOS DE TOPOLOGÍA

1.1. Introducción

La noción de conjunto, si bien nos dice que ciertos objetos –los elemen-
tos que lo conforman– tienen algo en común entre sí, no nos da ninguna idea
de la cercanía de entre estos elementos, mientras que por otro lado si consi-
deramos por ejemplo los números reales esta noción está presente. Sabemos
por ejemplo que el número 2 está mucho más cercano al 1 que lo que lo está
el 423. El concepto de una topología en un conjunto que definiremos a con-
tinuación trata de captar con precisión esta noción de cercanía la cual, como
veremos admite muchas gradaciones.

Definición: Un espacio topológico consiste en un par (X , T ), donde X es


un conjunto y T es una colección de subconjuntos de X satisfaciendo las
siguientes condiciones:

1. Los subconjuntos ; y X de X están en T .

2. Sea Oλ , λS
∈ I , una familia monoparamétrica de subconjuntos de X en
T , luego I Oλ está también en T .

3. Si O y O ′ están en T , también lo está O ∩ O ′ .

Los elementos de T , subconjuntos de X , son llamados los subconjuntos


abiertos de X , el conjunto T en sí es llamado una topología de X . La condi-
ción 2) nos dice que infinitas uniones de elementos de T también están en T ,
mientras que la condición 3) nos dice que en general solo finitas interseccio-
nes siguen estando en T . De los ejemplos siguientes se desprende el porqué
de esta asimetría, ellos también nos ilustrarán de cómo dar una topología es
esencialmente dar una noción de cercanía entre los puntos del conjunto en
cuestión.

15
Ejemplo: a) Sea T = {;, X }, es decir que los únicos subconjuntos abiertos de
X son el subconjunto vacío y el subconjunto X . Es claro que esta colección
de subconjuntos es una topología, ya que satisface las tres condiciones reque-
ridas, a esta topología se la denomina indiscreta. Podemos decir que en esta
topología los puntos de X están arbitrariamente cerca entre sí, ya que si un
abierto contiene a uno de ellos los contiene a todos.

Ejemplo: b) Sea T = P (X ), la colección de todos los subconjuntos de X , cla-


ramente esta colección también satisface las condiciones arriba mencionadas
y por lo tanto también es una topología de X , la llamada discreta. Podemos
decir que en ésta todos los puntos están arbitrariamente separados entre sí ya
que por ejemplo, dado cualquier punto de X existe un abierto que separa a
éste de todos los demás, el que consiste de solo el punto en cuestión.

Ejemplo: c) Sea X el conjunto de los números reales, de ahora en más, lR, y


sea T = {O| s i r ∈ O, ∃ǫ > 0 t a l q u e s i |r − r ′ | < ǫ, r ′ ∈ O}, es decir la
colección de abiertos en el sentido usual. Veamos que esta colección satisface
las condiciones para ser una topología. Claramente ; ∈ T , (ya que no tiene

ningún r ), lo mismo que lR, (ya que contiene S a todos los r ), y así condición
1) es satisfecha. Veamos la segunda, sea r ∈ I Oλ luego r ∈ Oλ para algún λ
y por lo tanto existirá S ǫ > 0 tal que todo r ′ con |r − r ′ | < ǫ está también en
Oλ , y por lo tanto en I Oλ . Veamos finalmente la tercera, sea r ∈ O ∩ O ′
luego r ∈ O y por lo tanto existirá ǫ > 0 tal que todo r ′ con |r − r ′ | < ǫ
estará en O, como r también está en O ′ existirá ǫ′ > 0 tal que todo r ′ con
|r − r ′ | < ǫ′ estará en O ′ . Sea ǫ′′ = mi n{ǫ, ǫ′ } luego todo r ′ con |r − r ′ | < ǫ′′
estará en O y en O ′ y por lo tanto en O ∩ O ′ , con lo que concluimos que este
último conjunto también está en T . lR con esta topología es llamada la línea
real.

Ejercicio: Encuentre usando el ejemplo anterior una intersección infinita de


abiertos que no es abierta.

Ejemplo: d) Sea X = lR×lR ≡ lR2, es decir el producto cartesiano de lRconsigo


mismo –el conjunto de todos los pares (x, y), con x, y ∈ lR– y sea T =
{O| s i (x, y) ∈ O, ∃ǫ > 0 t a l q u e s i |x − x ′ | + |y − y ′ | < ǫ, (x ′ , y ′ ) ∈ O}.
Del ejemplo anterior se puede ver que este también es un espacio topológico
y que esta es la topología que usualmente usamos en lR2

Definición: Un espacio métrico, (X , d ) es un par consistente en un conjunto

16
X y un mapa d : X × X −→ lR, llamado usualmente distancia, satisfaciendo
las siguientes condiciones:

1. d (x, x ′ ) ≥ 0, = 0 ⇒ x = x ′ .
2. d (x, x ′ ) = d (x ′ , x).
3. d (x, x ′ ) + d (x ′ , x ′′ ) ≥ d (x, x ′′ ).

Ejercicio: Pruebe que este espacio posee una topología inducida por su métri-
ca en forma similar a lR en el ejemplo anterior.

Ejercicio: Vea que d (x, y) = 1 si x 6= y, es una distancia. ¿Qué topología nos


introduce dicha distancia?
Claramente una métrica nos da una noción de cercanía entre puntos, ya
que nos da un valor numérico de la distancia entre sí de estos. Una topología,
al no darnos en general ningún número nos da una noción de cercanía mucho
más vaga, pero de todos modos en general interesante.

1.1.1. Terminología
Damos a continuación un resumen de la terminología usual en esta área,
la misma es una generalización directa de la usada comúnmente.

Definición: Llamaremos el complemento, O c , del subconjunto O de X al


subconjunto de todos los elementos de X que no están en O.

Definición: Diremos que un subconjunto O de X es cerrado si su comple-


mento O c es abierto.

Definición: Un subconjunto N de X es llamado un entorno de x ∈ X si


existe un abierto O x , con x ∈ O x , contenido en N .

Definición: Llamaremos el interior de A ∈ X al subconjunto I n t (A) de X


formado por la unión de todos los abiertos contenidos en A.

Definición: Llamaremos la clausura de A ∈ X al subconjunto C l (A) de X


formado por la intersección de todos los cerrados conteniendo a A.

Definición: Llamaremos la frontera de A ∈ X al subconjunto ∂ A de X for-


mado por C l (A) − I n t (A) ≡ I n t (A)c ∩ C l (A).

17
Ejercicio: Sea (X , d ) un espacio vectorial métrico, pruebe que:
a) C x1 = {x ′ |d (x, x ′ ) ≤ 1} es cerrado y es un entorno de x.
b) N xǫ = {x ′ |d (x, x ′ ) < ǫ}, ǫ > 0 es también un entorno de x.
c) I n t (N xǫ ) = N xǫ
d) C l (N xǫ ) = {x ′ |d (x, x ′ ) ≤ ǫ}
e) ∂ N xǫ = {x ′ |d (x, x ′ ) = ǫ}.

Ejercicio: Sea (X , T ) un espacio topológico y A un subconjunto de X . Pruebe


que:
a) A es abierto si y solo si cada x ∈ A tiene un entorno contenido en A.
b) A es cerrado si y solo si cada x en Ac (o sea no perteneciente a A) tiene un
entorno que no intersecta a A.

Ejercicio: Sea (X , T ) un espacio topológico, sea A ∈ X y x ∈ X . Pruebe que:


a) x ∈ I n t (A) si y solo si x tiene un entorno contenido en A.
b) x ∈ C l (A) si y solo si todo entorno de x intersecta A.
c) x ∈ ∂ A si y solo si todo entorno de x contiene puntos en A y puntos en
Ac .

1.2. Conceptos Derivados

En las secciones anteriores hemos visto que el concepto de una topología


nos lleva a una generalización de una serie de ideas y conceptos derivados que
manejábamos en lRn , las cuales no dependían de la métrica usual usada en es-
tos espacios (la llamada Métrica Euclídea). Cabe entonces preguntarse si hay
otras generalizaciones posibles todavía. En esta y en la próxima subsección
estudiaremos dos más de ellas, éstas a su vez abren una vasta área de las mate-
máticas, que no trataremos en este curso pero que es muy importante en lo
que respecta a la física moderna.
La primera de ellas es la de continuidad.

1.2.1. Mapas continuos

Definición: Sea ϕ : X → Y un mapa entre dos espacios topológicos. (Ver


recuadro.) Diremos que el mapa ϕ es continuo si dado cualquier abierto O
de Y , ϕ −1(O) es un abierto de X .

18
Definición: Un mapa φ : X → Y entre un conjunto X y otro Y es una
asignación a cada elemento de X de un elemento de Y .
Esto generaliza el concepto de función usual, note que el mapa está definido
para todo elemento de X , mientras que en general su imagen, es decir el
conjunto φ(X ) ≡ {y ∈ Y | ∃x ∈ X y φ(x) = y}, no es todo Y . En el caso
que lo es, es decir que φ(X ) = Y , diremos que el mapa es suryectivo. Por
otro lado si se cumple que φ(x) = φ(x̃) =⇒ x = x̃ diremos que el mapa es
inyectivo. En tal caso existe el mapa inverso a φ entre el conjunto φ(X ) ⊂ Y
y X . Si el mapa es además suryectivo entonces su inverso está definido en
todo Y y en este caso se denota por φ−1 : Y → X . Es de utilidad considerar
también los conjuntos φ−1(O) = {x ∈ X | φ(x) ∈ O}

Claramente la definición anterior solo usa conceptos topológicos ¿Tie-


ne algo que ver con la usual épsilon-delta usada en lRn ? La respuesta es afir-
mativa, como veremos más abajo en nuestro primer teorema, pero primero
veamos algunos ejemplos.

Ejemplo: a) Sean X e Y cualquiera y sea la topología de X la discreta. Luego


cualquier mapa entre X e Y es continuo. En efecto, para cualquier O abierto
en Y , ϕ −1(O) es algún subconjunto en X , pero en la topología discreta todo
subconjunto de X es un abierto.

Ejemplo: b) Sean X e Y cualquiera y sea la topología de Y la indiscreta. Lue-


go también cualquier mapa entre X e Y es continuo. En efecto, los únicos
abiertos en Y son ; e Y , pero ϕ −1(;) = ;, mientras que ϕ −1(Y ) = X , pero
cualquiera sea la topología de X , ; y X son abiertos.
De los ejemplos anteriores parecería ser que nuestra definición de conti-
nuidad no es muy interesante, eso es debido a que hemos tomado casos con
las topologías extremas, en las topologías intermedias es donde la definición
se hace más útil.

Ejemplo: c) Sean X e Y líneas reales, y sea ϕ(x) = 1 si x ≥ 0, ϕ(x) = −1


si x < 0. Este mapa no es continuo ya que, por ejemplo, ϕ −1((1/2, 3/2)) =
{x|x ≥ 0}.

Teorema 1.1 El mapa ϕ : X → Y es continuo si y solo si se cumple que: dado


cualquier punto x ∈ X y cualquier entorno M de ϕ(x), existe un entorno N de
x tal que ϕ(N ) ⊂ M .

19
Esta segunda definición está mucho más cerca del concepto intuitivo de
continuidad.

Prueba: Supongamos ϕ continuo. Sea x un punto de X , y M un entorno de


φ(x). Luego existe un abierto O en Y contenido en M y conteniendo a φ(x).
Por continuidad N = ϕ −1(O) es un abierto de X , y como contiene a x, un
entorno de x. Se cumple entonces que ϕ(N ) ⊂ O ⊂ M . Supongamos ahora
que dado cualquier punto x ∈ X y cualquier entorno M de ϕ(x), existe un
entorno N de x tal que ϕ(N ) ⊂ M . Sea entonces O un abierto cualquiera de
Y , debemos mostrar ahora que ϕ −1(O) es un abierto de X . Sea x un punto
cualquiera de ϕ −1(O), luego ϕ(x) ∈ O y por lo tanto O es un entorno de
ϕ(x), por lo tanto existe un entorno N de x tal que ϕ(N ) ⊂ O y por lo tanto
N ⊂ ϕ −1(O). Pero entonces ϕ −1(O) contiene un entorno de cada uno de sus
puntos y por lo tanto es abierto.

Ejercicio: Sea φ : X → Y y ψ : Y → Z mapas continuos, pruebe que ψ ◦ φ :


X → Z también es continuo. (Composición de mapas preserva continuidad.)

Topología Inducida:

Sea φ un mapa entre un conjunto X y un espacio topológico {Y, T }. Este


mapa proporciona naturalmente, es decir sin la ayuda de ninguna otra estruc-
tura, una topología en X , denotada por T φ y llamada la topología inducida
por φ en X . El conjunto de sus abiertos está dado por: T φ = {O ⊂ X | O =
φ−1(Q), Q ∈ T }, es decir O es un abierto de X si existe un abierto Q de Y
tal que O = φ−1(Q).

Ejercicio: Demuestre que esta construcción realmente define una topología.


No todas las topologías así inducidas son de interés y en general dependen
fuertemente del mapa, como lo demuestra el siguiente ejemplo:

Ejemplo:
a) Sea X = Y = lR con la topología usual y sea φ : lR → lR la función φ(x) =
17 ∀ x ∈ lR. Esta función es claramente continua con respecto a las topologías
de X e Y , las de la línea real. Sin embargo T φ , la topología inducida en X
por este mapa es la indiscreta!
b) Sea X e Y como en a) y sea φ(x) un mapa invertible, luego T φ coincide
con la topología de la línea real.

20
1.2.2. Compacidad
La otra generalización corresponde al concepto de Compacidad. Para
ello introducimos la siguiente definición: Sea X un conjunto, A un subcon-
junto de éste y {Aλ } una colección de subconjuntos de X parametrizados por
una variable continua o discreta λ. Diremos que esta colección cubre A si
A ⊂ ∪λ Aλ .

Definición: Diremos que A es compacto si dada cualquier colección {Aλ } de


abiertos que lo cubren, existe un número finito de estos Aλ que también lo
cubren.

Ejemplo: a) Sea X un conjunto infinito de puntos con la topología discreta.


Luego un cubrimiento de X consiste, por ejemplo, en todos los puntos de
éste, considerados cada uno de ellos como un subconjunto del mismo. Pero la
topología de X es la discreta, por lo tanto este es un cubrimiento de abiertos
y ningún número finito de ellos lo cubrirá, por lo tanto X no es en este
caso compacto. Claramente si X tuviese solo un número finito de elementos
siempre sería compacto, cualquiera fuese su topología.

Ejemplo: b) Sea X cualquier conjunto con la topología indiscreta. Luego X es


compacto. Los únicos abiertos de este conjunto son ; y X , por lo tanto cual-
quier cubrimiento tiene a X como uno de sus miembros y éste solo alcanza
para cubrir a X .
Vemos así que esta propiedad depende fuertemente de la topología del
conjunto. La relación con el concepto intuitivo de compacidad queda clara
de los siguientes ejemplo y ejercicio.

Ejemplo: c) Sea X la línea real y A = (0, 1). Este subconjunto no es compacto


pues por ejemplo el siguiente es un cubrimiento de abiertos de A tal que
cualquier subconjunto finito del mismo no lo es. An = ( n1 , n−1
n
)

Ejercicio: Sea X la línea real y A = [0, 1]. Pruebe que A es compacto.


Prueba:
Sea {Aλ } un cubrimiento de [0, 1] y a ∈ [0, 1] la menor cota superior de
los x ∈ (0, 1] tales que [0, x] está cubierto por un subcubrimiento finito. a
existe pues 0 tiene un A que lo cubre. Sea Aλ0 un elemento del cubrimiento
tal que a ∈ Aλ0 . Luego existe b < a tal que b ∈ Aλ0 y b ya está cubierto por un
subcubrimiento finito. Tenemos así que a está en un subcubrimiento finito y
por lo tanto, si a 6= 1 también algunos elementos mayores al mismo. Lo que

21
constituiría una contradicción. ♠
Veamos ahora la relación entre los dos conceptos derivados del de To-
pología, es decir el de la continuidad de mapas entre espacios topológicos y
el de compacidad. El hecho de que un mapa entre espacios topológicos sea
continuo implica que este mapa es especial, en el sentido de que tiene o lleva
información sobre las respectivas topologías y preserva las propiedades topológi-
cas de los conjuntos que asocia. Esto se ve en la siguiente propiedad, la cual
–como se desprende del ejemplo que sigue– es muy importante.
Teorema 1.2 Sean X e Y dos espacios topológicos y φ un mapa continuo entre
ellos. Luego si A es un subconjunto compacto de X , φ(A) es un subconjunto
compacto de Y .

Prueba: Sea Oλ una colección de abiertos en Y que cubren a φ(A). Luego


la colección φ−1(Oλ ) cubre a A, pero A es compacto y por lo tanto habrá
una subcolección finita φ−1Oλ̃ de la anterior que también lo cubre. Por lo
tanto la subcolección finita Oλ̃ cubrirá también a φ(A). Como esto es cierto
para cualquier colección de abiertos cubriendo a φ(A) concluimos que éste es
compacto.

Ejemplo: Sea A compacto y sea φ : A → lR continuo, es decir un mapa conti-


nuo entre A y la línea real. φ(A) es entonces un conjunto compacto de la línea
real y por lo tanto un conjunto cerrado y acotado, pero entonces este conjun-
to tendrá un máximo y un mínimo, es decir el mapa φ alcanza su máximo y
mínimo en A.
Finalmente otro teorema de fundamental importancia acerca de los con-
juntos compactos, el cual muestra que éstos tienen otra propiedad que los
hace muy interesantes. Para ello introducimos las siguientes definiciones, las
cuales también solo en conceptos topológicos. Una sucesión o secuencia en
un conjunto X {xn } = {x1, x2, ...}, con xn ∈ X , es un mapa de los números
enteros en este conjunto. Dada una sucesión {xn } en un espacio topológico
X , diremos que x ∈ X es un punto de convergencia o límite de esta sucesión
si dado cualquier abierto O de X conteniendo a x existe un número N tal que
para todo n > N xn ∈ O. Diremos que x ∈ X es un punto de acumulación
de esta sucesión si dado cualquier abierto O de X conteniendo a x, infinitos
elementos de la sucesión también pertenecen a O.

Ejercicio: Encuentre un ejemplo de una sucesión en algún espacio topológico


con diferentes puntos límites.

22
Teorema 1.3 Sea A compacto. Luego toda sucesión en A tiene un punto de acu-
mulación.

Prueba: Supongamos –en contradicción con la afirmación del teorema– que


existe una sucesión {xn } sin ningún punto de acumulación. Es decir, dado
cualquier punto x de A existe un entorno O x conteniéndolo y un número
N x tal que si n > N x luego xn ∈
/ O x . Como esto es válido para cualquier x en
A, la colección de conjuntos {O x |x ∈ A} cubre A, pero A es compacto y por
lo tanto existirá una subcolección finita de éstos que también lo cubre. Sea N
el máximo entre los N x de esta colección finita. Pero entonces xn ∈ / A para
todo n > N lo que es absurdo.

Ejercicio: Pruebe que los conjuntos compactos en la línea real son los cerra-
dos y acotados.
Nos podemos hacer ahora la pregunta inversa: ¿Si A ⊂ X es tal que toda
sucesión tiene puntos de acumulación, es cierto entonces que A es compac-
to? Una respuesta afirmativa nos daría una caracterización alternativa de la
compacidad, y ésta es afirmativa para el caso de la línea real. En general la res-
puesta es negativa: hay topologías en las cuales toda sucesión en un conjunto
tiene puntos de acumulación en él, pero este no es compacto. Sin embargo to-
das las topologías que nosotros veremos son numerables de segunda especie
[Ver recuadro] y en éstas la respuesta es afirmativa.
En la línea real es cierto que si x ∈ lR es un punto de acumulación de
una sucesión {xn } entonces existe una subsucesión, {x̃n }, –es decir una res-
tricción del mapa definiendo la sucesión a un número infinito de números
naturales–, que tendrá a x como punto límite. Esto tampoco es cierto en la
generalidad de los espacios topológicos, pero sí lo es si consideramos solo
aquellos que son numerables de primera especie [Ver recuadro]. Todos los
espacios que veremos en este curso lo son.

23
*Numerabilidad de espacios topológicos.

Definición: Diremos que un espacio topológico {X , T } es numerable de pri-


mera especie si para cada p ∈ X existe una colección contable de abiertos
{On } tal que todo abierto conteniendo a p contiene también al menos uno de
estos On .

Definición: Diremos que un espacio topológico {X , T } es numerable de se-


gunda especie si hay una colección numerable de abiertos tal que cualquier
abierto de X puede ser expresado como una unión de conjuntos de esta co-
lección.

Ejemplo:
a) X con la topología indiscreta es numerable de primera especie.
b) X con la topología discreta es numerable de primera especie. Y de segunda
especie si y solo si sus elementos son numerables.

Ejercicio: Demostrar que la línea real es numerable de primera y segunda


especie. Ayuda: Para el primer caso use los abiertos On = ( p − n1 , p + n1 ) y
p p
para el segundo O pq n = ( q − n1 , q + n1 )

24
*Separabilidad de espacios topológicos.

Definición: Un espacio topológico X es Hausdorff si dados cualquier par de


puntos de X , x e y, luego existen entornos O x y Oy tales que O x ∩ Oy = ;.

Ejemplo:
a) X con la topología indiscreta es Hausdorff.
b) X con la topología discreta no es Hausdorff.

Ejercicio: Encontrar una topología tal que los enteros sean Hausdorff y com-
pactos.

Ejercicio: Pruebe que si un espacio es Hausdorff entonces si una sucesión


tiene un punto límite este es único.

Ejercicio: Sea X compacto, Y Hausdorff y φ : X → Y continuo. Pruebe


que las imágenes de conjuntos cerrados son cerradas. Encuentre un contra-
ejemplo si Y no es Hausdorff.

Notas bibliográficas: Este capítulo es esencialmente un condensado de los


capítulos 26,27,28,29 y 30 de [1], ver también [2], [6] y [21]. La topología es
una de las más apasionantes ramas de las matemáticas, ¡si profundiza quedará
atrapado! De particular interés en física en la noción de Homotopía un buen
lugar para entender estas ideas es el capítulo 34 de [1].

25
26
CAPÍTULO 2

ÁLGEBRA LINEAL

2.1. Espacios Vectoriales

Definición: Un Espacio Vectorial Real consiste de tres cosas – i ) Un con-


junto, V , cuyos elementos serán llamados vectores. i i ) Una regla que asigna
a cada par de vectores, v, u, un tercer vector que denotaremos por v + u y
que llamaremos su suma. i i i) Una regla que asigna a cada vector, v y a ca-
da número real a, un vector que denotaremos por av y que llamaremos el
producto de v con a. – sujetas a las siguientes condiciones:

1.a) Para cualquier par de vectores u, v ∈ V se cumple que,

u+v =v+u (2.1)

1.b) Existe en V un único elemento llamado cero y denotado por 0, tal que

0 + v = v ∀v ∈ V . (2.2)

1.c) Para cualquier vector u ∈ V existe un único vector en V , denotado


−u, tal que,
u + (−u) = 0 (2.3)

2.a) Para cualquier par de números reales a y a ′ y cualquier vector v se


cumple que,
a(a ′ v) = (aa ′ )v.

2.b) Para cualquier vector v se cumple que,

1v = v.

27
3.a) Para cualquier par de números reales a y a ′ y cualquier vector v se
cumple que,
(a + a ′ )v = av + a ′ v.

3.b) Para cualquier número real a y cualquier par de vectores v y v ′ se


cumple que,
a(v + v ′ ) = av + av ′ .

Las primeras son condiciones que involucran solo la regla de la suma. Las
siguientes solo involucran a la regla del producto, mientras que las dos últimas
tratan de la relación entre estas dos operaciones.

Ejemplo: El conjunto de todas las n–tuplas de números reales con las ope-
raciones usuales de suma y multiplicación tupla por tupla. Este espacio se
denomina lRn .

Ejemplo: Sea S cualquier conjunto y sea V el conjunto de todas las funcio-


nes de S en los reales, v : S → lR, con las siguientes operaciones de suma y
producto: La suma de la función v con la función v ′ es la función (elemento
de V ) que al elemento s de S le asigna el valor v(s) + v ′ (s). El producto de
a ∈ lR con la función v es la función que a s ∈ S le asigna el valor av(s). Este
ejemplo aparecerá muy a menudo en los capítulos siguientes.

Definición: diremos que un conjunto P i de vectores {v i } i = 1, . . . , n son li-


i
nealmente independientes si i a v i = 0 a ∈ lR, i = 1, . . . , n =⇒ a i = 0,
i = 1, . . . , n, es decir si cualquier combinación lineal no trivial de estos vecto-
res nos da un vector no trivial. Si un número finito de vectores linealmente
independientes, n, son suficientes para expandir V , [es decir si cualquier
vector en V puede ser obtenido como una combinación lineal de estos n vec-
tores], entonces diremos que estos forman una base de V y que la dimensión
de V es n, dimV = n.

Ejercicio: Muestre que la dimensión de V es única, es decir que no depende


de la base empleada para definirla.
Note que si en el ejemplo anterior S consta de un número finito de ele-
mentos, luego la dimensión de V es finita.1 En el caso de que S tuviese un
número infinito de elementos diríamos que la dimensión de V sería infinita.
1
Es decir un número finito de vectores linealmente independientes expanden V .

28
En lo que sigue de este capítulo solo consideraremos espacios vectoriales de
dimensión finita.

Problema 2.1 Sea S un conjunto finito, S = {s1, s2, . . . , sn }, encuentre una base
del espacio vectorial de todas las funciones de S en lR. Encuentre la dimensión de
este espacio.

2.1.1. Covectores y Tensores


Sea V un espacio vectorial de dimensión n. Asociado con este espacio
vectorial consideremos el conjunto, V ∗ = { el espacio de mapas lineales f :
V → lR}. Este es también un espacio vectorial, llamado el espacio dual a
V , o espacio de covectores, con suma y producto dados por: ( f + α g )(v) =
f (v)+α g (v) ∀ v ∈ V con f , g ∈ V ∗ , α ∈ lR. ¿Cuál es su dimensión? Note
que si {v i } i = 1, . . . , n es una base de V , es decir un conjunto linealmente
independiente de vectores que expanden V , podemos definir n elementos de
V ∗ (llamados co-vectores) por la relación

θ i (v j ) = δ ij . (2.4)

Es decir definimos la acción de θ i sobre los {v j } como en la ecuación de


arriba y luego extendemos su acción a cualquier elemento de V escribiendo a
este elemento en la base {v i } y usando el hecho que la acción debe ser lineal.
Se puede ver fácilmente que cualquier ρ ∈ V ∗ se puede obtener como
combinación lineal de los covectores {θ j }, j = 1, . . . , n y que estos son li-
nealmente independientes, por lo tanto forman una base y por lo tanto la
dimensión de V ∗ es también n.

Ejercicio: Vea que V ∗ es un espacio vectorial y que las {θ i } forman realmente


una base.
Como V y V ∗ tienen la misma dimensión son, como espacios vectoria-
les, la misma cosa, pero como no existe ningún mapa que los identifique los
tenemos que tomar como distintos.
¿Qué pasa si ahora tomamos el dual de V ∗ ? ¿Obtendremos así más copias
de V ? La respuesta es no, ya que existe una identificación natural entre V y
su doble dual V ∗∗ .
En efecto a cada v ∈ V le podemos asociar un elemento x v de V ∗∗ ,
es decir una funcional lineal de V ∗ en lR, de la siguiente forma: x v (ω) =
ω(v) ∀ ω ∈ V ∗ . Es decir el elemento x v de V ∗∗ asociado a v ∈ V es aquel

29
que al actuar sobre un covector cualquiera ω da el número ω(v). Note que
x v actúa linealmente en los elementos de V ∗ y por lo tanto es un elemento de
V ∗∗ . ¿Hay elementos de V ∗∗ que no provengan de algún vector en V ? La res-
puesta es no, ya que el mapa x v : V → V ∗∗ es inyectivo [x v (ω) = 0 ∀ ω =⇒
v = 0] y por lo tanto 2 dim x V = dimV . Por otro lado dimV ∗∗ = dimV ∗
ya que V ∗∗ es el dual de V ∗ y así dimV = dimV ∗ = dimV ∗∗ , lo que indica
que el mapa en cuestión es también suryectivo y por lo tanto invertible. Es-
to nos permite identificar V y V ∗∗ y concluir que dualizando no podremos
construir más espacios vectoriales interesantes.

Ejercicio: Vea que efectivamente dim x V = dimV .


Sin embargo nada nos impide considerar también mapas multilineales 3
de V
| × V {z × · · · × V} en lR, o más generalmente,
k veces


V · · × V} ×V
| × ·{z | × ·{z· · × V }∗ → lR.
k veces l veces

El conjunto de estos mapas (para cada par (k, l ) dado) es también un espacio
vectorial, –con las operaciones obvias– y sus elementos son llamados tensores
de tipo (k, l ) .

Ejercicio: ¿Cuál es la dimensión de estos espacios como función del par (k, l )?
Nota: En dimensión finita se puede demostrar que cualquier tensor de tipo
(k, l ) se puede escribir como combinación lineal de elementos del producto
cartesiano de k copias de V ∗ y l copias de V –donde hemos identificado a V
con V ∗∗ –. Por ejemplo si t es de tipo (0, 2), –o sea un mapa que tiene como
argumentos a dos covectores–, entonces dada una base {v i } de V habrá n × n
números reales t i j , i = 1, . . . , n tales que

X
n
t (σ, ω) = t i j v i (σ)v j (ω), ∀σ, ω ∈ V ∗ . (2.5)
i, j =1

Pero el producto de combinaciones lineales de productos cartesianos de k


copias de V ∗ y l copias de V es también un espacio vectorial, se lo llama
producto externo de k copias de V ∗ y l copias de V y se lo denota por
2
Denotando por x V la imagen por x (·) de V .
3
O sea mapas separadamente lineales en cada uno de sus argumentos.

30
∗ ∗
V
| ⊗ V {z ⊗ · · · ⊗ V }∗ ⊗V · · ⊗ V} .
| ⊗ ·{z
k veces l veces

Por lo tanto también se los puede considerar a los tensores como elementos
de estos productos externos.

Ejemplo: a) Sea t de tipo (2, 0), o sea t ∈ V ∗ ⊗V ∗ . Este es un mapa bilineal de


V ⊗V en lR, t (v, u) ∈ lR. Sea t simétrico [t (v, u) = t (u, v)] y no degenerado
[ t (v, ) = 0 ∈ V ∗ =⇒ v = 0]. Como t es no degenerado define un mapa
invertible entre V y su dual.

Ejemplo: b) Sea ǫ un elemento de (n, 0) tal que

v , . . . , |{z}
ǫ(. . . , |{z} v , . . .)
u , . . . , |{z}
u , . . .) = −ǫ(. . . , |{z} (2.6)
i j i j

cualquiera sea la casilla i y j , es decir un tensor totalmente antisimétrico.


Sea {u i } una base de V y ǫ123...n = ǫ(u 1, u 2, . . . , u n ), luego cualquier otra
componente de ǫ en esta base será o bien cero o ǫ123...n o −ǫ123...n de acuerdo
a que algún u i se repita o sea una permutación par de la de arriba o una impar.
Por lo tanto basta un número, ǫ123...n , para determinar el tensor ǫ y dado y
otro tensor ǫ̃ no idénticamente cero con las propiedades arriba mencionadas
luego existirá un número α tal que ǫ = αǫ̃.

Ejercicio: Sea ǫ no idénticamente cero y {u i } un conjunto de n = dimV


vectores de V . Muestre que estos forman una base si y solo si

ǫ(u1, . . . , un ) 6= 0. (2.7)

Ejemplo: c) Sea A un elemento de (1, 1),

u ∈ V , v ∗ ∈ V ∗ → A(u, v ∗ ) ∈ lR. (2.8)

Esto implica que A(u, ) es también un vector (identificando V con V ∗∗ ,


aquel que toma una forma ω ∈ V ∗ y da el número A(u, ω)). Tenemos así un
mapa lineal de V en V , o sea un operador lineal en V .

Ejercicio: Sea {u i } una base de V y sean a i los vectores A(ui , ), luego

ǫ(a1, . . . , an ) = ǫ(A(u1, ), . . . , A(un , ))

31
es totalmente antisimétrico en los {ui } y por lo tanto proporcional a sí mis-
mo;

ǫ(A(u1, ), . . . , A(un , )) ∝ ǫ(u1. . . . , un ).

La constante de proporcionalidad se llama determinante del operador A,


det(A).

Problema 2.2 Muestre que esta definición no depende del ǫ empleado ni de la


base y por lo tanto es realmente una función del espacio de operadores de V en
lR.

Ejercicio: Si A y B son dos operadores de V , luego A · B(v) ≡ A(B(v)).


Muestre que det(AB) = det(A) · det(B).

2.1.2. Complexificación
Otra manera de obtener campos vectoriales a partir de uno dado, diga-
mos V , es extendiendo el campo donde está definida la operación de multi-
plicación, si esto es posible. El caso más común es la complexificación de un
espacio vectorial real en ese caso simplemente se extiende el producto a los
números complejos resultando un campo vectorial de la misma dimensión.
Una manera de obtenerlo, por ejemplo es tomando un conjunto de vectores
linealmente independientes del espacio inicial, es decir una base, y conside-
rando todas las combinaciones lineales con coeficientes complejos arbitrarios.
El espacio así obtenido se denota por V C . Si las componentes de los vectores
en V en la base original eran n-tuplas de números reales, ahora son n-tuplas
de números complejos. Como la base es la misma, la dimensión también es
la misma. Estas extensiones de espacios vectoriales aparecen a menudo y más
adelante veremos otras.

Ejemplo: Considere el espacio vectorial Q n consistente de todas las n-tuplas


de números racionales. En este espacio el campo es también el conjunto de
los racionales. Si extendemos el campo a los reales obtenemos lRn .

2.1.3. Espacios cociente


La última forma que veremos de obtener espacios vectoriales a partir de
otros espacios vectoriales es la de tomar cocientes. Sea V un espacio vectorial
y sea W ⊂ V un subespacio del mismo. Llamaremos espacio cociente al

32
conjunto de clases equivalentes en V , donde diremos que dos vectores de V
son equivalentes si su diferencia es un vector en W . Este espacio se denota
como V /W .

Ejercicio: Probar que esta es una relación de equivalencia.

Veamos que este es un espacio vectorial. Los elementos de V /W son cla-


ses equivalentes, las cuales denotamos como {v}, dos elementos de V , v y
v ′ pertenecen a la misma clase equivalente si v − v ′ ∈ W . Sean ζ y ζ ′ dos
elementos de V /W , es decir dos clases equivalentes de elementos de V . De-
finiremos las operaciones propias en los espacios vectoriales de la siguiente
forma: ζ + αζ ′ será la clase equivalente correspondiente un elemento ṽ ob-
tenido tomando un elemento de V en ζ , digamos v, otro de ζ ′ , digamos v ′ ,
y definiendo ṽ = v + αv ′ , tenemos {ṽ} = ζ + αζ ′ .

Ejercicio: Vea que esta definición no depende de la elección de elementos


en la clase equivalente tomados para hacer la operación. Es decir, considere
otros dos elementos en ζ y ζ ′ , digamos v̂ y v̂ ′ y vea que con ellos obtiene un
elemento en la misma clase que ṽ = v + αv ′ .

Ejemplo: Sea V = lR2, es decir el espacio de 2-tuplas de números reales. Sea


v un elemento cualquiera. Este elemento genera el espacio unidimensional
Wv que consiste en todos los vectores de la forma αv, para α ∈ lR. El espacio
cociente V /Wv es el espacio compuesto por las líneas paralelas a v. Es decir,
cada línea es un elemento del espacio cociente y entre ellas existe una noción
de suma y multiplicación por un escalar.

2.2. Normas

Definición: Una norma en un espacio vectorial V es un mapa kxk : V → lR+ ,


satisfaciendo para todo x, y ∈ V , α ∈ lR ,
i) kxk ≥ 0 (= ↔ x = 0)
i i ) kαxk = |α| kxk
i i i) kx + yk ≤ kxk + kyk

Ejemplos: En lR2 :

33
2v Wv ′
v

v′
Wv

Figura 2.1: Interpretación geométrica del espacio cociente.

a) k(x, y)k := ma x{|x|, |y|};


Æ
b) k(x, y)k2 := x 2 + y 2, norma Euclídea;
c) k(x, y)k1 := |x| + |y|;
1
d) k(x, y)k p := (|x| p + |y| p ) p p ≥ 1;
e) En V cualquiera sea t un tensor simétrico positivo definido de tipo (0,2),
es decir t (u, v) = t (v, u), t (u, u) ≥ 0 (= ↔ u = 0). La función kuk t =
p
t (u, u) es una norma. Cada tensor de este tipo genera una norma, pero
hay muchas normas que no provienen de ningún tensor de este tipo. Dé un
ejemplo.

Ejercicio: Pruebe que |t (u, v)|2 ≤ ||u|| t ||v|| t . Ayuda: Considere el polino-
mio: P (λ) := t (u + λv, u + λv).

Ejercicio: Pruebe que los ejemplos dados son en realidad normas. Grafique
las curvas de nivel de las cuatro primeras normas, es decir los conjuntos Sa =
{(x, y) ∈ lR2 / k(x, y)k = a} y las “bolas de radio a", es decir Ba = {(x, y) ∈
lR2/k(x, y)k ≤ a}.

Ejercicio: Pruebe que el mapa d : V × V → lR+ dado por d (x, y) = kx − yk


es una métrica.

¿Qué es, geométricamente una norma? Dado un vector x 6= 0 de V y

34
un número positivo cualquiera, a, existe un único número α > 0 tal que
kαxk = a. Esto indica que las superficies de nivel de la norma, es decir las
hiper-superficies Sa = {x ∈ V /kxk = a}, a > 0 forman una familia suave de
capas una dentro de la otra y cada una de ellas divide a V en tres conjuntos
disjuntos, el interior4 de Sa –conteniendo el elemento x = 0– , Sa y el exterior
de Sa . El interior de Sa es un conjunto convexo, es decir si x e y pertenecen
al interior de Sa luego αx + (1 − α)y, α ∈ [0, 1] también pertenece [ya que
kαx + (1 − α)yk ≤ αkxk + (1 − α)kyk ≤ αa + (1 − α)a = a]. Una curva
de nivel caracteriza completamente una norma en el sentido que si damos
un subconjunto N de V , tal que N tiene la propiedad radial, es decir dado
x 6= 0 existe α > 0 tal que α x ∈ N , y su interior es convexo, luego existe una
única norma tal que N es la superficie de nivel S1. Esta norma se define de la
siguiente forma: dado x habrá un α > 0 tal que αx ∈ N y entonces la norma
de x será kxk = α1 .

Ejercicio: Pruebe que esta es una norma.

De esta imagen se ve que dadas dos normas de un espacio vectorial de


dimensión finita y una superficie de nivel de una, habrá superficies de nivel
de la otra que tendrán la primera en su interior o en su exterior. En las normas
a) y b) del ejemplo anterior vemos que dado un cuadrado conteniendo al cero,
habrá dos círculos conteniendo al cero, uno conteniendo el cuadrado y otro
contenido por éste. Esto nos lleva al siguiente Teorema.

Teorema 2.1 Sea V un espacio vectorial de dimensión finita. Luego todas sus
normas son equivalentes entre sí, en el sentido que dadas k · k y k · k′ existen
constantes positivas M1 y M2 tal que para todo x ∈ V se cumple M1 kxk ≤
kxk′ ≤ M2kxk.

P
Prueba: Mostraremos que todas son equivalentes a la norma kxk1 = ni=m |a i |,
donde los a i son las componentes de x, con respecto a una base {e i } que su-
pondremos dada, x = a i ei . Sea y = b i ei y k · k otra norma cualquiera, luego

| kxk − kyk | ≤ kx − yk = k(a i − b i ) ei k


P
≤ |a i − b i | kei k ≤ (ma xi=1,n kei k) ni=n |a i − b i | (2.9)
= (ma xi=1,n kei k) kx − yk1
4
No confundir con el interior de un conjunto que definimos en el capítulo anterior, que
en este caso sería Sa .

35
Esto demuestra que la norma k · k es una función continua con respecto a
la norma k·k1. Sea S1 la superficie de nivel de radio 1 con respecto a la métrica
k · k1. S1 es un conjunto cerrado y acotado y por lo tanto compacto5. Por lo
tanto, por continuidad, k · k tiene un valor máximo, M2, y un mínimo, M1,
que dan la desigualdad buscada.
Notas:
i) En esta prueba es crucial el hecho de que S1 es compacto. Si V es de dimen-
sión infinita esto no es así y hay muchas normas no equivalentes.
i i ) Para nuestros propósitos cualquier norma es suficiente –ya que si por
ejemplo, f : V → lR es diferenciable con respecto a una norma lo es tam-
bién con respecto a cualquier otra equivalente a ésta– y por simplicidad de
ahora en más usaremos la Euclídea.
i i i) En este sentido las normas de espacios vectoriales son equivalentes a la
generada por cualquier elemento simétrico-positivo del producto exterior de
su dual consigo mismo.
i v) Como normas equivalentes generan una misma topología, vemos que en
los espacios vectoriales de dimensión finita existe una única topología asocia-
da con todas sus posibles normas. Esta usualmente se denomina la topología
fuerte .

2.2.1. Las normas inducidas en V ⋆


Las normas definidas en V inducen naturalmente normas en su dual, V ⋆ .
Esta viene dada por:

kωk := ma xkv k=1{|ω(v)|}. (2.10)

Ejercicio: Vea que esta es una norma y que |ω(v)| ≤ kωkkvk.

2.3. Teoría de Operadores Lineales

Un operador lineal A de un espacio vectorial V es un mapa continuo6


de V en V tal que ∀ x, y ∈ V , α ∈ lR, A(αx + y) = α A(x) + A(y) , es decir
un tensor de tipo (1,1).
El conjunto de los operadores lineales L es un álgebra, es decir un espacio
vectorial con producto. En efecto, si A, B ∈ L , α ∈ lR, luego A + αB ∈ L
5
Con respecto a la topología generada por k · k1 .
6
Con respecto a la topología inducida por cualquiera de las normas equivalentes de V .

36
y además A · B (el operador que a x ∈ V lo envía a A(B(x)) ∈ V ) también
pertenece a L . Debido a esta propiedad podemos además definir funciones
no lineales de L en lR y mapas de L en L . Para estudiar la continuidad
y diferenciabilidad de estos mapas introduciremos una norma en L , la más
conveniente es la siguiente norma inducida de la usada en V ,

kAkL = maxk x kV =1kA(x)kV . (2.11)

Si V es de dimensión finita (lo que asumiremos de ahora en más), el espacio


vectorial L es también de dimensión finita y por lo tanto todas sus normas
son equivalentes. El hecho que la norma de A sea finita usa nuevamente que
A : V → V es continua y que {x ∈ V /kxkV = 1} es compacto, en el caso
de dimensión infinita ninguna de estas cosas es necesariamente cierta y den-
tro de L tenemos solo un subespacio de operadores lineales de norma finita
(acotados).

Ejercicio: Muestre que k kL : L → lR+ es una norma.

Ejercicio: Muestre que


kA(v)k ≤ kAkL kvk.

Ejercicio: Usando el resultado del ejercicio anterior muestre que

kABkL ≤ kAkL kBkL .

Estudiamos a continuación varias funciones en el espacio de operadores.

El determinante de un operador, introducido en la sección anterior es un


polinomio de grado n = dimV en A y por lo tanto diferenciable. Usando la
regla de la cadena se ve que d e t (I + ǫA) es diferenciable en ǫ, y de hecho un
polinomio de grado n en ǫ. Cada uno de los coeficientes de este polinomio es
una función de A. De importancia en lo que sigue es el coeficiente lineal en A
que se obtiene usando la fórmula

d ǫ(A(u1), u2, . . . , un ) + · · · + ǫ(u1, . . . ,A(un ))


d e t (I + ǫA)|ǫ=0 = (2.12)
dǫ ǫ(u1, . . . , un )

37
esta función se llama la traza de A y se denota t r (A).
Entre los mapas de L en L consideremos el mapa exponencial, definido
como,
∞ Ai
X A2
eA = = I +A+ + ··· (2.13)
i =0 i! 2

Teorema 2.2 e A ∈ L si A ∈ L y e t A es infinitamente diferenciable con res-


pecto a t .

n Ai
X
Prueba: Considere la sucesión de Cauchy {enA}, donde enA ≡ . Esta
i=0 i!
sucesión es de Cauchy ya que, tomando m > n, tenemos

Am−1 Am−2 An+1


ke A − e Ak L = k + + ... + k
m n
(m − 1)! (m − 2)! (n + 1)! L
Am−1 Am−2 An+1
≤ k k +k k + ... + k k
(m − 1)! L (m − 2)! L (n + 1)! L
kAk m−1 kAk m−2 kAkn+1
≤ L + L + ... + L
(m − 1)! (m − 2)! (n + 1)!
kAk kAk
= |e m L − en L | → 0. (2.14)

kAk n kAi k
X
Donde em L ≡ L y la última implicación sigue del hecho que
i=0 i!
kAk
la serie numérica e L converge. Pero por completitud 7 de L toda su-
cesión de Cauchy converge a algún elemento de L que llamaremos e A. La
P
diferenciabilidad de e t A sigue del hecho de que si una serie ∞ f (t ) es con-
i =0 i
P d fi d P∞
vergente y ∞ i=0
es uniformemente convergente, luego dt i=0 i
f (t ) =
P∞ d d t
f (t ) ♠
i=0 d t i

Ejercicio: Muestre que


7
Todo espacio vectorial real de dimensión finita es completo.

38
a) e (t +s)A = e t A · e s A,
b) Si A y B conmutan, es decir si AB = BA, luego e A+B = e A e B .
c) d e t (e A) = e t r (A)
d
d) e t A = Ae t A.
dt
Ayuda: Para el punto c) use que e A se puede definir también como,

A
e A = lı́m (I + )m .
m→∞ m

2.3.1. Representación Matricial

Para describir ciertos aspectos de los operadores lineales es conveniente


introducir la siguiente representación matricial.
Sea {u i }, i = 1, . . . , n una base
Pde V , es decir un conjunto de vectores li-
n
nealmente independientes de V [ i=1 c i u i = 0 =⇒ c i = 0] que lo expanden
P
[si v ∈ V , existen números {v i }, i = 1, . . . , n tal que v = ni=1 v i u i )]. Apli-
cando el operador A a un miembro de la base u i obtenemos Pn un vector A(u i )
que a su vez puede ser expandido en la base, A(u i ) = j =1 A j i u j . La matriz
así construida, A j i , es una representación del operador A en esa base. En este
lenguaje vemos que la matriz A j i transforma el vector de componentes {v i }
en el vector de componentes {A j i v i }. Dada una base, {u i }, y una matriz A j i
podemos construir un operador lineal de la siguiente forma: Dada la base de-
∗ i
finimos su co-base, es decirPn una base en V como {θ }, i = 1, . . . , n, tal que
i i j i
θ (u j ) = δ j , luego A = i, j =1 A i u j θ .
Si cambiamos de base las matrices representando los operadores cambia-
rán. En efecto, si tomamos otra base {û i } y escribimos sus componentes con
respecto a la base anterior como û i = P k i u k , y por lo tanto, θ̂ j = (P −1) j l θ l ,
entonces la relación entre las componentes del operador A en ambas bases
está dado por

 j i = A(θ̂ j , û i ) = (P −1) j l Al k P k i o  = P −1 AP (2.15)

es decir que  y A son matrices semejantes.

Pn
Ejercicio: Ver, a partir de su definición (ecuación (2.12)), que t r A = i=1
Ai i .

39
2.3.2. Subespacios Invariantes

Definición: Sea A : V → V un operador y sea W un subespacio de V . Dire-


mos que W es un subespacio invariante de A si AW ⊆ W .
Los subespacios invariantes de un operador son importantes pues nos per-
miten entender cual es su acción. Note que dado cualquier operador A siem-
pre existen al menos dos espacios invariantes, V y {0} y en realidad muchos
más. Por ejemplo, y como veremos más adelante, dado cualquier número en-
tre 1 y n (=dimV ) existe un subespacio invariante con ese número como
dimensión. Los que verdaderamente codifican la acción del operador son sus
subespacios invariantes irreducibles, es decir aquellos que no pueden ser a su
vez descompuestos en subespacios invariantes.

Ejercicio: Sea el V el espacio de pares de números, es decir con elementos de


la forma v = (a, b ), a, b ∈ lR y sea A dado por A(a, b ) = (b , 0). Encuentre sus
subespacios invariantes irreducibles.
Estudiaremos en detalle los subespacios invariantes de dimensión 1, note
que los mismos son irreducibles. Para estudiar los espacios invariantes resul-
ta conveniente estudiar los subespacios invariantes del operador cuando su
acción se extiende a V C , es decir la complexificación de V .
Veamos a continuación que un operador siempre tiene al menos un subes-
pacio invariante de dimensión 1 (y por lo tanto que siempre tiene un subes-
pacio invariante irreducible no trivial).

Lema 2.1 Dado A : V C → V C , siempre existe un u ∈ V C y un λ ∈ C tal que,

(A − λI )u = 0 (2.16)

Prueba:
Una solución de esta ecuación consiste así de un escalar λ, llamado au-
tovalor del operador A y de un vector u, llamado autovector del operador
A. El subespacio de V C dado por {αu | α ∈ C } es el subespacio invariante
buscado.
Es claro que el sistema tiene solución si y solo si det(A − λI ) = 0. Pero
este es un polinomio en λ de orden igual a la dimensión de V y por lo tanto,
por el Teorema Fundamental del álgebra tiene al menos una solución o raíz,
(en general complejas), λ1, y por lo tanto habrá, asociada a ella, al menos un
u 1 solución de (2.16) con λ = λ1 ♠

40
La necesidad de considerar todas estas soluciones es lo que nos lleva a
tratar el problema para espacios vectoriales complejos.

Aplicación: Lema de triangulación de Schur

Definición: Una matriz n × n A j i tiene forma triangular superior si A j i =


0 ∀ j > i, j , i = 1, . . . , n. Es decir es una matriz de la forma,
 1 
A 1 A12 · · · · · · A1 n
 
 0 A22 · · · · · · A2 n 
 
 .. ..
A=  0 0 . . An 3
. (2.17)
 . .. .. .. .. 
 . . . .
 . . 
n
0 ··· ··· 0 A n
Como veremos más adelante, en el capítulo 5, esta es una forma muy con-
veniente para poder entender cómo son las soluciones a sistemas de ecuacio-
nes diferenciales ordinarias. Y lo más atractivo de la misma es que cualquier
operador tiene una representación matricial con forma diagonal superior! Es
más, si un producto escalar está presente, la base para esta representación pue-
de ser elegida en forma orto-normal.

Lema 2.2 (Schur) Sea A : V → V un operador lineal actuando en un espacio


vectorial complejo V de dimensión finita, n y sea (·, ·) un producto escalar en V .
Luego, existe una base orto-normal {u i }, i = 1, . . . , n con respecto a la cual la
representación matricial de A es triangular superior.

Prueba: Consideremos el problema de autovalores-autovectores para A,

(A − λI )u = 0. (2.18)

Como ya vimos este problema siempre tiene al menos una solución no trivial
y por lo tanto tenemos un par (λ1, u 1) solución del problema. Tomamos u 1
de norma unidad y como primer elemento de la base a determinar. Tenemos
entonces A j 1 = θ j (A(u 1)) = θ j (λ1 u 1) = λ1δ j 1.
Consideremos ahora el espacio

Vn−1 = {u ⊥
1
} := {u ∈ V |(u 1, u) = 0}

y el operador de Vn−1 → Vn−1 dado por (I − u 1θ1)A. Note que como forma-
remos una base orto-normal conocemos ya el primer miembro de la co-base,

41
θ1 = (u 1, ·). Para este operador, en este espacio, podemos plantear también la
ecuación de autovalores-autovectores,
((I − u 1θ1)A − λI )u = 0. (2.19)
Obtenemos así un nuevo par (λ2, u 2), con u 2 perpendicular a u 1 y ade-
más, Au 2 = λ2 u 2 + u 1θ1(A(u 2)). Por lo tanto

A j 2 = θ j (A(u 2)) = θ j (λ2 u 2 + u 1θ1(A(u 2))) = λ2δ j 2 + δ j 1A12.


El próximo paso es considerar ahora el subespacio Vn−2 = {u ⊥ 1
} ∪ {u ⊥
2
} :=
{u ∈ V |(u 1, u) = (u 2, u) = 0} y allí la ecuación de autovalores-autovectores
para el operador (I − u 1θ1 − u 2θ2)A. Prosiguiendo de esta forma generamos
toda la base ♠

Problema 2.3 : Pruebe el teorema anterior usando ahora la noción de espacio


cociente y prescindiendo así del producto escalar. Ayuda: en vez de usar los es-
pacios perpendiculares a los autovectores que vaya obteniendo, use los espacios
cociente por estos autovectores. Vea que un operador lineal induce una acción
natural en un espacio cociente.

Continuamos ahora con el estudio de los subespacios invariantes. Si det(A−


λI ) tiene 1 ≤ m ≤ n raíces distintas, {λi }, i = 1, . . . , m habrá entonces al me-
nos un autovector complejo u i asociado a cada una de ellas. Veamos que estos
conforman subespacios invariantes distintos.

Lema 2.3 Sea {(λi , u i )} i = 1. . . m un conjunto de pares de autovalores au-


tovectores. Si λi 6= λ j ∀ i 6= j , i , j = 1. . . m entonces estos autovectores son
linealmente independientes.

Prueba: Supongamos por contradicción que no y por lo tanto que existen


constantes c i ∈ C, i = 1, . . . , m − 1, tales que
X
m−1
um = ci ui (2.20)
i=1

Aplicando A en ambos lados obtenemos


X
m−1
Au m = λ m u m = c i λi u i (2.21)
i=1

42
o sea,
X
m−1
0= c i (λ m − λi ) u i . (2.22)
i=1

Concluimos así que {u i } i = 1, . . . , m − 1 son linealmente dependientes. De-


bido a 2.20 y a la hipótesis que los autovalores son distintos, al menos uno de
los coeficientes tiene que ser distinto de cero y por lo tanto podemos despejar
uno de los restantes autovectores en función de función otros m−2. Repitien-
do este procedimiento (m − 1) veces llegamos a que necesariamente u 1 = 0 lo
que es una contradicción ya que, como hemos visto, la ecuación de autovec-
tores siempre tiene una solución no-trivial para cada autovalor distinto ♠

Si por cada autovalor existe más de un autovector entonces éstos forman


un subespacio vectorial invariante de mayor dimensión (reducible). Dentro
de cada uno de estos subespacios podemos tomar una base compuesta por
autovectores. El lema anterior nos asegurará entonces que todos estos auto-
vectores así elegidos, para todos los autovalores, forman un gran conjunto
linealmente independiente.

Ejercicio: Convénzase de que el conjunto de autovectores con un mismo au-


tovalor forman un subespacio vectorial.
Si un dado operador A tiene todos sus autovalores distintos entonces te-
nemos que los correspondientes autovectores son linealmente independientes
e igualan en número a la dimensión de V , es decir generan una base de V C .
En esa base la representación matricial de A es diagonal, es decir A j i = δ j i λi .
Cada uno de sus autovectores genera un subespacio invariante irreducible y
en su conjunto generan V C . En cada uno de ellos el operador A actúa mera-
mente por multiplicación por λi . Note que los λi son en general complejos
y por lo tanto tal multiplicación es en realidad una rotación más una dilata-
ción. Note, que a diferencia con la base del Lema de triangulación de Schur,
ésta no es en general ortogonal con respecto a algún producto escalar dado de
antemano. 8

Ejemplo: Sea V el conjunto de 2-tuplas de números reales con elemento gené-


rico (a, b ) y sea A dado por A(a, b ) = (b , −a). Esta es una rotación de −π/2
en el plano. Tomando una base, e 1 = (1, 0), e 2 = (0, 1) vemos que
8
NotePsin embargo que se puede declarar ortogonal definiendo como producto escalar
(u, v) = ni=1 θ i (ū)θ i (v)

43
det(A − λI ) = ǫ((A − λI )e 1, (A − λI )e 2)/ǫ(e 1, e 2)
= ǫ(−e 2 − λe 1, e 1 − λe 2)/ǫ(e 1, e 2)
= 1 + λ2 . (2.23)

y por lo tanto los autovalores son λ1 = ı, 1 λ2 = −ı. Los autovectores son


u 1 = (1, −ı) y u 2 = (1, ı) = ū 1. Vemos entonces que la acción de A en estos
subespacios es multiplicación por ±ı y que ambos subespacios invariantes
son genuinamente complejos. En esta nueva base el espacio V es generado
por todas las combinaciones lineales de la forma z u 1 + z̄ u 2 y la acción de A
es simplemente multiplicación por −ı de z.

Si la multiplicidad de alguna de las raíces det(A − λI ) = 0 es mayor que


uno habrá menos autovalores que la dimensión del espacio y por tanto no ten-
dremos garantía de que habrá suficientes autovectores como para formar una
base, ya que solo podemos garantizar la existencia de uno por cada autovalor.
Debemos analizar por lo tanto qué pasa en estos casos. Para ello definamos,
dado λi un autovalor de A, los siguientes subespacios:

Wλi p = {u ∈ V | (A − λi I ) p u = 0} (2.24)

Note que estos son espacios invariantes: AWλi p ⊂ Wλi p . Además Wλi p ⊂
Wλi p+1 y por lo tanto, para un p suficientemente grande ( p ≤ n) tendremos
que Wλi p = Wλi p+1 tomando el mínimo entre los p’s donde esto ocurre
definimos Wλi := Wλi p . Note que si para algún λi , p = 1 entonces el subes-
pacio Wλi está compuesto por autovectores. Estos son los máximos espacios
invariantes asociados con el autovalor λi , en efecto tenemos:

Lema 2.4 El único autovalor de A en Wλi es λi .

Prueba: Sea λ un autovalor de A en Wλi . Veamos que λ = λi . Como ya hemos


visto habrá entonces un autovector ζ ∈ Wλi con λ como autovalor. Como
esta en Wλi habrá algún p ≥ 1 tal que (A − λi I ) p ζ = 0 pero como es un
autovector tenemos que (λ − λi ) p ζ = 0, y por lo tanto que λ = λi ♠
Veamos ahora que estos subespacios son linealmente independientes y
generan todo V C . Probaremos nuevamente este teorema en el Capítulo 5.

44
Teorema 2.3 (Ver capítulo 5, Teorema 5.3) Dado un operador A : V → V ,
con autovectores {λi }, i = 1...m el espacio V C admite una descomposición di-
recta en subespacios invariantes Wλi , donde en cada uno de ellos A tiene solo a
λi como autovalor.

Prueba:
Los Wλi son independientes. Sea v 1 + . . . + v s = 0, con v i ∈ Wλi , luego
debemos probar que cada v i = 0. Aplicando (A − λ2 I ) p2 . . . (A − λ s I ) ps a la
suma anterior obtenemos, (A − λ2 I ) p2 . . . (A − λ s I ) ps v 1 = 0, pero como λi ,
i 6= 1 no es un autovalor de A en Wλ1 el operador (A − λ2 I ) p2 . . . (A − λ s I ) ps
es invertible 9 es ese subespacio y por lo tanto v 1 = 0. Continuando de esa
forma vemos que todos los v i se deben anular.
Los Wλi generan todo V C . Supongamos por contradicción que este no es
el caso, y consideremos V C /W , donde W es el espacio generado por todos
los Wλi , es decir el espacio de todas las combinaciones lineales de elementos
en los Wλi . El operador A actúa en V C /W [A{u} = {Au}] y por lo tanto
tiene allí un par autovalor-autovector. Esto implica, que para algún elemento
ζ de V C en alguna clase equivalente de V C /W se cumple:

Aζ = λζ + u 1 + . . . + u s (2.25)

donde los u i pertenecen a cada Wλi . Supongamos ahora que λ 6= λi ∀ i =


1..s, luego A − λI es invertible en cada Wλi y por lo tanto existen vectores
ζ i = (A−λI )−1 u i ∈ Wλi . Pero entonces ζ̃ := ζ −ζ 1 −. . .−ζ s es un autovalor
de A! Esto es imposible pues λ no es una raíz del polinomio característico
ni ζ̃ = 0, pues al pertenecer ζ a V C /W no es una combinación lineal de
elementos en los Wλi . Tenemos así una contradicción. Supongamos ahora
que λ = λ j para algún j ∈ {1..s}. Todavía podemos definir los vectores ζ i =
(A − λ j I )−1 u i para todo i 6= j y ζ̃ , donde solo sustraemos a ζ todos los ζ i
con i 6= j , por lo tanto tenemos que

(A − λ j I )ζ̃ = u i (2.26)

Pero aplicando (A − λ j I ) p j a esta ecuación, con p j el mínimo valor para el


cual Wλ j p j = Wλ j p j +1 obtenemos que ζ̃ ∈ Wλ j y así otra contradicción, por
9
Note que (A− λi I ) s |Wλ es invertible si su determinante es distinto de cero. Pero det(A−
j
s s s dim(Wλ )
λi I ) = (det(A − λi I )) = (λ j − λi ) j 6= 0

45
lo tanto solo puede ser que V C /W sea el espacio trivial y los Wλi generan
todo V C ♠
Vemos así que solo necesitamos estudiar ahora cada uno de estos subes-
pacios Wλi para encontrar todas sus partes irreducibles (de ahora en más su-
primiremos el subíndice i). Pero en estos subespacios el operador A actúa en
forma muy sencilla!
En efecto, sea ∆λ : Wλ → Wλ definido por ∆λ := A|Wλ − λI |Wλ , luego ∆
tiene solo al 0 como autovalor y por lo tanto es nilpotente , es decir, existe
un entero m ≤ n tal que ∆λm = 0.

Lema 2.5 Sea ∆ : W → W tal que su único autovalor es 0, luego ∆ es nilpoten-


te.

Prueba: Sea W p := ∆ p W , luego tenemos que W p ⊆ W q si p ≥ q. Como la


dimensión de W es finita deberá suceder que para algún p entero tendremos
que W p = W p+1 vemos entonces que ∆ p actúa inyectivamente en W p y
por lo tanto no puede tener al 0 como autovalor. Pero hemos visto que todo
operador tiene algún autovalor y por lo tanto tenemos una contradicción a
menos que W p = {0}. Es decir ∆ p = 0 ♠
Los operadores nilpotentes tienen la importante propiedad de generar
una base del espacio en que actúan a partir de su aplicación repetidas veces
sobre conjunto menor de vectores linealmente independiente.

Lema 2.6 Sea ∆ : W → W nilpotente, luego existe una base de W constituida


por elementos de la forma:

{{v 1, ∆v 1, . . . , ∆ p1 v 1}, . . . , {{v d , ∆v d , . . . , ∆ pd v d }}

donde pi es tal que ∆ pi +1 v i = 0

P
Note que si n = dimW luego n = di=1 pi . Cada uno de estos conjuntos
formados por repetidas aplicaciones de un operador se llama un ciclo . En
este caso la base está formada por los elementos de d ciclos. Note que no
necesariamente los ciclos son entes únicos, en efecto, si tenemos dos ciclos
con el mismo número de elementos, entonces cualquier combinación lineal
de los mismos será también un ciclo. Note que cada ciclo contiene un solo
autovector.

46
Prueba: Lo probaremos por inducción en la dimensión de W . Si n = 1 toma-
mos cualquier vector para generar la base, ya que en este caso ∆ = 0. Supo-
nemos ahora que es cierto para toda dimensión menor que n. En particular,
como ∆ tiene un autovalor nulo dim(ker ∆) ≥ 1 y por lo tanto tenemos que
W ′ (= ∆(W )) tiene dimensión menor que n, digamos n ′ y por la hipótesis
inductiva una base de la forma
′ p′ ′
{{v ′1, ∆v ′1, . . . , ∆ p1 v ′1}, . . . , {{v ′d ′ , ∆v ′d ′ , . . . , ∆ d v ′d ′ }}.

Para formar una base de W agregaremos a estos vectores d ′ vectores v i tales


que ∆v i = v ′i , i = 1, . . . , d ′ . Esto siempre se puede hacer pues v ′i ∈ W ′ =
∆W . Vemos así que hemos incrementado el conjunto de vectores a
′ p ′ ′ +1
{{v 1, ∆v 1, . . . , ∆ p1+1 v 1}, . . . , {{v d ′ , ∆v d ′ , . . . , ∆ d v d ′ }},
P ′
es decir tenemos ahora r = di =1( pi′ + 1) = n ′ + d ′ vectores. Para obtener
una base debemos entonces incrementar este conjunto con n − n ′ − d ′ vecto-
res. Note que este número es no-negativo, en efecto, n − n ′ = dim(ker ∆) ≥
dim(ker ∆∩W ′ ) = d ′ y es precisamente la dimensión del subespacio de ker ∆
que no está en W ′ . Completamos entonces la base propuesta para W incor-
porando al conjunto ya obtenido n − n ′ − d ′ vectores {z i }, i = 1, ..n − n ′ − d ′
del espacio nulo de ∆ que sean linealmente independientes entre sí y con los
otros elementos de ker ∆ en W y que además no estén en W ′ . Hemos obte-
nido así un conjunto de d = d ′ + n − n ′ − d ′ = n − n ′ ciclos. Veamos que
el conjunto así obtenido es una base. Como son n en número solo tenemos
que ver que son linealmente independientes. Debemos entonces probar que
si tenemos constantes {Ci, j }, i = 1..d , j = 0.. pi′ + 1 tales que


d pX
X i
+1
0= C i j ∆ pi v i (2.27)
i=1 j =0

entonces Ci j = 0. Aplicando ∆ a esta relación obtenemos,


d pX
X i
+1
0 = ∆ C i j ∆ pi v i
i=1 j =0
pi ′
X
d′ X

= Ci j ∆ pi v ′i , (2.28)
i=1 j =0

47

donde hemos usado que ∆ pi +1 v ′i = 0. Pero esta es la relación de ortogonali-
dad de la base de W ′ y por lo tanto concluimos que Ci j = 0 ∀i ≤ d ′ , j ≤ pi′ .
La relación inicial queda entonces reducida a

X
d

0 = Ci p ′ +1∆ pi +1 v i
i
i=1
X
d′ X
d
pi′
= Ci p ′ ∆ v ′i + Ci1 z i , (2.29)
i
i=1 i=d ′ +1

pero los miembros de la primera sumatoria son parte de la base de W ′ y por lo


tanto linealmente independientes entre sí, mientras que los de la segunda son
un conjunto de elementos fuera de W ′ elegidos de forma que sean linealmente
independientes entre sí y con los de la primera sumatoria, y por lo tanto
concluimos que todos los Ci j se anulan ♠

Prueba alternativa: Alternativamente el lema anterior se puede probar


en forma constructiva. En efecto, si m +1 es la potencia para la cual ∆ se anu-
la, podemos tomar el espacio W m = ∆ m (W ) y una base {v im }, del mismo.
Luego considerar el espacio W m−1 = ∆ m−1(W ). Como W m = ∆(W ) m−1
por cada vector v im de la base {v im } de W m habrá un vector v im−1 tal que
∆v im−1 = v im . Como W m ⊂ W m−1 el conjunto {v im } ∪ {v im−1} está con-
tenido en W m−1. Note que dimW m = dim ker ∆ ∩ W m , y dimW m−1 −
dimW m = dim(ker ∆ ∩ W m−1) Por lo tanto,
dimW m−1 = dimW m + dim(ker ∆ ∩ W m−1)
= 2dimW m + dim(ker ∆ ∩ W m−1) − dimW m
= 2dimW m + dim(ker ∆ ∩ W m−1) − dim ker ∆ ∩ W m
(2.30)

Agregando entonces al conjunto anterior un conjunto {z i } de dim(ker ∆ ∩


W m−1) − dim(ker ∆ ∩ W m ) vectores del espacio nulo de ∆ en W n−1, tales que
sean linealmente independientes entre sí y con los elementos de la base de
W m , obtenemos un conjunto de dimW m−1 vectores. Note que la mencio-
nada elección de los elementos {z i } se puede hacer pues es meramente una
extensión de la base {v im } de W m a una base de ker ∆ ∩ W m−1. Probemos
ahora que son linealmente independientes y por lo tanto que forman una base
de W m−1. Para ello habrá que probar que si
X X X
0= Cim v im + Cim−1 v im−1 + C jz z j (2.31)
i i j

48
entonces cada uno de los coeficientes Cim , Cim−1, C j debe anularse. Multi-
plicando la expresión anterior por ∆ obtenemos,
X X
0= Cim−1∆v im−1 = Cim−1 v im , (2.32)
i i

pero entonces la independencia lineal de la base de W m nos asegura que los


{Cim−1} son todos nulos. Tenemos entonces que,
X X
0= Cim v im + C jz z j . (2.33)
i j

Pero estos vectores fueron elegidos linealmente independientes entre sí y por


lo tanto todos los coeficientes en esta suma deben anularse. Vemos así que
el conjunto {v im } ∪ {v im−1} ∪ {z i } forman una base cíclica de W m−1. Conti-
nuando con W m−2 y así sucesivamente obtenemos una base cíclica para todo
W.
Vemos así que los subespacios invariantes irreducibles de un operador es-
tán constituidos por ciclos dentro de subespacios invariantes asociados a con
un dado autovector. Cada ciclo contiene un único autovalor del operador.
Denotaremos a los subespacios generados por estos ciclos (y usualmente lla-
mados también ciclos) por Cλk , donde el índice inferior se refiere al autovalor
i
del ciclo y el superior indexa los distintos ciclos dentro de cada Wλi .

Ejercicio: Muestre que los ciclos obtenidos son subespacios invariantes irre-
ducibles de A.

2.3.3. Forma Canónica de Jordan

Definición: Sea A : V → V un operador lineal. Diremos que A es de tipo


Jordan con autovalor λ si existe una base {u i } de V tal que 10

X
n X
n
i
A= λ uiθ + u i θ i−1 ≡ λI + ∆ (2.34)
i =1 i =2

donde {θ i } es la co-base de la base {u i }.


Pn Pn
10
En el sentido que A(v) = λ i=1
u i θ i (v) + i=2
u i θ i −1 (v) ∀v ∈ V

49
Es decir, en esta base las componentes de A forman una matriz A j i dada
por  
λ 1 0 ··· 0
 
 0 . . . . . . . . . ... 
 
A= 
 λ 1 0 
 (2.35)
 
 0 λ 1 
λ
Note que la matriz ∆ es n-nilpotente, es decir ∆n = 0.
No es cierto que todo operador sea del tipo Jordan –encuentre uno que
no lo sea– pero es claro que la restricción de cualquier operador a uno de sus
subespacios invariantes irreducibles (ciclos) lo es. Esto se puede ver numeran-
do los elementos de la base generada por el ciclo convenientemente.

Ejercicio: Encuentre dicho ordenamiento de los elementos de la base.


Por lo tanto podemos resumir los resultados hallados anteriormente en
el siguiente teorema sobre las representaciones matriciales de un operador
cualquiera actuando en un espacio de dimensión finita.

Teorema 2.4 de Jordan Sea A : V → V un operador lineal actuando en un


espacio vectorial complejo V . Luego, existe una única descomposición en suma
k k
directa 11 de V en subespacios Cλk , V = Cλ1 ⊕· · · Cλ i ⊕· · ·⊕Cλ1 ⊕· · · Cλ d , d ≤
i 1 1 d d
n tal que
i) Los Cλk son invariantes bajo la acción de A, es decir , ACλk ⊆ Cλk
i i i
ii) Los Cλk son irreducibles, es decir no existen subespacios invariantes de Cλk
i i
tales que sus sumas sea todo Cλk .
i
iii) Debido a la propiedad i) el operador A induce en cada Cλk un operador
i
Ai : Cλk → Cλk , este es del tipo de Jordan con λi una de las raíces del polinomio
i i
de grado ni ,
d e t (Ai − λi I ) = 0. (2.36)

Este teorema nos dice que dado A existe una base, en general compleja,
tal que la matriz de sus componentes tiene forma de bloques diagonales cua-
drados de ni × ni , donde ni es la dimensión del subespacio Cλk , cada uno con
i

11
Recordemos que un espacio vectorial V se dice que es suma directa de dos espacios vecto-
riales W y Z, y lo denotamos como V = W ⊕ Z si cada vector en V puede ser obtenido de
una única manera como la suma de un elemento en W y otro de Z.

50
la forma dada en 2.35. Esta forma de la matriz se llama forma canónica de
Jordan.

Ejercicio: Muestre que las raíces, λi , que aparecen en los operadores Ai son
invariantes ante transformaciones de semejanza, es decir λi (A) = λi (PAP −1).

Ejemplo: Sea A : C 3 → C 3, luego d e t (A − λI ) es un polinomio de 3er gra-


do, y por lo tanto tiene tres raíces. Si éstas son distintas habrá al menos tres
subespacios invariantes e irreducibles de C 3, pero d i mC 3 = 3 y por lo tanto
cada uno de ellos tiene ni = 1. La forma canónica de Jordan es entonces,
 
λ1 0 0
 
 0 λ2 0  (2.37)
0 0 λ3

Si dos de ellas coinciden tenemos dos posibilidades, o tenemos tres subespa-


cios, en cuyo caso la forma C. de J. será
 
λ1 0 0
 
 0 λ 0  (2.38)
0 0 λ

o, tenemos dos subespacios, uno necesariamente de dimensión 2, la forma C.


de J. será
 
λ1 0 0
 
 0 λ 1  (2.39)
0 0 λ
Si las tres raíces coinciden entonces habrá tres posibilidades,
     
λ 0 0 λ 0 0 λ 1 0
     
 0 λ 0 ,  0 λ 1  y  0 λ 1  (2.40)
0 0 λ 0 0 λ 0 0 λ

Ejemplo: Ilustraremos ahora el caso de autovalores coincidentes en dos di-


mensiones. Este caso no es genérico, en el sentido que cualquier perturbación
en el sistema –es decir cualquier cambio mínimo en las ecuaciones– separa las
raíces haciéndolas distintas.

51
Sea A : C 2 → C 2. En este caso el polinomio característico d e t (A − λI )
tiene solo dos raíces las que supondremos coincidentes, λ1 = λ2 = λ. Nos en-
contramos aquí ante dos posibilidades, o existen dos autovectores linealmen-
te independientes u 1 y u 2, en cuyo caso V = B1 ⊕ B2 y A es diagonalizable
(A = d ia g (λ, λ) = I λ), o existe solo un autovector ũ 1. En tal caso sea ũ 2
cualquier vector linealmente independiente de ũ 1, luego Aũ 2 = c 1 ũ 1 + c 2 ũ 2
para algunos escalares c 1 y c 2 en C. Calculando el determinante de A− λ̃I en
esta base obtenemos (λ − λ̃)(c 2 − λ̃), pero λ es una raíz doble y por lo tanto
c 2 = λ.
Reordenando y re-escaleando las bases u 1 = ũ 1 , u 2 = c 1 ũ 2 obtenemos

Au 1 = λ u 1 + y
(2.41)
Au 2 = λu 2 + u 1,

y por lo tanto
A = λ(u 1 ⊕ θ1 + u 2 ⊕ θ2) + u 1 ⊕ θ2, (2.42)

donde {θ i } es la co-base de la base {u i }.


Note que (A − λI ) u 2 = u 1 y (A − λI )u 1 = 0 o sea ∆2 = (A − λI )2 = 0.
Como veremos más adelante en las aplicaciones físicas los subespacios in-
variantes tienen un significado físico claro, son los llamados modos normales
–caso unidimensional– y ciclos –en los otros casos.

2.3.4. Relación de Semejanza

En las aplicaciones en física es frecuente la siguiente relación de equiva-


lencia: [Ver recuadro al final del capítulo.] Diremos que el operador A es
semejante al operador B si existe otro operador P, invertible, tal que

A = P BP −1. (2.43)

Es decir, si a V lo rotamos con un operador invertible P y luego le aplicamos


A, obtenemos la misma acción a que si primero aplicamos B y luego rotamos
con P.

Ejercicio:
a) Probar qué semejanza es una relación de equivalencia.
b) Probar que las funciones y los mapas definidos anteriormente lo son en las

52
distintas clases equivalentes, es decir,

d e t (PAP −1) = d e t (A)


t r (PAP −1) = t r (A) (2.44)
−1
e PAP = P e AP −1.

53
Relaciones de Equivalencia.

Definición: Una relación de equivalencia, ≈, entre elementos de un conjun-


to X es una relación que satisface las siguientes condiciones:

1. Reflexiva: Si x ∈ X , luego x ≈ x.
2. Simétrica: Si x, x ′ ∈ X y x ≈ x ′ , luego x ′ ≈ x.
3. Transitiva: Si x, x ′ , x ′′ ∈ X , x ≈ x ′ y x ′ ≈ x ′′ , luego x ≈ x ′′ .

Note que la primer propiedad nos asegura que cada elemento de X cumple
una relación de equivalencia con algún elemento de X , en este caso consigo
mismo. Relaciones de equivalencia aparecen muy a menudo en física, esencial-
mente cuando usamos para describir algún proceso físico un ente matemático
que tiene partes superfluas en lo que respecta a este proceso y que por lo tan-
to querríamos ignorarlas. Esto se logra declarando dos entes que describen el
mismo fenómeno entes equivalentes.

Ejemplo: Sea X el conjunto de los números reales y sea x ≈ y si y solo si existe


un entero n tal que x = n + y, esta claramente es una relación de equivalencia.
Esta se usa cuando interesa describir algo usando la línea recta pero que en
realidad se debería describir usando un círculo de circunferencia unitaria.
Dada una relación de equivalencia en un conjunto podemos agrupar los ele-
mentos de éste en clases equivalentes de elementos, es decir en subconjuntos
donde todos sus elementos son equivalentes entre sí y no hay ningún ele-
mento que no esté en este subconjunto que sea equivalente a alguno de los
elementos del subconjunto. (Si X es el conjunto, Y ⊂ X es una de sus clases
equivalentes, y si y ∈ Y , luego y ≈ y ′ ↔y ′ ∈ Y .)

54
La propiedad fundamental de las relaciones de equivalencia es la siguiente.

Teorema 2.5 Una relación de equivalencia en un conjunto X permite re-


agrupar sus elementos en clases equivalentes de modo que cada elemento de X
está en una y solo en una de éstas.

Prueba: Sea x ∈ X e Y el subconjunto de todos los elementos de X equiva-


lentes a x. Veamos que este subconjunto es una clase equivalente. Sean y e y ′
dos elementos de Y , es decir y ≈ x e y ′ ≈ x, pero por la propiedad de transiti-
vidad entonces y ≈ y ′ . Si y ∈ Y y z ∈
/ Y entonces y ≈/z, ya que de otro modo
z sería equivalente a x y por lo tanto estaría en Y . Por último note que por
reflexividad x también está en Y . Solo resta ver que si y está en Y y también
en otra clase equivalente, digamos Z, luego Y = Z. Como y ∈ Y luego y es
equivalente a todo elemento de Y , como y ∈ Z luego y es equivalente a todo
elemento de Z, pero por transitividad entonces todo elemento de Y es equiva-
lente a todo elemento de Z, pero al ser estas clases equivalentes y por lo tanto
cada una contener todos sus elementos equivalentes ambas deben coincidir.

Ejercicio: ¿Cuáles son las clases equivalentes del ejemplo anterior?

2.4. Operadores Adjuntos

Sea A un operador lineal entre dos espacios vectoriales, A : V → W ,


es decir A ∈ L (V ,W ). Debido a que V y W tienen espacios duales este
operador induce naturalmente un operador lineal de W ′ a V ′ llamado su
dual ,
A′ (ω)(v) := ω(A(v)) ∀ ω ∈ W ′ , v ∈ V . (2.45)
Es decir el operador que al aplicarlo a un elemento ω ∈ W ′ nos da el elemento
A′ (ω) de V ′ que cuando actúa en v ∈ V da el número ω(A(v)). Ver figura.

Notemos que éste es un operador lineal ya que,

A′ (αω + σ)(v) = (αω + σ)(A(v))


= αω(A(v)) + σ(A(v))
= αA′ (ω)(v) + A′ (σ)(v). (2.46)

En la representación matricial este operador está representado meramen-


te por la misma matriz que el original, pero ahora actuando por izquierda,
A′ (w)i = w j A j i , es decir, A′i j = A j i .

55
A ω(A(v))

V W

A′
V ′
W′

A′ (ω)(v)

Figura 2.2: Diagrama del operador dual.

Si hay normas definidas en V y W y definimos la norma de A : V → W


de la manera usual,

kAk := sup {kA(v)kW } (2.47)


k v kV =1

Entonces vemos que

kA′ k := sup {kA′ (ω)kV ′ }


kω kW ′ =1

= sup { sup {|A′ (ω)(v)|}}


kω kW ′ =1 k v kV =1

= sup { sup {|ω(A(v))|}}


kω kW ′ =1 k v kV =1

≤ sup { sup {kωkW ′ k(A(v))kW }}


kω kW ′ =1 k v kV =1

= sup {k(A(v))kW }
k v kV =1
= kAk. (2.48)

Vemos así que si un operador es acotado, luego su dual también lo es.


Veamos cuales son las componentes del dual de un operador en término
de las componentes del operador original. Sea entonces {u i }, {θ i }, i = 1, ..n
i
una base, respectivamente una co-base de V y sea {û i }, {θ̂ }, i = 1, ..m un par
base-co-base de W . Tenemos entonces que las componentes de A con respecto
i P P
a estas bases son: Ai j := θ̂ (A(u j )), es decir, A(v) = im=1 nj=1 Ai j û i θ j (v).
Por lo tanto, si v tiene componentes (v 1, v 2, . . . , v n ) en la base {u i }, A(v)

56
tiene componentes

X
n X
n X
n
i i
( 1
A iv , 2
A iv ,..., Am i v i )
i=1 i =1 i=1

en la base {û i }
Veamos ahora las componentes de A′ . Por definición tenemos,
i i
(A′ )i j := A′ (θ̂ )(u j ) = θ̂ (A(u j )) = Ai j .

O sea las mismas componentes, pero ahora la matriz actúa por izquierda en
las componentes (ω1, ω2, . . . , ω m ) de un elemento ω de W ′ en la co-base
i
{θ̂ }. Las componentes de A′ (ω) en la co-base {θ i } son,

X
m X
m X
m
i i
( A 1ωi , A 2ωi , . . . , Ai n ωi ).
i=1 i=1 i=1

Un caso particularmente interesante de esta construcción es cuando W = V


y este es un espacio con producto interno, es decir un espacio de Hilbert. En
tal caso el producto interno nos da un mapa canónico entre V y su dual V ′ :

φ : V → V ′ , φ(v) := (v, ·), (2.49)

y por lo tanto si A : V → V luego A′ : V ′ → V ′ puede también ser considera-


do como un operador entre V y V que llamaremos A⋆ .
Note que φ−1 : V ′ → V está definido por (φ−1(ω), u) = ω(u), ya que

((φ−1(φ(v)), u) = ((φ−1((v, ·)), u) = (v, u) ∀u ∈ V .

Con la ayuda de este mapa definimos A⋆ : V → V dado por: (Ver figura)

A⋆ (v) := φ−1(A′ (φ(v))). (2.50)


En término del producto escalar esto es:

(A⋆ (v), u) = (φ−1(A′ ((v, ·)), u) = A′ ((v, ·)), (u) = (v,A(u)). (2.51)

En su representación matricial este operador es,

A⋆ j i = ti l Al k (t −1)k j ,

57
A
V V

( , )−1 (, )

A⋆

V′ V′

A′

Figura 2.3: Diagrama del operador estrella.

donde t l i es la representación del producto escalar y (t −1) j k el de su inversa


(ti l (t −1) l k = δ k i ). En el caso de que ti k = δi k , la delta de Kronecker, la
representación matricial del adjunto es simplemente la matriz transpuesta,
A⋆ j i = A† j i = Ai j ,
Un subconjunto de operadores particularmente interesante es aquel para
el cual se cumple A = A⋆ . Estos operadores se llaman Hermitianos o Auto-
adjuntos . 12
Los operadores autoadjuntos tienen importantes propiedades:

Lema 2.7 Sea M = S pan{u, u 2, . . . , u m }, donde {u i } son un conjunto de auto-


valores de A, un operador autoadjunto. Luego M y M ⊥ son espacios invariantes
de A.

Prueba: La primera afirmación es clara y general, la segunda depende de la


Hermiticidad de A. Sea v ∈ M ⊥ cualquiera, veamos que A(v) ∈ M ⊥ . Sea
u ∈ M arbitrario, luego

(u,A(v)) = (A(u), v) = 0, (2.52)

ya que A(u) ∈ M si u ∈ M ♠Esta propiedad tiene el siguiente corolario:

Corolario 2.1 Sea A : H → H autoadjunto. Luego los autovalores de A forman


una base ortonormal de H .

Prueba: A : H → H tiene al menos un autovector, digamos u 1. Consideremos


ahora su restricción al espacio perpendicular a u 1 que denotamos también
con A pues por el lema anterior este es un espacio invariante, A : {u 1}⊥ →
{u 1}⊥ . Este operador también tiene un autovector, digamos u 2 y u 1 ⊥ u 2.
12
En el caso de dimensión infinita estos nombres dejan de coincidir para algunos autores.

58
Consideremos ahora la restricción de A a S pan{u 1, u 2}⊥ allí también tene-
mos A : S pan{u 1, u 2}⊥ → S pan{u 1, u 2}⊥ y por lo tanto un autovector de
A, u 3 con u 3 ⊥ u 1, u 3 ⊥ u 2. Continuando de esta manera llegamos a tener
n = dim H autovectores todos ortogonales entre sí ♠
Este teorema tiene varias extensiones al caso donde el espacio vectorial es
de dimensión infinita. Más adelante en el capítulo 12 veremos una de ellas.
Notemos que en esta base A es diagonal y por lo tanto tenemos
Corolario 2.2 Todo operador autoadjunto es diagonalizable
Notemos también que si u es un autovector de A autoadjunto, con autovalor
λ luego,
λ̄(u, u) = (A(u), u) = (u,A(u)) = λ(u, u) (2.53)
y por lo tanto λ̄ = λ, es decir,

Lema 2.8 Los autovalores de un operador autoadjunto son reales

Veamos qué quiere decir la condición de hermiticidad en término de las


componentes del operador en una base ortonormal. Sea entonces A un ope-
rador autoadjunto y sea {e i }, i = 1, . . . , n una base ortonormal del espacio
donde éste actúa. Tenemos que (A(e i ), e j ) = (e i ,A(e j )) y por lo tanto, notan-
P
do que I = ni=1 e i θ i , obtenemos,
X
n X
n
k
0 = ( e k θ (A(e i ), e j ) − (e i , e l θ l (A(e j ))
k=1 l =1
X
n X
n
= Āk i (e k , e j ) − Al j (e i , e l )
k=1 l =1
Xn X
n
= Āk i δk j − Al j δ l i . (2.54)
k=1 l =1

de lo que concluimos que

Ā j i = Ai j (2.55)
o sea que la matriz transpuesta es la complejo conjugada de la original. En el
caso de matrices reales vemos que la condición es que en esa base la matriz
sea igual a su transpuesta, lo que usualmente se denota diciendo que la matriz
es simétrica.
Una propiedad interesante de los operadores autoadjuntos es que su nor-
ma es igual al supremo de los módulos de sus autovalores. Como la cuenta

59
demostrando esto será usada más adelante en el curso damos una demostra-
ción de este hecho a continuación.
Lema 2.9 Si A es autoadjunto luego kAk = sup{|λi |}.
Prueba: Sea F (u) := (A(u),A(u)) definida en la esfera kuk = 1. Como dicho
conjunto es compacto (aquí estamos usando el hecho que el espacio es de
dimensión finita) tiene un máximo que denotaremos u 0. Notemos entonces
que F (u 0) := kAk2. Como F (u) es diferenciable en la esfera se debe cumplir
que
d
F (u 0 + λδ u)|λ=0 = 0, (2.56)

a lo largo de toda curva tangente a la esfera en el punto u 0, es decir, para todo
δ u tal que (u 0, δ u) = 0. Ver figura.

u0

δu

Figura 2.4: Vectores normales y tangentes a la esfera.

Pero
d d
F (u 0 + λδ u)|λ=0 = (A(u 0 + λδ u),A(u 0 + λδ u))|λ=0
dλ dλ
= (A(δ u),A(u 0)) + (A(u 0),A(δ u))
= 2ℜ(A⋆Au 0, δ u)
= 0 ∀δ u, (u 0, δ u) = 0 (2.57)
Como δ u es arbitrario en {u 0}⊥ esto simplemente implica
A⋆A(u 0) ∈ {δ u}⊥ = {u 0}⊥⊥ = {u0 }. (2.58)

60
y por lo tanto que existirá α ∈ C tal que

A⋆A(u 0) = αu 0. (2.59)

Tomando producto escalar con u 0 obtenemos,

(A⋆A(u 0), u 0) = ᾱ(u 0, u 0)


= (A(u 0),A(u 0))
= kAk2 (2.60)

y por lo tanto tenemos que α = ᾱ = kAk2.


Sea ahora v := Au 0 − kAku 0, luego, usando ahora que A es autoadjunto
tenemos,

A(v) = AA(u 0) − kAkA(u 0)


= A⋆A(u 0) − kAkA(u 0)
= kAk2 u 0 − kAkA(u 0)
= kAk(kAku 0 − A(u 0))
= −kAkv, (2.61)

por lo tanto o v es un autovector de A, con autovalor λ = −kAk, o v = 0, en


cuyo caso u 0 es un autovector de A con autovector λ = kAk ♠

2.5. Operadores Unitarios

Otra subclase de operadores lineales que aparece muy a menudo en física


cuando hay un producto interno privilegiado es la de los operadores unita-
rios , es decir aquellos tales que su acción preserva el producto escalar,

(U (u), U (v)) = (u, v), ∀u, v ∈ H . (2.62)

El caso más típico de operador unitario es una transformación que envía una
base ortonormal en otra. Ejemplos usuales son las rotaciones en lRn .
Observemos también que kU k = supkv k=1{kU (v)k} = 1.
Notemos que

(U (u), U (v)) = (U ⋆ U (u), v) = (u, v), ∀u, v ∈ H , (2.63)

o sea,
U ⋆U = I (2.64)

61
y por lo tanto,
U −1 = U ⋆ . (2.65)
Veamos cómo son los autovalores de un operador unitario U . Sea v 1 un
autovector de U (sabemos que al menos tiene uno), luego,

(U (v 1), U (v 1)) = λ1λ̄1(v 1, v 1)


= (v 1, v 1) (2.66)

y por lo tanto λ1 = e iθ1 para algún ángulo θ1.


Si el operador U representa una rotación entonces habrá solo un autovec-
tor real, correspondiente al eje que queda fijo en una rotación. Si tenemos más
de un autovalor, luego sus correspondientes autovectores son ortogonales, en
efecto, sean v 1 y v 2 dos autovectores luego

(U (v 1), U (v 2)) = λ̄1λ2(v 1, v 2)


= (v 1, v 2) (2.67)

y por lo tanto si λ1 6= λ2 debemos tener (v 1, v 2) = 0.

Ejercicio: Muestre que si A es un operador autoadjunto, luego U := e i A es


un operador unitario.

2.6. Problemas

Problema 2.4 Sea el operador A : V → V donde dimV = n, tal que Ax = λx.


Calcule detA y t r A.

Problema 2.5 Sea V = lR3 y x un vector no nulo cualquiera. Encuentre geomé-


tricamente y analíticamente el espacio cociente V /W x , donde W x es el espacio
generado por x. Tome otro vector, x ′ , linealmente independiente con el primero
y calcule ahora V /W( x , x ′ ) .

Problema 2.6 La norma sobre operadores se define como:

kAkL = maxk x kV =1kA(x)kV . (2.68)

Encuentre las normas de los siguientes operadores, dados por su representa-


ción matricial con respecto a una base y donde la norma en el espacio vectorial
es la euclídea con respecto a dicha base.

62
a)
 
3 5
(2.69)
4 1
b)
 
3 5 2
 
 4 1 7  (2.70)
8 3 2

Problema 2.7 Sea V un espacio vectorial cualquiera y sea k·k una norma Euclí-
dea en dicho espacio. La norma H i l b e r t − S c h mi d t de un operador se define
como:
X n
2
kAkH S = |A j i |2. (2.71)
i, j =1

donde la base empleada ha sido la ortonormal con respecto a la norma Euclídea.


a) Muestre que esta es una norma.
b) Muestre que kAkL ≤ kAkH S .
P
c) Muestre que nj=1 |A j k |2 ≤ kAk2 para cada k. Por lo tanto kAk2H S ≤
L
nkAk2 , y las dos normas son equivalentes.
L
Ayuda: use que θ j (A(u)) = θ j (A)(u) y luego que |θ(u)| ≤ kθkkuk.

Problema 2.8 Calcule los autovalores-vectores de las siguientes matrices:


a)
 
3 6
(2.72)
4 1
b)
 
3 6
(2.73)
0 1
c)
 
2 4 2
 
 4 1 0  (2.74)
3 3 1

Problema 2.9 Lleve a forma triangular superior las siguientes matrices: Nota:
De la transformación de las bases.
a)
 
3 4
(2.75)
2 1

63
b)  
2 4 2
 
 4 1 0  (2.76)
3 3 1
c)  
1 4 3
 
 4 4 0  (2.77)
3 3 1

Problema 2.10 Muestre nuevamente que det e A = e t r A. Ayuda: exprese la re-


presentación matricial de A en una base donde tenga la forma canónica de Jor-
dan. Alternativamente use una base donde A sea diagonal superior y vea que el
producto de matrices diagonal superior da una matriz diagonal superior y por lo
tanto que la exponencial de una matriz diagonal superior es también diagonal
superior.

Notas bibliográficas: Este capítulo está basado en los siguientes libros: [1],
[3], [5] y [18]. También son de interés los siguientes, [11] y [12]. El álgebra
lineal es una de las áreas más grandes y más prolífica de las matemáticas, so-
bre todo cuando trata de espacios de dimensión infinita, lo que usualmente
se llama análisis real y teoría de operadores. En mi experiencia personal la
mayoría de los problemas terminan reduciéndose a un problema algebraico y
uno siente que ha hecho un avance cuando puede resolver dicho problema.

64
CAPÍTULO 3

GEOMETRÍA

3.1. Variedades

Hay dos motivos principales que justifican el estudio del concepto de va-
riedad, o más generalmente de la geometría diferencial por parte de los físicos.
Uno es que en física aparecen naturalmente las variedades y por lo tanto no
las podemos eludir. Solo en los cursos elementales se logra esquivar a éstas
por medio del cálculo vectorial en lRn . Así es que, por ejemplo, para estudiar
el movimiento de una partícula restringida a moverse en una esfera la imagi-
namos a esta última embebida en lR3 y usamos las coordenadas naturales de
lR3 para describir sus movimientos.
El segundo motivo es que el concepto de variedad es de gran utilidad
conceptual, ya que por ejemplo en el caso de una partícula moviéndose en lR3
este nos permite discernir claramente entre la posición de una partícula y su
vector velocidad como entes matemáticos de naturaleza diferente. Este hecho
se enmascara en lR3 ya que este tipo especial de variedad tiene la estructura
de un espacio vectorial.
Una variedad es una generalización de los espacios Euclídeos lRn en la
cual uno preserva el concepto de continuo, es decir su topología en el sentido
local pero descarta su carácter de espacio vectorial. Una variedad de dimen-
sión n es en términos imprecisos un conjunto de puntos que localmente es
como lRn , pero que no lo es necesariamente en su forma global.
Un ejemplo de una variedad en dos dimensiones es la esfera, S 2. Si mira-
mos un entorno suficientemente pequeño, Up , de un punto cualquiera de S 2
vemos que es similar a un entorno del plano, lR2, en el sentido que podemos
definir un mapa continuo e invertible entre ambos entornos. Globalmente
el plano y la esfera son topológicamente distintos, ya que no existe ningún
mapa continuo e invertible entre ellos. [Ver figura 3.1.]
Como dijimos antes, se podría objetar la necesidad, en el ejemplo ante-

65
Figura 3.1: Un atlas de la esfera.

rior, de introducir el concepto de variedad, ya que uno podría considerar S 2


como el subconjunto de lR3 tal que x12 + x22 + x32 = 1. La respuesta a esta
objeción es que en física uno debe seguir la regla de la economía de concep-
tos y objetos y descartar todo lo que no sea fundamental a la descripción de
un fenómeno: si queremos describir cosas sucediendo en la esfera, ¿para qué
necesitamos un espacio de más dimensiones?
Esta regla de economía nos fuerza a precisar los conceptos y descartar
todo lo superfluo.
Damos a continuación una serie de definiciones para desembocar finalmente
en la definición de variedad de dimensión n.

Definición: Sea M un conjunto. Una carta de M es un par (U , ϕ) donde U


es un subconjunto de M y ϕ un mapa inyectivo entre U y lRn , tal que su
imagen, ϕ(U ) es abierta en lRn .

Definición: Un atlas de M es una colección de cartas {(Ui , ϕ i )} satisfaciendo


las siguientes condiciones: [Ver figura 3.2.]

[
1. Los Ui cubren M , (M = Ui ).
i

2. Si dos cartas se superponen entonces ϕ i (Ui ∩ Uj ) es también un abierto


de lRn .
3. El mapa ϕ j ◦ ϕ −1
i
: ϕ i (Ui ∩ Uj ) → ϕ j (Ui ∩ Uj ) es continuo, inyectivo y
suryectivo.
La condición 1 nos da una noción de cercanía en M inducida de la noción
análoga en lRn . En efecto, podemos decir que una secuencia de puntos { pk }

66
φ j (Uj ) φ j (Ui ∩ Uj ) φi (Ui ∩ Uj )
lRn
lRn

φ j ◦ φ−1
i

φi (Ui )

φj φi

Uj Ui

Figura 3.2: Relación entre cartas.

en M convergen a p en Ui si existe k0 tal que ∀ k > k0, pk ∈ Ui y la secuencia


{ϕ i ( pk )} converge a ϕ i ( p)}. Otra manera de ver esto es que si luego de esta
construcción de una variedad imponemos que los mapas ϕ i sean continuos
entonces inducimos de forma unívoca una topología en M . [Ver figura 3.3.]

φi
lRn

pk Ui

p
φi ( p)

Figura 3.3: Sucesiones en M .

La condición 2 simplemente nos asegura que esta noción es consistente.


Si p ∈ Ui ∩ Uj luego el hecho de que la secuencia converja es independiente
de que usemos la carta (Ui , ϕ j ) o la (Uj , ϕ j ).
La condición 3 nos permite codificar en los mapas ϕ j ◦ ϕ −1
i
de lRn en lRn
la información topológica global necesaria para distinguir, por ejemplo, si M
es una esfera o un plano o un toro. Allí está, por ejemplo la información de
que no existe ningún mapa continuo e invertible entre S 2 y lR2. Pero tam-
bién, si pedimos que estos mapas sean diferenciables, es lo que nos permitirá
formular el cálculo diferencial en M . En efecto, note que en la condición 3
hablamos de la continuidad del mapa ϕ j ◦ ϕ −1
i
, la cual está bien definida debi-
n n
do a que este es un mapa entre lR y lR . Análogamente podemos hablar de

67
la diferenciabilidad de estos mapas.
Diremos que un atlas {(Ui , ϕ i )}, es C p si los mapas ϕ j ◦ϕ −1
i
son p-veces
diferenciables y su p-ésima derivada es continua.
Uno estaría tentado a definir la variedad M como el par que consiste del
conjunto M y un atlas {(Ui , ϕ i )}, pero esto nos llevaría a considerar como
distintas variedades, por ejemplo, el plano con un atlas dado por la carta
(lR2, (x, y) → (x, y)) y el plano con un atlas dado por la carta (lR2, (x, y) →
(x, −y)).
Para subsanar este inconveniente introducimos el concepto de equivalen-
cia entre atlas.

Definición: Diremos que dos atlas son equivalentes si su unión es también


un atlas.

Ejercicio: Demuestre que esta es realmente una relación de equivalencia ≈, es


decir que cumple:
i) A ≈ A
i i ) A ≈ B =⇒ B ≈ A
i i i) A ≈ B , B ≈ C =⇒ A ≈ C .
Con esta relación de equivalencia podemos dividir el conjunto de atlas de
M en distintas clases equivalentes. [Recuerde que cada clase equivalente es
un conjunto donde todos sus elementos son equivalentes entre sí y tal que no
hay ningún elemento equivalente a estos que no esté en él.]

Definición: Llamaremos variedad M de dimensión n y diferenciabilidad


p al par que consiste del conjunto M y de una clase equivalente de atlas,
{ϕ i : Ui → lRn } , en C p .
Se puede demostrar que para caracterizar la variedad M unívocamente es
suficiente dar el conjunto M y un atlas. Si tenemos dos atlas de M , luego, o
bien estos son equivalentes y así representan la misma variedad, o no lo son
y entonces representan variedades distintas.
La definición de variedad que hemos introducido es todavía demasiado
general para las aplicaciones físicas usuales, en el sentido de que la topologías
permitidas pueden aún ser patológicas desde el punto de vista de la física. Por
ello en este curso impondremos a las variedades una condición extra. Supon-
dremos que éstas son separables o Hausdorff. Eso es si p y q ∈ M luego:
o pertenecen al dominio de una misma carta Ui (en cuyo caso existen entor-
nos W p de ϕ i ( p) y Wq de ϕ i (q) tales que ϕ −1
i
(W p ) ∩ ϕ −1
i
(Wq ) = ;, o sea
los puntos tienen entornos disjuntos) o bien existen Ui y Uj con p ∈ Ui ,

68
q ∈ Uj y Ui ∩ Uj = ;, lo que también implica que tienen entornos disjun-
tos. Esta es una propiedad en la topología de M que esencialmente dice que
podemos separar puntos de M . Un ejemplo de una variedad no–Hausdorff es
el siguiente.

Ejemplo: M , como conjunto, consta de tres intervalos de la recta I1 = (−∞, 0],


I2 = (−∞, 0] y I3 = (0, +∞).
Un atlas de M es {(U1 = I1 ∪ I3 , ϕ 1 = i d ) , (U2 = I2 ∪ I3 , ϕ 2 = i d )}. [Ver
figura 3.4.]

I1 p

I3

I2

Figura 3.4: Ejemplo de variedad no–Hausdorff.

Ejercicio: Pruebe que es un atlas.


Note que dado cualquier entorno W1 de ϕ 1(0) en lR y cualquier entorno W2
de ϕ 2(0) tenemos necesariamente que
ϕ −1
1
(W1) ∩ ϕ −1
2
(W2) 6= ;.

3.2. Funciones Diferenciables en M

De ahora en más asumiremos que M es una variedad C ∞ , o sea que todos


sus mapas ϕ i ◦ϕ −1
j
son infinitamente diferenciables. Si bien matemáticamente
esto es una restricción, no lo es en las aplicaciones físicas. En estas M es gene-
ralmente el espacio de posibles estados del sistema y por lo tanto sus puntos
no pueden ser determinados con absoluta certeza, ya que toda medición invo-
lucra cierto error. Esto indica que por medio de mediciones nunca podríamos
saber el grado de diferenciabilidad de M . Por conveniencia supondremos que
es C ∞ .
Una función en M es un mapa f : M → lR, o sea un mapa que asigna un
número real a cada punto de M . La información codificada en el atlas sobre
M nos permite decir cuan suave es f .

69
Definición: Diremos que f es p-veces continuamente diferenciable en el
p
punto q ∈ M , f ∈ Cq si dada (Ui , ϕ i ) con q ∈ Ui , f ◦ ϕ −1
i
: ϕ i (Ui ) ⊂
n
lR → lR es p-veces continuamente diferenciable en ϕ i (q).
Note que esta propiedad es independiente de la carta empleada [ mientras
consideremos solo cartas de la clase compatible de atlas ]. Diremos que f ∈
p
C p (M ) si f ∈ Cq ∀ q ∈ M . [Ver figura 3.5.]

f ◦ φ−1
i
n
lR
lR

φi

q
Ui M

Figura 3.5: Composición del mapa de una carta con una función.

En la práctica uno define una función particular f ∈ C p (M ) introdu-


ciendo funciones fi : ϕ i (Ui ) ⊂ lRn → lR ( o sea fi (x j ) donde x j son las
coordenadas cartesianas en ϕ i (Ui ) ⊂ lRn ) que sean C p en ϕ i (Ui ) y tales que
fi = f j ◦ ϕ j ◦ ϕ −1
i
en ϕ i (Ui ∩ Uj ). Esto garantiza que el conjunto de las fi
determinan una única función f ∈ C p (M ). El conjunto de las fi (= f ◦ ϕ −1 i
)
forman una representación de f en el atlas {(Ui , ϕ i )}. [Ver figura 3.6.]

Ejercicio: El círculo, S 1, se puede pensar como el intervalo [0,1] con sus ex-
tremos identificados. ¿Cuáles son las funciones en C 2(S 1)?

Usando la construcción anterior también se pueden definir mapas de M


en lR m que sean p-veces diferenciables. Ahora realizamos la construcción in-
versa es decir definiremos la diferenciabilidad de un mapa de lR m en M . Ha-
remos el caso lR → M , en cuyo caso el mapa así obtenido se llama curva. El
caso general es obvio.

70
M φi
lR
fi

Ui

φ j ◦ φ−1
i

Uj
φj fj

Figura 3.6: La relación entre las fi .

3.3. Curvas en M

Definición: Una curva en M es un mapa entre un intervalo I ⊂ lR y M ,


γ : I → M.
Note que la curva es el mapa y no su gráfico en M , es decir el conjunto
γ (I ). Se puede así tener dos curvas distintas con el mismo gráfico. Esto no es
un capricho matemático sino una necesidad física : no es lo mismo que un
auto recorra el camino Córdoba–Carlos Paz a 10 km/h que a 100 km/h, o lo
recorra en sentido contrario.
p
Definición: Diremos que γ ∈ C t si dada una carta (Ui , ϕ i ) tal que γ (t0) ∈ Ui
0
el mapa ϕ i ◦ γ (t ) : I t0 ⊂ I → lRn es p-veces continuamente diferenciable en
t0. [Ver figura 3.7.]

lRn

φi ◦ γ
φi (Ui )

I
t0
γ φi
I t0

Ui
M
γ (t0)

Figura 3.7: Diferenciabilidad de curvas en M .

71
Ejercicio: Demuestre que la definición anterior no depende de la carta usada.

Esta vez hemos usado el concepto de diferenciabilidad entre mapas de lR


en lRn .
p
Definición: Una curva γ (t ) ∈ C p (I ) si γ (t ) ∈ C t ∀ t ∈ I .

Ejercicio: ¿Cómo definiría el concepto de diferenciabilidad de mapas entre


dos variedades?

De particular importancia entre estos son los mapas de M en sí mismo


g : M → M que son continuamente diferenciables e invertible. Se llaman
Difeomorfismos. De ahora en más supondremos que todas las variedades,
curvas, difeomorfismos y funciones son suaves, es decir, son C ∞ .

3.4. Vectores

Para definir vectores en puntos de M utilizaremos el concepto de derivada


direccional en puntos de lRn , es decir, explotaremos el hecho de que en lRn
hay una correspondencia uno a uno entre vectores (v 1, . . . , v n ) x y derivadas
0
i ∂
direccionales v( f )| x = v f .
0 ∂ xi x0
Como hemos definido funciones diferenciables en M podemos definir
derivaciones, o sea derivadas direccionales, en sus puntos e identificar con
ellos a los vectores tangentes.

Definición:Un vector tangente v en p ∈ M es un mapa

v : C ∞ (M ) → lR

satisfaciendo: ∀ f , g ∈ C ∞ (M ) , a, b ∈ lR
i) Linealidad; v(a f + b g )| p = a v( f )| p + b v( g )| p .
i i ) Leibnitz; v( f g )| p = f ( p) v( g )| p + g ( p) v( f )| p .

Note que si h ∈ C ∞ (M ) es la función constante, h(q) = c ∀ q ∈ M , lue-


go v(h) = 0. [ i) =⇒ v(h 2) = v(c h) = c v(h) mientras que i i ) =⇒ v(h 2) =
2 h( p) v(h) = 2 c v(h) ]. Estas propiedades muestran asimismo que v( f ) de-
pende solo del comportamiento de f en p.

Ejercicio: Pruebe esta última afirmación.

72
Sea T p el conjunto de todos los vectores en p. Este conjunto tiene la
estructura de un espacio vectorial y es llamado el espacio tangente al punto
p. En efecto, podemos definir la suma de dos vectores v 1 , v 2 como el vector,
es decir el mapa, satisfaciendo i) y i i ), (v 1 + v 2)( f ) = v 1( f ) + v 2( f ) y el
producto del vector v por el número a como el mapa (av)( f ) = a v( f ).
Como en lRn , la dimensión del espacio vectorial T p , (es decir el número
máximo de vectores linealmente independientes), es n.

Teorema 3.1 dim T p = d i mM .

Prueba: Esta consistirá en encontrar una base para T p . Sea d i m M = n y


(U , ϕ) tal que p ∈ U y f ∈ C ∞ (M ) cualquiera. Para i = 1, . . . , n definimos
los vectores x i : C ∞ (M ) → lR dados por,


−1
xi(f ) = ( f ◦ ϕ ) . (3.1)
∂x i
ϕ ( p)

Note que estos mapas satisfacen i) y i i ) y por lo tanto las x i son real-
mente vectores. Note además que el lado derecho de 3.1 está bien definido ya
que tenemos las derivadas parciales usuales de mapas entre lRn y lR. Estos x i
dependen de la carta (U , ϕ) pero esto no importa en la prueba ya que T p no
depende de P carta alguna. Estos vectores son linealmente independientes, es
decir si x = ni=1 c i x i = 0 luego c i = 0 ∀ i = 1, . . . , n. Esto se ve fácilmente
considerando las funciones (en rigor definidas solamente en U ), f j = x j ◦ ϕ,
j
ya que x i ( f j ) = δi y por lo tanto 0 = x( f j ) = c j . Solo resta mostrar que
cualquier vector v puede ser expresado como combinación lineal de los x i .
Para ello usaremos el siguiente resultado cuya prueba dejamos como ejercicio.

Lema 3.1 Sea F : lRn → lR, F ∈ C ∞ (lRn ) luego para cada x0 ∈ lRn existen
funciones Hi : lRn → lR ∈ C ∞ (lRn ) tales que ∀ x ∈ lRn se cumple

X
n
F (x) = F (x0) + (x i − x0i ) Hi (x) y (3.2)
i=1

además, ∂ F
= Hi (x0). (3.3)
∂ xi x=x0

73
Continuamos ahora la prueba del Teorema anterior. Sea F = f ◦ ϕ −1 y
x0 = ϕ( p), luego ∀ q ∈ U tenemos

X
n
f (q) = f ( p) + (x i ◦ ϕ(q) − x i ◦ ϕ( p)) Hi ◦ ϕ(q) (3.4)
i=1

Usando i) y i i ) obtenemos,
Pn
i i
v( f ) = v( f ( p)) + i=1(x ◦ ϕ(q) − x ◦ ϕ( p)) v(Hi ◦ ϕ)
P q= p

+ ni=1(Hi ◦ ϕ) v(x i ◦ ϕ − x i ◦ ϕ( p))
p (3.5)
Pn
= i=1(Hi ◦ ϕ) v(x i ◦ ϕ)
Pn p
i
= i=1 v x i ( f )

donde v i ≡ v(x i ◦ ϕ), y por lo tanto hemos expresado v como combinación


lineal de los x i , finalizando así la prueba.
La base {x i } se llama una base coordenada y los {v i }, las componentes
de v en esa base.

Ejercicio: Si (Ũ , ϕ̃) es otra carta tal que p ∈ Ũ , entonces ésta definirá otra
base coordenada { x̃ i }. Muestre que

n ∂ x̃ i
X
xj = x̃ i
i =1 ∂ xj

donde x̃ i es la i-ésima componente del mapa ϕ̃ ◦ ϕ −1. Muestre también que


Xn ∂ x̃ i
i
la relación entre las componentes es ṽ = j
vj.
i=1 ∂ x

Ejemplo: Sea γ : I → M una curva en M . En cada punto γ (t0), t0 ∈ I , de M


podemos definir un vector de la siguiente forma, [Ver figura 3.8.]

d
t(f ) = ( f ◦ γ )| t =t . (3.6)
dt 0

Sus componentes en una base coordenada se obtienen por medio de las


funciones
x i (t ) = ϕ ◦ γ (t ) (3.7)

74
lR lR
f ◦γ

f
γ

Figura 3.8: Definición de vector.

d d
(f ◦ γ) = ( f ◦ ϕ −1 ◦ ϕ ◦ γ )
dt dt
d
= ( f ◦ ϕ −1(x i (t )))
dt
Xn ∂ −1
d xi
= ( i ( f ◦ ϕ ))
i=1 ∂ x dt
Xn d xi
= xi(f ) (3.8)
i=1 d t

3.5. Campos Vectoriales y Tensoriales

Si a cada punto q de M le asignamos un vector v|q ∈ Tq tendremos un


campo vectorial. Este estará en C ∞ (M ) si dada cualquier f ∈ C ∞ (M ) la fun-
ción v( f ), que en cada punto p de M le asigna el valor v | p ( f ), esta también
en C ∞ (M ) . Al conjunto de los campos vectoriales C ∞ lo denotaremos T M
y obviamente es un espacio vectorial, de dimensión infinita.

3.5.1. El Corchete de Lie

Consideremos ahora la operación en el conjunto T M de campos vecto-


riales, [·, ·] : T M × T M → T M . Esta operación se llama corchete de Lie y

75
dados dos campos vectoriales (C ∞ ) nos da un tercero:

[x, y] ( f ) := x (y( f )) − y (x( f )). (3.9)

Ejercicio:
1) Muestre que [x, y] es en realidad un campo vectorial.
2) Vea que se satisface la identidad de Jacobi:

[[x, y] , z ] + [[z , x] , y] + [[y, z , x] = 0 (3.10)

3) Sean x i y x j dos campos vectoriales provenientes de un sistema coor-


∂f
” —
denado, es decir x i ( f ) = i , etc. Muestre que x i , x j = 0.
∂x
4) Dadas las componentes de x e y en una base coordenada, ¿cuáles son
las de [x, y]?
Con esta operación T M adquiere el carácter de un álgebra, llamada Álge-
bra de Lie.

3.5.2. Difeomorfismos y la Teoría de las Ecuaciones Diferenciales Or-


dinarias

Definición: Un grupo monoparamétrica de difeomorfismos g t es un mapa


lR × M → M tal que:
1) Para cada t fijo es un difeomorfismo 1 M → M
2) Para todo par de reales, t , s ∈ lR tenemos g t ◦ g s = g t +s (en particular
g 0 = i d ).

Podemos asociar con g t un campo vectorial de la siguiente manera : Para


un p fijo g t ( p) : lR → M es una curva que en t = 0 pasa por p y por lo tanto
define un vector tangente en p, v | p . Repitiendo el proceso para todo punto
de M tenemos un campo vectorial en M . Note que debido a la propiedad de
grupo que satisface g t el vector tangente a la curva g t ( p) es también tangente
a la curva g s ( g t ( p)) en s = 0.
Podemos hacernos la pregunta inversa: ¿Dado un campo vectorial suave
v en M existirá un grupo monoparamétrico de difeomorfismos que lo defi-
na? La respuesta a esta pregunta, que consiste en encontrar todas las curvas
integrables g t ( p) que pasan por cada p ∈ M es la teoría de las ecuaciones
1
Es decir un mapa suave con inversa también suave.

76
diferenciales ordinarias, –que será el objeto de nuestro estudio en los capítu-
i
los siguientes– ya que consiste en resolver las ecuaciones ddxt = v i (x j ) con
condiciones iniciales x i (0) = ϕ i ( p) ∀ p ∈ M . Como veremos la respues-
ta es afirmativa pero solo localmente, es decir podremos encontrar solo g t
definidos en I (⊂ lR) × U (⊂ M ) → M .

Ejemplo: En lR1 sea el vector con componente coordenada x 2, es decir V (x) =


x 2 ddx . La ecuación diferencial ordinaria asociada con este vector es dd xt = x 2,
cuya solución es
−1 1 −1
t − t0 = + ó x(t ) = (3.11)
x x0 1
t−
x0
−1
donde hemos tomado t0 = 0. O sea g t (x0) = . Note que cualquiera sea
t − x1
0
t este mapa no está definido para todo lR y por lo tanto no es un difeomor-
fismo.

Ejemplo: Sea g t un difeomorfismo lineal en lR, es decir g t (x +αy) = g t (x) +


α g t (y). Luego tiene la forma g t (x) = f (t ) x. La propiedad de grupo implica
f (t ) · f (s) = f (t + s) o f (t ) = c ek t = ek t , ya que g 0 = i d . Por lo tanto
g t (x) = ek t x. La ecuación diferencial asociada es: x(t ) = ek t x0 =⇒ ẋ =
k ek t x0 = k x = ẋ .

Ejercicio: Grafique en un entorno del origen lR2 las curvas integrales y por lo
tanto g t de los siguientes sistemas lineales.
    
ẋ 1 0 x
= (3.12)
ẏ 0 k y

a) k > 1 b) k = 1 c) 0 < k < 1, d) k = 0, e) k < 0

3.5.3. Campos de Covectores y Tensores


Así como introdujimos la noción de campo vectorial podemos también
introducir la de campo de co-vectores, es decir un mapa suave de M en T p∗ .
Este actuará en campos vectoriales dando como resultado funciones en M .
En el ejemplo que sigue vemos cómo se define el campo diferencial de f .

77
Ejemplo: Sea f ∈ C p∞ . Un vector en p ∈ M es una derivación sobre funciones
en C p∞ , v( f ) ∈ lR. Pero dados v 1 y v 2 ∈ T p (v 1 + v 2)( f ) = v 1( f ) +
v 2( f ) y por lo tanto f define una funcional lineal d f | p : T p → lR, llamada
la diferencial de f , es decir un elemento de T p∗ . De esta forma la diferencial
de una función d f es un co-vector que al actuar sobre un vector v nos da el
número la derivada de f en el punto p en la dirección de v.
Considere el subconjunto S de M tal que f (M ) = cte. Esta será una sub-
variedad de M , es decir superficies embebidas en M , de dimensión n − 1. La
condición d f | p (v) = 0 en vectores de T p con p ∈ S significa que estos son en
realidad vectores tangentes a S, es decir elementos de T p (S). Por el contrario,
si d f (v)| p 6= 0 entonces en ese punto v pincha a S.

Ejemplo: La función f (x, y, z) = x 2 + y 2 + z 2 en lR3.


S = {(x, y, z) ∈ lR3/ f (x, y, z) = a 2 , a 2 > 0} es la esfera de radio a, y como
ya hemos visto una variedad. Sea (v x , vy , v z ) un vector en (x, y, z) ∈ lR, luego
la condición d f (v) = 2(x v x + y vy + z v z ) = 0 implica que v es tangente a S.
Similarmente definimos campos tensoriales como los mapas multilinea-
les que al actuar sobre campos vectoriales y co-vectoriales dan funciones de
la variedad en los reales y que en cada punto de la variedad sólo dependen
de los vectores y co-vectores definidos en ese punto. Esta última aclaración
es necesaria pues de lo contrario incluiremos entre los tensores, por ejemplo,
integrales lineales sobre los campos vectoriales.

3.5.4. La Métrica
Sea M una variedad n-dimensional. Hemos definido anteriormente en M
las nociones de curvas, campos vectoriales y co-vectoriales, etc. pero no una
noción de distancia entre sus puntos, es decir una función d : M × M → lR
que toma dos puntos cualquiera, p y q de M y nos da un número d ( p, q)
satisfaciendo,
1. d ( p, q) ≥ 0.
2. d ( p, q) = 0 ↔ p = q.
3. d ( p, q) = d (q, p).
4. d ( p, q) ≤ d ( p, r ) + d (r, q).
Esta, y en algunos casos una noción de pseudo-distancia [donde 1) y 2)
no se cumplen], es fundamental si queremos tener una estructura matemáti-
ca que sea útil para la descripción de fenómenos físicos. Por ejemplo la ley

78
de Hooke, que nos dice que la fuerza aplicada a un resorte es proporcional
a la elongación (una distancia) de éste, claramente necesita de este ente. A
continuación introduciremos una noción de distancia infinitesimal, es decir
entre dos puntos infinitesimalmente separados, la cual responde a la noción
Euclídea de distancia y permite desarrollar una noción de distancia global, es
decir entre dos puntos cualesquiera de M .
La idea es entonces tener un concepto de distancia (o seudo-distancia) en-
tre dos puntos infinitesimalmente cercanos, es decir dos puntos conectados
por un desplazamiento infinitesimal, es decir conectados por un vector. La
noción que necesitamos es entonces la de norma de un vector. Como una
variedad es localmente como lRn , en el sentido de que el espacio de vectores
tangentes a un punto p, T p M es lRn , es razonable considerar allí la noción
de distancia Euclídea, es decir que la distancia entre dos puntos x0 y x1 ∈ lRn
es la raíz cuadrada de la suma de los cuadrados de las componentes (en algún
sistema de coordenadas) del vector conectando estos dos puntos. El inconve-
niente con esto es que dicha noción depende del sistema coordenado que se
esté usando y por lo tanto habrá tantas distancias como sistemas coordenados
cubriendo el punto p. Esto no es más que una indicación que la estructura
que hasta este momento tenemos no contiene una noción de distancia privi-
legiada o natural. Esta debe ser introducida como una estructura adicional.
Una manera de obtener distancias infinitesimales independientes del sistema
coordenado (es decir geométricas) es introduciendo en cada punto p ∈ M un
tensor de tipo (2,0), simétrico [g(u, v) = g(v, u)∀u, v ∈ T p M ] y no degene-
rado [g(u, v) = 0∀v ∈ T p M ⇒u = 0]. Si además pedimos que este tensor sea
definido positivo [g(u, u) ≥ 0(= ⇔ u = 0)] se puede ver fácilmente que es-
te define un producto escalar en T p M (o seudoescalar si g(u, u) = 0 para algún
u 6= 0 ∈ T p M ). 2 Si hacemos una elección para este tensor en cada punto de
M de forma suave obtendremos un campo tensorial suave que se denomina la
métrica de M . Esta estructura extra, un campo tensorial con ciertas propieda-
des es lo que nos permite construir las bases matemáticas para luego edificar
gran parte de la física sobre ella.
Sea g una métrica en M , dado un punto cualquiera p de M existe un
sistema coordenado en que sus componentes son
gi j = δi j

y por lo tanto da origen al producto escalar Euclídeo, sin embargo en general


este resultado no se puede extender a un entorno del punto y en general sus
2
Posteriormente veremos que un producto escalar da origen a una distancia, correspon-
dientemente un producto seudo-escalar da origen a una seudo-distancia.

79
componentes dependerán allí de las coordenadas. Note que esto es lo que
queríamos hacer en un comienzo, pero ahora al definir esta norma vía un
vector le hemos dado un carácter invariante.
Restringiéndonos ahora a métricasp definidas positivas definiremos la nor-
ma de un vector v ∈ T p como |v| = | g (v, v)|, es decir como la distancia
infinitesimal dividida por ε entre el p y el punto γ (ε) donde γ (t ) es una curva
d γ (t )
tal que γ (0) = p, d t | t =0 = v. Análogamente podemos definir la longitud
de una curva suave γ (t ) : [0, 1] → M por la fórmula,
Z 1Æ
L(λ) = g(v, v) d t , (3.13)
0

d γ (t )
donde v(t ) = d t . Vemos entonces que definimos la longitud de una curva
midiendo las longitudes infinitesimales entre puntos cercanos de ésta y luego
integramos con respecto a t.

Ejercicio: Pruebe que la distancia L(γ ) es independiente del parámetro elegi-


do.
Definimos la distancia entre dos puntos p, q ∈ M como,

d g ( p, q) = in f |L(γ )| (3.14)
{γ (t ) : γ (0)= p,γ (1)=q}

Es decir como el ínfimo de la longitud de todas las curvas conectando p con


q.

Ejercicio: Encuentre un ejemplo de una variedad con dos puntos tales que el
ínfimo de la definición anterior no es un mínimo. Es decir en la que no haya
ninguna curva conectando los dos puntos con la mínima distancia entre ellos.

Ejercicio: a) La métrica Euclídea en lR2 es (d x)2 +(d y)2, donde {d x, d y} es la


co-base asociada con {∂ x, ∂ y}. ¿Cuál es la distancia entre dos puntos en este
caso?

Ejercicio: b) ¿Cuál es la forma de la métrica Euclídea de lR3 en coordenadas


esféricas? ¿Y en cilíndricas?

80
Ejercicio: c) La métrica de la esfera es (d θ)2+sin2 θ (d ϕ)2. ¿Cuál es la distancia
en este caso? ¿Para qué puntos p, q existen varias curvas γ i con L( γ i ) =
d ( p, q)?

Ejercicio: d) La métrica (d x)2 + (d y)2 + (d z)2 − (d t )2 en lR4 es la métrica de


Minkowski de la relatividad especial. ¿Cuál es la distancia entre el punto de
coordenadas (0, 0, 0, 0) y (1, 0, 0, 1)?
Una métrica nos da un mapa privilegiado entre el espacio de vectores
tangentes a p, T p y su dual T p∗ para cada p en M , es decir el mapa que a
cada vector v ∈ T p le asigna el co-vector g (v, ) ∈ T p . Como esto es válido
para cada p obtenemos así un mapa entre campos vectoriales y co-vectoriales.
Como g es no degenerada este mapa es invertible, es decir existe un tensor de
tipo (2, 0) simétrico g −1 tal que

g (g −1 (θ, ), ) = θ (3.15)

para todo campo co-vectorial θ. Esto indica que cuando tenemos una varie-
dad con una métrica se hace irrelevante distinguir entre vectores y co-vectores
o por ejemplo entre tensores tipo (0,2), (2,0) o (1,1).

3.5.5. Notación de Índices Abstractos


Cuando se trabaja con objetos tensoriales la notación hasta ahora usada
no es la más conveniente pues es difícil recordar cuál es el tipo de cada tensor,
en qué casilla come otros objetos, etc. Una solución es introducir un siste-
ma de coordenadas y trabajar con las componentes de los tensores, donde al
haber índices es fácil saber de qué objetos se trata o introducir bases genera-

les. De esta forma, por ejemplo representamos al vector l = l i por sus
∂ xi
componentes {l i }. Una conveniencia de esta notación es que comer pasa a
ser contraer, ya que por ejemplo representamos al vector l comiéndose a una
función f , por la contracción de las componentes coordenadas del vector y
de la diferencial de f :
Xn ∂f
l(f ) = li i
.
i=1 ∂ x
Pero un inconveniente grave de esta representación es que en principio de-
pende del sistema coordenado y por lo tanto todas las expresiones que cons-
truyamos con ella tienen el potencial peligro de depender de tal sistema.
Remediaremos esto introduciendo índices abstractos (que serán letras
latinas) que indican donde irían los índices coordenados pero nada más, es

81
decir no dependen del sistema de coordenadas y ni siquiera toman valores
numéricos, es decir l a no significa la n–tupla, (l 1, l 2, . . . , l n ) como si fuesen
índices. De esa forma l a denotará al vector l , θa al co-vector θ y gab a la
métrica g . Una contracción como por ejemplo g (v, ) se denotará gab v a y a
este covector lo denotaremos por v b , es decir la acción de gab es la de bajar
el índice a v a y dar el covector v b ≡ v a gab . Del mismo modo denotaremos a
g −1 (la inversa de g ) como g ab , es decir g con los índices subidos.
La simetría de g es entonces el equivalente a gab = g b a .

Ejercicio: ¿Cómo denotaría un tensor de tipo (2, 0) antisimétrico?

Usando índices repetidos para la contracción vemos que l ( f ) se puede


denotar por l a ∇a f donde ∇a f denota el co-vector diferencial de f , mientras
el vector ∇a f := g ab ∇ b f es llamado el gradiente de f y vemos que éste no
solo depende de f sino también de g .

3.6. Derivada Covariante

Hemos visto que en M existe la noción de la derivada de un campo es-


calar f , ésta es el co-vector diferencial de f que denotamos ∇a f . ¿Existirá
la noción de la derivada de un campo tensorial? Por ejemplo, ¿existirá una
extensión del operador ∇a a vectores tal que si l a es un vector diferenciable
luego ∇a l b sea un tensor del tipo (1,1)? Para fijar ideas definamos a esta exten-
sión del diferencial ∇a , llamada derivada covariante, pidiendo que satisfaga las
siguientes propiedades: 3
a ···a a ···a
i) Linealidad: Si Ab1 ...bk , B b 1...bk son tensores de tipo (k, l ) y α ∈ lR luego
1 l 1 l

 
a ···a a ···a a ···a a ···a
∇c αAb1 ...bk + B b 1...bk = α∇c Ab1 ...bk + ∇c B b 1...bk (3.16)
1 l 1 l 1 l 1 l

i i ) Leibnitz:
     
a1 ···ak c1 ...c m a1 ···ak c1 ...c m a1 ···ak c ...c
∇e Ab ...b Bd ...d = Ab ...b ∇e Bd ...d + ∇e Ab ...b Bd1 ...dm (3.17)
1 l 1 n 1 l 1 n 1 l 1 n

i i i) Conmutatividad con contracciones:


 
a1 ..., j ,...,ak a ..., j ,...,a
i
∇e δ j Ab ...,i,...,b = δ i j ∇e Ab1 ...,i,...,bk (3.18)
1 k 1 k

3
Note que son una extensión de las que se pide para definir derivaciones.

82
Es decir si primero contraemos algunos índices de un tensor y luego tomamos
su derivada obtenemos el mismo tensor que si tomamos primero la derivada
y luego contraemos.
i v) Consistencia con la diferencial: Si l a es un campo vectorial y f un campo
escalar, luego
l a ∇a f = l ( f ) (3.19)
v) Torsión cero: Si f es un campo escalar luego

∇a ∇ b f = ∇ b ∇a f (3.20)

Ejemplo: Sea {x i } un sistema coordenado global en lRn y sea ∇c el operador


a ···a
que cuando actúa en Ab1 ...bk general el campo tensorial que en estas coordena-
1 l
das tiene componentes.
i ...i
∂ j A j1 ... jk (3.21)
1 l

Por definición es un tensor y claramente satisface todas las condiciones de


la definición, –ya que las satisface en este sistema de coordenadas– por lo
tanto es una derivada covariante. Si tomamos otro sistema de coordenadas
obtendremos otra derivada covariante, en general distinta de la anterior. Por
ejemplo, hagamos actuar ∇c en el vector l a luego
i
∇c l a j
= ∂j l i. (3.22)

En otro sistema de coordenadas {x̄ i } este tensor tiene componentes


n ∂ x̄ l ∂ x j ∂ l i
X
l
∇c l a k = i j
(3.23)
k
i, j =1 ∂ x ∂ x̄ ∂ x

¯
las cuales no son, en general, las componentes de la derivada covariante ∇ c
que estas nuevas coordenadas definen, en efecto

€ Šl Pn   Pn  ∂ x̄ l 
¯ la ∂ l¯l ∂ xj ∂ i
∇ c ≡ = j =1 i=1
l =
k ∂ x̄ k ∂ x̄ k ∂ xj ∂ xi

Pn    Pn  
∂ x̄ l ∂ xj ∂ li ∂ xj ∂ 2 x̄ l
= i , j =1
+ i, j =1 ∂ x̄ k
li (3.24)
∂ xi ∂ x̄ k ∂ xj ∂ x j ∂ xi

i Pn  
∂ xj ∂ 2 x̄ l
= ∇c l a j + i, j =1 ∂ x̄ k
li,
∂ x j ∂ xi

83
lo que muestra claramente que son dos tensores distintos y que su diferencia
es un tensor que depende linealmente y no diferencialmente de l a . ¿Es esto
¯ , ¿es su diferencia
cierto en general? Es decir, dada dos conexiones, ∇c y ∇ c
un tensor (y no un operador diferencial)? Veremos que esto es cierto.

Teorema 3.2 La diferencia entre dos conexiones es un tensor.

Prueba: Note que por propiedad i i i) y i v) de la definición, si sabemos cómo


actúa ∇c en co-vectores sabemos cómo actúa en vectores y así por i) y i i )
en cualquier tensor. En efecto, si conocemos ∇c wa para cualquier wa luego
∇c l a es el tensor de tipo (1,1) tal que cuando contraído con un wa arbitrario
nos da el co-vector
  
∇c l a wa = ∇c wa l a − l a ∇c wa , (3.25)

el cual conocemos ya que por i v) también sabemos cómo actúa ∇c en escala-


res. Por lo tanto es suficiente ver que
€ Š
¯ −∇ w =Cb w
∇ (3.26)
c c a ca b

b
€ algúnŠtensor C ca . Probemos primero que dado cualquier p ∈ M ,
para
∇¯ − ∇ w | depende solo de w | y no de su derivada. Sea w ′ cualquier
c c a p a p a
otro co-vector tal que en p coinciden, es decir (wa − wa′ )| p = 0. Luego da-
da una co-base suave {µai } en un entorno de p tendremos que wa − wa′ =
P i i i
i f µa con f funciones suaves que se anulan en p. En p tenemos entonces
€ Š € Š P ¯ € i iŠ P € Š
∇¯ w − w′ − ∇ w − w′ = ∇ f µ − ∇ f i i
µ
c a c a
a a Pi ic € ¯ ai i Šc a
= µ ∇ f −∇ f i =0
i a c c
(3.27)
¯
ya que por iv) ∇c y ∇c deben actuar del mismo modo en escalares –y en
particular en las f i –. Esto muestra que
€ Š € Š
¯ − ∇ w′ = ∇
∇ ¯ −∇ w (3.28)
c c a c c a
€ Š
y por lo tanto que ∇ ¯ − ∇ w depende de solo w | y obviamente en for-
c
€ c a
Š a p
¯
ma lineal. Pero entonces ∇c − ∇c debe ser un tensor de tipo (1,2) que está
€ Š
esperando comerse una forma para darnos el tensor de tipo (0,2) ∇¯ −∇ w .
c c a
€ Š
¯ b
Es decir ∇c − ∇c wa = C ca w b , lo que prueba el teorema.

84
Note que condición v) nos dice que ∇a ∇ b f = ∇ b ∇a f , tomando wa =
∇a f obtenemos

¯ ∇¯ ¯ ∇ f
∇ a bf = ∇ a b
= ¯ w
∇ a b
c (3.29)
= ∇a w b + Cab ∇c f
c
= ∇a ∇ b f + Cab ∇c f .

Como ∇c f | p puede ser un co-vector cualquiera vemos que la condición de


que no haya torsión implica que C c ab es simétrico en los índices inferiores,
C c ab = C c b a .
€ Š
Ejercicio: ¿Cómo actúa ∇¯ − ∇ en vectores?
c c

Ejercicio: Exprese el corchete de Lie en términos de una conexión cualquiera


y luego pruebe explícitamente que no depende de la conexión empleada.

Ejercicio: Sea Ab ,...,z un tensor totalmente antisimétrico. Muestre que ∇[a Ab ,...,z] ,
es decir la antisimetrización total de ∇a Ab ,...,z , no depende de la derivada co-
variante empleada.

La diferencia entre una conexión cualquiera ∇c y una proveniente de un


sistema de coordenadas {x i } es un tensor llamado símbolo de Christoffel de
∇c con respecto a las coordenadas {x i }, Γca
b
,

b
∇c wa = ∂c wa + Γca wb . (3.30)

El conocimiento de este tensor es muy útil en la práctica, pues nos permite


expresar ∇c en término de la conexión coordenada correspondiente, ∂c .
Como hemos visto en una variedad M existen infinitas formas de tomar
la derivada de un tensor. ¿Hay alguna natural o privilegiada? La respuesta es
no, a menos que pongamos más estructura en M . Intuitivamente la razón de
esto es que en M no sabemos comparar l a | p con l a |q si p y q son dos puntos
distintos. 4
¿Es suficiente la presencia de una métrica en M para poder realizar esta
comparación? ¡La respuesta es sí!
4
Note que una manera de comparar vectores infinitesimalmente cercanos, dado un campo
vectorial m a , es con el corchete de Lie de m a con l a , [m, l ]a . Esto no es lo apropiado ya que
[m, l ]a | p depende de la derivada de m a en p.

85
Teorema 3.3 Sea gab una métrica (suave) en M , luego existe una única derivada
covariante ∇c tal que ∇c gab = 0.

Prueba: Sea ∇ ¯ una conexión cualquiera y sea ∇ tal que ∇ g = 0, es sufi-


c c c ab
ciente mostrar que esta condición determina unívocamente el tensor diferen-
cia, C d ca . Pero,
¯ g −Cd g −Cd g
0 = ∇a g b c = ∇ (3.31)
a bc ab d c ac b d

o sea
¯ g
Ccab + C b ac = ∇ (3.32)
a bc

pero también
a↔b Cc b a + Cab c ¯ g
= ∇ b ac (3.33)
c↔b C b ca + Cac b ¯
= ∇c gab .
Sumando estos dos últimos, sustrayendo la primera y usando la simetría de
los dos últimos índices obtenemos
¯ g +∇
2Cab c = ∇ ¯ g −∇¯ g (3.34)
b ac c ab a bc

o
1
Cabc = ¯ g +∇
g ad {∇ ¯ g −∇¯ g } (3.35)
b dc c db d bc
2
Nótese que la existencia de una métrica no es equivalente a la existencia de
una conexión. Hay conexiones ∇c para las cuales no existe ninguna métrica
gab tal que ∇a g b c = 0, es decir hay tensores C a b c para los cuales no hay
ninguna gab que satisfaga (3.35).

¯ es una derivada correspondiente a un sistema de coordenadas


Ejercicio: Si ∇ c
¯
∇c = ∂c el símbolo de Christoffel correspondiente es
1
Γa b c = g ad {∂ b gd c + ∂c gd b − ∂d g b c }. (3.36)
2
Muestre que sus componentes en ese sistema de coordenadas están dadas por,
1
Γi j k = g i l {∂ j g l k + ∂k g l j − ∂ l g j k }, (3.37)
2
donde gi j son las componentes de la métrica en el mismo sistema de coorde-
nadas.

86
Ejercicio: La métrica Euclídea de lR3 en coordenadas esféricas es

d s 2 = (d r )2 + r 2((d θ)2 + s e n 2θ(d ϕ)2).

Calcule el Laplaciano ∆ = g ab ∇a ∇ b en estas coordenadas.

*El tensor de Riemann


¿Dada una derivada covariante en una variedad, es posible definir campos ten-
soriales que solo dependan de ella y por lo tanto que nos den información
sobre ésta?
¡La respuesta es sí! El siguiente tensor se denomina tensor de Riemann o de
Curvatura y solo depende de la conexión:

2∇[a ∇ b ] l c := ∇a ∇ b − ∇ b ∇a l c := Rc d ab l d ∀l c ∈ T M .

Ejercicio: Muestre que la definición de arriba tiene sentido, es decir que el


lado izquierdo, evaluado en un punto p cualquiera de M solo depende de l c | p
y por lo tanto podemos escribir el lado derecho para algún tensor Rc d ab .

¯ otra derivada covariante. Calcule la diferencia entre los res-


Ejercicio: Sea ∇ a
pectivos tensores de Riemann en términos del tensor que aparece como dife-
rencia de las dos conexiones.

Notas bibliográficas: Recomiendo el libro de Wald [6], sobre todo por su


notación moderna, ver también [21]. El lenguaje de la intuición es la geo-
metría, es la herramienta que nos permite visualizar los problemas, tocarlos,
darlos vuelta a nuestro gusto y luego reducirlos al álgebra. Entender la geome-
tría es la forma más eficiente de entender la física ya que ésta solo se entiende
cabalmente cuando es traducida a un lenguaje geométrico. No abuse de ella,
es un área muy vasta y es fácil perderse, aprenda bien lo básico y luego solo
lo que le sea relevante.

87
88
CAPÍTULO 4

ECUACIONES DIFERENCIALES ORDINARIAS

4.1. Introducción

En este capítulo comenzaremos el estudio de los sistemas de ecuaciones


diferenciales en derivadas ordinarias –EDO de ahora en más–. Estos siste-
mas aparecen constantemente en física y conjuntamente con los sistemas de
ecuaciones diferenciales en derivadas parciales, –EDP de ahora en más– que
estudiaremos en la segunda parte de este curso, forman el esqueleto matemá-
tico de las ciencias exactas. Esto se debe a que la mayoría de los fenómenos
físicos se pueden describir en término de estas ecuaciones. Si el parámetro
libre –o variable independiente– tiene la interpretación de ser un tiempo, en-
tonces estamos frente a ecuaciones de evolución. Estas nos permiten, para
cada estado inicial del sistema, conocer su evolución temporal, es decir nos
dan la capacidad de hacer predicciones a partir de condiciones iniciales, lo
cual es el aspecto característico de toda teoría física. 1
Existen otros fenómenos físicos descriptos por EDO que no tienen un
carácter evolutivo. En general en estos casos estamos interesados en estados
de equilibrio del sistema. Por ejemplo si queremos ver qué figura describe la
cuerda de secar la ropa que tenemos en casa. Estos casos no serán incluidos
en la teoría de EDO que desarrollaremos a continuación, sino que sus casos
más sencillos serán tratados como casos especiales (unidimensionales) de las
EDP elípticas.
Si bien la física cuántica, o más precisamente la teoría de campos cuán-
ticos, nos muestra que una descripción de los fenómenos físicos a esa escala
microscópica no es posible por medio de los sistemas de ecuaciones diferen-
ciales ya mencionados, usualmente nos ingeniamos para encontrar aspectos
1
En algunos casos se da que la variable independiente no es el tiempo sino algún otro
parámetro, pero la ecuación también puede ser considerada como describiendo evolución.
Por ejemplo si queremos ver cómo varía la densidad de un medio al aumentar la temperatura.

89
parciales de estos fenómenos, o ciertas aproximaciones en donde sí es posible
una descripción en término de estos sistemas. Esto no se debe a un capricho
o empecinamiento, sino al hecho de que nuestro conocimiento de las EDO,
y en menor medida de las EDP, es bastante profundo, lo cual nos permite
manejarlas con relativa facilidad y comodidad. Por otro lado, y es importante
remarcarlo, nuestro conocimiento del tipo de ecuaciones que aparecen en las
teorías de campos cuánticos no-lineales es, en comparación, prácticamente
nulo.

4.2. El Caso de una Única Ecuación Ordinaria de Primer Orden

4.2.1. Ecuación Autónoma de Primer Orden


Esta tiene la forma:
dx
ẋ = = f (x) (4.1)
dt
o sea una ecuación para un mapa x(t ) : I ⊂ lR → U ⊂ lR.
Supondremos f : U → lR continua. Una solución de esta ecuación será un
mapa diferenciable ϕ(t ) definido para todo I y con imagen en U . Diremos
que ϕ(t ) satisface la condición inicial x0 en t = t0 ∈ I si
ϕ(t0) = x0. (4.2)
Como veremos a continuación bajo ciertas hipótesis la condición inicial que
una solución cumple la determina unívocamente.
La ecuación 4.1 se puede interpretar geométricamente de la siguiente for-
ma. En cada punto del plano (x, t ) marcamos una rayita", es decir un campo
de direcciones de tal forma que el ángulo que forma con el eje x =cte tenga
tangente igual a f (x) .
1
Ejemplo: ẋ = x 2 . [Ver figura (4.1).]
Como ϕ(t ) tiene derivada f (ϕ(t )) , en el punto (ϕ(t ), t ) , ϕ(t ) será tan-
gente a la rayita en ese punto. Si nos paramos en algún punto (x0, t0) por
donde ésta pase podremos encontrar la solución siguiendo las rayitas. Por lo
tanto vemos que dado un punto por donde la solución pasa, siguiendo una
rayita determinaremos una única solución. Esto en particular nos dice que
en este gráfico la mayoría de las soluciones no se cortan. Como veremos más
adelante la unicidad de la solución se da si la rayita en cada punto tiene una
tangente no nula. Por otro lado, es claro del caso en la figura anterior, 4.1, que
si comenzaremos con el punto (x0 = 0, t0) tendríamos dos opciones, o bien
dibujar la línea ya dibujada (t 2, t ) o simplemente la línea (0, t ).

90
x

t
Figura 4.1: Interpretación geométrica de la ecuación f (x) = x 1/2.

Ejercicio: Extender esta intuición gráfica al caso ẋ = f (x, t ).

Ejemplo: De hecho la ecuación ẋ = x 1/2 tiene dos soluciones que pasan por
(0, 0) ,
t2
ϕ(t ) = 0 y ϕ = (4.3)
4
dx 1/2
En efecto, supongamos x(t ) 6= 0 entonces = d t o 2(x 1/2 − x0 ) =
x 1/2
t − t0 , tomando x0 = t0 = 0
 2
t
x= (4.4)
2
La otra es trivialmente una solución.

La unicidad de las soluciones se obtiene, aun en el caso en que f (x) se


anula, si en vez de pedir que f (x) sea continua se pide un poquito más, y eso
es que, donde se anula, digamos en x0 , se cumpla que
Zx
dx
lı́m = ∞, (4.5)
ε→0 x +ǫ f (x)
0

o alternativamente que para ε > 0 suficientemente pequeño, exista k > 0 tal


que,
| f (x)| < k | x − x0 | si | x − x0 |< ε. (4.6)

91
O sea que f (x) vaya a cero cuando x → x0 a lo sumo tan rápidamente
como una función líneal. Esta condición se llama condición de Lipschitz. De
ahora en más supondremos que f (x) es diferenciable y por lo tanto Lipschitz.

Ejercicio: Vea que esta condición es más débil que pedir que f sea diferencia-
ble en x0.
Solución: La función f (x) = x sin( x1 ) es Lipschitz en x+0 pero no es diferen-
ciable.
Así llegamos a nuestro primer teorema sobre ecuaciones ordinarias.

Teorema 4.1 Sea f (x) : U → lR continua y Lipschitz en los puntos donde se


anula. Luego
i) Por cada t0 ∈ lR , x0 ∈ U existe un intervalo I t0 ∈ lR y una solución ϕ(t )
de la ecuación 4.1 definida ∀ t ∈ I t0 y la condición inicial ϕ(t0) = x0 ;
ii) Dos soluciones cualesquiera ϕ1, ϕ2 de 4.1 satisfaciendo la misma condición
inicial coinciden en algún entorno de t = t0
iii) la solución ϕ de 4.1 es tal que
Z ϕ(t )
dx
t − t0 = si f (x) 6= 0 (4.7)
x0 f (x)

Nota: La solución cuya existencia asegura este teorema es válida en un inter-


valo I t0 abierto, que el teorema no determina. Por lo tanto la unicidad se da
solo en el máximo intervalo que esas tienen en común.

Prueba:
Si f (x0) = 0 luego ϕ(t ) = x0 es una solución.
Si f (x0) 6= 0 luego por continuidad existe un entorno de x0 donde f (x) 6=
0 y por lo tanto 1/ f (x) es una función continua, esto implica que la integral
en 4.29 es una función diferenciable de sus extremos de integración, los que
llamaremos ψ(x) − ψ(x0) .
Por lo tanto tenemos,
t − t0 = ψ(x) − ψ(x0) (4.8)
O sea dado x obtenemos t y además esta relación se cumple automáticamente
que cuando x = x0, t = t0. Queremos ahora despejar x de esta relación, es
decir encontrar φ(t ).
Pero
d ψ 1
= 6= 0 , (4.9)
dx x=ζ
f (ζ )

92
Por lo tanto el teorema de la función inversa nos asegura que existe un I t0 y
una única ϕ(t ) diferenciable, definida para todo t ∈ I t0 y tal que ϕ(t0) = x0 y
t − t0 = ψ(ϕ(t )) − ψ(x0). Formando su derivada obtenemos,
– ™
dϕ d ψ−1 1 −1
= = = f (ϕ(t )) (4.10)
dt d t x=ϕ(t ) f (x)
x=ϕ(t )

lo que demuestra que es una solución, necesariamente única de 4.1 con la


condición inicial apropiada.
Solo resta ver que en el caso en que f (x0) = 0 la solución es única. Para
ello utilizaremos el siguiente Lema.

Lema 4.1 Sean f1 y f2 funciones reales en U ⊂ lR tal que f1(x) < f2(x) ∀ x ∈
U y sean ϕ 1 y ϕ 2 respectivas soluciones a las ecuaciones diferenciales que éstas
generan, definidas en un intervalo I ∈ lR y tal que ϕ 1(t1) = ϕ 2(t1) para algún
t1 ∈ I . Luego
ϕ 1(t ) ≤ ϕ 2(t ) ∀ t > t1 ∈ I (4.11)

Prueba: Trivial, el que corre más rápido en cada sector del camino gana! Sea
el conjunto S = {t > t1 ∈ I |φ1(t ) > φ2(t )}. Sea T ≥ t1, T ∈ I la mayor de las
cotas inferiores de S. En este instante ϕ 1(T ) = ϕ 2(T ), pero

d ϕ 1 d ϕ 2
< (4.12)
d t t =T d t t =T

Por lo tanto existe ǫ > 0 tal que para todo t ∈ [T , ǫ), ϕ 1(t ) < ϕ 2(t ) lo que es
una contradicción, a menos que sea el último valor en I .
Con la ayuda de este Lema probaremos la unicidad de la solución. Sea
ϕ 1(t ) una solución con ϕ 1(t0) = x0 pero distinta de la solución ϕ(t ) = x0 ∀ t .
Supongamos entonces que existe t1 > t0 tal que ϕ 1(t1) = x1 > x0, los otros
casos se tratan similarmente. [Ver figura 4.3.]
Si elegimos x1 bastante próximo a x0 se cumple

f (x) < k | x − x0 | ∀ x0 ≤ x ≤ x1 (4.13)

y por lo tanto que ϕ 2(t ) < ϕ 1(t ), ∀ t0 ≤ t ≤ t1, donde ϕ 2(t ) es la solución
de la ecuación ẋ = k(x − x0) con condición inicial ϕ 2(t1) = x1. Pero ϕ 2(t ) =

93
x

φ1

x1
φ2

x0
t0 t1 t

Figura 4.2: Prueba del Lema 4.1.

x
φ2

φ1
U

t0 t

Figura 4.3: Prueba de la unicidad de la solución.

94
x0 +(x1 − x0) ek(t −t1) que tiende a x0 sólo cuando t → −∞. Por lo tanto ϕ 1(t )
no puede tomar el valor x0 para ningún t < t1 finito y por lo tanto tenemos
una contradicción ♠
La solución cuya existencia y unicidad acabamos de demostrar no sólo se
puede pensar como un mapa entre I t0 y U sino también como un mapa g xt
entre Ux0 × I t0 y U (Ux0 entorno de x0). El mapa g xt lleva (x, t ) al punto ϕ(t )
donde ϕ es la solución de 4.1 con condición inicial ϕ(0) = x.
Estos mapas, o difeomorfismos locales, se denominan flujos de fase lo-
cales, (ya que en general no se pueden definir en todo I t0 × U ) y satisfacen la
siguiente importante propiedad de grupo; si t , s ∈ I0 luego g s+t
x
= g s o g xt .
Por la forma en que aparecen las condiciones iniciales en el Teorema an-
terior es fácil ver, usando nuevamente el teorema de la función inversa, que si
f (x0) 6= 0 luego g xt es diferenciable también con respecto a x.

Corolario 4.1 si f (x0) 6= 0 luego g xt : Ux0 × I t0 → U es diferenciable en ambos


t y x.

Nota: La restricción f (x0) 6= 0 es innecesaria como veremos más adelante.

Del uso del Teorema de la función inversa en el Teorema 4.1 también si-
gue que si consideramos el conjunto de las soluciones distinguiendo cada una
por su condición inicial, [ϕ(x0, t0, t ) es la solución que satisface ϕ(t0) = x0],
luego la función ϕ(x0, t0, t ) : U × I × I → U es diferencible con respecto a
todos los argumentos. Es decir que si cambiamos levemente las condiciones
iniciales, luego la solución solo cambiará levemente. Más adelante daremos
una prueba de todas las propiedades, incluyendo el Teorema 4.1 para los sis-
temas generales, o sea la ecuación 4.30.

Ejemplo: Sea x(t ) el número de bacterias en un vaso de cultivo al tiempo t . Si


el número es lo suficientemente grande podemos pensarla como una función
suave, diferenciable. Si a su vez este número no es tan grande de modo que
su densidad en el vaso sea lo suficientemente baja como para que éstas no
tengan que competir por aire y alimento, luego su reproducción es tal que
x(t ) satisface la ecuación,
1
ẋ = a x a = cte. ≃ 2,3 , (4.14)
día
o sea la velocidad de crecimiento es proporcional a la cantidad de bacterias
presentes. La constante a es la diferencia entre la tasa de reproducción y la de

95
extinción. Aplicando el Teorema 4.1 sabemos que la ecuación nos permite,
dado el número de bacterias x0 al tiempo t0, conocer el número de éstas para
todo tiempo. En efecto la solución de 4.14 es

dx
=a dt (4.15)
x

Integrando ambas partes

x
ln = a (t − t0) o; x(t ) = x0 ea (t −t0) (4.16)
x0

O sea que el número de bacterias crece exponencialmente, a menos por


supuesto de que x0 = 0, y depende continuamente del número inicial. Se debe
advertir que si bien la dependencia es continua la diferencia entre soluciones
con condiciones iniciales distintas crece exponencialmente.
El flujo de fase es en este caso g xt = x ea t y aquí es global. Con ese creci-
miento es fácil darse cuenta que en pocos días el número de bacterias y por lo
tanto su densidad será tan grande que éstas entrarán a competir entre sí por
el alimento lo cual hará disminuir la velocidad de crecimiento. Se observa
experimentalmente que este hecho se puede tomar en cuenta incluyendo en
la 4.14 un término proporcional al cuadrado del número de bacterias.

a
ẋ = a x − b x 2 b= . (4.17)
375
Si x es pequeña el primer término domina y x comienza a crecer, como
ya vimos, en forma exponencial hasta que el segundo término comienza a ser
importante y la velocidad de crecimiento decrece tendiendo a cero cuando
x = x s tal que a x s − b x s2 = 0 o a− b x s = 0 o x s = a/b ≃ 375 bacterias. Como
ϕ(t ) = x s es una solución , debido a la unicidad, la solución que tiende a x s
que describimos arriba no puede alcanzar el valor x s en un tiempo finito. Si el
número de bacterias presentes es mayor que 375 la velocidad de crecimiento
será negativa y la solución nuevamente tenderá asintóticamente a x s
La solución general de 4.17 puede ser obtenida de forma análoga a la
de 4.14 y es,
a/b
x(t ) = (4.18)
1 + ( bax − 1)e−a(t −t0)
0

lo cual confirma el análisis anterior.

96
x

a/b

Figura 4.4: Distintas soluciones de la ecuación de crecimiento bacteriano:


ϕ 1(t0) = 0, ϕ 2(t0) = x s = ba , ϕ 3(t ) = x0 < x s y ϕ 4(t ) = x0 > x s

Este ejemplo nos permite introducir dos conceptos claves en el área. El


primero es el de solución estacionaria o de equilibrio . Estas son las solucio-
nes constantes o sea son tales que ẋ s = f (x s ) = 0 o sea las raíces de la función
f (x). Para la ecuación 4.14 x s = 0 , para la ecuación 4.17 x s = 0 y a/b .
Note que no siempre existen soluciones estacionarias, por ejemplo la
ecuación con f (x) = 1 no las tiene, pero cuando existen el problema de en-
contrarlas se reduce a resolver una ecuación a lo sumo trascendente. Debido
a la unicidad de las soluciones, esto nos permite dividir el plano (x, t ) en fran-
jas tales que si una solución tiene condiciones iniciales en esta franja ésta debe
permanecer en ella.
El segundo concepto es la estabilidad de estas soluciones. La solución
x s = 0 de 4.14 y 4.17 no es estable en el sentido que si elegimos como condi-
ción inicial un punto en cualquier entorno de esta solución, la solución co-
rrespondiente se apartará inicialmente en forma exponencial de la anterior.
Por lo contrario la solución de 4.17 x s = a/b es estable en el sentido que si
tomamos valores iniciales próximos a ésta las soluciones correspondientes se
aproximarán asintóticamente (en el futuro) a la anterior.
Las soluciones inestables no tienen interés físico ya que la más mínima
perturbación del sistema originará una solución que se alejará rápidamente
de la solución inestable. Esto no es así en el ejemplo anterior pues el número
de bacterias es discreto y la ecuación solo representa una aproximación. Si
el vaso de cultivo está esterilizado y herméticamente cerrado luego no hay
posibilidad de crecimiento bacteriano. Más adelante analizaremos en detalle
el problema de la estabilidad.

97
4.2.2. Extendiendo la Solución Local
Si nos olvidamos del modelo físico que describimos con 4.17 y tomamos
a/b −z
zo < 0, to = 0, por ejemplo, habrá un tiempo máximo, td = a1 ln[ −z o ],
o
finito para el cual la solución diverge, es decir,

lı́m z(t ) = ∞. (4.19)


t →td

Esto muestra que el teorema anterior solo puede asegurar la existencia de


un intervalo I para el cual la solución existe. Lo máximo que podemos con-
cluir en forma general, es decir sin que se dé más información sobre f , es el
siguiente Corolario del Teorema 4.1.

Corolario 4.2 Sea U ⊂ lR el dominio de definición de f, Uc un intervalo com-


pacto [es decir cerrado y acotado] de U , zo ∈ Uc . Luego la solución (ϕ(zo , to , t ), I )
de la ecuación 4.1 puede ser extendida o bien indefinidamente o bien hasta la
frontera de Uc . Esta extensión es única en el sentido que cualquier par de so-
luciones, (ϕ 1(zo , to , t ), I1), ϕ 2(zo , to , t ), I2) coinciden en la intersección de sus
intervalos de definición, I = I1 ∩ I2.

Prueba: Primero probamos la versión global de la unicidad de la solución. Sea


T la menor de las cotas superiores del conjunto {τ | ϕ1(zo , t ) = ϕ2(zo , t ) ∀ to ≤
t ≤ τ}. Supongamos en contradicción que T es un punto interior de I1 ∩ I2.
Por continuidad tenemos, ϕ1(zo , T ) = ϕ2(zo , T ), pero por el resultado del
Teorema 4.1 , usando condiciones iniciales ϕ1(zo , T ), en T vemos que ambas
soluciones deben coincidir en un entorno de T , lo que contradice que T sea
el máximo. Así es que T debe ser un extremo de alguno de los intervalos de
definición por lo que las soluciones coinciden en I1 ∩ I2 ∩ {t |t ≥ to }. El caso
t ≤ to se trata similarmente y por lo tanto las soluciones coinciden en todo
I1 ∩ I2.
Segundo construimos la extensión. La idea es que si dos soluciones coin-
ciden en I1 ∩ I2 luego las podemos combinar y formar una en I1 ∪ I2,

ϕ 1(t ) ∀t ∈ I1
ϕ(t ) = (4.20)
ϕ 2(t ) ∀t ∈ I2.

Sea T la cota superior mínima de {τ|ϕ(t ) existe y está contenida en


Uc ∀ to ≤ t ≤ τ}. Si T = ∞ no hay nada que probar, por lo tanto supon-
gamos T < ∞. Probaremos que existe ϕ(t ) definida para todo to ≤ t ≤ T
y tal que ϕ(T ) es uno de los extremos de Uc . El Corolario 4.1 nos dice que

98
φ1
x
φ2

U
x0

t0 τ t

Figura 4.5: Unicidad global.

φ φ̂
φ′
Uc
φ φ̃

I2
I1 T −ǫ τ T

Figura 4.6: Extendiendo la solución.

99
dado cualquier ẑ ∈ U , existen ε ẑ > 0 y un entorno de ẑ, V ẑ ⊂ U tal que
para cualquier z ∈ V ẑ existe una solución con condiciones iniciales ϕ(to ) = z
definida para todo t en |t − to | < ε ẑ . Como USc es compacto podemos elegir
un número finito de puntos ẑi tal que Uc ⊂ V ẑi . Sea ε > 0 el mínimo de
los ε ẑi . Como T es la cota superior mínima existe τ entre T − ε y T tal que
ϕ(t ) ∈ Uc ∀ to ≤ t ≤ τ, pero como ϕ(τ) ∈ Uc está en alguno de los V ẑi existe
una solución ϕ̂(t ) definida para todo t en |t − τ| < ε con condición inicial
ϕ̂(τ) = ϕ(τ). Usando ϕ̂(t ) podemos ahora extender ϕ, cuya extensión llama-
remos ϕ̃, al intervalo to ≤ t < τ + ε. Pero ϕ̃(θ) ∈ Uc ∀ to < θ < T ya que
ϕ̃(θ) = ϕ(θ) ∈ Uc , y de otro modo T no sería una cota superior mínima.
Por continuidad ϕ̃(T ) ∈ Uc y como por definición de T para todo intervalo
abierto, IT , conteniendo T , ϕ̃[IT ] 6∈ Uc concluimos que ϕ̃(T ) es un extremo
de Uc ♠

4.2.3. El Caso No-autónomo


Este es el caso en que en vez de 4.1 tenemos
d ż
= f (z, t ). (4.21)
dt
La interpretación geométrica es la misma, sólo que ahora las rayitas tienen
un ángulo que depende también de la variable t, por lo tanto esperamos que si
comenzamos en un punto (to , zo ) y trazamos una curva tangente a las rayitas
obtendremos también una única solución. Este es en realidad el caso, pero su
discusión estará comprendida en la teoría general de sistemas autónomos de
primer orden que enunciaremos más adelante.
Suponiendo ciertas condiciones para f (z, t ) –por ejemplo que sea Lips-
chitz con respecto a ambas variables – se puede ver que también existen flujos
locales, pero éstos ahora dependen también de to y no solo de la diferencia
entre el tiempo inicial y el final. Denotaremos a estos flujos como, g tt (z) y la
o
t
propiedad de semigrupo que cumplen es g tt ◦ g t 1 (z) = g tt (z).
1 o o
Hay una clase especial de ecuaciones no-autónomas que se puede redu-
cir al ya estudiado. Esta es la clase donde f (z, t ) se puede escribir como el
cociente de dos funciones, una de z y otra de t ,
g (z)
f (z, t ) = . (4.22)
h(t )
En este caso la interpretación geométrica es que el parámetro t no es el más
indicado para describir este sistema. Esto se remedia eligiendo otro parámetro

100
dτ 1
τ dado por, dt
= h(t )
,o
Z t dt
τ − τo = . (4.23)
to h(t )
Una vez que se obtiene t (τ) [Ver el Teorema 4.1] debemos resolver,
dz
= g (z(τ)), (4.24)

[Usando nuevamente el Teorema 4.1], obteniendo ϕ(τ). La solución con res-
pecto al parámetro original se obtiene definiendo ϕ(t ) = ϕ(τ(t )).

4.3. Reducción a Sistemas de Primer Orden

Definición: La ecuación diferencial ordinaria general de orden m es una


ecuación de la forma:
F (x, x (1) , . . . , x (m) , t ) = 0 (4.25)
Es decir una ecuación implícita de x, un mapa entre I˜ ⊂ lR y Ũ ⊂ lR m×n ,
i
(o sea x es un vector de n componentes), y sus derivadas (donde x (i) ≡ d xi ]
dt
denota la i-ésima derivada con respecto al parámetro independiente, t ) hasta
el orden n 2.

Definición: Diremos que el mapa m–veces diferenciable x(t ) : I → lRn es una


solución de la ecuación anterior si F evaluada en este mapa está bien definida
y es idénticamente nula en todo el intervalo I .
En este curso supondremos que 4.25 puede ser resuelta para x m , o sea
que 4.25 es equivalente a la siguiente ecuación:
x (n) = f (x, x (1) , . . . , x (n−1) , t ) (4.26)
en abiertos I ⊂ I˜ ⊂ lR y U ⊂ Ũ ⊂ lR m

Ejemplo: La EDO F (x, x (1) , t ) = ((x (1) )2 −1) = 0 implica una de las siguientes
EDO en nuestro sentido:
x (1) = 1
o (4.27)
x = −1
(1)

2
En realidad para definir correctamente 4.25 se deben dar los abiertos Ũ i para la i -ésima
derivada con respecto a x donde F está definida.

101
Si conocemos los valores de x y sus derivadas hasta el (m − 1)-ésimo or-
den en un punto t0 entonces la ecuación 4.26 nos permite conocer la m-ésima
derivada en dicho punto. Si suponemos que f es continua entonces esto nos
permite conocer x y sus derivadas hasta el (m − 1)-ésimo orden en un punto
t0 +ǫ suficientemente cercano (el error en que incurriremos será del orden de
ǫ× derivadas de f ), pero entonces podemos usar nuevamente la ecuación 4.26
y así conocer aproximadamente la n-ésima derivada de x en t0 +ǫ. Prosiguien-
do de este modo podemos lograr una solución aproximada en un intervalo
dado. Al menos intuitivamente, parecería que haciendo el intervalo ǫ cada
vez más pequeño deberíamos obtener una solución. ¡Esto en realidad es así!
Y lo probaremos más adelante en el curso. Lo importante por el momento
es el hecho de que para obtener una solución debemos dar en un punto t0
el valor de todas las derivadas de la variable incógnita de orden menor de la
que determina el sistema, es decir de la que aparece en el lado izquierdo de la
ecuación 4.26.

Introduciendo ũ 1 ≡ x , ũ 2 ≡ x (1) , . . . , ũ n ≡ x (m−1) , podemos escri-


bir 4.26 de la forma:
1
ũ˙ = ũ 2
2
ũ˙ = ũ 3
.. (4.28)
.
m
ũ˙ = f ( ũ 1, ũ 2, . . . , ũ m , t )

donde hemos denotado con un punto sobre la función su derivada con respec-
to al parámetro t . Por lo tanto 4.26 es equivalente a una ecuación de primer
orden para el vector de vectores ũ ⊂ U ⊂ lRn×m ,

ũ˙ = Ṽ (ũ, t ) (4.29)


donde Ṽ es también un vector en algún subconjunto de lRn×m . Si Ṽ ( ũ, t )
depende explícitamente de t entonces podemos agregarle a ũ otra compo-
nente, la (n × m + 1)-ésima con ũ n×m+1 = t , y por lo tanto tenemos que
n×m+1)
ũ˙ = 1. La ecuación 4.29, más esta última ecuación, toman la forma ,

u̇ = V (u) , (4.30)

donde u = (ũ, ũ n×m+1) y


¨
Ṽ i (ũ, ũ n×m+1) si 1 ≤ i ≤ m × n
V i (u) = (4.31)
1 si i = n × m + 1) ,

102
un mapa entre U ⊂ lRn×m+1 y lRn×m+1.
Así es que arribamos al siguiente teorema.

Teorema 4.2 (de Reducción) Si la función f del sistema 4.26 de m ecuaciones


diferenciales ordinarias de orden n es diferenciable, luego este sistema es equiva-
lente a un sistema de m × n + 1 ecuaciones diferenciales ordinarias de primer
orden que no dependen explícitamente de la variable independiente. Es decir por
cada solución del sistema 4.26 podemos construir una solución del sistema 4.30 y
viceversa.

Prueba: Claramente dada una solución del sistema 4.26 suficientemente dife-
renciable podemos escribir con ella un vector u y éste satisfará (porque así lo
construimos) el correspondiente sistema 4.30. Por lo tanto toda solución del
sistema original es solución del sistema de primer orden asociado a él.
Para probar el inverso, es decir que toda solución u(t ) del sistema 4.30
da origen a una del sistema 4.26, solo es necesario tomar repetidas derivadas
de las primeras componentes, x(t ) = u 1(t ), e ir usando las ecuaciones en
el correspondiente orden hasta obtener el sistema original satisfecho por la
enésima derivada de x(t ) ♠
Este teorema es importante pues nos permite abarcar toda la teoría gene-
ral de las ODE a partir del estudio de la ecuación 4.30, la cual como veremos
tiene un sentido geométrico claro. Sin embargo se debe tener en cuenta que
muchas veces en física aparecen subclases de ecuaciones muy especiales con
propiedades particulares de mucha importancia física que la teoría general no
contempla.

Ejemplo: Péndulo Matemático

ẍ = k x u 1 = x , u 2 = ẋ
    
d u1 0 1 u1
= (4.32)
dt u2 k 0 u2

Note que si u = γ (t ) : I → U es una solución de 4.30 luego ∀s ∈ lR tal


que t + s ∈ I , γ (t + s) es también una solución. En efecto,

d d

γ (t + s) = γ (t ) = V (γ (to + s)) = V (γ (t + s))| t =t . (4.33)
dt d t o
t =t
o t =t +s
o

103
Debido a esto de ahora en más tomaremos to , el punto donde daremos la
condición inicial, igual a cero.

Ejercicio: Si u = sin(t ) : lR → [0, 1], es una solución de 4.30 pruebe que


u = cos(t ) también lo es.

4.4. Sistemas de EDO

¿Tienen los sistemas de EDO una interpretación geométrica? Como ya


vimos estos tienen la forma genérica.

d xi
= v i (x j ) i = 1, . . . , n. (4.34)
dt

Sea γ (t ) una curva entre un intervalo I ∈ lR y M una variedad de n dimen-


siones. Sea p = γ (t0) un punto de M y (U , ϕ = (x 1, . . . , x n )) una carta con
p ∈ U . Luego ϕ ◦ γ (t ) = (x 1(t ), . . . , x n (t )) es un mapa entre I y un abierto de
n
d xi
lR , y son las componentes del vector tangente a γ en la base coordenada
dt
{x i } en el punto γ (t ) de M . Por lo tanto v i (x j ) son las componentes de un
campo vectorial v en la base coordenada {x i } en el punto p ∈ M correspon-
diente a ϕ( p) = (x 1, . . . , x n ). Vemos así que los sistemas de EDO se pueden
interpretar como un campo vectorial v en una variedad M , y sus soluciones
como curvas γ (t ) tal que su tangente en todo punto sea v.

Ejemplo: El péndulo Físico



 θ̈ = − sin θ ó
(4.35)
 θ̇ = z
ż = − sin θ

∂ ∂
Aquí el campo vectorial es z − sin θ
,
∂θ ∂z
note que el diagrama en el plano se repite cada 2π según el eje θ. En realidad
la ecuación tiene sentido físico en un cilindro, siendo θ la variable angular, o
sea la variedad es un cilindro. Las curvas integrales, o sea las imágenes de los
mapas γ (t ) que son soluciones, se construyen siguiendo los vectores de tal
modo que éstas sean siempre tangentes a las curvas.

104
x2

B B

x1

Figura 4.7: El péndulo Físico.

A
B

Figura 4.8: La variedad Péndulo Físico.

105
Del ejemplo queda claro que en general si damos un punto de M siguiendo
los vectores, a partir de éste, podremos encontrar una solución γ (t ) que pasa
por este punto. Si tenemos dos soluciones γ1(t ), γ2(t ) éstas no se pueden
cruzar –sin ser tangentes– en los puntos donde el campo vectorial es distinto
de cero [ya que de otro modo sus tangentes darían dos vectores distintos en
el punto]. Si se supone que el campo vectorial es diferenciable luego se puede
ver que distintas curvas nunca se pueden tocar y por lo tanto las soluciones
son únicas.
Por supuesto, como se ve por ejemplo en la figura 4.8, una misma curva
si se puede intersectar (note que esto solo puede suceder si el sistema es autó-
nomo, ya que de lo contrario, la inclusión de la variable temporal hace que
ninguna curva se pueda intersectar). En tal caso se puede probar que esa solu-
ción es periódica, es decir que existe T > 0 tal que γ (t + T ) = γ (t ). Note en
particular que esto implica que γ está definida para todo t en lR.

Problema 4.1 Si M es una variedad compacta (ejemplo: una esfera o un toro) se


puede probar usando Corolario 4.2 que todas sus curvas de fase están definidas
para todo t . Sin embargo existen algunas que no son cerradas, dé un ejemplo.

4.4.1. Integrales Primeras


Dado un campo vectorial v en M , si existe f : M → lR no constante tal
que v( f ) = 0 en M luego diremos que f es una integral primera o constante
de movimiento del sistema de EDO generado por v.
Se puede demostrar que si n es la dimensión de M , luego localmente,
alrededor de puntos donde v 6= 0, existen n − 1 integrales primeras funcio-
nalmente independientes sin embargo es fácil encontrar campos vectoriales
que no tienen ninguna integral primera.

Ejemplos–Problemas

Problema 4.2 El sistema 


ẋ1 = x1
ẋ2 = x2
no tienen ninguna, ¿por qué? Ayuda: Dibuje las curvas integrales.

Problema 4.3 Considere el sistema



ẋ1 = k1
ẋ2 = k2

106
en el toro (obtenido identificando los puntos (x1, x2) y (x1 +n, x2 +m) de lR). ¿Pa-
ra cuáles valores de k1 , k2 existe una integral primera y para cuáles no? Ayuda:
ídem 1).

Problema 4.4 Las ecuaciones de Hamilton de la mecánica clásica forman un


sistema de EDO,

∂H
q̇i = (4.36)
∂ pi
∂H
ṗi = − (4.37)
∂ qi

i = 1, . . . , n, donde H : lR2n → lR es la función Hamiltoniano o energía. De-


muestre que H es una integral primera de este sistema.

Los ejemplos anteriores muestran que hay sistemas de EDO que global-
mente no son derivables de un principio variacional.
Así como el conocimiento de la energía de un sistema Hamiltoniano es
una ayuda inestimable para conocer la forma cuantitativa de su movimien-
to, el conocimiento de una integral primera de un sistema general de EDO
también brinda una gran ayuda ya que sabemos que las curvas de fase están
restringidas a sus superficies de nivel ( f = cte.) lo que nos permite reducir
efectivamente el orden de la ecuación en uno: solo tenemos que considerar el
problema en la variedad dada por los puntos f = c t e.

4.4.2. Teorema Fundamental de los Sistemas de EDO


Teorema 4.3 Sea v un campo vectorial continuamente diferenciable (C 1) en
un entorno de p ∈ M . Luego,
i) Existe un entorno Up de p y un abierto I ⊂ lR, tal que dado cualquier
q ∈ Up (t0 ∈ I ) existe una curva diferenciable γq (t ) : I → M satisfaciendo

d γq
= v|γq (t )
d t t (4.38)
γq (t0) = q.

ii) si γq1 y γq2 satisfacen la condición i) luego γq1 = γq2 en I 1 ∩ I 2.


iii) γq (t ) es también C 1 cuando es considerada como una función de I ×
Up → M . O sea es continuamente diferenciable con respecto a la condición ini-
cial.

107
iv) Sea U una región compacta (acotada) de M , v ∈ C 1 y p ∈ U luego γ p (t )
puede ser extendida (hacia adelante y/o hacia atrás) hasta la frontera de U . En
particular si M es compacta y v ∈ C 1(M ), luego γ p (t ) existe globalmente (para
todo t ∈ lR).

Probaremos este teorema más adelante, luego de introducir las herra-


mientas matemáticas necesarias.

4.4.3. Dependencia en Parámetros, Ecuación de Variaciones

Una consecuencia, muy importante en las aplicaciones, del teorema fun-


damental es el siguiente:

Corolario 4.3 Sea v λ un campo vectorial diferenciable en U ⊂ M que depende


diferenciablemente de un parámetro λ ∈ A ⊂ lR. Luego dados p ∈ U , t0 ∈ I
y λ0 ∈ A existen entornos Up , I t0 y Aλ0 tales que para toda terna (q, t , λ) ∈
Up × I t0 × Aλ0 existe una única curva integral de v λ , γλ (t ) : I t0 × Aλ0 → Up con
γλ (0) = q. Esta depende diferenciablemente de q, t y λ.

Prueba: Considere el campo vectorial (v λ , 0) : U × A → T M × lR. Por hipó-


tesis este campo es diferenciable y por lo tanto tiene curvas integrales (γλ , λ)
que dependen diferenciablemente de las condiciones iniciales y por lo tanto
de λ ♠

Advertencia: El intervalo I t0 × Aλ0 donde la solución es diferenciable no ne-


cesariamente es el intervalo de definición de la solución. Por ejemplo no es
cierto que aun cuando la solución esté definida para todo t en lR los límites
lı́m γλ (t ) y lı́m γλ (t ) conmuten.
T →∞ λ→λ0
La importancia práctica de este corolario es que nos permite obtener solu-
ciones aproximadas a las ya conocidas. En efecto supongamos que para λ = 0
conocemos alguna curva integral de v|λ=0 , γ0(t ) con γ0(0) = p. Tenemos
entonces, aplicando el Corolario y un desarrollo en serie de Taylor, que

γλ (t ) = γ0(t ) + λ γ1(t ) + O(λ2) (4.39)

o sea que γ0(t ) + λ γ1(t ) es una buena aproximación a γλ (t ) para λ suficiente-


mente pequeño.

108
Resta entonces encontrar la ecuación que satisface γ1(t ). Esta se obtiene
diferenciando con respecto a λ la ecuación diferencial en λ = 0,
‚ Œ
d d γλ (t )
= v λ (γλ (t )) , (4.40)
dλ dt
λ=0

expandiendo y usando coordenadas



d j ∂ v j i
d v j

γ1 = · γ + , (4.41)
dt ∂ x i (γ ,λ=0) 1 d λ (γ
0 0 ,λ=0)

= A j i (t ) γ1i + b j (t ).
o sea la ecuación para γ1(t ) –usualmente llamada ecuación de variaciones–
es una ecuación líneal inhomogenea no-autónoma. Como tomamos como
condición inicial γλ (0) = p ∀ λ, la condición inicial que consideraremos
para 4.4.3 es γ1(0) = 0.

Problema 4.5 ¿Cuál sería la condición inicial para γ1 si la condición para γλ


fuese γλ (0) = p(1 − λ) + λq? Considere solo el caso unidimensional pero piense
en el genérico.

Problema 4.6 Si decidiésemos considerar una aproximación hasta segundo or-


den γλ = γ0 + λγ1 + λ2γ2 + O(λ3), ¿qué ecuaciones obtendríamos para γ2?

Ejemplo: a) Un cuerpo cae verticalmente en un medio de baja viscosidad, la


cual depende de la posición y velocidad de éste.

ẍ = − g + ǫ F (x, ẋ) ǫ≪1 (4.42)

Calcule el efecto de esta resistencia en el movimiento.


La solución, x(t ), dependerá suavemente de ǫ por lo tanto podemos desa-
rrollar esta en serie de Taylor con respecto a ǫ.

x(t ) = x0(t ) + ǫ x1(t ) + O(ǫ2). (4.43)


La solución para ǫ = 0 es claramente

t2
x0(t ) = xi + v i t − g , (4.44)
2

109
donde xi y vi son respectivamente la posición y la velocidad inicial, mientras
que la ecuación de variaciones es

ẍ1 = F (x0, ẋ0), x1(0) = 0, ẋ1(0) = 0. (4.45)


Integrando obtenemos
Z tZ τ
x1(t ) = F (x0(τ̃), ẋ0(τ̃)) d τ̃ d τ. (4.46)
0 0

b) El segundo ejemplo es el de auto-oscilaciones.


Considere el sistema,
ẋ1 = x2 + ǫ f1(x1, x2)
(4.47)
ẋ2 = −x1 + ǫ f2(x1, x2), para ǫ ≪ 1.
Sin pérdida de generalidad podemos asumir fi (0, 0) = 0. Cuando ǫ = 0 obte-
nemos las ecuaciones del péndulo –en la aproximación de pequeñas amplitu-
des– , o sea un sistema conservativo. Su energía –integral primera– está dada
por E(x1, x2) = 12 (x12 + x22) y sus curvas de fase son entonces círculos de radio
p
2E.
Cuando ǫ > 0 las curvas de fase no son necesariamente cerradas, pero
debido al Corolario anterior a lo más pueden ser espirales con una distancia
del orden de ǫ entre vuelta y vuelta. p Estas pueden tender hacia algún pun-
to estacionario dentro del círculo 2Ei , donde Ei = energía inicial, es decir
donde x2 + ǫ f1(x1, x2) = −x1 + ǫ f2(x1, x2) = 0, o pueden aproximarse asin-
tóticamente a alguna órbita cerrada o finalmente pueden diverger. Que estas
son las únicas opciones es el resultado de un teorema clásico de Poincaré–
Bendixson, el cual muestra que en general estas son las únicas posibilidades
en dos dimensiones.
Para estudiar cuál es el caso entre estos tres consideramos la variación de
energía entre dos vueltas consecutivas.
Usando que,
Ė(x1, x2) = ǫ (x1 f1 + x2 f2) (4.48)
obtenemos
H
∆E = ǫ (− f1 d x2 + f2 d x1) + O(ǫ2)
(4.49)
= ǫ F (E).
p
donde la integral es a lo largo de un círculo de radio 2E en la dirección del
movimiento. Es decir, hemos aproximado la curva con ǫ > 0 por la curva con
ǫ = 0.

110
Si F (E) es positiva la energía aumenta y el sistema realiza oscilaciones
crecientes.
Si F (E) es negativa las oscilaciones disminuyen en amplitud y el sistema
tiende eventualmente a un punto de equilibrio.
Si F (E) cambia de signo, digamos en E = E0, se puede probar entonces
que cerca de este círculo hay una curva de fase Γǫ cerrada.
Si F ′ (E) E=E es negativa Γ es un ciclo límite estable –cualquier curva de
0
fase cercana se aproxima asintóticamente a ésta– . Si F ′ (E) E=E0
es positiva Γ
es inestable.

Problema 4.7 Muestre que si hay dos ciclos límites estables luego debe haber
también al menos uno que es inestable.

De los dos ejemplos anteriores queda claro la importancia práctica del


Corolario. La dependencia en forma diferenciable de las condiciones iniciales
también conduce a la ecuación de variaciones, por lo tanto esta ecuación, que
es líneal, inhomogenea, es de suma importancia y en el próximo capítulo la
estudiaremos en más detalle.

4.5. Problemas

Problema 4.8 (Kiseliov) Encuentre todas las soluciones de

dx 3
= x 2/3. (4.50)
dt 2
Ayuda: hay infinitas y éstas se obtienen a partir de segmentos de algunas solucio-
nes particulares. Grafique algunas de estas soluciones.

Problema 4.9 (Kiseliov) Aplique el teorema de existencia y unicidad para de-


terminar las regiones donde las ecuaciones siguientes tienen solución única:
a) ẋ = x + 3x 1/3.
b) ẋ = p
1 − cot x.
c) ẋ = 1 − x 2.

Problema 4.10 (Kiseliov) Resuelva las siguientes ecuaciones, en todos los casos
dé las soluciones generales en función de un dato inicial x0 para el tiempo inicial
t0 .
a) t ẋ + x = c o s(t ). (Use integral primera de la parte homogénea.)
b) ẋ + 2x = e t . (Use variación de constantes.)

111
c) (1 − t 2)ẋ + t x = 2t . (Resuelva primero la homogénea y luego sume una
inhomogénea particular.)
d) x ẋ = t − 2t 3.
Problema 4.11 (Kiseliov) Resuelva las siguientes ecuaciones apelando a un cam-
bio de variable en la variable independiente (t).
a) ẋ x = −t . (t = cos(s).)
b) ẋ t − x = 0.
c) ẋ + e ẋ = t .
Problema 4.12 (Kiseliov) Grafique las isoclinas (líneas de igual pendiente en
el plano (t , x)) y luego trace las soluciones de las siguientes ecuaciones:
a) ẋ = 2t − x.
b) ẋ = sin(x + t ).
c) ẋ = x − t 2 + 2t − 2.
x−t
d) ẋ = x+t .

Problema 4.13 Resuelva la ecuación:


ẋ = A(t )x + B(t )x n Ayuda: Use el cambio de variable y = x 1−n .
Problema 4.14 Resuelva la ecuación
dx
= iλx + Ae iωt λ, ω ∈ lR (4.51)
dt
y vea cómo se comporta su parte real. Examine los casos:
a) A = 0, b) (A 6= 0, λ 6= ω) y c) (A 6= 0, λ = ω).
Problema 4.15 La ecuación del péndulo físico.
a) Grafique el campo vectorial de la ecuación
d 2θ
= − sin(θ), −π ≤ θ ≤ π. (4.52)
d t2
b) Grafique algunas curvas integrales alrededor de (θ = 0, z = dd θt = 0).
c) Grafique las curvas integrales que pasan por el punto θ = ±π, z = 0). In-
fiera que el tiempo necesario para llegar por estas curvas a dicho punto es infinito.
d) Grafique el campo vectorial a lo largo de una recta z = z0. Infiera de
ello que las soluciones no pueden superar nunca la velocidad adquirida cuando
pasan por el punto θ = 0. Ayuda: Concluya esto primero para la región 0 ≤ θ ≤
π, 0 ≤ z ≤ z0 y luego use la simetría de la solución.
2
e) Sea E(z, θ) := z2 − cos(θ). Vea que ddEt = 0. Use esta cantidad para ana-
lizar el comportamiento de las soluciones con dato inicial (z0, θ0 = 0). En parti-
cular determine cuáles cruzan el eje z = 0 y cuáles no.

112
Problema 4.16 Sea la ecuación:

dz f (z) |z| < 1
= (4.53)
dt iz |z| ≥ 1

Donde f (z) es continua con i z en |z| = 1. Infiera que no importando có-


mo sea la forma de f (z), las soluciones nunca escapan de la región {|z(t )| ≤
máx{|z(0)|, 1}}.

Problema 4.17 Sea un cuerpo afectado por una fuerza central, es decir,

d 2~x
m = f (r )~x r := |~x |. (4.54)
d t2
a) Encuentre un sistema equivalente de primer orden.
b) Compruebe que dado un vector cualquiera (constante) ~c , luego F (~x , ~p) :=
~c · (~x ∧ ~p), donde ~p := d~
x
dt
, es una integral primera.

Problema 4.18 Sea la ecuación:


d~x
= ~x ∧ ω(~
~ x ). (4.55)
dt
a) Vea que R := ~x · ~x es una integral primera.
b) Concluya que las soluciones de este sistema existen para todo tiempo.

Problema 4.19 (Strichartz) Muestre que


∞ (−1) j (t /2)k+2j
X
Jk (t ) = , (4.56)
j =0 j !(k + j )!

tiene radio de convergencia infinito y satisface la ecuación de Bessel, x ′′ (t ) +


(1/t )x ′ (t ) + (1 − k 2/t 2)x(t ) = 0.

Problema 4.20 Resuelva el sistema:


   
d x1 −x2 + ǫ(x12 + x22)
= (4.57)
dt x2 x1

Para los datos iniciales (x1(0) = 1, x2(0) = 0). Investigue ahora la solución cerca
de ǫ = 0 obteniendo los coeficientes en la serie de Taylor de la misma con respecto
al parámetro ǫ. Encuentre qué ecuaciones satisfacen estos coeficientes.

113
Problema 4.21 (Arnold) Considere la ecuación del péndulo físico:

d 2x
2
= − sin(x).
dt
Vea cómo varía la frecuencia en función de la amplitud para soluciones pequeñas.
Ayuda: suponga una solución en serie de Taylor en la amplitud y resuelva hasta
encontrar la primera contribución no trivial a la solución linealizada. Encuentre
el período ubicando los puntos de retorno (velocidad cero).

Notas bibliográficas: Para éste y los próximos tres capítulos recomiendo


los siguientes libros: [3], [7] y [8]. Sobre todo el primero. Las ecuaciones di-
ferenciales ordinarias son la base de la mecánica clásica, aunque en esta última
hay además una estructura geométrica particular que es fundamental. Casi
todo lo que hemos visto en este capítulo es la teoría local, la teoría global, es
decir el comportamiento de las soluciones para grandes valores de la variable
independiente (el tiempo en la mayoría de los casos) solo se ha comprendido
en los últimos años, dando origen a conceptos nuevos como el de caos, atrac-
tores, dimensiones fractales, etc. Lamentablemente estos aspectos no han sido
todavía suficientemente sintetizados y por lo tanto no puedo recomendar nin-
gún libro al respecto. Hay demasiadas ideas interesantes pero cada una de ellas
requiere de un gran bagaje de información.

114
CAPÍTULO 5

SISTEMAS LINEALES

5.1. Sistema lineal homogéneo

Teorema 5.1 Sea A(t ) continua en I ⊂ lR, cerrado. Luego existe una única
solución x(t ) : I → V de la ecuación,

d x(t )
= A(t ) x(t ), (5.1)
dt
con condición inicial x(t0) = x 0 ∈ V , t0 ∈ I .

Prueba: Sean x, y ∈ V , luego

kA(t )x − A(t )ykV ≤ kA(t )kL kx − ykV (5.2)

y por lo tanto A(t )x es Lipschitz en V . El teorema fundamental nos garan-


tiza existencia y unicidad local. El teorema quedará entonces demostrado si
mostramos que x(t ) no puede hacerse infinita en un tiempo finito. Para ello
usaremos,
d kx(t1)kV − kx(t )kV kx(t1) − x(t )k
kxkV = lı́m ≤ lı́m
dt t1→t t1 − t t1 →t t1 − t (5.3)

= ddxt = kA xkV ≤ kAkL kxkV .
V

Integrando esta desigualdad entre t0 y t ∈ I obtenemos,


Rt
kA( t˜)kL d t˜
kx(t )kV ≤ kx(t0)kV e t0
, (5.4)
lo que muestra que x(t ) no puede escapar a infinito en un tiempo finito y por
lo tanto completa la prueba.

115
Consideremos el conjunto de las soluciones de 5.1 definidas en un único
intervalo I ⊂ lR cerrado, S o l (A, I ). Este conjunto tiene la estructura de un
espacio vectorial. En efecto, si x(t ) e y(t ) son dos soluciones de 5.1, luego
x(t ) + αy(t ) , α ∈ lR, es también una solución. ¿Cuál es su dimensión? El
siguiente teorema responde a esta pregunta y muestra que cualquier solución
de 5.1 puede ser expresada como combinación lineal de un número finito
(n) = d i m V de soluciones.

Teorema 5.2 dim S o l (A, I ) = dim V .

Prueba: Sea {u 0i }, i = 1, . . . , n una base de V , t0 ∈ I y {u i (t )}, i = 1, . . . , n t ∈


I el conjunto de soluciones de 5.1 con condición inicial u i (t0) = u 0i . Mostra-
remos que las {u i (t )} forman una base de S o l (A, I ), y por lo tanto
dim S o l (A, I ) = dim V . Primero veamos que las soluciones {u i (t )} son li-
nealmente independientes. P
Supongamos que existen constantes c i tales que x(t ) = ni=0 c i u i (t ) se
anula para algún t˜ en I . Como x(t ) es una solución de 5.1 y estas son únicas
˜
cuando un dato inicial es especificado, tomando en este caso x( Ptn) = 0,i 0
vemos
que x(t ) = 0 ∀ t ∈ I . En particular tenemos que x(t0) = i=0 c u i = 0
y la independencia del conjunto {u 0i (t )} implica entonces que c i = 0 ∀ i =
1, . . . , n, probando la independencia lineal. Note que no solo hemos probado
que los {u i (t )} son linealmente independientes como elementos Pn de S o l (A, I )
i
–para lo cual solo hubiésemos tenido que probar que si i=0 c u i (t ) = 0
∀ t ∈ I luego c i = 0 ∀ i = 1, . . . , n lo que es trivial ya que t0 ∈ I – sino
también que para cada t ∈ I los {u i (t )} son linealmente independientes como
elementos de V , este resultado será usado más adelante.
Para completar el teorema veamos ahora que cualquier solución de 5.1
x(t ) : I → V , es decir cualquier elemento de S o l (A, I ) puede ser escrito co-
mo combinación lineal de los {u i (t )}. Sea x(t ) ∈ S o l (A, I ), como los {u 0i }
forman una base de V existirán constantes c i , i = 1, . . . , n tales que x(t0) =
c i u 0i . Consideremos entonces la solución de 5.1 dada por ϕ(t ) = c i u i (t ).
Como ϕ(t0) = x(t0) y las soluciones son únicas tenemos,

x(t ) = ϕ(t ) = c i u i (t ) ∀ t ∈ I (5.5)

El teorema anterior nos dice que si conocemos n soluciones linealmente


independientes de A, {u i (t )}, conocemos todas sus soluciones, ya que éstas

116
serán combinaciones lineales de las {u i (t )}. La dependencia con los datos
iniciales es también lineal, es decir si x(t ), y(t ) ∈ S o l (A, I ) y x(t0) = x 0
e y(t0) = y 0 luego x(t ) + αy(t ) , α ∈ lR, es la solución con dato inicial
x 0 + αy 0 y por lo tanto el mapa g tt –que en este caso llamaremos X tt – que
0 0
lleva datos iniciales dados en t = t0 a soluciones con esos datos, al tiempo t es
un operador lineal de V en V . En efecto si {θ0i } es la c o-base de la base {u i },
j j P
i.e. θ0(u 0i ) = δi . Luego X tt = ni=1 u i (t ) θ0i . Debido a la independencia
0
lineal de los {u i (t )} como elementos de V se puede ver que el mapa X tt :
0
V → V es inyectivo y por lo tanto invertible, para cada t ∈ I . Su inversa, que
denotaremos (X tt )−1 lleva la solución en t a su dato inicial en t = t0, o sea
0
t
(X tt )−1 = X t0 .
0

t
Ejercicio: Pruebe que (X tt )−1 = X t0 .
0

Ejercicio: Pruebe que X tt no depende de la base empleada.


0

El mapa X tt es en realidad la familia mono-paramétrica de difeomorfis-


0
mos de V en V generados por el campo vectorial Ax. En este caso estos son
lineales. En efecto X tt x 0 es la curva que pasa por el punto x 0 ∈ V en t = t0
0
y cuyo vector tangente es AX tt x 0.
0
Hemos visto entonces que si conocemos un conjunto de n soluciones
linealmente independientes {u i (t )} podemos construir cualquier solución
usando el operador X tt aplicado al dato inicial de nuestro gusto.
0
¿Cómo sabemos en la práctica que un conjunto de n soluciones {u i (t )}
es linealmente independiente? Como ya vimos es suficiente ver que éstas son
linealmente independientes, como elementos de V , a un tiempo t cualquiera.
Es decir que el escalar

w(t ) = ǫ(u 1(t ), u 2(t ), . . . , u n (t )) (5.6)

es distinto de cero. Esta función se llama el Wronskiano del sistema y satis-


face una ecuación particularmente simple cuya solución llamada fórmula de
Liouville, es
Zt
t r (A( t˜)) d t˜
w(t ) = w(t0) e 0t (5.7)

117
Prueba:

ẇ(t ) = ǫ(u̇ 1, u 2, . . . , u n ) + ǫ(u 1, u̇ 2, . . . , u n ) + · · · + ǫ(u 1, u 2, . . . , u̇ n )


= ǫ(Au 1, u 2, . . . , u n ) + ǫ(u 1,Au 2, . . . , u n ) + · · · + ǫ(u 1, u 2, . . . ,Au n )
= t r (A) w(t ),
(5.8)
cuya solución es 5.7.

La fórmula de Liouville es una demostración independiente del resultado


que las {u i (t )} forman una base de V para cada t ∈ I . Note que si t r (A) ≡ 0
el Wronskiano es constante y nos puede ser de utilidad para determinar una
solución en función de otras ya conocidas.

5.2. Sistema Lineal Inhomogeneo – Variación de constantes

Aquí trataremos el sistema,


dx
= A(t ) x + b(t ), (5.9)
dt
donde b(t ) : I → V es integrable. Veremos que si conocemos el operador X tt
0
correspondiente al sistema homogéneo
dx
= A(t ) x, (5.10)
dt
Luego conocemos todas las soluciones del sistema 5.9. El método que usa-
remos se llama de variación de constantes y también es de utilidad para
obtener soluciones aproximadas a sistemas no lineales. El método consiste en
suponer que la solución de 5.9 será de la forma,

ϕ(t ) = X tt c(t ) (5.11)


0

para algún mapa c(t ) : I → V , diferenciable. Note que si c(t ) = c ∈ V , es


decir un mapa constante, luego ϕ(t ) satisface 5.10. Sustituyendo ϕ(t ) en 5.9
obtenemos,
 
d d
dt
ϕ̇(t ) = X t
d t t0
c(t ) + X tt ddt c(t )
0 (5.12)
= A(t )X tt c(t ) + X tt ddt c(t ) = A(t )X tt c(t ) + b(t ).
0 0 0

De donde vemos que para que ϕ(t ) sea una solución c(t ) debe satisfacer la
ecuación X tt ddt c(t ) = b(t ).
0

118
t
Pero como X tt es invertible y su inversa es X t0 obtenemos
0

d t
c(t ) = X t0 b(t ). (5.13)
dt

Integrando obtenemos
Z t
t
c(t ) = X ˜0 b( t˜) d t˜ + c(t0) (5.14)
t
t0

o Z 
t
t
ϕ(t ) = X tt  X ˜0 b( t˜) d t˜ + X tt ϕ(t0), (5.15)
0 t 0
t0

donde ϕ(t0) es una condición inicial cualquiera.

Debido al teorema de existencia de soluciones del sistema homogéneo


t
sabemos que X t0 existe y es diferenciable ∀ t ∈ I y por lo tanto ϕ(t ) también
existe y es diferenciable ∀ t ∈ I , ya que b( t˜) es integrable. Como el dato
inicial para ϕ(t ) puede darse en forma arbitraria, y las soluciones de 5.9 son
únicas, concluimos que 5.15 es la solución general del sistema 5.9.

5.3. Sistemas lineales homogéneos: coeficientes constantes

La ecuación que trataremos aquí es

dx
= A x, (5.16)
dt

donde x : I ⊂ lR → V es una curva en V y A es un operador lineal de V ,


A: V → V.
Ya vimos en un ejercicio que x(t ) = e At x 0, x 0 ∈ V cualquiera, es una
solución de 5.16 con condición inicial x(0) = x 0. Note que como e At está
definido para todo t ∈ lR, las soluciones que hemos encontrado también están
definidas en todo lR.
Sea x̃(t ) una solución cualquiera de 5.16 definida en un intervalo I˜ ⊂ lR
y sea t1 ∈ I˜. Luego la curva x 0(t ) = e A(t1−t ) x̃(t1) es también una solución
de 5.16 y x(t1) = x̃(t1), pero por la unicidad de las soluciones de 5.16, x(t )
y x̃(t ) deben coincidir en todo I˜ y x(t ) es la extensión máxima de x̃(t ). Ve-
mos así que por medio de la exponencial e At obtenemos todas las soluciones

119
de 5.16. De hecho, hemos demostrado que la familia monoparamétrica de di-
feomorfismos lineales g t = e At está definida globalmente [∀t ∈ lR, ∀x 0 ∈ V ]
y es la generadora del campo vectorial v(x) = Ax. [Con la definición dada en
5.1 en este caso X tt = g t −t0 = e A(t −t0) .]
0

¿Cuál es la forma general de esta familia? O dicho de otro modo, ¿cómo es la


forma funcional del mapa exponencial? Para ello es conveniente tomar una
base fija {u i } (independiente de t ) en V y expresar la ecuación en término de
la n-tupla de componentes {x i } de x. De esta forma obtenemos,

d xi X
n
= Ai j x j , (5.17)
dt j =1

es decir una ecuación para la n-tupla {x i }. La ventaja de este cambio es que


podemos tomar una base conveniente, en particular la base ortogonal del Le-
ma 2.2 (de Schur) en la cual la matriz Ai j es triangular superior. El precio
pagado por la simplificación es que, como la base de Schur es en general com-
pleja, tanto la n-tupla {x i } como las componentes de A, Ai j , son complejas y
por lo tanto hemos pasado a un problema en C n , o en forma abstracta en la
complexificación de V .
Para esa base tenemos que la componente enésima satisface una ecuación
particularmente simple!,
d xn
= An n x n (5.18)
dt
y por lo tanto, x n (t ) = e λn t x0n (recuerde que la diagonal de una matriz trian-
gular superior está compuesta por sus autovalores), donde x0n en la enésima
componente de la condición inicial a t = 0. La ecuación para la componente
n − 1 es,

d x n−1
= An−1 n−1 x n−1 + An−1 n x n (5.19)
dt
= λn−1 x n−1 + An−1 n e λn t x0n . (5.20)

Usando la fórmula (5.15) para el caso unidimensional, (y A constante) obte-


nemos,

Z t
n−1 λn−1 t
x (t ) = e x0n−1 + e λn−1 t e −λn−1 s (An−1 n e λn s x0n ) d s (5.21)
0

120
Z t
λn−1 t
= e x0n−1 + e λn−1 t e (λn −λn−1)s d s An−1 n x0n , (5.22)
0

y vemos que si λn − λn−1 6= 0 luego la solución es una suma de exponencia-


An−1 n x0n λ t
les, x n−1(t ) = e λn−1 t x0n−1 + λ (e n −e λn−1 t ). Si los autovalores coinciden
n −λn−1
(λn −λn−1 = 0) luego aparece un término lineal en t , x n−1(t ) = e λn−1 t (x0n−1 +
t An−1 n x0n ). Conociendo x n−1(t ) podemos ahora calcular, usando nuevamen-
n−2
te (5.15), x (t ) y así sucesivamente todas las componentes de x(t ) en esta
base. El resultado final será que las componentes son todas sumas de expo-
nenciales por polinomios. En efecto note que la integral de un polinomio
de grado m por una exponencial es también un polinomio del mismo grado
por la misma exponencial más una constante de integración (a menos que
la exponencial sea nula, en cuyo caso el resultado es un polinomio de grado
m + 1).

Ejercicio: Pruebe esta última afirmación por inducción en el grado del po-
linomio y el uso de integración por partes, es decir, use que e at P m (t ) =
d eat eat d
(
dt a
P m (t )) − P (t ) y que ddt P m (t ) es un polinomio de orden m − 1.
a dt m

Reordenando términos vemos así que la solución general será de la forma:

X
m
x(t ) = e λi t v i (t ) (5.23)
i=1

donde la suma es sobre los distintos autovalores y donde los vectores v i (t )


son polinomios en t .
Una propiedad importante de la estructura algebraica de esta solución
queda de manifiesto con el siguiente lema.

Lema 5.1 Los espacios vectoriales

Eλ := { f (t ) : lR 7→ V C | f (t ) = e λt P m (t ), con P m (t ) un polinomio}

son linealmente independientes.

Prueba: Debemos probar entonces que si tenemos una suma finita de elemen-
tos de los Eλi , {u i } y esta se anula, luego cada uno de estos vectores se debe

121
anular idénticamente. Es decir
X
m
u i = 0, u i ∈ Eλi λi 6= λ j ⇒ u i = 0. (5.24)
i=1

Lo probaremos por inducción en el número de elementos de la suma. El


caso m = 1 es trivial. Supondremos entonces que la afirmación es verdadera
para m − 1 y la probaremos para m. Supondremos además por contradicción
que existe una suma de m elementos distintos de cero que se anula, es decir:

X
m
u i = 0, u i ∈ Eλi , λi 6= λ j , u i 6= 0. (5.25)
i=1

dividiendo por e λ1 t obtenemos

X
m X
m
−λ1 t
0 = S(t ) := e u i = P m1 (t ) + e (λi −λ1)t P mi (t ). (5.26)
i=1 i=2

Tomando m1 + 1 derivadas de S(t ), donde m1 es el orden del polinomio del


primer término obtenemos:

d m1+1 X
m
0= m1 +1
S(t ) = e (λi −λ1)t P̃ mi (t ). (5.27)
dt i=2

donde es fácil ver que los polinomios P̃ mi (t ) son del mismo grado que los
originales. Estamos así bajo la hipótesis inductiva y por lo tanto como estos
polinomios son no-nulos tenemos una contradicción ♠

Veamos ahora que en realidad cada uno de los términos en esta suma es
una solución de la ecuación 5.16. Dado λ ∈ C cualquiera consideremos el
espacio vectorial de funciones de lR → V C de la forma e λt w(t ), donde w(t )
es un polinomio 1 en t . Este espacio es invariante bajo la acción de ddt , ya que
tomando su derivada obtenemos una expresión similar, es decir el producto
de la misma exponencial por otro polinomio. Por otro lado es invariante
ante la acción de A, ya que como A no depende de t su acción en cualquier
e λt w(t ) nos da otra expresión semejante. Por lo tanto, la acción de ddt − A
también nos mantendrá en el mismo espacio. Vemos así que si tenemos una
suma de términos con esa estructura y con distintos valores de λ, como es
1
Es decir una combinación lineal de vectores en V C con coeficientes polinómicos en t .

122
d
el caso en la ecuación anterior, 5.23, luego si la aplicación de dt
− A nos da
cero esto significa que la aplicación de ddt − A a cada término de la suma debe
dar cero. Es decir cada término es una solución de la ecuación 5.16! Es así
que concluimos que cada término en la suma 5.16 es de la forma e At v 0 para
algún v 0 ∈ V C . Consideremos ahora el subconjunto Wλ de V C , tal que si
v 0 ∈ Wλ luego e At v 0 = e λt v(t ). Está claro que los únicos subespacios no
triviales serán aquellos con λ = λi , donde {λi }, i = 1..d son los autovalores
de A. Por lo tanto debemos considerar solo estos subconjuntos. Como esta
relación es lineal, Wλ es un subespacio de V C . Como e At Av 0 = Ae At v 0 =
e λt Av(t ) = e λt v ′ (t ) y v ′ (t ) es también polinomial en t , vemos que Wλ es
un subespacio invariante de A. Mientras que usando una base de Wλ en la
que la restricción a ese espacio de A es triangular superior vemos que λ es
el único autovalor que dicha restricción puede tener. Finalmente, como toda
solución de 5.16 tiene la forma 5.23 el teorema de existencia de soluciones nos
asegura que cualquier dato inicial, es decir cualquier elemento de V C , puede
ser expresado como combinación lineal de elementos en Wλi . En efecto, sea
v 0 un elemento cualquiera de V C cualquiera, del teorema de existencia de
soluciones, tenemos entonces una única solución de 5.16 x(t ) con x(0) = v 0.
Pero entonces
X
m
x(t ) = e λi t v i (t )
i=1
Xm
= e At v 0i , (5.28)
i=1

para algún conjunto de vectores {v 0i } ∈ Wλi . Evaluando esta expresión en


Pm
t = 0 obtenemos, v 0 = i=1 v 0i y vemos que los Wλi generan V C . Por
otro lado la unicidad de las soluciones implica que ningún elemento de un
dado Wλi puede ser escrito como una combinación lineal de elementos de
los otros Wλ [de lo contrario un mismo dato inicial daría origen a dos so-
luciones distintas (ya que su dependencia funcional sería distinta)]. En efec-
to, sea 0 = v 01 + . . . + v 0s una combinación lineal cualquiera de elemen-
tos de Wλi , i = 1..s, veamos que cada uno de ellos debe anularse. Por la
unicidad
P m deAtlas soluciones
P m λa tlas ecuaciones ordinarias tenemos entonces que
0 = i=1 e v 0i = i=1 e i v i (t ) por lo visto anteriormente, cada elemento
en la última suma debe anularse y por lo tanto, evaluando a estos en t = 0
obtenemos v 0i = 0 ∀ i = 1..s. Resumiendo lo anterior tenemos,

123
Teorema 5.3 Dado un operador A : V C → V C existe un conjunto de subespa-
cios invariantes de A, {Wλi }, donde λi son los autovalores de A tales que:

a) V C = Wλ1 ⊕ Wλ2 ⊕ · · ·Wλd

b) El único autovalor de la restricción de A en {Wλi } es λi .

Concluimos el estudio de las soluciones de la ecuación 5.16, o sea de la


función e At con una descripción pormenorizada de la forma de las mismas
que se obtiene usando la representación matricial de A en la base donde ad-
quiere la forma canónica de Jordan. Es decir, para todo subespacio invariante
Wλi la restricción de A en este subespacio tiene la forma,

A = λi + ∆i , (5.29)

donde los números λi son los autovalores correspondientes a A –en general


complejos y por lo tanto estamos considerando ahora a A como un operador
de C n en C n – y ∆i es una matriz cuyas únicas componentes no nulas son
unos y sólo pueden estar en la diagonal superior inmediata a la mayor. La
matriz ∆i tiene la importante propiedad de ser nilpotente, es decir existe un
m
entero mi menor o igual a la multiplicidad de λi , tal que ∆i i = 0.
Como λi I y ∆i conmutan tenemos que

e t λi I +t ∆i = e t λi I e t ∆i , (5.30)

m
t λi I t λi t ∆i
X i −1 (t ∆i ) j
pero e =e I ye = , es decir una suma finita.
j =0 j!

Debido a que la exponencial de A es una suma de potencias de A se cumple


que los espacios invariantes de ésta son los mismos que los de A y por lo tanto,
e t A|Bi = e t Ai . De esto concluimos que la matriz e t A es de la forma

 
k
 0 
 k1 
e tA = 
 .. 
 (5.31)
 . 
kp

124
con cada ki una sub-matriz cuadrada, la k0 = d i a g (e t λ1 , . . . , e t λn ) y si i 6= 0
 
1 t t 2/2 · · · · · · t n−1/(n − 1)!
 .. 
 
 1 t ··· ··· . 
 .. 
 
tλ  1 ··· ··· . 
ki = e  , (5.32)
 .. 
 . ··· t 2/2 
 .. 
 0 . t 
 
1

donde el número de filas o columnas es el mismo que las de las Ji correspon-


diente a A en la composición de Jordan, este es menor o igual a la multiplici-
dad de λi como raíz del polinomio característico.
La base en la cual A tiene la forma canónica de Jordan es en general com-
pleja, es en realidad una base en C n . Si deseamos usar una base real, lo cual es
posible ya que partimos de tener a A como operador de lRn en lRn , y hacemos
la transformación correspondiente la matriz e At sufrirá la transformación de
semejanza correspondiente. Como esta transformación es independiente del
tiempo, si bien las componentes de e At no tendrán la forma anterior, éstas se-
rán sumatorias de términos exponenciales por polinomios en t . Por lo tanto
cada componente de la solución general de 5.16 será de la forma,
q n
X o
i
x (t ) = (e t λ p + e t λ̄ p ) P pi (t ) + i(e t λ p − e t λ̄ p ) Q pi (t ) (5.33)
p=1

donde q es el número de autovalores distintos –contando a los pares comple-


jos como uno solo– y P pi , Q pi son polinomios en t cuyo grado es menor o
igual a la multiplicidad con que aparece el autovalor λ p como raíz del poli-
nomio característico. Esta información es útil en dos sentidos. En el práctico
debido a que si bien el método de construir la solución usando una base en
la que A tiene la forma canónica de Jordan es directo, para sistemas de gran
dimensión se torna engorroso. En algunos casos es conveniente calcular los
autovalores y su multiplicidad y luego suponer una solución de la forma 5.33
y calcular los polinomios P pi , Q pi .
Este método también es útil en el sentido que nos permite conocer el
comportamiento global de las soluciones. Por ejemplo vemos que si la parte
real de los autovalores no es positiva y aquellos cuya parte real es cero no
aparecen repetidos, entonces todas las soluciones son acotadas [Existe C > 0

125
tal que kx(t )k < C .] Si además todos tienen parte real negativa luego todas
las soluciones tienden asintóticamente a la solución trivial [ lı́m x(t ) = 0 ].
t →∞

Analizaremos ahora en detalle el caso en que todos los autovalores son


distintos. Note que si bien éste es el caso genérico, –en el sentido que si un
sistema tiene autovalores coincidentes luego existen modificaciones arbitra-
riamente pequeñas de éste que hacen que los autovalores sean distintos– los
sistemas con autovalores coincidentes aparecen en física. Este caso contempla
también la situación de un sistema general donde los datos iniciales pertene-
cen a uno de los subespacios unidimensionales Bi .
Como el operador A es real sus autovalores serán reales o complejos con-
jugados [si d e t (A − λI ) = 0 luego d e t (A − λI ) = d e t (A − λ̄I ) = 0]. Si λi es
real luego su autovector puede ser elegido real. En efecto si (A − λI )u i = 0,
luego también (A− λI )ū i = 0, pero las raíces son simples y por lo tanto cada
λi tiene un solo autovector–módulo un escalar complejo–, es decir ū i = α u i
α ∈ C . Eligiendo v i = u i + ū i = (1 + α) u i obtenemos un autovalor real.
En este caso tenemos que la componente x0i de x 0 en la auto-base en la
dirección v i evoluciona como

x i (t ) = x0i e λi t , (5.34)

es decir crece o decrece exponencialmente con el tiempo de acuerdo al signo


de λi
Si el autovalor λi es complejo entonces podemos elegir su autovector u i
de forma que sea el complejo conjugado al elegido correspondiente a λ̄i . Este
par de autovectores generan un sub-espacio complejo 2-dimensional. Si x 0
pertenece a este subespacio y es real entonces tendrá la forma x 0 = a(u i +
ū i ) − i b (u i − ū i ) con a y b reales, o sea x 1 = u i + ū i y x 2 = i(u i − ū i )
forman una base real.
¿Cómo cambian estos vectores si les aplicamos el operador e At ? Es decir,
¿cuáles son las soluciones de la ecuación ẋ = A x con condiciones iniciales x 1
y x 2? Llamando a estos x 1(t ) y x 2(t ) respectivamente y usando que e At u i =
e λi t u obtenemos,
i

x 1(t ) = e αi t (x 1 cos wi t − x 2 sin wi t )


(5.35)
x 2(t ) = e αi t (x 2 cos wi t + x 1 sin wi t ),

con λi = αi + i wi .
Vemos que la acción del operador e At es en este caso la de dilatar los
vectores por un factor e αi t y la de rotarlos un ángulo wi t .

126
5.4. Problemas

Problema 5.1 Dado un conjunto de funciones { fi (t )}, i = 1, .., n se definen


(1)
vectores u i (t ) := ( fi (t ), fi (t ), . . . f (n−1) ) y el Wronskiano del sistema como
W ({ fi })(t ) := ǫ(u 1(t ), u 2(t ), . . . , u n (t )). Si el Wronskiano de un conjunto de
funciones no se anula, entonces las funciones son linealmente independientes, es
decir ninguna combinación lineal no trivial de las mismas (con coeficientes cons-
tantes) se anula. La conversa no es cierta. Calcule el Wronskiano de los siguientes
conjuntos:
a) {4, t }
b) {t , 3t , t 2}
c) {e t , t e t , t 2 e t }
d) {sin(t ), cos(t ), cos(2t )}
e) {1, sin(t ), sin(2t )}

Problema 5.2 Decida si el siguiente conjunto de funciones es linealmente de-


pendiente o no. Luego calcule el Wronskiano.

0, 0 ≤ x ≤ 1/2
f1(t ) = 2 (5.36)
(x − 1/2) , 1/2 ≤ x ≤ 1

(x − 1/2)2, 0 ≤ x ≤ 1/2
f2(t ) = (5.37)
0, 1/2 ≤ x ≤ 1

Problema 5.3 Use la teoría de ecuaciones diferenciales ordinarias para probar


las siguientes identidades:
a)
e s Ae t A = e (s+t )A, (5.38)
b)
e Ae B = e A+B , si y solo si [A, B] := AB − BA = 0. (5.39)

Problema 5.4 Grafique los campos vectoriales correspondientes a los siguientes


sistemas y algún conjunto de soluciones típicas de los mismos.
a)
  ‚ Œ 
d x1 1 0 x1
= (5.40)
dt x2 0 12 x2
b)
    
d x1 1 0 x1
= (5.41)
dt x2 0 −1 x2

127
c)
    
d x1 1 1 x1
= (5.42)
dt x2 0 1 x2
d)
    
d x1 −1 0 x1
= (5.43)
dt x2 1 −1 x2
e)
    
d x1 0 1 x1
= (5.44)
dt x2 1 0 x2
f) (compare las soluciones con las del punto b)
    
d x1 0 −1 x1
= (5.45)
dt x2 1 0 x2
g)
    
d x1 i 0 x1
= (5.46)
dt x2 0 i x2
h)
    
d x1 1+ i 0 x1
= (5.47)
dt x2 0 1− i x2
i)
    
d x1 1+ i 0 x1
= (5.48)
dt x2 1 1− i x2

Problema 5.5 Lleve estas ecuaciones a sistemas de primer orden y encuentre la


solución general de las ecuaciones:
3 2
a) d x3 − 2 d x2 − 3 dd xt = 0
dt dt
d 3x d 2x
b) + 2 2 + dd xt = 0
d t3 dt
d 3x d 2x
c) + 4 2 + 13 dd xt = 0
d t3 dt
d 4x d 3x d 2x
d) 4 +4 3 +8 + 8 dd xt +4=0
dt dt d t2
2
Problema 5.6 (Ley de Newton) Sea la ecuación d x2 + f (x) = 0.
Rx dt
1 2
a) Pruebe que 2 ẋ + x f (s)d s es una integral primera.
0
2
b) Encuentre la integral primera de d x2 − x + x 2/2 = 0.
dt
c) Grafique el campo vectorial correspondiente y alguna de sus soluciones. En-
cuentre sus soluciones estacionarias (o puntos de equilibrio) y estudie sus entornos
lineralizando la ecuación en estos puntos.

128
Problema 5.7 Estudie el siguiente sistema

ẋ1 = x1 − x1 x2 − x23 + x3(x12 + x22 − 1 − x1 + x1 x2 + x23)


ẋ2 = x1 − x3(x1 − x2 + x1 x2)
ẋ3 = (x3 − 1)(x3 + 2x3 x22 + x33) (5.49)

a) Encuentre los puntos de equilibrio.


b) Muestre que los planos x3 = 0 y x3 = 1 son conjuntos invariantes, (es decir,
las soluciones que comienzan en los mismos nunca los abandonan).
c) Considere el conjunto invariante x3 = 1 y vea si tiene soluciones periódi-
cas.

129
130
CAPÍTULO 6

ESTABILIDAD

Las soluciones estacionarias o de equilibrio son muy importantes en físi-


ca ya que muchos sistemas (especialmente aquellos donde hay disipación) se
comportan de forma tal que la solución se aproxima, en su evolución, a estas
soluciones.
Otra particularidad que las hace importantes es el hecho que éstas están
simplemente dadas por los puntos donde el campo vectorial se anula, y por lo
tanto a lo sumo se debe resolver una ecuación algebraica para encontrarlas, en
contraste con el caso general donde debemos resolver una ecuación diferen-
cial. Incluso en algunos casos es posible inferir que el campo vectorial se debe
anular, tal es el caso por ejemplo si la variedad es una esfera bi-dimensional
ya que cualquier campo vectorial continuo definido sobre ésta es tal que al
menos existen dos puntos donde éste se anula, y por lo tanto en este caso
siempre habrá soluciones estacionarias.

Ejercicio: Convénzase que esto es así.

Por lo dicho anteriormente se desprende que es importante estudiar el


comportamiento de las soluciones que se originan de datos iniciales cercanos
a una solución estacionaria. Para ello definimos los siguientes conceptos de
estabilidad.

Definición: Sea v un campo vectorial en M y sea p ∈ M tal que v( p) = 0.


Diremos que la solución estacionaria γ (t ) ≡ p es estable si dado un entorno
Up de p existe otro entorno V p de p tal que toda solución σ(t ) con σ(0) ∈ V p
satisface σ(t ) ∈ Up ∀ t ≥ 0. [Ver figura 6.1.]

Definición: Diremos que la solución anterior es asintóticamente estable si

131
es estable y además si σ(0) ∈ V p luego lı́m σ(t ) = p.
t →+∞

Vp

Up

Figura 6.1: Estabilidad.

Si una solución estacionaria no es estable entonces no tiene mucho interés


físico ya que la más mínima perturbación nos aleja mucho de ésta.

Ejemplos:
a) La ecuación del crecimiento bacteriano ẋ = a x − b x 2 tiene como solucio-
nes estacionarias x(t ) ≡ 0 y x(t ) ≡ ba . Como la solución general es,

x(0)e at
x(t ) = , x(0) ≥ 0 (6.1)
b x(0) at
1+ a
(e − 1)

se ve claramente que x(t ) = 0 no es una solución estable (a estas las llamare-


mos inestables) y que x(t ) ≡ ba es asintóticamente estable. Si contaminamos
un recipiente de cultivo con una sola bacteria esto es suficiente para que ésta
se reproduzca 1 hasta alcanzar (asintóticamente) la concentración ba . Si ahora
sacamos o agregamos algunas bacterias cosa de cambiar su concentración las
bacterias se reproducirán o aniquilarán hasta alcanzar nuevamente la concen-
tración estable ba .

b) La ecuación ẋ = Ax tiene entre sus soluciones estacionarias la dada por


x(t ) ≡ 0. ¿Cuáles otras? Éstas serán estables cuando los autovalores de A,
λi , satisfagan ℜ(λi ) ≤ 0, λi 6= λ j o ℜ(λi ) < 0 si λi = λ j , donde ℜ indica
1
Note que en el proceso real no tenemos una variable continua y por lo tanto en él las
perturbaciones son como mínimo de una bacteria, esto hace que sea posible tener recipientes
estériles y por lo tanto la inestabilidad matemática no se manifiesta en la realidad.

132
parte real. Esto es claro ya que la solución general es x(t ) = e At x(0) y la
condición mencionada implica que ke At kL < C , C > 0 ∀t ≥ 0. En este
caso podemos tomar como Up=0 = {x ∈ lRn | |x| < ε} y por V p=0 = {x ∈
lRn | |x| < Cε }. Si además se cumple que ℜ(λi ) < 0 ∀i = 1, ..., n luego x(t ) ≡ 0
es asintóticamente estable.
El siguiente teorema nos brinda una herramienta muy práctica para co-
nocer cuando una solución estacionaria es estable o no.

Teorema 6.1 (de Estabilidad) Sea γ (t ) ≡ p una solución estacionaria de v ∈


T M , es decir v( p) = 0, y sea A : T p M → T p M definido por,

d
Ax ≡ v(σ x (s))| s=0, (6.2)
ds

donde σ x (s) es una curva en M satisfaciendo: σ x (0) = p y dds σ x | s=0 = x ∈ T p M ,


es decir es una curva suave cualquiera que pasa por p cuando s = 0 y en ese punto
tiene como tangente a x ∈ T p M . Si ℜ(λi ) < 0, donde λi son los autovalores de
A, luego γ (t ) ≡ p es asintóticamente estable. Si algún λi tiene parte real positiva
luego γ (t ) = p es inestable.

Ejercicios:
a) Muestre que A es realmente un operador lineal.

b) Muestre que Ax = [v, x̃]| p , donde x̃ es cualquier campo vectorial tal que
x̃| p = x. Ayuda: no olvide que v| p = 0.

Ejemplos:
a) Considere la ecuación del crecimiento bacteriano en x = 0 y x = ba . Para el
primer caso tomamos σδ x (s ) = δ x s y obtenemos,

d
Aδ x = (aδ x s − b (δ x)2 s 2)| s=0 = aδ x, (6.3)
ds
lo que muestra que x = 0 es una solución inestable ya que a > 0. Para el
segundo caso tomamos σδ x = ba + δ x s luego

d a2 a
Aδ x = ( + aδ x s − b ( + δ x s)2)| s=0 = aδ x − 2aδ x = −aδ x, (6.4)
ds b b
lo que muestra que es asintóticamente estable.

133
b) Péndulo físico con fricción: θ̈ = −s e nθ − k θ̇, k > 0. El campo vectorial
en este caso está dado por,

θ̇ = z
(6.5)
ż = −s e nθ − k z,
es decir el vector con componentes (z, −s e nθ − k z) en el espacio de las fases
que es este caso es un cilindro, z ∈ [−∞, +∞], θ ∈ [0, 2π].

Figura 6.2: Péndulo físico con fricción.

Este vector se anula sólo en p1 = (θ = 0, z = 0) y p2 = (θ = π, z = 0).


Para la primera solución estacionaria, usando σ(s) tal que,
 
δθ s
φ ◦ σ(s) = , (6.6)
δz s
obtenemos,     
δθ 0 1 δθ
A = . (6.7)
δz −1 −k δz
En este caso la ecuación
p de autovalores es λ2 + kλ + 1 = 0 de lo cual obtene-
−k ± k 2 − 4
mos, λ± = , lo que implica ℜ(λ± ) < 0 y así estabilidad.
2
Para la segunda solución estacionaria tomamos σ(s) tal que,
 
δθs + π
φ ◦ σ(s) = (6.8)
δz
y obtenemos     
δθ 0 1 δθ
A = . (6.9)
δz 1 −k δz

134
p
−k ± k2 + 4
con autovalores λ± = , lo que implica ℜ(λ± ) > 0 y así inesta-
2
bilidad.
De los ejemplos se ve que este teorema es de aplicación amplia. Como es-
tabilidad es una noción local para facilitar la demostración tomaremos M =
lRn y un sistema coordenado cartesiano con origen en la solución estable
a considerar. Usaremos varios resultados previos que probamos a continua-
ción.

Teorema 6.2 (de Lyapunov) Sea A : lRn → lRn un operador lineal cuyos au-
tovalores tienen parte real negativa. Luego existe un tensor de tipo (2, 0), ρ(·, ·),
simétrico y positivo definido [ ρ(w, v) = ρ(v, w) y ρ(w, w) ≥ 0 (= s i i w =
0)] tal que,
Ax( ρ(x, x)) < 0 ∀ x 6= 0,
es decir la derivada de ρ(x, x) en la dirección Ax es negativa.

La interpretación geométrica de esta condición es que ρ(x, x) define una


norma cuyas superficies de nivel son tales que en cada una de éstas el vector
Ax en p = x apunta hacia adentro. Ver figura.

~ · ~x
A

~x

Figura 6.3: La norma ρ(x, x).

Prueba: Si todos los autovalores de A son distintos luego existe una base de
Jordan {u i }, i = 1, ..., n y la correspondiente co-base {θ i }, i = 1, ..., n (con
P P i
θ i (u j ) = δ ji ) tal que A = ni=1 λi u i θ i . Sea en este caso ρ = ni=1 θ i θ̄ .

135
P P P ′
Si z = ni=1 z i u i e y = ni=1 y i u i ∈ C n , luego ρ(z, y) = ni=1 z i y i +
P(n−n ′ )/2 i i
′ (z ȳ + z̄ i y i ) donde hemos separado la suma en la de los autovec-
n +1
tores reales y en la de los complejos conjugados. Es fácil ver que el ρ( , )
obtenido al restringir z e y a lRn es la norma cartesiana usual en la base real
correspondiente. Calculemos ahora Ax( ρ(x, x)).
ρ(x + ǫAx, x + ǫAx) − ρ(x, x)
Ax( ρ(x, x)) = lı́mǫ→0
ǫ
= ρ(Ax, x) + ρ(x, Ax) (6.10)
P
= 2 ni=1(ℜλi )x i x i < 0.

Hemos probado así el teorema para el caso diagonalizable. El caso en que A


no lo es es más complicado y para ello usaremos los siguientes lemas.

Lema 6.1 Dado ε > 0 existe una base {u i } tal que en esa base

A = d ia g .(λ1, ..., λn ) + ε∆,

con ∆ una matriz con componentes distintas de cero (e igual a uno) a lo sumo en
la diagonal inferior, es decir,
 
λ1 0 0 . . . 0
 ǫ λ 0 . . . 0 
 2 
 
A=  . . . . . . . . (6.11)
 
 0 . . . . . 0 
0 . . . . ǫ λr

Prueba: Es un simple cambio de escala de la base de Jordan de A. Por ejemplo


en C 3 si {ũ i } es tal que en ella,
 
λ 0 0
 
A=  1 λ 0 . (6.12)
0 1 λ
ũ 1 ũ 2
definiendo u 1 = 2
, u2 = , y u 3 = ũ 3, vemos que en esta nueva base,
ε ε
 
λ 0 0
 
A=  ǫ λ 0 . (6.13)
0 ǫ λ

136
ũ 1 λũ 1 ũ 2 ũ 1 + λũ 2
[Au 1 = A = = λu 1, Au 2 = A = = εu 1 + λu 2, etc.].
ε2 ε2 ε ε
Lema 6.2 El conjunto de tensores simétricas positivas es abierto en el conjunto
de formas simétricas, es decir si ρ0 es simétrica y positiva y ρ1 es simétrica luego
existe ε > 0 tal que ρ0 + ε ρ1 es también positiva.

Prueba: Sea B1 la esfera unidad con respecto a alguna norma en lRn y conside-
remos ρ0(x, x) : B1 → lR+ . Como B1 es compacta ρ0 alcanza allí su mínimo,
α mi n . Análogamente ρ1 alcanza allí su máximo, que llamaremos β max . To-
α mi n
mando ǫ < se cumple lo requerido.
β max

Ejemplo: En lR2 sea ρ0((x1, y1), (x2, y2)) = x1 x2+y1 y2 y ρ1((x1, y1), (x2, y2)) =
x1 y2 + x2 y1, luego ρ0 + ǫ ρ1 es positiva si |ǫ| < 2.

Para completar la demostración del teorema de Lyapunov tomaremos


X i
ρ= θ i ⊗ θ̄ ,
i

donde {θ i } es la co-base encontrada en el lema 6.1 con ǫ > 0 a determinar.


Luego,
−Ax( ρ(x, x)) = − ρ(Ax, x) − ρ(x, Ax)
P P (6.14)
= −2 ni=1 ℜ(λi )x i x i − 2ǫ n−1 f x i x i+1,
i=1 i

con fi = 1 ó 0 según haya ǫ o no en ese lugar de la diagonal inmediata su-


perior. El primer término es una forma positiva definida ρ0 evaluada en x
en ambas entradas. El segundo es una forma simétrica ǫ ρ1 evaluada en x en
ambas entradas. El segundo lema nos dice que tomando ǫ pequeño ρ0 + ǫ ρ1
es también positiva definida. Esto concluye la prueba del teorema.
Note ahora que no solo la ρ que hemos encontrado es simétrica y positiva
definida y por lo tanto una norma en lRn , sino que también −Ax( ρ(x, x)) es
positiva definida y define una norma [ya que −Ax( ρ(x, x)) = − ρ(Ax, x) −
ρ(x, Ax)]. Pero ya vimos que en lRn todas las normas son equivalentes y por
lo tanto existirá γ > 0 tal que
1
− ρ(x, x) ≤ Ax( ρ(x, x)) ≤ −2γ ρ(x, x). (6.15)

137
Este es el resultado que utilizaremos para la prueba del teorema de estabilidad
que damos a continuación.

Prueba del Teorema de Estabilidad: Hemos visto que si ℜ(λi ) < 0 luego exis-
te una constante γ > 0 y una forma simétrica positiva definida ρ( , ) tal que

Ax( ρ(x, x)) ≤ −2γ ρ(x, x). (6.16)

Aplicando el campo vectorial que define la ecuación, v(x) a ρ(x, x) obtene-


mos,
v(x)( ρ(x, x)) = Ax( ρ(x, x)) + O( ρ(x, x)3/2), (6.17)
donde hemos supuesto v es diferenciable y por lo tanto v(x) = Ax +O(|x|2).

Ejemplo: v(x) = (a x + b x 2) ∂∂x y ρ(x, x) = αx 2 luego,

v(x)( ρ(x, x)) = a x ∂∂x ρ(x, x) + 2b αx 3


(6.18)
2b 3/2
= a x ∂∂x ρ(x, x) + ρ(x, x)
α1/2

Si x es suficientemente pequeño, [|x| < C para algún C > 0] se cumple


que O( ρ(x, x)3/2) < γ ( ρ(x, x)) y por lo tanto tenemos que

v(x)( ρ(x, x)) ≤ −2γ ρ(x, x) + γ ρ(x, x) ≤ −γ ρ(x, x). (6.19)

Sea entonces ϕ(t ) una solución con dato inicial suficientemente cercano
a x = 0, es decir ϕ̇(t ) = v(ϕ(t )), |ϕ(0)| < C . Definiendo 2

r (t ) = ln ρ(ϕ(t ), ϕ(t )) (6.20)

y derivando con respecto a t obtenemos,

ρ(ϕ(t˙),ϕ(t )) v (ϕ(t ))( ρ(ϕ(t ),ϕ(t )))


2
ṙ (t ) = =
ρ(ϕ(t ),ϕ(t )) ρ(ϕ(t ),ϕ(t )) (6.21)
≤ −γ .

Por lo tanto r (t ) ≤ r (0) − γ t , he integrando concluimos que

ρ(ϕ(t ), ϕ(t )) ≤ ρ(ϕ(0), ϕ(0))e −γ t , (6.22)


2
Por unicidad de la solución ϕ(t ) 6= 0 y por lo tanto ρ(ϕ(t ), ϕ(t )) > 0 y el logaritmo está
bien definido.

138
lo que implica que ϕ(t ) → 0 y concluye la demostración del teorema. 3
t →∞

Es instructivo observar que la prueba se basa en la construcción de una


norma, ρ(x, x), especialmente adaptada al problema en el sentido que nos
asegura que en sus superficies de nivel el vector v(x) (si x es suficientemente
pequeño) apunta hacia adentro.

6.1. Problemas

Problema 6.1 (La ecuación de Volterra-Lotka) Sea el sistema:

ẋ1 = (a − b x2)x1
ẋ2 = −(c − f x1)x2, (6.23)
a, b , c, f ≥ 0.
a) Haga una trasformación de coordenadas y tiempo que lo lleve a la forma,
ẋ1 = (1 − x2)x1
ẋ2 = −(e − x1)x2 (6.24)
b) Grafique el campo vectorial y vea que no hay integrales primeras no tri-
viales en los cuadrantes donde al menos una de las coordenadas es negativa.
c) Encuentre las soluciones de equilibrio y determine cuáles son estables y
cuáles no.
d) Examine el cuadrante positivo mediante la transformación: x1 = e q1 ,
x2 = e q2 y vea que allí la cantidad f (q1, q2) := e q1 + q2 − (e q1 + e q2 ) es una
integral de movimiento. Utilice esta información para inferir que en ese cua-
drante las trayectorias permanecen en regiones acotadas.
e) Examine las ecuaciones linealizadas alrededor de la solución de equilibrio
en el cuadrante positivo y determine cuál sería la frecuencia de oscilaciones de las
variaciones cercanas a equilibrio que tendría el sistema.
Nota, esta ecuación describe la población de dos especies en competencia. Lo
que acabamos de ver es que las especies no crecen indefinidamente ni desaparecen.
Esto último nos dice que la aproximación no es muy buena... Note que x2 repre-
senta un predador que depende exclusivamente para su subsistencia de la presa
x1, ya que si ésta se extingue el predador lo sigue.
3
En realidad debemos probar además que si |ϕ(0)| < C luego ϕ(t ) existe para todo t .
Pero la última desigualdad probada nos dice que ϕ(t ) no puede abandonar la región compacta
{x| ρ(x, x) ≤ ρ(ϕ(0), ϕ(0))} y por lo tanto el teorema de extensión nos asegura que ϕ(t ) existe
para todo t ∈ [0, +∞).

139
Problema 6.2 Si en el sistema anterior las especies tienen otros medios alterna-
tivos de subsistencia entonces las ecuaciones resultantes son:

ẋ1 = (1 − x1 − a x2)x1
ẋ2 = (1 − x2 + b x1)x2 (6.25)

donde se ha usado otra parametrización.


a) Encuentre las soluciones de equilibrio para los casos i) 0 < a < 1, y ii)
1 < a.
b) Se observa que b ≈ 3a (a nos indica cuan agresivo es el predador). ¿Cuál
es el valor de a si su instinto lo lleva a maximizar la población de su especie
manteniendo un equilibrio estable?
c) Mire el sistema cerca de su solución de equilibrio y determine la frecuencia
de las oscilaciones en el número de especies que esperaría en ese entorno.

Problema 6.3 (Ciclo límite) Considere el sistema:

ẋ1 = x2 + x1(1 − (x12 + x22))


ẋ2 = −x1 + x2(1 − (x12 + x22)). (6.26)

a) Lleve este sistema a un par de ecuaciones desacopladas,

ṙ = f (r )
θ̇ = −1. (6.27)

b) Estudie los puntos de equilibrio de la primera ecuación y su estabilidad.


¿Cuál es la solución del sistema original correspondiente a este punto de equili-
brio?
c) Grafique soluciones cerca de estos puntos, en el plano (r, θ) y en el plano
(x1, x2).
d) Utilice el método descripto al final de capítulo 4 para corroborar la estabi-
lidad encontrada en el punto b).

Problema 6.4 (Verhulst) Encuentre las soluciones de equilibrio (y analice su


estabilidad) del sistema:

ẋ = y
ẏ = x − 2x 3 (6.28)

Grafique algunas soluciones.

140
Problema 6.5 (Verhulst) Encuentre las soluciones de equilibrio (y analice su
estabilidad) del sistema:

ẋ = x 2 − y 3
ẏ = 2x(x 2 − y) (6.29)

Grafique algunas soluciones.

Problema 6.6 (Verhulst) Encuentre las soluciones de equilibrio (y analice su


estabilidad) del sistema:

ẋ = −x
ẏ = 1 − (x 2 + y 2) (6.30)

Grafique algunas soluciones.

141
142
CAPÍTULO 7

PRUEBA DEL TEOREMA FUNDAMENTAL

Solo probaremos los puntos i) y i i), para lo cual usaremos el método de


aproximaciones sucesivas de Picard, que tiene su importancia en aplicaciones.
La prueba del punto i i i) es de carácter técnico y no aporta ninguna enseñan-
za extra de consideración. Punto i v) sigue de los puntos i) y i i ) y la prueba
de esto es idéntica a la del Corolario 1.2 del Teorema análogo para el caso de
una EDO.
Para la prueba de estos puntos deberemos desarrollar algunas ideas y re-
sultados de la teoría matemática de espacios vectoriales de dimensión infinita.
Nos restringiremos a lo mínimo que el teorema requiere ya que estos temas
serán desarrollados más extensamente en la segunda parte de este curso.

Definición: Diremos que un espacio vectorial, V es de dimensión infinita si


tiene un número infinito de vectores linealmente independientes.
Ejemplos:
a) Sea V el conjunto de todas las sucesiones {xi }, i = 1, . . . , ∞ de números
reales. Este es un espacio vectorial si definimos la suma y el producto de
sucesiones por medio de la siguiente fórmula,

{xi } + α{yi } = {xi + α yi }. (7.1)

Estos vectores se pueden escribir también como {xi } = (x1, x2, x3, . . .) con
lo que se ve que es la extensión de lRn con n → ∞. Claramente los u 1 =
(1, 0, 0, . . .); u 2 = (0, 1, 0, . . .); u 3 = (0, 0, 1, . . .); son linealmente independien-
tes e infinitos en número.

b) Sea V el conjunto de funciones continuas en el intervalo [0, 1]. Este es un


espacio vectorial ya que si f y g son continuas en [0, 1], luego h = f + α g ,
α ∈ lR, es también continua en [0, 1].

143
n
El conjunto PMun =n x n , n ∈ N , esn linealmente independiente
PM den vectores
e infinito ( n=0 c un = n=0 c x = 0 =⇒ c = 0 ∀ n ≤ M ) ya que un
polinomio de grado M tiene a lo sumo M raíces.
A los espacios de dimensión infinita también se les puede asignar nor-
mas, pero en este caso éstas no son equivalentes y por lo tanto habrá que ser
cuidadoso en no confundir las estructuras resultantes. Para ello asignaremos
distintos nombres a los espacios con distintas normas.
Ejemplos: a) El espacio vectorial normado l 2 es el espacio de sucesiones infi-
s
X∞
nitas con la norma k{xi }k2 = xi2 < ∞.
i =1
b) El espacio vectorial normado l ∞ es el espacio de sucesiones infinitas con
la norma k{xi }k∞ = s u pi {|xi |}. Es decir el espacio de todas las sucesiones
acotadas.
c) El espacio vectorial normado C [a, b ] es el espacio de funciones continuas
con la norma k f kc = s u p x∈[a,b ] {| f (x)|}. Es decir el espacio de funciones
continuas acotadas en [a, b ].

Ejercicios:
1) Muestre que las normas definidas en el ejemplo anterior son en realidad
normas.
2) Muestre que existen sucesiones en l ∞ que no pertenecen a l 2. Ayuda: En-
cuentre una de ellas. Æ P∞
3) Muestre que k{xi }kn := n |x |n
i =1 i −→
s u pi {|xi |}.
n→∞

A diferencia del caso de dimensión finita, un espacio normado de dimen-


sión infinita no necesariamente es completo. Para ilustrar esto consideremos
el espacio vectorial normado l0∞ el cual es un subespacio de l ∞ que consis-
te en todas las sucesiones acotadas con solo un número finito de términos
no nulos. Cada sucesión {xi }n = (1, 1/2, 1/3, . . . , 1/n, 0, 0, . . .) está en l0∞ , la
sucesión de sucesiones {{xi }n } es de Cauchy
 
1
k{xi } m − {xi }n k∞ = −→ 0
n + 1 n→∞
y converge a la sucesión {xi }∞ = (1, 1/2, 1/3, . . .) ∈ l ∞ que no pertenece a l0∞ .
Por lo tanto l0∞ no es completo.

Definición: Diremos que un espacio vectorial normado (V , k·k) es un espacio


de Banach si es completo.

144
Ejemplos: lRn con cualquiera de sus normas, l 2 y l ∞ son espacios de Banach.

Un importante resultado, crucial en la prueba del Teorema Fundamental


es el siguiente teorema.
Teorema 7.1 El espacio vectorial de funciones continuas acotadas, C [a, b ] es
completo.

Prueba: Sea { fn (x)} una sucesión de Cauchy en C [a, b ], es decir cada fn (x) es
una función continua y acotada en [a, b ] y se cumple que dado ǫ > 0 existe
N > 0 tal que ∀ m, n > N k fn − f m kc = s u p x∈[a,b ] | fn (x) − f m (x)| < ǫ.
Pero entonces para cada x ∈ [a, b ] la sucesión de números reales { fn (x)}
es de Cauchy. Pero los números reales son completos y por lo tanto para
cada x ∈ [a, b ] { fn (x)} converge a un número que llamaremos f (x). Pero
entonces dado ǫ > 0 para todo N tal que m, n ≥ N implique k fn − f m kc < ǫ,
tenemos que

s u p x∈[a,b ] | f (x) − fN (x)| = s u p x∈[a,b ] lı́m | fn (x) − fN (x)|


n→∞
≤ s u pn≥N s u p x∈[a,b ] | fn (x) − fN (x)| (7.2)
= s u pn≥N k fn − fN kc < ǫ.
Por lo tanto si pudiésemos probar que f ∈ C [a, b ] entonces tendríamos
que k f − fn kc → 0, n → ∞ y por lo tanto que { fn } → f en C [a, b ] y el
teorema estaría probado.
Sea x ∈ [a, b ] cualquiera y dado, probaremos que f es continua en x y
así en todo [a, b ]. Sea ǫ > 0, queremos encontrar un δ tal que |x − y| < δ
implique | f (x) − f (y)| < ǫ. Tomemos N tal que k f − fN kc < ǫ/3 y δ tal que
|x − y| < δ implique | fN (x) − fN (y)| < ǫ/3 [Esto es posible pues las fN (x)
son continuas en [a, b ]]. Luego |x − y| < δ implica
| f (x) − f (y)| ≤ | f (x) − fN (x)| + | fN (x) − fN (y)| + | fN (y) − f (y)|
1 (7.3)
< 3
ǫ + 13 ǫ + 13 ǫ = ǫ.

y por lo tanto la continuidad de f (x). Como [a, b ] es un conjunto compacto


(cerrado y acotado) luego f es acotada en [a, b ] y por lo tanto pertenece a
C [a, b ] ♠

Definición: Sea T : V → V un mapa de un espacio de Banach V en sí mismo.


Diremos que T es una contracción si existe λ < 1 tal que:
kT (x) − T (y)kV ≤ λ kx − ykV . (7.4)

145
Ejemplos: ¦x ©
a) El mapa lineal en l 2; A{x i } = i+1i .
b) El Mapa de lR2 en lR2 que manda al punto (x, y) en el punto (x0 +
x/2, y/2).
c) Una función Lipschitz cualquiera de lR en lR con módulo de continui-
dad (k) menor que uno.

La propiedad importante de estos mapas es el siguiente teorema

Teorema 7.2 Sea T : V → V una contracción. Luego existe un único v ∈ V


tal que T (v) = v, además la sucesión T n (u) tiende a v cualquiera sea u.

Prueba: Sea kT (u) − uk = d , luego kT n+1(u) − T n (u)k ≤ λn d y si m > n

kT m (u) − T n (u)k
= kT m (u) − T m−1(u) + T m−1(u) − T m−2(u) + · · · T n (u)k
m
≤ kTP (u) − T m−1(u)k + kT m−1(u) − T m−2(u)k + · · ·
≤ d nm λ m .
P
Como ∞ n=0
λn converge {T n (u)} es una sucesión de Cauchy. Pero V es
completo y por lo tanto existe v ∈ V tal que lı́mn→∞ T n u = v.
Como toda contracción es continua tenemos que

T (v) = T ( lı́m T n (u)) = lı́m T n+1(u) = v.


n→∞ n→∞

Solo resta probar que v es único. Supongamos por contradicción que


exista w ∈ V distinto de v y tal que T w = w. Pero entonces kw − vkV =
kT (w) − T (v)kV ≤ λ kw − vkV lo que es una contradicción ya que λ 6= 1 ♠

Ejercicio: Sea T : BR,x0 → BR,x0 , BR,x0 ∈ V una bola cerrada de radio R alrede-
dor de x0, una contracción 1. Probar para este caso las mismas afirmaciones
que en el teorema anterior.

Prueba de los puntos i) y i i ) del teorema fundamental. Como solo que-


remos ver existencia y unicidad local, es decir solo en un entorno de un punto
p de M es suficiente considerar el sistema en lRn . Esto nos permitirá usar la
norma euclídea allí presente. Para ver esto tomemos una carta (U , ϕ) con
1
Acomode también la definición de una contracción para este caso.

146
p ∈ U y por simplicidad ϕ( p) = 0 ∈ lRn . Usando este mapa podemos trasla-
dar el campo vectorial v en M a un campo vectorial ṽ definido en un entorno
del cero en lRn . Allí trataremos el problema de encontrar sus curvas integrales
g (t , x) que pasan por el punto x ∈ ϕ(U ) al tiempo t = 0. Luego por medio
del mapa ϕ −1 obtendremos en M las familias monoparamétricas de difeomor-
fismos g t (q) , q ∈ U , que serán tangentes en todo punto al campo vectorial
v.
Con esto en mente, solo resta por ver que para R > 0 y ǫ > 0 sufi-
cientemente pequeños existen curvas integrales, g (t , x) : [0, ǫ] × BR = {x ∈
lRn | kxkV < R} → lRn , del vector ṽ, es decir mapas satisfaciendo

d g (t , x)
= ṽ( g (t , x)) , g (0, x) = x, (7.5)
dt
con g (t , x) continua con respecto al segundo argumento, es decir con respec-
to a la condición inicial. Por la suposición de que v es Lipschitz 2, tenemos
que existe k > 0 tal que ∀ x, y ∈ BR

kṽ(x) − ṽ(y)kV < k kx − ykV . (7.6)

Consideremos ahora el espacio de Banach C ([0, ǫ] × BR ) que consiste en


todos los mapas continuos (en t y x ) de [0, ǫ] × BR en lRn con la norma

khkC = su p kh(t , x)kV ,


x ∈ BR (7.7)
t ∈ [0, ǫ].

Sea el mapa de la bola de radio R en C ([0, ǫ] × BR ) en sí misma dado por,


Zt
T (h) = ṽ(x + h(τ, x)) d τ . (7.8)
0

Para que este mapa esté bien definido supondremos R lo suficientemente pe-
queño como para que ṽ esté definido y satisfaga la condición de Lipschitz en
B2R y ǫ menor que R/C , donde C = máx x∈B2R |ṽ(x)|, de
modo que si khkC < R luego kx + h(τ, x)kV < 2R ∀τ ∈ [0, ǫ] y por lo tanto
kT (h)kC < R en todo C ([0, ǫ] × BR ). [Ver figura 7.1.]

Lema 7.1 Si ǫ es suficientemente pequeño entonces T es una contracción.


2
Para probar la existencia y unicidad de soluciones locales solo es necesario suponer que v
es Lipschitz.

147
h

2R

Figura 7.1: Entornos usados en la prueba del Teorema Fundamental.

Prueba:
Z t
kT (h1) − T (h2)kV = kṽ(x + h1(τ, x)) − ṽ(x + h2(τ, x))kV d τ
0
Zt
≤ k kh1(τ, x) − h2(τ, x)kV d τ
0
≤ k ǫ kh1 − h2kC
y por lo tanto
kT (h1) − T (h2)kC ≤ k ǫ kh1 − h2kC ∀ h1, h2 ∈ C ([0, ǫ] × BR ).
Tomando ǫ < 1/k completamos la prueba del Lema.
Este Lema y el Teorema 7.2 nos aseguran que existe un único mapa h(t , x)
–el punto fijo de T – satisfaciendo
Zt
h(t , x) = T (h(t , x)) = ṽ(x + h(τ, x)) d τ. (7.9)
0

Sea g (t , x) ≡ x + h(t , x), esta función es continua en ambos argumentos


–ya que h(t , x) ∈ C ([0, ǫ] × BR )– y por construcción continuamente dife-
renciable en t –ya que satisface (7.9)–. Diferenciando (7.9) con respecto a

148
t vemos que g (t , x) satisface la ecuación (7.5) y su condición inicial, lo que
completa la prueba de los puntos i) y i i ) del Teorema Fundamental. ♠

7.1. Problemas

Problema 7.1 Vea que l 2 la bola unidad no es compacta. Ayuda: encuentre una
sucesión infinita en la bola unidad que no tiene punto de acumulación.

Problema 7.2 Pruebe que la condición

kA(x) − A(y)k < kx − yk (7.10)

no es suficiente para garantizar la existencia de un punto fijo. Ayuda: construya


un contraejemplo. Hay algunos muy simples usando funciones de la recta en sí
misma.

Problema 7.3 Sea f : [a, b ] → [a, b ] una función Lipschitz con constante
menor que la unidad en todo el intervalo [a, b ]. Demuestre usando el teorema
del punto fijo para contracciones que la ecuación f (x) = x siempre tiene una
solución. Grafique en un diagrama (y = f (x), x) la sucesión dada por xi =
f (xi−1) para el caso de f con pendiente positiva y menor que uno en todo punto.
¿Qué sucede cuando la pendiente se hace mayor que uno en algún intervalo?

Problema 7.4 Sea g : [a, b ] → lR una función continuamente diferenciable tal


que g (a) < 0, g (b ) > 0 y 0 < c1 < g ′ (x). Use el teorema del punto fijo de las con-
tracciones para probar que existe una única raíz g (x) = 0 en el intervalo. Ayuda:
defina la función f (x) = x − λ g (x) para una constante λ convenientemente ele-
gida y encuentre un punto fijo: f (x) = x. Note que la sucesión aproximante es la
del método de Newton para obtener raíces.

149
150
CAPÍTULO 8

ELEMENTOS BÁSICOS DE ANÁLISIS FUNCIONAL

8.1. Introducción

Esta área de la matemática estudia los espacios funcionales, es decir los


espacios cuyos elementos son ciertas funciones. Usualmente éstos son de di-
mensión infinita. Así es que sus resultados principales forman dos clases. Al-
gunos son resultados generales, válidos para espacios vectoriales más generales
que aquellos cuyos elementos son funciones. Éstos tienen un carácter geomé-
trico o topológico el cual trataremos de rescatar en todo momento. Los otros
son resultados particulares que nos relacionan distintos espacios funcionales
entre sí. Estos son más cercanos a los resultados del análisis usual. Presenta-
remos aquí resultados de ambos tipos ya que de su conjunción obtendremos
algunos aspectos de la teoría de las EDP. Por razones de brevedad solo consi-
deraremos los puntos que nos serán útiles o aquellos para los que se requiera
un mínimo de esfuerzo extra para obtenerlos y su importancia cultural así lo
justifique.

8.2. Completando un Espacio Normado

En la primera parte de este curso introdujimos los espacios de Banach, es


decir espacios vectoriales con una norma definida en ellos y que eran comple-
tos con respecto a ella. Allí también probamos que el conjunto de funciones
continuas en un intervalo [a, b ] ∈ lR con la norma

k f k1 = S u p x∈[a,b ] {| f (x)|} (8.1)

era completo y por lo tanto Banach.


Cabe preguntarse si dado un espacio vectorial normado W es posible en-
gordarlo , es decir agregarle vectores, y así hacerlo completo. Note que eso
es lo que se hace con los racionales Q (el cual es un espacio vectorial si solo

151
permitimos la multiplicación de sus elementos por números racionales!). El
espacio engordado es en este caso el de los reales. La respuesta es afirmativa y
está dada por el siguiente teorema.

Teorema 8.1 Sea W un espacio vectorial normado. Luego existe un espacio de


Banach V y un mapa lineal continuo ϕ : W → V tal que kϕ(w)kV = kwkW y
ϕ[W ] es un subespacio denso de V , es decir la clausura de ϕ[W ] es V .

Prueba: Los detalles de esta pueden ser encontrados en, por ejemplo [Y], pag.
56. Aquí solo daremos las ideas. Si W es completo entonces tomamos V = W
y ϕ = i d . Por lo tanto supondremos que W no es completo. Entonces habrán
sucesiones de Cauchy {wn } en w que no convergen a ningún punto de W . La
idea es tomar estas sucesiones como nuevos puntos con los cuales engordar
W . Como muchas sucesiones distintas podrían tender a un mismo punto, a
los efectos de no engordar demasiado a W , todas ellas deberán ser conside-
radas como un solo elemento. Esto se logra tomando clases equivalentes de
sucesiones como elementos de V . Diremos que dos sucesiones, {wn }, {wn′ },
son equivalentes si su diferencia tiende al elemento cero,
lı́m kwn − wn′ kW = 0. (8.2)
n→∞

Como el conjunto de sucesiones de Cauchy de elementos de W forma un es-


pacio vectorial, el conjunto de clases equivalentes de sucesiones también es un
espacio vectorial, este será V . Este espacio hereda una norma naturalmente
de W , dada por,
k{wn }kV = lı́m kwn kW , (8.3)
n→∞
la cual es claramente independiente de la sucesión particular que uno elija,
para calcularla, dentro de la clase equivalente. Se puede probar fácilmente
que con esta norma V es completo y por lo tanto Banach.

Ejercicio: Pruebe que la sucesión de Cauchy de sucesiones de Cauchy, {{wn }N }


converge en esta norma a la sucesión {w̄n } ≡ {{wn }n }.

¿Cuál es el mapa ϕ? Este toma un elemento w ∈ W y nos da un elemento


en V , es decir una clase equivalente de sucesiones. Esta es la clase equivalente
que converge a w y un representante es, por ejemplo,
{wn } = (w, w, w, . . .). (8.4)

152
El teorema anterior nos dice que siempre podemos completar un espacio
vectorial normado y esto de una manera esencialmente única. De esta forma
entonces se puede hablar de completar un espacio normado W en uno V .
Como W es denso en V y el mapa ϕ es continuo todas las propiedades que
son continuas en W valen automáticamente en V . El teorema anterior nos
dice también que los elementos del espacio completado pueden tener un ca-
rácter muy diferente al de los elementos del espacio original. Debido a esto
es que en la práctica uno debe ser muy cuidadoso al momento de atribuirle
propiedades a los elementos de un dado espacio de Banach. Como ejemplo de
lo anterior veremos la integral de Lebesgue.

8.3. *Integral de Lebesgue

La integral de Lebesgue es una extensión de la integral de Riemann a una


clase de funciones más general que aquella donde la de Riemann está definida.
Tenemos dos maneras de definirla, uno como la norma de un espacio de Ba-
nach completado, cuyos elementos son entonces las funciones integrables
en el sentido de Lebesgue. La otra manera es usando un proceso de límite
similar al empleado para definir la integral de Riemann. Veremos las dos.
Sea W el espacio de funciones continuas en el intervalo [a, b ] y sea
Z b
k f kw = | f (x)| d x (8.5)
a

su norma, donde la integral es en el sentido de Riemann. Esta definición tiene


sentido ya que los elementos de W son funciones continuas y por lo tanto
la integral está bien definida. Note también que esta es una norma ya que
como f es continua si la integral de su módulo es cero, su módulo, y así f , es
también cero. Sea L1([a, b ]) el espacio completado de W . Este es el espacio
de funciones integrables de Lebesgue. ¿Qué funciones están allí?1 Sea { fn }
la sucesión dada por el gráfico de la fig. 8.1.

Esta sucesión es de Cauchy en L1([0, 1]) y por lo tanto converge a un


elemento de L1([0, 1]), la función,

0 0 ≤ x ≤ 1/4, 3/4 ≤ x ≤ 1
f (x) = (8.6)
1 1/4 < x < 3/4.
1
En realidad las funciones no son propiamente elementos de L1 sino que éstos son la ima-
gen por el mapa ϕ (definido en la sección anterior) de éstas.

153
1/4
1

0
1/4 1/2 3/4

Figura 8.1: Una sucesión de Cauchy.

Esto no es de sorprender ya que aunque esta función no es continua ésta


es integrable aún en el sentido de Riemann. Sea ahora la sucesión { fn } dada
por el gráfico de la fig. 8.2,

1/n

Figura 8.2: Otra sucesión de Cauchy.

esta también es de Cauchy y tiende a la función,



0 0 ≤ x < 1/2 < x ≤ 1
f (x) = (8.7)
1 x = 1/2,

la cual sí es muy extraña. Cualquiera sea el sentido de la integral de Lebesgue

154
la integral de esta función es de esperar que sea cero, y de hecho lo es ya que
Z1
lı́m | fn (x)| d x = 0. (8.8)
n→∞
0

Pero entonces la norma de f es cero y por lo tanto parecería ser tenemos


una contradicción, a menos que f sea cero. La resolución de este problema
consiste en notar que cuando completamos el espacio W tomamos como sus
elementos a ciertas clases equivalentes. La función descripta arriba está en la
clase equivalente correspondiente al elemento cero. Como veremos luego los
elementos de L1 son funciones, pero solo definidas en casi todos los puntos.
El segundo método consiste en definir la integral de Lebesgue de forma
similar a como se define la integral de Riemann. Para ello debemos definir lo
que se llama una medida en ciertos subconjuntos de lR, es decir una función
de estos subconjuntos en los reales positivos, que generaliza el concepto de
extensión (o medida) de un abierto (a, b ), µ((a, b )) = b − a.
Una vez introducido este concepto de medida la integral de Lebesgue de
una función positiva f : lR → lR+ se define como,
Z X X∞ m   
−1
m m+1
f (x) d x = lı́m ( f ) = lı́m µ f [ , ) ,
n→∞
n
n→∞
m=0 n n n

donde hemos usado el mismo símbolo para denotar la integral de Lebesgue


que el normalmente usado para la integral de Riemann, esto es natural ya
que como vimos en la primera definición si una función es integrable en el
sentido de Riemann lo es también en el sentido de Lebesgue y el valor de las
integrales coincide.
La interpretación de esta definición es la siguiente: se divide la imagen
de f en intervalos regulares de longitud n1 , se considera la imagen por f −1
de estos intervalos, se los mide con µ y estas medidas se suman convenien-
temente. Ver figura. Finalmente se toma elPlímite n yendoP a infinito, es de-
cir los intervalos
P yendo aPcero. Note que 2n ( f ) ≥ n ( f ) y por lo tanto
lı́mn→∞ n ( f ) = S u pn n ( f ) existe (pudiendo ser infinito).

¿Para qué funciones está definida esta operación? La condición de que f


fuese positiva no es realmente una restricción ya que cualquiera sea ésta siem-
pre se la puede escribir como f = f+ − f− con f+ y f− ambas positivas y
la integral es una operación lineal [lo cual no es obvio de la definición dada
arriba]. La condición que sí es restrictiva es que f −1(A), con A abierto, sea un
subconjunto medible, ya que como veremos si le pedimos a la función medi-
da que satisfaga ciertas propiedades naturales luego no todo subconjunto de

155
f (x)
m+1
n

m
n

f −1 [( mn , m+1
n
)]

Figura 8.3: Integral de Lebesgue.

lR puede estar en el dominio de esta función. Para estudiar esta restricción


debemos tener en claro qué propiedades queremos que la medida cumpla,
encontrar la colección de subconjuntos de lR que son medibles y finalmente
definir la medida. Estas propiedades definirán la noción de medida, o más es-
pecíficamente de espacio medible, ya que las propiedades que le asignaremos
dependen tanto de la medida como de su dominio de definición.

Definición: Un espacio medible consta de una terna (X , M , µ) donde X es


un conjunto (el dominio de las funciones a integrar), M una colección de sub-
conjuntos de X llamados los subconjuntos medibles de X y µ es una fun-
ción (llamada la medida) de M en lR∗ = lR+ ∪{∞} satisfaciendo las siguientes
condiciones:
i) ; ∈ M y µ(;) = 0.
i i ) Si A ∈ M luego Ac (el complemento de A en X ) también está en M .
[
i i i) Si Ai ∈ M , i = 1, 2, . . . , luego Ai ∈ M .
i
 
 [ 
i v) Si Ai ∈ M , i = 1, 2, ... y Ai ∩ A j = ; si i =
6 j luego µ  Ai  =
i
P
i µ (Ai ).
Intuitivamente los conjuntos medibles son los conjuntos que admiten una
noción de longitud o área y su medida es el valor de esta longitud o área.

156
Ejercicio: Muestre que:
1. X ∈ M
\
2. Si Ai ∈ M , i = 1, 2, ... luego Ai ∈ M . Esta es la razón por la cual se
i  
 \  P
pide ii), ya que esperaríamos que µ  Ai  ≤ i µ (Ai ).
i

3. Si A ⊂ B luego µ(A) ≤ µ(B).


Ejemplos:
1. Sea X un conjunto cualquiera y sea M la colección de todos los subcon-
juntos de X . Sea µ tal que µ(;) = 0 y µ(A) = ∞ para todo A ∈ M no
vacío.
2. Sea M = {;, X } y sea µ tal que µ(;) = 0 y µ(X ) = 7.
3. Sea X = Z + = {números enteros positivos} y sea {xi }, xi ∈ lR+ , una
sucesión. Sea M la colección de todos los subconjuntos de Z + y µ(A) =
P
i∈A(xi ).
El siguiente no es un espacio medible (¿por qué?) pero nos será útil para
construir luego el que deseamos.
4. Sea X = lR y M = J el conjunto de todas las uniones (contables)
de intervalos abiertos disjuntos, es decir un elemento, I , de J es un
subconjunto de lR de la forma,
[
I = (ai , bi ), (8.9)
i

con a1 ≤ b1 < a2 ≤ b2 < a3 · · · . Sea µ ≡ m : J → lR∗ definida como,


X
m(I ) = (bi − ai ). (8.10)
i

Ejercicio: Muestre que el tercer ejemplo es un espacio medible.

Como se ve de estos ejemplos la noción de espacio medible es amplia.


Distintos ejemplos de espacios medibles aparecen en diversas ramas de la físi-
ca. De ahora en más nos restringiremos a un espacio medible y éste es el de
Lebesgue, el cual construiremos a partir del cuarto ejemplo.

157
Sea X = lR, M̄ todo subconjunto de X y µ̄ : M̄ → lR∗ dada por,
µ̄(A) = in f (m(I ))
I ∈I (8.11)
A⊂ I .
Es decir, dado un subconjunto de lR, A, consideramos todos los elementos de
J tales que A está contenido en éstos, calculamos su medida y tomamos el
ínfimo sobre todos los elementos de J .
Ejemplos:
1. Sea A = (0, 1), luego un candidato es I1 = (−1, 1) ∪ (3, 5), m(I1) = 2 +
2 = 4, pero también tenemos I2 = (0, 1) con m(I2) = 1 y claramente
µ̄(A) = 1.
2. Sea B = 1 ∪ 2 ∪ 3 ∪ . . . luego µ̄(B) = 0 ya que podemos cubrir B con
I = (1 − ǫ, 1 + ǫ) ∪ (2 − ǫ, 2 + ǫ) ∪ . . . .
Como vemos esta terna (lR, M̄ , µ̄) parece tener las condiciones deseadas
para ser la medida que buscamos, pero en realidad ni siquiera es un espacio
medible!

Contraejemplo: Sea (S 1, M , µ), donde S 1 es el círculo, un espacio medible con


µ una medida finita e invariante ante translaciones, es decir µ(A) = µ(Ar )
donde Ar = {a + r |a ∈ A} -note que nuestra µ̄ lo es, pero este resultado es
mucho más general-. Luego M no puede ser la colección de todos los subcon-
juntos de S 1.
La idea es encontrar un subconjunto A de S 1 tal que si suponemos que
sea medible obtenemos una contradicción. Para ello pensamos a S 1 como lR
con sus extremos identificados (0=1). Introducimos ahora una relación de
equivalencia: Diremos que dos puntos de S 1 son equivalentes a ≈ b si a − b
es un número racional.

Ejercicio: Muestre que es una relación de equivalencia.


Construimos A tomando exactamente un elemento de cada clase equiva-
lente -note que hay infinitas maneras de elegir un conjunto A- Supongamos
que A es medible con µ(A) = α ∈ lR+ y sea Ar = {a| (a + r ) (mod 1) ∈ A},
con r racional, es decir una translación por −r de A. Luego es fácil ver que si
r 6= r ′ luego Ar ∩ Ar ′ = ;, es decir los Ar son disjuntos [Si x ∈ Ar y x ∈ Ar ′
luego x = a + r = b + r ′ , con a, b ∈ A,[ pero entonces a − b = r − r ′ ∈ Q lo
que es una contradicción.] y que S 1 = Ar [Sea x ∈ S 1, luego x pertenece
r ∈Q

158
a alguna de las clases equivalentes en que hemos separado a S 1, pero entonces
existe a ∈ A y r ∈ Q tal que a + r = x, o sea x ∈ Ar .]. Como por hipótesis
µ(Ar ) = µ(A) = α entonces,
 
[  X X

1
1 = µ(S ) = µ  
Ar  = µ(Ar ) = α, (8.12)
r ∈Q r ∈Q

lo cual lleva a una contradicción ya que si α = 0 luego la sumatoria da cero y


si α 6= 0 la sumatoria da infinito.
Este contraejemplo nos dice entonces que debemos restringir M a ser un
subconjunto de M̄ si queremos tener una medida. Hay muchas maneras de
caracterizar esta restricción una de ellas está dada por el siguiente teorema
(que no probaremos).

Teorema 8.2 Sea M el subespacio de M̄ tal que si A ∈ M luego

µ̄(E) = µ̄(A ∩ E) + µ̄((X − A) ∩ E) ∀E ∈ M̄ . (8.13)

Sea µ la restricción de µ̄ a M , luego (X , M , µ) es el espacio medible de Lebesgue.

Intuitivamente vemos que los conjuntos medibles son aquellos que cuan-
do usados para separar otros conjuntos en dos partes dan una división que es
aditiva con respecto a µ̄.
Como en general solo tenemos que µ̄(E) ≤ µ̄(A ∩ E) + µ̄((X − A) ∩ E)
vemos entonces que los conjuntos no-medibles son aquellos cuyos puntos están
distribuidos en X de tal forma que cuando uno trata de cubrir A∩E y (X −A)∩E
con abiertos éstos se superponen tanto que en realidad uno puede obtener un
ínfimo menor cubriendo directamente E con abiertos.
Existe un gran número de teoremas que nos dan información acerca de
cuáles son los conjuntos medibles. Bastará decir que todos los conjuntos abier-
tos de lR (y muchos más ) están en M y que si f : lR → lR es una función
continua luego f −1[M ] ∈ M .
Retornamos ahora a la integral de Lebesgue. Naturalmente diremos que
f es medible si f −1[(a, b )] ∈ M para todo intervalo abierto (a, b ) ∈ lR.

Teorema 8.3 Las funciones medibles tienen las siguientes propiedades:

a) Si f y g son medibles y λ ∈ lR luego f + λ g es medible.

b) También son medibles f g , ma x{ f , g } y mi n{ f , g }.

159
c) Sea { fn (x)} una sucesión de funciones medibles que convergen punto a
punto a f (x), es decir lı́mn→∞ fn (x) = f (x), luego f (x) es también me-
dible.

Note que | f | = ma x{ f , − f } y f± = max


mi n
{ f , 0}.

La primera parte de este teorema nos dice que el conjunto de funcio-


nes medibles es un espacio vectorial. Esto sigue siendo cierto si nos restrin-
gimos al espacio de R funciones integrables en el sentido de Lebesgue, es de-
cir f medible y | f | d x < ∞. Denotaremos a este espacio como L1 o
L1(lR). Similarmente definiremos L1[a, b ] al espacio de funciones integra-
bles f : [a, b ] → lR donde en este caso la integral se define como antes pero
extendiendo la función f a todo lR con valor cero fuera del intervalo [a, b ].
Como ya vimos antes para hacer de L1 un espacio normado debemos
tomar como sus elementos las clases equivalentes
R de funciones donde diremos
que f , g ∈ L1 son equivalentes si | f − g |d x = 0. Esto es equivalente a
decir que el subconjunto de lR donde f es distinta de g es de medida cero, o
en otras palabras que f es igual a g en casi todo punto.
Denotaremos al espacio de clases equivalentes de funciones integrables
(Lebesgue) con L1 y sus elementos con letras tildadas. Note que un elemento
f˜ de L1 es una clase equivalente de funciones y por lo tanto en general el valor
de f˜ en x, f˜(x), no tiene sentido alguno ya que podemos tener funciones en
la clase equivalente f˜, f1 y f2 con f1(x) 6= f2(x) para algún x ∈ lR. Por lo tanto
debemos ser precavidos al respecto.
¿Es este espacio L1 el mismo que habíamos obtenido anteriormente? La
respuesta es sí y sigue trivialmente de los siguientes teoremas.

Teorema 8.4 (Riez-Fisher) : L1 es completo.

Teorema 8.5 C 1[a, b ] es denso en L1[a, b ], es decir L1[a, b ] es el espacio com-


pletado de C 1[a, b ].

8.4. Espacios de Hilbert

Los espacios de Hilbert son espacios de Banach2 cuya norma proviene de


un producto escalar, es decir de un mapa (·, ·) de V × V → C satisfaciendo:
2
De ahora en más y esencialmente por la misma razón que dimos en el caso del teorema
de la forma canónica de Jordan, consideraremos espacios vectoriales complejos.

160
i) (x, y + c z) = (x, y) + c(x, z),
(x + c y, z) = (x, z) + c̄(y, z)
para cualquier x, y, z en V y c en C .

i i) (x, y) = (y, x)
i i i) (x, x) ≥ 0 (0 sii x = 0).
La primera parte de la condición i) indica que el mapa producto escalar
es lineal con respecto a su segundo argumento. La segunda parte indica que
es lineal en el primer argumento, excepto por el hecho de que se toma el
complejo conjugado del escalar. Se dice que este mapa es anti-lineal con res-
pecto al primer argumento. La condición ii) nos dice que el mapa es todo lo
simétrico que puede ser, dado que en el primer argumento es anti-lineal. Esta
condición nos garantiza que (x, x) es un número real y , junto con i i i), que
es no-negativo.

Ejercicio: Pruebe que dando un tensor de tipo (2, 0), t (·, ·), simétrico, real y
positivo definido, entonces (x, y) ≡ t (x̄, y) es un producto escalar.

La norma que este producto escalar induce es simplemente la función,


k · kV : V → lR+ dada por,
Æ
kxkV = (x, x). (8.14)
Que esta es en realidad una norma sigue de los siguientes lemas:
Lema 8.1 (Desigualdad de Schwarz) : |(x, y)| ≤ kxk kyk.

Prueba: Para cualquier x, y ∈ V , λ ∈ lR tenemos por iii),


0 ≤ (y + λ(x, y) x, y + λ(x, y) x)
= kyk2 + λ2 |(x, y)|2 kxk2+
(8.15)
+λ (x, y)(x, y) + λ (x, y)(y, x)
= kyk2 + 2λ |(x, y)|2 + λ2 |(x, y)|2 kxk2.
Como esta relación debe valer para todo λ ∈ lR entonces el discriminante
del polinomio en λ de la derecha debe ser no-positivo, es decir,
4|(x, y)|4 − 4kxk2kyk2|(x, y)|2 ≤ 0. (8.16)
lo que nos da la desigualdad buscada.

161
Lema 8.2 (Desigualdad triangular) : kx + yk ≤ kxk + kyk.

Prueba:
kx + yk2 = kxk2 + kyk2 + 2Re (x, y)
≤ kxk2 + kyk2 + 2|(x, y)|
≤ kxk2 + kyk2 + 2kxk kyk
≤ (kxk + kyk)2 ,
Lo que nos da la desigualdad buscada.
Ejemplos:
1. C n , el espacio vectorial de n-tuplas de números complejos.
Sea x = (x1, x2, ..., xn ) e y = (y1, y2, ..., yn ), luego
X
n
(x, y) = x̄ j y j .
j =1

2. l 2, el espacio vectorial de sucesiones de números complejos {xi } tales


que v
uX
u∞
k{x j }k2 ≡ t |x j |2 < ∞,
j =1

con el producto escalar,


X

({x j }, {y j }) = x̄ j y j .
j =1

Note que la desigualdad de Schwarz nos garantiza que el producto es-


calar está bien definido para todo par de vectores de l 2.
Para asegurarnos que l 2 es un espacio de Hilbert debemos probar que
es completo, es decir que toda sucesión de Cauchy (con respecto a la
norma de l 2) converge a un elemento de l 2.

Lema 8.3 l 2 es un espacio de Hilbert.

Prueba: Sea {{xi }N } una sucesión de sucesiones. Que esta sea de Cau-
chy significa que dado ǫ > 0 existe N̄ tal que
X

k{xi }N − {xi }M k = 2
|xiN − xiM |2 < ǫ2 ∀ N , M > N̄ ,
i=1

162
pero eso implica que para cada i

|xiN − xiM | < ǫ (8.17)

es decir la sucesión de números complejos (en N , i fijo) {xiN } es Cauchy.


Pero el plano complejo es completo y por lo tanto para cada i, {xiN }
converge a un número complejo que denotaremos x̄i
Sea {x̄i } la sucesión (en i) de estos números, probaremos ahora que
{x̄i } ∈ l 2 y que {{xi }N } −→ { x¯i } para N → ∞.
Tomando el límite N → ∞ vemos que si M > N̄ luego

X
k
|x jM − x̄ j |2 < ǫ2
j =1

Pero esta es una sucesión (en k) de números reales que es acotada (por
ǫ2) y por lo tanto, tomando ahora el límite k → ∞ vemos que {{xi }N }−
{x̄i } ∈ l 2 y que si {x̄i } ∈ l 2 luego {{xi }N } → {x̄i } en norma. Pero

k{x̄i }k2 = k{{xi }N } + ({x̄i } − {{xi }N })k2


≤ k{{xi }N }k2 + k{x̄i } − {{xi }N }k2,

y por lo tanto que {x̄i } ∈ l 2 ♠


Este ejemplo y el que lo sigue son ejemplos clásicos a tener en cuenta,
esencialmente todo espacio de Hilbert que trataremos es alguna de estas
variantes.

3. L2 (o H 0), el espacio de funciones medibles con cuadrado integrable en


lR e identificadas entre
R sí, si 2su diferencia está en un conjunto de me-
dida cero ( f ∼ g si | f − g | d x < 0). El producto escalar es ( f , g ) =
R ¯ ÆR
f g d x y su norma obviamente k f k 0 = H | f |2 d x.

4. (Espacios de Sobolev) Sea la norma


Z X
n X
n
2 2 2
k f kH m = {| f | + |∂i f | + |∂i ∂ j f |2 + · · ·
Ω i=1 i, j =1
X
n
+ |∂i ∂ j . . . ∂k f |2},
i, j , . . . , k = 1
| {z }
m

163
donde las derivadas parciales son con respecto a un sistema cartesiano
de coordenadas en lRn . Definiremos el espacio de Sobolev de orden m
como, H m (Ω) = { Completamiento del espacio de funciones m veces
diferenciables en Ω ⊂ lRn con respecto a la norma k kH m }
Es obvio cuál es el producto escalar correspondiente, además note que
por definición H m es completo. H 0 coincide con el definido en el ejem-
plo anterior, ya que las funciones continuas son densas en L2.

Como vemos de estos ejemplos los espacios de Hilbert son la generaliza-


ción inmediata de lRn ( o C n ) a dimensión infinita donde hemos preservado
la noción no solo de la magnitud de un vector sino también la del ángulo
entre dos vectores. Esto hace que los espacios de Hilbert tengan propiedades
más interesantes que las que tienen los espacios de Banach en general. La más
interesante se refiere a los subespacios de H . Sea M un subespacio cerrado de
H . Este subespacio hereda el producto escalar definido en H (simplemente
restringiendo el mapa (·, ·) a actuar solo en elementos de M ) y por ser cerrado
es completo, por lo tanto es también un espacio de Hilbert.

Ejemplos:

a) Sea M el subespacio generado por el vector (1, 0, 0) en C 3, es decir todos


los vectores de la forma (c, 0, 0) con c ∈ C .

b) Sea M el subespacio de H 0 que consiste de todas las funciones que se


anulan en el intervalo (0, 1) excepto en un subconjunto de medida nula.
M es cerrado, ya que si una sucesión de Cauchy de funciones se anula en
( 0, 1) luego la función límite (que existe pues H es completo) también
se anula en dicho intervalo y por lo tanto está en M .

c) Sea M = C [a, b ] el subespacio de funciones continuas de H 0([a, b ]).


Este no es cerrado y por lo tanto no es un espacio de Hilbert. [Mues-
tre, encontrando una sucesión de Cauchy de funciones continuas que
no tiene como límite una función continua, que este subespacio no es
cerrado.]

d) Sea K un subconjunto cualquiera de H y considere la intersección de


todos los subespacios cerrados de H que contienen a K. Esta inter-
sección nos da el subespacio más pequeño que contiene a K y se lla-
ma el subespacio generado por K. En el ejemplo a) K = {(1, 0, 0)} ge-
nera el plano complejo que contiene a este vector. En el ejemplo c)
K = C [a, b ] genera todo H 0([a, b ]).

164
El concepto definido anteriormente no usa del producto escalar y por lo
tanto también es válido para espacios de Banach en general (un subespacio
cerrado de un espacio de Banach es también un espacio de Banach).
El producto escalar nos permite introducir el concepto de ortogonalidad
y así definir el complemento ortogonal de M , es decir el conjunto,

M ⊥ = {x ∈ H | (x, y) = 0 ∀ y ∈ M }, (8.18)
que tiene la siguiente propiedad,

Teorema 8.6 Sea M un subespacio cerrado de un espacio de Hilbert H . Luego


M ⊥ es también un espacio de Hilbert. Además M y M ⊥ son complementarios, es
decir todo vector en H puede ser escrito de una única manera como la suma de
un vector en M y otro en M ⊥ .

H = M ⊕ M⊥ (8.19)

Prueba:
Es inmediato que M ⊥ es un subespacio vectorial y que es cerrado. [Si {xi }
es una sucesión en M ⊥ convergiendo a x en H luego |(x, y)| = |(x − xi , y)| ≤
kx − xi k kyk → 0 ∀ y ∈ M y por lo tanto x ∈ M ⊥ .] Solo debemos probar la
complementaridad. Para ello, dado x ∈ H , buscaremos el elemento z en M
más próximo a x, ver figura.

M⊥

~y
~x

~z
z~2
z~1

Figura 8.4: El espacio perpendicular.

Sea d = i n fw∈M kx − wkH y elijamos una sucesión {zn } en M tal que


kx − zn kH → d . Esto es posible por la definición de ínfimo.

165
Luego

kzn − z m k2H = k(zn − x) − (z m − x)k2H


= 2kzn − xk2H + 2kz m − xk2H
−k(zn − x) + (z m − x)k2H
z +z
= 2kzn − xk2H + 2kz m − xk2H − 4k n 2 m − xk2
≤ 2kzn − xk2H + 2kz m − xk2H − 4 d 2
−→ 2 d 2 + 2 d 2 − 4 d 2 = 0
m→∞
n→∞

La segunda igualdad proviene de la llamada ley del paralelogramo, ver figura.

zn
(zn − x) + (z m − x)

(zn − x) − (z m − x)

zm
x

Figura 8.5: Ley del paralelogramo.

Esto nos dice que {zn } es Cauchy y por lo tanto que converge a un único
z en M .
Sea y = x − z, solo resta ver que y está en M ⊥ , es decir que (y, v) =
0 ∀ v ∈ M . Sea v ∈ M y t ∈ lR, luego

d 2 ≡ kx − zk2 ≤ kx − (z + t v)k2 = ky − t vk2


(8.20)
= d 2 − 2 t Re(y, v) + t 2 kvk2

y por lo tanto −2t Re(y, v)+t 2 kvk2 ≥ 0 ∀ t lo que implica que Re(y, v) = 0.
Tomando i t se obtiene que I m(y, v) = 0 y se completa la prueba ♠

Problema 8.1 En la prueba solo usó la ley del paralelogramo,

kx + yk2 + kx − yk2 = 2(kxk2 + kyk2) (8.21)

166
Muestre que una norma la satisface si y solo si ésta proviene de un producto
escalar. Ayuda: Utilice la denominada identidad de polarización para definir un
producto interno a partir de la norma,

1
(x, y) = {[kx + yk2 − kx − yk2] − ℑ[kx + ℑyk2 − kx − ℑyk2] (8.22)
4

Este teorema tiene importantes corolarios que veremos a continuación.

Corolario 8.1 (M ⊥ )⊥ = M

Prueba:
Probaremos éste mostrando que M ⊂ (M ⊥ )⊥ y que (M ⊥ )⊥ ⊂ M .
La primera inclusión es obvia ya que (M ⊥ )⊥ es el conjunto de vectores
ortogonales a M ⊥ el cual a su vez es el conjunto de vectores ortogonales a M .
La segunda inclusión sigue de que si descomponemos cualquier vector
x ∈ (M ⊥ )⊥ en su parte en M y en parte en M ⊥ , x = x1 + x2, x1 ∈ M , x2 ∈ M ⊥ ,
la primera inclusión nos dice que x1 ∈ (M ⊥ )⊥ pero (M ⊥ )⊥ y M ⊥ son también
complementarios y por lo tanto x2 = 0 ♠
Este nos dice que tomando complementos no obtendremos más que un
solo espacio de Hilbert extra.
Para formular el siguiente corolario es necesario introducir un nuevo con-
cepto, el de espacio dual de un espacio de Hilbert. Podríamos definir el dual
de un espacio de Hilbert de la misma forma que lo hicimos para espacios vec-
toriales de dimensión finita, es decir como el conjunto de mapas lineales de
H en C. El espacio vectorial así obtenido no hereda H ninguna propiedad
interesante por ser éste un espacio demasiado grande. Para lograr un espacio
más pequeño y con propiedades atractivas restringiremos los mapas lineales
a aquellos que sean continuos. Es decir el espacio dual a H , H ′ será el con-
junto de mapas lineales continuos de H en C. ¿Qué mapas están en H ′ ? Note
que si y ∈ H luego el mapa ϕ y : H → C definido por ϕ y (x) = (y, x) es lineal
y como |ϕ(x)| ≤ kykH kxkH también es continuo. Este mapa nos da una co-
rrespondencia inyectiva (no canónica, ya que depende del producto escalar)
entre los elementos de H y los de su dual. Vemos así que H está contenido
naturalmente en H ′ .

Ejercicio: Medite sobre cuál es la norma natural en H ′ . Pruebe que con esa
norma tenemos kφy kH ′ = kykH .

167
Problema 8.2 Sea φ : H → C un mapa lineal. Muestre que la continuidad del
mapa en el origen asegura la continuidad del mapa en todo punto.

Si la dimensión de H es finita luego sabemos que H ′ tendrá la misma


dimensión y entonces tendremos una correspondencia (no canónica) uno a
uno entre vectores y covectores. En principio esto no tiene por qué ser así
en el caso de dimensión infinita y efectivamente si usamos una definición
análoga y definimos el dual de un espacio de Banach en general no habrá
ninguna relación entre éste y el espacio original. En el caso de espacios de
Hilbert todo es más simple, como muestra el siguiente corolario.

Corolario 8.2 (Teorema de representaciones de Riez) : Sea ϕ ∈ H ′ , luego


existe un único y ∈ H tal que ϕ(x) = (y, x)∀ x ∈ H , es decir H ≈ H ′ en el
sentido que existe un mapa natural invertible entre H y H ′ .

Prueba: Sea M = {x ∈ H tal que ϕ(x) = 0}. Como ϕ es lineal, M es un subes-


pacio de H , como ϕ es continuo este es cerrado. Por el teorema anterior M ⊥
es un espacio de Hilbert y complementa a M . Si M ⊥ es cero luego M = H
y ϕ es el mapa cero e y = 0 será su representante en H . Supongamos en-
tonces M ⊥ 6= {0} y elijamos w ∈ M ⊥ tal que ϕ(w) = 13. Para cualquier
v ∈ M ⊥ v − ϕ(v)w ∈ M ⊥ , pero ϕ(v − ϕ(v)w) = 0 y por lo tanto también
v − ϕ(v)w ∈ M . Así concluimos que v − ϕ(v)w = 0 ∀ v ∈ M ⊥ o sea que
v = ϕ(v)w ∀ v ∈ M ⊥ , es decir que M ⊥ es unidimensional. Veamos ahora que
w
ϕ(x) = ( , x) ∀x ∈ H . En efecto por el teorema anterior x = αw + y con
kwk2
α ∈ C e y ∈ M y por lo tanto, ϕ(x) = ϕ(αw + y) = αϕ(w) + ϕ(y) = α, pero
w
por otro lado, ( , x) = α ♠
kwk2

Ejercicio: Concluya la prueba probando unicidad.

Para enunciar el tercer corolario necesitamos el concepto de base orto-


normal. Una base ortonormal de H es un subconjunto de vectores de H
que tienen norma uno, que son mutuamente ortogonales y que generan H
(es decir que dado x ∈ H y ǫ > 0 existe una combinación lineal finita de
elementos de esta base y tal que kx − ykH < ǫ.
3
El lector debe convencerse que si ϕ no es el mapa nulo entonces siempre existe w ∈ H tal
que ϕ(w) = 1.

168
Ejemplo: En l 2 sea e1 = (1, 0, 0, ...), e2 = (0, 1, 0, ...), etc.
Pi
Ejercicio: Muestre que si a ∈ l 2 luego ka − n=1
(a, en )en k l 2 −→ 0.
i→∞

Corolario 8.3 Todo espacio de Hilbert tiene una base ortonormal.

Este resultado, como el anterior, es muy poderoso ya que nos dice que
siempre podemos aproximar distintos elementos de H usando una dada base.
No probaremos este Corolario pues para ello se necesitan herramientas que
no se verán en este curso. Pero sí otro resultado más simple, para lo cual
introducimos la siguiente definición.

Definición: Diremos que un espacio de Banach (y en particular de Hilbert)


es separable si tiene un subconjunto denso con una cantidad numerable de
elementos.
Ejemplos:
a) El subconjunto S de sucesiones l 2 que tienen un número finito de ele-
mentos racionales es denso en l 2 [ya que como veremos más adelante cual-
quier elemento de l 2 se puede expresar como el límite de una sucesión S] y
numerable [ya que los racionales lo son].
b) El subconjunto S(lR) que consiste de las funciones f r,s,t (x) = r e −s|x−t |
(note que estas son suaves), donde r, s, t son números racionales y s > 0, es
denso y numerable en L2(lR).
La mayoría de los espacios de Hilbert que aparecen en la práctica son
separables y por lo tanto tienen la siguiente propiedad:

Teorema 8.7 Un espacio de Hilbert H es separable si y solo si tiene una base


ortonormal numerable S. Si S tiene un número finito de elementos, N, luego H
es isomorfo a C N (es decir existe un mapa ϕ : H → C N , en este caso lineal, con
kϕ(x)kC N = kxkH ∀x ∈ H que es continuo e invertible y su inversa es también
continua). Si S tiene un número infinito de elementos luego H es isomorfo a l 2.

Este teorema nos dice que entre los espacios de Hilbert separables esen-
cialmente no hay más estructura que la ya presente en C N o l 2.

Prueba: Para obtener la base ortonormal (numerable) primero descartamos


de un subconjunto denso y numerable de H , S, algunos de sus elementos
hasta obtener una subcolección de vectores (por construcción numerable) li-
nealmente independientes y que todavía expanden S. Luego aplicamos a esta

169
subcolección el procedimiento de Gram-Schmidt para obtener la base orto-
normal. Para probar el resto del teorema necesitamos los siguientes lemas.

Lema 8.4 (Pitágoras) : Sea {xn }N


n=1
un conjunto ortonormal de H , no necesa-
riamente una base. Luego,

X
N X
N
kxk2H = 2
|(xn , x)| + kx − (xn , x)xn k2 ∀ x ∈ H . (8.23)
n=1 n=1

P PN
Prueba: Sea v = N n=1
(x n , x)x n y w = (x − (x , x)xn ). Es fácil de ver
n=1 n
que v ∈ V , el subespacio de Hilbert generado por los {xn }N n=1
y w ∈ V ⊥,
pero entonces

kxk2H = (x, x)
= (v + w, v + w)
= (v, v) + (w, w)
XN
= |(xn , x)|2 + kwk2H .
n=1

Lema 8.5 (Desigualdad de Bessel) :


Sea {xn }N
n=1
un conjunto ortonormal de H , no necesariamente una base.
Luego,
XN
2
kxkH ≥ |(x, xn )|2 ∀ x ∈ H (8.24)
n=1

Prueba: Obvia conclusión del lema anterior ♠

Lema 8.6 Sea S = {xn } una base ortonormal numerable4 de H . Luego ∀ y ∈


H, X
y= (xn , y)xn (8.25)
n
y X
kyk2 = |(xn , y)|2, (8.26)
n
4
Un resultado similar es válido aún en el caso de que la base no sea numerable, o sea aún
cuando H no sea separable.

170
donde la primera igualdad significa que la suma converge con respecto a la norma
de H a y ∈ H . La última igualdad es llamada relación de Parseval y los
2
coeficientes
P (xn , y) los coeficientes de Fourier de y. Inversamente si {cn } ∈ l
luego n cn xn ∈ H .

Prueba: De la desigualdad de Bessel sigue que dado cualquier subconjunto


finito {xn }N
n=1
,
XN
aN = |(xn , y)|2 ≤ kyk2 (8.27)
n=1

lo que implica que la sucesión {aN }, que es monótonamente creciente, es aco-


tada y por lo tanto converge
PaNun valor límite finito. Esto a su vez implica que
{aN } es Cauchy. Sea yN = n=1(xn , y)xn , luego para N > M

X
N X
N
kyN − yM k2H =k (x j , y)x j k2H = |(x j , y)|2 = aN − aM
j =M +1 j =M +1

La convergencia de {aN } garantiza así que {yN } es una sucesión de Cauchy


y así que esta converge a un elemento y ′ de H . Probemos entonces que y ′ = y.
Pero para cualquier elemento de S, xn

X
N

(y − y , xn ) = lı́m (y − (x j , y)x j , xn )
N →∞
j =1
(8.28)
= (y, xn ) − (y, xn ) = 0

y por lo tanto y−y ′ es perpendicular al espacio generado por S, que es todo H


y por loP∞ tanto tiene que ser el elemento cero. Solo resta ver que si {cn } ∈ l 2
luego n=1 cn xn ∈ H . Un cálculo idéntico al anterior muestra que {yN =
PN
c x } es una sucesión de Cauchy y por lo tanto que lı́mN →∞ yN ∈ H
n=1 n n

Continuamos ahora la prueba del Teorema 8.7 El último argumento del
Lema 8.6 nos muestra que dada unaPbase numerable {xn }∞ n=1
de H el conjunto

numerable S panQ {S} = {x|x = n=1 cn xn con {cn } una sucesión finita de
racionales } es denso en H y por lo tanto que H es separable. Esto concluye
la parte sii de la prueba, solo resta encontrar un isomorfismo entre H y C N
o l 2. Sea {xn } una base numerable de H y sea ϕ : H → C N o l 2 el mapa

ϕ(y) = {(xn , y)}. (8.29)

171
Si la base es finita, con dimensión N este es claramente un mapa en C N . Si la
base es infinita la imagen de H por ϕ está incluida en el espacio de sucesiones
complejas infinitas, pero usando el Lema 8.6 vemos que ,

X

kϕ(y)k22 = |(xn , y)|2 = kyk2H (8.30)
l
n=1

y por lo tanto que dicha imagen está contenida en l 2. La continuidad e inver-


tibilidad del mapa quedan como ejercicio para el lector ♠

El teorema anterior, entre otras cosas sirve para dar una caracterización
que diferencia los espacios de Hilbert de dimensión finita de los de dimensión
infinita. (En realidad esta caracterización es válida para espacios de Banach en
general).

Teorema 8.8 Sea H un espacio de Hilbert y sea

B1(H ) = {x ∈ H / kxkH ≤ 1}

la bola de radio uno en H . Luego B1(H ) es compacta sii H es de dimensión


finita. [Se puede ver que en este caso un subconjunto B de H es compacto sii toda
sucesión {xn } de elementos de H en B tiene una subsucesión que converge a un
elemento de B.]

Prueba: Veremos solo el caso en que el espacio es separable. Si H es de di-


mensión finita es isomorfo a C N , pero B1(C N ) es un subconjunto cerra-
do y acotado, y por lo tanto compacto. Si H es de dimensión infinita (y
separable) entonces es isomorfo a l 2, pero la sucesión en B1(l 2), {xn } con

{xn = (0, ..., 0, 1 , 0, ...)} claramente no tiene ninguna subsucesión conver-


n

gente ♠

Ejercicio: Ver que ninguna subsucesión de la sucesión anterior es de Cauchy.

Ejemplo: Sea H = L2([0, 2π]) y S = { p1 e i n x , n = 0, ±1, ±2, . . .}. El desa-



rrollo de este ejemplo será nuestra ocupación hasta el final de este capítulo.

172
1
Ejercicio: Muestre que los elementos de L2(0, 2π) de la forma fn (x) = p e inx ,

n = 0, ±1, ±2, ..., forman un conjunto ortonormal.

8.5. Serie de Fourier


n o
e i nx
Teorema 8.9 S = p , n = 0, ±1, ±2. . . es un conjunto completo de vecto-

res ortonormales (es decir una base ortonormal) de L2[0, 2π].

Note que por Lema 8.6 esto es equivalente a asegurar que si f ∈ L2[0, 2π]
luego fN (x) converge (en la norma de L2[0, 2π]) a f cuando N → ∞.

Prueba: La ortogonalidad es trivial y forma parte de un ejercicio anterior, por


lo tanto solo nos concentraremos en la completitud. El espacio de funciones
Lipschitz en [0, 2π], Li p[0, 2π] es denso [esencialmente por definición! ya
que contiene a todas las funciones suaves] en L2[0, 2π], pero entonces su
subespacio consistente de funciones periódicas Li p p [0, 2π] también lo es [ya
que los elementos de L2[0, 2π] son clases equivalentes de funciones y en cada
clase siempre hay una que es periódica]. Supongamos ahora que

1 X N
SN ( g )(x) := p gn e i n x → g (x) (8.31)
2π n=−N
punto a punto y uniformemente si g (x) ∈ Li p p ([0, 2π]). Luego por densi-
dad, dada cualquier función f (x) ∈ L2([0, 2π]) y ǫ > 0 existirá fǫ ∈ Li p p ([0, 2π])
tal que k f − fǫ kL2 < ǫ/3 y por lo tanto tendremos,

k f − SN ( f )kL2 = k f − SN ( f ) − fǫ + SN ( fǫ ) + fǫ − SN ( fǫ )kL2
≤ k f − fǫ kL2 + k fǫ − SN ( fǫ )kL2 + kSN ( f − fǫ )kL2

pero
X
N
kSN ( f − fǫ )kL2 = |( f − fǫ )n |2
n=−N
≤ k f − fǫ k2
≤ ǫ/3 (8.32)
ǫ , lo que sigue de
y por lo tanto eligiendo N tal que | fǫ (x) − SN ( fǫ )(x)| < 6π
nuestra suposición anterior (todavía no probada), tenemos que k fǫ −SN ( fǫ )kL2 <
ǫ y por lo tanto concluimos que para dicho N , k f − S ( f )k 2 < ǫ ♠
3 N L

173
Vemos así que solo resta probar nuestra suposición de convergencia uni-
forme de SN ( f ) a f para funciones Lipschitz periódicas. La prueba de esta
afirmación es muy instructiva y nos muestra como trabaja la serie de Fou-
rier. Preparatoriamente para este resultado probamos una serie de lemas:

Lema 8.7 Si f es integrable ( f ∈ L1) luego,


Z 2π
1
sup{| fn |} ≤ p | f (x)|d x. (8.33)
n 2π 0

Prueba:

e inx
| fn | = |( p , f )|

Z 2π
1
≤ p |e −i n x f (x)|d x
2π 0
Z 2π
1
≤ p | f (x)|d x (8.34)
2π 0

Lema 8.8 Si f tiene derivada integrable, luego fn → 0 cuando n → ∞.

Prueba: Integrando por partes tenemos,

e inx
fn = (p , f )

Z 2π
1
= p e −i n x f (x)d x
2π 0
Z 2π
1 1
= p e −i n x f ′ (x)d x − p e −i n x f (x)|2π
0
i n 2π 0 i n 2π
Z 2π
1 1
= p e −i n x f ′ (x)d x − p [ f (2π) − f (0)]
i n 2π 0 i n 2π

y por lo tanto

1
| fn | ≤ p [k f ′ kL1 + | f (2π) − f (0)|], (8.35)
n 2π

174
con lo que el lema queda demostrado ♠
Este lema y su generalización a un número mayor de derivadas nos indica
que cuanto más diferenciable es una función más rápido decaen sus coeficien-
tes de Fourier (asintóticamente).

Ejercicio: Pruebe un lema similar que dé una mejor cota para fn si la función
es periódica y es m veces diferenciable.

Lema 8.9 (Riemann-Lebesgue) Si f ∈ L1([0, 2π]), es decir una función inte-


grable. Luego,

lı́m f =0 (8.36)
n→∞ n

Prueba: Si f ∈ L1([0, 2π]), luego es aproximable por funciones suaves, en


particular, dado cualquier ǫ > 0 existe fǫ : [0, 2π], suave, tal que k f − fǫ kL1 <
ǫ
p . Pero como,
2 2π

e inx
| f n − fǫ n | = |( p , f − fǫ )|

Z 2π
1
≤ p | f (x) − fǫ (x)|d x
2π 0
1
≤ p k f − fǫ kL1

≤ ǫ/2 (8.37)
tenemos que
| fn | ≤ | fn − fǫn | + | fǫn | ≤ ǫ/2 + | fǫn |. (8.38)
Aplicando el lema anterior y notando que fǫ es diferenciable vemos que
fǫn → 0 y por lo tanto, dado ǫ > 0 puedo elegir N tal que para todo n > N
| fǫn | < ǫ/2 con lo que | fn | < ǫ para todo n > N y por lo tanto concluimos
que fn → 0 cuando n → ∞ ♠
Ahora estamos en condiciones de probar el teorema sobre convergencia
puntual de funciones Lipschitz.

Teorema 8.10 Sea f : [0, 2π] → C periódica y Lipschitz. Luego

1 X N
SN ( f )(x) := p fn e i n x (8.39)
2π n=−N
converge puntualmente y uniformemente a f (x).

175
Prueba: Probaremos solo la convergencia puntual, la uniforme sigue fácil-
mente y la prueba de ello no agrega nada nuevo. Comenzamos con el si-
guiente cálculo,

1 X N
SN ( f )(θ) := p fn e i n x
2π n=−N
1 X N Z 2π

= e i nθ f (θ′ )e i nθ d θ′
2π n=−N 0
Z X N
1 2π ′
= ′
f (θ )( e i n(θ−θ ) )d θ′
2π 0 n=−N
Z 2π
= f (θ′ )DN (θ − θ′ )d θ′ (8.40)
0

donde hemos definido el núcleo de Dirichlet


1 X
N


DN (θ − θ ) := e i n(θ−θ ) . (8.41)
2π n=−N

Estudiamos ahora algunas propiedades del núcleo de Dirichlet. Notemos pri-


mero que,
Z N Z
2π 1 X 2π


DN (θ − θ )d θ ′
= e i n(θ−θ ) d θ′
0 2π n=−N 0

1 X
N −i
= [ [e i n(θ−2π) − e i nθ ] + 2π]
2π n=−N , n6=0
n
= 1. (8.42)

Por otro lado tenemos que

X
N
2πDN (θ) = e i nθ
n=−N
X
N
= (e iθ )n (8.43)
n=−N

y llamando q := e iθ para simplificar la escritura tenemos,


2πDN (θ)

176
X
N
= qn
n=−N
X
N X
N
n
= q + q −n − 1
n=0 n=0
N +1
q −1 q −(N +1) − 1
= + −1
q −1 q −1 − 1
(q N +1 − 1)(q −1 − 1) + (q −(N +1) − 1)(q − 1) − (q − 1)(q −1 − 1)
=
(q − 1)(q −1 − 1)
”
= (q N +1/2 − q −1/2)(q −1/2 − q 1/2) + (q −(N +1/2) − q 1/2)(q 1/2 − q −1/2)
—
− (q 1/2 − q −1/2)(q −1/2 − q 1/2) /(q 1/2 − q −1/2)(q −1/2 − q 1/2)
q N +1/2 − q −N −1/2
=
q 1/2 − q −1/2
e iθ(N +1/2) − e −iθ(N +1/2)
=
e i θ/2 − e −iθ/2
sin((N + 1/2)θ)
= . (8.44)
sin(θ/2)

Por lo tanto
1 sin((N + 1/2)θ)
DN (θ) = . (8.45)
2π sin(θ/2)
Tenemos por lo tanto,
Z 2π
SN ( f )(θ) = f (θ′ )DN (θ − θ′ )d θ′
0
Z 2π
= f (θ − θ′ )DN (θ)d θ′
0
Z 2π
1 sin((N + 1/2)θ′ )
= [ f (θ − θ′ ) − f (θ)] d θ′ + f (θ)
2π 0

sin(θ /2)

donde en la segunda igualdad hemos usado que la integral de una función


periódica sobre su período es independiente del punto donde comienza el
intervalo de integración, y en la última hemos restado y sumado f (θ) y usado
que la integral del núcleo de Dirichlet es uno (8.42).
Si f (θ) es Lipschitz, | f (θ − θ′ ) − f (θ)| ≤ k|θ′ | y por lo tanto


| f (θ − θ′ ) − f (θ)|
gθ (θ ) := (8.46)
sin(θ′ /2)

177
es continua en (0, 2π) y acotada en los extremos, por lo tanto integrable.
Aplicando ahora el Lema de Riemann-Lebesgue concluimos entonces que la
integral tiende a cero con N y por lo tanto que lı́mN →∞ SN ( f )(θ) = f (θ) en
todo punto donde f (θ) es Lipschitz. ♠
Para probar que S es completo solo tenemos que ver que si (e i n x , g ) =
0 ∀ n luego g = 0. Sea f ∈ C p1[0, 2π] y cn sus coeficientes de Fourier con
respecto a S, luego
!
XM e inx
( f , g ) = lı́m cn p , g = 0 (8.47)
M →∞ 2π
−M

Concluimos entonces que g es ortogonal a toda f ∈ C p1[0, 2π], pero como


vimos este espacio es denso en L2[0, 2π] y por lo tanto por continuidad de-
bemos tener entonces que ( f , g ) = 0 ∀ f ∈ H , o sea g = 0 ♠

Ejemplo [Aplicación de la serie de Fourier] Sea S un aro de metal de


circunferencia 2π y sea T0(θ) una distribución de temperatura que supon-
dremos de cuadrado integrable (∈ L2(S)). La evolución temporal de T (θ, t ),
(despreciando pérdidas al medio circundante por conducción o por radiación)
está dada por,

∂T ∂ 2T
=k (8.48)
∂t ∂ θ2
con k una constante positiva. Supondremos T (θ, 0) = T0(θ). Suponiendo
además que T (θ, t ) admite una descomposición en serie de Fourier,
X
∞ e i nθ
T (θ, t ) = Tn (t ) p (8.49)
n=−∞ 2π
y que se puede pasar las derivadas dentro de la sumatoria infinita obtenemos,
∂T ∂ 2T
0 = −k
∂t ∂ θ2
X∞ d Tn (t ) 2
e i nθ
= ( + k n Tn (t )) p (8.50)
n=−∞ d t 2π
e i nθ
y tomando el producto escalar con p vemos que se debe cumplir,

d Tn (t )
= −k n 2Tn (t ) ∀ n (8.51)
dt

178
o sea,
2
Tn (t ) = Tn (0)e −k n t . (8.52)
Si la temperatura inicial era
X

0
e i nθ
T0(θ) = Tn p (8.53)
n=−∞ 2π
2
vemos entonces que Tn (t ) = Tn0 e −k n t y

X

2 e i nθ
T (θ, t ) = Tn0 e −k n t p (8.54)
n=−∞ 2π
nos da la solución del problema.
Notemos que: a) La distribución de temperatura en la barra solo depende
de la distribución inicial. b) El hecho de haber podido reducir un problema
en derivadas parciales en un problema en derivadas ordinarias de debe a que
hemos elegido representar a las funciones en una base de autovectores del
operador derivada. En efecto, lo que hemos usado fundamentalmente es que
∂ i nθ
∂θ
e = i nθd i nθ . c) No importa cuan mala (no diferenciable) es la distribu-
ción inicial T0(θ), mientras esté en L2(S), la solución se suaviza para tiempos
positivos. En efecto si por ejemplo la distribución inicial es solo Lipschitz
luego para todo t > 0 la solución es infinitamente diferenciable, tanto en t
como en θ. Para ver esto, por ejemplo tomemos,
∂ p T (θ, t ) X
∞ e i nθ
= Tn0(−k n 2) p e−k n 2 t p , (8.55)
∂ tp n=−∞ 2π
2
pero como para t > 0, n 2p e −k n t → 0 rápidamente cuando n → ∞ la serie
converge absolutamente. Por el contrario, para dato inicial genérico, aun infi-
nitamente diferenciable, la solución no existe para tiempos negativos, ya que
en ese caso los coeficientes de la serie crecen rápidamente con n.

Ejercicio: Pruebe que un conjunto ortogonal {x n } es completo si y solo si


(x n , g ) = 0 ∀n ⇒ g = 0.

Problema 8.3 : Use Gram-Schmidt para obtener una base ortonormal a partir
de los monomios
1, x, x 2, . . . , x n , . . . , (8.56)
con respecto a los espacios de Hilbert obtenidos a partir de los siguientes productos
escalares:

179
R1 ¯
1. ( f , g ) = −1
f g d x (En este caso obtendrá los polinomios de Legendre.)
R ∞ ¯ −x 2
2. ( f , g ) = −∞
f ge d x (En este caso obtendrá los polinomios de Hermi-
te.)
R ∞ ¯ −x
3. ( f , g ) = 0
f g e d x (En este caso obtendrá los polinomios de Lague-
rre.)

Estas bases polinómicas reciben el nombre genérico de sistemas de polinomios


de Tchebyschev.

El hecho de que los polinomios de Legendre son una base sigue del Teore-
ma de Aproximación de Weirstrass y del hecho de que las funciones continuas
son densas en L2.

*Método de Gram – Schmidt.


Dado un conjunto numerable de elementos linealmente independientes de
H , {x i } generamos recursivamente los siguientes conjuntos:

X
i −1 yi
yi = xi − (u l , x i )u l , u i = .
l =1
ky i k

Note que la segunda operación está bien definida ya que y i 6= 0. Esta aseve-
ración sigue del hecho de que el lado derecho en la definición de y i es una
combinación lineal de los x j , j = 1, ..., i y hemos supuesto que estos son li-
nealmente independientes.
Veamos ahora que (u i , u j ) = δi j . Para ello probaremos por inducción que
dado i, (u i , u j ) = 0 ∀ j < i positivo. Esto es cierto para i = 1 [ya que no hay
j ]. Supongamos entonces que es cierto para i − 1 y veamos que también lo es
para i . Pero, dado j < i tenemos,
j −1
X
(u j , y i ) = [(u j , x i ) − (u l , x i )(u j , u l )] = [(u j , x i ) − (u j , x i )] = 0.
l =1

Si el conjunto de partida es un conjunto completo, es decir un conjunto que


no es subconjunto de un conjunto mayor de vectores linealmente indepen-
dientes, luego el conjunto resultante es una base ortogonal. En particular, si
(x, u i ) = 0 ∀i, luego x = 0. Caso contrario tomamos u = k xx k y tendría-
mos otro elemento de la base, lo que sería una contradicción con respecto a
la completitud de los {u i }.

180
8.6. Problemas

Problema 8.4 Sea φ : H → C un mapa lineal. Muestre que φ es continuo si y


solo si es acotado.

Problema 8.5 Muestre que el mapa I : C [a, b ] → ℜ dado por


Zb
I(f ) ≡ f (x)d x, (8.57)
a

es un mapa lineal y continuo.

Problema 8.6 Sea V un espacio de dimensión finita y sea {u i }, i = 1..n una


P
base y {θ i }, i = 1..n la correspondiente co-base. Sea x = ni=1 x i u i un vector
P
de V cualquiera y ω = ni=1 ωi θ i una funcional lineal cualquiera, es decir un
elemento de V ′ . Considere en V la norma
X
n 1
kxk p ≡ ( |x i | p ) p . (8.58)
i =1

Vea que esta es una norma y pruebe que la norma inducida en V ′ por ésta está
dada por,
Xn 1
kωkq ≡ ( |ωi |q ) q , (8.59)
i=1
donde
1 1
+ =1 ( p, q ≥ 1); (8.60)
p q
Ayuda: Exprese ω(x) en componentes con respecto a la base/co-base dada y luego
use (pruebe) la desigualdad:
X
n X
n 1 X
n 1
i i p
| x ωi | ≤ ( |x | ) ( p |ωi |q ) q . (8.61)
i=1 i=1 i=1

Problema 8.7 Sea c0 el espacio de sucesiones {x} = (x1, x2, . . .) convergiendo a


cero con la norma
k{x}kc0 ≡ sup{|xi |}. (8.62)
i
Probar que el dual del espacio c0 es el espacio l1 de las sucesiones absolutamente
sumables {ω} = (ω1, ω2, . . .) con la norma
X

k{ω}k l1 ≡ |ωi |. (8.63)
i=1

181
Ayudas: Note que dado un elemento de l1, {ω} = (ω1, ω2, . . .), tenemos un fun-
cional lineal dado por,
X∞
ω({x}) ≡ xi ωi . (8.64)
i =1

Pruebe que este cumple


kωk ≤ k{ω}k l1 . (8.65)

Luego encuentre un elemento de norma igual o menor que la unidad en c0 y con


su ayuda vea que
kωk ≥ k{ω}k l1 . (8.66)

de lo cual se concluye que las normas son las mismas. Solo resta ver que para cada
elemento del dual de c0, ω, existe un elemento de l1, {ω} = (ω1, ω2, . . .) tal que
la ecuación 8.64 valga. Para ello construya una base de c0 y la respectiva base de
su dual. Atención: en algún punto tendrá que usar que las funcionales lineales
consideradas son continuas.

8.7. Problemas de Series de Fourier

Problema 8.8 Sea f una función integrable de período T . Muestre que


Z T Z T +a
f (x)d x = f (x)d x, ∀a ∈ lR (8.67)
0 a

Problema 8.9 a.- Encuentre la serie de Fourier de la función f (x) := x en el


intervalo [−π, π].
b.- Use la relación de Parseval para probar que

X
∞ 1

2
= π2/6 (8.68)
n=1 n

Problema 8.10 a.- Encuentre la serie de Fourier de la función f (x) := e s x en el


intervalo [−π, π].
b.- Use la relación de Parseval para probar que

X
∞ 1
πc ot h(πs)/s = 2 2
(8.69)
n=−∞ s + n

182
Problema 8.11 Sea Sn : L2 → L2 el mapa que envía f ∈ L2 en la serie parcial
de Fourier,
X
n 1
Sn ( f ) := cm e i m x , c m := (e i m x , f (x)). (8.70)
m=−n 2π

Muestre que los Sn son proyecciones ortogonales y que Sn S m = S m Sn = S m si


m ≤ n.

Problema 8.12 En este problema se intenta probar que la serie de Fourier de


una función continua es sumable en el sentido de Césaro en todo punto. Sea
1
f (θ) una función periódica en L2, f (θ) ∈ L2[0, 2π], c m := 2π (e i mθ , f (θ)) y
Pn
Sn ( f ) := m=−n c m e i m x
a.- Probar que
Z 2π
1 sin((n + 1/2)x)
Sn ( f )(θ) = f (θ + x) dx (8.71)
2π 0 sin(x/2)
1 Pn
b.- Sea S Sn ( f )(θ) = n+1 S ( f )(θ) (suma de Césaro), pruebe que:
0 m

Z
1 2π sin2((n + 1)x/2)
S Sn ( f )(θ) = f (θ + x) dx (8.72)
2π(n + 1) 0 sin2(x/2)
sin2 ((n+1)x/2)
c.- Sea Kn (x) = pruebe que para todo δ > 0,
2π(n+1) sin2 (x/2)
Kn (x) → 0 uniformemente en [δ, 2π − δ].
d.- Pruebe que S Sn ( f )(θ0) → f (θ0) si f es acotada y continua en θ0.
e.- Probar que si f es continua y periódica, entonces S S Ln ( f )(θ) → f (θ)
uniformemente en θ. Ayuda: recuerde que si f es continua en [0,2π] entonces f
es uniformemente continua.
f.- Mostrar que k f − Sn ( f )k ≤ k f − S S Ln ( f )k y concluir que Sn ( f ) → f en
2
L si f es continua.

Problema 8.13 Suponga que f ∈ C p1([0, 2π]) y sea cn = (e i nθ , f ) y bn =


(e i nθ , f ′ ). P P∞ 2 2
2
a.- Vea que ∞ P∞
−∞
|b n | < ∞ y concluya que −∞
n |cn | < ∞.
b.- Probar que −∞ |cn | < ∞.
P
c.- Probar que nm=−n c m e mi θ es uniformemente convergente para n → ∞.
Pn d.- Utilicemielθ ítem f.- del problema anterior para concluir que
m=−n m
c e → 2π f (θ) uniformemente.

183
Problema 8.14 Considere la expansión en serie de Fourier para la siguiente fun-
ción:

−1 0 < x < π
f (x) := (8.73)
+1 π < x2π
f (θ + 2π) = f (θ). La suma de los primeros n términos produce una función
que tiene un máximo absoluto en las cercanías positivas de 0 de altura 1 + δn .
Mostrar que lı́mn→∞ δn ≈ 0,18. Esto se conoce como fenómeno de Gibbs.

Notas bibliográficas: Estas notas están basadas en los siguientes libros: [9],
[10], [13], [1] y [14]. Ésta es una de las áreas mas bellas y útiles de las mate-
máticas, básica para casi todo, en particular la mecánica cuántica. No deje de
profundizar un poquito en ella, sobre todo recomiendo los libros [9] y [1] de
lectura placentera.

184
CAPÍTULO 9

DISTRIBUCIONES

9.1. Introducción

Para hacer del espacio de funciones de cuadrado integrable L2(lR) un es-


pacio normado fue necesario generalizar el concepto de función ( como mapa
de lR en lR ) en el sentido que los elementos de L2 son solo funciones definidas
en casi todos los puntos, es decir clases equivalentes Rde funciones de cuadrado
integrable ante la relación de equivalencia f ≈ g si | f − g |2 d x = 0.
Si bien esta generalización es útil ya que entre otras cosas nos permite
agrupar las funciones en espacios de Hilbert y así usar la poderosa estructu-
ra geométrica que éstos tienen, es conveniente considerar una generalización
aun mayor la cual, como veremos más adelante, nos proveerá de una impor-
tante herramienta en lo que hace al cálculo formal en física matemática.
Las funciones generalizadas que definiremos a continuación, llamadas dis-
tribuciones, tienen muchas propiedades interesantes, entre ellas que la ope-
ración diferenciación es cerrada en este espacio, es decir la derivada de una
distribución es otra distribución. Esto es particularmente sorprendente si se
tiene en cuenta que entre las distribuciones hay funciones que ni siquiera son
continuas!
¿Cuál es la idea detrás de esta generalización? El teorema de representa-
ción de Riez nos mostró que el dual de L2(lR) es ese mismo espacio. Aho-
ra bien, si en vez del dual de L2(lR) consideramos el dual de un subespacio
de L2(lR), obtendremos un espacio mayor que L2(lR) y que contiene a éste
de una manera natural. Este espacio lineal, que contiene al de las funciones
usuales es un espacio de funciones generalizadas.
Está claro que existen muchos espacios de funciones generalizadas ya que
no solo podemos considerar distintos subespacios de L2(lR), sino también po-
demos considerar distintas nociones de continuidad más débiles que la conti-
nuidad proveniente de la norma de L2(lR) para definir los espacios duales.

185
¿Cuál de ellos estudiar? La respuesta es: El que más convenga al trata-
miento del problema para el cual se las quiere usar. Aquí trataremos aquellas
obtenidas a partir de un subespacio bastante pequeño con lo cual se obtiene
una generalización lo suficientemente amplia como para abarcar con ella la
mayoría de los problemas de la Física. Es necesario remarcar que el concepto
de distribución que introduciremos no es una necesidad física, en el sentido
que las teorías físicas se pueden enunciar usando simplemente funciones infi-
nitamente diferenciables1 , pero sí es una herramienta muy útil que permite
una formulación más “condensada"de algunas de estas leyes. El subespacio
de L2(lR) que usaremos es de las funciones infinitamente diferenciables y de
soporte compacto C0∞ (lR). [Recuerde que el soporte de una función clásica
f (x) está dado por el subconjunto de lR,

C l { f −1 [lR − {0}]},

donde C l significa tomar la clausura. Como el soporte de una función es


automáticamente cerrado, que sea compacto (como subconjunto de lR o lRn
) significa meramente que es acotado.]

Ejercicio: Muestre que C0∞ (lR) es realmente un espacio vectorial.

Ejercicio: Muestre que además es un álgebra con respecto al producto usual.


¿Cuál es el soporte de f · g ?

¿Qué noción de continuidad introduciremos en las funcionales de C0∞ (lR)


para definir el dual? Desgraciadamente no hay en este espacio ninguna norma
que sea natural, en particular no hay ninguna en que éste sea completo 2.
Hay sí, en este espacio, una topología conveniente. La correspondiente
noción de continuidad de esta topología se obtiene del siguiente criterio de
convergencia:
1
Aquí nos referimos a las teorías fundamentales. Existen aproximaciones, como la teoría
de los fluidos, donde las distribuciones aparecen naturalmente.
2
Aún en el caso que, por ejemplo, usásemos como norma
X

1
kf k = s u p x∈lR {| f (n) (x)|}
n=0 n!

no obtendríamos un espacio completo ya que en este hay sucesiones de Cauchy que tienden a
funciones infinitamente diferenciables pero cuyo soporte no es compacto.

186
Definición: Diremos que una sucesión {ϕ n }, ϕ n ∈ C0∞ (lR) converge a ϕ ∈
C0∞ (lR) si:
1. Existe K ⊂ lR compacto tal que s o p o r t e(ϕ n ) ⊂ K ∀n.
( p)
2. Las sucesiones {ϕ n } de sus derivadas de orden p convergen uniforme-
mente en K a ϕ ( p) para todo p = 0, 1, 2, . . . ,, es decir dado p y ǫ > 0
existe N tal que para todo n > N se cumple
s u p x∈K |ϕ (np) (x) − ϕ ( p) (x)| < ǫ. (9.1)

Note que la primera condición nos restringe a considerar como sucesiones


convergentes a aquellas que solo pueden converger a una función de soporte
compacto. Esto es fundamental para la completitud del espacio y para que
la convergencia uniforme en la segunda condición tenga sentido usando el
supremo. Con este criterio de convergencia asociamos la siguiente noción de
continuidad sobre las funcionales de C0∞ (lR) en lR.

Definición: Diremos que la funcional F : C0∞ (lR) → lR (o C) es continua en


ϕ ∈ C0∞ (lR) si dada cualquier sucesión convergente {ϕ n } en C0∞ (lR) a ϕ se
cumple,
F (ϕ n ) −→ F (ϕ). (9.2)
Esta noción proviene de la topología antes mencionada.

Ejercicio: Sea B un espacio de Banach con la noción de convergencia dada por


su norma. Muestre que en ese caso la noción de continuidad definida arriba
coincide con la usual (ǫ, δ).

Con esta noción de continuidad el espacio C0∞ (lR) es llamado el espacio


de funciones de prueba de lR y denotado por D(lR).

Definición: El espacio dual al espacio de funciones de prueba, D ′ , es decir


el espacio de funcionales lineales continuas T : C0∞ (lR) → lR es llamado el
espacio de las distribuciones.

Ejemplos:
a) Sea f continua y sea la funcional lineal
Z
T f (ϕ) = f ϕ d x. (9.3)
lR

187
Como Z 
|T f (ϕ)| ≤ |f | dx s u p x∈K |ϕ| (9.4)
K

donde K es cualquier compacto conteniendo el soporte de ϕ vemos que T f


es continua y por lo tanto una distribución. Vemos así que las funciones con-
tinuas dan origen a distribuciones, es decir están incluidas naturalmente en el
espacio de las distribuciones.

Ejercicio: Muestre que si f 6= g luego T f 6= T g .

b) Sea f integrable (en el sentido de Lebesgue) es decir un elemento de L 1(lR)


y sea Z
T f (ϕ) = f ϕ dx ∀ ϕ ∈ C0∞ (lR). (9.5)
lR
R
Pero |T f (ϕ)| ≤ s u p x∈K |ϕ| lR | f | d x y por lo tanto si {ϕn } → 0 entonces
T f (ϕn ) → 0 lo que nos asegura (por linealidad) que T f es continua y así una
distribución. Note que si f = g en casi todo punto ( f ∼ g ) luego T f = T g
por lo que concluimos que son en realidad los elementos de L1 los que definen
estas distribuciones. Las distribuciones obtenidas de esta forma se denominan
regulares.

c) Sea Ta : C0∞ (lR) → lR, a ∈ lR, dada por Ta (ϕ) = ϕ(a), este mapa es clara-
mente lineal,

Ta (ϕ + αψ) = ϕ(a) + α ψ(a) = Ta (ϕ) + α T( ψ),

y continuo
|Ta (ϕ)| = |ϕ(a)| ≤ s u p x∈lR |ϕ(x)|
y por lo tanto una distribución. Esta es llamada la delta de Dirac en el punto
a. ¿Hay alguna función continua, f , tal que Ta = T f ? Supongamos que sí,
y que f (r ) 6= 0 con r 6= a. Eligiendo ϕ distinto de cero solo en un entorno
suficientemente pequeño de r que no contenga a a y con el mismo signo que
f (r ) obtenemos ϕ(a) = 0 y T f (ϕ) 6= 0 lo que implica que f (r ) = 0 ∀r 6= a
pero por continuidad concluimos entonces que f ≡ 0 y por lo tanto que
T f (ϕ) = 0 ∀ ϕ ∈ C0∞ (lR). Vemos entonces que esta distribución no provie-
ne de ninguna función continua y se puede ver que en realidad no proviene
de ningún elemento de L1(lR), es así una distribución irregular. Estos son
los elementos extra que nos da la generalización definida. Usualmente, en

188
manipulaciones formales se pretende que esta distribución proviene de una
función, denominada delta de Dirac y denotada por δ(x − a). Con ella se
escriben cosas como
Z
δ(x − a) ϕ(x) d x = ϕ(a). (9.6)
lR
Como hemos visto en realidad no existe ninguna función para la cual esta
expresión tenga sentido por lo tanto ésta es solo formal y debe considerársela
con precaución, es decir siempre como un mapa lineal y continuo del espacio
de funciones de prueba.
¿Qué estructura tiene D ′ (lR)? Por ser un espacio dual ésta es un espacio
vectorial con la suma de sus elementos y el producto de éstos por núme-
ros
€ realesŠdefinidos en la manera
€ Šobvia, es decir si T , T̃ ∈ D, α ∈ lR, luego
T + αT̃ (ϕ) = T (ϕ) + α T̃ (ϕ) . Estas operaciones generalizan las opera-
ciones definidas sobre funciones integrables ya que T f + α T g = T f +α g .
¿Está definido el producto de distribuciones? La respuesta es que en ge-
neral no lo está –así como tampoco lo está entre funciones integrables–. Sí lo
está si una de ellas proviene de una función de prueba, es decir

Tϕ T̃ (ψ) := T̃ (ϕψ) ∀ψ ∈ D, (9.7)

donde hemos usado que los elementos de D forman un álgebra. Note que
ésto generaliza la operación definida sobre funciones integrables:
Z
Tϕ T f (ψ) = f ϕψ = T f (ϕψ) = Tϕ f (ψ) (9.8)
lR
ya que si f ∈ L1 luego f ϕ ∈ L1 si ϕ ∈ D.

9.2. La derivada de una distribución

Si f es continuamente diferenciable luego su derivada también da origen


a una distribución T f ′ . ¿Qué relación hay entre T f y T f ′ ? Note que
Z Z

T f ′ (ϕ) = f ϕ dx =− f ϕ ′ d x = −T f (ϕ ′ ) ∀ ϕ ∈ D (9.9)
lR lR
donde al integrar por partes se usó que las ϕ en D tienen soporte acotado.
Esto sugiere que la posibilidad de extender la noción de derivada a toda dis-
tribución por medio de la fórmula
T ′ (ϕ) := −T (ϕ ′ ), ∀ ϕ ∈ D, (9.10)

189
donde el lado derecho está bien definido ya que si ϕ ∈ D luego ϕ ′ ∈ D. Note
que esta operación satisface las condiciones que uno esperaría ya que son las
mismas que satisface la derivada usual, teniendo en cuenta que ahora estamos
en este espacio más amplio donde el producto de funciones no está definido
en general. En efecto esta operación es lineal.
€ Š′ € Š € Š
T + αT̃ (ϕ) = − T + αT̃ (ϕ ′ ) = − T (ϕ ′ ) + αT̃ (ϕ ′ )
(9.11)
= T ′ (ϕ) + αT̃ ′ (ϕ)

y satisface la regla de Leibniz tanto como es posible ya que como vimos el


producto de distribuciones no está definido en general. Cuando si lo está, es
decir cuando una de ellas es un elemento de D, tenemos que
 ′  
Tϕ T̃ (ψ) = − Tϕ T̃ (ψ′ ) = −T̃ (ϕ ψ′ )
= −T̃ ((ϕ ψ)′ − ϕ ′ ψ)
= −T̃ ((ϕ ψ)′ ) + T̃ (ϕ ′ ψ)
(9.12)
= T̃ ′ (ϕ ψ) + ϕ ′ T̃ (ψ)
= T̃ϕ T̃ ′ (ψ) + Tϕ ′ T̃ (ψ)
 

= Tϕ T̃ + Tϕ ′ T̃ (ψ).

Pero estas son las condiciones que definen una derivación. Vemos por lo tan-
to que ésta es una extensión de la derivada de una función en D. Note que
al generalizar la noción de función en la de distribución la hemos ampliado
tanto que ahora objetos como la derivada de funciones discontinuas (incluso
en todos sus puntos!) están incluidas entre éstas e incluso son a su vez infini-
tamente diferenciables [(T )(n) (ψ) ≡ (−1)n T (ψ(n) )].

Ejemplo: Ta′ , la derivada de la función de Dirac en a es la distribución tal que


Ta′ (ϕ) = −ϕ ′ (a) ∀ ϕ ∈ D.

Comenzamos con el espacio de funciones infinitamente diferenciables de


soporte compacto y finalizamos también con un espacio infinitamente dife-
renciable [con una noción distinta de derivada], cabe preguntarse si existe
una noción de soporte de una distribución. Obviamente no podemos utili-
zar la misma noción que para funciones continuas y tendremos que proceder
de una manera indirecta.
Sea O un abierto acotado, de lR y D(O) el espacio de funciones de prueba
con soporte en la clausura de O, Ō. Diremos que una distribución T se anula

190
en O si T [D(O)] = 0, es decir si se anula para toda función de prueba con
soporte en O. Llamaremos el soporte de T al complemento de la unión de
todos los abiertos donde T se anula. Por ser el complemento de un conjunto
abierto este conjunto es cerrado.

S El soporte de To es {0}. Sea On = (1/n, n) ∪ (−n, −1/n), luego


Ejemplo:
lR − n On = {o}.

Ejercicio: Sea f continua. Pruebe que s o p o r t e{ f } = s o p o r t e{T f }

Ejercicio: ¿Cómo extendería las nociones de funciones pares ( f (x) = f (−x))


y el de impares ( f (x) = − f (−x)). ¿Qué propiedades conserva esta extensión?

Ejercicio: Sea

x, x ≥ 0
g (x) =
0, x ≤ 0
x ∈ lR. Claramente g (x) es continua pero no diferenciable (en el sentido
clásico). Encuentre las 3 primeras derivadas de g en el sentido de las distribu-
ciones.

Ejercicio: La parte principal, en el sentido de Cauchy, de una función,


Z
1
P (1/x)( f ) = lı́m f (x) d x
ǫ→0 |x|≥ǫ x

es una distribución. ¿Cómo debe interpretarse la fórmula?


‚ Œ
1 1
lı́m =P − i π δ(x − x0)
ǫ→0 x − x0 + iǫ x − x0

Hemos visto que una distribución es diferenciable, es decir dada T ∈ D ′


existe S ∈ D ′ tal que T ′ = S. Cabe preguntarse lo opuesto, es decir si dada
S ∈ D ′ existe T tal que la fórmula de arriba valga, es decir

−T (ϕ ′ ) = S(ϕ) ∀ ϕ ∈ D. (9.13)

191
Esta es una generalización a distribuciones de la más simple de las ecuaciones
diferenciales ordinarias ya estudiadas y la respuesta al problema planteado
es afirmativa. Note que dada T la ecuación (9.13) nos define S, es decir su
derivada, pero si damos S luego (9.13) no define T completamente ya que
esta fórmula nos dice solamente cómo actúa T sobre funciones de prueba
(ϕ ′ ) cuya integral (ϕ) es también una función de prueba. Esto es de esperar ya
que en el caso de funciones la primitiva de una función está sólo determinada
hasta una constante. Esta indeterminación se remedia dando valores iniciales
generalizados lo cual se logra pidiendo que T (θ) tenga un dado valor, Tθ ,
para alguna
Z θ ∈ D que no sea la primitiva de otra funciónZen D, es decir que
x
ϕ(x) = θ(x̃) d x̃ no tenga soporte acotado (o sea que θ(x̃) d x̃ 6= 0).
−∞ lR
R
Teorema 9.1 Dada S ∈ D ′ , θ ∈ D tal que lR θ d x 6= 0 y Tθ ∈ lR, existe una
única T satisfaciendo

−T (ϕ ′ ) = S(ϕ) ∀ϕ∈D
(9.14)
T (θ) = Tθ

Prueba: Solo tenemos que conocer la acción de TRsobre una arbitraria ψ ∈ D.


Sin pérdida de generalidad tomemos θ tal que lR θ = 1. Vemos que dada
ψ ∈ D existe un único λψ ∈ lR y una única ϕ ψ ∈ D tal que, ψ − λψ θ = ϕ ′ψ , es
decir es una función de prueba con primitiva. En efecto, sea
Zx
ϕ ψ (x) = (ψ − λψ θ) d x̃
−∞

luego la condición para que ϕ ψ tenga soporte compacto (y por lo tanto sea
una función de prueba) es que
Z∞ Z∞
0= (ψ − λψ θ) d x̃ = ψ d x − λψ = 0 (9.15)
−∞ −∞
o sea Z ∞
λψ = ψ d x. (9.16)
−∞
Sea entonces
T (ψ) = λψ Tθ − S(ϕ ψ ), (9.17)
esta distribución satisface las ecuaciones del enunciado del teorema. Note que
λψ Tθ es una distribución,

192
Z
λ ψ Tθ = Tθ ψ d x,
lR
y que,

T (θ) = λθ Tθ − S(ϕ θ ) = Tθ − S(0) = Tθ .

Veamos la unicidad, sea T̃ otra distribución satisfaciendo 9.14, luego la dife-


rencia, δT = T − T̃ satisfacerá,

−δT (ϕ ′ ) = 0 ∀ ϕ ∈ D
(9.18)
δT (θ) = 0.
Como hemos visto que cualquier función de prueba ψ se puede escribir co-
mo, ψ = λψ θ + ϕ ′ψ tenemos,

δT (ψ) = λψ δT (θ) + δT (ϕ ′ψ ) = 0.

Lo que concluye la demostración de unicidad. De esto concluimos que, como


en el caso de funciones, dos soluciones cualesquiera de (9.13) difieren por una
constante ♠

9.3. Nota sobre la completitud de D y su dual D ′

Usando la noción de convergencia introducida en D podemos definir un


concepto análogo al de sucesión de Cauchy:

Definición: diremos que una sucesión de funciones de prueba {ϕ n }, ϕ n ∈ D


es convergente si:
1) Existe K ∈ lR compacto tal que s o p(ϕ n ) ⊂ K ∀ n.
2) Dado p y ǫ > 0 existe N tal que para todo n, m > N se cumple

( p) ( p)
s u p x∈K fn (x) − f m (x) < ǫ

Con esta noción de convergencia el espacio D es completo, es decir toda


sucesión convergente converge a un elemento de D. Para discutir completitud
de D ′ debemos introducir nociones similares en este espacio. La noción de
convergencia apropiada es la siguiente.

193
Definición: Diremos que la sucesión {Tn }, Tn ∈ D ′ converge a T ∈ D ′ si
Tn (ϕ) → T (ϕ) para todo ϕ ∈ D 3.
Ejemplos:
2
a) Sea Tn la distribución asociada con la función e −|x−n| . Luego Tn converge
a la distribución cero. Esto muestra lo débil que es este tipo de convergencia.
b) Sea Tn la distribución asociada con alguna función fn satisfaciendo

1. fn (t ) ≥ 0 si |t | < 1/n y cero si |t | ≥ 1/n.


Rb
2. a
fn (t ) d t = 1,

Luego Tn → T0, la función de Dirac con soporte en el cero.

Análogamente podemos definir la noción de convergencia de distribucio-


nes.

Definición: {Tn }, Tn ∈ D ′ es convergente si para cada ϕ ∈ D y ǫ > 0 existe


N tal que si n, m > N luego

|Tn (ϕ) − T m (ϕ)| < ǫ

Con esta noción de convergencia el espacio D ′ es completo.

9.4. Convergencia y Compacidad Débil

En un espacio normado, H , tenemos la noción de convergencia con res-


pecto a la norma, la cual llamaremos convergencia fuerte

f
{xn }→x si lı́m kxn − xkH = 0.
n→∞

En estos espacios existe otra noción de convergencia, la llamada convergencia


débil y que usa la existencia del espacio dual de H , H ′ .

Definición: Diremos que {xn } converge débilmente a x,

d
{xn }→x, si σ(xn ) → σ(x) ∀ σ ∈ H ′ .
3
Nuevamente estamos introduciendo una topología de manera indirecta, esta vez en D ′ .

194
Si H es un espacio de Hilbert (lo que supondremos de ahora en más) el Teo-
d
rema de Representación de Riez nos dice que {xn }→x sii (xn , y) → (x, y)
∀ y ∈ H.

Claramente esta noción de convergencia es la más débil tal que los ele-
mentos de H ′ son funcionales continuas [En el sentido que f es continua
en x si dada cualquier sucesión {xn } convergiendo a x luego lı́m f (xn ) =
n→∞
f (x).], donde decimos que una noción de convergencia es más débil que otra
si toda sucesión que converge con respecto a la segunda también lo hace con
respecto a la primera y hay sucesiones que convergen con respecto a la pri-
mera pero no con respecto a la segunda. Veamos, a manera de ejemplo, que la
convergencia en norma, o fuerte, es en realidad más fuerte que la llamada dé-
f
bil. Supongamos entonces que {xn }→x es decir lı́mn→∞ kx −xn kH = 0, luego
como los elementos de H ′ son funcionales lineales acotadas (⇐⇒ continuas)
se cumple que

|σ(x) − σ(xn )| ≤ kσkH ′ kx − xn k ∀ σ ∈ H ′, (9.19)

y por lo tanto,
lı́m |σ(x) − σ(xn )| = 0, (9.20)
n→∞
d
o sea {xn }→x. El siguiente es un ejemplo de una sucesión que convergen
débilmente y no fuertemente.

Ejercicio: Muestre que la sucesión {xn = (0, ..., 0, 1 , 0, ...)} converge débil-
n

mente en l 2 pero no fuertemente.


El anterior fue también el ejemplo que utilizamos para mostrar que la bo-
la de radio unidad en l 2 no era compacta con respecto a la convergencia fuer-
te. ¿Será ésta débilmente compacta? Es decir, dada una sucesión {xn } ∈ B1(l 2)
cualquiera ¿existirá una subsucesión que converja débilmente? La respuesta
es afirmativa y es una de las herramientas más útiles del análisis funcional.

Teorema 9.2 B1 es débilmente compacta.

Prueba: Sólo probaremos el caso en que H es separable. Sea {xn } con kxn kH ≤
1 y S = {y m } una base ortonormal numerable de H . Construiremos, usando

195
inducción, una subsucesión {xn∞ } tal que,
n→∞
(xn∞ , y m ) → α m ∀ y m ∈ S. (9.21)
Sea m = 1, luego |(xn , y1)| ≤ kxn kH ky1kH ≤ 1. Vemos entonces que {(xn , y1)}
es una sucesión acotada en C. Pero la bola de radio unidad en C es compacta
y por lo tanto habrá alguna subsucesión (xn1 , y1) convergiendo a algún α1 en
C. Supongamos ahora que tenemos una subsucesión {xnm−1} tal que

(xnm−1, y p ) → α p ∀ 1 ≤ p ≤ m − 1. (9.22)

De la misma forma que como hicimos para el caso m = 1, considerando


en este caso {(xnm−1, y m )} obtenemos una subsucesión {xnm } de {xnm−1} que
satisface,
n→∞
(xnm , y m ) → α m , (9.23)
lo que completa la inducción. Tenemos así un mapa σ : {y m } → C dado por
σ(y m ) = α m , como {y m } es una base podemos extender este mapa linealmen-
te a todo H . Como {xn∞ } es acotada,
|σ(y)| = lı́m |(xn∞ , y)| ≤ kykH (9.24)
y σ es también acotada, por lo tanto continua. Usando el Teorema de Repre-
sentación de Riez sabemos entonces que existe x ∈ H tal que
(x, y) = σ(y) = lı́m(xn∞ , y) ∀ y ∈ H. (9.25)
d
Concluimos así que {xn∞ }→x ♠
En el próxido capítul o haremos uso de esta propiedad para probar un
importante resultado en espacios de Sobolev.

Notas bibliográficas: Recomiendo leer: [10], [1] [9]. A pesar de que fue
un físico, Dirac, el que introdujo el concepto de distribución muchos físicos
las desdeñan como algo matemático y las usan como una abreviación útil para
hacer cálculos. Usualmente la persona que las manipula conoce lo que está ha-
ciendo y no comete errores, pero es bastante fácil cometerlos si no se siguen
cuidadosamente las reglas y se pierde de vista lo que son. Esto por ejemplo
lleva a errores tales como asignarle significado al producto de dos distribucio-
nes arbitrarias. No es difícil entender el concepto básico de distribución ni
tampoco que no hay que salirse de las reglas operativas, sígalas siempre y no
se equivocará.

196
CAPÍTULO 10

L A TRANSFORMACIÓN DE FOURIER

10.1. Introducción

Consideremos el siguiente problema en el círculo S 1 cuya circunferencia


es 2π:
Dada ρ continua en S 1 encuentre f en S 1 tal que

∂ 2f
= ρ. (10.1)
∂ θ2

Una manera
n deoresolver este problema es utilizando la base ortogonal de Fou-
rier, p1 e i nθ de L2(S 1). Sea F : L2(S 1) → l 2 el mapa entre estos espacios

generado por esta base, es decir,
¨‚ Œ«
1 i nθ
F (f ) = p e ,f ≡ {cn } . (10.2)

Luego
  n o
∂ 2f 1 d2 f
F −ρ = p e i nθ , −ρ
∂ θ2 2π d θ2 (10.3)
 2
= −n cn − an

donde {an } = F (ρ).


Como F (0) = {0} vemos que (10.1) implica una ecuación algebraica en
2
l ,
−n 2 cn = an . (10.4)

Si ρ es L2 ortogonal a f = c t e., es decir a las únicas soluciones de (10.1)


an
con ρ = 0, lo que implica a0 = 0, la sucesión con c0 arbitrario y cn = − 2 ,
n

197
n 6= 0 satisface (10.4). El mapa inverso F −1 : l 2 → L2(S 1) nos define f (θ) =
X∞ cn i nθ
p e , el cual al menos formalmente1 es una solución de (10.1).
n=−∞ 2π
Note que en esta aplicación no hemos usado directamente el hecho de que
1 d i nθ
las funciones { p e i nθ } forman una base ortogonal sino solo que e =
2π dθ
i n e i nθ y ciertas propiedades del mapa F generado por dicha base. En parti-
cular esta propiedad de la base se induce en el mapa en el sentido que si f ∈ L2
df
es diferenciable y F ( f ) = {cn } luego F ( ) = {+i n cn }.

Estas observaciones son muy útiles pues existen casos, como el de L2(lR),
en los cuales no se conocen bases ortogonales interesantes, pero sí mapas si-
milares a F con propiedades interesantes. Uno de ellos es la transformación
de Fourier que estudiaremos ahora. El problema en L2(lR) es que desearía-
d
mos tener una base {ϕ n } cuyas funciones satisfagan ϕ = i cn ϕ n , pero
dx n
las soluciones a esta ecuación son ϕ n = an e i cn x , las cuales no son funciones
de cuadrado integrable cualquiera sea cn o an ∈ lR (excepto por supuesto
que tomemos an ≡ 0). Sin embargo aunque estas funciones no formen una
base ortogonal si generan un mapa F , esta vez de L2(lR) en otra copia (con-
siderada como distinta) de L2(lR), con propiedades similares a las del mapa F
considerado anteriormente.

Teorema 10.1 (de Fourier) La transformación de Fourier


Z
1
fˆ(λ) := F ( f )(λ) := e −i x·λ f (x) d x n (10.5)
(2π)n/2 lRn
P i
donde x · λ = i=1 x λi . Satisface:

a) F : L2(lRn ) → L2(lRn ) es un mapa lineal, continuo e invertible de L2(lRn ) en


sí mismo que preserva la norma (es decir unitario), k fˆkL2 = kF ( f )kL2 = k f kL2
(identidad de Plancherel).

X

1
El mapa define un elemento de L2 pues ρ ∈ L2 y por lo tanto |an |2 < ∞ lo que
−∞
an
implica que {c0 arbitrario, cn = − 2
, n 6= 0} es también un elemento de l 2. Restaría ver que
n
f = F −1 {cn } es dos veces diferenciable.

198
b) Su inversa está dada por
Z
1
ǧ (x) = F −1
(ĝ ) = e i x·λ ĝ (λ) d λ. (10.6)
(2n)n/2 lRn

c) Si la derivada de f ∈ L2(lRn ) en el sentido distribucional está también en


L2(lRn ) se cumple entonces que
!
∂f
F (λ) = i λ j F ( f )(λ). (10.7)
∂ xj

Este teorema nos dice que esta transformación tiene todas las propiedades
que tenía la generada por la base de Fourier y por lo tanto será tan útil como
aquella en aplicaciones similares, pero ahora en lRn .
La prueba de este teorema usa varias de las técnicas más comunes y pode-
rosas del análisis funcional y por lo tanto es recomendable una lectura atenta
y no automática de la misma.

Prueba: El mapa F es obviamente lineal y claramente está definido para cual-


quier función en C ∞ (lRn ), es decir infinitamente diferenciable y de soporte
compacto. Veamos primero que F preserva la norma L2(lRn ) para estas fun-
ciones. Sea f ∈ C ∞ (lRn ) cualquiera y tomemos un n-cubo Cǫ de volumen
2
( )n con ǫ > 0 suficientemente pequeño como para que s o p( f ) ⊂ Cǫ . Sea
ǫ
Kǫ = {k ∈ lRn | ki = π pǫ para algún entero p}, [por ejemplo en lR3 el vec-
tor (πǫ5, πǫ17, 0) es un«elemento de Kǫ ]. Luego el conjunto de funciones
¨  ǫ ‹n/2
e i k·x | k ∈ Kǫ forman una base ortogonal de L2(Cǫ ).
2
Pero f ∈ L2(Cǫ ) y es continuamente diferenciable, por lo tanto
‚ ‹ Œ ‹
X ǫ n/2 i k·x̃
ǫ n/2 i k·x
X fˆ(k)
e , f (x̃) e = e i k·x (2πǫ/2)n , (10.8)
2 2 n/2
k∈Kǫ k∈Kǫ (2π)

es la representación en serie de Fourier de f la cual converge uniformemente


a f en Cǫ y por lo tanto en lRn . Tenemos entonces que
Z
2
kf k 2 = | f (x)|2 d n x
L
lRn

199
Z
= | f (x)|2 d n x

X  ǫ ‹ 2
= ( )n/2 e i k·x , f (x)
2
k∈Kǫ
X
= | fˆ(k)|2 (πǫ)n . (10.9)
k∈Kǫ

Como lRn es la unión de n-cubos de lados πǫ ( o sea de volumen (πǫ)n alre-


dedor de los puntos de Kǫ el lado derecho de (10.9) es simplemente la serie de
Riemann de la función | fˆ(k)|2. Si esta función fuese continua luego la serie
de Riemann convergería a k fˆk2 2 y habríamos probado que la transformada
L
de Fourier de una función en C ∞ (lRn ) preserva la norma L2(lRn ). Pero
Z
∂ fˆ(k) 1
s u pk | ∂ k | = s u pk | n/2 −i x j e −i k·x f (x) d n x|
j (2π)
Z Rn (10.10)
1 j n
≤ n/2 |x f (x)| d x < ∞,
(2π)
Rn

ya que f ∈ C ∞ (lRn ). Vemos entonces que las derivadas de fˆ(k) están acotadas
y por lo tanto que fˆ es continua. Este resultado no solo completa la demos-
tración de que F preserva la norma sino también, ya que fˆ(k) es continua,
que la serie de Riemann en el lado derecho de la ecuación (10.8) converge a
la integral y por lo tanto que F −1(F ( f )) = f (x) ∀ f ∈ C ∞ (lRn ).
Si f ∈ C ∞ (lRn ) luego la identidad del punto c) se muestra trivialmente.
Solo resta entonces extender estos resultados para f arbitraria en L2(lRn ),
pero C ∞ (lRn ) es una subespacio denso de L2(lRn ), es decir todo elemento
f ∈ L2(lRn ) puede obtenerse como límite (con respecto a la norma L2(lRn ))
de una sucesión { fn } de funciones en C ∞ (lRn ), esto nos permite extender la
acción de F a todo elemento de L2(lRn ). En efecto, sea f ∈ L2(lRn ) arbitraria
y sea { fn } → f ∈ C ∞ (lRn ) luego la sucesión fˆn (k) = F ( fn ) satisface,

k fˆn (k) − fˆm (k)kL2(Rn ) = k fn (x) − f m (x)kL2(lRn ) . (10.11)

Como { fn } es convergente es de Cauchy y por lo tanto { fˆn } es también


de Cauchy en L2(lRn ), pero L2(lRn ) es completo y por lo tanto existe fˆ ∈
L2(lRn ) tal que { fˆn } → fˆ. Extenderemos el mapa F a L2(lRn ) definiendo
F ( f ) ≡ fˆ. Esta extensión es claramente lineal y acotada por lo tanto es con-
tinua. Usando el mismo razonamiento extendemos F −1 a todo L2(lRn ) y

200
vemos que F −1(F ( f (x))) = f (x) ∀ f (x) ∈ L2(lRn ) lo que demuestra que
F es invertible, que su inversa es F −1 y es continua. El mismo argumento
muestra que la fórmula en c) también es válida para todo f tal que su gradien-
te también está en L2(lRn ). Esto completa la prueba del teorema ♠
Note que la estrategia ha sido primero tomar un espacio (C ∞ (lRn )) donde
todas las propiedades valen obviamente, luego tomar un espacio que contie-
ne al anterior y donde este es denso, ver que el mapa es allí continuo (con
respecto a la noción de continuidad del espacio mayor) y finalmente tomar la
extensión que esta continuidad nos brinda.
¿Hay otras extensiones posibles? La respuesta es sí y ahora veremos una
de ellas que nos permitirá usar la transformación de Fourier en distribucio-
nes. Lo haremos en forma de un problema dividido en varios ejercicios.

Notación de Schwartz: I+n denotará el conjunto de n-tuplas de enteros no-


P
negativos α =< α1, . . . , αn > y |α| = ni=1 αi . Similarmente denotamos por
α
∂α ∂ |α|
D ≡ α
≡ α1 , es decir D α es el operador diferencial que toma
∂x α
∂ x1 · · · ∂ xn n
α1, derivadas parciales con respecto a x1, α2 derivadas parciales con respecto
a x2, etc. El grado de D α es |α|.

Definición: Llamaremos espacio de Schwartz S (lRn ) al espacio vectorial de


funciones infinitamente diferenciables que decaen asintóticamente más rápi-
do que la inversa de cualquier polinomio, es decir que
X
kϕk p,q ≡ s u p x∈lRn |x α D β ϕ(x)| < ∞ (10.12)
|α̃| ≤ p
|β̃| ≤ q
∀ α, β ∈ I+n , con la siguiente noción de convergencia: diremos que {ϕ n }, ϕ n ∈
S converge a ϕ ∈ S si dado ǫ > 0 para cada par de enteros no negativos, p,
q, existe N p,q tal que si n > N p,q luego kϕ − ϕ n k p,q < ǫ.

Ejercicios:
1) ¿Cómo definiría la noción de sucesión convergente en este espacio?
2) Muestre que si {ϕ n } → ϕ luego {ϕ n } converge en el sentido anterior.
3) Muestre que D está estrictamente contenido en S . Ayuda: Encuentre ϕ ∈
S con s o p(ϕ) = lRn .

Las propiedades de este espacio que nos interesan son las siguientes:

201
Lema 10.1 Con la noción de convergencia correspondiente el espacio S (lRn )
es completo.

Lema 10.2 El espacio C ∞ (lRn ) es denso en S , es decir cualquier elemento ϕ ∈


S puede ser obtenido como límite de una sucesión convergente con cada uno de
sus miembros en C ∞ (lRn ).

Ejercicio: Pruebe el Lema 10.2.

Lema 10.3 F : S → S es continuo e invertible con inversa continua.

Ejercicio: Pruebe el Lema 10.3. Ayuda: Pruebe que dado enteros p y q existen
p̃ y q̃ y c > 0 tales que para todo ϕ ∈ S se cumple

kϕ̂k p,q ≤ c kϕk p̃,q̃ . (10.13)

2 /2
Ejercicio: Encuentre F (e −αx ).

Definición: El espacio dual a S , S ′ se llama el espacio de las distribuciones


temperadas.

Ejercicio: Muestre que S ′ está estrictamente contenido en D ′ . Ayuda: En-


cuentre f tal que T f ∈ D ′ y no a S ′ .

¿Cómo extender F a S ′ ? Usando la identidad de Plancherel y la de po-


larización2 tenemos que (ϕ, ψ) = (ϕ̂, ψ̂) . Pero entonces
Z Z
Tσ̂ (ψ̂) = σ̂ ψ̂ d k = σ ψ d x = Tσ (ψ) := T̂σ (ψ̂). (10.14)

Esto nos induce a definir en general

T̂ (ϕ̂) := T (ϕ). (10.15)


2
Es decir que (x, y) = 41 {||x + y||2 − ||x − y||2 + i ||x − i y||2 − i ||x + i y||2}

202
Ejercicio: Calcule F (δ a ) y F (δ ′a ).

¿Qué otras propiedades tiene la transformación de Fourier? Note que de la


identidad del punto c) del Teorema de Fourier sigue que si x α D β f ∈ L2(lRn )
luego k β D α fˆ ∈ L2(lRn ). Esto nos dice esencialmente que diferenciabilidad
en x es equivalente a decaimiento en k y viceversa. En particular esto nos
dice que la transformada de Fourier de una función de soporte compacto es
infinitamente diferenciable.3 Más aún se puede probar que es analítica.
Otra propiedad importante de la transformación de Fourier es que lleva
producto de funciones en convolución de funciones y viceversa.

Definición: Sea f , g ∈ S (lRn ). La convolución de f con g denotada f ∗ g es


la función, también en S (lRn ), dada por
Z
( f ∗ g )(y) = f (y − x) g (x) d n x. (10.16)
lRn

Teorema 10.2 a) Para cada f ∈ S (lRn ), el mapa lineal g → f ∗ g de S (lRn )


en S (lRn ) es continuo.
b) Ó
f g = 1 fˆ ∗ ĝ y Õ f ∗ g = (2π)n/2 fˆĝ .
(2π)n/2
c) f ∗ g = g ∗ f y f ∗ ( g ∗ h) = ( f ∗ g ) ∗ h.

Prueba: Una vez probado el punto b ) los otros siguen trivialmente. Asegú-
rese! Probaremos entonces b ). Como ya vimos (ϕ, ψ) = (ϕ̂, ψ̂) ∀ ϕ, ψ ∈
S (lRn ). Aplicando esta identidad a e i y·x f¯(x) y g (x) obtenemos (e i y·x f¯, g ) =
×
(e i y·x f¯, ĝ ). pero
Z
(e i y·x f¯, g ) = e −i y·x f (x) g (x) d n x = (2π)n/2 Ó
fg (10.17)
n
lR

3
En realidad el argumento anterior nos dice que si s o p( f ) es compacto luego D α fˆ ∈
L2(lRn ) ∀ α ∈ I+n . Como veremos más adelante esto implica que es infinitamente diferen-
ciable.

203
y
 
× i y·x ¯
R R −i λ·x+i y·x ¯ n
(e f , ĝ ) = lRn (2π) −n/2
lRn e f (x) d x ĝ (λ) d n λ
R
= lRn fˆ(y − λ) ĝ (λ) d n λ

= fˆ ∗ ĝ .
(10.18)
−1
La otra fórmula se obtiene aplicando F a la anterior ♠
Otra propiedad interesante de la convolución se obtiene al notar que co-
mo S (lRn ) es cerrado con respecto a la operación de convolución ( f , g ∈
S (lRn ) =⇒ f ∗ g ∈ S (lRn )) podemos definir la convolución de una distri-
bución temperada con una función en S (lRn ) como,
(T ∗ f )(ϕ) = T ( f˜ ∗ ϕ) donde f˜(x) := f (−x). (10.19)

Ejercicio: Aplique (10.19) a T = T g para g ∈ S (lRn ) y vea que esta definición


tiene sentido.
La propiedad interesante se ve en el siguiente lema.
Lema 10.4 T ∗ f es equivalente a una función infinitamente diferenciable.

10.2. *Propiedades básicas de los Espacios de Sobolev

Como una aplicación de la transformación de Fourier veremos a conti-


nuación las propiedades básicas de los espacios de Sobolev. Éstas será usa-
das más adelante cuando estudiemos la teoría de las ecuaciones diferenciales
parciales. El primer paso será una generalización de los espacios de Sobolev.
Como vimos los espacios de Sobolev son espacios de Hilbert con norma pro-
veniente del siguiente producto escalar.
 
Xm X n  
( f , g )H m = ∂ ∂ . . . ∂ f , ∂ ∂ . . . ∂ g  , (10.20)
| i j{z }p i j p 
k=0 i , j , p=1
k veces L2

donde f y g son funciones definidas en un abierto Ω cualquiera de lRn . Si


Ω = lRn luego de las propiedades de la transformación de Fourier obtenemos
P m Pn
( f , g )H m = (λ λ . . . λ fˆ(λ), λi λ j . . . λ p , ĝ (λ))L2
k=0v i, j , p=1 i j v p
uXm uX
u u m (10.21)
ˆ
= ( f (λ) t |λ| , ĝ (λ)t
2k
|λ|2k ),
k=0 k=0

204
es decir las funciones f (x) ∈ H m (lRn ) son aquellas que su transformada
v de
uX
u m
Fourier f decae lo suficientemente rápido como para que f (λ)t
ˆ ˆ |λ|2k sea
k=0
de cuadrado integrable.
Esto nos sugiere generalizar los espacios permitiendo índices no enteros
y aún negativos por medio del siguiente producto escalar,

( f , g )H s = ( fˆ(λ)(1 + |λ|2) s/2, ĝ (λ)(1 + |λ|2) s/2)L2 . (10.22)

Ejercicio: Muestre que este es un producto escalar.

X
m
Note que para s = m en vez del polinomio |λ|2k , ahora tenemos (1 +
k+0
2 m
|λ| ) . Como existen constantes positivas c1 yc2, tales que

X
m
2 m
c1(1 + |λ| ) ≤ |λ|2k ≤ c2(1 + |λ|2) m (10.23)
k=0

este cambio en la norma es trivial en el sentido de que estas normas son equi-
valentes entre sí. En realidad, como veremos en un caso especial, incluso el 1
en el polinomio se puede ignorar y aún así obtener una norma equivalente.
La primera propiedad que veremos es el siguiente lema:

Lema 10.5 Si s ′ > s luego H s ⊂ H s .

Prueba: Trivial ♠

En particular si s > 0 luego H s ⊂ H 0 = L2, si s < 0 luego L2 ⊂ H s . ¿Qué


son los elementos de H s para s negativo?
Dada g ∈ H −s puedo definir el siguiente mapa de H s en C,


Ψ g ( f ) := (ĝ , fˆ)H 0 = ( , fˆ(1 + |λ|2) s /2)H 0 .
2 s/2
(1 + |λ| )

Este mapa es lineal, está bien definido ∀ f , g ∈ C0∞ y puede ser extendido a
todo H s (y H −s ) por continuidad, ya que,

|Ψ g ( f )| ≤ || g ||H −s || f ||H s .

205
Por lo tanto tenemos un mapa entre H −s y el dual de H s , que preserva la
norma, es más, se puede probar que este mapa en un isomorfismo (o sea que
además es invertible) entre estos espacios.4 Por lo tanto podemos identificar
a H −s con el dual de H s .

Ejercicio: Usando que C ∞ (lRn ) es denso en H s (lRn ) muestre que la delta de


Dirac está en H s (lRn ) para todo s < −n/2.

Quizás la más importante propiedad de H s (lRn ) es la siguiente,

Lema 10.6 (de Sobolev) Si m < s − n/2 luego H s (lRn ) ⊂ C m (lRn ).

Prueba: Basta con probarlo para m = 0, el resto sigue por inducción. Basta
también probar la desigualdad. k f kC 0 < C k f kH s , s > n2 para alguna cons-
tante C > 0 independiente de f y para toda f ∈ C ∞ (lRn ), el resto sigue por
la continuidad de la norma. Pero
Z

k f kc 0 = s u p x∈Rn | f (x)| = s u p x∈Rn e iλ·x fˆ(λ) d n x
n
Z R
1
≤ n/2 | fˆ(λ)| d n λ
(2π)
Rn
Z
1
| fˆ(λ)|(1 + |λ|2) s/2
≤ d nλ
(2π)n/2
Rn (1 + |λ|2) s/2
1 ˆ 2 s/2 1
≤ n/2 k f (λ)(1 + |λ| ) kL2 k k 2
(2π) (1+kλ|2 ) s/2 L

≤ C k f kH s .
(10.24)
1
donde hemos usado que s > n/2 para probar que k kL2 < ∞ ♠
(1 + |λ|2) s/2
Este lema nos dice que si f ∈ H m (lRn ) para m suficientemente grande
luego f puede ser identificada con una función ordinaria, continua e incluso
diferenciable.
n
Sea f una función continua en lR+ = {x ∈ lRn xn ≥ 0} y sea τ f la res-
tricción de esa función al hiperplano xn = 0 es decir (τ f )(x1, x2, . . . , xn−1) =
f (x1, x2, . . . , xn = 0). Claramente τ es un mapa lineal y si f es continua en
4
Por el teorema de Representación de Riez cada Ψ : H s → C puede además ser escrito
como Ψ( f ) = ( g̃ , f )H s , g̃ ∈ H s . Si tomamos g = F −1 ((1 + |λ||2) s F ( g̃ )) ∈ H −s entonces
Ψ( f ) = Ψ g ( f ).

206
n
lR+ luego τ f es continua en lRn−1 = {x ∈ lRn / xn = 0}. ¿Se puede extender
este mapa a funciones más generales? La respuesta es el siguiente lema que nos
muestra además el porqué de la necesidad de extender los espacios de Sobolev
a índices no enteros.
Lema 10.7 (Traza) Sea m > 0 entero, luego:
n
i) τ : H m (lR+ ) → H m−1/2(lRn−1) es continuo.
ii) es suryectivo.

Prueba: Por el mismo argumento que en el lema anterior para probar i) basta
probar que existe c > 0 tal que
n
kτ f kH 1/2(Rn−1/2) < C k f kH 1(Rn ) ∀ f ∈ C0∞ (lR+ ) (10.25)
+

Sea fˆ(λ′ , xn ) la transformada de Fourier de f (x) con respecto a las coor-


n
denadas (x1, x2, . . . , xn−1) de lR+ , luego
Z ∞ ∂ fˆ
| fˆ(λ′ , 0)|2 = −2 Re (λ′ , t ) fˆ(λ′ , t ) d t . (10.26)
0 ∂ xn
Multiplicando ambos lados de esta igualdad por (1 + |λ′ |2)1/2 e integrando
con respecto a λ′ obtenemos,

Z
kτ f kH 1/2(Rn−1 ) = | fˆ(λ′ , 0)|2 d n−1λ′
n−1
R
Z Z∞ ˆ ′
∂ f (λ , t ) ˆ ′
= 2 ′
(1 + |λ | )2 1/2
f (λ , t ) d t d n−1
λ

Rn−1 0 ∂ xn
 2  1/2
Z Z
∞ ∂ fˆ
 
≤ 2 ′
(λ , t ) d t d n−1 ′
λ ×
 Rn−1 0 ∂ xn 
Z Z∞ 1/2
′ 2 ′ 2 n−1 ′
× (1 + |λ | ) | f (λ , t )| d t d λ .
Rn−1 0
(10.27)
2 2
Usando que |2a b | ≤ a + b y la identidad de Plancherel obtenemos
R ¦ P ©
kτ f k2 1/2 n−1 ≤ Rn | f (x)|2 + n−1 |∂
k=0 k
f | 2
+ |∂ n f | 2
dnx
H (R ) +
(10.28)
= k f kH 1(Rn ) .
+

207
Para probar suryectividad debemos ver que dada g ∈ H 1/2(lRn−1) existe al
n
menos una (en realidad infinitas) f ∈ H 1(lR+ ) tal que τ f = g . Nuevamente
basta definir una anti-traza K en C ∞ (lRn ) y probar que existe C > 0 tal que

kK g kH 1(Rn ) < C k g kH 1/2(Rn−1) ∀ g ∈ C0∞ . (10.29)


+

′ 2 1/2 n
Sea K( g ) = F −1(e −(1+|λ | ) x F ( g )) y notando que el argumento de F −1
está en S (lRn−1) dejamos la prueba de la desigualdad anterior como ejercicio.
En las aplicaciones tendremos que considerar funciones definidas solo en
abiertos de lRn , Ω y sus bordes ∂ Ω. Supondremos que Ω es tal que su borde,
∂ Ω = C l Ω − Ω, es una variedad suave.
Sea H m (Ω) el espacio de Sobolev obtenido tomando la integral en el pro-
ducto escalar simplemente sobre Ω y completando el espacio C0∞ (Ω) con res-
pecto a su norma y sea H0m (Ω) el obtenido con la misma norma pero com-
pletando el espacio C ∞ (Ω). Si m = 0 o si Ω = lRn luego estos espacios coin-
ciden. Pero si m ≥ 1 y ∂ Ω es no vacío entonces son distintos (obviamente
H0m ⊂ H m ) ya que como se controlan derivadas en la norma las sucesiones
de funciones de soporte compacto no pueden converger una función no nula
en el borde. ¿Cómo extenderemos los resultados obtenidos en lRn a Ω? El
lema clave para ello es el siguiente.

Lema 10.8 Sea γ la restricción de funciones en lRn a funciones en Ω, luego

γ : H m (lRn ) → H m (Ω)

es continuo y suryectivo.

Prueba: La continuidad es clara, solo resta ver la suryectividad. Probaremos


suryectividad para el caso Ω = {x ∈ lRn , xn > 0}, ∂ Ω = {x ∈ lRn / xn =
0}. Sea f ∈ H m (Ω) luego por el Lema anterior τ(∂nk f ) ∈ L2 para k =
0, 1, . . . , m − 1. Continuamos f para xn negativo como,
 
X (−xn )k
m−1  
 k  1/xn2
f (x) ≡ τ(∂n f ) 1− e , xn < 0 (10.30)
k=1
k!

La sumatoria hace que las derivadas de f sean continuas en xn = 0 y la expo-


nencial hace que la norma H m sea acotada. Pero esta norma solo dependerá
de las normas de τ(∂nk f ) las cuales a su vez están acotadas por k f kH m (Ω) y

208
por lo tanto existirá c > 0 tal que k f (x)kH m (Rn ) < C k f kH m (Ω) ∀ f ∈ C0∞ . El
caso general es técnicamente más engorroso la idea básica es la de usar cartas
tales que mapeen regiones conteniendo parte del borde de Ω en lRn + ma-
peando borde con borde. En cada una de estas cartas sabemos cómo probar
la desigualdad correspondiente. La desigualdad global se prueba suponiendo,
por el absurdo, que ésta no vale ♠
Este lema nos permite inmediatamente generalizar los lemas anteriores.

Definición: Diremos que f ∈ H s (Ω) si admite una extensión f˜ a lRn tal que
f˜ ∈ H s (lRn ) [Note que esto concuerda con lo probado para s entero positi-
vo].

Es inmediato entonces que si s ′ > s luego H s (Ω) ⊂ H s (Ω), que si m < s −
n/2 luego H s (Ω) ⊂ C m (Ω) y que si m > 0 entero τ : H m (Ω) → H m−1/2(∂ Ω)
es continuo y suryectivo. En la última afirmación usamos H m−1/2(∂ Ω) don-
de en general ∂ Ω 6= abierto en lRn−1 y por lo tanto no se encuadra en la
definición anterior. En el caso en que ∂ Ω sea compacto diremos que f ∈
H m−1/2(∂ Ω) si, dado cualquier cubrimiento abierto {Ui } de ∂ Ω lo suficien-
temente pequeño como para que exista ϕ i , tal que (Ui , ϕ i ) sea una carta de
∂ Ω entonces f ∈ H m−1/2(Ui ) ∀ i.
Finalizamos este capítulo con dos lemas. El segundo de ellos, consecuen-
cia del primero, es de gran importancia en la teoría de ecuaciones en derivadas
parciales.
Lema 10.9 Sea Γd un cubo en lRn con lados de longitud d > 0. Si u ∈ H 1(Γd )
luego,
Z
2 n 2
nd 2 Xn
kuk 0 −n
≤d | u d x| + k∂ j uk2 0 . (10.31)
H (Γd ) 2 j =1 H (Γd )
Γd

Prueba: Es suficiente considerar u ∈ C 1(Γd ). Para cualquier x e y en Γd tene-


mos,
Xn Z yj
u(y) − u(x) = ∂ j u(y 1, ..., y j −1, s, x j +1, ..., x n )d s. (10.32)
j =1 xj

Tomando su cuadrado y usando la desigualdad de Schwarzt obtenemos,


|u|2(x) + |u|2(y) − 2ℜ(u(x)u(y))
Xn Z d /2
≤ nd |∂ j u(y 1, . . . , y j −1, s, x j +1, . . . , x n )|2 d s. (10.33)
j =1 −d /2

209
Integrando con respecto a todos los x j e y j obtenemos,
Z 2
X n
n 2 n n+2
2 d kuk 0 ≤2 u d x + n d k∂ j ukH 0(Γ ) , (10.34)
H (Γd ) Γ j =1
d
d

de la cual sigue trivialmente la desigualdad buscada ♠

Lema 10.10 Sea Ω ⊂ lRn compacto con borde suave. Si una sucesión {u p } en
H01(Ω) es acotada, luego existe una subsucesión que converge (fuertemente) en
H 0(Ω). Es decir el mapa natural 5 H01(Ω) → H 0(Ω) es compacto.

Prueba: Sea k = s u p{ku p kH 1(Ω) }. Como Ω es acotado lo podemos encerrar


0
en un cubo ΓD y extender cada un como cero en ΓD − Ω. Sea ǫ > 0 y M lo
2 2
suficientemente grande como para que 2nk 2D < ǫ. Descomponiendo ΓD en
M
n j
M cubos con d = D/M y usando que como {un } es también acotada
Γd
en H 0(Ω) existe una subsucesión { ũ p } y u ∈ H 0(Ω) tal que esta converge
débilmente a u. Vemos entonces que existe un entero N tal que si p y q > N ,
2
Z ‚ Œ2n
ǫ D 1
( ũ − ũ ) d n x < . (10.35)
j p q 2 M Dn
Γd

j
Si aplicamos a cada Γd el lema (10.9) y sumamos sobre j obtenemos que ∀ p
y q > N,
€ Šn P n € Š2n  € Š
2 D M ǫ D n D 2
k ũ p − ũq k 0 ≤ M j =1 2 M
+ 2 M (2k 2)
H (Ω)

≤ ǫ+ǫ (10.36)
2 2

≤ ǫ.

Pero entonces { ũ p } es una sucesión de Cauchy en H 0(Ω) y por lo tanto con-


verge fuertemente a u en H 0(Ω) ♠
5
Por mapa natural entre dos espacios de Banach se entiende lo siguiente: recordemos que
los elementos de cada uno de estos espacios son clases equivalentes de sucesiones de Cauchy,
las cuales podemos asumir consisten de elementos suaves de algún espacio denso, por ejemplo
C ∞ (Ω), el mapa natural se define como aquel que envía elemento a elemento una sucesión de
Cauchy de un espacio en el otro. Como la norma del espacio de salida acota a la norma del
espacio de llegada la sucesión obtenida en el espacio de llegada también es de Cauchy y por lo
tanto determina una clase equivalente allí, ergo un elemento del espacio.

210
Notas bibliográficas: Recomiendo los libros: [15] y [9]. Los espacios de
Sobolev permitieron comprender gran parte de la teoría de ecuaciones no
lineales y previamente la teoría de ecuaciones lineales pero a coeficientes no
suaves. No son ideas complejas, pero muy útiles e imprescindibles para la
investigación en ecuaciones en derivadas parciales.

211
212
CAPÍTULO 11

TEORÍA DE ECUACIONES EN DERIVADAS PARCIALES

11.1. Introducción

Definición: Una ecuación diferencial en derivadas parciales de orden m


en M es una ecuación de la forma
 m veces

 z }| { 
F  p, u, ∇a u, ∇a ∇ b u, . . . , ∇a · · · ∇c u  = 0, (11.1)

donde ∇a es alguna conexión en M . Más generalmente u puede ser una tu-


pla de campos tensoriales y F tener rango en alguna otra tupla de campos
tensoriales.

Ejemplos:

a) La ecuación de Laplace en lR3 con respecto a una métrica gab ,

∆u ≡ g ab ∇a ∇ b u = 0 (11.2)

Si gab es la métrica Euclídea, luego en coordenadas cartesianas

∂ 2u ∂ 2u ∂ 2u
∆u = + + . (11.3)
∂ x2 ∂ y2 ∂ z2

b) La ecuación de Poisson,
∆u − ρ = 0, (11.4)
donde ρ es una función dada.

213
c) La ecuación de onda en lRn+1. Esta tiene la forma de la ecuación de Laplace
Xn
pero para una métrica de la forma −(d x0) +2
(d x i )2. Por ejemplo en lR2,
i =1
gab = −(d t )2ab + (d x)2ab ,

ab
∂ 2u ∂ 2u
g ∇a ∇ b u = − + . (11.5)
∂ t2 ∂ x2

d) Las ecuaciones de Maxwell,

∇a F ab = j b
(11.6)
∇[a F b c] = 0

donde M es lR4, la métrica (usada tanto para subir los índices de Fab como
para definir ∇c ) es la de Minkowski, gab = −(d x 0)2 +d x 1)2 +(d x 2)2 +(d x 3)2,
Fab es un campo tensorial antisimétrico en M , y y b es un campo vectorial (la
cuadricorriente) en M .

e) Las ecuaciones de elasticidad en lR3(Euclídeo)×lR

∂ 2ua
ρ 2
= µ ∆u a + (λ + µ) ∇a (∇c u c ), (11.7)
∂t

donde u a es el vector desplazamiento (en lR3), ρ la densidad del medio elás-


tico y λ y µ las constantes de Lamé del medio.

f) La ecuación de conducción del calor en lR3(Euclídeo)×lR

∂u
= k ∆u, k >0 (11.8)
∂t

g) La ecuación de Schrödinger en lR3(Euclídeo)×lR,

∂ ψ ħh 2
i ħh =− ∆ ψ + V ψ, (11.9)
∂t 2m

donde ψ es una función compleja y V un potencial.

214
h) La ecuación de Navier-Stokes para un fluido viscoso e incompresible (ejem-
plo agua) en lR3(Euclídeo)×lR

∂ ua 1
+ u b ∇b u a + ∇a p − γ ∆u a = 0 (11.10)
∂t ρ

∇a u a = 0, (11.11)

donde u a es el vector velocidad del fluido, p su presión, ρ su densidad (cons-


tante) y γ la viscosidad cinemática.

De los ejemplos citados, de los cuales solo el último no es lineal, vemos la


tremenda importancia física que tiene tener una teoría general de estas ecua-
ciones y es así que ésta es una de las ramas más activas de la matemática. Por
su complejidad, en el gran número de casos distintos que presenta, la teo-
ría general dista mucho de estar completa, sin embargo hay casos o clases de
ecuaciones donde esto se ha logrado. Uno de éstos es el caso de una única
ecuación de primer orden, donde como veremos el problema se reduce al de
las ecuaciones diferenciales ordinarias.
Otro de estos casos es el de las ecuaciones lineales con coeficientes cons-
tantes (es decir para los cuales existe un sistema de coordenadas en el cual
todos los coeficientes son constantes -ejemplo el Laplaciano para una métrica
Euclídea). Esto se debe fundamentalmente al uso de transformadas como la de
Fourier. Hago notar sin embargo que hay trabajos recientes mostrando nue-
vos resultados, aún en el caso del Laplaciano! Si permitimos a los coeficientes
variar el problema se complica, sin embargo ciertas subclases de éstos han sido
estudiadas completamente. Si a esto le agregamos no-linealidad en una forma
no demasiado drástica –lo que se conoce como ecuaciones cuasi-lineales– el
conocimiento se reduce bruscamente, aunque algunas subclases han sido do-
blegadas y algunas ecuaciones particulares completamente estudiadas. El caso
donde la no-linealidad es drástica no ha sido todavía atacado con éxito -de nin-
guna clase-. Por fortuna los problemas físicos que hasta el momento hemos
podido modelar o describir por ecuaciones en derivadas parciales tienen ecua-
ciones a lo sumo del tipo cuasi-lineal. En este curso veremos en detalle solo la
teoría de algunas de las ecuaciones más simples [esencialmente las ecuaciones
en los ejemplos a), b), c) y f)], siempre tratando de usar métodos que pueden
ser aplicados a ecuaciones similares pero más complejas. Esto no solo se debe
a la simplicidad de estas ecuaciones, lo que permite su conocimiento comple-
to y detallado sino a que por un lado representan los “ejemplos canónicos" de
distintas clases de ecuaciones. Las soluciones de las ecuaciones en cada una de

215
estas clases se comportan en forma muy similar mientras que lo hacen en for-
ma radicalmente diferente a las soluciones a ecuaciones en las otras clases. Por
otro lado estas son las ecuaciones más usadas en física y aparecen en multitud
de problemas diferentes, incluso como casos particulares de las ecuaciones en
los ejemplos d), e), f) y g)!

11.2. La ecuación de primer orden

Esta es una ecuación de la forma



F p, u, ∇a u = 0. (11.12)

donde u es una función en alguna variedad M . Esta ecuación puede ser ataca-
da con mucho éxito y resulta en ecuaciones ordinarias, cuya teoría ya cono-
cemos. Por simplicidad aquí consideraremos solo el caso cuasi-lineal y en lR2,
es decir una ecuación de la forma,

a(x, y, u) u x + b (x, y, u) uy = c(x, y, u), (11.13)

donde u x = ∂∂ ux y uy = ∂∂ uy .
Por motivos geométricos es útil representar las soluciones de esta ecua-
ción en lR3 o más precisamente en una región Ω de lR3 donde a, b y c estén
definidos, eso es asociar una solución u(x, y) de (11.13) con la hiper-superficie
de lR3 dada por τ = z − u(x, y) = c t e. Estas hiper-superficies se denominan
superficies integrales de la ecuación (11.13). El gradiente de τ es en estas
coordenadas es (∇a τ) = (−u x , −uy , 1), por lo que vemos que la ecuación
(11.13) es simplemente la condición que τ sea constante a lo largo del campo
vectorial (l a ) = (a(x, y, z), b (x, y, z), c(x, y, z)), es decir l a ∇a τ = 0, lo que
es equivalente a decir que l a es tangente a las superficies integrales. Note que
si l a ∇a τ = 0 luego ( f l a )∇a τ = 0 o sea que lo que determina la ecuación
(11.13) no es l a sino su dirección. Este campo de direcciones se llama de di-
recciones características, y sus curvas integrales curvas características. 1 La
teoría de EDO nos dice entonces que por cada punto de Ω pasa una única
curva característica. El conocimiento de estas curvas es fundamental ya que
1
Recuerde que una curva integral es la “imagen” de una curva γ (t )(en este caso =
(x(t ), y(t ), z(t )) solución de una EDO, en este caso
   
d γ (t ) d  x a(x, y, z)
  
=  y  =  b (x, y, z)  . (11.14)
dt dt z c(x, y, z)

216
si formamos una superficie S tomando la unión de ciertas curvas característi-
cas luego claramente S será una superficie integral de (11.13), pero por otro
lado, dada una superficie integral S y cualquier p ∈ S la curva característica
que pasa por p será tangente a S en todo punto y por lo tanto será una sub-
variedad de S con lo que se ve que S estará formada por la unión de curvas
características.

curva característica

la

y τ = c t e.

Figura 11.1: Curvas características.

En particular note que si dos superficies integrales S, S ′ , es decir dos so-


luciones de (11.13), u y u ′ , tienen un punto p en común luego tienen que
tener toda una curva característica en común, ya que por p solo pasa una de
tales curvas y ésta no puede abandonar ninguna de las dos superficies. Por
otro lado si S y S ′ se intersectan en una curva γ ésta debe ser integral. Para
ver esto tomemos un punto p de γ y consideremos T p S y T p S ′ ; como las
superficies se intersectan en una curva estos dos sub-espacios de T p lR3 se in-
tersectan en una línea, como ambos deben contener la dirección dada por l a
ésta será la línea. Pero esto es cierto para todo punto de γ y por lo tanto el
vector tangente a γ en proporcional a l a y γ es característica.

11.2.1. El Problema de Cauchy


Se llama problema de Cauchy de una ecuación al problema de encontrar
ciertos datos tales que dando éstos exista una única solución de esta ecuación.

217
Figura 11.2: Intersección de soluciones.

Es decir el de encontrar un cierto conjunto cuyos elementos son llamados


datos y un mapa entre este espacio y el conjunto de soluciones de la ecuación.
Por ejemplo en el caso de los EDO, el problema consiste en dada un campo
vectorial suave v a en M encontrar algún conjunto tal que a cada elemento de
éste le corresponda una curva integral de v a . Claramente podríamos tomar
este conjunto a los puntos de M donde v a 6= 0 ya que por cada uno de estos
puntos pasa una única curva integral. Claramente también podríamos tomar
como conjunto de datos –al menos localmente– una hiper-superficie s de M
tal que en ninguno de sus puntos v a sea tangente a ésta. En tal caso tenemos
además la muy deseable propiedad de que cada punto de S determina una
única solución, es decir no contamos cada solución más que una vez.
¿Cuáles serán estos datos en el caso de la ecuación (11.13)?
Sea γ (s ) = (x0(s), y0(s), z0(s)), s ∈ [0, 1], una curva en lR3. Buscaremos una
solución tal que su superficie integral contenga a γ , es decir una u(x, y) tal
que se cumpla,2

z0(s) = u(x0(s), y0(s)) ∀ s ∈ [0, 1]. (11.15)

Consideraremos primero el caso en que γ (s) no es una curva característi-


ca. Tomando cada punto γ (s) como punto inicial para la ecuación diferencial
2
Solo interesa la imagen de la curva y no su parametrización, por lo tanto tomaremos una
en que el rango de S sea el intervalo [0, 1].

218
ordinaria que determina l a y resolviendo esta obtenemos para cada s la curva
característica que pasa por γ (s). (Ver figura.)

la

Figura 11.3: Construyendo la solución a partir de la curva γ .

Obtenemos así un mapa γ (s, t ) : I s × I t → lR3 dado por,

γ (s, t ) = (x(s, t ), y(s, t ), z(s , t )) (11.16)

con x(s, 0) = x0(s ), y(s, 0) = y0(s) y z(s, 0) = z0(s) y donde a s fijo se cumple,

d γ (s, t )
= l a (γ (s, t )). (11.17)
dt

Si pudiésemos invertir las funciones x(s, t ) e y(s, t ) y así obtener s y t


como funciones de x e y luego

u(x, y) ≡ z(s(x, y), t (x, y)) (11.18)

sería la solución buscada, ya que tal u satisface por construcción (11.13) y


(11.15).
No siempre es posible tal inversión. La razón es que en general habrá
valores de s y t tales que el plano tangente a γ (s, t ) en ese punto contiene al
eje z. Veamos si hay condiciones que nos aseguren que tal inversión es posible
al menos localmente, es decir en un entorno de algún punto (x(s0, 0), y(s0, 0))
sobre γ (s).
El teorema de la función implícita nos dice que esto será posible si el
diferencial de la transformación en ese punto (s0, 0) es invertible, es decir si su
determinante (el Jacobiano de la transformación) no se anula. En este punto

219
tenemos,

∂ x ∂y
∂ s (s ,0) ∂ s (s ,0)
∂x ∂y
0 0
J = ∂ x ∂y = (s0) b0 − (s0)a0 6= 0, (11.19)
∂s ∂ s
∂ t (s ,0) ∂ t (s ,0)
0 0

donde a0 = a(x(s0), y(s0), z(s0))y b0 = b (x(s0), y(s0), z(s0)). Esta es entonces


la condición para la existencia local de soluciones y nos dice que γ (s) debe ser
elegida de modo tal que su proyección en el plano (x, y) tenga vector tangente
que no sea proporcional a la proyección en dicho plano del vector (a, b , c).

Ejemplo: En algunas aplicaciones la coordenada y es el tiempo. En tal caso


es natural especificar u en un instante de tiempo, digamos y = 0, es decir
dar su valor inicial. Así es que el problema de valores iniciales consiste
simplemente en elegir γ (s) = (s, 0, h(s)). La ecuación (11.15) resulta entonces
h(s) = u(s, 0) o h(x) = u(x, 0), es decir h(s) será el valor inicial que tendrá
la solución a y = 0. en este caso habrá solución local siempre y cuando b , el
∂u
coeficiente de , no se anule en (x, 0, h(x)).
∂y
Si γ fuese una curva característica luego existirán infinitas soluciones (lo-
cales) ya que dado un punto γ (s ) de γ y una curva no característica γ ⋆ (r )
pasando por este punto podremos construir, usando el procedimiento ante-
rior, pero ahora con γ ⋆ (r ), una solución (una superficie) γ ⋆ (r, t ) que necesa-
riamente contendrá a γ .

Ejercicio: Resuelva por el método descripto las ecuaciones:

a)
∂u ∂u
+c =0
∂y ∂x
u(x, 0) = h(x).
b)
∂u ∂u
+u =0
∂y ∂x
u(x, 0) = −x.
c) ¿Por cuánto tiempo (y = t ) se pueden extender las soluciones de b)?

220
11.3. Clasificación de ecuaciones en derivadas parciales

Para facilitar la clasificación procederemos en forma similar a como lo


hicimos cuando estudiamos las ecuaciones en derivadas ordinarias, es decir
reduciremos los sistemas de ecuaciones a sistemas de primer orden. Para ello
tomaremos como variables independientes todas las derivadas de orden infe-
rior al mayor orden en que aparece cada una de las variables.

Ejemplo: Sea φ : lR2 → lR satisfaciendo

∂ 2φ ∂ 2φ
+ = ρ, (11.20)
∂ x2 ∂ y2

es decir el Laplaciano en una variedad dos dimensional plana. Definamos


∂φ ∂φ
u 1 := φ, u 2 := ∂ x y u 3 := ∂ y , luego esta ecuación es equivalente al siguiente
sistema
     
0 1 0  1  0 0 1  1  ρ
  u   u  
 1 0 0   2   0 0 0   2   u2 
 ∂  u  +  ∂  u  =  3 
 0 0 0  x 3  1 0 0  y  u 
u u3
0 0 −1 0 1 0 0
(11.21)
El motivo por el cual agregamos la cuarta ecuación se verá más adelante,
pero adelantamos que ella nos permite deducir, sin recurrir a las ecuaciones
de las filas segunda y tercera, de que las componentes u 2 y u 3 son las com-
ponentes de la diferencial de alguna función. Si conocemos una solución de
11.21, (u 1, u 2, u 3) podemos probar que u 1 satisface también el Laplaciano.
En efecto, tomando una derivada con respecto a x de la segunda fila y una
derivada con respecto a y de la tercera, sumándolas y luego usando la primer
fila obtenemos el resultado buscado. De todos los sistemas de primer orden
(y básicamente también por la misma razón que dimos cuando consideramos
sistemas de ecuaciones ordinarias) solo consideraremos aquellos de la forma,

MAa ′ B ∇a u B = IA′ , (11.22)

con M a ′ y IA′ funciones suaves del punto en la variedad (campos) y de u A.


AB
Los índices que estamos usando son índices abstractos y puede denotar no
solo un conjunto de escalares, sino también un gran vector hecho de diversos
campos vectoriales. Veremos esto en ejemplos. También se pueden tomar sis-
temas coordenados y bases y entonces plantear el problema en componentes,
como hicimos en el ejemplo anterior, en cuyo caso entonces podemos pensar

221
a u A como en gran arreglo vectorial de campos escalares. Hemos usado ín-
dices con y sin primar para dejar en claro que el espacio (co-vectorial) de los
índices primados no tiene la misma dimensión que el espacio vectorial de los
índices sin primar.
El tipo de sistema que acabamos de definir se llama cuasi–lineal, pues las
derivadas aparecen en forma lineal. Esta no es una pérdida de generalidad
desde el punto de vista de la física:

¡Todos los sistemas físicos conocidos son de esta forma!

Históricamente la clasificación que daremos a continuación nace del in-


tento de encuadrar todas las ecuaciones en el Problema de Cauchy, es decir,
tomar una hiper-superficie Σ de M , dar allí como dato u y su derivada en la
dirección normal y tratar de construir soluciones en un entorno de Σ en M
(soluciones locales). Este intento no fue en general exitoso, ya que en general
esta no es la manera correcta de dar datos, pero sí lo fue la clasificación de
estas ecuaciones así obtenida, ya que las propiedades de las soluciones a las
ecuaciones en cada una de estas clases en las que las clasificaremos son muy
similares y en cada una de estas clases los datos se prescriben también de ma-
nera similar.
Para fijar ideas sea M de dimensión n y sea p ∈ M . Queremos encontrar
las soluciones en un entorno de p dando como dato u A en alguna hiper-
superficie Σ de M que contiene a p. Por simplicidad haremos las cuentas
necesarias en un sistema de coordenadas adaptado al problema en el sentido
que elegiremos a la coordenada x n de tal forma que la subvariedad x n = 0
sea la superficie Σ y p sea el origen de coordenadas. Los datos serán entonces
ΦA(x 1, ..., x n−1), que luego corresponderá a la solución u A restringida a Σ, es
decir ΦA = u A|Σ .
Como conocemos lo que será u A en Σ conocemos lo que serán todas
sus derivadas (de cualquier orden) con respecto a las coordenadas x i , i =
1, ..., n − 1. La idea es ahora usar la ecuación para encontrar ∂n u A|Σ y así su-
cesivamente encontrar todas las derivadas de u en p (o cualquier otro punto
de Σ). Si lo lográsemos podríamos, al menos formalmente y en un entorno
de p, construir u A como su serie de Taylor alrededor de p. Si pudiésemos
encontrar las derivadas normales a Σ, si ΦA fuesen datos analíticos, y si los
coeficientes de la ecuación fuesen también analíticos, luego se puede demos-
trar (Teorema de Cauchy-Kowalevski) que la solución u A construida formal-
mente arriba en realidad existe y es analítica en un entorno de p en M .

222
Up

Σ
xn = 0

Figura 11.4: Construyendo la solución local.

¿Qué requisitos debe satisfacer la ecuación para que esto sea posible? Usan-
do el sistema de coordenadas mencionado se puede ver que

M (ΦC , q)An ′ B ∂n u B |Σ = Términos en (ΦA, ∂i ΦC , q)A′ , (11.23)

Está claro entonces que podremos resolver para ∂n u A sólo si M (ΦC , q)n ′ es
AB
invertible. En general (como en el ejemplo que dimos) el espacio de llegada
del mapa M n′ no tiene la misma dimensión que el espacio de partida y por
AB
lo tanto el mapa no es en general invertible, por lo tanto solo pediremos que
el rango de dicho mapa tenga la dimensión máxima (es decir la dimensión
del espacio de partida –la de los vectores u A–). En particular esto implica
que estamos suponiendo que la dimensión del espacio de llegada es mayor o
igual que la del espacio de partida. Estamos pidiendo la posibilidad mínima
de tener soluciones.
Si esto no sucede entonces es claro que la ecuación será una relación entre
términos determinados a partir de los datos dados y en general no se satis-
fará. En ese caso los datos a dar libremente serán un número menor al de la
dimensión del espacio de partida, solo se podrán dar algunas componentes de
u A.
¿Qué es geométricamente la condición de maximalidad del rango de M a ′
AB
en lo que hace a las coordenadas elegidas?
Si la superficie x n = 0 es una superficie suave entonces podemos suponer
que ∇a x n existe y es distinta de cero, en este caso la condición anterior es
simplemente la condición que M a ′ ∇a x n tiene rango máximo, pero esta es
AB
independiente del sistema coordenado y solo depende de Σ, ya que aquí x n
es simplemente una función en M que es constante en Σ y cuyo gradiente no
se anula. Las superficies en donde la condición anterior se viola en todos sus

223
puntos se llaman superficies características. Clasificaremos a las ecuaciones
de acuerdo al número de superficies características que se intersecten en un
dado punto. Note que la clasificación solo depende del tensor M a ′ y no de
AB
a B
los términos de menor orden. M ′ ∇a u es llamada la parte principal de la
AB
ecuación. Note también que como M a ′ es un campo tensorial no necesaria-
AB
mente constante, la condición definiendo las superficies características puede
ser muy distinta de punto a punto, por lo tanto la clasificación que introdu-
ciremos vale en general solo para el punto en cuestión. Por fortuna en las
aplicaciones muy pocas veces aparecen ecuaciones donde su tipo cambia de
región en región. Note también que para sistemas no–lineales la condición
depende también de la solución que uno esté considerando! Como nuestra
clasificación solo se basa en la parte principal de la ecuación ésta debe tener
toda la información sobre la ecuación, es por eso que en el ejemplo anterior
agregamos la última fila en el sistema de ecuaciones, sin ella y considerando
el sistema principal no podríamos saber que las dos últimas componentes de
u A debían ser las componentes de la diferencial de una función.
Diremos que una ecuación es elíptica en p ∈ M si p no es intersectado
por ninguna superficie característica. Es decir si Rango M a ′ ka no es maximal
AB
entonces ka = 0 [como estamos en un punto la condición de que ka sea un
gradiente es vacía].

Ejercicio: El ejemplo canónico de ecuación elíptica es el Laplaciano en M ,


∆u := g ab ∇a ∇ b φ = ρ donde g ab es una métrica Riemanniana. Muestre
que el ejemplo dado anteriormente es un sistema elíptico.

Diremos que una ecuación es parabólica en p ∈ m si p es intersectado


por una única superficie característica. Es decir existe un único ka 6= 0 –a
menos de un factor multiplicativo– tal que Rango M a ′ ka no es maximal.
AB
El ejemplo canónico de ecuación parabólica (o de difusión) es la ecuación
del calor en lR × lRn−1,
∂ t u = ∆u. (11.24)

2
Ejercicio: Considere la ecuación anterior en lR × lR, ∂ t u = ∂ u2 . Reduzca
∂x
dicho sistema a primer orden y encuentre las superficies características de
esta ecuación.

224
Diremos que una ecuación es hiperbólica en p ∈ M si es intersectado por
más de una superficie característica.
El ejemplo canónico en este caso es la ecuación de onda en M

∆u = g ab ∇a ∇ b u, (11.25)

donde g ab es una métrica tal que dado cualquier punto p ∈ m existe un


sistema coordenado en donde gab toma la forma,
X
gµν | p = {−(d t )2 + (d x i )2}| p . (11.26)
i

Ejercicio: Considere en lR2 la métrica d s 2 = −(d t )2 + (d x)2 (en todo punto)


y la ecuación g ab ∇a ∇ b u = ρ.
a) Reduzca la ecuación a primer orden.
b) Encuentre las características de la ecuación.
c) Haga lo mismo en lR×S 1 (un cilindro espacio temporal) con d s 2 = −(d t )2+
(d θ)2 y con d s 2 = −(d t )2 + t 2(d θ)2.

Notas bibliográficas: Lectura recomendada para éste y los capítulos que


siguen: [15], [16], [17] y [19]. Lo expuesto en estos capítulos es lo mínimo
e imprescindible para tener una noción de esta área. Se conoce muchísimo
más y a la vez, como siempre, hay muchísimo más que desconocemos, solu-
ciones débiles, existencia global, ondas de choque, condiciones de contorno,
estabilidad, etc, etc. Esta es probablemente el área más activa, con más gente
trabajando y con el mayor número de aplicaciones de toda la matemática. La
mayoría de estas aplicaciones han sido tradicionalmente en el área de la inge-
niería y en particular en la de fluidos, lo que ha hecho de que solo se tratasen
cierto tipo específico de ecuaciones, bastante difíciles por cierto, y no las más
usadas en otras áreas de la física, esto ha evolucionado en los últimos años y
ahora hay un cambio considerable de atención hacia muchos de los problemas
de la física moderna.

225
226
CAPÍTULO 12

ECUACIONES ELÍPTICAS

12.1. La Ecuación de Laplace

Tomaremos como modelo de ecuaciónPn elíptica a la ecuación de Laplace


n
en lR con métrica Euclídea d s = i=1(d x i )2, o una región abierta Ω de
2

lRn con la misma métrica. Los resultados que obtendremos que no dependan
de funciones especiales se pueden generalizar para ecuaciones elípticas de la
forma (12.45) si se asume que c ≤ 0.
Como ya mencionamos, el programa de Cauchy, es decir formular el pro-
blema de obtener soluciones dando como dato u A en una hipersuperficie Σ
no funciona en general, solo lo hace para ecuaciones hiperbólicas. Si consi-
deramos datos no-analíticos, y los datos físicos son en general no-analíticos,
no hay en general ni siquiera soluciones locales. ¿Cuál es la manera apropiada
entonces de dar datos para la ecuación de Laplace? Obtendremos la respuesta
a esto considerando un fenómeno físico descripto por esta ecuación.
Consideremos un tambor e imprimamos una fuerza (pequeña) sobre su
membrana (o parche) en forma perpendicular a ésta.

La membrana se moverá de su posición plana (de reposo) y adquirirá una


nueva posición de equilibrio generando una fuerza elástica que cancele exac-
tamente a la aplicada. ¿Cuál será esta nueva forma de la membrana? Si deno-
tamos por u(x, y) al desplazamiento de ésta en la dirección del eje vertical (z)
y f a la fuerza por unidad de área aplicada (en la dirección vertical) se puede
ver que u debe satisfacer la ecuación,
Æ
∆u = f , en Ω = {(x, y)| x 2 + y 2 < radio del tambor}. (12.1)

Ejercicio: Convénzase de que (12.1) es la ecuación de equilibrio. Ayuda: Haga


primero el caso unidimensional.

227
Figura 12.1: La membrana de un tambor.

Como el borde del tambor sujeta la membrana allí tendremos la siguiente


condición de contorno,
Æ
u|∂ Ω = 0, ∂ Ω = {(x, y)| x 2 + y 2 = radio del tambor}. (12.2)

Tenemos así el siguiente problema: Dado f en Ω encuentre u satisfaciendo


(12.1) y (12.2). Por nuestra experiencia física sabemos que este problema se
debe poder resolver! Más aún, se debe poder resolver el problema donde el
tambor no es circular pero tiene forma arbitraria, permitiendo que ∂ Ω sea
un borde arbitrario pero suave y también que ∂ Ω no esté en el plano x = 0
o equivalentemente que esté en tal plano pero que u pueda tomar un valor
cualquiera –pero suave– φ en ∂ Ω.
Llegamos así al siguiente Problema de Dirichlet: Dada Ω con ∂ Ω suave,
f : Ω → lR suave y φ0 : ∂ Ω → lR, también suave, encuentre u : Ω → lR
satisfaciendo,

1. ∆u = f en Ω,

2. u|∂ Ω = φ0.

Más adelante reafirmaremos nuestra intuición viendo que este problema siem-
pre se puede resolver.
Supongamos ahora que permitimos que los bordes de la membrana se
pueda deslizar verticalmente pero en el borde ponemos resortes verticales
con una constante de Hooke que depende de la posición, k : ∂ Ω → lR y
dispuestos de tal forma que la posición de equilibrio antes de aplicar f sea
u = 0. Cuando apliquemos f la membrana se moverá hasta que nuevamente

228
en el interior tengamos,
∆u = f en Ω (12.3)
y en el borde
(k u + n a ∇a u)|∂ Ω = 0, (12.4)
donde n a es la normal a ∂ Ω. Este Problema Mixto también se puede resol-
ver.

Figura 12.2: Problema mixto.

Un caso particular de éste es cuando para ejercer la fuerza de borde no


usamos resortes sino simplemente una fuerza dada Rφ1 : ∂ Ω → lR, pero te-
niendo la precaución de que su contribución total, ∂ Ω φ1 d S, cancele exac-
tamente la contribución total de f –de no ser así tendríamos una membrana
acelerándose–. En tal caso tenemos el Problema de Neumann:

∆u = f en Ω (12.5)
n a ∇u|∂ Ω = φ1, en el borde, (12.6)
Z Z Z Z
con φ1 d S = n a ∇a u d S = f dV = ∆u dV . (12.7)
∂Ω ∂Ω Ω Ω

12.1.1. Existencia
A continuación veremos que el problema de Dirichlet siempre tiene una
única solución (suponiendo que f , φ0 y ∂ Ω son lo suficientemente suaves).
Los otros problemas se resuelven en forma similar.
Supongamos que existe u ∈ H 2(Ω) satisfaciendo, ∆u = f en Ω y u|∂ Ω =
0 –lo que implica u ∈ H01(Ω)–. Luego usando el teorema de la divergencia
obtenemos la primera identidad de Green, ∀v ∈ C ∞ (Ω).

229
Z Z Z Z
v f¯d n x = n
v∆ ū d x = − ab
e ∇a v∇ b ū d x + n
v(n a ∇a ū)d n−1 x,
Ω Ω Ω ∂Ω
(12.8)
Si suponemos que v ∈ H01(Ω) la identidad todavía es válida y en este caso se
reduce a,
Z Z
ab
e ∇a v∇ b ū d x = − n
v f¯d n x, ∀ v ∈ H01(Ω). (12.9)
Ω Ω

Pero note que esta identidad todavía es válida si suponemos simplemente que
u ∈ H01(Ω) –no necesariamente en H 2(Ω)– y que f ∈ H −1(Ω).
Tenemos así el Problema Débil de Dirichlet (con φ0 = 0): Encuentre
u ∈ H01(Ω) tal que dada f ∈ H −1(Ω) se satisfaga (12.9).
Si el lado derecho (12.9) fuese un producto escalar este daría origen (por
completamiento) a un espacio de Hilbert H y entonces (12.9) tendría la for-
ma Z
(u, v) = Φ (v) ≡ − f¯v d n x, ∀v ∈ H 1(Ω).
H f (12.10) 0

Si H = H01(Ω) y si Φ f : H → C fuese continua luego el teorema de repre-


sentación de Riez nos diría que existe un único u en H satisfaciendo (12.9)
y por lo tanto (12.10). Como veremos a continuación (lema de Poincaré-
Hardy) en este caso la parte derecha de (12.9) es un producto escalar equiva-
lente al de H01(Ω) y por lo tanto H = H01(Ω). Pero entonces Φ f es claramente
continua ya que H −1(Ω) es el dual de H 1(Ω) ⊃ H01(Ω) y u ∈ H01(Ω). Hemos
probado entonces:

Teorema 12.1 (de existencia y unicidad) Dada f ∈ H −1(Ω) existe una úni-
ca u ∈ H01(Ω) satisfaciendo el problema débil de Dirichlet.

Corolario 12.1 El mapa (∆, τ) : H 1(Ω) → H −1(Ω) × H 1/2(Ω) dado por,

∆u = f ∈ H −1(Ω),
(12.11)
τu = φ0 ∈ H 1/2(∂ Ω),

es un isomorfismo 1.
1
Siempre entendiendo estas ecuaciones en su forma débil o distribucional

230
Prueba: Es claro que el mapa es continuo –ya que es lineal y acotado–. Es
también inyectivo ya que si φ0 = 0 luego u ∈ H01(Ω) y si f = 0 el teorema
anterior (unicidad) nos dice entonces que u = 0. Veamos que es suryectivo.
Sea φ0 ∈ H 1/2(Ω), luego existe w ∈ H 1(Ω) tal que su restricción a ∂ Ω, τw =
φ0 y sea f ∈ H −1(Ω). Como también ∆w ∈ H −1(Ω) el teorema anterior nos
garantiza que existe ū ∈ H01(Ω) tal que

∆ ū = f − ∆w en Ω. (12.12)

Pero entonces u = ū + w satisface ∆u = f en Ω y τu = φ0 en ∂ Ω.

Solo resta probar entonces que el producto escalar anterior es un realmente


un producto escalar y la norma así obtenida es equivalente a la de H01. Esto
sigue del siguiente resultado,

Lema 12.1 (de Poincaré-Hardy) Existe C > 0 tal que para todo u ∈ H01(Ω),
se cumple, Z Z
|u| d x ≤ C e ab ∇a ū∇ b u d n x.
2 n
(12.13)
Ω Ω

Esto nos dice que el producto escalar en H01(Ω) es equivalente al producto


escalar usado anteriormente.

Prueba: Como C0∞ (Ω) es denso en H01(Ω) es suficiente probar la desigualdad


para estas funciones. Sea Γd un n-cubo de lado d conteniendo a Ω. Extendien-
do las funciones en C0∞ (Ω) como cero en Γd − Ω obtenemos,
R x1
|u|2(x) = | −d /2 1
∂ u(ξ 1, x 2, ..., x n )d ξ 1|2
R x1
≤ (x 1 + d2 ) −d /2 |∂1 u|2 d ξ 1 (12.14)
R d /2
≤ d −d /2 |∂1 u|2 d ξ 1.

Por lo tanto,
Z d /2 Z d /2
2 1 2
|u(x)| d x ≤ d |∂1 u|2 d ξ 1, (12.15)
−d /2 −d /2
y
Z Z Z
|u|2(x)d n x ≤ d 2 |∂1 u|2 d n x ≤ C ∇a ū∇a u d n x, (12.16)
Γd Γd Γd

231
con C = d 2. Esto prueba el lema y concluye la prueba de existencia y unici-
dad ♠♠
Tanto el teorema de existencia y unicidad como el de regularidad (que
damos a continuación) pueden ser generalizados a ecuaciones elípticas con
coeficientes no constantes mientras éstos sean suaves, se cumpla que c ≤ 0
y que a ab la l b > k g ab la l b , donde k es una constante y g ab es una métrica
positiva definida tal que el volumen de Ω con respecto a esta métrica es fi-
nito. La prueba que dimos es válida solo si V o l g (Ω) < ∞, ya que en esta
usamos el lema de Poincaré-Hardy. Si Ω = lRn entonces la prueba es todavía
válida si sustituimos al espacio H01 por el espacio H11, es decir el espacio de las
funciones que decaen al infinito, con norma
Z
| f |2
2
|| f || 1 n = 2
+ e ab ∇a f¯∇ b f .
H1 (R )
Rn r

En este caso se puede probar que la solución del problema no solo será
suave sino también que decaerá asintóticamente como 1/r .

12.1.2. *Regularidad de las Soluciones


La solución que hemos encontrado lo es solo en el sentido débil. Si supo-
nemos ahora que f y φ0 tienen cierta regularidad podemos concluir además
que,
Teorema 12.2 (de Regularidad) Sea u ∈ H 1(Ω) una solución débil de la ecua-
ción ∆u = f en Ω con condición de contorno u|∂ Ω = φ0 y sea f ∈ H k (Ω),
3
φ0 ∈ H k+ 2 (∂ Ω), k ≥ −1 luego u ∈ H k+2(Ω). En particular si f ∈ C ∞ (Ω) y
φ0 ∈ C ∞ (∂ Ω), luego u ∈ C ∞ (Ω).
Antes de proceder con la prueba definiremos el operador diferencia finita
y veremos sus propiedades. Sea {x i } un sistema coordenado en un abierto de
Ω.

Definición:
u(x 1, ..., x i + h, ...x n ) − u(x 1, ..., x i , ..., x n )
∆ih u(x 1, ..., x i , ..., x n ) ≡ .
h
Lema 12.2 Si u ∈ H 1(Ω) y Ω′ ⊂⊂ Ω (contenido estrictamente, ∂ Ω ∩ Ω′ = ;)
luego,
k∆ih ukH 0(∂ Ω) ≤ k∂i ukH 0(Ω) . (12.17)

232
Prueba: Es suficiente considerar el caso u ∈ C 1(Ω). Si h < d i s t (∂ Ω, Ω′ ),
luego
Z h
1
∆ih u(x) = ∂i u(x 1, ..., x i + ξ , ..., x n )d ξ ∀x ∈ Ω′ , (12.18)
h 0

por lo tanto, usando la desigualdad de Schwarzt vemos que,


Z h
1
|∆ih u(x)|2 ≤ |∂i u(x 1, ..., x i + ξ , ..., x n )|2 d ξ . (12.19)
h 0

Integrando sobre Ω′ obtenemos,


Z Z hZ Z
1
|∆ih u(x)|2 d n x ≤ 2 n
|∂i u| d x d ξ ≤ |∂i u|2 d n x. (12.20)
Ω ′ h 0 Ω ′

Lema 12.3 Sea u ∈ H0(Ω) (y por lo tanto ∆ih u ∈ H0(Ω′ )) y supongamos existe
k < 0 tal que k∆ih ukH0(Ω′ ) ≤ k ∀ h > 0 y Ω′ ⊂⊂ Ω, con h < d i s t (∂ Ω, Ω′ ).
Luego la derivada débil ∂i u existe y satisface, k∂i ukH0(Ω) ≤ k.

Prueba: Por la compacidad débil de los conjuntos cerrados y acotados en


H0(Ω′ ) existirá una sucesión {h m } → 0 y vi ∈ H0(Ω) con kvi kH0(Ω′ ) ≤ k
h d
tal que ∆i m u →vi , es decir
Z Z
h n
φ∆i m u d x→ φvi d n x, ∀ φ ∈ C01(Ω). (12.21)
Ω Ω

Por otro lado, si h m < d i s t (s o p.φ, ∂ Ω), luego


Z Z Z
hm −h m
φ∆i u d x = − u(∆i φ)d x → − u∂i φd n x.
n n
(12.22)
Ω Ω Ω

Concluimos así que,


Z Z
n
φvi d x = − u∂i φd n x, (12.23)
Ω Ω

o sea que vi es la derivada débil (distribucional) de u en la dirección x i ♠

233
Prueba: (Teorema de Regularidad): Nos contentaremos con probar que u
es regular en cualquier Ω′ contenido estrictamente en Ω, la extensión de la
prueba a todo Ω no agrega ningún concepto nuevo. Probaremos el enunciado
para k = 0, el resto sigue por inducción en k. Como u es una solución débil
tenemos que
Z Z
a n
∇ ū∇a v d x = f¯v d n x, ∀v ∈ C01(Ω). (12.24)
Ω Ω

Reemplazando v por −∆−h


i
v con |2 h| < d i s t (s o p.v, ∂ Ω), tenemos,
Z Z
(∆ih ∇a ū)∇a v d n x =− f¯∆ih v d n x, ∀v ∈ C01(Ω) (12.25)
Ω Ω

y por lo tanto (Usando el lema (12.2)),


Z
k (∆ih ∇a ū)∇a v d n xk ≤ k f kH0 k∂i vkH0 . (12.26)

Tomando ahora v = ∆ih u obtenemos,


Z
k (∆ih ∇a ū)∆ih ∇a u d n xk ≤ k f kH0 k∂i ∆ih ukH0 , (12.27)

o sea,
k∆ih ∇a uk2H ≤ k f kH0 k∆ih ∇a ukH0 , (12.28)
0

lo que finalmente implica,

k∆ih ∇a ukH0 ≤ k f kH0 < k. (12.29)

El lema (12.3) nos dice entonces que ∂i u ∈ H 1(∂ Ω) y completa la primera


parte de la prueba.
Veamos ahora, para completar la prueba, que si f ∈ C ∞ (Ω) luego u ∈
C ∞ (Ω). Pero esto es obvio ya que si u ∈ H p (Ω), Ω ⊂ lRn , luego por el Lema
n
de Sobolev u ∈ C p− 2 −ǫ (Ω) ∀ ǫ > 0 y en particular si u ∈ H p (Ω) ∀ p
luego u ∈ C ∞ (Ω) ♠

12.2. Teorema Espectral

Sea una barra de un material de conductividad térmica q = 1 y longitud


L = 2π y supongamos que queremos describir la evolución de su distribución

234
de temperatura T (t , x). Para ello supondremos una distribución inicial T0(x)
y que los extremos de la barra están conectados con un reservorio infinito de
calor a cero grado. Debemos resolver entonces el problema matemático,

d d2
T = − 2T, t ≥ 0
dt dx
T (t0, x) = T0(x), (12.30)

T (t , 0) = T (t , 2π) = 0 t ≥ 0.

Para resolverlo usaremos un desarrollo en serie de Fourier, es decir planteare-


mos una solución de la forma,
X
∞ nx
T (t , x) = Cn (t )s e n( ), (12.31)
n=1 2

la cual satisface claramente las condiciones de contorno. Aplicándole la ecua-


ción y usando la ortogonalidad de las funciones obtenemos,

d n2
Cn (t ) = − Cn (t ), (12.32)
dt 4
la cual tiene como solución,
n2
t
Cn (t ) = Cn (0)e − 4 . (12.33)

Por lo tanto si damos como condición inicial T0 ∈ L2(0, 2π), ésta determinará
una sucesión {Cn0 = (T0, s e n( n2x ))L2 } en l 2 que usaremos como condición
inicial y así obtendremos T (t , x). Como

X
∞ X

n 2 X

2
|Cn (t )| = |Cn0|2 e − 2 t ≤ |Cn0|2 < ∞ (12.34)
n=1 n=1 n=1

la solución formal –ya que no sabemos si es diferenciable– estará en L2(0, 2π)


n2
para todo t ≥ 0. Para cualquier t > 0 y q ∈ N tenemos que n 2q e − 2 t tiende en
forma exponencial a cero cuando n tiende a infinito y por lo tanto T (t , x) ∈
H q (0, 2π) lo que implica T (t , x) ∈ C ∞ ((0, +∞) × [0, 2π]) 2.
Hemos resuelto así completamente este problema.
2
Se puede demostrar además que T (t , x) es analítica en ambas variables en (0, +∞) ×
[0, 2π])

235
¿Qué hemos usado para construir estas soluciones? Hemos usado que
cualquier función que se anula en los extremos puede ser expandida en tér-
mino de su serie de Fourier, es decir de las funciones s e n( n2x ) y además que
,
d2 nx n2 nx
s e n( ) = − s e n( ) (12.35)
d x2 2 4 2
En analogía con la teoría de operadores entre espacios vectoriales de dimen-
sión finita llamaremos a la ecuación de arriba la ecuación de autovectores-
2
autovalores del operador lineal d 2 . Dado un operador lineal L : D ⊂ L2 → L2
dx
el problema de encontrar sus autovalores y autovectores con condiciones de
contorno dadas se llama problema de Sturn-Liouville. Como veremos a conti-
nuación existe una gran cantidad de operadores para los cuales este problema
tiene solución. ¿Es una casualidad que el conjunto de autovalores del opera-
dor en el ejemplo sea una base de L2? 3 El siguiente teorema y su corolario
nos dicen que no lo es, si el operador en cuestión satisface ciertas condiciones.

Teorema 12.3 (Espectral para el Laplaciano) Sea Ω ⊂ lRn acotado. Luego el


Laplaciano tiene un conjunto numerable y discreto de autovalores, Σ = {λi },
cuyas autofunciones (autovectores) expanden H01(Ω).

Prueba: [Teorema Espectral] Considere la funcional J : H01(Ω) → lR+ dada


por, R
∇ ū∇a u d n x
Ω a
J (u) = R n
. (12.36)

ū u d x
Como J (u) es no negativa existirá λ0(Ω) ∈ lR+ tal que

λ0 = i n f J (u) . (12.37)
u∈H01 (Ω)

Ejercicio: Relacione este λ0 con la constante en el Lema de Poincaré-Hardy.

Como veremos a continuación este λ0 es el menor de los autovalores del


Laplaciano y su autofunción u0 es la que minimiza a J . En efecto supon-
gamos que existe u0 en H01(Ω) que minimiza a J , como J es una funcional
3
Para obtener convergencia puntual(y no simplemente en L2) en el caso de condiciones de
contorno no nula hay que agregar los autovectores (con cero autovalor) f0(x) = 1 y f1 (x) = x.

236
diferenciable debemos tener que

d
J (u0 + s v)| s=0 = 0 ∀ v ∈ H01(Ω). (12.38)
ds
Pero
Z
d 1
J (u0 + s v)| s=0 = R n
[ (∇a v̄∇a u0 + ∇a ū0∇a v)d n x
ds ū u d x Ω

Z
− λ0[ (v̄ u0 + ū0 v)d n x]] (12.39)

y por lo tanto (12.38) es equivalente a que u0 satisfaga la versión débil de la


ecuación de autovalores-autovectores. Veamos ahora que u0 existe. Como λ0
es el ínfimo de J existe una sucesión {u p } ∈ H01(Ω) tal que ku p kH 0(Ω) = 1 y
J (u p ) → λ0. Pero tal sucesión es acotada en H01(Ω) y por lo tanto por el le-
ma (10.10) existe una subsucesión { ũ p } que converge fuertemente en H 0(Ω)
R
a una función u0 con ku0kH 0(Ω) = 1. Como Q(u) ≡ Ω ∇a ū∇a u d n x es una
norma proveniente de un producto escalar se cumple la regla del paralelogra-
mo,
ũ p − ũq ũ p + ũq 1
Q( ) + Q( ) = (Q( ũ p ) + Q( ũq )), (12.40)
2 2 2
la que implica

ũ p − ũq 1 ũ p + ũq
Q( ) ≤ (Q( ũ p ) + Q( ũq )) − λ0k k2 0 → λ0 − λ0 = 0.
2 2 2 H (Ω) p,q→∞

(12.41)
ũ p + ũq
Donde hemos usado que como { ũq } → u0 en H 0(Ω), { 2
} también lo
ũ p + ũq
hace y por lo tanto {k 2 kH 0(Ω) } → 1. Pero como la norma Q(u) es equi-
valente a la de H01(Ω) vemos que { ũ p } es también de Cauchy en H01(Ω) y por
lo tanto que u0 ∈ H01(Ω). Usando el teorema de regularidad con f = λ0 u0
vemos que u0 ∈ C ∞ (Ω) ∩ H01(Ω) y por lo tanto que u0 es un autovalor en el
sentido clásico (∆u0 + λ0 u0 = 0). Probemos ahora la existencia de los otros
autovalores-autovectores. Sea H (1) = {u ∈ H01(Ω)|(u, u0)H 0(Ω) = 0}. Este es
un subespacio vectorial y es cerrado, por lo tanto es un espacio de Hilbert 4,
4
Note que H (1) 6= espacio perpendicular a u0 en la norma H01 (Ω).

237
por lo tanto existirá λ1, tal que

λ1 = in f J (u). (12.42)
u∈H (1)

Repitiendo el argumento anterior vemos que λ1, será un autovalor, es


decir que existirá una autofunción u1, con autovalor λ1.
Definiendo H (2) = {u ∈ H01(Ω)|(u, u0)H 0(Ω) = (u, u1)H 0(Ω) = 0}, etc. po-
demos continuar indefinidamente y obtener Σ y un conjunto ortonormal 5,
en H 0(Ω), de autovectores. Para completar la prueba veamos que este conjun-
to expande H01(Ω). Como ui satisface ∆ui + λi ui = 0 y (ui , u j )H 0(Ω) = 0 si
i 6= j tenemos que
Z
0 = (u j , ∆ui + λi ui )H 0(Ω) = − ∇a ū j ∇a ui d n x (12.43)

y por lo tanto también que

(u j , ui )H 1(Ω) = 0. (12.44)
0

Vemos entonces que este conjunto es ortogonal en H01(Ω) y que por cons-
trucción su subespacio perpendicular es 0 lo que implica que este conjunto
es una base de H01(Ω) ♠

Ejercicio: Encuentre los autovalores y autovectores de Laplaciano en H01(Ω)


cuando: a) Ω ⊂ lR2 es un cuadrado de lado L. b) Ω ⊂ lR3 es una esfera de
radio R. Construya en ambos casos usando estas autofunciones la función de
Green del problema en cuestión.
¿Para qué ecuaciones se puede generalizar el teorema anterior? Para la
prueba se usaron propiedades específicas del Laplaciano solo para afirmar que
J era acotada por debajo –para concluir que el ínfimo existía– y que Q(u)
era una norma proveniente de un producto escalar –para concluir que la ley
del paralelogramo valía–. Si

L(u) = a ab ∇a ∇ b u + b a ∇ b u + c u, (12.45)

con a ab la l b ≥ k g ab la l b , k > 0, para todo campo vectorial la en Ω (eliptici-


dad) y con a ab , b a y c campos suaves en Ω, luego existen constantes positivas
5
Luego de normalizarlos convenientemente.

238
c1 y c2 tales que
Z Z Z
(u, −L(u))H 0(Ω) = − ū L(u)d n x ≤ c1 g ab ∇a ū∇ b u d n x − c2 |u|2 d n x.
Ω Ω Ω
(12.46)

Ejercicio: Pruebe esto.

Por lo tanto en este caso también tenemos que


(u, −L(u))H 0(Ω)
J (u) ≡ , (12.47)
(u, u)H 0(Ω)

es acotada por debajo. La condición de que Q(u) ≡ (u, −L(u))H 0(Ω) satisfaga
la regla del paralelogramo. Aunque no sea positiva definida es mucho más
restrictiva, y es equivalente a pedir que L satisfaga

(v, L(u))H 0(Ω) = (L(v), u)H 0(Ω) ∀ u, v ∈ H01(Ω). (12.48)

Los operadores que satisfacen esta relación se denominan auto-adjuntos o


hermitianos.

Ejercicio: Muestre que

L(u) = ∇a (a ab ∇ b u + b a u) − b a ∇a u + c u, (12.49)

con a ab , b a y c campos tensoriales reales es auto-adjunto.

Ejercicio: Muestre que si L es autoadjunto luego los autovectores son reales.

Ejercicio: Encuentre los autovalores y autovectores en H01(Ω) de

d2
L(u) = 2
u + c x 2 u. (12.50)
dx
Llegamos así a la siguiente generalización:

Teorema 12.4 (Espectral) Sea Ω acotado y L un operador elíptico autoadjunto


con coeficientes a ab , b a y c en C ∞ (Ω) [Condición que se puede debilitar con-
siderablemente]. Luego el problema de autovalores L(ui ) = λi ui , ui ∈ H01(Ω),
tiene un conjunto numerable y discreto de autovalores reales, cuyas autofuncio-
nes ui ∈ C ∞ (Ω) expanden H01(Ω).

239
Ejercicio:
a) Pruebe el siguiente corolario:
Si L elíptico y autoadjunto es tal que sus autovalores son distintos de cero
luego el problema de Dirichlet

L(u) = f , (12.51)

f ∈ H 0(Ω), u ∈ H 1(Ω), tiene una única solución.


b) Si algún λi = 0 entonces el problema anterior tiene solución sii (ui , f )H 0(Ω) =
0 para toda autofunción con autovalor cero.

240
CAPÍTULO 13

ECUACIONES SIMÉTRICO–HIPERBÓLICAS

13.1. Introducción

En este capítulo estudiaremos sistemas de ecuaciones hiperbólicas bajo la


siguiente restricción:

Definición: Diremos que un sistema es simétrico–hiperbólico si:

a.) El espacio de llegada del mapa lineal M a ′ ka es de la misma dimensión


AB
que el espacio de partida para todo ka 6= 0. Por lo tanto de ahora en más
usaremos índices sin primar.
a
b.) El mapa MAB ka es simétrico para todo ka 6= 0.

c.) En un entorno de cada punto existe una función τ tal que si llamamos
a
a su diferencial por ta (= ∇a τ), el mapa HAB := MAB ta es positivo
A B A
definido. (Es decir HAB u u ≥ 0 (= 0 sii u = 0).)

Note que esta última condición implica que HAB es una métrica en el espacio
de las variables independientes. Esta y su inversa, que denotaremos por H AB
serán usadas para subir y bajar índices.
Esta tampoco en una restricción importante desde el punto de vista de
la física, ya que todos los sistemas físicos que conocemos son simétrico–
hiperbólicos.
También, pero solo por simplicidad en la exposición ya que así evitaremos
algunas complicaciones técnicas, solo consideraremos sistemas lineales.
Comenzaremos este capítulo con un ejemplo simple que ilustra las carac-
terísticas básicas de esta clase de ecuaciones.

241
13.2. Un ejemplo

Sea una cuerda infinita en el plano x, y y sea y = u(x, t ) la posición de la


cuerda al tiempo t en dicho plano. Ajustando las dimensiones (de longitud o
de tiempo) se puede ver que u(x, t ) satisface la ecuación,

∂ 2u ∂ 2u
− + = f (x, t ), (13.1)
∂ t2 ∂ x2
donde f (x, t ) es la densidad de fuerza que se ejerce sobre la cuerda y que
suponemos no depende de la posición de la cuerda con respecto a la coorde-
nada y.1 Tenemos así el problema matemático de encontrar las soluciones de
la ecuación,
ƒu = g ab ∇a ∇ b u = f , (13.2)
en M = lR2 con métrica pseudo-euclídea gab = −(d t )2 + (d x)2. Para tratar
esta ecuación es conveniente introducir un sistema coordenado apropiado a
esta métrica, es decir uno que tiene sus líneas características como ejes,

ξ = x + t = c t e.,
(13.3)
η = x − t = c t e.

η = c t e.

ζ = c t e.

Figura 13.1: Sistema coordenado nulo.

1
De otro modo deberíamos considerar f (x, t , u) lo que complica el problema.

242
tenemos entonces que
ξ +η
x = 2
ξ −η (13.4)
t = 2
y
1
gab = −(d t )2 + (d x)2 = 4
[{−(d ξ )2 − (d η)2 + d ξ
⊗ dη + dη ⊗ dξ }
2 2
+{(d ξ ) + (d η) + d ξ ⊗ d η + d η ⊗ d ξ }]
= 12 [d ξ ⊗ d η + d η ⊗ d ξ ]
(13.5)
ab
Notando que g = 2[∂ ξ ⊗∂ η+∂ η⊗∂ ξ ] y que los símbolos de Christoffel
se anulan debido a que la métrica tiene componentes constantes tenemos,2

∂ 2u
ƒu = 4 = f (η, ξ ). (13.6)
∂ η∂ ξ

Esta ecuación puede ser integrada inmediatamente, obteniéndose


Z
∂u ξ
(η, ξ ) = 4 f (η, ξ˜) d ξ˜ C (η)
∂η ξ
Z η0 Z ξ (13.7)
u(η, ξ ) = 4 f (η̃, ξ˜)d ξ˜ d η̃ + uI (ξ ) + uI I (η),
η0 ξ0

donde uI (ξ ) y uI I (η) son funciones arbitrarias. Consideremos primero el


caso f ≡ 0, es decir la ecuación homogénea. Sus soluciones son entonces
suma de una función cualquiera de ξ y otra cualquiera de η. Volviendo a las
coordenadas x, t obtenemos

u(x, t ) = uI (x + t ) + uI I (x − t ). (13.8)

Por ejemplo,
( 1

uI (x + t ) = e (x+t )2−1 x + t ∈ [−1, 1] (13.9)


0 x + t ∈ (−∞, −1] ∪ [1, +∞)

es una solución que representa una onda (≡ solución de la ecuación homo-


génea) moviéndose hacia la izquierda sin cambiar de forma y con velocidad
1.

2
Note además que g (∂η , ∂η ) = g (∂ ξ , ∂ ξ ) = 0, es decir estos vectores coordenados tienen
norma nula.

243
U

t =1

Figura 13.2: Propagación de ondas.

Similarmente uI I representa una onda moviéndose hacia la derecha. Ver


figura. Veamos ahora que el problema de Cauchy en este caso tiene solución.
Esto es extremadamente importante en física: nos dice que si tomamos una
superficie no característica (por ejemplo la t = 0) y damos allí como dato u y
su derivada temporal obtendremos una única solución para tiempos futuros.
Esto es lo que nos permite, si conocemos el presente, predecir el futuro, es
decir, si preparamos un experimento, predecir el resultado. Este hecho es el
que distingue a la física de las otras ciencias naturales. Supongamos entonces
que a t = 0 (ξ = η = x) damos u(x, 0) = u0(x) y su derivada ∂∂ ut (x, 0) = u1(x).
Tenemos entonces que

u0(x) = u(x, 0) = uI (x) + uI I (x), (13.10)

∂u
u1(x) = (x, 0) = uI′ (x) − uI′ I (x). (13.11)
∂t
Diferenciando (13.10) con respecto a x y resolviendo el sistema lineal así
obtenido tenemos,
u0′ (x) + u1(x)

uI (x) =
2 (13.12)
u0′ (x) − u1(x)
uI′ I = ,
2
e integrando,
Z x
u0(x) 1
uI (x) = + u1(x̃)d x̃ + CI ,
2 2 0
Z (13.13)
u0(x) 1 x
uI I (x) = − u1(x̃)d x̃ + CI I .
2 2 0

244
Para que (13.10) se satisfaga debemos tener CI = −CI I y por lo tanto
Z x+t
1 1
u(x, t ) = (u0(x + t ) + u0(x − t )) + u1(x̃)d x̃. (13.14)
2 2 x−t

Vemos entonces que si damos como dato u0(x) ∈ C 2(lR) y u1(x) ∈ C 1(lR)
obtenemos una solución u(x, t ) ∈ C 2(lR×lR). Por construcción esta solución
es única.

Ejercicio: Muestre explícitamente que (13.14) satisface (13.1) con f ≡ 0.


La ecuación (13.14) nos dice que a u(x, t ) contribuyen solo el promedio
de los valores de u0 en x − t y x + t y la integral de u1, entre estos dos valores.
[Ver figura 13.3.]

(x, t )

x−t x+t x

Figura 13.3: Solución general homogénea en 1+1 dimensiones.

¿Qué pasa si tenemos una fuente f (x, t )? Como ya tenemos la solución


general (para dato de Cauchy arbitrario) de la homogénea solo necesitamos la
solución de la inhomogenea con cero dato. Esto se logra integrando f (ξ , η)
primero con respecto a ξ˜ entre η̃ y ξ y luego η̃ entre ξ y η.
Zη Zξ !
v(η, ξ ) = 4 f (ξ˜, η̃)d ξ˜ d η̃. (13.15)
ξ η̃

245
t

(η, ζ )

η̃

ζ = η̃ η=ζ x

Figura 13.4: Solución general inhomogenea.

Ejercicio: Muestre que

Z Z !
t x+(t − t˜)
v(x, t ) = f (x̃, t˜)d x̃ d t˜, (13.16)
0 x−(t − t˜)

que
∂v
v(x, t )| t =0 = (x, t )| t =0 = 0, (13.17)
∂t
y que v(x, t ) satisface (13.1).

Vemos entonces que la solución buscada es,


Z Z Z !
1 1 x+t t x+(t − t˜)
u(x, t ) = (u0(x + t ) + u0(x − t )) + u1(x̃)d x̃ + f (x̃, t˜)d x̃ d t˜,
2 2 x−t 0 x−(t − t˜)
(13.18)
que por construcción es única y que u(x0, t0) depende de los valores iniciales
y de f en la región cónica con vértice (x0, t0) dada por,

t ≤ t0
(13.19)
|x − x0| ≤ t0 − t .

246
Esta región se llama dominio de dependencia del punto (x0, t0), solo lo que
acontece en esta región puede afectar el valor de u en dicho punto. Simi-
larmente se define el dominio de influencia de un punto (x0, t0) como el
conjunto de puntos en los cuales se puede cambiar el valor de u si se cambia
el valor de u, de su derivada o de f en (x0, t0). En este caso este viene dado
por: {(x, t )|t ≥ t0, |x − x0| ≤ t − t0}.
El comportamiento de las soluciones de las ecuaciones hiperbólicas es en
general el mismo que el de este simple ejemplo: Dados datos de Cauchy gené-
ricos habrá una única solución (tanto hacia el futuro como hacia el pasado).
En el caso de las ecuaciones lineales esta solución se puede extender indefini-
damente en ambas direcciones temporales, en el caso no-lineal las soluciones
tienen solo validez en un intervalo temporal finito y es un problema físico
interesante ver si las ecuaciones físicas no-lineales pueden o no ser extendi-
das indefinidamente y que significa físicamente la aparición de singularidades
en las soluciones. 3 Una cantidad de gran importancia física y matemática
relacionada con la ecuación de onda es la energía de las soluciones. En dos
dimensiones ésta está dada por,
Z
1 ∂u 2 ∂u 2
E(u, t0) = [( ) +( ) ]d x. (13.20)
2 t =t0 ∂ t ∂x
Observe que la energía es positiva y su tasa de variación está dada por,
Z
dE ∂ u ∂ 2u ∂ 2u ∂ u
(u, t0) = ( 2
+ )d x
dt t =t0 ∂ t ∂ t ∂ t∂ x ∂ x
Z
∂ u ∂ 2u ∂ 2u ∂ ∂u∂u
= [ ( 2− 2
) + ( )]d x (13.21)
∂ t ∂ t ∂ x ∂ x ∂ t ∂ x
Z t =t0
∂u
= [ f ]d x,
t =t0 ∂ t
∂u∂u
donde en la última igualdad hemos usado (13.1) y supuesto que lı́m =
∂t ∂x x→∞
0. Si f = 0 luego la energía se conserva y esto nos da una prueba alternativa
de la unicidad de las soluciones.
Teorema 13.1 (de Unicidad) A lo más existe una única solución u(x, t ) a la
ecuación de onda entre las funciones en u(x, t ) ∈ H 1(lR), ∂∂ ut (x, t ) ∈ H 0(lR)
(donde lR es la superficie t = c t e) para un dado dato de Cauchy.
3
Una singularidad es un punto donde u deja de ser lo suficientemente diferenciable como
para que la ecuación tenga sentido o peor aún donde u deja de tener sentido incluso como
distribución.

247
Prueba: Supongamos existen dos soluciones u1 y u2 con los mismos datos
de Cauchy en, digamos t = 0. Luego δ u = u1 − u2 satisface la ecuación
homogénea y tiene dato de Cauchy igual a cero. Por lo tanto E(δ u, t = 0) =
0, pero la energía de δ u es conservada y por lo tanto E(δ u, t − t0) = 0 ∀t0.
Esto implica que k ∂∂δtu (x, t )| t =t0 kH 0(R) = 0 y por lo tanto ∂∂δtu (x, t )| t =t0 = 0
en casi todo punto. Análogamente tenemos que k ∂∂δxu (x, t )| t =t0 kH 0(R) = 0 y
por lo tanto ∂∂δxu (x, t )| t =t0 = 0 o δ u = c t e. Pero las constantes no son de
cuadrado integrable en lR y por lo tanto δ u(x, t ) = u1(x, t ) − u2(x, t ) = 0
como elemento de H 1(lR) ♠

13.3. Desigualdad de la energía para sistemas simétrico–hiperbó-


licos

En esta sección consideraremos un sistema simétrico–hiperbólico lineal


general. Es decir un sistema de la forma:
a
MAB ∇a u B = IA, (13.22)
a a
con MAB y IA en general dependientes de la posición, con MAB simétrico en
los índices mayúsculos y tal que exista una función τ con gradiente ta tal que
HAB sea positiva definida y por lo tanto invertible.
Sea Σ t la familia de superficies dadas por las superficies de nivel τ = t
Sea Γ una región cualquiera de Σ0 y sea Ω una región tal que Ω ∩ Σ0 = Γ sea
además Γ(t ) = Ω ∩ Σ t
Sea u A una solución de 13.22 y sea,
Z
A a
E(u , t ) = na MAB uAuB , (13.23)
Γ(t )

es decir la integral de HAB u A u B sobre una región de la hipersuperficie τ =


t = c on s t ., donde hemos definido HAB usando na = ta /|ta |, es decir hemos
normalizado a ta .
Veamos la diferencia de esta cantidad entre dos superficies como muestra
la figura.

Para ello usaremos el teorema de la divergencia, que nos dice que,


Z
E(u A, t ) − E(u A, 0) + E(u A, s) = ∇a (MABa
u A u B ), (13.24)
Ω(0,t )

248
tn τ=t

S
Γt


na

Σ0

tn

Γ τ=0

Figura 13.5: Desigualdad de la energía

ΣT t =T

Σ0
t =0

Figura 13.6: Desigualdad de la energía, vista en perspectiva.

249
donde el signo negativo del segundo término de la izquierda es debido a que
en la definición de E(u A, 0) tomamos la normal entrante a la región Ω(0, t ).
El último término representa la integral de la energía sobre una superficie S
que supondremos dada por la ecuación σ = s donde σ es una función suave
y s ∈ lR. Este término representa la energía que escapa de la región a través
de la superficie S.
Usando la ecuación 13.22 en el miembro derecho obtenemos,
Z
E(u A, t ) − E(u A, 0) + E(u A, s) = [(∇a MABa
)u A u B + 2IA u A] (13.25)
Ω(0,t )
Z tZ
a
≤ {|(∇a MAB )u A u B | + 2|IA u A|}d t˜
0 Σ t˜
Z tZ
≤ {|C HAB u A u B |
0 Σ t˜
Æ Æ
+ 2 |IA IB H | |HAB u A u B |}d t˜
AB
Zt
≤ [(C + 1)E(u A, t˜) + D( t˜)]d t˜,
0

donde en el primer miembro de la segunda desigualdad hemos usado la de-


sigualdad de Schwartz (ver ejercicio) y hemos definido,
A
C 2 := sup{(∇a MAB )(∇ b MCb D )H AC H B D }. (13.26)

En la tercer desigualdad hemos usado que 2a b ≤ a 2 + b 2 y hemos definido,


Z
D(t ) := H AB IA IB . (13.27)
Σt

Ejercicio: Sea HAB simétrica y positiva definida, con inversa H AB . Probar:


a.) S AB S C D HAC HB D ≥ 0, (= 0 s i i S AB = 0).
Æ
b.) |SAB u u | ≤ H AC H B D SAB SC D HAB u A u B .
A B

Haremos ahora una suposición importante que luego discutiremos en de-


talle:

supondremos de ahora en más que E(u A, s) ≥ 0 ∀ u A.

250
Con esta suposición podemos ignorar dicho término en la desigualdad
anterior y obtener,
Z t
A A
E(u , t ) − E(u , 0) ≤ [(C + 1)E(u A, t˜) + D( t˜)]d t˜. (13.28)
0

Diferenciando esta desigualdad integral obtendremos una cota máxima


para la energía. En efecto, diferenciando esta expresión y notando que el signo
de la desigualdad se mantiene obtenemos la siguiente desigualdad diferencial,

d
E(u A, t ) ≤ (1 + C )E(u A, t ) + D(t ), (13.29)
dt

La igualdad diferencial tiene como solución (usando el método de variación


de constantes, sección 5,2),
Z t
˜
Y (t ) = e (1+C )t )
[Y (0) + e −(1+C ) t D( t˜)d t˜]. (13.30)
0

Usando ahora el lema 4,1 vemos que E(u A, t ) ≤ Y (t ) ∀ t ≥ 0 si E(u A, 0) =


Y (0), y por lo tanto tenemos que,
Z t
A A ˜
E(u , t ) = e (1+C )t )
[E(u , 0) + e −(1+C ) t D( t˜)d t˜]. (13.31)
0

Esta desigualdad es extremadamente importante, no solo permite inferir


la unicidad de las soluciones (como veremos a continuación) sino también
juega un papel fundamental para probar la existencia de soluciones y para
lograr algoritmos numéricos convergentes y fiables.

13.4. Unicidad de las soluciones

Usando la desigualdad obtenida anteriormente probaremos el siguiente


teorema:

Teorema 13.2 Sea una ecuación simétrico–hiperbólica en una variedad M , Sea


a
Σ0 una superficie dada por la ecuación τ = 0 con y tal que MAB ∇a τ sea positiva
definida. Sea Γ una región cualquiera de Σ0 y sea Ω una región tal que Ω∩Σ0 = Γ
y tal que E(u A, s ) ≥ 0 ∀u A. [Ver figura anterior.] Luego si u C y ũ C son dos
soluciones que coinciden en Γ luego éstas coinciden en todo Ω.

251
Prueba: Sea δ A := u A − ũ A. Luego δ A satisface,
a
MAB ∇a δ A = 0. (13.32)

Por lo tanto tenemos una desigualdad de la energía para δ C con D(t ) ≡ 0


y además con E(δ C , 0) = 0 ya que las dos soluciones coinciden en Γ. Pero
entonces la desigualdad nos dice que E(δ C , t ) = 0 para todo t y por lo tanto
δ C = 0 en todo Ω probando así el teorema ♠

13.5. Dominio de dependencia

El teorema de unicidad anterior se basó en la suposición de que


Z
C a
E(u , s) = na MAB uAuB ≥ 0 (13.33)
S

y por lo tanto es importante determinar cuáles son las posibles regiones don-
de esto pasa. En particular, dada una región Γ, la mayor región Ω donde te-
nemos unicidad de las soluciones con idénticos datos iniciales en Γ se llama
el dominio de dependencia de Γ, es la región que depende completamente
de los datos iniciales dados en Γ, o sea dando datos iniciales en Γ podemos
controlar completamente el valor de la solución en cualquier punto de su
dominio de dependencia.
Veamos primero que este dominio de dependencia no es vacío. Para ello
a
tomemos Γ compacto en Σ0 y consideremos HAB = ta MAB . Sea ahora σ =
τ − δξ con ξ una función suave en un entorno de Γ positiva en dentro de
este conjunto y negativa en Σ0 − Γ (o sea que se anula en su frontera) y δ un
número real que supondremos pequeño. [Ver figura 13.7.]

τ = c t e.

σ = c t e.

Figura 13.7: Región en forma de ampolla

En cada punto p ∈ Γ HAB es una métrica positiva definida y por lo tanto,


como el conjunto de métricas positivas definidas es abierto en el espacio de
todos los tensores simétricos, dado otro covector wa cualquiera existirá ǫ > 0

252
suficientemente pequeño tal que
a
(ta + ǫwa )MAB = HAB + ǫwa M a AB es también positiva definida. Como Γ
es compacta dado un wa en ella habrá un ǫ mínimo y positivo tal que el
tensor definido arriba será positivo4 Por el mismo argumento de continuidad
habrá una región compacta alrededor de Γ y un ǫ > 0, un poco menor que el
a
anterior tal que allí ∇a σ MAB será positiva definida. Hemos logrado así tener
una región Ω entre las superficies de nivel τ = 0 y σ = 0, es decir, una pequeña
ampolla donde la integral de la energía saliente por S = { p ∈ M |σ( p) = 0} es
positiva para toda solución u A.
¿Cuán grande podemos hacer esta ampolla, es decir cuánto más podemos
inclinar la superficie S y todavía mantener positividad? Esta pregunta tiene
mucho que ver con la siguiente: ¿cuánto podemos inclinar a ta en cada punto
a
y todavía tener positividad de ta MAB en dicho punto?
a a
Obsérvese primero que si ta MAB es positivo luego αta MAB , α > 0 también
lo es, con lo que el conjunto de los ta para los cuales tenemos positividad
forman un cono. Esto también nos asegura de que no todos los co-vectores
están en este cono, ya que si ta lo está, (−ta ) no lo está.
Segundo obsérvese que si ta y t˜a están en el cono, [es decir cada uno de
ellos da una métrica positiva definida] también lo están todos los co-vectores
de la forma, αta + (1− α) t˜a , α ∈ [0, 1] ya que (αta MAB
a
+ (1− α) t˜a MAB
a
)u A u B
es positivo si los coeficientes de α y (1− α) lo son. Es decir el conjunto de los
co-vectores que dan métricas positivas definidas forman un cono convexo de
T p∗ , en cada punto p ∈ M . Este cono se denomina cono característico. [Ver
figura 13.8.]

¿Qué pasa con los co-vectores en la frontera de dicho cono? Allí la con-
dición de positividad definida debe fallar, es decir dado un co-vector ta en
dicha frontera habrá algún u A tal que ta MAB
a
u A u B = 0. Esto implica que allí
a
el rango de ta MAB deja de ser máximo.

13.5.1. Construcción de una superficie característica


Ahora construiremos la superficie frontera del máximo dominio de de-
pendencia. A partir de una región Γ dada por {q ∈ Σ0 | σ0( p) = 0} construi-
remos una superficie S tal que su normal en cada uno de sus puntos perte-
nezca a la frontera del cono característico. Esta superficie vendrá dada por
4
Para ver esto considere el mapa entre (B1 × Γ) × (B1 × Γ) × Γ → lR dado por,
a
wa ( p)MAB ( p)u A( p)u B ( p) donde B1 ( p) = {u A( p)|HAB ( p)u A u B = 1}. Este es un mapa con-
tinuo y su dominio es compacto por lo tanto tiene un máximo, m < ∞. Podremos tomar
entonces 0 < ǫ < 1/m.

253
tn

Figura 13.8: Cono característico

una función σ = 0 tal que σ|Σ0 = σ0. Para encontrar la ecuación que esta
función deberá satisfacer es conveniente introducir un sistema apropiado de
coordenadas, el mismo que usamos en nuestra clasificación de las ecuaciones
en derivadas parciales. Una de estas coordenadas será t = τ y llamaremos a
∂σ ∂σ
las otras x i , también por conveniencia definiremos σ t = ∂ t y σi = i . Con
∂x
estas coordenadas obtenemos que,
X
a t i
∇a σ MAB = σ t MAB + σi MAB
i
X
i
= σ t HAB + σi MAB . (13.34)
i

Multiplicando por la inversa de HAB , H AB , obtenemos


X
H C A∇a σ MABa
= σt δ C B + σi H C A MAB
i
, (13.35)
i

el cual es un operador, es decir un mapa lineal de un espacio vectorial en sí


mismo, y por lo tanto le podemos tomar su determinante, obteniendo,
!
X
d e t σt δ C B + σi H C A MAB
i
= 0, (13.36)
i

ya que el determinante de H C A∇a σ MABa


se anula pues hemos supuesto que
a
el rango de ∇a σ MAB dejaba de ser máximo. Para cada valor fijo de las deriva-
das espaciales σi esta ecuación tendrá
P en general n soluciones (raíces) reales,
CA i
σ t , (los autovalores del operador i σi H MAB ), de todas ellas tomaremos

254
aquella que nos dé la frontera del menor cono conteniendo a ta , es decir la
mayor raíz. Tendremos así para esta raíz una ecuación de la forma:
σ t + H (σi , x i , t ) = 0. (13.37)
La función H tiene una propiedad muy importante, note que si (σ t , σi ) es una
solución también lo es (ασ t , ασi ) y por lo tanto H debe ser homogénea de
primer grado, es decir H (ασi , x i , t ) = αH (σi , x i , t ). Estas ecuaciones, con
H homogénea de primer grado se llaman ecuaciones eikonales y son casos
particulares de la ecuación de Hamilton–Jacobi que se estudia en mecánica.
Este tipo de ecuaciones, que en principio son ecuaciones en derivadas par-
ciales pueden ser resueltos transformándolos a un problema equivalente en
derivadas ordinarias proveniente de un Hamiltoniano. En efecto, considere
el sistema de ecuaciones ordinarias Hamiltonianas:
d xi ∂H
=
dt ∂ pi
d pi ∂H
= − i, (13.38)
dt ∂x
donde H ( pi , x i , t ) := H (σi , x i , t )|σi = pi . Integrando este sistema con condi-
ciones iniciales:
x i (0) = x0i
pi (0) = σ0i , (13.39)
y luego restringiendo las curvas integrales obtenidas en el espacio de fase
(x i , p j ) al espacio de configuración x i , obtenemos una serie de curvas en
nuestra variedad emanando de la superficie Γ. Llamaremos a estas curvas,
curvas características ya que tienen la importante propiedad de que a lo
largo de ellas la función σ que andamos buscando es constante! Para pro-
bar esto primero veamos que con las condiciones iniciales elegidas pi (t ) =
σi (x i (t ), t ) ∀ t . Pero tomando la derivada con respecto a x i de la ecuación
13.37 obtenemos:
∂ σi ∂ 2σ
=
∂t ∂ t∂ xi
∂ 2σ
=
∂ xi∂ t
X∂H ∂ σi ∂ H
= − (σk , x k , t ) j
− i
(σk , x k , t ), (13.40)
j ∂ σj ∂x ∂x

255
y por lo tanto

d ( pi − σi ) ∂H X ∂ σi d x j ∂ σi
k
= − i
( pk , x , t ) − −
dt ∂x j ∂ xj dt ∂t
∂H X ∂ σi ∂ H
k
= − i
( p k , x , t) − ( pk , x k , t )
∂x j ∂ x j ∂ pj
X∂H ∂ σi ∂H
+ (σk , x k , t ) j
+ i
(σk , x k , t )
j ∂ σj ∂x ∂x
∂H ∂H
= − i
( pk , x k , t ) + i
(σk , x k , t )
∂x ∂x !
X ∂ σi ∂H ∂H
− ( pk , x k , t ) − (σk , x k , t ) ,(13.41)
j ∂ xj ∂ pj ∂ σj

donde en la segunda igualdad hemos usado las ecuaciones 13.38 y 13.40. Esta
última ecuación, con las condiciones iniciales elegidas tiene solución trivial,
pero el teorema de unicidad de las soluciones de ecuaciones ordinarias nos ga-
rantiza que esta es la única y por lo tanto la igualdad buscada. Por lo tanto de
ahora en más no deberemos distinguir en el argumento de H si está evaluada
en σi o en pi .
Pero entonces note que la derivada a lo largo de una curva característica
de σ es,

dσ X d xi
= σi + σt
dt i dt
X∂H
= σi − H (σk , x k , t )
i ∂ σi
= 0, (13.42)

donde en la última igualdad hemos usado que por ser H homogénea de pri-
P
mer grado en σi se cumple la igualdad H (σk , x k , t ) = i ∂∂ σH σi .
i
Hemos demostrado entonces que σ será constante a lo largo de las líneas
integrales de la ecuación 13.38 con condiciones iniciales dadas por 13.39. Por
lo tanto conocemos S, esta será la superficie reglada por las curvas caracterís-
ticas emanando de ∂ Γ5. [Ver figura 13.9.]

5
En general las curvas características se cruzan entre sí y por lo tanto aún dando una región

256
σ0 = 0

Γ Σ0

σ0 > 0

σ0 < 0

Figura 13.9: Construcción de S y una singularidad en S

13.5.2. Dominio de dependencia, ejemplos

A continuación damos un par de ejemplos de la construcción de curvas


características y determinación de los dominios de dependencia.

Ejemplo: Fluidos en una dimensión


Consideremos un fluido con densidad promedio ρ0, moviéndose con ve-
locidad promedio v0 y con una ecuación de estado para la presión en función
de la densidad p = p(ρ). Estamos interesados en pequeñas fluctuaciones de
estas cantidades alrededor del estado de equilibrio (ρ0, v0), es decir en la teo-
ría del sonido en este fluido. En este caso u A = (ρ, v) será dichas fluctuaciones
y las ecuaciones del fluido son

∂ρ ∂ρ ∂v
− v0 − ρ0 = 0
∂t ∂x ∂x
∂v ∂v 1 ∂p
− v0 − = 0. (13.43)
∂t ∂x ρ0 ∂ x

dp
Si c 2 := |
d ρ ρ0
> 0, (c es la velocidad del sonido en el medio) entonces el siste-
a
ma es simétrico–hiperbólico con MAB obtenido reescribiendo las ecuaciones

Γ con frontera suave luego de un cierto tiempo la superficie reglada desarrollará singularidades
y σ será multivaluada. Sin embargo estas singularidades se conocen perfectamente bien y se
sabe cómo descartar regiones hasta obtener dominios de dependencia con frontera continuas.

257
como:
     
c2 0 ρ −c 2 v0 −c 2ρ0 ρ
+ = 0, (13.44)
0 ρ20 v t
−c 2ρ0 −ρ20 v0 v x
∂p ∂ p ∂ρ
donde hemos usado que ∂x
= ∂ρ ∂x
.
El determinante que debemos estudiar es entonces:
 
σ t c 2 − σ x c 2 v0 −σ x c 2ρ0
 
det  , (13.45)
2 2
−σ x c ρ0 σ t ρ0 − σ x ρv

que tiene como raíces,


σ t = (v0 ± c)σ x . (13.46)
Supongamos c > v0 (fluido normal, subsónico), y que Γ = [0, 1] con σ0 =
x(x − 1). En x = 0 σ0x es negativa y entonces la mayor raíz es v0 − c y la
solución es σ− = t (c − v0) − x. En x = 1 σ0x es positiva y entonces la mayor
raíz es v0 + c y la solución es σ− = t (v0 + c) − (x − 1). [Ver figura.]

σ+ σ−

0 1 x

Figura 13.10: Dominio de dependencia de un fluido

Ejemplo: Ecuación de onda en 2 + 1 dimensiones.


La ecuación es:
∂ 2φ ∂ 2φ ∂ 2φ
− + + = ρ, (13.47)
∂ t∂ t ∂ x∂ x ∂ y∂ y

258
∂φ ∂φ ∂φ
y usando u A = (φ, , , )
∂t ∂x ∂y
el sistema se puede escribir como,
  1    1    1   
1 0 0 0 u 0 0 0 0 u 0 0 0 0 u −u 2
  2    2      
0 1 0 0  u   0 0 1 0  u   0 0 0 1   u2   −ρ 
   −   −  3  =  
0 0 1 0   u3   0 1 0 0   u3   0 0 0 0  u   0 
0 0 0 1 u4 t 0 0 0 0 u4 x 0 1 0 0 u4 y 0

∂ u1 ∂ u1
Ejercicio: Pruebe que si los datos iniciales son tales que u 2 = ∂x
y u3 = ∂y
,
luego u 1 satisface 13.47.

Las ecuaciones para σ son:


 
σt 0 0 0
 
 0 σ t σ x σy 
det  0 σ σ
 = (σ )2[(σ )2 − (σ )2 − (σ )2], (13.48)
 x t 0 
t t x y

0 σy 0 σ t

o sea q
σt = (σ x )2 + (σy )2 := −H (σ x , σy ). (13.49)

Las ecuaciones de Hamilton para este sistema son:

dx ∂H −σ x
= =q
dt ∂ σx (σ x )2 + (σy )2

dy ∂H −σy
= =q
dt ∂ σy (σ x )2 + (σy )2

d σx ∂H
= − =0
dt ∂x
d σy ∂H
= − = 0, (13.50)
dt ∂y

y sus soluciones son:


−σ0x
x(t ) = q t + x0
2 2
(σ0x ) + (σ0y )

259
−σ0y
y(t ) = q t + y0 . (13.51)
2 2
(σ0 x) + (σ0y )

260
CAPÍTULO 14

ECUACIONES PARABÓLICAS

14.1. Introducción

Aquí trataremos el arquetipo de ecuación parabólica, la ecuación del ca-


lor,
∂u
∂t
− ∆u = f en Ω,
u| t =0 = u 0, (14.1)
u|L = 0,

donde Ω es una región cilíndrica de la forma [0, T ] × S y L = [0, T ] × ∂ S.


Ver figura.

t =T

L

t =0

Figura 14.1: Condiciones de contorno para la ecuación del calor.

También se puede tratar el problema en que n a ∇a u|L = 0, o problemas


mixtos, aquí solo trataremos el primero, ya que el tratamiento de los otros
no reviste mayores cambios. Las condiciones de contorno no homogéneas se
tratan de forma similar al caso de ecuaciones elípticas.

261
Usando el Teorema Espectral, 12.2, descomponemos u, f y u 0 en auto-
funciones del Laplaciano en S en H01(S) y obtenemos,

X

j
u(t , x ) = un (t )vn (x j ),
n=0
X∞
f (t , x j ) = fn (t )vn (x j ),
n=0
X

u 0(x j ) = un0 vn (x j ),
n=0

donde las funciones vn (x j ) satisfacen,

∆vn (x j ) = λn vn (x j )
vn (x j )|L = 0.

Obtenemos así el siguiente sistema infinito de ecuaciones ordinarias,

u̇n + λn un = fn
(14.2)
un | t =0 = un0 .

La solución de la ecuación homogénea es unH = un0 e −λn t y usando el método


de variación de constantes obtenemos,
Zt
˜
unI = e −λn t fn ( t˜)e λn t d t˜. (14.3)
0

La solución completa (respetando la condición inicial) es


Zt
˜
un (t ) = e −λn t [un0 + fn ( t˜)e λn t d t˜]. (14.4)
0

De manera análoga a como probamos que la solución formal para el caso


hiperbólico era una solución suave se puede demostrar aquí que para t > 0 la
solución es, en las variables espaciales dos veces más diferenciable que f y en
la temporal una vez más.
Una propiedad muy importante de esta ecuación es que en general solo
admite una solución para t > 0, esto implica que a diferencia con las ecua-
ciones de la mecánica o el electromagnetismo esta ecuación privilegia una
dirección temporal particular. Entre otras cosas esto nos indica que esta ecua-
ción representa o describe fenómenos que no pueden ser derivados solamente

262
de la mecánica y que en ellos debe haber alguna clase de información de tipo
termodinámico.
Para ver esto retomemos el ejemplo dado en la introducción al Teorema
Espectral, 12.2
d 2u
u̇ − = 0 en [0, 1], (14.5)
d x2
donde vimos que las autofunciones vn (x) con vn (0) = vn (1) = 0 son vn (x) =
sin(πn x) con autovalor λn = π2 n 2.
0
P∞ (−1) n−1 2
Tomando como dato inicial u (x) = n=1 2 s e n(πn x), la cual es
P∞ 1 n
acotada en [0, 1] ya que n=1 2 < ∞, obtenemos,
n
n−1 2n2 t
X
∞ (−1) 2 e −π
u(t , x) = 2
s e n(πn x).
n=1 n
P∞ 2
e −π (2n−1)
2t
Pero u(t , 1/2) = n=1 (2n−1)2
la cual es finita ∀ t ≥ 0 e infinita para
cualquier t < 0 ya que el enésimo
P∞ término tiende a infinito con n. Por otro
0 0
lado dada cualquier u (x) = n=0 un s e n(πn x), continua obtenemos
X

2n2 t
u(t , x) = un0 e −π s e n(πn x) (14.6)
n=0

la cual es infinitamente diferenciable para todo t > 0 ya que dado cualquier


2 2
polinomio P (n) de n, P (n)e −π n t → 0 cuando n → ∞ si t > 0.

14.2. Unicidad y el Teorema del Máximo

Vemos ahora que la solución obtenida en el caso general es única. Para


ello supondremos que esta es C 1 con respecto al tiempo y C 2 con respecto a
las coordenadas espaciales. Para llegar a esta conclusión usaremos el principio
del máximo. Desarrollamos este primero para el problema de Dirichlet.

Teorema 14.1 (del Máximo) Sea u ∈ C 2(S) y ∆u ≥ 0 en S, luego

máx u = máx u
S̄ ∂S

Prueba: Si ∆u > 0 esto sigue simplemente del hecho de que si el máximo


2
estuviese en p ∈ S luego ∂ ku 2 | p ≤ 0 ∀ k = 1, ..., n y por lo tanto ∆u ≤ 0
∂ (x )

263
lo que es una contradicción. Para el caso ∆u ≥ 0 usamos v = |x|2. Como
∆v > 0 en S luego
∆(u + ǫv) > 0 en S ∀ǫ > 0 (14.7)

y así
máx(u + ǫv) = máx(u + ǫv)
S̄ ∂S

y por lo tanto
máx u + ǫ mı́n v ≤ máx u + ǫ máx v
S̄ S̄ ∂S ∂S

y tomando ǫ → 0 obtenemos la igualdad buscada. En el caso en que ∆u = 0


luego también se cumple que

mı́n u = mı́n u
S̄ ∂S

(Simplemente usando que mı́n(u) = − máx(−u)).


Este resultado nos da otra prueba de la unicidad de las soluciones al pro-
blema de Dirichlet para el Laplaciano.

Teorema 14.2 (Unicidad del Problema de Dirichlet) El problema

∆u = f en S
(14.8)
u|∂ S = u0 ,

tiene a lo sumo una única solución en C 2(S).

Prueba: Sean u y ũ en C 2(S) soluciones, luego δ = u − ũ satisface ∆δ = 0 y


δ|∂ S = 0 pero entonces
máx δ = máx δ = 0
C̄ ∂S

y
mı́n δ = mı́n δ = 0
S̄ ∂S

por lo tanto concluimos que δ = 0.

Ejercicio: ¿Para qué otras ecuaciones elípticas vale esta prueba de unicidad?

¿Podemos obtener un resultado similar para la ecuación del calor?

264
Teorema 14.3 (Unicidad para la ecuación del Calor) Existe a lo más una úni-
ca solución u ∈ C 1[0, T ] × C 2(S) del problema,

u̇ − ∆u = f en S
u| t =0 = u 0, (14.9)
u|L = u 1,
u 0 y u 1 continuas.

La prueba de este teorema es una aplicación trivial del siguiente lema.

Lema 14.1 Sea u ∈ C 1[0, T ]×C 2(S) continua en Ω̄ y satisfaciendo u t −∆u ≤


0. Luego

máx u = máx u
Ω̄ ∂ ′Ω

donde ∂ ′ Ω = S0 ∪ L.

t =T

∂˜ Ωǫ = ST −ǫ

S0 ∩ L

S0

t =0

Figura 14.2: Prueba del Lema 14.1

Prueba: Veamos primero el caso u t − ∆u < 0 en Ω. Sea 0 < ǫ < T y


Ωǫ = {∪ t˜∈(0,T −ǫ) S t˜}. Como u es continua en Ω̄ǫ existirá p ∈ Ω̄ǫ tal que
u( p) = máxΩ̄ u. Si p ∈ Ωǫ luego allí u t = 0 y ∆u ≤ 0 lo que nos da una con-
ǫ
tradicción. Si p ∈ ∂˜ Ωǫ = ST −ǫ tendríamos u t ≥ 0 y ∆u ≤ 0, lo que también
nos da una contradicción. Sigue entonces que p ∈ ∂ ′ Ωǫ y

máx u = máx u ≤ máx u


Ω̄ǫ ∂ ′ Ωǫ ∂ ′Ω

265
tendiendo ǫ → 0 obtenemos el resultado buscado.
Para tratar el caso u t − ∆u ≤ 0 en Ω, consideramos v = u − k t , k > 0.
Luego v t − ∆v = u t − ∆u − k < 0 y por lo tanto

máx u = máx(v +k t ) ≤ máx(v +kT ) ≤ máx v + kT ≤ máx u +kT , (14.10)


Ω̄ Ω̄ Ω̄ ∂ ′Ω ∂ ′Ω

donde en la última desigualdad hemos usado que máx v ≤ máx u si k ≥ 0,


t ≥ 0. Tomando el límite, k → 0 obtenemos el resultado buscado.

∂u
Ejercicio: Probar que si ∂t
− ∆u ≥ 0 luego mı́nΩ̄ u = mı́n∂ ′ Ω u.

266
CAPÍTULO 15

GRUPOS

15.1. Introducción

Los grupos juegan un papel fundamental en la física contemporánea. Es-


to se debe a que en la naturaleza se observan simetrías, o su correlato, vía
el teorema de Noether, cantidades conservadas, es decir que no varían du-
rante las interacciones de los diversos campos durante las escalas temporal
propias a estas. Estas simetrías son invariancias ante transformaciones, tales,
por ejemplo, como las traslaciones espaciales o temporales, las rotaciones, o
transformaciones entre distintos campos, tales por ejemplo las que dan cuenta
de la conservación de la carga eléctrica, el número bariónico, etc. Todas es-
tas transformaciones, conforman grupos, y la determinación de la estructura
de los mismos es un ingrediente fundamental en la construcción de modelos
aproximando la realidad.
Comenzamos con la definición abstracta de grupo:

Definición: Un grupo es un conjunto G y una asignación, Ψ : G×G → G, lla-


mada multiplicación, y usualmente denotada de la misma manera, Ψ( g , g ′ ) :=
g g ′ , satisfaciendo las siguientes condiciones:

Asociatividad: g ( g ′ g ′′ ) = ( g g ′ ) g ′′

Existe un elemento en G, usualmente denotado por e, tal que

ge = e g = e ∀ ∈ G

For each element g ∈ G there exists another element in G, called its


inverse, g −1, such that,

g g −1 = g −1 g = e

267
Ejemplo: Sea el conjunto Z de números reales, incluidos los negativos y el
cero. Sea el producto dado por la suma, Ψ(n, m) = n + m. Esta operación
es claramente asociativa, Ψ(n, Ψ(m, l )) = Ψ(n, m + l ) = n + m + l = Ψ(n +
m, l ) = Ψ(Ψ(n, m), l ). En este caso la identidad es el número cero, Ψ(0, n) =
Ψ(n, 0) = n y la inversa del elemento n es el número −n.

Ejemplo: Sea el conjunto R − {0} y la multiplicación la usual. Vea que este


conjunto con dicha operación es un grupo.

Ejemplo: Veamos ahora el ejemplo más importante de grupo, como veremos


más adelante todos los grupos se pueden obtener por esta construcción. Sea
S un conjunto cualquiera, sea P (S) el conjunto de los mapas injectivos y sur-
jectivos de S en S, Ψ : S → S. Sea el producto la composición de mapas.
Notemos que la composición de mapas es claramente asociativa,

Ψo(Φoχ )(s) = ΨoΦ(χ (s )) = Ψ(Φ(χ (s))) = (ΨoΦ)(χ (s)) = (ΨoΦ)oχ (s).

Por otro lado la composición de mapas invertibles da un mapa invertible y


por lo tanto la multiplicación es cerrada en P (S). Como los mapas conside-
rados son invertibles sus inversas como mapas son sus inversas como grupos
y la identidad como mapa es la identidad en el grupo.

Ejemplo: Sea S = {1, 2} un conjunto de dos elementos. P (S) consta de solo


dos elementos, la identidad, e(1, 2) = (1, 2) y la conmutación g (1, 2) := (2, 1).
Notemos que g es su propia inversa, g o g (12) = g (2, 1) = (1, 2).
Abstractamente podemos definir este grupo por su tabla de multiplica-
ción,

Cuadro 15.1: Tabla de multiplicación de P (1, 2)

e g
g e

Ejemplo: Veamos el caso siguiente, sea S = {1, 2, 3}. En este caso tenemos los
siguientes mapas: e(1, 2, 3) = (1, 2, 3), f1(1, 2, 3) = (1, 3, 2), f2(1, 2, 3) = (3, 2, 1),
f3(1, 2, 3) = (2, 1, 3), g (1, 2, 3) = (3, 1, 2), g ′ (1, 2, 3) = (2, 3, 1). Su tabla de mul-
tiplicación es la siguiente:

268
Cuadro 15.2: Tabla de multiplicación de P (1, 2, 3)

e g g′ f1 f2 f3
g g′ e f3 f1 f2
g′ e′ g f2 f3 f1
f1 f2 f3 e g g′
f2 f3 f1 g′ e g
f3 f1 f2 g g′ e

Ejemplo: Considere el grupo de todos los mapas lineales de lR2 7→ lR2 que
preservan un triángulo equilátero.

Ejercicio: Considere el espacio todos los mapas lineales de lR2 7→ lR2 que
preservan un cuadrado. Compare su tabla con la de P (1, 2, 3, 4).

15.2. Isomorfismos

Como hemos visto, el grupo de transformaciones lineales en lR2 que pre-


servan un triángulo equilátero y el grupo P (1, 2, 3) tienen la misma tabla de
multiplicación. Por para todo fin práctico, de forma abstracta estos dos gru-
pos son idénticos, el estudio de uno nos da toda la información sobre el otro.
Esto no se una excepción, en física los mismos grupos aparecen como trans-
formaciones en situaciones y espacios muy diversos y no es tan fácil estable-
cer la relación entre los mismos. Formalmente la relación entre ellos se puede
definir de la siguiente manera:

Definición: Dos grupos, G y H son isomórfos si existe un mapa invertible


entre ambos, Ψ : G 7→ H tal que,

Ψ( g )Ψ( g ′ ) = Ψ( g g ′ ).

Note que en el lado izquierdo el producto es el producto de H , mientras que


en el derecho el producto es el de G. Es decir el mapa Ψ preserva el producto
entre los espacios. Si dos grupos son isomórficos entonces son idénticos en
cuanto a sus propiedades intrínsecas.

Ejercicio: Encuentre el mapa que hace P (1, 2) y grupo de todos los mapas
lineales de lR2 7→ lR2 que preservan un triángulo equilátero.

269
15.3. Subgrupos

Definición: H es un subgrupo de G si es un grupo en sí mismo, con la ope-


ración de multiplicación heredada de G. Es decir, si dado dos elementos,
h, h ′ ∈ H , h h ′ ∈ H , o sea que es cerrado bajo el producto, y si h ∈ H ,
luego h −1 ∈ H . Note que ambas condiciones ya nos aseguran que e ∈ H .

Ejemplo: En P (1, 2, 3) los elementos e, g , g ′ forman un subgrupo de H .

Ejercicio: Encuentre un subgrupo no trivial (el elemento identidad es siempre


un subgrupo) del grupo dado por el conjunto lR − {0} con la multiplicación
usual.

Ejemplo: Si H1 y H2 son subgrupos, luego su intersección, H1 ∩ H2, también


lo es. Dado un subconjunto S de G, la intersección de todos los grupos que
lo contienen es un subgrupo. Se lo denomina el subgrupo generado por S.

Ejercicio: Demuestre las afirmaciones del ejemplo anterior.

Ejercicio: Considere un conjunto S y el grupo de permutaciones sobre el mis-


mo, P (S). Sea S ′ un subconjunto de S y considere todos los mapas que cuando
restringidos a S ′ son la identidad. Vea que este conjunto es un subgrupo.

Ejercicio: Sea A subconjunto de G. Vea que A es un subgrupo sii ∀ a, a ′ ∈ A,


a −1a ′ ∈ A.

Ejercicio: Sea P (S), con S finito. Sea

A := {µ ∈ P (S)| ∃ s, s ′ s ′′ distintos, tales que µ(s ) = s ′ , µ(s ′ ) = s ′′ µ(s ′′ ) = s.}

Muestre que el subgrupo generado por A no es todo P (S).

15.4. La construcción universal

Vimos varios ejemplos de grupos que aparecen como grupos de trans-


formaciones, es decir como mapas invertibles de un conjunto en sí mismo.
En realidad todos los grupos se pueden obtener de esta forma. Citamos el
siguiente teorema, el cual no probaremos, pero que es muy importante pues
sitúa a los grupos en sy justa dimensión:

270
Teorema 15.1 Dado un grupo G existe un conjunto S tal que G es isomórfico
a un subgrupo de P (S).

Más adelante veremos una manera de establecer este resultado.

Ejemplo: Sea el grupo cuyo conjunto consiste de los números enteros y la


multiplicación la suma. Vea que este grupo es isomorfo al grupo de traslacio-
nes sobre Z: Ψn : Z 7→ Z, dados por Ψn (m) = n + m.

Ejemplo: Sea el grupo cuyo conjunto es R − {0} con multiplicación dada por
el producto. Este grupo puede ser obtenido como el conjunto de los mapas
invertibles de la línea real en sí misma dados por, Ψ x : lR 7→ lR dados por
Ψ x (y) := x y. Estos mapas son llamados dilataciones.

15.5. Grupos Lineales

Se llama grupos lineales a aquellos grupos que aparecen como subgrupos


del grupo de mapas lineales e invertibles de lRn 7→ lRn o sus versiones com-
plejas, los mapas de C n 7→ C n .
El mayor de ellos es el conjunto completo, llamado el grupo lineal gene-
ral, y denotado GL(n, lRn /C n ), es decir el conjunto de matrices cuadradas
invertibles n × n, con elementos reales o complejos.
Un subgrupo del mismo es el de todas las matrices con determinante con
módulo unidad. Note que este conjunto es realmente un subgrupo ya que,

det(A) det(B) = det(AB).

Un subgrupo más pequeño de este está formado por el subconjunto de las


mismas que tiene determinante unidad. Estas reciben el nombre, grupo lineal
especial, S L(n, lRn /C n ).
Estos espacios tienen más subgrupos pero los mismos no se manifiestan
de forma natural a menos que incluyamos más estructura. Por ejemplo, si in-
troducimos una base preferida, luego el conjunto de matrices que son triangu-
lar superior (inferior) con todos los elementos de la diagonal distintos de cero
(invertibles) son subgrupos. De más relevancia son los que aparecen cuando
introducimos un producto escalar. En ese caso vemos que las matrices unita-
rias, (ortogonales) forman subgrupos, de hecho, si U y U ′ son unitarias, es
decir,

〈U x, U y〉 = 〈U ′ x, U ′ y〉 = 〈x, y〉,

271
su producto también es unitario,

〈U U ′ x, U U ′ y〉 = 〈U (U ′ x), U (U ′ y)〉 = 〈U ′ x, U ′ y〉 = 〈x, y〉.

Estos grupos se denotan como U (n) cuando consideramos matrices com-


plejas (unitarias) y O(n) para el caso real. Las con determinante unidad por
S U (n) y SO(n).
El grupo SO(3) es el grupo de rotaciones en el espacio. El O(n) incorpo-
ra, además de las rotaciones, las inversiones perpendiculares a planos arbitra-
rios.

Ejercicio: Encuentre y describa todos estos grupos anteriores para n = 1 y


n = 2.

Ejercicio: Vea que U (1) tiene como subgrupo a P (1, 2, 3). U (1) aparece en
física como un grupo de simetría asociado a la conservación de la carga eléc-
trica.

Ejercicio: ¿Que otros subgrupos tiene U (1)?

Ejercicio: Vea que U (1) es isomorfo a SO(2).

Ejercicio: Vea que S U (2) es igual a SO(3). S U (2) aparece en física como
uno de los grupos principales del modelo estándar de partículas, al igual que
S U (3).

Ejercicio:

15.5.1. El grupo SO(3).

El grupo SO(3) consiste de las matrices ortonormales 3 × 3 con determi-


nante unidad. Es decir las rotaciones en lR3. Veamos que propiedades tiene
este conjunto como variedad. Una manera de describir este conjunto es la si-
guiente: Para determinar una rotación necesitamos dar el eje invariante de la
misma, o sea una dirección en lR3, que tomamos como un vector unidad en
lR3, n̂ y el ángulo de la misma. A este último le podemos asignar un rango
dado por [−π, π] teniendo en cuenta que la rotación en la dirección n̂ por un
ángulo π es igual a la rotación por el ángulo −π. Cada una de estas rotaciones
puede ser expresada por la matriz,

272
 
1 0 0
 
 0 cos θ sin θ 
0 − sin θ cos θ
Donde hemos elegido los ejes coordenados de manera que el eje z coincide
con la dirección de la rotación. Vemos así que la rotación por π es la misma
rotación que por −π. Podemos unir la dirección de rotación con el ángulo
de la misma y formar un vector de forma que su dirección coincida con la
dirección de rotación y su magnitud con el ángulo de la misma. Vemos en-
tonces que SO(3) consta de todos los puntos en una bola de radio π, cada
diámetro de la misma consiste en todas las rotaciones sobre un eje fijo. Pero
este conjunto tiene una peculiaridad, debemos identificar cada punto de la es-
fera exterior, de diámetro π, con su antípoda. Logramos así una variedad que
no tiene frontera. Si trazamos una curva que pretende salir de ella, cuando
llega al diámetro π aparece en el punto opuesto de dicha esfera ingresando al
interior de la bola por dicho punto. En particular si comenzamos una curva
de este tipo en un punto p en el interior de la bola, vamos hacia el diámetro
π y la continuamos hasta alcanzar nuevamente el punto inicial p tendremos
una curva cerrada que no puede ser deformada a la curva identidad! 1 Es de-
cir, como variedad, SO(3) no es simplemente conexa. El siguiente ejemplo
también muestra que no es un toro.

Ejercicio: Muestre gráficamente que una curva que recorre dos veces el ca-
mino de la anterior es deformable a la identidad.
Esta propiedad de SO(3) tiene importantes consecuencias en física. Es la
que permite la existencia matemática de los espinores, es decir el modelo que
describe todos los campos fermiónicos, en particular el electrón. Esto se debe
a que los espinores cuando son rotados por un ángulo de 2π, es decir a lo
largo de uno de los ejes de SO(3), éste cambia de signo, (sabe de las curvas
no deformables). Mientras que si lo rotamos por un ángulo de 4π vuelve a su
estado original.

15.6. Cosets

Dado un grupo G y un subgrupo H del mismo, podemos construir dos


espacios cocientes. Uno de ello se obtiene introduciendo la siguiente relación
1
Diremos que una curva cerrada γ (t ) con γ (0) = γ (1) = p en una dada variedad, M , puede
ser deformada a la curva identidad i (t ) ≡ p, si existe un mapa φ(t , s ), [0, 1] × [0, 1] 7→ M tal
que φ(t , 0) = γ (t ) y φ(t , 1) = i (t 0 = p.

273
de equivalencia:
Diremos que g1 ≈ g2 si existe g ∈ G tal que g1 = g h1 y g2 = g h2. Con
h1, h2 ∈ H .
Las dos primeras condiciones que definen una relación de equivalencia se
satisfacen trivialmente. Veamos la tercera:
Debemos ver que si g1 ≈ g2 y g2 ≈ g3, entonces g1 ≈ g3. Las dos primeras
condiciones nos dan, g1 = g h1 y g2 = g h2 para algún g ∈ G y g2 = g̃ h̃2 y
g3 = g̃ h̃3 para algún g̃ ∈ G. Usando las dos relaciones para g2 vemos que
g̃ = g h2 h̃2−1. Por lo tanto, g3 = g̃ h̃3 = g h2 h̃2−1 h̃3 = g h2 h̃2−1 h̃3. Lo que prueba
la afirmación ya que h2 h̃2−1 h̃3 ∈ H .
Definimos así, L = G/HL , el conjunto de clases equivalentes con respecto
a esta relación de equivalencia. El subíndice L se refiere a que hacemos equi-
valencias multiplicando los elementos de H por la izquierda. El otro espacio
cociente se obtiene por multiplicación por la derecha.
¿Cómo están constituido los elementos de L? Sea g ∈ G, luego podemos
considerar el conjunto,

g H := { g h, h ∈ H }.
Note que g ∈ H ya que e ∈ H y que todos los elementos de g H son equi-
valentes entre sí y no hay ningún elemento fuera de g H que sea equivalente
a g . Por lo tanto estos son los elementos de L. Note que ya que estas son
clases equivalentes, cada elemento de G está en una y solo una de estas clases
equivalentes.

Ejercicio: Constate para el caso de P (1, 2, 3) que los cosets por derecha corres-
pondientes a tomar P (1, 2, 3) como su propio subgrupo son las columnas de
la tabla de multiplicación. A que corresponden las filas? Esto indica que cada
fila y columna está constituida por elementos distintos entre sí.
Sean A y B dos elementos de L. Tomando dos elementos cualesquiera de
G en cada una de estas clases equivalentes, gA y gB , tenemos que A = gA H y
B = gB H . Con lo cual B = gB H = gB gA−1A y vemos que dados dos elementos
cualesquiera de L, existe un mapa invertible que envía todos los elementos de
uno en el otro. Es decir todas las clases equivalentes son isomorfas entre sí.
Note que esto tiene la siguiente implicación. Sea G un grupo con p elementos
y H un subgrupo del mismo. El espacio cociente tendrá n elementos, clases
equivalentes, cada uno con q elementos, el número de elementos de H . Co-
mo las relaciones de equivalencia dividen al conjunto G en clases disjuntas.
Debemos tener que p = nq. Es decir el número de elementos de un subgru-
po divide al número de elementos del grupo! En particular, si el número de

274
elementos de un grupo es primo, podemos concluir inmediatamente que este
solo tendrá los subgrupos triviales, la identidad y el grupo completo.

Ejemplo: Sea P (1, 2, 3) = {e, g , g ′ , f1, f2, f3}, este grupo tiene los siguientes
subgrupos, H0 := {e, g , g ′ } y Hi := {e, fi }. Como H0 tiene 3 elementos,
(P (1, 2, 3)/H0)L tendrá dos elementos, L1 = H0 y L2 = { f1, f2, f 3}.

Ejercicio: Vea que fi L1 = L2.

Ejercicio: >Cuantos elementos tiene (P (1, 2, 3)/Hi )L ? Encuéntrelos.

15.6.1. Espacios Homogéneos

El conjunto L = G/HL no es en general un grupo, pero tiene propieda-


des interesantes y estos conjuntos aparecen muy a menudo en aplicaciones,
usualmente bajo el nombre de Espacios Homogéneos.
Ya vimos que G actúa sobre L, dado un elemento de L, A, la acción de
g ∈ G en A es el elemento de L dado por g A. Denotaremos dicho mapa como
Ψ g : L 7→ L. Como ya vimos, dados dos elementos de L, A y B, siempre existe
un elemento de G, g tal que Ψ g (A) = B, es decir actúa transitivamente. La
inversa de este mapa es Ψ g −1 . Esto nos dice que todos los puntos de L tiene la
misma estructura, el grupo los mueve a todos en todos. De ahí su nombre de
espacios homogéneos.
Como los mapas anteriores tienen inversa pertenecen a P (L) el espacio
de permutaciones de L. Tenemos así un mapa de G en P (L), el que, dado un
elemento g ∈ G asigna el mapa Ψ g en P (L). Tenemos que,

Ψ g oΨ g ′ (A) = Ψ g ( g ′ A) = g ( g ′ A) = ( g g ′ )A = Ψ g g ′ (A),

o sea un homomorfismo entre grupos, lo que indica que G es un subgrupo de


P (L). Si tomamos L = G/e = G, tenemos al grupo como espacio homogéneo
y a G como subgrupo de P (G). Esto nos da una prueba del teorema de la
construcción universal mencionado anteriormente.

Ejemplo: Sea G = lR − {0} con la operación de multiplicación usual entre


racionales. Sea H = {−1, 1}. En este caso G/H = lR+ .

275
15.7. Subgrupos Normales

Una clase particular de subgrupos son los llamados grupos normales. Es-
tos son los grupos donde los cosets por derecha e izquierda coinciden, es
decir, N ∈ G es subgrupo normal si es un subgrupo y además,

gN = N g ∀g ∈ G

la propiedad importante que tiene los cosets generados por subgrupos nor-
males es que tienen una operación de multiplicación cerrada que convierte
al conjunto de los mismos en grupos. De hecho, debido a la relación que los
define,

g N g ′N = g g ′N N = g g ′N

el grupo así definido no es, en general, un subgrupo de G.

Ejercicio: Mostrar que la intersección de subgrupos normales es normal.


De la misma forma que se pueden generar subgrupos a partir de subcon-
juntos de G tomando la intersección de todos los subgrupos que contienen
el subconjunto generador. Como la intersección de subgrupos normales es
un subgrupo normal, la intersección de todos los subgrupos conteniendo al
subconjunto generador generarán un subgrupo normal.
Un caso particularmente interesante es cuando el subconjunto es el con-
junto de elementos de G de la forma,

C := { g g̃ g −1 g̃ }

El subgrupo normal generado a partir de este conjunto se denomina el


conmutador de G. Este contiene todos los elementos que no conmutan en el
sentido que si tomamos el cociente, G/N obtenemos un grupo abeliano.

Ejercicio: Pruebe que un grupo es abeliano sii su subgrupo conmutador es la


identidad.

Ejercicio: Sea P (S) el grupo de permutaciones sobre S. Vea que las transfor-
maciones que dejan todos los elementos de S invariantes, excepto un numero
finito de elementos en un subgrupo normal.

Ejercicio: Muestre que un subgrupo dando origen a solo dos cosets en nece-
sariamente normal.

276
Ejercicio: Sea Z el conjunto de elementos de G tales que si z ∈ Z luego g z =
z g ∀ g ∈ G. Muestre que Z es un subgrupo normal.

277
278
CAPÍTULO 16

PREGUNTAS TEÓRICAS DE EXÁMEN

Problema 16.1 Sea S un conjunto finito. Considere el espacio de todas las fun-
ciones de S en lR. Vea que éste es un espacio vectorial. Encuentre una base y diga
cual es su dimensión.

Problema 16.2 Pruebe que dimV = dimV ∗ y que existe un mapa invertible
natural entre V y V ∗∗ .

Problema 16.3 Vea que V /W es un espacio vectorial.

Problema 16.4 Vea que en dimensión finita todas las normas son equivalentes.

Problema 16.5 Sea V un espacio normado y V ∗ su dual. Como se define la


norma inducida en V ∗ ? Vea que si v ∈ V y ω ∈ V ∗ , luego |ω(v)| ≤ ||ω||||v||.

Problema 16.6 Sean A y B dos tensores de tipo (1, 1) actuando sobre un espacio
vectorial normado. Defina la norma inducida en estos operadores. Muestre que

||AB|| ≤ ||A||||B||

Problema 16.7 Muestre usando la definición de determinante dada en el teóri-


co, que dado dos tensores de tipo (1, 1), A y B, luego det(AB) = det(A) det(B).

Problema 16.8 Vea que el operador exponencial está bien definido.

Problema 16.9 Vea que dado un mapa lineal A, el conjunto de todos los mapas
lineales de la forma e t A, t ∈ lR, forman un grupo.

Problema 16.10 Pruebe que dado un espacio vectorial complejo, V C siempre


existe un par autovector-autovalor.

279
Problema 16.11 Vea que si {ui } son un conjunto de autovectores tales que λi 6=
λ j , luego estos son linealmente independientes.

Problema 16.12 Pruebe el lema de Schür usando la noción de espacio cociente.

Problema 16.13 Encuentre todas las posibles formas de Jordan de matrices 3 ×


3.

Problema 16.14 Dado un operador lineal, A : V 7→ W , estudie la definición


de operador adjunto. Encuentre la relación entre las componentes de estos en
término de una base cualquiera. Vea que si estos operadores tienen normas y con
ellas el mapa es acotado, luego se cumple que

||A′ || = ||A||.

Problema 16.15 Vea que los autovectores de un operador autoadjunto son per-
pendiculares entre sí si sus autovalores son distintos. Vea que los autovalores son
reales. Vea que todo operador autoadjunto es diagonalizable.

Problema 16.16 Vea que si A es autoadjunto luego e iA es unitario. Vea que el


conjunto e i t A, t ∈ lR es un grupo.

Problema 16.17 Pruebe que las cartas definiendo la variedad Non-Hausdoff


forman un atlas.

Problema 16.18 Defina la diferenciabilidad de un mapa entre dos variedades


infinitamente diferenciales.

Problema 16.19 Vea que dim T p = dim M .

Problema 16.20 Dado un punto p de M y una curva γ (t ) que pasa por ese
punto a t = t0, encuentre las componentes del vector tangente a dicha curva en
ese punto en una carta cualquiera. Exprese la derivada a lo largo de t de una
función definida en un entorno de p en dicha base.

Problema 16.21 Vea que la diferencia entre dos conexiones es un tensor.

Problema 16.22 Encuentre el laplaciano de un vector en coordenadas polares


en el plano.

Problema 16.23 Enuncie y entienda geométricamente el teorema fundamental


de las ecuaciones ordinarias. Aplique a ejemplos simples.

280
Problema 16.24 Pruebe el teorema de completamiento de espacios normados.
De ejemplos de espacios de Banach.

Problema 16.25 Pruebe que l 2 es completo (y por lo tanto Hilbert).

Problema 16.26 Pruebe que dado un subespacio cerrado M de un espacio de


Hilbert H ,
H = M ⊕ M ⊥.
Dé ejemplos de subespacios cerrados.

Problema 16.27 Pruebe el teorema de Riez.

Problema 16.28 Pruebe la relación de Parseval y dé dos ejemplos de bases donde


se cumple.

Problema 16.29 Pruebe el teorema de la distribución primitiva. Úselo en dos


ejemplos concretos.

Problema 16.30 Como se define la transformada de Fourier de una distribu-


ción? Encuentre en que espacio de Sobolev se encuentra la delta de Dirac.

Problema 16.31 Entienda la prueba de la transformada inversa de Fourier.

Problema 16.32 Estudie la clasificación de las ecuaciones en derivadas parcia-


les y la noción de superficie característica. Se darán ejemplos de ecuaciones para
clasificar.

Problema 16.33 Pruebe el teorema de Poincaré–Hardy y diga como se emplea


en la prueba de existencia del problema de Dirichlet para el Laplaciano. Entienda
las generalizaciones de este teorema.

Problema 16.34 Use y entienda el teorema del máximo para probar la unicidad
del problema de Dirichlet.

Problema 16.35 Enuncie y entienda las generalizaciones del teorema espectral.


Dé ejemplos de aplicabilidad.

Problema 16.36 Entienda las soluciones generales de la ecuación de onda en 1


y 3 dimensiones. Entienda los conceptos de dominio de dependencia y de influen-
cia.

281
Problema 16.37 Use el teorema del máximo para probar la unicidad del pro-
blema de valores iniciales y contorno para la ecuación del calor.

Problema 16.38 Encuentre todos los subgrupos de P (1, 2, 3). Cuales de ellos son
normales?

Problema 16.39 Pruebe que si N es subgrupo normal de G, luego G/N es un


subgrupo. Muestre un ejemplo de esta construcción.

Problema 16.40 Encuentre un subgrupo de U (2). Ayuda, use el mapa exponen-


cial.

282
BIBLIOGRAFÍA

[1] Mathematical Physics, Geroch, R., The Univ. of Chicago Press.

[2] Topología General, Kelley, J. L., EUDEBA.

[3] Ordinary Differential Equations, Arnold, V. I., The MIT Press, 1987.

[4] Mathematical Methods of Classical Mechanics, Arnold, V. I., Springer,


1980.

[5] Differential Equations: Geometric Theory, Lefschetz, S, Wiley, 1962.

[6] General Relativity, Wald, R., The University of Chicago Press, 1993.

[7] Differential Equations and their applications, an introduction to applied


mathematics, Braum, M. New York, Springer, 1983.

[8] Ecuaciones diferenciales ordinarias y teoría de control. Roxin, E. Buenos


Aires, EUDEBA, 1968.

[9] Methods of Modern Mathematical Physics. I. Functional Analysis, Reed,


M., and Simon, B., Academic Press, 1972.

[10] Real Analyis, Lang, S., Addison-Wesley, 1983.

[11] Introduction to Linear Algebra, Lang, S., Undergraduate Texts in Mat-


hematics, Springer, second edition, 1986.

[12] Linear Algebra, Lax, P., Pure and applied mathematics, Wiley, 1996.

[13] Functional Analysis, Yosida, K., Springer-Verlag 1980.

[14] Introductory Rela Analysis, A.N. Kolmogorov, and S.V. Fomin, Dover,
1970.

[15] Basic Linear Partial Differential Equations, Treves, F., Academic Press,
1975.

283
[16] Partial Differential Equations, John, F., Springer-Verlag 1982.

[17] Introduction to Partial Differential Equations, Folland, G. B., Mathema-


tical Notes, Princeton Univ. Press 1976.

[18] Partial Differential Equations I: Basic Theory M. Taylor, Aplied Mathe-


matical Sciences 115, Springer-Verlag, 1996.

[19] Ecuaciones de la Física Matemática, Godunov, S.K. Moscú, MIR, 1978.

[20] Problemas de Ecuaciones Diferenciales Ordinarias Kiseliov A. , Krasnov


M., and Makarenko G., Moscú, MIR, Moscú, 1968.

[21] Modern Differential Geometry for Physicists Isham C., World Scientific
Lecture Notes in Physics - Vol. 61 World Scientific, Second edition,
1999.

284
Se terminó de imprimir
en marzo de 20012
CORDOBA – ARGENTINA

285

También podría gustarte