Analitica PDF
Analitica PDF
Analitica PDF
21 de enero de 2012
Indice general
Introduccion XIV
ii
INDICE GENERAL iii
15.Oscilaciones 416
15.1. Pequenas oscilaciones y equilibrio estable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
15.2. Solucion de las Ecs. de mov. como problema de valores propios . . . . . . . . . . . . . . . . . . 419
15.2.1. Un ejemplo con dos grados de libertad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 421
15.3. Problema de valores propios con degeneracion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424
15.3.1. Un ejemplo bidimensional con degeneracion . . . . . . . . . . . . . . . . . . . . . . . . . 425
15.4. Frecuencias de vibracion libre y coordenadas normales . . . . . . . . . . . . . . . . . . . . . . . 425
15.5. Vibraciones libres de una molecula triatomica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429
15.5.1. Modos normales de frecuencia cero: traslaciones y rotaciones rgidas . . . . . . . . . . . 431
15.5.2. Vectores propios de la ecuacion secular . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432
15.5.3. Modos normales y modos reales de la molecula triatomica . . . . . . . . . . . . . . . . . 432
15.5.4. Analisis cualitativo de vibraciones transversales y longitudinales . . . . . . . . . . . . . 435
15.6. Modos normales puros y soluciones fsicas asociadas . . . . . . . . . . . . . . . . . . . . . . . . 436
15.7. Vibraciones forzadas y amortiguadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 437
15.7.1. Vibraciones forzadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 437
15.7.2. Vibraciones amortiguadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 439
15.7.3. Vibraciones amortiguadas forzadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442
15.8. Ejemplos de oscilaciones anarmonicas (opcional) . . . . . . . . . . . . . . . . . . . . . . . . . . 444
15.8.1. Ecuaciones del pendulo amortiguado forzado de amplias oscilaciones . . . . . . . . . . . 444
15.8.2. Soluciones del pendulo amortiguado forzado de amplias oscilaciones . . . . . . . . . . . 445
15.9. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 450
INDICE GENERAL ix
Estas notas de clase tienen como objetivo ser una gua para un curso de mecanica analtica, en donde los
principios de la mecanica clasica se examinan a la luz de las formulaciones Lagrangiana y Hamiltoniana y
las variantes que de ellas se derivan. Estas formulaciones ubican a la energa en el papel fundamental que las
fuerzas tienen en la formulacion Newtoniana. Quizas el aspecto mas atractivo de estas formulaciones consiste
en su poder para enlazar las simetras de un sistema con las constantes de movimiento, y en la riqueza de
estrategias para extraer informacion del sistema sin resolver explcitamente las ecuaciones de movimiento. Estos
aspectos se enfatizan fuertemente a lo largo del texto, aunque en algunos casos se estudia la solucion completa
de acuerdo con la conveniencia y la simplicidad de estas soluciones. Se ha pretendido enfatizar en aspectos que
en opinion del autor, han presentado fuerte dificultad en el desarrollo de las clases. A manera de ejemplo, la
discusion del algebra matricial que precede al estudio de la cinematica del cuerpo rgido es considerablemente
extensa y detallada haciendo enfasis tanto en lo geometrico como en lo algebraico. Debe notarse sin embargo
que el contenido de esta seccion de algebra matricial va mas alla de las necesidades del curso presente, lo cual
tiene como fin preparar al estudiante para trabajar no solo en los espacios euclidianos Rn sino tambien en los
espacios unitarios Cn que juegan un papel fundamental en mecanica cuantica. Los captulos que se incluyen
son en opinion del autor de gran importancia para la formacion general del Fsico y constituyen el punto de
partida de muchas ramas de la Fsica.
Es muy claro a lo largo de la lectura de las notas, que estas ultimas se han generado con una influencia
considerable del clasico texto de Herbert Goldstein, especialmente de la segunda y tercera edicion. No obstante,
existen cambios de enfoque y/o presentacion de numerosas unidades tematicas, debidos a la influencia de otros
autores (tales como Jose, Saletan, Cromer, Whittaker, Marion etc.), as como de algunos abordajes propios
del autor. A manera de ejemplo, los angulos de Euler se han introducido de manera que no solo quede claro
el algoritmo de rotacion, sino la necesidad de dicho algoritmo. Se ha realizado un considerable esfuerzo por
presentar de manera clara la filosofa e implementacion del metodo de Hamilton-Jacobi. La mayor parte de
herramientas matematicas necesarias se han aislado en captulos independientes a fin de dar mas flexibilidad
al texto y con el fin de que el lector las capture en su esencia y no las asocie a problemas muy especficos
de la Fsica, lo cual dificulta en general la aplicacion de estas herramientas en otros escenarios de la Fsica
diferentes a los aprendidos. Algunas secciones se han indicado como opcionales, a fin de facilitar al lector una
primera lectura, y al mismo tiempo, darle al texto la riqueza necesaria para ir mas alla de lo estrictamente
basico, sugiriendo caminos que incentiven la curiosidad del lector.
Para una adecuada comprension de estas notas, el lector debe tener conocimientos a nivel introductorio
sobre mecanica newtoniana, as como de algebra lineal y calculo diferencial e integral. En algunos pasajes
aislados se asume un conocimiento basico de electricidad, magnetismo y ondas.
El captulo 1 es un repaso de la mecanica clasica en la llamada formulacion Newtoniana en donde la
fuerza es la cantidad dinamica central. El captulo 2 nos presenta el principio de DAlembert y las ecuaciones de
Lagrange, enfatizando que estas formulaciones apuntan a resolver dos problemas importantes en la dinamica
de sistemas clasicos: (a) excluir a las ligaduras de la formulacion debido a la dificultad que usualmente se
presenta para obtenerlas y (b) trabajar solo con los grados de libertad independientes, evitando las coordenadas
redundantes. El captulo 3 es un suplemento matematico sobre el calculo variacional. A pesar de que este
xi
xii PREFACIO
suplemento sera aplicado mayormente en el llamado principio variacional de Hamilton, la exposicion muestra
la posibilidad de aplicar esa herramienta matematica en otros ambitos de la Fsica. El captulo 4 trata sobre la
formulacion integral del formalismo de Lagrange, cuya formulacion diferencial fue presentada en el captulo 2.
En el captulo 5, se presenta una de las ventajas notables de la formulacion de Lagrange, a saber la explotacion
sistematica de las simetras del sistema y su relacion con las cantidades conservadas.
En el captulo 6 se presenta la formulacion de Hamilton de la mecanica clasica en la cual se sustituyen
las coordenadas y velocidades generalizadas por las coordenadas generalizadas y momentos conjugados, se
discutira la ventaja de trabajar con este nuevo sistema de variables (denominadas variables canonicas), as como
las ventajas de pasar de un sistema de n ecuaciones diferenciales de segundo orden, a un sistema de 2n
ecuaciones diferenciales de primer orden. Puesto que la funcion Hamiltoniana se puede expresar en cualquier
conjunto de variables canonicas, es necesario estudiar la relacion que hay entre los diversos conjuntos de
variables canonicas, as como las transformaciones que nos llevan de un conjunto de variables canonicas a otro,
este sera el tema del captulo 7. Una forma alternativa de presentar las ecuaciones de Hamilton, es a traves
de diversos invariantes canonicos, entre los cuales se destacan los llamados corchetes de Poisson, con los
cuales las simetras y constantes de movimiento se pueden identificar con gran facilidad, este sera el tema del
captulo 8. Por otra parte, una eleccion adecuada de variables canonicas puede conducirnos a trivializar las
ecuaciones de movimiento (ecuaciones de Hamilton), en cuyo caso la tarea principal consiste en encontrar la
transformacion del sistema canonico original al sistema canonico que trivializa dichas ecuaciones, esta es la
esencia de la teora de Hamilton-Jacobi, presentada en el captulo 9.
En este punto culmina la descripcion de estas formulaciones alternativas de la mecanica clasica. En los
captulos posteriores, se describen problemas clasicos especficos que se abordaran con una formulacion La-
grangiana y/o Hamiltoniana. En el captulo 10 se aborda el problema de las fuerzas centrales, y el tipo de
orbitas que dichas fuerzas generan. Como caso particular importante, se estudia en detalle el problema de
Kepler. En el captulo 11, se estudia la teora de colisiones y dispersion, con especial enfasis en la teora de la
dispersion por potenciales centrales. Otro interludio matematico es presentado en el captulo 12 concerniente
a matrices, vectores y tensores cartesianos, en este captulo se desarrollan diversas herramientas matematicas
necesarias para captulos subsecuentes. En particular para el captulo 13 de cinematica del cuerpo rgido, en el
cual se analiza el movimiento general de un cuerpo rgido, utilizando la parametrizacion por angulos de Euler
y la parametrizacion eje-angulo. En tal captulo se analiza ademas la razon de cambio de un vector visto por
un sistema rotante, lo cual nos permitira estudiar con naturalidad a los sistemas no inerciales rotantes. En
el captulo 14 se estudia la dinamica del cuerpo rgido, privilegiando el estudio de la precesion libre y de la
peonza simetrica pesada con punto fijo. El captulo 15 sobre oscilaciones, estudia el problema de la obtencion
de los modos normales de oscilacion (desacople de las ecuaciones diferenciales), de un conjunto de osciladores
acoplados, como un problema de valores propios modificado que involucra matrices positivas. Este abordaje del
problema posee la ventaja (con respecto a la forma tradicional utilizada en los cursos de oscilaciones y ondas)
que es extendible a coordenadas generalizadas, incluso si estas no estan asociadas a un sistema ortogonal de
vectores unitarios.
En el captulo 16 se introduce la formulacion Lagrangiana y Hamiltoniana de la relatividad especial. Se
ha utilizado el espacio con eje temporal imaginario ict, con metrica trivial. A pesar de que la mayor parte de
textos de relatividad modernos privilegian la metrica g con eje real, el uso de un eje temporal imaginario
nos permitira aprovechar la teora de matrices ortogonales desarrollada en los captulos 12 y 13. Por otra
parte, dado que no se abordara la relatividad general, ambas escogencias poseen aproximadamente las mismas
ventajas. En todo caso, la traduccion entre las dos formulaciones se presenta en la seccion 16.3.
En el captulo 17 se introduce la teora canonica de perturbaciones dependiente e independiente del tiempo,
basada en el formalismo de Hamilton-Jacobi. Se analizara ademas el fenomeno de la invarianza adiabatica,
para lo cual las variables accion-angulo seran particularmente ventajosas.
Finalmente, el captulo 18 estudia la formulacion Lagrangiana y Hamiltoniana para la mecanica de medios
contnuos (teora clasica de campos), tanto en el regimen no-relativista como en el relativista, estableciendo la
ecuacion de continuidad para el flujo de cualquier medio contnuo, y la conservacion de la carga generalizada.
Este formalismo es aplicable a todo tipo de medios contnuos tales como campos electromagneticos, campos
de presiones, de temperatura, fludos etc. No obstante, en el captulo 18 nos restringimos a describir modelos
PREFACIO xiii
En las formulaciones Lagrangiana y Hamiltoniana de la Mecanica Clasica (as como en sus formulaciones
derivadas), existen varias estrategias que aportan un considerable valor agregado con respecto a la formulacion
Newtoniana. En las presentes notas se ha procurado enfatizar reiteradamente en aquellos puntos que en opinion
del autor, constituyen los valores agregados mas fuertes.
Discutiremos brevemente dos aspectos que constituyen la motivacion de una formulacion Lagrangiana: (a)
La eliminacion de las fuerzas de ligadura, de las ecuaciones de movimiento y (b) el uso del mnimo numero
posible de coordenadas. Para comprender la motivacion del incizo (a) bastara que el lector examine con cuidado
un problema como el de una partcula que desliza sobre una trayectoria hiperbolica, e intente encontrar el valor
de la fuerza normal (fuerza de ligadura) que mantiene a la partcula sobre la trayectoria en cuestion. Para el
incizo (b) basta con decir que cuando un conjunto de N partculas estan ligadas (por ejemplo si las distancias
entre ellas son constantes), el numero de coordenadas independientes es menor que 3N , pero en la formulacion
Newtoniana tendremos que plantear las ecuaciones para las 3N coordenadas, obteniendo as informacion
redundante, para posteriormente incorporar la ligadura. Hay entonces un considerable ahorro al elaborar una
formulacion en donde de entrada se trabaja solo sobre coordenadas independientes. Esta misma filosofa se
conserva en la formulacion Hamiltoniana.
Otra ventaja de estas formulaciones consiste en que permitira un uso mas sistematico de las simetras del
sistema para extraer informacion total o parcial de este.
De otra parte, aunque a traves del texto se estudian problemas fsicos especficos, es tambien comun abordar
temas introduciendo un pensamiento fsico abstracto, en el sentido de que ciertos aspectos estructurales nos
daran informacion parcial del sistema, independiente de los detalles de este. A manera de ejemplo: para muchos
sistemas fsicos se puede construr una cantidad denominada Lagrangiano, y que depende de un conjunto de
coordenadas generalizadas qi , velocidades generalizadas qi y el tiempo
L = L (q1 , . . . , qn , q1 , . . . , qn ; t)
supongamos que un Lagrangiano es tal que aparece la velocidad generalizada qk pero no aparece su coordenada
generalizada asociada qk , cuando esto ocurre existe una cantidad que es constante de movimiento, denominada
momento conjugado a qk
L
pk = cte
qk
esta caracterstica solo depende de un aspecto estructural del Lagrangiano, no de los detalles del sistema, ni
siquiera importa si el sistema es mecanico, electrico o de otra naturaleza.
Otro aspecto que nos introduce en el pensamiento fsico abstracto es la introduccion constante de canti-
dades generalizadas. Las coordenadas generalizadas son simplemente las variables mnimas independientes
de un sistema y no tienen que ser necesariamente variables de posicion. As mismo, q no es necesariamente
una velocidad lineal. Una densidad generalizada (x, t) es cantidad de carga generalizada por unidad de
volumen, donde la carga generalizada es cualquier cantidad fsica escalar tal como la carga electrica, la masa,
la energa, la probabilidad etc. A esta cantidad escalar se le puede asociar una propiedad de transporte a traves
de una densidad de corriente generalizada, no importa si se transporta energa, masa, carga electrica, pro-
babilidad etc. La dinamica de estas densidades y densidades de corriente generalizada seran validas para estos
y muchos otros escenarios al tiempo. En particular, la formulacion de la ecuacion de continuidad adquirira un
poder extraordinario con esta forma de pensamiento generalizado.
xiv
xv
Acorde con lo anterior, se ha procurado mantener un balance entre el pensamiento fsico especfico
y el pensamiento fsico abstracto, competencias ambas indispensables en la formacion del fsico y otros
profesionales afines.
Por otra parte, es muy comun enfocar un curso de mecanica analtica como un puente necesario para
abordar los cursos de mecanica cuantica. En opinion del autor, esta no debe constitur la unica motivacion
para dictar un curso de esta naturaleza. Ciertamente los postulados de la mecanica cuantica requieren del
conocimiento de la formulacion Hamiltoniana y tambien se puede abordar con el formalismo Lagrangiano. Sin
embargo, la mecanica clasica posee numerosos problemas abiertos puros y aplicados (caos, mecanica de fludos,
teora de perturbaciones clasica etc.), que constituyen tambien un campo de accion plausible para el fsico, y
para los cuales el lenguaje que se aborda es usualmente el descrito en estos cursos. Basta con observar que
historicamente, los formalismos Lagrangiano y Hamiltoniano precedieron en varias decadas al nacimiento de
la mecanica cuantica.
xvi INTRODUCCION
Captulo 1
Elementos basicos de Mecanica Newtoniana
1.1. Cinematica
La cinematica trata de la descripcion del movimiento de los cuerpos sin referencia a las causas de dicho
movimiento. El tratamiento sera breve sin una discusion detallada de los conceptos. Para detalles, ver por
ejemplo las referencias. [2, 3]. Asumiremos que tenemos una idea intuitivamente clara de los conceptos de
espacio, tiempo y masa.
El primer concepto que se construye es el de vector posicion. Una partcula puntual ocupa un punto
especfico en el espacio, si elegimos un sistema de referencia, podemos trazar un vector desde el origen de dicho
sistema hasta el punto donde se ubica la partcula, y lo denominamos vector posicion. La posicion entendida
como un punto geometrico en el espacio, no es un vector como tal (no tiene direccion, magnitud, ni sentido),
lo cual se refleja en el hecho de que el vector posicion depende del origen elegido para el sistema coordenado.
Cuando una partcula se desplaza desde un punto descrito por el vector posicion r0 hasta otro descrito por rf ,
podemos describir el movimiento de esta partcula a traves del vector desplazamiento r, como un vector
que va desde r0 hacia rf . Este vector indica la direccion del desplazamiento y la distancia recorrida (magnitud
del vector).
r rf r0
vale la pena mencionar que r s es un vector como tal, lo cual se refleja en el hecho de que r es independiente
del origen elegido.
Ahora definimos el vector velocidad, como el cambio de posicion (o desplazamiento) por unidad de tiempo
rf r0 r
v=
tf t0 t
si queremos conocer el valor de la velocidad del movil en forma mas detallada, partimos el intervalo anterior
en intervalos mas finos, y definimos una velocidad para cada intervalo
r (ti + ti ) r (ti ) ri
v=
ti ti
ri
lm = vinst
ti 0 ti
vi ti = xi
1
2 CAPITULO 1. ELEMENTOS BASICOS DE MECANICA NEWTONIANA
tambien es util definir la razon de cambio de la velocidad, a traves del vector aceleracion en la forma
v dv
a = ; ainst =
t dt
donde a denota la aceleracion promedio, en tanto que ainst es la aceleracion instantanea, usualmente esta
ultima se denota simplemente como a. Un argumento similar al anterior nos lleva a la ecuacion
Z tf Z rf Z tf
a dt = dv vf v0 = a dt
t0 r0 t0
estas ecuaciones y algunas combinaciones especiales de ellas nos proveen el marco para la descripcion del
movimiento de los cuerpos.
F = ma
esta ley tambien contiene el principio de superposicion de las fuerzas, segun el cual la fuerza neta o resultante
sobre una partcula es la suma vectorial de cada fuerza aplicada como si cada una de ellas actuara sola. Esto
significa que no hay efectos de interferencia entre las distintas fuerzas aplicadas sobre la partcula.
Tercera Ley: Cuando una partcula A hace una fuerza FAB sobre una partcula B entonces la fuerza
sobre A debida a B (denotada como FBA ) esta relacionada con FAB en la forma
FAB = FBA
esta ley tiene implcita la propagacion instantanea de senales por lo cual su validez es muy limitada. En su
forma fuerte, la fuerza es de naturaleza central, sin embargo existen fuerzas que solo cumplen esta ley en su
forma debil, es decir los pares de fuerzas son opuestos pero no van a lo largo de la lnea que une a las partculas.
Finalmente, en otros casos la ley no se cumple en ninguna de sus versiones, lo cual ocurre cuando el tiempo
de propagacion de la interaccion es significativo.
Por otro lado, las leyes anteriores se pueden sustituir por sus equivalentes en terminos del concepto de
momento lineal definido como el producto de la masa por la velocidad p mv. La primera ley nos dice que
en los sistemas inerciales el momento lineal de una partcula aislada es constante, la segunda ley se escribira
de la forma F = dP/dt y la tercera ley sera sustituda por el principio de conservacion del momento para un
sistema aislado de partculas. Estas leyes tienen una rango de validez mas amplio que la formulacion original,
aunque hay que usar un concepto extendido de momento lineal.
1.3. TRABAJO Y ENERGIA 3
A pesar de que las leyes de Newton me dan en principio una descripcion completa de la evolucion de
los sistemas, tienen el limitante de que requieren el conocimiento de las fuerzas en funcion del tiempo, en
la practica es mas usual que se conozca la fuerza en funcion de la posicion, lo cual nos lleva al concepto de
trabajo.
dW = F dr
notese que F es una de las fuerzas aplicadas sobre la partcula, y no necesariamente corresponde a la fuerza
resultante. Sin embargo, cuando la fuerza en cuestion es la resultante sobre la partcula, la segunda ley de
Newton conduce automaticamente al teorema fundamental del trabajo y la energa
Z B
1 2 1 2
F dr = mvB mvA (1.1)
A 2 2
la cual nos indica que sin importar la trayectoria seguida por la partcula, el trabajo realizado por la fuerza
resultante sobre esta equivale al cambio en la cantidad (1/2) mv 2 que denominamos la energa cinetica de la
partcula. Es indispensable tener claro que el teorema fundamental del trabajo y la energa solo es aplicable
a la fuerza resultante sobre la partcula y no a una de las fuerzas aplicadas. A priori se podra pensar que
esta formulacion es esteril cuando la queremos aplicar a una fuerza sobre una partcula, dado que el calculo
del trabajo requiere conocer la trayectoria de esta, lo cual presupone que de alguna forma el problema ya
esta resuelto. Sin embargo, hay tres razones por las cuales la formulacion es util a pesar de lo anterior
1. Con frecuencia, existen fuerzas de ligadura que obligan a la partcula a seguir una trayectoria dada (e.g.
pendulo, montana rusa), de modo que conocemos la trayectoria aunque no conozcamos el valor de la
fuerza de ligadura, ni otras variables dinamicas del sistema (velocidad o aceleracion en funcion de la
posicion o del tiempo).
2. Existen fuerzas para las cuales la evaluacion de la integral de lnea no requiere del conocimiento de la
trayectoria sino solo de los puntos inicial y final. Esto nos lleva al concepto de Fuerza conservativa
3. En el caso de la fuerza resultante el teorema fundamental del trabajo y la energa nos permite encontrar el
trabajo que dicha fuerza hace sobre la partcula, conociendo unicamente las velocidades en los extremos
de la trayectoria as como la masa de la partcula.
Definition 1 Una fuerza conservativa es aquella para la cual el trabajo asociado no depende de la trayectoria
seguida por la partcula sino solo de la posicion final e inicial
Z B
F dr = U (rA ) U (rB ) (1.2)
A
4 CAPITULO 1. ELEMENTOS BASICOS DE MECANICA NEWTONIANA
la funcion escalar U (r) se conoce como energa potencial. Por otro lado, si la fuerza resultante es conservativa,
podemos combinar la definicion de conservatividad con el teorema fundamental del trabajo y la energa y se
obtiene
1 1
mv 2 mv 2 = U (rA ) U (rB )
2 B 2 A
1 2 1
mvA + U (rA ) = mv 2 + U (rB )
2 2 B
esto conduce al teorema de conservacion de la energa mecanica. Es necesario enfatizar que la conser-
vatividad requiere que la energa potencial definida en (1.2) dependa unicamente de la posicion. Si la energa
potencial es funcion explcita del tiempo, entonces la suma de Ek + U todava me define la energa total del
sistema, pero esta cantidad ya no se conserva en general. En otros casos la energa potencial puede depender
de la velocidad, aceleracion etc. Finalmente, en algunos casos no existe ninguna funcion escalar que pueda dar
cuenta del trabajo realizado. En ninguno de estos casos se conserva la energa.
Retomando la definicion (1.2), vemos que a la energa potencial se le puede agregar una constante arbitraria
sin alterar el contenido Fsico de esta, ya que lo que es relevante fsicamente es el cambio en la energa potencial
y no su valor en s. Es facil demostrar que para que una fuerza sea conservativa, cada una de estas afirmaciones
es condicion necesaria y suficiente
Z B I
F (r) = U (r) ; F (r) = 0 ; F (r) dr = U (rA ) U (rB ) ; F (r) dr = 0
A
donde todas estas expresiones deben cumplirse para todo r R3 o para toda trayectoria en R3 . Las dos primeras
son condiciones en todo el espacio y las dos siguientes para toda trayectoria (general y cerrada respectivamente).
En todas estas ecuaciones, se debe enfatizar que no debe haber dependencia temporal explcita. Las fuerzas
conservativas mas importantes son las fuerzas constantes y las fuerzas centrales. Dentro de las no conservativas
el rozamiento es la mas destacable.
En el tratamiento de fuerzas centrales existe una cantidad que se conserva y que resulta muy util en el
tratamiento de este tipo de fuerzas: el momento angular
d dr dp
(r p) = p+r = mv v + r F
dt dt dt
dL
= ~ (1.3)
dt
para una fuerza central con origen en el punto de convergencia, el torque es cero y el momento angular es
una constante de movimiento. Aunque los conceptos de torque y momento angular de una partcula surgen de
manera natural en el caso de fuerzas centrales, son extensibles a cualquier tipo de fuerza y la relacion (1.3)
es valida en general. En particular si no hay torque sobre la partcula el momento angular se conserva, de la
misma forma que el momento lineal se conserva ante la ausencia o anulacion de las fuerzas.
Finalmente, es necesario insistir en la fuerte dependencia que el torque y el momento angular tienen con
respecto al origen coordenado elegido, lo cual se manifiesta a traves de su dependencia del vector posicion r.
De esta forma hay tres cantidades cuya conservacion sera mas adelante extensible a sistemas de partculas,
la energa, el momento lineal y el momento angular
1.5. DINAMICA DE UN SISTEMA DE PARTICULAS 5
definamos la velocidad del centro de masa vCM del sistema de manera que:
P M vCM (1.4)
donde M es la masa total. Es decir, de manera que el momento del sistema sea el mismo que le correspondera
al caso en que toda la masa estuviera concentrada en el llamado centro de masa, cuya velocidad es vCM . Por
lo tanto:
Pn
P m1 v1 + m2 v2 + ... + mn vn mi vi
vCM = = = i=1 (1.5)
M m1 + m2 + ... + mn M
si suponemos que las masas son independientes de la velocidad, vCM corresponde a la velocidad asociada a la
posicion:
Pn
m1 r1 + m2 r2 + ... + mn rn mi ri
rCM = = i=1 (1.6)
m1 + m2 + ... + mn M
la cual define la posicion del centro de masa del sistema relativa a algun observador O, que mide los vectores de
posicion y velocidad ri , vi . Ahora bien, es uno de los principios mas fundamentales de la naturaleza el llamado
principio de conservacion del momento el cual establece que si un sistema de partculas esta aislado,
su momento total es constante, y como suponemos que la masa no depende de la velocidad, tenemos de la
ecuacion (1.4) que vCM = cte de modo que: El centro de masa de un sistema de partculas aislado se
mueve con velocidad constante con respecto a un sistema inercial.
Un sistema de referencia muy particular es aquel que no rota con respecto a un sistema inercial y cuyo origen
coincide con el propio centro de masa del sistema de partculas. Si colocamos nuestro sistema de referencia sobre
el centro de masa, obviamente vCM = 0 por tanto, el momento total P del sistema de partculas es cero. Por
brevedad designaremos de ahora en adelante al sistema de referencia del centro de masa como sistemaC de
referencia. De modo que podemos escribir:
n
X
PCM = pi = 0 (en el sistema C de referencia) (1.7)
i=1
Este sistema de referencia es muy importante dado que muchos fenomenos fsicos pueden ser descritos mas
facilmente en el sistema de referencia centro de masa que en el sistema del laboratorio.
esto significa que cualquier cambio en el momento de S debe venir acompanado de un cambio en el momento
de S , a fin de mantener la suma constante.
PS = PS (1.9)
Luego, la interaccion entre los sistemas S y S se puede describir como un intercambio de momento. Al
tomar la derivada temporal de (1.8) obtenemos:
d
(PS + PS ) = 0
dt
dPS dPS
= (1.10)
dt dt
haciendo una extrapolacion, es natural llamar a la derivada temporal del momento total del sistema, como la
fuerza externa ejercida sobre S (en analoga al caso de una partcula), es decir:
P
dPS d ( ni=1 pi )
= Fext o = Fext (1.11)
dt dt
la denominacion de externa se debe al hecho de que es producida por su interaccion con S . Las fuerzas internas
que existen en S debidas a la interaccion entre sus partculas no producen ningun cambio en el momento total
en virtud del principio de conservacion del momento, pues si quitamos las interacciones externas, se tendra
que el momento total PS del sistema permanecera constante y por tanto dP dt = 0 es decir Fext = 0. De all se
S
concluye que las fuerzas internas de S no contribuyen a la cantidad dPS /dt. Utilizando las ecuaciones (1.10)
y (1.11) tenemos que
Fext = Fext (1.12)
donde Fext es la fuerza externa sobre S la cual es ejercida por las partculas del sistema S. Esta es la extension
de la ley de accion y reaccion para las interacciones entre S y S .
Por otro lado como PS = M vCM (donde CM define el centro de masa del sistema S y no del sistema
compuesto S + S ) tenemos:
dvCM
M = Fext (1.13)
dt
con lo cual podemos definir de manera natural la aceleracion del centro de masa:
dvCM
aCM = (1.14)
dt
M aCM = Fext (1.15)
Nuevamente analogo al caso de una partcula. Reuniendo las ecuaciones (1.4) (1.14) y (1.15) se puede concluir
que:
La dinamica del centro de masa de un sistema de partculas es equivalente al de una partcula de masa
igual a la masa total del sistema concentrada en dicho centro de masa, y sobre la cual se aplicara una fuerza
equivalente a la suma vectorial de las fuerzas externas sobre el sistema.
Adicionalmente, la interaccion entre los sistemas S y S puede ser descrita formalmente de manera analoga
al caso de dos partculas segun se ve en las Ecs. (1.8), (1.9), (1.10), (1.11) y (1.12). En este punto queda por
tanto, mas que justificada la introduccion del concepto de centro de masa.
No obstante, vale la pena aclarar que la formulacion anterior no resuelve el problema dinamico completo
para el sistema S. Para resolver formalmente el problema dinamico de cada partcula, vamos a relacionar
Fext con las fuerzas que actuan sobre cada partcula. De aqu en adelante nos olvidaremos del sistema S
cuya influencia sobre S estara representada por la fuerzas externas sobre S. Sea pi el momento lineal de la
(e)
partcula i de masa mi ; sea Fi la fuerza externa resultante sobre dicha partcula, y Fij la fuerza interna que
1.5. DINAMICA DE UN SISTEMA DE PARTICULAS 7
la partcula j tambien del sistema S, ejerce sobre la partcula i. La fuerza total ejercida sobre la partcula
(e)
i es por tanto igual a la fuerza externa Fi mas la suma de las fuerzas internas de todas las partculas j del
sistema S (excepto la propia partcula i) aplicando la segunda ley de Newton a esta partcula se tiene:
X n
dpi (e)
= Fi + Fij (1.16)
dt
j6=i
asumiremos de aqu en adelante que Fii = 0. Resolviendo esta ecuacion para cada partcula i del sistema,
se obtiene la solucion dinamica completa de este. Observese que aqu s aparecen explcitamente las fuerzas
internas. Ahora sumemos todas las ecuaciones de todas las partculas de la siguiente manera:
n
X n
X n X
X n
dpi (e)
= Fi + Fij
dt
i=1 i=1 i=1 j6=i
Pn Xn Xn X n
d( i=1 pi ) (e)
= Fi + Fij (1.17)
dt
i=1 i=1 j6=i
P P
pero i j Fij se puede escribir como:
n X
X n n n
1 XX
Fij = (Fij + Fji ) (1.18)
2
i=1 j6=i i=1 j>i
sustituyendo (1.18) en (1.17) y usando el principio de accion y reaccion, la ecuacion (1.17) nos queda:
Pn n
X
d( i=1 pi ) (e)
= Fi
dt
i=1
comparando con la ecuacion (1.11) se concluye que la fuerza externa sobre un sistema de partculas es la suma
de las fuerzas externas sobre cada una de las partculas del sistema.
i ri Fi ; Li ri pi
dLi
= i
dt
supongamos ademas que la partcula esta sujeta a las fuerzas internas que sobre ella realizan las otras partculas
(e) P
del sistema S mas una fuerza externa resultante. Luego, la fuerza resultante sobre la partcula i es Fi + Fij y
j
su torque resultante es:
n
X
dLi (e)
= i = ri Fi + Fij
dt
j6=i
en analoga con la definicion de momento lineal total, definimos el torque total como la suma vectorial de
los torques individuales de las partculas, similarmente definimos el momento angular total L. Escribimos
entonces:
8 CAPITULO 1. ELEMENTOS BASICOS DE MECANICA NEWTONIANA
n
X n
X Pn
dLi d( i=1 Li ) dL
= i = = =
dt dt dt
i=1 i=1
n
X n
X
= ri F(e) + Fij
i
i=1 j6=i
n
X Xn n
X
(e) ri
= ri Fi + Fij
i=1 i=1 j6=i
por otra parte, utilizando la ley de accion y reaccion, puede demostrarse por induccion que:
n
X n
X n1
XX n
ri Fij = [(ri rj ) Fij ] (1.19)
i=1 j6=i i=1 j>i
Si suponemos especialmente que las fuerzas internas Fij actuan a lo largo de los vectores relativos rij se
tiene que el segundo termino de la derecha se anula quedando
n
X
(e)
= ri Fi
i=1
(e) (e)
donde ri Fi representa el torque debido a las fuerzas externas Fi sobre cada partcula i entonces:
n
X
= i,ext = ext
i=1
de modo que
dL
= ext (1.20)
dt
que constituye la relacion fundamental de la mecanica rotacional, observese la analoga entre las Ecs. (1.20) y
(1.11). Si ext = 0, se encuentra que:
dL
= 0 L = L1 + L2 + ... + Ln = cte (1.21)
dt
la ecuacion (1.21) constituye la ley de conservacion del momento angular. La cual nos indica que si en un
sistema las fuerzas externas sobre el son tales que su torque total es cero, su momento angular permanece
constante. En particular, el momento angular se conservara cuando el sistema este aislado.
Vale anotar que la ley de conservacion del momento angular ha mostrado ser universalmente valida a
pesar de nuestra suposicion inicial de que las fuerzas vayan a lo largo de las lneas que unen a las partculas
(propiedad que no cumplen por ejemplo las fuerzas magneticas). De manera que aun en los casos en que
nuestra suposicion inicial no es valida, la ley de conservacion del momento angular se ha cumplido en todos
los procesos observados hasta ahora, aunque con un concepto extendido de momento angular.
1.5. DINAMICA DE UN SISTEMA DE PARTICULAS 9
ri = ri + rCM (1.22)
vi = vi + vCM (1.23)
siendo rCM y vCM la posicion y velocidad del centro de masa medidas por el laboratorio. Multiplicando (1.23)
por mi se obtiene
pi = pi + mi vCM (1.24)
utilizando estas relaciones, obtenemos:
n
X n
X
L = (ri pi ) = ri + rCM pi + mi vCM
i=1 i=1
n n n
!
X X X
L = ri pi + rCM pi + mi ri + rCM vCM
i=1 i=1 i=1
n n n
!
X X X
L = ri pi + rCM pi + mi ri vCM
i=1 i=1 i=1
P P
pero i pi = 0 de acuerdo con (1.7) y utilizando (1.6) se tiene que ( i mi ri ) = M rCM de modo que:
n
X
L = ri pi + M rCM vCM
i=1
L = LCM + rCM P (1.25)
el termino LCM es el momento angular relativo al centro de masa, o momento angular interno; esto ultimo
debido a que el momento angular as medido es una propiedad del sistema e independiente del observador. El
segundo termino a la derecha suele denominarse momento angular externo relativo al sistema-L (laboratorio),
y equivale al momento angular (medido desde el sistema laboratorio) correspondiente a una partcula de masa
M colocada en la posicion del centro de masa y con la velocidad del CM. Por ejemplo, cuando un lanzador
arroja una pelota rotando, el momento angular debido a la rotacion esta dado por LCM , mientras que el
momento angular debido a la traslacion de la pelota esta dado por M rCM vCM con M la masa de la bola.
Para la Tierra LCM es debido a su rotacion y M rCM vCM es debido a su traslacion alrededor del Sol.
Relacion entre el torque externo alrededor del centro de masa y el torque alrededor del labora-
torio
Con un argumento similar al anterior se puede calcular la relacion entre el torque externo medido por el
laboratorio y el medido por el centro de masa
dL dLCM dvCM
= + rCM M
dt dt dt
y tomando las Ecs. (1.13) y (1.20):
dLCM
ext = + rCM Fext (1.27)
dt
Y comparando (1.26) y (1.27) se obtiene:
dLCM
= CM (1.28)
dt
esta relacion es funcionalmente identica a (1.20) pero con la diferencia de que (1.20) es valida solo cuando el
torque y el momento angular se miden a partir de un punto fijo (usualmente el origen) en un sistema inercial
de referencia, en tanto que la relacion (1.28) es valida incluso si el sistema de referencia-C no es inercial1 . Esta
ecuacion resultara muy util para estudiar el movimiento del cuerpo rgido.
(e)
donde Fi es la resultante de las fuerzas externas. El diferencial de trabajo es:
n
X
(e)
dWi = mi ai dri = Fi dri + Fij dri
j6=i
el diferencial de trabajo total realizado sobre el sistema, es entonces la suma de los diferenciales de trabajo de
partcula individual:
n
X n
X n X
X n
(e)
dW = mi ai dri = Fi dri + Fij dri
i=1 i=1 i=1 j6=i
n X
X n n1
XX n n1
XX n
Fij dri = [(dri drj ) Fij ] = (drij Fij )
i=1 j6=i i=1 j>i i=1 j>i
dvi dri
por otro lado ai dri = dt dri = dvi dt = dvi vi con lo cual queda:
n
X n
X n1
XX n
(e)
dW = mi dvi vi = Fi dri + (drij Fij )
i=1 i=1 i=1 j>i
1
Sin embargo, la relacion (1.28) no es valida si el sistema-C esta rotando con respecto al sistema inercial [4].
1.5. DINAMICA DE UN SISTEMA DE PARTICULAS 11
observese que estrictamente aqu se realizan n integrales dado que existen n trayectorias seguidas por cada
una de las n partculas. El primer termino de la derecha es el trabajo realizado por las fuerzas externas a S. El
segundo termino corresponde al trabajo hecho por las fuerzas internas.
Z n
X
1 1
dW = mi vi2 mi v0i
2
= Wext +Wint
2 2
i=1
n
X n
X
1 1
W = mi vi2 2
mi v0i = Wext +Wint
2 2
i=1 i=1
Pn
pero i=1 12 mi vi2 es la energa cinetica del sistema en un instante dado. Por tanto el trabajo total realizado por
las fuerzas externas e internas cuando el sistema de partculas se desplaza desde la configuracion de posiciones
(x01 , ..., x0n ) hasta la configuracion de posiciones (xf 1 , ..., xf n ) a traves de las trayectorias (x1 (t) , ..., xn (t)) es
igual al cambio de energa cinetica entre estas dos configuraciones de posicion, sin importar la naturaleza de
las trayectorias. Hemos recuperado por tanto el teorema fundamental del trabajo y la energa para el caso de
un sistema de partculas, el cual enunciaremos de la manera siguiente:
El trabajo total efectuado por las fuerzas externas e internas sobre un sistema de partculas
es igual al cambio producido en su energa cinetica.
Por tanto escribiremos:
pero como se trata de interaccion de pares de partculas, la energa potencial depende unicamente del vector
relativo entre los pares de partculas i, j. Si suponemos especialmente que la fuerza Fij va a lo largo del vector
rij que une a las dos partculas, se tiene que la energa potencial dependera solamente de la distancia entre las
dos partculas:
Z Bij
ij ij
(drij Fij ) = Ep0,int (rij ) Ep,int (rij ) , rij krij k
Aij
en este caso, la energa potencial esta definida por pares de partculas, a esto se refiere el suprandice i, j en la
ecuacion anterior. Por tanto, las fuerzas internas producen un trabajo equivalente a:
n1
XX n h i
ij ij
Ep0,int (rij ) Ep,int (rij )
i=1 j>i
y como sabemos que la suma de fuerzas conservativas es tambien conservativa se tiene que:
n1
XX n n1
XX n
ij ij
Wint = Ep0,int (rij ) Ep,int (rij ) = Ep0,int Ep,int
i=1 j>i i=1 j>i
U Ek + Ep,int (1.30)
el nombre de energa propia indica que esta es una propiedad del sistema (y no de agentes externos). Podemos
reescribir la ecuacion anterior como:
U U0 = Wext (1.31)
es decir, el cambio en la energa propia del sistema es igual al trabajo realizado por las fuerzas externas sobre
el sistema de partculas.
Como la energa potencial Ep,int (rij ) solo depende de la distancia entre las dos partculas i, j se tiene
ij ji
entonces que Ep,int = Ep,int por lo tanto:
n1
XX n n n
ij 1 X X ij
Ep,int (rij ) = Ep,int (rij )
2
i=1 j>i i=1 j6=i
regresando a la Ec. (1.31) se tiene que si Wext = 0, la energa propia es igual al principio y al final de cualquier
proceso, de modo que podemos enunciar el siguiente principio de conservacion:
Si las fuerzas externas no realizan ningun trabajo, se tiene que la energa propia del sistema
se conserva (siendo las fuerzas internas conservativas).
Finalmente, supongamos que tambien las fuerzas externas son conservativas de manera que:
U U0 = Ep,ext0 Ep,ext
(U + Ep,ext ) (U0 + Ep,ext0 ) = 0
es decir, la cantidad U + Ep,ext se conserva para cualquier proceso realizado por las fuerzas externas e internas.
Como en el calculo de U + Ep,ext intervienen todas las fuerzas sobre S, podemos denominar a esta cantidad
como la energa total del sistema
es decir la energa total del sistema es igual a la energa cinetica mas la energa potencial de las fuerzas internas
y externas, y se tiene que:
E E0 = 0
es decir la energa total se conserva para cualquier proceso realizado por las fuerzas internas y externas siempre
y cuando ambos tipos de fuerzas sean conservativos. Hemos deducido entonces el teorema de conservacion de
la energa para un sistema de partculas en donde las fuerzas involucradas son todas conservativas2 . En el caso
de una sola partcula, la energa total se reduce a la expresion correcta ya que cuando solo hay una partcula
Ep,int = 0 (puesto que la energa potencial interna se debe a la interaccion por pares, de modo que debe
haber al menos dos partculas) y Ep,ext es la energa potencial correspondiente a la fuerza resultante sobre la
partcula.
2
En su forma mas general, la conservacion de la energa adquiere el caracter de principio y su validez es universal, mas alla de
las suposiciones realizadas para demostrar el teorema.
1.6. EJERCICIOS 13
1 2
Ek = Ek,CM + M vCM
2
n
X n
X
1 1 1
mi vi2 = 2
mi vi2 + M vCM (1.32)
2 2 2
i=1 i=1
el primer termino de la derecha es el debido al movimiento de las partculas del sistema con respecto al centro
de masa, el segundo termino es el debido al movimiento del sistema como un todo (movimiento de su centro
de masa con respecto al laboratorio). La energa propia de S vendra dada entonces por:
1 2
U = Uint + M vCM
2
esta relacion muestra que la energa interna es el menor valor que puede tomar la energa propia, y este valor
lo toma cuando se mide en el sistema C de referencia.
1.6. Ejercicios
1. Demuestre por argumentos puramente cinematicos, que la velocidad inicial v0 y la velocidad final vf de
una partcula, estan relacionadas con su aceleracion a, por medio de la ecuacion
Z rf
2 2
vf v0 = a dr
r0
donde r0 y rf son la posicion inicial y final de la partcula respectivamente. Notese que al multiplicar
esta ecuacion por la masa, se obtiene el teorema fundamental del trabajo y la energa, Ec. (1.1).
2. La velocidad de escape de una partcula en la tierra, es la velocidad inicial mnima que requiere una
partcula que esta en la superficie de la tierra, para poder escapar del campo gravitatorio terrestre.
Ignorando la resistencia del aire, calcule esta velocidad de escape por argumentos de energa.
3. Demuestre la Ec. (1.19) por induccion matematica.
4. Demuestre que la relacion entre el torque externo medido por el laboratorio y el medido por el centro de
masa viene dado por la Ec. (1.26). (Para comentarios adicionales sobre algunas sutilezas de esta relacion,
ver la Ref. [4]).
5. Demuestre que la energa cinetica de un sistema de partculas vista por el laboratorio es la energa
cinetica vista por el centro de masa, mas la energa cinetica que tendra una partcula con la masa total
del sistema y la velocidad del centro de masa (ver Ec. 1.32).
Captulo 2
Principio de DAlembert y ecuaciones de Lagrange
la experiencia muestra que las formulaciones integrales y diferenciales tienen cada una sus ventajas y desven-
tajas y en general resultan un buen complemento para obtener un buen panorama de la teora subyacente.
En esta misma tonica queremos obtener el nuevo formalismo a partir de una formulacion diferencial y una
formulacion integral. La formulacion diferencial se cimenta en el llamado principio de DAlembert en tanto
que la formulacion integral se basa en el principio variacional de Hamilton.
Nos ocuparemos primero de la version diferencial, pero antes de discutir el principio de DAlembert que la
genera, debemos estudiar el papel de las ligaduras en la Fsica.
2.1. Ligaduras
Aunque las ecuaciones de movimiento (1.16) nos dictaminan formalmente toda la evolucion del sistema,
desde el punto de vista operativo es en general difcil conocer todas las fuerzas aplicadas sobre cada partcula.
Con frecuencia, los sistemas estan sometidos a ligaduras que obligan a la partcula o sistema de partculas a
moverse en ciertas trayectorias o a restringir su movimiento a ciertas regiones especficas. Tal es el caso de
sistemas como la montana rusa o el pendulo en donde la trayectoria del movil esta determinada por la normal
y la tension de la cuerda respectivamente, observese que en estos casos particulares no es facil encontrar a
priori el valor de las fuerzas de ligadura. Otro caso comun es el de un gas en un contenedor, en tal caso la
ligadura se manifiesta como la exclusion de la region exterior al contenedor como posible region de movimiento
para las partculas.
Hay varias formas de clasificar las ligaduras. Una de las clasificaciones mas utiles consiste en la caracteri-
zacion de las ligaduras como holonomas y no holonomas. Las ligaduras holonomas son aquellas que se pueden
escribir como ecuaciones que conectan las coordenadas de las partculas y tal vez el tiempo, de la forma
f (r1 , r2 , . . . , rN , t) = 0 (2.1)
14
2.1. LIGADURAS 15
un ejemplo sencillo lo constituye el cuerpo rgido para el cual las ligaduras se expresan de la forma
(ri rj )2 c2ij = 0
siendo ri , rj posiciones de un par de partculas del cuerpo rgido y siendo cij sus distancias (constantes). La
montana rusa y el pendulo son tambien ejemplos de ligaduras holonomas, ya que el movil esta obligado a
seguir una trayectoria especfica. La ecuacion de la trayectoria actua entonces como la ligadura.
Toda ligadura que no cumpla la condicion (2.1), se denomina no holonoma. En el ejemplo del contenedor
de gas, asumiendo por simplicidad un contenedor esferico de radio a, tendramos una ligadura de la forma
r 2 a2 0
es decir una desigualdad. Naturalmente hay infinidad de ligaduras no holonomas ya que solo se requiere que
no se cumpla una ecuacion de la forma (2.1).
Otra clasificacion importante es en ligaduras reonomas (que contienen el tiempo como variable explcita)
y escleronomas (el tiempo no aparece explcitamente en la ligadura). Un bloque que se desliza por un plano
inclinado, donde este ultimo esta fijo en el espacio, es una ligadura escleronoma. Por otro lado, si el plano
inclinado se mueve de una manera prescrita1 , la ligadura es reonoma. Notese sin embargo, que si el movimiento
del plano inclinado es solo debido a la fuerza de reaccion del bloque, la dependencia temporal entra a traves de
las coordenadas que describen a la curva que hace el bloque; en tal caso, la ligadura como tal es escleronoma.
Como ya se menciono, en general es difcil hallar las fuerzas de ligadura. Adicionalmente, si tenemos N
partculas, las 3N coordenadas necesarias para determinar las posiciones de las N partculas no son en general
independientes, de modo que los grados de libertad son menores a 3N . En el caso mas general puede ser muy
difcil saber cuantas coordenadas independientes hay, pero en el caso de las ligaduras holonomas, este conteo
es muy sencillo ya que si tenemos k ecuaciones holonomas, el numero de grados de libertad sera 3N k. Por
tanto, cuando las ligaduras son holonomas, se pueden encontrar un conjunto de coordenadas generalizadas
que consisten en un conjunto de 3N k grados de libertad independientes que denotaremos por q1 , . . . , q3N k
las cuales se pueden escribir en terminos de las antiguas coordenadas r1 , . . . , rN con ecuaciones de la forma
que contienen implcitamente las ligaduras. Si a este sistema le anadimos las ecuaciones de ligadura
fj (r1 , . . . , rN , t) = 0 ; j = 1, . . . , k (2.3)
el conjunto de transformaciones debe ser invertible de modo que cada qi se puede escribir en terminos de
las antiguas coordenadas ri y el tiempo. Es importante notar que en el caso mas general, las coordenadas
generalizadas no se pueden agrupar en triplas que formen un vector euclidiano.
Un ejemplo que ilustra todos estos detalles es el pendulo doble que se muestra en la figura 2.1. Por simplici-
dad asumamos que las lentejas se mueven en un plano. Las coordenadas cartesianas de las dos lentejas nos dan
seis escalares que especifican las posiciones de ambas. Sin embargo, es claro que no todas estas componentes
son independientes. Los angulos 1 y 2 representan un conjunto de grados de libertad (coordenadas inde-
pendientes) que determinan completamente la posicion de las dos lentejas bajo las ligaduras ya mencionadas.
Existen en efecto 4 ecuaciones de ligadura, dos de ellas asociadas al hecho de que las lentejas estan en un plano
(e.g. z1 = 0 y z2 = 0) y otras dos que nos dicen que las longitudes de las cuerdas son constantes2 . Para este
sistema, el par (1 , 2 ) no forma un vector euclidiano en el plano de movimiento, tambien se ve otro aspecto
interesante: las coordenadas generalizadas no necesariamente tienen dimensiones de longitud (en este caso son
adimensionales), en general las coordenadas generalizadas pueden tener cualquier tipo de dimension.
Dado que cuando las ligaduras son holonomas las coordenadas dependientes se pueden eliminar, estos
problemas son accesibles para solucionarse al menos formalmente. Las ligaduras no holonomas deben tratarse
1
Usualmente debido a alguna fuerza externa que introduce la dependencia temporal en la ecuacion de ligadura.
2
En este caso, dos ligaduras estan asociadas a condiciones iniciales (la ausencia de una componente z de las velocidades iniciales
de las lentejas), y otras dos estan asociadas a fuerzas de ligadura (las tensiones de las cuerdas).
16 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE
Figura 2.1: Ilustracion de un pendulo doble. Un conjunto conveniente de coordenadas son los angulos 1 y 2
medidos con respecto a la vertical, siempre que el movimiento se restrinja a un plano.
cada una por aparte y no hay una estrategia general de solucion. Es importante enfatizar que para que
las ligaduras sean holonomas es necesario que las funciones f no contengan como argumento, derivadas u
operadores diferenciales de la posicion3 .
De momento nos limitaremos a ligaduras holonomas para las cuales es mas sencillo el conteo de grados de
libertad. Recordemos que una segunda dificultad cuando nos encontramos con ligaduras es el hecho de que las
fuerzas de ligadura son desconocidas y en general difciles de hallar. Para obviar este problema sera deseable
obtener un formalismo en el cual las fuerzas de ligadura no esten includas. Esta es la principal motivacion
para introducir el llamado principio de DAlembert.
N
X
Fi pi = 0 (Fi pi ) ri = 0
i=1
3
Cuando hay operadores diferenciales es en algunos casos posible tener ligaduras integrables que permitan reducir las variables
dependientes con facilidad. Incluso cuando las ligaduras no son integrables, el metodo de multiplicadores de Lagrange puede hacer
esta funcion, pero volveremos sobre eso mas adelante.
2.3. COORDENADAS GENERALIZADAS Y ECUACIONES DE LAGRANGE 17
como la idea es eliminar a las fuerzas de ligadura de la formulacion, haremos la separacion de Fi entre las
(a)
fuerzas aplicadas Fi y las fuerzas de ligadura fi
(a)
Fi = Fi + fi
N
X N
X
(a)
Fi pi ri + fi ri = 0
i=1 i=1
a continuacion nos restringiremos a sistemas en los cuales los trabajos virtuales netos asociados a las fuerzas de
ligadura se anulan. Es facil ver que esta condicion se cumple en gran numero de casos, por ejemplo la tension
de la cuerda no realiza trabajo sobre la lenteja de un pendulo (ni virtual ni real). En una montana rusa sin
rozamiento, la normal no hace trabajo sobre el movil. En un cuerpo rgido las fuerzas de ligadura son fuerzas
internas que obligan a las partculas a conservar sus distancias relativas, lo cual conduce a que no hayan cambios
en la energa interna, es decir que no hay trabajo realizado por estas fuerzas internas de ligadura. Cuando
intervienen fuerzas de friccion por deslizamiento no se cumple esta condicion de tal manera que debemos excluir
esta situacion de nuestra formulacion actual4 . Sin embargo, el rozamiento estatico de rodadura no viola esta
condicion ya que no realiza trabajo real ni virtual. Vale la pena anotar que si una partcula esta restringida
a una superficie o curva que a su vez se desplaza en el tiempo, la fuerza de ligadura es instantaneamente
perpendicular a la superficie o curva de modo que el trabajo virtual es cero, aunque el trabajo real en un
intervalo dt no es necesariamente cero (ver Refs. [5, 6] y problema 2.2). Esta ultima observacion justifica la
introduccion de los desplazamientos virtuales, ya que eliminan muchas fuerzas de ligadura que no se eliminan
con los desplazamientos reales.
Asumiendo entonces que las fuerzas de ligadura no producen trabajos virtuales, se tiene que
N
X
(a)
Fi pi ri = 0 (2.4)
i=1
a la expresion (2.4), se le conoce como principio de DAlembert. Hemos logrado nuestro objetivo en el
sentido de exclur las fuerzas de ligadura de la formulacion. De aqu en adelante omitiremos el suprandice
(a) sobreentendiendo que las fuerzas involucradas excluyen a las ligaduras. No obstante, los coeficientes de los
desplazamientos virtuales ri no son necesariamente cero, ya que los desplazamientos virtuales ri al ser com-
patibles con las ligaduras no son en general independientes, estan conectados por las ecuaciones de ligadura. El
siguiente paso es entonces encontrar un conjunto de coordenadas generalizadas qj que sean independientes
y solo tengan en cuenta los verdaderos grados de libertad del sistema. En tal caso los desplazamientos virtuales
qj seran independientes y podremos aseverar que los coeficientes asociados a estos desplazamientos deben ser
nulos. La existencia de estas coordenadas independientes solo se puede garantizar cuando las ligaduras son
holonomas.
donde hemos hecho la suposicion de que t qk = dqk /dt qk mas adelante discutiremos esta suposicion. Tenien-
do en cuenta de nuevo la Ec. (2.5), los desplazamientos virtuales originales se conectan con los desplazamientos
virtuales en coordenadas generalizadas a traves de la relacion
n
X ri
ri = qj (2.7)
qj
j=1
en donde no se incluye la variacion temporal por la definicion de desplazamiento virtual. Como ya vimos antes,
cuando la ligadura cambia con el tiempo, es posible que solo el trabajo virtual se anule, pero no el trabajo
real. El trabajo virtual en terminos de las coordenadas generalizadas queda entonces
N
X N X
X n X n
ri
Fi ri = Fi qj = Qj qj (2.8)
qj
i=1 i=1 j=1 j=1
N
X ri
Qj Fi (2.9)
qj
i=1
en analoga con la expresion original del trabajo virtual, al termino Qj se le llama la fuerza generalizada.
Notese que Qj no necesariamente tiene dimensiones de fuerza al igual que las qj no tienen necesariamente
unidades de longitud, pero el producto Qj qj debe tener unidades de trabajo.
Nos ocuparemos ahora del segundo termino en (2.4)
N
X N
X
pi ri = mi ri ri
i=1 i=1
y usando la identidad
ri d ri d ri
mi ri = mi ri mi ri
qj dt qj dt qj
se obtiene
N
X n
N X
X
d ri d ri
pi ri = mi ri mi ri qj (2.10)
dt qj dt qj
i=1 i=1 j=1
denotaremos la energa cinetica del sistema con T de modo que el principio de DAlembert queda
Xn
d T T
Qj qj = 0 (2.14)
dt qj qj
j=1
vemos entonces que las dos primeras suposiciones (2.15) provienen de las condiciones (2.16) que resultan cuando
las coordenadas son independientes, en tanto que la tercera de las suposiciones (2.15) proviene directamente
del caracter holonomo de las ligaduras.
Por otra parte, el hecho de que las qk solo sean funciones del tiempo, implica ademas que podemos realizar
un desplazamiento virtual para una sola coordenada qk sin violar las ligaduras5 . Al ser independientes todos los
desplazamientos virtuales, podemos hacer que todos los q s sean nulos excepto un qj especfico, por tanto su
coeficiente asociado en la ecuacion (2.14) debe ser nulo. Procediendo de la misma forma con cada coordenada,
conclumos que
d T T
= Qj ; j = 1, ..., n (2.17)
dt qj qj
hay un numero n de estas ecuaciones, donde n es el numero de grados de libertad (y de coordenadas generali-
zadas).
5
Notese la importancia de que el desplazamiento sea virtual, pues si el desplazamiento es real, la dependencia temporal de las
coordenadas no permite que en general se mueva una sola coordenada en el sistema.
20 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE
Ahora veamos el caso en el cual cada una de las fuerzas Fi son derivables de una funcion potencial escalar6
V
V V V
Fi = i V = , , ; i = 1, . . . , N (2.18)
xi yi zi
en este caso las fuerzas generalizadas definidas en (2.9), se escriben como
N
X XN
ri ri
Qj = Fi = i V
qj qj
i=1 i=1
XN
V xi V yi V zi
Qj = + + (2.19)
xi qj yi qj zi qj
i=1
por otro lado, impondremos como condicion adicional, que dicho potencial sea funcion solamente de las posi-
ciones y el tiempo
V = V (r1 , . . . , rN , t) = V (x1 , . . . , xN , y1 , . . . , yN , z1 , . . . , zN ; t) (2.20)
cuando los argumentos del potencial son los dados por la Ec. (2.20), el termino a la derecha de la Ec. (2.19)
coincide con la derivada parcial de V con respecto a qj con lo cual se obtiene7
V
Qj = (2.21)
qj
reemplazando la expresion (2.21) en (2.17) y teniendo en cuenta que el potencial V no depende de las veloci-
dades generalizadas qj 8 podemos escribir
d (T V ) (T V )
=0 ; j = 1, ..., n
dt qj qj
las n ecuaciones as obtenidas se conocen como ecuaciones de Lagrange. Observese que estas ecuaciones no
requieren que las fuerzas sean conservativas, ya que el potencial puede ser funcion explcita del tiempo.
En la formulacion Lagrangiana ya vemos algunas ventajas operativas como son: (1) No aparecen las fuerzas
de ligadura, y las fuerzas aplicadas usualmente son parametros de entrada. Es decir, normalmente conocemos
la forma funcional de las fuerzas aplicadas. (2) Al no haber coordenadas dependientes, el numero de ecuaciones
es el menor posible. (3) Las ecuaciones son escalares ya que estan basadas en la energa. (4) Las ecuaciones de
Lagrange son identicas en forma en cualquier sistema de coordenadas generalizadas9 .
6
Debemos tener presente que Fi incluye las fuerzas internas y externas sobre la partcula i. Adicionalmente, el potencial V
esta asociado a todo el sistema de partculas y no a una sola partcula, razon por la cual las fuerzas sobre cada partcula se pueden
extraer de el como se observa en la Ec. (2.18).
7
P xi
Si el potencial dependiera por ejemplo de los xi , entonces V /qj tambien tendra terminos de la forma i V xi qj
de manera
que la igualdad (2.21) ya no se cumple.
8
Cuando las ligaduras son holonomas, la transformacion entre coordenadas me garantiza que si el potencial no depende de las
velocidades en las coordenadas originales, tampoco depende de las velocidades generalizadas en el nuevo sistema coordenado.
9
Por ejemplo, en coordenadas cartesianas las ecuaciones de Newton tienen la forma F = mx. Sin embargo, al cambiar a
coordenadas polares F 6= m, y la forma de las ecuaciones cambia con el cambio en el sistema coordenado.
2.3. COORDENADAS GENERALIZADAS Y ECUACIONES DE LAGRANGE 21
vemos que la energa cinetica contiene un termino independiente de las velocidades generalizadas, as como
otro lineal y otro cuadratico en dichas velocidades. Es entonces conveniente escribir la energa cinetica en la
forma
n
X n n
1 XX
T = T0 + T1 + T2 = M0 + Mj qj + Mjk qj qk (2.24)
2
j=1 j=1 k=1
N
X 2 N
X X ri ri N
1 ri ri ri
M0 mi ; Mj mi ; Mjk mi
2 t t qj qj qk
i=1 i=1 i=1
si las ecuaciones de transformacion (2.5) no dependen explcitamente del tiempo (ligaduras holonomas y
escleronomas), solo el termino cuadratico sobrevive.
En cuanto al potencial, su forma explcita en coordenadas generalizadas depende de cada sistema en
particular. En realidad, la forma del potencial es la que usualmente sugiere las coordenadas generalizadas a
usar.
d (q, t)
L (q, q, t) = L (q, q, t) + (2.25)
dt
conduce a las mismas ecuaciones de movimiento. En algunos casos particulares otras redefiniciones son posibles.
Las ecuaciones de Lagrange poseen entonces una simetra gauge o de calibracion para el Lagrangiano. Para
verificar que el Lagragiano L conduce a las mismas ecuaciones de movimiento que L, es suficiente demostrar
22 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE
que las ecuaciones de Lagrange para un Lagrangiano de la forma L = d [ (q, t)] /dt, son triviales, es decir dan
cero en ambos miembros.
d L L d d (q, t) d (q, t)
=
dt qi qi dt qi dt qi dt
n n
d X X
= qj + qj +
dt qi qj t qi qj t
j=1 j=1
n n
d X X 2 2
= ij qj +
dt qj qi qj qi t
j=1 j=1
X n
d
= qj +
dt qi qj qi t qi
j=1
Xn X n
= qj + qj +
qj qi t qi qj qi t qi
j=1 j=1
= 0
donde hemos usado el hecho de que no depende de qi . Adicionalmente, hemos tenido en cuenta que las
derivadas parciales se pueden intercambiar, siempre y cuando estas ultimas sean contnuas en todo el intervalo
espacio temporal en cuestion10 .
donde E (r, t) y B (r, t) son funciones contnuas en sus argumentos. Estos campos se pueden generar de un
potencial escalar (r, t) y uno vectorial A (r, t)
A
E = ; B=A (2.30)
t
verifiquemos que el potencial
U = q qA v (2.31)
es un potencial generalizado adecuado para reproducir la fuerza generalizada de Lorentz. En nuestro caso,
dado que el problema no tiene ligaduras, lo mas comodo es usar las coordenadas cartesianas como coordenadas
generalizadas, de modo que las coordenadas originales y las generalizadas coinciden. Las fuerzas generalizadas
son simplemente las componentes de la fuerza original (recordemos que las fuerzas generalizadas son cantidades
escalares). Calculemos la cantidad O bj U , en lo que sigue asumimos convencion de suma sobre ndices repetidos
y tendremos en cuenta que xi y xi = vi son independientes entre s. Finalmente, asumiremos que A y solo
son funciones de xi , t pero no son funciones de xi .
U = q qA v = q qAi vi
U Ai vi Ai
= q q vi qAi =q q vi
xj xj xj xj xj xj
U U Ai vi
= =q q vi qAi = qAj
xj vj vj vj vj
d U Aj Aj Aj Aj
= q xi q = q vi q
dt xj xi t xi t
definiendo el tensor de Levi-Civita ijk podemos escribir lo anterior en notacion mas compacta
Qj = q (j + t Aj ) + q (j Ai i Aj ) vi = q (j + t Aj ) + qjin nrs vi r As
Qj = q ( + t A)j + qjin vi ( A)n = q ( + t A)j + q [v ( A)]j
Qj = qEj + q [v B]j
de modo que componente a componente, este potencial genera correctamente la fuerza de Lorentz Ec. (2.29).
El Lagrangiano se escribe
1
L T U = mxi xi q + qAi xi (2.32)
2
tomemos la ecuacion de Lagrange asociada a la coordenada generalizada xk con k = 1, 2, 3
d L L d
=0 [mxk + qAk ] + qk q (k An ) xn = 0
dt xk xk dt
24 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE
mxk = qvn k An q (t Ak + vn n Ak ) qk
mxk = qvn (k An n Ak ) q (t Ak + k )
A
mxk = q [v ( A)]k q + ()k
t k
Qj = QU
QU b
j + Qj ; j = Oj U
podemos entonces definir un Lagrangiano L = T U y una fuerza generalizada Qj que no proviene de ningun
potencial, de tal manera que usando (2.26), la Ec. (2.34) queda
d L L
= Qj (2.35)
dt qj qj
esta ecuacion de Lagrange generalizada es util por ejemplo para el caso de fuerzas de friccion. Con frecuencia,
la friccion viscosa se modela como una interaccion proporcional a la velocidad, de modo que su componente x
se escribe como
Ff x = kx vx (2.36)
y similarmente para las otras componentes. Si el fludo es anisotropico, las constantes kx , ky , kz seran en general
diferentes. Supondremos sin embargo, que el medio es homogeneo y que por tanto kx , ky y kz no dependen de
la posicion ni del tiempo. Las fuerzas de friccion de este tipo se pueden derivar de una expresion de la forma
N
1X 2 2 2
= kx vix + ky viy + kz viz (2.37)
2
i=1
2.6. ALGUNAS CARACTERISTICAS DE LAS CANTIDADES GENERALIZADAS 25
donde la suma es sobre las partculas del sistema. Si el fludo en donde estan inmersas las partculas es
homogeneo, entonces sera funcion de las velocidades unicamente. A esta expresion se le conoce como funcion
de disipacion de Rayleigh. A partir de (2.37), la componente x de la fuerza de friccion sobre la iesima
partcula se escribe
Ffix =
vix
y analogamente para las otras componentes. Simbolicamente se puede escribir
Fif = vi = xi
para ver el significado fsico de la funcion de disipacion, calculemos el trabajo realizado por el fludo sobre el
sistema
N
X N
X N
X
dWf = Fif dri = Fif vi dt = (kx vix , ky viy , kz viz ) (vix , viy , viz ) dt
i=1 i=1 i=1
XN
2 2 2
dWf = kx vix + ky viy + kz viz dt = 2 dt
i=1
usando (2.12), y teniendo en cuenta que la funcion de disipacion solo depende de los ri y por tanto de los qi ,
obtenemos
XN
ri
Qj = xi =
qj qj
i=1
Las ecuaciones de Lagrange con un termino de disipacion quedan
d L L
+ =0 (2.38)
dt qj qj qj
Vemos que cuando existen fuerzas generalizadas que no provienen de un potencial generalizado (denotadas
por Qj ), el Lagrangiano no contiene toda la informacion fsica del sistema, ya que solo la parte de Qj que
s proviene de potenciales generalizados es absorbida en el. Este hecho resulta claro de la Ec. (2.35), y para el
caso especfico de fuerzas disipativas esto se ve de la Ec. (2.38) en donde la funcion de disipacion de Rayleigh
contiene informacion fsica que no posee el Lagrangiano.
observemos en primer lugar que las coordenadas qj no estan necesariamente asociadas a una partcula. Por
ejemplo, si en el pendulo doble de la Fig. 2.1 tengo una lenteja adicional en la mitad de una de las varillas, la
coordenada generalizada digamos 1 me describe la posicion de dos de las lentejas. Tampoco es necesario que la
coordenada generalizada determine la posicion de una o varias de las partculas en forma directa, por ejemplo
26 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE
una o mas coordenadas del centro de masa del sistema puede ser util como coordenada generalizada, y es bien
sabido que no necesariamente debe haber presencia de masa en este punto. Es quizas mas apropiado decir
que cada coordenada qj esta asociada al sistema. De esto se desprende que una fuerza generalizada tampoco
esta necesariamente asociada a una partcula o incluso a un subsistema, solo podemos decir en general que
esta asociada a una coordenada generalizada qj . Recordemos ademas que qj , Qj pueden tener en principio
cualquier dimension siempre y cuando Qj qj tenga dimensiones de energa. En la Ec. (2.39), Fi corresponde
a la resultante de las fuerzas internas y externas sobre la partcula i, pero hay una suma sobre todas las
partculas (las posiciones y fuerzas iniciales ri , Fi s estan asociadas a partculas), esto enfatiza el hecho de
que Qj no esta necesariamente asociado a una partcula.
Con esta misma filosofa, debemos comprender que un desplazamiento compatible con las ligaduras (real
o virtual) de una sola coordenada independiente, no necesariamente implica el desplazamiento de una sola
partcula del sistema. Tomemos de nuevo el pendulo doble de la Fig. 2.1, los angulos 1 y 2 que cada lenteja
hace con la vertical son un conjunto posible de coordenadas generalizadas independientes. Un desplazamiento
virtual 2 compatible con las ligaduras y que mantenga fijo a 1 es claro que implica solo el movimiento de
la lenteja m2 permaneciendo m1 en su lugar. Sin embargo, un desplazamiento virtual 1 de la lenteja m1
compatible con las ligaduras y que deje fija la coordenada 2 claramente requiere el movimiento de la otra
lenteja, pues mover la lenteja 1 sin mover la lenteja 2 viola las ligaduras y modifica el valor de 2 . Es claro sin
embargo, que al menos virtualmente existe un movimiento simultaneo de las dos lentejas que es compatible con
las ligaduras y que vara la coordenada 1 y deja fija la coordenada 2 . Tal movimiento consiste en desplazar
m1 de modo que l1 permanezca constante y que la lenteja m2 se mueva de tal forma que el vector relativo r12
que une a las dos masas, ejecute una translacion paralela. Nuevamente no hay una asociacion directa entre
coordenadas generalizadas y partculas del sistema.
Un conjunto de tres ejes coordenados linealmente independientes que convergen en un punto (origen) forman
un sistema de referencia respecto al cual se pueden medir cantidades fsicas tales como velocidades, desplaza-
mientos, aceleraciones, fuerzas, torques etc. Existen infinitos sistemas de referencia inerciales y no inerciales.
Una vez fijado el sistema de referencia (usualmente inercial), existen infinitos sistemas de coordenadas que se
pueden construr. En particular, para describir un sistema fsico particular es posible usar diversos sistemas
de coordenadas generalizadas para un mismo sistema de referencia. Por ejemplo, las transformaciones
(2.5) describen un cambio de sistema coordenado pero bajo el mismo sistema de referencia. En la mayor parte
del tratamiento de este texto se trabajara con transformaciones de coordenadas sin cambio en el sistema de
referencia, a menos que se indique lo contrario.
Notemos en particular que aunque el Lagrangiano puede tener un comportamiento funcional diferente
cuando se cambia de sistema coordenado (sin cambio en el sistema de referencia), su valor numerico debe
permanecer intacto ya que la energa cinetica y potencial no sufren ningun cambio (en su valor numerico). En
contraste, si se cambia de sistema de referencia claramente pueden cambiar la energa cinetica y la potencial, e
incluso es posible que haya que agregar fuerzas ficticias, por tanto un cambio en el sistema de referencia puede
alterar tanto el valor numerico como el comportamiento funcional del Lagrangiano. Es necesario entonces
diferenciar muy bien entre un cambio de sistema coordenado y un cambio de sistema de referencia.
2.8. EJEMPLOS DE USO DE LA FORMULACION LAGRANGIANA 27
1 T T T
T = m x2 + y 2 + z 2 ; = = =0
2 x y z
T T T
= mx ; = my ; = mz
x y z
1
X ri r
Qj Fi =F ; qj = x, y, z
qj qj
i=1
Qx = (Fx , Fy , Fz ) (x, y, z) = Fx
x
similarmente Qy = Fy y Qz = Fz . Con lo cual las ecuaciones de movimiento (2.17) quedan
d d d
(mx) = Fx ; (my) = Fy ; (mz) = Fz
dt dt dt
con lo cual llegamos a las ecuaciones de movimiento de Newton.
Veamos las ecuaciones de la misma partcula pero ahora en dos dimensiones y en coordenadas polares, la
transformacion a estas coordenadas generalizadas es
x = r cos ; y = r sin
por tanto11
1
T = m r 2 + r 2 2 (2.40)
2
ahora calculemos las fuerzas generalizadas, Ecs. (2.39)
r (r ur ) ur
Qr = F =F = F ur + F r = F ur = Fr (2.41)
r r r
r (r ur ) ur
Q = F =F =Fr = F ru = rF (2.42)
observese que no todas las fuerzas (y coordenadas) generalizadas tienen las mismas dimensiones. Qr tiene
dimensiones de fuerza en tanto que Q tiene dimensiones de torque (o trabajo), las coordenadas generalizadas
11
El lector puede tambien calcular la energa cinetica a partir de las Ecs. (2.24).
28 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE
respectivas tienen dimensiones de longitud y son adimensionales respectivamente, de modo que los productos
Qj qj siempre tienen dimensiones de trabajo. Escribamos las dos ecuaciones de Lagrange (2.17)12
T 2 T d T
= mr ; = mr ; = mr
r r dt r
mr mr 2 = Fr
el segundo termino es el de aceleracion centrpeta. Veamos la ecuacion asociada a
T T 2 d T
=0 ; = mr ; = mr 2 + 2mr r
dt
la ecuacion resulta
mr 2 + 2mr r = rF
se puede demostrar que el termino de la izquierda es la derivada temporal del momento angular, en tanto que
el termino de la derecha es el torque aplicado. Hemos llegado entonces a la expresion en componentes de la
Ec. (1.3).
Figura 2.2: (a) Maquina de Atwood. La longitud L = l1 +l2 +R de la cuerda es constante, y por tanto tambien
lo es l = l1 + l2 . (b) Vista aerea de una cuenta sobre un alambre que rota con velocidad angular constante ,
en ausencia de un campo gravitacional.
La maquina de Atwood mostrada en la Fig. 2.2a, consiste en una polea fija, por la cual pasa una cuerda
que se ata a dos masas m1 y m2 . Asumiremos que la cuerda no desliza sobre la polea y que la masa de la polea
y de la cuerda son despreciables. La ligadura (longitud constante de la cuerda) es holonoma y escleronoma.
Solo hay una coordenada independiente x, la otra es fijada por la ligadura de longitud constante de la cuerda.
Usando el origen en el centro de la polea, la energa potencial es
1
V = M1 gx M2 g (l x) ; T = (M1 + M2 ) x2
2
12
En este problema no podemos usar las ecuaciones de Lagrange dadas por (2.22, 2.23), puesto que no conocemos la forma
especfica de la fuerza y por tanto, no sabemos si esta posee un potencial asociado.
2.8. EJEMPLOS DE USO DE LA FORMULACION LAGRANGIANA 29
el Lagrangiano queda
1
LT V =(M1 + M2 ) x2 + M1 gx + M2 g (l x)
2
solo hay una coordenada generalizada x, y por tanto una sola ecuacion de movimiento del tipo (2.23)
L d L
= (M1 M2 ) g ; = (M1 + M2 ) x
x dt x
(M1 + M2 ) x = (M1 M2 ) g
de aqu sale el valor de la aceleracion el cual coincide con el ya obtenido por metodos tradicionales. Observese
que la fuerza de ligadura de tension no aparece en el formalismo y no se puede obtener directamente de el.
Figura 2.3: (a) Sistema de dos masas unidas por una barra sin masa. El crculo esta sobre el plano XY y
por tanto, tambien el centro de masa. Aunque cada masa puede tener una componente Z. (b) Sistema de
coordenadas esfericas para determinar la posicion de una de las masas con respecto al centro de masa.
donde v es la rapidez de cada partcula vista por el CM. Construyendo coordenadas esfericas r, , sobre
este nuevo sistema de referencia, es claro que r = l/2 de modo que para la partcula en cuestion, la posicion
esta dada por
l l l
x= sin cos ; y = sin sin ; z = cos
2 2 2
de modo que
l l l
x = ( cos cos sin sin ) ; y = ( sin cos + sin cos ) ; z = sin
2 2 2
v 2 = x2 + y 2 + z 2
l2 h 2 i
x2 = cos2 cos2 2 cos cos sin sin + 2 sin2 sin2
4
l2 h 2 2 i
y 2 = sin cos2 + 2 sin cos sin cos + 2 sin2 cos2
4
l2 2 2
z 2 = sin
4
adicionandolos se obtiene
32 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE
l2 2
v 2 = [ cos2 (cos2 + sin2 ) + 2 sin2 (sin2 + cos2 ) + 2 sin2 ]
4
l2 h 2 i
v 2 = cos2 + sin2 + 2 sin2
4
l2 2
v 2 = ( + 2 sin2 )
4
y la energa cinetica total queda
T = TCM + T = ma2 2 + mv 2
l2 2
T = ma2 2 + m + 2 sin2
4
teniendo en cuenta que la componente Z de cada partcula es igual en XY Z que en XC YC ZC y que en el
sistema de referencia del CM las posiciones de las dos partculas son opuestas, tenemos V = mgz mgz = 0.
De modo que el Lagrangiano coincide con la energa cinetica.
Puede verse que , , son coordenadas generalizadas independientes ya que cada una se puede mover
en un desplazamiento virtual, sin modificar las otras coordenadas y sin violar las ligaduras. Podemos verlo
tambien por un conteo de grados de libertad: los seis grados de libertad originales para dos partculas, se
pueden traducir en tres grados de libertad de la posicion del centro de masa, y tres mas del vector posicion
relativo entre las dos partculas. La ligadura de mover el CM en un crculo, nos lleva a un solo grado de libertad
para fijar el CM (el angulo ), los tres grados de libertad del vector relativo se reducen a dos por la ligadura
de distancia constante que impone la barra.
Figura 2.4: (a) Aro que rueda sin deslizar sobre un plano inclinado o cuna que desliza sobre el suelo sin
rozamiento. (b) Ilustracion de las coordenadas generalizadas (, S) y de la geometra basica del problema.
Un aro de masa m y radio R rueda sin deslizar sobre un plano inclinado o cuna de masa M que hace un
angulo con la horizontal como se ve en la Fig. 2.4. Encuentre el Lagrangiano y las ecuaciones de Lagrange
si el plano inclinado puede deslizar sin friccion a lo largo del suelo.
Tomaremos como coordenadas generalizadas una coordenada que indica la posicion del plano inclinado
(desde el origen hasta el vertice en angulo recto del plano inclinado), y una coordenada S medida desde el
vertice superior de la cuna, hasta el punto de contacto del aro con la cuna. La longitud total de la cuna se
2.8. EJEMPLOS DE USO DE LA FORMULACION LAGRANGIANA 33
denota por l, y las coordenadas del centro del aro con respecto al origen seran x, y. La Fig. 2.4 nos muestra
que estas coordenadas vienen dadas por
usando estas coordenadas, teniendo en cuenta que el momento de inercia de un aro es I = mR2 y que S = R
por la condicion de rodadura, la energa cinetica del aro quedara en la forma
2 2 1
1 2 2
1 2 1 S 2
Thoop = m x + y + I = m + S cos + S sin + mR2
2 2 2 2 R2
de modo que
1 h 2 i 1
Thoop = m + S 2 cos2 + 2S cos + S 2 sin2 + mS 2
2 2
1 h 2 i
= m 2S + 2 + 2S cos
2
pero la energa cinetica total debe inclur el movimiento translacional de la cuna a lo largo de x
1
Tplane = M 2
2
la energa total es entonces
1
T = Thoop + Tplane = mS 2 + (m + M ) 2 + m S cos
2
y la energa potencial nos da
V = mgy = mg [R cos + (l S) sin ]
no es necesario inclur la energa potencial asociada a la cuna ya que esta no cambia. El Lagrangiano queda
entonces
1
L = mS 2 + (m + M ) 2 + m S cos mg [R cos + (l S) sin ] (2.51)
2
De modo que
d L d L
= 2mS + m cos = 2mS + m cos ; = mg sin
dt S dt S
d L d h i L
= (m + M ) + mS cos = (m + M ) + mS cos ; =0
dt dt
Es importante tener en cuenta que la energa cinetica traslacional del aro no se puede escribir en la forma 12 mS 2 ,
ya que S esta medida con respecto al vertice superior de la cuna, que no define un sistema inercial. Esto debido
al movimiento (en general acelerado) de la cuna con respecto al origen fijo en el suelo (que s se supone inercial).
donde r es la distancia de la partcula al centro de fuerzas y c la velocidad de la luz en el vaco. Esta expresion
representa la fuerza entre dos cargas en la electrodinamica de Weber. Queremos plantear un Lagrangiano
asociado a este sistema.
La partcula se mueve en un plano, pero no tiene ligaduras dentro del plano. Lo natural es entonces utilizar
coordenadas generalizadas polares r y . Ya calculamos las expresiones para las fuerzas generalizadas de una
partcula no ligada en coordenadas polares Ecs. (2.41, 2.42) Pag. 27. Puesto que esta fuerza es central tenemos
que Q = rF = 0 y Qr = Fr = F .
Se puede verificar que el potencial dado por
1 r 2
U (r, r) = + 2 (2.55)
r c r
es un potencial generalizado valido para reproducir el valor de la fuerza generalizada Qr = F , donde F es
dado en (2.54). Para verlo partimos de las expresiones (2.26, 2.27) para el potencial y la fuerza generalizados,
de modo que la fuerza generalizada asociada al potencial en (2.55) es
U d U
Qr = Fr = + (2.56)
r dt r
U 1 r 2 d U d 2r 2r r 2r 2r 2 2r
= 2 2 2 ; = 2
= 2
2
+ 2 = 2 2 + 2
r r c r dt r dt c r c r c r c r c r
con lo cual
U d U 1 r 2 2r 2 2r 1 r 2 2r 1 r 2 2rr
+ = 2+ 2 2 2 2+ 2 = 2 2 2+ 2 = 2 1
r dt r r c r c r c r r c r c r r c2
que reproduce la expresion (2.54) de la fuerza. Para qj , tambien se cumple la condicion (2.27) obteniendose
cero en ambos miembros. Pues no debe perderse de vista que U debe reproducir todas las fuerzas generalizadas
asociadas al problema.
Hay dos puntos que vale la pena enfatizar: (a) Los potenciales generalizados deben reproducir la fuerza ge-
neralizada y no la fuerza real (aunque en este caso ambas coinciden en magnitud). (b) El potencial generalizado
no tiene porque ser unico, ya que solo se busca una solucion a la ecuacion diferencial (2.27), sin condiciones
iniciales ni de frontera. La no unicidad del potencial generalizado es de esperarse, puesto que incluso el poten-
cial tradicional no es unico. Por supuesto, el potencial generalizado tiene un gauge mas complejo, ya que si
redefinimos el potencial generalizado en la forma
es claro que U (q, q, t) reproduce las mismas fuerzas generalizadas que U (q, q, t). En particular W = cte es un
gauge posible.
Usando la energa cinetica (2.40) para una partcula en coordenadas polares y el potencial generalizado
(2.55) el Lagrangiano queda
1 1 r 2
L = T U = m r 2 + r 2 2 1+ 2
2 r c
puede el lector encontrar una forma sistematica de encontrar un potencial generalizado, por medio de la
ecuacion (2.56) y la expresion (2.54) para la fuerza?.
2.8. EJEMPLOS DE USO DE LA FORMULACION LAGRANGIANA 35
kz kz Z kz
z + g + z = 0 Z + Z = 0 =
m m Z m
cuya solucion es
kz kz
ln Z = t + B Z = Ce m t
m
mg kz
z + = Ce m t (2.61)
kz
tomando la condicion inicial z (t = 0) = v0 , en esta ecuacion se tiene que
mg
v0 + =C
kz
con lo cual la ecuacion (2.61) queda
mg kz mg
z = + v0 e m t (2.62)
kz kz
la velocidad terminal se puede obtener haciendo t , con lo cual se reproduce adecuadamente el valor dado
en la Ec. (2.60). Notese que por los dos caminos seguidos, es claro que la velocidad terminal es independiente
del valor (y del signo) de v0 . En particular, si |v0 | > |zterm | y la partcula va inicialmente hacia abajo (v0 < 0),
la fuerza viscosa disminuye la rapidez de la partcula hasta que alcanza el valor de la velocidad terminal, esto
debido a que inicialmente la fuerza viscosa supera en magnitud al peso. El lector puede obtener facilmente
z (t) integrando (2.62).
36 CAPITULO 2. PRINCIPIO DE DALEMBERT Y ECUACIONES DE LAGRANGE
Se puede demostrar que el Lagrangiano (2.63) y la funcion de disipacion (2.64) junto con las ecuaciones
de Lagrange con termino disipativo Ecs. (2.38), reproducen las ecuaciones diferenciales que describen a un
conjunto de circuitos RLC con fuentes, y acoplados a traves de las inductancias mutuas Mjk . Los valores
Lj , Cj , Vj denotan inductancias, capacitancias y voltages de fuentes respectivamente. qj denota las cargas
electricas que en este caso han sido tomadas como las variables dinamicas (y por tanto, como las coordenadas
generalizadas), este no es un ejemplo mecanico en el sentido de que las cargas no denotan de ningun modo
posiciones de las partculas o subsistemas. No obstante, el sistema tiene un analogo mecanico: la inductancia es
una medida de la resistencia al cambio en el flujo de carga, de modo que es un termino de inercia, caso similar
el de las inductancias mutuas16 . El capacitor actua como una fuente de energa potencial del tipo oscilador
armonico simple17 , la resistencia proporciona un termino disipativo tipo Stokes (proporcional a la velocidad
generalizada), y finalmente la fuerza electromotriz equivale a un forzamiento externo que se traduce en una
energa potencial de la forma qj Vj (siendo Vj el voltage en un instante).
Finalmente, cabe resaltar que en el caso de ligaduras holonomas, en el cual es posible encontrar un con-
junto mnimo de coordenadas independientes, el sistema de ecuaciones Lagrangianas se reduce con respecto al
formalismo Newtoniano. Esto se debe a que cada ecuacion de movimiento esta asociada a una coordenada y
no a una partcula, y claramente el numero de coordenadas independientes es menor o igual que 3N , siendo
N el numero de partculas.
2.10. Ejercicios
1. Tres masas se acoplan por medio de cuerdas en serie, para formar un pendulo triple similar al de la Fig.
2.1. (a) Encuentre un conjunto apropiado de coordenadas generalizadas independientes. (b) Describa un
desplazamiento virtual para cada coordenada, de modo que las otras se mantengan fijas. (c) Plantee el
Lagrangiano asociado. Puede asumir que todas las masas se mueven en un plano.
2. Sea un sistema de referencia inercial S y un plano inclinado que esta en reposo con respecto a S. Sobre el
plano inclinado desliza un bloque de masa m. Tomemos ahora otro sistema de referencia inercial S que
se mueve a una velocidad constante v = vux con respecto a S. (a) Demuestre que la fuerza normal del
plano inclinado sobre el bloque realiza trabajo (real) sobre el bloque, visto por el sistema de referencia
S . (b) Demuestre que el trabajo virtual de la normal sobre el bloque es cero, tanto en S como en S .
(Para mas comentarios ver Refs. [5, 6]).
15
Hay que aclarar sin embargo que esta caracterstica no solo la presenta la formulacion Lagrangiana, en realidad las ecuaciones
diferenciales en la mecanica Newtoniana ya presentan estas analogas.
16
La suma de los terminos con autoinductancias e inductancias mutuas dan una energa cinetica que solo depende cuadratica-
mente de las coordenadas generalizadas. Lo cual equivale en el caso mecanico a escenarios con ligaduras escleronomas (ver seccion
2.3.1, Ec. 2.24).
17
Efectivamente, se requiere una cierta energa para cargar el condensador, esta energa queda almacenada y se puede intercambiar
en otra forma de energa.
2.10. EJERCICIOS 37
3. Demuestre que las ecuaciones de Lagrange del tipo dado en (2.17) se pueden escribir equivalentemente
en la forma
T T
2 = Qj
qj qj
usualmente conocidas como ecuaciones de Nielsen.
4. Encuentre el Lagrangiano y las ecuaciones de Lagrange de un pendulo esferico. Esto es, una masa puntual
en un campo gravitacional, que se mueve de modo que su distancia a un punto fijo permanece constante
(debido por ejemplo, a una varilla rgida sin masa). Plantee un Lagrangiano para pequenas oscilaciones
en las coordenadas generalizadas apropiadas.
5. Obtenga el Lagrangiano y las ecuaciones de movimiento del pendulo doble ilustrado en la Fig. 2.1 Pag.
16, asumiendo que el movimiento se realiza en un plano. Plantee el Lagrangiano en una aproximacion de
pequenas oscilaciones para ambas coordenadas generalizadas 1 y 2 .
6. Supongamos una masa m1 que se mueve con movimiento circular uniforme, debido a que esta atada a
una cuerda de longitud constante. Por otro lado, una partcula sometida a una fuerza central atractiva
de la forma F = kr 2 ur , puede realizar un movimiento circular uniforme con las condiciones iniciales
apropiadas (ver captulo 10). No obstante, la fuerza que mantiene la distancia constante en el primer
problema (tension de la cuerda) se considera una fuerza de ligadura. En contraste, aunque la fuerza F =
kr 2 ur mantenga constante la distancia de la partcula al centro de fuerzas, esta NO se trata como
fuerza de ligadura. En que consiste la diferencia?.
7. Encuentre un potencial generalizado U que difiera de manera no trivial del potencial U en la Ec. (2.55)
y que genere las mismas fuerzas generalizadas.
Captulo 3
Suplemento matematico: calculo de variaciones y
multiplicadores de Lagrange
Existen muchos problemas de minimizacion o maximizacion que requieren de extender las herramientas
tradicionales del calculo. Es frecuente encontrar problemas en los cuales una trayectoria completa se mapea en
un numero real y queremos encontrar la trayectoria que minimiza o maximiza dicho numero. En el presente
captulo estudiaremos el calculo variacional, como herramienta para resolver esta clase de situaciones. Por otra
parte, cuando un proceso de optimizacion esta sujeto a ligaduras, el metodo de multiplicadores de Lagrange
es una herramienta sistematica para encontrar los extremos de una funcion sin violar las ligaduras impuestas.
Veremos mas adelante que la combinacion de las dos herramientas nos generara una formulacion lagrangiana
con la capacidad de inclur y resolver las fuerzas de ligadura.
38
3.1. ALGUNOS PROBLEMAS PRACTICOS DE NATURALEZA VARIACIONAL 39
donde ds denota una longitud de arco infinitesimal de la trayectoria, la expresion queda finalmente
Z s
x2
1 + y 2 dy
t= dx ; y (x) (3.1)
x1 =0 2gx dx
por tanto sera necesario encontrar el valor de y (x) que hace que la integral (3.1) nos de el menor valor posible.
En calculo ordinario los problemas de minimizacion usualmente consisten en encontrar el valor de un punto
(por ejemplo sobre la recta real) de modo que una cierta cantidad (funcion) nos de un valor mnimo al evaluarla
en ese punto. En contraste, aqu requerimos encontrar una trayectoria completa que haga que cierta cantidad
sea mnima, puesto que lo que tenemos en este problema es una trayectoria completa que se mapea en un
numero (el tiempo).
Figura 3.1: Solido de revolucion generado alrededor de Y . (x1 , y1 ) y (x2 , y2 ) son puntos fijos y se busca la curva
generadora que pase por estos puntos y que minimice la superficie lateral del solido.
Consideremos la superficie lateral generada por una curva que une dos puntos fijos (x1 , y1 ) y (x2 , y2 ) cuando
se revoluciona alrededor de un eje coplanar con los puntos y la curva (ver Fig 3.1). La idea es encontrar la
ecuacion de la curva en cuestion a fin de que el area lateral generada por este solido de revolucion sea mnima.
Planteamiento: Asumiremos que la curva con extremos fijos se revoluciona alrededor del eje Y . Para
calcular el area lateral total de revolucion, calculamos primero el diferencial de area dA sobre una pequena
tira como se muestra en la figura 3.1. Dicho diferencial viene dado por
s 2
q
2 2 dy
dA = 2x ds = 2x (dx) + (dy) = 2x 1+ dx
dx
nuevamente ds es la longitud infinitesimal de arco asociada a la curva. La expresion final para el area queda
Z x2 p dy
A = 2 x 1 + y 2 dx ; y (3.2)
x1 dx
de nuevo la minimizacion del area consiste en encontrar una trayectoria completa que minimice tal cantidad.
40 CAPITULO 3. CALCULO VARIACIONAL Y MULTIPLICADORES DE LAGRANGE
adquiera un valor estacionario relativo a caminos vecinos que difieren infinitesimalmente del original. En nuestro
caso, consideraremos solo los caminos que cumplen la condicion y (x1 ) = y1 , y (x2 ) = y2 , ya que esta condicion
siempre se impone en el principio de Hamilton. Esto se denomina condicion de extremos fijos. Si hacemos
3.2. ASPECTOS FUNDAMENTALES DEL CALCULO DE VARIACIONES 41
una grafica de y vs x, para varias trayectorias posibles, encontramos que todas ellas deben converger en los
extremos de la grafica, a los puntos (x1 , y1 ) y (x2 , y2 ). Notese que la grafica y vs x no representa el espacio
de configuraciones, ya que este ultimo no contiene ningun eje que represente al parametro. En este caso, el
espacio de configuraciones es de una sola dimension, todos los caminos posibles son lneas rectas que conectan
a y1 con y2 . En consecuencia, lo que distingue a los diferentes caminos es su dependencia con el parametro x.
Vale decir que la coordenada y es generalizada y por tanto no tiene necesariamente dimensiones de longitud.
Ahora parametrizaremos el problema de tal manera que se pueda hacer uso del calculo ordinario. Cuando
partimos del camino correcto, la variacion de J debe ser cero con respecto al cambio a una familia de caminos
vecinos que rotularemos con alguna variable infinitesimal . Denotaremos a las trayectorias vecinas como
y (x, ), donde y (x, 0) es el camino correcto. Por ejemplo, si seleccionamos una funcion arbitraria (x) pero
que cumpla con la condicion de que se anula en los extremos i.e. en x = x1 y x = x2 una posible familia de
caminos vecinos estara definida por
y (x, ) = y (x, 0) + (x) (3.6)
claramente, esta familia de funciones converge en sus extremos gracias a la condicion impuesta a (x) de
nulidad en los extremos. Asumiremos de aqu en adelante que el camino correcto y (x, 0) y la funcion (x)
son de clase C 2 (contnuas y no singulares hasta la segunda derivada en todos sus argumentos) en el intervalo
[x1 , x2 ]. Con cualquier familia de curvas en la vecindad de y (x), el variacional J es funcion de
Z x2
J () = f (y (x, ) , y (x, ) , x) dx (3.7)
x1
dado que hemos definido que la curva correcta se encuentre cuando = 0, la condicion de punto estacionario
para J se puede ahora expresar en terminos de cantidades del calculo ordinario en la forma
dJ
=0 (3.8)
d =0
derivando la Ec. (3.7) bajo el signo integral de la forma usual, tenemos
Z x2
dJ f y f y
= + dx (3.9)
d x1 y y
naturalmente se asume que x/ = 0 ya que es un parametro que me caracteriza cada curva en tanto que
x se mueve a lo largo de cada curva (con fijo) claramente los dos son independientes1 . Veamos la segunda
integral en el miembro derecho de la Ec. (3.9)
Z x2 Z x2 Z x2
f y f y f y
dx = dx = dx (3.10)
x1 y x1 y x x1 y x
para integrar por partes elegiremos
f y
u= ; dv = dx
y x
h i
con lo cual du = d f = dxd f
dx puesto que en la integral solo se hace variacion en el parametro x.
y y
y
Por otro lado, v = , y al integrar por partes queda
Z Z x2
x2
f y f y x2 d f y
dx = dx (3.11)
x1 y x y x1 x1 dx y
donde la continuidad hasta segundas derivadas de y (x, ) asegura que el intercambio de las derivadas parciales
es posible. Teniendo en cuenta que todas las curvas deben pasar a traves de los puntos (x1 , y1 ) y (x2 , y2 ), se
1
En la Ec. (3.6) el termino (x) que determina la desviacion del camino variado con respecto al camino real, tiene toda su
dependencia de la variable x en la funcion (x).
42 CAPITULO 3. CALCULO VARIACIONAL Y MULTIPLICADORES DE LAGRANGE
llega a que la derivada parcial de y con respecto a deben ser cero en x1 y en x2 . En consecuencia, el primer
termino de la derecha en (3.11) se anula y por tanto, la integral (3.10) queda
Z x2 Z x2
f y d f y
dx = dx (3.12)
x1 y x1 dx y
reemplazando (3.12) en (3.9) se obtiene
Z x2
dJ f d f y
= dx (3.13)
d x1 y dx y
Combinando (3.8) con (3.13) se ve que la condicion para que J adquiera un valor estacionario es
Z x2
dJ f d f y
= dx = 0 (3.14)
d =0 x1 y dx y =0
por otro lado, la expresion (y/)=0 es una funcion arbitraria de x excepto por exigencias de continuidad
hasta la segunda derivada y la condicion de extremos fijos. Por ejemplo, para el conjunto particular de familias
definidas por (3.6) el factor (y/)=0 viene dado por la funcion arbitraria (x). Aplicaremos ahora a la Ec.
(3.14) el lema fundamental del calculo de variaciones, segun el cual si se cumple
Z x2
M (x) (x) dx = 0 (3.15)
x1
para todas las funciones arbitrarias (x) contnuas hasta la segunda derivada, entonces M (x) debe ser identi-
camente cero en el intervalo (x1 , x2 ). La demostracion formal se puede encontrar en los textos de calculo
variacional pero se puede dar una vision eurstica de este lema: Imaginemos que construmos una funcion (x)
que es positiva en una vecindad de un cierto punto y cero en las otras regiones, en consecuencia la integral
(3.15) solo sera valida si M es cero en este punto arbitrariamente escogido. Por tanto, M debe ser cero en todo
el intervalo de integracion. Usando este lema para la expresion (3.14) se obtiene
f d f
=0 (3.16)
y dx y
esta ecuacion diferencial nos da entonces como solucion la trayectoria y = y (x) que deja estacionaria la
cantidad J. Ahora bien, la desviacion infinitesimal de un camino dado con respecto al camino correcto y (x, 0)
en el punto x viene dado por
y (x, )
d y (x) (3.17)
=0
como en esta variacion el parametro x es fijo, el desplazamiento anterior corresponde a los desplazamientos
virtuales de las coordenadas generalizadas discutidos en la formulacion de Lagrange (en la formulacion de
Lagrange, el parametro es el tiempo y permanece fijo cuando se hace un desplazamiento virtual de la coordenada
generalizada) por eso la notacion y. Por otro lado, la variacion de J con respecto a su valor cuando se toma
el camino correcto es
dJ
d J (3.18)
d =0
la estacionaridad del variacional J cuando se evalua sobre el camino correcto se manifiesta entonces como
J = 0. Multiplicando la Ec. (3.14) por d y usando (3.17) y (3.18) resulta
Z x2
f d f
J = y dx = 0 (3.19)
x1 y dx y
requiriendo que y (x) satisfaga la ecuacion (3.16). La variacion de una integral de lnea usualmente se denota
como para diferenciarla de la variacion de una funcion ordinaria. La Ec. (3.19) no contiene informacion
nueva con respecto a (3.14) pero resulta mas adecuada para una extension del formalismo cuando tenemos n
coordenadas generalizadas como veremos a continuacion.
3.3. SOLUCION DE LOS PROBLEMAS DE APLICACION PLANTEADOS 43
donde todas las variables yi , yi son independientes entre s, y solo pueden depender del parametro x. En este
caso tenemos una hipertrayectoria correcta y una familia posible de hipertrayectorias vecinas se puede escribir
como
yi (x, ) = yi (x, 0) + i (x) ; i = 1, . . . , n (3.21)
donde yi (x, 0) con i = 1, . . . , n, denotan la solucion (trayectoria correcta en el espacio de configuraciones).
Las i (x) son independientes entre s, pero deben anularse en los extremos y ser contnuas hasta la segunda
derivada, por lo demas son completamente arbitrarias. Un calculo semejante al anterior nos conduce a
Z 2X n
J f yi f yi
d = d + d dx
1 yi yi
i=1
dado que las coordenadas generalizadas son independientes, sus variaciones yi tambien lo son2 . Por ejemplo,
para la familia de curvas vecinas definidas por la Ec. 3.21, equivale a que los i (x) sean independientes. En
virtud de la independencia de los yi , si la suma sobre i en la Ec. (3.23) es nula, debe ser nulo cada sumando.
Apelando entonces al lema fundamental del calculo variacional, se llega a que la condicion de estacionaridad
J = 0 nos lleva a
f d f
= 0 , i = 1, . . . , n (3.25)
yi dx yi
las soluciones yi (x) forman entonces la trayectoria en el espacio de configuraciones que hace de J un valor
estacionario. Estas ecuaciones se conocen como las ecuaciones de Euler-Lagrange. Se pueden estudiar gene-
ralizaciones a variacionales en donde por ejemplo la funcion f dependa de derivadas superiores de y, existan
varios parametros xj o se relaje la condicion de extremos fijos. Para el analisis del principio de Hamilton que
se vera en el captulo 4, las condiciones aqu trabajadas son lo suficientemente generales.
de las expresiones !
f d f d y
=0 ; = p
y dx y dx 1 + y 2
usando la Ec. (3.16) resulta !
d y
p =0
dx 1 + y 2
el termino entre parentesis debe ser constante
!
y
p =c
1 + y 2
ahora bien, para que se cumpla esta relacion es necesario que a su vez y sea una constante relacionada con c
(aunque esta relacion no es relevante), de lo cual se obtiene la ecuacion de la trayectoria
y = a y = ax + b
que corresponde a una lnea recta, las constantes de integracion a y b se determinan con los puntos fijos de la
trayectoria. Estrictamente, solo se ha demostrado que la trayectoria da un valor estacionario para la longitud
de arco pero sabemos por intuicion que corresponde a un mnimo. En realidad se puede encontrar el tipo de
extremo a traves de la segunda derivada funcional.
f
como y = 0 la ecuacion de Euler Lagrange queda
d f f 1
=0 = cte
dx y y 2a
y 1 y 2 1
p = 2
= 2ay 2 = x 1 + y 2
x (1 + y 2 ) 2a x (1 + y ) 2a
x x2
y 2 = =
(2a x) (2ax x2 )
x = a (1 cos ) ; y = a ( sin )
que coinciden con las ecuaciones parametricas del cicloide, con parametro . Este perfil especfico del cicloide
se denomina una braquistocrona.
f f xy
=0 ; =p
y y (1 + y 2 )
46 CAPITULO 3. CALCULO VARIACIONAL Y MULTIPLICADORES DE LAGRANGE
despejando y Z
a a dx
y = p ; y= p
(x2 a2 ) (x2 a2 )
esta integral nos da x
y = a cosh1 +b
a
donde a y b son constantes de integracion que se determinan requiriendo que la curva pase por los puntos
(x1 , y1 ) y (x2 , y2 ). Esta ecuacion se puede invertir para escribir
yb
x = a cosh
a
que se reconoce como la ecuacion de la catenaria, que es la curva que se forma cuando una cuerda flexible
cuelga libremente entre dos puntos fijos en un campo gravitacional uniforme.
Notese que si definimos x = x/a y y = y/a obtenemos
x = cosh y b/a
obtenemos una ecuacion con un solo parametro b/a. Es decir, un reescalamiento de la curva nos deja un solo
parametro relevante.
Para algunos pares de puntos fijos se puede encontrar un conjunto unico de constantes de integracion a
y b. Para otros puntos es posible encontrar dos catenarias a traves de los puntos fijos en tanto que en otros
casos no hay solucion para los valores de a y b. Adicionalmente, solo hemos demostrado que la curva deja a
la superficie en un valor estacionario, de modo que la catenaria no siempre representa un valor mnimo, en
algunos casos representa un punto de inflexion. Para algunas combinaciones de pares de puntos fijos el mnimo
absoluto en la superficie de revolucion se genera a partir de una curva compuesta de segmentos de lnea recta.
Esta clase de solucion no se puede encontrar con el formalismo presentado aqu, ya que en nuestra formulacion
las f (, x) y las (x) se consideran contnuas hasta la segunda derivada, en tanto que la curva descrita arriba
no es derivable en los puntos de quiebre entre segmentos.
Las anteriores consideraciones muestran las restricciones que se derivan de nuestra formulacion sobre la
condicion variacional estacionaria.
df = 0 (3.30)
es decir
f f f
df = dx1 + dx2 + dx3 = 0 (3.31)
x1 x2 x3
3.4. LIGADURAS Y MULTIPLICADORES DE LAGRANGE (OPCIONAL) 47
dado que las variables son independientes, podemos variar por ejemplo x1 sin variar x2 y x3 de modo que
dx2 = dx3 = 0 con lo cual x1 f = 0. Procediendo identicamente con las otras variables vemos que la condicion
necesaria y suficiente para tener un extremo es
f f f
= = =0 (3.32)
x1 x2 x3
sin embargo ocurre con frecuencia que las variables que se utilizan a priori para describir al sistema no son
independientes. En muchos casos la ligadura se puede escribir en forma de una ecuacion de la forma
(x1 , x2 , x3 ) = 0 (3.33)
en este caso la Ec. (3.32) no necesariamente se cumple ya que las variables no se pueden mover independiente-
mente. Una forma de tratar el problema es despejar una variable de modo que nos quedamos con dos variables
independientes y hacemos el tratamiento normal con dos variables independientes. Sin embargo, este despeje
puede ser muy difcil en la practica, por lo cual exploraremos un metodo alternativo conocido como el metodo
de los multiplicadores indeterminados de Lagrange.
De la Ec. (3.33), es claro que d = 0, de modo que se cumple una relacion similar a (3.31) que escribiremos
en la forma
dx3 = dx1 + dx2
x3 x1 x2
con lo cual tenemos
f f x f
df = dx1 + dx2 + 3 dx3
x1 x2 x3 x3
f f x3 f
= dx1 + dx2 dx1 + dx2
x1 x2 x3 x1 x2
f f x f
df = dx1 + dx2 + dx1 + dx2 ; 3 (3.34)
x1 x2 x1 x2 x3
donde hemos supuesto que x3 6= 0. Notese que con este procedimiento, hemos logrado que la expresion de
df quede en terminos solo de los diferenciales independientes dx1 y dx2 . Escribamos ahora
f f f
df + d = dx1 + dx2 + dx3 + dx1 + dx2 + dx3
x1 x2 x3 x1 x2 x3
f
+ =0 (3.36)
x3 x3
siempre que x3 6= 0. La Eq. (3.35) queda de la forma
f f
+ dx1 + + dx2 = 0
x1 x1 x2 x2
y dado que x1 y x2 se pueden variar independientemente, cada termino entre parentesis debe anularse
f f
+ =0 ; + =0 (3.37)
x1 x1 x2 x2
48 CAPITULO 3. CALCULO VARIACIONAL Y MULTIPLICADORES DE LAGRANGE
cuando se cumplen las Ecs. (3.36, 3.37) se tiene que df = 0 y f es un extremo (o punto de silla). Si anadimos la
ecuacion de ligadura (3.33) tendremos cuatro ecuaciones con cuatro incognitas x1 , x2 , x3 , . Notese sin embargo
que en general nuestro interes es calcular los xi , de modo que no necesita ser hallado. Por esta razon, a se
le denomina multiplicador indeterminado de Lagrange. Es claro que el metodo falla cuando todos los
coeficientes de se anulan en el extremo i.e. si
= 0 para i = 1, 2, 3;
xi xi =xi,0
donde (x1,0 , x2,0 , x3,0 ) es el punto donde se ubica el extremo de f . En este caso resulta imposible despejar .
En lo anterior hemos identificado a f como la funcion que toma un valor extremo y la ecuacion que
expresa la ligadura. Sin embargo, la forma de las Ecs. (3.36, 3.37) nos muestran que podemos intercambiar los
papeles de estas funciones.
k (x1 , . . . , xn ) = 0 ; k = 1, . . . , m (3.38)
con m n. Multipliquemos cada ecuacion de ligadura por un factor k
es claro que
m n m
" n #
X X f X X k
df + k dk = dxi + k dxi
xi xi
k=1 i=1 k=1 i=1
m n
( m
)
X X f X k
df + k dk = + k dxi
xi xi
k=1 i=1 k=1
Pm
y dado que df = dk = 0 tenemos que df + k=1 k k = 0 de modo que
n
( m
)
X f X k
+ k dxi = 0 (3.39)
xi xi
i=1 k=1
como los xi no son independientes, los terminos entre parentesis no necesariamente son nulos. No obstante,
podemos ahora elegir las m n primeras variables como independientes, en tanto que las m ultimas estan
determinadas por las ligaduras (3.38). Ahora aprovechamos el caracter indeterminado de los k para eliminar
las coordenadas dependientes, lo cual haremos exigiendo que los k tomen valores tales que se satisfagan las
ecuaciones
Xm
f k
+ k = 0 ; i = n m + 1, ..., n (3.40)
xi xi
k=1
para las ultimas m variables. Al reemplazar (3.40) en (3.39) se obtiene
nm
( m
)
X f X k
+ k dxi = 0
xi xi
i=1 k=1
y como las coordenadas involucradas en esta ecuacion son las independientes, podemos afirmar que cada
termino entre parentesis es cero de modo que
X k m
f
+ k = 0 ; i = 1, ..., m n (3.41)
xi xi
k=1
3.5. PROBLEMAS VARIACIONALES CON LIGADURAS (OPCIONAL) 49
siendo m el numero de ligaduras y n el numero de variables xi . Hay un multiplicador k por cada ligadura k .
Las Ecs. (3.42) junto con las ligaduras (3.38) nos dan un conjunto de n + m ecuaciones con n + m incognitas
(las n variables y los m multiplicadores k ).
la ecuacion de ligadura (3.38) corresponde en este caso a la restriccion de mantener el volumen constante, y
se puede escribir como
(R, H) = R2 H V0 = 0 (3.44)
puesto que solo hay una ecuacion de ligadura, hay un solo multiplicador indeterminado . Reemplazando (3.43,
3.44) en (3.42) las ecuaciones para f (R, H) con multiplicadores para las variables R y H son
f (R, H) f (R, H)
+ = 0 ; + =0
H H R R
2R + R2 = 0 ; R + 2RH = 0
2 + R = 0 ; 1 + 2H = 0
(4H)2 H = V0
r r
3 V0 4V0
H = ; R=
16
sea estacionaria. Siendo las yi coordenadas generalizadas que solo pueden depender del parametro x. La codicion
de estacionaridad es
Z 2
J = f (y1 (x) , . . . , yn (x) , y1 (x) , . . . , yn (x) , x) dx = 0 (3.46)
1
asumamos sin embargo, que el problema debe respetar ciertas restricciones que se manifiestan en ecuaciones
de ligadura de la forma
k (y1 , y2 , . . . , yn ; x) = 0 ; k = 1, 2, . . . , m (3.47)
50 CAPITULO 3. CALCULO VARIACIONAL Y MULTIPLICADORES DE LAGRANGE
multiplicando cada una de las ecuaciones (3.47) por un multiplicador indeterminado que en general depende
del parametro, i.e. k = k (x), sumando sobre k e integrando en el mismo rango que en la ecuacion 3.45, se
obtiene
Z 2Xm
k (x) k (y1 , y2 , . . . , yn ; x) dx = 0
1 k=1
en este caso podemos multiplicar cada una de estas ecuaciones por un k (que en este caso no dependera del
parametro x), sumar sobre k y aplicar la variacion quedando
Z m
2X
k k (y1 , y2 , . . . , yn ; x) dx = 0 (3.49)
1 k=1
notese que las Ecs. (3.48, 3.49) son esencialmente identicas excepto por la dependencia de k del parametro x
en la Ec. (3.48). Sumando cualquiera de estas dos ecuaciones con la Ec. (3.46) resulta
Z " m
#
2 X
f (yi , yi , x) + k k (yi ; x) dx = 0
1 k=1
redefiniendo
m
X
g (yi , yi , x) f (yi , yi , x) + k k (yi ; x)
k=1
tenemos que
Z 2
g (yi , yi , x) dx = 0
1
y con el mismo procedimiento que nos llevo de la Ec. (3.20) a la Ec. (3.23), obtenemos
Z 2 n Z
X 2
g d g
g (yi , yi , x) dx = yi dx = 0 (3.50)
1 1 yi dx yi
i=1
en esta caso no podemos decir que cada integrando es cero ya que los desplazamientos virtuales yi no son
independientes. De nuevo, usamos el caracter indeterminado de los multiplicadores de Lagrange para exigir
que los terminos asociados a las coordenadas dependientes se anulen
g d g
= 0 , i = n m + 1, . . . , n (3.51)
yi dx yi
X Z 2
nm
g
d g
yi dx = 0
1 yi dx yi
i=1
3.5. PROBLEMAS VARIACIONALES CON LIGADURAS (OPCIONAL) 51
y dado que las coordenadas que quedan son independientes, podemos afirmar que cada integrando es cero, y
junto a las Ecs. (3.51) esto nos lleva a
g d g
= 0 , i = 1, . . . , n (3.52)
yi dx yi
m
X
g (yi , x) f (yi , yi , x) + k k (yi ; x) (3.53)
k=1
los multiplicadores de Lagrange tienen aplicaciones en multiples escenarios de la Fsica mas alla de los que
utilizaremos en el presente texto (ver por ejemplo la Ref. [7]).
Figura 3.2: Solido de revolucion generado por la funcion f (x) definida en el intervalo [x0 , xf ], cuando se rota
alrededor del eje X.
Sea una funcion f (x) definida en un intervalo [x0 , xf ] de longitud L, de tal manera que genera un solido de
revolucion alrededor del eje X como el de la Fig. 3.2. Queremos encontrar una funcion f (x) de tal manera que
el solido generado posea la mnima area lateral, pero de tal forma que el volumen V0 permanezca constante.
Un diferencial de area lateral, es el area lateral del cilindro de radio f (x) y altura dx como se ve en la Fig.
3.2, i.e. dA = 2f (x) dx. El area lateral es entonces
Z xf
2 f (x) dx = A (3.54)
x0
Un diferencial de volumen del solido, es el volumen del cilindro de radio f (x) y altura dx de modo que
dV = f (x)2 dx. La ligadura de volumen constante queda entonces en la forma
Z xf
f (x)2 dx = V0 (3.55)
x0
en este caso la funcion f (x) que se pretende optimizar es la coordenada generalizada y x es el parametro del
cual depende. Tenemos entonces las asignaciones
df (x)
y (x) f (x) , y f
dx
52 CAPITULO 3. CALCULO VARIACIONAL Y MULTIPLICADORES DE LAGRANGE
Para evitar confusiones, conviene hacer un cambio de notacion en la Ecs. (3.52, 3.53)
X m
G d G
= 0 ; G f, f, x F f, f, x + k k (yi ; x) (3.56)
f dx f
k=1
dado que la cantidad a optimizar es el area lateral, y el volumen actua como la ligadura, podemos escribir
Z xf Z xf
J A= F f, f, x dx ; f, f, x dx = V0 (3.57)
x0 x0
comparando las Ecs. (3.57) con las Ecs. (3.54, 3.55), tenemos que
F f, f , x = F (f ) = 2f ; f, f , x = (f ) = f 2 (3.58)
es decir F y solo dependen de la coordenada generalizada y no dependen explcitamente del parametro x ni
de f. Sustituyendo (3.58) en la segunda de las Ecs. (3.56), tenemos entonces
G f, f, x = G (f ) = 2f + f 2
3.6. Ejercicios
1. Encuentre el radio R y la altura H de un cilindro circular recto, que minimice su area lateral, manteniendo
constante el volumen V0 del cilindro.
2. Sea una elipse descrita por la ecuacion
x 2 y 2
+ = 1.
a b
Encuentre el rectangulo inscrito de mayor area. Muestre que el cociente entre el area de este rectangulo
y el area de la elipse es 2/.
3. Sea f (x) el generador de un solido de revolucion alrededor del eje X como en la Fig. 3.2. Encuentre la
funcion f (x) que genere un solido de revolucion con el mnimo volumen, manteniendo fijo el valor del
area lateral.
4. Para un solido de revolucion como el de la Fig. 3.2, con densidad constante, los momentos de inercia
con respecto a los ejes X e Y vienen dados por (ver problema 1 pag 414, y Ref. [8])
Z Z xf
xf 4 IX
IX = f (x) dx ; IY = + x2 f (x)2 dx
2 x0 2 x0
utilizando ligadura de masa constante para el solido encuentre (a) La funcion f (x) que minimiza IX , (b)
la funcion f (x) que minimiza a IY . (c) A que solidos de revolucion corresponden estas funciones?.
5. Encuentre la curva f (x) de longitud L, limitada por abajo por el eje X, que pasa por los puntos (a, 0)
y (a, 0), y que encierra la mayor area. Este tipo de problemas se conocen como problemas isoperimetricos
o problemas de Dido.
Captulo 4
Principio variacional de Hamilton y ecuaciones de
Lagrange
53
54 CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECS. DE LAGRANGE
cuando las ligaduras son holonomas el principio de Hamilton es condicion necesaria y suficiente para la vali-
dez de las ecuaciones de Lagrange. Una ventaja de esta formulacion es que la accion es invariante ante una
transformacion de un sistema de coordenadas generalizadas a otro. Adicionalmente, veremos que el formalis-
mo variacional permitira inclur las ligaduras en el formalismo y tratar algunos problemas con ligaduras no
holonomas. Finalmente, una formulacion variacional es mas adecuada en el tratamiento de campos y sistemas
contnuos.
solo se usa en el ultimo paso cuando se considera que todas las coordenadas generalizadas (y sus despla-
zamientos virtuales) son independientes entre s. Sin embargo, cuando las ligaduras son no holonomas, las
coordenadas generalizadas ya no seran independientes y no es posible reducirlas por medio de ecuaciones de
la forma f (q1 , .., qn , t) = 0. De modo que en general tendremos que trabajar con un sistema coordenado no
independiente.
Desde el punto de vista del principio variacional, esto influye en la forma en que se construyen los caminos
variados. Un desplazamiento y (o q), nos lleva de un punto en el camino real a otro punto sobre un camino
variado, cuando las coordenadas son independientes es el camino variado final el que importa y no la forma
como se construye. Pero cuando tenemos coordenadas no independientes relacionadas entre s por ligaduras,
la forma en que se construye el camino influye ya que los desplazamientos virtuales en general no respetan las
ligaduras. Por tanto resulta importante si el camino variado fue construdo con desplazamientos que respetan
o no las ligaduras.
Un conjunto de ligaduras no holonomas para el cual es susceptible el tratamiento variacional, es el conjunto
de ligaduras de la forma
n
X
alk dqk + alt dt = 0 ; l = 1, . . . , m (4.4)
k=1
es decir una relacion lineal entre los diferenciales de las coordenadas y el tiempo. El ndice l determina el
numero de ecuaciones l = 1, . . . , m. Los coeficientes alk , alt pueden ser funciones de las coordenadas y el
tiempo. Estas ligaduras son en general no integrables a menos que se cumplan las relaciones
f f
alk = ; alt = (4.5)
qk t
para alguna funcion f = f (qi , t). En tal caso la ligadura es realmente holonoma. Tomaremos el caso general
en donde las relaciones (4.5) no necesariamente se cumplen. En principio se podra pensar en construir un
camino variado a traves de desplazamientos virtuales infinitesimales del camino real que sean compatibles con
la ligadura (4.4). Sin embargo se ha demostrado que no se puede construir tal camino variado, a menos que
las ligaduras sean integrables en cuyo caso dichas ligaduras son realmente holonomas. Construiremos de todas
formas un principio variacional en el cual los desplazamientos virtuales generaran los caminos variados aunque
no sea en forma compatible con las ligaduras. Como los desplazamientos virtuales son fijos en el tiempo, las
ligaduras para los desplazamientos virtuales se escriben
n
X
alk qk = 0 ; l = 1, ..., m (4.6)
k=1
el camino variado en general no satisface las ecuaciones (4.4). La idea es ahora reducir los desplazamientos
virtuales a los independientes. Para eliminar los desplazamientos virtuales sobrantes se utiliza el metodo de los
multiplicadores indeterminados de Lagrange. Para ello multiplicamos la ecuacion (4.6) por una cantidad
indeterminada l que puede ser funcion de las coordenadas y del tiempo
n
X
l alk qk = 0 (4.7)
k=1
por supuesto, hay m cantidades l una para cada ecuacion de ligadura. Si asumimos que el principio de
Hamilton es tambien valido para sistemas no holonomos2 , y usamos las Ecs. (3.23), entonces el principio de
Hamilton conduce a
Z 2 X n
L d L
dt qk = 0 (4.8)
1 qk dt qk
k=1
2
La naturaleza de la ligadura no aparece en el principio de Hamilton. Solo se exige que el sistema sea monogenico.
56 CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECS. DE LAGRANGE
con el fin de poder introducir los l dentro del principio de Hamilton, sumamos la Ec. (4.7) sobre los valores
de l e integramos en el tiempo entre t1 y t2
Z 2 "X n X m
#
dt l alk qk = 0 (4.9)
1 k=1 l=1
las qk siguen siendo dependientes, ya que estan ligadas por las m ecuaciones (4.6). De modo que las n m
primeras de ellas se pueden elegir en forma independiente, en tanto que las m ultimas estan determinadas por
las Ecs. (4.6). Para eliminar los desplazamientos sobrantes, aprovechamos la arbitrariedad en las cantidades
l . Exigiremos entonces que estas cantidades satisfagan las ecuaciones
m
d L L X
+ l alk = 0 ; k = n m + 1, . . . , n (4.11)
dt qk qk
l=1
es decir, para las ultimas m coordenadas generalizadas. Reemplazando (4.11) en (4.10) se obtiene
" #
Z 2 nmX d L L X m
dt + l alk qk = 0
1 dt qk qk
k=1 l=1
pero ahora las qk que intervienen son las independientes, de modo que se puede afirmar que
m
d L L X
+ l alk = 0 ; k = 1, . . . , n m. (4.12)
dt qk qk
l=1
las Ecs. (4.11, 4.12) nos dan el sistema completo de ecuaciones de Lagrange para sistemas no holonomos
m
d L L X
+ l alk = 0 ; k = 1, . . . , n. (4.13)
dt qk qk
l=1
este sistema tiene n ecuaciones con n + m incognitas (n coordenadas y m multiplicadores). Las m ecuaciones
faltantes seran las ecuaciones de ligadura (reales) Ecs. (4.4), que enlazan las qk . No obstante, es mas conveniente
para la solucion del sistema tener estas ligaduras en forma de ecuaciones diferenciales de primer orden
n
X
alk qk + alt = 0 ; l = 1, . . . , m (4.14)
k=1
de modo que las ecuaciones (4.13, 4.14) definen el sistema completo de n + m ecuaciones e incognitas.
donde QLk son las fuerzas generalizadas asociadas a las fuerzas aplicadas que emulan a las de ligadura. Na-
turalmente, estas fuerzas aplicadas deben ser iguales a las de ligadura para mantener intacta la dinamica del
4.2. EXTENSION DEL PRINCIPIO DE HAMILTON A ALGUNOS SISTEMAS NO HOLONOMOS 57
sistema3 . Por otro lado, la invarianza de la dinamica tambien requiere que las ecuaciones (4.13) y (4.15) sean
identicas. Esto conduce a
Xm
QLk = l alk ; k = 1, ..., n (4.16)
l=1
esto significa que esta formulacion tiene una informacion adicional que no habamos obtenido con las anteriores
formulaciones: las fuerzas de ligadura. Para ver con mayor claridad la relacion entre los l y las fuerzas reales
de ligadura, aplicamos la definicion de fuerza generalizada a las Ecs. (4.16)
N
X X m
ri
FL
i = l alk ; k = 1, ..., n (4.17)
qk
i=1 l=1
donde FL i representa las fuerzas reales de ligadura. Vemos que en la relacion interviene una suma sobre todas
las fuerzas reales de ligadura y otra suma sobre todos los multiplicadores, la relacion entre multiplicadores y
fuerzas reales de ligadura es entonces bastante indirecta.
fl (q1 , . . . , qn , t) = 0 ; l = 1, . . . , m (4.18)
de modo que la Ec. (4.21) corresponde a las ecuaciones de Lagrange con multiplicadores indeterminados en
el caso de ligaduras holonomas. Las fuerzas generalizadas provenientes de ligaduras holonomas se escriben
entonces
Xm
fl
QLk l (4.22)
qk
l=1
estas mismas ecuaciones se pueden obtener partiendo P directamente de la forma de la ligadura holonoma
fl (q, t) = 0 e introduciendo un termino de la forma l l fl = 0 en el principio de Hamilton, con un procedi-
miento similar al realizado para ligaduras no holonomas.
3
Para llegar a la Ec. (4.15), podemos seguir el procedimiento de la seccion 2.2, pero de modo que en la Ec. (2.4) no se excluyan
las fuerzas de ligadura de la formulacion. Seguimos entonces el procedimiento que nos lleva de (2.4) hasta (2.17), de tal modo que
(a) (a)
Qj en esta ultima ecuacion de puede descomponer como Qj = Qj + QL j , donde Qj proviene de las fuerzas aplicadas originales,
(a) (a) bj U como en las Ecs.
y QL j esta asociada a las nuevas fuerzas aplicadas que emulan a las de ligadura. Si Qj = qj V o Qj = O
(2.21, 2.27), podemos construr un lagrangiano L = T U donde el potencial incluye solo a las fuerzas aplicadas originales, con lo
cual se llega a la Ec. (4.15).
4
La ecuacion (4.19) es eqivalente a (4.18), siempre y cuando al integrar (4.19) exijamos que la constante de integracion sea nula.
58 CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECS. DE LAGRANGE
La introduccion de multiplicadores de Lagrange en ligaduras holonomas se justifica en uno de estos casos (1)
Comenzamos con coordenadas no independientes y queremos eliminar las dependientes5 (2) queremos hallar
las fuerzas de ligadura, es necesario tener en cuenta que los multiplicadores de Lagrange solo extraen el valor
de la magnitud de las fuerzas de ligadura, la direccion se debe determinar por consideraciones fsicas. Esto se
debe a la arbitrariedad para definir el signo del multiplicador, en realidad se puede hacer el cambio l l
(siempre y cuando sea para todos los l ), y la formulacion es igualmente consistente.
siguiendo los procedimientos variacionales ya descritos teniendo en cuenta que el potencial generalizado es
funcion de las coordenadas generalizadas, las velocidades generalizadas y el tiempo, se tiene
Z t2 n
Z t2 X
U d U
T dt = qk dt
t1 t1 qk dt qk
k=1
en esta forma el principio de Hamilton dice que la diferencia de la integral temporal de la energa cinetica entre
dos caminos vecinos es igual a menos la integral temporal del trabajo realizado en los desplazamientos virtuales
entre los caminos. El trabajo calculado proviene solo de las fuerzas que derivan del potencial generalizado (ya
que implcitamente el potencial del Lagrangiano solo contiene fuerzas aplicadas y no de ligadura). Por tanto, se
requiere que las ligaduras no realicen trabajos virtuales a fin de que las fuerzas generalizadas asociadas a dichas
ligaduras no entren en el miembro derecho de la Ec. (4.23). En consecuencia, si queremos mantener el principio
de Hamilton tanto para el caso holonomo como el no holonomo, es necesario que las fuerzas adicionales de
ligadura no holonomas no trabajen en desplazamientos virtuales qk .
Otra manera de ver que las fuerzas de ligadura no entran en el principio variacional de Hamilton, se obtiene
partiendo de las ecuaciones (4.6) de ligadura para desplazamiento virtual
n
X
alk qk = 0 , l = 1, . . . , m (4.24)
k=1
que nos conduce a la nulidad de los trabajos virtuales de las fuerzas de ligadura.
Por supuesto esta demostracion se restringe a ligaduras holonomas o no holonomas que cumplan la condicion
(4.24). En nuestro caso, la ligadura no-holonoma que mas usaremos sera la correspondiente a la condicion de
rodadura, que claramente cumple con la condicion (4.24)6 y no realiza trabajo virtual.
la ligadura nos muestra que la coordenada r no es independiente. As que podemos reducir a el conjunto de
coordenadas generalizadas independientes. No obstante, escribiremos las ecuaciones de Lagrange usando las
dos coordenadas r,. Calcularemos ademas las fuerzas generalizadas asociadas a las ligaduras con base en la
Ec. (4.22)
d L L f1
= M r ; = M r 2 M g cos ; QLr = 1 = 1
dt r r r
d L d L f1
= M r 2 = M r 2 + 2M r r ; = M gr sin ; QL = 1 =0
dt dt
M r M r 2 + M g cos = 1 (4.28)
2
M r + 2M r r M gr sin = 0 (4.29)
las ecuaciones de Lagrange (4.28, 4.29) junto con la ecuacion de ligadura (4.27) forman un sistema de 3
ecuaciones y tres incognitas (r, , 1 ), cuya solucion es unica bajo las condiciones iniciales adecuadas. Hay un
solo multiplicador 1 ya que solo tenemos una ligadura. Aplicando la ligadura llegamos a r = a y r = r = 0,
y sustituyendolo en la ecuaciones (4.28, 4.29) obtenemos
M a 2 + M g cos = 1 ; M a2 M ga sin = 0
g 1 g
2 cos = ; = sin (4.30)
a Ma a
6
Ver ejercicios 1, 2, de la Pag. 66.
60 CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECS. DE LAGRANGE
este es un problema de dos ecuaciones con dos incognitas que tiene solucion unica bajo las condiciones iniciales
adecuadas. Una solucion parcial se puede obtener con el ansatz7
2 = A B cos (4.31)
2g 2g
2 = cos + (4.32)
a a
ahora reemplazando (4.32) en la primera de las Ecs. (4.30) se tiene que
2g 2g g 1
cos + cos =
a a a Ma
g 1
(2 3 cos ) =
a Ma
con lo cual queda finalmente
1 = M g (3 cos 2)
usando los metodos tradicionales de solucion se puede ver que el multiplicador corresponde numericamente al
valor de la fuerza de ligadura normal. Esto tambien se puede ver haciendo uso de las Ecs. (4.17, 4.20), teniendo
en cuenta que hay una sola fuerza de ligadura y un solo multiplicador
r f1
N = 1
qk qk
(rur ) f1
N = 1 (N ur ) ur = 1
r r
1 = N
donde hemos usado el hecho de que la fuerza normal va a lo largo de ur . Se puede ver que estrictamente
el multiplicador solo nos puede proporcionar la magnitud de la normal ya que la fuerza de ligadura (vecto-
rial) aparece en un producto punto que nos hace perder informacion sobre la direccion, a esto se le suma la
ambiguedad del signo del multiplicador.
Este problema ilustra muchas caractersticas de la tecnica de multiplicadores de Lagrange
7
Este ansatz esta inspirado en el hecho de que = (g/a) sin se asemeja a la ecuacion de un pendulo simple (con
y ) de oscilaciones no necesariamente pequenas, en tal problema 2 se puede obtener por conservacion de la energa
mecanica de lo cual se obtendra una expresion similar a nuestro ansatz Ec. (4.31).
8
Naturalmente, debe ser ligeramente distinto de cero para que exista movimiento. Sin embargo, usamos estas condiciones
teniendo en cuenta que en ausencia de rozamiento, la velocidad angular se puede aproximar arbitrariamente a cero.
9
La Ec. (4.32) tambien se puede obtener as: = ddt = dd d
dt
= dd . De la segunda de las Ecs. (4.30) y usando la expresion
anterior tenemos que
Z Z Z
g g
d = sin d d = cos
0 a 0 0 a 0
1. Las ecuaciones de Lagrange solo se pueden solucionar teniendo en cuenta las ecuaciones de ligadura, para
formar el sistema de n + m ecuaciones e incognitas.
2. Observese que el metodo para calcular las fuerzas generalizadas de ligadura conduce automaticamente
a encontrar las coordenadas espureas. En este caso existe un multiplicador que elimina la coordenada
sobrante r.
3. La fuerza de ligadura pudo ser hallada y esta asociada a 1 . Debe tenerse en cuenta sin embargo, que no
hay una relacion uno a uno entre multiplicadores y fuerzas generalizadas de ligadura, en realidad cada
fuerza generalizada de ligadura es una combinacion lineal de todos los i como lo muestran las Ecs. (4.16,
4.22). La relacion entre fuerzas reales de ligadura y multiplicadores es mas indirecta todava.
V = M g (l x) sin 0
dado que hay una ecuacion de ligadura, se requiere solo un multiplicador de Lagrange. Comparando (4.33) con
(4.4) los coeficientes que acompanan a la ligadura son
QL L
x = 1 a1x = 1 ; Q = 1 a1 = a1
10
Esto se debe a que esta es una condicion de rodadura en donde el aro se restringe a moverse en un plano. Cuando esta
restriccion deja de ser cierta, la ligadura es realmente no-holonoma, como se aprecia en los ejercicios 1, 2, Pag. 66.
62 CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECS. DE LAGRANGE
de modo que las ecuaciones de Lagrange junto con las ecuaciones de ligadura quedan
M x M g sin 0 = 1 ; M a2 = a1 ; a = x (4.36)
constituye un conjunto de tres ecuaciones para x, ,1 . Diferenciando la ligadura respecto al tiempo se obtiene
a = x, sustituyendo en la segunda de las Ecs. (4.36) se tiene que M x = 1 al sustituir esto en la primera de
las Ecs. (4.36) queda
g sin 0
x =
2
con lo cual
g sin 0 M g sin 0
= ; 1 = (4.37)
2a 2
puesto que hay un solo multiplicador, podemos obtener la magnitud de la fuerza de ligadura usando una sola
fuerza generalizada de ligadura, digamos QL L
x . La fuerza (real) de ligadura esta dada por F = N + Fr siendo
N la normal y Fr la fuerza de rozamiento estatico. Utilizando las ecuaciones (4.16, 4.17) tenemos que
r r
QL L
x =F = (N + Fr ) = 1 a1x
x x
es facil ver que r = xux , por tanto x r = ux , utilizando esto y la Ec. (4.35) resulta11
(N + Fr ) ux = 1
M g sin 0
kFr k = 1 Fr =
2
donde hemos usado la Ec. (4.37). Notese que hemos obtenido informacion sobre la fuerza de rozamiento pero
no sobre la normal. Esto era de esperarse, ya que la fuerza de rozamiento estatico es la que genera la condicion
de rodadura, que fue la ecuacion que usamos como ligadura.
Figura 4.1: Esfera de radio , que rueda sin deslizar en la mitad inferior de una superficie cilndrica de radio
R.
la condicion de rodadura nos da la ligadura
f (, ) = R = 0 (4.38)
existe entonces un solo multiplicador de Lagrange y las ecuaciones de Lagrange con multiplicadores quedan
L d L f L d L f
= ; =
dt dt
mg (R ) sin m (R )2 = R (4.39)
2
m2 = (4.40)
5
de (4.40) se obtiene
2
= m (4.41)
5
y usando (4.38), encontramos
2 R 2
= m = mR (4.42)
5 5
sustituyendo (4.42) en (4.39) se encuentra la ecuacion de movimiento con respecto a .
2 2
mg (R ) sin m (R ) = mR R
5
2 2 2
g (R ) sin = R + (R )
5
g (R ) sin
= h i
2 2 2
5 R + (R )
= 2 sin
64 CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECS. DE LAGRANGE
la ecuacion para es la de un pendulo simple de amplias oscilaciones. Una vez resuelto (t), la ecuacion de
se obtiene directamente de (4.38), as mismo la solucion para el multiplicador se obtiene de (4.42). Cual es la
asociacion entre fuerzas de ligadura y el multiplicador en este problema?.
L = L(qi , qi , qi , t) (4.43)
bajo el postulado de que se cumple el principio variacional de Hamilton extendido. La accion queda entonces
de la forma Z 2
I= L(qi , qi , qi , t)dt
1
y se tiene que
Z n
2X
I L qi L qi L qi
d = d + d + d dt (4.44)
1 qi qi qi
i=1
Asumiremos suma sobre ndices repetidos cuando los ndices aparezcan. De momento omitiremos los ndices
para simplificar los calculos. En analoga con la Ec. (3.17, 3.18) tenemos
I q
d = I ; q = d
con lo cual la Ec. (4.44) queda
13
Debe aclararse sin embargo, que el espacio de configuraciones y la trayectoria en dicho espacio, s dependen de las coordenadas
generalizadas empleadas.
4.6. PRINCIPIO VARIACIONAL PARA LAGRANGIANOS QUE CONTIENEN A Q (OPCIONAL) 65
Z 2
L L q L q
I = q + d + d dt (4.45)
1 q q q
Integrando por partes el termino de la mitad nos da en analoga con la Ec. (3.11)
Z Z Z 2
2
L q 2
L 2 q L q 2 q d L
dt = dt = dt (4.46)
1 q 1 q t q 1 1 dt q
el primer termino a la derecha es cero debido a la condicion de extremo fijo en las qi . sustituyendo (4.46) en
la expresion (4.45) resulta
Z 2
L d L L q
I = q q + d dt (4.47)
1 q dt q q
donde hemos usado de nuevo la definicion q = (q/) d. El ultimo integrando requiere dos integraciones
por partes
Z Z Z 2
2
L q 2
L 2 q L q 2 q d L
dt = dt = dt
1 q 1 q t q 1 1 dt q
y usando la condicion de extremo fijo en las qi , vemos que se elimina el primer termino a la derecha. Una
segunda integracion por partes nos da
Z 2 Z 2 2
q d L q d L
dt = dt
1 dt q 1 t dt q
Z 2
d L q 2 q d2 L
= dt
dt q 1 1 dt2 q
el primer termino a la derecha se elimina por la condicion de extremo fijo en los qi . Por tanto
Z 2 Z 2
L q q d2 L
dt = 2
dt (4.48)
1 q 1 dt q
reemplazando (4.48) en (4.47) y usando la definicion de q se tiene que
Z 2
L d L d2 L
I = q q + 2 q dt
1 q dt q dt q
factorizando qs, y colocando los ndices de nuevo, resulta
Z n
2X
L d L d2 L
I = + 2 qi dt = 0
1 qi dt qi dt qi
i=1
puesto que las qi son independendientes, las variaciones qi son independientes y podemos aplicar el lema
fundamental del calculo variacional y ver que I = 0 requiere que tanto el integrando como los coeficientes de
qi se anulen separadamente, llegando entonces a las ecuaciones de movimiento:
L d L d2 L
+ 2 =0 ; i = 1, 2, ..., n. (4.49)
qi dt qi dt qi
Notese que para utilizar el principio variacional de Hamilton extendido, el espacio de configuraciones debe
ser de dimension 2n, con qi y qi en los ejes, ya que la condicion completa de variacion cero en los extremos
requiere esta extension del espacio. Ademas estas condiciones de variacion cero conducen a la invarianza de
las ecuaciones de movimiento, bajo el siguiente tipo de transformaciones gauge del Lagrangiano
dF (q, q, t)
L = L + (4.50)
dt
66 CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECS. DE LAGRANGE
1 k
L = mq q q 2 (4.51)
2 2
para el cual tenemos
L 1 d L d2 L d2 1 1
= mq kq ; =0 ; = 2 mq = mq
q 2 dt q dt2 q dt 2 2
al reemplazar estas relaciones en las ecuaciones de movimiento (4.49) tenemos
mq kq = 0
Que corresponde a la ley de Hooke. Notese que el Lagrangiano (4.51) a pesar de su apariencia extrana,
nos da las ecuaciones del oscilador armonico cuando usamos este formalismo de sacudida de las ecuaciones
de Lagrange. Para entender porque, utilizaremos la invarianza gauge en (4.50), para obtener el Lagrangiano
(4.51) a partir del Lagrangiano usual para el oscilador armonico simple LSHO
d mq q mq 2 kq 2 mq q mq 2
L (q, q , q, t) = LSHO (q, q, t) + =
dt 2 2 2 2 2
1 k 2
L (q, q , q, t) = mq q q
2 2
es muy importante enfatizar que los Lagrangianos L y LSHO son equivalentes solo bajo el principio de Hamilton
extendido con variacion cero en q, q. De otra forma el Gauge (4.50) ya no sera valido.
De lo anterior se ve que se requiere un principio variacional especfico o equivalentemente, un tipo especfico
de ecuaciones de movimiento, para que un Lagrangiano dado tenga toda la informacion fsica del sistema.
As mismo, las transformaciones gauge posibles para el Lagrangiano dependen del principio variacional que se
postule, o de las ecuaciones de movimiento que se asuman.
4.7. Ejercicios
1. Supongamos un disco de radio R que rueda sobre un plano horizontal XY , de manera que permanece
siempre vertical. Sean (x, y) las coordenadas del centro del disco. Definimos tambien un angulo de rotacion
alrededor del eje del disco, y un angulo entre el eje X y el eje del disco (ver Fig. 4.2). Si el disco
rueda sin deslizar, demuestre que la condicion de rodadura se manifiesta en una ligadura de la forma
2. Supongamos que tenemos un conjunto de ecuaciones diferenciales lineales de ligadura del tipo
n
X
gk (x1 , . . . , xn ) dxk = 0 (4.53)
k=1
este tipo de ligaduras son holonomas solo si existe una funcion integrante f (x1 , . . . , xn ) que convierta a
estas ecuaciones en diferenciales exactas i.e.
n
X n
X f f
gk (x1 , . . . , xn ) dxk = df = dxk gk = (4.54)
xk xk
k=1 k=1
multiplicando la ultima ecuacion por f y derivando el producto parcialmente con respecto a xj se obtiene
f f 2f
(f gk ) = +f (4.55)
xj xj xk xj xk
4.7. EJERCICIOS 67
Figura 4.2: Disco vertical que rueda sin deslizar sobre el plano XY .
invirtiendo el rol de los ndices j, k, se obtiene una ecuacion similar, y el miembro derecho de tal ecuacion
es identico al miembro derecho de la Ec. (4.55) si las segundas derivadas parciales son contnuas. Por
tanto, la funcion integrante debe cumplir la condicion14
(f gk ) (f gj )
= ; j, k = 1, . . . , n (4.56)
xj xk
demuestre que no se puede encontrar una funcion integrante para la ligadura de rodadura Ec. (4.52). Sin
embargo, tal funcion integrante s existe cuando es constante en la Ec. (4.52), como ocurre por ejemplo
con un disco que rueda sobre un plano inclinado.
3. Resolver el ejercicio de la seccion 4.4.2, sustituyendo el aro por una esfera, un cilindro, un disco y un
elipsoide de revolucion. Asuma constante la densidad de cada figura.
4. Demuestre que el gauge (4.50), deja invariantes las ecuaciones de movimiento (4.49), que se derivan del
principio de Hamilton extendido, asociado al formalismo de la sacudida. Demuestrelo (a) apelando
directamente a las ecuaciones diferenciales, (b) apelando al principio variacional de Hamilton extendido.
5. En la seccion 2.8.6 Pag. 32, se estudio la dinamica de un aro que rueda sin deslizar sobre una cuna que
desliza sin rozamiento sobre el suelo. Trate la ligadura de rodadura utilizando el metodo de multiplica-
dores de Lagrange. Contraste los resultados con los obtenidos en la seccion 4.4.2, Pag. 61, en la cual la
cuna esta fija en el suelo.
6. Una esfera de masa m y radio r rueda sin deslizar sobre un cilindro fijo de radio R, como se indica en
la Fig. 4.3. Si la esfera comienza a rodar sin deslizar desde el punto mas alto del cilindro y partiendo
14
En las condiciones (4.54, 4.56) podemos agregar la coordenada temporal digamos xn+1 t, y las Ecs. (4.54, 4.56) seran
validas para j, k = 1, . . . , n + 1. Notese que esta es la estructura de las Ecs. (4.4), Pag. (55).
68 CAPITULO 4. PRINCIPIO VARIACIONAL DE HAMILTON Y ECS. DE LAGRANGE
Figura 4.3: Esfera de masa m y radio r que rueda sin deslizar sobre un cilindro fijo de radio R.
del reposo. (a) Plantee las ecuaciones de Lagrange con multiplicadores que den cuenta de la fuerza de
ligadura del cilindro sobre la esfera. (b) Encuentre el punto donde la esfera se separa del cilindro. (c)
Resuelva el mismo problema reemplazando la esfera por un aro y por un cilindro, cada uno con masa m
y radio r.
Captulo 5
Simetras y cantidades conservadas en el formalismo
de Lagrange
f (q, q, t) = cte
que son ecuaciones diferenciales de primer orden. Estas estructuras se conocen como primeras integrales de las
ecuaciones de movimiento. Mucha informacion se puede extraer de estas primeras integrales, en particular las
leyes de conservacion.
Consideremos un sistema de partculas puntuales bajo la influencia de fuerzas que se derivan de potenciales
que solo dependen de la posicion. En este caso podemos escribir
L T V T X1
= = mk x2k + yk2 + zk2
xi xi xi xi xi 2
k
L
= mi xi = pxi
xi
que corresponde a la componente x del momento lineal de la partcula iesima. Esto sugiere la forma de elabo-
rar el concepto de momento generalizado cuando usamos coordenadas generalizadas. El momento generalizado
pj asociado a la coordenada generalizada qj se define como
L
pj (5.1)
qj
por razones que veremos posteriormente, a pj tambien se le conoce como momento canonicamente conjugado
69
70 CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)
a qj . Notese que pj no tiene necesariamente dimensiones de momento lineal1 . Cuando tenemos potenciales
dependientes de la velocidad incluso en coordenadas cartesianas el momento generalizado difiere del momen-
to mecanico. Un ejemplo notable es el de un conjunto de partculas en un campo electromagnetico, cuyo
Lagrangiano es2
XN N
X N
X
1
L= mi r2i qi (ri ) + qi A (ri ) ri
2
i=1 i=1 i=1
px = mx + qAx = cte
1
Sin embargo, es claro de la definicion (5.1), que pj qj tiene dimensiones de energa. Por tanto, pj qj tiene dimensiones de energa
por tiempo, es decir de momento angular.
2
Notese que cuando al sistema de partculas le anadimos el campo, no es necesario diferenciar para una partcula entre la
contribucion debida a las fuerzas internas y las externas, ya que ambas contribuciones estan contenidas en el campo.
5.1. TEOREMAS DE CONSERVACION Y PROPIEDADES DE SIMETRIA 71
De la teora electrodinamica clasica, es bien conocido que cuando A y no dependen de x, la cantidad qAx
es la componente x del momento lineal del campo electromagnetico asociado con la carga q, el momento
mecanico mx esta asociado unicamente a la carga. Por tanto, el momento canonico px es una cantidad mixta
que esta asociada tanto a la carga como al campo, esto no supone ninguna contradiccion ya que como dijimos,
el momento canonico esta realmente asociado a la coordenada y no a la partcula (ni al campo).
Example 2 Para el problema de la seccion 2.8.6 del aro que rueda sin deslizar sobre un plano inclinado, que
a su vez se desliza sobre el suelo sin rozamiento, el Lagrangiano esta dado por la Ec. (2.51) Pag. 33
1
L = mS 2 + (m + M ) 2 + m S cos mg [R cos + (l S) sin ] (5.5)
2
Se observa que en este Lagrangiano la coordenada es cclica, y por tanto su momento canonicamente con-
jugado es constante. Esto nos conduce a una primera integral de movimiento (ecuacion diferencial de primer
orden)
L
p = = (m + M ) + mS cos = K
esta expresion se puede encontrar tambien al integrar una de las ecuaciones de Lagrange que resultaron en el
problema, Ec. (2.53), Pag. 33.
Para el anterior ejemplo, es importante mencionar que el Lagrangiano 5.5, esta escrito en coordenadas real-
mente independientes y por esta razon el momento conjugado p es realmente una constante de movimiento.
Ya mencionamos que en un problema similar, obtuvimos un Lagrangiano Ec. (4.34), que contiene una coor-
denada cclica que no conduce a la conservacion de su momento canonico, en virtud de que las coordenadas
generalizadas en tal problema no eran independientes. Por otro lado, el ejemplo anterior tambien muestra con
claridad que la invarianza de un momento conjugado equivale a un proceso de integracion que nos lleva a
una ecuacion diferencial de primer orden. Sin embargo, en este ejemplo particular este proceso de integracion
es trivial y se poda ejecutar sin mayores dificultades desde las ecuaciones de Lagrange mismas. Es necesario
decir no obstante, que el proceso que nos lleva de las ecuaciones de Lagrange (de segundo orden) a primeras
integrales de movimiento (ecuaciones de primer orden), puede ser muy complejo en general, y esto justifica la
introduccion del concepto de coordenada cclica y de la conservacion de su momento conjugado asociado.
Veremos ahora que los teoremas usuales de conservacion estan contenidos en la regla general sobre coor-
denadas cclicas.
a continuacion veremos que esta es la ecuacion de movimiento para el momento lineal total a lo largo de qj .
Es decir que Qj es la componente de la fuerza (en el sentido Newtoniano) en la direccion qj , en tanto que pj
es la componente del momento lineal a lo largo de tal direccion. La fuerza generalizada Qj viene dada por
N
X ri
Qj = Fi (5.7)
qj
i=1
notese que al ser qj una variable de traslacion, sus unidades s deben ser de longitud y se puede definir
unvocamente un vector unitario de traslacion n, a lo largo de dqj . Como dqj representa una traslacion del
sistema a lo largo de cierto eje, la diferencia entre los vectores ri (qj ) y ri (qj + dqj ) va a lo largo de n, y tiene
como magnitud dqj
ri ri (qj + qj ) ri (qj ) dqj n
= lm = =n (5.8)
qj qj 0 qj dqj
observese que se ha escrito n y no ni ya que al ser una traslacion del sistema como un todo, cada partcula se
desplaza en la misma direccion que las otras. De aqu resulta
N
X
Qj = Fi n = n F
i=1
por lo tanto, Qj representa la componente de la fuerza total sobre el sistema a lo largo de la direccion n de
traslacion. Para ver el significado del momento canonico, calculemos pj
N
! N
L T 1X X ri
pj = = = mi r2i = mi ri
qj qj qj 2 qj
i=1 i=1
N
X ri
pj = mi vi
qj
i=1
que corresponde a la componente del momento mecanico lineal total del sistema a lo largo de la direccion de
traslacion. Vemos que en este caso, el momento generalizado asociado a una sola coordenada qj resulto estar
asociado al momento lineal de todo el sistema, esto no es de extranar, ya que qj represento una traslacion
para el sistema como un todo. Esto enfatiza el hecho de que el momento generalizado esta asociado a una
coordenada y no a una partcula. El mismo comentario vale para la fuerza generalizada. En realidad, todas las
variables generalizadas en la formulacion Lagrangiana estan asociadas a coordenadas en lugar de partculas.
A este hecho se debe en parte la facilidad de extender este formalismo a campos y sistemas contnuos.
Vale la pena mencionar que en el presente tratamiento solo se asumio que el potencial no dependa de la
velocidad generalizada qj pero podra depender de las velocidades generalizadas de otras coordenadas. Por
otro lado, para sistemas aislados cuyo potencial no dependa de qj las demas condiciones se satisfacen (para
una direccion arbitraria de la traslacion), ya que al no existir fuerzas externas no hay ligaduras externas que
signifiquen una violacion de las ligaduras cuando el sistema se traslada como un todo. Adicionalmente, debido
a la homogeneidad del espacio, una traslacion del sistema como un todo es equivalente para un sistema aislado
a un corrimiento del origen, de lo cual es claro que la energa cinetica no puede depender de qj . Notese que
5.1. TEOREMAS DE CONSERVACION Y PROPIEDADES DE SIMETRIA 73
Figura 5.1: Rotacion infinitesimal del sistema como un todo, caracterizada por el desplazamiento angular dqj .
De manera similar al caso anterior, veremos que si dqj corresponde a una rotacion del sistema como un todo
alrededor de cierto eje, el momento generalizado corresponde al momento angular del sistema a lo largo del
74 CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)
eje de rotacion en tanto que Qj corresponde a la componente del torque en la direccion de dicho eje. Cuando
la variable qj se vuelve cclica se llega a la conservacion del momento angular.
Asumiremos las mismas condiciones del caso anterior pero para una coordenada qj que produce la rotacion
del sistema como un todo alrededor de un eje fijo. La Fig. 5.1 muestra la rotacion en una cantidad dqj de
la partcula iesima del sistema, donde por comodidad y sin perdida de generalidad se ha colocado el eje de
rotacion a lo largo del eje Z. ri (qj ) es la posicion de esa partcula cuando la coordenada generalizada vale qj y
ri (qj + dqj ) es la posicion de la partcula iesima cuando la rotacion dqj se ha realizado, es el angulo entre
ri y el eje de rotacion y Ri el radio del crculo descrito por la partcula i alrededor del eje de rotacion. Como
hemos asumido que T es independiente de qj y que V es independiente de qj llegamos de nuevo a (5.6), y la
fuerza generalizada Qj esta dada de nuevo por (5.7) pero en este caso la derivada adquiere un sentido diferente
ri
kdri k = Ri dqj = ri sin dqj
= ri sin
qj
la direccion de dri y por lo tanto la de ri /qj es perpendicular a n (vector unitario a lo largo del eje de
rotacion). Adicionalmente dado que ri no cambia de magnitud, se tiene que dri (y por tanto ri /qj ) es tambien
perpendicular a ri . Por tanto, ri /qj es perpendicular a n y a ri y su magnitud es ri sin = knk kri k sin ,
de lo cual se deduce que
ri
= n ri (5.9)
qj
la fuerza generalizada queda entonces
N
X N
X
Qj = Fi (n ri ) = n (ri Fi )
i=1 i=1
N
X
Qj = n Ni = n N
i=1
la fuerza generalizada corresponde entonces a la componente del torque total del sistema a lo largo del eje de
rotacion4 . Veamos el momento conjugado
XN X N X N X N
L T ri ri
pj = = = mi vi = mi vi = mi vi (n ri ) = n (ri mi vi )
qj qj qj qj
i=1 i=1 i=1 i=1
N
X
pj = n Li = n L
i=1
el momento canonico es entonces la componente del momento angular total en la direccion del eje de rotacion.
Si la variable qj se vuelve ignorable, se llega a la conservacion de la componente del momento angular total en
la direccion del eje de rotacion. La variable qj es en este caso una variable angular y por tanto, adimensional.
Vemos que las condiciones anteriores se cumplen para un sistema aislado. La discusion es muy similar al
caso traslacional salvo que esta vez apelamos a la isotropa del espacio y no a la homogeneidad. Recordemos
que la homogeneidad nos dice que la estructura del espacio es la misma si cambiamos el origen del sistema
coordenado, en tanto que la isotropa nos menciona que la estructura del espacio se ve igual si hacemos una
reorientacion de los ejes coordenados (sin cambiar el origen).
4
Es importante notar que esta afirmacion es valida siempre y cuando el origen con respecto al cual se mide el torque, sea tal
que el eje de rotacion pase por dicho origen, como se aprecia en la Fig. 5.1.
5.2. FUNCION ENERGIA Y CONSERVACION DE LA ENERGIA 75
Xn n
dL d L dqj X L dqj L
= + +
dt dt qj dt qj dt t
j=1 j=1
Xn
dL d L L
= qj +
dt dt qj t
j=1
76 CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)
la funcion energa es identica en valor al Hamiltoniano, cuya formulacion veremos mas adelante. Sin embargo,
se denota con una letra diferente (el Hamiltoniano se denota como H) ya que las dos funciones difieren en
cuanto a los argumentos que utilizan, h es funcion de qj , qj , t; en tanto que H es funcion de qj , pj , t siendo
pj el momento conjugado a qj . Aplicando (5.13), la ecuacion (5.12) se escribe
dh L
= (5.14)
dt t
de lo cual se ve en forma inmediata que si el Lagrangiano no es funcion explcita del tiempo, es decir su
dependencia temporal aparece solo a traves de q (t), y q (t), la funcion energa es una constante de movimiento.
h es en consecuencia, una primera integral de movimiento y se le denomina integral de Jacobi.
En este punto conviene clarificar que para que una cierta cantidad sea constante de movimiento, es necesario
y suficiente que su derivada total con respecto al tiempo (y no necesariamente la parcial) sea nula. Para ver
la razon de esto, recordemos el significado de cada una de estas derivadas, la derivada parcial corresponde a
dejar las coordenadas y velocidades generalizadas fijas y solo se mueve el parametro tiempo, el hecho de que
la derivada parcial se anule significa entonces que la cantidad en cuestion se mantiene constante en un proceso
virtual en el cual las coordenadas y velocidades generalizadas del sistema se mantuvieran fijas y solo variara el
parametro tiempo, es decir solo evolucionan las influencias exteriores al sistema5 . Una cantidad es constante
de movimiento cuando se mantiene constante su valor en un proceso real, y en un proceso real las coordenadas
y velocidades generalizadas tambien evolucionan a medida que transcurre el tiempo, en consecuencia es la
derivada total la que describe correctamente la evolucion de una cierta cantidad con el tiempo. En particular,
la cantidad sera constante de movimiento si y solo si su derivada total es cero.
Mas adelante veremos que para el Hamiltoniano (que coincide numericamente con la funcion energa) las
derivadas temporales total y parcial coinciden (ver Ec. 6.38, Pag. 101). Naturalmente esto tambien sera valido
para la funcion energa, de modo que en este caso muy particular la anulacion de la derivada parcial nos
conduce a que h sea constante de movimiento. Debemos enfatizar sin embargo, que en general las derivadas
total y parcial con respecto al tiempo de una cantidad arbitraria pueden ser muy diferentes.
donde L2 es una funcion homogenea de segundo grado (no simplemente cuadratica) en q. L1 es homogenea
de primer grado en q, y L0 es independiente de q (i.e. homogenea de grado cero en q). No hay ninguna razon
de primeros principios para asumir que el Lagrangiano tenga esta forma, pero esta estructura aparece en una
gran cantidad de problemas. Por ejemplo, el Lagrangiano adquiere esta forma cuando el potencial no depende
en forma explcita de la velocidad. Sin embargo, aun para ciertos potenciales dependientes de la velocidad,
esta separacion es posible como se puede ver para el caso mas caracterstico del potencial de una carga en un
campo electromagnetico.
Aplicaremos ahora el teorema de Euler, que nos dice que si f (x1 , . . . , xp ) es una funcion homogenea de
grado n en las variables xi entonces
Xp
f
xi = nf (5.16)
xi
i=1
aplicando la definicion de la funcion h, Ec. (5.13), para Lagrangianos de la forma (5.15), resulta
Xn X n n
X n
X
L L0 L1 L2
h= qj L= qj L0 + qj L1 + qj L2
qj qj qj qj
j=1 j=1 j=1 j=1
la definicion de dada por la Ec. (2.37), nos muestra que esta funcion es homogenea de grado 2 en las qs.
Aplicando de nuevo el teorema de Euler, resulta
dh L
= 2 (5.18)
dt t
Si L no es funcion explcita del tiempo y el sistema es tal que h es la energa del sistema, la Ec. (5.18) nos dice
que 2 es la rata de disipacion de energa
dE
= 2 (5.19)
dt
que concuerda con lo demostrado en la seccion 2.5, aunque all fue probado en circunstancias menos generales.
Theorem 3 Teorema de Noether: Sea un Lagrangiano de la forma L = L (q, q, t). Supongamos que las ecua-
ciones de movimiento de Lagrange Ecs. (4.3), son invariantes bajo una transformacion contnua de coordenadas
de la forma [t, q] [t (t) , q (q,t)]. Entonces existe una integral de movimiento i.e. una cantidad conservada
asociada a dicha invarianza.
Demostracion: Dado un Lagrangiano L (q, q, t) que depende de las coordenadas qi (i = 1, ..., n), sus
derivadas temporales qi y el tiempo t, podemos introducir unas nuevas coordenadas con la transformacion
esta transformacion debe ser invertible ya que de lo contrario, el nuevo conjunto coordenado no sera indepen-
diente. Parametrizaremos las nuevas coordenadas en la forma:
donde en la ultima igualdad hemos aplicado justamente (5.25) y los lmites de integracion cambian por el
hecho de que cambia el diferencial del cual dependen estos.
Si la forma de las ecuaciones de movimiento es invariante ante esta transformacion de coordenadas, se dice
que dicha transformacion es simetrica. En el caso mas simple, el lagrangiano como tal es invariante:
L q , q , t = L q , q , t
esto sin embargo, no es necesario, ya hemos visto que es suficiente que se cumpla la relacion.
d
L q , q , t = L q , q , t + q , t (5.26)
dt
es decir, que ambas funciones lagrangianas pueden diferir en una derivada total con respecto al nuevo parametro
de tiempo. Si insertamos la ecuacion (5.26) en (5.25), se tiene:
dt d
L q q , t , q q , q , t , t t = L q
, q
, t + q
, t (5.27)
dt dt
de lo cual queda:
dt
d
dt
L q q , t , q q , q , t , t t = L q , q , t + q ,t
dt dt dt
dt d
L [q, q, t] = L q , q , t + q , t
dt dt
80 CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)
dt d
L [q, q, t] L q , q , t = q , t
dt
dt
d d
L [q, q, t] L q , q , t 1 + t = q , t
dt dt
de modo que
d d
L [q, q, t] L q , q , t = L q , q , t t + q , t (5.28)
dt dt
y dado que la transformacion es contnua, es posible considerar transformaciones infinitesimales en (5.21).
Definiendo
L q , q , t L [q, q, t] L
y tomando (5.21), la ecuacion (5.28) se convierte en:
d d
L L [q, q, t] L (q + q, q + q, t + t) = L (q + q, q + q, t + t) t + (q + q, t + t)
dt dt
pero por expansion de Taylor
d d
L (q + q, q + q, t + t) t = L (q, q, t) t + O 2
dt dt
despreciando terminos cuadraticos en q, q y/o t, resulta
d d
L = L (q, q, t) t + (q + q, t + t)
dt dt
En particular, si escojemos q = t = 0, se tiene que q = q y t = t , ademas usando (5.24) se obtiene q =
d
0, de modo que q = q . Con estas consideraciones y usando la Ec. (5.27) se tendra que dt (q, t) = 0. Podemos
anadir este cero para reescribir L como
d d
L = L (q, q, t) t + [ (q + q, t + t) (q, t)]
dt dt
d d
L = L (q, q, t) t (q, t) (5.29)
dt dt
por otro lado, dado que estamos escribiendo L en funcion de q, q, t la regla de la cadena para L nos da
Xn
L L L
L = qi + qi + t (5.30)
qi qi t
i=1
n
X
L L L d d
qi + qi + t + L t = (q, t)
qi qi t dt dt
i=1
Xn
L L d d L d d
qi + qi qi t + +L t = (q, t)
qi qi dt dt t dt dt
i=1
Xn Xn
L L d L d L d d
+ qi qi t + +L t = (q, t)
qi qi dt qi dt t dt dt
i=1 i=1
n " n
#
X L L d L X L d d
+ qi + t + L qi t = (q, t) (5.31)
qi qi dt t qi dt dt
i=1 i=1
5.3. TEOREMA DE NOETHER PARA SISTEMAS DISCRETOS (OPCIONAL) 81
la Ec. (5.31) describe la condicion que un debe cumplir para un Lagrangiano dado, a fin de que las
ecuaciones de movimiento (4.3), permanezcan invariantes ante una transformacion infinitesimal dada por
(5.21)6 . El problema se reduce usualmente a la existencia (o no existencia) de una solucion para la funcion
en la Ec. (5.31) para una transformacion especfica de la forma (5.21). En particular, si se cumplen las
condiciones
d () d (t)
=0 y =0 (5.32)
dt dt
entonces la Ec. (5.29) nos lleva a que L = 0. Por tanto, bajo estas condiciones la funcion Lagrangiana misma
permanecera invariante bajo la transformacion de coordenadas. Si la Ec. (5.31) se satisface, entonces al usar
las ecuaciones de movimiento
L d L
=
qi dt qi
se obtiene: " #
n
X n
X
d L L d L L d d
+ qi + t + L qi t = (q, t) (5.33)
dt qi qi dt t qi dt dt
i=1 i=1
organizando los terminos que aparecen bajo la derivada temporal total resulta
( n n
! ) n n
d X L X L X L d X d L
2 qi +
L qi t + (q, t) qi qi +
dt qi qi qi dt dt qi
i=1 i=1 i=1 i=1
n
!
L dL d X L
+ t t + t qi = 0
t dt dt qi
i=1
simplificando terminos
( n n
! ) ( n )
d X L X L d X L
2 qi + L qi t + (q, t) qi +
dt qi qi dt qi
i=1 i=1 i=1
" n
!#
L dL d X L
+ + qi t = 0
t dt dt qi
i=1
6
Vale la pena mencionar que al Lagragiano lo podemos ver en este teorema, como una funcion arbitraria que depende de un
parametro t, de unas coordenadas qi y de qi , de tal manera que las ecuaciones que rigen el comportamiento de las coordenadas
qi con respecto al parametro t, sean las Ecs. (4.3). El sistema no tiene que ser mecanico y de hecho no tiene que ser un sistema
Fsico.
82 CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)
usando regla de la cadena para dL/dt y las ecuaciones de Lagrange, evaluamos el termino proporcional a t
n
! n
! n n
L d X L dL L d X L X L X L L
+ qi = + qi qi qi
t dt qi dt t dt qi qi qi t
i=1 i=1 i=1 i=1
X n X n Xn X n
d L L L L
= qi + qi qi qi
dt qi qi qi qi
i=1 i=1 i=1 i=1
n
X n n n
L X L X L X L
= qi + qi qi qi = 0
qi qi qi qi
i=1 i=1 i=1 i=1
es una constante de movimiento o cantidad conservada (integral de movimiento). En sntesis, si para una
transformacion especfica de coordenadas de la forma (5.21), existe un valor de (q, t) que satisfaga la Ec.
(5.31), dicho valor de nos conducira a una constante de movimiento de la forma (5.37). Recordemos que la
condicion (5.31) equivale a la invarianza de las ecuaciones de movimiento ante la transformacion (5.21).
2. Aunque (q, t) es una funcion arbitraria, esta debe ser derivable hasta segundo orden en todas sus varia-
bles y esta segunda derivada debe ser contnua. Ya que en una parte de la demostracion se intercambian
las segundas derivadas.
3. El teorema implica la invarianza de la accion (i.e. de las ecuaciones de movimiento). Sin embargo, no
implica la invarianza del lagrangiano mismo, esta solo se cumple si d () /dt = 0, d (t) /dt = 0.
4. En teora de campos (ver seccion 18.3) se puede hacer una demostracion similar con las siguientes
correspondencias: q (q) , q (q) , L L donde (q) representa los campos (un arreglo
vectorial de ellos), (q) representa sus derivadas con respecto al espacio y el tiempo, y L representa
una densidad Lagrangiana con Z
L L d3 q,
5. A pesar de que la funcion actua como un gauge para el Lagrangiano, vemos que la cantidad conser-
vada depende del cambio de esta funcion evaluado entre los dos sistemas coordenados. Esto es logico
ya que surge de manera natural a partir de la transformacion de coordenadas que se hizo. En realidad
esta cantidad se debe fijar a traves de la Ec. (5.31) con el fin de que la transformacion en cuestion deje
invariantes a las ecuaciones de movimiento.
5.4. EJEMPLOS DE APLICACION DEL TEOREMA DE NOETHER 83
6. Notese que la solucion para en la Ec. (5.31), no tiene porque ser unica. Por otro lado, puede ocurrir que
no exista solucion, en este caso la transformacion de coordenadas no es una transformacion de simetra
del sistema y no tendramos una cantidad conservada.
8. Una condicion esencial para la validez del teorema, es que el nuevo parametro t , dependa unicamente
del antiguo parametro t = t (t), y no de las antiguas coordenadas, como se ve en las Ecs. (5.20).
Esto es importante para la consistencia de la teora, puesto que el parametro debe ser completamente
independiente de las coordenadas, de modo que solo el regule la evolucion de las coordenadas, conservando
la independencia entre estas.
10. El teorema implica que las simetras del sistema deben reflejarse en su accion S.
11. Una estrategia muy fructfera para el uso del teorema de Noether es la siguiente: para una transformacion
de coordenadas especfica, buscamos las condiciones requeridas para que la Ec. (5.31) tenga solucion,
con la solucion as obtenida vamos a la Ec. (5.37) para encontrar la constante de movimiento que se
genera. Las condiciones que se necesiten para que (5.31) tenga solucion, seran entonces las condiciones
fsicas que debe tener mi sistema para que la transformacion de coordenadas sea una transformacion de
simetra para mi sistema, y por ende para que la cantidad generada en (5.37) sea realmente conservada.
" n
#
L X L d d
+ L qi = (q, t)
t qi dt dt
i=1
L d
= (q, t) (5.38)
t dt
si L no depende explcitamente del tiempo entonces es constante y ademas la Ec. (5.29) nos indica que el
Lagrangiano mismo es invariante ante la transformacion en cuestion. Por tanto, la cantidad conservada dada
por la Ec. (5.37) sera !
n
X n
X
L L
qi + L qi + = ca
qi qi
i=1 i=1
teniendo en cuenta que qi = 0 y como y son constantes resulta:
n
! n
!
X L X
h (qi , qi , t) qi L = pi qi L H = cte
qi
i=1 i=1
es decir, la funcion energa del sistema (Funcion Hamiltoniana), es la constante de movimiento. Cuando la
funcion energa (el Hamiltoniano) corresponde a la energa del sistema llegamos a la conservacion de la energa.
84 CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)
Vale decir que de acuerdo con nuestras condiciones, la energa se conserva incluso para algunos sistemas no
aislados, pues si los campos externos son independientes del tiempo, el Lagrangiano no dependera del tiempo
que es la condicion requerida para llegar a la conservacion de esta cantidad (ademas de las condiciones para
que la funcion energa, sea la energa del sistema).
En la discusion anterior asumimos que el Lagrangiano no depende explcitamente del tiempo, con lo cual
el Lagrangiano mismo permanece invariante ante la traslacion temporal. Vale la pena preguntarse si podemos
encontrar una condicion mas general en la cual las ecuaciones de movimiento permanezcan invariantes ante
dicha transformacion, pero no necesariamente el Lagrangiano mismo. Asumamos en consecuencia que el La-
grangiano puede depender explcitamente del tiempo, dado que L = T V , usualmente la energa cinetica
no depende explcitamente del tiempo (a menos que la transformacion a coordenadas generalizadas dependa
explcitamente del tiempo), si asumimos que en cambio la energa potencial es dependiente del tiempo, la Ec.
(5.38) queda
V 1 d
=
t dt
en general no es posible encontrar un que satisfaga esta ecuacion, ya que V
t no tiene que ser una derivada
total. Efectivamente en este caso la funcion energa no es constante de movimiento y no hay garanta de que
se pueda encontrar alguna funcion que s sea constante de movimiento.
En las tres secciones siguientes asumiremos que la funcion Lagrangiana del sistema en coordenadas carte-
sianas esta dada por
1
L = mr2 V (r) (5.39)
2
y encontraremos las condiciones para que las traslaciones espaciales, las rotaciones y las transformaciones de
Galileo sean transformaciones de simetra del sistema. As mismo encontraremos las cantidades conservadas
asociadas a cada simetra y veremos que los resultados son consistentes con los ya obtenidos.
x1 = x2 = 0 , x3 = cte , t = 0 (5.40)
n
X
L L d d
+ xi = (x, t) (5.41)
xi xi dt dt
i=1
n
X L
xi + (q, t) = ca (5.42)
xi
i=1
L V L
= ; = mxi (5.43)
xi xi xi
5.4. EJEMPLOS DE APLICACION DEL TEOREMA DE NOETHER 85
esto es valido para la invarianza traslacional, rotacional y galileana ya que hasta ahora solo hemos usado
t = 0. En el caso de la invarianza traslacional, usando (5.41), (5.40) y (5.43), se tiene:
n
X V d
xi = (x, t)
xi dt
i=1
X n
V
x3 = (x, t) xi (x, t)
x3 xi t
i=1
n
X
V
(x, t) xi = x3 (x, t) (5.44)
xi x3 t
i=1
claramente, la expresion de la derecha no contiene a los xi , por lo tanto los coeficientes de la izquierda tampoco
pueden contenerlos i.e.
(x, t) = 0 (x, t) = (t)
xi
de modo que la condicion (5.44) se reduce a:
V d
x3 = (t)
x3 dt
debido a la forma de nuestro Lagrangiano, el potencial V solo es funcion de la posicion de modo que a la
izquierda tenemos un termino que solo depende de la posicion y a la derecha otro que solo depende del tiempo,
V
de lo cual se sigue que x 3
debe ser independiente de (x,t), es decir es constante. Integrando7 :
V
x3 t = (5.45)
x3
con este valor de las ecuaciones de movimiento son invariantes en forma ante una transformacion espacial
de x3 . Es decir, que cuando se cumple (5.45), la traslacion espacial es una transformacion de simetra, la
constante de movimiento se sigue de (5.42)
L
x3 + (t) = ca
x3
V ca
mx3 + t = cb
x3 x3
V
recordando que la fuerza se escribe como Fi = x i
. tendremos en general que
mx3 F3 t = cb
ahora bien, si tenemos una invarianza similar asocida a x1 y x2 , la cantidad conservada es:
e = p Ft = mr Ft = cb
P (5.46)
es decir que el momento lineal p, es una funcion lineal del tiempo. Recordemos que bajo las condiciones
aqu establecidas, las componentes de la fuerza deben ser constantes de modo que F es un campo de fuerzas
constante y homogeneo.
Volviendo a la invarianza en solo x3 , vemos que la exigencia de dicha invarianza nos lleva a que 3 V = F3
sea constante. Es decir, a que la componente de la fuerza en esa direccion sea constante. Si en particular
suponemos que F3 = 0, se sigue que la cantidad conservada es justamente la componente del momento en esa
direccion.
L
= mx3 = p3 = cb (5.47)
x3
7
Una posible constante de integracion se puede absorber en .
86 CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)
adicionalmente, se puede ver de (5.45) que cuando F3 = 0, = 0 y el Lagrangiano como tal es invariante.
Por supuesto, la invarianza del vector momento se seguira si cada componente de la fuerza se anula.
Por tanto, vemos que el principio de conservacion del momento se sigue de la invarianza del Lagrangiano
ante una traslacion espacial, pero no de la invarianza de las ecuaciones de movimiento. Cuando solo esta ultima
se cumple para todas las coordenadas, F es un campo de fuerzas constante y homogeneo.
La existencia de un campo constante y homogeneo ilustra la diferencia entre homogeneidad local y homo-
geneidad global del espacio. El espacio que ocupa el campo es localmente homogeneo, porque ningun punto de
dicho espacio se puede distinguir de otro por una medicion local (en nuestro caso, se obtendra el mismo valor
de la fuerza en cada punto). Sin embargo, esta fuerza tiene que ser generada por alguna fuente (las placas de
un condensador, una masa distante etc.) la existencia de dicha fuente destruye la homogeneidad global del
espacio. Por tanto, la homogeneidad local del espacio implica que el momento es una funcion lineal del tiempo
en tanto que la homogeneidad global implica su conservacion8 .
Si consideramos que la rotacion esta descrita por un angulo infinitesimal constante, la transformacion a
primer orden en queda:
1 x1 x1
=
1 x2 x2
x1 = x1 () x2
x2 = x1 + x2
de modo que
x1 = x1 x1 = () x2
x2 = x2 x2 = () x1
x3 = t = 0 (5.48)
Recordemos que las ecuaciones (5.41, 5.42, 5.43), solo emplearon la condicion t = 0, y la estructura (5.39) del
Lagrangiano, de modo que son aplicables en este contexto. A partir de (5.41) se obtiene:
n
X
L L d d
+ xi = (x, t) (5.49)
xi xi dt dt
i=1
para la forma de nuestro Lagrangiano se aplican las Ecs. (5.43). Usando (5.43) y (5.48), los miembros de la
izquierda de (5.49) se escriben como
Xn
L L L L V V
xi = x1 + x2 + x3 = x2 x1
xi x1 x2 x3 x1 x2
i=1
Xn
L d L d L d
xi = x1 + x2 = mx1 () x2 + mx2 () x1 = 0
xi dt x1 dt x2 dt
i=1
8
Por supuesto la homogeneidad global absoluta no existe, ya que toda fuerza debe tener sus fuentes en alguna parte. Sin
embargo, si las fuentes estan a distancias mucho mayores que todas las distancias tpicas de mi problema, podemos pensar que las
fuentes estan en el infinito, en cuyo caso adquiere sentido la homogeneidad global como una buena aproximacion.
5.4. EJEMPLOS DE APLICACION DEL TEOREMA DE NOETHER 87
pero dado que los terminos de la izquierda no dependen de xi los coeficientes de xi a la derecha deben anularse
con lo cual xi = 0 i.e. (x, t) = (t). Con lo cual la Ec. (5.53) queda
d
(r V )3 = (t) (5.54)
dt
Por tanto, el miembro de la izquierda depende de coordenadas espaciales y el de la derecha solo del tiempo,
de tal forma que cada miembro debe ser constante, lo cual nos lleva a:
(r V )3 = cte (5.55)
La Ec. (5.55), es la condicion que se requiere para que las ecuaciones de Lagrange sean invariantes bajo una
rotacion sobre el plano X Y , este termino corresponde a menos la tercera componente del torque. Es decir
que la invarianza de las ecuaciones de Lagrange ante las rotaciones espaciales alrededor de un eje, requiere que
la componente del torque a lo largo de dicho eje sea uniforme y constante. Esto es analogo a la condicion de
que la fuerza sea constante y uniforme para que las ecuaciones de Lagrange sean invariantes ante traslaciones
espaciales. Integrando (5.54) obtenemos el valor de (t)
L L
x1 + x2 () 3 t = ca
x1 x2
mx1 () x2 + mx2 () x1 () 3 t = ca
mx1 x2 + mx2 x1 3 t = cb
(r p)3 3 t = cb
si asumimos que hay invarianza ante rotaciones en tres ejes mutuamente perpendiculares, la constante de
movimiento es
L ~ t = cb (5.57)
que es el analogo de (5.46) en el caso de invarianza traslacional. En este caso el momento angular es funcion
lineal del tiempo.
Volviendo a la invarianza ante rotaciones con respecto a x3 , vemos que si la tercera componente del torque
es cero la Ec. (5.54) nos dice que
d
(r V )3 = 0 (x, t) = 0
dt
y es una constante, esto nos lleva a la invarianza del Lagrangiano puesto que se cumplen las condiciones
(5.32). Reemplazando 3 = 0 en (5.57) la constante de movimiento es
L3 = cb (5.58)
88 CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)
que es el analogo de (5.47) para traslaciones espaciales. Luego la conservacion del momento angular total se
sigue de la invarianza del Lagrangiano ante rotaciones en tres ejes independientes.
Notese la analoga con las traslaciones espaciales, la invarianza de las ecuaciones de movimiento ante
traslaciones tena como condicion que las fuerzas fueran constantes y la invarianza del Lagrangiano mismo
nos llevaba a la conservacion del momento lineal. En este caso la invarianza rotacional de las ecuaciones de
movimiento requiere torques constantes y uniformes, y la invarianza del Lagrangiano mismo nos lleva a la
conservacion del momento angular. Es de anotar que en ambos casos cuando las ecuaciones quedan invariantes
pero no el Lagrangiano, las cantidades conservadas no son el momento lineal o el momento angular sino las
cantidades definidas en (5.46, 5.57).
V d V 1 d
t (v3 ) = f (t) (v3 ) = f (t) (5.65)
x3 dt x3 t dt
1 d V
y como t dt f (t) solo depende del tiempo y x3 (v3 ) solo del espacio, se tiene que
V
= cte
x3
ya que v3 es constante. La condicion Fsica requerida para la existencia de es entonces que la componente
F3 de la fuerza sobre la partcula sea constante y uniforme. Con esta condicion, podemos integrar facilmente
(5.65) y se obtiene
V t2
f (t) = (v3 ) + C (5.66)
x3 2
reemplazando (5.66) en (5.64)
1 V 2
= mx3 + t (v3 ) + C
2 x3
la constante se puede absorber en la cantidad conservada. Nuevamente usamos (5.37) para encontrar la cantidad
conservada y le aplicamos las Ecs. (5.43, 5.59)
n
X L
xi + (q, t) = ca
xi
i=1
L
x3 + (q, t) = ca
x3
1 V 2
mx3 (v3 ) t + mx3 + t (v3 ) = cb
2 x3
1 V 2
mx3 t mx3 + t = c1
2 x3
1
mx3 t mx3 F3 t2 = c1 (5.67)
2
De nuevo enfatizamos que F3 debe ser constante. Si adicionalmente, el Lagrangiano L tambien tiene invarianza
traslacional a lo largo de X3 , tendremos que 3 V = F3 = 0, y la cantidad conservada se reduce a:
mx3 t mx3 = c1
p3
x3 x3 t = c2 = x3 t
m
p3
c2 = x3 (0) = x3 t (5.68)
m
y como F3 = 0, la partcula se mueve con velocidad constante en la direccion x3 . Efectivamente, la Ec. (5.68)
describe un movimiento uniforme en la direccion de X3 , ya que p3 es constante en virtud de la invarianza
translacional del Lagrangiano a lo largo de X3 . Recordemos que x3 se refiere a la velocidad de la partcula, en
tanto que v3 o v3 se refiere a la velocidad del sistema S con respecto a S.
90 CAPITULO 5. SIMETRIAS Y CANTIDADES CONSERVADAS (LAGRANGE)
5.5. Ejercicios
1. Sea L (qi , qi , qi ) un Lagrangiano asociado al formalismo de la sacudida (ver seccion 4.6). Para este
Lagrangiano definamos una coordenada cclica qk como una coordenada que no aparece en el Lagrangiano,
pero aparece qk y/o qk . Defina una cantidad adecuada (un momento canonico extendido conjugado a qk )
que sea constante de movimiento cuando qk es cclica. Sugerencia: Observe la ecuacion de movimiento
(4.49), cuando esta asociada a una coordenada cclica.
2. Supongamos que el potencial U de un sistema fsico depende de las velocidades generalizadas. (a) De-
muestre que el momento p canonicamente conjugado a una coordenada global de rotacion del sistema
como un todo, viene dada por
N
X
p = L n (ri vi U )
i=1
donde n es un vector unitario en la direccion del eje de rotacion y vi es el operador diferencial definido
como
vi ux + uy + uz
vix viy viz
siendo vix la componente x de la velocidad de la iesima partcula, y lo mismo para las otras componentes.
Finalmente, L es el momento angular mecanico total a lo largo del eje de rotacion i.e.
N
X
L = n (ri pi )
i=1
3. Una partcula se mueve sobre un aro sin masa de radio R. El aro esta siempre vertical y gira alrededor de
un eje vertical que pasa por su diametro, con velocidad angular constante . Supondremos que las unicas
fuerzas exteriores son las de gravedad. (a) Encuentre un Lagrangiano y las ecuaciones de movimiento. (b)
Encuentre posibles constantes de movimiento. (c) Demuestre que si > 0 para un cierto valor crtico
0 , existe una solucion tal que la partcula permanece fija en el aro en un punto que no es el mas bajo.
Pero si < 0 , el unico punto estacionario para la partcula es el punto mas bajo del aro. Encuentre el
valor de 0 .
4. Para el pendulo esferico del problema 4 Pag. 4. (a) Encuentre los momentos canonicamente conjugados a
las coordenadas generalizadas que utilizo. Alguno de ellos es constante de movimiento?. (b) Encuentre
la funcion energa, se conserva?, es igual a la energa del sistema?. Recuerde que sus respuestas pueden
depender de las coordenadas generalizadas utilizadas.
L dGi
= (5.69)
qi dt
6. Sea una carga puntual q no relativista de masa m inmersa en un campo electrico constante y homogeneo
E. Un campo electrico constante y homogeneo E, se puede describir por cualquiera de los siguientes
conjuntos de potenciales
= E r ; A = 0 (5.70)
= 0 ; A = Et (5.71)
5.5. EJERCICIOS 91
correspondientes a diferentes gauges. (a) Tomando la convencion (5.70), demuestre que se conserva la
cantidad p qEt, donde p es el vector cuyas componentes son los momentos canonicamente conjugados a
las coordenadas cartesianas. (b) Demuestre que si tomamos la convencion (5.71), la cantidad conservada
es el momento canonicamente conjugado p. (c) Demuestre que en ambos casos la cantidad conservada se
reduce a mx qEt. Este ejercicio muestra que el momento canonicamente conjugado a las coordenadas
de una partcula en un campo electromagnetico, as como su contenido fsico pueden depender del gauge.
7. Sea una carga puntual q no relativista de masa m inmersa en un campo magnetico constante y homogeneo
B. Un campo magnetico constante y homogeneo B, se puede describir con los potenciales
1
A= Br ; =0 (5.72)
2
demuestre que se conserva la cantidad
q
p rB (5.73)
2
siendo p las componentes de los momentos canonicamente conjugados. Demuestre que en terminos de la
velocidad, esta cantidad conservada se puede escribir como
mx qr B (5.74)
9. Obtenga el valor de la constante de movimiento asociada a la invarianza galileana Ec. (5.67), en terminos
de las condiciones iniciales de dos maneras: (a) haciendo t = 0 en la Ec. (5.67). (b) Teniendo en cuenta
que F3 es constante de modo que hay un movimiento uniformemente acelerado en X3 , y reemplazando
las expresiones de x3 (t) y x3 (t) para un movimiento uniformememnte acelerado, en la Ec. (5.67).
Captulo 6
Ecuaciones de Movimiento de Hamilton
a las cantidades (qj , pj ) se les conoce como variables canonicas. La combinacion de ecuaciones de primer
orden y variables (q, p) resulta particularmente motivante, puesto que ya se discutio que muchas primeras
integrales de movimiento conducen a cantidades conservadas, esto implica que al ser las ecuaciones de Hamilton
de primer orden tales primeras integrales deben aparecer de manera mas directa1 . Ademas si una variable qi es
cclica, su momento canonicamente conjugado es constante y dado que los momentos conjugados son parte del
conjunto de variables independientes, estas constantes aparecen de manera mas directa en el formalismo.
1
Al ser las ecuaciones de Lagrange de segundo orden, se requiere realizar un proceso de integracion para llegar a primeras
integrales, las cuales son de primer orden.
92
6.2. TRANSFORMACIONES DE LEGENDRE 93
En las ecuaciones de Lagrange las variables q, q fueron tratadas todas como independientes, pero cada
ecuacion involucraba a q y q. Dado que ahora queremos escribir un formalismo en terminos de las variables
qk , pk , t, debemos realizar un cambio de variables del conjunto (qk , qk , t) al conjunto (qk , pk , t). Por simplicidad
consideremos primero un Lagrangiano que depende de una sola coordenada generalizada y una sola velocidad
generalizada L (q, q). Un diferencial de esta funcion se escribe como
L L
dL = u dq + v dq ; u ; v
q q
donde u y v son funciones de q y q. Para poder escribir con base en esto una funcion H (q, p), requerimos
escribir un diferencial de esta funcion en la forma
H H
dH = u dq + v dp ; u ; v
q p
donde u , v son funciones de q y p. El procedimiento matematico para realizar la transformacion de la funcion
L (Lagrangiano) a la funcion H (Hamiltoniano), se denomina una transformacion de Legendre.
g = f ux (6.3)
escribamos el diferencial de g
dg = df u dx x du = u dx + v dy u dx x du
dg = v dy x du
este diferencial tiene entonces la forma deseada. Las variables x y v son ahora funciones de u y y de la forma
g g
x= ; v=
u y
que son los analogos de (6.2). Un ejemplo de uso frecuente de la transformacion de Legendre en Fsica aparece
en la termodinamica. Para un gas experimentando un proceso reversible, se puede demostrar que el cambio
diferencial de energa dU se puede escribir como
U U
dU = T dS P dV ; T = ; P =
S V
siendo T, S, P, V la temperatura, la entropa, la presion y el volumen respectivamente. A partir de la funcion
energa interna U (S, V ) se puede generar la entalpa H (S, P ), a traves de una transformacion de Legendre
H = U + P V dH = dU + P dV + V dP = T dS P dV + P dV + V dP
H H
dH = T dS + V dP ; T = ; V =
S P
las energas libres de Helmholtz y de Gibbs, estan dadas por otras transformaciones de Legendre
F U TS ; G H TS
94 CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON
la forma diferencial de H se obtiene de su definicion (6.7) y de la forma diferencial del Lagrangiano (6.6)
dH = pk dqk + qk dpk dL
L
dH = pk dqk + qk dpk pk dqk pk dqk dt
t
L
dH = qk dpk pk dqk dt (6.8)
t
y el diferencial adquiere la forma deseada, puesto que los diferenciales dqk han sido removidos por la trans-
formacion de Legendre, y en su lugar aparecen los diferenciales dpk . Puesto que exigiremos que H sea funcion
exclusiva de las variables (qk , pk , t), el diferencial de H tambien se puede escribir de la forma
H H H
dH = dqk + dpk + dt (6.9)
qk pk t
comparando (6.8) con (6.9), y teniendo en cuenta que todas las variables qk , pk son todas independientes entre
s, se obtiene un conjunto de 2n + 1 ecuaciones
H
qk = ; k = 1, . . . , n
pk
H
pk = ; k = 1, . . . , n (6.10)
qk
L H
= (6.11)
t t
Las Ecs. (6.10), son conocidas como ecuaciones de movimiento de Hamilton, y constituyen el conjunto de
2n ecuaciones de primer orden que se buscaba. El primer conjunto de ecuaciones se puede considerar como el
inverso de las Ecs. (6.1) que definen al momento conjugado, con lo cual se puede pensar que no dan ninguna
informacion nueva. Esto es cierto desde el punto de vista de la resolucion de problemas, pero dentro del
formalismo ambos conjuntos de ecuaciones tienen gran significado si el Hamiltoniano puede ser conocido de
alguna manera.
Como se puede ver comparando (5.13) con (6.7), la funcion energa h y el hamiltoniano H son numerica-
mente identicos, pero se usa un smbolo diferente para cada una puesto que h es funcion de q,q,t en tanto que
el Hamiltoniano debe ser funcion exclusiva de q,p,t. El procedimiento para utilizar las ecuaciones de Hamilton
se ve mas bien laborioso ya que comprende las siguientes etapas
6.4. ALGORITMO MATRICIAL PARA LA OBTENCION DEL HAMILTONIANO 95
3. Se usa (6.7) para construir el Hamiltoniano. Sin embargo, la Ec. (6.7) deja al Hamiltoniano como funcion
mixta de q, q, p, t
4. Las ecuaciones (6.1) se invierten para obtener q en funcion de q, p, t. Este proceso de inversion presenta
varias dificultades que veremos mas adelante.
5. Los resultados anteriores se aplican para eliminar las q de H con el fin de expresar esta funcion unicamente
en terminos de q, p, t
h = H = L2 L0 (6.12)
Tambien aprendimos en la seccion 5.2.1, que si ademas las transformaciones que llevan a las coordenadas
generalizadas no dependen explcitamente del tiempo, y las fuerzas derivan de un potencial que no depende
de las q, la funcion energa (y por tanto el Hamiltoniano), sera la energa total
h= H = T +V (6.13)
Ahora haremos una suposicion un tanto mas restrictiva (pero suficientemente general) que la que se asume en
(5.15). Asumiremos que el Lagrangiano tiene la estructura
1
L = L0 (q, t) + qi ai (q, t) + qi qk Tik (q, t) (6.14)
2
En tal caso y teniendo en cuenta la Ec. (6.7), el Hamiltoniano H viene dado por la siguiente prescripcion
1
H = pn qn L0 (q, t) qi ai (q, t) qi qk Tik (q, t) (6.15)
2
si se cumple cualquiera de las relaciones (6.12, 6.13, 6.15), los pasos 3 y 4 arriba indicados se abreviaran. En
particular, bajo la suposicion (6.15), los pasos del 2 al 5 se pueden realizar de una vez al menos formalmente.
Para ello escribiremos (6.14) en forma matricial
e + 1 qT
L (q, q, t) = L0 (q, t) + qa e q (6.16)
2
donde q, a son matrices columna (no vectores Euclidianos!), T es una matriz n n, que sin perdida de
e es la traspuesta de q. Los elementos de las matrices son en
generalidad se puede tomar como simetrica2 y q
2
Un termino cuadratico en q tpico del Lagrangiano es de la forma M12 q1 q2 . En la suma sobre ndices de qi Tij qj aparecen dos
terminos relacionados con este coeficiente de modo que M12 q1 q2 = (q1 T12 q2 + q2 T21 q1 ) /2 (teniendo en cuenta el factor 1/2 en la
Ec. 6.16). Esto implica que la unica restriccion sobre T es que M12 = (T12 + T21 )/2 . En consecuencia, los elementos de la matriz
se pueden definir de muchas maneras, en particular podemos elegir T12 = T21 = M12 , y lo mismo para los otros coeficientes, en
cuyo caso la matriz sera simetrica.
96 CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON
general funciones de q y t. La transformacion de Legendre que define al Hamiltoniano Ec. (6.15), se puede
escribir matricialmente como
e e e 1 e
H = qp L = qp L0 (q, t) + qa + qTq
2
1
e (p a) qT e q L0 (q, t)
H = q (6.17)
2
derivando (6.14) se obtienen los momentos conjugados
L 1
pn = = L0 (q, t) + qi ai (q, t) + qi qk Tik (q, t)
qn qn 2
1 1
pn = an (q, t) + qk Tnk (q, t) + qi Tin (q, t)
2 2
teniendo en cuenta que la matriz T se eligio como simetrica y que los ndices k, i son mudos, se obtiene
pn = an (q, t) + Tnk qk
de modo que los momentos conjugados escritos en forma de matriz columna p estan dados por
p = Tq + a p a = Tq
donde hemos usado el hecho de que T1 tambien es simetrica. Observese que las expresiones (6.18, 6.19)
permiten reemplazar las q en terminos de los p, q, t ya que a y T solo son funciones de q, t. Es decir hemos
logrado el proceso descrito en el paso 4 de invertir las ecuaciones (6.1). Reemplazando (6.18, 6.19) en el
Hamiltoniano (6.17)
1
H = (e
pa e) T1 (p a) pe
(e a) T1 T T1 (p a) L0 (q, t)
2
1
pe
H = (e a) T1 (p a) (e pe a) T1 (p a) L0 (q, t)
2
1
H = pe
(e a) T1 (p a) L0 (q, t) (6.20)
2
Por lo tanto, si el Lagrangiano se puede escribir en la forma (6.16), el Hamiltoniano se escribe directamente
en la forma (6.20). En el caso mas usual, la matriz T es diagonal, en cuyo caso el inverso es tambien diagonal
donde T1 ii = Tii1 .
6.4.1. Hamiltoniano para un cuerpo sometido a una fuerza central en coordenadas esferi-
cas
A manera de ejemplo, consideremos el movimiento de un cuerpo bajo una fuerza central en coordenadas
esfericas, calculemos primero la energa cinetica
1
T = m x2 + y 2 + z 2
2
3
Tecnicamente, la matriz T es simetrica real y definida positiva. Esto implica que sus valores propios y su determinante son
estrictamente positivos con lo cual la matriz es invertible (ver seccion 12.14).
6.4. ALGORITMO MATRICIAL PARA LA OBTENCION DEL HAMILTONIANO 97
2
v 2 = x2 + y 2 + z 2 = r sin cos + r cos cos r sin sin
2 2
+ r sin sin + r cos sin + r sin cos + r cos r sin
v 2 = r 2 sin2 cos2 + sin2 + r 2 cos2 + r 2 2 cos2 cos2 + sin2 + r 2 2 sin2
+r 2 2 sin2 sin2 + cos2 + 2rr sin cos cos2 + sin2 2rr cos sin
v 2 = r 2 sin2 + cos2 + r 2 2 cos2 + sin2 + r 2 2 sin2 + 2rr sin cos 2rr cos sin
v 2 = r 2 + r 2 2 + r 2 2 sin2
por lo tanto el Hamiltoniano tiene la forma (6.12). En arreglo matricial, el Lagrangiano (6.22) se escribe
r
0 1 m 0 0
L = V (r) + r 0 + r 0 mr 2 sin2 0
2
0 0 0 mr 2
comparando con (6.16) resulta
1
0 m 0 0 m 0 0
1
L0 = V ; a = 0 ; T = 0 mr 2 sin2 0 ; T1 = 0 mr 2 sin2
0 (6.24)
0 0 0 mr 2 0 0 1
mr 2
y reemplazando en (6.20)
1 p x qAx
1 1 py qAy + q
H = (e e) T1 (p a) L0 =
pa px qAx py qAy pz qAz
2 2 m
pz qAz
1
H = (pi qAi ) (pi qAi ) + q
2m
1
H = (p qA)2 + q (6.26)
2m
donde el momento canonicamente conjugado p ya haba sido calculado en la seccion 5.1, Ec. (5.2), Pag. 70
de modo que el Hamiltoniano en terminos de la velocidad (o mas bien la funcion energa), queda
mx2
h=H= + q = T + q
2
notese que en este caso el potencial tiene un termino lineal en las velocidades de modo que el Hamiltoniano no
corresponde a T + U . Sin embargo, en este caso particular el Hamiltoniano aun corresponde a la energa total,
ya que el termino magnetico, que es el que rompe la condicion para que H = T + U , no produce trabajo4 y
la energa potencial (entendida como la capacidad para realizar trabajo) depende solo de . De lo anterior se
deduce que la condicion H = T + U es suficiente pero no necesaria para que H sea la energa del sistema.
de aqu se deduce que una coordenada generalizada esta ausente en el Hamiltoniano si y solo si esta ausente en el
Lagrangiano. En consecuencia, si cierta coordenada generalizada esta ausente de H, su momento canonicamente
conjugado sera constante de movimiento. Por tanto, las constantes de movimiento asociadas a variables cclicas
aparecen de inmediato como se anticipo debido a que las ecuaciones son de primer orden y que los momentos
conjugados se tomaron como coordenadas independientes. Esto significa que los teoremas de conservacion que
se derivaron en la seccion 5.1 se pueden derivar de la formulacion Hamiltoniana, as como la coneccion entre
simetras del sistema y constantes de movimiento. En particular, la invarianza ante traslaciones del sistema
como un todo en cierta direccion conduce a la conservacion de la componente del momento lineal del sistema
en esa direccion, esta coordenada de traslacion no aparece en H. La invarianza ante una rotacion con respecto
a cierto eje hace que dicha coordenada generalizada de rotacion (angulo), no aparezca en el Hamiltoniano y
lleva a la conservacion de la componente del momento angular total a lo largo del eje de rotacion.
Cuando trabajamos la funcion energa en la seccion 5.2, vimos que si L no es funcion explcita del tiempo,
h es una constante de movimiento. Naturalmente, esto es tambien valido para H. Con el fin de probar la
consistencia de esta aseveracion llegaremos a la misma conclusion por otro camino: Tomando la derivada total
de H con respecto al tiempo
dH H H H
= qi + pi +
dt qi pi t
usando las Ecs. de Hamilton (6.10), se eliminan los dos primeros terminos de la derecha, y utilizando (6.11)
resulta
dH H L
= = (6.38)
dt t t
de aqu resulta que t no aparece explcitamente en el Lagrangiano (t L = 0) si y solo si, no aparece explcita-
mente en el Hamiltoniano (t H = 0). En consecuencia, cuando t no aparece explcitamente en el Hamiltoniano,
tenemos que H sera una constante de movimiento (dH/dt = 0)6 . Recordemos que la conservacion de h (y H)
no significa necesariamente que esta funcion coincida con la energa total del sistema.
Por otro lado, tambien se vio en la seccion 5.2 que la funcion h (y por tanto H) es la energa total del sistema
si se cumplen las siguientes condiciones: (a) El Lagrangiano es expresable en la forma L = L0 + L1 + L2 siendo
cada sumando una funcion homogenea de grado cero uno y dos en las qi (b) las transformaciones que definen las
coordenadas generalizadas Ecs. (2.5) no dependen explcitamente del tiempo, y (c) el potencial es independiente
de las velocidades generalizadas. Si el potencial depende explcitamente del tiempo, entonces la energa del
sistema (el Hamiltonino) no es una constante de movimiento, pero si ademas de las anteriores condiciones
ocurre que el potencial no depende explcitamente del tiempo, la energa del sistema (el Hamiltoniano) es una
constante de movimiento.
La anterior discusion muestra que la identificacion de H como la energa del sistema o como constante
de movimiento son dos cosas aparte, aunque no necesariamente excluyentes. Otro aspecto discutido en la
seccion 5.2 es la dependencia tanto funcional como numerica de h con respecto a la escogencia del sistema
de coordenadas generalizadas. Lo mismo ocurre para H. Es posible por ejemplo, que para una escogencia de
coordenadas H se conserve, en tanto que con otra escogencia el nuevo H no se conserve. Por otro lado, es
plausible que el Hamiltoniano en cierto sistema coordenado corresponda a la energa del sistema, en tanto que
en otro sistema coordenado no lo sea. Esta es una de las diferencias mas fundamentales entre H y L, ya que
este ultimo cambia en forma funcional pero no en magnitud, cuando se hace un cambio a otras coordenadas
generalizadas. Ilustraremos las anteriores consideraciones con un ejemplo.
102 CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON
Figura 6.1: Sistema masa resorte donde el resorte se ata a un carro que viaja a velocidad constante.
mx2 k
L (x, x, t) = T V = (v0 t x)2 mx = k (x v0 t)
2 2
una forma de resolver el problema es cambiar a una variable x
x = x v0 t (6.39)
mx = kx (6.40)
donde x es el desplazamiento de la partcula medido desde el punto O . La Ec. (6.40) nos dice que el sistema
de referencia asociado al carro movil ve un movimiento armonico simple como se espera del principio de
equivalencia de Galileo7 .
Veamos ahora la formulacion Hamiltoniana. En terminos de la variable x vemos que la transformacion
(identidad) a coordenadas generalizadas no depende explcitamente del tiempo, el Lagrangiano se puede des-
componer en la forma L = L0 + L1 + L2 y ademas el potencial no dependen de la velocidad generalizada x.
Por tanto, el Hamiltoniano es la energa total del sistema y queda
p2 k
H (x, p, t) = T + V = + (x v0 t)2
2m 2
sin embargo H no es una cantidad conservada puesto que depende explcitamente del tiempo. Esto es fsi-
camente entendible ya que un agente externo debe proveer de energa al sistema para que el carro viaje a
velocidad constante en contra de la reaccion de la partcula.
6
Esto se debe a su vez a la propiedad particular de H (o de h), de que su derivada parcial temporal coincide con su derivada
temporal total. En este caso, hemos probado esta aseveracion como una consecuencia de las ecuaciones de Hamilton.
7
De la Ec. (6.39) vemos que para el caso particular de la Fig. 6.1, la variable x es negativa, puesto que v0 t x 0.
6.8. PROBLEMAS DE APLICACION DE LAS ECUACIONES DE HAMILTON 103
escribiendo el Lagrangiano de acuerdo con la estructura (6.16) en donde las matrices son 1 1 tenemos
mv02 k 2 1
L x , x , t = x + mv0 x + x mx
2 2 2
mv02 k 2
L0 = x ; a = mv0 ; T = m (6.42)
2 2
1 1 1 k mv02
H x , p , t = p a T 1 p a L0 = p mv0 p mv0 + x2
2 2 m 2 2
(p mv0 )2 kx2 mv02
H x , p , t = +
2m 2 2
La Ec. (6.41) nos indica que el Lagrangiano escrito en el nuevo sistema coordenado, posee un termino lineal
en x . Por otro lado, la transformacion a coordenadas generalizadas depende explcitamente del tiempo segun
se ve en la Ec.(6.39). Esto indica que H ya no es la energa total del sistema. En cambio, s es una constante
de movimiento ya que no depende explcitamente del tiempo y H /t = dH /dt = 0. Por otro lado, se
puede notar que el termino mv02 /2 es una constante que se puede remover tanto del Lagrangiano como del
Hamiltoniano, sin afectar las ecuaciones de movimiento. Finalmente, se puede ver que excepto por tal termino
constante, H se puede identificar con la energa total de movimiento de la partcula relativa al carro movil.
Ambos Hamiltonianos difieren en magnitud, forma funcional y dependencia temporal. Sin embargo, se puede
verificar que ambos conducen al mismo movimiento de la partcula.
Con lo anterior podra quedar la sensacion de que hemos cambiado de sistema de referencia en virtud de
que x es la coordenada que medira el sistema del carro movil (lo llamaremos sistema S ) y H sera la energa
total relativa a dicho sistema tambien. No obstante, la coordenada x es medida por el sistema original fijo a
tierra (lo llamaremos S), esto se puede ver en la forma en que se construye el Lagrangiano Ec. (6.41), tanto la
energa cinetica como la potencial se siguen midiendo con respecto al sistema S aunque se escriban en terminos
de la coordenada x . Efectivamente, ante un cambio de sistema de coordenadas el Lagrangiano preserva su
magnitud (aunque no su forma funcional). En contraste, ante un cambio de sistema de referencia tanto la
magnitud como la forma funcional del Lagrangiano pueden cambiar. El Hamiltoniano H se construyo usando
el Lagrangiano (6.41) de modo que tambien esta asociado al sistema S. Las interpretaciones como coordenada
relativa a S y energa relativa a S son una forma de ver a estas cantidades, pero no han sido construdas en
este sistema de referencia. Nuevamente se insiste en no confundir un cambio de sistema de referencia con un
cambio de sistema de coordenadas generalizadas.
Tomaremos las coordenadas generalizadas z y indicadas en la figura 6.2. Su relacion con las coordenadas
cartesianas es
La partcula esta sometida a la fuerza restauradora y la fuerza de ligadura que la mantiene sobre la superficie
cilndrica. Por supuesto, solo la fuerza restauradora contribuye a la energa potencial, la cual viene dada por
1 2 1 1
V = kr = k x2 + y 2 + z 2 = k R2 + z 2
2 2 2
1 2
V = kz
2
donde hemos suprimido el termino constante (1/2) kR2 obteniendo una energa potencial equivalente. La
6.8. PROBLEMAS DE APLICACION DE LAS ECUACIONES DE HAMILTON 105
energa cinetica es
1 1
T = m x2 + y 2 + z 2 = m 2 R2 sin2 + 2 R2 cos2 + z 2
2 2
1 2 2
T = m R + z 2
2
el Lagrangiano queda en la forma
1 2 2 1
L = T V = m R + z 2 kz 2 = L0 + L1 + L2
2 2
1 1 2 2
L0 = kz 2 , L1 = 0 , L2 = m R + z 2
2 2
la transformacion de coordenadas (6.43) no depende explcitamente del tiempo, el Lagrangiano se puede
descomponer en la forma L0 + L1 + L2 , y el potencial no depende de las velocidades generalizadas. Por tanto
la funcion energa es la energa del sistema
1 1
h = T + V = m R2 2 + z 2 + kz 2
2 2
para encontrar el Hamiltoniano en los argumentos adecuados, podemos en este caso invertir directamente las
ecuaciones (6.1), ya que
L L
p = = mR2 , pz = = mz
z
p pz
= 2
; z = (6.45)
mR m
sustituyendo estas expresiones en la funcion energa, obtenemos el Hamiltoniano
1 p 2 pz 2 1
H = m R2 + + kz 2
2 mR2 m 2
" #
1 p2 1
H = 2
+ p2z + kz 2
2m R 2
el Hamiltoniano no depende explcitamente del tiempo y por tanto la energa de la partcula se conserva. Las
ecuaciones de Hamilton nos dan
H H p
p = = 0 , = = (6.46)
p mR2
H H pz
pz = = kz , z = = (6.47)
z pz m
Notese que las ecuaciones de Hamilton para y z son las mismas ecuaciones (6.45) de definicion de los
momentos conjugados. Las dos ecuaciones (6.46) asociadas a p y tienen solucion inmediata, debido al
caracter cclico de la coordenada
p = mR2 = c0 (6.48)
de modo que el momento angular con respecto al eje Z se conserva, esto a su vez proviene del hecho de que el
problema es invariante ante una rotacion alrededor de dicho eje, puesto que es un eje de simetra del sistema.
Equivalentemente, la velocidad angular de giro alrededor del eje z es constante. Integrando la ecuacion (6.48)
se obtiene (t)
c0
(t) = 2
t + 0 ; c0 = p = (6.49)
mR mR2
106 CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON
Derivando la segunda de las Ecs. (6.47) obtenemos pz = mz, y reemplzando esto en la primera de las Ecs.
(6.47) queda
k
z + 02 z = 0 ; 02 (6.50)
m
la proyeccion del movimiento sobre Z es entonces armonica simple con frecuencia angular 0 . Es claro de
las ecuaciones (6.49, 6.50) que las constantes de integracion se obtienen conociendo condiciones iniciales tales
como (0) , (0) , z (0) , z (0). Equivalentemente puede ser el conjunto (0) , p , z (0) , pz etc.
q22
L = kq12 + + k1 q12 + k2 q1 q2 (6.51)
a + bq12
para un Lagrangiano con la estructura (6.52), el Hamiltoniano viene dado por (6.20)
1
H (q, p, t) = (e a) T1 (p a) L0 (q, t)
pe (6.55)
2
Figura 6.3: Pendulo simple cuyo punto de suspension esta restringido a moverse sobre una parabola z = ax2 .
La posicion del punto de suspension del pendulo esta dada por las coordenadas (x, z) , en tanto que la posicion
de la lenteja esta dada por las coordenadas (x , z ).
2 2
1 1
T = m(x2 + z 2 ) = m x + l cos + 2axx + l sin
2 2
2
V = mgz = mg ax l cos
en las Ecs. (6.54, 6.53), hubiese conducido al mismo Lagrangiano. Sin embargo, en tal caso la matriz T no sera simetrica, lo cual
fue una hipotesis fundamental en los desarrollos de la seccion 6.4.
9
De la Figura 6.3, se observa que se puede mover sin mover x y sin violar las ligaduras (moviendo con el punto de suspension
fijo). As mismo, se puede mover la coordenada x manteniendo fijo y respetando las ligaduras. Esto se logra moviendo el punto
de suspension a lo largo de la parabola manteniendo fijo, es decir con una traslacion paralela de la cuerda.
108 CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON
1 2
L = m x + 2lx cos + 4a2 x2 x2 + 4alxx sin + l2 2 mg(ax2 l cos )
2
1 h i
L = mg(ax2 l cos ) + m x2 1 + 4a2 x2 + 2xl (cos + 2ax sin ) + l2 2
2
este Lagrangiano se puede escribir en estructura matricial de la forma
2 1 m(1 + 4a2 x2 ) ml(cos + 2ax sin ) x
L = mg(ax l cos ) + x
2 ml(cos + 2ax sin ) ml2
tenemos que
escribiremos T1 como
1 1 1 J
T =
mY J (1 + 4a2 x2 )/l2
J (cos + 2ax sin )/l ; Y (sin 2ax cos )2 (6.61)
1 cos + 2ax sin 1 + 4a2 x2
H (x, , px , p ) = p2x 2 p px + p2 +
2m (sin 2ax cos )2 l l2
+mg(ax2 l cos ) (6.62)
Es facil ver que este Hamiltoniano es la energa del sistema y se conserva. Este Hamiltonainao no tiene
coordenadas cclicas para el sistema coordenado elegido. Escribiremos ahora las ecuaciones de Hamilton dadas
por
H H H H
x = ; = ; px = ; p =
px p x
las dos primeras nos dan
1 cos + 2ax sin
x = p x p (6.63)
m(sin 2ax cos )2 l
1 1 + 4a2 x2
= (cos + 2ax sin ) px + p (6.64)
ml(sin 2ax cos )2 l
las otras son son un poco mas extensas de calcular comencemos con
H 1 4a sin 8a2 x 2
px = = p px + 2 p
x 2m(sin 2ax cos )2 l l
2(2a cos ) 2 cos + 2ax sin 1 + 4a2 x2
+ p 2 p px + p2 + 2mgax
2m(sin 2ax cos )3 x l l2
resultando finalmente
2a l2 cos p2x + (cos + 2ax sin ) p2 + l sin2 2 2ax sin cos px p
px = 2mgax (6.65)
ml2 (2ax cos sin )3
(cos + 2ax sin ) 2 1 + 4a2 x2 (cos + 2ax sin )
p = p
3 x + 2 3 p2
m (sin 2ax cos ) l m (sin 2ax cos )
sin 2ax cos cos + 2ax sin (cos + 2ax sin )
+ +2 p px + mgl sin
ml (sin 2ax cos )2 l m (sin 2ax cos )3
1 2
p = 3 l (cos + 2ax sin ) p2x + (cos + 2ax sin ) 1 + 4a2 x2 p2
ml2 (sin 2ax cos )
h i o
l (sin 2ax cos )2 + 2 (cos + 2ax sin )2 p px mgl sin
y se obtiene finalmente
1 2
p = 3 l (cos + 2ax sin ) p2x + (cos + 2ax sin ) 1 + 4a2 x2 p2
ml2 (sin 2ax cos )
h i o
l (2ax sin + cos )2 + 1 + 4a2 x2 p px mgl sin (6.66)
reuniendo las ecuaciones (6.63, 6.64, 6.65, 6.66) obtenemos las ecuaciones de Hamilton para el pendulo cuyo
punto de suspension se mueve a lo largo de la parabola z = ax2
1 cos + 2ax sin
x = px p (6.67)
m(sin 2ax cos )2 l
1 1 + 4a2 x2
= (cos + 2ax sin ) px + p (6.68)
ml(sin 2ax cos )2 l
2
2a l cos p2x + (cos + 2ax sin ) p2 + l sin2 2 2ax sin cos px p
px = 2mgax (6.69)
ml2 (2ax cos sin )3
1 2 2 2 2
2
p = 3 l (cos + 2ax sin ) px + (cos + 2ax sin ) 1 + 4a x p
2
ml (sin 2ax cos )
h i o
l (2ax sin + cos )2 + 1 + 4a2 x2 p px mgl sin (6.70)
L (q1 , . . . , qs ; q1 , . . . , qn ; t)
es decir las ultimas ns coordenadas son cclicas (naturalmente s < n). Dado que en el formalismo Lagrangiano
todas las velocidades generalizadas aparecen y pueden ser en general funciones del tiempo, el problema tiene
aun n grados de libertad a pesar de la existencia de las coordenadas cclicas. En contraste, en el formalismo
Hamiltoniano las coordenadas cclicas se vuelven realmente ignorables, ya que los correspondientes momentos
conjugados se vuelven constantes de movimiento que denotaremos por k . El Hamiltoniano se puede escribir
en la forma
H = H (q1 , . . . , qs ; p1 , . . . , ps ; s+1 , . . . , n ; t)
el Hamiltoniano describe un problema de solo s grados de libertad, y las coordenadas cclicas han sido comple-
tamente ignoradas, excepto que se manifiestan como constantes de integracion k que se determinan con las
condiciones iniciales. El comportamiento de la coordenada cclica como tal se encuentra integrando la siguiente
ecuacion de movimiento
H
qn =
n
6.9. PROCEDIMIENTO DE ROUTH 111
esto sugiere utilizar un metodo que permita aprovechar las ventajas del formalismo Hamiltoniano con las
coordenadas cclicas junto con el formalismo Lagrangiano para las coordenadas no cclicas. Esto se logra usando
una transformacion matematica que convierta la base de las q,q en la base q, p solo para las coordenadas cclicas.
De esta forma se obtienen s ecuaciones de Lagrange para las coordenadas no cclicas, y 2 (n s) ecuaciones de
Hamilton para las coordenadas cclicas. Asumiendo que las coordenadas qs+1 , . . . , qn son cclicas, se propone
una nueva funcion R (conocida como el Routhiano) que defina una transformacion de Legendre parcial en
donde solo se transformen los terminos asociados a las variables cclicas, por tanto R esta definida por
n
X
R (q1 , . . . , qs ; q1 , . . . , qs ; ps+1 , . . . , pn ; t) pi qi L (6.71)
i=s+1
n
!
R X L L d L
= pi qi = =
qk qk qk qk dt qk
i=s+1
R
= pk = 0
qk
donde hemos tenido en cuenta las ecuaciones de Lagrange (2.23), la definicion de momento conjugado (5.1),
y el hecho de que los momentos conjugados a variables cclicas son constantes. Por otro lado para k = s +
1, . . . , n tambien tenemos
n
!
R X L
= pi qi = qk
pk pk pk
i=s+1
R R
= pk = 0 ; = qk ; k = s + 1, . . . , n (6.73)
qk pk
de modo que se logra el objetivo de tener ecuaciones tipo Lagrange para las variables no cclicas, Ecs. (6.72)
y tipo Hamilton para las variables cclicas Ecs. (6.73). Este metodo se conoce como procedimiento de Routh.
Es necesario escribir el Routhiano con los argumentos dados en la Ec. (6.71).
112 CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON
p2 nk
mr + 3
n+1 = 0
mr r
p2 nk
r 2 3 + = 0 (6.75)
m r mr n+1
ahora debemos aplicar las ecuaciones (6.73) tipo Hamilton, a la coordenada cclica y su momento conjugado
p
R R p
= 0 ; =
p mr 2
p
p = 0 ; = (6.76)
mr 2
cuya solucion es
p = mr 2 l = cte (6.77)
Las Ecs. (6.75, 6.77), junto con las condiciones iniciales, nos dan la solucion a la dinamica de la partcula. Un
conjunto de condiciones iniciales puede ser r (0) , r (0) , (0) y l.
El formalismo de Routh es frecuentemente util para problemas practicos en Fsica y en Ingeniera. Sin em-
bargo, como instrumento formal para posteriores construcciones en mecanica clasica, el formalismo puramente
Hamiltoniano es mucho mas fructfero.
6.10. ECS. DE HAMILTON A PARTIR DE UN PRINCIPIO VARIACIONAL 113
En la formulacion Lagrangiana las integrales se evaluan con base en las trayectorias en el espacio de configura-
ciones (adaptado para la formulacion Lagrangiana). La filosofa del formalismo Hamiltoniano requiere tratar
a las coordenadas q, p como independientes entre s. Por tanto, el espacio adecuado para trabajar trayectorias
en este formalismo consiste en tener 2n ejes coordenados uno para cada qi y uno para cada pi , un punto en este
espacio (espacio de fase) traza una curva a traves del parametro tiempo. En consecuencia, las integrales deben
ser evaluadas con base en las trayectorias en el espacio de fase. Dado que el conjunto q, p se considera inde-
pendiente, el integrando sera, en general funcion de q, q, p, p. Usando la Ec. (6.7) que define al Hamiltoniano,
en la Ec. (6.78) resulta
Z t2
I = [pi qi H (q, p, t)] dt = 0 (6.79)
t1
A la Ec. (6.79) se le suele denominar principio modificado de Hamilton en virtud de que la integral de lnea se
esta realizando en un espacio diferente (el espacio de fase). Teniendo en cuenta que las tecnicas desarrolladas
en la seccion 3.2 son validas para cualquier conjunto de variables y sus derivadas con respecto a un parametro
(en nuestro caso el tiempo)10 , tenemos que genericamente nuestro principio variacional se escribe
Z t2
I = f (q, q, p, p) dt = 0
t1
por tanto, las ecuaciones que se derivan del principio de Hamilton modificado, se obtienen aplicando las
relaciones (6.80) al integrando de la Ec. (6.79)
resultando
H H
pj + = 0 ; qj + =0
qj pj
De modo que hemos llegado a las ecuaciones de Hamilton a traves del principio variacional modificado de
Hamilton. Se puede argumentar que los momentos no pueden considerarse independientes en virtud de su
definicion (5.1) que nos muestra que p es en general funcion de q y q, con lo cual no se puede variar q
10
Desde el punto de vista matematico el espacio de fase es simplemente un espacio de configuracion de dimension 2n, ya que lo
que se hace es cartesianizar las variables independientes q y p colocando un eje para cada variable independiente.
114 CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON
o q, sin variar p. Recordemos sin embargo, que la filosofa misma del formalismo Hamiltoniano requiere de
considerar a q y p independientes, es decir que una vez establecido el formalismo Hamiltoniano la definicion
(5.1) no constituye parte del formalismo. Los momentos conjugados son elevados a la categora de variables
independientes, con un papel analogo a las coordenadas y conectados con ellas y con el tiempo solo a traves
de las ecuaciones de movimiento y no a traves de definiciones. Visto desde el punto de vista de un conteo de
grados de libertad, al introducir los momentos olvidando su definicion, estamos aumentando el numero de
grados de libertad, pero tambien estamos aumentando el numero de ecuaciones de modo que el numero de
grados de libertad real se conserva.
Un aspecto similar ocurre en la formulacion Lagrangiana, estrictamente q y q no son independientes en
virtud de la definicion q = dq/dt, pero cuando escribimos las ecuaciones de Lagrange olvidamos la definicion
de q y la elevamos al estatus de independiente, la dependencia original se recupera a traves de las n ecuaciones
de movimiento.
Podemos preguntarnos si el principio modificado de Hamilton contiene nueva Fsica respecto al original,
sin embargo este principio fue establecido con el fin de obtener las ecuaciones de Hamilton, al igual que el
principio variacional original fue construdo con el fin de reproducir las ecuaciones de Lagrange. Una vez que
el Hamiltoniano es construdo, la transformacion de Legendre muestra que las formulaciones de Lagrange y
Hamilton as como los respectivos principios variacionales de donde vienen, contienen todos la misma Fsica.
Vale la pena mirar si las restricciones de punto fijo en el principio de Hamilton sufren algun cambio en
el principio de Hamilton modificado. Por ejemplo en el espacio de configuraciones, la condicion de extremo
fijo significa qi = 0, en tanto que en el espacio de fase significa qi = pi = 0. Para esto nos debemos
preguntar si es necesaria la condicion de extremo fijo en el espacio de fase para llegar a las ecuaciones de Euler
Lagrange dadas por (6.80). Si volvemos a la demostracion de las ecuaciones de Euler Lagrange en la seccion
3.2, vemos que la condicion de extremo fijo se requiere para eliminar el primer termino de la derecha en la
Ec. (3.22). No obstante, teniendo en cuenta que nuestro integrando definido por (6.81) no es funcion explcita
de pj se observa que la eliminacion del termino ya descrito, es automatica para las variables pj y no requiere
de condicion de punto fijo en estas variables. Por tanto, el principio de Hamilton modificado conduce a las
ecuaciones de Hamilton bajo las mismas condiciones variacionales que el principio de Hamilton original, es
decir bajo la condicion de extremo fijo solo en las qi .
La anterior discusion muestra que la condicion pj = 0 no es una condicion necesaria pero s sera una
condicion suficiente para llegar a las ecuaciones de Hamilton. Existen en realidad grandes ventajas al imponer
extremos fijos en el espacio de fase, ya que en este caso obtenemos una simetra Gauge para el Hamiltoniano
similar a la que posee el Lagrangiano, es decir se puede adicionar al integrando una funcion de la forma
dF (q, p, t) /dt, siendo F dos veces diferenciable, sin afectar la validez del principio variacional. Como ejemplo
d
sencillo si adicionamos al integrando en la Ec. (6.79) un termino de la forma dt (qi pi ) el principio modificado
de Hamilton quedara
Z t2
[pi qi H (q, p, t)] dt = 0 (6.82)
t1
notese que ahora el integrando s depende de pj . Por tanto, si queremos que esta nueva expresion aun nos
conduzca a las ecuaciones de Hamilton, es necesario imponer pj = 0 (con esta nueva expresion no necesitamos
que qj = 0, pero al hacer la transformacion inversa y volver al integrando original, se ve que dicha condicion
s es necesaria). De modo que si requerimos una simetra gauge que permita adicionar un termino de la forma
dF (q,p,t)
dt se requiere de condicion de extremo fijo en el espacio de fase11 . El integrando en (6.82) no es el
Lagrangiano ni se puede relacionar facilmente con el Lagrangiano a traves de una transformacion puntual. La
condicion de extremo fijo en el espacio de fase provee un metodo para llegar a la formulacion Hamiltoniana sin
pasar por una formulacion Lagrangiana. Esto elimina la necesidad de ligar las q, q de un Lagrangiano, con las
q, p de un Hamiltoniano. Esto sera importante cuando estudiemos transformaciones de variables en el espacio
de fase que preservan la forma de las ecuaciones de Hamilton.
La independencia entre q y p en la formulacion Hamiltoniana es una de las grandes diferencias con las
11
Notese que en ausencia de la condicion pj = 0, aun tenemos un gauge aunque mas debil, ya que podramos adicionar un
factor de la forma dFdt
(q,t)
. Esto no es lo deseable ya que la idea es que F contenga todas las variables independientes.
6.11. EL PRINCIPIO DE MINIMA ACCION (OPCIONAL) 115
formulacion Lagrangiana en la cual los momentos aparecen como una definicion Ec. (5.1). Podemos pensar
como si tuvieramos 2n coordenadas generalizadas y sus derivadas temporales. Solo ampliando el numero de
grados de libertad de n a 2n se pueden obtener ecuaciones de primer orden.
donde L () representa el valor de L cuando tomamos el camino variado siendo L (0) el camino correcto.
La variacion se descompone en dos partes, una surge del cambio en los lmites de integracion y la otra del
parametro i.e. la variacion de la curva como tal. Escribiremos la primera integral como
Z t2 +t2 Z t2 Z t1 +t1 Z t2 +t2
= +
t1 +t1 t1 t1 t2
y dado que las cantidades t1 , t2 y F () son infinitesimales, las dos ultimas integrales nos dan diferenciales
de segundo orden y por tanto se desprecian. Similarmente, L (0) se puede considerar constante dentro de los
intervalos de integracion [ti , ti + ti ] , puesto que una variacion L (infinitesimal) del Lagrangiano dentro de
uno de estos intervalos, dara una contribucion del orden de Lti . Con estas consideraciones, la variacion
a primer orden queda finalmente
Z t2 Z t2
L dt = L (t2 , = 0) t2 L (t1 , = 0) t1 + L dt (6.86)
t1 t1
Los dos primeros terminos en el miembro derecho de la Ec. (6.86), se deben a la variacion en los lmites
de integracion, tomados sobre el camino correcto. El tercer termino a la derecha de (6.86), se origina en la
variacion de la curva como tal a traves del parametro , tomando los mismos lmites de integracion que en la
curva original.
La variacion en la integral de la derecha puede realizarse a traves de una parametrizacion del camino
variado, como en la seccion 3.2, pero la variacion de qi no se anula en los extremos. Retomando la ecuacion
(3.22), el primer termino de la derecha en dicha ecuacion ya no se anula, con lo cual la Ec. (3.23) se modifica
en la forma Z t2 Z t2
L d L L 2
L dt = qi dt + qi
t1 t1 qi dt qi qi 1
donde qi se define en forma analoga a la Ec. (3.24). Usando las ecuaciones de Lagrange12 , esta nueva variacion
se escribe Z t2
L 2
L dt = qi
qi t1 1
12
Al tomar ecuaciones de Lagrange, estamos asumiendo la validez del principio de Hamilton.
6.11. EL PRINCIPIO DE MINIMA ACCION (OPCIONAL) 117
y la variacion queda Z t2 2
L dt = L (t) t + pi qi 1 (6.87)
t1
qi (1) es la variacion en qi con respecto a la coordenada en la curva correcta tomada en el tiempo t1 , otro
tanto ocurre con qi (2). La idea es escribir la variacion de la accion en terminos de las variaciones de
las coordenadas, calculemos entonces qi (2)
notese que i (t2 ) nos da una variacion solo si no se impone que i se anule en los extremos con t1 y t2 fijos.
De manera similar se calcula para el otro extremo quedando
qi = qi + qi t (6.88)
1. Consideraremos sistemas en donde L, y por tanto H no dependan explcitamente del tiempo, de modo
que H es una cantidad conservada.
2. Restringiremos las variaciones de tal manera que para los caminos vecinos H tambien sea conservada al
igual que en el camino correcto.
3. Exigiremos ademas que los caminos variados cumplan el requerimiento de que qi se anule en los extremos
(pero no t). Esto implica entonces que qi (t1 , 0) para el camino real debe coincidir con qi (t1 + t1 , )
para el camino variado, y similarmente para t2 .
Un ejemplo particular de trayectoria vecina que podra satisfacer los tres requisitos, es un camino en donde
la lnea que describe la trayectoria variada en el espacio de configuraciones coincida con la lnea de la
trayectoria real, la diferencia consiste en la rapidez con que se desplaza el punto que describe la trayectoria en
ambos casos, es decir que las funciones qi (t) estan alteradas en el camino variado. En este caso es necesario
cambiar los tiempos en los extremos de la curva variada a fin de que H se mantenga constante en todos los
puntos de la trayectoria variada.
Teniendo en cuenta las condiciones adicionales impuestas, la variacion de la accion dada por la Ec.
(6.89), queda
Z t2
L dt = H (t2 t1 ) (6.90)
t1
por otro lado, bajo las mismas condiciones, la accion como tal queda
Z t2 Z t2
L dt = pi qi dt H (t2 t1 )
t1 t1
118 CAPITULO 6. ECUACIONES DE MOVIMIENTO DE HAMILTON
el nombre de este principio proviene del hecho de que la integral en (6.92), se conoca antiguamente como la
accion. La literatura moderna utiliza el termino accion para la integral involucrada en el principio variacional
de Hamilton. Para la integral en (6.92) se utiliza con frecuencia el termino accion abreviada.
T 1
pi = = (Mik qk + Mji qj )
qi 2
1
pi qi = (Mik qk qi + Mji qj qi ) = 2T
2
empleando esta ultima igualdad en (6.92) resulta
Z t2
T dt = 0 (6.93)
t1
si ademas T se conserva al igual que H (por ejemplo es el caso de un cuerpo rgido aislado puesto que en tal
caso la energa potencial es solo interna y no cambia con el tiempo). El principio de mnima accion adquiere
entonces la forma
(t2 t1 ) = 0
esta ecuacion nos dice que de todos los caminos posibles entre dos puntos en el espacio de configuraciones,
consistente con la conservacion de H y T , el sistema se movera a lo largo de un camino particular para el
cual el tiempo de transito es el mnimo posible (mas estrictamente estacionario). En esta forma el principio de
mnima accion nos recuerda al principio de Fermat en optica geometrica, en donde una rayo de luz atraviesa el
camino que minimiza el tiempo de viaje. Notese que para llegar a esta conclusion por este camino, fue necesario
que el intervalo temporal de integracion no fuera fijo, como efectivamente ocurre en la variacion.
Pensemos ahora el caso especial de una partcula asumiendo que T no es necesariamente constante, la
energa cinetica se escribe
m ds 2
T =
2 dt
donde s denota la longitud de arco. De esta ecuacion se puede despejar dt
ds
dt = p (6.94)
2T /m
6.12. EJERCICIOS 119
6.12. Ejercicios
1. Demuestre explcitamente que dado un Hamiltoniano H, el nuevo Hamiltoniano dado por
dF (q, p, t)
H = H +
dt
conduce a las mismas ecuaciones de Hamilton que H. Que condiciones se necesitan sobre F para
garantizar la equivalencia de ambos Hamiltonianos?.
2. Use las ecuaciones de Hamilton para encontrar las ecuaciones de movimiento de un pendulo esferico,
usando coordenadas generalizadas apropiadas.
3. En el problema de la seccion 6.8.1, de una partcula restringida a moverse en una superficie cilndrica,
encuentre la energa del sistema en terminos de las condiciones iniciales.
4. Encuentre las ecuaciones de Hamilton asociadas al Hamiltoniano de la Ec. (6.54), Pag. 106.
5. Un Hamiltoniano de un solo grado de libertad tiene la forma
p2 ba kq 2
H (q, p) = bqpet + q 2 et + bet + (6.96)
2 2 2
donde a, b, , y k son constantes (a) Encuentre el Lagrangiano asociado a este Hamiltoniano, (b) Encuen-
tre un Lagrangiano equivalente que no dependa explcitamente del tiempo. (c) Encuentre el Hamiltoniano
asociado al nuevo Lagrangiano, as como su relacion con el Hamiltoniano (6.96).
6. Encuentre el Hamiltoniano y las ecuaciones de Hamilton para el pendulo doble descrito por la Fig. 2.1,
Pag. 16.
Captulo 7
Transformaciones canonicas
Hay un tipo de problema que sera de muy facil solucion con el formalismo Hamiltoniano, el caso en el cual
H es una constante de movimiento y todas las coordenadas generalizadas son cclicas, de modo que todos los
momentos conjugados son constantes
pi = i ; i = 1, . . . , n
y dado que el Hamiltoniano no puede ser funcion ni del tiempo ni de las coordenadas cclicas, este se escribe
como
H = H (1 , . . . , n )
y las ecuaciones de Hamilton para qi son simplemente
H
qi = = i ; i = 1, . . . , n (7.1)
i
dado que las i son funciones de las i unicamente, son tambien constantes en el tiempo. Las Ecs. (7.1) tienen
solucion inmediata
qi = i t + i ; i = 1, . . . , n
donde las i as como las i se determinan con las 2n condiciones iniciales. Podra pensarse que esta clase de
problemas son de interes solo academico. No obstante, cabe recordar que existe en general mas de un sistema
coordenado generalizado para un sistema fsico dado. Por ejemplo, para fuerzas centrales el uso de coordenadas
cartesianas no conduce a variables cclicas en tanto que las coordenadas polares producen automaticamente una
variable cclica. El numero de variables cclicas depende en general del sistema de coordenadas generalizadas
utilizado. Es posible entonces que encontremos un conjunto de coordenadas en las que todas las coordenadas
sean cclicas, una vez encontrado el resto del problema es muy sencillo. Dado que en general el sistema
coordenado mas obvio no va a ser normalmente cclico, debemos desarrollar un metodo para transformar este
conjunto coordenado en otro que sea mas adecuado. Las transformaciones de este tipo que hemos usado hasta
el momento, son de un conjunto {qi } de coordenadas generalizadas a otro conjunto {Qi }
Qi = Qi (qi , t) ; i = 1, . . . , n (7.2)
por ejemplo, la transformacion de coordenadas cartesianas a polares tiene esta forma1 . Estas transformaciones
se conocen como transformaciones puntuales.
En el formalismo Hamiltoniano, los momentos conjugados estan al mismo nivel que las coordenadas de tal
modo que las transformaciones puntuales deben realizarse en el espacio de fase y no en el de configuraciones,
por tanto debemos estudiar transformaciones del tipo
Qi = Qi (q, p, t) ; Pi = Pi (q, p, t) (7.3)
1
No toda transformacion de coordenadas cartesianas a otro conjunto de coordenadas es del tipo (7.2), ya que estas ultimas
se refieren a transformaciones entre dos conjuntos de coordenadas independientes. Por ejemplo, las transformaciones descritas
por (2.2), relacionan en general a un conjunto de coordenadas dependientes (las cartesianas) con otro conjunto de coordenadas
independientes (las qi ).
120
7.1. TRANSF. CANONICAS Y EL PRINCIPIO DE HAMILTON MODIFICADO 121
En el formalismo Hamiltoniano, solo interesan aquellas transformaciones para las cuales exista una funcion
K (Q, P, t) tal que las ecuaciones de movimiento en el nuevo sistema de coordenadas Q, P , tengan la estructura
de las ecuaciones de Hamilton, es decir
K K
Qi = ; Pi = (7.4)
Pi Qi
al mismo tiempo, las antiguas variables canonicas deben satisfacer el mismo principio
Z t2
(pi qi H (q, p, t)) dt = 0 (7.6)
t1
teniendo en cuenta que el principio modificado de Hamilton tiene variacion cero en los extremos2 , la validez
simultanea de (7.5) y (7.6) conduce a que los dos integrandos esten relacionados de la siguiente forma
dF
[pi qi H (q, p, t)] = Pi Qi K (Q, P, t) + (7.7)
dt
donde F es una funcion de las coordenadas del espacio de fase y del tiempo con derivadas contnuas hasta se-
gundo orden. es una constante independiente de las coordenadas y el tiempo, que produce una transformacion
de escala.
Example 4 Veamos un caso de transformacion de escala. Pasemos de {q, p} a otro conjunto {Q , P } con una
transformacion de la forma
Qi = qi ; Pi = pi (7.8)
las ecuaciones de Hamilton (7.4) seran satisfechas si elegimos el kamiltoniano
K Q , P H (q, p) (7.9)
(pi qi H) = Pi Qi K (7.10)
2
Recordemos que para llegar a las ecuaciones de Hamilton solo requerimos que qi = 0, pero tambien podemos imponer pi = 0,
con el fin de enriquecer el gauge del Hamiltoniano.
122 CAPITULO 7. TRANSFORMACIONES CANONICAS
que es de la forma (7.7) con = , y dF/dt = 0. Sin embargo, si tenemos una transformacion {q, p}
{Q , P } con factor de escala 6= 1
dF
[pi qi H (q, p, t)] = Pi Qi K Q , P , t + (7.11)
dt
siempre podemos encontrar un conjunto intermedio de coordenadas {Q, P } relacionadas con {Q , P } por una
transformacion de escala de la forma (7.8, 7.10)
Qi = Qi ; Pi = Pi
Pi Qi K = Pi Qi K (7.12)
El ejemplo anterior nos muestra que la transformacion de escala es basicamente trivial y no aporta signifi-
cativamente al formalismo de las transformaciones canonicas, de modo que trabajaremos las transformaciones
dadas por (7.13). Cuando 6= 1 se habla de transformaciones canonicas extendidas. Cuando = 1 habla-
mos simplemente de una transformacion canonica. Lo que hemos visto es que una transformacion canonica
extendida siempre se puede separar en una transformacion canonica seguida de una transformacion de escala.
Cuando la transformacion canonica no depende explcitamente del tiempo se habla de transformacion canonica
restringida. De aqu en adelante se trabaja con transformaciones canonicas (no extendidas) a menos que se
indique lo contrario.
El ultimo termino a la derecha de (7.13) solo contribuye a la variacion de la accion en los extremos y por
lo tanto se anula si F es una funcion de (q, p, t) o de (Q, P, t) o cualquier mezcla de las coordenadas de los dos
espacios de fase {q, p} y {Q, P }, dado que todas ellas tienen variacion cero en los extremos. Ademas, por medio
de las ecuaciones de transformacion (7.3) y sus inversas, es posible expresar a F en terminos de coordenadas
nuevas y viejas. En realidad estas funciones adquieren mayor utilidad cuando se expresan con un numero igual
de variables viejas y nuevas (ademas del tiempo). En ese sentido F actua como puente entre los dos sistemas
de coordenadas y se denomina la funcion generadora de la transformacion.
F F1 (q, Q, t) (7.14)
dF1
pi qi H = Pi Qi K +
dt
F1 F1 F1
pi qi H = Pi Qi K + + qi + Qi (7.15)
t qi Qi
7.2. FUNCIONES GENERADORAS DE UNA TRANSFORMACION CANONICA 123
y dado que las coordenadas nuevas y viejas son separadamente independientes y H,K, F1 no son funciones de
qi ni de Qi , se llega a que los coeficientes que acompanan a qi , Qi deben anularse
F1 F1
pi = ; Pi = ; i = 1, . . . , n (7.16)
qi Qi
quedando finalmente
F1
K=H+ (7.17)
t
las primeras n de las Ecs. (7.16) definen a pi como funciones de qj , Qj y t. Asumiendo que son invertibles, se
pueden despejar las Qi en terminos de qj , pj , t, lo cual nos dara la primera mitad de las transformaciones
(7.3). Una vez establecidas, las Qi (qj , pj , t) se pueden sustituir en la segunda serie de Ecs. (7.16) de tal manera
que se obtienen las Pi como funciones de qj , pj , t; y por tanto la segunda mitad de las transformaciones
(7.3). Finalmente, la relacion (7.17) nos da la coneccion entre el nuevo Hamiltoniano K y el antiguo H, de
esta relacion se ve que K difiere numericamente de H si y solo si F1 depende explcitamente del tiempo. Es
necesario tener en cuenta que K debe ser funcion de Q, P, t, para lo cual los argumentos de H es decir q, p, t
deben ser convertidos en Q, P, t a traves de la inversa de las relaciones (7.3), de la misma forma, los argumentos
qi , t de la funcion t F1 deben expresarse en terminos de Q, P, t; con lo cual la funcion K ya queda en terminos
de los argumentos correctos.
El procedimiento anterior describe formalmente como se pueden obtener las transformaciones canonicas
partiendo de una funcion generatriz F1 . Este proceso puede ser revertido para obtener la funcion generatriz
comenzando con las transformaciones canonicas (7.3). Se comienza por invertir el primer conjunto de transfor-
maciones (7.3) con el fin de expresar los pi como funciones de q, Q, t, tal expresion se reemplaza entonces en el
segundo conjunto de transformaciones (7.3) con lo cual se obtienen los Pi tambien como funciones de q, Q, t.
Se obtienen entonces dos funciones especficas
pi = pi (q, Q, t) ; Pi = Pi (q, Q, t)
reemplazando estas funciones especficas en las ecuaciones (7.16), se obtiene un conjunto de 2n ecuaciones
diferenciales con 2n coordenadas (qi , Qi ), para F1 (q, Q, t). Estas ecuaciones permiten en principio encontrar
a F1 siempre que las transformaciones sean realmente canonicas. Se puede ver que existe una arbitrariedad en
la solucion para F1 . En particular, se le puede adicionar una funcion arbitraria cuyo argumento es el tiempo
solamente3
F1 (q, Q, t) = F1 (q, Q, t) + g (t)
Esta funcion aditiva claramente no afecta las ecuaciones de transformacion. Por otro lado, se aprecia en la Ec.
(7.17), que el Kamiltoniano con F1 s cambia con respecto al Kamiltoniano con F1 , pero en una derivada total
con respecto al tiempo, que no afecta a las ecuaciones de Hamilton. En algunas ocasiones F1 puede tener otras
ambiguedades.
En ocasiones no es adecuado escribir la funcion generatriz en terminos de los argumentos q, Q, t. Por
ejemplo, la transformacion puede ser tal que los pi no se puedan escribir como funciones de q, Q, t, sino
mas bien como funciones de q, P, t. En este caso se debe buscar una funcion generatriz que sea funcion de las
antiguas coordenadas q y los nuevos momentos P . Claramente la Ec. (7.15) debe reemplazarse por una relacion
similar pero que involucre a Pi en lugar de Qi . Esto se logra escribiendo a F en (7.13) como
F F2 (q, P, t) Qi Pi (7.18)
3
Este es un conjunto de ecuaciones diferenciales sin condiciones iniciales ni de frontera. Por esta razon no se espera unicidad
en su solucion. Ademas, F1 no corresponde a un observable fsico, de modo que tampoco es necesaria dicha unicidad.
124 CAPITULO 7. TRANSFORMACIONES CANONICAS
Cuadro 7.1: Funciones generatrices de los 4 tipos, sus ecuaciones diferenciales asociadas y algunos ejemplos
simples.
por razones similares al caso de F1 , los terminos proporcionales a qi y Pi deben anularse y por lo tanto
los tres ultimos terminos de la izquierda deben cancelarse. De estas cancelaciones se obtienen las ecuaciones
fundamentales para F2 y para K
F2 F2
pi = ; Qi = (7.19)
qi Pi
F2
K = H+ (7.20)
t
al igual que con el caso anterior, el primer conjunto de ecuaciones (7.19) debe resolverse para Pi en funcion
de qj , pj , t, con lo cual se tiene la segunda mitad de las transformaciones (7.3). La primera mitad de las
transformaciones (7.3) se obtiene sustituyendo P (q, p, t) en la segunda mitad de las Ecs. (7.19).
Obviamente, existen otros dos tipos basicos de funciones generatrices F3 (p, Q, t) y F4 (p, P, t), para las
cuales el procedimiento es analogo y se sintetiza en la tabla 7.1. Se puede observar que los cuatro tipos basicos
de funciones generatrices estan conectados a traves de transformaciones de Legendre. Por ejemplo, la transicion
entre F1 y F2 equivale a ir de las variables q, Q a las variables q, P con el segundo conjunto de relaciones (7.16)
F1 (q, Q, t)
Pi =
Qi
ya que de esta relacion se puede obtener Pi en terminos de q, Q, t la cual formalmente se puede despejar para
obtener Qi (q, P, t), que permitira reemplazar el conjunto q, Q por el conjunto q, P . Esta es precisamente la
forma requerida para una transformacion de Legendre de la base de variables (q, Q) a la base de variables
(q, P ), como se discutio en la seccion 6.2. En analoga con la Ec. (6.3), escribimos
lo cual es equivalente a igualar (7.14) con (7.18). De manera similar a partir de (7.14), y las definiciones de las
otras funciones generatrices dadas en la tabla 7.1, se puede ver que todas las otras funciones generatrices se
7.3. EJEMPLOS DE TRANSFORMACIONES CANONICAS 125
pueden ver como transformaciones de Legendre de F1 . En particular, F4 se obtiene con dos transformaciones
de Legendre de F1 dado que requiere el cambio de los dos conjuntos de argumentos. Sin embargo, no toda
transformacion canonica puede ser generada por medio de alguna de las cuatro funciones generatrices basicas.
De modo que en algunos casos, estas transformaciones de Legendre pueden conducir a funciones generatrices
nulas o indeterminadas. Por esta razon es preferible definir cada tipo de funcion generadora relativa a la funcion
F de la Ec. (7.13), la cual es una funcion de 2n coordenadas y/o momentos independientes, pero que no tiene
sus argumentos bien definidos.
En particular, la funcion generatriz apropiada no necesariamente es del tipo 1,2,3 o 4 para todas sus
coordenadas y/o momentos. Es posible y en algunos casos necesario para ciertas transformaciones canonicas,
usar una funcion generatriz que sea mezcla de los cuatro tipos. A manera de ejemplo, podra ser conveniente
que para cierta transformacion canonica con dos grados de libertad, definamos una funcion generatriz de la
forma
F (q1 , p2 , P1 , Q2 , t)
esta funcion generatriz estara relacionada con F de (7.13) a traves de
F = F (q1 , p2 , P1 , Q2 , t) Q1 P1 + q2 p2
esto define una transformacion de Legendre adecuada para cambiar Q1 por P1 y para cambiar q2 por p2 . Las
ecuaciones de transformacion se obtienen a traves de las relaciones
F F
p1 = ; Q1 =
q1 P1
F F
q2 = ; P2 =
p2 Q2
F
K = H+
t
Se puede ver que F es una mezcla entre funciones del tipo F2 y F3 .
F2 = qi Pi (7.22)
donde las fi son un conjunto de funciones independientes, y g es una funcion diferenciable en q, t, ambas tienen
como argumentos las coordenadas antiguas y el tiempo. Usando el segundo conjunto de Ecs. (7.19) las nuevas
coordenadas Qi vienen dadas por
F2
Qk = = fk (q1 , . . . , qn ; t) (7.24)
Pk
de modo que con esta transformacion las coordenadas nuevas solo dependen de las coordenadas antiguas y
el tiempo pero no de los antiguos momentos. Esto define una transformacion puntual como la expresada en
126 CAPITULO 7. TRANSFORMACIONES CANONICAS
(7.2). Para definir una transformacion puntual las funciones fi deben ser independientes e invertibles, de
modo que las qj se puedan expresar en terminos de las Qk . Dado que las fi son por lo demas arbitrarias, se
concluye que toda transformacion puntual puede ser parte de una transformacion canonica (recuerdese que
una transformacion canonica requiere conocer tambien las transformaciones en los pi ). Las Ecs. (7.20, 7.23)
nos dan el nuevo Hamiltoniano
fi g
K=H+ Pi +
t t
Veamos ahora las ecuaciones de transformacion para el momento conjugado que induce (7.23), el primer
conjunto de Ecs. (7.19) lleva a
F2 fi g
pj = = Pi + (7.25)
qj qj qj
estas ecuaciones se pueden invertir para dar P en funcion de (q, p). Este procedimiento es mas sencillo si se
usa una formulacion matricial, definiremos entonces arreglos matriciales de la forma
f fi g g
(p)j pj ; (P)i Pi ; ;
q ji qj q j qj
F1 = qk Qk (7.28)
Similarmente, una funcion tipo F1 (q, Q, t) no puede generar la transformacion identidad, ya que las Ecs.
(7.16) nos llevan a
F1 (q, Q, t)
pi =
qi
y definen a pi en funcion de q, Q, t, pero en la transformacion identidad, pi solo es funcion de Pi . Adicionalmente,
no es posible obviar esta dificultad definiendo una funcion F1 mediante una transformada de Legendre del tipo
(7.21), aplicada a la generadora F2 de la identidad.
F1 (q, Q, t) = F2 (q, P, t) Pi Qi = qi Pi Pi Qi
F1 (q, Q, t) = Qi Pi Pi Qi = 0
que no es una funcion generatriz. Similar resultado se obtiene si se intenta generar la transformacion de
permutacion a partir de una funcion F2 que provenga de la transformacion de Legendre del generador F1 de
permutacion. No obstante, se puede demostrar que una funcion F3 puede generar la transformacion identidad
y que una funcion tipo F4 puede generar la permutacion.
Finalmente, una transformacion que deja algunas parejas (q, p) inalteradas, e intercambia el resto (con un
cambio de signo), es una transformacion canonica de tipo mixto. En un sistema de dos grados de libertad, la
transformacion
Q1 = q1 , P1 = p1
Q2 = p 2 , P2 = q2 (7.29)
1 k
H= p 2 + m2 2 q 2 ; 2
2m m
esta forma en suma de cuadrados en q y p sugiere que para que la nueva coordenada sea cclica, podemos
hallar una transformacion de la forma
f (P )
p = f (P ) cos Q ; q = sin Q (7.31)
m
Dado que la transformacion (7.31) no depende explcitamente del tiempo, el Hamiltoniano no cambia numeri-
camente y en las nuevas coordenadas queda
f 2 (P ) f 2 (P )
K=H= cos2 Q + sin2 Q = (7.32)
2m 2m
de modo que Q resulta cclica. Solo nos queda hallar la forma de f (P ) tal que la transformacion (7.31) sea
canonica. El cociente entre la Ecs. (7.31) nos lleva a
p = mq cot Q (7.33)
128 CAPITULO 7. TRANSFORMACIONES CANONICAS
que es independiente de f (P ). Esta transformacion es de la forma p = p (q, Q) lo cual sugiere buscar una
funcion generatriz tipo F1 , pues el primer conjunto de Ecs. (7.16) nos da pi = pi (q, Q, t) en la forma
F1 (q, Q, t)
p= (7.34)
q
mq 2
F1 (q, Q, t) = cot Q (7.35)
2
F1 mq 2
P = = (7.36)
Q 2 sin2 Q
despejando q se obtiene
r
2P
q= sin Q (7.37)
m
que al compararla con la segunda de las Ecs. (7.31) nos da
f (P ) = 2mP (7.38)
K = H = P
que claramente es cclico en Q, con lo cual P es una constante de movimiento. Como H es constante y es la
energa del sistema, el nuevo momento canonico viene dado por
E
P = (7.39)
K
Q = =
P
cuya solucion es
Q = t + (7.40)
siendo una constante de integracion fijada por las condiciones iniciales. Sustituyendo (7.39) y (7.40) en (7.37)
resulta
r
2E
q= sin (t + )
m 2
que es la solucion conocida para el oscilador armonico.
Cabe ahora la pregunta, que nos asegura que la transformacion definida por (7.31) y por (7.38) es canoni-
ca?. Lo asegura el hecho de que tal transformacion es generada por una funcion generatriz tipo 1 Ec. (7.35)
que cumple con sus ecuaciones diferenciales Ecs. (7.34) y (7.36).
7.5. TRANSF. CANONICAS CON LA FORMA SIMPLECTICA DE LAS ECS. DE HAMILTON 129
la primera caracterstica notable es que el Hamiltoniano no cambia ante una transformacion canonica restrin-
gida, como se ve de (7.14, 7.17). Su forma funcional puede ser diferente pero se conserva su valor numerico.
La idea es que la transformacion sea canonica, lo cual es equivalente a exigir que las nuevas coordenadas Q, P
cumplan ecuaciones de Hamilton para el nuevo Hamiltoniano K = H
H H
Qi = ; Pi = (7.42)
Pi Qi
Estudiaremos el primer conjunto de Ecs. (7.42), evaluemos primero Qi el cual se calcula con base en
(7.41), y en las ecuaciones de Hamilton para las coordenadas antiguas (es decir asumiendo que las coordenadas
originales tambien son canonicas)
Qi Qi Qi H Qi H
Qi = qj + pj = (7.43)
qj pj qj pj pj qj
ahora calculamos el termino de la derecha en el primer conjunto de Ecs. (7.42), para lo cual se requieren las
inversas de (7.41)
qj = qj (Q, P ) ; pj = pj (Q, P ) (7.44)
las cuales nos permiten calcular H (q, p, t) en terminos de Q, P, t, as como el termino en cuestion
H H pj H qj
= + (7.45)
Pi pj Pi qj Pi
El primer conjunto de Ecs. (7.42), nos conduce a igualar los terminos de la derecha en (7.43) y (7.45) con lo
cual resulta
Qi pj Qi qj
= ; = (7.46)
qj q,p Pi Q,P pj q,p Pi Q,P
donde los subndices enfatizan los argumentos en los cuales queda evaluada cada expresion. Con un procedi-
miento similar, el segundo conjunto de Ecs. (7.42) nos lleva a las siguientes condiciones
Pi pj Pi qj
= ; = (7.47)
qj q,p Qi Q,P pj q,p Qi Q,P
el conjunto de condiciones (7.46) y (7.47) se conoce usualmente como condiciones directas para una trans-
formacion canonica restringida.
4
Vale la pena mencionar que los cuatro tipos basicos de funciones generatrices que se han estudiado no cubren el espectro de
todas las transformaciones canonicas.
130 CAPITULO 7. TRANSFORMACIONES CANONICAS
El procedimiento anterior se puede realizar en forma matricial usando las ecuaciones de Hamilton simplecti-
cas descritas en la seccion 6.5. Partimos de la formulacion simplectica descrita en las Ecs. (6.33).
H
= J (7.48)
con J y definidos por (6.29, 6.31). Similarmente, el nuevo conjunto coordenado Qi , Pi define una matriz
columna de dimension 2n analoga a , denotamos esta matriz por , y para una transformacion canonica
restringida, las Ecs. (7.41) se pueden escribir como
= () (7.49)
ahora bien, la condicion canonica exige que se cumplan las Ecs. (7.42), que matricialmente se escriben en la
forma
H
= J (7.50)
donde hemos tenido en cuenta que una transformacion canonica restringida no cambia el valor numerico del
Hamiltoniano como se vio en el formalismo de la funcion generatriz. Evaluemos primero el termino de la
izquierda en (7.50) teniendo en cuenta (7.49)
i
i = j i, j = 1, . . . , 2n
j
i
Mij i = Mij j (7.51)
j
matricialmente queda
= M (7.52)
reemplazando (7.48) en (7.52) resulta
H
= MJ (7.53)
por otro lado, a traves de la relacion inversa de (7.49), H se puede escribir como funcion de , y podemos
evaluar tambien el termino de la derecha en (7.50)
H H j H H fij H
= = Mji =M
i j i i j j
la transposicion y la inversion se pueden tomar en cualquier orden. Si se comparan explcitamente las con-
diciones que se derivan de (7.57), se observa que coinciden con las expresadas en las Ecs. (7.46) y (7.47).
Adicionalmente, usando (6.32) vemos que la Ec. (7.57) se puede transformar en
f 1 (J)
JMJ (J) = J2 M
JM = Mf 1 J
o equivalentemente
f
MJM =J (7.58)
La ecuacion (7.56), o la version equivalente (7.58) se conocen como condiciones simplecticas para una
transformacion canonica y la matriz M que satisface esta condicion, se denomina matriz simplectica.
Para una transformacion canonica extendida restringida (independiente del tiempo e incluyendo una trans-
formacion de escala), donde K = H, la condicion (7.56) resulta
f = J
MJM (7.59)
M es funcion de F (ya que depende de la transformacion canonica especfica), pero no as J la cual es una
matriz constante (ver Ec. 6.31). Este formalismo no se puede aplicar en todos los casos. En particular, no se
puede construir una matriz simple M para generar la transformacion canonica usada para el oscilador armonico
en la seccion 7.4.
= (, t)
evoluciona contnuamente con el tiempo a partir de un cierto t0 . Es una transformacion contnua uniparametri-
ca. Si la transformacion
(t) (7.62)
es canonica, se tiene que en particular la transformacion
(t0 ) (7.63)
es canonica siendo t0 un tiempo fijo, se sigue entonces de la definicion de transformacion canonica, que la
transformacion caracterizada por
(t0 ) (t) (7.64)
es tambien canonica. Puesto que en (7.63) el tiempo es fijo, esta transformacion canonica debe satisfacer la
condicion simplectica (7.58). Si podemos probar que (7.64) cumple la condicion simplectica, es facil mostrar
que la transformacion general (7.62) tambien la cumple.
Para demostrar que la condicion simplectica es aun necesaria y suficiente para transformaciones de la forma
(7.64) usaremos la nocion de transformacion canonica infinitesimal (TCI) en la cual todas las coordenadas
nuevas difieren de las antiguas por cantidades infinitesimales
Qi = qi + qi (7.65)
Pi = pi + pi (7.66)
F2 = qi Pi + G (q, P, t) (7.68)
es una parametro infinitesimal y G es una funcion con segundas derivadas contnuas en sus 2n+1 argumentos.
Dado que esta funcion generatriz es de tipo 2, podemos emplear las Ecs. (7.19) de transformacion para los
momentos
F2 G
pj = = Pj +
qj qj
7.6. METODO SIMPLECTICO PARA T.CS DEPENDIENTES DEL TIEMPO 133
con lo cual
G
pj Pj pj = (7.69)
qj
F2 G
Qj = = qj +
Pj Pj
dado que el segundo termino a la derecha es lineal en , y que Pj solo difiere de pj infinitesimalmente, entonces
es consistente a primer orden cambiar la variable de derivacion Pj por pj . De esta forma G se escribe en
terminos de q, p, t unicamente. El cambio infinitesimal qj se puede escribir a primer orden como
G
qj Qj qj = (7.70)
pj
las ecuaciones de transformacion (7.69, 7.70), se pueden sintetizar en una ecuacion matricial
G
= J (7.71)
una transformacion infinitesimal que nos interesa directamente, es la transformacion (7.64) cuando t difiere de
t0 en una cantidad infinitesimal
(t0 ) (t0 + dt) (7.72)
dt hace las veces del . Dado que entre (, t0 ) y (, t) con t0 y t arbitrarios, la transformacion es contnua, se
puede construir como una sucesion de transformaciones infinitesimales en pasos de dt. Por lo tanto, bastara con
probar que la transformacion infinitesimal (7.72) satisface la condicion simplectica (7.58). La TCI (7.71), tiene
asociada una matriz jacobiana, y se puede ver facilmente que esta ultima es simplectica. Tomando la definicion
de matriz jacobiana (7.51) para una transformacion infinitesimal como (7.67) se obtiene
M =1+
definimos la matriz
2G 2G
(7.74)
ij i j
la cual es claramente simetrica, en virtud de la continuidad de las segundas derivadas de G. Teniendo ademas
en cuenta que J es antisimetrico, y trasponiendo M en (7.73) resulta
^ 2G
f = 1+ e
M J
2
f G
M = 1 J
134 CAPITULO 7. TRANSFORMACIONES CANONICAS
f
para chequear la condicion simplectica (7.58) debemos hacer el producto MJM
2 2
f G G
MJM = 1 J J 1 + J
2 2
G G
= J+J2 J2 + O 2
2 2
G G
f
MJM = J + + O 2
f
MJM = J + O 2
donde hemos usado la propiedad J2 = 1, de modo que a primer orden en , se cumple la condicion simplectica
para la transformacion infinitesimal (7.72). Por tanto cualquier transformacion canonica obedece la condicion
simplectica aun cuando sea explcitamente dependiente del tiempo. Notese que es esencial que no haya con-
tribuciones a primer orden en , ya que una transformacion canonica finita, se obtiene con un proceso de
integracion sobre el parametro infinitesimal de las TCI. En consecuencia, los terminos de primer orden daran
una contribucion finita para una transformacion canonica finita, y solo los terminos de segundo orden en
adelante tienden a cero despues de llevar a cabo la integracion.
A pesar de que en este acercamiento poco se ha usado el formalismo de la funcion generatriz, tanto el
formalismo simplectico como el de la funcion generatriz estan conectados (ver seccion 8.5). Se puede demostrar
por ejemplo que la condicion simplectica implica la existencia de una funcion generatriz. Cualquiera de los
dos formalismos se puede usar indistintamente de acuerdo con las necesidades y conveniencias. En particular,
cualquiera de los dos formalismos sirve para demostrar que las transformaciones canonicas forman un grupo
matematico.
Q = q cos p sin
P = q sin + p cos (7.79)
para averiguar si esta transformacion es canonica, utilizaremos la condicion simplectica Ec. (7.56)
f=J
MJM (7.80)
Podemos hallar M a traves de la ecuacion (7.52)
= M (7.81)
para lo cual derivamos las Ecs. (7.79) con el tiempo, teniendo en cuenta que es fijo
Q cos sin q q
= =M
P sin cos p p
evaluando explcitamente la condicion (7.80) tenemos
f cos sin 0 1 cos sin
M JM =
sin cos 1 0 sin cos
f cos sin sin cos 0 1
MJM = = =J
sin cos cos sin 1 0
F1 (q, Q) F1 (q, Q)
p= ; P = (7.82)
q Q
La primera de las ecuaciones (7.82), requiere conocer p como funcion de q, Q. Podemos lograr este despeje en
la primera de las Ecs. (7.79)
Q
p (q, Q) = + q cot (7.83)
sin
con lo cual la primera de las ecuaciones diferenciales (7.82) queda
136 CAPITULO 7. TRANSFORMACIONES CANONICAS
F1 (q, Q) Q
= + q cot
q sin
que al integrar nos da
Qq q2
F1 (q, Q) = + cot + g(Q) (7.84)
sin 2
para poder emplear la segunda de las ecuaciones diferenciales (7.82), debemos escribir P = P (q, Q), lo cual se
logra insertando (7.83) en la segunda de las ecuaciones de transformacion (7.79)
Q q cos
P = q sin + p cos = q sin + + cos
sin sin
q cos2 Q cos
P (q, Q) = q sin + (7.85)
sin sin
q Q cos
P (q, Q) = (7.86)
sin sin
utilizando (7.86) en la segunda de las Ecs. (7.82) resulta
F1 (q, Q) q Q cos
= +
Q sin sin
que se puede integrar para obtener
qQ Q2
F1 = + cot + h(q) (7.87)
sin 2
comparando las F1 de las ecuaciones (7.84, 7.87) encontramos una solucion haciendo
q2 Q2
h (q) = cot ; g (Q) = cot
2 2
quedando finalmente
Qq 1
F1 = + (q 2 + Q2 ) cot ; 6= n (7.88)
sin 2
esta solucion es valida para todo , excepto para = n siendo n un entero, puntos en los cuales esta funcion
diverge. Veremos ahora si existe una solucion tipo F2 (q, P ) que pueda cubrir los huecos dejados por la
solucion de F1 (q, Q). Las ecuaciones diferenciales (7.19), se escriben
F2 (q, P ) F2 (q, P )
p= ; Q= (7.89)
q P
la primera requiere conocer p = p (q, P ), y este despeje es directo de la segunda de las ecuaciones (7.79)
P q sin F2
p= ; p= (7.90)
cos q
la solucion para F2 (q, P ) es de la forma
qP q2
F2 = tan + f (P ) (7.91)
cos 2
para resolver la segunda ecuacion (7.89) necesitamos Q = Q (q, P ), lo cual se obtiene insertando (7.90) en la
primera de las ecuaciones (7.79)
F2
Q = q cos (P q sin ) tan ; Q=
P
7.7. EJEMPLOS DE TRANSFORMACIONES CANONICAS 137
P2 sin2
F2 = qP cos tan + qP + g(q)
2 cos
qP P2
F2 = tan + g(q) (7.92)
cos 2
1 qP 1
F2 (q, P ) = (q 2 + P 2 ) tan + ; 6= n+ (7.93)
2 cos 2
esta funcion converge para = n, de modo que llena los huecos dejados por la funcion F1 (q, Q) de la Ec.
(7.88). La funcion (7.93) diverge para = (n + 1/2) , pero estos huecos son llenados por F1 .
La interpretacion de la transformacion (7.79) como una rotacion bidimensional nos hace intuir que = 0
corresponde a la identidad, como se observa al hacer = 0 en (7.79). Similarmente, haciendo = 0 en (7.93)
obtenemos F2 (q, P ) = qP , en concordancia con el generador de la identidad dado por la Ec. (7.22).
Ahora aplicando = /2 en las ecuaciones (7.79) tenemos
Q = p ; P = q
p1 p2
Q1 = q 1 q 2 P1 = +1
q2 q1
q 2 p2 q 1 p1
Q2 = q 1 + q 2 P2 = (q2 + q1 )
q2 q1
es canonica. Para ello recurriremos a la condicion simplectica. La matriz jacobiana de transformacion esta dada
por la Ec. (7.51)
Q1 Q1 Q1 Q1
M11 = = q2 ; M12 = = q1 ; M13 = = 0 ; M14 = =0
q1 q2 p1 p2
Q2 Q2 Q2 Q2
M21 = = 1 ; M22 = = 1 ; M23 = = 0 ; M24 = =0
q1 q2 p1 p2
P1 p1 p2 P1 p1 p2
M31 = = 2 ; M32 = =
q1 (q2 q1 ) q2 (q2 q1 )2
P1 1 P1 1
M33 = = ; M34 = =
p1 (q2 q1 ) p2 (q2 q1 )
138 CAPITULO 7. TRANSFORMACIONES CANONICAS
P2 p2 q 2 p1 q 1 p1 p2 q2 p1 q1 (q2 q1 ) p1 (q2 q1 )2
M41 = = 1 =
q1 (q2 q1 )2 q2 q1 (q2 q1 )2
p2 q2 p1 q2 + 2q1 q2 q12 q22
=
(q2 q1 )2
P2 p2 p1 q 1 p2 q 2
M42 = = + 1
q2 q2 q1 (q2 q1 )2
(q2 q1 ) p2 + p1 q1 p2 q2 (q2 q1 )2 p1 q1 p2 q1 + 2q1 q2 q12 q22
= =
(q2 q1 )2 (q2 q1 )2
P2 q1 P2 q2
M43 = = ; M44 = =
p1 q2 q1 p2 q2 q1
la matriz jacobaina y su transpuesta quedan entonces
q2 q1 0 0
1 1 0 0
M =
(p1 p2 ) (p1 p2 )
(q q )2 1 1
(q2 q
(q2 q1 )2 2 1 (q2 q1 ) 1)
2 2
p2 q2 p1 q2 +2q1 q2 q1 q2 p1 q1 p2 q1 +2q1 q2 q12 q22
(q2 q1 )2 (q2 q1 )2
(q2qq
1
1)
q2
(q2 q1 )
p1 p2 (q12 +q22 +p1 q2 p2 q2 2q1 q2 )
q2 1 (q1 q2 )2
2
(q1 q2 )
(q12 +q22 p1 q1 +p2 q1 2q1 q2 )
f =
M q1 1 (qp1q
p2
2 (q1 q2 )2
1 2)
1 q1
0 0 q1 q2 q1 q2
0 0 1
q1 q2 q1qq
2
2
ahora debemos realizar el producto MJM f y verificar si coincide con J. Con una dosis de paciencia y una buena
taza de cafe, el lector puede comprobar que se cumple la condicion simplectica. Por tanto, esta transformacion
es canonica.
7.8. Ejercicios
1. Demostrar que una funcion del tipo F3 (p, Q, t) puede generar la transformacion canonica identidad, y
una funcion del tipo F4 (p, P, t) puede generar la transformacion canonica de intercambio o permutacion.
2. Sea q, p un conjunto canonico para un grado de libertad. Demuestre que el conjunto Q, P dado por
Q = log (1 + q cos p) ; P = 2 (1 + q cos p) q sin p (7.94)
es tambien un conjunto canonico y que una funcion generadora para esta transformacion esta dada por
2
F3 (p, Q) = eQ 1 tan p
3. Para un sistema con dos grados de libertad, sean {qi , pi } variables canonicas, y una transformacion
puntual de la forma
Q1 = q12 , Q2 = q1 + q2
7.8. EJERCICIOS 139
encuentre la transformacion mas general para P1 y P2 que genere una transformacion canonica. Ahora
sea el Hamiltoniano
p1 p2 2
H= + p2 + (q1 + q2 )2
2q1
Encuentre una transformacion particular para P1 y P2 de tal forma que Q1 y Q2 sean ambas cclicas.
Resuelva las ecuaciones de Hamilton y obtenga la solucion para q1 , q2 , p1 y p2 en funcion del tiempo, y
en terminos de las condiciones iniciales.
4. La Ec. (2.49) define una transformacion gauge para los campos electromagneticos. Dicha transformacion
cambia al Hamiltoniano (6.26) y al momento canonico (6.27). (a) Muestre que este cambio se puede
ver como una transformacion canonica en donde q permanece inalterada. (b) Encuentre una funcion
generadora del tipo 2, que genera dicha transformacion canonica. Una transformacion canonica para n
grados de libertad que deja invariantes los qi se denomina una transformacion canonica gauge.
es canonica.
p iaq
Q = p + iaq , P =
2ia
es canonica. (b) Encuentre una funcion generadora. (c) Use esta transformacion para resolver el oscilador
armonico lineal.
8. Utilizando el procedimiento de la seccion 7.2, complete la tabla 7.1 de la Pag. 124, para las funciones del
tipo F3 (p, Q, t) y F4 (p, P, t).
Captulo 8
Corchetes de Poisson y otros invariantes canonicos
Hemos visto que las transformaciones canonicas son aquellas que preservan la forma de las ecuaciones de
Hamilton. Esto nos motiva a buscar estructuras que sean invariantes canonicas, ya que si una cierta cantidad
preserva su forma ante transformaciones canonicas, entonces es posible que dicha cantidad pueda enlazarse
facilmente con las ecuaciones de movimiento en cualquier base canonica. Por otro lado, los invariantes canonicos
tienen el potencial de expresar ecuaciones de movimiento equivalentes a las de Hamilton. Teniendo esto en
mente estudiaremos un invariante canonico muy importante: los corchetes de Poisson. Adicionalmente, veremos
como las ecuaciones de movimiento y las cantidades conservadas se pueden escribir en el lenguaje de los
corchetes de Poisson. Haremos ademas una breve mencion de otros invariantes canonicos.
140
8.1. CORCHETES DE POISSON 141
pero las derivadas parciales definen precisamente el Jacobiano de la transformacion, con lo cual tenemos
f
[, ] = MJM (8.5)
y dado que la transformacion es canonica, la condicion simplectica (7.58) nos lleva a escribir
[, ] = J (8.6)
se pueden revertir los pasos para mostrar que si (8.6) es valida, la transformacion es canonica.
Los corchetes de Poisson de variables canonicas en s tales como (8.4, 8.6), se denominan corchetes
fundamentales de Poisson. Las Ecs. (8.4) escritas en las nuevas variables canonicas, dan
[, ] = J (8.7)
y comparando (8.6) con (8.7) vemos que ambos tienen el mismo valor cuando se evaluan con respecto a
cualquier conjunto de coordenadas canonicas. En otras palabras, los corchetes fundamentales de Poisson son
invariantes bajo transformaciones canonicas. La ecuacion (8.5), muestra que la invarianza es una condicion
necesaria y suficiente para que la matriz de transformacion sea simplectica. La invarianza de los corchetes
fundamentales de Poisson ante el cambio de base canonica, es entonces equivalente en todos los sentidos a la
condicion simplectica.
Veremos ahora que todos los corchetes de Poisson son invariantes ante transformaciones canonicas. Reto-
memos el corchete de Poisson para funciones arbitrarias u, v Ec. (8.2), la derivada de v con respecto a se
puede escribir en analoga con la Ec. (7.54)
v v i v fki v
= = Mik = M
k i k i i
v f v
= M
similarmente
^ ^ ^
u f u = u M
= M
reemplazando estas expresiones en (8.2)
^ ^
u v u f v
[u, v] = J = MJM
por tanto todos los corchetes de Poisson son invariantes canonicos. Este resultado nos permite omitir
el subndice que denota el conjunto de variables que se usan para evaluar el corchete, siempre y cuando las
variables que se usen sean canonicas. Vale la pena anotar sin embargo, que las transformaciones de escala,
as como las transformaciones canonicas extendidas, en donde la condicion simplectica toma la forma (7.59),
NO dejan invariantes a los corchetes de Poisson.
Recordemos que la definicion original de transformaciones canonicas surge de la necesidad de conservar la
forma de las ecuaciones de Hamilton ante un cambio de coordenadas generalizadas y momentos conjugados.
Esto sugiere que, dado que los corchetes de Poisson son invariantes canonicos, podemos construr ecuaciones de
movimiento en terminos de corchetes de Poisson que sean invariantes en forma ante transformaciones canonicas.
Desarrollaremos entonces un formalismo paralelo al formalismo de Hamilton basado en los corchetes de Poisson.
142 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS
donde u, v, w son funciones arbitrarias de las variables canonicas y del tiempo en tanto que a y b son constantes.
Todas estas propiedades son directas a partir de la definicion (8.1), excepto quizas (8.12) conocida como la
identidad de Jacobi. A manera de ejemplo demostremos la propiedad (8.11) directamente con la definicion
(uv) w (uv) w v u w v u w
[uv, w] = = u + v u + v
qi pi pi qi qi qi pi pi pi qi
u w u w v w v w
[uv, w] = v+u
qi pi pi qi qi pi pi qi
[uv, w] = [u, w] v + u [v, w]
Veamos ahora la demostracion de la identidad de Jacobi (8.12). Esta propiedad muestra que la suma de
corchetes de Poisson dobles construdos con permutaciones cclicas de tres funciones es cero. Estrictamente,
esta propiedad se puede demostrar con un reemplazo explcito a partir de la definicion, sin embargo, un cambio
de nomenclatura puede abreviar notablemente la demostracion, las derivadas parciales las escribiremos como
u 2v
ui ; vij = vji (8.13)
i i j
[u, v] = ui Jij vj
esta notacion resulta particularmente practica para expresar los corchetes dobles de Poisson. Escribamos el
primer corchete doble de (8.12) en esta notacion
Todos los 6 terminos tienen una segunda derivada en alguna de las funciones u, v, w. Tomemos los dos terminos
que contienen segunda derivada en w
el primero proviene de [u, [v, w]] y el segundo de [v, [w, u]]. Reescribamos estos terminos teniendo en cuenta
que las segundas derivadas parciales se pueden intercambiar y que la matriz J es antisimetrica
donde hemos tenido en cuenta que todos los ndices se suman y por tanto son mudos. Es claro entonces que
W1 + W2 = 0, de modo que los dos pares de terminos que contienen segundas derivadas en w se anulan. Por
argumentos identicos, los otros dos pares que contienen segundas derivadas en u y v se anulan, con lo cual se
demuestra la identidad de Jacobi Ec. (8.12). Notese que la unica propiedad que se uso de J fue su antisimetra.
siendo ckij cantidades denominadas constantes de estructura1 . En este caso, el conjunto de todos los elementos
u, v junto con la operacion producto, forman un algebra no conmutativa conocida como algebra de Lie. Notese
que en este contexto la notacion [ui , uj ] se refiere a una ley de combinacion cualquiera y no a los corchetes
de Poisson. En el espacio tridimensional, los corchetes de Poisson cumplen la propiedad (8.14) de una manera
bien particular. O bien, todas las constantes de estructura son cero, o bien solo hay un termino en el lado
derecho de la ecuacion (8.14), para cada par de ndices i, j.
Un comentario final sobre algebras de Lie, nombraremos dos conjuntos de algebras de Lie particularmente
utiles en Fsica, la primera es el algebra definida sobre los vectores Euclidianos en R3 con la ley de combinacion
V [A, B] A B
la segunda es el algebra definida sobre el conjunto de matrices n n con la operacion producto definida por
el conmutador entre ellas
M [A, B] AB BA
lo interesante es que muchos resultados solo dependen de la estructura de algebra y no de la forma explcita
de la ley de combinacion. Profundizar en estos topicos va mas alla de los propositos de este texto, el lector
interesado puede consultar las Refs. [9, 10, 11].
qi pi pi qi
{u, v}q,p =
u v u v
^
{u, v} = J
u v
1
Nuevamente insistimos en que los ndices i, j, k en la Ec. (8.14) son rotulos para un conjunto dado de elementos, y no denota
derivadas como en la Ec. (8.13).
144 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS
la prueba de su invarianza canonica es muy similar a la de los corchetes de Poisson. Hay una especie de
relacion inversa entre los corchetes de Poisson y Lagrange, que se manifiesta en la siguiente propiedad: Sea ui
un conjunto de 2n funciones de las variables canonicas e independientes entre s. Con este conjunto se puede
formar el vector u de dimension 2n, y la matriz 2n 2n definida por {u, u}ij {ui , uj }. Similarmente se
define la matriz [u, u] para corchetes de Poisson, se deja como ejercicio verificar que
sin embargo, los corchetes de Lagrange no son de tan amplio uso como los de Poisson. La razon estriba en el
hecho de que esta nueva ley de combinacion posee las mismas propiedades fundamentales de los corchetes de
Poisson, pero con una importante excepcion: los corchetes de Lagrange no obedecen la identidad de Jacobi y
por tanto no forman un algebra de Lie.
como es bien sabido, las magnitudes de los dos elementos de volumen estan enlazadas a traves del valor absoluto
del determinante de la matriz jacobiana
(d) = kMk (d)
Pero tomando el determinante en la condicion simplectica (7.56), se obtiene
f
2
MJM
= kJk kMk kJk = kJk kMk = 1
de modo que el valor absoluto del determinante de M es uno (si la transformacion canonica es real, el de-
terminante es 1). Esto muestra entonces que el elemento diferencial de volumen en el espacio de fase es un
invariante canonico. Como corolario resulta que el volumen de una region arbitraria en el espacio de fase
Z Z
Jn = . . . (d)
es un invariante canonico. Esta integral de volumen es el miembro final de una secuencia de invariantes canoni-
cos que constan de integrales sobre subespacios del espacio de fase de diferentes dimensiones. Tal secuencia
es conocida como integrales invariantes de Poincare. Una vez mas, remitimos al lector interesado en
profundizar en estos temas a las Refs. [9, 10, 11].
si suponemos que la primera de estas transformaciones es invertible de modo que p se puede escribir como
funcion de q, Q entonces
p (q, Q) (8.17)
y si a su vez sustitumos esta expresion en la segunda ecuacion de transformacion, obtenemos P tambien en
funcion de q, Q
P = P (q, (q, Q)) (q, Q) (8.18)
queremos ahora enlazar estas transformaciones con las funciones generatrices. Dado que las Ecs. (8.17, 8.18)
tienen como argumentos a q, Q es natural que estas transformaciones se construyan con funciones generatrices
de tipo 1. En algunos casos, cuando la primera de las Ecs. (8.16) no es invertible (como en la transformacion
identidad) podemos comenzar invirtiendo la segunda de las Ecs. (8.16) y reemplazando en la primera, con lo
cual llegamos a funciones generatrices del tipo 2.
Volviendo a nuestro caso, asumiendo que existen funciones generatrices del tipo 1 que pueden generar a
las Ecs. (8.17, 8.18), estas se escriben segun la prescripcion dada por (7.16)
F1 (q, Q) F1 (q, Q)
p= ; P = (8.19)
q Q
si las ecuaciones (8.19) se cumplen (es decir, si es consistente nuestra suposicion de que existe una funcion
generatriz del tipo 1) entonces se debe cumplir que
F1 F1
= [p (q, Q)] = [P (q, Q)]
Q q q Q Q q
= (8.20)
Q q
donde hemos usado (8.19), (8.17), y (8.18). Recprocamente, si se cumple (8.20) debe existir una funcion de
tipo 1 que satisfaga (8.19).
Para demostrar la validez de (8.20), escribiremos todas las cantidades en terminos de q, Q. Comenzamos
con la identidad
Q
=1
Q
sustituyendo la Ec. (8.17) en la primera de las Ecs. (8.16)
reorganizando terminos
Q Q Q Q Q
[Q, P ] = =1
Q q p p q p q
Q
[Q, P ] = =1 (8.23)
p q
du u u u u H u H u
= qi + pi + = +
dt qi pi t qi pi pi qi t
qi = [qi , H] ; pi = [pi , H]
= [, H] (8.26)
notese que estas ecuaciones dependen de que q/t = 0. Esto se puede ver del hecho de que u (q, p, t) /t
consiste en evaluar la razon de cambio de u manteniendo fijo q y p moviendo solo el tiempo, y esto es valido
en particular cuando u = q. Se observa que esto es diferente al caso en el cual se toma q = q (t) en cuyo caso
8.7. CONSTANTES DE MOVIMIENTO CON CORCHETES DE POISSON 147
q/t = dq/dt = q. Argumento similar se sigue para ver que p/t = 0. Usando la definicion simplectica de
los corchetes de Poisson (8.2) queda
^
u u u
[, u] = J =IJ =J (8.27)
H
= J
que son las ecuaciones de Hamilton en forma simplectica. Vemos entonces que tomando la expresion general
(8.25), con u = q, p resultan las ecuaciones de movimiento para q, p que coinciden con las ecuaciones de
Hamilton como era de esperarse. Otra propiedad familiar resulta cuando se toma u = H en (8.25), lo cual nos
arroja
dH H
=
dt t
que coincide con (6.38). Notese que la ecuacion de movimiento (8.25) es invariante en forma ante una trans-
formacion canonica. La ecuacion es valida cualquiera que sea el conjunto de coordenadas canonicas que se use
para expresar a u y para evaluar el corchete de Poisson. No obstante, debe tenerse en cuenta que el Hamil-
toniano que se use debe ser apropiado para el conjunto de variables canonicas elegido, cuando se pasa a otro
conjunto de variables canonica debemos cambiar al Hamiltoniano transformado o Kamiltoniano.
Un comentario final, la ecuacion de movimiento (8.25) solo sera valida si u solo es funcion explcita de las
coordenadas q, p del sistema y del tiempo, es decir u no puede ser funcion explcita de una variable externa
(por ejemplo no podra ser funcion explcita de un campo electrico externo) toda la dependencia de u con
respecto al exterior debe estar en el parametro tiempo.
Si conocemos dos constantes de movimiento, la identidad de Jacobi nos da la posibilidad de obtener mas
constantes de movimiento. Si u, v son constantes de movimiento que no dependen explcitamente del tiempo,
podemos usar la identidad de Jacobi (8.12) para escribir
[u, [v, H]] + [v, [H, u]] + [H, [u, v]] = 0 (8.30)
lo cual nos dice que [u, v] es una constante de movimiento. Cuando u, v dependen explcitamente del tiempo,
el corchete de Poisson entre ellos sigue siendo constante de movimiento, aunque la demostracion es un tanto
148 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS
mas elaborada. Al ser u y v constantes de movimiento se cumple para ambos la Ec. (8.28), al reemplazar dicha
ecuacion en la identidad de Jacobi (8.30) se obtiene
v u
u, + v, + [H, [u, v]] = 0
t t
v u
, u + v, = [H, [u, v]]
t t
usando la definicion de los corchetes de Poisson obtenemos
v u v u v u v u
+ = [H, [v, u]]
qi t pi pi t qi qi pi t pi qi t
v u v u v u v u
+ = [H, [v, u]]
t qi pi t pi qi qi t pi pi t qi
v u v u v u v u
+ = [H, [v, u]]
t qi pi qi t pi pi t qi t pi qi
reagrupando terminos
v u u v
= [H, [v, u]]
t qi pi t qi pi
v u u v
= [H, [v, u]]
t qi pi qi pi
[v, u] = [H, [v, u]]
t
al comparar con (8.28) se obtiene que [v, u] = [u, v] es una constante de movimiento. Llegamos entonces al
Theorem 5 Teorema de Poisson: El corchete de Poisson de dos constantes de movimiento es tambien una
constante de movimiento.
En consecuencia, la aplicacion reiterada del teorema de Poisson nos puede proveer de un conjunto de cons-
tantes de movimiento. Desafortunadamente, este algoritmo nos lleva con frecuencia a constantes de movimiento
triviales o claramente dependientes de las anteriores. Sin embargo, el metodo debe ser tenido en cuenta para
multiples aplicaciones.
Vale la pena mencionar que la condicion (8.28) es necesaria y suficiente para que una cierta funcion de las
variables q, p del sistema y el tiempo sea constante de movimiento. Sin embargo, tal expresion no nos da un
algoritmo para encontrar constantes de movimiento, mas bien es un metodo para chequear si una cantidad dada
es o no es una constante de movimiento del sistema. Esta forma de evaluacion posee no obstante la ventaja
de que podemos verificar si una cantidad es o no es constante de movimiento sin resolver completamente la
evolucion del sistema. Finalmente, enfatizamos de nuevo que para que esta formulacion sea valida, u no puede
ser funcion explcita de ninguna variable externa al sistema.
H = q1 p1 q2 p2 aq12 + bq22
mostraremos que
p1 aq1
F1 = F2 = q1 q2
q2
8.8. CONSTANTES DE MOV. EVALUADAS POR CORCHETES DE POISSON 149
son constantes de movimiento. Puesto que F1 y F2 no dependen explcitamente del tiempo, solo debemos
chequear que los corchetes de Poisson de estas cantidades con el Hamiltoniano se anulen
H F1 F1 H H F1 F1 H
[H, F1 ] = +
q1 p1 q1 p1 q2 p2 q2 p2
1 a (p1 aq1 )
[H, F1 ] = (p1 2aq1 ) q1 + (p2 + 2bq2 ) 0 (q2 )
q2 q2 q22
(p1 2aq1 ) aq1 (p1 aq1 )
[H, F1 ] = + =0
q2 q2 q2
por tanto F1 es constante de movimiento, veamos a F2
[H, F2 ] = [(p1 2aq1 ) 0 (q2 ) q1 ] + [(p2 + 2bq2 ) 0 (q1 ) (q2 )]
[H, F2 ] = q2 q1 + q1 q2 = 0
luego F2 tambien es constante de movimiento. Dado que tenemos dos constantes de movimiento, es inmediato
pensar que el teorema de Poisson podra proveernos de otras constantes de movimiento independientes. Para
ello debemos evaluar el corchete de Poisson entre estas constantes
F2 F1 F1 F2 F2 F1 F1 F2
[F2 , F1 ] = +
q1 p1 q1 p1 q2 p2 q2 p2
1 a (p1 aq1 )
[F2 , F1 ] = (q2 ) (0) + (q1 ) (0) 0
q2 q2 q22
[F2 , F1 ] = 1
se concluye que la unidad es una constante de movimiento, lo cual es cierto pero trivial. En este caso el
teorema de Poisson no es util para generar constantes de movimiento independientes. Notese que en general
lo unico que afirma el teorema es que el corchete entre dos constantes de movimiento es otra constante de
movimiento, pero no nos dice si esa constante es no trivial o si es independiente de las dos anteriores. Mas
adelante veremos algunos ejemplos en donde el teorema de Poisson nos genera constantes de movimiento no
triviales e independientes de las anteriores.
dD D h p r i p r [p r, H] nH
= [D, H] + = Ht, H + Ht = [H, H] t H = 0H
dt t n t n n n
dD
= 0
dt
donde hemos usado (8.33), y el hecho de que H no depende explcitamente del tiempo. Hemos tenido en cuenta
ademas que t (p r) = 0 (porque?). Conclumos entonces que D es una cantidad conservada.
Podemos aplicar este ejemplo al caso particular de un solo grado de libertad en el cual n = a1 = b = 2,
el Hamiltoniano y la cantidad conservada quedan
p2 1 pq
H= 2 ; D= Ht (8.34)
2 2q 2
Q = q, p = P, t = 2 t (8.35)
dq (t) H dp (t) H 1
= = p (t) ; = = 3 (8.37)
dt p dt q q (t)
dq (t) dp (t) 1
= p (t) ; = 3 (8.38)
dt dt q (t)
Por otro lado, teniendo en cuenta las ecuaciones (8.35, 8.36, 8.38) tenemos
dQ (t ) 1 dQ (t ) dq (t) 1
= = = p (t) = P t
dt 2 dt 2 dt
dP (t )
1 dP (t ) 1 dp (t) 1 1 1 1
= = 3 = 3 3 = 3 = Q3 (t )
dt 2 dt dt q (t) [q (t)]
dQ (t )
dP (t ) 1
= P t ;
= 3 (8.39)
dt dt Q (t )
las cuales son identicas en forma a las ecuaciones (8.38). Es notable que las ecuaciones de movimiento para q y
p con el Hamiltoniano (8.34) son invariantes bajo la transformacion (8.35), a pesar de que dicha transformacion
no es canonica. Esto se puede ver del hecho de que las transformaciones canonicas son las transformaciones de
q, p mas generales que dejan invariantes las ecuaciones de movimiento, pero no contemplan transformaciones
en el parametro tiempo. La constante de movimiento D, en la ecuacion (8.34) esta asociada a esta invarianza3 .
2
en este caso escribimos dq/dt y dp/dt en lugar de q y p, ya que debemos diferenciar bien los dos parametros temporales.
3
Mas adelante veremos que la relacion entre H y t, es muy similar a la relacion entre q y p, a pesar de que H y t no son
variables canonicamente conjugadas. En la cantidad conservada D de la Ec. (8.34), podemos apreciar un producto qp asociado a
la transformacion de escala de las variables canonicas y un producto Ht asociado a la transformacion de escala del Hamiltoniano
y el tiempo.
8.8. CONSTANTES DE MOV. EVALUADAS POR CORCHETES DE POISSON 151
du u u H u H u
= [u, H] + = +
dt t q p p q t
y utilizando el Hamiltoniano (8.40), resulta
du im p 1 ip kq
= (kq) i = i
dt p + imq m p + imq p + imq
du ip m 2 q p + imq
= i = i i = i i
dt p + imq p + imq
du
= 0
dt
para ver el significado Fsico de esta constante de movimiento exponenciamos las ecuacion (8.41)
q
u it 2 2 i it mq
e = (p + imq) e = p + (mq) e e ; = arctan
p
mq
eu = 2mHei(t) ; = arctan (8.42)
p
sustituyendo (8.43) en (8.42) y teniendo en cuenta que H es la energa del oscilador armonico, tenemos
h
i
eu = 2mEei(+ 2 ) u = ln 2mEei(+ 2 ) = ln (2mE)1/2 + i +
2
1
u = ln (2mE) + i +
2 2
por tanto la parte real de u esta relacionada con la energa y la parte imaginaria con la fase inicial.
152 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS
G ()
= J (8.44)
tomando la Ec. (8.27)
u
[, u] = J (8.45)
esta expresion es valida independientemente del conjunto de variables canonicas usadas para evaluar el corchete.
Haciendo u = G y reemplazando (8.45) en (8.44)
= [, G] (8.46)
con lo cual hemos logrado el proposito de escribir la TCI en terminos de corchetes de Poisson, en donde
el corchete involucra a las variables canonicas en cuestion, la funcion generatriz de la TCI y el parametro
infinitesimal de evolucion. Consideremos el caso en el cual el parametro contnuo es el tiempo de modo que
= dt. Tomemos como funcion generadora el Hamiltoniano5 . Las ecuaciones de transformacion para las TCI
se obtienen de (8.46)
= [, H] dt = dt = d (8.47)
donde hemos usado las Ecs. de Hamilton en corchetes de Poisson Ecs. (8.26). Para ver el significado de (8.47)
recordemos el significado de y de d. La cantidad se refiere al cambio infinitesimal en las coordenadas
debido a una transformacion canonica, recordemos que un cambio de coordenadas no se refiere a la evolucion del
sistema. En contraste d se refiere al cambio de las coordenadas desde el tiempo t a sus valores en el tiempo
t + dt como producto de la evolucion del sistema. En consecuencia, la igualdad entre estas dos cantidades
infinitesimales nos muestra que la TCI generada por el Hamiltoniano y usando el tiempo como parametro
contnuo, cambia las coordenadas y momentos en la misma forma que lo hara la evolucion del sistema. En
otras palabras, el movimiento del sistema Fsico en un intervalo de tiempo dt se puede describir a traves de
una transformacion canonica infinitesimal generada por el Hamiltoniano, siendo dt el parametro infinitesimal
que modula la TCI. Por otro lado, una transformacion canonica arbitraria se puede obtener por medio de
TCIs sucesivas (esto es formalmente un proceso de integracion en el parametro infinitesimal). Es decir, que el
4
Estrictamente la funcion generatriz de las transformaciones infinitesimales es la funcion F2 dada por la Ec. (7.68), Pag. 132.
Sin embargo, dado que el termino qi Pi de esta funcion es el generador de la identidad, la funcion G en esta ecuacion es la parte no
trivial de esta transformacion. Por tanto, nos referiremos a G de aqu en adelante como la funcion generadora de una transformacion
infinitesimal modulada por el parametro .
5
Notese que en el paso desde la Ec. (7.68) hasta la Ec. (7.71), solo hemos exigido que las segundas derivadas de G sean contnuas
en sus 2n+1 argumentos. Esto con el fin de garantizar que la matriz (7.74) sea simetrica, lo cual a su vez conduce a que la condicion
simplectica sea necesaria y suficiente para llegar a la condicion canonica en la transformacion. Por lo demas, G y su parametro
infinitesimal de modulacion son arbitrarios.
8.9. TRANSF. CANONICAS INFINITESIMALES Y CORCHETES DE POISSON 153
movimiento del sistema en un intervalo finito de tiempo se obtiene con sucesivos corrimientos dt. Los valores
de q, p en cierto tiempo se pueden obtener a partir de sus valores iniciales por una transformacion canonica
que es funcion contnua del tiempo. De acuerdo a este punto de vista, el movimiento de un sistema mecanico
corresponde a una evolucion contnua de las transformaciones canonicas. Todo este razonamiento nos lleva a
concluir que el Hamiltoniano es el generador del movimiento del sistema con el tiempo.
Inversamente, debe existir una transformacion canonica que a partir de los valores de las variables q, p en un
tiempo t, nos lleve a sus valores iniciales. Encontrar esta transformacion canonica es equivalente a resolver la
ecuacion de movimiento. Habamos sugerido previamente la posibilidad de obtener un Hamiltoniano con todas
las coordenadas cclicas que conduca a que todos los momentos eran constantes de movimiento. La presente
estrategia, si es posible, nos llevara a una transformacion canonica en donde qi y pi seran todas constantes de
movimiento. Volveremos sobre estas consideraciones en el siguiente captulo para obtener soluciones formales
para sistemas mecanicos.
Lo anterior nos lleva a contemplar la posibilidad de ver a las transformaciones canonicas desde otro punto
de vista, as como a los efectos que esta produce. La nocion de transformacion canonica se introdujo como un
cambio en las coordenadas (pero no en la configuracion del sistema) para describir el mismo sistema usando
otro espacio de fase. En esta vision, cambiamos de las coordenadas (q, p) de un espacio de fase , a otro espacio
de fase con coordenadas (Q, P ). Si el estado de un sistema en un cierto tiempo esta descrito por un punto
A en el espacio de fase , tambien puede describirse equivalentemente a traves del punto transformado A del
espacio de fase (en el mismo instante de tiempo). Cualquier funcion del sistema de variables tendra el mismo
valor para una configuracion dada del sistema, bien sea que la describamos con el conjunto (q, p) o con (Q, P ).
Es decir, la funcion tendra el mismo valor en A que en A (aunque diferente forma funcional). Este se llama
un punto de vista pasivo de la TC. Desde el punto de vista matematico, esto corresponde a un mapeo desde
el espacio al espacio (con inversa). La Fig. 8.1a ilustra el concepto de TC desde el punto de vista pasivo.
Notese que con este enfoque, la transformacion de coordenadas esta totalmente desligada de la evolucion del
sistema.
La TC que genera el Hamiltoniano usando al tiempo como parametro, sugiere otra interpretacion para esta
TC. Cuando movemos el parametro tiempo desde t hasta t, esta TC cambia las coordenadas y momentos
desde sus valores en el tiempo t hasta los valores que estas tendran en el tiempo t + t. Esta transformacion
canonica se puede interpretar consistentemente de la siguiente manera: Dicha TC nos relaciona las coordenadas
(q, p) de un punto en el espacio de fase (definido con las coordenadas q, p) con las coordenadas (Q, P ) de otro
punto en el mismo espacio de fase. Esto corresponde a un mapeo del espacio de fase en s mismo. Lo anterior
nos conduce a una interpretacion activa de la TC como la generadora de movimiento del punto en el
espacio de fase de una posicion (q, p) a otra posicion (Q, P ), como se ilustra en la Fig. 8.1b. Por supuesto, la
transformacion canonica como tal no puede mover o cambiar la configuracion del sistema. Lo que ocurre es que
el cambio de coordenadas producido por la TC emula el cambio dinamico de las coordenadas producido por la
evolucion del sistema. En otras palabras, el paso de (q, p) a (Q, P ) bajo una TC significa que estoy cambiando
el sistema coordenado que uso para describir al sistema, el mismo cambio interpretado en forma dinamica se
refiere al cambio que el mismo sistema coordenado sufre por efecto de la evolucion del sistema. El punto es
que cuando las dos transformaciones coinciden numericamente, puedo atribur la dinamica del sistema (desde
un punto de vista practico) a la transformacion canonica.
La interpretacion activa no es siempre util. Por ejemplo, la TC que nos lleva de las coordenadas cartesianas
a las coordenadas polares esfericas, es una TC de tipo pasivo, y una interpretacion activa sera absurda.
Por ejemplo, los ejes de ambos espacios de fase no poseen las mismas unidades fsicas pues en coordenadas
cartesianas ambos ejes de coordenadas tienen unidades de longitud y los ejes de momentos tienen unidades
de masa por velocidad, en contraste se tiene que en coordenadas polares hay un eje angular adimensional
en la coordenada y el eje de p tiene unidades de momento angular (aunque s son iguales las dimensiones
en cuanto al numero de coordenadas i.e. ejes independientes, es decir son iguales las dimensiones de los dos
espacios de fase como espacios vectoriales).
El punto de vista activo es particularmente util en TCs que dependen en forma contnua de un solo
154 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS
Figura 8.1: Descripcion de una transformacion canonica (a) desde el punto de vista pasivo y (b) desde el punto
de vista activo.
8.10. Cambio de una funcion del sistema bajo una transformacion canoni-
ca en los enfoques pasivo y activo
Nos preguntamos ahora por el cambio de una funcion del sistema u = u (q, p, t) bajo una TC. Veremos que
el cambio en esta funcion depende de si tomamos el punto de vista activo o pasivo.
Bajo el punto de vista pasivo, debemos tener en cuenta que si en un instante dado t0 la transformacion
canonica se describe por Q0 = Q (q0 , p0 , t0 ) , P0 = P (q0 , p0 , t0 ) entonces el conjunto (q0 , p0 ) describe la misma
configuracion del sistema que el conjunto (Q0 , P0 ). Ahora bien, el valor de una funcion del sistema solo puede
depender de la configuracion de este. Por lo tanto, el cambio del conjunto coordenado (q0 , p0 ) al conjunto
6
Notese que en transformaciones canonicas contnuas uniparametricas no es de esperarse que las unidades de las coordenadas y
momentos cambien con la transformacion. A manera de ejemplo, asumamos por un momento que para un sistema unidimensional
partimos de variables (q, p) donde q tiene unidades de longitud y p de momento lineal, y terminamos con un sistema (Q, P ) donde
Q es adimensional y P tiene unidades de momento angular. Es claro que el cambio de unidades es discreto y no es de esperarse
que una TC que se puede generar por TCIs sucesivas me lleve a un cambio en las unidades de las coordenadas, a menos que se
presente el caso bastante atpico de una TC que vare de manera contnua las unidades de las variables. Por tanto las TC contnuas
uniparametricas permiten interpretar consistentemente el hecho de que la transformacion siempre este en el mismo espacio de fase.
8.11. CAMBIO DEL HAMILTONIANO BAJO UNA TRANSFORMACION CANONICA 155
(Q0 , P0 ) debe dejar inalterado el valor de una funcion del sistema, aunque la funcion puede cambiar de forma
o dependencia funcional con las nuevas variables. Podemos escribir entonces que u (q0 , p0 , t0 ) = u (Q0 , P0 , t0 ).
En otras palabras, el valor numerico de una funcion del sistema no puede depender del espacio de fase que
utilice para describir a dicha funcion.
En contraste, una vision activa de la TC nos habla de una traslacion del sistema del punto A al punto
B, de la posicion (qA , pA ) a la posicion (qB , pB ) en el mismo espacio de fase. Desde este punto de vista, la
funcion u (q, p) no cambia su dependencia funcional con respecto a q, p ya que no estamos cambiando de espacio
de fase. En cambio, la funcion s cambia su valor como resultado del cambio en el valor de los argumentos
u (qA , pA ) 6= u (qB , pB ). Esto tiene que ver con el hecho de que en la vision activa A y B me estan describiendo
diferentes configuraciones del sistema.
Usaremos el smbolo para denotar el cambio en el valor de una funcion bajo una TCI activa
u = u ( + ) u ()
expandiendo en serie de Taylor hasta primer orden en infinitesimales y usando (8.44) se obtiene
" ^ #
u
u = u () + + . . . u ()
^ ^
u u G
u = = J
recordemos que el uso de la Ec. (8.44) es lo que nos garantiza que la transformacion sea canonica. Ahora
utilizamos la definicion de corchetes de Poisson (8.2) para obtener:
u = [u, G] (8.49)
de nuevo la aplicacion mas inmediata consiste en usar (8.49) cuando u es una coordenada del espacio de fase,
teniendo en cuenta ademas la Ec. (8.46), resulta
= [, G] = (8.50)
Este resultado es obvio a partir de la definicion del punto B con respecto al punto A, el cambio en las
coordenadas desde A hasta B es precisamente la diferencia infinitesimal entre las coordenadas viejas y nuevas.
H (A) no tendra necesariamente el mismo valor que K (A ). A manera de ejemplo, en cierto espacio de fase
el Hamiltoniano puede ser la energa del sistema y en otro espacio de face puede no serlo. En virtud de lo
anterior, designaremos por H a la diferencia en el valor final del Hamiltoniano bajo las dos interpretaciones.
H = H (B) K A (8.51)
en los casos en que la funcion misma no cambia con la transformacion canonica, las dos formas de cambio
descritas por (8.48) y (8.51) son identicas puesto que u (A) = u (A ) (recordemos que el valor numerico de las
funciones coincide en A y A en una interpretacion pasiva). En general, K esta relacionado con H a traves de
la ecuacion
F
K=H+ (8.52)
t
Una vez que definimos la relacion entre los Hamiltonianos en ambos espacios de fase a traves de la relacion
(8.52), las funciones K y H ya se pueden tomar como funciones del sistema, es decir como funciones bien
definidas para una configuracion dada del sistema. Por ejemplo H (A) = H (A ) ya que se trata de la misma
funcion del sistema definida en puntos A y A de diferentes espacios de fase pero que describen la misma
configuracion del sistema. Para una TCI, la funcion generatriz esta dada por (7.68) en terminos de G. Dado
que en (7.68) solo G puede ser funcion explcita del tiempo, el valor del nuevo Hamiltoniano es
G G
K A = H A + = H (A) +
t t
y el cambio en el Hamiltoniano definido en (8.51) es
G
H = H (B) H (A) (8.53)
t
siguiendo un camino similar al que nos llevo desde (8.48) hasta (8.49), vemos que H esta dado por
G
H = [H, G]
t
tomando la ecuacion generalizada de movimiento (8.25) con u = G, resulta
G dG G
H =
t dt t
dG
H = (8.54)
dt
dicha funcion induce es tal que el Hamiltoniano permanece invariante ante dicha TCI. Es esencial insistir en
que estas conclusiones solo son validas si G no es funcion explcita del tiempo.
Veremos enseguida que un momento pi canonicamente conjugado a una variable qi , se conserva si y solo si la
coordenada qi es cclica. No obstante, este escenario abarca muchas constantes de movimiento independientes
y no solo los momentos generalizados conservados. Sin embargo, el presente formalismo no abarca todas las
constantes de movimiento (recordemos que la Ec. 8.25 abarca formalmente todas las constantes de movimiento).
Esto por dos razones (1) Estas simetras estan restringidas solo a TCIs y no a transformaciones arbitrarias. (2)
Las transformaciones de simetra mas generales son las que dejan invariantes las ecuaciones de movimiento,
incluso si no dejan invariante al Hamiltoniano9 . Ya hemos visto en la seccion 5.3 que con el formalismo
Lagrangiano la invarianza de las ecuaciones de movimiento nos lleva a constantes de movimiento que no
estan includas en escenarios donde el Lagrangiano mismo es invariante. Lo esencial es tener en cuenta que
ni el Lagrangiano ni el Hamiltoniano son observables del sistema, y por tanto pueden ser modificados de
una manera especial sin cambiar el contenido fsico de estos. En todo caso, la relacion entre la constante de
movimiento G y la invarianza del Hamiltoniano nos muestra una vez mas el fuerte nexo entre simetras y
cantidades conservadas.
Veremos a continuacion que los teoremas de conservacion de los momentos generalizados son casos es-
peciales de lo anterior. Si una coordenada qj es cclica, es obvio que el Hamiltoniano es invariante ante una
transformacion infinitesimal que involucre un desplazamiento de qj unicamente. Por supuesto, es necesario ase-
gurarse que dicha transformacion infinitesimal es de naturaleza canonica, de ser as, debe existir una funcion
generatriz G que me genere la hipotetica TCI a traves de las ecuaciones (7.69, 7.70), puede verificarse que la
funcion10
G (q, p) = pi (8.55)
genera una transformacion canonica infinitesimal a traves de (7.69, 7.70) descrita por
qj = ij ; pi = 0 (8.56)
es decir pi es una funcion generatriz de una transformacion canonica infinitesimal que desplaza a qi unicamente.
Dado que solo qi se desplaza, es obvio que si dicha coordenada es cclica el Hamiltoniano queda invariante, lo
cual nos lleva a la conservacion de G segun la Ec. (8.54), pero G en nuestro caso es precisamente pi como se ve en
(8.55). Por tanto, se observa que si qi es cclica llegamos a la conservacion de su momento conjugado como se
esperaba. Recprocamente si pi es constante entonces la funcion G (q, P ) en (8.55) es constante de movimiento
y esto nos lleva a la invarianza del Hamiltoniano ante la TCI (8.56), que desplaza solo a qj dejando todas las
demas coordenadas y momentos fijos, esto implica entonces que H/qi = 0 y por tanto que la coordenada es
cclica.
En virtud de la simetra entre q y p en la formulacion Hamiltoniana, es natural pensar que G (q, P ) = qi
genere una TCI en donde solo se mueva pi (tal vez con un cambio de signo debido a la estructura simplectica).
Ambas consideraciones se pueden escribir en un contexto mas general. Tomemos como generador de una TCI
a la funcion
Gl = (J)l = Jlr r (8.57)
la ecuaciones de transformacion (7.71) aplicadas a (8.57) dan
Gl r
k = Jks = Jks Jlr = Jks Jlr rs = Jks Jls = Jks Jesl
s s
lo cual en virtud de la ortogonalidad de J (ver Ec. 6.32, Pag. 99), resulta
k = kl
esto muestra claramente que una transformacion que cambie solo a l es generada por su variable conjugada.
Si l es qi entonces G es pi . Si l es pi , G es entonces qi .
9
Notese que una transformacion que cambie al Hamiltoniano en la forma H = H + dF (q,p,t)
dt
, deja invariantes las ecuaciones de
movimiento pero no al Hamiltoniano.
10
Estrictamente G es de tipo 2, de modo que sus argumentos son G (qi , Pi ). Sin embargo, en la interpretacion activa Pi esta en el
mismo espacio de fase que el momento original, razon por la cual escribiremos simplemente G (qi , pi ), al menos cuando se trabaje
con la interpretacion activa de la TC.
158 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS
8.12.1. El momento lineal total como generador de TCIs que generan traslaciones
Examinemos una vez mas el caso en el cual realizamos la traslacion de un sistema como un todo pero
ahora en el marco del formalismo de las TCIs. En primer lugar, es importante enfatizar que el significado
fsico de la funcion generatriz G no puede depender del conjunto canonico empleado para describirla. Para ver
esto, observemos que en la Ec. (8.46) el cambio de una cierta variable canonica i es el mismo independiente
del sistema canonico que usemos para expresar G, ello en virtud de la invarianza canonica de los corchetes
de Poisson. Por lo anterior, podemos utilizar en particular las coordenadas cartesianas de las partculas del
sistema. Definamos la funcion generatriz
N
X
G= pkx ; dx (8.58)
k=1
en donde pkx es la componente x del momento canonico de la kesima partcula. Utilizando las Ecs. (7.69,
7.70) vemos que la TCI inducida por esta funcion es
N
!
G X G
xi = dx = dx pkx = dx , pix = dx =0
pix pix qix
k=1
G G
yi = dx =0 , piy = dx =0 ; zi = piz = 0
piy qix
de modo que
xi = dx ; yi = zi = pix = piy = piz = 0
es decir la funcion G definida en (8.58) genera una traslacion del sistema como un todo en una cantidad
infinitesimal dx en la direccion x, sin traslacion en las otras cooordenadas ni momentos. Vemos pues que las
traslacion del sistema como un todo a lo largo de cierto eje, corresponde efectivamente a una transformacion
canonica.
Puesto que G no depende explcitamente del tiempo, es constante de movimiento si y solo si la TCI que
genera deja invariante el Hamiltoniano. Es decir, el momento lineal total en la direccion x (que corresponde a
G en este caso), se conserva si y solo si la traslacion del sistema como un todo en la direccion x, deja invariante
al Hamiltoniano. Notese que la direccion x se puede escoger arbitrariamente. Si denotamos n como el vector
unitario en la direccion de la traslacion y P como el momento lineal total del sistema, podemos decir que
G=Pn
se conserva si y solo si el Hamiltoniano es invariante ante una TCI que genera una traslacion del sistema como
un todo en la direccion n. Recordemos que si las fuerzas que actuan sobre el sistema se derivan de potenciales
que dependen de la velocidad, el momento canonico asociado a las coordenadas cartesianas no es el momento
lineal de la forma mx. Por tanto nuestros resultados son mas generales que los obtenidos en la seccion 5.1.1
en donde se supuso explcitamente que los potenciales son independientes de la velocidad.
8.12.2. El momento angular total como generador de TCIs que generan rotaciones
Ahora analizaremos la rotacion de un sistema Fsico como un todo en el marco de las TCIs. Por los
mismos argumentos de la seccion anterior, podemos emplear las coordenadas cartesianas. Adicionalmente, y
sin perdida de generalidad elegiremos al eje de rotacion como nuestro eje z. Para una rotacion infinitesimal
antihoraria en un angulo d la matriz de rotacion a primer orden se escribe
cos d sin d 1 d
sin d cos d d 1
8.12. CANTIDADES CONSERVADAS E INVARIANZAS DEL HAMILTONIANO 159
ahora tendremos en cuenta que en coordenadas cartesianas tanto las coordenadas (xi , yi , zi ) como los momentos
conjugados (pix , piy , piz ) forman vectores euclidianos, de modo que se comportan de la misma forma ante
rotaciones11 con lo cual
xi 1 d xi
= xi = xi yi d ; yi = yi + xi d
yi d 1 yi
xi xi = yi d ; yi yi = xi d
dado que los momentos poseen las mismas transformaciones, basta con hacer un reemplazo de la forma xi pix
para obtener la transformacion de los momentos, las transformaciones infinitesimales quedan entonces
xi = yi d ; yi = xi d ; zi = 0
pix = piy d ; piy = pix d ; piz = 0 (8.59)
estrictamente, aun no hemos demostrado que esta transformacion es canonica. Esto equivale a demostrar que
existe una funcion generatriz G, tal que las Ecs. (7.69, 7.70) reproducen adecuadamente a las ecuaciones (8.59).
Podemos ver que una funcion generatriz adecuada para esta TCI es
G = xk pky yk pkx ; d (8.60)
Esto se puede ver explcitamente reemplazando (8.60) en las Ecs. (7.69, 7.70)
G G G
xi = d = yi d ; yi = d = xi d ; zi = d =0
pix piy piz
G G G
pix = d = piy d ; piy = d = pix d ; piz = d =0
xi yi zi
que reproduce correctamente las Ecs. (8.59). Es inmediato ver que la funcion G dada por (8.60) corresponde
a la componente z del momento angular canonico total
G = Lz (ri pi )z (8.61)
y dado que el eje z se eligio en la direccion del eje de rotacion cuya orientacion es arbitraria, se concluye que
la funcion generatriz G corresponde a la componente del momento angular canonico total a lo largo del eje de
rotacion. Denotando n al vector unitario a lo largo del eje de rotacion se tiene que
G=Ln (8.62)
es importante notar que el momento angular canonico que hemos definido puede diferir del momento angular
mecanico, ya que si las fuerzas que actuan sobre el sistema se derivan de potenciales que dependen de la
velocidad, las cantidades pi no necesariamente corresponden con el momento lineal (aunque siguen siendo
vectores Euclidianos que fue nuestra unica suposicion). En consecuencia, la expresion (8.61) no corresponde
necesariamente al momento angular mecanico. Por lo tanto, nuestros resultados son mas generales que los
obtenidos en la seccion 5.1.2 en donde se supuso explcitamente que los potenciales eran independientes de
la velocidad. Podemos ver entonces que el momento conjugado asociado a una coordenada generalizada de
rotacion del sistema como un todo alrededor de un eje n, es la componente del momento angular canonico
total segun este eje, incluso si el potencial depende de la velocidad. Este resultado se puede derivar tambien
de las Ecs. (8.55, 8.56).
Conclumos que el Hamiltoniano es invariante bajo la rotacion del sistema como un todo alrededor de la
direccion n, si y solo si se conserva la funcion generatriz G definida en la Ec. (8.62), es decir si se conserva el
momento angular canonico total en la direccion n. Una vez mas vemos como la invarianza del Hamiltoniano
ante rotaciones alrededor de un eje conduce a la conservacion del momento angular canonico total alrededor
de dicho eje.
En sntesis, as como el Hamiltoniano es un generador de desplazamiento del sistema en el tiempo, el
momento lineal es un generador de desplazamiento lineal espacial (traslacion) del sistema, y el momento
angular es un generador de desplazamiento angular espacial (rotacion) del sistema. Recordemos que aqu la
palabra generador indica que este induce una TCI que nos lleva a la transformacion en cuestion.
11
Para mas detalles ver seccion 12.6
160 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS
u = d [u, G] (8.63)
d2 u du
= = u , G = [[u, G] , G]
d2 d
el proceso se repite para las sucesivas derivadas con lo cual la expansion de Taylor queda
2 3
u () = u0 + [u, G]0 + [[u, G] , G]0 + [[[u, G] , G] , G]0 + . . . (8.65)
2! 3!
en particular, si u representa una variable canonica i , con u0 representando el valor inicial de la variable
i , la ecuacion (8.65) nos da la prescripcion para calcular la transformacion canonica finita generada por G.
Definimos el operador G b como
Gb [(. . .) , G] (8.66)
b actua sobre las funciones u de la configuracion del sistema. Es decir
donde G
b [u, G]
Gu (8.67)
8.13. CONSTRUCCION DE TCS FINITAS A PARTIR DE TCIS 161
claramente
b2 u = G
G b Gu
b =G
b ([u, G]) [[u, G] , G]
teniendo en cuenta que la sumatoria entre llaves tiene la estructura de la serie correspondiente a la funcion
exponencial, podemos escribir simbolicamente esta transformacion de la forma
b
u () = eG u (8.69)
0
Otra forma interesante de obtener la Ec. (8.69) se basa en la funcion generatriz para ex
x n
ex = lm 1+
n n
en (8.70) se puede ver que el valor final para la funcion u () se puede obtener a partir de su valor inicial,
aplicando sucesivamente (n veces) el operador b b con n . En tal lmite, este operador solo difiere
1 + G/n
infinitesimalmente de la identidad. Es decir la TC completa se esta generando como una aplicacion sucesiva
de TCIs.
Un caso muy importante surge cuando en la Ec. (8.69) tomamos el caso particular en el cual G = H y el
parametro contnuo es el tiempo, se obtiene
b
u (t) = etH u (8.71)
0
b [(. . .) , H] ; Hu
H b [u, H] (8.72)
b
la ecuacion (8.71) nos dice que la evolucion temporal de u se obtiene aplicando el operador etH sobre u (qi , pi )
b
y evaluando en t = 0. Por esta razon, a etH se le denomina operador evolucion temporal.
b = 0), las
Notese que si el corchete de Poisson de u con el generador G de la transformacion se anula (i.e. Gu
Ecs. (8.65, 8.68) nos muestran que la transformacion generada por G dejara invariante a la funcion u. Cuando
G es el Hamiltoniano y el parametro es el tiempo, esto es consistente con la Ec. (8.25), si recordamos que
hemos asumido que u (qi , pi ) no es funcion explcita del tiempo.
162 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS
p0 at2
x (t) = x0 + t+
m 2
p2 1 H p H
H= + kx2 ; = ; = kx
2m 2 p m x
vamos a evaluar la evolucion temporal de x (t), de modo que haremos u x. Evaluemos las sucesivas potencias
b nx
de la forma H
b x H x H 1
Hx = [x, H] = = p
x p p x m
Hxb b
Hx p p
b 2 H H m H m H
H x = [[x, H] , H] = =
x p p x x p p x
b 2x = xk
H (8.76)
m
b 2x b 2x
H H H H mk
x H m k
x H 1 k
b 3x =
H = = p
x p p x x p p x m m
2
mk2 p H mk2 p H k k
b 4x =
H = 2 kx = x
x p p x m m
h 2 i h 2 i
m k
x H m k
x H 2
b 5x = k p 1 k 2
H = = p
x p p x m m m m
h i h i
1 k 2 1 k 2 3
m m p H m m p H 1 k 2 k
b 6x =
H = kx = x
x p p x m m m
8.13. CONSTRUCCION DE TCS FINITAS A PARTIR DE TCIS 163
las Ecs. (8.77) pueden demostrarse rigurosamente por induccion usando la Ec. (8.76). Hagamoslo para la
primera identidad en (8.77)
b 2n+2 b 2 b 2n b 2 k n k n b2 k n k k n+1
H x = H H x =H x = H x = x= x
m m m m m
b 2(n+1) k n+1
H x= x
m
y similarmente para la segunda de las Ecs. (8.77). Haciendo u x en (8.74), y separando potencias pares e
impares, resulta
1 b 2 1 b 4 b 1 b 3 1 b 5
x (t) = 1+ tH + tH + . . . x + tH + tH + tH + . . . x
2! 4! 0 3! 5! 0
X X
1 b
2n 1 b
2n+1
x (t) = tH x + tH x (8.78)
2n! 0 (2n + 1)! 0
n=0 n=0
Los corchetes de Poisson se pueden evaluar en forma directa o por sus propiedades, usando la expresion (8.60)
para G = Lz , as como los corchetes fundamentales (8.3) para obtener
[xi , Lz ] = yi ; [yi , Lz ] = xi
etc. Ahora los corchetes de Poisson se evaluan en el valor inicial = 0 del parametro de evolucion. Reempla-
zando (8.81) en (8.80) evaluado en = 0 obtenemos
2 3 4
xi () = xi0 yi0 xi0 + yi0 + xi0 ...
2! 3! 4! 3
2 4
xi () = xi0 1 + ... yi0 + ...
2! 4! 3!
xi () = xi0 cos yi0 sin
que corresponde justo a la transformacion que genera una rotacion alrededor de Z, se puede ver que las
transformaciones de yi y zi tambien son las adecuadas (la ultima no se transforma). Esto corresponde a una
prueba alternativa de que Lz es un generador de rotaciones alrededor de z y como z es arbitrario esto indica
que el generador L n produce una rotacion alrededor de n. Este hecho nos inspira a encontrar las propiedades
de los corchetes de Poisson de los momentos angulares en forma mas sistematica.
unicamente y no involucra ninguna cantidad externa o vector que no sea afectado por la TCI. Bajo estas
condiciones una rotacion espacial del sistema implica una rotacion de F. Los vectores que cumplen estas
condiciones seran denominados vectores del sistema. El cambio en un vector Euclidiano bajo rotaciones
infinitesimales alrededor de n, fue discutido en la seccion 5.1, Ec. (5.9)
dF = n d F
de tal modo que para un vector del sistema, una TCI generada por L n induce un cambio en dicho vector de
la forma12
F = d [F, L n] = n d F (8.83)
la Ec. (8.83) conduce a una importante identidad concerniente al corchete de Poisson entre L n y un vector
del sistema
[F, L n] = n F (8.84)
La condicion (8.84) ya no hace ninguna referencia a una TC o incluso a una rotacion espacial. Es simplemente
una propiedad del corchete de Poisson entre un cierto tipo de vectores (del sistema) y una componente del
momento angular canonico en cierta direccion.
La relacion (8.84) se puede expresar en componentes usando el tensor de Levi Civita.
[Fi , Lj nj ] = ijk nj Fk
y dado que n es arbitrario, podemos elegir en particular que nj = 1 para un j especfico y cero para las otras
componentes, lo cual nos conduce a
[Fi , Lj ] = ijk Fk (8.85)
lo cual se puede escribir tambien de la forma
otra relacion interesante es ver lo que ocurre con el producto F G entre dos vectores del sistema. Siendo
un escalar, este producto punto debe ser invariante bajo rotaciones13 . La identidad (8.84) nos muestra que
efectivamente, el corchete de Poisson entre este producto y L n se anula.
[F G, L n] = F [G, L n] + [F, L n] G = F (n G) + (n F) G
= F (n G) + F (G n)
[F G, L n] = 0 (8.87)
recordemos que la anulacion del corchete de Poisson de cierta funcion del sistema con el generador de una
transformacion, nos conduce a la invarianza de esta funcion bajo la transformacion producida por el generador
como se ve en la Ec. (8.65)14 . Haciendo F = G, se obtiene la propiedad esperada de que la magnitud de un
vector se conserva bajo rotaciones, ya que el corchete de Poisson de F2 se anulara para cualquier componente
de L.
Naturalmente, todas las relaciones anteriores son validas en particular cuando F = L en (8.84). En tal caso
resulta
[L, L n] = n L [Li , Lj ] = ijk Lk (8.88)
12
Un vector podra ser mixto i.e. funcion de q y p del sistema pero tambien funcion de variables externas. En tal caso es de
esperarse que dicho vector se transforme bajo la rotacion generada por la TCI pero no transformara de la forma prescrita por la
Ec. (8.83).
13
Esto se puede ver de F G = F G cos . F y G son invariantes ya que una rotacion no cambia la magnitud de los vectores,
ademas el angulo relativo entre dos vectores tambien se conserva en una rotacion de modo que la invarianza es clara.
14
Recordemos que esto solo vale si la funcion del sistema no depende explcitamente del tiempo. En realidad, si tal funcion depende
explcitamente del tiempo, significa que esta puede cambiar con el tiempo incluso si la configuracion del sistema permanece sin
alterar. Esto solo es posible si existe algun agente externo que produzca dicho cambio. En conclusion, una funcion u (qi , pi , t) no sera
una funcion solo del sistema, sino mas bien una funcion mixta que depende del sistema y de algun agente externo. Razonamiento
identico se da para vectores F, del sistema o mixtos.
166 CAPITULO 8. CORCHETES DE POISSON Y OTROS INVARIANTES CANONICOS
de las relaciones (8.88) y el teorema de Poisson vemos que si Lx y Ly son constantes de movimiento entonces
Lz tambien es una constante de movimiento. Por tanto, la invarianza de dos componentes del momento angular
canonico cartesiano nos lleva a la invarianza del vector L completo. Adicionalmente, aplicando las relaciones
(8.84) y (8.85) con F = p, es decir el momento canonico cartesiano, tenemos que
si ahora asumimos que ademas de Lx , Ly la componente pz es tambien una constante de movimiento, entonces
ademas de Lz obtenemos otras dos constantes de movimiento via teorema de Poisson
[pz , Lx ] = py , [pz , Ly ] = px
de modo que tanto L como p se conservan. En general si Li , Lj y pk son constantes de movimiento con i, j, k
diferentes entre s, obtenemos la invarianza de L y p. Este es un caso en el cual el teorema de Poisson es util
para encontrar nuevas constantes de movimiento.
En contraste, examinemos un escenario en el cual asumimos que px , py , Lz son constantes de movimiento,
la aplicacion del teorema de Poisson nos da
[qi , pk ] = [Lx , Ly ] = Lz 6= ik
que de nuevo contradice las Ecs. (8.3). Similarmente no es posible que por ejemplo Lx y Ly sean ambas
coordenadas qi y qk . En sntesis, no podemos escoger simultaneamente dos componentes de L como variables
canonicas. Sin embargo, la Ec. (8.89) muestra que es posible escoger simultaneamente a la magnitud al cuadrado
de L, y a cualquiera de las componentes de L (pero solo una), como variables canonicas.
[px , Lz ] = [px , xpy ypx ] = [px , xpy ] [px , ypx ] = x [px , py ] + [px , x] py y [px , px ] [px , y] px
[px , Lz ] = py
donde hemos usado las propiedades (8.10, 8.11) y las identidades (8.3). Similarmente
de modo que al evaluar la expresion de la izquierda en (8.84) para este caso resulta
[p, L uz ] = py ux + px uy
este corchete nos da las componentes de uz p, lo cual confirma la validez de la Ec. (8.84) para este caso par-
ticular. Adicionalmente, para este problema el lector puede verificar explcitamente la validez de las siguientes
expresiones
[p L, L n] = p2 , L n = L2 , L n = 0
que nos confirman que estas cantidades son escalares, es decir que no son afectadas por una rotacion, en
concordancia con (8.87).
8.15. Ejercicios
1. Demostrar que las transformaciones de escala, as como las transformaciones canonicas extendidas, no
dejan invariantes a los corchetes de Poisson.
3. Verifique que se cumple la relacion (8.15) entre los corchetes de Poisson y los corchetes de Lagrange.
4. Utilizando corchetes de Poisson, demuestre que las transformaciones definidas en la Ec. (7.94), Pag. 138,
son canonicas.
5. Utilizando corchetes de Poisson, demuestre que las transformaciones definidas en la Ec. (7.95), Pag. 139,
son canonicas.
6. Demuestre en detalle que la Ec. (8.79) es la solucion conocida del movimiento armonico simple en terminos
de las condiciones iniciales.
Captulo 9
Teora de Hamilton-Jacobi y variables accion-angulo
Ya hemos mencionado que las transformaciones canonicas pueden ser usadas como un procedimiento para
resolver las ecuaciones de movimiento, para lo cual se sugirieron dos estrategias, (a) Cuando el Hamiltoniano
se conserva, se puede obtener la solucion transformando a un nuevo conjunto de variables canonicas en donde
todas las coordenadas son cclicas, en cuyo caso las nuevas ecuaciones de movimiento de Hamilton resultan
triviales, y (b) encontrar una transformacion canonica que partiendo de las coordenadas q, p que describen la
configuracion del sistema en un tiempo t, nos lleve a un nuevo sistema coordenado constitudo unicamente por
cantidades constantes. En particular, las constantes que constituyen el nuevo sistema de variables canonicas
se puede elegir como el conjunto q0 , p0 que coincide con los valores iniciales de las variables canonicas. Si
encontramos esta TC, la correspondiente transformacion entre las antiguas y las nuevas coordenadas se puede
invertir para obtener
q = q (q0 , p0 , t) ; p = p (q0 , p0 , t)
lo cual nos da el valor de las coordenadas y momentos en funcion de los valores iniciales de estos y el tiempo.
Este procedimiento es el mas general y es aplicable (al menos formalmente) incluso si el Hamiltoniano es funcion
del tiempo. La teora de Hamilton Jacobi es un procedimiento sistematico para encontrar la transformacion
canonica que lleva de los valores q, p en un tiempo t, a los valores iniciales o a otros valores constantes que son
funciones de las condiciones iniciales.
168
9.1. EC. DE HAMILTON-JACOBI PARA LA FUNCION PRINCIPAL DE HAMILTON 169
donde hemos tenido en cuenta que los nuevos momentos los hemos elegido como las s y que las nuevas
coordenadas tambien deben ser constantes que denotamos por i . Una vez conocidos los valores de las i a
traves de las Ecs. (9.9), podemos reemplazar estos valores en (9.10) para obtener las i haciendo t = t0 en
dichas ecuaciones y apelando a las condiciones iniciales en q. Ahora bien, en las ecuaciones (9.10) podemos
despejar qj para obtener las coordenadas en funcion de , , t
qj = qj (, , t) (9.11)
lo cual resuelve la dinamica de las coordenadas generalizadas qj en funcion del tiempo y de las condiciones
iniciales. Despues de derivar en la Ec. (9.9) se pueden tomar las qi encontradas en (9.11) para sustiturlas en
(9.9), con lo cual se encuentra el valor de cada pi en funcion de , , t
pi = pi (, , t) (9.12)
por tanto, las Ecs. (9.11, 9.12) constituyen las soluciones completas a las ecuaciones de Hamilton.
La funcion principal de Hamilton es en consecuencia generadora de una transformacion canonica que nos
lleva a valores constantes de las nuevas coordenadas y los nuevos momentos. Cuando se resuelve la ecuacion
de Hamilton-Jacobi (9.5), obtenemos al mismo tiempo una solucion al problema mecanico. Matematicamente
hemos establecido una equivalencia entre las 2n ecuaciones canonicas de movimiento que son 2n ecuaciones
diferenciales ordinarias de primer orden, con la ecuacion diferencial parcial de primer orden de Hamilton Jacobi.
Esta clase de equivalencia es muy comun en la teora de ecuaciones diferenciales de primer orden. Esencialmente
la conexion proviene del hecho de que ambas formulaciones provienen del principio variacional de Hamilton
modificado (recordemos que la Ec. 9.2 proviene del principio de Hamilton modificado). Hasta cierto punto, la
asignacion de las i como los nuevos momentos es arbitraria. Podramos haber elegido como momentos otro
conjunto de constantes i , que son a su vez funciones independientes de las constantes de integracion i
i = i (1 , . . . , n ) (9.13)
por medio de estas relaciones, la funcion principal de Hamilton se puede escribir en funcion de q, , t, el resto
de la derivacion es analoga teniendo cuidado de reemplazar i i en (9.9) y (9.10). Es a veces conveniente
definir ciertos i como los nuevos momentos en lugar de las i que aparecen como constantes de integracion
en (9.5).
Un caso interesante se da cuando el Hamiltoniano no depende explcitamente del tiempo y por tanto se
conserva. En este caso la Ec. (9.5) muestra que S/t no puede ser funcion explcita del tiempo con lo cual la
forma mas general de S se escribe como
donde W (q, ) es llamada la funcion caracterstica de Hamilton. Insertando (9.14) en (9.5) se observa
que la constante k debe coincidir con el valor del Hamiltoniano (que es precisamente constante). Recuerdese
que aun cuando el Hamiltoniano sea constante, no necesariamente corresponde a la energa del sistema.
recordando que el principio de Hamilton es una aseveracion sobre la integral definida de L en el tiempo, y que
a partir de el se obtiene la solucion del problema mecanico via ecuaciones de Lagrange, vemos que en este caso
la misma integral de accion pero esta vez en forma indefinida, nos provee de otro metodo de solucion. Notese
que la Ec. (9.15) no posee utilidad practica puesto que para evaluar la integral en el tiempo se debe conocer
L en funcion de t lo cual equivale a conocer q (t) y q (t) es decir hay que saber la solucion.
En forma similar, el significado fsico de la funcion caracterstica de Hamilton W , se puede revelar a traves
de su derivada total
dW W
= qi
dt qi
Usando (9.9) y (9.14) se obtiene
Z Z
dW
= pi qi W = pi qi dt = pi dqi (9.16)
dt
que es precisamente la accion abreviada definida en (6.92) aunque en forma de integral indefinida.
de acuerdo con la ecuacion fundamental de Hamilton Jacobi Ec. (9.5), debemos sustitur a p por S/q en el
Hamiltoniano (recordando que F2 se redefine como S) y plantear la ecuacion diferencial (9.5)
" 2 #
1 S 2 2 2 S
+m q + =0
2m q t
como este Hamiltoniano no depende explcitamente del tiempo, podemos escribir a S como (9.14) (donde
usaremos en vez de k). De esta forma se elimina la dependencia temporal de la ecuacion de Hamilton Jacobi
" 2 #
1 W
+ m2 2 q 2 = (9.18)
2m q
la constante corresponde a la energa del sistema lo cual se puede ver reemplazando (9.14) en (9.3)
S
H+ =0 H =0
t
la ecuacion (9.18) se puede integrar con lo cual se obtiene
Z r
m 2 q 2
W = 2m dq 1 (9.19)
2
Z r
m 2 q 2
S = t + 2m dq 1 (9.20)
2
172 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-ANGULO
aunque la integral se puede resolver explcitamente, debemos recordar que S no aparece en las ecuaciones de
movimiento sino solo sus derivadas parciales. Resulta mas util en este caso, hacer primero las derivaciones
antes de integrar. La solucion para q se obtiene de las ecuaciones (9.10)
r Z
S m dq
= = t + q
2 2 2
1 m2q
este resultado nos dice que p = mq como se esperaba. Finalmente, debemos determinar las constantes y a
traves de las condiciones iniciales q0 , p0 . El valor de se puede despejar facilmente evaluando las Ecs. (9.21)
y (9.23) en t = 0 y sumando sus cuadrados
2m = p20 + m2 2 q02
esta misma ecuacion se puede encontrar recordando que = H = E es constante, y usando la Ec. (9.17) en
t = t0 . La fase se obtiene de nuevo evaluando (9.21) y (9.23) en t = 0 y haciendo el cociente
q0
tan = m
p0
En este caso vemos que la funcion principal de Hamilton S asumio el papel de generador de una transformacion
canonica a una nueva coordenada que mide el angulo de fase inicial, y a un nuevo momento que se puede
identificar como la energa total del sistema.
Ahora bien, si sustitumos la solucion (9.21) para q en la Ec. (9.20) obtenemos
Z Z
2 2 1
S = t + 2 cos (t + ) dt = 2 cos (t + ) dt
2
se puede verificar que el integrando coincide con el Lagrangiano
1 2 2 2 2
2 2
2 1
L = p m q = cos (t + ) sin (t + ) = 2 cos (t + )
2m 2
Z
S = L dt
y vemos que S efectivamente coincide con la integral indefinida del Lagrangiano con el tiempo, como lo prescribe
la Ec. (9.15). Notese que tal identidad solo se pudo comprobar una vez que se encontro la solucion.
9.2. SOLUCION DEL OSCILADOR ARMONICO POR EL METODO DE HAMILTON-JACOBI 173
S (x, y, , y , t) = W (x, y, , y ) t
dado que las coordenadas y momentos en x e y se separan en forma de suma en el Hamiltoniano, es razonable
suponer que la funcion caracterstica de Hamilton W se separa de forma similar
usando (9.24, 9.25) en la Ec. (9.5), obtenemos la ecuacion de Hamilton-Jacobi para el oscilador bidimensional
anisotropico
" 2 #
1 Wx 2 W y
+ m2 x2 x2 + + m2 y2 y 2 =
2m x y
" 2 # " 2 #
1 Wy 1 Wx
+ m2 y2 y 2 = + m2 x2 x2 (9.26)
2m y 2m x
el termino de la izquierda solo depende de y, y el de la derecha solo depende de x, de modo que ambos deben
ser constantes. Igualemos cada termino a una constante que denotamos y
" 2 #
1 Wy
+ m2 y2 y 2 = y (9.27)
2m y
" 2 #
1 Wx
+ m2 x2 x2 = y (9.28)
2m x
con lo cual las ecuaciones (9.27, 9.29) quedan mas simetricas. Comparando las Ecs. (9.27, 9.29) con la Ec.
(9.18), vemos que las soluciones son de la forma dada en las Ecs. (9.21, 9.23)
s
2x
x = sin ( x t + x ) ; p x = 2mx cos (x t + x )
mx2
s
2y p
y = sin ( y t + y ) ; p y = 2my cos (y t + y ) (9.30)
my2
E = = x + y
174 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-ANGULO
mx2 2 my2 2 m 2 2 m 2 r 2
V (x, y) = x + y = x + y2 = V (r)
2 2 2 2
en consecuencia, resulta interesante resolver el problema utilizando coordenadas polares, ya que en estas
coordenadas el oscilador isotropico tiene una coordenada cclica
1 p2
H=E= p2r + 2 + m2 2 r 2
2m r
vemos que el Hamiltoniano es cclico en . Emulando el procedimiento en el caso anisotropico, asumimos que
la funcion caracterstica W es separable
S (r, , , ) = Wr (r, , ) + W (, , ) t
aunque se puede resolver directamente para Wr , es mas comodo usar la solucion en coordenadas cartesianas
dada en las Ecs. (9.30) para la condicion kx = ky
r
2
x = sin (t + ) ; p x = 2m cos (t + )
m 2
r
2
y = 2
sin t ; py = 2m cos t
m
9.3. EC. DE H-J PARA LA FUNCION CARACTERISTICA DE HAMILTON 175
Adicionalmente, aqu solo pedimos que las coordenadas nuevas Qi sean cclicas pero no necesariamente que
sean constantes, pues solo exigimos que sean constantes los momentos conjugados Pi . Usando (9.33) en (9.34)
resulta
W
H qi , = 1 (9.35)
qi
que coincide con la Ec. (9.32). De aqu tambien se ve que puesto que W no involucra al tiempo, el antiguo y el
nuevo Hamiltoniano coinciden numericamente i.e. K = 1 . Esto es una diferencia con respecto al formalismo
de la funcion generatriz S, la cual cambia el valor del Hamiltoniano y lo vuelve nulo.
La funcion caracterstica de Hamilton genera una TC que nos lleva a otro conjunto de variables en donde
todos los momentos son constantes, usando las Ecs. de Hamilton esto se traduce en
K
Pi = = 0, Pi = i (9.36)
Qi
es decir todas las coordenadas Qi son cclicas, de modo que la solucion del problema ya es trivial. Ahora
bien, dado que el nuevo Hamiltoniano solo depende de uno de los i puesto que K = 1 , y como las i son
independientes, tenemos entonces que de las otras ecuaciones de Hamilton
K 1
Qi = = = i1 (9.37)
i i
se obtienen entonces las soluciones
W (q, )
Qi = i1 t + i (9.38)
i
de modo que la unica coordenada que no es una constante de movimiento es Q1 . Dado que 1 = K es el
momento conjugado a Q1 y Q1 es la unica coordenada que depende del tiempo, vemos de nuevo un escenario
en el cual el Hamiltoniano y el tiempo actuan como si fueran variables canonicamente conjugadas.
La dependencia de W con las antiguas coordenadas q se determina con la Ec. Diferencial Parcial (9.32),
conocida como ecuacion de Hamilton-Jacobi restringida. En este caso hay n constantes de movimiento (con
respecto al caso anterior, no hay constante de integracion para el tiempo), pero de nuevo una de ellas es una
constante meramente aditiva la cual se identifica de inmediato con 1 4 . De nuevo es natural asumir que las
n constantes de integracion (incluyendo a 1 ) sean los nuevos momentos conjugados.
Veamos ahora como se obtiene la solucion dinamica en el formalismo de Hamilton-Jacobi restringido (HJR).
Una vez que se encuentra una solucion para W (q, ) de la Ec. (9.32), introducimos este W en la primera mitad
de las ecuaciones (9.33) y lo evaluamos en t = t0 , esto nos relaciona las constantes con las condiciones iniciales.
Reemplazando i = i (q0 , p0 ) en las Ecs. (9.38), y evaluando en t = t0 obtenemos i = i (q0 , p0 ). Una vez
conocidos i , i en terminos de las condiciones iniciales, se evaluan de nuevo las Ecs. (9.38) pero esta vez para
tiempo arbitrario, lo cual nos permite despejar qi = qi (j , j , t) y por tanto cada qi en terminos del tiempo y
de las condiciones iniciales. Finalmente, estas qi (q0 , p0 , t) se reemplazan junto con los i (q0 , p0 ) en el primer
conjunto de ecuaciones (9.33) para obtener pi como funcion del tiempo y las condiciones iniciales, con lo cual
ya tenemos la solucion dinamica completa5 .
Vale la pena enfatizar que solo una de las n ecuaciones (9.38) involucra al tiempo. Teniendo en cuenta que
W es funcion de qj y j resulta de (9.38) que
t + 1 = f1 (q1 , . . . , qn ; 1 , . . . , n )
i = fi (q1 , . . . , qn ; 1 , . . . , n ) ; i = 2, 3, . . . , n
vemos que solo la ecuacion con i = 1 nos conecta explcitamente al tiempo. Por otro lado, las ecuaciones con
i > 1 solo relacionan a las qi s entre s, es decir son ecuaciones de trayectoria. Una de las qi s se puede
tomar como independiente y las otras coordenadas se pueden expresar en terminos de ella resolviendo solo las
4
Sin embargo, a diferencia de la constante aditiva que apareca en (9.14), en este caso la constante tiene un significado fsico
pues es el valor numerico del Hamiltoniano.
5
Notese que la segunda mitad de Ecs. (9.33) no se uso directamente, en virtud de que son equivalentes a las Ecs. (9.38).
9.4. PARALELISMO ENTRE LOS DOS FORMALISMOS DE H-J 177
ecuaciones que son independientes del tiempo. En consecuencia, el formalismo nos conduce directamente a las
ecuaciones de movimiento de la trayectoria (ya que no involucran al tiempo explcitamente). Por ejemplo en
el caso de fuerzas centrales veremos que este procedimiento nos genera la ecuacion de r en funcion de sin
pasar primero por las soluciones de r (t) y (t).
Como ya se menciono, no es en general necesario elegir las i s como los nuevos momentos canonicos.
En ocasiones puede ser mas conveniente elegir otras constantes i que son funciones de las constantes de
integracion i
Pi i (1 , . . . , n ) ; i = 1, . . . , n (9.39)
naturalmente las i deben ser independientes entre s. En tal caso, la funcion caracterstica de Hamilton
W tendra como argumentos a las qi , i . El nuevo Hamiltoniano K = 1 (numericamente igual a H pero
funcionalmente diferente) se obtiene despejando 1 de (9.39) y sera funcion exclusivamente de las i . Las
ecuaciones de Hamilton son entonces
K K 1 (i )
Pk = = 0 ; Qk = = vk (9.40)
Qk k k
es obvio que las vk son constantes que dependen exclusivamente de las k . Las soluciones para las nuevas
variables canonicas son
Pk = k ; Qk = vk t + k (9.41)
la forma de W no se puede encontrar hasta tener una solucion completa de la ecuacion de Hamilton Jacobi
restringida.
Un comentario final, a priori la expresion K = cte conduce a las mismas ecuaciones de movimiento que
K = 0. Sin embargo, las ecuaciones (9.1) con K = 0 claramente conducen a soluciones diferentes que las Ecs.
(9.36, 9.37) con K = 1 = cte. Para comprender la diferencia debemos tener en cuenta que aunque las i
son constantes, ellas son tratadas como variables para efectos de obtener las ecuaciones de Hamilton como se
ve en las Ecs. (9.37), es decir que aunque K es constante, dicha constante 1 es una propiedad del sistema
(en muchos casos la energa del sistema), si en cambio K es igual a una constante independiente del sistema,
entonces para todos los efectos sera equivalente a escoger K = 0.
En otros terminos, supongamos que un sistema Fsico tiene condiciones iniciales (q0 , p0 ), si para el mismo
sistema cambiamos las condiciones iniciales a (q0 , p0 ), entonces cambiara en general el valor numerico del
Hamiltoniano
1 q0 , p0 6= 1 (q0 , p0 )
En tal caso, al usar el formalismo en el cual W es la funcion generatriz, el valor numerico del nuevo Hamiltoniano
K = 1 debe cambiar con respecto al caso en el cual usamos las condiciones iniciales (q0 , p0 ). En contraste, en
el formalismo en el cual S es la funcion generatriz, dicha funcion se ajusta de modo que el nuevo Hamiltoniano
sea siempre nulo, por tanto en este formalismo K = 0 sin importar las condiciones iniciales.
Esto nos deja una leccion muy importante, dos Hamiltonianos que difieren en una constante solo son
equivalentes si la constante en cuestion no es una funcion del sistema, es decir si no depende de las condiciones
iniciales de este. No obstante, en este escenario muy particular (siempre que el Hamiltoniano sea independiente
del tiempo) los Hamiltonianos K = 1 y K = 0 corresponden a la misma Fsica, ya que ambos estan escritos
en bases canonicas distintas, y pretenden por metodos diferentes resolver el mismo problema6 . Pero si dos
Hamiltonianos escritos en la misma base canonica difieren en una constante que es funcion del sistema, las
ecuaciones de Hamilton son diferentes y la Fsica que describen es diferente.
sin embargo, la interpretacion de la solucion W (qi , i ) es muy distinta para el formalismo de Hamilton-Jacobi
(HJ) con respecto a la interpretacion en el formalismo de Hamilton-Jacobi restringido (HJR). En el formalismo
de HJ, W (qi , i ) es solo una parte de la funcion generatriz de la TC, la funcion generatriz completa esta dada
por
S (q, , t) = W (q, ) 1 t (9.43)
9.5. SEPARACION DE VARIABLES EN LA ECUACION DE HAMILTON-JACOBI 179
y S genera una TC que cambia el valor numerico del Hamiltoniano a una valor identicamente nulo, trayendo
como consecuencia que todos los nuevos momentos y coordenadas son constantes de movimiento.
En contraste, para el formalismo HJR, la solucion W (qi , i ) representa la funcion generatriz completa, la
cual al ser independiente del tiempo no genera un cambio en el valor numerico del Hamiltoniano de modo
que K = 1 , la TC generada por W es tal que todas las nuevas coordenadas son cclicas. Como consecuencia,
los nuevos momentos son constantes de movimiento y las nuevas coordenadas son o bien constantes o bien
funciones lineales del tiempo.
Debe decirse sin embargo, que aunque W se interpreta de modo diferente en HJ y en HJR, ambas estan
resolviendo el mismo problema Fsico.
donde claramente 1 coincide con el valor numerico del Hamiltoniano. La Ec. (9.46) esta en concordancia con
(9.43). Naturalmente podemos sumar una constante al valor de S0 pero esto no tiene ninguna relevancia. Lo
importante es encontrar una solucion para S, pues recordemos que la unicidad no se requiere para la funcion
generatriz.
Si ademas de que el Hamiltoniano es independiente del tiempo ocurre que todas las variables son separables,
podemos parametrizar cada Si de la forma
Es de anotar que las funciones Hi pueden ser o no Hamiltonianos, esto esta relacionado con el hecho de
que el concepto de separabilidad no involucra al Hamiltoniano sino a las soluciones de la ecuacion de HJ.
Similarmente, las constantes de separacion i puede ser o no ser una energa, (aunque sus dimensiones son
siempre de energa), o alguna otra cantidad dependiendo de la naturaleza de qi .
Las constantes i se denominan constantes de separacion. Cada una de las ecuaciones (9.48) involucra
solo una coordenada qj y la correspondiente derivada parcial de Wj con respecto a qj . En consecuencia, resultan
un conjunto de ecuaciones diferenciales ordinarias de primer orden. Dado que en principio podemos resolver
para despejar Wj /qj para luego integrar sobre qj , se deduce que el problema esta reducido a cuadraturas.
En la practica ocurre con frecuencia que cada Hi solo contiene uno o unos pocos s. Adicionalmente,
existen escenarios en donde solo r variables son separables y las restantes n r variables no pueden separarse.
En tal caso, solo podemos reducir a cuadraturas la ecuacion de movimiento de las r variables separables como
veremos mas adelante.
Finalmente salvo casos excepcionales, casi todas las aplicaciones utiles del formalismo de HJ involucran
Hamiltonianos independientes del tiempo en donde t es una coordenada separable para S (y cclica para
W ). En consecuencia, la discusion subsecuente sobre separabilidad se limitara a Hamiltonianos constantes y
se utilizara solamente la funcion caracterstica W .
introduciendo (9.50) en (9.49) queda claro que en la Ec. (9.49) solo queda la parte aditiva W , en tanto que
W1 es la solucion de la ecuacion (9.33) con i = 1
W W1
p1 = 1 = = (9.51)
q1 q1
1 es por tanto la constante de separacion, la solucion obvia para W1 (excepto por una constante aditiva) es
W1 = 1 q1 (9.52)
9.5. SEPARACION DE VARIABLES EN LA ECUACION DE HAMILTON-JACOBI 181
H = H (q1 , . . . , qs ; 1 , . . . , n ) (9.54)
donde qi representa el conjunto de todos los qs excepto qj . Supongamos que el ansatz de separacion (9.56) nos
conduce a que la ecuacion restringida de HJ tenga la forma
W Wj
H qi ; ; f qj , = 1 ; i = 1, . . . , j 1, j + 1, . . . , n (9.57)
qi qj
ahora bien, el lado izquierdo depende exclusivamente de qj en tanto que el lado derecho solo depende de las
otras variables q. Por tanto la Ec. (9.58) solo puede ser cierta si ambos lados son iguales a la misma constante
por lo tanto
Wj W
f qj , = j ; g qi , = j ; i = 1, . . . , j 1, j + 1, . . . , n
qj qi
con lo cual se ha logrado la separacion de la variable qj .
Vale la pena resaltar que la separabilidad depende no solo del problema fsico sino tambien del sistema de
coordenadas generalizadas usado. Por ejemplo el problema de un cuerpo bajo una fuerza central es separable
en coordenadas polares pero no en cartesianas. En algunos casos la ecuacion de HJ no se puede separar
182 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-ANGULO
completamente como es el caso en el problema de los tres cuerpos. En contraste, para algunos problemas
fsicos es posible separar la ecuacion de HJ en mas de un sistema coordenado. En general solo es posible
encontrar una solucion cerrada para la ecuacion de HJ cuando las variables son completamente separables.
En consecuencia, se han estudiado con profundidad diversos metodos para encontrar los sistemas coordenados
apropiados para cada problema.
En general no hay un criterio simple para indicar que sistemas coordenados conducen a soluciones de
Hamilton Jacobi separables para un problema especfico. Sin embargo, en el caso de sistemas ortogonales de
coordenadas, las llamadas condiciones de Staeckel resultan muy utiles. Estas son condiciones necesarias y
suficientes para la separabilidad bajo ciertas circunstancias. Dichas condiciones son las siguientes:
1. El Hamiltoniano se conserva.
2. El Lagrangiano es solo una funcion cuadratica de las velocidades generalizadas de tal forma que el
Hamiltoniano tiene la estructura dada por la Ec. (6.20) con L0 (q, t) = V (q)
1
H= (e a) T1 (p a) V (q)
pe
2
3. El sistema coordenado es un sistema ortogonal, esto trae como consecuencia que la matriz T sea diagonal
y por lo tanto tambien lo es su inversa
1
T1 ij
= ij (no suma)
Tii
4. El vector a tiene elementos ai que solo dependen de su coordenada correspondiente i.e. ai = ai (qi )
5. La funcion potencial V (q) es separable en la forma
Vi (qi )
V (q) = (9.59)
Tii
6. Existe una matriz de dimension n n con elementos ij = ij (qi ) de tal forma que
1
1 1j
= (no suma)
Tjj
Si se cumplen las condiciones de Staeckel, la funcion caracterstica de Hamilton sera completamente sepa-
rable. X
W (q) = Wi (qi )
i
y cada Wi satisface las ecuaciones
2
Wi
ai = 2Vi (qi ) + 2ij j
qi
siendo las j constantes de integracion y solo hay suma sobre j. La ultima condicion resulta a priori muy
complicada. Sin embargo veremos mas adelante que en la practica ocurre a menudo que solo es necesario probar
la existencia de la matriz , sin que sea necesario encontrar su forma explcita. Esto facilita enormemente
aplicar las condiciones de Staeckel. Para mas informacion sobre las condiciones de Staeckel, remitimos al lector
al apendice D de la segunda edicion de la Ref. [1].
W = W1 (r) + (9.61)
donde
= p l (9.62)
es el momento conjugado a i.e. la magnitud del momento angular. Para el Hamiltoniano (9.60), la ecuacion
de Hamilton Jacobi restringida (9.32) queda de la forma
" #
1 W 2 (W/)2
+ + V (r) = 1
2m r r2
dW1 2 2
+ 2 + 2mV (r) = 2m1 (9.63)
dr r
recordemos que 1 se identifica con el valor numerico del Hamiltoniano y en este caso, de la energa total
del sistema. La Ec. (9.63) es una ecuacion diferencial ordinaria para W1 (r) que se puede reducir en forma
inmediata a cuadraturas s
dW1 2
= 2m [1 V (r)] 2
dr r
y la funcion W dada por (9.61) queda en la forma
s
Z 2
W = + 2m [1 V (r)] 2 dr
r
La ecuacion (9.64) nos da r = r (t) y en general, las constantes 1 y se pueden relacionar con las cantidades
conservadas energa y momento angular (en el problema de una partcula sometida a una fuerza central, es
mas comun conocer la energa y el momento angular como condiciones iniciales, en lugar de las tradicionales
condiciones iniciales de posicion y momento). Como ya se menciono, las restantes ecuaciones de Qi que no
involucran explcitamente al tiempo, proporcionan la ecuacion de la orbita. En este caso solo hay una ecuacion
remanente para la orbita Ec. (9.65). En general resulta util realizar el cambio de variable u = 1/r en (9.65)
con lo que la ecuacion de la orbita queda en la forma
Z
du
= 2 q (9.66)
2m 2
2 (1 V ) u
W = Wr (r) + W () + W () (9.68)
W = (9.69)
donde es una constante de integracion y coincide con el momento conjugado a como se puede ver teniendo
en cuenta las Ecs. (9.51) y (9.52). Usando la forma de W dada por las Ecs. (9.68, 9.69) la ecuacion de Hamilton
Jacobi queda de la forma
" #
Wr 2 1 W 2 2
+ 2 + + 2mV (r) = 2mE (9.70)
r r sin2
donde hemos escrito la constante de integracion 1 como la energa que es el valor numerico de nuestro
Hamiltoniano. Notese que toda dependencia de ha sido separada en el termino entre parentesis cuadrados,
es decir cumple con la estructura de la Ec. (9.57). Esto nos implica que esta funcion de se puede igualar a
una constante segun el razonamiento hecho en la seccion 9.5.2, por ejemplo despejando el termino mencionado
queda " #
2
W 2 2 2 2 Wr
+ = 2mr [E V (r)] r
sin2 r
el miembro izquierdo depende solo de y el derecho solo de r luego ambos deben igualarse a la misma constante
2
W 2
= 2
+ (9.71)
sin2
2
2 2 Wr
2mr [E V (r)] r = 2 (9.72)
r
y obtenemos dos ecuaciones diferenciales ordinarias para y r que ya me reducen el problema a cuadraturas.
Notese que la ecuacion diferencial para r tambien se puede encontrar reemplazando (9.71) en (9.70) quedando
2
Wr 2
+ = 2m [E V (r)] (9.73)
r r2
esta ecuacion es claramente equivalente a (9.72). El unico aspecto que falta determinar es la asociacion de las
constantes E, , con cantidades fsicas. La cantidad E es la energa del sistema. Por otro lado, es el
momento conjugado a la variable , y sabemos que el momento conjugado a una variable angular corresponde
a la componente del momento angular del sistema a lo largo del eje de rotacion que rotara al sistema como
un todo en una cantidad d, este eje sera claramente el eje z y por tanto corresponde a la componente
polar del momento angular Lz .
9.6. FUERZAS CENTRALES EN EL FORMALISMO DE HAMILTON-JACOBI 185
No es tan sencillo identificar el significado Fsico de por multiples razones. En primer lugar, esta cantidad
aparece como una constante de separacion y no como el momento conjugado a (de por s veremos mas adelante
que no lo es), por otro lado una variacion en no define un unico eje de rotacion, ya que a diferencia de
cuya variacion ocurre siempre sobre el plano XY , la variacion en se da en el plano definido por el eje Z y
el vector instantaneo de posicion, este plano claramente cambia cuando vara la direccion del vector posicion.
Finalmente, no puede tomar cualquier valor (0 ) con lo cual se dificulta su interpretacion como angulo
de rotacion. Para encontrar el significado fsico de , calculemos primero los momentos conjugados a cada
variable angular recurriendo al correspondiente Lagrangiano en tres dimensiones para coordenadas esfericas
de la partcula sometida al potencial V (r) i.e.
1 2
L (r, , ) = m r + r 2 2 + r 2 2 sin2 V (r)
2
los momentos conjugados a las variables angulares quedan
L (r, , )
p = = mr 2 (9.74)
L (r, , )
p = = mr 2 sin2 (9.75)
ahora veremos la relacion entre , y los momentos p , p 7 . Ya hemos mencionado que es el momento
conjugado a la variable
W
= p = (9.76)
Para relacionar con los momentos conjugados, podemos reescribir (9.71) en la forma
p2
p2 + = 2 (9.77)
sin2
de tal manera que el Hamiltoniano (9.67), se puede reescribir como
1 2 2
H= pr + 2 + V (r) (9.78)
2m r
lo cual ya nos da el significado fsico de como el modulo del momento angular del sistema. Notese que en
tres dimensiones la conservacion del modulo del momento angular no esta asociado a una variable cclica como
s ocurre en dos dimensiones9 , pues no es variable cclica en tres dimensiones y por tanto p no es constante
de movimiento como se puede apreciar de (9.77), de esta ecuacion tambien se observa que l se escribe en
terminos de los momentos asociados a ambos angulos.
Vemos entonces que la conservacion de las constantes E, , representan fsicamente la conservacion de
la energa, de la componente polar del momento angular y del modulo del momento angular respectivamente.
En este ejemplo, vemos que el metodo de Hamilton Jacobi resulta particularmente poderoso para extraer las
constantes de movimiento as como las ecuaciones de r = r (t) y de la orbita. Adicionalmente, el formalismo
7
A priori estaramos tentados a interpretar a p = mr 2 como el modulo del momento angular total, pero en tres dimensiones
no es la velocidad angular con que la partcula se mueve sobre el plano. En particular, notese que no es cclica y por tanto p
no es constante de movimiento.
8
Los Hamiltonianos (9.78) y (9.60) se pueden comparar apropiadamente, ya que tanto en coordenadas polares planas como en
coordenadas esfericas, la coordenada r se refiere a la distancia al origen.
9
El modulo del momento angular en tres dimensiones aparece como una constante de separacion .
186 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-ANGULO
de Hamilton Jacobi para este problema es separable en otras coordenadas como las parabolicas y elpticas, y
las constantes aparecen en forma apropiada para cada sistema coordenado.
Este problema tambien provee un escenario natural para emplear las condiciones de Staeckel de modo que
encontremos el potencial mas general V para una partcula que haga que las soluciones de la ecuacion sean
totalmente separables en coordenadas esfericas. La matriz de las condiciones de Staeckel solo depende del
sistema coordenado y no del potencial. Como acabamos de demostrar que la ecuacion de Hamilton Jacobi
es separable para al menos un potencial en coordenadas esfericas, las condiciones de Staeckel me dicen que
dicha matriz tiene que existir, y observamos por otro lado que no requerimos de la forma especfica de
para encontrar las condiciones de separabilidad, solo requerimos de su existencia. Adicionalmente, el arreglo
rectangular columna a es nulo y sabemos que el sistema de coordenadas esfericas es ortogonal, de modo que
las condiciones de Staeckel se reducen a aplicar (9.59), para encontrar la forma separable mas general del
potencial. Para ello encontramos primero los elementos (diagonales) de la matriz de energa cinetica (ver Ec.
6.24, Pag. 98)
Trr = m ; T = mr 2 ; T = mr 2 sin2 (9.80)
aplicando (9.59) la estructura mas general del potencial separable es de la forma
Vr (r) V () V () V () V () Vq (q)
V (q) = + + = Vr (r) + 2
+ 2 2 ; Vq (q)
Trr T T r r sin m
se puede comprobar la separabilidad de este potencial por sustitucion directa en la ecuacion de HJ.
1 1 1
A = B r = Buz (xux + yuy + zuz ) = (xBuy yBux )
2 2 2
1 B
r A = (xux + yuy + zuz ) (yBux + xBuy ) = (xy y x)
2 2
y el Lagrangiano queda
m 2 qB k 2
L= x + y 2 + (xy y x) x + y2
2 2 2
introduciendo coordenadas polares
el Lagrangiano queda
m 2 qB h i k
L = r + r 2 2 + (r cos ) r sin + r cos (r sin ) r cos r sin r 2
2 2 2
m 2 qB 2 k k 0 1 m 0 r
L = r + r 2 2 + r r 2 = r 2 + r qB 2 + r 2
2 2 2 2 2 r 2 0 mr
puesto que el Hamiltoniano no depende explcitamente del tiempo y es cclica, proponemos una solucion de
la forma
S (r, , E, , t) = Wr (r, E, ) + p Et (9.83)
con lo cual la ecuacion de HJ (9.82) queda
2 2
1 dWr 1 qB 2 1
+ p r + kr 2 = E
2m dr 2mr 2 2 2
Si comparamos esta solucion con la solucion (9.31) para el oscilador armonico bidimensional isotropico, vemos
que la Ec. (9.85) equivaldra a un oscilador armonico bidimensional isotropico con energa E y frecuencia
angular dadas por
q r
2 2
k qB
E = E + c p , = 0 + c ; 0 , c
m 2m
notese que c es la mitad de la frecuencia de ciclotron de la partcula en el campo magnetico B. Cuando B = 0,
se obtiene E = E y = 0 como era de esperarse. Naturalmente, el problema puede formularse directamente
con la funcion caracterstica W en lugar de la funcion principal S.
188 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-ANGULO
W = Wu + Wv + W
L
p = = m a2 sinh2 v sin2 u = mr 2 = cte
Partcula puntual bajo el campo gravitacional de dos masas desiguales por HJR
Vamos a ilustrar la separacion de variables en la Ec. (9.92), reduciendo a cuadraturas el problema de una
masa puntual m, que se mueve en el campo gravitacional generado por dos masas desiguales fijas M1 y M2 .
Dado que a en las Ecs. (9.86) es una cantidad positiva arbitraria pero fija, la definiremos de modo que sea la
mitad de la distancia entre M1 y M2 . Sin perdida de generalidad, podemos asumir que M1 y M2 yacen en el
eje Z en las posiciones r1 = auz , r2 = auz . Si r es la posicion de la masa m, el potencial generado por M1 y
M2 en la posicion r de m sera
GmM1 GmM2 GmM1 GmM2
V (r) = = (9.95)
|r r1 | |r r2 | |r auz | |r + auz |
una ventaja de poner a M1 y M2 sobre el eje Z, es que el potencial tendra automaticamente simetra azimutal.
Resta entonces demostrar que el potencial (9.95) posee en coordenadas elipsoidales la estructura dada en la
Ec. (9.91), para reducir este problema a cuadraturas.
Denotaremos a la posicion de la masa m como r = xux + yuy + zuz de modo que
donde r, z y son las coordenadas cilndricas de r. Ahora escribimos la expresion (9.96) en coordenadas
elipsoidales, haciendo uso de las Ecs. (9.86)
notese que esta factorizacion fue posible, debido a que la constante a de la Ec. (9.86) se hizo coincidir con la
mitad de la distancia entre M1 y M2 de modo que r1,2 = auz . Usando cosh2 v = 1 + sinh2 v, tenemos
|r auz |2 = a2 sinh2 v sin2 u + 1 + sinh2 v cos2 u + 1 2 cosh v cos u
= a2 (sinh2 v + cos2 u + 1 2 cosh v cos u)
= a2 (cosh2 v + cos2 u 2 cosh v cos u)
1 1
Vu (u) = Gm (M2 M1 ) cos u ; Vv (v) = Gm (M1 + M2 ) cosh v (9.97)
a a
y reemplazando (9.97) en las Ecs. (9.93, 9.94) el problema queda reducido a cuadraturas
1 dWu 2 p2 1
2
+ 2 2 E sin2 u + Gm (M2 M1 ) cos u = A (9.98)
2ma du 2ma sin u a
2 2
1 dWv p 1
2
+ 2 2 E sinh2 v Gm (M1 + M2 ) cosh v = A (9.99)
2ma dv 2ma sinh v a
Figura 9.1: Trayectoria en el espacio de fase de un sistema unidimensional (a) para periodicidad tipo libracion
y (b) para periodicidad tipo rotacion.
Consideraremos en primera instancia el caso de un solo grado de libertad. Asumiremos ademas que el
Hamiltoniano es constante
H (q, p) = 1
podemos resolver para el momento y obtener
p = p (q, 1 ) (9.100)
la Ecuacion (9.100) se puede considerar como una ecuacion de trayectoria en el espacio de fase. Cuando el
movimiento es periodico se habla de una orbita en el espacio de fase. Definiremos dos tipos de periodicidad de
acuerdo con las caractersticas de la orbita en el espacio de fase:
192 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-ANGULO
2. En el segundo tipo de orbita, la trayectoria en el espacio de fase es tal que p es una funcion periodica de
q, con periodo q0 , como se ilustra en la figura 9.1(b). Equivalentemente este tipo de movimiento implica
que cuando la coordenada se incrementa en q0 , el sistema permanece basicamente inalterado. El ejemplo
mas familiar es el cuerpo rgido que rota sobre un eje fijo, siendo q el angulo de rotacion. Cuando se
incrementa q en 2, no se produce ningun cambio esencial en el estado del cuerpo rgido. En realidad
para este tipo de periodicidad la coordenada de posicion esta siempre asociada a un angulo de rotacion
de tal modo que el movimiento periodico asociado se denomina simplemente rotacion, en constraste con
la libracion. En este caso los valores de q ya no estan acotados sino que pueden crecer indefinidamente.
Figura 9.2: Trayectorias en el espacio de fase de un pendulo simple, para diferentes condiciones iniciales.
Cuando E < mgl, obtenemos una orbita cerrada i.e periodicidad tipo libracion. Para el caso E=mgl tenemos
bifurcacion. Finalmente, cuando E > mgl, tenemos periodicidad de rotacion.
Hay sistemas fsicos que pueden exhibir cualquiera de estos dos tipos de movimiento periodico. Un ejemplo
sencillo es el pendulo simple consistente en una lenteja sostenida por una varilla fija a un punto de suspension,
donde el movimiento de la lenteja es en un plano11 . En este caso, q es el angulo de deflexion respecto a la
vertical. Tomando el cero de potencial en el punto de suspension de la varilla sin masa, la energa es constante
y coincide con el Hamiltoniano quedando
p2
E= mgl cos
2ml2
11
Asumimos una varilla en lugar de una cuerda para que la distancia al punto de suspension sea siempre la misma, sin importar
la amplitud angular.
9.8. VARIABLES ACCION-ANGULO PARA SISTEMAS CON UN GRADO DE LIBERTAD 193
siendo l, la longitud de la varilla. Despejando p , obtenemos la ecuacion para el camino que describe el punto
del sistema en el espacio de fase en la forma descrita por (9.100)
p
p = 2ml2 (E + mgl cos ) (9.101)
si E es menor que mgl sabemos por consideraciones de energa que el movimiento es acotado en , de modo
que || < max el valor de la cota superior se obtiene cuando p = 0 y corresponde al valor
E
cos max =
mgl
en este caso la energa es siempre negativa. Claramente el pendulo oscila entre max y max lo cual nos
da un movimiento periodico tipo libracion (ver figura 9.2). Notese ademas que el doble signo en (9.101) es
necesario para que la orbita sea cerrada, es decir no define una funcion. Por otro lado, si E > mgl, la energa
es suficiente para que el pendulo pueda girar completamente de modo que puede tomar cualquier valor y no
esta acotado, este sera un movimiento periodico tipo rotacion (ver figura 9.2). El lmite E = mgl se ilustra
tambien en la Fig. 9.2, y corresponde a un pendulo que llega a = con energa cinetica cero es decir con
p = 0. Este es un punto de equilibrio inestable en el cual se puede quedar indefinidamente, pero si hay la
menor perturbacion el pendulo toma uno de dos caminos drasticamente diferentes (giro en cualquiera de los
sentidos). El punto = , p = 0 es un punto de silla para el Hamiltoniano H = E (p , ), y en dicho punto se
intersectan dos caminos del espacio de fase con energa constante. Este fenomeno se conoce como bifurcacion.
la integracion se realiza en un ciclo completo de libracion o rotacion segun el caso. Observese que este termino
se asemeja a la accion abreviada definida en (6.92) lo cual justifica su nombre de variable de accion. Las
dimensiones de J siempre seran en consecuencia unidades de momento angular. Teniendo en cuenta (9.100) y
(9.102) se observa que J es funcion exclusivamente de 1 i.e. del Hamiltoniano
J = J (1 ) 1 H = H (J)
es decir cumple con la estructura dada por (9.39). Vemos ademas que la coordenada conjugada a J es cclica,
como se espera con el metodo de HJR. La funcion caracterstica de Hamilton puede escribirse como
W = W (q, J) (9.103)
W (q, J)
w= (9.104)
J
las ecuaciones de Hamilton para el conjunto canonico w, J nos dan
H (J)
w = = v (J) (9.105)
J
H (J)
J = = 0 J = cte (9.106)
w
194 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-ANGULO
J es constante ya que esta asociado a una coordenada cclica. A su vez, puesto que v (J) solo depende de J,
tambien es constante. Por tanto, la Ec. (9.105) tiene solucion inmediata
w = vt + (9.107)
y w es funcion lineal del tiempo lo cual es logico ya que este es un caso particular de la Ec. (9.41) con w
haciendo el papel de la nueva coordenada Q.
Una vez obtenida W (q, J), la solucion formal del problema se puede obtener despejando q en terminos de
w, J a partir de (9.104), y luego reemplazando w por la expresion en (9.107). Esto nos da q como funcion del
tiempo y de las constantes J, v, que a su vez se pueden obtener de las condiciones iniciales. Sin embargo, este
procedimiento no posee ninguna ventaja significativa con respecto a otras elecciones de los nuevos momentos.
El verdadero poder de la formulacion en variables accion angulo radica en la interpretacion Fsica de las
constantes v (J). Para ver su significado primero consideremos el cambio en w cuando q hace un ciclo completo
de libracion o rotacion, este cambio esta dado por
I
w
w = dq (9.108)
q
dado que J es constante a lo largo de todo el ciclo, la derivada con respecto a J se puede sacar fuera del signo
integral
I I
d W d
w = dq = p dq = 1
dJ q dJ
donde hemos usado (9.33) y la definicion de J (9.102). Esta ecuacion establece que w cambia en la unidad (w
es adimensional) cuando q se mueve a lo largo de un ciclo. Si ahora asumimos que el movimiento es periodico
en el tiempo13 , entonces este cambio tambien se puede evaluar de (9.107)
w = w ( ) w (0) = v = 1
donde denota el periodo para un ciclo completo de q en cualquiera de los dos tipos de periodicidad. De
aqu resulta entonces que v es el inverso del periodo, es decir la frecuencia asociada al movimiento periodico de
q. Por lo tanto el formalismo de las variables accion angulo nos permite evaluar la frecuencia del movimiento
periodico sin resolver completamente el movimiento del sistema. Si sabemos a priori que cierto sistema
de un grado de libertad es periodico en cualquiera de las dos formas, la frecuencia se puede determinar una
vez que H se escribe en terminos de J y aplicando (9.105). La identificacion de v (J) como una frecuencia
y la Ec. (9.107) nos refuerza el hecho de que a la variable w se le denomine variable angular. De la misma
forma se puede ver que si w tiene dimensiones de angulo (adimensional) el momento conjugado J debe tener
dimensiones de momento angular.
12
Notese que en (9.108) no aparece dependencia explcita del tiempo como a priori se ve en (9.107). La razon es que cuando w
se escribe en terminos de q queda en la forma w = w (q, J) segun se puede ver de las Ecs. (9.103, 9.104). Ademas J es constante a
lo largo del ciclo por construccion.
13
Notese que hasta este punto no se ha utilizado la periodicidad en el tiempo, solo el hecho de que la trayectoria en el espacio
de fase sea cerrada o que p = p (q) sea periodica en q, pero podra ocurrir que cada ciclo en el espacio de fase tomara un tiempo
distinto en ejecutarse.
9.9. PROBLEMAS DE VARIABLES ACCION-ANGULO CON UN GRADO DE LIBERTAD 195
siendo la energa total (conservada) y 2 = k/m. Notese que el signo positivo vale para la mitad del ciclo
(en el que se incrementa q) y el negativo para la otra mitad (en el que decrece la variable q). Por simetra esto
se puede escribir como cuatro veces la integral que comprende al movimiento desde el origen hasta el punto
de maima elongacion en direccion positiva, en este cuarto de ciclo p > 0 y por tanto el radical es positivo
Z qmax p
J =4 2m m2 2 q 2 dq
0
el cambio de variable r
2
q= sin
m 2
nos define claramente los lmites de integracion requeridos para el cuarto de ciclo de la franja superior del
plano de fase, y la integral se convierte en
s
Z /2 s Z /2 2
2 2
J = 4 2m m2 2 2
sin2 cos d = 4 1 sin2 cos d
0 m 0
Z /2
8
= |cos | cos d
0
pero en el intervalo [0, /2] tenemos que |cos | = cos , por tanto
Z
8 /2 2
J= cos2 d = (9.110)
0
despejando i.e. el Hamiltoniano resulta
J
H (J) = (9.111)
2
con lo cual la frecuencia de oscilacion se obtiene aplicando (9.105)
r
H 1 k
v= = = (9.112)
J 2 2 m
en concordancia con la frecuencia obtenida por otros metodos. Es interesante escribir las soluciones para las
Ecs. (9.21, 9.23) en funcion de J y w, a pesar de que no se requieren para encontrar las frecuencias. Teniendo
en cuenta las Ecs. (9.112, 9.107) vemos que
w = vt + = t+ (9.113)
2
2w = t + ; 2 (9.114)
196 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-ANGULO
donde hemos definido adecuadamente la constante arbitraria de integracion . Con esta relacion, las soluciones
de (9.21, 9.23) en funcion de J y w quedan de la forma
r r
J mJ
q= sin 2w ; p = cos 2w (9.115)
m
Las Ecs. (9.115) definen la transformacion canonica que nos lleva del sistema canonico (q, p) al sistema
canonico (w, J). Vale la pena enfatizar que la forma explcita de la TC no fue necesaria para calcular la
frecuencia del movimiento.
9.9.2. Partcula en movimiento periodico en una dimension bajo un potencial V (x) = F |x|
Una partcula posee movimiento periodico en una dimension bajo la influencia de un potencial V (x) = F |x|,
donde F es constante positiva. Encontraremos el periodo de movimiento utilizando variables accion-angulo. El
Hamiltoniano del sistema es simplemente
p2
HE= + F |q|
2m
despejando el momento conjugado en terminos de la coordenada y las constantes de movimiento nos da
p
p = 2m (E F |q|)
con lo cual tenemos una ecuacion del tipo (9.100) que describe la trayectoria en el espacio de fase. La variable
de accion viene dada por la Ec. (9.102)
I I p
J = p dq = 2m(E F |q|) dq (9.116)
Puesto que F > 0, el movimiento esta acotado dentro del intervalo [E/F, E/F ], como se puede ver por
consideraciones de energa. En un ciclo completo se recorre este intervalo de ida y vuelta. Este movimiento es
del tipo libracion ya que la coordenada no crece indefinidamente, sino que retorna a los mismos valores. Por
simetra, podemos recorrer solo el primer cuadrante desde q = 0 hasta q = E/F (donde p = 0), y multiplicamos
por el factor 4 para tener en cuenta el recorrido completo en el espacio de fase. En el recorrido desde 0 hasta
E/F tanto p como q son positivos. La integral (9.116) queda entonces
Z E/F p
J = 4 2m E F q dq
0
con la sustitucion
u = E Fq ; du = F dq
la integral queda
Z 0 Z
1/2 du 4 2m E 1/2
J = 4 2m u = u du
E (F ) F 0
8 2m 3/2
J = E (9.117)
3F
despejando E = H en terminos de J encontramos la frecuencia de movimiento
3F J 2/3 (3F )2/3 2/3
E = H= = J
8 2m 4 3 2m
H (3F )2/3 1/3
= = J
J 6 3 2m
9.10. VARIABLES ACCION-ANGULO PARA SISTEMAS COMPLETAMENTE SEPARABLES16 197
que nos da la frecuenciay periodo del movimiento en terminos de los parametros del sistema (F y m) y las
condiciones iniciales (la energa).
pi = pi (qi ; 1 , . . . , n ) (9.120)
la Ec. (9.120) es el equivalente de (9.100), pero aplicado ahora a varios grados de libertad. La Ec. (9.120)
representa la ecuacion de orbita de la proyeccion del punto del sistema sobre el plano (qi , pi ) en el espacio de
fase (i es un ndice fijo en este caso). Es util definir variables accion angulo cuando las ecuaciones de orbita
para todos los planos (qi , pi ), describen orbitas cerradas (libraciones) o funciones periodicas de qi (rotaciones).
Es de anotar que las condiciones anteriores no significan que necesariamente las variables qi , pi sean fun-
ciones periodicas del tiempo, es decir que repitan su valor para intervalos de tiempo regulares. Incluso cuando
cada conjunto (qi , pi ) es periodico en este sentido, el movimiento completo no es necesariamente periodico.
Para tomar un ejemplo concreto, el oscilador armonico con tres grados de libertad puede tener una frecuencia
diferente sobre cada coordenada cartesiana, el movimiento solo sera periodico si las tres frecuencias son conme-
surables entre s, es decir si los cocientes entre las frecuencias son racionales; de no ser as, se describen figuras
de Lissajous que no son curvas cerradas15 . Tal movimiento se denomina movimiento periodico multiple. Una
de las ventajas de la formulacion de Hamilton Jacobi en variables accion angulo, es que permite evaluar todas
las frecuencias de un movimiento periodico multiple sin resolver completamente el problema del movimiento.
En analoga con (9.102) las variables de accion Ji se definen en terminos de integrales de lnea sobre periodos
completos de la orbita en el plano (qi , pi ). I
Ji = pi dqi (9.121)
notese que la separabilidad manifestada en la ecuacion (9.120) es indispensable para que cada Ji sea una
constante, ya que si cada pi depende de varios q s, esta integral dependera de todos los q s excepto de qi . Si
una coordenada es cclica, su momento conjugado es constante de modo que la trayectoria u orbita en el espacio
de fase (qi , pi ) es una lnea recta horizontal, que no parece ser la naturaleza de un movimiento periodico. En
realidad el movimiento se puede considerar un caso lmite de movimiento periodico de rotacion, en el cual
14
En lo que sigue del captulo no adoptaremos la convencion de suma de ndices repetidos a menos que se indique lo contrario.
15
Vale decir que este ejemplo es en el espacio real y no en el espacio de fase. Pero el razonamiento para el movimiento en el
espacio de fase es identico.
198 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-ANGULO
se le puede asignar un periodo arbitrario a qi . Dado que una coordenada de rotacion es invariablemente un
angulo, si la coordenada cclica es angular, entonces tendra un periodo natural de 2. En consecuencia, es
natural (aunque no obligatorio) evaluar la integral en la definicion de la variable de accion correspondiente
a una coordenada angular cclica entre 0 y 2. Por tanto, para toda variable cclica qi su variable de accion
asociada se definira como
Ji = 2pi (9.122)
usando la Ec. (9.119) en la definicion de Ji Ec. (9.121) se tiene
I
Wi (qi ; 1 , . . . , n )
Ji = dqi (9.123)
qi
como ya mencionamos, gracias a la completa separabilidad en las coordenadas, cada Ji es solo funcion de
las constantes de integracion i que aparecen al integrar la ecuacion de Hamilton Jacobi y es por tanto
constante. Por otro lado, debido a la independencia de los pares (qi , pi ), se tiene que ademas las J s son n
funciones independientes de las s de modo que forman un conjunto adecuado de constantes para definir los
nuevos momentos. Al expresar los s en terminos de los J s, podemos redefinir los argumentos en la funcion
caracterstica17
n
X
W = W (q1 , . . . , qn ; J1 , . . . , Jn ) = Wj (qj ; J1 , . . . , Jn ) (9.124)
j=1
H = 1 = H (J1 , . . . , Jn ) (9.125)
al igual que en el caso de un grado de libertad, podemos definir variables angulares conjugadas wi a traves de
la funcion caracterstica W teniendo en cuenta que esta ultima es una funcion generatriz de tipo 2
n
X Wj (qj ; J1 , . . . , Jn )
W
wi = = (9.126)
Ji Ji
j=1
esta ecuacion muestra que las wi son en general funciones de todas las qj y todas las Jj .
wi = wi (q1 , . . . , qn ; J1 , . . . , Jn ) (9.127)
wi = vi t + i (9.129)
que en este caso no estamos ejecutando un movimiento del sistema en el tiempo. Es como si congelaramos el
tiempo y cada qi fuera movido independientemente a traves de un cierto numero de ciclos de su movimiento.
Esto es analogo al concepto de desplazamiento virtual desarrollado para el principio de DAlembert, de modo
que los cambios infinitesimales en las wi cuando cambian las qi infinitesimalmente, son tambien de naturaleza
virtual por lo cual usamos la notacion wi
n n n
" n
#
X wi X 2W X 2 X
wi = dqj = dqj = Wk (qk ; J1 , . . . , Jn ) dqj
qj Ji qj Ji qj
j=1 j=1 j=1 k=1
donde hemos usado (9.126). La derivada con respecto a qj se anula excepto para Wj y usando (9.119) y (9.120)
se obtiene
n
X
wi = pj (qj ; J1 , . . . , Jn ) dqj (9.130)
Ji
j=1
la Ec. (9.130) representa a wi como una suma de contribuciones independientes cada una asociada al movi-
miento virtual de un qj . El cambio total en wi se puede escribir entonces
n
X I
wi = pj (qj , J) dqj (9.131)
Ji
j=1 mj
el operador diferencial con respecto a Ji se puede mantener por fuera de la integral ya que en el proceso de
integracion i.e. de variacion de las qi el conjunto de las Ji permanece inalterado. El smbolo mj indica que cada
una de las n integrales se realiza sobre un cierto numero de ciclos, siendo mj el numero de ciclos que ejecuta
la coordenada qj . Por otro lado, en virtud de la definicion de variables accion angulo Ec. (9.121) cada una de
estas integrales es mj Jj . Adicionalmente, dado que cada Ji es independiente, se sigue que
wi = mi (9.132)
w = m (9.133)
en estas instancias conviene reafirmar la importancia de la naturaleza virtual del movimiento de rotacion o
libracion en cada plano qi , pi . Notese que en (9.130) wi se representa como una suma de contribuciones
independientes gracias a la virtualidad del movimiento de cada qj ; pues de lo contrario, el parametro tiempo
hace que estos ciclos se recorran en forma correlacionada. Mas importante aun, en el movimiento real si las
frecuencias en cada plano qi ,pi no son conmesurables, no existira un valor finito del tiempo para el cual se hayan
ejecutado ciclos completos en cada plano. Es decir para un movimiento real con frecuencias no conmesurables,
no hay un valor del tiempo para el cual las Ecs. (9.132, 9.133) sean validas.
Finalmente, es importante insistir en que hasta el momento no se ha utilizado periodicidad en el tiempo,
lo cual esta enfatizado por el caracter virtual de los wi .
tomemos mk = ki , de modo que completamos un ciclo en las variables qi , pi dejando a las otras variables sin
transformar, es decir que todas las componentes qk , pk con k 6= i permanecen sin cambiar en tanto que las
componentes qi , pi vuelven a sus valores originales luego de completar un ciclo, esto nos da como resultado que
= 0. Por tanto, en el caso mas general las componentes de tienen que ser funciones periodicas de cada
wi con periodo unidad; esto es, las q s y las p s son funciones periodicas multiples de las w s con periodos
unidad19 . Una funcion periodica multiple como esta puede ser siempre representada por una expansion de
Fourier, la cual para un cierto qk se escribe como
X
X (k)
qk = ... aj1 ,...,jn exp [2i (j1 w1 + . . . + jn wn )] (9.134)
j1 = jn =
donde los jm son enteros. Naturalmente podemos tratar al conjunto de las j s y las w s como arreglos vectoriales
para escribir esta relacion en forma mucho mas compacta
X (k)
qk = aj exp [2i (j w)] (9.135)
j
w = vt + (9.136)
observese que en general qk (t) no es necesariamente una funcion periodica en el tiempo; pues la expansion
de Fourier solo ha requerido la periodicidad en cada coordenada wi por aparte y cada una de ellas crece a
diferente ritmo, no es necesario ni siquiera que haya periodicidad temporal para completar cada ciclo en un
qi , pi dado. Incluso si asumimos periodicidad temporal para cada qi , pi , la periodicidad en qk (t) ocurrira solo
si los vi son todos conmesurables entre s, es decir multiplos racionales unos de otros. Por lo tanto, en el caso
mas general qk se considera una funcion cuasi periodica del tiempo. Finalmente, debe recordarse que los
(k)
coeficientes aj pueden encontrarse usando el procedimiento estandar para encontrar coeficientes de Fourier.
Ellos estan dados por integrales multiples sobre la celda unitaria en el espacio w
Z 1 Z 1
(k)
aj = ... qk (w) exp [2i (j w)] dw
0 0
la funcion en una serie de Fourier multiple analoga a (9.134), y encontrar la dependencia temporal usando
(9.129)
X (k)
qk wk q0k = aj exp [2i (j w)]
j
X (k)
qk = q0k (vk t + k ) + aj exp [2ij (vt + )]
j
por lo tanto, es siempre posible generar una funcion periodica multiple a partir de una coordenada de ro-
tacion, la cual puede ser manipulada exactamente de la misma forma que una coordenada de libracion. En
consecuencia, para simplificar la discusion nos restringiremos a trabajar con el movimiento periodico tipo
libracion.
por ejemplo, cuando las coordenadas cartesianas de las partculas en el sistema no son en s las coordenadas
de separacion, ellas aun se pueden escribir como funciones del tiempo en la forma de las Ecs. (9.138), ya que
ri = ri (q).
Cuando asumimos periodicidad temporal en cada plano qi , pi ; las Ecs. (9.134, 9.137), representan el tipo
mas general de movimiento periodico multiple del tipo libracion. Sin embargo, no todos los sistemas con este
tipo de movimiento poseen todas las caracterstica mostradas en (9.134, 9.137). Por ejemplo, en una amplia
gama de problemas de aplicacion de las variables accion angulo las Ecs. (9.126, 9.127) se simplifican a
Wi
wi = (qi ; J1 , . . . , Jn ) ; wi = wi (qi ; J1 , . . . , Jn ) (9.139)
Ji
de modo que cada coordenada qi de separacion es funcion unicamente de su wi asociado. Cuando esto ocurre,
qk es una funcion periodica solo de wk , y la serie de Fourier multiple se reduce a una serie de Fourier sencilla
X
X
(k) (k)
qk = aj exp [2i (jwk )] = aj exp [(2i) j (vk t + k )] (9.140)
j= j=
En el lenguaje de los sistemas de osciladores acoplados, se puede decir que estas q s son las coordenadas
normales del sistema. Sin embargo, incluso cuando el movimiento de las q s se pueda simplificar as, ocurre
con frecuencia que las funciones f (q) de todas las q s, tales como las coordenadas cartesianas, continuan
siendo funciones periodicas multiples de las w s y deben ser representadas como en la Ec. (9.138). Aunque
haya periodicidad temporal en cada plano (qk , pk ), solo habra periodicidad temporal de tales funciones si las
varias frecuencias vk son conmesurables. Una vez mas, el movimiento de un oscilador armonico bidimensional
anisotropico es un buen ejemplo para ilustrar estas consideraciones.
Supongamos que en un conjunto particular de coordenadas cartesianas, el Hamiltoniano viene dado por
1 2
H= px + 4 2 m2 vx2 x2 + p2y + 4 2 m2 vy2 y 2
2m
estas coordenadas cartesianas son entonces coordenadas de separacion adecuadas y cada una exhibe movi-
miento armonico simple con frecuencias vx y vy respectivamente. Luego, las soluciones para x, y son formas
202 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-ANGULO
particularmente simples de expansiones sencillas de Fourier de la forma (9.140). Supongamos ahora que las
coordenadas estan rotadas /4 alrededor del eje z. Las componentes del movimiento a lo largo de los ejes x , y
seran21
1
x = [x0 cos 2 (vx t + x ) + y0 cos 2 (vy t + y )]
2
1
y = [y0 cos 2 (vy t + y ) x0 cos 2 (vx t + x )] (9.141)
2
si el cociente vx /vy es racional, estas dos expresiones seran conmesurables y corresponderan a figuras de
Lissajous cerradas. Pero si el cociente no es racional, la figura es tal que el punto en el espacio de fase nunca
vuelve exactamente sobre el mismo trazo y las Ecs. (9.141) nos dan un ejemplo sencillo de expansiones de
Fourier de periodicidad multiple de la forma (9.138).
Incluso cuando qk es una funcion periodica multiple de todas las w s, intuitivamente parece existir una
relacion entre qk y su wk asociado (y por tanto con la frecuencia vk ). Despues de todo es de anotar que el
argumento que nos llevo a la Ec. (9.132), nos dice que cuando qk completa un ciclo (moviendo solo a qk ), wk
se incrementa en la unidad en tanto que las otras w s retornan a sus valores iniciales. Un argumento riguroso
para esta relacion fue desarrollado por J. Vinti en 1961.
Supongamos que un cierto intervalo de tiempo T contiene a mk ciclos completos de qk mas una fraccion
de un ciclo. En general el tiempo requerido para cada ciclo sucesivo puede ser diferente, puesto que qk no es
necesariamente una funcion periodica en el tiempo. Vinti demostro, sobre la base de un teorema de la teora
de numeros, que cuando T crece indefinidamente
mk
lm = vk
T T
de modo que la frecuencia promedio del movimiento de qk esta siempre dada por vk , incluso cuando el movi-
miento completo es mas complicado que una funcion periodica con frecuencia vk .
Es notable el hecho de que la ecuacion (9.123) nos dice que cuando qi hace un recorrido virtual de un ciclo
completo (es decir cuando wi se incrementa en la unidad) la funcion caracterstica se incrementa en Ji . Con
una estrategia similar a la que se sigue para el movimiento periodico de rotacion, se tiene que la funcion
X
W = W wk Jk (9.142)
k
permanece invariante cuando cada wk se incrementa en la unidad, con las otras variables de accion perma-
neciendo constantes. La ecuacion (9.142) representa entonces una funcion periodica multiple que se puede
expandir en terminos de las wi (o las frecuencias vi y el tiempo), por una serie de la forma (9.138). Puesto que
las ecuaciones de transformacion para las variables angulares vienen dadas por
W
wk =
Jk
se puede reconocer que la ecuacion (9.142) define una transformacion de Legendre desde la base (q, J) hacia la
base (q, w). Recordando que W es una funcion generatriz tipo 2 y usando las Ecs. (7.14, 7.18) tenemos que si
W (q, J) es de tipo F2 entonces W (q, w) es la funcion correspondiente de tipo F1 . Por tanto, ambas transforman
de las variables (q, p) a las variables (w, J). Sin embargo aunque W genera la misma transformacion que W ,
no es una solucion de la ecuacion de Hamilton Jacobi, ya que el formalismo de Hamilton Jacobi esta disenado
para funciones tipo 2.
Hemos visto que asumiendo periodicidad temporal para cada plano (qi , pi ), la conmesurabilidad es un
criterio esencial para distinguir entre un sistema periodico multiple o un sistema periodico simple. Cuando las
frecuencias todas son conmesurables entre s, la configuracion se repite despues de un tiempo suficientemente
21
La clave es que x = x (vx ) , y = y (vy ) en tanto que x = x (vx , vy ) y y = y (vx , vy ).
9.10. VARIABLES ACCION-ANGULO PARA SISTEMAS COMPLETAMENTE SEPARABLES23 203
largo y sera periodico simple. Matematicamente la conmesurabilidad entre pares de frecuencias se manifiesta
en las siguientes ecuaciones
ji vi = jk vk (no suma) (9.143)
siendo ji y jk enteros positivos. Basta con probar que un cierto vi es conmesurable con los demas para demostrar
que todos son conmesurables entre s, en cuyo caso se habla de una sistema completamente conmesurable.
Pero si solo m de las n frecuencias satisfacen (9.143), el sistema se dice mconmesurable. Por ejemplo si
tenemos las frecuencias
v1 = 3M Hz, v2 = 5M Hz, v3 = 7M Hz, v4 = 2 2M Hz
v5 = 3 2 M Hz, v6 = 3M Hz, v7 = 7M Hz
Los tres primeros son 3-conmesurados y los dos siguientes son doble conmesurados. Hay una relacion interesante
entre conmesurabilidad y las coordenadas en las cuales las Ecuaciones de Hamilton Jacobi son separables. Puede
demostrarse que el camino que recorre el punto en el espacio de configuraciones o de fase para un sistema no
conmesurable llena completamente una region limitada del correspondiente espacio (es decir para cualquier
punto de esta region, la curva pasa por dicho punto en algun instante de tiempo). Esto se ve en las figuras de
Lissajous para frecuencias inconmesurables.
Supongamos que el sistema es tal que en cualquiera de las coordenadas de separacion el movimiento
es simplemente periodico y que por tanto es independiente del movimiento en las otras coordenadas. En
consecuencia, el camino que traza el punto del sistema como un todo tiene que estar limitado por las superficies
de qi y pi constantes que marcan los lmites del movimiento oscilatorio de las variables de separacion (esto es
extendible al movimiento periodico rotacional si restringimos el valor del angulo entre 0 y 2). Estas superficies
por tanto definen un volumen en el espacio que esta densamente lleno por la orbita del punto del sistema. De
esto se sigue que las variables de separacion en un sistema no conmesurado tienen que ser unicas; la ecuacion
de Hamilton Jacobi no puede ser separable en dos sistemas coordenados diferentes (excepto por variaciones
triviales tales como cambios de escala). La posibilidad de separar el movimiento de un sistema en mas de un
sistema coordenado es usualmente una evidencia de conmesurabilidad.
donde las jki toman los valores 0 y 1. Haremos ahora una transformacion canonica desde (w, J) hasta
(w , J ) definida por una funcion generatriz del tipo descrito en (7.23), con g = 0. En nuestro caso tenemos las
asignaciones
qi wi ; pi Ji ; Qi wi ; Pi Ji (9.146)
204 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-ANGULO
definiendo la funcion Pn
fk (w1 , . . . , wn ) = i=1 jki wi si k = 1, . . . , m
(9.147)
wk si k = m + 1, . . . , n
reemplazando (9.147) en (7.23) teniendo en cuenta las asignaciones (9.146) y el hecho de que en (7.23) hay
convencion de suma sobre ndices repetidos, se obtiene una funcion tipo F2 de la forma
n m n
! n
X
X X X
F2 w, J = fk (w1 , . . . , wn ) Jk = jki wi Jk + Jk wk
k=1 k=1 i=1 k=m+1
de modo que
m X
n n
X X
F2 w, J = Jk jki wi + Jk wk (9.148)
k=1 i=1 k=m+1
las coordenadas nuevas se encuentran con las ecuaciones de transformacion (7.19) y las asignaciones (9.146)
) Xm Xn Xn
F2 (w, J
wk = = Jp jpi wi + Jp wp
Jk Jk p=1 p=m+1i=1
La forma funcional de las J con respecto a las J se obtiene utilizando la ecuacion (7.26) con las asignaciones
(9.146)
X
n
f fk
J = J Ji = J
w wi k
k=1
(m " n #) ( n )
X X X
wk
Ji = Jk jkl wl + Jk
wi wi
k=1 l=1 k=m+1
donde hemos usado (9.147). Las correspondientes constantes asociadas a las variables de accion Ji son las
soluciones de las n ecuaciones de transformacion24
m
X n
X
Ji = Jk jki + Jk ki ; i = 1, . . . , n (9.150)
k=1 k=m+1
Nuestra hipotesis es que el sistema es periodico en las variables canonicas (qi , pi ) y ello nos lleva a que las
variables del sistema son periodicas multiples en las coordenadas wk . Cuando se ejecutan mi ciclos completos
en cada plano (qi , pi ) el cambio en las variables wi viene dado por
wi = mi
ahora bien, de las Ecs. (9.149) vemos que para k > m tenemos wi = wi . Por otro lado, las Ecs. (9.149)
para k m, se pueden escribir
Si hacemos una solo ciclo en el plano (qk , pk ) y ningun ciclo en los otros planos tenemos wk = 1 (para cualquier
valor de k). Estas consideraciones nos llevan a conclur que el sistema tambien es periodico multiple en las wk
coordenadas con periodo unidad. Por tanto, estas nuevas variables tambien son del tipo accion-angulo, y las
nuevas frecuencias se pueden calcular como en las ecuaciones (9.128, 9.129)
n
X
vk = wk = jki vi = 0 ; k = 1, ..., m
i=1
vk = wk = vk ; k = m + 1, ..., n (9.151)
donde hemos tenido en cuenta (9.145). En el nuevo sistema canonico tenemos entonces n m frecuencias
independientes (cuando k m + 1) que ademas coinciden con las frecuencias originales del sistema, y las
m frecuencias espureas asociadas con la mdegeneracion se han traducido en m frecuencias nulas25 . Puesto
que wk = vk t + k , las frecuencias nulas corresponden a wk = k y por tanto a factores constantes en la
expansion de Fourier, como se puede ver por ejemplo en la Ec. (9.134). Estos factores constantes tambien
aparecen en la expansion original, siempre que los ndices ji satisfagan una condicion de degeneracion. Por
ejemplo, supongamos que tenemos tres frecuencias 1 , 2 , 3 y que 1 = 2 , la expansion (9.137) en las bases
(w, J) y (w , J ) se escribe
X X X (k)
qk (t) = aj1 ,j2,j3 exp {2i [j1 (2 t + 1 ) + j2 (2 t + 2 ) + j3 (3 t + 3 )]}
j1 j2 j3
XXX
qk (t) = a(k)
m1 ,m2 ,m3 exp {2i [m1 (1 2 ) + m2 (2 t + 2 ) + m3 (3 t + 3 )]}
m1 m2 m3
H
vi = (9.152)
Ji
el Hamiltoniano tiene que ser independiente de las variables de accion Ji asociadas a las frecuencias nulas, que
por construccion son las m primeras frecuencias. Por tanto
H = H Jm+1 , Jm+2 , . . . , Jn (9.153)
en conclusion, la funcion caracterstica W sirve tambien como generatriz de la transformacion desde (q, p)
hasta (w , J ).
25
Es obvio que las m frecuencias nulas no son frecuencias fsicas, sino artificios matematicos para simplificar el problema. En
todo caso, el numero de frecuencias no-nulas independientes permanece constante.
26
El hecho de que W (q, J) se pueda escribir como W (q, J ), tambien se puede ver teniendo en cuenta que la transformacion
(w, J) (w , J ) es tal que J = J (J).
206 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-ANGULO
p = (9.155)
2
p2 = 2 (9.156)
sin2
2
p2r = 2m [E V (r)] (9.157)
r2
como es variable angular cclica se le puede asociar la accion J = 2 de acuerdo con (9.122), y asumir
que es una rotacion eligiendo por conveniencia el periodo 2 (recuerdese que para variable cclica el periodo
de rotacion es arbitrario). A primera vista, la Ec. (9.156) parece mostrar que la trayectoria en el plano de fase
(, p ) es periodica. No obstante, es necesario tener cierta informacion del movimiento para saber si esta en
un intervalo acotado que se recorre de ida y vuelta en un intervalo finito de tiempo (o si tiene periodo tipo
rotacion donde el periodo en se recorra en un intervalo finito de tiempo). Algo similar ocurre con el plano
(, p ) y con el plano (r, pr ). En el movimiento real estos planos definiran trayectorias periodicas solo si la
energa del sistema es negativa, pues de lo contrario la orbita no sera cerrada ni acotada (para mas detalles,
ver Cap. 10). Por ejemplo cuando la trayectoria es abierta, no barre el intervalo completo entre 0 y 2 y el
intervalo acotado solo se recorre de ida, no hay en consecuencia movimiento de rotacion ni de libracion en el
plano (, p ). Por otro lado, cuando la trayectoria es cerrada y acotada se puede ver que y r son acotados (van
y vuelven dentro de un intervalo finito de tiempo) de modo que su movimiento es de libracion28 . En contraste
aumenta indefinidamente y su movimiento es de rotacion. La discusion anterior refuerza el hecho de que el
28
Si suponemos que el plano de movimiento pasa por el origen, y que el eje z no yace en el plano de movimiento, podemos
asegurar que 6= 0 (y en general 6= n) en todo punto de la trayectoria, lo cual nos evita una singularidad en la Ec. (9.156).
9.12. EL PROBLEMA DE KEPLER EN VARIABLES ACCION-ANGULO 207
caracter periodico en el espacio de fase y/o en el tiempo son una hipotesis de trabajo para iniciar el tratamiento
con variables accion angulo, pero no hay nada en este formalismo que nos garantice tal periodicidad, la cual
debe ser extrada por otros argumentos.
Asumiendo entonces periodicidad en cada plano (qi , pi ), vamos a construir las variables de accion asociadas
a cada coordenada. Para ello usamos los valores de los momentos conjugados a , , r de las Ecs. (9.155, 9.156,
9.157), y usando un potencial de la forma V = k/r
I I
W
J = d = d = 2 (9.158)
s
I I 2
W
J = d = 2 d (9.159)
sin2
s
I I
W 2mk 2
Jr = dr = 2mE + 2 dr (9.160)
r r r
la primera integral es trivial y esta asociada con el hecho de que la variable asociada es cclica. Para calcular la
segunda integral es conveniente introducir el angulo polar del momento angular total que denotaremos por i .
Recordando que representa la componente polar del momento angular (ver Sec. 9.6.2), el angulo i viene
dado claramente por
Lz
cos i = = (9.161)
L
en terminos de cos i , la integral (9.159) queda
s
I
2 1
J = 1 2 d
sin2
I r
cos2 i
J = 1 d (9.162)
sin2
podemos asumir sin perdida de generalidad, que el plano del movimiento pasa por el origen de coordenadas.
Para analizar los lmites de integracion debemos calcular los angulos mnimo y maximo 0 y 1 entre un vector
de posicion de la partcula y el eje Z.
La Fig. 9.3 nos ayuda a encontrar estos angulos extremos. En esta figura, el plano Y Z se define de modo
que sea perpendicular al plano de movimiento. Por simplicidad, el plano Y Z se hace coincidir con el plano del
papel y el eje X sale del papel. La lnea punteada que pasa por el origen define la interseccion entre el plano
de movimiento y el plano Y Z. Puesto que L es perpendicular al plano de movimiento, si lo trasladamos al
origen claramente yacera en el plano Y Z. Teniendo en cuenta que i es el angulo entre el momento angular
L y el eje Z, y que L es perpendicular a cualquier vector de posicion dentro del plano de movimiento, es
facil ver que el menor y el mayor valor de se obtienen cuando el momento angular, el eje Z y el vector de
posicion son coplanares. Hay dos vectores unitarios de posicion que cumplen esta condicion: los dos vectores
unitarios que van a lo largo de la lnea punteada denotados por rA y rB , los cuales definen los angulos 0 y 1
respectivamente. Adicionalmente, la Fig. 9.3 muestra que
0 = i , 1 = 0 = + i .
2 2
De lo anterior, se deduce que el circuito completo del angulo consiste en ir desde (/2) i , hasta (/2) + i
y volver, donde sin 0 = cos i . La integral circuital (9.162) se puede escribir como 4 veces la integral entre /2
y (/2) + i quedando29
s
Z (/2)+i r Z (/2)+i
cos2 i sin2 cos2 i
J = 4 1 d = 4 d (9.163)
/2 sin2 /2 sin2
29
0 es el angulo mnimo pero no necesariamente el angulo inicial.
208 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-ANGULO
Figura 9.3: Movimiento bajo una fuerza central. El plano Y Z es perpendicular al plano de movimiento. Cuando
la partcula alcanza la posicion de mnimo o maximo valor de , el vector posicion de la partcula esta en el
mismo plano que el eje Z y el momento angular.
ahora bien, en nuestra convencion L esta en el plano Y Z. Por tanto, siempre es posible escoger el sentido del
eje Z de tal forma que el angulo i entre Z y L este en el intervalo [0, /2). Esto equivale a escoger cos i y
sin i como positivos30 , y dado que la integral anterior se evalua entre /2 y (/2) + i , tendremos que sin
tambien sera positivo. Por tanto, la integral (9.163) queda
Z (/2)+i p 2 Z (/2)+i
sin cos2 i cos2 + 1 cos2 i
J = 4 d = 4 d
/2 sin /2 sin
Z (/2)+i p 2
sin i cos2
J = 4 d (9.164)
/2 sin
La sustitucion
cos = sin i sin sin d = sin i cos d
convierte la integral (9.164) en
Z Z q
(/2)+i
sin d p 2 /2
sin i cos d
J = 4 sin i cos2 = 4 sin2 i (sin i sin )2
/2 sin2 0 1 (sin i sin )2
Z /2 q
sin2 i cos d
= 4 1 sin2
0 1 sin2 i sin2
quedando
Z /2
2 cos2 d
J = 4 sin i (9.165)
0 1 sin2 i sin2
30
Elegimos el intervalo [0, /2), ya que i = /2, equivale a que el eje Z este sobre el plano de movimiento, y esto permite
que = 0, en los puntos de la trayectoria en los cuales la orbita cruza al eje Z. Esto a su vez nos lleva a una singularidad en la
expresion (9.156).
9.12. EL PROBLEMA DE KEPLER EN VARIABLES ACCION-ANGULO 209
la sustitucion adicional
u = tan ; du = 1 + tan2 d = 1 + u2 d
nos da
Z /2 Z /2
2 d 2 d
J = 4 sin i 1 = 4 sin i
0 cos2
2 2
sin i tan 0 (1 + tan ) sin2 i tan2
2
Z Z
du/ 1 + u2 du
= 4 sin2 i 2
2
= 4 sin i
0
2
(1 + u ) sin i u 2
0 (1 + u ) 1 + u2 1 sin2 i
2
Z
sin2 i
J = 4 du
0 (1 + u2 ) [1 + u2 cos2 i ]
puesto que la idea es escribir todo en terminos de las J s, invertimos las Ecs. (9.158, 9.166) para obtener ,
en terminos de J , J
J J + J
= ; = (9.167)
2 2
sustituyendo (9.167) en la expresion (9.160) para Jr resulta
s
I I
W 2mk (J + J )2
Jr = dr = 2mE + dr (9.168)
r r 4 2 r 2
despues de realizar esta integracion, obtenemos una funcion cuyos argumentos son
Jr = Jr (E, J + J ) (9.169)
H H
E = H = H (Jr , J + J ) =
J J
= (9.170)
de modo que las frecuencias en los angulos estan degeneradas. Este resultado no depende de la ley del
inverso cuadrado sino solo del hecho de que la fuerza sea central, y de que la orbita sea acotada, en
cuyo caso el movimiento sera al menos simplemente degenerado. Esta degeneracion es consecuencia del hecho
de que el movimiento se hace en un plano perpendicular al momento angular. El movimiento en este plano
indica que y estan relacionados de tal manera que cuando completa un periodo entre 0 y 2, recorre
210 CAPITULO 9. TEORIA DE HAMILTON-JACOBI Y VARIABLES ACCION-ANGULO
un ciclo completo entre los lmites 1 y 2 ida y vuelta siendo 1,2 = (/2) i , de modo que las frecuencias
en y son necesariamente iguales.
Para realizar la integracion en Jr primero tengamos en cuenta que el movimiento es acotado solo para
energas negativas y dado que el integrando es igual a pr = mr, los lmites del movimiento estan comprendidos
entre las races r1 y r2 de la expresion que esta dentro del radical en (9.168) y que forman los puntos de retorno
en r. Los extremos r1 y r2 son entonces las races de
2mk (J + J )2
2mE + = 0
r 4 2 r 2
(J + J )2
2mEr 2 + 2mkr = 0 (9.171)
4 2
Si r1 , r2 son los lmites inferior y superior respectivamente (las dos races de la cuadratica 9.171), un ciclo
completo incluye ir desde r1 hasta r2 y volver. En la ida (vuelta) pr es positivo (negativo) y por tanto la raz
cuadrada en (9.168) debe ser positiva (negativa). Con lo cual (9.168) se escribe como
s
Z r2
2mk (J + J )2
Jr = 2 2mE + dr
r1 r 4 2 r 2
La integracion por variable compleja se puede ver en la Pag 469 de la Ref. [1], el resultado es
r
2m
Jr = (J + J ) + k
E
el cual tiene la estructura dada por (9.169) como se anticipo. Notese que Jr solo es real para energas negativas,
en concordancia con el hecho de que las trayectorias deben tener energa negativa para ser acotadas. Despejando
la energa i.e. el Hamiltoniano se tiene
2 2 mk2
E=H= (9.172)
(Jr + J + J )2
se ve que para fuerzas atractivas inversas al cuadrado de la distancia, la degeneracion es aun mayor de lo
predicho para fuerzas centrales en general. En este caso los tres periodos coinciden y el movimiento es comple-
tamente degenerado, lo cual nos dice que la orbita es cerrada cuando la energa es negativa. Con una orbita
cerrada el movimiento es simplemente periodico y en este caso, completamente degenerado. Si la fuerza central
contiene un termino proporcional a r 3 (por ejemplo una correccion relativista de primer orden), la orbita ya
no es cerrada sino que tiene la forma de una elipse que precesa. Una de las degeneraciones se remueve en este
caso, pero el movimiento es aun simplemente degenerado ya que la fuerza aun es central.
Volviendo al caso de Kepler, la frecuencia y el periodo vienen dados por
H H H 4 2 mk2 1 (Jr + J + J )3
v= = = = ; = = (9.173)
Jr J J (Jr + J + J )3 4 2 mk2
la suma de los J s se puede escribir en terminos de la energa a partir de (9.172), y el periodo resulta
r
m
= k (9.174)
2E 3
esta formula para el periodo esta de acuerdo con la tercera ley de Kepler si tenemos en cuenta que el semieje
mayor a es igual a k/2E, como se vera en el Cap. 10, Ecs(10.94, 10.110).
Recalcamos finalmente, que para encontrar el periodo del movimiento no utilizamos la ecuacion de la
trayectoria ni la dependencia de las variables con el tiempo. Para integrar los Ji , solo fue necesario hacer
algunas suposiciones generales tales como: (a) El movimiento es periodico y acotado en todos los planos de
9.12. EL PROBLEMA DE KEPLER EN VARIABLES ACCION-ANGULO 211
fase, solo si la energa es negativa31 . (b) El momento angular es una constante de movimiento y esto implica
que el movimiento es en un plano.
Vale decir que en este caso fue posible predecir con base en estas hipotesis, la presencia de degeneracion
simple en el caso de fuerzas centrales ( = ), y de degeneracion total para interaccion kepleriana atractiva
i.e. V (r) = k/r.
quedando
J = J2 J1 ; J = J1 ; Jr = J3 J2 (9.179)
las Ecs. (9.178) y el inverso de las ecuaciones (9.179), me caracterizan a (w , J ) en terminos de los (w, J)
originales
w1 = w w ; w2 = w wr ; w3 = wr (9.180)
J1 = J ; J2 = J + J ; J3 = J + J + Jr (9.181)
y reemplazando estas expresiones en (9.172) resulta
2 2 mk2
H J3 = E = (9.182)
J32
como se predijo, el Hamiltoniano es funcion de una sola Ji en esta base de variables, debido a la completa
degeneracion del sistema. La unica frecuencia caracterstica (no nula) del problema es
H 4 2 mk2
3 = =
J3 J33
para escribir la frecuencia y el periodo en terminos de constantes mas Fsicas, podemos despejar J3 de la Ec.
(9.182) de modo que queda en terminos de la energa, esencialmente en la misma forma en que pasamos de la
Ec. (9.173) a la Ec. (9.174).
Si realizamos un analisis detallado de las variables angulares w veremos que estas tambien conducen a
constantes de movimiento. Esto se puede ver mas facilmente si trabajamos el problema bidimensionalmente
desde el principio (ver seccion 10.16).
9.13. Ejercicios
1. Un sistema de un grado de libertad esta descrito por el Hamiltoniano
p2
H= mAtx
2m
siendo A una constante. Resuelva el problema dinamico utilizando la funcion principal de Hamilton
bajo las condiciones iniciales x (0) = 0 y p (0) = mv0 . Notese que este es un ejemplo de Hamiltoniano
dependiente del tiempo que se puede resolver por HJ. Es claro que para este Hamiltoniano no se puede
emplear la ecuacion de HJR para la funcion caracterstica de Hamilton.
2. Una partcula de masa m esta restringida a moverse sobre una curva en el plano vertical definida por las
ecuaciones parametricas
y = l (1 cos 2) ; x = l (2 + sin 2)
sobre la partcula actua la fuerza gravitacional en la direccion vertical y. Encuentre las frecuencias del
movimiento empleando variables accion-angulo, empleando todas las condiciones iniciales que nos lleven
a que el maximo de sea menor o igual a /4.
3. Consideremos una partcula de carga q que se mueve en el plano XY sujeta a un campo magnetico
constante y uniforme B, perpendicular al plano XY . Escogeremos el vector potencial A de modo que
solo tenga componente y (esta escogencia se conoce como gauge de Landau), de modo que Ay = Bx y el
Hamiltoniano del sistema sera
p2x (py + bx)2
H (x, y, px , py ) =+ ; b qB (9.183)
2m 2m
asuma separacion de variables para la funcion principal de Hamilton
S = Wx (x) + Wy (y) t
y reduzca el problema a cuadraturas.
9.13. EJERCICIOS 213
5. Una partcula de masa m esta restringida a moverse sobre el eje X sujeta al potencial V = a sec2 (x/l).
(a) Resuelva la ecuacion de HJ y a partir de la funcion generatriz, encuentre x (t). (b) Encuentre las
variables accion-angulo y la frecuencia asociada al sistema. Obtenga la dependencia de la frecuencia
con la amplitud y encuentre el lmite de pequenas amplitudes para .
donde m y k son constantes y f (t) una funcion integrable. Encuentre q (t) y p (t) as como la trayectoria
en el espacio de fase, para los tres casos siguientes
Discutiremos a continuacion, el problema de la interaccion entre dos masas puntuales que se mueven
bajo la influencia de una fuerza que va a lo largo de la lnea que las une. Este es un problema que posee
muchas aplicaciones tanto en Fsica Clasica como en Fsica Moderna. Siguiendo el espritu de las formulaciones
aqu presentadas, primeros nos concentraremos en las primeras integrales que se pueden hallar sin resolver el
problema completo, para luego analizar algunos potenciales especficos.
m1 r1 + m2 r2
r r2 r1 ; R (10.1)
m1 + m2
214
10.1. REDUCCION AL PROBLEMA DE DOS PARTICULAS DESACOPLADAS 215
r1 = R + r1 ; r2 = R + r2 (10.3)
con lo cual
m2 m1
r1 = r ; r2 = r (10.4)
m1 + m2 m1 + m2
En esta seccion consideraremos una situacion algo mas general en donde el potencial puede depender tambien
de las derivadas temporales del vector relativo r. El Lagrangiano del sistema se puede escribir como
L = T R, r U (r, r, ..)
es bien sabido que la energa cinetica de un sistema de partculas se puede escribir como la energa cinetica
del centro de masa mas la energa cinetica con respecto al centro de masa (ver Ec. 1.32, Pag. 13)
1 1 1 1 1
T = m1 r21 + m2 r22 = m1 r2 2
1 + m2 r2 + M R
2
(10.5)
2 2 2 2 2
donde M m1 + m2 . Usando (10.4) se puede escribir la energa cinetica en terminos de las coordenadas
generalizadas elegidas i.e. las componentes de R y r
1m m 1
1 2 2
T R, r = r + M R2 (10.6)
2 M 2
el Lagrangiano queda de la forma
1 1 m1 m2 2
L = M R2 + r U (r, r, ..) (10.7)
2 2 M
se puede ver que las 3 coordenadas de R son cclicas. Si elegimos como coordenadas generalizadas las tres
componentes cartesianas de R, vemos que los tres momentos lineales (que seran los momentos canonicos)
son constantes y por tanto, R = cte, de modo que el centro de masa esta en reposo o movimiento rectilneo
uniforme1
R = R0 + Rt (10.8)
si nuestro sistema original de referencia es inercial, entonces el sistema con origen en el centro de masa tambien
lo es. Podemos entonces ver el movimiento a partir del centro de masa, en cuyo caso el Lagrangiano (10.7)
queda
1
L = r2 U (r, r, ..) (10.9)
2
donde hemos definido la masa reducida del sistema como
m1 m2
(10.10)
M
El Lagrangiano (10.9) es el equivalente al Lagrangiano que se obtendra si tuvieramos una partcula de masa
(que llamaremos la partcula) sometida a una fuerza que apunta siempre hacia un punto fijo (fuerza
central), y a una distancia r del centro de fuerza. Por otro lado, el Lagrangiano (10.7) que se escribe desde
el sistema de referencia del laboratorio, es equivalente al Lagrangiano de dos partculas desacopladas, una de
ellas es la partcula ya mencionada y la otra es una partcula libre de masa M = m1 + m2 , que se mueve
1
Desde el punto de vista Newtoniano esto se puede ver por el hecho de que el sistema esta aislado, de modo que el centro de
masa no puede estar acelerado. En terminos de simetras, se dice que el sistema tiene invarianza traslacional que conduce a la
conservacion del momento lineal.
216 CAPITULO 10. FUERZAS CENTRALES
con velocidad constante como se ve en la Ec. (10.8) y que llamaremos la M partcula. Sin embargo, dado que
la dinamica de la M partcula es trivial, solo necesitaremos resolver la dinamica de la partcula. Por esta
razon suele decirse que el problema de dos cuerpos sometidos a fuerzas centrales mutuas, se puede reducir a
un problema de una sola partcula que interactua con un centro de fuerzas2 .
Debemos recordar sin embargo, que tanto la partcula como la M partcula SON IMAGINARIAS,
no hay ninguna partcula en el sistema Fsico con masa o con masa M . Las trayectorias que encontraremos
son las trayectorias de estas partculas imaginarias. Para encontrar la trayectoria de las partculas reales con
respecto al sistema inercial original (laboratorio), es necesario devolverse tomando las Ecs. (10.2, 10.8) junto
con las soluciones que encontremos para r.
No obstante, si ocurre que m1 << m2 entonces tanto la trayectoria como la masa de la partcula,
van a ser muy semejantes a la trayectoria y masa real de m1 . En el mismo lmite, la trayectoria y la masa
de la M partcula son muy similares a la trayectoria y la masa de la partcula real m2 . De hecho, en esta
aproximacion la posicion del centro de masa es casi igual a la posicion de la partcula m2 .
Podemos decir entonces que el paso de las coordenadas r1 , r2 a las coordenadas R, r nos lleva de un
sistema de dos partculas (reales) acopladas o interactuantes, a otro sistema de dos partculas (imaginarias)
desacopladas o no interactuantes entre s, donde una de ellas es libre y la otra interactua con el potencial
central.
L = r p = cte
Trabajaremos entonces en coordenadas polares planas para las cuales el Lagrangiano se escribe
1
L = m r 2 + r 2 2 V (r)
2
como se previo, existe una coordenada angular cclica . El momento conjugado a esta variable es constante y
corresponde a la magnitud del momento angular
L
p = = mr 2 = cte
notese que esta cantidad contiene la informacion sobre el sentido de giro (dada por el signo de ) y por tanto del
sentido de L, como se observa en la Ec. (10.11), es decir nos dice si L apunta en forma paralela o antiparalela
al eje Z. Una de las primeras integrales de movimiento es entonces
d 2
p = mr = 0 (10.12)
dt
y se puede integrar en forma inmediata
mr 2 = l (10.13)
siendo l la magnitud del momento angular. Podemos extraer mas informacion util a partir de (10.12), de la
cual se deduce
d 1 2
r = 0 (10.14)
dt 2
veamos la interpretacion del termino entre parentesis. Sea ds la longitud de arco recorrida por la partcula
en un intervalo infinitesimal de tiempo dt, el diferencial de area que barre el radio vector de posicion en un
tiempo dt es
r ds 1
dA = = r (rd)
2 2
y la velocidad de area, es decir el area que barre el radio vector de posicion por unidad de tiempo es
dA 1 d 1
= r2 = r 2 (10.15)
dt 2 dt 2
pero de acuerdo con (10.14) se llega a que
d dA dA
=0 = cte
dt dt dt
de modo que la velocidad de area es constante y se obtiene la segunda ley de Kepler, el radio vector de
posicion barre areas iguales en tiempos iguales. El valor de la velocidad de area se puede encontrar
facilmente a partir del valor del momento angular l. Kepler obtuvo esta ley con base en la interaccion gravita-
cional en donde V (r) = k/r. Sin embargo, en nuestra presente derivacion solo se empleo la conservacion del
momento angular, mostrando que esta ley es valida para cualquier fuerza central.
La ecuacion de Lagrange para la coordenada no cclica r es
d V
(mr) mr 2 + =0
dt r
recordando que la fuerza viene dada por V que en este caso es (V /r) ur se tiene que
mr mr 2 = f (r)
218 CAPITULO 10. FUERZAS CENTRALES
teniendo en cuenta la primera integral dada por (10.13) podemos eliminar de la anterior ecuacion
l2
mr = f (r) (10.16)
mr 3
con lo cual se obtiene una ecuacion diferencial ordinaria solo en la variable r. Aunque esto reduce formalmente
el problema a cuadraturas, resulta mas ventajoso obtener otra primera integral de movimiento teniendo en
cuenta que la funcion energa (o el Hamiltoniano) reune las condiciones para ser la energa del sistema y ademas
no es funcion explcita del tiempo lo cual nos lleva a la conservacion de la energa del sistema (esto tambien
se puede ver por el hecho de que las fuerzas centrales son conservativas). Esta ley de conservacion se escribe
1 2 2
1 2 2 2
1 2 r 2 l2
E = m vr + v + V (r) = m r + r + V (r) = m r + 2 4 + V (r) (10.17)
2 2 2 m r
1 2 1 l2
E = mr + + V (r) (10.18)
2 2 mr 2
donde hemos tenido en cuenta de nuevo (10.13). Notese que la Ec. (10.18) es de primer orden en tanto que
(10.16) es de segundo orden, es decir formalmente hemos hecho un primer proceso de integracion. Este primer
proceso de integracion se puede ver de manera mas transparente usando las Ecs. (10.12, 10.16). La Ec. (10.16)
se puede reescribir como
d 1 l2
mr = V +
dr 2 mr 2
multiplicando a ambos lados por r
d 1 l2
mr r = r V + (10.19)
dr 2 mr 2
el miembro de la izquierda se escribe como
d 1 2
mr r = mr
dt 2
para el miembro de la derecha se tiene en cuenta que la derivada total respecto al tiempo de una funcion g que
solo depende de r, se escribe como dg (r) /dt = (dg/dr) r. De modo que
d 1 l2 d 1 l2
V + = r V +
dt 2 mr 2 dr 2 mr 2
con lo cual la Ec. (10.19) queda
d 1 2 d 1 l2
mr = V +
dt 2 dt 2 mr 2
1 2 1 l2
mr + V + = cte E (10.20)
2 2 mr 2
y la Ec. (10.20) coincide con (10.18). Se observa que el ultimo paso es un proceso de integracion que me redujo
la ecuacion diferencial de segundo orden a una de primer orden. El procedimiento anterior nos muestra tambien
la ventaja de conocer constantes de movimiento por argumentos de simetra, ya que permite obtener primeras
integrales de movimiento sin tener que realizar explcitamente el primer proceso de integracion.
Dado que originalmente tenemos dos variables r y y ecuaciones diferenciales de segundo orden, se requieren
cuatro integraciones para resolver las ecuaciones de movimiento de las cuales hemos obtenido dos. Como se
puede ver las primeras integrales obtenidas han convertido las ecuaciones de Lagrange en dos ecuaciones
de primer orden que requieren de dos integraciones Ecs. (10.13, 10.18). Notese que la Ec. (10.18) tiene una
apariencia muy similar a una ecuacion unidimensional con potencial conservativo
1
E= mx2 + V (x)
2
10.2. ECUACIONES DE MOVIMIENTO Y PRIMERAS INTEGRALES 219
excepto por el termino l2 / 2mr 2 . Esto nos induce a definir un potencial efectivo de la forma
1 l2
Vef f V (r) + (10.21)
2 mr 2
de modo que la Ec. (10.18) se reescribe como
1
E = mr 2 + Vef f (r) (10.22)
2
con la Ec. (10.22) el analogo unidimensional se hace perfecto. Esto nos permitira realizar curvas de energa
potencial efectiva versus r e interpretar el movimiento de manera analoga al caso unidimensional, aunque con
algunas diferencias que ya indicaremos mas adelante.
Ya hemos visto varios metodos para obtener las integrales de movimiento, el mas sencillo a partir del
procedimiento que hemos seguido es el de resolver para r en la Ec. (10.22)
r
2
r = [E Vef f (r)] (10.23)
m
con lo cual
dr
dt = q
2
m [E Vef f (r)]
la Ec. (10.24) nos da t en funcion de r y de las constantes de integracion E, l, r0 , recordemos que l esta contenido
en el potencial efectivo. Este puede invertirse al menos formalmente para obtener r en funcion del tiempo y
las constantes. Una vez encontrada la solucion para r (t) se puede sustitur en (10.13) para obtener la solucion
en
l
= (10.25)
mr 2 (t)
l dt
d = (10.26)
mr 2 (t)
tomando a 0 como el valor inicial de , la integracion nos da
Z t
l dt
0 = 2
(10.27)
m t0 r (t)
finalmente, si estamos interesados en la ecuacion de la trayectoria, esta se puede obtener haciendo el cociente
de (10.25) sobre (10.23)
d/dt d l
= = q (10.28)
dr/dt dr mr 2 2
m (E Vef f )
Z r
l dr
0 = q (10.29)
r0 mr 2 2
m (E Vef f )
formalmente las Ecs. (10.24, 10.27) nos proveen de las dos integrales restantes necesarias para determinar las
ecuaciones de movimiento5 . Dado que se requieren cuatro integrales tambien se requieren cuatro constantes
5
La integral (10.28) no es independiente y se obtiene a partir de las anteriores.
220 CAPITULO 10. FUERZAS CENTRALES
de movimiento, las cuales pueden ser r0 , 0 , r0 , 0 , sin embargo un conjunto mas conveniente para la mayora
de aplicaciones es E, l, r0 , 0 . En todo caso, un conjunto se puede convertir en el otro. En los problemas que
analizaremos sera mas conveniente usar E y l. En mecanica cuantica, los valores iniciales de las coordenadas
y sus derivadas pierden su significado, pero E, l son todava utiles en este formalismo y de por s muchas
de las diferencias entre los comportamientos clasicos y cuanticos estriban en el comportamiento de estas dos
cantidades. Por este motivo, para cuantizar una teora es conveniente que este escrita en terminos de la energa
y el momento angular del sistema.
Ya hemos visto que la definicion de un nuevo potencial efectivo (10.21) conduce a que una de las primeras
integrales asociada a la conservacion de la energa, tenga un analogo unidimensional ya que queda escrito de
la forma
1
E = mr 2 + Vef f (r) (10.30)
2
Donde el potencial efectivo Vef f corresponde al potencial real mas un termino adicional en la forma
1 l2 1
Vef f V (r) + Vcent ; Vcent = mv2 (10.31)
2 mr 2 2
Vcent se conoce como potencial centrfugo. Este nombre se debe a que si este termino correspondiera a un
potencial real, correspondera a una fuerza central repulsiva (ya que es positivo). No obstante, debe tenerse
claro que este termino no da cuenta de una interaccion real, es decir no es un verdadero potencial, realmente
corresponde a una porcion de la energa cinetica de la partcula (la correspondiente a la velocidad transversal)
como puede verse en la seccion anterior Ecs. (10.17, 10.18). Este termino centrfugo depende de l y por tanto
depende en general de las condiciones iniciales, un cambio en el momento angular correspondera a un cambio
en el potencial centrfugo, observese que el potencial real unidimensional es independiente de las condiciones
iniciales lo cual constituye una de las principales diferencias con el potencial efectivo. Sin embargo, mientras
el sistema no interactue con otros cuerpos, el momento angular sera una constante y por lo tanto el potencial
efectivo no cambiara.
Veamos ahora que observables se pueden determinar con base en las primeras integrales, la velocidad por
ejemplo se puede obtener en magnitud y direccion, su magnitud se obtiene de la conservacion de la energa
r
1 2 2
E = mv + V (r) v = [E V (r)] (10.32)
2 m
en este caso solo interviene el potencial real ya que el efectivo lo que hace es tomar una porcion de la energa
cinetica la cual aqu se escribe completa. La componente radial de la velocidad se puede obtener de (10.23)6 .
Con la rapidez y la velocidad radial es suficiente para obtener el vector velocidad7 . Otra manera de hacerlo es
obtener a traves de l en la Ec. (10.13), y r con la ecuacion (10.23).
Las siguientes relaciones se siguen de las Ecs. (10.30, 10.31)
1 2 1
E Vef f = mr = mvr2 (10.33)
2 2
1 1
E V (r) = mv 2 = m vr2 + v2 (10.34)
2 2
1 2 2 1
Vef f V = mr = mv2 (10.35)
2 2
6
Notese que esto es equivalente a tomar (10.32), descomponiendo la velocidad en sus terminos radial y transversal y absorbiendo
el termino transversal en el potencial para definir el potencial efectivo que aparece en (10.23).
7
La conservacion del momento angular evita una posible ambiguedad en el sentido de la velocidad transversal.
10.4. ANALISIS DE CURVAS DE POTENCIAL EFECTIVO 221
Las Ecs. (10.33, 10.34, 10.35) nos inspiran a hacer graficas de la energa total, el potencial efectivo, y el
potencial real en funcion de r. Naturalmente, la curva de E corresponde a una recta horizontal en virtud de su
conservacion. De las mencionadas ecuaciones vemos que las regiones accesibles, es decir los valores permitidos
para r deben cumplir que E Vef f (r) puesto E Vef f es la cantidad no negativa 12 mr 2 , esta cantidad a lo
mas puede ser cero lo cual ocurre en los puntos de retorno8 ri , en donde se anula la velocidad radial. De la
misma manera, la region accesible debe cumplir que E V (r) ya que E V (r) es la energa cinetica completa
para un valor dado de r. Finalmente, en la region permitida se debe cumplir que Vef f (r) V (r) puesto que
Vef f V es la energa cinetica transversal.
Las Ecs. (10.33, 10.34, 10.35), muestran que la brecha entre la energa total y la curva de potencial efectivo
es la energa cinetica radial, la brecha entre E y la curva V (r) nos da la energa cinetica total y la brecha
entre las curvas Vef f y V (r) nos da la energa cinetica transversal (termino centrfugo). Por tanto, estas curvas
proveen la rapidez de la partcula as como sus componentes radial y transversal para una distancia dada r,
con una energa y momento angular dados.
Por otro lado, vemos que la definicion (10.21) conduce automaticamente a la condicion Vef f (r) V (r), y
que el cumplimiento de la condicion E Vef f , nos lleva automaticamente a E V (r). En consecuencia, solo
la condicion E Vef f nos da informacion fsica sobre regiones permitidas o excludas para la partcula.
El analisis cualitativo aqu descrito permite pintar la orbita en forma aproximada.
Figura 10.2: (a) Graficas del potencial centrfugo (lnea punteada superior), potencial real (grafica punteada
inferior) y potencial efectivo (grafica contnua), como funciones de r, para un potencial Kepleriano. Las lneas
horizontales representan diversos valores de la energa total de la partcula. (b) Grafica del potencial efectivo
y de la energa total para el caso de energa total positiva.
en la barrera efectiva para volver a aumentar ahora indefinidamente. No obstante, el perfil de la curva no nos
prohbe que la partcula empiece a aumentar su coordenada r desde el principio aumentando indefinidamente
sin acercarse nunca a la barrera de potencial, efectivamente esta sera la situacion si r0 > 0 como se puede ver
de la Fig. 10.4a, si invertimos el sentido de la velocidad inicial. Nuevamente las condiciones iniciales son las
que nos permiten dicernir cual es la situacion que esta ocurriendo10 . De lo anterior, vemos que dependiendo
de las condiciones iniciales es posible que la partcula no acceda a toda la region permitida por la curva de
potencial efectivo.
Ahora bien, para el caso de una energa E2 = 0, la historia es muy parecida al caso de energa positiva
excepto que en el infinito la partcula no poseera energa cinetica (la energa cinetica en el infinito es preci-
samente la energa total ya que todos los potenciales se van para cero). En contraste, cuando la energa es
positiva la partcula posee energa cinetica incluso en el infinito.
La Fig. 10.3a, muestra que para cualquier valor E3 < 0 que sea mayor que el mnimo de Vef f 11 , la
coordenada r esta acotada entre dos puntos de retorno r1 y r2 que seran los valores maximo y mnimo de
la distancia al centro atractor, conocidas como distancias apsidales. Esto no significa que las orbitas sean
necesariamente cerradas, solo nos demuestra que estan acotadas por la region definida entre los crculos de
radios r1 y r2 , donde los puntos de retorno siempre estan sobre una de las circunferencias. La forma generica
de la orbita esperada se muestra en la figura 10.4b.
La Fig. 10.3b ilustra la situacion en la cual la energa E4 es igual al mnimo de Vef f de modo que solo hay
un valor accesible de r donde r = 0, en cuyo caso la trayectoria es circular. Definiendo una fuerza efectiva
de la forma
Vef f l2
fef f (r) = =f+ (10.36)
r mr 3
el requerimiento de orbita circular r Vef f = 0, corresponde claramente a la anulacion de la fuerza efectiva. Es
10
Recordemos que en principio se requieren cuatro condiciones iniciales para determinar la dinamica del sistema, y en la curva de
potencial hay solo dos, la energa y el momento angular. Usualmente las dos condiciones restantes que permiten un mejor analisis
son los valores iniciales de r y de r.
11
Si E < Vef f (r) para todo r, no hay regiones accesibles ya que conduce a energa cinetica radial negativa.
10.4. ANALISIS DE CURVAS DE POTENCIAL EFECTIVO 223
Figura 10.3: (a) Grafica del potencial efectivo kepleriano y de la energa total para el caso de energa total
negativa donde E3 es mayor que el valor del mnimo del potencial efectivo. (b) Grafica del potencial efectivo
kepleriano y la energa total para el caso de energa total negativa donde E4 coincide con el valor del mnimo
del potencial.
el equivalente a pararse en el sistema no inercial atado a la partcula para ver la anulacion entre la fuerza real
y la fuerza centrfuga de caracter ficticio.
Por otro lado, recordemos que el cambio en l cambia el perfil de Vef f aunque esto no cambia la clasificacion
general de los tipos de orbitas (a menos que l se vuelva nulo). Es decir para valores negativos de la energa
seguimos teniendo orbitas acotadas, y para energas no negativas las orbitas continuan siendo no acotadas sin
importar el valor del momento angular (siempre que sea no nulo), aunque por supuesto el perfil especfico del
potencial efectivo y la forma especfica de la orbita cambian con el momento angular. Sin embargo, cuando
el momento angular se vuelve nulo la clasificacion de las orbitas s cambia, ya que el potencial centrfugo se
anula y la trayectoria es una lnea recta.
Mas adelante veremos que en el caso de la ley de inverso cuadrado atractivo, las energas positivas conducen
a orbitas hiperbolicas, energa cero conduce a orbitas parabolicas y energa negativa a elipses. Estos resultados
estan en concordancia con el analisis cualitativo que mostramos aqu. Sin embargo, ademas de los detalles de
la orbita, veremos que toda orbita acotada para potencial kepleriano corresponde a una trayectoria cerrada,
lo cual no se puede garantizar con el analisis del potencial efectivo. De hecho, son muy pocos los potenciales
para los cuales toda orbita acotada es cerrada (ver seccion 10.9, Pag. 237).
Figura 10.4: (a) Ilustracion del tipo de orbita no acotada que corresponde a una energa total no negativa en un
potencial kepleriano. r1 es la menor distancia de aproximacion al centro de fuerzas. (b) Ilustracion del tipo de
orbita acotada entre dos valores de r que corresponde a una energa total negativa. De momento no podemos
garantizar que esta orbita sea cerrada.
a este problema de dos cuerpos. Denotaremos por v0 la velocidad relativa la cual viene dada por
v0 = r = r2 r1 = v2 v1
claramente v0 es constante ya que v1 y v2 lo son. La energa total del sistema relativa al centro de masa es
1 2 1
E= v0 + V (r) = v02
2 2
puesto que V (r) = 0. El potencial efectivo esta dado por
l2 l2
Vef f = + V (r) =
2r 2 2r 2
1 l2 1
E = r 2 + = v02 (10.37)
2 2r 2 2
es claro que cuando los dos cuerpos alcanza su distancia mnima de aproximacion r = b y r = 0 puesto que r
es un mnimo local en este punto, esto se ilustra en la Fig. 10.5b. Por tanto
l2 1
2
= v02 l = bv0 (10.38)
2b 2
1 b2
Vef f = v02 2
2 r
10.4. ANALISIS DE CURVAS DE POTENCIAL EFECTIVO 225
Figura 10.5: Ilustracion del comportamiento de la coordenada r para el caso de dos partculas no interactuan-
tes. (b) Ilustracion de la barrera de potencial efectivo que nos indica el valor de la mnima distancia de
aproximacion. (c) Grafica de potencial efectivo para la partcula equivalente al problema de dos cuerpos no
interactuantes.
de modo que el grafico del potencial efectivo es el indicado en la Fig. 10.5c. La region permitida es aquella
en la cual E Vef f . Haremos un analisis del movimiento de la partcula equivalente. Denotaremos el
punto de retorno como rt . Si las condiciones iniciales son tales que r (0) > rt y r (0) < 0, entonces la partcula
inicialmente se aproxima al punto de retorno y al llegar a el rebota en la barrera de potencial efectivo luego
de lo cual se invierte el sentido radial de movimiento y la coordenada r crece indefinidamente. Debe tenerse
presente que el retorno es en la coordenada radial de la partcula, pero no en la coordenada , de modo
que no hay retorno del movimiento como tal. Si cambiamos las condiciones iniciales de modo que r (0) > rt y
r (0) > 0, la partcula inicialmente se aleja del punto de retorno y la coordenada r aumenta indefinidamente
puesto que no hay puntos de retorno a la derecha de r (0), en cuyo caso la partcula nunca pasa por el
punto de retorno. Comparese este analisis con el estudio puramente cinematico de las dos partculas reales al
principio de este seccion.
La Fig. 10.5c muestra ademas que cuando la partcula se dirige hacia el punto de retorno, la energa
cinetica radial va disminuyendo12 , y cuando se aleja del punto de retorno, la energa cinetica radial esta au-
mentando hasta llegar al valor E en el infinito.
A manera de consistencia, encontraremos el punto de retorno con la condicion E = Vef f (rt ) lo cual nos da
1 2 1 2 b2
v = v0 2 rt = b
2 0 2 rt
en concordancia con nuestro analisis cinematico. Esto se ve de las graficas 10.5a,b ya que r disminuye hasta
llegar a r = b, y a partir de all vuelve a aumentar. En nuestra grafica unidimensional 10.5c, esto se interpreta
diciendo que la partcula equivalente rebota en la barrera de potencial efectivo. Insistiendo en que estos
rebotes o retornos son en la coordenada r y no en el movimiento del sistema.
Este ejemplo es muy enfatico en su mensaje, el potencial efectivo (que aqu coincide con el potencial
centrfugo) no esta de ninguna manera relacionado con interaccion, ya que estas partculas no interactuan
entre s. En este caso, la barrera de potencial efectiva (centrfuga) es debida exclusivamente a las condiciones
iniciales del problema. Efectivamente, si el choque fuera frontal i.e. b = 0, el potencial efectivo se anulara
y se desvanecera la barrera de potencial efectiva, lo cual se refleja en el hecho de que dos partculas no
interactuantes que se aproximan frontalmente, puede acercarse una a otra en forma indefinida.
226 CAPITULO 10. FUERZAS CENTRALES
Figura 10.6: Graficas del potencial centrfugo (lnea punteada superior), potencial real (grafica punteada infe-
rior) y potencial efectivo (grafica contnua), como funciones de r, para un potencial de la forma V = a/r 3 .
a 3a
V (r) = 3
f = 4 (10.39)
r r
a l2
Vef f = 3+ (10.40)
r 2mr 2
el potencial efectivo junto con el potencial real y el termino centrfugo, se grafican en la figura 10.6. Este
potencial efectivo solo tiene un maximo local y tiende a cero por la derecha cuando r , tambien tiende
a cuando r 0. Para una energa E positiva menor que el maximo local, hay dos tipos de movimiento
dependiendo del valor inicial de r. Si r0 r1 el movimiento sera acotado entre 0 y r1 ; ademas la energa
cinetica tendera a infinito a medida que se acerca al centro atractor. Si r0 r2 el movimiento es no acotado y
su distancia mnima de acercamiento es r2 , la partcula no podra nunca acceder al pozo de potencial, debido
a que existe entre r1 y r2 una barrera de potencial. El intervalo r1 < r < r2 es claramente inaccesible.
Para el caso E 0 la orbita estara acotada entre r = 0 y un punto de retorno, la energa tiende a infinito
cuando r 0. Cuando E es mayor que el maximo del potencial todas las regiones son permitidas.
Resulta interesante el caso en el cual E coincide con el valor del maximo del potencial, llamemos rm al valor
de r en el cual ocurre el maximo. Si r0 > rm y r0 < 0 la coordenada r disminuira acercandose a rm , en este
proceso disminuye la energa cinetica radial hasta anularse cuando r = rm , y la partcula queda atrapada en
una trayectoria circular de radio rm . Notese sin embargo que si la energa es ligeramente mayor o ligeramente
menor a este valor del maximo de potencial, la naturaleza del movimiento cambia drasticamente, de modo que
12
Naturalmente, la energa cinetica total es constante y esta dada por E V (r) = E. De modo que la energa cinetica transversal
debe estar aumentando. Efectivamente, esta energa esta dada por Vef f (r) V (r) = Vef f (r), y el potencial efectivo aumenta
cuando disminuye r.
10.4. ANALISIS DE CURVAS DE POTENCIAL EFECTIVO 227
tenemos una orbita circular inestable. De otra parte, si r0 > rm y r0 > 0 la partcula se aleja indefinidamente
del valor rm y nunca retorna. Un analisis similar se puede hacer para la condicion inicial r0 < rm .
Figura 10.7: (a) Grafica del potencial efectivo correspondiente a una fuerza restauradora lineal para momento
angular nulo. (b) Graficas de potencial centrfugo, potencial real y potencial efectivo para una fuerza restaura-
dora lineal con momento angular no nulo.
Otro caso interesante es el de una fuerza restauradora lineal (oscilador armonico isotropico)
1
f = kr ; V = kr 2
2
para momento angular cero, correspondiente a movimiento a lo largo de una lnea recta, Vef f = V y la situacion
es como la que se ilustra en la Fig. 10.7a. Para cualquier valor positivo de la energa el movimiento esta acotado
y como se sabe, es armonico simple. Si l 6= 0, surge un potencial centrfugo y las caractersticas del movimiento
se ilustran en la Fig. 10.7b. El movimiento es siempre acotado para todas las energas fsicamente posibles y
no pasa por el centro de fuerzas. En este caso particular es facil ver que la orbita es elptica, ya que si f = kr,
las componentes x, y de las fuerzas son
fx = kx ; fy = ky
el movimiento consta de la composicion de dos movimientos armonicos simples de la misma frecuencia cada
uno perpendicular al otro. Esto conduce en general a orbitas elpticas.
Un ejemplo bien conocido es el del pendulo esferico de pequenas oscilaciones. Las famosas figuras de
Lissajous se obtienen como la composicion de dos movimientos armonicos simples perpendiculares entre s,
y son cerradas cuando los cocientes entre las frecuencias son numeros racionales. Para dos oscilaciones con
la misma frecuencia, la figura es una lnea recta cuando las oscilaciones estan en fase, un crculo cuando su
diferencia de fase es /2, y una forma elptica en los demas casos. En consecuencia, el movimiento bajo una
fuerza central restauradora lineal nos provee las figuras de Lissajous mas sencillas.
Cuando el potencial efectivo posee un mnimo local, existen valores de la energa para los cuales la orbita
esta acotada en un intervalo [ra , rb ] siendo ra y rb puntos de retorno de r en donde la energa cinetica radial
se anula. Sin embargo, el movimiento estara acotado en este intervalo solo si la posicion inicial es tal que
r0 [ra , rb ]. Aunque la presencia de un mnimo local en el potencial efectivo es una condicion suficiente
para que el movimiento acotado sea posible, el ejemplo de la seccion 10.4.3 muestra que no es una condicion
necesaria. Adicionalmente, el ejemplo del potencial tipo Hooke de la seccion 10.4.4, nos muestra que existen
potenciales (reales) para los cuales el movimiento es siempre acotado sin importar las condiciones iniciales13 .
Los analisis anteriores tambien muestran que para muchos potenciales (reales) el movimiento no acotado
es posible. Para un par de valores fijos de la energa y el momento angular, esto ocurre cuando existe un punto
rb para el cual no hay puntos de retorno a la derecha de rb . Si en este caso las condiciones iniciales son tales
que r (0) > rb y r (0) > 0, la coordenada r crece indefinidamente.
Cuando el potencial efectivo posee un mnimo o un maximo local en un punto r1 , el movimiento circular
es posible si se cumple la condicion E = Vef f (r1 ). Para el caso de un mnimo local se requiere ademas la
condicion14 r (0) = r1 . El movimiento circular tendra radio r1 y sera estable (inestable) si Vef f (r1 ) corresponde
a un mnimo (maximo) local. Para mas detalles, ver seccion 10.7.
Una condicion especial interesante ocurre cuando el momento angular es nulo, lo cual cinematicamente
implica que la velocidad inicial de la partcula es tal que su prolongacion pasa por el centro de fuerzas. En
otras palabras, ocurre cuando la partcula apunta directamente al centro de fuerzas. En este caso la simetra
esferica del potencial implica que la trayectoria debe ser una lnea recta (no hay velocidad inicial transversal
ni aceleracion transversal). En realidad, la velocidad inicial v0 rompe la simetra esferica del potencial y la
reduce a una simetra cilndrica donde el eje de simetra es aquel paralelo a v0 que pasa por el centro de
fuerzas. No obstante, hay un remanente de la simetra esferica si tenemos en cuenta que la direccion de este
eje es arbitraria. Es decir no importa cual sea la direccion de v0 (siempre y cuando la partcula apunte hacia
el centro de fuerzas) vamos a obtener una simetra cilndrica. Podemos expresar esto diciendo que hay una
simetra esferica que nos permite escoger el eje de simetra en direccion arbitraria, pero una vez elegido un
eje especfico, la simetra esferica se rompe reduciendose a una simetra cilndrica alrededor de dicho eje. En
todo caso, los argumentos de simetra nos dicen que el movimiento de la partcula para L = 0 debe realizarse
a lo largo del eje de simetra determinado por v0 y el centro de fuerzas, de modo que la trayectoria debe ser
recta.
No todos los potenciales pueden exhibir los cuatro tipo de orbita. Por ejemplo, el potencial real de Hooke
no puede conducir a orbitas no acotadas para ningun conjunto de condiciones iniciales. Existe un conjunto de
condiciones suficientes (pero no necesarias), para que los cuatro tipos de movimiento sean posibles para un
potencial dado, y son las siguientes: (a) el potencial real decae mas lentamente que 1/r 2 cuando r y (b)
diverge mas lentamente que 1/r 2 cuando r 0. La primera condicion asegura que el potencial real predomina
sobre el termino centrfugo para valores grandes de r, en tanto que la segunda condicion asegura que para
pequenos valores de r predomina el termino centrfugo. En sntesis, estas condiciones nos garantizan que el
potencial en cuestion tendra un comportamiento asintotico similar al del potencial de Kepler V (r) = k/r.
pi = Fi
13
En el caso del potencial de Hooke esto es de esperarse, debido a que se trata de una interaccion que aumenta con la distancia.
14
Puede pensarse que para mnimos locales con E = Vef f (r1 ) la condicion r (0) = r1 es redundante, ya que en cierta vecindad
de r1 , el unico valor permitido para r es precisamente r1 . No obstante, si el mnimo local no es un mnimo absoluto del potencial
efectivo, pueden existir otras regiones permitidas para r.
10.5. EL TEOREMA DEL VIRIAL 229
donde la suma es sobre todas las partculas del sistema. Fi incluye a las fuerzas internas y externas sobre la
partcula i. La derivada total en el tiempo de esta cantidad es
N
X N
X N
X N
X N
X N
X
dG 1
= ri pi + pi ri = mi ri ri + Fi ri = 2 mi vi2 + Fi ri
dt 2
i=1 i=1 i=1 i=1 i=1 i=1
N
X
dG
= 2T + Fi ri
dt
i=1
calculemos ahora el promedio temporal de esta cantidad tomado sobre un intervalo [0, ], lo cual se obtiene
integrando en dicho intervalo y dividiendo por
Z X
1 dG dG
dt = 2T + Fi ri
0 dt dt
i
X 1
2T + Fi ri = [G ( ) G (0)]
i
hay dos situaciones interesantes para las cuales el termino de la derecha se anula. (a) Cuando el movimiento
es periodico de tal modo que todas las coordenadas y velocidades se repiten despues de cierto tiempo, en tal
caso el termino de la derecha se anula si elegimos a como el periodo del movimiento. (b) Las coordenadas y
velocidades de todas las partculas permanecen finitas para todo tiempo, el sistema esta entonces acotado y el
valor de G tambien. En este caso el termino de la derecha tiende a cero para tiempos suficientemente largos.
En cualquiera de estas situaciones se tiene
1X
T = Fi ri (10.41)
2
i
La ecuacion (10.41) se conoce como el teorema del virial, y el lado derecho se conoce como el virial de Clausius.
(e)
Con frecuencia es conveniente separar las fuerzas externas Fi e internas Fij de cada partcula para escribir
cada contribucion en forma separada. Si asumimos que se cumple el principio de accion y reaccion el teorema
queda ( )
1 X (e) X
T = Fi ri + Fij rij (10.42)
2 pares
i
Si las fuerzas son derivables de un potencial, el teorema del virial (10.41) queda de la forma
1X
T = V ri (10.43)
2
i
En el contexto de las fuerzas centrales, examinaremos la informacion que nos da el teorema del virial aplicado
a una sola partcula sujeta a un potencial central. Si usamos una ley de potencial de la forma
V (r) = ar n+1
n+1
T = V (10.44)
2
este mismo resultado se puede obtener aplicando el teorema de Euler Ec. (5.16) para un potencial homogeneo
en r de grado n + 1 (lo cual es mas general). Para el caso particular de una fuerza con ley de inverso al
cuadrado, usamos n = 2 y resulta
1
T = V (10.45)
2
notese que aunque el teorema del virial esta relacionado con promedios temporales, se puede emplear para
una sola partcula o para muchas. Ya vimos que el promedio temporal debe tomarse sobre un periodo si el
movimiento es periodico, o para tiempos muy grandes si el movimiento no es periodico pero es acotado en el
espacio y las velocidades. En el caso de fuerzas centrales, el promedio dado por la Ec. (10.44) solo sera valido
si la orbita es acotada. Si la orbita no es periodica, el promedio se debe tomar sobre un intervalo muy grande
de tiempo, si es periodica se debe tomar sobre el periodo.
El lector interesado puede consultar los detalles por ejemplo en la Ref. [2]. Notese que la contribucion del
termino de fuerzas internas puede ser negativo (positivo) para fuerzas atractivas (repulsivas). En el caso de
un gas ideal, se desprecia la interaccion entre moleculas y solo se considera la interaccion con las paredes, de
modo que todas las fuerzas internas se anulan y la ecuacion de estado queda en la forma
pV = N kT ; gas ideal
Adicionalmente, si la fuerza resultante (para una o mas partculas) es la suma entre fuerzas no friccionales
y fuerzas friccionales proporcionales a la velocidad, entonces el virial solo depende de las primeras, no hay con-
tribucion de las fuerzas friccionales viscosas. No obstante, es necesario que se le inyecte energa al sistema para
mantener el movimiento ya que si las fuerzas viscosas detienen el movimiento todos los promedios temporales
tienden a cero para tiempos suficientemente grandes.
mr 2
dt = d
l
esta ecuacion permitira relacionar la derivada temporal de una funcion arbitraria F con su derivada con
respecto a . Para nuestros propositos nos interesa tambien la segunda derivada
dF dF l dF
= 2 =
dt mr
d mr 2 d
l
10.6. ECUACION DE LA ORBITA Y POTENCIALES INTEGRABLES 231
d2 F d dF d l dF d l dF
= = =
dt2 dt dt dt mr 2 d mr 2
d mr 2 d
l
d2 F l d l dF
=
dt2 mr 2 d mr 2 d
y como F es arbitrario, hemos encontrado una relacion entre las derivadas en y en t
d (. . .) l d (. . .) d2 (. . .) l d l d (. . .)
= ; = (10.46)
dt mr 2 d dt2 mr 2 d mr 2 d
esta ecuacion se puede sustituir bien sea en la Ec. (10.16) o en (10.23). La sustitucion en (10.16) nos da una
ecuacion de segundo orden, en tanto que la sustitucion en (10.23) nos da una ecuacion de primer orden en el
tiempo. Aunque las ecuaciones de segundo orden son en general mas difciles de resolver, aplicaremos primero
la Ec. (10.46) a la Ec. (10.16) ya que esta ecuacion diferencial tambien nos dara un informacion util. Aplicando
las relaciones (10.46) en la Ec. (10.16) se obtiene
l d l dr l2
m 2 = f (r) (10.47)
mr d mr 2 d mr 3
usando la identidad
1 dr d (1/r)
2
=
r d d
en la Ec. (10.47) se obtiene
2 2
l d l d (1/r) l2 1 3 l2 1 d (1/r) l2 1 3
= f (r) + = f (r)
r 2 d m d m r m r d 2 m r
de lo cual se ve conveniente el cambio de variable u = 1/r, resultando
l2 u2 d2 u 1
2
+ u = f (10.48)
m d u
2
d u m 1 d 1
2
+u = 2 2 V (10.49)
d l u dr u
y teniendo en cuenta
d dr d 1 d
= = 2
du du dr u dr
la Ec. (10.49) se puede escribir en funcion del potencial
2
d u m d 1
+u = 2 V (10.50)
d 2 l du u
empleando cualquiera de las Ecs. (10.48, 10.50) podemos hallar la orbita con base en la fuerza o el potencial de
interaccion. Es tambien interesante el caso inverso, es decir dada la orbita (determinada experimentalmente)
encontrar el potencial de interaccion. Por el momento, deseamos demostrar a partir de (10.50) que la orbita es
simetrica respecto a los puntos de retorno del movimiento. Notemos que si la orbita es simetrica sera posible
reflejarla respecto a la direccion del angulo de retorno sin producir ninguna variacion. Si se eligen las coorde-
nadas de tal modo que el punto de retorno corresponda a = 0, la reflexion podra hacerse matematicamente
sustituyendo por . La ecuacion diferencial (10.50) que describe la orbita es evidentemente invariante ante
dicha sustitucion, ya que aparece la segunda derivada en pero no la primera derivada. Veamos ahora si las
condiciones iniciales son tambien invariantes15 , para verlo sera mas util escribir las condiciones iniciales en
15
Hemos visto en la seccion 10.4.5, que las condiciones iniciales pueden romper las simetras del potencial. Similarmente, las
condiciones iniciales pueden romper la simetra de las ecuaciones de movimiento. Podemos expresarlo diciendo que las simetras
dinamicas pueden ser rotas por la cinematica.
232 CAPITULO 10. FUERZAS CENTRALES
Figura 10.8: Construccion de la orbita a partir de una seccion orbital entre dos lneas apsidales (curva 1
contnua). La curva 2 se formo por imagen especular de la curva 1 con respecto al apside r2 en tanto que la
curva 3 se formo por reflexion de la curva 1 con respecto al apside r1 .
Retornaremos ahora a la ecuacion de orbita en la forma (10.29) pero escribiendola de nuevo en terminos
del potencial real V (r) Z r
l dr
0 = r h i
r0 2 l2
mr 2 m E V (r) 2mr 2
la integracion detallada de esta expresion no es en general sencilla. En realidad solo ciertos tipos de potenciales
han sido estudiados en forma detallada. Los mas importantes son los potenciales de la forma
V = kr n+1 (10.53)
la cual es integrable en terminos de funciones sencillas solo en algunos casos. Las soluciones se pueden escribir
en terminos de funciones trigonometricas en los casos en que
n = 1, 2, 3
l2
f (r0 ) = (10.55)
mr03
esto nos dice que la fuerza (real) debe ser atractiva al menos a la distancia r0 , con el fin de lograr una orbita
circular. Adicionalmente, la energa de la partcula se obtiene de las Ecs. (10.30, 10.31) simplemente teniendo
en cuenta que la energa cinetica radial es cero ya que r0 debe ser nulo.
l2
E = Vef f (r0 ) = V (r0 ) + (10.56)
2mr02
las Ecs. (10.55) y (10.56) implican que para toda fuerza central atractiva se puede obtener una orbita circular
de radio arbitrario r0 dado, si el momento angular viene dado por (10.55) y la energa viene dada por (10.56).
Si el potencial efectivo presenta un mnimo local y elevamos la energa ligeramente, la orbita ya no sera circu-
lar pero estara acotada entre dos crculos de radios cercanos al de la orbita original, de modo que la trayectoria
no se desva significativamente de la original (aunque podra dejar de ser cerrada). Tomando la terminologa
del caso unidimensional decimos que esta orbita circular es estable. Por el contrario si estamos en un maximo
234 CAPITULO 10. FUERZAS CENTRALES
Figura 10.9: (a) Para este potencial efectivo el movimiento es acotado para energas alrededor de E. (b) Para
este potencial un ligero aumento en la energa conduce a movimiento no acotado, una ligera disminucion de
la energa conduce a movimiento no acotado si r (t = 0) > r0 .
local, el mas leve aumento (o disminucion) de la energa puede llevar a orbitas totalmente diferentes aunque
podran todava ser acotadas como se ve en la Fig. 10.9a, pero en algunos casos como el de la figura 10.9b el
movimiento se vuelve no acotado. El hecho importante es que un ligero cambio en la energa (y por tanto en
las condiciones iniciales) conduce a trayectorias totalmente distintas por lo cual decimos que la orbita circular
es inestable. Dado que la estabilidad (inestabilidad) esta dictaminada por la condicion de mnimo (maximo),
del potencial efectivo, podemos en consecuencia traducirlo algebraicamente en segunda derivada positiva (ne-
gativa) que corresponde a un perfil concavo hacia arriba (abajo) en el punto donde se encuentra el extremo.
El criterio de estabilidad se escribe entonces como
2 Vef f 2 V 3l2 f 3l2 df 3l2
= + = + > 0 >
r 2 r=r0 r 2 r=r0 mr 4 r=r0 r r=r0 mr04 dr r=r0 mr04
df 3l2
<
dr
r=r0 mr 4 0
como caso particular, si la fuerza esta gobernada por una ley de potencias de r de la forma
f = kr n ; k > 0 (10.59)
ln f = ln (k) + ln r n = ln (k) + n ln r d ln f = n d ln r
d ln f
= n (10.60)
d ln r
10.8. ORBITAS CIRCULARES PERTURBADAS A PRIMER ORDEN 235
notese que la condicion de estabilidad (i.e. de positividad de 2 ) coincide con la condicion de estabilidad dada
por la Ec. (10.58). Con 2 definida positiva y tomando un origen adecuado para , la ecuacion diferencial
(10.65) tendra como solucion
2 r0 df d ln f
x u u0 = a cos ; 3+ =3+ (10.68)
f0 dr r=r0 d ln r r=r0
En resumen, hemos demostrado que para pequenas variaciones con respecto a la condicion de circularidad
estable, la partcula ejecuta un movimiento armonico simple en u ( 1/r) alrededor de u0
u = u0 + a cos (10.69)
donde a es la amplitud del movimiento, la cual depende de la desviacion de la energa con respecto al valor
de esta cuando la orbita es circular, es un valor que surge de la expansion de Taylor de J (u) alrededor de
la orbita circular de radio r0 = u1
0 y esta dado por la Ec. (10.67). Por otro lado, la ecuacion (10.69) muestra
que cuando el radio vector de la partcula ha barrido completamente el plano (i.e. ha barrido un intervalo
entre 0 y 2), u ha ejecutado oscilaciones. Si es un numero racional, de tal forma que = n/m con n
y m enteros, entonces despues de m revoluciones del radio vector la orbita comenzara a repetirse17 , es decir
obtenemos una orbita cerrada a primer orden18 .
Para cada valor de r0 que cumpla la desigualdad (10.57) o (10.58), es posible construr una orbita circular
estable de radio r0 si el momento angular y la energa adquieren los valores prescritos por las Ecs. (10.55,
10.56). La pregunta natural es para que formas funcionales de la fuerza, las orbitas ligeramente perturbadas
con respecto a la circular son cerradas a primer orden?. Es claro que la condicion de que sea racional es
necesaria, pero se requiere un ingrediente adicional: el valor de debe ser el mismo para todos los valores de
r0 para los cuales se pueden construr orbitas circulares estables. De no ser as, puesto que solo puede tomar
valores discretos (por ser racional), el numero de periodos de oscilacion cambiara discontnuamente con r0 , y
las orbitas no podran ser cerradas en la discontinuidad. Con 2 constante para todo el rango de r0 , podemos
sin ambiguedad quitar la evaluacion en r0 de la expresion de la derecha en la Ec. (10.67)
r df d ln f
2 = 3 + =3+ (10.70)
f dr d ln r
con lo cual resulta una ecuacion diferencial para f en terminos de la variable r, siempre que tengamos en cuenta
que solo es valida en el rango de r en donde las orbitas circulares estables son posibles. Tenemos entonces
d ln f dF
= 2 3
d ln r dr
17
Naturalmente, para obtener el mnimo de revoluciones necesarias para repetir la orbita, se requiere que n y m sean primos
entre s.
18
Esta orbita tal vez no es exactamente cerrada ya que aqu solo estamos en aproximacion de primer orden, en seguida veremos
un criterio para tener orbitas exactamente cerradas.
10.9. ORBITAS CIRCULARES PERTURBADAS Y CONDIC. PARA ORBITAS CERRADAS 237
ahora tendremos en cuenta que C es una constante que en general puede ser compleja. Definiremos entonces
C ln (k) con lo cual queda
2
ln f = ln r 3 + ln (k)
h 2
i
ln f = ln kr 3
de aqu resulta
2 3
f (r) = kr ; k>0 (10.71)
donde la condicion k > 0 proviene del hecho ya discutido de que la condicion de circularidad requiere de una
fuerza atractiva como se ve en la Ec. (10.55). Todas las leyes de fuerza de la forma (10.71) con racional,
conducen a ecuaciones de orbitas que son cerradas a primer orden, es decir cuando las condiciones iniciales solo
difieren ligeramente de aquellas que conducen a una orbita circular. Aparecen dentro del espectro de fuerzas
permitidas las leyes de fuerza mas familares: ley del inverso cuadrado ( = 1) y ley de Hooke ( = 2). Tambien
aparecen por supuesto un infinito espectro de otras leyes de fuerza.
Theorem 6 Las unicas fuerzas centrales (atractivas) que producen orbitas cerradas para toda trayectoria
acotada de una partcula, son la ley del inverso cuadrado y la ley de Hooke.
Este resultado es muy notable ya que las apreciaciones astronomicas muestran que muchos cuerpos celestes
se mueven en orbitas cerradas al menos a primer orden. Esto nos conduce a leyes de la forma (10.71). Sin
embargo, si pensamos que la orbita debe ser cerrada cuando solo interactuan dos cuerpos y las pequenas
desviaciones se atribuyen a la interaccion con otros cuerpos quedamos con solo dos leyes posibles. La ley
de Hooke es descartable ya que implicara que la interaccion aumenta con la distancia haciendo imposible
despreciar la interaccion con muchos cuerpos. Nos queda entonces que la ley de gravitacion debe ser de la
forma 1/r 2 .
En el formalismo de Hamilton Jacobi vimos una forma alterna de ver el movimiento orbital cerrado: El
movimiento orbital en el plano se puede ver como la composicion de dos movimientos oscilatorios periodicos
uno en r y el otro en . En el caso de la ley inverso cuadrado y de Hooke, ambos movimientos tienen el mismo
periodo y tenemos entonces una degeneracion que como vimos, tiene una fuerte relacion con la naturaleza del
potencial.
Un comentario final, el teorema de Bertrand no prohibe la existencia de orbitas cerradas para otras leyes de
fuerzas. Lo que el teorema prohibe para otras leyes de fuerzas es que toda trayectoria acotada sea cerrada, pero
238 CAPITULO 10. FUERZAS CENTRALES
es posible que ciertas trayectorias acotadas con condiciones iniciales muy especficas nos lleven a trayectorias
cerradas. De hecho hemos demostrado que toda fuerza central atractiva puede generar orbitas circulares para
cualquier valor del radio del crculo, siempre que los valores de E y l se ajusten de una manera muy especfica.
dado que las oscilaciones alrededor del movimiento circular son pequenas, podemos definir
r = r0 + ; << r0
y el Hamiltoniano queda
1 2 1 2 1 d2 Vef f (r0 )
H = pr + Vef f (r0 + ) pr + Vef f (r0 ) + (r r0 )2
2m 2m 2 dr 2
1 2 1
H = E pr + Vef f (r0 ) + 2 k (10.73)
2m 2
las pequenas oscilaciones se dan cuando la energa es apenas un poco mayor al valor del mnimo del potencial
efectivo. Podemos entonces definir el pequeno valor de energa dado por
L L
pr = = = p (10.75)
r
lo cual es equivalente a redefinir el Hamiltoniano con un corrimiento constante, que claramente no afecta a la
Fsica del problema. Este es el Hamiltoniano de un oscilador armonico para la variable . Comparandolo con
el Hamiltoniano (9.109), con q resulta
1 k
p2 + m2 2 2 ; 2
2m m
Por tanto, podemos utilizar la Ec. (9.111) para escribir
J
=
2
con lo cual la frecuencia esta dada por (9.112)
r
H 1 k
= = = = (10.76)
J J 2 2 m
y el movimiento esta descrito por las Ecs. (9.115) con la asignacion q .
r r
J mJ
r = r0 + sin 2w ; pr = cos 2w
m
se deja como ejercicio al lector escribir la frecuencia de pequenas oscilaciones radiales (10.76) en terminos de
las condiciones iniciales, y comprobar que coincide con la obtenida en las Ecs. (10.68).
1. Todo planeta se mueve con una trayectoria elptica, en uno de cuyos focos se encuentra el Sol
2. El radio vector que une el Sol y el planeta recorre areas iguales en tiempos iguales
3. El cociente k entre el cubo de la distancia r del sol al planeta y el cuadrado del periodo de revolucion T
del planeta
r3
k= 2 (10.77)
T
es identico para todos los planetas.
Tomaremos por simplicidad una trayectoria circular (elipse con distancia focal cero) con rapidez constante.
El movimiento lunar es un buen ejemplo de esta trayectoria, la fuerza centrpeta es de la siguiente forma
v2
F = mac = m (10.78)
r
como la velocidad tangencial constante es de la forma
2r
v= (10.79)
T
entonces
m 4 2 r 2 4 2 mr
F = = (10.80)
rT 2 T2
19
Este problema inverso se conoce usualmente como problema de dispersion o scattering como veremos mas adelante.
240 CAPITULO 10. FUERZAS CENTRALES
siendo T un periodo lunar. Aplicando estos valores a las Ecs. (10.78, 10.79) se tiene
v2 4 2 r g
ac = = 2,72 103 m/s2 (60)2
r T2 ac
en tanto que los cocientes entre r 2 y R2 son
2
3,84 108
= 3634 (60)2
(6,37 106 )2
de modo que la igualdad (10.82) esta sustentada por los valores experimentales. Este analisis le da consistencia
a la ley del inverso al cuadrado.
mk
usando el cambio de variable y = u l2 , la ecuacion diferencial queda
d2 y
+y =0 (10.84)
d 2
cuya solucion mas general se puede escribir de la forma
mk
y = B cos u = B cos
l2
mk
u = 2
+ B cos
l
donde B y son las constantes de integracion. Escribiendo la solucion en funcion de r
1 mk l2
= 2 1 + cos ; B (10.85)
r l mk
Otra alternativa consiste en hacer las asignaciones n 2 y k k en las ecuaciones (10.53, 10.54) 20
Z
du
= q (10.86)
2mE 2mku 2
l2 + l2 u
tomaremos la integral como indefinida y a cambio absorbe las constantes de integracion que surjan, de modo
que no necesariamente coincide con el valor inicial de . Puesto que absorbe a la constante 0 y a los
lmites de integracion en la ecuacion (10.54) se sigue que dependera tanto de 0 como de r0 .
La integral indefinida tiene la estructura siguiente
Z
du 1 + 2u
p = arc cos ; q 2 4 (10.87)
+ u + u2 q
20
Aunque este camino es mas largo, tiene la ventaja de que la constante queda directamente en terminos de la energa y el
momento angular
242 CAPITULO 10. FUERZAS CENTRALES
Cuadro 10.1: Tipos de conicas que se obtienen con diferentes valores de la excentricidad. La segunda columna
nos da el valor de la energa para el cual se obtienen estas conicas. El momento angular se asume diferente de
cero.
y resolviendo para u 1/r la ecuacion de la trayectoria queda
r
l2 u l2 u
mk 1 2El2
cos = q 1+ cos = 1
1 + 2El
2 mk2 mk
mk 2
r " r #
l2 u 2El2 mk 2El 2
= 1+ 1+ cos u= 2 1+ 1+ cos
mk mk2 l mk2
" r #
1 mk 2El2
= 2 1+ 1+ cos (10.89)
r l mk2
se puede ver que esta ecuacion coincide con (10.85) excepto que aparece en (10.89) como funcion de E y l
tal como se anticipo. La Ec. (10.89) nos permite identificar a como uno de los angulos correspondientes a la
inversion del movimiento de la orbita, ya que si tomamos = 0 vemos que esta ecuacion queda invariante ante
la transformacion especular . Esto nos indica segun la discusion de la seccion 10.6 que = corresponde
al lugar geometrico de un apside, de hecho la Ec. (10.89) nos indica que es un periapside, puesto que para =
la coordenada r adquiere su valor mnimo. Notemos que de las cuatro constantes de integracion solo aparecen
tres (E, l, ), esto se debe a que la cuarta constante (0 o r0 ) ubica la posicion inicial de la partcula, la cual
es claramente irrelevante en la ecuacion de la orbita21 . Sin embargo, esta cuarta constante debera aparecer
cuando se solucione el problema de r y en funcion del tiempo. En particular, si queremos resolver la primera
integral de movimiento asociada a la conservacion del momento angular Ec. (10.13), tenemos que conocer el
valor inicial de i.e. 0 .
lnea recta, que corresponde al caso en el cual la velocidad inicial es tal que la partcula apunta directamente
al centro de fuerzas. La clasificacion anterior coincide con la clasificacion general de trayectorias acotadas y no
acotadas que se hizo en la seccion 10.4.1, basados en el analisis de la curva de energa potencial efectiva. Notese
que siempre que garanticemos que l 6= 0, el tipo de conica solo depende de la energa, aunque la trayectoria
detallada depende de E y l. Adicionalmente, si la trayectoria es abierta y la posicion inicial de la partcula no
esta en el infinito22 , la partcula solo recorrera una porcion de la seccion conica (parabola o hiperbola).
1 V V
E =T +V = V +V = =
2 2 2
por lo tanto
k
E= (10.91)
2r0
pero recordando la condicion de circularidad (10.55), que equivale a la anulacion de la fuerza efectiva podemos
escribir
k l2 l2
f (r0 ) = 2 = 3 r0 = (10.92)
r0 mr0 mk
que al reemplazar en (10.91) resulta
mk2
E= (10.93)
2l2
esta expresion coincide con la que se obtendra haciendo = 0 (condicion de circularidad) en la Ec. (10.90).
Un breve calculo nos muestra que esta expresion tambien coincide con la que se obtuvo en (10.56) para la
condicion de circularidad con un potencial central arbitrario. Partiendo de (10.93) y usando (10.92) se tiene
que
mk2 mk2 mk l2 mk 2 k l2 l2
E = 2 + 2 = k 2 + = + = V (r0 ) +
l 2l l 2m l2 r0 2mr02 2mr02
que coincide con (10.56).
1 k l2
E = V (ri ) + mv2 = + ; i = 1, 2
2 ri 2mri2
por tanto, las distancias apsidales corresponden a las races de la siguiente ecuacion
l2 k
E 2 + = 0
2mri ri
k l2
ri2 + ri = 0
E 2mE
22
Si la partcula esta inicialmente en el infinito (que en la practica significa muy lejos), aun es posible que la velocidad inicial
lo aleje aun mas del centro de fuerza.
244 CAPITULO 10. FUERZAS CENTRALES
en una ecuacion cuadratica, la suma de las races es el cociente entre el coeficiente del termino lineal sobre el
coeficiente del termino cuadratico cambiado de signo. Por lo tanto el semieje mayor viene dado por
r1 + r2 k
a= = (10.94)
2 2E
y el semieje mayor solo depende de la energa como se anticipo. En el lmite de circularidad la Ec. (10.94)
coincide con (10.91). Despejando la energa en (10.94) y reemplazando en (10.90), se obtiene la excentricidad
de la elipse en funcion del semieje mayor r
l2
= 1 (10.95)
mka
la cual se puede despejar en la forma
l2
= a 1 2 (10.96)
mk
con lo cual la ecuacion de la orbita (10.85) cuando esta es elptica se puede reescribir en la forma
a 1 2
r= (10.97)
1 + cos ( )
de la Ec. (10.97) se encuentra que las dos distancias apsidales (correspondientes a igual a cero y ) son
iguales a
r1 = rmn = a (1 ) ; r2 = rmax = a (1 + )
lo cual es consistente con las propiedades de la elipse.
sin embargo, la expresion (10.99) tiene la desventaja de requerir la integracion previa de (10.98) y la inversion
de la relacion obtenida para encontrar r (t). Por esta razon, es mas facil encontrar la relacion entre y el
tiempo usando la Ec. (10.13) de conservacion del momento angular.
d mr 2
mr 2 =l dt = d (10.100)
dt l
combinando esta ecuacion con la ecuacion de orbita (10.85) resulta
h 2 i2
l 1
m mk 1+ cos( ) ml4 d
dt = d dt =
l lm2 k2 [1 + cos ( )]2
Z
l3 d
t t0 = (10.101)
mk2 0 [1 + cos ( )]2
aunque esta integral se puede escribir en forma cerrada, la forma funcional es muy compleja y su inversion
para obtener las coordenadas en funcion del tiempo es un problema colosal.
10.13. MOVIMIENTO EN EL TIEMPO EN EL PROBLEMA DE KEPLER 245
aun la inversion de esta ecuacion implica resolver una cubica para tan (/2), para luego hallar el arcotangente
respectivo. La distancia radial en ese instante se encuentra mediante la ecuacion orbital.
r = a (1 cos ) (10.103)
al comparar con la Ec. (10.97) para la orbita, queda claro que tambien cubre el intervalo entre 0 y 2 cuando
recorre una revolucion completa, ademas = 0 en el perihelio al igual que (por convenio), as mismo en
el afelio = = . A partir de las Ecs. (10.94, 10.95) podemos expresar a E y l en funcion de a, , y k
k l2
E= ; 2 = 1 l2 = mka 1 2
2a mka
estos reemplazos tienen la ventaja de que a y son variables mas geometricas y por tanto mas observables
astronomicamente. Reemplazando estas expresiones en la Ec. (10.98) para movimiento elptico resulta
Z r Z r
dr dr
t = r = r
r0 2 k k mka(12 ) r0 2k r2 a(12 )
m 2a + r 2mr 2 mr 2 2a + r 2
r Z r
m r dr
t = q (10.104)
2k r0 2)
r2
r 2a a(1
2
primero podemos observar que esta ecuacion nos permite obtener una expresion para el periodo del movi-
miento elptico, si extendemos la integral a todo el dominio de entre 0 y 2
r
3/2 m
= 2a (10.106)
k
t = sin ; (t = 0) = 0 (10.107)
esta relacion es conocida como ecuacion de Kepler. La cantidad t barre el dominio entre 0 y 2 junto con y
, en el curso de una revolucion completa, razon por la cual tambien se le llama una anomala, mas exactamente
anomala media.
Para hallar la posicion en la orbita en un tiempo t, se debera en primer lugar invertir la ecuacion de
Kepler (10.107) de tal manera que se obtiene la anomala excentrica en funcion del tiempo. Esta ultima se
reemplaza entonces en (10.103) que es la ecuacion que define la anomala excentrica, con ello obtenemos r (t).
Por otro lado, el angulo polar se puede expresar en funcion de por comparacion de (10.103) con la ecuacion
de la orbita elptica (10.97), donde nuevamente por convencion tomaremos = 0, que equivale a que = 0 en
el perihelio y por tanto en t = 0.
a 1 2 1 2
= a (1 cos ) 1 + cos =
1 + cos 1 cos
1 2 1 2
1 (1 cos ) ( + cos )
cos = = =
(1 cos ) (1 cos ) (1 cos )
cos
cos = (10.108)
1 cos
10.13. MOVIMIENTO EN EL TIEMPO EN EL PROBLEMA DE KEPLER 247
4 2 m 3
2 = a (10.110)
k
este resultado tambien se puede obtener a traves de las propiedades de la elipse. Ya hemos visto que la
conservacion del momento angular conduce a que la velocidad aerolar es constante y viene dada por la Ec.
(10.15)
dA 1 l
= r 2 =
dt 2 2m
si integramos sobre un periodo completo, se obtiene el area total, la cual para una elipse viene dada por ab,
siendo b el semieje menor. Z
dA l
dt = AT = = ab (10.111)
0 dt 2m
el semieje menor viene dado por p
b = a 1 2 (10.112)
y combinando (10.112) con la relacion (10.95) nos permite escribir el semieje menor en la forma
r
a
b=l (10.113)
mk
248 CAPITULO 10. FUERZAS CENTRALES
en consistencia con (10.110). Estas expresiones coinciden con la tercera ley de Kepler, la cual se puede enunciar
de la siguiente manera: los cuadrados de los periodos de los distintos planetas son proporcionales a los cubos
de sus ejes (o semi-ejes) mayores.
Kepler enuncio ademas que la constante de proporcionalidad es la misma para todos los planetas. No
obstante, esta ultima afirmacion es solo aproximadamente cierta. Para verlo, recordemos que el movimiento
de un planeta alrededor del sol, es un problema de dos cuerpos y la masa que aparece aqu equivale a la masa
reducida del sistema
m1 m2
=
m1 + m2
por convencion tomaremos a m1 como la masa de un planeta y a m2 como la masa del sol. La fuerza gravitatoria
de atraccion se escribe
Gm1 m2 k
f = = 2 ; k Gm1 m2
r2 r
y la Ec. (10.110) queda de la forma
2 m m
2 4 2 3 4 m11+m22 3
= a = a
k Gm1 m2
4 2 a3 4 2 a3
2 = = (10.114)
G (m1 + m2 ) Gm2
notese que la constante de proporcionalidad es diferente para cada planeta, pero si despreciamos la masa
m1 del planeta con respecto a la masa m2 del sol, la constante sera la misma para todos los planetas. En las
orbitas del atomo de Bohr esta constante de proporcionalidad es la misma, ya que todos los electrones poseen
la misma masa y carga (es decir igual valor de la masa reducida y de k).
1 d 1 d
r r = (r r) = (rr) = r r
2 dt 2 dt
o visto de otra forma
r r = rur r = rur (vr ur + v u ) = rvr = r r
10.14. VECTOR DE LAPLACE-RUNGE-LENZ 249
de modo que
mf (r) 2
2 rr r
p L = r (r r) r r = mf (r) [rr r r] = mf (r) r
r r2 r
Teniendo en cuenta esta identidad y el hecho de que L es constante, se tiene que
d r rr d r
(p L) = p L = mf (r) r 2 2 = mf (r) r 2
dt r r dt r
d dur
(p L) = mf (r) r 2 (10.117)
dt dt
hasta aqu podemos llegar para una expresion general de la fuerza central. Ahora tomando una fuerza atractiva
proporcional al inverso al cuadrado de la distancia f (r) = k/r 2 , la integracion resulta inmediata, ya que la
Ec. (10.117) se convierte en
d k dur d d
(p L) = m 2 r 2 = (mkur ) (p L mkur ) = 0
dt r dt dt dt
que nos dice que en el problema de Kepler hay un vector conservado A definido por
A p L mkur (10.118)
conocido como vector de Laplace-Runge-Lenz (L-R-L). Dado que L = luz , la definicion de A nos muestra que
AL=0 (10.119)
esta ortogonalidad implica que A es un vector fijo que yace en el plano de movimiento. Si llamamos el angulo
que hace r con el vector fijo A, el producto escalar de estos dos vectores sera
r (p L) = L (r p) = l2
o alternativamente
1 mk A
= 2 1+ cos (10.121)
r l mk
vemos entonces que el vector de L-R-L proporciona otra manera de llegar a la ecuacion de la orbita en el
problema de Kepler. Comparando (10.121) con la ecuacion de la orbita en la forma (10.85), se ve que el
modulo de A viene dado por
A = mk (10.122)
de la Ec. (10.121) es claro que = 0 corresponde a la direccion del periapside r ( = 0) = rmn rm .
Recordando ademas que por definicion es el angulo entre A y r (segun la Ec. 10.120), vemos que = 0
indica que A es paralelo a rm . Por tanto, A tiene la direccion del radio vector que corresponde al periapsis o
perihelio de la orbita.
Hemos identificado en consecuencia dos vectores y un escalar que se conservan (L, A, E) para un total
de siete cantidades conservadas. Por otro lado, el sistema requiere de seis constantes de movimiento que
corresponden por ejemplo a las tres componentes de la posicion inicial y a las tres componentes de la velocidad
inicial de la partcula. Notese por otro lado, que todas las constantes que aparecen en el conjunto (L, A, E) son
funciones algebraicas de r y p que describen la orbita en su conjunto (orientacion en el espacio, excentricidad
250 CAPITULO 10. FUERZAS CENTRALES
etc.), ninguna de las siete cantidades se refiere a la localizacion de la partcula en el instante inicial. Como
una de las constantes de movimiento debe referirse a esta informacion, por ejemplo en forma del tiempo de
paso T de la partcula por el perihelio, solo podra haber cinco cantidades de movimiento independientes en
el conjunto (L, A, E) que describan el tamano, forma y orientacion de la orbita. Es necesario entonces que
existan dos relaciones entre las cantidades L, A y E. La primera viene dada por la relacion de ortogonalidad
entre L y A, Ec. (10.119). La otra se deduce de la Ec. (10.122) cuando se escribe la excentricidad en terminos
de E y l, Ec. (10.90) r
2El2
A = mk 1 + A2 = m2 k2 + 2mEl2 (10.123)
mk2
confirmando que solo hay cinco cantidades independientes entre las siete descritas por el conjunto (L, A, E).
Dado que el momento angular y la energa proveen cuatro cantidades independientes, el vector de L-R-L
nos da una mas. Es entonces natural preguntarse si para una fuerza central arbitraria existe una cantidad
conservada analoga al vector de L-R-L que junto con L y E nos sirvan para definir la orbita. Parece ser que
s se pueden construr cantidades de este tipo pero en general no son funciones muy simples del movimiento
(D. M. Fradkin, Progress of Theoretical Physics 37, 798, mayo 1967). Esto se debe a que las constantes de
movimiento relacionadas con la orbita definen la forma funcional r (), pero hemos visto que en general las
fuerzas centrales conducen a orbitas no cerradas, como se ve en el teorema de Bertrand. Es una caracterstica
general de las orbitas no cerradas el hecho de que la curva llegara a pasar por un punto (r, ) arbitrario que
este entre las cotas de los puntos de retorno de r. Podemos verlo heursticamente teniendo en cuenta que si la
orbita no es cerrada, al variar a lo largo de todo un ciclo la partcula no debera recorrer de nuevo sus pasos
sobre ninguna orbita anterior. En consecuencia la orbita es tal que r es funcion multiforme de (modulo 2),
en realidad es una funcion infinitiforme de . En consecuencia, la cantidad conservada adicional a L y a E que
define la orbita, debera contener una funcion infinitiforme del movimiento de la partcula. Solo en el caso de
orbitas cerradas o mas generalmente cuando el movimiento sea degenerado, como en el problema de Kepler,
se puede esperar que la cantidad conservada adicional sea una funcion sencilla de r y p tal como el vector de
L-R-L.
Es interesante ver el aporte geometrico de cada constante de movimiento, dos grados de libertad de L
determinan el plano de movimiento, los valores de E y l determinan el tamano y forma de la elipse23 , finalmente
el vector de L-R-L determina la orientacion de la elipse en el plano de movimiento. Notese que una elipse solo
requiere un parametro angular para ser orientada dentro de un plano, lo cual coincide con el hecho de que el
vector L-R-L solo contribuye con un parametro24 .
A la luz del teorema de Bertrand, es de esperarse que en el caso de una ley de fuerza central tipo Hooke,
encontremos una cantidad conservada semejante al vector de L-R-L, puesto que en este caso las orbitas tambien
son degeneradas. Tal cantidad existe pero la manera mas natural de definirla es con un tensor de segundo rango.
De esta forma la existencia de una constante de movimiento adicional a E, L y relacionada con la orbita que
sea funcion algebraica simple del movimiento, es suficiente para indicar que el movimiento es degenerado y
que las orbitas acotadas son cerradas.
qi , qi para las tres coordenadas generalizadas), para resolver completamente la dinamica. Ya hemos observado
que para el problema de fuerzas centrales es mas conveniente tomar las seis constantes de modo que cinco
de ellas sean funciones de las coordenadas y momentos que describen la orbita en el espacio y solo la ultima
se refiere a la posicion de la partcula en la orbita en un instante dado (ver seccion 10.14). Para el caso de
la orbita elptica, las cinco constantes que determinan la orbita se pueden tomar de la siguiente forma: dos
constantes tpicamente angulares determinan la orientacion del plano de movimiento, un parametro para la
escala de la elipse (por ejemplo el semieje mayor), otro para la forma de la elipse (digamos la excentricidad
o el eje menor), y finalmente un parametro que especifique la orientacion de la elipse dentro del plano de la
orbita.
Veamos de forma especfica la manera de determinar la orbita con cinco parametros de esta naturaleza y
un sexto parametro que me introduce la dependencia temporal. La Fig. 10.10, muestra un sistema xyz donde
el origen se eligio en el centro de fuerzas, de modo que el plano de movimiento pasa por dicho origen. En el
proceso de determinacion de la orbita seguiremos los siguientes pasos: (a) determinacion del plano de la orbita,
(b) determinacion de la escala y forma de la elipse, (c) determinacion de la orientacion de la elipse en el plano
de movimiento y el sentido en que la partcula recorre la elipse. Estos pasos nos determinan completamente la
orbita, de modo que para determinar la dinamica completa solo se necesita un paso adicional (d) determinacion
de la dependencia de la posicion de la partcula en la orbita con el parametro tiempo.
Para realizar el paso (a), observemos que el vector unitario n especifica el plano de movimiento, podramos
en consecuencia pensar en utilizar los angulos que definen a este vector unitario como los parametros que
definen la orientacion de este plano. Resulta no obstante, mas practico definir la direccion de este plano en la
forma siguiente: La interseccion del plano xy con el plano orbital se llama lnea de nodos. Si determinamos
la direccion de la lnea de nodos, lo que nos falta para determinar el plano orbital es el angulo diedro entre el
plano xy y el plano de movimiento. Para determinar la direccion de la lnea de nodos, notemos que en dicha
lnea hay dos puntos que corresponden a la interseccion de la orbita elptica con el plano xy. El punto en el
cual la partcula pasa del hemisferio inferior o hemisferio sur (z < 0) al hemisferio superior o hemisferio norte
(z > 0) se denomina nodo ascendente. La parte punteada de la orbita en la Fig. 10.10 corresponde a la
porcion que esta en el hemisferio sur. La recta ON es un segmento de la lnea de nodos que va del origen al
nodo ascendente. La direccion de ON en el plano xy (y por tanto la direccion de la lnea de nodos) puede
determinarse con el angulo que este segmento hace con el eje x conocido como longitud del nodo ascendente
252 CAPITULO 10. FUERZAS CENTRALES
y denotado por . Una vez determinada la direccion de la lnea nodal a traves de , vemos facilmente que el
angulo diedro entre el plano de movimiento y el plano xy corresponde justamente a i i.e. el angulo entre n y
el eje z que usualmente se denomina inclinacion de la orbita.
El paso (b) se realiza de manera inmediata si conocemos dos de los siguientes tres parametros: semieje me-
nor, semieje mayor y excentricidad. Usualmente se toman los dos ultimos, de modo que tpicamente obtenemos
la escala de la elipse con el semieje mayor y la forma de esta con la excentricidad.
Ahora para el paso (c) determinamos la orientacion de la elipse en el plano de movimiento. Es natural
tomar como referente la orientacion del periapside, la cual se puede obtener a traves del angulo N OC siendo
C el punto de la orbita que corresponde al periapside, este angulo se denota por y se denomina argumento
del perihelio (incluso para orbitas no relacionadas con el sol). Este es el angulo entre la lnea nodal (con su
sentido determinado por el nodo ascendente), y la lnea del periapside. Notese que la determinacion del nodo
ascendente ya nos determina el sentido en el cual la partcula recorre la elipse.
Finalmente, para el paso (d) de determinar la dependencia de la posicion de la partcula con el parametro
tiempo, podemos determinar por ejemplo la posicion angular inicial de la partcula, digamos con respecto al
periapside. Sin embargo, un parametro mas utilizado es el tiempo T para el cual la partcula pasa por el
periapside. Es decir el tiempo que le toma a la partcula en ir desde su posicion inicial en t = 0 hasta el
periapside.
En sntesis, la dinamica completa de movimiento se determina con los siguientes parametros
i , , a, , , T (10.124)
los dos primeros parametros definen la orientacion del plano por medio de la orientacion de la lnea de nodos
(), y el angulo diedro i entre el plano orbital y el plano xy. El semieje mayor a define la escala de la
elipse, y la excentricidad define la forma de esta. El angulo determina la direccion de la elipse en el plano
de movimiento tomando como referente la lnea del periapside. El sentido del movimiento lo determina la
localizacion del nodo ascendente (que a su vez se usa para definir ). Finalmente, el parametro T define la
dependencia de la posicion de la partcula en la orbita en funcion del tiempo.
En la seccion 9.12 vimos la reduccion a cuadraturas del problema de Kepler con el formalismo de variables
accion-angulo, comenzando con un problema tridimensional en coordenadas esfericas. Para entonces solo nos
interesaba indicar la solucion formal. En esta seccion nos ocuparemos de mostrar algunos detalles adicionales
que se pueden observar para el problema de Kepler en variables accion-angulo, aprovechando ademas el co-
nocimiento adicional que hemos obtenido en este captulo. En particular usaremos desde el principio el hecho
de que el movimiento corresponde a una orbita bidimensional cerrada, y que la frecuencia es completamente
degenerada.
En primer lugar, cuando utilizamos coordenadas esfericas o polares planas como coordenadas generalizadas,
la transformacion de coordenadas cartesianas a las generalizadas no depende explcitamente del tiempo, por
consiguiente la energa cinetica en estas coordenadas solo depende cuadraticamente de qi (ver seccion 2.3.1)
i.e. T = T2 . Por otro lado, para una partcula sometida a una fuerza central, el Lagrangiano y el Hamitoniano
en coordenadas esfericas o en coordenadas polares planas poseen las siguientes propiedades estructurales
L = T V = L2 + L0 ; L2 = T , L0 = V
H pi qi L = T + V pi qi (T V ) = T + V
pi qi = 2T = 2L2
por tanto, la energa cinetica se puede expresar en coordenadas esfericas (r, , ) o en coordenadas polares
10.16. PROBLEMA DE KEPLER EN VARIABLES ACCION-ANGULO REVISADO (OPCIONAL) 253
2T = pr r + p + p = pr r + p (10.125)
y dado que las frecuencias de y son iguales, y varian en 2 cuando realiza un ciclo completo de
libracion, de modo que las integrales se simplifican en la forma
J = 2 (l p ) = 2 ( ) (10.126)
donde hemos tenido en cuenta que coincide con el momento conjugado a , en tanto que corresponde
al modulo del momento angular, segun las Ecs. (9.76, 9.79)26 . La Ec. (10.126) concuerda con la Ec. (9.166).
La variable J es inmediata dado el caracter cclico de
J = 2 = 2p (10.127)
la cual es independiente de la forma explcita de las variables accion-angulo originales. La completa degeneracion
de las frecuencias de r, , implica que el Hamiltoniano es funcion de un solo Ji como se ve en las Ecs. (9.181,
9.182), aqu omitiremos la notacion primada de estas ecuaciones. La dependencia de H con este J unico se
puede obtener de (10.125). Para verlo, aplicamos el teorema del virial al problema de Kepler Ec. (10.45)
V = 2T (10.128)
H = E = T + V = T (10.129)
integrando la Ec. (10.125) en el tiempo sobre un periodo (degenerado y denotado por 3 ) se tiene que
Z I I I
3 3
2 T dt = pr r dt + p dt + p dt
3 0
I I I
23 T = pr dr + p d + p d
2T
= Jr + J + J = J3 (10.130)
v3
25
Notese que en tanto el movimiento este confinado a un plano y el origen pase por dicho plano, la coordenada r de distancia al
origen es igual en coordenadas esfericas, que en las coordenadas polares asociadas a dicho plano.
26
Recordemos que y surgen como constantes de integracion (ver Sec. 9.6.2, Pag. 184).
254 CAPITULO 10. FUERZAS CENTRALES
donde v3 es la frecuencia degenerada del movimiento. Combinando las Ecs. (10.129, 10.130) y teniendo en
cuenta (9.128) resulta
dH 2 1 dH
2H = J3 v3 = J3 =
dJ3 J3 H dJ3
esta ecuacion diferencial tiene solucion inmediata
D
H= (10.131)
J32
donde D es una constante que no puede contener ningun J y por tanto solo depende de m y k. Podemos
calcular D usando una trayectoria circular de radio r0 para la cual Jr = 0 (ya que pr = mr = 0), y por tanto
J3 = Jr + J + J = J + J = 2 (l ) + 2
J3 = 2l (10.132)
V V
H =T +V = +V =
2 2
y dado que en el movimiento circular el potencial es constante, tenemos
k
H=E= (10.133)
2r0
Para potenciales keplerianos la condicion de circularidad descrita por la Ec. (10.55) se puede escribir en la
forma
k l2 J32
= = (10.134)
r02 mr03 4 2 mr03
donde hemos tenido en cuenta la Ec. (10.132). Despejando r0 en esta ecuacion tenemos
J32
r0 = (10.135)
4 2 mk
sustituyendo (10.135) en (10.133) obtenemos H en funcion de J3
k k 4 2 mk
H = =
2r0 2 J32
2 2 mk2
H = E= (10.136)
J32
aunque esta relacion la hemos encontrado para orbitas circulares, la Ec. (10.131) nos dice que tambien debe
ser valida para cualquier orbita cerrada kepleriana, ya que el Hamiltoniano es una cantidad dinamica (no
cinematica), y por tanto es independiente de las condiciones iniciales. Esta relacion coincide ademas con (9.182).
Vemos que hemos evaluado H (J) sin calcular las integrales circuitales, usando la degeneracion completa de las
frecuencias de movimiento. Esto significa una simplificacion importante, ya que la realizacion de las integrales
circuitales es considerablemente extensa como vimos en la seccion 9.12.
J1 , J2 , J3 , en tanto que las otras dos constantes estaran asociadas a w1 y w2 ya que sus frecuencias correspon-
dientes son nulas27 . En consecuencia, debe ser posible relacionar las cinco primeras constantes en (10.124) con
las cinco constantes J1 , J2 , J3 , w1 , w2 generadas por las variables accion-angulo (la variable temporal se deja
intacta). Combinando las Ecs. (9.181, 10.126, 10.127) se observa que28
J2 = J + J = 2 ( ) + 2
J2 = 2 2l (10.137)
k J2
a= = 23 (10.139)
2E 4 mk
la ecuacion (10.95) para la excentricidad se puede escribir en funcion de J2 y J3 usando (10.137) y (10.139)
r r s 2
l2 J22 J22 4 mk
= 1 = 1 2 = 1 2
mka 4 mka 4 mk J32
s 2
J2
= 1 (10.140)
J3
Las Ecs. (10.138, 10.139, 10.140) conectan las variables orbitales (i , a, ) con las variables de accion
(J1 , J2 , J3 ).
Falta la identificacion de w1 y w2 con los elementos clasicos de orbita (10.124). Es claro que w1 y w2 deben
contener a y las cuales no estan contenidas en los J s. Veremos que para una eleccion adecuada de las
constantes de integracion aditivas w1 y w2 seran proporcionales a y .
Veamos el caso de w1 , la ecuacion (9.154) define a w1 en terminos de la funcion generatriz W
W
w1 = (10.141)
J1
podemos utilizar la Ec. (9.16) para escribir
Z Z Z
W = p d + p d + pr dr (10.142)
debemos recordar que en (9.16) las integrales eran indefinidas. Para poder usar (10.141), debemos escribir W
en terminos de (J1 , J2 , J3 ). De acuerdo con (10.142), esto equivale a encontrar p , p , pr en terminos de los Ji .
La Ec. (9.168), Pag. 209 nos da una expresion para pr
s
W 2mk (J + J )2
pr = = 2mE + (10.143)
r r 4 2 r 2
27
Esto se puede ver derivando temporalmente las ecuaciones (9.180), y teniendo en cuenta la degeneracion en las frecuencias de
r, , .
28
Debe tenerse en cuenta que la relacion (10.132) solo es valida para movimiento circular en tanto que la relacion (10.137) es
valida para todas las trayectorias elpticas (en particular las circulares). En general, J2 y J3 son momentos canonicos independientes.
Alternativamente, se puede ver que para el movimiento circular Jr = 0, con lo cual J2 = J + J = J + J + Jr = J3 .
256 CAPITULO 10. FUERZAS CENTRALES
Figura 10.11: Variables angulares para el posicionamiento de la orbita que aparecen en el problema de Kepler,
cuando se usa el formalismo de variables accion angulo.
u aplicando trigonometra esferica al triangulo esferico definido por la lnea de nodos, el radio vector y la
proyeccion del radio vector sobre el plano xy. Resulta mas simple sin embargo, realizar algunas manipulaciones
con la trigonometra plana. En la Fig. 10.11 la recta que contiene al segmento OA es la misma recta que contiene
al segmento ON de la Fig. 10.10, y por tanto define la lnea de nodos, OR es colineal con el radio vector de
posicion en un instante dado y OP es paralelo a la proyeccion del radio vector sobre el plano xy. Definiremos a
como el angulo azimutal i.e. entre el eje x y la proyeccion OP . Vamos a demostrar que u es el angulo entre
la proyeccion del radio vector y la lnea de nodos i.e. entre OP y OA. Para ello imaginemos un plano normal
al plano xy y a la lnea de nodos y que corte al radio vector a una distancia del origen O igual a la unidad.
Este plano corta a las rectas OA, OR y OP en los puntos A, B y C respectivamente. Los puntos A, B y C
junto con el origen O, definen cuatro triangulos rectangulos OAC, OCB, OAB y ACB donde el vertice en
angulo recto esta definido por la letra de la mitad29 . De los triangulos OCB y ACB vemos que
BC AC
cos = = BC ; cot i =
OB BC
AC = cos cot i (10.151)
29
Aunque los segmentos ON y OA de las figuras 10.10, 10.11 son paralelos, vale decir que el punto N (definido por el nodo
ascendente), es en general diferente al punto A (definido por la interseccion de una recta con un plano), de modo que la longitud
de estos segmentos es en general distinta.
258 CAPITULO 10. FUERZAS CENTRALES
donde hemos tenido en cuenta que OB tiene longitud unidad por construccion. Por otro lado, los triangulos
OCB y OAC nos dicen que
OC AC AC
sin = = OC ; sin u = =
OB OC sin
AC = sin sin u (10.152)
que coincide con la Ec. (10.149) con lo cual vemos que u en dicha ecuacion es el angulo indicado en la Fig.
10.11. Es claro tambien de dicha figura y de la definicion de en la Fig. 10.10, que u = de lo cual se
obtiene
2w1 = (10.153)
un procedimiento similar se puede realizar para encontrar la interpretacion fsica de w2 . De las integrales que
aparecen en (10.142), las correspondientes a y r contienen a J2 y por tanto intervienen en el calculo de
w2 . A partir de w2 = W/J2 se puede calcular la integral asociada a con una sustitucion trigonometrica
similar a la utilizada para calcular w1 . La integral asociada a r se puede calcular de varias formas, la mas
directa es usando la ecuacion de la orbita que da r en terminos del angulo polar en el plano orbital. Eligiendo
adecuadamente el lmite inferior de integracion que es arbitrario se puede encontrar que 2w2 esta dado por la
diferencia entre dos angulos que estan en el plano de la orbita, uno de ellos es el angulo entre el radio vector y
la lnea de nodos y el otro es el angulo entre el radio vector y la lnea del periapside (ver Figs. 10.10 y 10.11),
con lo cual se obtiene
2w2 = (10.154)
donde es el argumento del perihelio como se aprecia en la Fig. 10.10.
Si bien el metodo de las variables accion-angulo no es el mas ventajoso para trabajar el problema de Kepler,
veremos que las variables accion-angulo constituyen una parametrizacion muy adecuada para el tratamiento
de la teora canonica de perturbaciones en el problema de Kepler. En el lenguaje de la mecanica celeste, a
la variables accion-angulo en el problema de Kepler se les conoce como variables de Delauney, si bien en
algunas convenciones las variables de Delauney difieren de las accion-angulo por constantes multiplicativas.
10.17. Ejercicios
1. A partir de la expresion (10.41) para el teorema del virial obtenga la expresion (10.42), teniendo en
cuenta la ley de accion y reaccion y el hecho de que la fuerza resultante sobre la iesima partcula se
escribe como X
(e)
Fi = Fi + Fij
j6=i
(e)
siendo Fi la fuerza externa neta y siendo Fij la fuerza interna que la partcula j hace sobre la partcula
i del sistema de partculas.
encuentre los valores de r para los cuales es posible una orbita circular estable. Repita el ejercicio para
2
f (r) = kr 3 ear .
3. Escriba la frecuencia de pequenas oscilaciones radiales (10.76) en terminos de las condiciones iniciales, y
compruebe que coincide con la obtenida en las Ecs. (10.68). Sugerencia: Utilice la Ec. (10.72).
10.17. EJERCICIOS 259
4. Con base en la Ec. (10.114), evalue el valor de la constante de proporcionalidad que relaciona el cuadrado
del periodo con el cubo del semi-eje mayor, para cada planeta del sistema solar. Evalue la desviacion
porcentual maxima que se presenta entre estas constantes.
6. Obtenga la relacion entre w2 y las variables orbitales descrita por la ecuacion (10.154), con un procedi-
miento similar al realizado para obtener la Ec. (10.153).
Captulo 11
Colisiones y dispersion
Vamos a analizar el problema de dos partculas que interactuan de alguna manera, pero que estan aisla-
das del resto del universo. En algunos casos es suficiente asumir que las dos partculas chocan o entran en
contacto directo entre s, lo cual implcitamente significa que las dos partculas se pueden aproximar indefi-
nidamente una a la otra. En este caso hablamos de una colision entre las dos partculas. Cuando estudiamos
el comportamiento de partculas macroscopicas, esta constituye una buena aproximacion y sera el primer caso
que trataremos.
Sin embargo, debe tenerse en cuenta que las interacciones son funciones de la distancia, y la fuerza usual-
mente adquiere un valor singular para distancia cero. Este hecho resulta de particular importancia en la Fsica
atomica y subatomica dado que en estos escenarios la distancia mnima de aproximacion entre dos partculas
es de un orden de magnitud similar al tamano mismo de las partculas. Cuando tenemos en cuenta que existe
una fuerza a distancia entre las partculas (por ejemplo una interaccion electrica) entonces el proceso no se
interpreta como un contacto directo entre tales partculas sino como la interaccion de estas ultimas a una dis-
tancia muy corta. En este caso hablamos de una dispersion (tambien suele usarse el anglicismo scattering).
Usualmente, el experimento se prepara de manera que inicialmente las dos partculas esten muy alejadas entre
s de manera que se puede despreciar la interaccion entre ellas en el instante inicial (y por tanto, la energa
potencial). Se lanzan entonces las dos partculas de masas m1 y m2 con velocidades v1 y v2 respectivamente.
Las dos partculas se acercan entonces e interactuan entre s para luego dispersarse de modo que el producto
saliente son dos partculas de masas m1 y m2 con velocidades v1 y v2 respectivamente. Observese que hemos
supuesto que en los productos finales tanto las velocidades como las masas pueden haber cambiado, incluso
el numero de partculas salientes podra ser diferente del numero de partculas entrantes. Por ejemplo, vere-
mos mas adelante que en las reacciones de captura entran dos partculas y sale solo una, la explosion de una
granada se puede ver como un fenomeno de colision ya que solo intervienen fuerzas internas; en este caso el
estado inicial es de una partcula y el estado final podra ser de muchas. Generalmente, en el experimento
se miden los estados finales cuando las partculas han vuelto a alejarse lo suficiente como para despreciar de
nuevo la interaccion entre ellas. Estos estados final e inicial en que las partculas estan muy alejadas entre s,
se conocen como estados asintoticos inicial y final respectivamente, son entonces estos valores asintoticos los
que usualmente interesan en un experimento de dispersion.
Es de anotar sin embargo, que los terminos colision y dispersion suelen usarse indistintamente. Es as como
es comun utilizar el termino colisiones atomicas en lugar de dispersiones atomicas.
260
11.1. COLISIONES Y DISPERSIONES GENERALES 261
entonces:
p1 + p2 = p1 + p2
m1 v1 + m2 v2 = m1 v1 + m2 v2 (11.1)
y si suponemos que la interaccion entre las dos partculas es conservativa, se tiene que el principio de conser-
vacion de la energa se puede escribir como:
1 2 1 2 (m1 v1 )2 (m2 v2 )2
T = m1 v1 + m2 v2 = +
2 2 2m1 2m2
p21 p2
T = + 2 (11.4)
2m1 2m2
ahora bien, las colisiones se pueden clasificar de acuerdo al valor del factor Q. Si Q = 0 se dice que la colision
es elastica ya que se conserva la energa cinetica en el proceso. Si Q < 0 se dice que la colision es inelastica de
primera clase o endoergica, este ultimo nombre se debe al hecho de que Q < 0 indica que la energa cinetica
ha disminudo en el proceso, de manera que la energa potencial aumenta (y por tanto la energa interna).
Finalmente, si Q > 0 tenemos una colision inelastica de segunda clase o exoergica.
De lo anterior se concluye que el factor Q nos da informacion acerca de la naturaleza de las interacciones
internas entre las partculas. Teniendo en cuenta (11.3) y (11.4) podemos escribir:
p2
1 p2
2 p21 p22
+ =Q (11.5)
2m1 2m2 2m1 2m2
si el factor Q es conocido, la Ec. (11.5) junto con el principio de conservacion del momento lineal, resuelven
completamente el problema de la colision entre dos partculas, siempre y cuando sus estados finales no sean
de mas de dos partculas. Es decir, dados los momentos iniciales podemos predecir el valor de los momentos
finales. Sin embargo, el factor Q no puede obtenerse de primeros principios, ya que depende en general de las
intrincadas interacciones microscopicas que suceden durante la colision. Por tanto, es usual determinar Q en
forma experimental.
Un hecho importante es que el factor Q as definido es independiente del observador. Para el caso de
partculas con interaccion central a distancia, esto es inmediato si tomamos en cuenta que la energa potencial
262 CAPITULO 11. COLISIONES Y DISPERSION
para una fuerza central es independiente del observador, ya que solo depende de la magnitud de la coordenada
relativa entre las partculas, y como Q = V (r) V (r) se concluye que Q es independiente del observador.
Para interacciones de contacto es necesario probar que la diferencia de energa cinetica final e inicial es la
misma para cualquier observador. El factor Q viene dado por:
1 1 1 1
Q = T T = m1 v12 + m2 v22 m1 v12 m2 v22
2 2 2 2
ahora bien, el factor Q medido por el centro de masa se obtiene teniendo en cuenta que la energa cinetica
en el laboratorio y en el centro de masa se relacionan como en la Ec. (1.32), Pag. 131 . Con lo cual se puede
escribir:
1
2 1 2
QCM = TCM TCM = T m1 + m2 vCM T (m1 + m2 ) vCM
2 2
1 2 1 2 1 2 1 1 1
= m v + m2 v2 m1 + m2 vCM m1 v12 m2 v22 + (m1 + m2 ) vCM
2
2 1 1 2 2 2 2 2
donde hemos tenido en cuenta que la velocidad del centro de masa es la misma antes y despues de la colision,
ya que el sistema es aislado. Adicionalmente, puesto que m1 + m2 = m1 + m2 = M se concluye que:
1 2 1 2 1 1
TCM TCM = m1 v1 + m2 v2 m1 v12 m2 v22 = T T
2 2 2 2
Q = QCM
Q = T T = TCM
TCM
y dado que el laboratorio es cualquier sistema inercial, esto prueba la invariancia de Q con respecto al sistema
de referencia inercial que lo mide. Veremos a continuacion, que la descripcion de la colision vista por el centro
de masa es mucho mas sencilla que vista desde el laboratorio. Con respecto al centro de masa, el momento
lineal total del sistema es cero de modo que:
si suponemos que la colision es elastica y que ademas la masa reducida no cambia en el proceso, se tiene que
Q = 0, = de modo que
p2
1,CM p21,CM 2
= y p2
1,CM = p1,CM (colision elastica con = ) (11.8)
2 2
es decir no hay intercambio de energa cinetica entre las partculas2 , y los momentos no cambian de magnitud.
No obstante, s hay intercambio de momento ya que aunque no vara la magnitud de los momentos, su direccion
puede variar en el proceso.
2 2
1 2 1 m1 v1 + m2 v2 1 m1 v1 + m2 v2
T = M vCM = M = (m1 + m2 )
2 2 m1 + m2 2 m1 + m2
1 (m1 v1 + m2 v2 )2
T =
2 m1 + m2
y el factor Q es entonces:
1 (m1 v1 + m2 v2 )2 1 1
Q = T T = m1 v12 m2 v22
2 m1 + m2 2 2
" #
1 m1 v1 + m2 v2 + 2m1 m2 v1 v2 m1 (m1 + m2 ) v12 m2 (m1 + m2 ) v22
2 2 2 2
=
2 m1 + m2
1 2m1 m2 v1 v2 m1 m2 v12 m1 m2 v22 1 m1 m2
= = (v2 v1 )2
2 m1 + m2 2 (m1 + m2 )
1
Q = v2 ; v v2 v1
2
es mas inmediato el calculo desde el centro de masa ya que en tal caso TCM = 0 puesto que la partcula final
sale con la velocidad del centro de masa y estara en reposo respecto a este ultimo. Luego Q queda:
Q = TCM TCM
1
Q = TCM = v2 (11.9)
2
donde hemos usado la Ec. (10.6), Pag. 215 vista desde el centro de masa. Es decir, en el caso de una reaccion
de captura, el factor Q es igual a menos la energa cinetica del sistema inicial vista por el centro de masa.
considerarse como el proyectil, y la partcula 2 como el blanco, el principio de conservacion de la energa nos
dice que:
p1 + p2 = p1 p2 = p1 p1
2
p2 = p1 p1 = p21 + p2 2 2
2 1 2p1 p1 = p1 + p1 2 kp1 k p1 cos
p2
2 = p21 + p2
1 2p1 p1 cos (11.10)
donde es el angulo entre los vectores p1 y p1 , es decir el angulo con que se dispersa la partcula 1. El factor
Q viene dado por:
p2
1 p2 p2
Q= + 2 1 (11.11)
2m1 2m2 2m1
p2
1 p21 + p2
1 2p1 p1 cos p21
Q = +
2m1 2m2 2m1
2
2
p1 1 1 p1 1 1 p1 p1
Q = + + cos
2 m1 m2 2 m2 m1 m2
r
p2 p2
2
4m1 m1 2m11 2m1
p2
1 m p m 1 1
Q = 1 + 1 + 1 1 cos
2m1 m2 2m1 m2 m2
p
m m1 2 m1 m1 T1 T1
Q= T1 1 + 1 T1 1 cos (11.12)
m2 m2 m2
la cual se conoce como ecuacion Q y expresa dicho factor para el caso de un blanco inicialmente en reposo.
Example 7 Una granada inicialmente en reposo explota en dos fragmentos m1 y m2 , hallar la energa cinetica
final en terminos de Q.
Como la granada esta inicialmente en reposo, entonces p1 = 0 y por conservacion del momentum p1 + p2 =
0, con lo cual p2 2
1 = p2 por tanto la energa cinetica final es:
p2
1 1 1 p2
1
T = + =
2 m1 m2 2
p2
Q = T T = T = 1
2
p
p1
=
p2
= 2 Q
11.2. DISPERSION EN UN CAMPO DE FUERZAS CENTRALES 265
de lo cual queda:
p21 2 Q m1 m2 Q
T1 = = =
2m1 2m1 m1 (m1 + m2 )
m2 Q
T1 =
(m1 + m2 )
p22 p21 2 Q
T2 = = =
2m2 2m2 2m2
m1 Q
T2 =
(m1 + m2 )
T = T1 + T2 = Q
El haz incidente se caracteriza a traves de su intensidad, es decir, numero de partculas por unidad de
area por unidad de tiempo que atraviesan una superficie normal a la direccion de propagacion del haz (a esta
cantidad tambien se le conoce con el nombre de densidad de flujo). Debido al cambio de direccion del haz
cuando ha pasado por el centro de fuerzas, diremos que el haz se ha dispersado o desviado como se puede ver
en la Fig. 11.1. Una cantidad fsicamente util para estudiar el fenomeno de la dispersion es la seccion eficaz de
dispersion en un direccion dada (denotada por () d)
() d = () sin d d (11.14)
Si la fuerza es central debe haber una simetra total con respecto al eje del haz incidente, lo cual nos conduce
a que la seccion eficaz diferencial debe ser independiente del angulo azimutal (i.e. el angulo de rotacion
alrededor del eje de simetra). Por esta razon se puede hacer una integracion parcial del angulo solido. Como
no depende de es decir posee simetra azimuthal, tenemos que la integracion en se puede realizar para
obtener
Z 2
() d = () sin d d () d = () sin d d
0
() d = 2 () sin d (11.15)
d = 2 sin d (11.16)
es el angulo que hacen la direccion desviada e incidente y se denomina angulo de dispersion. El termino
seccion eficaz se debe a que () tiene dimensiones de area. Cuando tenemos una fuerza central y por tanto
simetra azimutal, podemos trabajar con el angulo solido d dado por (11.16) que corresponde al anillo
sombreado sobre la superficie esferica en la Fig. (11.1), en lugar del angulo solido d = sin d d. De
aqu en adelante, volveremos a la notacion d sobreentendiendo que nos referimos al angulo solido dado en
(11.16).
Es importante mencionar que lo que se puede medir experimentalmente es la integral de la Ec. (11.14) o
de la Ec. (11.15) sobre una cierta porcion finita de angulo solido, ya que en la realidad solo podemos calcular
angulos de dispersion y contar las partculas que se dispersan dentro de cierto rango finito de esos angulos de
dispersion.
Tomaremos el origen de nuestro sistema coordenado en el centro dispersor, el eje X ira paralelo a la
velocidad del haz incidente y en el mismo sentido del haz. El angulo de una determinada posicion r se mide
con respecto al eje X positivo de modo que para las partculas incidentes (cuando t ) se tiene que
r y = . Para una partcula dada, asumiendo que conocemos su plano de movimiento3 y teniendo
en cuenta que su posicion inicial esta dada por r y = , veremos que las constantes de la orbita y
por tanto la dispersion, estan determinadas por la energa y el modulo del momento angular E y l. Conviene
expresar el momento angular en funcion de la energa y de una cantidad s denominada parametro de impacto
que es la distancia entre las rectas paralelas a la velocidad del proyectil, que pasan por el proyectil y el centro
de fuerza respectivamente (ver Fig. 11.1). Si v0 es la rapidez incidente de la partcula se tiene que
s
1
l = rp sin ( ) = r sin mv0 = mv0 s = s 2m 2
mv0 = s 2mE (11.17)
2
3
La determinacion del plano de movimiento implica el conocimiento de la variable azimutal .
11.2. DISPERSION EN UN CAMPO DE FUERZAS CENTRALES 267
donde es el angulo entre el vector posicion incidente y la lnea paralela a la direccion de incidencia que pasa
por el centro dispersor (i.e. el angulo entre el vector posicion de la partcula incidente y el eje X negativo)4 .
En esta expresion hemos tenido en cuenta que la partcula incidente esta muy lejos del centro de fuerza, de
modo que su energa es puramente cinetica. Una vez fijados E y s queda determinado unvocamente el angulo
de dispersion 5 . Las partculas cuyo parametro de impacto esta entre s y s + ds deben cruzar la superficie
del anillo con radio interno s y radio externo s + ds ilustrado en la Fig. 11.1, el area de este anillo es 2s |ds|.
Ahora bien, el numero de partculas por unidad de tiempo que pasan por dicho anillo es igual a la intensidad
incidente I multiplicada por el area del anillo es decir
dN
= 2Is |ds| (11.18)
dt anillo ds
por otro lado, el numero de partculas por unidad de tiempo que se dispersan en el angulo solido d (determi-
nado por la region sombreada sobre la superficie esferica en la Fig 11.1)6 se puede calcular teniendo en cuenta
la definicion (11.13), de la cual se ve que corresponde simplemente a I () d, teniendo en cuenta (11.15)
el numero de partculas por unidad de tiempo que se dispersa en un angulo solido d es
dN
= 2 () I sin |d| (11.19)
dt angulo solido d
Supondremos de momento que partculas con diferente parametro de impacto no pueden llegar al mismo angulo
de dispersion. En tal caso, el numero de partculas dispersadas por el angulo solido d comprendido entre y
+ d debera ser igual al numero de partculas incidentes con parametro de impacto comprendido entre los
valores s y s + ds. Por tanto en este caso las cantidades definidas en (11.18, 11.19) son iguales y se obtiene
los valores absolutos se introducen para asegurar que el numero de partculas sea positivo, ya que a menudo s
y varan en sentidos opuestos. Si consideramos a s como funcion de la energa y el angulo de dispersion
s = s (, E) (11.21)
y despejando () en (11.20), la dependencia entre la seccion eficaz diferencial y vendra dada por
s ds
() = (11.22)
sin d
a partir de la ecuacion de orbita general (10.51a) se puede obtener directamente una expresion formal para el
angulo de dispersion. Consideraremos por simplicidad una fuerza totalmente repulsiva. Teniendo en cuenta que
la orbita debe ser simetrica respecto a la direccion del periapside (recordemos que la orbita es simetrica ante
reflexion con respecto a las apsides, ver discusion de la Ec. 10.50), el angulo del periapside con la direccion
incidente es igual al angulo entre el periapside y la direccion de dispersion (ver Fig. 11.2). En consecuencia, el
angulo de dispersion viene dado por
= 2 (11.23)
El angulo se puede obtener de (10.51a) tomando el lmite r0 cuando 0 (direccion incidente).
4
Dado que la partcula incidente esta muy lejos, es muy pequeno. Sin embargo, r sin es claramente finito e igual al parametro
de impacto.
5
En este punto la mecanica cuantica s difiere de la clasica ya que en la primera no se pueden definir trayectorias sino probabi-
lidades de desviacion en distintas direcciones.
6
Es importante observar que la partcula no necesariamente tiene que cruzar por el anillo sombreado sobre la esfera. Lo que
define este anillo es el espacio angular por donde debe pasar la partcula. En la Fig. 11.1, la trayectoria dibujada no pasa por el
lugar geometrico en el que se dibujo el anillo, pero el angulo de deflexion de esta partcula esta dentro del intervalo angular que
define el anillo, cuando dicho angulo se mide desde el origen.
268 CAPITULO 11. COLISIONES Y DISPERSION
Figura 11.2: Ilustracion del angulo entre la direccion incidente y la lnea del periapside para una dispersion
central repulsiva. La simetra de reflexion conduce a que este angulo coincide con el formado por la direccion
de dispersion y el periapside.
Por otro lado, es claro que = cuando r = rm distancia de mayor acercamiento7 . Integrando la orbita
(10.51a) desde la posicion incidente hasta el periapside con estas consideraciones se tiene
Z rm
dr
= q +
r2 2mE 2mV 1
l2
l2
r2
quedando finalmente Z
dr
= q (11.24)
2mE 2mV 1
rm r2 l2 l2 r2
de aqu se puede encontrar una expresion formal para calcular reemplazando (11.25) en (11.23)
Z
s dr
(s) = 2 r h i (11.26)
rm
r r 2 1 V E(r) s2
quedando finalmente Z um
s du
(s) = 2 q (11.27)
0 V (1/u)
1 E s2 u2
Sin embargo, cuando se dispone de una funcion analtica para la orbita, es frecuente que se pueda encontrar
a en funcion de s por simple inspeccion. En consecuencia, las Ecs. (11.26, 11.27) se usan muy poco para
calculos analticos, y usualmente se emplean para el calculo numerico del angulo de dispersion.
ZZ e2
f (r) = ur
r2
es decir una fuerza repulsiva de la forma k/r 2 . Los resultados obtenidos para el problema de Kepler se pueden
usar teniendo en cuenta que k = ZZ e2 en la Ec. (10.83)
Ya que la energa potencial es positiva, la energa total E tambien lo es, y la orbita sera una hiperbola con
excentricidad dada por la Ec. (10.90)
s s
2El2 2Es 2
= 1+ = 1+ >1 (11.28)
m (ZZ e2 )2 ZZ e2
donde hemos tenido en cuenta la Ec. (11.17). Tomemos = en (10.85) y escribamos la ecuacion de la orbita
1 mk m ZZ e2
= 2 [1 + cos ( )] = [1 cos ]
r l l2
y la ecuacion de la orbita queda
1 mZZ e2
= ( cos 1) (11.29)
r l2
vemos que al tomar = en (10.85), el periapside correspondera a = 0. Por otro lado, la Ec. (11.29)
requiere que cos 1 sea no negativo, el hecho de que > 1 garantiza que existen valores de para los cuales
se cumple esta condicion. No obstante, tal condicion excluye ciertos valores de . Adicionalmente, dado que
el periapside esta definiendo el angulo cero, la direccion de la asntota de incidencia (o dispersion) queda
determinada por el valor de en el lmite r en (11.29)
1
cos = (11.30)
notese que los valores permitidos de yacen justamente en el intervalo [, ] como se puede observar de la
Fig. 11.2 o teniendo en cuenta que si reemplazamos cos = cos () = 1/ en (11.29) se anula el termino de
8
Se define e como la carga negativa del electron de modo que Ze se refiere a una carga positiva. Z se refiere al numero atomico.
270 CAPITULO 11. COLISIONES Y DISPERSION
1
0< = sin 1
2
de modo que
0< cot 0 (11.34)
2 2 2
con lo cual la Ec. (11.33) queda de la forma
2Es
cot = (11.35)
2 ZZ e2
despejando s en esta ecuacion, se obtiene la relacion funcional entre el parametro de impacto y el angulo de
dispersion
ZZ e2
s= cot (11.36)
2E 2
que es una relacion de la forma (11.21) con la cual es posible calcular () por medio de la Ec. (11.22).
Reemplazando (11.36) en (11.22) se encuentra que () es
ZZ e2 1 d ZZ e2
() = cot cot
2E 2 sin d 2E 2
" 2
#
ZZ e2 1 1
2
() = cot
csc
2E 2
2 sin 2 cos 2 2 2
2 2
1 ZZ e2 cos 2 csc2 2 1 ZZ e2 csc2 2
() = =
4 2E sin 2 sin 2 cos 2 4 2E sin2 2
finalmente 2
1 ZZ e2
() = csc4 (11.37)
4 2E 2
La Ec. (11.37) corresponde a la llamada dispersion de Rutherford quien la dedujo para la dispersion de
partculas por nucleos atomicos. Es notable el hecho de que en mecanica cuantica en el lmite no relativista,
la seccion eficaz coincide con este resultado clasico.
el ultimo paso solo se puede realizar si hay simetra azimutal, lo cual efectivamente ocurre si la fuerza es
central. Sin embargo si intentamos calcular la seccion eficaz total para la dispersion coulombiana de Rutherford,
sustituyendo (11.37) en (11.38) obtenemos un resultado divergente. Es facil ver la razon por la cual esto es as,
la seccion eficaz total es el numero de partculas que por unidad de intensidad incidente se dispersan en todas
direcciones. Ocurre que la interaccion coulombiana es de alcance infinito, las desviaciones muy pequenas solo
tienen lugar para partculas con parametro de impacto muy grande. Por tanto todas las partculas de un haz
incidente de seccion lateral infinita se desviaran en mayor o menor medida y por tanto deben inclurse en la
seccion eficaz total de dispersion. En consecuencia, la infinitud de la seccion eficaz total en mecanica clasica no
es exclusiva del potencial coulombiano y se extiende a todos los potenciales de alcance infinito independiente de
lo grandes que sean9 . Solo si el potencial presenta un corte de modo que se anula mas alla de cierta distancia,
sera finita esta seccion eficaz total. Este es el caso del campo coulombiano de un nucleo, el cual presenta un
corte debido al apantallamiento de la nube electronica.
Figura 11.3: (a) perfil de un potencial repulsivo que permanece finito en el centro de fuerza. (b) Grafica
de vs s para el anterior potencial donde se observa que a cada valor permitido de le corresponde dos
parametros de impacto diferentes (excepto para = m ).
Es muy importante tener presente que la validez de la Ec. (11.22) depende de que las partculas con diferente
parametro de impacto no puedan llegar al mismo angulo de dispersion, ya que de ello depende la validez de
(11.20) y (11.22). En la dispersion de Rutherford, esta condicion se cumple ya que el angulo de dispersion es
una funcion monotona suave (y por tanto uno a uno) del parametro de impacto s. Esto se puede apreciar en
la Ec. (11.36), teniendo en cuenta que esta entre cero y . En la Ec. (11.36) se ve que al disminuir s desde
el infinito hacia cero el angulo crece monotonamente a partir de cero (cuando s es logico que 0
ya que la interaccion tiende a cero), alcanzando el valor de cuando s = 0 lo cual corresponde a colision
frontal con el centro de fuerzas, que naturalmente obliga a la partcula a recular en la direcion contraria a la
incidencia.
No obstante, existen otros potenciales clasicos cuyo comportamiento requiere reevaluar la expresion (11.22),
por ejemplo para un potencial repulsivo como el de la figura 11.3a, tal que el potencial es finito incluso en
r 0 y tal que la energa de la partcula es mayor al potencial para todo valor de r, es facil ver que la curva
de versus s se puede comportar de la forma indicada en la figura 11.3b, la cual no es una funcion uno a uno.
Este comportamiento se puede explicar mediante el siguiente razonamiento fsico: Para parametros de impacto
muy grandes, la partcula permanece todo el tiempo muy lejos del centro de fuerzas de tal modo que su angulo
de dispersion es muy pequeno. Si s = 0 la partcula se dirige en lnea recta directamente al centro de fuerzas
y dado que su energa es superior al maximo valor del potencial, pasara a traves del centro de fuerzas sin
deviarse de su curso (en vez de recular). Por esta razon, el angulo de dispersion se anula en los dos extremos de
s, y dado que 0 , si la grafica es bien comportada es de esperarse que tenga por lo menos un maximo
local M , para algun valor del parametro de impacto. La Fig. 11.3b muestra que para < M existen dos
valores de s que corresponden al mismo angulo de dispersion. Cada uno de ellos contribuye a la seccion eficaz
de dispersion segun un angulo y por tanto la Ec. (11.22) se debe modificar en la forma
X si ds
() = (11.39)
sin d i
i
9
En cuantica, todos los potenciales que tienden a cero a grandes distancias mas rapidamente que 1/r 2 producen un seccion
eficaz total de dispersion finita.
272 CAPITULO 11. COLISIONES Y DISPERSION
donde el subndice i distingue los distintos valores de s que dan el mismo valor de . A manera de ejemplo,
pensemos que la curva de vs s es tal que = 0 en s = 0, y que ademas posee dos maximos locales
1 , 3 (1 > 3 ) y un mnimo local 2 tal que s1 < s2 < s3 . En este caso, hay angulos para los cuales hay
cuatro parametros de impacto asociados (2 < < 3 ), otros tienen dos parametros s asociados (3 < <
1 y < 2 ), cuando = 2 o = 3 hay tres parametros de impacto asociados, y finalmente cuando
= 1 solo hay uno.
Volviendo al caso descrito por la Fig. 11.3b, resulta de especial interes la seccion eficaz correspondiente al
angulo maximo M . Puesto que para este angulo se anula la derivada de con respecto a s, se ve de la Ec.
(11.39) que la seccion eficaz debe diverger cuando M . Pero para todos los angulos con > M , la
seccion eficaz es nula (para el caso de la Fig. 11.3b, solo hay un maximo local de modo que ninguna partcula
se dispersa con una angulo mayor a M ). Este fenomeno de la subida infinita de la seccion eficaz seguida de
una desaparicion brusca, es muy semejante a lo que ocurre en la optica geometrica de la dispersion de la luz
solar por las gotas de lluvia. En virtud de esta semejanza, a este fenomeno se le denomina dispersion en
arco iris.
Cuando el scattering es debido a fuerzas atractivas, pueden surgir otras complicaciones. Por ejemplo, dado
que la partcula es atrada hacia el centro de fuerzas, el angulo entre la direccion incidente y la direccion del
periapsis puede ser mayor que /2, con lo cual a traves de la Ec. (11.23) obtenemos un angulo de dispersion
negativo. Esto no supone mucho problema en virtud de que lo que importa para medir () es el valor absoluto
de . No obstante, el valor absoluto de dicho angulo de acuerdo con la Ec. (11.26) o (11.27), puede ser mayor
que 2, lo cual significa que fsicamente la partcula podra dar una o mas vueltas alrededor del centro de
fuerzas, antes de ser lanzada hacia su direccion asintotica de dispersion.
Figura 11.4: (a) Potenciales efectivos asociados a un potencial intermolecular real tpico, cada valor del parame-
tro de impacto conduce a un potencial efectivo diferente. (b) Grafica del angulo de desviacion en funcion de
s, para el potencial anterior con dos valores diferentes de la energa.
Veamos un ejemplo de como puede ocurrir esto fsicamente. En la grafica 11.4a, se pintan una serie de po-
tenciales efectivos para un potencial intermolecular (real) tpico. Cada curva esta asociada al mismo potencial
real, pero con una barrera centrfuga diferente, lo cual corresponde a un valor distinto del momento angular l
y por tanto tambien del parametro de impacto s. Lo mas caracterstico de esta clase de potenciales intermole-
culares reales es que son atractivos a grandes distancias decayendo a un ritmo mayor a 1/r 2 , y repulsivos con
magnitud de fuerza rapidamente creciente a cortas distancias10 . Dado que a grandes distancias el potencial
real (atractivo) decae mas rapido que 1/r 2 la barrera centrfuga que se forma cuando s 6= 0 dominara a grandes
distancias y para valores pequenos de s se formara un maximo local, a medida que el parametro de impacto
10
Estas son las caractersticas que a grandes rasgos se esperan para que la materia no implosione y al mismo tiempo pueda
formar condensados.
11.2. DISPERSION EN UN CAMPO DE FUERZAS CENTRALES 273
aumenta la curva tiende a aplanarse y para algun valor del parametro de impacto s2 , solo hay un punto de
inflexion en Vef f para cierto valor de la energa E2 . Finalmente, para parametros de impacto aun mayores no
aparecen extremos locales ni puntos de inflexion en el potencial.
Consideremos una partcula con parametro de impacto s1 y energa E1 correspondiente a la energa en el
maximo local. Recordemos que la distancia entre Vef f y E1 es la energa cinetica radial. Por tanto, cuando
la partcula llega a una distancia r1 del centro de fuerzas la velocidad radial se anula. Recordemos ademas
que cuando la energa coincide con un maximo local tenemos una orbita circular inestable. En ausencia de
perturbaciones la partcula de energa E1 y parametro de impacto s1 quedara realizando una orbita circular
de radio r1 de forma indefinida. Si la energa es un poco mayor que E1 la orbita ya no es circular pero su
velocidad radial sera muy pequena en las vecindades de r1 , y la partcula puede permanecer en esta vecindad
un largo tiempo realizando varios giros. En contraste, la velocidad angular no esta afectada por la existencia
de un maximo y para un valor dado de r viene dada por (11.17)
r
l s1 2E
= = 2
mr12 r1 m
por tanto durante el tiempo en el que la partcula atraviesa la region del maximo, su velocidad angular
vendra dada aproximadamente por este valor y puede hacer que dicha partcula ejecute varios giros. En tales
casos, se dice que la dispersion clasica exhibe una orbitalizacion o espiralacion.
Claramente para energas mayores que E2 (en donde se presenta el punto de inflexion para un s2 dado),
no es posible un movimiento orbital. All se puede presentar no obstante otro fenomeno interesante, y es
que la combinacion de componentes atractivas y repulsivas del potencial efectivo puede incluso conducir a
deflexion nula para algun valor finito del parametro de impacto. Por otro lado, a valores grandes de energa
con pequenos parametros de impacto, los efectos de dispersion dominantes corresponden a repulsion fuerte a
cortas distancias, y el scattering se asemeja cualitativamente a la dispersion de Rutherford11 .
Dado que la partcula se puede deflectar en un angulo mayor a , pero el angulo medido en el laboratorio
esta entre 0 y , es util en este caso diferenciar el angulo de deflexion , que es el que se calcula con las
expresiones de la derecha en las Ecs. (11.26) o (11.27) y el angulo de dispersion que se observa . Para un
dado el valor se calcula con la expresion
= 2m , m entero positivo
el signo y el valor de m se escogen para que quede en el rango entre 0 y . La suma expresada por (11.39)
cubre entonces todos los valores de que conducen al mismo . En la Fig. 11.4b, se hace una grafica de
vs s para el potencial de la figura 11.4a, para dos energas diferentes. La orbitacion que se produce en
E = E1 se muestra como una singularidad en la curva en s = s1 ya que el sistema da infinitas vueltas12 . Para
E > E2 no hay orbitacion pero hay un efecto arco iris en = (aunque la seccion eficaz no se anula para
angulos mayores, sino menores a ). Notese que se anula (y por tanto tambien ) para s = s3 lo cual
significa a partir de (11.22) que la seccion eficaz se vuelve infinita en la direccion adelante debido a que el
factor sin = sin se anula13 . Similarmente, la seccion eficaz puede diverger en la direccion hacia atras (i.e.
para = ) si ocurre que
ds
s
d
permanece finito en = . Estos infinitos en la dispersion adelante atras se conocen como dispersion gloria,
de nuevo por su analogo al correspondiente fenomeno en optica metereologica. El efecto optico es familiar para
11
Esto es de esperarse ya que a mayor energa con bajo parametro de impacto, la partcula puede penetrar la nube electronica
y acercarse mucho al nucleo. En realidad la dispersion de Rutherford se da gracias a este efecto.
12
Dado que > 0, la Ec. (11.23) muestra que , de modo que solo puede diverger con valores negativos, como se aprecia
en la Fig. 11.4b.
13
El hecho de que exista un parametro de impacto finito y diferente de cero para el cual no hay deflexion, significa que los efectos
de atraccion y repulsion a diversas distancias en que estuvo la partcula, tuvieron un efecto de cancelacion. Sin embargo, esto no
significa que la partcula viajo en lnea recta, pues en la region de dispersion la trayectoria pudo ser muy compleja. De hecho las
lneas rectas que definen las trayectorias inicial y final son paralelas pero no necesariamente coincidentes.
274 CAPITULO 11. COLISIONES Y DISPERSION
los viajeros de avion que pueden ver un anillo de luz que envuelve la sombra del avion proyectada sobre una
nube subyacente.
Aunque las correcciones cuanticas son en general importantes, a veces dichas correcciones son pequenas
como ocurre con la dispersion a bajas energas en retculos cristalinos de iones. Incluso en ocasiones se recurre
a metodos semiclasicos en los cuales es necesario el conocimiento de la orbita clasica.
Figura 11.5: (a) Dispersion de dos partculas vista por el sistema de referencia del laboratorio. (b) Dispersion
de dos partculas vista por el sistema de referencia del centro de masa.
Hasta el momento, hemos supuesto que el centro de fuerzas es fijo y por lo tanto trabajamos el problema
de un cuerpo. En la realidad, lo que tenemos es un cuerpo mucho mas masivo que el otro que en todo caso
debe recular. Por otro lado, podemos estar interesados en la colision de dos partculas con masas similares o
casos en que el blanco es movil. Todo ello conduce al hecho de que el problema de la colision es un problema
de dos cuerpos. Aunque ya hemos demostrado que este problema se puede reducir al problema de un cuerpo
con masa reducida cuando la interaccion es central, no podemos simplemente reemplazar los dos cuerpos por
este cuerpo equivalente. La dificultad radica en que el angulo de dispersion se mide realmente en el laboratorio
y corresponde al angulo entre las direcciones inicial y final de la partcula dispersada en las coordenadas de
laboratorio. Por otro lado, el angulo calculado a partir del problema equivalente de un cuerpo es el angulo
entre las direcciones inicial y final del vector relativo entre las dos partculas en las coordenadas del centro de
masa14 .
En lo que sigue asumiremos que en el instante inicial (t ), uno de los cuerpos esta en reposo. En
este caso, los valores de y solo son iguales si la partcula que estaba en reposo permanece estacionaria
en el proceso. Dado que en la realidad la partcula inicialmente en reposo se pone en movimiento gracias a la
interaccion con el proyectil, los dos angulos seran diferentes como se ve en la figura 11.5a. En consecuencia, el
problema equivalente de un cuerpo no nos da directamente el angulo de dispersion que mide el laboratorio15 .
11.3.1. Relacion entre el angulo de dispersion medido por el laboratorio y el medido por
el centro de masa
Para encontrar la relacion entre y debemos primero examinar como ocurre la dispersion para un
sistema de referencia que se mueve con el centro de masa (que claramente tambien es inercial). En este sistema
14
Estrictamente, es el mismo cuando se mide en el sistema de referencia del laboratorio como se ve en la Fig. 11.5a, en virtud
de que el vector relativo es identico en ambos sistemas de referencia. Esto se puede ver en la Fig. 10.1 de la Pag. 214, la cual
muestra claramente que r2 r1 = r2 r1 = r, y esta relacion es valida para todo tiempo.
15
Recordemos que las trayectorias que hemos obtenido para un cuerpo bajo fuerzas centrales, tampoco son las orbitas que vera
un sistema de referencia inercial, y solo coinciden razonablemente cuando uno de los cuerpos esta casi en reposo y es muy masivo
con respecto al otro.
11.3. DISPERSION VISTA POR EL LABORATORIO Y EL CM (BLANCO EN REPOSO) 275
de referencia el momento total es cero siempre, as que las dos partculas siempre se mueven con momentos
opuestos. Antes de la dispersion las dos partculas se acercan mutuamente y luego de la dispersion se alejan
una de otra.
En la Fig. 10.1 de la Pag. 214, podemos ver que el vector relativo entre las partculas pasa por el centro de
masa, as mismo los vectores r, r1 ,r2 son todos colineales para todo tiempo. Esto significa que desde el punto
de vista del centro de masa, no solo los momentos son antiparalelos sino que las direcciones incidentes de las
dos partculas yacen sobre la misma recta, al igual que las direcciones salientes o reflejadas como se ilustra
en la Fig. 11.5b. De aqu se concluye que los angulos de dispersion de las dos partculas son identicos ya que
son opuestos por el vertice como se ve en la Fig. 11.5b. Por otro lado, vemos que el angulo de dispersion de
ri sera el mismo que el angulo de deflexion de r ya que son colineales todo el tiempo. Por tanto el angulo de
deflexion de las partculas visto por el CM es el angulo que se muestra en la Fig. 11.5a. La dispersion vista
por el centro de masa se ilustra en la Fig. 11.5b.
Ahora bien, la relacion entre y se obtendra entonces haciendo la transformacion entre el sistema centro
de masa y laboratorio. Esta transformacion ya fue considerada en la seccion 10.1. Derivando en el tiempo la
Ec. (10.3) se obtiene
v1 = V + v1 (11.40)
esta relacion es valida para todo tiempo. Por conveniencia, haremos un ligero cambio en la terminologa: r1 , v1
son la posicion y velocidad de la partcula incidente m1 despues de la dispersion en el sistema de laboratorio
(L). r1 , v1 son la posicion y velocidad de la partcula incidente m1 despues de la dispersion en el sistema
del centro de masa (CM). R y V no sufren modificacion en su significado antes y despues de la colision.
cos +
cos = p (11.46)
1 + 2 cos + 2
vemos que las relaciones entre y expresadas en (11.44) y (11.46) involucran el factor que depende de las
rapideces inicial de la partcula 1 vista por (L) y final de la misma partcula pero vista por (CM). Conviene
por tanto, caracterizar adecuadamente a este factor.
teniendo en cuenta que la energa del sistema en el laboratorio es (1/2) m1 v02 se tiene que
1 2 1 2 m2 m2
v = m1 v0 = E
2 0 2 m1 + m2 m1 + m2
y la Ec. (11.49) queda
m1 + m2 Q
v 2 = v02 1 +
m2 E
Por tanto, el cociente entre las rapideces relativas antes y despues del choque se puede escribir como
s
v m1 + m2 Q
= 1+ (11.50)
v0 m2 E
siendo E el valor de la energa de la partcula incidente (en el sistema de laboratorio). Reemplazando (11.50)
en (11.47), se tiene que el factor para dispersion inelastica, vendra dado por
m1
inelast = r (11.51)
Q
m2 1 + m1m+m 2
2
E
Cuando la colision es elastica (Q = 0), la energa cinetica total de las dos partculas permanece inalterada
y el factor de la Ec. (11.51) se simplifica a
m1
elast = (11.52)
m2
y es independiente de las energas y rapideces. El mismo resultado se obtiene haciendo Q = 0 en (11.48) de lo
cual se obtiene v = v0 y reemplazando esta igualdad en (11.47), se obtiene (11.52).
Las Ecs. (11.44, 11.46) muestran que los valores de y son en general diferentes si 6= 0, y la Ec. (11.51)
muestra que esta condicion ocurre para cualquier valor finito de Q.
d (cos ) 1 + cos
=
d (cos ) (1 + 2 cos + 2 )3/2
de lo cual la seccion eficaz () queda finalmente
3/2
1 + 2 cos + 2
() = () (11.53)
1 + cos
es importante enfatizar que () no es la seccion eficaz que medira un observador en el sistema del centro
de masa. Tanto () como () son secciones eficaces medidas en el laboratorio, pero estan expresadas en
termino de coordenadas angulares diferentes. Un observador fijo en el centro de masa vera una densidad de
flujo de partculas incidentes diferente de la que se mide en el sistema de laboratorio y habra que inclur esa
transformacion de la densidad de flujo si por alguna razon quisieramos relacionar las secciones eficaces medidas
en uno y otro sistema.
La relacion entre los dos angulos de dispersion es particularmente simple en el caso en el cual tenemos una
colision elastica donde las partculas tienen masas iguales, en este caso = 1 y segun (11.46) se tiene
r
1 + cos
cos = = cos
2 2
de modo que
= ( = 1) (11.54)
2
en consecuencia, en el caso de dispersion elastica con masas iguales no podra haber angulos de dispersion
mayores que /2 en el sistema de laboratorio; toda la dispersion tiene lugar en el hemisferio de adelante.
Correspondientemente, la seccion eficaz de dispersion vendra dada en funcion de segun la Ec. (11.53) en la
forma
(2 + 2 cos )3/2 23/2 (1 + cos )3/2
() = () = ()
1 + cos "1 + cos
h i 1/2 #
3/2 1/2 3/2 2
= () 2 (1 + cos ) = () 2 2 cos
2
si el choque es elastico, se tiene que = m1 /m2 con lo cual la Ec. (11.56) se puede simplificar en la forma
2
1 2
2 m1 v1 m1 m2 / (m1 + m2 ) 2 2
m2
1 2
= 1 + 2 cos + = 1 + 2 cos + 2
2 m1 v0
m2 (m1 /m2 ) (m1 + m2 )
2
E1 1
= 1 + 2 cos + 2
E0 1+ m 1
m2
quedando finalmente
E1 1 + 2 cos + 2 m1
= , = (choque elastico) (11.57)
E0 (1 + )2 m2
siendo E0 (E1 ) la energa cinetica inicial (final) del proyectil en el sistema de laboratorio. Es facil ver que
(11.57) corresponde a un frenamiento del proyectil incidente i.e. E1 E0
E1 1 + 2 cos + 2 1 + 2 + 2
= =1
E0 (1 + )2 (1 + )2
La relacion se simplifica aun mas si el choque elastico ocurre entre masas iguales i.e. con = 1
E1 1 + cos
= = cos2
E0 2 2
E1
= cos2 (choque elastico con = 1)
E0
donde hemos utilizado (11.54). Por lo tanto, para el angulo de dispersion maximo ( = , = /2), el proyectil
cede toda su energa al blanco y queda detenido, visto por el sistema de referencia del laboratorio.
Esta transferencia de energa cinetica por dispersion es el principio basico utilizado en los reactores de
neutrones termicos. Los neutrones rapidos producidos por fision colisionan elasticamente en forma sucesiva con
un moderador, hasta que su energa cinetica se convierte en energa termica, en cuyo caso es mas posible que
originen fisiones a que sean capturados. A priori, los elementos ligeros deberan ser los mejores moderadores,
idealmente el hidrogeno (con el cual = 1). Sin embargo, por otras razones tecnicas, el hidrogeno solo es
practico en los reactores nucleares cuando es parte de una mezcla o compuesto (como el agua). Se utilizan
mas como moderadores el deuterio y el carbono 12. El hidrogeno que forma parte de la parafina, el agua o los
plasticos s se usa como moderador.
Estos calculos de transformacion del laboratorio al centro de masa y la cesion de energa cinetica se han
realizado en un contexto clasico. Calculos analogos se pueden realizar para choques de contacto tales como
los que ocurren entre bolas de billar (ver Sec. 11.1.2). Lo interesante es que a pesar de su simplicidad estos
calculos son de muy amplio uso ya que usan principios fundamentales como la conservacion del momento
lineal y la energa. Mientras se usen los principios de conservacion y el factor Q, los detalles de la colision
son irrelevantes, en realidad la region de interaccion se considera como una caja negra y lo que medimos
son los estados asintoticos inicial y final. No interesa mucho que los fenomenos ocurridos en esta caja negra
sean cuanticos o clasicos. Como ya mencionamos, las formulas obtenidas en este captulo sirven para analizar
fenomenos de naturaleza cuantica tales como la dispersion neutron proton, siempre que las energas sean lo
suficientemente bajas para ignorar los efectos relativistas.
11.4. Ejercicios
1. Se ha encontrado experimentalmente que en una colision frontal (o central) de dos esferas solidas tales
como dos bolas de billar, las velocidades despues del choque estan relacionadas con las velocidades antes
del choque por la expresion
v1 v2 = e (v1 v2 ) (11.58)
280 CAPITULO 11. COLISIONES Y DISPERSION
donde e es el coeficiente de restitucion y tiene un valor entre cero y uno. Esta relacion fue propuesta
por Newton y tiene validez solamente aproximada. Adicionalmente, se conserva el momento lineal en el
choque. Probar lo siguiente:
v1 (m1 m2 e) + v2 m2 (1 + e)
v1 = (11.59)
m1 + m2
v2 (m2 m1 e) + v1 m1 (1 + e)
v2 = (11.60)
m1 + m2
b) La Q de la colision es:
1 m1 m2
1 e2 (v1 v2 )2 (11.61)
2 m1 + m2
2. En una colision frontal perfectamente inelastica o plastica (reaccion de captura) los dos cuerpos se
mueven juntos despues del choque. (a) Calcule el coeficiente de restitucion e definido en (11.58), para
esta colision. (b) Calcule el valor de Q en terminos del coeficiente de restitucion e.
3. Demostrar que si la energa y el momento lineal se conservan en un choque (choque elastico), las veloci-
dades v1 y v2 antes de la colision, se relacionan con las velocidades v1 y v2 despues de la colision, por
medio de la ecuacion
u v1 v2 = u (v1 v2 )
siendo u un vector unitario en la direccion en la cual el momento lineal de una de las partcula ha
cambiado. Esto implica que en la colision, la componente de la velocidad relativa a lo largo de la direccion
de intercambio de momento lineal ha cambiado de sentido. Aplique el resultado a una colision frontal y
compare el resultado con el obtenido para e = 1 en las ecuaciones (11.59, 11.60).
4. Una granada de masa M va con velocidad v0 cuando esta a una altura h a la cual explota en dos
fragmentos iguales. Inicialmente, los fragmentos se mueven horizontalmente en el sistema de referencia
C. El factor Q de la explosion es Q = M v02 . Determinar los puntos de colision de los fragmentos con el
suelo con relacion al punto donde ocurre la explosion cuando (a) v0 = v0 uy , y (b) Cuando v0 = v0 ux .
5. Demuestre que para una fuerza central repulsiva f = kr 3 , la seccion eficaz diferencial esta dada por
k (1 x) dx
() d = 2 ; x
2E x (2 x) sin x
2
6. Es comun encontrar en los modelos de Fsica Nuclear, pozos rectangulares de potencial definidos por
0 si r>a
V =
V0 si ra
demuestre que la dispersion producida por este potencial en Mecanica Clasica es igual a la refraccion de
rayos luminosos por una esfera de radio a, e ndice relativo de refraccion n dado por
r
E + V0
n=
E
11.4. EJERCICIOS 281
esta equivalencia explica porque los fenomenos de refraccion podan ser explicados tanto por la teora
corpuscular de Newton como por las ondas de Huygens. Demuestre que la seccion eficaz diferencial viene
dada por
n2 a2 n cos 2 1 n cos 2
() = 2
4 cos 2 1 + n2 2n cos 2
y encuentre la seccion eficaz total. Esta clase de analogas entre dispersiones mecanicas y fenomenos
ondulatorios es muy comun en Fsica. De hecho, tambien existen numerosas analogas con ondas cuanticas
de probabilidad.
Captulo 12
Interludio matematico: Matrices, vectores y tensores
cartesianos
En el presente captulo desarrollaremos desde un punto de vista practico el algebra basica de los vectores y
matrices en el espacio cartesiano Rn . Enfatizaremos en la relacion que hay entre matrices y transformaciones
lineales. Se asume cierta familiaridad del lector con el algebra lineal ya que el proposito de este captulo es el de
dar un compendio de propiedades requeridas para los captulos subsiguientes. Debe mencionarse sin embargo,
que ademas de las propiedades matematicas de los vectores y matrices se estudiaran aspectos de un interes
mas fsico como son la interpretacion pasiva y activa de las matrices, la clasificacion de escalares y vectores
por sus propiedades bajo paridad, y la caracterizacion de los tensores cartesianos.
una transformacion de x a otro vector x se denomina una transformacion lineal homogenea1 , si dicha trans-
formacion es de la forma
xi = aij xj ; i, j = 1, . . . , n (12.2)
donde aij son coeficientes constantes y se usa convencion de suma sobre ndices repetidos. Consideremos el
caso de dos transformaciones lineales sucesivas de la forma (12.2). Adicionalmente, definiremos vectores x que
son generales (no necesariamente vectores posicion). Hagamos primero la transformacion de x a x realizada
por el operador B
x = Bx xk = bkj xj (12.3)
x = Ax xi = aik xk (12.4)
1
Una transformacion lineal inhomogenea tiene la forma xi = aij xj + bi , donde las bi son constantes. De aqu en adelante
hablaremos de una transformacion lineal sobreentendiendo que es homogenea, a menos que se indique lo contrario.
282
12.1. PROPIEDADES BASICAS DE LAS MATRICES 283
para obtener la relacion entre xi y las xj se pueden combinar las dos ecuaciones para obtener
x = ABx x = Cx C = AB (12.5)
xi = aik bkj xj xi = cij xj (12.6)
cij aik bkj (12.7)
vemos que podemos definir una nueva transformacion lineal C caracterizada por los elementos cij que forman
un nuevo arreglo matricial que se obtiene de los elementos aik y bkj de A y B con el algoritmo descrito en
(12.7). Esto nos indica que la composicion de transformaciones lineales A y B nos define otra transformacion
lineal C. Es facil ver que el algoritmo (12.7) nos dice que la composicion (multiplicacion) de operadores no
es conmutativa
lo cual se puede comprobar con unos simples casos particulares (ver ejercicio 1, Pag. 335). Esto implica que
el resultado de aplicar dos operadores lineales sucesivos depende en general del orden de aplicacion de tales
operadores. Puede comprobarse sin embargo que esta multiplicacion es asociativa (ver ejercicio 2, Pag. 336)
(AB) C = A (BC)
la operacion descrita por la Ec. (12.2) se puede escribir en arreglo matricial emulando el algoritmo (12.7) en
donde los vectores se escriben como matrices de una columna en la forma de la Ec. (12.1). Por simplicidad,
ilustraremos esta operacion en tres dimensiones
x1 x1 a11 a12 a13
x = Ax ; x x2 ; x x2 ; A a21 a22 a23
x3 x3 a31 a32 a33
x i = (Ax)i xi = aij xj = ai1 x1 + ai2 x2 + ai3 x3 ; i = 1, 2, 3
la suma de dos matrices se define como la matriz que se obtiene al sumar los elementos de cada una, claramente
esta operacion s es conmutativa
(A + B)ij = aij + bij = cij = (C)ij
un proceso importante es la composicion inversa de A que nos lleva de regreso desde x hacia x
x = Ax ; A1 x = x A1 Ax = x (12.8)
A1 A = 1 (12.9)
donde 1 es el operador identidad que deja al vector (o al sistema coordenado) inalterado. Por otro lado,
multiplicando la segunda de las Ecs. (12.8) por A a la izquierda
AA1 x = Ax AA1 x = x
AA1 = 1 (12.10)
A1 A = AA1 = 1 (12.11)
284 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
designemos a los elementos de la inversa como aij . La segunda de las Ecs. (12.8) se escribe como
xi = aij xj (12.12)
que debe ser consistente con la primera de las Ecs. (12.8)
xk = aki xi (12.13)
y sustituyendo xi de (12.12) en (12.13)
xk = aki aij xj
y puesto que las componentes de x son independientes, esta ecuacion solo es correcta si la suma se reduce
identicamente a xk i.e.
aki aij = kj (12.14)
la delta de Kronecker efectivamente es la unica representacion de los elementos de la matriz identidad como
se puede ver del algoritmo (12.7). Podemos llegar tambien a (12.14) directamente a partir de (12.10) usando
el algoritmo (12.7). Si partimos de (12.9) llegamos a la relacion
aij ajk = ik
se puede ver ademas que la inversa del producto de dos matrices es la inversa del producto aplicado en orden
contrario. Por definicion de inverso se tiene que
ABx = x (AB)1 x = x (12.15)
multiplicando por A1 a la izquierda de la primera ecuacion (12.15) y posteriormente por B1 resulta
1
A1 ABx = A1 x Bx = A1 x B Bx = B1 A1 x
x = B1 A1 x
comparando esta ecuacion con la segunda de las Ecs. (12.15) teniendo en cuenta que estas deben ser validas
para x y x arbitrarios, resulta
(AB)1 = B1 A1 (12.16)
es importante tener en cuenta tambien que la matriz identidad deja inalterada a otra matriz cuando se hace
el producto entre ellas
A1 = 1A = A
finalmente, definiremos la traspuesta de una matriz como aquella matriz que se obtiene intercambiando filas
e se define entonces por
por columnas y viceversa en la matriz A, esta matriz simbolizada por A
e
A eaij = aji
ij
es facil demostrar que la traspuesta del producto de dos matrices es el producto de las matrices traspuestas
en orden contrario
eA
B e = B e e
A ^
= bki ajk = ajk bki = (AB)ji = (AB) ij
ij ik kj
y como esto vale para un elemento arbitrario i, j se tiene que
^=B
(AB) eA
e (12.18)
es muy facil verificar que la traspuesta de una suma es la suma de las traspuestas
^
(A e +B
+ B) = A e
12.1. PROPIEDADES BASICAS DE LAS MATRICES 285
aij = aji e
A=A
aij = aji e
A = A
entonces tenemos una matriz antisimetrica. Claramente, los elementos diagonales de una matriz antisimetrica
son nulos.
Notese que siempre es posible descomponer una matriz en una componente simetrica y otra antisimetrica
de la siguiente forma
1 e
1 e
A = As + Aa ; As A+A ; Aa AA
2 2
ademas, la traspuesta de la matriz tambien es combinacion de estas componentes
e = As Aa
A
Adicionalmente, se puede demostrar que el determinante del producto, es el producto de los determinantes
de modo que 1
A = |A|1 o det A1 = (det A)1 (12.22)
por otro lado si cualquier fila o columna de una matriz se multiplica por un escalar , el determinante queda
multiplicado por tal escalar. Por ejemplo en tres dimensiones
a11 a12 a13 a11 a12 a13 a11 a12 a13
a21 a22 a23 = a21 a22 a23 = a21 a22
a23 (12.23)
a31 a32 a33 a31 a32 a33 a31 a32 a33
286 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
T rA = aii (12.26)
de modo que
h i h i h i h i
T r A(1) A(2) . . . A(n2) A(n1) A(n) = T r BA(n) = T r A(n) B = T r A(n) A(1) A(2) . . . A(n2) A(n1)
y teniendo en cuenta que los ndices (1) , (2) , ... son mudos, vemos que cualquier cambio cclico es posible. Vale
la pena tener en cuenta que la propiedad (12.27) no significa que para calcular la traza se puedan conmutar las
matrices, por ejemplo para tres o mas matrices la traza no es la misma para cualquier orden de las matrices,
solo cambios cclicos son posibles (ver ejercicio 1). En tal sentido debemos interpretar (12.27) como un cambio
cclico de dos matrices y no como una conmutacion.
Veremos mas adelante que las trazas y los determinantes son invariantes ante un cambio de base.
(A)ik = aik ; i = 1, . . . , m ; k = 1, . . . , n
la traspuesta de esta matriz sera de dimension n m. Un arreglo vectorial columna (de aqu en adelante lo
llamaremos simplemente vector aunque no necesariamente sea un vector en todo el sentido de la palabra) es
una matriz rectangular de dimension m 1, su traspuesta es una matriz de dimension 1 m.
Ahora bien, sera deseable extrapolar el algoritmo (12.7) para realizar productos de matrices rectangulares
Se observa que la extrapolacion del producto matricial entre dos matrices rectangulares C = AB solo se puede
definir consistentemente si el numero de columnas de A es el mismo que el numero de filas de B.
e nm y Bnd B
Amn A e dn
el producto AB esta definido. Sin embargo, se puede notar que sus traspuestas solo se pueden multiplicar
e A.
en el orden opuesto, i.e. en el orden B e De por s es simple demostrar que al igual que con las matrices
cuadradas el traspuesto del producto es el producto del traspuesto en orden inverso, Ec. (12.18). Aplicando
esta propiedad se puede ver que
] =x
(Ax) eAe ; (e ]
xA) = Axe
r = Ar (12.30)
esta notacion sin parentesis indica que el vector como tal ha sido transformado, con ambos vectores r y r
descritos por el mismo sistema coordenado. Por tanto, en el caso particular de rotacion en dos dimensiones
en lugar de rotar el sistema coordenado en el sentido antihorario, estaramos girando el vector posicion en
sentido horario manteniendo fijos los ejes. Los angulos de rotacion en ambos casos poseen naturalmente la
misma magnitud pero signo opuesto. Vale destacar que en la transformacion (12.30) las componentes del
nuevo vector estaran relacionadas con las del vector original por las mismas transformaciones que en las Ecs.
(12.29) aunque la interpretacion geometrica sea distinta.
288 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
Para entender la diferencia, es esencial comprender que la definicion completa de un operador requiere
conocer no solo que operacion realiza, sino sobre que objetos actua, en este sentido matematico estricto los
dos operadores (cambio de base y cambio del vector) son en realidad diferentes aunque posean la misma
representacion matricial. Notese en particular que el sentido de la rotacion cuando se interpreta como cambio
en el vector, es inverso con respecto al caso en que se interpreta como rotacion del sistema coordenado.
No obstante visto desde un punto de vista practico, dado que las operaciones matematicas son las mismas,
es posible y a veces conveniente cambiar de una interpretacion a otra segun las necesidades. Por ejemplo,
en el caso de la especificacion de la orientacion de un cuerpo rgido relativo a un sistema de referencia S, la
interpretacion del operador como transformando el sistema coordenado es la mas conveniente. Por otro lado la
interpretacion del operador como agente que cambia al vector tiene muchas aplicaciones. Por tanto, tomaremos
una u otra interpretacion a lo largo del texto.
Esta dualidad en la interpretacion o mas bien en el rol de los operadores esta presente en otro tipo
de transformaciones de coordenadas mas generales que las transformaciones ortogonales. En ocasiones se
interpreta su rol como el de cambiar el sistema coordenado expresando cierta cantidad o funcion en terminos
del nuevo sistema coordenado pero sin alterarla. En otras ocasiones se puede considerar como actuando sobre
la cantidad o funcion en s misma cambiando a nuevas cantidades en el mismo sistema coordenado. Cuando
la transformacion es del tipo de un cambio de base i.e. solo sobre el sistema coordenado, hablamos de un rol
pasivo de la transformacion. Por otro lado cuando al operador se le otorga el rol de cambiar a un vector u
otra cantidad fsica, hablamos de un rol activo de la transformacion. Ya nos habamos encontrado con esta
dualidad en el captulo sobre transformaciones canonicas y en realidad es aplicable en muchos campos de la
Fsica.
Es importante el hecho de que las propiedades matematicas de las transformaciones activas y pasivas son
identicas, de modo que en la mayor parte de lo que sigue, no haremos distincion entre (r) y r en las operaciones
subsecuentes, a menos que se especifique lo contrario (como es el caso de la seccion 12.2.1).
G = AF (12.31)
ahora pensemos que el sistema coordenado original sera transformado a otro a traves de una matriz ortogonal
B. El cambio de base se expresa como
(G) = BG (12.32)
donde revivimos la notacion (G) para indicar que representa al mismo vector pero en un sistema coordenado
diferente. Combinando (12.31) y (12.32) se obtiene
notese que en la ultima igualdad los dos vectores G y F estan expresados en bases diferentes. Es deseable
que ambos queden escritos en la nueva base (por ejemplo dos vectores solo se pueden sumar componente a
componente si ambos estan expresados en la misma base). Esto se logra introduciendo un operador identidad
en la forma
(G) = (BA) B1 B F (G) = BAB1 (BF)
(G) = BAB1 (F) (12.33)
Si comparamos (12.31) con (12.33) teniendo en cuenta que los vectores primados son identicos a los vecto-
res sin primar salvo que estan escritos en bases diferentes, llegamos a la siguiente conclusion: La matriz de
12.3. PROBLEMA DE VALORES PROPIOS 289
transformacion A (en la base original) me produce la misma transformacion que la matriz de transformacion
BAB1 en la nueva base. En otras palabras, A y BAB1 son representaciones diferentes del mismo operador,
donde se ve que la representacion depende de la base que usemos para construirla. En consecuencia podemos
definir
A = BAB1 (12.34)
una transformacion de esta forma (entre A y A ) se denomina una transformacion de similaridad. A las
matrices A y A se les denomina matrices equivalentes, lo cual es logico si recordamos la interpretacion
activa de A y pasiva de B que nos llevo a observar que A representa en la nueva base al mismo operador
activo que representa la matriz A en la base antigua. Otra razon para llamar equivalentes a estas matrices
es tener en cuenta que la transformacion de similaridad forma una relacion de equivalencia entre A y A
(reflexiva, simetrica y transitiva). Se deja como ejercicio al lector demostrar que la similaridad es una relacion
de equivalencia.
Puede demostrarse que tanto el determinante como la traza de una matriz A son invariantes ante una trans-
formacion de similaridad. Esto es de gran importancia porque significa que estas cantidades estan asociadas a
un operador lineal de manera unvoca, sin importar la base en que se exprese tal operador.
Veamos la invarianza del determinante
A = BAB1 = |B| |A| B1 = |B| |A| |B|1
A = |A|
donde hemos usado (12.21) y (12.22). La invarianza de la traza se demuestra facilmente en forma explcita
n
X X X X X
1
T r A = T r BAB = BAB1 ii
= bik akl bli = bli bik akl = lk akl = akk = T rA
i=1 i,k,l i,k,l k,l k
una forma mas inmediata de verlo es teniendo en cuenta que la traza es un invariante cclico (ver Ec. 12.28),
de modo que
T r A = T r BAB1 = T r B1 BA = T rA
notese que las propiedades de las transformaciones de similaridad aqu mostradas, no dependen de que la
matriz B para el cambio de base sea ortogonal. Lo unico que se pide es que esta matriz sea no singular para
que exista la inversa. En realidad la definicion de transformacion de similaridad no se restringe al caso en el cual
la matriz B sea ortogonal, aunque el uso de estas transformaciones nos facilitara realizar una interpretacion
geometrica, ya que una transformacion ortogonal transforma una base ortonormal en otra base ortonormal.
Ax = x (12.35)
como la ecuacion de valores propios asociada a dicha matriz. La idea es solucionar para los posibles valores
de y vectores asociados x. Los valores son en general complejos y se conocen como valores propios en
tanto que los vectores x asociados se denominan vectores propios. La operacion en (12.35) nos muestra que
la ecuacion de valores propios consiste en la busqueda de vectores para los cuales el operador A nos alarga
o nos acorta el vector en cuestion, eventualmente cambiando su sentido pero siempre conservando su
direccion. El valor propio sera entonces el factor de contraccion o dilatacion y en caso de ser negativo
invertira el sentido del vector original2 .
2
La razon para colocar todos estos terminos entre comillas, es que tal interpretacion geometrica solo es clara para vectores
reales. Si bien la analoga para vectores complejos no esta excenta de utilidad.
290 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
(A 1) x = 0 (12.36)
los argumentos que siguen son validos para matrices de dimension arbitraria finita, pero por comodidad los
escribiremos en tres dimensiones. Este conjunto de ecuaciones homogeneas para x1 , x2 , x3 solo tiene solucion
no trivial si el determinante del sistema es nulo de modo que
a11 a12 a13
det (A 1) = |A 1| = a21 a22 a23 = 0 (12.38)
a31 a32 a33
condicion que se conoce como ecuacion secular o caracterstica de la matriz. Los valores de para los
cuales se satisface esta ecuacion son los autovalores o valores propios asociados a la matriz. Es de anotar
que aun en el caso en el cual existen soluciones no triviales, el conjunto de ecuaciones homogeneas (12.37)
no nos da valores definidos para las tres (o para las n) componentes sino solo cocientes entre estas. Este
hecho se puede entender por argumentos algebraicos o geometricos. Desde el punto de vista algebraico, esto
esta relacionado con el hecho de que el producto del autovector x con un escalar tambien sera autovector,
lo cual se puede ver inmediatamente de (12.36)3 . Geometricamente, esto implica que solo la direccion del
autovector esta determinada pero su magnitud (e incluso sentido) permanecen indeterminados, lo cual se ve
particularmente claro en tres dimensiones. Dado que A representa una transformacion lineal es claro que si A
conserva la direccion del vector x i.e. Ax = x tambien conservara la direccion del vector x para arbitrario.
Al expandir el determinante (12.38) se observa que en general la solucion de la ecuacion secular se reduce
a encontrar las races de un polinomio de grado n. Sabemos pues que hay un numero maximo de n de estas
races y que tales races pueden ser complejas. En general, podemos construr a lo mas n vectores linealmente
independientes xk cada uno asociado a un valor propio k . Denotaremos la componente iesima del kesimo
vector propio en la forma xik . Podemos realizar un arreglo matricial con estos vectores, colocandolos como
vectores columna en forma adyacente. En tres dimensiones tal arreglo matricial queda en la forma
x11 x12 x13
X (x1 x2 x3 ) = x21 x22 x23 (12.39)
x31 x32 x33
las Ecs. (12.36) se escriben para cada valor propio k y su respectivo vector propio xk en la forma
3
Alternativamente, esto se puede ver del hecho de que la ecuacion secular solo tiene solucion no trivial cuando una o mas de las
ecuaciones es linealmente dependiente con las demas. En tal caso hay mas incognitas que ecuaciones y tenemos entonces infinitas
soluciones.
12.3. PROBLEMA DE VALORES PROPIOS 291
en las dos ecuaciones anteriores no hay suma sobre el ndice repetido k. Recordemos que xjk es la componente
jesima del vector xk . Ahora bien, la cantidad jk k jk se puede asociar a una matriz diagonal que en
tres dimensiones se escribe
1 0 0
0 2 0 (12.42)
0 0 3
matricialmente la Ec. (12.41) se escribe como
AX = X
si multiplicamos por X1 a la izquierda se obtiene
X1 AX = (12.43)
esta operacion es una transformacion de similaridad operando sobre A. Notese que ademas la matriz X
que se construye con los vectores propios es la matriz de transformacion (mas estrictamente la matriz de
transformacion es X1 ), dicha matriz X1 diagonaliza a A a traves de la transformacion de similaridad y los
elementos de la diagonal corresponden a los valores propios (k asociado al vector columna xk en la matriz
X en la Ec. 12.39).
Es obvio de la Ec. (12.43), que la condicion necesaria y suficiente para que la diagonalizacion de A sea
posible, es que la matriz X admita inversa. A su vez una condicion necesaria y suficiente para esto, es que
los vectores propios que constituyen a la matriz X sean un conjunto linealmente independiente. En otras
palabras, la diagonalizacion de una matriz n n es posible si y solo si, existen n vectores propios linealmente
independientes de dicha matriz. Es decir, los vectores propios linealmente independientes de la matriz deben
formar una base de Rn .
Surge entonces la pregunta natural de cuales son las condiciones para que dada una matriz n n, exista
un conjunto de n vectores propios linealmente independientes. Ya hemos mencionado que la ecuacion secular
nos lleva a buscar las races de un polinomio de grado n. En algunas ocasiones hay races degeneradas, es decir
que se repiten dos o mas veces. Cuando existen valores propios degenerados, es decir que un subconjunto de
ellos posee el mismo valor, no es siempre posible diagonalizar la matriz A. Volveremos sobre este punto en la
seccion 12.12.
Por otro lado, en el caso en que la diagonalizacion es posible, el determinante y la traza de A se pueden
calcular teniendo en cuenta que tales cantidades son invariantes ante una transformacion de similaridad, por
lo tanto
det A = det X1 AX = det = 1 2 . . . n (12.44)
1
T rA = T r X AX = T r = 1 + 2 + . . . + n (12.45)
de modo que el determinante y la traza de una matriz diagonalizable son simplemente el producto y la suma
de sus valores propios respectivamente.
Finalmente, si la matriz A en la Ec. (12.35) es real, podemos ver tomando el conjugado en dicha ecuacion,
que si x es un vector propio de A asociado a un valor propio , entonces x tambien es vector propio de A y
estara asociado al valor propio .
donde el subndice indica el valor propio asociado y el superndice es el ndice de degeneracion. Si A es una
matriz n n, sus vectores propios estaran en Rn o Cn que genericamente lo escribiremos como E n . Por tanto
(k)
p n, y todas las combinaciones lineales de los vectores del tipo xi generan un subespacio del tipo E p . Es
4 p
facil ver que un vector arbitrario no nulo de E es vector propio de A con valor propio i . Para verlo tomemos
un vector arbitrario x E p , tal vector es una combinacion lineal de los vectores en la Ec. (12.46), y dado que
A define una transformacion lineal tenemos
h i h i
(m) (m) (m) (m)
Ax = A m xi = m Axi = m i xi = i m xi
Ax = i x
que demuestra lo que se pide. Adicionalmente, puesto que (12.46) define el maximo conjunto de vectores
propios linealmente independientes asociados a i , es claro que ningun vector propio asociado a i esta por
fuera de E p , resumimos este resultado en la siguiente forma
Esto ademas implica que si el conjunto de vectores dado en (12.46) no es ortonormal, puede ortonormalizarse
(por ejemplo con un proceso de ortogonalizacion de Gram-Schmidt), lo cual equivale a escoger una base
ortonormal de vectores de Ei , que obviamente son vectores propios de A asociados a i .
De lo anterior es facil ver que si A es real y un valor propio dado i es real, siempre es posible escoger una
(k)
base de vectores reales en Ei . Tomemos un vector xi de la base (12.46), suprimiremos el suprandice por
comodidad. La ecuacion de valores propios y su conjugada nos dan
donde hemos tomado en cuenta el caracter real de A y . Supongamos primero que xi es linealmente depen-
diente de xi . Por lo menos una de las combinaciones lineales dadas por
xi + xi i (xi xi )
= Re xi ; = Im xi (12.48)
2 2
es un vector no nulo, y sera vector propio con componentes reales asociado al mismo valor propio. En todo
caso, si ambos vectores son diferentes de cero, seran linealmente dependientes.
Supongamos ahora que xi es linealmente independiente de xi , como ambos son vectores propios asociados
a i , esto implica que i tiene degeneracion por lo menos de orden 2. Es claro que el espacio dos dimensional
generado por xi y xi consta de vectores propios con valor propio i (si bien no es necesariamente el subespacio
mas grande que cumple esta condicion). La misma combinacion lineal definida en (12.48), nos da en este caso
dos vectores reales y linealmente independientes5 , que generan el mismo subespacio que xi y xi . Procediendo
de esta forma con todos los vectores de la Ec. (12.46), podemos encontrar un conjunto linealmente independiente
de vectores reales que generen Ei . Vale decir sin embargo, que no todos los vectores reales obtenidos de esta
(1)
manera van a ser necesariamente independientes. Por ejemplo, xi podra ser linealmente dependiente con
(2) (1) (1) (2) (2)
xi en esta caso el espacio generado por Rexi y Imxi contiene a xi aunque no necesariamente a xi .
Por tanto, los vectores
(1) (1) (2) (2)
Rexi , Imxi , Rexi , Imxi
4
Un vector propio es por definicion diferente de cero.
5
La independencia lineal de Re xi e Im xi se garantiza dado que el conjunto original xi y xi es linealmente independiente por
hipotesis, y la transformacion
Re xi 1 1 1 xi
=
Im xi 2 i i xi
es no singular.
12.4. PROPIEDADES BASICAS DE LAS MATRICES ORTOGONALES 293
no van a ser todos linealmente independientes. No obstante, es claro que al barrer todos los vectores de
la Ec. (12.46) obtendremos una base de n vectores reales, mas posiblemente algunos vectores linealmente
dependientes. Por otro lado, esta base se puede ortonormalizar por ejemplo con un proceso de ortonormalizacion
de Gram-Schmidt con combinaciones lineales reales, de modo que la base ortonormal obtenida sea tambien
real. Resumimos estos resultados en la forma
Theorem 9 Sea A una matriz real n n con un valor propio real i que genera el subespacio Ei de E n .
Entonces existe una base de vectores reales que genera a Ei . En particular, existe una base ortonormal real que
genera a Ei .
Notese que el teorema no dice que los vectores propios asociados a i no puedan ser complejos, de hecho si
x es vector propio real, entonces ei x es un vector propio complejo. As mismo, dados varios vectores propios
reales de Ei , una combinacion lineal compleja tambien pertenece a Ei si este espacio es del tipo Cn . El teorema
tampoco dice que los valores propios de una matriz real sean necesariamente reales, de hecho veremos muy
pronto que los valores propios de una matriz real pueden ser reales o complejos.
xi = aij xj , i = 1, 2, 3 (12.49)
existe un conjunto particularmente interesante para la Fsica: el conjunto mas general de transformaciones
lineales homogeneas6 , que deja invariante la norma de los vectores con componentes reales. Si un vector real
arbitrario r se escribe en la forma r = xi ui siendo xi valores reales, entonces las transformaciones lineales
(activas o pasivas) de la forma (12.49) que mantengan invariante la norma de vectores reales, deben cumplir
la condicion
xi xi = xi xi (12.50)
usando (12.49) esta ecuacion se reescribe como
xi xi = (aij xj ) (aik xk )
jk xj xk = aij aik xj xk
donde hemos tenido en cuenta que los ndices repetidos son mudos. Como las coordenadas xk , xj son arbitrarias
entonces la relacion anterior es cierta si y solo si
el lector puede demostrar que esta condicion tiene la siguiente forma alternativa
A cualquier transformacion lineal de la forma (12.49) que cumpla las condiciones (12.51) (o su forma
alternativa las Ecs. 12.52) se le denomina una transformacion ortogonal. Las Ecs. (12.51) se conocen como
condiciones de ortogonalidad.
Consideremos las condiciones de ortogonalidad (12.51) y escribamoslas en notacion matricial
aij aik = jk e
aji aik = jk AAe = 1jk
jk
tenemos que
e = 1 AAA
AA e 1 e = A1
= 1A1 A1
6
Volvemos a insistir en el caracter homogeneo de las transformaciones lineales, ya que existen transformaciones lineales inho-
mogeneas (e.g. las traslaciones) que dejan invariante la norma de un vector.
294 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
vemos entonces que el determinante de una matriz ortogonal es mas o menos uno. Por razones que veremos mas
adelante, las transformaciones ortogonales de determinante +1 se denominan propias y las de determinante
1 se denominan impropias.
De otra parte, existe otra forma geometrica de caracterizar a las matrices ortogonales reales en un enfoque
pasivo. Este es el conjunto mas general de matrices reales que me convierte una base ortonormal real en otra
base ortonormal real, esto se demostrara como caso especial de un contexto mas general en la seccion 12.9.
Esta caracterstica es muy importante ya que usualmente estamos interesados en pasar de un conjunto de
ejes ortogonales a otro conjunto de ejes tambien ortogonales y adicionalmente conservar la unitariedad de los
vectores base.
Cuando el autovalor es complejo, entonces en general su correspondiente vector propio tambien tendra com-
ponentes complejas. Cuando los vectores son complejos, la magnitud al cuadrado de estos se calcula usualmente
de la forma
kxk2 = |xi | |xi | = xi xi (12.54)
y la condicion de invarianza de esta norma no coincide con la condicion de invarianza (12.50). Examinemos en
detalle algunos aspectos de las invarianzas expresadas por (12.50) y (12.54).
xi xi = xi xi (12.55)
debemos tener presente que en la demostracion no se usa en ningun momento el caracter real de los xi ni
tampoco de las componentes de la matriz aij . En conclusion, aunque la motivacion original involucra solo
numeros reales los resultados nos muestran que podemos hacer un enunciado mas general
Theorem 10 Sea xT = (x1 , .., xn ) un arreglo vectorial con componentes complejas. El conjunto de transfor-
maciones lineales homogeneas mas general que deja invariante la cantidad xi xi , es el conjunto de matrices
e = A1 .
complejas A que cumplen la condicion A
12.4. PROPIEDADES BASICAS DE LAS MATRICES ORTOGONALES 295
El punto es que en la mayora de los casos, la norma de vectores complejos no se define como xi xi sino en la
forma xi xi como ya se discutio. No obstante, existe una importante excepcion, en relatividad especial cuando
usamos el espacio de Minkowski con eje temporal imaginario, definimos los vectores complejos (x1 , x2 , x3 , ict)
y su modulo cuadrado7 se define como xi xi = x21 + x22 + x23 c2 t2 .
Veamos ahora como actuan las matrices ortogonales sobre el modulo cuadrado de un vector complejo cuando
tal modulo se define en la forma xi xi , siguiendo el algoritmo para multiplicacion de matrices rectangulares se
tiene que
kxk2 = xe x ; x x e
donde hemos definido la conjugada transpuesta del vector como el adjunto del vector simbolizado x . Escri-
bimos entonces
kxk2 = x x
usando la propiedad (12.53) se tiene que si x = Ax siendo A una matriz ortogonal, la norma de x se escribe
como
2
x
= xe x = (Ax)
] Ax = x e Ax = x
e A e A1 Ax = x e (A )1 Ax
Ahora bien si la matriz es ortogonal real se tiene que A = A y se obtiene la invarianza de la norma usual
para vectores complejos de modo que se llega al siguiente
Theorem 11 Bajo una transformacion ortogonal real, la magnitud al cuadrado de vectores complejos definida
en la forma xi xi permanece invariante.
Sin embargo, las matrices ortogonales reales no son el conjunto mas general de matrices que dejan invariante
la norma de vectores complejos. Mas adelante caracterizaremos al conjunto mas general de matrices (complejas)
que dejan invariante la norma de numeros complejos, este conjunto se denomina matrices unitarias y contiene
a las matrices ortogonales reales como subconjunto propio.
Por otro lado multiplicando la Ec. (12.35) por su conjugada transpuesta, podemos escribir
] (Ax) = (x)
(Ax) g (x)
xe x = x
e x
y si imponemos la invarianza de la norma del vector complejo ante la transformacion se tiene que
kk2 = 1 (12.56)
en conclusion, todos los valores propios de una matriz que preserva la norma usual de los vectores complejos
tienen norma unidad8 .
Figura 12.1: Conversion de un sistema coordenado dextrogiro en uno levogiro (cambio de quiralidad). En la
figura de la derecha, el eje X va hacia adentro del papel. Notese que en el sistema dextrogiro (de mano derecha)
se tiene que ux uy = uz en tanto que en el sistema levogiro (de mano izquierda) se tiene que ux uy = uz .
inversion de los ejes coordenados9 . Una forma de realizar esta operacion es rotar alrededor de un cierto eje
en 180 , para luego realizar una reflexion con respecto al plano definido por dicho eje y que pasa por el origen
de coordenadas. Si tomamos por ejemplo el eje Z para la operacion de girar 180 , vemos que esta operacion
debe realizar la transformacion x, y, z x, y, z; la cual se puede obtener aplicando sobre el vector columna
(x, y, z) la siguiente matriz
1 0 0
rotacion 180 alrededor de Z = 0 1 0
0 0 1
la matriz de reflexion debe convertir z z y dejar inalteradas las otras coordenadas
1 0 0
ref lexion respecto al plano XY = 0 1 0
0 0 1
la composicion de las dos operaciones (tomada en cualquier orden) nos da la matriz de inversion que cambia
de signo todas las coordenadas
1 0 0
Inversion = 0 1 0 = 133
0 0 1
la naturaleza discreta de esta operacion nos dice que una inversion de un sistema dextrogiro a uno levogiro
(cambio de quiralidad), no puede ser realizado por ningun cambio contnuo en la orientacion de los ejes coor-
denados. Por lo tanto, una inversion no puede corresponder a una transformacion contnua (por ejemplo, una
rotacion contnua de los ejes coordenados o el desplazamiento fsico de un cuerpo rgido). Ahora bien, teniendo
en cuenta que toda matriz ortogonal de determinante 1 se puede escribir como el producto de S = 133
con una matriz ortogonal de determinante +1 (e.g. una rotacion mas una inversion), la argumentacion anterior
sera valida para todas las matrices ortogonales de determinante 1. En consecuencia, las transformaciones
ortogonales que representan a cualquier transformacion contnua deben ser de determinante +1. Otra forma de
ver esto es teniendo en cuenta que la matriz que representa a una transformacion contnua, debe evolucionar
9
En el sistema dextrogiro ux uy = uz en tanto que en el levogiro ux uy = uz y lo mismo pasa con todos los productos
cruz fundamentales. Esto implica que el algoritmo del producto cruz en el sistema levogiro cambia todos los signos respecto al
algoritmo del dextrogiro. El cambio de un sistema coordenado dextrogiro a uno levogiro o viceversa se denomina un cambio de
quiralidad del sistema coordenado.
12.5. VECTOR ASOCIADO A UNA MATRIZ ANTISIMETRICA REAL 3 3 297
en forma contnua desde la identidad la cual tiene determinante +1, el cambio repentino a un determinante
1 no se puede lograr con una transformacion contnua de los elementos de la matriz.
En virtud de lo anterior, las matrices ortogonales se dividen en dos grandes grupos: Las transformacio-
nes propias (determinante +1) e impropias (determinante 1). Las primeras generan transformaciones
contnuas, en tanto que las otras representan una transformacion contnua combinada con una transformacion
discreta de inversion. Un estudio sistematico de las propiedades de transformacion de los vectores bajo la ope-
racion de inversion (tambien conocida como transformacion de paridad) nos lleva a clasificar a los vectores y
escalares de acuerdo con tales propiedades de transformacion como veremos a continuacion.
esta matriz tiene solo tres grados de libertad independientes, de modo que es razonable construr una arreglo
vectorial de la forma
a23 v1
vA a31 v2 (12.58)
a12 v3
Ahora bien, si aplicamos la matriz a un vector arbitrario x obtenemos
0 v3 v2 x1 v3 x2 v2 x3
Aa x = v3 0 v1 x2 = v1 x3 v3 x1 (12.59)
v2 v1 0 x3 v2 x1 v1 x2
las componentes del nuevo vector claramente son identicas a las obtenidas a traves del siguiente producto cruz
Aa x = x vA (12.60)
De modo que a una matriz antisimetrica real 3 3 aplicada a un vector x se le puede asociar un producto
cruz entre x y el vector asociado a la matriz antisimetrica. Inversamente, cualquier producto vectorial se puede
asociar con una matriz antisimetrica actuando sobre un vector, lo cual se puede ver en la siguiente forma
donde hemos usado la antisimetra de ijk y de Aaij . Este resultado coincide con la Ec. (12.58).
En resumen, cualquier matriz antisimetrica real 3 3 se puede parametrizar como
0 a12 a13 0 a12 a31 0 v3 v2
Aa = a21 0 a23 = a12 0 a23 v3 0 v1 (12.63)
a31 a32 0 a31 a23 0 v2 v1 0
donde los tres grados de libertad se pueden asociar con un vector en la forma
a23 v1
1
vA a31 v2 ; (vA )m = vm = mij aij (12.64)
2
a12 v3
Aa x = x vA (12.65)
inversamente, cualquier producto vectorial se puede asociar con una matriz antisimetrica actuando sobre un
vector en la forma
(x vA )i = Aaij xj = (Aa x)i ; Aaij ijk vkA (12.66)
Esto se aplica con frecuencia a cantidades como el torque y el momento angular.
Tomemos una matriz antisimetrica Aa y construyamos una matriz equivalente Aa por medio de una
transformacion de similaridad
Aa = BAa B1 (12.67)
nos restringiremos a transformaciones de similaridad con matrices ortogonales reales B. En una transformacion
de similaridad ortogonal se conserva la antisimetra i.e. Aa tambien es antisimetrica, lo cual se puede ver
transponiendo la Ec. (12.67)
g
e = B e aB
1 A e
e =B
eAe aB
e = BAa B1 = A
Aa a
En el caso de tres dimensiones, recordemos que los argumentos que nos llevaron a las Ecs. (12.58-12.60) nos
indicaron que a toda matriz Aa real antisimetrica y de dimension 3 3 se le puede asociar un arreglo vectorial
vA . Esto implica que la matriz Aa tambien se puede escribir en la parametrizacion (12.57), y denotamos los
nuevos elementos como v1 , v2 , v3 . Para encontrar la transformacion que nos lleva de vA a vA
, comenzaremos
y utilizando la Ec. (12.61) podemos escribir esta ecuacion en terminos de las componentes de los vectores
asociados a las matrices antisimetricas
iml vl = bij (jkr vr ) bmk
multiplicando a ambos lados por imd y sumando sobre i, m (ndices repetidos), tenemos
imd iml vl = imd jkr bij bmk vr 2ld vl = imd jkr bij bmk vr
1 1 1
vd = imd jkr bij bmk vr = imd jkr bij bmk rg vg = imd jkr bij bmk (bhr bhg ) vg
2 2 2
12.6. PROPIEDADES DE PARIDAD DE VECTORES Y ESCALARES 299
en el ultimo paso hemos usado la condicion de ortogonalidad de B, Ec. (12.51). Tomemos por ejemplo d = 3
1 1 1
v3 = im3 jkr bij bmk bhr bhg vg = 123 jkr b1j b2k bhr bhg vg + 213 jkr b2j b1k bhr bhg vg
2 2 2
1 1
= jkr b1j b2k bhr bhg vg + kjr b1k b2j bhr bhg vg = jkr b1j b2k bhr bhg vg
2 2
donde hemos usado el hecho de que j, k son ndices mudos. Sumando explcitamente sobre h, y agrupando las
expresiones que se contraen, resulta
v3 = (jkr b1j b2k b1r ) (b1g vg ) + (jkr b1j b2k b2r ) (b2g vg ) + (jkr b1j b2k b3r ) (b3g vg ) (12.68)
los dos primeros sumandos de la derecha se anulan en virtud de la antisimetra de jkr . Por ejemplo, en
jkr b1j b2k b1r para k = 1, aparecen 213 b12 b21 b13 + 312 b13 b21 b11 = 0, y similarmente para k = 2, 3. Tenemos
entonces10
v3 = (jkr b1j b2k b3r ) (b3g vg ) = (det B) (b3g vg )
procediendo de forma similar con las otras componentes obtenemos:
esto a su vez se puede interpretar como la propiedad de transformacion para el arreglo vectorial vA asociado a
la matriz Aa . El arreglo vectorial vA transforma bajo una transformacion de similaridad ortogonal en la forma
vA = (det B) BvA (12.70)
si comparamos este comportamiento con el del vector posicion bajo transformaciones ortogonales
r = Br (12.71)
notamos que la transformacion de vA es similar a la del vector posicion excepto por el factor det B. Para
transformaciones propias (i.e. det B = +1) ambas transformaciones son identicas y definiremos un vector en
R3 como una tripla que bajo transformaciones ortogonales propias cambia con la prescripcion dada en la Ec.
(12.71). En contraste, ambas transformaciones poseen un signo diferente bajo transformaciones ortogonales
impropias. Recordando ademas que una transformacion impropia consiste en una transformacion propia junto
con una inversion, se deduce que bajo la transformacion de inversion, el cambio de vA difiere en un signo con
respecto al cambio del vector posicion r. El vector posicion r invierte su signo bajo inversion en tanto que vA
permanece inalterado ante dicha operacion. Esto induce a definir dos tipos de vectores
1. Vectores polares: aquellos que bajo el operador de inversion, invierten el signo de sus componentes. El
vector posicion (con origen fijo) es un prototipo para estos vectores.
2. Vectores axiales o pseudovectores: aquellos que permanecen inalterados ante una operacion de inversion,
el vector vA asociado a una matriz antisimetrica es el prototipo para esta clase de vectores.
b definido
Una manera de establecer sistematicamente esta clasificacion es a traves del operador paridad P
como aquel que invierte todas las coordenadas xi xi . Una forma util de obtener un escalar es a traves del
producto punto, por ejemplo el producto punto rr no cambia su signo bajo paridad ya que cada vector cambia
su signo. En general, el producto punto entre dos vectores polares no cambia su signo bajo paridad y seran
el prototipo de los verdaderos escalares. Por otro lado, el producto punto de un vector polar con uno axial
invierte su signo bajo paridad, es decir, difiere del comportamiento de un verdadero escalar y se le denomina
10
En sntesis, los terminos de la forma jkr bmj bnk bpr seran nulos si por lo menos dos de los ndices m, n, p coinciden. Si m, n, p
son todos distintos, se obtiene el determinante si estan en orden cclico, y menos el determinante si estan en orden anti-cclico.
300 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
Un ejemplo muy comun de vector axial es aquel que proviene del producto cruz de dos vectores polares
VA = V1 V2
lo cual se puede ver teniendo en cuenta que bajo inversion de los ejes coordenados, cada vector V1 y V2
invierte su signo (por ser polares). Ejemplos comunes son el momento angular y el torque
L = rp ; = rF
similarmente el producto cruz de un vector axial por uno polar es un vector polar. De lo anterior y teniendo
en cuenta la fuerza de Lorentz
F = q (v B)
se ve que si postulamos que la carga electrica es un escalar, el campo magnetico debe ser un vector axial ya
que F y v son vectores polares. Este hecho es consistente con la ley de Biot-Savart que nos describe la integral
de un vector axial diferencial ya que es el producto cruz de dos vectores polares (de la forma dl b r/r 2 ), la
integracion es entonces un vector axial.
Desde un punto de vista pasivo se puede ver porque un vector polar invierte su signo bajo inversion. El
vector permanece inalterado en tanto que los ejes coordenados se invierten, de modo que las componentes en
el nuevo sistema coordenado aparecen invertidas. Que ocurre con un vector axial? ocurre que un vector axial
lleva consigo una convencion de quiralidad. Bajo inversion, un sistema coordenado dextrogiro se convierte
en uno levogiro, si tomamos el producto cruz de dos vectores polares
(1) (2) (2) (1)
VAi = VP j VP k VP j VP k ; i, j, k en orden cclico
el orden cclico requerido en esta ecuacion implica un cambio similar desde la regla de la mano derecha hacia la
regla de la mano izquierda. Por lo tanto, incluso en una interpretacion pasiva, hay un cambio real de direccion
de este producto cruz bajo inversion.
y comparando con la ecuacion general de valores propios (12.38) se observa que = 1 es una solucion para tal
ecuacion. En conclusion, para una matriz ortogonal propia de dimension impar, uno de los valores propios de
la matriz es = +1. Es importante enfatizar que esta conclusion solo es valida para matrices de dimension
impar en virtud del uso de la Ec. (12.25). Para n par, basicamente se llega a una identidad trivial y no a
(12.72). Adicionalmente, recordemos que si la matriz A es real, se tiene que si es solucion de la ecuacion
secular, tambien lo sera .
y recordando que los valores propios son de modulo unidad para las matrices unitarias y en particular para las
matrices ortogonales reales (ver Ec. 12.56 y su discusion), tenemos
k1 k = k2 k = 3 = +1 (12.74)
todo complejo unitario se escribe de la forma ei . Teniendo en cuenta las Ecs. (12.73) y (12.74) podemos
escribir
1 = ei1 ; 2 = ei2 ; 3 = 1
1 2 = 1 = ei1 ei2 1 = 2
1 = ei ; 2 = ei ; 3 = 1 (12.75)
Vemos que 1 es el complejo conjugado de 2 lo cual es consistente con el hecho de que si la matriz A es
real, es solucion de la ecuacion secular, siempre que lo sea. Esto a su vez implica que 1 y 2 son ambos
complejos o ambos reales. Son reales cuando = 0, y complejos en otros casos. Tenemos entonces tres
posibles estructuras
1. Cuando = 0, todos los autovalores son +1. La matriz es la identidad y es facil ver que A tambien lo
es (la matriz identidad tiene la misma representacion en cualquier base), este caso es la solucion trivial
kxk2 = xi xi kxk2 = x
e x
notese que hemos tenido que escribir a la izquierda el vector traspuesto (es decir vector fila) a fin de que la
e se obtiene al conjugar
operacion este definida segun la discusion en la seccion (12.1.2). La matriz rectangular x
y trasponer la matriz rectangular x, vamos a definir a x e como la adjunta de la matriz x y la denotamos con
un obelisco
x xe (12.76)
vamos a definir ahora una funcion compleja de los vectores columna x e y en la forma
(x, y) x y = xi yi
x Mx (12.78)
nos preguntamos ahora como debe transformar el vector y (sin alterar al vector x) de modo que este producto
interno permanezca intacto, es decir de modo que
x y = x y x , y = x, y (12.79)
y = By (12.80)
f
M M (12.81)
obtenemos
x M y = x By
dado que esto es valido para todo x e y, se concluye que
B = M
12.9. MATRICES UNITARIAS Y CAMBIOS DE BASE (OPCIONAL) 303
donde el smbolo M indica la conjugada traspuesta de la matriz M, concepto que se extiende naturalmente
de la definicion analoga para vectores columna. La matriz adjunta de M es entonces su conjugada traspuesta.
En notacion de producto interno escribimos
(Mx, y) = x, M y (12.82)
Veremos que varias propiedades interesantes de transformacion se traducen en propiedades de la matriz adjunta.
Es facil ver las siguientes propiedades
M = M ; (AB) = B A ; det M = (det M) (12.83)
a continuacion veremos algunas matrices especiales relacionadas con la adjunta de una matriz.
U U = 1 (12.84)
U es entonces la inversa a izquierda de la matriz U pero recordando que para matrices cuadradas la inversa
a izquierda es igual a la inversa a la derecha resulta
U = U1 (12.85)
En particular, si x = y observamos que estas transformaciones dejan invariante la norma del vector x. Por lo
tanto la propiedad (12.85) define al conjunto mas general de transformaciones lineales homogeneas que preser-
van el producto interno y en particular la norma de los vectores. A las matrices que cumplen esta propiedad se
les denomina matrices unitarias. Cuando los elementos matriciales son complejos, la magnitud de los vectores
(que en general tendran tambien componentes complejas), no sera invariante bajo una transformacion con
matrices ortogonales complejas. Las matrices unitarias son matrices complejas que mantienen invariante la
norma de vectores complejos. Los valores propios de las matrices unitarias poseen modulo unidad como se
demostro en (12.56) pues debemos recordar que la unica condicion que se uso para llegar a (12.56) fue la
preservacion de la norma de los vectores (reales o complejos) ante la transformacion asociada a la matriz (real
o compleja). El determinante se obtiene de la propiedad (12.84)
det U U = 1 det U e det U = 1 (det U) det U = 1
de modo que el determinante al igual que los valores propios es un numero complejo con norma unidad. Esto
es consistente con el hecho de que cuando la matriz es diagonalizable12 , el determinante es el producto de sus
valores propios. En este caso todos los valores propios son de norma unidad y por tanto tambien su producto.
12
En la seccion 12.12, veremos que las matrices unitarias son diagonalizables.
304 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
Existe otra propiedad fundamental de las matrices unitarias que con frecuencia la literatura toma como
definicion. Una matriz es unitaria si y solo si transforma cualquier base ortonormal en otra base ortonormal.
Para verlo, sea {ui } un conjunto de vectores ortonormales i.e.
(ui , uj ) = ij
transformemos cada elemento ui de la base con una matriz unitaria i.e. ui = Uui tenemos que
ui , uj = (Uui , Uuj ) = (ui , uj )
donde hemos usado la definicion de matriz unitaria como aquella que no altera el valor del producto interno.
Por lo tanto
ui , uj = (ui , uj ) = ij
recprocamente, pensemos en el conjunto mas general de transformaciones lineales homogeneas que nos llevan
de un sistema coordenado ortonormal a otro ortonormal, tenemos entonces
ui , uj = (ui , uj ) = ij ; ui = Mu
ui , uj = (Mui , Muj ) = ui , M (Muj ) = ui , M M uj
ui , M M uj = (ui , uj ) = ij
y puesto que ui , uj pertenecen a una base ortonormal arbitraria, vemos que se llega a la condicion M M = 1,
que caracteriza a las matrices unitarias. Esta propiedad es de suma importancia dado que usualmente estamos
interesados en utilizar bases ortonormales incluso cuando cambiamos de base. Si definimos un espacio vectorial
donde los escalares son reales los vectores base estan asociados al espacio Rn , en tanto que si los escalares son
complejos hablamos de una base en el espacio unitario Cn de dimension n donde cada componente representa
un numero complejo. El espacio C2 es por ejemplo de gran importancia en la caracterizacion del espn en
mecanica cuantica y los cambios de base en este espacio se realizan con matrices unitarias de dimension dos.
Para nuestros propositos estaremos interesados en vectores de Rn en cuyo caso sera suficiente trabajar el
subconjunto propio de matrices unitarias reales, es decir el conjunto de transformaciones ortogonales reales13 .
Los cambios de base se realizaran entonces con matrices ortogonales reales propias14 . Recordemos entonces
que ante un cambio de base, un operador activo A cambia su representacion matricial en la forma
A = BAB1 (12.86)
y si ambas bases son ortonormales, B es una matriz unitaria u ortogonal real segun el espacio en el que
trabajemos.
La condicion de unitariedad (12.85) se puede escribir en componentes en la forma siguiente
e = 1 ; U
UU e U = 1 uij u
ejk = ik ; eij ujk = ik
u
uij ukj = ik ; uji ujk = ik (12.87)
el primer conjunto de ecuaciones (12.87) nos indica que los vectores fila que constituyen a la matriz unitaria
son ortonormales entre s. Similarmente, el segundo conjunto de ecuaciones (12.87) muestra la ortonormalidad
de los vectores columna que constituyen la matriz unitaria. Es claro que solo un conjunto de estas relaciones
es independiente y el otro es redundante. Naturalmente, si las componentes son reales las condiciones de
unitariedad (12.87) coinciden con las condiciones de ortogonalidad Ecs. (12.51, 12.52).
Finalmente, cabe enfatizar que un cambio de base en Cn (Rn ) de la forma (12.86) no requiere que la matriz
de transformacion sea unitaria u ortogonal. Solo se necesita que la matriz pasiva de transformacion sea no
13
Las matrices unitarias complejas mantienen la norma de los vectores que originalmente son reales, pero me pueden llevar un
vector de Rn a un vector de Cn .
14
Una matriz ortogonal real impropia nos llevara a un sistema coordenado izquierdo, y a menos que estemos analizando paridad,
este cambio de quiralidad no es deseable.
12.9. MATRICES UNITARIAS Y CAMBIOS DE BASE (OPCIONAL) 305
singular. El problema es que la nueva base no sera ortonormal lo cual puede traer varias dificultades que
ilustraremos con un sencillo ejemplo, escribamos el producto interno de un cierto conjunto de vectores base en
la forma
(vi , vj ) = gij (12.88)
y denominamos a gij el tensor metrico. Si los vectores unitarios son ortonormales entonces gij = ij . Si la base
es ortogonal pero los vectores base no estan normalizados gij es no trivial pero sigue siendo diagonal. Si la
base no es ortogonal ni normal este tensor es ademas no diagonal. Escribimos x e y en terminos de la base y
calculamos el producto interno entre ellos
donde hemos usado las propiedades (12.77) del producto interno. En notacion matricial
(x, y) = x Gy (12.89)
Sea un operador lineal A y veamos que relacion tiene su representacion matricial con la del operador adjunto
B en esta base
Esto nos motiva a introducir una sutil diferencia entre operadores lineales adjuntos, unitarios, etc. y ma-
trices adjuntas, unitarias, etc. Tomemos de ejemplo los operadores unitarios y matrices unitarias para la
discusion. En general la literatura utiliza el termino matriz unitaria para los arreglos matriciales que cum-
plen el algoritmo matricial U1 = U esta es una definicion algebraica. Por otro lado, se define un operador
lineal unitario como aquel que deja invariante el producto interno entre dos vectores arbitrarios, esta es una
definicion geometrica y por tanto independiente del sistema coordenado que se use. No obstante, una matriz
unitaria en el sentido aqu expuesto solo representa a un operador unitario cuando la base es ortonormal.
Cuando la base no es ortonormal la representacion matricial de un operador unitario esta dada por el algo-
ritmo (12.91) y la llamaremos representacion matricial del operador unitario. Por supuesto, la misma
discusion vale para el concepto de adjunto y otros conceptos que veremos a continuacion como hermiticidad,
normalidad, etc.
Lo anterior nos ilustra algunas dificultades que aparecen cuando se toman bases no ortonormales, por esta
razon es usual que los cambios de base se hagan garantizando que se llega a otra base ortonormal i.e. con
matrices unitarias u ortogonales reales. Veremos sin embargo, que las bases no ortonormales nos permiten
resolver un problema modificado de valores propios con muchas aplicaciones en Fsica (ver Sec. 12.14).
306 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
donde Em es el subespacio de E n generado por m , dicho subespacio es de dimension gm . Dado que todos los
vectores propios forman una base de E n , se tiene que
p
X
gm = n
m=1
n o
(k)
ahora bien, una vez que la base vi se ordena de una manera especfica, el conjunto ordenado de coeficientes
n o
(k)
ci definido en la Ec. (12.93) para un vector dado x E n es unico, en virtud de la independencia lineal de
la base. Esto a su vez significa que para un vector dado x E n , cada uno de los vectores xm Em definidos
en (12.94) es unico. Esto significa que un vector arbitrario de E n tiene una descomposicion unica de la forma
x = x1 + x2 + . . . + xp ; xm Em x E n (12.95)
en otras palabras, cada vector de E n se descompone de una manera unica en una suma de vectores xm que
pertenecen a los subespacios Em generados por los valores propios m . Esto se expresa tambien diciendo que E n
se descompone en una suma directa de subespacios Em y se escribe
p
X
E n = E1 E2 . . . Ep Ei , m Em (12.96)
m=1
a la componente xm Em se le llama la proyeccion del vector x sobre el subespacio Em . Las Ecs. (12.95,
12.96) expresan que el espectro (conjunto de valores propios) de A llena el espacio E n , o que su espectro es
completo. Esta es otra forma de expresar el hecho de que exista un conjunto de vectores propios de A que
forman una base de E n .
15
A pesar de que se hara referencia constante a la seccion 12.12, dicha seccion puede omitirse en una primera lectura, si aceptamos
la hipotesis de que las matrices en cuestion poseen un conjunto completo de vectores propios y comprendemos las consecuencias
de esta hipotesis.
16
Debe anotarse sin embargo, que una combinacion lineal de los vectores propios de la base no es necesariamente un vector propio.
Esto se debe a que los vectores propios de esta base estan en general asociados a diferentes valores propios. Si la combinacion lineal
involucra solo vectores asociados a un valor propio dado, el vector resultante tambien sera vector propio.
12.11. MATRICES HERMITICAS Y SIMETRICAS REALES 307
nos preguntamos por los operadores para los cuales A = A i.e. para los cuales se cumple
Dado que nuestra base es ortonormal, esta condicion equivale a la igualdad de la matriz representativa
con su adjunta (conjugada transpuesta). Se dice que una matriz es hermtica o autoadjunta si dicha matriz
coincide con su adjunta i.e.
A=A e A
Es facil demostrar que para una matriz hermtica de dimension arbitraria, su naturaleza hermtica se
preserva ante una transformacion de similaridad unitaria. Bajo una transformacion de similaridad
A = BAB1
A = G1 A G
308 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
haciendo el producto por la izquierda con el vector adjunto (conjugado traspuesto) correspondiente al vector
propio nesimo tenemos
V(n) HV(j) = j V(n) V(j) (12.97)
HV(n) = n V(n)
y multiplicamos por el vector (columna) V(j) a la derecha de ambos miembros, teniendo en cuenta ademas
que la matriz H es hermtica, se obtiene
si j = n se obtiene que
2
(n n )
V(n)
= 0
de modo que n = n y los valores propios son reales como se quera demostrar. Ahora bien, si j 6= n y j 6= n ,
es decir si estos valores propios no son degenerados, se obtiene de (12.99)
(j n ) V(n) V(j) = 0 V(n) V(j) = V(n) , V(j) = 0
donde hemos usado el caracter real de los valores propios. Vemos entonces que los vectores propios corres-
pondientes a valores propios diferentes son ortogonales. Este hecho tiene un gran alcance en terminos de
aplicaciones. Por ejemplo en ecuaciones diferenciales, muchos operadores diferenciales son lineales y hermti-
cos, tales operadores actuan sobre espacios vectoriales de funciones (usualmente de dimension infinita) sus
valores propios son reales y sus vectores propios son ortogonales al menos en ausencia de degeneracion, estos
vectores propios permiten generalmente construr una base para el espacio vectorial en cuestion. En consecuen-
cia el problema de Sturn-Liouville se reduce a un problema de valores propios de un operador hermtico que al
ser lineal admite una representacion matricial (aunque estas matrices son en general de dimension infinita lo
cual introduce problemas que no trataremos aqu). Es necesario enfatizar sin embargo que los vectores propios
asociados a valores propios degenerados no son necesariamente ortogonales.
En la seccion 12.12 veremos que las matrices hermticas tienen un espectro completo. Por tanto, si H es
una matriz hermtica n n, podemos inducir una descomposicion del espacio E n en los subespacios generados
por los vectores propios m de H. As mismo un vector arbitrario x de E n se puede descomponer de manera
unica en proyecciones a lo largo de cada subespacio Em
E n = E1 E2 . . . Ep , m Em (12.100)
n
x = x1 + x2 + . . . + xp ; xm Em x E (12.101)
Ahora bien, puesto que los vectores propios asociados a valores propios diferentes son ortogonales para las
matrices hermticas, tenemos que todos los vectores de Ei son perpendiculares a todos los vectores de Ej si
i 6= j. Esto se indica diciendo que los subespacios {Ek } son perpendiculares entre s y se denota Ei Ej . Por
tanto, tenemos tambien que xi xj para las proyecciones dadas en la Ec. (12.101) y hablamos entonces de
proyecciones ortogonales.
12.11. MATRICES HERMITICAS Y SIMETRICAS REALES 309
tendremos entonces
(Hp )i1 = 1 i1 ; (Hp )i2 = 2 i2
18
Este es un buen punto para hacer notar que la matriz de diagonalizacion no es unica, lo cual se ve de inmediato debido a la
falta de unicidad del conjunto de vectores propios que forman una base. Esta arbitrariedad se puede utilizar tambien para hacer
que la matriz ortogonal real sea propia.
19
El que una matriz sea real no garantiza que su espectro sea real. Esto esta relacionado con el hecho de que la ecuacion secular
nos lleva a buscar las races de un polinomio con coeficientes reales. No obstante, el teorema fundamental del algebra nos dice que
las races pueden ser complejas incluso si los coeficientes son reales.
20
Cuando los vectores son complejos n dimensionales, es decir que yacen en el espacio Cn donde cada componente es compleja,
la relacion de ortonormalidad se define por (ui , uj ) = ui uj = ij . Para el caso de vectores reales, el tercer eje principal se puede
generar con u3 = u1 u2 que garantiza la obtencion de ejes a derecha.
310 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
se puede verificar que los nuevos vectores u1 , u2 tambien son vectores propios con valor propio 1 = 2 .
Esto implica entonces que dados dos valores propios degenerados 1 = 2 dos vectores propios linealmente
independientes asociados a este valor propio degenerado me definen un plano en donde todos los vectores que
yacen en tal plano son vectores propios. Los ejes principales son entonces cualquier par ortogonal de ejes en
este plano. Tenemos entonces que esta degeneracion esta asociado a una simetra axial (alrededor del eje X3 ).
En nuestro lenguaje anterior, el espacio R3 se puede escribir como la suma directa de los subespacios
generados por los valores propios diferentes 1 y 3 . El subespacio generado por 1 es de dimension dos debido
a su degeneracion y es el plano R2 expandido por los vectores propios u1 y u2 asociados a 1 . El subespacio
generado por 3 es de dimension uno y es un eje coordenado R expandido por u3
R3 = R2 R , 1 R2 , 3 R
y ya vimos que toda combinacion lineal dentro de cada subespacio sigue siendo vector propio con el mismo
valor propio. Es por ello que tenemos la libertad de rotar en el plano generado por u1 y u2 y continuar teniendo
vectores propios u1 y u2 asociados a 1 .
Analogamente, si todos los valores propios son iguales, todas las direcciones del espacio conducen a vec-
tores propios, es decir tenemos una simetra esferica pero en este caso la matriz ya estara diagonalizada y
sera proporcional a la identidad, de modo que la degeneracion total no representa tampoco un problema en
tres dimensiones.
n = i ui
12.11. MATRICES HERMITICAS Y SIMETRICAS REALES 311
i Hij j H
No obstante sera mas practico escribir esta ecuacion en forma normalizada para lo cual definimos un vector
en la forma
n
(12.104)
H
ahora dividimos por H a ambos lados de (12.103) con lo cual queda
eH = 1
(12.105)
si la consideramos como una funcion en tres variables esta es la ecuacion de una superficie en el espacio de
configuracion con ejes 1 , 2 , 3 . Podemos realizar un cambio de base a traves de una matriz ortogonal real
propia B, reescribiendo (12.105) de la siguiente forma
e B1 B H B1 B
= 1 eB
e BHB1 B = 1
] BHB1 (B) = 1
(B)
y dado que para matrices simetricas reales es posible encontrar una matriz ortogonal real propia que la
diagonalice con una transformacion de similaridad, escogemos a B como la matriz de diagonalizacion (que se
construira con los vectores propios de H) tenemos entonces que BHB1 = siendo la matriz diagonal con
los valores propios en la diagonal. Resulta entonces
e = 1 ; B (12.107)
Esto implica que en general siempre es posible pasar a un sistema coordenado con ejes 1 , 2 , 3 en donde la
Ec. (12.106) toma su forma normal
1 2 2 2
1 + 2 2 + 3 3 = 1 (12.108)
Si todos los coeficientes i son positivos, entonces la Ec. (12.108) define la superficie de un elipsoide, estando
los ejes principales del elipsoide a lo largo de los nuevos ejes coordenados. Esto ocurrira cuando la matriz H
sea una matriz positiva como se discutira en la seccion 12.14. A manera de ejemplo, se sabe que para el tensor
de inercia los momentos principales de inercia (elementos diagonales del tensor) son positivos cualquiera que
sea la inclinacion de los ejes, lo cual garantiza que la forma diagonal tiene solo coeficientes positivos. La forma
cuadratica (12.108) es precisamente la forma que tiene la Ec. (12.106) en un sistema de coordenadas en el
cual la matriz simetrica real es diagonal. Es decir los ejes principales que vuelven diagonal a H son los mismos
que llevan a la ecuacion de un elipsoide a su forma normal. Los valores propios en consecuencia determinan
las longitudes de los ejes del elipsoide. Si dos valores propios coinciden, el elipsoide tendra dos ejes iguales de
modo que sera un elipsoide de revolucion manifestando la simetra axial asociada, si la degeneracion es total,
el elipsoide es una esfera manifestando la simetra esferica del problema.
Por supuesto es posible que los coeficientes en (12.108) y por lo tanto los valores propios de la matriz
simetrica asociada no sean positivos, en tal caso estaremos transformando otra clase de superficie (en general
conicas) a su forma normal.
312 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
Definition 12 Decimos que una matriz es normal cuando conmuta con su adjunto, esto lo simbolizamos
como h i
AA A A A, A = 0
En esta seccion, la notacion de parentesis cuadrados indicara conmutador y no corchete de Poisson. Puede
demostrarse sin embargo, que los conmutadores obedecen un algebra similar a la de los corchetes de Poisson
Ecs. (8.9-8.12). Es inmediato ver que las matrices hermticas y unitarias son casos particulares de matrices
normales, por tanto todos los resultados que se deriven aqu seran validos para matrices hermticas y unitarias.
Partamos de la hipotesis de que la matriz A es diagonalizable con una matriz unitaria, y veamos las
condiciones que se obtienen con esta hipotesis
UAU = UA U =
donde la segunda ecuacion es simplemente la adjunta de la primera. Multiplicando las dos ecuaciones en
diferente orden tenemos
UAU UA U = ; UA U UAU =
UAA U = ; UA AU =
donde hemos usado el caracter unitario de U y el hecho de que dos matrices diagonales conmutan entre s (ver
ejercicio 3, Pag. 336). Restando las dos ecuaciones queda
h i
U AA A A U = 0 U U AA A A U U = U 0U
AA A A = 0
por tanto para que una matriz sea diagonalizable con una transformacion unitaria, es necesario que la matriz
sea normal. Recprocamente, es posible probar que si la matriz es normal, entonces es diagonalizable por una
transformacion unitaria de similaridad. Probaremos el recproco solo para el caso en el cual el espectro de
valores propios no es degenerado.
Veremos antes algunas de las propiedades de las matrices normales. Escribamos la ecuacion de valores
propios y su correspondiente adjunta
(A 1) x = 0 ; x A 1 = 0
Bx = 0 ; x B = 0 ; B A 1 (12.109)
donde hemos usado las propiedades del conmutador Ecs. (8.9-8.12), el caracter normal de la matriz, y el hecho
de que la identidad conmuta con cualquier matriz. Tenemos entonces que
h i h i
(A 1) , (A 1) B , B = 0 (12.110)
de modo que la matriz B definida en (12.109) es tambien normal. Usando (12.109) y (12.110) resulta
x B Bx = 0 = x BB x B x B x = 0
2
B x
= 0 B x = 0 A 1 x = 0
por tanto, un autovector de A es tambien autovector de A pero con autovalor . Partiendo de la ecuacion de
valores propios de A se puede demostrar analogamente que los autovectores de A tambien son autovectores
de A. Entonces, para matrices normales, A tiene los mismos autovectores de A pero sus autovalores son los
conjugados de los autovalores de A.
Usando lo anterior, tomemos ahora la ecuacion de valores propios para A y A en la forma
A xi = i xi ; Axj = j xj
xi A = i xi ; xi Axj = j xi xj
multiplicando la primera ecuacion por xj a la derecha y restando las dos ecuaciones resulta
(i j ) xi xj = 0
podemos aplicarle una transformacion unitaria que nos lleva a otra base ortonormal de Ei , que igual nos sirve
como parte de la base ortonormal de todo el espacio. Notese que en ausencia de degeneracion, cada subespacio
Ei es unidimensional y dada una base ortonormal, lo mas que se puede hacer es multiplicar a cada vector por
una fase compleja (transformacion unitaria unidimensional), si la base es real y deseamos que continue siendo
real, los mas que se puede hacer es multiplicar cada vector por 1.
Tenemos entonces que una matriz es normal si y solo si puede diagonalizarse con una matriz unitaria.
Este hecho se conoce usualmente como teorema espectral. Notese que dicho teorema no prohibe que otras
matrices diferentes a las normales puedan ser diagonalizables. Sin embargo, si una matriz no es normal puede
no ser diagonalizable, y si lo es, esta diagonalizacion debe obtenerse con una transformacion de similaridad no
unitaria.
Ya hemos dicho que las matrices unitarias y hermticas son normales. Por tanto, una matriz unitaria
puede ser diagonalizada por otra matriz unitaria que significado puede tener la diagonalizacion de una matriz
unitaria por otra matriz unitaria?. Esto tendra sentido geometrico si la matriz que se diagonaliza es activa
(por ejemplo una matriz que representa la rotacion de un vector en Cn o en Rn ) en tanto que la matriz que
diagonaliza debe ser pasiva (reorientacion de los ejes en Cn o en Rn ).
a Ha 0 ; a Cn (12.111)
adicionalmente, si existe por lo menos un vector a 6= 0 para el cual esta forma bilineal se anule, se dice que la
matriz es positiva singular. Si a = 0 es el unico vector que anula a la forma bilineal, se dice que la matriz es
definida positiva. Si solo sabemos que se cumple la condicion (12.111), diremos simplemente que la matriz es
positiva.
Theorem 14 Una matriz hermtica H de dimension n n es positiva si y solo si sus valores propios son
no-negativos.
por tanto j 0.
Ahora suponemos que los valores propios de H son no-negativos, y llegamos a que la matriz es positiva.
Para ello recurrimos al hecho de que para una matriz hermtica es posible encontrar una base ortonormal
completa {xj } de vectores propios, donde xj esta asociado a un j dado21 . Por tanto, todo vector a Cn se
puede escribir como combinacion lineal de n vectores propios xj ortonormales de H, en consecuencia
Theorem 15 Una matriz hermtica es definida positiva si y solo si todos sus valores propios son estrictamente
positivos. Una matriz hermtica es singular positiva si y solo si todos sus valores propios son no-negativos, y al
menos uno de ellos es nulo. En particular, esto implica que las matrices singulares positivas no son invertibles,
en tanto que las definidas positivas son invertibles.
Demostracion: Supongamos que la matriz hermtica tiene valores propios estrictamente positivos. Si
a 6= 0 en la Ec. (12.112), entonces uno o mas de los coeficientes ci es no nulo y dado que cada i > 0, es claro
que a Ha en (12.112), es mayor que cero, de modo que la matriz es definida positiva. Recprocamente, si H
es definida positiva y hacemos a = xi vector propio con valor propio i , obtenemos
xi Hxi = kci k2 i > 0 no suma sobre i
donde hemos usado el hecho de que xi 6= 0 y el caracter definido positivo de H.
La negacion de estas implicaciones conduce al resto del teorema22 . Sin embargo, lo ilustraremos explcita-
mente para estudiar el comportamiento de las matrices singulares positivas.
Partimos primero de que la matriz es singular positiva, entonces existe por lo menos un vector a 6= 0 tal
que
a Ha = 0 ; a 6= 0
escribiendo a = ci xi como combinacion lineal de vectores propios xi de H, y haciendo un procedimiento
analogo al que nos llevo a (12.112), resulta
a Ha = kci k2 i = 0 ; a 6= 0
puesto que a 6= 0, hay uno o varios ci no-nulos. Dado que i 0, es necesario que todos los valores propios
asociados a coeficientes ci no nulos sean cero. Por tanto, si a = ci xi 6= 0, es un vector que genera una
forma bilineal nula con H, los valores propios asociados a todos los vectores propios que intervienen en esta
combinacion lineal deben ser nulos. Pueden existir por supuesto, mas valores propios nulos (i.e. un mayor grado
de degeneracion de = 0), si existen varios vectores propios ak 6= 0, linealmente independientes que anulen
a la forma bilineal. El grado de degeneracion del valor propio nulo sera entonces la dimension del subespacio
generado por = 0.
Recprocamente, supongamos que cada i 0, y que existe por lo menos un k = 0. Tomando a = xk i.e.
como uno de los vectores propios asociado a k , la forma bilineal queda
xk Hxk = k xk xk = k kxk k2 = 0 ; xk 6= 0
de modo que hay por lo menos un vector diferente de cero que anula la forma bilineal.
Finalmente, puesto que las matrices positivas son diagonalizables con una transformacion de similaridad, el
determinante es el producto de los valores propios. Por tanto, el determinante de una matriz definida positiva
es positivo y la matriz es invertible, en tanto que el determinante de una matriz singular positiva es cero y por
tanto es no invertible. QED.
donde hemos usado el hecho de que por construccion los vectores v, w son reales y por tanto su adjunto
coincide con su traspuesto. La parte imaginaria en (12.115) se anula debido a la simetra de M, de modo que
el factor a Ma es real y queda en la forma
a Ma = v
e Mv + wMw
e ; a = v + iw ; v, w Rn (12.116)
Va = Ta (12.117)
Donde T y V son matrices, un numero complejo y a un vector columna. Notese que la Ec. (12.117), es una
ecuacion de valores propios con estructura diferente a la mostrada en (12.35), ya que al operar V sobre a no
obtenemos a por una constante sino una constante multiplicada por Ta. Adicionalmente, asumiremos que las
matrices T y V en la Ec. (12.117) son simetricas y reales y ademas T es definida positiva en tanto que V es
positiva. Con estas hipotesis de trabajo demostraremos las siguientes propiedades:
1. Los valores propios son reales no negativos23 . Si ademas V es definida positiva, los valores propios
seran estrictamente positivos.
2. Las componentes de los autovectores a son reales, excepto por una posible fase global.
4. Los autovectores a correspondientes a valores propios diferentes son ortogonales, aunque bajo una metrica
diferente como veremos mas adelante.
5. La matriz de autovectores A diagonaliza tanto a T como a V. Esta diagonalizacion se realiza con una
transformacion de congruencia que definiremos mas adelante. La matriz T se diagonaliza a la identidad
y la matriz V se diagonaliza a una matriz cuya diagonal contiene los valores propios.
Para demostrar estas propiedades comencemos por rotular los valores propios k y los correspondientes
vectores propios a(k) de la matriz V de dimension n n. El parentesis indica que estamos rotulando un vector
propio y no una componente del vector. Es claro que k = 1, . . . , n y algunos de los n valores propios pueden
tener el mismo valor.
Reescribimos la Ec. (12.117) en la forma
donde hemos usado el caracter real y simetrico de T y V 24 . Multiplicando (12.119) por a(k) a la derecha,
multiplicando (12.118) por a(m) a la izquierda y sustrayendo se obtiene
e
a(k) Va(k) = k e
a(k) Ta(k)
e(k) Va(k)
a
k = (12.123)
e
a(k) Ta(k)
y como los vectores a(k) son reales no nulos26 , el teorema 16 nos dice que el numerador es no negativo y el
denominador es estrictamente positivo en virtud de la caracter positivo de V y definido positivo de T. Por
tanto los valores propios k son no negativos. Si adicionalmente V es definida positiva, el numerador es
tambien positivo y por lo tanto los valores propios son estrictamente positivos. Por otro lado, si V es singular
positiva, existe un conjunto m de vectores no nulos linealmente independientes tales que e a(k) Va(k) = 0, por
tanto tendremos m valores propios nulos.
Volvamos a la Ec. (12.120) para la cual hemos examinado el caso en que k = m Ec. (12.121). Estudiemos
entonces el caso en el cual m 6= k, teniendo en cuenta que los vectores y valores propios son reales
(k m ) e
a(m) Ta(k) = 0 (12.124)
24
Estrictamente, solo estaramos usando su caracter hermtico.
25
Es obvio de la Ec. (12.117) que si un vector real a es vector propio entonces tambien lo sera ei a, es decir que cada componente
del vector tiene la misma fase.
26
Notese que si los vectores tienen una fase global, el cociente dado en la Ec. (12.123) se debe escribir como
a(k) Va(k)
k =
a(k) Ta(k)
si las races k y m de la ecuacion secular son distintas, la Ec. (12.124) solo se cumple si
e(m) Ta(k) = 0
a ; m 6= k (12.125)
ya se ha mencionado en varias ocasiones que los valores de los aj(k) no estan completamente fijados por la
ecuacion de valores propios (12.118). Podemos remover esta indeterminacion exigiendo la condicion
e
a(k) Ta(k) = 1 (12.126)
hay n de estas ecuaciones y por tanto queda fija la componente que antes era arbitraria en cada a(k) , excepto
por un signo global ya que si cambiamos a(k) a(k) aun se siguen cumpliendo (12.125) y (12.126). Si
organizamos los vectores propios en columnas adyacentes para formar una matriz A con elementos ajk las Ecs.
(12.125) y (12.126) se pueden sintetizar en una sola
e
ATA =1 (12.127)
si existe degeneracion ya no sera valido el argumento que nos llevo a la Ec. (12.125). Sin embargo, de manera
similar al problema de valores propios ordinario, es posible establecer que una combinacion lineal arbitraria
de vectores propios asociados a un mismo valor propio es tambien un vector propio con el mismo valor propio.
De esta forma, el conjunto de todos los vectores propios reales de V asociados a un valor propio dado k
junto con el cero, forman un subespacio vectorial de Rn , i.e. el subespacio generado por el valor propio, cuya
dimension p es el grado de degeneracion de k . Dentro de este subespacio podemos escoger cualquier conjunto
de p vectores linealmente independientes como base del subespacio. En particular, podemos escoger una base
ortonormal en el sentido dado por las Ecs. (12.125), para lo cual se puede utilizar un proceso generalizado de
ortogonalizacion de Gram-Schmidt (ver ejercicio 8 Pag. 336).
En conclusion, incluso en presencia de degeneracion es siempre posible encontrar un conjunto de coeficientes
ajk que satisfagan la ecuacion de valores propios (12.118) y las Ecs. (12.125, 12.126) con lo cual se cumple la
Ec. (12.127), dicha ecuacion nos inspira para definir una relacion semejante a la transformacion de similaridad.
Hablamos de la transformacion de congruencia de C por medio de A cuando tenemos la relacion
e
C = ACA (12.128)
e = A1 B y la transformacion de congruencia se convierte en transformacion
si A es ortogonal se tiene que A
de similaridad. La Ec. (12.127) nos dice entonces que A transforma a T por medio de una transformacion de
congruencia en una matriz diagonal, en particular en la matriz identidad n n.
En componentes, la ecuacion de valores propios (12.118) se escribe
no hay suma sobre k. Podemos definir una matriz diagonal que contiene a los valores propios en la diagonal,
de la forma mk = mk k . Si ademas escribimos aj(k) como un arreglo matricial A de los vectores propios se
tiene que
Vij ajk = Tij ajm mk
que matricialmente se escribe
VA = TA (12.129)
e a la izquierda
multiplicando (12.129) por A
e
AVA e
= ATA
las Ecs. (12.127) y (12.130) nos dicen entonces que la misma transformacion de congruencia (ambas con la
matriz A de vectores propios) diagonaliza tanto a T como a V. La primera se diagonaliza a la identidad y la
segunda a una matriz diagonal donde los elementos diagonales son los valores propios.
Reescribiendo (12.117) en la forma
(V T) a = 0
vemos que lo que tenemos es un conjunto homogeneo de ecuaciones para los coeficientes ak que solo tiene
solucion no trivial cuando el determinante del sistema es nulo
|V T| = 0 (12.131)
por tanto, los valores propios son las races de esta ecuacion secular (modificada). En coordenadas cartesianas
y usando T = 1, (12.131) se convierte en la ecuacion secular usual
|V 1| = 0 (12.132)
es conveniente escribir estas formas cuadraticas como una estructura bilineal mediada por matrices simetricas
reales en la forma27
1 1
T = i Tij j , V = i Vij j ; Tij = Tji = (1 + ij ) Kij , Vij = Vji = (1 + ij ) Zij
2 2
1 1
T = e T ; V =
e V (12.134)
2 2
Impongamos la condicion de que la matriz simetrica real T definida por los elementos Tij , sea definida positiva
y que la matriz simetrica real V definida por los Vij sea una matriz positiva. Las formas cuadraticas son
entonces positivas. Hagamos una transformacion de las coordenadas y , a otras coordenadas y por
medio de la matriz A que se construye con los vectores propios de la Ec. (12.118)
= A1 ; = A1 (12.135)
= A ; = A (12.136)
por razones que veremos mas adelante, llamaremos a i y a i las coordenadas normales asociadas a las
formas cuadraticas T y V respectivamente. Usando (12.136), la forma cuadratica positiva V Ec. (12.134) en
terminos de las coordenadas normales queda
1 1 f 1 e e
V = e V =
A V (A) = A V (A)
2 2 2
1e e
V = AVA
2
27
Por supuesto, son posibles otras matrices para definir la forma bilineal, la condicion es que se cumpla la igualdad
n X
X n
1
T = Kij i j = i Tij j
i=1 ji
2
que para valores fijos no diagonales de i y j con j > i, se cumple para todo i j si y solo si
1 1
Kij = i Tij j + j Tji i no suma
2 2
en virtud de que hay un doble conteo para cada par (i, j) no diagonal de la forma bilineal. Por ejemplo, se puede escoger Tij = 2Kij
para i > j y Kij = 0 para i < j o viceversa. Sin embargo, es conveniente elegir la matriz simetrica y real a fin de que sea hermtica.
320 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
pero recordemos que A diagonaliza a V a traves de una transformacion de congruencia Ec. (12.130) de modo
que la estructura de la forma cuadratica positiva se simplifica en estas coordenadas.
1e 1
V = = k k k (12.137)
2 2
la forma cuadratica T definida positiva, adquiere una forma aun mas simple que la de V en las nuevas
coordenadas , puesto que A diagonaliza a T y la convierte en la identidad, como se ve en (12.127)
1 1 g 1 e e
T = e T =
A T (A) = A T (A)
2 2 2
1e e
T = ATA
2
y usando (12.127) esta forma cuadratica se reduce finalmente a
1e 1
T = = i i (12.138)
2 2
las Ecs. (12.137, 12.138) muestran que en coordenadas normales y , tanto V como T se simplifican ya
que se convierten en formas cuadraticas desacopladas, i.e. formas cuadraticas sin terminos cruzados. Esto
es consecuencia de que A produce una transformacion a ejes principales similar a la transformacion a ejes
principales que deja a una matriz hermtica en forma diagonal. Los ingredientes nuevos en este caso son:
(a) la transformacion es de congruencia (y no de similaridad), (b) La misma transformacion de congruencia
diagonaliza simultaneamente a dos matrices T y V, como se aprecia en las Ecs. (12.136).
Esta tecnica resulta muy poderosa para desacoplar sistemas de ecuaciones algebraicas y diferenciales. En la
seccion 15.2 aplicaremos esta tecnica para encontrar los modos normales de una red de osciladores acoplados.
usando (12.140) y (12.141), la forma cuadratica T dada por (12.134) se transforma de la siguiente manera
e T = y
2T = e =y
eBTBy eCy = Ci yi yi (12.142)
28
Esta seccion no es muy util para calculos practicos, pero aporta una gran claridad conceptual sobre la diagonalizacion simultanea
de dos formas cuadraticas. Puede omitirse en una primera lectura.
12.15. INTERPRETACION GEOMETRICA DE LA DIAGONALIZACION DE DOS MATRICES 321
la forma cuadratica Ci yi yi solo puede ser definida positiva si cada termino Ci es estrictamente positivo, lo cual
se puede ver haciendo todas las yi cero excepto una. Esto tambien se puede ver teniendo en cuenta que la
diagonalizacion por una transformacion de similaridad nos lleva a la matriz diagonal de los valores propios Ci
de T, los cuales son estrictamente positivos en virtud del teorema 15. De esta forma la ecuacion para las yi
Ci
yi yi = 1 (12.143)
2T
define un elipsoide de dimension n cuyos ejes principales van a lo largo de los ejes definidos por las nuevas
coordenadas yi , la Ec. (12.143) se puede convertir de forma inmediata en la ecuacion de una esfera para un
nuevo conjunto de variables zi
p
zi = yi Ci no suma (12.144)
1
zi zi = 1 (12.145)
2T
podemos reescribir (12.144) en la forma
p
zi = Cj ij yj = Dij yj
p
Dij ij Cj no suma (12.146)
2T = zi zi = e
z1nn z
es decir T ha sido transformado a la identidad a traves de dos transformaciones sucesivas: primero una
transformacion de similaridad con una matriz ortogonal real Ec. (12.140) y luego un reescalamiento (12.144).
La primera transformacion comporta una rotacion de ejes a los ejes principales en donde el elipsoide asociado
a T queda en su forma normal, la segunda transformacion no involucra una rotacion de ejes, sino un cambio
de escala de los ejes yi . Lo que hace tal reescalamiento es estirar o comprimir los ejes principales de modo que
el elipsoide se convierta en una esfera.
Ahora nos preguntamos que le hace estas transformaciones a la forma cuadratica positiva V . Hagamos las
mismas transformaciones sobre las coordenadas asociadas a V
w B ; x Dw x = DB (12.148)
la inversa sera
e 1 x
= (DB)1 x = BD
eD1 B
e = x
1
D 1 ij = p ij
Cj
donde hemos usado que D es diagonal y por tanto es simetrica y su inversa se obtiene con el recproco de los
elementos diagonales ver Ec. (12.146). La composicion de estas dos transformaciones no diagonaliza en general
a V, pero la forma cuadratica V queda de la forma
h i
2V = e V = x eD1 B V BD e 1 x = x e D1 BVBD e 1 x
322 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
es simetrica, adicionalmente todas las matrices involucradas son reales luego M es simetrica y real. Notese
que en general el producto BVB e no necesariamente es diagonal, ya que la diagonalizacion de V con la misma
transformacion de congruencia, solo esta garantizada si tal transformacion diagonaliza a T a la identidad. Sin
embargo, la matriz B diagonaliza a T pero no la convierte en la identidad (esto solo ocurre si T ya es la
identidad). No obstante, el hecho de que V se escriba
eMx
2V = x
siendo M simetrica y real nos garantiza que existe una transformacion ortogonal real F que diagonaliza a M
por medio de una transformacion de similaridad
e
= Fx x = F x e
e = F (12.150)
e
eMx = FM
2V = x F e = i i i
e = (12.151)
como la idea es diagonalizar a las dos matrices T y V con la misma transformacion, debemos realizar esta ter-
cera transformacion en las variables asociadas a T (que son las zi luego de las dos transformaciones anteriores),
para lo cual definimos unas nuevas variables i asociadas a T
= Fz (12.152)
2T = e e F
z1z = F1 e
e = 1
vemos que esta ultima rotacion no afecta la estructura de la forma cuadratica definida positiva T , de modo
que el tensor sigue siendo representado por la identidad. Geometricamente, esto se ve con el hecho de que la
esfera asociada no establece ninguna diferencia cuando se rotan los ejes. Aqu tenemos entonces la explicacion
de porque una matriz definida positiva y otra positiva se pueden diagonalizar simultaneamente: la superficie
asociada a la forma cuadratica definida positiva es un elipsoide que se puede transformar en una esfera me-
diante dos transformaciones sucesivas, una rotacion ortogonal de ejes seguido de un reescalamiento de ejes.
Aunque esta transformacion no diagonaliza a V, nos permite hacer una transformacion ortogonal adicional ya
que cualquier rotacion adicional sigue definiendo ejes principales para la esfera. Esta libertad para rotar los
ejes sin romper la estructura cuadratica de T (i.e. sin cambiar la representacion para T) es la que permite
diagonalizar a V. En resumen, la diagonalizacion de las dos formas cuadraticas se realiza comenzando con una
transformacion ortogonal real B que diagonaliza a T seguida de un rescalamiento de ejes D que lo trivializa,
y otra transformacion ortogonal F que no cambia la representacion de T. Por el lado de V las dos primeras
transformaciones no diagonalizan a V pero la matriz resultante resulta ser simetrica y real lo cual posibilita
la diagonalizacion de esa matriz a traves de la ultima transformacion F.
En aras de organizar la informacion resumiremos los resultados aqu obtenidos: hemos partido de dos
formas cuadraticas en terminos de las variables , descritas por la Ec. (12.134)
1 1
T = e T ; V= e V
2 2
donde la matriz T es definida positiva y la matriz V es positiva, ambas son simetricas y reales. Hemos reescrito
estas formas cuadraticas en terminos de nuevas variables , que denominamos coordenadas normales en
virtud de que en ellas la forma cuadratica se desacopla segun se ve en las Ecs. (12.137, 12.138)
1e 1 1e 1
V = = k k k ; T = = i i
2 2 2 2
la transformacion que nos lleva de las coordenadas originales a las normales se puede rastrear en las Ecs.
(12.139, 12.147, 12.152) y las Ecs.(12.148, 12.150)
Y comparando (12.153) con (12.135), vemos que la matriz de transformacion que nos lleva desde las
coordenadas originales a las normales viene dada por
A1 = FDB A = BD e
e 1 F (12.154)
donde hemos usado el hecho de que B y F son ortogonales. Por otro lado la matriz que transforma a T y V
se obtiene facilmente de (12.149, 12.151)
g ^
e = FD1 BVBD
= FMF e = FD1 BVB
e 1 F eD e = FD1 B V FD
1 F 1
B (12.155)
^
A = FD1 e 1 F
B = BD e
e FD1 B
A e
; AVA = e
; ATA =1 (12.157)
es facil demostrar que A es ortogonal si y solo si D1 es ortogonal. Puesto que en general D1 no es orto-
gonal, tampoco lo sera A, con lo cual las transformaciones de congruencia (12.127, 12.130) no son en general
transformaciones de similaridad. Es facil tambien ver las condiciones necesarias y suficientes para que D1 sea
ortogonal. Imponiendo la condicion de ortogonalidad (12.51) a D1 resulta
D1 ij
D1 ik
= jk ij ik = jk jk = Ci jk Ci = 1
Ci Ci
es decir D1 es ortogonal si y solo si Ci = 1 para todo i, esto implica que todos los valores propios de T
son iguales a la unidad, de modo que T debe ser la identidad. Esto tambien puede verse teniendo en cuenta
que si A es ortogonal, entonces T es equivalente a la identidad (ya que 1 y T estaran conectados por una
transformacion de similaridad), y la identidad
solo es equivalente consigo misma.
Si T = C1 es facil ver que D1 = 1/ C, de modo que todos los ejes se reescalan de la misma forma.
Geometricamente, puesto que T es proporcional a la identidad, la forma cuadratica T ya es una esfera en la
base de coordenadas original29 , de modo que solo tenemos que normalizar el radio de la esfera para que T
se diagonalice a la identidad, por lo cual el factor de escala es el mismo para todos los ejes. Notese que esta
transformacion no es de similaridad, ya que los valores propios de T = C1 son diferentes a los de la identidad
a menos que C = 1.
Notese que si las dos formas cuadraticas son positivas pero ninguna es definida positiva, entonces la forma
normal de las cuadraticas es tambien de la forma (12.142), pero en virtud del teorema 15 por lo menos uno
de los coeficientes es nulo, esto imposibilita que en general esta superficie defina un elipsoide que se pueda
convertir en una esfera con un reescalamiento. Es por esto que por lo menos una de las formas cuadraticas debe
ser definida positiva. Por ejemplo, si uno o mas de los coeficientes en (12.142) es cero, la ecuacion define un
elipsoide de menor dimension que solo se puede convertir en una esfera tambien de menor dimension. Tomemos
el caso tridimensional, si uno de los coeficientes es cero entonces la ecuacion define una elipse que se convierte
en crculo, pero un crculo no permanece invariante ante una rotacion arbitraria de ejes en tres dimensiones.
La tercera rotacion se puede usar para diagonalizar digamos a V1 , pero V2 queda en general no diagonal, si
intentamos una cuarta rotacion para diagonalizar a V2 ocurre en general que se estropea la diagonalizacion de
V1 . Esto debido a que no se puede convertir a V1 o V2 en una esfera de la dimension del espacio, que quede
invariante bajo rotaciones.
Si tenemos dos formas definidas positivas T1 , T2 y una positiva V , es evidente que se podran diagonalizar
las tres formas simultaneamente cuando las superficies elipsoidales estan orientadas de la misma forma y
sean semejantes (i.e. los cocientes entre sus ejes tomados digamos en orden ascendente son todos iguales). Lo
primero asegura que la misma reorientacion de ejes lleva ambos elipsoides a su forma normal y lo segundo
asegura que el mismo reescalamiento convierte en esferas a las dos formas cuadraticas definidas positivas.
Al tener dos esferas para T1 y T2 tenemos libertad para rotar y diagonalizar la tercera forma cuadratica sin
romper la diagonalizacion de las otras dos. En terminos algebraicos, podemos diagonalizar simultaneamente
a dos matrices definidas positivas T1 , T2 y una matriz positiva V , cuando (a) T1 es diagonal si y solo si T2 es
(1) (2)
diagonal. (b) Si i , i son los valores propios ordinarios de T1 y T2 respectivamente, entonces30
(2)
i
(1)
=C para i = 1, . . . , n
i
siendo C una constante independiente de i. Estas dos condiciones son equivalentes a la ecuacion
T2 = CT1 (12.158)
Va(k) = k T1 a(k)
a pesar de que en el analogo geometrico C sera positiva, es obvio que esto es valido para una constante
arbitraria, incluso compleja.
kxk2 = (x, x) = x
eTx 0 , x Rn
y solo es cero para x = 0. Por tanto, el tensor metrico tiene que ser definido positivo como efectivamente
supusimos para T.
30
Esta notacion se utiliza para no confundir estos valores porpios con los valores propios modificados de V dados por Va = Ta.
12.15. INTERPRETACION GEOMETRICA DE LA DIAGONALIZACION DE DOS MATRICES 325
En un enfoque activo, los vectores propios a(k) son ortonormales, pero en un espacio de Riemann que no
es necesariamente cartesiano (un espacio que no es plano sino curvo)31 . En un espacio de Riemann se define
el elemento de longitud de camino en la forma
donde los gik son elementos del tensor metrico G del espacio. En dicho espacio se define un producto escalar
inducido por el tensor metrico (ver Ec. 12.88)
eGy
(x, y) = x y = xi gij yj = x ; gij (vi , vk )
siendo vi los vectores de la base elegida. Este tensor induce a su vez una norma o modulo para los vectores
kxk2 (x, x) = x
eGx 0 (12.161)
y por las mismas razones anteriores, esto conduce a que el tensor metrico debe estar representado por una
matriz definida positiva. Adicionalmente, se ve de su definicion que es una matriz simetrica real. Si el espacio
se vuelve plano (cartesiano), el tensor metrico se reduce a la identidad.
Aunque usualmente nos referiremos a la interpretacion activa, cada parte del desarrollo subsecuente tiene
tambien su interpretacion en el enfoque pasivo. Podemos decir que la matriz T cumple con las propiedades
de un tensor metrico ya que el modulo de un vector sera no negativo y es nulo solo si corresponde al vector
nulo. T es por definicion una matriz simetrica real y definida positiva como lo es el tensor metrico. En otras
palabras, en un espacio de configuracion en el cual T sea el tensor metrico, el termino e
aTa define una norma al
cuadrado para un vector en el espacio de configuraciones. En tal espacio, la Ec. (12.127) o las correspondientes
ecuaciones por vectores componentes (12.125, 12.126), representan
una condicion de ortonormalidad.
Veamos primero como hacer el cambio de una base viT que no es ortonormal a otra base viI que s es
ortonormal. Escribamos el producto interno para el espacio de Riemann con tensor metrico T
eTy = x
(x, y) = x e B1 B T B1 B y
elijamos a B como una matriz ortogonal real. Dado que T es una matriz simetrica real, siempre es posible
encontrar una matriz ortogonal real que la diagonalice, por tanto para una eleccion apropiada de B se tiene
(x, y) = x e BTB1 By = (Bx)C
eB ] (By) = x ea Cya
(x, y) = x ea Cya ; xa Bx
eTy = x (12.162)
donde C es una matriz diagonal. La Ec. (12.162) nos muestra que la transformacion de coordenadas inducida
por B nos lleva a un tensor metrico C diagonal
Cij = via , vja = ij Ci
donde los Ci son los valores propios de T. Esto quiere decir que los vectores que forman la nueva base son
ortogonales pero no estan normalizados, es decir su norma no es la unidad. Esto es logico, ya que si la base
original no estaba normalizada, una transformacion ortogonal real la puede reorientar para volverla ortogonal
pero no puede cambiar su norma. Esto nos indica que el proceso de normalizacion no se puede llevar a cabo
con una transformacion ortogonal real.
Si cada Ci es diferente, tenemos que cada vector base tiene norma diferente (que corresponde a Ci ).
Pasemos ahora a una base normalizada
a p va va p
a a a a a a a a j
(x, y) = x e Cy = xi Cij yj = xi vi , vj yj = Ci xi i , Ci yja
Ci Ci
b b b b
(x, y) = xi v bi , v
bj yj
31
En este caso, un enfoque pasivo se refiere a un cambio de base dentro del mismo espacio Rn , y un enfoque activo se refiere a
una transformacion del espacio como tal.
326 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
donde D es la matriz de reescalamiento descrita en las Ecs. (12.146, 12.147). Tenemos que el tensor metrico
es ahora la identidad
(x, y) = xbi yib = x
e b yb = x
eb 1yb
hemos partido de una base que no es ortogonal ni normal para llegar a una base ortonormal. Esto se hizo
con dos transformaciones: la primera es una transformacion asociada a una matriz ortogonal que convierte
la base original en una base ortogonal pero que no esta normalizada. La segunda es una transformacion de
escala que se usa para normalizar los vectores de la base ortogonal, los factores de escala son efectivamente
las normas de los vectores de la base ortogonal. El tensor metrico asociado es ahora la identidad. Notese que
aqu podramos realizar una tercera transformacion con cualquier matriz ortogonal real y el tensor seguira
siendo la identidad ya que esta matriz me convertira una base ortonormal en otra base ortonormal. Hagamos
entonces una transformacion ortogonal real F que mas adelante se elegira de forma adecuada.
(x, y) = x eb 1yb = x e
eb F1Fy b
= ^ Fxb 1 Fyb
ec 1yc ;
(x, y) = x xc Fxb
Bx = xa , DBx = xb Nx = xb ; N DB (12.164)
c c
FDBx = x Rx = x ; R FDB (12.165)
donde hemos usado el caracter simetrico de D. Notese que dado que D y C son ambos diagonales, entonces con-
mutan entre s de modo que D1 CD1 = D2 C = 1. Se puede ver entonces que el algoritmo de trivializacion
del tensor metrico es
h i h i
T BTB e D1 BTB e D1 F D1 BTB e D1 F e = F D1 BTB e De 1 F e
h i h i
= F D1 B T(D ^1 B) F e F KTK e F ^ WTW
e = (FK) T(FK) f
T Ta Tb Tc e , Tb KTK
; Ta BTB e , Tc WTW
f (12.166)
1 1
con K D B ; W FD B (12.167)
12.15. INTERPRETACION GEOMETRICA DE LA DIAGONALIZACION DE DOS MATRICES 327
como esto es valido para x, y arbitrarios se tiene que despues de las dos primeras transformaciones donde el
tensor metrico ya se ha trivializado, el producto interno se escribe
eTy = x
(x, y) = x eb 1yb = x
eNe KTK e Ny
K es entonces la primera transformacion que trivializa al tensor metrico. Veamos como se comporta V ante
esta misma trasnformacion
V KVK e
en virtud de la simetra de V y del hecho de que todas las matrices que intervienen son reales, es claro que esta
nueva matriz es simetrica y real. Por tanto puede ser diagonalizada por alguna matriz ortogonal real. Esgogemos
entonces la matriz ortogonal real F de modo que diagonalize a V. Recordemos que esta transformacion continua
dejando trivial al tensor metrico de modo que las dos matrices T y V quedan diagonalizadas una vez se ejecuta
la tercera transformacion
V F KVK e F e = WVW f =
e
AVA e W = FD1 B
= ; A (12.168)
la matriz de diagonalizacion esta entonces dada por la Ec. (12.168) que coincide con la Ec. (12.157). Notese
que la diagonalizacion de V a traves de A no nos da los valores propios de la ecuacion normal de valores
propios ya que esta matriz contiene una transformacion de reescalamiento. En consecuencia, la transformacion
de congruencia no es de similaridad y no se conservan los valores propios usuales en el proceso. Solo en el
caso en el cual T = 1, obtendremos los vectores y valores propios usuales.
Con base en lo anterior, podemos dar una interpretacion geometrica a la diagonalizacion simultanea de
T y V a traves de A. La transformacion (12.127) corresponde a una transformacion lineal de un sistema de
ejes que no son ortogonales ni normales para pasar a un sistema de ejes ortogonales y normales, a traves de
tres pasos. En el primer paso se hace una transformacion ortogonal que me produce una base ortogonal pero
no normal (tensor metrico diagonal), en el segundo paso se realiza un reescalamiento que me normaliza los
vectores. Con estos pasos se consigue una base ortonormal lo cual equivale a trivializar al tensor metrico T. En
cuanto a la matriz V estas dos transformaciones no la diagonalizan pero la mantienen simetrica y real. Esto
implica que una transformacion ortogonal adicional (tercer paso) puede diagonalizar a V, y al mismo tiempo
mantener inalterada la forma del tensor metrico, ya que una matriz ortogonal me lleva de una base ortonormal
a otra base ortonormal. Obtenemos entonces un conjunto de ejes principales comunes para T y V.
Cuando se presenta degeneracion el numero de ecuaciones independientes entre los valores propios resulta
insuficiente para determinar los cocientes entre componentes de un vector propio. Por ejemplo, si es una
raz doble, se podran elegir de forma arbitraria dos componentes cualesquiera aj , y las demas se determinan a
traves de las ecuaciones de valores propios. Recordemos ademas que degeneracion corresponde a una simetra
del sistema, cuanto mas degenerados son los valores propios, mas libertad existe de escoger los vectores propios,
es decir aumentan las transformaciones que dejan invariante al sistema. De nuevo esto tambien se puede ver
teniendo en cuenta que a mayor degeneracion de un dado, mayor es la dimensionalidad del subespacio
generado por , y por tanto mayor el numero de vectores propios linealmente independientes. Esto tambien
implica mayor libertad para escoger una base de vectores propios que genere al mencionado subespacio.
Finalmente, incluso si nos restringimos a trabajar en el espacio plano Rn , podemos tener una interpretacion
activa de la ecuacion de valores propios modificada. Por ejemplo, en el problema de los osciladores acoplados
se llega a la ecuacion de valores propios modificada en la cual T representa la matriz de energa cinetica y V
representa al potencial, en este problema ambas matrices son activas.
328 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
A este conjunto lo denominaremos O (3) para denotar que consta de matrices Ortogonales en 3 dimensiones.
Veremos algunas propiedades de este conjunto. Sean A, B O (3), la transpuesta del producto de estas
matrices es
e AB
C g =B eAe = B1 A1 = (AB)1 = C1
de modo que el producto de dos matrices ortogonales reales es tambien ortogonal real. Por otro lado, es bien
conocido que el producto matricial es asociativo, por lo tanto lo es en particular para las matrices ortogonales
reales. Adicionalmente, es obvio que la matrix identidad es una matriz ortogonal, de modo que la identidad
esta contenida en el conjunto. Finalmente, dado que el determinante de estas matrices no es cero, existe la
matriz inversa de cada una, y es facil demostrar que A1 tambien es ortogonal real32
] 1
^
(A1 ) = Ae = A = A1 1 ; det A1 = = 1
det A
vale anotar que el producto de dos matrices ortogonales
3
X
C = AB ; Cij = Aik Bkj
k=1
es en general no-conmutativo. Geometricamente, esto tendra como consecuencia el hecho de que las rotaciones
en tres dimensiones no conmutan entre s, como veremos mas adelante. Lo anterior se puede sintetizar en la
siguiente forma
Theorem 17 Sea O (3) {Ai } el conjunto de todas las matrices reales 3 3 que cumplen con las condiciones
(12.169). Si definimos al producto matricial como ley de combinacion entre matrices de O (3), tenemos que
Lo anterior significa que el conjunto O (3) es un grupo cuando usamos la multiplicacion de matrices
como ley de combinacion, ya que los tems arriba mencionados corresponden a los axiomas que definen a un
grupo matematico. Es facil demostrar que el subconjunto de todas las matrices ortogonales de determinante +1,
tambien cumple con las propiedades de grupo (i.e. es un subgrupo de O (3)) y se denomina el grupo ortogonal
especial en tres dimensiones SO (3). En contraste, el subconjunto de las transformaciones ortogonales de
determinante 1 no forma un grupo. Notese que SO (3) da cuenta de todas las transformaciones ortogonales
contnuas (rotaciones), en tanto que O (3) da cuenta ademas de las transformaciones de inversion y de la
combinacion entre inversion y rotacion.
aunque todas las transformaciones que consideraremos en esta seccion son pasivas, omitiremos la notacion (r)
y la escribiremos simplemente como r . Vamos a tomar al vector posicion como un prototipo para la definicion
de vectores cartesianos
Definition 18 Una cantidad fsica v se denomina un vector cartesiano (o euclidiano) si se puede representar
por una tripla (v1 , v2 , v3 ) R3 de numeros reales, que bajo una transformacion pasiva A del grupo SO (3),
cambia sus componentes en la forma
Notese que la definicion de vector cartesiano esta referida a un grupo de simetra del espacio tiempo. Si
adjuntamos dos vectores v, w la transformacion de dicha yuxtaposicion se escribe de la forma
donde v(i) denota al iesimo vector. Esta yuxtaposicion tendra 3N componentes (en 3 dimensiones).
Definition 19 Por extension, diremos que un tensor cartesiano de SO (3) (o euclidiano) T de rango N en
el espacio cartesiano tridimesional, es una cantidad constituda por 3N componentes reales que denotamos
por Ti1 i2 ...iN (i.e. con N ndices), donde ik = 1, 2, 3; y que bajo una transformacion ortogonal A SO (3),
transforma bajo el esquema
Ti1 i2 ...iN = ai1 j1 ai2 j2 . . . aiN jN Tj1 j2 ...jN (12.172)
lo cual es una emulacion directa de la propiedad de transformacion (12.171) que posee una yuxtaposicion de
N vectores cartesianos. Sin embargo, el tensor Ti1 i2 ...iN es una entidad independiente definida por la propiedad
de transformacion (12.172) y no necesariamente proviene de una yuxtaposicion de vectores.
330 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
Por la forma en que ha sido construda esta definicion, es inmediato que un vector cartesiano o euclidiano
es un tensor de primer rango.
Es bien sabido que el producto punto entre dos vectores de R3 es un numero real. Nos preguntamos ahora
por sus propiedades de transformacion bajo SO (3). Para verlas, usamos las propiedades de transformacion de
los vectores cartesianos bajo dicho grupo
el producto punto es invariante ante una transformacion de SO (3). Esto nos induce a construr la siguiente
definicion
Definition 20 Denominaremos tensor cartesiano de rango cero o escalar, a una cantidad fsica real que es
invariante bajo transformaciones del grupo SO (3) (rotaciones). El ejemplo mas claro es el producto punto
entre dos vectores cartesianos y en particular la norma de un vector.
en rigor, es necesario distinguir entre un tensor de segundo rango T y la matriz cuadrada formada por sus
componentes. Un tensor esta definido solo por sus propiedades de transformacion ante una transformacion
ortogonal de coordenadas. En contraste, una matriz no esta restringida de ninguna forma por los tipos de
transformacion que pueda experimentar y se puede considerar totalmente independiente de sus propiedades
bajo un tipo particular de transformacion. Una matriz es simplemente un arreglo de elementos con un algoritmo
de suma y multiplicacion. Tales arreglos junto con sus algoritmos sirven para expresar de manera sintetica
cualquier transformacion lineal aplicada sobre cierto espacio (no necesariamente vectorial). De la misma forma,
un arreglo en columna no es necesariamente un vector Euclidiano, pero esta bien definido el producto del arreglo
matricial con el arreglo vectorial. Incluso las matrices se pueden definir por s solas con sus propiedades de
suma, producto, inversa etc. formando estructuras matematicas tales como grupos, anillos etc. En contraste,
los tensores siempre estan ligados a un espacio vectorial o a una variedad.
Vale decir sin embargo, que si una matriz representa una transformacion activa sobre un espacio vectorial,
los componentes tensoriales y matriciales se manipulan en la misma forma al menos dentro del dominio
restringido a las transformaciones ortogonales. Para toda ecuacion tensorial habra una ecuacion matricial
correspondiente y viceversa. La Ec. (12.34) nos indica la manera en que transforma una matriz que representa
a un operador lineal en un espacio vectorial, cuando hacemos un cambio de base (cambio de sistema coordenado)
T = ATA1
siendo A la matriz que genera el cambio de coordenadas (transformacion pasiva). La nueva matriz T representa
al mismo operador en una base diferente. Si la transformacion es ortogonal se tiene
e
T = ATA
en cambio no hay una manera natural geometrica de inducir la misma transformacion en una matriz que
juega el rol de cambio de base. En este punto queda quizas mas claro el hecho de que las matrices y sus
algoritmos se pueden trabajar sin saber que estan representando, pero para conocer sus eventuales propiedades
de transformacion es necesario saber en que espacio actuan y sobre que objetos (e.g. los vectores o el sistema
coordenado).
En virtud de la analoga entre las propiedades de los tensores de segundo rango y las matrices activas,
podemos deducir que la misma terminologa derivada del algebra matricial (traspuesta, antisimetrica etc.)
sera de gran utilidad tambien en el algebra de tensores de segundo rango. De igual modo, en el algebra de
tensores de primer rango, podemos usar formas de vector fila y columna para las manipulaciones algebraicas.
r = Bp r = Bi r
y como la transformacion de r bajo una matriz ortogonal propia es simplemente r = Bp r, podemos escribir
genericamente
r = Br ; B O (3) (12.173)
a toda tripla de R3 cuyas propiedades de transformacion bajo el grupo O (3) sean las dadas por la Ec. (12.173),
la denominaremos vector cartesiano polar o simplemente vector polar.
Ahora si tomamos como prototipo al vector asociado a una matriz real antisimetrica 3 3, vemos que sus
propiedades de transformacion bajo un elemento del grupo O (3) vienen dadas por la Ec. (12.70)
vA = (det B) BvA ; B O (3) (12.174)
a los vectores que transforman como vA bajo O (3), los denominamos vectores cartesianos axiales. Bajo
SO (3), los vectores polares y axiales transforman de manera identica, y su diferencia esta solo en el com-
portamiento bajo paridad de modo que solo se manifiesta bajo O (3). Los vectores polares cambian su signo
con la transformacion de paridad en tanto que los vectores axiales son invariantes ante una transformacion de
paridad.
Por otro lado, inspirados en la definicion de tensores de SO (3) de rango N , podemos definir tensores de O (3)
como una yuxtaposicion de vectores de O (3). En este caso es sin embargo necesario estudiar el comportamiento
de estos tensores bajo paridad. Comenzaremos estudiando los tensores de rango 2. Si yuxtaponemos dos vectores
polares es claro que el tensor resultante es invariante bajo paridad, ya que cada vector de la yuxtaposicion
invierte el signo bajo paridad. Similarmente, la yuxtaposicion de dos vectores axiales es invariante bajo paridad.
Si en cambio yuxtaponemos un vector polar con uno axial, el tensor resultante invierte su signo bajo paridad.
Definiremos un tensor cartesiano polar de rango N , como aquel que bajo O (3) se comporta como la
yuxtaposicion de vectores polares. Por tanto un tensor polar de rango N se comporta bajo O (3) en la forma
Un tensor cartesiano axial o pseudotensor sera aquel que transforme bajo paridad con el signo opuesto
con respecto a un tensor polar. Esto equivale a decir que bajo una transformacion impropia el signo debe
332 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
cambiar con respecto al de un tensor polar, pero bajo una transformacion propia debe transformar de manera
identica a un tensor polar. Por tanto, la regla de transformacion de un pseudotensor es
TiS
1 i2 ...iN
= (det A) ai1 j1 ai2 j2 . . . aiN jN TjS1 j2 ...jN ; A O (3)
podemos escribir las propiedades de transformacion de un tensor de O (3) de rango N en la siguiente forma
sintetica
cuando p = 0 decimos que el tensor es polar y cuando p = 1 decimos que es un tensor axial o pseudotensor.
Sea un tensor cartesiano formado con la yuxtaposicion de N vectores, donde k vectores de la yuxtaposicion
son axiales (k N ). Es facil probar que el tensor sera polar si k = 2n, y sera axial si k = 2n + 1, siendo
n un entero no-negativo. Debemos recordar sin embargo que un tensor no necesariamente proviene de una
yuxtaposicion de vectores.
Veamos ahora los escalares. Tomaremos como prototipo de escalar al producto punto entre dos vectores
polares. Bajo paridad dicho producto punto es invariante. Es natural entonces definir un pseudoescalar como
un numero que bajo paridad invierta su signo. El prototipo inmediato de pseudoescalar es entonces el producto
punto entre un vector polar y un vector axial.
De acuerdo con la definicion 21, los vectores axiales son pseudotensores de primer rango y los pseudoesca-
lares son pseudotensores de rango cero.
Vemos entonces que tensores cartesianos se refiere a tensores asociados al grupo SO (3) o al grupo O (3)
si queremos distinguir quiralidad. Existen tensores definidos para otros grupos de simetra del espacio-tiempo,
tales como los tensores de Minkowski, que se relacionan con el grupo de Lorentz. En el espacio Rn con
coordenadas cartesianas, no existe diferenciacion entre los ndices covariantes y contravariantes, de modo
que no se emplea esta terminologa propia de los tensores de Minkowski. Los tensores desarrollados en esta
seccion estan construdos en una base cartesiana de Rn y deben llamarse tensores Cartesianos. Sin embargo,
emplearemos la simple denominacion de tensor mientras no se presente ambiguedad.
en orden anticclico
Tijk = (det A) aip ajq akr pqr = (det A)2 = 1 = ijk ; (i, j, k) (1, 3, 2) , (2, 1, 3) , (3, 2, 1)
=
ademas Tijk ijk = 0, cuando hay ndices repetidos tales como (1, 1, 2) , (2, 2, 2) , (3, 1, 3) etc. Conclumos
que
Tijk = Tijk = ijk
lo cual demuestra que si un pseudotensor cartesiano de tercer rango Tijk coincide numericamente con ijk en
una base dada, coincidira con el en cualquier otra base33 . Podemos ver que el factor det A en (12.176) es
crucial para obtener la misma forma numerica del Levi Civita cuando se cambia de base.
Es mucho mas facil demostrar que ij es un tensor polar de segundo rango. El pseudotensor de Levi-
Civita y el tensor polar de Kronecker son ejemplos un tanto paradojicos de tensores, ya que sus propiedades
de transformacion (no triviales) ante O (3), garantizan su invarianza ante una transformacion de dicho grupo.
esto nos lleva a construr el concepto de afinor, como una combinacion lineal de diadas
y la diada se puede ver como un afinor construdo con la yuxtaposicion de los vectores base. Hemos supuesto
implcitamente propiedades de distributividad y de producto por escalar (linealidad). Se puede definir el
producto punto doble de la siguiente forma
A (CD) B (A C) (B D) (12.181)
este doble producto punto s es un producto escalar. La diada identidad se construye en la forma
1 ui ui (12.182)
donde ui son los vectores unitarios de una base ortonormal. Es facil ver su caracter de identidad con los
algoritmos que acabamos de establecer
A1 =1A=A ; A1A=AA
33
Bajo O (3) tambien se incluyen cambios de base en los cuales cambia la quiralidad de los ejes.
334 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
al igual que las matrices, las diadas y afinores son algoritmos de calculo que permiten clarificar las operaciones
con tensores de segundo rango. Sin embargo, es el tensor el que tiene significado geometrico y el algoritmo
puede cambiar si usamos por ejemplo bases diferentes a las cartesianas (en donde los conceptos de covarianza
y contravarianza adquieren sentido) o definimos tensores en espacios mas generales. Por el momento, notemos
que si definimos la diada a traves de dos ndices (cada uno correspondiente a un vector) i.e.
AB Ai Bj Tij
podemos escribir el algebra de diadas y afinores en terminos de ndices
K (AB) = (K A) B = Ki Ai Bj
K T = Ki Tij
similarmente
T K = Tij Kj ; D T K = Di Tij Dj
en todos los algoritmos hay suma sobre ndices repetidos.
donde hemos usado la definicion de Rj Ec. (12.183). La Ec. (12.184) nos muestra que efectivamente, la con-
traccion definida en (12.183) corresponde a un tensor de primer rango. En todo lo anterior hemos asumido
implcitamente tensores de SO (3). Si por ejemplo Tij es un pseudotensor de O (3) y Ki es un vector polar de
O (3), se puede demostrar con una transformacion ortogonal impropia, que el resultado de la contraccion es un
pseudovector o vector axial. Se deja al lector la demostracion general para la contraccion de tensores de rango
arbitrario, y la demostracion de que la contraccion es un tensor polar (axial) si el numero de pseudotensores
en la contraccion es par (impar).
Por otro lado, consideremos el conjunto de ecuaciones
Ki Ci = B (12.185)
Kij Cj = Bi (12.186)
Kij Cjk = Bik (12.187)
Kijkl Cij = Bkl (12.188)
Kij Ck = Bijk (12.189)
donde en cada expresion, C y B son tensores cartesianos de rangos indicados por los ndices, y C es arbitrario.
En cada caso K es una cantidad desconocida. La llamada regla del cociente establece que si la ecuacion en
cuestion es valida en todo sistema (rotado) cartesiano de coordenadas, K es un tensor cartesiano del rango
indicado por sus ndices.
Probaremos la regla del cociente (12.186) a manera de ilustracion. Sea A la matriz ortogonal que nos lleva
de un sistema no primado de coordenadas a un sistema primado de coordenadas. En el sistema cartesiano
primado tenemos
Kij Cj = Bi = aik Bk
donde hemos usado las propiedades tensoriales de B. Puesto que la ecuacion es valida en todo sistema cartesiano
rotado, podemos asumir su validez en el sistema coordenado no primado
e tenemos
y transformando C de nuevo al sistema cartesiano primado (por medio de A1 = A)
Kij Cj = aik Kkl Cl = aik Kkl ajl Cj
Kij aik ajl Kkl Cj = 0
esto debe ser valido para cada ndice i y para todo sistema coordenado primado, y dado que Cj es arbitrario34
resulta
Kij = aik ajl Kkl (12.190)
que es la definicion de un tensor de segundo rango. Vale mencionar sin embargo que es importante que B sea
diferente de cero. Las otras reglas de cociente se demuestran en forma similar.
12.22. Ejercicios
1. Para las matrices dadas por
3 2 1 1 4 2 6 2 1
A= 0 2 7 ; B = 3 0 9 ; C = 9 5 1
1 6 4 1 1 2 3 2 4
34
Por ejemplo si tomamos Cj = 1j se sigue de inmediato que Ki1
= aik a1l Kkl . Otras escogencias adecuadas nos dan el resto de
Ecs. (12.190).
336 CAPITULO 12. INTERLUDIO: MATRICES, VECTORES Y TENSORES
encuentre los productos AB y BA y muestre que AB 6= BA. Calcule T r (AB) y T r (BA). Demuestre
explcitamente que
pero
T r (ABC) 6= T r (BAC)
explique este hecho.
4. Demuestre que la delta de kronecker es la unica representacion posible de la matriz identidad en cualquier
base.
A = BAB1
donde B es la matriz que representa al operador pasivo que nos lleva de XY Z hacia X Y Z . (a) De-
muestre que la relacion entre A y A , es una relacion de equivalencia. (b) Discuta la necesidad de que
esta relacion deba ser de equivalencia.
[A, B] AB BA
cumple las propiedades dadas por las Ecs. (8.9-8.12), en donde los parentesis cuadrados significan con-
mutador en lugar de corchete de Poisson. Este hecho nos muestra la similaridad entre el algebra de los
conmutadores y la de los corchetes de Poisson.
8. Sea V E n un subespacio vectorial de E n de dimension k. Sea {e1 , . . ., ek } una base del subespacio V ,
(no necesariamente ortonormal). En el proceso de ortogonalizacion de Gram-Schmidt construmos un
conjunto ortonormal {u1 , . . ., uk } que genera al mismo espacio V con el siguiente algoritmo
a) Construmos una base ortogonal (no necesariamente normalizada) {d1 , . . ., dk }, para lo cual elegimos
d1 = e1 y d2 se construye en la forma
(e2 , d1 )
d2 = e2
(d1 , d1 )
12.22. EJERCICIOS 337
9. Demuestre que utilizando la multiplicacion matricial como ley de combinacion, el subconjunto de O (3)
de matrices con determinante +1 forma un subgrupo de O (3), pero el subconjunto de matrices de O (3)
con determinante 1, no forma un subgrupo.
10. Demuestre que el delta de Kronecker ij es un tensor polar de segundo rango.
11. Demuestre que la contraccion de tensores cartesianos arbitrarios, da como resultado un tensor de rango
igual al numero de ndices libres que quedan despues de la contraccion. Demuestre que el tensor resultante
es polar (axial) si el numero de pseudotensores en la contraccion es par (impar).
12. Demuestre las reglas del cociente Ecs. (12.185-12.189).
13. Un vector de O (3) se comporta bajo paridad en la forma
b = V
PV
segun si el vector es polar o axial. Puede decirse que un vector de O (3) es un vector de SO (3) que
ademas es autovector del operador paridad, con valor propio 1 si el vector es polar, y +1 si el vector
es axial. (a) Demuestre que el operador paridad es un operador lineal hermtico y autoinverso ya que
cumple la condicion Pb 2 = 1 o equivalemente P
b =P b 1 . (b) Demuestre que los valores propios permitidos
para un operador lineal hermtico autoinverso son = 1.
14. Demuestre que si V1 es polar y V2 es axial entonces V = V1 + V2 no es un autovector del operador
paridad. En otras palabras, V no es un vector de O (3) (aunque si es un vector de SO (3)). Esto implica
en particular, que el conjunto de todos los vectores de O (3) mas el vector nulo, NO forman un espacio
vectorial. En una teora que conserva paridad, los vectores observables son vectores de O (3). Por esta
razon, la suma E + B de un campo electrico mas un campo magnetico (vector polar mas vector axial) no
aparece como observable en la teora electromagnetica. En general, la suma de un tensor polar de rango
n con un tensor axial de rango n, no representara un observable en una teora que conserve paridad, de
manera que solo la suma entre tensores polares o entre tensores axiales formara un observable en estas
teoras35 .
15. Demuestre que el triple producto escalar (A B) C de tres vectores polares es un pseudoescalar.
35
Por ejemplo, E2 + B2 s representa un observable importante, y claramente forma un escalar polar. Hay teoras que no
conservan paridad como es la teora de la interaccion debil en partculas elementales, para estas teoras es posible sumar tensores
con pseudotensores y obtener observables.
Captulo 13
Cinematica del cuerpo rgido
Ya hemos definido un cuerpo rgido como un conjunto de partculas cuyas distancias relativas son constantes.
La condicion de cuerpo rgido se traduce en un conjunto de ligaduras holonomas de la forma
siendo rij la distancia entre las partculas iesima y j-esima, y cij son valores constantes. Aunque esto cons-
tituye una idealizacion, la mecanica del cuerpo rgido es de fundamental importancia en muchos campos de la
Fsica. En este captulo discutiremos la cinematica del cuerpo rgido, es decir las caractersticas de su movi-
miento, para lo cual sera necesario desarrollar ciertas herramientas matematicas, que ademas seran aplicables
en muchos otros campos de la Fsica.
De particular importancia sera el movimiento de rotacion de un cuerpo rgido, el cual estudiaremos con
el formalismo de la matrices ortogonales. Dicho tipo de movimiento introducira consideraciones geometricas
relativas a la rata de cambio de un vector con el tiempo con respecto a un sistema de referencia rotante.
Posteriormente se estudiara la dinamica del cuerpo rgido, es decir la respuesta que estos sistemas producen
cuando se someten a torques y fuerzas externas.
338
13.1. COORDENADAS INDEPENDIENTES DE UN CUERPO RIGIDO 339
Figura 13.1: Orientacion relativa de un cuerpo rgido. El sistema S es inercial, S0 es un sistema cuyo origen
esta fijo en algun punto de referencia del cuerpo y cuyos ejes son paralelos a los de S. El sistema S esta fijo
al cuerpo y tiene origen comun con S0 .
de S con respecto a S (o lo que es lo mismo, con respecto a S0 ). Notese que dicho numero de grados de
libertad es independiente del numero de partculas del solido e incluso de su naturaleza discreta o contnua.
Veamos como conciliar este numero con las ligaduras enunciadas en (13.1). Hay 3N grados de libertad
superficiales debidos a las N partculas del solido. Para un numero N de partculas el numero de ecuaciones
de ligadura de la forma (13.1) viene dado por N (N 1) /2. Si intentamos simplemente sustraer el numero de
ligaduras de los 3N grados de libertad, obtenemos valores negativos (para N 8) que crecen rapidamente
en magnitud cuando aumenta N . El punto es que estas ligaduras no son todas independientes. Para fijar un
punto en el cuerpo rgido, no es necesario especificar las distancias a todos los demas puntos del cuerpo, es
suficiente con especificar su distancia a otros 3 puntos fijos al cuerpo y no colineales como se ve en la figura
13.2. Por lo tanto, una vez fijadas las posiciones de tres partculas no colineales del cuerpo, las ligaduras fijan
las posiciones de las otras. Por el momento esto nos deja con 9 grados de libertad, sin embargo, una vez fijada
la partcula 1 de referencia (3 grados de libertad) la ubicacion de la partcula 2 solo requiere dos grados de
libertad pues al estar fija su distancia a la primera, debe yacer en la superficie de una esfera centrada en la
partcula 1. Fijadas las partculas 1 y 2, la tercera debe yacer en una circunferencia cuyo centro pasa por
el eje definido por el vector relativo r12 siendo dicho vector perpendicular al crculo y la distancia entre un
punto de la circunferencia y las partculas 1 y 2 fijadas por las ligaduras (13.1), esto nos deja con un grado de
libertad necesario para fijar esta posicion (por ejemplo un angulo). Aparecen entonces seis grados de libertad
en consistencia con lo que se obtuvo con el argumento anterior. Esto se puede ver a su vez de forma mas simple
teniendo en cuenta que a los 9 grados de libertad para fijar las tres partculas se les deben restar 3 ligaduras
340 CAPITULO 13. CINEMATICA DEL CUERPO RIGIDO
Figura 13.2: Tres puntos de referencia no colineales del cuerpo rgido permiten localizar cualquier partcula
i-esima en dicho cuerpo.
independientes
r12 = c12 ; r23 = c23 ; r13 = c13
por supuesto pueden haber ligaduras adicionales tales como condiciones de rodadura, existencia de puntos fijos
etc. que pueden disminur aun mas el numero de grados de libertad independientes.
siendo uj los vectores cartesianos unitarios a lo largo de los ejes Xj , y ui los analogos para el sistema S . En
ij el primer ndice se refiere al ndice primado y el segundo al ndice no primado. La proyeccion de un vector
ui a lo largo de u1 esta dada por ui u1 de modo que la componente de ui a lo largo de u1 viene dada por
(ui u1 ) u1 de manera similar se obtienen las componentes de ui a lo largo de u2 y u3 con lo cual se obtiene
ui = ui u1 u1 + ui u2 u2 + ui u3 u3
pero recordando la definicion de los cosenos directores y usando de aqu en adelante convencion de suma sobre
ndices repetidos, se obtiene
ui = (cos ij ) uj (13.3)
con lo cual se muestra que los 9 cosenos directores determinan completamente la orientacion del nuevo sistema
coordenado X1 , X2 , X3 con respecto a X1 , X2 , X3 de S0 . El proceso es facilmente invertible para obtener a los
ui en funcion de los uj .
ui = ui uj uj = (cos ji ) uj (13.4)
Podemos escribir entonces
r = xi ui = xj uj
puesto que el vector posicion en esencia no cambia (ya que el origen es comun), solo cambian las componentes
y bases con que se mide. Claramente
xi = r ui = (xj uj ) ui = xj uj ui
xi = cos ij xj (13.5)
los cosenos directores en consecuencia permiten obtener la relacion entre las coordenadas de un punto en un
sistema con respecto a las del otro (componentes de r). Claramente el analisis anterior es extensible a otros
vectores, diferentes al vector posicion1 . La componente de un cierto vector G a lo largo de Xi viene dada por
Gxi = G ui = (Gj uj ) ui = Gj uj ui = cos ij Gj
de modo que el conjunto de los 9 cosenos directores nos da la transformacion completa entre los dos sistemas
coordenados.
Al ser los ejes primados fijos al cuerpo, los 9 cosenos directores son en general funciones del tiempo ya que
el cuerpo puede cambiar su orientacion en el curso del movimiento. En tal sentido, los cosenos directores se
pueden considerar como coordenadas que especifican la orientacion instantanea del cuerpo rgido con respecto
a S0 . Ya hemos visto sin embargo, que solo tres coordenadas son necesarias para orientar el cuerpo, de modo
que los 9 cosenos directores no pueden ser independientes. De hecho, es necesario que existan seis ecuaciones
de ligadura para obtener los tres grados de libertad requeridos. Veamos como traducir las ligaduras sobre los
cosenos directores en forma de ecuaciones. Tanto los sistemas primado como sin primar son ortogonales
ui uj = ij ; ui uj = ij (13.6)
se puede obtener una expresion analoga partiendo de expresar ui uk en terminos de cosenos directores
en cualquiera de sus formas, estas relaciones nos brindan seis ecuaciones independientes (por ejemplo se puede
imponer que i k en estas ecuaciones). Esto nos deja con tres grados de libertad independientes como
esperabamos.
En vista de lo anterior, los 9 cosenos directores no se pueden usar como coordenadas generalizadas en un
formalismo Lagrangiano o Hamiltoniano para encontrar las ecuaciones de movimiento, es necesario encontrar
tres funciones independientes de estos cosenos directores. Discutiremos mas adelante algunos de ellos siendo los
mas importantes los angulos de Euler. No obstante, los cosenos directores son de gran utilidad para estudiar
la conexion entre los dos sistemas cartesianos y expresar de una forma mas simple y general varios teoremas
relativos a los cuerpos rgidos. De igual forma permite el uso de algoritmos extendibles a la relatividad especial
y la mecanica cuantica. Por lo tanto, seguiremos trabajando en el lenguaje de los cosenos directores.
aij cos ij
las ecuaciones (13.5) constituyen un conjunto de transformaciones lineales siendo aij un conjunto de coe-
ficientes constantes (independientes de x, x ). En la nueva notacion podemos sintetizar estas transformaciones
como
xi = aij xj , i = 1, 2, 3 (13.9)
dado que los cosenos directores no son todos independientes, estas ecuaciones no definen la transformacion
lineal homogenea mas general. Las ligaduras obtenidas anteriormente se pueden ver facilmente a la luz de la
nueva notacion, teniendo en cuenta que el vector posicion tiene la misma magnitud en ambos sistemas de
referencia S y S0 en virtud de su origen comun. Esto nos conduce a la condicion
xi xi = xi xi (13.10)
que en el caso de vectores reales corresponde a la invarianza de su norma, y como se puede ver en la seccion
12.4, la transformacion lineal mas general que deja invariante la cantidad xi xi , conduce a las condiciones
La transformacion lineal (13.9) se denomina transformacion ortogonal si los coeficientes aij de la trans-
formacion satisfacen las Ecs. (13.11) conocidas como condiciones de ortogonalidad. De modo que la tran-
sicion entre las coordenadas de S0 y las de S se realizan a traves de una transformacion ortogonal. Los
coeficientes de la transformacion se pueden escribir en un arreglo matricial de la forma
a11 a12 a13
A a21 a22 a23
a31 a32 a33
13.4. ANGULOS DE EULER 343
que denominaremos matriz de la transformacion siendo los aij elementos matriciales de la transformacion.
Notese que la condicion de ortogonalidad (13.11) se puede ver mnemotecnicamente como si la matriz estuviera
constituda por 3 vectores columna ortonormales entre s i.e.
a1k
A (V1 V2 V3 ) ; Vk a2k ; k = 1, 2, 3
a3k
Vj Vk = aij aik = jk (13.13)
la cual se puede ver como una relacion de ortonormalidad entre los vectores columna arriba descritos2 .
Sin embargo, es importante enfatizar que esta es una regla mnemotecnica ya que los Vk no definen ningun
vector en el espacio. La representacion de un vector en terminos de componentes debe estar referida a una base
especfica. Estos coeficientes son realmente enlaces entre dos bases diferentes y constituyen una transformacion
que genera un cambio de base. El producto punto definido aqu es solo un algoritmo establecido para el arreglo
vectorial pero no se esta realizando el producto entre vectores unitarios bien definidos.
A manera de ejemplo, veamos el caso del movimiento en un plano. Si por simplicidad, nos restringimos a
rotacion en el plano X1 X2 entonces el eje de rotacion es el eje X3 de modo que u3 = u3 . Pensemos que en un
instante dado de tiempo el angulo entre X1 y X1 es , se tiene entonces que
a11 = cos 11 = u1 u1 = cos ; a12 = u1 u2 = cos = sin ; a13 = u1 u3 = u1 u3 = 0
2
a21 = u2 u1 = cos + = sin ; a22 = u2 u2 = cos ; a23 = u2 u3 = u2 u3 = 0
2
a31 = u3 u1 = u3 u1 = 0 ; a32 = u3 u2 = u3 u2 = 0 ; a33 = u3 u3 = 1
Figura 13.3: Conjunto de rotaciones para llegar desde los ejes X1 X2 X3 hasta los ejes X1 X2 X3 .
consecuencia buscar tres parametros independientes con los cuales se pueda escribir la matriz ortogonal de
rotacion. Estos parametros se podran usar entonces como coordenadas generalizadas independientes para un
formalismo Lagrangiano o Hamiltoniano. Por otro lado, dado que las rotaciones son transformaciones contnuas,
se sigue que ademas de las condiciones de ortogonalidad, las matrices ortogonales asociadas deben ser propias
i.e. su determinante debe ser +1.
13.4. ANGULOS DE EULER 345
Hay muchas escogencias posibles para los tres parametros independientes, siendo las mas populares los
angulos de Euler que describimos a continuacion: Queremos pasar de un conjunto de ejes coordenados ortogo-
nales X1 X2 X3 a otro conjunto de ejes ortogonales X1 X2 X3 donde ambos sistemas de ejes tienen origen comun.
Es claro que si determinamos las direcciones de los ejes X1 X2 el tercer eje esta unvocamente determinado
si la transformacion es contnua (ya que en este caso se conserva la quiralidad del sistema de ejes). Para ello
necesitamos determinar el plano en donde yace X1 X2 y algun angulo que oriente a estos ejes en dicho plano. La
figura 13.3 muestra al plano generado por X1 X2 y al plano (sombreado) generado por X1 X2 los cuales forman
un angulo diedro, y se intersectan en una lnea nodal como indica la figura 13.3. Para pasar del sistema
X1 X2 X3 al sistema X1 X2 X3 debemos llevar a los ejes X1 X2 a sus posiciones finales lo cual se puede realizar
esquematicamente en tres pasos (a) Rotar el sistema para que el nuevo eje X1 quede en el plano sombreado
(plano generado por X1 X2 ), (b) rotar el sistema para que el nuevo eje X2 entre tambien en el plano sombreado,
una vez que los nuevos ejes X1 X2 ya esten en el plano de X1 X2 el paso final es (c) hacer una rotacion de los
ejes en el plano sombreado para que tengan su orientacion final.
(a) (a) (a)
Veamos en detalle el proceso: (a) En primer lugar pasamos del sistema X1 X2 X3 al sistema X1 X2 X3
(a)
haciendo una rotacion alrededor del eje X3 en un angulo de modo que el nuevo eje X1 quede a lo largo de
(a) (a)
la lnea nodal, es decir X1 queda dentro del plano sombreado, en este caso es claro que X3 = X3 . (b) En
(a) (a) (a) (b) (b) (b) (b)
el siguiente paso, pasamos del sistema X1 X2 X3 al sistema X1 X2 X3 de modo que el nuevo eje X2
quede dentro del plano sombreado, pero sin sacar al eje que ya se introdujo en ese plano. Por tanto, se deduce
(a)
que la rotacion debe realizarse alrededor de X1 para que este eje no se salga del plano sombreado. Haremos
(a) (b)
entonces una rotacion en un angulo alrededor de X1 , siendo el angulo adecuado para que el eje X2
(b) (a)
quede dentro del plano sombreado. En este caso es claro que X1 = X1 y con este paso hemos conseguido
(b) (b)
que los nuevos ejes X1 y X2 esten en el plano generado por X1 X2 , solo falta en consecuencia realizar una
(b) (b)
rotacion dentro de este plano que nos lleve desde X1 X2 hacia los ejes X1 X2 lo cual se logra con (c) una
(b) (b)
rotacion alrededor del eje X3 en un angulo . En este caso X3 = X3 .
En consecuencia, una rotacion arbitraria del sistema coordenado X1 X2 X3 al sistema coordenado X1 X2 X3
se puede realizar de la forma que se ve en la Fig. 13.3: comenzamos haciendo una rotacion antihoraria en un
(a) (a)
angulo alrededor de X3 , al sistema coordenado resultante de esta rotacion lo denotaremos por X1 , X2 ,
(a) (a)
X3 (naturalmente, X3 coincide con X3 ). En el segundo paso, rotamos al nuevo sistema coordenado con
(a)
respecto a X1 en sentido antihorario en una cantidad como muestra la figura 13.3, denotamos al sistema
(b) (b) (b) (b) (a)
resultante como X1 , X2 , X3 . El eje X1 (que coincide con X1 ), se forma con la interseccion entre los planos
(b) (b)
X1 X2 y X1 X2 y se conoce como lnea nodal. Finalmente, se hace una rotacion antihoraria alrededor
(b)
de X3 para llegar al sistema coordenado final X1 X2 X3 . Los elementos de una transformacion completa se
puede obtener por composicion de las tres operaciones aqu descritas. La rotacion inicial (alrededor de X3 )
transforma a un vector (o a sus componentes) en la forma
cos sin 0
x(a) = Dx ; D = sin cos 0 (13.15)
0 0 1
(a) (a) (a)
donde D es una matriz que describe un cambio de base de la forma X1 X2 X3 X1 X2 X3 . La segunda
(a) (a) (a) (a) (b) (b) (b)
rotacion alrededor de X1 describe un cambio desde la base X1 X2 X3 hacia la base X1 X2 X3 y nos
da
1 0 0
x(b) = Cx(a) ; C = 0 cos sin (13.16)
0 sin cos
(b) (b) (b) (b)
y finalmente describimos el cambio de base X1 X2 X3 X1 X2 X3 con la rotacion alrededor de X3 :
cos sin 0
x = Bx(b) ; B = sin cos 0 (13.17)
0 0 1
346 CAPITULO 13. CINEMATICA DEL CUERPO RIGIDO
utilizando de forma sucesiva estas transformaciones, llegamos a la transformacion que nos lleva desde x hasta
x
x = Bx(b) = B Cx(a) = BCx(a) = BC (Dx)
x = Ax ; A BCD (13.18)
haciendo el producto de las tres matrices (ver ejercicio 1 Pag. 371), se obtiene la matriz de rotacion mas general
en terminos de los angulos de Euler
cos cos cos sin sin cos sin + cos cos sin sin sin
A = sin cos cos sin cos sin sin + cos cos cos cos sin (13.19)
sin sin sin cos cos
Se puede demostrar que A1 = A e y que det A = +1. Es decir que A es efectivamente una matriz ortogonal
real propia (ejercicio 2 Pag. 371).
cos cos cos sin sin sin cos cos sin cos sin sin
A1 = A e = cos sin + cos cos sin sin sin + cos cos cos sin cos (13.20)
sin sin cos sin cos
0 < 2 , 0 , 0 < 2
donde el rango de esta relacionado con el hecho de que el angulo diedro entre los planos X1 X2 y X1 X2 esta en
el intervalo [0, ]. Existe por supuesto una arbitrariedad en la secuencia de rotaciones que se puede escoger, la
primera rotacion se puede realizar con respecto a cualquiera de los ejes y en las dos rotaciones posteriores, la
unica limitacion es que no se puede hacer dos rotaciones sucesivas con respecto al mismo eje. Por lo tanto hay
un total de 12 convenciones posibles para un sistema dextrogiro. Las dos convenciones mas usadas en Fsica
son: nuestra convencion (denominada xconvencion), y la llamada yconvencion.
(a) (a)
En la yconvencion, la primera rotacion (alrededor de X3 ) se hace de modo que el eje X2 (y no el eje X1 )
(a)
coincida con la lnea nodal. La segunda rotacion se hace entonces con respecto a X2 a fin de introducir al nuevo
(b) (b) (b)
eje X1 en el plano X1 X2 . La tercera operacion rota a los ejes X1 X2 hasta su orientacion final en el plano
X1 X2 . Hay una tercera convencion muy usada en aplicaciones en ingeniera conocida como xyzconvencion. Es
muy importante conocer la convencion usada en la construccion de la matriz a la hora de comparar resultados.
Los cuatro parametros de Cayley-Klein son cuatro numeros complejos , , , . Es tambien conveniente
definir y en terminos de parametros reales de la siguiente forma
es facil ver que esta matriz es real, si la escribimos es terminos de los parametros reales e0 , e1 , e2 , e3
2
e0 + e21 e22 e23 2 (e1 e2 + e0 e3 ) 2 (e1 e3 e0 e2 )
A = 2 (e1 e2 e0 e3 ) e20 e21 + e22 e23 2 (e2 e3 + e0 e1 )
2 (e1 e3 + e0 e2 ) 2 (e2 e3 e0 e1 ) e20 e21 e22 + e23
es facil demostrar que esta es una matriz ortogonal propia. Adicionalmente, se puede demostrar que su relacion
con los angulos de Euler viene dada por
+
= exp i cos ; = i exp i sin
2 2 2 2
+
= = i exp i sin ; = = exp i cos
2 2 2 2
de estas ecuaciones se pueden extraer tambien las relaciones entre los angulos de Euler y los cuatro parametros
de Euler reales e
+
e0 = cos cos ; e2 = sin sin
2 2 2 2
+
e1 = cos sin ; e3 = sin cos
2 2 2 2
un tratamiento detallado de los parametros de Cayley-Klein se puede encontrar en la seccion 4.5 de la segunda
edicion de la Ref. [1].
Theorem 22 Teorema de Euler: El movimiento general de un cuerpo rgido con un punto fijo es una rotacion
alrededor de algun eje que pasa por dicho punto.
El teorema establece que para toda rotacion con un punto fijo es siempre posible encontrar un eje que
pasa por el punto fijo orientado de una forma particular (con respecto a S0 ), tal que la rotacion con un cierto
angulo alrededor de este eje, emula la rotacion general. En este caso podemos pensar en los parametros
angulares , (que orientan al eje con respecto a S0 ) y el parametro de rotacion como los tres parametros
independientes.
Es claro que una rotacion con un punto fijo en un intervalo dado de tiempo nos lleva de una configuracion
inicial a una configuracion final. Si bien el teorema nos afirma que a partir de la configuracion inicial es posible
llegar a la configuracion final por medio de una rotacion con un eje fijo para cierto angulo, esto no quiere decir
que el movimiento real haya sido con eje fijo, de hecho durante el movimiento es posible que la orientacion
del eje de rotacion haya cambiado en el tiempo. Esto es analogo al caso traslacional: el movimiento de una
partcula puntual nos lleva de una posicion inicial a una posicion final, para ir de esta posicion inicial a la
posicion final es siempre posible realizarlo a traves de una lnea recta (direccion constante) recorriendo cierta
distancia, pero esto no siginifica que el movimiento real haya sido en lnea recta, aunque en ambos casos la
posicion inicial y la final coincidan.
Si el punto es fijo con respecto a un sistema inercial (el punto fijo no es necesariamente el centro de masa
del cuerpo), entonces podemos hacer que S coincida con S0 y tal punto se toma como origen de S, S0 y S para
todo tiempo, el desplazamiento del cuerpo rgido no involucra traslacion de los ejes del cuerpo respecto a S,
solo cambia su orientacion. El teorema entonces establece que los ejes coordenados X1 X2 X3 se pueden obtener
para cualquier tiempo t, por medio de una unica rotacion alrededor de un eje dado del sistema X1 X2 X3 .
Esto implica formalmente que el operador representado por la matriz A que describe el movimiento fsico del
cuerpo rgido es una rotacion. Es caracterstico de una rotacion, que la direccion del eje de rotacion permanezca
inalterada en el proceso. Por tanto, un vector que vaya a lo largo de tal eje debe tener las mismas componentes
en S0 y S . La otra condicion necesaria para una rotacion de que la magnitud de los vectores sea un invariante,
esta garantizada por el caracter ortogonal real de la matriz como vimos en la seccion 12.4. En consecuencia, el
teorema de Euler sera probado si podemos mostrar que para una rotacion no trivial (diferente a la identidad)
existe al menos un vector no nulo x que tiene las mismas componentes en ambos sistemas coordenados S y
S , pero que todo vector linealmente independiente de x tiene componentes distintas en S y S . Lo ultimo
garantiza que la direccion del eje de rotacion esta unvocamente determinada, ya que geometricamente una
rotacion no trivial debe transformar de manera no trivial a cualquier vector que no sea colineal con el eje de
rotacion.
En notacion matricial, debe existir x no nulo tal que
x = Ax = x (13.24)
comparando esta ecuacion con la ecuacion de valores propios (12.35), se observa que el problema se reduce
a demostrar que = 1 es un valor propio no degenerado de la matriz A, cuando A es no trivial. La no
degeneracion de = 1 para una rotacion no trivial, garantiza que ningun vector linealmente independiente
de x, puede ser vector propio de A con valor propio = 1. Por otro lado, es claro que si la rotacion es la
identidad, cualquier eje que pase por el punto fijo sirve como eje de rotacion. Esto se refleja en el hecho de que
= 1 es totalmente degenerado para la rotacion identidad.
Podemos entonces reescribir el teorema de Euler en la siguiente forma:
La matriz ortogonal real propia que especifica el movimiento de un cuerpo rgido con un punto fijo, o bien
es la identidad, o bien es tal que = 1 es un valor propio no degenerado de la matriz.
En la seccion 12.7 encontramos que para toda matriz ortogonal real propia de dimension impar
siempre hay por lo menos un valor propio igual a la unidad. Recordando ademas que las rotaciones solo
pueden ser descritas por matrices ortogonales propias y que nuestra dimension es tres, se obtiene la existencia
de por lo menos un vector no nulo que permanece invariante bajo la rotacion. Notese que la validez del
teorema de Euler dependio del caracter impar de la dimension del espacio. Por ejemplo, en dos dimensiones
13.6. TEOREMA DE EULER PARA EL MOVIMIENTO DEL CUERPO RIGIDO 349
no existe un vector en el espacio bidimensional que quede invariante ante una rotacion, el eje de rotacion
es perpendicular al plano y esta por tanto fuera de dicho espacio.
Finalmente, debemos determinar el grado de degeneracion de = 1. Examinando los valores propios de una
matriz ortogonal real propia de tres dimensiones Sec. 12.7.1 Ecs. (12.75), y recordando las transformaciones
asociadas a las posibles estructuras de valores propios (ver Pag. 301), se puede ver que los posibles valores de
son 1, ei y ei . Si 6= 0, el valor propio unidad es no degenerado, en tanto que = 0 corresponde a la
identidad (degeneracion total de = 1). Esto completa la demostracion del teorema de Euler.
La Ec. (13.24) nos muestra que el autovector asociado a = 1 determina la direccion del eje de rotacion,
y dado que si la rotacion es no trivial solo hay un valor propio = 1 podemos determinar unvocamente dicho
eje. Los cosenos directores del eje de rotacion se pueden obtener entonces haciendo = 1 en las ecuaciones de
valores propios (12.37) y resolviendo para x1 , x2 , x3 cuyas soluciones forman un autovector asociado a = 1
(recordemos que estrictamente solo se obtienen cocientes entre tales componentes, si imponemos unitariedad
podemos definir casi completamente un vector en la direccion del eje excepto por su sentido, cualquier multiplo
de este autovector tambien es autovector asociado al mismo autovalor3 ).
Una vez determinado el eje de rotacion procedemos a encontrar el angulo de rotacion alrededor de dicho
eje. A traves de una transformacion de similaridad (cambio de base), es posible transformar la matriz A a una
matriz equivalente i.e. que describe al mismo operador pero en otra base
A = BAB1
en particular podemos escoger el cambio de base B de tal forma que el nuevo eje X3 coincida con el eje de
rotacion. En tal sistema coordenado A representa una rotacion alrededor de X3 i.e. en el plano X1 X2 , en un
angulo . En consecuencia, la matriz A adquiere la forma
cos sin 0
A = sin cos 0 (13.25)
0 0 1
la traza de A es de la forma
T rA = 1 + 2 cos (13.26)
y recordando que la traza es invariante ante una transformacion de similaridad tenemos que
T rA = T rA
3
X
aii = 1 + 2 cos (13.27)
i=1
siendo aii los elementos diagonales (conocidos) de la matriz A. Por tanto, se puede despejar en terminos
de estos elementos. Por otra parte, asumamos otra transformacion de similaridad que nos lleve a una forma
diagonal equivalente (ver Ecs. 12.42, 12.43). De nuevo usando la invarianza de la traza y la estructura de
valores propios (12.75)
T rA = T r = 1 + ei + ei = 1 + 2 cos (13.28)
e igualando (13.27) con (13.28) resulta
1 + 2 cos = 1 + 2 cos
= (13.29)
de modo que el angulo de rotacion es igual a una de las fases complejas asociadas a los valores propios.
3
En la practica es mas sencillo dar un valor fijo a una de las componentes del autovector. Por ejemplo, podemos hacer x3 = 1
y resolver para x1 y x2 con dos de las ecuaciones linealmente independientes, para finalmente normalizar. Es posible que no se
pueda encontrar una solucion consistente, en cuyo caso debemos hacer x3 = 0, para obtener la solucion correcta. Finalmente, es
facil ver de las Ecs. (12.37), que si x1 , x2 , x3 es una solucion, tambien lo sera x1 , x2 , x3 ; en particular cuando = 1.
350 CAPITULO 13. CINEMATICA DEL CUERPO RIGIDO
donde hemos usado la no degeneracion de k para rotaciones no triviales. La Ec. (13.30) muestra que para
una matriz ortogonal A, xk es un vector propio de A con valor propio k si y solo si xk es vector propio
de Ae = A1 con valor propio 1 . Esto es logico geometricamente4 , ya que si k = 1, entonces xk va en
k
la direccion del eje de rotacion y por tanto queda invariante tanto bajo A como bajo A1 . Si k = ei la
rotacion inversa corresponde al mismo eje de rotacion pero con el angulo de rotacion cambiado de signo es
decir asociado a ei = 1k .
Notese sin embargo, que el vector propio xk asociado a k = ei con 6= 0, no es necesariamente un
vector real. En consecuencia, la transformacion que lleva a la matriz A a su forma canonica no es necesariamente
ortogonal real, sino que sera en general una matriz unitaria U
i
e 0 0
U1 AU = 0 ei 0 (13.31)
0 0 1
donde U se forma con la yuxtaposicion de los vectores propios debidamente ortonormalizados5 . Hemos usado
la convencion de que el eje X3 de los ejes principales sea el eje de rotacion (el unico vector propio que se puede
garantizar como real es el asociado al eje de rotacion y a k = 1). Si sacamos el inverso a ambos lados de
(13.31), obtenemos i
e 0 0
U1 AUe = 1 0 ei 0 (13.32)
0 0 1
de modo que la misma transformacion de similaridad que diagonaliza a A diagonaliza a A e = A1 , y la matriz
diagonal obtenida es la que se obtiene de A intercambiando el signo de los angulos.
Aun as persiste la ambiguedad del orden en el que aparecen los valores propios en X1 y en X2 . Las
ambiguedades pueden ser al menos aminoradas asumiendo que se asocia a A y se asocia a A1 , y
fijando el sentido de los ejes de rotacion por la regla de la mano derecha. En otras palabras, asociando la forma
canonica de A a la matriz diagonal descrita por la Ec. (13.31), de modo que la forma canonica de A e = A1
es la matriz diagonal asociada a la Ec. (13.32).
Como corolario del teorema de Euler aparece el Teorema de Chasles: El desplazamiento mas general
de un cuerpo rgido consiste en una traslacion mas una rotacion. Esto se ve simplemente teniendo en cuenta
que si el punto de referencia ya no es fijo entonces podemos descomponer el movimiento visto por S como
la traslacion pura de S0 mas la rotacion pura de S con respecto a S0 . En realidad, Chasles demuestra una
version mas fuerte que dice que es posible escoger el origen de S de modo que la traslacion este en la misma
direccion que el eje de rotacion.
4
Si {k } es el conjunto de valores propios de A entonces 1 e = A1 . Pero dado que
es el conjunto de valores propios de A
k
i i
{k } = 1, e , e e
, es claro que ambos conjuntos de valores propios son iguales, en concordancia con la observacion de que A
posee los mismos valores propios de A.
5
Las matrices ortogonales reales son normales, de modo que el teorema espectral garantiza que se pueden diagonalizar con una
transformacion de similaridad unitaria (ver seccion 12.12).
13.7. ROTACIONES FINITAS 351
Figura 13.4: Rotacion finita en un angulo . El vector unitario n determina el eje de rotacion en el sentido
horario (regla de la mano izquierda).
Hemos trabajado hasta aqu dos parametrizaciones para determinar la orientacion relativa de un sistema
coordenado. Por un lado los angulos de Euler me permiten construr cualquier orientacion relativa de S a partir
de la orientacion de S0 mediante tres rotaciones sucesivas. Por otro lado, el teorema de Euler nos dice que la
transformacion de coordenadas necesaria para cualquier cambio de orientacion se puede llevar a cabo con una
sola rotacion en torno a una direccion adecuada. Es natural entonces tratar de construr una representacion
en terminos de los grados de libertad de dicha rotacion como son el angulo de rotacion y los cosenos directores
del eje (probablemente con condicion de unitariedad del vector director).
Es mas conveniente en este caso utilizar un punto de vista activo de la rotacion de modo que el sistema
coordenado permanece inalterado y se hace una rotacion de los vectores. Hay que recordar que una rotacion
antihoraria para el sistema coordenado corresponde a una rotacion horaria para los vectores.
En la figura 13.4, el vector OP es la posicion inicial r del vector y la posicion final r sera OQ. El vector
unitario n define la direccion del eje de rotacion y su sentido sigue la regla de la mano izquierda, los vectores
N P y N Q son perpendiculares al eje de rotacion y pasan por el. Es claro que la distancia ON tiene valor n r,
por lo tanto podemos escribir
ON = n (n r) (13.33)
Del diagrama tambien se observa que
ON + N P = OP N P = OP ON
N P = r n (n r) (13.34)
estas magnitudes son iguales al radio de la circunferencia en la figura. La figura 13.4 muestra a la derecha
el diagrama de vectores en el plano N QP perpendicular al eje de rotacion. Con estas relaciones ya podemos
escribir la relacion entre r y r en funcion de n y . De este diagrama es facil ver que
r = OQ = ON + N V + V Q (13.36)
352 CAPITULO 13. CINEMATICA DEL CUERPO RIGIDO
siendo el vector V Q perpendicular a N P . El vector r n es perpendicular al plano ON P . Por otro lado la
figura tambien muestra que
N P
NP
NP
N V =
N V
=
N Q
cos
=
N P
cos
= N P cos
N P
N P
N P
(r n)
(r n)
V Q =
V Q
=
N Q
sin
kr nk
N Q
V Q = (r n) sin (13.38)
a la ecuacion (13.39) se le conoce como formula de rotacion. Esta ecuacion es valida para cualquier rotacion
de cualquier magnitud, y por tanto constituye una version para la rotacion finita (en sentido horario, es decir
con el vector unitario definido por la regla de la mano izquierda) de la expresion que se encontro en la pagina
74, Ec. (5.9) para rotaciones infinitesimales en un vector.
e0 = cos ; e = n sin (13.40)
2 2
es evidente que estos paramtros estan relacionados por
usando la identidad
cos2 sin2 = cos = e20 e2
2 2
cos = e20 e21 e22 e23 (13.42)
y de la identidad
2 sin cos = sin = 2e0 e
2 2
n sin = 2e0 e (13.43)
13.7. ROTACIONES FINITAS 353
usando las identidades (13.40), (13.41), (13.42), (13.43) en la Ec. (13.39) resulta
r
= r e20
e21 e22 e23
+ n (n r) 2 sin + 2 (r e) e0 2
2
2 2 2 2
r = r e0 e1 e2 e3 + 2n sin n sin r + 2 (r e) e0
2 2
2
r = r e0 ek ek + 2e (e r) + 2 (r e) e0 (13.44)
esta ecuacion establece una relacion lineal entre r y r, en una forma vectorial. Para construir la matriz
ortogonal A en estos parametros, se procede a escribir la ecuacion para cada componente xi en terminos de
una combinacion lineal de los xj , los coeficientes de la combinacion nos dan la matriz A. Por ejemplo, para
una componente primada se tiene
xi = xi e20 ek ek + 2ei (ej xj ) + 2ijk e0 xj ek
xi = xj ij e20 ek ek + 2ei ej xj + 2ijk e0 ek xj
xi = ij e20 ek ek + 2ei ej + 2ijk e0 ek xj aij xj
a manera de consistencia veremos que la traza de la matriz (13.45) es identica a la traza expresada en la Ec.
(13.28), puesto que la traza es invariante ante un cambio de base.
2 2 2 2
T rA = 3e20 e21
= 3 cos e22 e23
sin = 2 cos 2
+ cos sin
2 2 2 2 2
= (1 + cos ) + cos = 1 + 2 cos
que coincide con (13.28). Notese la similitud entre los parametros reales de Euler definidos en la seccion 13.5,
por medio de las Ecuaciones (13.21, 13.22) y los definidos por las Ecs. (13.40, 13.41). Comparese tambien las
matrices de rotacion definidas por las Ecs. (13.23) y (13.45).
T r1 A = cos cos cos sin sin sin sin + cos cos cos + cos
= (1 + cos ) cos cos (1 + cos ) sin sin + cos
= (1 + cos ) (cos cos sin sin ) + cos
= (1 + cos ) cos ( + ) + cos
2 2 + 2 + 2 2
= 2 cos cos sin + cos sin
2 2 2 2 2
354 CAPITULO 13. CINEMATICA DEL CUERPO RIGIDO
2 2 + 2 + 2 + 2 2
T r1 A = 2 cos 2 cos cos sin + cos sin
2 2 2 2 2 2
+
= 2 cos2 2 cos2 1 + cos2 sin2
2 2 2 2
2 2 + 2 2 2
= 4 cos cos 2 cos + cos sin
2 2 2 2 2
+
= 4 cos2 cos2 cos2 sin2
2 2 2 2
+
= 4 cos2 cos2 1
2 2
A+B=B+A
hemos visto que la composicion de dos matrices en general no es conmutativa y esto es valido en particular para
las matrices ortogonales. Es facil mostrar un ejemplo fsico en el cual las rotaciones sucesivas no conmutan,
la Fig. 13.5 muestra dos rotaciones sucesivas de un bloque realizadas en diferente orden: en el primer caso
se comienza con una rotacion antihoraria alrededor de x con x = /2 seguida por otra rotacion antihoraria
de /2 alrededor de y. En el segundo caso se invierte el orden de las rotaciones y se observa una marcada
diferencia entre las dos configuraciones.
En consecuencia, si un vector representara satisfactoriamente a una rotacion, y la adicion de vectores me
representara la composicion de rotaciones, dicha operacion de adicion vectorial no debera ser conmutativa,
pero esta es un propiedad fundamental de un espacio vectorial. Luego, las rotaciones finitas no pueden ser
representadas por vectores.
Veremos a continuacion que las transformaciones infinitesimales conmutan a primer orden y que por tanto
pueden ser representadas por un vector. Visto de manera pasiva, consideraremos un cambio de orientacion de los
ejes coordenados en la cual los ejes X1 , X2 , X3 solo difieren infinitesimalmente de X1 , X2 , X3 respectivamente.
13.8. ROTACIONES INFINITESIMALES 355
Figura 13.5: Dos rotaciones finitas sucesivas realizadas en diferente orden: Este ejemplo ilustra la no conmu-
tatividad de las operaciones finitas de rotacion.
La transformacion solo difiere de la identidad por cantidades infinitesimales. Las nuevas componentes xi de un
vector vendran dadas por
xi = xi + ij xj
donde los parametros ij son infinitesimales de modo que para efectos de calculo solo se conservaran terminos
de primer orden en tales parametros. La relacion anterior se escribe
xi = (ij + ij ) xj
r = (1 + ) r (13.47)
356 CAPITULO 13. CINEMATICA DEL CUERPO RIGIDO
que manifiesta el hecho ya mencionado de que la matriz de transformacion solo difiere infinitesimalmente de
la identidad. Veamos ahora como actua la composicion de dos transformaciones infinitesimales
A1 A2 = (1 + 1 ) (1 + 2 ) = 1 + 1 + 2 + 1 2
A1 A2 = 1 + 1 + 2 (13.48)
esta operacion es claramente conmutativa (solo el termino de segundo orden que se desprecio es no conmuta-
tivo). En consecuencia, es posible representar estas operaciones infinitesimales mediante vectores.
Es muy sencillo obtener la matriz inversa de una transformacion infinitesimal si tenemos en cuenta la
regla de composicion a primer orden dada por (13.48), en esta composicion se obtiene la identidad si y solo si
1 = 2 , por lo tanto la inversa se escribira con la siguiente asociacion
A = (1 + ) A1 = (1 ) (13.49)
notese que esto se asemeja a la relacion escalar de primer orden (1 + x)1 = 1 x para x << 1. Recordando
que la condicion de ortogonalidad equivale a que la inversa sea identica a la traspuesta, se obtiene la siguiente
relacion6
1+e
= 1
e
=
de modo que la matriz infinitesimal debe ser antisimetrica a fin de que A permanezca ortogonal real. Dada
la antisimetra de , los elementos diagonales de dicha matriz son nulos y tenemos tres grados de libertad como
corresponde a toda matriz antisimetrica real 3 3. Esto a su vez implica que la diagonal de A sigue teniendo
elementos unidad y al expandir el determinante se observa que este continua siendo +1 a primer orden.
Naturalmente, no era de esperarse un cambio brusco del determinante a 1 ya que estas transformaciones
son contnuas e infinitesimales. Visto de otro modo, no era de esperarse que ocurriera una transformacion
discreta de inversion cuando lo que tenemos son parametros contnuos infinitesimales. En conclusion estas
transformaciones ortogonales son propias y pueden asociarse a una rotacion.
Ya hemos visto que una matriz antisimetrica se puede parametrizar como en la ecuacion (12.57). Aplicando
esta parametrizacion para escribimos
0 d3 d2
= d3 0 d1 (13.50)
d2 d1 0
donde la notacion enfatiza el caracter infinitesimal de los parametros. Teniendo en cuenta (13.47), el cambio
infinitesimal en las componentes de un vector se escribe como
r r dr = r (13.51)
Aplicando ademas las Ecs. (12.57, 12.58, 12.59, 12.60) vemos que un diferencial del vector r se escribe
dr = r d ; d (d1 , d2 , d3 )T (13.52)
Esta ecuacion nos dice que el cambio infinitesimal del vector r es perpendicular a r mismo y al vector d el
cual como veremos mas adelante va a lo largo del eje de rotacion. Lo primero se puede ver por el hecho de
que si hubiera una componente de dr a lo largo de r implicara un cambio de magnitud de r que no puede ser
producido por una transformacion ortogonal. Ahora bien, ya hemos visto que el vector asociado a una matriz
6
Lo discutido hasta aqu es valido para cualquier transformacion lineal infinitesimal, ya que no se ha usado la relacion de
ortogonalidad en ninguna forma.
13.9. ROTACIONES FINITAS E INFINITESIMALES EN CONVENCION QUIRAL DERECHA 357
antisimetrica es un vector axial (ver seccion 12.6). Notese que la ecuacion (13.52) es consistente con este hecho,
ya que r y dr son vectores polares, por lo tanto es necesario que d sea axial para que su producto cruz con un
vector polar sea polar. Como todo vector axial, d posee las propiedades de transformacion dadas por (12.69)
di = (det B) bij dj
la forma explcita de d en terminos de los parametros de rotacion se puede encontrar tomando la formula de
rotacion Ec. (13.39) y aplicandola a un angulo infinitesimal para el cual cos d 1, sin d d, resulta
r = r + (r n) d
r r = dr = (r n) d (13.53)
d = n d (13.54)
Notese que hemos obtenido lo que esperabamos: el vector d que caracteriza a la rotacion infinitesimal va en
la direccion del eje de rotacion y su magnitud es el angulo de rotacion infinitesimal d. Vale la pena anotar
que este vector diferencial no proviene de ninguna diferencia entre vectores finitos, ya que las rotaciones finitas
no pueden ser asociadas a un vector como ya se vio. Geometricamente, una inversion pasiva nos cambia de
un sistema dextrogiro a uno levogiro para definir el sentido de n con lo cual dicho vector sera axial, y dado
que d tambien es axial, se deduce que d debe ser un escalar (y no un pseudoescalar). La relacion (13.54)
tambien se puede encontrar muy facilmente considerando un angulo infinitesimal de rotacion en la figura 13.6.
El signo de d se considera positivo en la direccion horaria es decir con convencion quiral izquierda.
Figura 13.6: Ilustracion de una rotacion infinitesimal. Se usa regla de la mano izquierda para la determinacion
del vector unitario n que determina al eje de rotacion.
ni son las componentes del vector unitario n que define al eje de rotacion. dr es el cambio infinitesimal desde
r hasta r . Teniendo en cuenta (13.51), as como (13.57) se tiene que
dr = r = (N d) r
resultando entonces una ecuacion diferencial matricial con respecto al angulo de rotacion
dr
= Nr (13.58)
d
los elementos de la matriz N definida en (13.57), estan dados por
Nij = ijk nk = jik nk (13.59)
adicionalmente, la matriz en (13.57) se puede representar de la siguiente forma
0 0 0 0 0 1 0 1 0
= ni Mi d ; M1 0 0 1 ; M2 0 0 0 ; M3 1 0 0 (13.60)
0 1 0 1 0 0 0 0 0
las matrices Mi se conocen como los generadores de rotaciones infinitesimales y su combinacion posee la
siguiente propiedad
Mi Mj Mj Mi [Mi , Mj ] = ijk Mk (13.61)
13.9. ROTACIONES FINITAS E INFINITESIMALES EN CONVENCION QUIRAL DERECHA 359
la diferencia entre los dos productos matriciales se denomina conmutador o corchete de Lie. La Ec. (13.61)
define un algebra de Lie del grupo de rotaciones parametrizado en terminos del angulo de rotacion y el vector
unitario a lo largo del eje de rotacion.
donde hemos usado (13.60). El producto punto definido por n M es solo una forma sintetica para denotar
la suma ni Mi la cual a su vez es una matriz. La segunda transformacion es
2
r (0) + r + r = (1 + ) (1 + ) r (0) = 1 + (n M) r (0)
k
para que cada transformacion sea realmente infinitesimal debe tomarse el lmite cuando k
k
r () = lm 1 + (n M) r (0) (13.62)
k k
r () = e[(nM) ]
r (0) (13.63)
b se puede escribir como una funcion de operadores
es decir el operador de rotacion O
b r (0)
r () = O ; b exp [(n M) ]
O
donde n y se denominan parametros de la rotacion y las tres matrices M definidas en (13.60) son los
generadores. Notese que las matrices M son las mismas para cada rotacion en tanto que los parametros varan
de una rotacion a otra.
Hay por supuesto otras representaciones de los generadores M, pero todas ellas deben cumplir el algebra
definida por los corchetes de Lie en (13.61). Notese la similitud entre (13.63) y (8.69), la cual no es coinci-
dencial ya que ambas representan transformaciones contnuas que se construyen a partir de transformaciones
infinitesimales partiendo de la identidad. Notese finalmente que (13.63) es solucion de la ecuacion diferencial
(13.58) con N = n M.
8
Por supuesto, ambos procedimientos son posibles tanto para las transformaciones canonicas como para las rotaciones.
360 CAPITULO 13. CINEMATICA DEL CUERPO RIGIDO
notese que tiene la proyeccion sin en el plano X1 X2y es perpendicular a la lnea de nodos.
Ahora debemos escribir las componentes de con respecto a los ejes X1 X2 X3 . Dado que va a lo largo
(a) (b)
de la lnea de nodos, la cual esta definida por el eje X1 = X1 , vemos que el vector se puede escribir en
(b) (b) (b)
el sistema coordenado X1 X2 X3 en la forma ( , 0, 0)T . Para escribir sus componentes con respecto a los
(b) (b) (b)
ejes de S requerimos en consecuencia pasar del sistema X1 X2 X3 al sistema X1 X2 X3 lo cual se obtiene
aplicando unicamente la transformacion ortogonal final B definida en (13.17)
cos sin 0
( )S = sin cos 0 0
0 0 1 0
con lo que se obtiene
( )X = cos ; ( )X = sin ; ( )X = 0
1 2 3
(b)
no es necesaria ninguna transformacion para obtener , el cual yace a lo largo de X3 = X3 ( = ) de
modo que en la base X1 X2 X3 ya se escribe en la forma 0, 0, . Sumando las componentes de cada velocidad
angular, se obtienen las componentes de con respecto a los ejes fijos al cuerpo i.e. de S :
X1 = sin sin + cos ; X2 = sin cos sin ; X3 = cos + (13.64)
con un procedimiento similar se puede encontrar las componentes de a lo largo de los ejes de S0 en terminos
de los angulos de Euler.
13.11. RAZON DE CAMBIO DE UN VECTOR VISTO POR SISTEMAS ROTANTES 361
ambos miembros de esta ecuacion se refieren al cambio del vector visto por S0 9 . En contraste, el cambio del
vector visto por S rot corresponde solo al primer termino de la derecha en la Ec. (13.67), ya que este sistema
ve que los vectores urot
i son estacionarios, es decir que visto por S rot se tiene que durot
i = 0 y por tanto
d ui = 0. Finalmente, de acuerdo con (13.65) tenemos que Virot urot
rot
i es simplemente V
Notese que dado que V como tal es igual en ambos sistemas, no escribimos un rotulo para designar al sistema
que lo mide. Finalmente la razon de cambio en un intervalo de tiempo dt sera
dV dV d
= + V
dt S0 dt rot dt
de aqu en adelante acortaremos la notacion para escribir (V)S y (V)r en lugar de (V)S0 y (V)rot . En
componentes la Ec. (13.71) se escribe
ViS = aji Vjr (13.72)
la matriz A (i.e. sus componentes) evoluciona en forma contnua con el tiempo. Por tanto, una transformacion
infinitesimal (en un intervalo dt) produce cambios infinitesimales en sus elementos. El diferencial del cambio
del vector sera
dViS = aji dVjr + daji Vjr (13.73)
por otro lado, siempre es posible elegir los ejes de modo que S0 coincida con S rot en un cierto instante t. De
esta forma se tiene que
A (t) = 1 ; A (t + dt) = 1 + (13.74)
como corresponde a las transformaciones infinitesimales, Ec. (13.47). A partir de (13.74) se observa que
donde hemos usado la antisimetra de . Como los ejes de ambos sistemas coordenados son coincidentes en t,
las componentes de los vectores coinciden instantaneamente, pero los diferenciales no seran identicos ya que
los dos sistemas se mueven el uno relativo al otro. Se tiene entonces que
donde solo se conservan diferenciales de primer orden. Reemplazando las Ecs. (13.76, 13.75) en (13.73) se
obtiene
dViS = dVir ij Vjr (13.77)
Por otro lado, usando las Ecs. (13.54), (13.57) y (13.59), podemos escribir los elementos de la matriz
antisimetrica ij en terminos del tensor cclico de Levi civita ijk 10 . Hay sin embargo un aspecto delicado
cual es el hecho de que estamos trabajando una transformacion pasiva, recordemos que una trasnformacion
activa en convencion antihoraria equivale a una pasiva en convencion horaria, por tanto debemos trabajar con
la convencion original de ejes a izquierda, para ello basta con cambiar de signo uno de los miembros de la Ec.
(13.59) manteniendo intactas las definiciones en (13.54), (13.57)
recordando ademas que las componentes del vector como tal coinciden entonces Vjr = VjS Vj y se obtiene
finalmente
(dV)S = (dV)r + d V (13.79)
que coincide con la expresion (13.68). Notese que la Ec. (13.79) no es tanto una ecuacion acerca de un vector
particular sino mas bien una aseveracion acerca de la transformacion infinitesimal entre dos sistemas coorde-
nados. Ahora bien, dado que (13.70) es valida para un vector o pseudovector arbitrario, podemos escribir una
ecuacion de operadores de la forma
d (. . .) d (. . .)
= + (. . .) (13.80)
dt S dt r
y la ecuacion vectorial resultante puede ser resuelta a lo largo de cualquier conjunto ortogonal de ejes, fijo o
movil. Notese de nuevo que la razon de cambio en el tiempo es solo relativa a un conjunto coordenado especfico.
Cuando la derivada temporal de un vector es con respecto a un sistema coordenado, las componentes pueden
ser tomadas a lo largo de otro sistema coordenado solo despues de realizar la diferenciacion.
notese que en la expresion ZS hemos puesto un rotulo para denotar el sistema de referencia en donde se observa
a Z, situacion diferente a la que se ve en la Ec. (13.70), en la cual no se especifica el sistema que observa a V.
La diferencia consiste en que V es un vector primario que no depende del sistema de referencia, en tanto
que Z ya es una razon de cambio temporal, que en consecuencia depende explcitamente del sistema elegido.
Por otro lado, usando (13.70) con la nueva notacion resulta
ZS = Zr + V (13.84)
de modo que
d
WS = Wr + ( V) + Zr + ( V) (13.86)
dt r
ahora retornamos a escribir estas segundas derivadas en terminos del vector original V, para ello usamos
(13.81, 13.82) y resulta
d dV d dV dV
= + 2 + ( V)
dt dt S S dt dt r r dt r
Una anotacion metodologica importante, para la validez de las ecuaciones (13.80, 13.88) no es estricta-
mente necesario suponer que ninguno de los sistemas de referencia S0 o S sea inercial o que alguno de los
dos este relacionado con un sistema inercial a traves de una traslacion pura. Ambos sistemas podran ser
rotantes con respecto a un sistema inercial, las relaciones aqu obtenidas son puramente cinematicas y parten
simplemente de dos premisas: S0 y S tienen origen comun y establecemos a S0 como el sistema no rotante
y a S como el sistema rotante. Lo que hacemos entonces es comparar los vectores y sus derivadas vistas
por ambos sistemas, es entonces la rotacion de S vista por S0 . Cuando entremos al estudio de la dinamica,
sera importante que uno de los dos sistemas sea inercial (o de lo contrario introducimos un tercero que s lo
sea) a fin de establecer un marco de referencia en donde se puedan emplear las leyes de Newton. Pero las Ecs.
(13.80, 13.88) mantendran su validez incluso cuando ambos sistemas sean no inerciales.
13.12. SISTEMAS NO INERCIALES ROTANTES 365
Figura 13.7: Ilustracion de la aceleracion centrfuga. Para una posicion dada de la partcula, la aceleracion
centrfuga va en la direccion perpendicular al eje y alejandose de el.
vr = vS r (13.91)
ar = aS + 2 (vr ) + [( r) ] (13.92)
analicemos los terminos que aparecen a la derecha de la expresion (13.92). El termino [( r) ] se ilustra en
la Fig. 13.7, en tal figura se asume que y r estan en el plano del papel de modo que r es perpendicular al
366 CAPITULO 13. CINEMATICA DEL CUERPO RIGIDO
papel hacia adentro. Colocando la cola del vector [( r) ] en el punto donde se ubica la partcula, vemos
que tal vector es perpendicular a y apunta en la direccion que se aleja de y por tanto del eje de rotacion,
razon por la cual se le conoce como aceleracion centrfuga. Su magnitud es 2 r sin siendo el angulo entre
y r. El termino 2 (vr ) se conoce como aceleracion de coriolis y es claramente perpendicular al eje de
rotacion y a la velocidad de la partcula vista por el sistema rotante.
Multiplicando (13.92) por la masa de la partcula vemos que un observador en el sistema rotante observa
el movimiento de la partcula como si esta se moviera bajo la influencia de una fuerza efectiva:
el primer termino entre parentesis se refiere a la velocidad angular relativa al radio vector del sol. La cantidad
en el segundo parentesis se refiere a el cociente entre el numero de das siderales en un ano, dividido por el
numero de das en un ano solar, es decir es el factor de correccion para obtener la velocidad angular relativa a
las estrellas fijas. Tomado este valor de junto con el radio de la tierra en el ecuador, la maxima aceleracion
centrpeta estara dada por
2 r = 3,38cm/s2
que corresponde a un 0,34 % de la aceleracion de la gravedad. Este efecto es pequeno pero no despreciable.
En realidad, el efecto medido de la gravedad representa el efecto combinado del campo gravitacional de la
distribucion de masa de la tierra y los efectos de la aceleracion centrpeta. En general se denota la suma de los
dos efectos como el campo de gravedad, para distinguirlo del campo gravitacional.
Un efecto interesante del termino de coriolis es el de convertir un movimiento horizontal en lnea recta sobre
una esfera rotante (e.g. la tierra), en movimiento circular. Supongamos que vr es la velocidad (con respecto a la
esfera) de un objeto que se mueve horizontalmente, es decir tangencial a la esfera. Veremos que la componente
horizontal de la fuerza de coriolis es perpendicular a vr y su magnitud es independiente de la direccion de vr .
13.12. SISTEMAS NO INERCIALES ROTANTES 367
Figura 13.8: Efecto coriolis sobre una masa ubicada sobre una esfera rotante. (a) Descomposicion de la velocidad
angular en sus componentes vertical V y horizontal H . Siendo la latitud de la partcula. (b) Direccion
de la componente horizontal FH de la fuerza de coriolis en los hemisferios norte y sur, para una partcula que
viaja a velocidad horizontal vr con respecto a la tierra en direccion norte. El hemisferio norte se define con
, utilizando la regla de la mano derecha.
Para verlo consideremos una masa m que se mueve con velocidad vr (con respecto a la esfera) a una latitud
como se ilustra en la Fig. 13.8a. sobre la superficie de una esfera que rota a velocidad angular uniforme
(donde la latitud se mide con respecto al ecuador definido por el eje de rotacion). Descomponiendo a en sus
componentes vertical y horizontal, la fuerza de coriolis se escribe
F = 2m vr = 2mH vr 2mV vr
puesto que H y vr son horizontales, entonces H vr es vertical. Por tanto la componente horizontal de la
fuerza de coriolis es
FH = 2mV vr = 2m sin (u vr )
donde u es el vector unitario radial de las coordenadas esfericas. Puesto que u y vr son perpendiculares,
vemos que la magnitud de FH esta dada por
ademas FH es siempre perpendicular a vr , de modo que en ausencia de otras fuerzas horizontales, produ-
cira movimiento circular horizontal (con una posible componente vertical). Puesto que FH depende de sin ,
es claro que invierte su sentido cuando se invierte la latitud como se observa en la Fig. 13.8b. El movimiento
sera en el sentido horario en el hemisferio norte y antihorario en el hemisferio sur. El flujo del viento sobre
la tierra esta fuertemente influenciado por la fuerza de coriolis formando patrones de movimiento circular
estables. Sin embargo, un mejor entendimiento de la dinamica de los sistemas atmosfericos requiere introducir
otras fuerzas.
Figura 13.9: (a) Superficie de un lquido que rota uniformente en un balde. (b) Diagrama de fuerzas aparentes
sobre un pequeno elemento de volumen en la superficie del agua, visto por un sistema de referencia que rota con
el balde. (c) Este diagrama muestra claramente que el angulo mide la inclinacion o pendiente de la superficie
del agua en el punto donde se ubica el elemento de volumen.
de agua de masa m sobre la superficie del lquido. Las fuerzas aparentes que actuan sobre este elemento de
volumen (ver Fig. 13.9b) son: la fuerza de contacto Fa que es la resultante de la interaccion del elemento de
volumen con otros elementos vecinos, el peso W y la fuerza ficticia centrfuga (puesto que el elemento esta en
reposo con respecto al sistema rotante, no hay fuerza de coriolis). El elemento esta en reposo con respecto al
sistema rotante de modo que
Fa + W + Fcent = 0
Fa cos mg = 0 ; Fa sin + m 2 r = 0
Fa cos = mg ; Fa sin = m 2 r
dz 2r
= tan =
dr g
es facil integrar esta ecuacion para encontrar la ecuacion de la superficie. Tomando z = 0 sobre el eje en la
superficie del lquido tenemos
Z z Z r 2
r 2 2
dz = dr z= r
0 0 g 2g
la superficie es un paraboloide de revolucion.
13.12. SISTEMAS NO INERCIALES ROTANTES 369
N = N u ; Fcor = 2m vr = 2m r (uz ur ) = 2m ru
Fcent = m ( r) = m 2 ruz (uz ur ) = m 2 rur
y las ecuaciones de la fuerza quedan
N 2m r = 0 ; m 2 r = mr (13.95)
la segunda ecuacion coincide con la Ec. (2.45), cuya solucion general es la Ec. (2.46) y la solucion para r (0) = 0
es la Ec. (2.47). Reemplazando la solucion (2.47) en la primera de las Ecs. (13.95) se encuentra
N = Fcor = 2m r = 2m 2 C cosh t
que coincide con (2.48), Pag. 29.
Figura 13.10: (a) Sistema coordenado cilndrico en el cual los vectores unitarios ur y u estan sobre el plano
ecuatorial y la velocidad angular de la tierra va a lo largo de uz . (b) El valor de la longitud de la cuerda y (que
mide la deflexion) es aproximadamente igual al valor del arco subtendido por , ya que dicho angulo es muy
pequeno.
Otro efecto interesante de la fuerza de coriolis es la deflexion con respecto a la vertical hacia el este, de
una masa m en cada libre. Calcularemos esta deflexion para una masa m que se suelta desde una altura h en
el ecuador.
Tomaremos un sistema de coordenadas cilndricas con el plano XY sobre el plano ecuatorial, donde u
apunta hacia el este como se ve en la Fig. 13.10a. La fuerza aparente sobre m estara dada por
F = mgur 2m vr m ( r) = mgur 2m uz vr + m2 rur
370 CAPITULO 13. CINEMATICA DEL CUERPO RIGIDO
la fuerza centrfuga va en la direccion radial de modo que solo cambia la gravedad aparente pero no produce
deflexion con respecto al desplazamiento vertical. Si la partcula parte del reposo, la fuerza de coriolis estara en
el plano ecuatorial. Por tanto m se mueve sobre el plano ecuatorial XY . En consecuencia, la velocidad de la
partcula con respecto a la tierra es
vr = rur + r u
de modo que la fuerza aparente es
F = m2 r mg ur 2m uz rur + r u
F = m 2 r + 2r g ur 2mr u
usando las expresiones para la aceleracion radial y transversal, obtenemos las ecuaciones
r r 2 = 2 r + 2r g ; r + 2r = 2r (13.96)
es una buena aproximacion considerar que m cae en forma casi vertical y << , con lo cual omitiremos
todos los terminos que contengan , y se obtiene
r 2 r g ; r 2r (13.97)
la variacion de r es muy pequena puesto que oscila entre h + RT y RT siendo RT el radio de la tierra y
considerando h << RT . Por esta razon tomaremos g constante y r RT de modo que la primera de las Ecs.
(13.97) se puede escribir como
r g + 2 RT g
donde g es la gravedad aparente generada por la correccion de la fuerza centrfuga. La solucion radial es
entonces
1
r g t ; r r0 g t2 (13.98)
2
reemplazando la primera de las Ecs. (13.98) en la segunda de las Ecs. (13.97) y usando r RT obtenemos
2g
RT 2g t
t
RT
g 2 g 3
t ; t (13.99)
RT 3RT
donde hemos usado las condiciones iniciales 0 = 0 = 0. Como se ilustra en la Fig. 13.10b, la deflexion
horizontal esta dada aproximadamente por y RT y de la Ec. (13.99) resulta
g 3
y t (13.100)
3
el tiempo th para caer una distancia h esta dado por
s
1 2h
r r0 h = g t2h th =
2 g
13.13. Ejercicios
1. Realice explcitamente el producto A BCD de las tres matrices dadas en las Ecs. (13.15, 13.16, 13.17),
y demuestre que se obtiene la matriz (13.19).
3. Relacione adecuadamente la expresion (5.9) de la Pag. 74, valida para rotaciones infinitesimales, con
la Ec. (13.39) de la Pag. 352, valida para rotaciones finitas. Tenga en cuenta las convenciones quirales
usadas en cada caso.
4. Demuestre que la matriz A dada en la Ec. (13.45), Pag. 353, es ortogonal real propia.
5. Demuestre que a primer orden, det A = +1 para la matriz (13.49), que describe una rotacion infinitesimal.
7. Encuentre la diferencia entre la gravedad aparente en el ecuador y en los polos, asumiendo que la tierra
es esferica. Encuentre el valor de la gravedad aparente en funcion de la latitud. Es de anotar sin embargo,
que la suposicion de tierra esferica no es buena, ya que el efecto del achatamiento de los polos sobre la
gravedad aparente, es comparable con el efecto de la latitud.
Captulo 14
Ecuaciones de movimiento del cuerpo rgido
En el captulo 13, hemos desarrollado las herramientas matematicas para el estudio sistematico de la
cinematica del cuerpo rgido. Los angulos de Euler proveen un conjunto conveniente (aunque asimetrico) de
3 coordenadas generalizadas independientes para determinar la orientacion relativa de un cuerpo rgido. En
particular, el metodo de transformaciones ortogonales propias provee una elegante tecnica para generar las
orientaciones relativas. Finalmente, las transformaciones ortogonales infinitesimales proveen un marco para
generar rotaciones finitas por transformaciones sucesivas infinitesimales (tal como ya se vio en el captulo de
transformaciones canonicas). En este captulo se pondra en accion el formalismo ya descrito para encontrar
las ecuaciones dinamicas de movimiento de Euler para el cuerpo rgido en una forma conveniente. Veremos
tambien las soluciones para algunas configuraciones simples pero muy importantes.
372
14.1. MOMENTO ANG. Y ENERGIA CINET. ALREDEDOR DE UN PUNTO 373
sera proporcional a M B que involucra solo la orientacion del cuerpo. En realidad casi todos los problemas
solubles en la practica permiten este tipo de division de modo que el Lagrangiano, L = T V se podra dividir
en dos partes una que involucra solo coordenadas traslacionales y otra que solo involucra variables rotacionales
(coordenadas angulares). Los dos grupos de coordenadas se separaran completamente y por tanto el problema
traslacional y el rotacional se resolveran tambien por separado.
Es por tanto de gran importancia encontrar expresiones para el momento angular y la energa cinetica
de movimiento con respecto a algun punto fijo en el cuerpo. Para ello emplearemos la relacion (13.80) que
liga a las derivadas temporales entre sistemas rotantes y no rotantes. No obstante, es necesario demostrar
previamente la siguiente aseveracion: el angulo de rotacion asociado al desplazamiento de un cuerpo
rgido, as como el vector velocidad angular de rotacion, son independientes de la escogencia de
origen del sistema coordenado fijo al cuerpo.
Para probarlo tomemos a partir del origen de S dos vectores R1 , R2 asociados a dos posibles orgenes de
sistemas de ejes fijos al cuerpo S1 y S2 respectivamente. Sea R el vector relativo que va desde el origen de S1
hasta el origen de S2 . Claramente resulta que
R2 = R1 + R
si el origen de S2 se considera como un medida relativa a S1 , entonces la derivada temporal de R2 relativa a
S se escribe
dR2 dR1 dR
= + (14.1)
dt S dt S dt S
calculemos el segundo miembro de la derecha usando (13.80)
dR dR
= + 1 R
dt S dt r1
donde 1 es el vector velocidad angular apropiado para el sistema S1 . Teniendo en cuenta ademas que las
derivadas de R relativas a todo sistema de ejes fijos al cuerpo deben ser nulas se obtiene:
dR
= 1 R
dt S
con lo cual la Ec. (14.1) queda
dR2 dR1
= + 1 R (14.2)
dt S dt S
por otro lado, podemos tambien considerar el origen de S1 como una medida relativa a S2 . El origen del primer
sistema coordenado se considera fijo en el segundo sistema con vector posicion R. En este caso la derivada
del vector posicion R1 con respecto a los ejes de S se escribe
dR1 dR2 dR dR2
= = 2 R
dt S dt S dt S dt S
dR2 dR1
= + 2 R (14.3)
dt S dt S
restando las Ecs. (14.2, 14.3) se obtiene la relacion
( 1 2 ) R = 0
es decir cualquier diferencia en los vectores velocidad angular en dos puntos arbitrarios debe ser paralela a la
lnea que une los dos puntos. Asumiendo que es un campo vectorial contnuo, la unica solucion posible para
todos los pares de puntos (i.e. para todas las orientaciones de R) es que los dos vectores velocidad angular
sean iguales
1 = 2
de modo que el vector velocidad angular es el mismo para todo sistema coordenado fijo al cuerpo rgido. Esto
se puede vislumbrar intuitivamente teniendo en cuenta que las partculas del cuerpo rgido se mueven y rotan
como un todo.
374 CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO
L = mi (ri vi ) (14.4)
siendo ri , vi el radio vector y la velocidad respectivamente de la iesima partcula relativa al origen escogido.
Es conveniente colocar el origen de S0 en un punto por donde pase el eje de rotacion. Cuando hay un punto
fijo del cuerpo rgido respecto a un sistema inercial, este punto es un buen origen ya que el eje de rotacion
pasa por el (teorema de Euler), y el sistema S0 sera inercial. Si no hay punto fijo un origen conveniente sera el
centro de masa, ya que en este caso el movimiento se podra separar en una traslacion pura del centro de masa
y una rotacion pura alrededor de un eje que pasa por el centro de masa.
Como el problema de la traslacion pura es muy simple, nos concentraremos en la rotacion pura. Supon-
dremos por simplicidad que existe un punto fijo con respecto a un sistema inercial de modo que S0 coincide
con nuestro sistema inercial S. Su origen estara en el punto fijo y el eje de rotacion pasa por este punto
(de lo contrario el punto no podra ser fijo). Es claro que cada partcula i del cuerpo rgido realizara un
movimiento circular con la misma frecuencia angular alrededor del eje de rotacion2 , donde el radio del
crculo sera ri sin i siendo ri la posicion de la partcula y i el angulo entre el eje de rotacion y ri . La rapidez
instantanea de la partcula esta dada por
vi = Ri = ri sin i
vi = ri (14.5)
como corresponde a todo movimiento circular. Es importante enfatizar que para que esta expresion y otras
que vienen de aqu en adelante sean validas, ri debe medirse con respecto a un origen tal que el eje de rotacion
pase por el3 . Otra forma de ver esta relacion es usando la Ec. (13.80) aplicada al vector ri en donde el sistema
rotante S se define como un sistema con ejes fijos al cuerpo
dri dri
= + ri
dt S dt S
el primer termino a la derecha es nulo porque en S la partcula debe estar en reposo, ya que el sistema es fijo
al cuerpo. Por tanto se reproduce la Ec. (14.5). Usando (14.5) en la Ec. (14.4) se obtiene
L = mi [ri ( ri )]
donde los ndices j, n denotan componentes en tanto que el ndice i rotula a una partcula, hay suma sobre los
ndices i, j. Expandiendo la componente x del momento angular resulta
n h io n h io
Lx = mi x ri2 (ri )x (ri )j j = mi x ri2 xi (ri )x x + (ri )y y + (ri )z z
Lx = mi x ri2 xi [xi x + yi y + zi z ]
Lx = mi ri2 x2i x mi xi yi y mi xi zi z
y ecuaciones similares para las otras componentes de L. Vemos que L esta relacionado con a traves de una
transformacion lineal. Parametrizaremos las trasformaciones lineales de las componentes de L en la forma
y procediendo de la misma manera con las componentes Ly y Lz , los coeficientes toman la forma
Iqw = mi ri2 qw qi wi ; q, w x, y, z (14.8)
donde a los elementos diagonales se les conoce como coeficientes de momento de inercia, en tanto que
los elementos no diagonales se denominan productos de inercia. Las Ecs. (14.8) son adecuadas si el sistema
de partculas es discreto. Para cuerpos rgidos contnuos la suma sobre i debe reemplazarse por una integral
volumetrica, la masa se convierte en un diferencial dm, de modo que los elementos de matriz se escriben como
Z Z
2 2
Iww = r w dm = (r) r 2 w2 dV , w x, y, z
V
Z
Iqw = (r) q w dV , q, w x, y, z (14.9)
V
donde (r) denota la densidad del solido en el punto r y dV es un diferencial de volumen alrededor de r.
Dado que en el contnuo desaparece el ndice de partcula, podemos condensar la notacion para los elemen-
tos diagonales y no diagonales si denotamos los ejes por Xi con i = 1, 2, 3 y el elemento de matriz Ijk se
escribira como Z
Ijk = (r) r 2 jk xj xk dV (14.10)
V
De la Ec. (14.7) podemos escribir la ecuacion que relaciona al momento angular total con la velocidad angular
de rotacion en la forma
Li = Iij j LS = IS S (14.11)
donde los elementos matriciales Iij estan dados por (14.10). El subndice S enfatiza que esta ecuacion y todos
los observables se miden en el sistema inercial S y con la base de vectores unitarios definida por S. En la
practica sin embargo, resulta poco util esta relacion ya que los elementos de la matriz IS dependen de la
dinamica del cuerpo y solo se podra calcular cuando este resuelto el problema. Por tanto reescribiremos a los
vectores L y y al operador I en una base de vectores unitarios de un sistema S de ejes fijos al cuerpo. Para
ello usamos la matriz pasiva de cambio de base B que nos lleva de la base en S a la base en S , esta matriz es
ortogonal real propia ya que pasa una base ortonormal a otra base ortonormal, multiplicando por B a ambos
lados de (14.11)
BLS = BIS B1 B S (BLS ) = BIS B1 (B S )
LS = I S S (14.12)
376 CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO
recordando que estas transformaciones son de tipo pasivo tenemos que LS , S representa a los mismos
vectores que LS , S . As mismo, IS representa al mismo operador que IS . Simplemente, se estan escribiendo
en bases diferentes. Por ejemplo LS NO representa el momento angular medido por el sistema S (el cual
obviamente es cero), lo que representa es al vector momento angular que mide el sistema S pero escrito en la
base de vectores unitarios ui fija al sistema S .
Que se logra con esta transformacion pasiva? basta notar el hecho de que si la matriz que representa
al operador I en la nueva base conserva su forma, es decir si IS viene dada por las Ecs. (14.10) con el
simple reemplazo xk xk esta matriz sera independiente del tiempo, ya que las coordenadas xi , yi , zi son
constantes en el tiempo para cada partcula iesima cuando S esta fijo al cuerpo. En consecuencia IS solo
dependera de factores geometricos. Los elementos de matriz seran constantes en el tiempo caractersticas del
cuerpo involucrado y dependientes del origen y orientacion del sistema coordenado particular fijo al cuerpo.
Sin embargo, para poder afirmar que IS es constante en el tiempo, es necesario demostrar que efectivamente
la representacion matricial de I conserva su forma ante una transformacion ortogonal propia (cambio de base),
esto se ve simplemente del hecho de que I es un tensor euclidiano de segundo rango, segun se puede demostrar
a traves de la regla del cociente expresada en la Ec. (12.186). Para ello notamos que se cumplen todas las
condiciones exigidas para la validez de esta regla del cociente: la ecuacion (14.11) es valida en cualquier sistema
cartesiano rotado segun se puede ver en el procedimiento que nos llevo a la Ec. (14.12) pues aunque elegimos
el sistema primado como un sistema de ejes del cuerpo, esta condicion no es necesaria para llegar a (14.12), el
vector es arbitrario pues en principio un cuerpo rgido se puede poner a rotar en cualquier direccion y con
cualquier velocidad angular y finalmente las cantidades L y son tensores bien definidos (vectores axiales). En
consecuencia, la regla del cociente nos lleva a que I es un tensor polar cartesiano de segundo rango, conocido
como tensor de inercia.
Con base en la discusion anterior, entenderemos que de ahora en adelante, la ecuacion
L = I (14.13)
se escribira en componentes usando la base de vectores unitarios definida por algun sistema coordenado fijo al
cuerpo rgido S 4 . Pero no debemos perder de vista que los observables involucrados en esta ecuacion son los
medidos con respecto al sistema de referencia S. El operador I esta representado por una matriz 3 3 cuyos
elementos son los coeficientes de momento de inercia y los productos de inercia. L y son vectores columna. Es
claro que el operador I actua desde un punto de vista activo sobre . Esto se puede ver de varias maneras: los
vectores L y son vectores fsicamente diferentes que incluso tienen diferentes dimensiones, y no simplemente
el mismo vector expresado en sistemas coordenados distintos. A diferencia del operador de rotacion que es
adimensional, el operador I tiene dimensiones de masa por longitud al cuadrado, y no esta restringido por
ninguna condicion de ortogonalidad, puesto que no esta obligado a conservar la norma del vector original.
donde el ndice i es un rotulo para partculas. Por simplicidad continuaremos utilizando la version discreta,
el procedimiento para el contnuo es analogo. Multiplicando (14.14) por el vector y usando la Ec. (14.13),
4
Naturalmente esta base de vectores unitarios es diferente en cada instante de tiempo, pero esto no compromete la validez de
la Ec. (14.13), la cual se evalua en cada instante de tiempo.
14.2. TENSOR DE INERCIA Y MOMENTO DE INERCIA 377
resulta
I = mi ri2 ri (ri ) = L
que coincide con la Ec. (14.6) y nos muestra la ventaja de usar el algoritmo algebraico de afinores. La energa
cinetica del cuerpo rgido se escribe como
1
T = mi vi2
2
donde vi es la velocidad de la partcula iesima relativa al punto fijo en el sistema S0 . A partir de la Ec.
(14.5), esta energa cinetica se puede escribir de la forma
1
T = mi vi ( ri )
2
utilizando la identidad vectorial a (b c) = b (c a), tenemos que
T = [mi (ri vi )]
2
la cantidad sumada sobre i en parentesis cuadrados, se reconoce como el momento angular total del cuerpo
alrededor del origen de S0 y en consecuencia la energa cinetica se puede escribir en la forma
L I
T = = (14.16)
2 2
definamos ahora
n (14.17)
siendo n la direccion del eje de rotacion, reescribimos la expresion como
2 1
T = n I n = I 2 ; I nIn (14.18)
2 2
usando (14.14) y la definicion de I en (14.18) vemos que esta cantidad esta dada por
h i
I n I n = mi ri2 (ri n)2 (14.19)
puesto que n es un vector axial e I es un tensor polar de segundo rango, la definicion de I en (14.18) nos dice
que I es un tensor polar de rango cero (escalar) y se conoce como el momento de inercia con respecto al eje
de rotacion definido por n y que pasa por el origen de S0 . Podemos escribir esta cantidad de la forma:
I n I n = mi ri2 ri2 cos2 i = mi ri2 sin2 i
La figura 14.1 muestra que la distancia entre el eje de rotacion y la partcula iesima esta dada por
Ri = ri sin i . Por lo tanto, el momento de inercia se puede escribir como
I = mi Ri2 (14.20)
siendo Ri la distancia entre la partcula iesima y el eje de rotacion. De esta expresion es claro que el valor del
momento de inercia depende de la direccion y localizacion del eje de rotacion5 . Dado que cambia en general
su direccion con respecto al cuerpo a medida que el tiempo transcurre, el momento de inercia sera tambien en
general funcion del tiempo6 . No obstante, si el cuerpo esta restringido a rotar sobre un eje fijo, el momento de
inercia sera una constante. En tal caso, la energa cinetica (14.16) esta casi en la forma requerida para construir
ecuaciones de movimiento de Lagrange o Hamilton, solo se requiere escribir como la derivada temporal de
algun angulo lo cual esta sugerido en la Ec. (13.69), y no presenta mayor dificultad.
5
Es decir para calcular el momento de inercia debemos ubicar la direccion del eje y un punto por donde pasa. Por otro lado,
recordemos que el origen se debe tomar de tal forma que pase por el eje de rotacion, en ese sentido se dice que el momento de
inercia (y el tensor de inercia) depende de la orientacion del eje y del origen.
6
De la expresion (14.19) vemos que I depende del tiempo solo a traves de n, puesto que el tensor I es independiente del tiempo,
al menos si usamos una base fija al cuerpo.
378 CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO
Figura 14.1: Ilustracion del momento de inercia con respecto al eje definido por n y que pasa por el punto O
que se elige como origen. La partcula iesima del cuerpo rgido esta a una distancia Ri de dicho eje.
Theorem 23 Teorema de Steiner: si tenemos dos ejes paralelos y uno de ellos pasa por el centro de masa del
cuerpo rgido, los momentos de inercia vistos por ambos ejes estan relacionados por
I = IC + M a2
siendo M la masa total del cuerpo y siendoa la distancia entre los ejes.
Definamos un eje XO que pasa por un cierto origen O, y sea XC un eje que pasa por el centro de masa
del cuerpo y que es paralelo a XO . Denotemos por RC a la posicion del centro de masa (CM) con respecto al
origen O. Recurriendo a la definicion del momento de inercia (14.20) y a la Fig. 14.1, escribiremos el momento
de inercia con respecto a XO
IO = mi Ri2 = mi ri2 sin2 i = mi (ri n)2 (14.21)
14.2. TENSOR DE INERCIA Y MOMENTO DE INERCIA 379
Figura 14.2: Ilustracion del teorema de los ejes paralelos o teorema de Steiner para el momento de inercia.
donde la posicion de la partcula iesima con respecto al origen O se define por ri , y su posicion con respecto
al CM se denota por ri , la Fig. 14.2 muestra que
ri = RC + ri (14.22)
es claro ademas de la Fig. 14.2, que la distancia entre la partcula iesima y el eje XC viene dada por
2 = r 2 sin2 . Reemplazando (14.22) en (14.21), el momento de inercia se escribe (escribiremos la suma
RiC i i
explcita)
X 2 X h 2 i
IO = mi ri + RC n = mi ri n + (RC n)2 + 2 ri n (RC n)
i i
Xh i
IO = mi ri2 sin2 i + mi (RC n)2 + 2 mi ri n (RC n)
i
! " ! #
X X 2 1 X
2
IO = mi RiC + mi (RC n) + 2M mi ri n (RC n)
M
i i i
P
el termino i mi ri /M se refiere a la posicion del centro de masa vista por el propio centro de masa de modo
que se anula. Por otro lado, el primer termino a la derecha es claramente el momento de inercia visto por el
eje XC .
IO = IC + M (RC n)2 = IC + M RC 2
sin2
y nuevamente la Fig. 14.2 muestra que RC sin es la distancia entre los dos ejes, de modo que (omitiendo el
subndice O)
I = IC + M a2 (14.23)
lo cual demuestra el teorema de Steiner. El segundo termino de la derecha equivale al momento de inercia que
tendra el cuerpo rgido con respecto al eje XO si toda la masa del cuerpo estuviera condensada en un punto
380 CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO
que esta a una distancia a de tal eje (en particular, un punto que pasa por el eje XC ). Podemos ver como
corolario que dada una orientacion especfica, de todos los ejes con esta orientacion el que pasa por el centro
de masa es el que da el mnimo valor posible del momento de inercia. Vemos ademas que el teorema de Steiner
nos enfatiza que para calcular el momento de inercia, no solo necesitamos la orientacion del eje de rotacion,
sino tambien un punto por donde pasa.
Para el tensor de inercia existe una propiedad analoga. Reemplacemos (14.22) en (14.14) y escribamos la
suma de forma explcita
X h 2 i
I = mi RC + ri 1 RC + ri RC + ri
i
X
2
I = mi RC 1 + ri2 1 + 2 RC ri 1 RC RC + RC ri + ri RC + ri ri
i
el tensor de inercia medido en el origen O se puede escribir en forma de afinor de la siguiente forma7
( )
X 2
2
I = M RC 1 + mi ri + 2RC ri 1 ri ri + RC ri + ri RC M RC RC
i
( )
X 2
I = mi r2
i 1 ri ri + 2RC ri 1 RC ri ri RC + M RC 1 M RC RC
i
( ) ! ( )
X X X X
2
I = mi r2
i 1 ri ri + 2RC mi ri 1 RC mi ri mi ri RC + M RC 1 M RC RC
i i i i
todas las sumas de la forma mi ri se anulan ya que estan asociadas a la posicion del CM vista por el propio
CM. La expresion se reduce a
" #
X
2 2
I = mi ri 1 ri ri + M RC 1 RC RC (14.24)
i
2
I = IC + M RC 1 RC RC (14.25)
de la Ec. (14.14) vemos que el segundo termino a la derecha de (14.25) correspondera al tensor de inercia con
respecto a O asociado a una partcula puntual de masa M situada en el centro de masa. En tal sentido, tanto
el momento de inercia como el tensor de inercia admiten una descomposicion relativa al CM muy semejante a
la que existe para la energa cinetica, el torque y el momento angular.
Finalmente, para distribuciones de masa bidimensionales, es facil relacionar el momento de inercia de un
sistema de tres ejes perpendiculares con origen comun, si colocamos el solido rgido plano sobre el plano XY
es claro que sus momentos de inercia con respecto a cada eje vendran dados por
Ix = mi yi2 ; Iy = mi x2i ; Iz = mi x2i + yi2
1. La representacion matricial del tensor de inercia depende de la base de vectores cartesianos elegida pero
tambien del origen de coordenadas elegido, ya que depende del vector posicion y de sus coordenadas.
2. Iij = Iji el tensor de inercia es simetrico y real, lo cual corresponde a una matriz hermtica real.
Recordemos que la propiedad de simetra es invariante ante un cambio de base ortogonal. Por tanto,
esta propiedad es valida en cualquier sistema ortogonal de ejes8 . El caracter simetrico y real a su vez
implica que el tensor tiene seis grados de libertad.
3. Iii 0, en cualquier base de modo que los elementos diagonales son no negativos. La ecuacion (14.8) nos
muestra que Ixx se puede escribir como
Ixx = mi yi2 + zi2
que solo es cero si todos los yi y zi son nulos. Esto indicara que la masa del cuerpo rgido esta toda
distribuda sobre el eje X. Es decir, un elemento diagonal puede ser nulo solo si la distribucion de masa
es unidimensional o si consta de una sola masa puntual. Si la distribucion es unidimensional solo un
elemento diagonal puede ser cero (y solo si se elige la base de modo que la distribucion de masa este a
lo largo de un eje). Si la distribucion es una masa puntual, todos los elementos del tensor de inercia son
cero (una masa puntual no puede rotar alrededor de un eje que pase por ella).
4. De lo anterior se deduce que si el cuerpo rgido es plano o volumetrico tendremos que Iii > 0, para los
tres ejes, y para cualquier base y origen.
Dado que la representacion matricial de este tensor es hermtica (simetrica y real) para cualquier base
ortogonal y origen coordenado, sus valores propios son reales (ver seccion 12.11). Mas aun dado que sus
elementos diagonales son no negativos en cualquier base, lo seran en particular en la base que diagonaliza tal
tensor, y dado que los elementos en la diagonal de la matriz diagonalizada son los valores propios, se deduce
que los valores propios de I son no negativos, y de hecho seran estrictamente positivos para distribuciones de
masa superficiales o volumetricas. Apelando al teorema 15, Pag. 315, encontramos que I es un operador lineal
definido positivo si la distribucion de masa es superficial o volumetrica, y singular positivo si la distribucion
es lineal o consta de una sola masa puntual.
Es claro que estas consideraciones han sido independientes del origen elegido. Adicionalmente, una transfor-
macion de similaridad con una matriz ortogonal real propia, preserva el caracter definido positivo (o singular
positivo) de una matriz. Por tanto, el caracter definido positivo o singular positivo de I es intrnseco, i.e.
independiente de la base y el origen utilizados.
Otra forma de ver la positividad del tensor de inercia es a traves de la definicion del momento de inercia
(14.18) combinada con la Ec. (14.20) para el momento de inercia con lo cual
n I n I = mi Ri2 0 (14.26)
siendo n un vector unitario real arbitrario y Ri la distancia de la masa mi al eje de rotacion. Puesto que I es
positivo y n es un vector unitario real pero por lo demas arbitrario, la Ec. (14.26) corresponde a la definicion
de una matriz positiva9 . En esta expresion se ve que la matriz es definida positiva a menos que todos los Ri
sean nulos, lo cual solo es posible si la distribucion de masa es lineal o si consta de una sola masa puntual. Se
requiere ademas que el eje pase por todas las masas de la distribucion.
Sintetizamos esta discusion enumerando las siguientes propiedades
1. El tensor de inercia es simetrico real. As mismo, es definido positivo para distribuciones superficiales y
volumetricas, y singular positivo para una distribucion lineal de masas o para una sola masa puntual10 .
8
En tensores, es de suma importancia saber si cierta propiedad es independiente de la base, o es valida solo en una base
particular.
9
El teorema 16, Pag. 315, nos dice que una matriz simetrica y real I es positiva si y solo si v I v 0, para v un vector real
arbitrario. Escribiendo v = vn 6= 0, esto es equivalente a escribir v 2 n I n 0, que a su vez es equivalente a n I n 0, para n
unitario y real pero por lo demas arbitrario.
10
Un conjunto discreto de varias masas puntuales no colineales se considera una distribucion superficial o volumetrica para
nuestros propositos.
382 CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO
2. Cuando I es definido positivo, todos sus valores propios son estrictamente positivos. Cuando es singular
positivo, al menos un valor propio es cero y los demas son positivos (ver ejercicio 3, Pag. 414).
3. Siempre es posible para un origen dado hacer una rotacion a ejes principales reales donde este tensor
sea diagonal, incluso en presencia de degeneracion de los valores propios11 . Esta caracterstica es muy
importante, ya que garantiza que la diagonalizacion se puede realizar dentro del espacio vectorial real
R3 .
5. La degeneracion completa indica simetra esferica como es el caso de esferas, cascarones y anillos esfericos
etc. (con densidad uniforme).
6. La rotacion que nos lleva a ejes principales tiene una interesante analoga con la rotacion que lleva a la
ecuacion de un elipsoide a su modo normal (ver seccion 12.11.3). En tal caso hablamos del elipsoide de
inercia. Los momentos principales de inercia determinan las longitudes de los ejes del elipsoide de inercia.
7. Recordemos que la degeneracion simple tiene como analogo geometrico a un elipsoide de revolucion y la
degeneracion total corresponde a una esfera.
1. La cantidad I es un tensor cartesiano polar de segundo rango, lo cual justifica el termino tensor de
inercia. Esto ademas implica que esta cantidad conserva su forma (definida por 14.10) en cualquier base
cartesiana. En notacion diadica, I se escribe en la forma de la Ec. (14.14)
I = mi ri2 1 ri ri (14.27)
2. Tanto el momento de inercia como el tensor de inercia poseen un teorema de ejes paralelos, estos teoremas
se escriben:
I = IC + M a2 (14.28)
2
I = IC + M RC 1 RC RC (14.29)
La Ec. (14.28) nos dice que si tenemos dos ejes paralelos uno de los cuales pasa por el centro de masa
del cuerpo, siendo a la distancia entre los ejes y M la masa del cuerpo rgido, el momento de inercia en
los dos ejes esta relacionado por dicha ecuacion. La Ec. (14.29) nos dice que si tenemos dos sistemas de
ejes S X1 X2 X3 y SC X1C X2C X3C paralelos entre s donde el origen de SC yace sobre el centro de
masa del cuerpo, los tensores de inercia medidos por ambos sistemas coordenados estan relacionados por
esta ecuacion, siendo RC el vector posicion del origen de SC medido con respecto al origen de S.
3. A partir de la definicion de momento de inercia (14.19), se ve que esta cantidad depende de la orientacion
y localizacion del eje con que se mide. El vector unitario n define la direccion, pero como I depende del
origen (el cual se debe elegir de modo que el eje pase por el), tenemos la direccion del eje y un punto por
donde pasa, lo cual define al eje unvocamente.
11
Esta caractersitca solo depende del caracter simetrico y real y no de su caracter positivo (ver seccion 12.11.1).
12
Si el origen que elegimos no pasa por el eje de simetra, el eje de simetra no sera en general eje principal con respecto a dicho
origen.
14.3. COMPENDIO DE PROPIEDADES DEL TENSOR DE INERCIA 383
Ahora bien, dado que el tensor de inercia es simetrico y real, se garantiza la existencia de ejes principales en
los cuales su representacion matricial es diagonal. Veremos que aspecto adquieren las ecuaciones antes vistas,
cuando se expresan en esta base de ejes principales. Cuando calculamos el tensor sobre los ejes principales
obtendremos una diada de la forma
I = Ikk uk uk Ik uk uk ; k = 1, 2, 3
con un origen dado, la relacion entre el momento angular y la frecuencia angular Ec. (14.13) se simplifica en
la forma
Lk = Ik k ; k = 1, 2, 3 (no hay suma) (14.30)
de la misma manera la expresion para la energa cinetica sera
1 1
T = I = (m um ) (Ik uk uk ) (n un )
2 2
1 1
T = (m Ik n ) (um uk ) (uk un ) = (m Ik n ) mk kn
2 2
1
T = Ik k2 (14.31)
2
se observa ademas, que si el eje de rotacion coincide con alguno de los ejes principales digamos X3 , entonces
k = k3 entonces la Ec. (14.30) nos da
Lk = Ik k3 = (I3 ) k3
es decir que solo sobrevive la componente 3, de modo que cuando la rotacion es alrededor de alguno de los ejes
principales, el momento angular es paralelo a la velocidad angular. Recordemos que la direccion de los ejes
principales coincide con la direccion de los vectores propios (conociendo los vectores propios, solo hay que elegir
un origen para determinar los ejes, pero este origen debe pasar por el eje de rotacion), por lo tanto el efecto
de I sobre cualquier vector paralelo a un eje principal nos da otro vector tambien paralelo al eje principal, sea
v un vector paralelo a uj
lo cual demuestra la anterior afirmacion. Este vector v tambien es naturalmente vector propio de I ya que la
accion de un operador sobre uno de sus vectores propios es tambien un vector propio13 .
Un concepto muy relacionado con el momento de inercia es el factor geometrico denominado radio de
giro definido por
I M R02 (14.32)
es decir dado un eje XO , el radio de giro es la distancia a este eje a la cual habra que colocar una masa puntual
con la masa de todo el solido, para que tuviese el mismo momento de inercia (con respecto a XO ) que el solido
completo. Recordando la definicion original del momento de inercia Ec. (14.19)
I =nIn
y comparando con la Ec. (12.103) podemos retomar el analisis hecho en la seccion 12.11.3. La Ec. (12.104) en
este contexto nos queda
n n
= (14.33)
I R0 M
13
Existen en todo caso posibles diferencias relativas a las unidades.
384 CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO
El radio vector a un punto sobre el elipsoide de inercia es entonces inversamente proporcional a R0 con respecto
a la direccion del vector. Las ecuaciones analogas a (12.106) y a (12.108) nos dan
siendo la ultima la ecuacion escrita en la base que diagonaliza al tensor de inercia, en la cual el elipsoide de
inercia adquiere su forma normal, lo cual geometricamente significa que los ejes de la base (ejes principales)
van a lo largo de los ejes del elipsoide. Ii son los valores propios del tensor de inercia (en cualquier base), en
presencia de degeneracion simple el elipsoide de inercia correspondera a un elipsoide de revolucion, en tanto
que en el caso de degeneracion completa el elipsoide se convierte en esfera.
El hecho de que el tensor de inercia y todas las cantidades asociadas a el tales como los ejes principales,
momentos principales, elipsoide de inercia etc., dependan del punto particular fijo en el cuerpo (origen elegido),
tiene como consecuencia que si cambiamos de punto en el cuerpo todas estas cantidades en general se modifican.
La Ec. (14.29) nos indica la manera en que el tensor de inercia se modifica cuando pasamos del punto de
referencia centro de masa a otro punto. En particular, la transformacion que diagonaliza a I cuando
el punto
2
fijo es el centro de masa no diagonalizara en general al termino diferencia M RC 1 RC RC de modo que
en general no definira ejes principales en el nuevo punto. El tensor diferencia solo sera tambien diagonal en
el caso en el cual RC vaya a lo largo de uno de los ejes principales relativos al centro de masa. En tal caso,
el nuevo tensor de inercia I posee los mismos ejes principales que en el centro de masa, pero los momentos
principales de inercia cambian, excepto en lo que corresponde al desplazamiento de ejes, donde es claro que el
elemento diagonal del tensor diferencia sera nulo. El teorema de los ejes paralelos para la forma diagonalizada
del tensor de inercia tiene entonces una forma algo especial y restringida.
El analogo geometrico del elipsoide de inercia resulta muy comodo para resolver al menos cualitativamente,
algunos aspectos de la dinamica del cuerpo rgido, para esto resulta mas conveniente parametrizar al vector
usando las Ecs. (14.18) y (14.17) en la Ec. (14.33)
n
= = = p =
I I 2T / 2 2T
= (14.36)
2T
F () = I = 2i Ii (14.37)
donde las superficies con F constante son elipsoides. De acuerdo con la Ec. (14.35), la superficie asociada
a F = 1 define el elipsoide de inercia (cuyos semiejes nos dan los momentos principales de inercia). La Ec.
(14.36), nos muestra que a medida que el eje de rotacion cambia en el tiempo, el vector se mueve con el, y
su extremo siempre esta en un punto de la superficie del elipsoide14 . El gradiente de F evaluado en ese punto
nos da la direccion de la normal al elipsoide en ese punto. De acuerdo con (14.37) tal gradiente con respecto
a viene dado por
2
F = 2I = (I )
2T
r
2
F = L (14.38)
T
con lo cual se observa que se movera de tal forma que la normal15 al elipsoide de inercia (en el punto donde
el extremo de toca al elipsoide) va en la direccion del momento angular.
Es claro geometricamente que en un punto de interseccion entre el elipsoide de inercia y un eje principal,
la normal a la superficie elipsoidal va a lo largo del eje principal. En consecuencia, cuando va a lo largo
de un eje principal, es paralelo a F, que a su vez implica que los vectores y L son paralelos entre s, en
concordancia con lo que se encontro para rotacion alrededor de un eje principal.
Bien sea que nuestro punto de referencia sea un punto fijo o el centro de masa, podemos obtener las
ecuaciones de movimiento de un cuerpo rgido empleando las Ecs. (1.15, 1.20) del formalismo Newtoniano.
Consideramos entonces un sistema inercial con origen en el punto fijo, o un sistema de ejes no rotante (con
respecto a un sistema inercial) con origen en el CM. En ambos casos es valida la Ec. (1.20) como se puede
verificar con la Ec. (1.28), estos sistemas los llamaremos simplemente sistemas no rotantes S0 , de modo que se
puede escribir
dL
=N (14.39)
dt S0
donde cambiamos la notacion para el torque por N. Podemos relacionar esta razon de cambio con aquella que
mide un sistema fijo al cuerpo usando (13.80)
dL dL
= +L (14.40)
dt S0 dt S
notese que esta ecuacion es estrictamente de caracter mixto en el sentido de que la razon de cambio de L es
medida por el sistema rotante fijo al cuerpo en tanto que los vectores N, L y estan medidos en el sistema no
rotante, sin embargo las coordenadas de estos vectores se escribiran en la base de vectores unitarios asociados
a S . A pesar de este caracter mixto, esta ecuacion resulta ser la mas conveniente para extraer la dinamica
del cuerpo rgido. Borraremos ahora el subndice S sobreentendiendo que se usa la base de un sistema
coordenado fijo al cuerpo y escribiremos esta ecuacion en componentes16
dLk
+ kmn m Ln = Nk
dt
si tomamos ejes principales con respecto al punto de referencia, podemos emplear (14.30) para escribir
dk
Ik + kmn m n In = Nk (no suma sobre k) (14.42)
dt
no hay suma sobre k pero s sobre los otros ndices. Hemos usado el hecho de que los momentos principales de
inercia son independientes del tiempo, lo cual a su vez esta ligado al hecho de escribir los vectores en la base
generada por S . Vale decir sin embargo, que aunque todos los observables en esta ecuacion estan escritos en
la base de ejes principales, , L y N como vectores estan medidos en el sistema S0 . En forma expandida estas
ecuaciones se escriben
I1 1 2 3 (I2 I3 ) = N1
I2 2 3 1 (I3 I1 ) = N2
I3 3 1 2 (I1 I2 ) = N3 (14.43)
Las Ecs. (14.42) o (14.43) se denominan ecuaciones de Euler de movimiento para un cuerpo rgido
con un punto fijo. Estas ecuaciones definen un sistema acoplado, sin embargo en presencia de degeneracion
simple (e.g. I1 = I2 6= I3 simetra cilndrica) se observa un desacople parcial de la tercera ecuacion ya que las
componentes N1 y N2 del torque solo afectan a 1 y 2 . Cuando la degeneracion es total (simetra esferica)
las ecuaciones se desacoplan completamente, esto nos muestra de nuevo que la degeneracion esta asociada con
simetras del sistema.
Es necesario hacer notar que las ecuaciones de Euler solo contienen la descripcion del movimiento rotacional,
y deben ser complementadas con las ecuaciones de la dinamica traslacional del centro de masa o del punto
16
Es necesario que todos los vectores esten escritos en la misma base para que sea valida la igualacion componente a componente.
14.4. ECUACIONES DE EULER PARA EL MOVIMIENTO DE UN CUERPO RIGIDO 387
de referencia. Finalmente, es necesario senalar otro inconveniente con las Ecs. (14.43), las componentes de
los vectores y N que all aparecen, estan evaluadas en la base fija al cuerpo, de modo que para obtener
el valor de cada uno de estos vectores necesitamos conocer la orientacion relativa de los vectores unitarios
base con respecto a los vectores base del sistema no rotante en el instante de tiempo en que evaluemos a
estos vectores. Por lo tanto, necesitaremos en general conocer la dinamica del sistema de ejes rotante para
determinar completamente a estos vectores en cualquier instante.
I2 2 3 1 (I3 I1 ) = N2
I1 1 2 3 (I2 I3 ) = N1
388 CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO
Figura 14.3: Ilustracion de la construccion de Poinsot para el estudio de la precesion libre. El elipsoide rueda
sin deslizar sobre el plano invariable definido por el momento angular. La Polhodia y Herpolodia son las curvas
trazadas sobre la superficie del elipsoide y el plano invariable respectivamente.
Ya hemos visto que en el sistema coordenado de los ejes principales del solido, la superficie que forma el
elipsoide de inercia nos da una relacion entre y L. En particular cuando la energa cinetica es constante, el
vector dado por (14.36) nos define completamente la dinamica del vector , y ya vimos que el extremo de
define un punto sobre la superficie del elipsoide, y que la normal a la superficie del elipsoide en este punto
determina precisamente la direccion del momento angular como se puede apreciar en (14.38).
14.5. PRECESION LIBRE 389
En el caso particular de solido libre, el momento angular es fijo en el sistema inercial y por tanto define la
direccion de un plano, y dado que precisamente L es perpendicular a la superficie del elipsoide en el punto donde
esta el extremo de , podemos definir unvocamente un plano normal a L y tangente al elipsoide en el punto
donde esta ubicado el extremo de (que denominaremos plano invariable). A medida que va cambiando el valor
de (i.e. de ), el elipsoide (que esta fijo al cuerpo) se debe mover entonces sobre este plano tangente a fin de
preservar la conexion entre y L. La fig 14.3 muestra la configuracion geometrica resultante. Adicionalmente,
se puede mostrar que la distancia entre el origen del elipsoide y el plano tangente a este en el extremo de
debe ser constante en el tiempo. Esta distancia es la proyeccion de sobre la direccion de L
b = L = L =
L
2T
L L 2T L
donde hemos usado las Ecs. (14.16, 14.36). Es claro que esta cantidad es constante en nuestro caso ya que T y
L son constantes. En consecuencia, el centro del elipsoide esta a una altura constante con respecto al plano
invariable. Adicionalmente, el centro del elipsoide coincide con el origen de todos los sistemas de referencia que
estamos usando ya que este origen se eligio para que no exista traslacion respecto al sistema inercial del centro
de masa (o punto fijo), por tanto dicho punto es estacionario con respecto al plano invariable. De lo anterior
se puede ver que el movimiento libre de fuerzas de un cuerpo rgido se puede representar considerando que
es el del elipsoide de inercia rodando sin deslizar sobre el plano invariable, con el centro del elipsoide fijo y a
una altura constante en el plano. La rodadura tiene lugar sin deslizamiento puesto que el punto de contacto
esta definido por el extremo de , el cual por estar dirigido segun el eje instantaneo de rotacion, es la direccion
del cuerpo que esta momentaneamente en reposo. La curva trazada por el punto de contacto sobre la superficie
del elipsoide de inercia se denomina polhodia. En tanto que la curva que traza el punto de contacto sobre
el plano invariable se denomina herpolhodia. Ocurre entonces que la polhodia rueda sin deslizar sobre la
herpolhodia que esta en el plano invariable.
La construccion de Poinsot es adecuada para describir completamente el movimiento de un cuerpo rgido
libre de fuerzas, ya que la direccion del plano invariable y la altura del elipsoide de inercia se determinan con los
valores de T y L, las cuales estan entre las condiciones iniciales del problema. El problema se reduce entonces
al problema geometrico de trazar la polhodia y la herpolhodia. Es notable el hecho de que la herpolhodia
es siempre concava hacia el origen de aqu su nombre que significa en forma de serpiente. La direccion y
magnitud de la velocidad angular estan dictaminadas por el vector como se puede ver de (14.36) teniendo en
cuenta que en nuestro caso T es constante. Por otro lado, la orientacion instantanea del cuerpo esta determinada
por la orientacion del elipsoide de inercia, ya que este esta fijo al cuerpo. Muchas descripciones del movimiento
libre de un cuerpo rgido basadas en estos argumentos se pueden encontrar en la literatura.
Es claro sin embargo, que este analisis no permite encontrar la dependencia parametrica de la polhodia o
la herpolhodia con el tiempo. Ademas, tampoco garantiza que todos los puntos de dichas curvas sean trazados
en el movimiento real, ya que es posible que solo una parte de dichas curvas se trace con un conjunto dado de
condiciones iniciales. En tal sentido, este analisis tiene limitaciones similares a las discutidas en las secciones
10.3 y 10.4, concernientes al analisis de curvas de potencial efectivo.
En el caso especial de simetra axial del cuerpo (que se representa por la degeneracion simple de los valores
propios del tensor de inercia), el elipsoide de inercia se convierte en un elipsoide de revolucion, de modo que
claramente la polhodia sobre el elipsoide es un crculo alrededor del eje de simetra. De la misma manera,
la herpolhodia sera tambien un crculo sobre el plano invariable. Un observador fijo al cuerpo vera que se
mueve sobre la generatriz de un cono (denominado el cono del cuerpo) cuya interseccion con el elipsoide
de inercia forma la polhodia. De manera analoga, un observador fijo en los ejes inerciales ve que se mueve
sobre la superficie de un cono del espacio cuya interseccion con el plano invariable genera la herpolhodia.
Por esta razon es usual describir el movimiento libre de un solido con simetra axial como el generado por el
rodamiento del cono del cuerpo sobre el cono del espacio.
390 CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO
Adicionalmente, si el momento de inercia alrededor del eje de simetra es menor que aquel correspondiente
a los otros dos ejes principales, se ve a traves de la Ec. (12.108) que el elipsoide sera prolato i.e. la longitud
a lo largo del eje de simetra sera mayor a la longitud de la seccion de revolucion (alargado como un balon de
rugby). Si por el contrario, el momento de inercia alrededor del eje de simetra es mayor, el elipsoide es oblato
(achatado).
En el caso de elipsoides prolatos, el cono del cuerpo es exterior al cono del espacio, para elipsoides oblatos
el cono del cuerpo rueda sobre el interior del cono del espacio. No obstante, en ambos casos se observa que
la direccion de precesa en el tiempo alrededor del eje de simetra del cuerpo. Por esta razon hablamos del
fenomeno de precesion libre.
Puede verse ademas, que si la rotacion es alrededor de un eje principal, un eje del elipsoide coincide con
la direccion de (y por tanto de ) y es perpendicular al plano invariable. En consecuencia es paralelo a L
como ya se vio con otros metodos, y la precesion de desaparece ya que dicho vector sera constante.
L21 L2 L2
T = + 2 + 3 (14.49)
2I1 2I2 2I3
puesto que T es constante, esta relacion define un elipsoide, referido como el elipsoide de Binet, que tambien
esta fijo en los ejes del cuerpo pero que NO coincide con el elipsoide de inercia18 . Si adoptamos la convencion
I3 I2 I1 y escribimos la ecuacion para el elipsoide en forma estandar
L21 L22 L2
+ + 3 =1 (14.50)
2T I1 2T I2 2T I3
el elipsoide tendra semiejes que en orden decreciente corresponden a 2T I1 , 2T I2 , 2T I3 . Por otro lado,
dado que se conserva la magnitud del momento angular podemos escribir una ecuacion de la forma
a2j
a2j = Li Li
ai ai
si aj es el menor de los semiejes principales (por convencion a3 ) tendremos que aj /ai 1 y por tanto
a23 a2 a2
a23 = L21 2 + L22 32 + L23 32 L21 + L22 + L23 = L2
a1 a2 a3
a21 L2
por lo tanto p p
2T I3 L 2T I1 (14.52)
que es lo que se quera demostrar. Si a3 6= a1 , la esfera esta fuera del elipsoide sobre el eje L3 y dentro del
elipsoide en el eje L1 20 . Las Figs. 14.4 muestran las curvas que resultan de la interseccion del elipsoide con la
esfera para diferentes valores de L ydesde diferentes perspectivas. Las curvas que aparecen como lneas rectas
en la Fig. 14.4 corresponden a L = 2T I2 .
Figura 14.4: Ilustracion de las trayectorias posibles del vector L sobre la superficie del elipsoide de Binet fijo
al cuerpo, para el estudio de la precesion libre.
Recordemos que i son componentes medidas en la base de los ejes principales del cuerpo, por tanto la
estacionaridad se esta midiendo usando una base de ejes fijos al cuerpo. Si en general suponemos que todos
los momentos principales de inercia son diferentes como es de esperarse con un solido irregular, vemos que el
movimiento estacionario para dicho solido solo es posible si al menos dos de las componentes de son cero, es
decir va a lo largo de un solo eje principal21 . Si existe degeneracion simple por ejemplo I1 = I2 solo existe
la condicion de que 3 = 0 de modo que puede estar en cualquier direccion dentro del plano X1 X2 lo cual
es de esperarse ya que cualquier eje sobre ese plano es eje principal. Si la degeneracion es total puede estar
en cualquier direccion ya que cualquier eje es principal en virtud de la simetra esferica.
Retornemos al caso no degenerado en donde los ejes principales forman un conjunto con una orientacion
bien definida. En este caso como ya vimos el movimiento solo puede ser estacionario si hay rotacion alrede-
dor de alguno de los ejes principales. Una pregunta natural que surge en toda condicion estacionaria es su
estabilidad, es decir la desviacion del comportamiento estacionario ante pequenas perturbaciones, para lo cual
examinaremos lo que ocurre en cada eje. Supongamos que como condicion inicial la rotacion comienza alrede-
dor del tercer eje principal (recordemos que por convencion I3 es el menor de los tres momentos de inercia),
ocurrira movimiento estable alrededor de L3 si comenzando con L en la direccion L3 garantizamos que no hay
otras orientaciones posibles en la vecindad del eje L3 ; geometricamente esto significa que la esfera y el elipsoide
de binet solo se deben intersectar en un punto en una vecindad de L3 de modo que el radio de la esfera debe
coincidir con el valor del semieje menor, es decir L2 = 2T I3 . Cuando hay una pequena desviacion de este
valor, el radio de la esfera del momento angular es solo un poco mayor de este valor22 , y la interseccion con el
elipsoide de la energa cinetica sera una pequena figura cerrada alrededor del eje L3 . El movimiento es entonces
estable ya que una pequena perturbacion produce una desviacion ligera de L alrededor del eje original.
Una situacion similar ocurre en el otro extremo en el cual el movimiento se hace alrededor del eje de mayor
momento de inercia. El movimiento estable ocurre cuando L2 = 2T I1 y cuando este movimiento es perturbado,
el radio de la esfera del momento angular es solo ligeramente menor que este valor. La interseccion es de nuevo
un pequeno crculo alrededor del eje principal y el movimiento es estable. En contraste, para el eje intermedio
L2 , la energa cinetica tiene dos orbitas que circundan al elipsoide y se cruzan entre s donde L2 pasa a traves
del
elipsoide (ver Figs. 14.4). En consecuencia, hay dos orbitas diferentes con valores ligeramente menores que
23
2T I2 y otras dos orbitas diferentes con valores ligeramente mayores que 2T I2 , todas las cuatro orbitas
tienen caminos largos y apartados sobre la superficie del elipsoide (Figs. 14.4). Este es un fenomeno tpico de
bifurcacion que por supuesto implica inestabilidad.
Lo anterior se puede entender teniendo en cuenta que para el eje con momento intermedio el radio de
curvatura del elipsoide en una direccion es mas grande que el de la esfera de contacto en tanto que es menor
en la direccion perpendicular. En los otros extremos en cambio los radios de curvatura son o bien mas grandes
o bien mas pequenos que el radio de la esfera en todas las direcciones. Estos criterios de estabilidad son de
gran utilidad en aplicaciones concernientes a la estabilidad de sistemas rotantes tales como naves espaciales.
No obstante, cuando hay fuerzas disipativas presentes, estos argumentos de estabilidad deben ser modificados.
Por ejemplo, para un cuerpo con L constante pero con T suavemente decreciente, la unica rotacion estable
es alrededor del eje principal con mayor momento de inercia. Esto se puede ver teniendo en cuenta que la
energa cinetica de rotacion alrededor de un eje principal iesimo viene dada por T = L2 /2Ii la cual tiene
un valor mnimo para el eje con mayor momento de inercia, y por tanto conduce a un movimiento estable
alrededor de tal eje. Cuando se pone a rotar al cuerpo alrededor de otro de los ejes principales el efecto de
decrecimiento ligero de la energa cinetica es el de cambiar gradualmente el eje de rotacion hasta que termina
rotando alrededor del eje con maximo valor de momento de inercia.
21
En tal caso L es paralelo a , y como L es constante, tambien lo sera .
22
La Ec. (14.52) nos garantiza que el radio de la esfera no puede ser menor que el semieje menor del elipsoide de Binet.
Similarmente tampoco puede ser mayor que el semieje mayor. Estrictamente, tanto la esfera como el elipsoide pueden cambiar,
por ejemplo si se introduce una pequena fuerza que produce un pequeno torque por un breve instante, puede ocurrir en general un
ligero cambio en el momento angular y tambien en la energa cinetica y ambas figuras deben cambiar. En cualquier caso al volver
a ser libre el cuerpo rgido se tiene que mantener la relacion (14.52) de modo que no cambia nuestra discusion.
23
Notese que en este caso el radio de la esfera puede aumentar o disminuir dentro de cierto intervalo sin violar la condicion
(14.52).
14.5. PRECESION LIBRE 393
la ultima de estas ecuaciones establece que 3 es constante, y se puede tratar como una condicion inicial
conocida del problema. Las dos ecuaciones siguientes se escriben como
I3 I1
1 = 2 ; 2 = 1 ; 3 (14.54)
I1
derivando la primera de estas ecuaciones y teniendo en cuenta la segunda, se obtiene
1 = 2 = 2 1 1 = 2 1
1 = A cos (t + ) (14.55)
estas soluciones muestran que 3 u3 es constante en tanto que 1 u1 + 2 u2 es constante en magnitud y rota
uniformemente alrededor del eje de simetra X3 del cuerpo con frecuencia angular . Esto indica entonces que
el vector completo es constante en magnitud y precesa alrededor de X3 con la misma frecuencia, tal como
lo predijo la construccion de Poinsot.
Otra forma interesante de ver la precesion es construyendo un vector a lo largo de X3 y con magnitud
descrita por la tercera de las Ecs. (14.54). En tal caso, las Ecs. (14.53) se pueden sintetizar en una ecuacion
vectorial
=
la cual muestra inmediatamente la precesion de con frecuencia .
Es importante tener en cuenta que la precesion aqu descrita es vista por los ejes del cuerpo, que a su
vez rotan en el espacio con una frecuencia que es usualmente mayor que . De otra parte, la tercera de
las Ecs. (14.54) nos dice que entre mas cerca este I1 de I3 mas lenta sera la precesion i.e. menor sera con
respecto a . Las constantes A (amplitud de precesion) y 3 se pueden evaluar en terminos de las constantes
de movimiento mas usuales como son T y L2 , es facil ver que estas cantidades se pueden escribir en terminos
de A y 3 de la siguiente forma. Empleamos primero las Ecs. (14.30, 14.31) para ejes principales con I1 = I2
y tendremos en cuenta las Ecs. (14.55, 14.56)
1 1 1 1
T = I1 12 + 22 + I3 32 = I1 A2 cos2 (t + ) + A2 sin2 (t + ) + I3 32
2 2 2 2
1 1
T = I1 A2 + I3 32
2 2
L2 = (I ) (I ) = [(Ik uk uk ) (m um )] [(Ij uj uj ) (n un )]
= [Ik m uk (uk um )] [Ij n uj (uj un )] = [Ik m uk km ] [Ij n uj jn ]
= [Ik k uk ] [Ij j uj ] = Ik Ij k j (uk uj ) = Ik Ij k j kj = Ik2 k2
= I12 12 + 22 + I32 32 = I12 A2 + I32 32
quedando finalmente
1 1
T = I1 A2 + I3 32 ; L2 = I12 A2 + I32 32 (14.57)
2 2
394 CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO
I3 I1
= 0,00327
I1
y dado que 3 es casi igual en magnitud que este resultado predice un periodo de precesion de unos 306
dias es decir unos 10 meses. Si alguna perturbacion ocurre sobre el eje de figura de la tierra, esperaramos que
el eje de rotacion precese alrededor del eje de figura (alrededor del polo norte) una vez cada diez meses. En
realidad se ha medido una precesion alrededor del polo con una amplitud del orden de unas pocas decimas
de segundo de latitud, aunque modelos mas realistas deben inclur otros efectos tales como fuerzas de friccion
que se producen por la no rigidez del planeta.
14.5.5. Estabilidad de solidos irregulares con precesion libre por metodos algebraicos
Retornemos al caso de solidos irregulares para los cuales los tres momentos de inercia a lo largo de ejes
principales son diferentes. Veremos el problema de la estabilidad directamente con las ecuaciones de Euler y sus
soluciones. Asumiremos que en t = 0 el movimiento comienza con 2 = 3 = 0 y 1 6= 0. Y que inmediatamente
despues de una breve perturbacion, 2 y 3 adquieren valores no nulos pero mucho menores que 1 . Cuando
la perturbacion termina, el movimiento vuelve a ser libre de fuerzas y torques de modo que las ecuaciones de
Euler quedan
I1 1 = 2 3 (I2 I3 ) (14.58)
I2 2 = 3 1 (I3 I1 ) (14.59)
I3 3 = 1 2 (I1 I2 ) (14.60)
dado que 2 y 3 son pequenos con respecto a 1 el termino a la derecha de la ecuacion (14.58) es de segundo
orden y se puede despreciar, por tanto tenemos que a primer orden I1 1 = 0 y 1 se puede considerar constante.
Derivando (14.59)
I2 2 = (3 1 + 3 1 ) (I3 I1 ) 3 1 (I3 I1 ) (14.61)
si I1 es el mayor o el menor de los tres momentos de inercia A sera negativo y laEc. (14.62) corresponde a la
ecuacion de un oscilador armonico simple. En tal caso, 2 oscila con frecuencia A con amplitud acotada, y
es facil demostrar que 3 tambien realiza movimiento armonico simple, en tanto que 1 es constante a primer
orden. Esto implica que el vector solo sufre una ligera desviacion de su valor original. En contraste, si I1 es el
eje intermedio, A sera positivo y las componentes 2 y 3 tenderan a crecer exponencialmente con el tiempo,
dando un movimiento inestable. Esta descripcion coincide con el analisis cualitativo de la seccion 14.5.3, basado
en el elipsoide de Binet.
14.6. LA PEONZA SIMETRICA PESADA CON UN PUNTO FIJO 395
Figura 14.5: Peonza simetrica pesada con un punto fijo que no esta en el centro de masa. El origen de ambos
sistemas coordenados se ubica en el punto fijo de la peonza. El campo gravitacional va en la direccion X3 .
el punto fijo, ambos sobre el eje de simetra esta dada por l. La razon de cambio de cada angulo nos da las
caractersticas del movimiento de la peonza
2. mide la precesion o rotacion del eje de figura X3 alrededor del eje vertical X3 .
3. mide la nutacion, o cabeceo arriba y abajo del eje de figura X3 relativo al eje vertical X3 .
En la mayora de casos de interes estas razones de cambio estan en la siguiente jerarqua: >> >> .
Puesto que I1 = I2 6= I3 las ecuaciones de Euler (14.43) quedan
I1 1 + 2 3 (I3 I1 ) = N1
I2 2 + 1 3 (I1 I3 ) = N2
I3 3 = N3 (14.63)
1 1
T = I1 12 + 22 + I3 32 (14.64)
2 2
como la idea es escribirla en terminos de los angulos de Euler, usaremos las Ecs. (13.64)
2 2
12 + 22 = sin sin + cos + sin cos sin
= 2 sin2 sin2 + 2 cos2 + 2 sin sin cos + 2 sin2 cos2 + 2 sin2 2 sin cos sin
= 2 sin2 sin2 + cos2 + 2 cos2 + sin2
12 + 22 = 2 sin2 + 2 (14.65)
2
32 = cos + (14.66)
1 I
3
2
T = I1 2 sin2 + 2 + cos + (14.67)
2 2
por otro lado, la energa potencial gravitacional del cuerpo rgido es la suma de las energas potenciales
individuales de cada partcula
m r
i i
V = Fi ri = mi g ri = M g
M
V = M RC g
14.6. LA PEONZA SIMETRICA PESADA CON UN PUNTO FIJO 397
siendo g el campo gravitacional uniforme en la superficie de la tierra y RC la posicion del centro de gravedad
de la peonza (que coincide con el centro de masa para campo gravitacional uniforme). En consecuencia, la
energa potencial es la misma que si todo el cuerpo estuviera concentrado en su centro de masa. A partir de
la geometra de la Fig. 14.5 se ve que
dada la energa cinetica (14.67) y la energa potencial (14.68), el Lagrangiano para la peonza simetrica pesada
con punto fijo queda en la forma
1 I
3
2
L = I1 2 sin2 + 2 + cos + M gl cos (14.69)
2 2
L
p = = I3 + cos = I3 3 I1 a (14.70)
L
p = = I1 sin2 + I3 cos2 + I3 cos I1 b (14.71)
donde hemos usado la tercera de las Ecs. (13.64). Ademas hemos expresado estas constantes de movimiento en
terminos de nuevas constantes a y b. Es inmediato ver que existe una constante adicional de movimiento dado
que el sistema es conservativo: la energa total del sistema (que coincide con la funcion energa y numericamente
con el Hamiltoniano)
1 I
3
E = T + V = I1 2 sin2 + 2 + 32 + M gl cos (14.72)
2 2
donde hemos usado la Ec. (14.67) y la tercera de las Ecs. (13.64). Puesto que tenemos tres coordenadas
generalizadas, tres cuadraturas son suficientes para resolver el problema. Estas se pueden obtener de las
integrales primeras de movimiento sin recurrir explcitamente a las ecuaciones de Euler-Lagrange. Despejando
en (14.70) se obtiene
I3 = I1 a I3 cos (14.73)
que a su vez se puede sustituir en (14.71) para eliminar en dicha ecuacion
I1 sin2 + I3 cos2 + I1 a I3 cos cos I1 b
I1 sin2 + I1 a cos I1 b
y despejando
b a cos
= (14.74)
sin2
398 CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO
esta ecuacion sera integrable si conocieramos a en funcion del tiempo. Sustitumos (14.74) de nuevo en
(14.73) de lo cual resulta una ecuacion analoga para
b a cos
I3 = I1 a I3 cos
sin2
I1 a b a cos
= cos (14.75)
I3 sin2
que de nuevo es integrable siempre que conozcamos a en funcion del tiempo. Finalmente, se observa que las
Ecs. (14.74, 14.75) se pueden usar para eliminar y en la ecuacion (14.72) de la energa25 , con lo cual se
obtendra una ecuacion diferencial ordinaria para . Antes de hacer esto, notemos que la Ec. (14.70) nos dice
que 3 es una constante en el tiempo y por tanto tambien lo sera la expresion I3 32 /2. En consecuencia la
expresion
I3 32
E = E
2
es tambien una constante de movimiento, esto permite eliminar esta constante de la Ec. (14.72) ya que un
corrimiento constante en la energa no tiene ninguna consecuencia fsica. Reemplazando (14.74) en (14.72) y
redefiniendo E se tiene
" #
1 b a cos 2 2 2
E = I1 sin + + M gl cos
2 sin2
1 2 1 (b a cos )2
E = I1 + I1 + M gl cos (14.76)
2 2 sin2
la Ec. (14.76) tiene la forma de un problema unidimensional equivalente si definimos un potencial efectivo de
la forma
1 (b a cos )2
Vef () = M gl cos + I1
2 sin2
que sera muy util para describir el movimiento en , al igual que en el caso de fuerzas centrales en el cual la
construccion de un potencial efectivo nos sirvio para analizar el movimiento radial26 . Es conveniente hacer el
cambio de variable
u = cos ; du = sin d
ya que en tal caso la ecuacion (14.76) queda de la forma
1 1 (b au)2
E = I1 2 + I1 + M glu
2 2 1 u2
y como
du d u2
= sin u2 = 2 sin2 = 2 1 u2 = 2
dt dt (1 u2 )
la expresion para E queda
1 u2 1 (b au)2
E = I1 + I1 + M glu
2 (1 u2 ) 2 (1 u2 )
1 1
E 1 u2 = I1 u2 + I1 (b au)2 + M gl u 1 u2
2 2
despejando u2
2E 2M gl
u2 = 1 u2 (b au)2 u 1 u2 (14.77)
I1 I1
25
Estrictamente ya ha sido eliminada en (14.72) a traves del factor 3 .
26
As como en el escenario de fuerzas centrales, los terminos adicionales en el potencial efectivo corresponden a las componentes
de la energa cinetica asociadas a las coordenadas cclicas que en este caso son dos. Sin embargo, en la definicion de E hemos
sustrado las componentes que dependen de , las cuales estan contenidas en 3 .
14.6. LA PEONZA SIMETRICA PESADA CON UN PUNTO FIJO 399
2E 2E I3 32 2M gl p I3 3 p
= = ; = ; a= = ; b= (14.78)
I1 I1 I1 I1 I1 I1
donde a y b provienen de las Ecs. (14.70, 14.71). Estas constantes estan asociadas a los momentos conservados,
la energa total y la energa potencial. Por ejemplo, es proporcional a la energa del sistema excluyendo la
energa cinetica angular asociada a X3 (es decir excluyendo el spinning asociado a 3 ). Usando (14.78) en
(14.77) se obtiene
u2 = 1 u2 (b au)2 u 1 u2
u2 = 1 u2 ( u) (b au)2 (14.79)
integrando esta ecuacion obtenemos en principio = (t) que al ser sustitudo en (14.74) y (14.75) nos reduce
a cuadraturas la dinamica de y . En cuanto a la solucion de (14.80), el polinomio del radical es cubico de
manera que las soluciones son integrales elpticas. De nuevo la forma analtica de las soluciones puede ser muy
compleja y poco ilustrativa. Por lo tanto es mas provechoso para los propositos actuales realizar consideraciones
generales, con las cuales se pueden extraer aspectos de la naturaleza general del movimiento sin integrar las
ecuaciones de movimiento.
Antes de analizar las soluciones posibles de (14.80), es importante analizar las constantes definidas en
(14.78). La Fig. 14.5 muestra un caso en el cual el punto fijo no yace en el centro de masa. Si la peonza
esta rotando sobre una superficie horizontal, entonces tanto como son mayores que cero. Si en cambio la
peonza posee un soporte que le permite estar por debajo de la horizontal (de modo que 0 , entonces
sigue siendo mayor que cero pero puede ser positivo o negativo27 . En otras aplicaciones como algunos
giroscopos, el punto fijo puede estar en el centro de masa, en tal caso se tiene que = l = 0 y 0.
Enfocaremos nuestra atencion al caso en el cual la energa cinetica rotacional alrededor de X3 es mucho mayor
que la energa cinetica asociada a los otros dos ejes.
esta ecuacion nos muestra por un lado que la funcion f (u) es un polinomio de grado 3 en u, y por otro lado
que debe ser no negativa ya que f (u) = u2 . Es decir valores de u (y por tanto de ) que conduzcan a valores
negativos de f (u) estaran fsicamente descartados. Esto a su vez nos llevara a que las races de este polinomio
de tercer grado nos dan los valores de en los cuales cambia de signo, es decir los angulos de retorno en
. El conocimiento de estos angulos nos puede dar informacion cualitativa del movimiento del sistema28 .
Para el giroscopo f (u) es cuadratica puesto que = 0, pero para la peonza contribuye en general todo el
polinomio cubico. Dado que en muchas aplicaciones los giroscopos usan montajes libres de torque, la precesion y
la nutacion estaran suprimidos de modo que el movimiento del giroscopo es trivial. Para entender el movimiento
general de un cuerpo rotante, consideraremos solo el caso en el cual > 0.
27
Esto se puede ver teniendo en cuenta que E en la Ec. (14.76), puede ser menor que cero para algunos valores de en donde
cos < 0. Es decir para algunos valores en los cuales /2 < , con lo cual el centro de masa esta por debajo de la horizontal
y por tanto la energa potencial es negativa.
28
Puesto que 0 , y u cos ; tenemos que u es una funcion monotonamente decreciente de en el intervalo fsico de este.
400 CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO
Las ecuaciones cubicas con coeficientes reales poseen tres races que pueden venir en cuatro tipos de
combinaciones29
Estas posibilidades dependen de los signos relativos y magnitudes de las cuatro constantes definidas en
(14.78). Para nuestro problema especfico, hay tambien una restriccion fsica y es que 1 u 1 para que
sea real. Consideraremos solo el caso en el cual cos u > 0 que corresponde a que el centro de masa
permanezca por encima de la horizontal. Recordemos sin embargo que muchos giroscopos poseen un soporte
puntual que permite que el centro de masa se situe por debajo del plano horizontal.
Es claro que f (1) = (b a)2 . En consecuencia, f (u) es negativa en ambos extremos del intervalo
[1, 1], excepto en el caso inusual en el que al menos uno de los valores u = 1 sea una raz. Esto ultimo
corresponde a tener una peonza vertical, caso que analizaremos mas adelante. Por tanto, en el presente analisis
asumiremos que el polinomio no tiene races en u = 1 y por tanto que f (1) < 0.
Para u grande, el termino dominante en f (u) es u3 . Dado que es una constante siempre positiva segun
se ve en la Ec. (14.78), f (u) sera positiva para valores grandes positivos de u y negativa para valores grandes
negativos de u. Ahora bien, ya que f () > 0 y f (1) < 0, el polinomio debe cortar al eje u en algun punto
del intervalo (1, +). En conclusion, f (u) tiene una raz real en el intervalo (1, ). Ahora bien puesto que
un valor de u en este intervalo esta fsicamente excludo, vemos que a lo mas existen dos races reales de u que
correspondan a una situacion fsicamente posible. Dicho algebraicamente, hay a lo mas dos races reales en el
intervalo 1 < u < 1.
Por otro lado, la ausencia de races de f (u) en el intervalo 1 < u < 1, indicara que no hay ningun valor
posible para lo cual sera fsicamente inconsistente. Esto indica que tiene que haber al menos una raz real
en tal intervalo. Vemos entonces que f (u) tiene al menos dos races reales distintas: una en (1, 1) y la otra
en (1, +). Esto descarta los casos 1 y 4.
Conclumos entonces que solo es posible que haya una o dos races en el intervalo (1, 1). Ademas, f (u)
es negativa en los extremos del intervalo (1, 1). Analicemos las posibles situaciones
Si existe un u0 (1, 1) tal que f (u0 ) > 0, deben existir dos races reales diferentes en (1, 1). Una a
la izquierda y otra a la derecha de u0 .
El caso f (u) < 0 para todo u (1, 1), es fsicamente inconsistente, puesto que no habra races en el
intervalo.
Si f (u) < 0 para todo u (1, 1), excepto para un punto u = u1 en el cual f (u1 ) = 0, es claro que f (u1 )
es un maximo local y u1 sera una raz. Puede verse facilmente que esta raz debe tener degeneracion
simple. Para verlo basta con escribir el polinomio y su derivada en terminos de las tres races
evaluando la derivada en u = u1 y usando la condicion de extremo (maximo local) en este punto, se tiene
lo cual solo es posible si u1 = u2 y/o u1 = u3 . La degeneracion no puede ser triple, ya que una de las
races esta en el intervalo (1, +).
29
Puede verse que para cualquier polinomio de grado n con coeficientes reales, el numero de soluciones complejas (no reales)
debe ser siempre par, pues es inmediato ver que si ua es una raz, entonces ua tambien sera una raz.
14.6. LA PEONZA SIMETRICA PESADA CON UN PUNTO FIJO 401
El anterior analisis descarta la posibilidad de que existan dos races u1 6= u2 en (1, 1), en donde una o
ambas correspondan a maximos locales de f (u), ya que al contar la degeneracion de estas, tendramos
mas races que el grado del polinomio. Esto contradice al teorema fundamental del algebra.
Lo anterior nos deja entonces con solo dos escenarios posibles para nuestro polinomio cubico: En el es-
cenario (a), todas las tres races son reales y diferentes, estando dos de ellas en el intervalo (1, 1). En el
escenario (b), hay una raz con degeneracion simple en el intervalo (1, 1); que corresponde a un maximo
local, y la otra esta fuera de este intervalo.
En el escenario (a) con dos races distintas u1 < u2 en el intervalo (1, 1), y teniendo en cuenta que
f (1) < 0, puede verse que30
En el escenario (b), solo hay una raz u1 en el intervalo (1, 1), que coincide con un maximo local (dege-
neracion). Como f (1) < 0 se concluye que f (u) < 0 en todo [1, 1] excepto en la raz u1 donde f (u1 ) = 0.
Analicemos fsicamente las dos soluciones algebraicas posibles. Cuando hay dos races distintas u1 , u2 en
(1, 1), hemos visto que f (u) 0 en [u1 , u2 ], lo cual significa que todo el intervalo es una region accesible
fsicamente. Cuando hay una sola raz en (1, 1) hay un solo valor posible fsicamente para u ya que en el
resto del intervalo f (u) < 0.
En resumen, el movimiento fsico corresponde a casos en que f (u) = u2 es un valor no negativo estando u
en el intervalo 1 u 1, lo cual corresponde a que este entre 0 y . Se llega a que para cualquier peonza
fsica no vertical, f (u) debe tener dos races u1 y u2 (posiblemente degeneradas) en el intervalo (1, 1) y la
peonza se mueve de manera que el cos permanezca entre estas races. Si no hay degeneracion (ver Fig. 14.7a,
Pag. 407) la peonza cabecea o nuta dentro del intervalo de permitido. Si hay degeneracion (ver Fig. 14.7b,
Pag. 407) solo hay un valor de permitido y no se produce nutacion. Es importante por tanto, localizar estas
dos races para extraer informacion cualitativa del comportamiento de y para los valores de permitidos.
Es usual describir el movimiento de la peonza trazando la curva que se produce con la interseccion entre el
eje de figura y una esfera de radio unidad centrada en el punto fijo. Esta curva es conocida como el locus del
eje de figura. La coordenada de un punto sobre el locus se especifica con los angulos de Euler y definidos
por los ejes del cuerpo31 . Las races u1 u2 definen el intervalo permitido para
El locus yace entonces entre dos crculos de colatitud 1 y 2 trazados sobre la esfera unidad (ver Figs. 14.6).
El valor de es nulo en ambos crculos y por tanto son puntos de retorno en .
Es natural ahora preguntarse si hay puntos de retorno posibles para , esto corresponde a hacer = 0, y
de la Ec. (14.74) vemos que esto equivale a la condicion
b au = 0
La forma del locus esta determinada en gran medida por el valor de la raz de esta ecuacion, la cual
denotamos por u
b
u (14.83)
a
30
Se deja al lector la demostracion de que f (u) < 0 en el intervalo [1, u1 ). Probemos que f (u) > 0 para todo u (u1 , u2 ).
Si f (u) > 0 para algun punto en (u1 , u2 ) entonces para que f (u) 0 en otros puntos de este intervalo tendra que haber mas
races del polinomio, lo cual no es posible. Por otro lado, si f (u) < 0 en todo el intervalo (u1 , u2 ), entonces f (u) posee un maximo
local en u1 , ya que f (u) tambien es negativa en una vecindad a la izquierda de u1 . Pero un maximo local implica que la raz
es degenerada, lo cual nos lleva a que el polinomio tendra cuatro races. De nuevo, esto no es posible. La demostracion de que
f (u) < 0 en el intervalo (u2 , 1] se sigue facilmente.
31
Es decir, el locus describe la precesion y nutacion pero no dice nada sobre el spinning. No obstante, en ausencia de friccion
esto no implica ninguna perdida de informacion ya que el spinning esta descrito por 3 que es constante de movimiento.
402 CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO
Figura 14.6: Ilustracion de la precesion y nutacion de una peonza simetrica pesada con un punto fijo. La
nutacion se realiza entre dos crculos.
supongamos por ejemplo que las condiciones iniciales son tales que u es mayor que u2 . En tal caso la Ec.
(14.74) nos dice que siempre tendra el mismo signo para todos los valores permitidos de entre 2 y 1 (si
u1 < u2 2 < 1 ), puesto que los puntos de retorno de ocurren en regiones no accesibles para . Por lo
tanto, el locus del eje de figura debe ser tangente a los crculos lmite de tal forma que esta en la misma
direccion tanto en 2 como en 1 . En otras palabras, la precesion del eje de figura alrededor del eje X3 nunca
revierte su sentido. Sin embargo, a diferencia de la precesion libre, en este caso el eje de figura tambien produce
un cabeceo o nutacion (variacion de ) hacia arriba y hacia abajo dentro del intervalo definido por 2 y 1 . Hay
entonces una nutacion durante la precesion de la forma ilustrada en la Fig. 14.6a. Por otro lado, vale la pena
aclarar que la precesion de la que hablamos aqu es del eje de simetra del cuerpo y no de la velocidad angular
o del momento angular con respecto a ejes del cuerpo que es la precesion que se discute en el caso libre.
Si ahora asumimos que u esta entre u1 y u2 , tenemos que existe un punto de retorno para dentro del
intervalo permitido para i.e. = 0, para algun valor de entre 2 y 1 . En otras palabras, la direccion de la
precesion sera diferente en los dos crculos lmite, de manera que el locus del eje de figura exhibe lazos cerrados
como muestra la figura 14.6b. No obstante, el promedio de no es nulo y hay un sentido neto de avance de la
precesion.
Otro caso interesante ocurre cuando u coincide con una de las races de f (u). Por ejemplo, si u = u2 , tanto
como deben anularse en el crculo superior lo cual requiere que el locus tenga cuspides tocando este crculo,
como muestra la figura 14.6c. Este caso no es tan excepcional como podra pensarse a priori, pues se cumple
cuando asumimos que la peonza simetrica esta rotando inicialmente alrededor del eje de figura solamente. En
otras palabras, asumamos que en t = 0 solo hay rotacion alrededor del eje de figura y en ese instante se suelta
dicho eje. El movimiento subsecuente viene descrito por las condiciones iniciales 0 , 0 (orientacion inicial del
eje de figura) y (0) = (0) = 0 32 . La cantidad u0 = cos 0 tiene que ser entonces una de las races de f (u),
ya que (0) = 0 significa que el punto inicial es de retorno en . De hecho, corresponde a la raz del crculo
lmite superior (correspondiente a 2 )
b
cos 0 = u0 = u2 = u = (14.84)
a
para probarlo, notemos que con estas condiciones iniciales E en t = 0, coincide con M gl cos 0 y que los
terminos en E provenientes de la energa cinetica no pueden ser negativos. Por tanto, tan pronto como
32
Por supuesto las condiciones iniciales (0) = 0 y (0) = 3 tambien son necesarias. La primera se puede tomar 0 = 0 sin
perdida de generalidad y la segunda es constante de movimiento.
14.6. LA PEONZA SIMETRICA PESADA CON UN PUNTO FIJO 403
y comienzan a ser no nulos, la energa solo se puede conservar si hay un decrecimiento del termino
potencial M gl cos i.e. aumentando 33 . El valor inicial de corresponde por tanto a 2 , el mnimo valor
posible para que corresponde al crculo superior. Es decir, tan pronto como el eje de figura se suelta la
peonza comienza a caer hasta que llega al valor maximo de que es 1 para retornar de nuevo hacia 2 y
as sucesivamente. Adicionalmente, el eje tambien esta precesando mientras se cumple el ciclo de nutacion ver
Fig. 14.6c. Finalmente, dado que en este caso u = u2 , el locus presenta cuspides en el crculo superior.
Desde el punto de vista de la energa (omitiendo la energa constante de spinning) podemos decir que
cuando = 2 las energas cineticas de nutacion y precesion son nulas y la potencial toma el valor maximo,
cuando la peonza cae hasta el punto mas bajo, la energa potencial alcanza su valor mnimo y la energa
cinetica de nutacion vuelve a ser nula ya que = 0, en tanto que la energa cinetica de precesion alcanza su
valor maximo.
1
E = I3 32 + M gl cos 0 E = M gl cos 0
2
que se puede reescribir como
2E 2M gl
= cos 0
I1 I1
y teniendo en cuenta (14.78, 14.84) tales condiciones equivalen a la igualdad
= u0
quedando finalmente
f (u) = (u0 u) 1 u2 a2 (u0 u) (14.87)
esta parametrizacion permite encontrar las otras races diferentes de u0 por medio de la expresion cuadratica
en los brackets. La raz buscada u1 debe en consecuencia satisfacer tal ecuacion cuadratica que la podemos
expresar en la forma
a2
1 u21 (u0 u1 ) = 0 (14.88)
de acuerdo con la discusion de la seccion 14.6.3, una de las races de f (u) es real con u > 1, es decir no es
fsicamente accesible. En este caso debe corresponder a una de las races de la ecuacion cuadratica (14.88), y
por tanto tal ecuacion solo nos dara una solucion fsica. Definiendo la cantidad
x1 u0 u1 (14.89)
de acuerdo con la seccion 14.6.3, vemos que si u1 es una solucion fsica, entonces x1 > 0. Solo las soluciones
positivas de x1 son fsicamente accesibles. Podemos reescribir (14.88) como
h i a2 a2
1 (u0 x1 )2 x1 = 0 1 u20 + 2u0 x1 x21 x1 = 0
2
a
x21 + 2u0 x1 + u20 1 = 0
a2
x21 + px1 q = 0 ; p 2 cos 0 ; q = sin2 0 (14.90)
claramente bajo la condicion (14.85) este cociente es mucho mayor que la unidad excepto en el caso en el cual
I3 << I1 (que correspondera a una peonza tipo cigarro). De esto se deduce entonces que p >> q. Calculemos
las races de (14.90), usando la aproximacion 1 + 2x 1 + x para |x| << 1
p r
p p2 + 4q p 4q p 2q
x1 = = 1 1 + 2 = 1 1 + 2
2 2 p 2 p
q q
xa1
= ; xb1
= p+
p p
y dado que q y p son ambos positivos en esta aproximacion, solo hay una raz positiva y por tanto solo una
solucion fsica como se anticipo. Por lo tanto, la unica raz fsicamente realizable de (14.90), esta dada a primer
orden en q/p por
q
x1
p
14.6. LA PEONZA SIMETRICA PESADA CON UN PUNTO FIJO 405
usando la segunda de las Ecs. (14.90) y despreciando 2 cos 0 comparado con a2 / este resultado se escribe
como
sin2 0 I1 2M gl
x1 = sin2 0 (14.92)
a 2 I3 I3 32
donde hemos usado (14.78). En consecuencia, la extension de la nutacion medida por x1 = u0 u1 disminuye
en la misma forma que 1/32 , de modo que a mayor spinning de la peonza menor es la extension de la nutacion.
Tambien vemos que la extension de la nutacion disminuye cuando disminuye 0 (al menos en el regimen en el
cual estamos interesados i.e. 0 < 0 /2), es decir a medida que nos acercamos a la vertical en la condicion
inicial. Debemos recordar sin embargo que la condicion 0 = 0 de peonza vertical ha sido excluda del analisis
hasta el momento.
La frecuencia de la nutacion para la peonza rapida se puede encontrar de manera aproximada teniendo en
cuenta que en (14.87) podemos hacer la aproximacion
1 u2 = 1 u2 = sin2 0
0 (14.93)
en virtud de lo pequeno de la extension de la nutacion. Teniendo en cuenta esta aproximacion y definiendo
x u0 u (14.94)
tenemos que la Ec. (14.87) queda
2 2 sin2 0
2
f (u) = x sin 0 a x = a x x
a2
de las Ecs. (14.79, 14.81) vemos que f (u) = u2 = x2 . Adicionalmente, usando la Ec. (14.92), se tiene que
f (u) = x2 a2 x (x1 x) ; x u0 u
si corremos el origen de x hasta el punto medio de su intervalo permitido por medio del cambio de variable
x1
y =x y = x
2
la ecuacion diferencial queda en la forma
x1 h x1 i x1 h x1 i
y 2 = a2 y + x1 y + y 2 = a2 y + y
2 2 2 2 2
x1
y 2 = a2 y2
4
al derivar a ambos lados se obtiene
2y y = 2a2 y y
que se simplifica a la ecuacion familiar de un oscilador armonico
x1
y = a2 y y = A cos (at + ) x = A cos (at + )
2
x1
x = + A cos (at + )
2
puesto que u (0) = u0 se tiene que x (0) = 0, y la condicion inicial (0) = 0 implica x (0) = u (0) = 0. Con
estas condiciones iniciales la amplitud A y la fase vienen dadas por
x1
A= ; =0
2
la solucion completa es
x1
x= (1 cos at) (14.95)
2
donde x1 viene dada por (14.92). La frecuencia angular de la nutacion del eje de figura entre 0 y 1 es entonces
I3
a=
3 (14.96)
I1
donde se ha tenido en cuenta (14.78). Vemos que esta frecuencia angular de nutacion se incrementa cuando
aumenta el spinning inicial de la peonza.
406 CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO
donde hemos tenido en cuenta las definiciones (14.84) y (14.94). Sustituyendo (14.95) en (14.97) se obtiene
a x1
= (1 cos at) (14.98)
sin2 0 2
La Ec. (14.98), nos muestra que la velocidad de precesion es directamente proporcional a la extension de la
nutacion x1 . Usando (14.92)
a I 1 2M gl
= sin2 0 (1 cos at)
2 sin2 0 I3 I3 32
2
a I1 2M gl
= 2 2 (1 cos at)
2 I3 3 I1
a 1
= (1 cos at)
2 a2
= (1 cos at) (14.99)
2a
con lo cual se ve que la rata de precesion no es constante sino que vara armonicamente con el tiempo con la
misma frecuencia que la nutacion. No obstante, debe tenerse en cuenta que para este caso no hay inversion del
sentido de precesion ya que nunca invierte su signo segun se ve en (14.99), esto se debe a que = 0 ocurre
al mismo tiempo que = 0 en un extremo del intervalo permitido. La frecuencia promedio de precesion es
sin embargo
Z 2/a Z 2/a
1 a
= (1 cos at) dt = dt
2/a 0 2a 2 2a 0
M gl
= = (14.100)
2a I3 3
que indica que la rata de precesion promedio disminuye a medida que aumenta la velocidad rotacional inicial
de la peonza.
Notese sin embargo que aunque en la practica la nutacion suele ser inobservable para peonzas rapidas,
ignorar completamente la nutacion nos lleva a la conclusion inconsistente de que una vez que se suelta el eje de
figura, la peonza comienza inmediatamente a precesar uniformemente. Es decir, que a partir de la condicion
inicial (t = 0) = 0, se alcanza una velocidad finita en un tiempo infinitesimal, implicando una aceleracion
angular infinita. Nuestro tratamiento de precesion pseudoregular resuelve la inconsistencia, mostrando que
la precesion crece contnuamente a partir del reposo sin ninguna aceleracion infinita y la tendencia inicial de
la peonza es moverse en la direccion de la fuerza de gravedad.
Figura 14.7: Comportamiento de las races del polinomio f (u) dado en la Ec. (14.81). (a) Hay dos races en
el intervalo (1, 1) y el sistema exhibe nutacion. (b) Hay solo una raz fsica u0 en el intervalo (1, 1) y por
tanto un solo valor permitido de , en este caso no hay nutacion (precesion regular). (c) Corresponde a un
maximo local con una unica raz fsica en u = 1 que corresponde a peonza vertical sin nutacion. Finalmente,
en (c) hay dos races fsicas donde una de ellas corresponde a u = 1, esto describe una peonza inicialmente
vertical con nutacion.
En vista de lo anterior, resulta de interes saber que condiciones iniciales conducen a una precesion verdade-
ramente regular. En tal caso permanece constante con su valor inicial 0 , lo cual significa que 1 = 2 = 0 .
Esto implica que f (u) debe tener una degeneracion simple en las races que yacen en el intervalo [1, 1] i.e.
u1 = u2 = u0 (ver Fig. 14.7b). Recordando que en este caso f (u) era no positivo en todo el intervalo [1, 1],
la unica manera de obtener una sola raz (o mas bien dos races degeneradas) en el interior de tal intervalo es
considerar el caso en el cual f (u) posee un maximo local en la raz, como se aprecia en la Fig. 14.7b, es decir
2 df
f (u0 ) = u0 = 0 ; =0 (14.101)
du u=u0
de la Ec. (14.74), es claro que la condicion (t) = 0 (ausencia de nutacion) nos conduce a = cte = 0 . Es
decir, que la ausencia de nutacion implica automaticamente el lmite de precesion regular. Utilizando la Ec.
(14.81) en la forma dada por la Ec. (14.79), la primera de las condiciones en (14.101) con u20 = 0 conduce a
(b au0 )2
( u0 ) = (14.102)
1 u20
408 CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO
a (b au0 ) ( u0 )
= 2 u0 (14.103)
2 1 u0 1 u20
sustituyendo (14.102) en (14.103) y teniendo en cuenta (14.74), se llega a una ecuacion cuadratica para
a (b au0 ) 1 (b au0 )2
= u0
2 1 u20 1 u20 1 u20
(b a cos 0 ) b a cos 0 2
= a cos 0
2 sin2 0 sin2 0
= a 2 cos 0 (14.104)
2
y teniendo en cuenta las definiciones de (14.78) para y a podemos escribir estos terminos en dos formas
alternativas, dependiendo de si a se expresa en terminos de 3 o de los valores constantes de y (ver Ecs.
14.78 y 14.70)
I3 I
3 2M gl
a= + cos = 3 ; = (14.105)
I1 I1 I1
reemplazando (14.105) en (14.104) usando las dos formas de a
M gl I3
= 3 2 cos 0
I1 I1
M gl I3
= + cos 0 2 cos 0
I1 I1
donde hemos tenido en cuenta que = 0 para todo tiempo. Estas ecuaciones se pueden escribir como
M gl = I3 3 I1 cos 0
h i
M gl = I3 (I1 I3 ) cos 0 (14.106)
las condiciones
inicialespara el problema de la peonza pesada simetrica con punto fijo, requieren la especi-
ficacion de , , , , y u 3 en el tiempo t = 0. Dado que las variables y son cclicas sus valores
iniciales no son muy relevantes, y en general podemos elegir cualquier valor que deseemos para cada una de
las otras cuatro constantes. Pero si hacemos la exigencia adicional de que el eje de figura precese uniforme-
mente sin nutacion, nuestra escogencia de estas cuatro condiciones iniciales ya no es completamente libre, ya
que debe satisfacer cualquiera de las Ecs. (14.106), que en general nos dan una relacion entre las cantidades
0 , 0 y 3 o entre las cantidades 0 , 0 y 0 . Para = 0 podemos aun elegir valores iniciales de y 3 casi
arbitrariamente, pero el valor de queda entonces determinado a traves de las Ecs. (14.74, 14.78). La frase
casi arbitrariamente, se refiere a que al ser las Ecs. (14.106) cuadraticas, y teniendo en cuenta que debe ser
real, entonces el discriminante de (14.106) debe ser no negativo. Aplicando esta condicion a la primera de las
Ecs. (14.106), se obtiene
I32 32 4M glI1 cos 0 (14.107)
para /2 0 < es decir cuando el centro de masa esta al nivel o por debajo del punto fijo (excluyendo por
ahora peonza vertical con = ), el miembro derecho de esta expresion es no positivo, de modo que cualquier
14.6. LA PEONZA SIMETRICA PESADA CON UN PUNTO FIJO 409
valor de 3 puede conducir a precesion uniforme. Pero para 0 < 0 < /2, el valor escogido para 3 tiene que
ser mayor a un valor mnimo 3 que se obtiene igualando los miembros en (14.107)
2p
3 3 = M gl I1 cos 0 (14.108)
I3
para lograr la precesion uniforme. Condiciones similares se pueden obtener a partir de la segunda de las Ecs.
(14.106) para los valores permitidos de .
Notese que las Ecs. (14.106) no se pueden satisfacer con (0) = 0 para valores finitos de o de 3 . Es decir
que para obtener precesion uniforme, debemos darle siempre a la peonza un impulso que origine la precesion,
i.e. tal que 0 6= 0. Sin esta velocidad precesional adecuadamente generada, podemos en el mejor de los casos
obtener solo una precesion pseudoregular. Esto es logico ya que sin un torque adicional, no es posible generar
la precesion sin una cada previa del centro de masa (que generara la nutacion), como ya vimos anteriormente.
3 3 2 3 3
1 = =
2I cos 0 2I1 cos 0
1
I3 3 1 1 x I1 cos 0 2M gl
1 = ; x y , y 1 2
(14.111)
2I1 cos 0 I3 2 I3 3
410 CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO
en este punto recordamos que en el lmite de peonza rapida, la velocidad angular de precesion era proporcional
a la extension de la nutacion, la cual a su vez era proporcional a 32 , de modo que la velocidad angular de
precesion disminuye con el aumento de la velocidad angular de spinning. Este resultado no es valido aqu,
ya que en este caso no tenemos nutacion. Sin embargo, es de esperarse que el resultado no sea demasiado
diferente al caso en el que 3 sea muy grande de modo que la extension de la nutacion es muy pequena y la
precesion muy lenta. Tomaremos en consecuencia el lmite de peonza rapida Ec. (14.85), que al compararse
con (14.111) nos lleva a que y << 1, y si I1 cos 0 no es mucho mayor que I3 nos conduce a que x << 1.
Usando la aproximacion 1 x 1 12 x para |x| << 1 en la Ec. (14.111), se obtiene
!
I3 3 1 1 12 x I3 3 I3 3 2M gl I1 cos 0
1 = x=
2I1 cos 0 4I1 cos 0 4I1 cos 0 12 I3 32 I3
M gl
1
I3 3
que coincide con el lmite de precesion lenta (14.110) obtenido con la aproximacion a >> cos 0 . Por tanto, el
lmite de peonza rapida (14.85) implica el lmite de precesion lenta, siempre que I1 cos 0 no sea mucho mayor
que I3 . Esto explica de una manera mas natural proque este lmite coincide con la precesion pseudoregular
(14.100), ya que esta fue obtenida en el lmite de peonza rapida. No obstante, la obtencion del lmite de
precesion lenta solo dependio de que |x| << 1, esto tambien se puede lograr si
I1 cos 0
<< 1
I3
siempre que y no sea mucho mayor que uno. Por ejemplo, tomemos I1 << I3 y/o 0 /2, con y 1. En este
caso obtenemos lmite de precesion lenta, aunque claramente no tenemos lmite de peonza rapida. De hecho,
al tomar |x| << 1 en (14.111) se obtiene
!
I1 cos 0 I1 cos 0 2M gl
x y= 1 2
<< 1
I3 I3 2 I3 3
2 M gl I1 cos 0
3 >>
I3
que al comparar con la Ec. (14.108), nos muestra de nuevo que el lmite de precesion lenta, equivale a requerir
valores de 3 mucho mayores a su cota inferior permitida. Esta es entonces la condicion mas general de precesion
lenta.
Debemos observar sin embargo, que las soluciones (14.109) conducen a una solucion de precesion lenta 1
y otra de precesion rapida 2 , independientemente de que se cumplan los lmites anteriores. Lo que hemos
analizado entonces son valores extremos de 1 y de 2 .
lo cual nos indica que u = 1 es una raz doble siempre que sea raz de f (u), donde la tercera raz viene dada
por
a2
u3 = 1 (14.112)
Si a2 / > 2, lo cual se cumple por ejemplo en el lmite de peonza rapida (siempre que I3 /I1 no sea mucho
menor que uno), se tiene que u3 > 1, de modo que solo la raz u = 1 corresponde a una situacion fsica. Esto
significa que la peonza continua con su eje de figura vertical, con energa cinetica de spinning unicamente. En
tal caso la raz degenerada u = 1 corresponde a un maximo local de f (u) con la tercera raz en algun punto
fuera del intervalo [1, 1], como se ve en la Fig. 14.7c.
Por otro lado, si a2 / < 2 se tiene que la tercera raz es menor que 1, tomaremos solo el caso en que
u3 esta en el intervalo (0, 1). En este escenario, la raz u = 1 corresponde a un mnimo local y f (u) se
comporta como muestra la Fig. 14.7d, la peonza nutara entre 0 y 3 que seran los puntos de retorno en .
Estas desigualdades muestran en consecuencia que existe un valor crtico a2 / = 2 que define la transicion
entre un movimiento perfectamente vertical y uno con nutacion y precesion34 . Aplicando (14.91), este valor
lmite nos da
a2 I3 I3 2
= =2
I1 2M gl
la unica variable que se puede modular en este termino (para una peonza dada) es la velocidad angular. Por
tanto, existe una velocidad angular crtica por encima de la cual solo el movimiento vertical es posible.
M glI1
2 = 4 (14.113)
I32
34
Vemos que cuando u = 1 es una raz, es posible que las tres races de f (u) sean todas fsicas, aunque solo hay a lo mas dos
races fsicas diferentes. Es tambien posible que las tres races sean degeneradas. Estas caractersticas difieren del analisis realizado
en la seccion 14.6.3, cuando descartabamos la posibilidad de que u = 1 fueran races de f (u).
412 CAPITULO 14. ECUACIONES DE MOVIMIENTO DEL CUERPO RIGIDO
expresion que es identica al valor expresado en la Ec. (14.108) de la frecuencia mnima para precesion constante,
y que ahora se aplica para 0 = 0.
En la practica, si la peonza gira inicialmente con eje vertical y 3 es superior al valor crtico, ella rotara un
tiempo solo sobre el eje vertical (trompo dormido) pero su spinning va disminuyendo por efecto de la friccion,
cuando 3 pasa el valor crtico, comienza a bambolearse en cantidades cada vez mayores a medida que disminuye
el spinning.
Figura 14.8: (a) Giroscopo al cual se le coloca un contrapeso W para compensar el torque debido al peso del
disco, de modo que el centro de masa de la configuracion coincida con el punto fijo. (b) Fenomeno de inercia
giroscopica: despues de 6 horas, un observador en la tierra ve un giro de /2 en el eje del giroscopo, debido a
que dicho eje permanece invariable con respecto a un sistema inercial.
Hay una amplia gama de aplicaciones concernientes al uso de peonzas rapidas. Una de ellas es el giroscopo
que consiste en una peonza simetrica que se monta sobre un soporte que permite la reorientacion del eje de
figura en cualquier direccion, el eje de figura gira muy rapidamente debido a la aplicacion de ciertos torques
externos. El centro de masa se hace coincidir con el punto fijo a traves de algun contrapeso colocado al otro
extremo de la peonza (ver Fig. 14.8a). Una vez se libera el eje de figura con una gran velocidad angular (con
= = 0), se observa que la direccion del eje de figura permanece constante (medida por un observador
inercial, por ejemplo las estrellas fijas) sin importar como reorientemos el montaje, fenomeno conocido como
inercia giroscopica, el cual se debe a la conservacion del momento angular en ausencia de torques netos externos.
En particular, si el montaje se deja por seis horas (asumiendo muy bajo amortiguamiento) se puede observar
una rotacion del eje de figura de /2 que en realidad se debe justamente a que el eje de figura permanece
constante en direccion con respecto a un sistema inercial, en tanto que la tierra ha tenido una rotacion de
/2, como se aprecia en la Fig. 14.8b. Esta caracterstica hace del giroscopo un excelente instrumento para
mantener direcciones especficas, por ejemplo para proveer plataformas estables.
14.6. LA PEONZA SIMETRICA PESADA CON UN PUNTO FIJO 413
Si se le aplican torques externos adecuados al giroscopo, puede generar precesion y nutacion. En la mayora
de ocasiones se puede utilizar el lmite de peonza rapida para estos dispositivos y como vimos antes, en
la practica la nutacion se atenua rapidamente por efectos de friccion y pronto se vuelve inobservable. En
realidad, en muchos giroscopos el montaje se realiza para atenuar deliberadamente el efecto de nutacion. En
tal caso, el estado estacionario del sistema solo presenta precesion, lo cual simplifica fuertemente el tratamiento
matematico. Podemos entonces generalizar el tratamiento hecho para la peonza simetrica de una manera simple.
Si R es el radio vector que va desde el punto fijo hasta el centro de masa a lo largo del eje de figura, el
torque gravitacional que se ejerce sobre la peonza viene dado por
N = R Mg (14.114)
donde g define al campo gravitacional uniforme en la vecindad de la superficie terrestre. Definamos L3 como
la componente del momento angular de la peonza a lo largo del eje de figura, el cual describe el momento
angular de espn del solido, y definamos p como el vector de precesion, el cual esta alineado con el eje vertical
y posee magnitud igual a la velocidad angular promedio de precesion dada aproximadamente por (14.100).
De las definiciones es claro que
p u3 ; L3 I3 3 u3
La direccion de la precesion pseudoregular esta dada por
u3 u3
u
ku3 u3 k
que es la direccion de la lnea de nodos (ver Fig. 14.5). Por tanto, p L3 esta dado por
p L3 = u3 I3 3 u3 = I3 3 u3 u3 = I3 3 sin u
14.7. Ejercicios
1. Sea un solido de revolucion como el de la Fig. 3.2, Pag. 51, con densidad constante. Demuestre que los
momentos de inercia con respecto a los ejes X e Y vienen dados por (ver problema 4 pag 52, y Ref. [8])
Z xf Z xf
4 IX
IX = f (x) dx ; IY = + x2 f (x)2 dx (14.116)
2 x0 2 x0
2. Demuestre que para un sistema ortogonal de ejes XY Z, se cumplen las siguientes propiedades
X
IX + IY + IZ = 2 mi ri2 (14.117)
i
IX IY + IZ ; IY IX + IZ ; IZ IX + IY (14.118)
donde ri es la posicion de la iesima partcula, con respecto al origen del sistema coordenado. Las Ecs.
(14.118) nos dicen que los momentos de inercia IX , IY , IZ cumplen una desigualdad triangular (Ver
Ref. [12], y Sec. 2.3 de la Ref. [13]).
3. Demuestre que para una distribucion lineal de masa el tensor I tiene un valor propio nulo no-degenerado
y un valor propio no-nulo con degeneracion 2. Una masa puntual tiene en cambio un valor propio nulo
totalmente degenerado. Es esto una manifestacion de la simetra del sistema?.
(i)
I = mi (Ri )2 ; (Ri )mn = mnk xk (14.120)
donde los ndices m, n, k denotan componentes y el ndice i rotula partculas. Ri es claramente una
matriz antisimetrica asociada al punto material iesimo del sistema (discreto) de partculas. Cual es el
analogo en el contnuo de las Ecs. (14.119, 14.120)?.
5. Demostrar que el movimiento general de un cuerpo rgido con un punto fijo cumple la siguiente condicion
entre la energa cinetica T , el torque externo neto N y el vector velocidad angular
dT
=N
dt
6. Dos esferas tienen el mismo diametro y la misma masa. Una de ellas es solida y la otra es hueca (una
capa esferica). Describa un experimento no destructivo para determinar cual es la esfera solida y cual es
la hueca.
7. Un cubo homogeneo de aristas de longitud l, tiene una de sus aristas en contacto con una superficie
horizontal, y esta inicialmente en una posicion de equilibrio inestable. Se le da entonces un pequeno
empujon para que comience a caer. Muestre que la velocidad angular del cubo cuando una de las caras
golpea la superficie viene dado por
Ag
2 = 21
l
donde A es una constante tal que A = 3/2 si la arista no desliza sobre la superficie y A = 12/5 cuando
hay deslizamiento sin friccion.
14.7. EJERCICIOS 415
8. Considere una lamina delgada homogenea que yace en el plano X1 X2 . Muestre que el tensor de inercia
toma la forma
A C 0
I = C B 0
0 0 A+B
y que si hacemos una rotacion en un angulo alrededor del eje X3 , el tensor de inercia resultante posee
la misma estructura con los reemplazos A A , B B , C C dados por
1
A = A cos2 C sin 2 +B sin2 ; B = A sin2 +C sin 2 +B cos2 ; C = C cos 2 (B A) sin 2
2
y que por tanto los ejes X1 y X2 seran ejes principales si la rotacion se hace en un angulo
1 1 2C
= tan
2 BA
9. Aplique el teorema anterior para calcular el tensor de inercia en los siguientes casos (a) una lamina
elptica cuyo centro coincide con el origen de coordenadas. (b) Una lamina elptica en donde uno de los
focos coincide con el origen de coordenadas. Utilice valores arbitrarios de la excentricidad y el semieje
mayor a.
10. Encuentre la matriz B que diagonaliza al tensor I mediante una transformacion de similaridad, utilizando
los siguientes metodos (a) Directamente de los resultados del problema 8. (b) Calculando los valores y
vectores propios de I y construyendo la matriz diagonalizante con los vectores propios (ver seccion 12.3).
Verifique que la matriz diagonalizada tiene los valores propios en la diagonal y de una interpretacion
fsica a tales valores propios.
Captulo 15
Oscilaciones
Un tipo de sistema clasico de muy amplia utilidad en diversas ramas de la Fsica es aquel que consiste de un
conjunto de elementos que oscilan alrededor de sus posiciones de equilibrio. Si la desviacion del equilibrio estable
de cada elemento del sistema es suficientemente pequena, entonces el movimiento de este se puede simular
como un conjunto de osciladores armonicos acoplados. Estudiaremos en este captulo el comportamiento de un
sistema discreto de osciladores. Las tecnicas matematicas a emplear seran muy similares a las que se usan para
estudiar la mecanica del cuerpo rgido, aunque los sistemas mecanicos considerados aqu, no necesariamente
deben involucrar cuerpos rgidos.
El hecho de que existan agregados de partculas que sean estables, indica la presencia de fuerzas restaura-
doras que en lmite de pequenas oscilaciones alrededor de sus posiciones de equilibrio, pueden aproximarse a
osciladores armonicos. De esta manera podemos estudiar sistemas tan diversos como partculas acopladas por
resortes, vibraciones de moleculas o de la red cristalina de un solido por efectos termicos, etc. Adicionalmen-
te, se puede utilizar el lmite apropiado para que una red discreta de osciladores se convierta en un sistema
contnuo (tales como cuerdas, superficies elasticas etc.), como veremos mas adelante cuando estudiemos la
mecanica de medios contnuos, o teora clasica de campos.
la energa potencial posee por lo tanto un extremo en la configuracion de equilibrio del sistema, que describimos
por q01 , . . . , q0n y que denotamos con el subndice 0 en la Ec. (15.1). Si el sistema esta inicialmente en
equilibrio con velocidades generalizadas nulas i.e. qi (0) = 0, el sistema continuara indefinidamente en el
equilibrio.
Intuitivamente tenemos la idea de lo que es el equilibrio estable e inestable. Por ejemplo, un lapiz que se
suspende verticalmente con su punta como punto de apoyo, abandona facilmente su configuracion de equilibrio
ante la mas mnima perturbacion. En cambio un pendulo simple vertical no tiende a alejarse de su posicion de
equilibrio cuando ejercemos una pequena perturbacion, mas bien el sistema oscila ligeramente alrededor del
equilibrio gracias a la presencia de fuerzas restauradoras que apuntan siempre hacia el punto de equilibrio.
Clasificamos como posicion de equilibrio estable a aquella en la cual una pequena perturbacion del sistema
resulta solo en un movimiento acotado en cierta region alrededor del equilibrio, con la condicion adicional de que
416
15.1. PEQUENAS OSCILACIONES Y EQUILIBRIO ESTABLE 417
esta region de oscilacion se puede hacer arbitrariamente pequena modulando adecuadamente la perturbacion1 .
El equilibrio se dice inestable si una perturbacion arbitrariamente pequena se traduce en movimiento acotado
en una region finita o en movimiento no acotado. Vemos pues que el pendulo vertical y el lapiz descritos arriba
estan en equilibrio estable e inestable respectivamente de acuerdo con esta definicion.
Figura 15.1: Curvas de energa potencial ilustrando el equilibrio estable e inestable en un sistema con un
grado de libertad. (a) Si la partcula esta en q01 en t = 0 y la energa es E1 + E, con E suficientemente
pequeno, el movimiento es acotado, y la region permitida disminuye arbitrariamente a medida que disminuye
E, hablamos entonces de equilibrio estable. Si la partcula esta en q03 para t = 0, y su energa es E3 + E, el
movimiento es acotado, pero el tamano mnimo del intervalo permitido es [q1 , q2 ] aun para E arbitrariamente
pequeno. El equilibrio es inestable. (b) Si la partcula esta en q0 , el movimiento sera no acotado para energas
E + E independientemente del tamano de E, este punto es de equilibrio inestable.
Podemos ver que si el extremo en el potencial es un mnimo local entonces el equilibrio tiene que ser estable.
Para demostrarlo tendremos en cuenta que en cierta vecindad alrededor del punto de equilibrio, el potencial
se incrementa en cualquier direccion. Supongamos que el sistema tiene inicialmente la energa total V (q0i ) i.e.
esta en reposo en la configuracion de equilibrio. Cuando hacemos un incremento de energa E (perturbacion)
el sistema adquiere energa cinetica cuyo valor en t = 0 es justamente E, como en cualquier direccion
la energa potencial aumenta, entonces la energa cinetica debe disminuir, podemos hacer un incremento de
energa (perturbacion) suficientemente pequeno para que
donde Vmax es el maximo valor que toma el potencial dentro de una region alrededor del equilibrio en la cual el
potencial aumenta en todas direcciones (denotamos a esta region por Rmax ). Si se cumple la condicion (15.2)
entonces existe un valor del potencial Vc dentro de la region en cuestion para la cual E = Vc V (q0i ).
El conjunto de puntos en donde V (q0i ) V Vc define una region que denotamos por Rc , y claramente
Rc Rmax . En los puntos de Rc en donde E = Vc V (q0i ) la energa cinetica es cero (punto de retorno) y
solo puede volver a aumentar si el sistema se mueve hacia donde disminuye el potencial. Esto impide al sistema
salir de la region Rc ya que en los puntos inmediatamente fuera de tal region el potencial es superior al de
cualquier punto en Rc . Finalmente para una funcion bien comportada, la region Rc disminuye arbitrariamente
a medida que disminumos a E.
1
El equilibrio inestable tambien puede producir movimiento acotado como se ve en la Fig. 15.1a. Sin embargo, vemos que el
intervalo permitido mnimo para el movimiento, no se puede hacer arbitrariamente pequeno, incluso si la perturbacion se hace
arbitrariamente pequena. En otros casos con el de la figura 15.1b, cualquier incremento en la energa conduce a movimiento no
acotado.
418 CAPITULO 15. OSCILACIONES
En un punto en el cual hay un maximo local del potencial, existe una vencindad alrededor del punto en
la cual la energa cinetica aumenta a medida que nos alejamos del equilibrio dado que el potencial disminuye
en cualquier direccion. Cuando hay un maximo local de una funcion bien comportada existe una region finita
en la cual el potencial decrece monotonamente y se puede ver que dentro de esta region no hay puntos de
retorno. En consecuencia si E > 0, el sistema se mueve mnimo en esta region finita accesible aun cuando
la perturbacion sea arbitrariamente pequena. Graficamente, estas caractersticas son faciles de visualizar para
sistemas unidimensionales como se puede apreciar en las figuras 15.1a,b.
Estaremos interesados en el movimiento del sistema dentro de una pequena region alrededor de un punto
de equilibrio estable. Dado que las desviaciones del equilibrio son pequenas, podemos hacer una expansion de
Taylor para las funciones involucradas alrededor del punto de equilibrio y retener solo los terminos de mas
bajo orden. Denotaremos las desviaciones de las coordenadas generalizadas con respecto al equilibrio por i
qi = q0i + i (15.3)
estas se tomaran como las nuevas coordenadas generalizadas del movimiento. Una expansion de Taylor del
potencial alrededor del punto de equilibrio nos da
2
V 1 V
V (q1 , . . . , qn ) = V (q01 , . . . , q0n ) + (qi q0i ) + (qi q0i ) (qj q0j ) + . . .
qi 0 2! qi qj 0
2
V 1 V
V (q1 , . . . , qn ) = V (q01 , . . . , q0n ) + i + i j + . . . (15.4)
qi 0 2 qi qj 0
se ha usado convencion de suma sobre ndices repetidos. Los terminos lineales en i se anulan debido a la
condicion de equilibrio (15.1). El primer termino es una constante que se puede remover redefiniendo el cero de
potencial. Por tanto, los primeros terminos no triviales son los terminos cuadraticos en i . Usaremos entonces
la aproximacion 2
1 V
V (q1 , . . . , qn ) Vij i j ; Vij (15.5)
2 qi qj 0
Los coeficientes Vij son constantes que dependen de los valores de las qi en el punto de equilibrio. De la
definicion es claro que los Vij son simetricos i.e. Vij = Vji (siempre que las segundas derivadas parciales sean
contnuas). Es posible que bajo diversas circunstancias, algunos de estos coeficientes se anulen. Por ejemplo,
si el potencial es independiente de una coordenada qk el equilibrio ocurrira para un valor arbitrario de esta
coordenada y hablaremos de equilibrio neutro o indiferente con respecto a dicha coordenada. Tambien puede
ocurrir que el potencial se comporte como cuadratico (sin algunos terminos cruzados) en tal punto, de modo
que uno o mas de los Vij seran nulos. Cualquiera de estos casos debe ser tratado por aparte con respecto a la
formulacion que desarrollaremos.
Una expansion en serie es tambien posible para la energa cinetica. Como las transformaciones a las qi no
dependen explcitamente del tiempo (y por lo tanto, tampoco las transformaciones a las i ) la energa cinetica
resulta ser una funcion homogenea de grado dos en las velocidades como se puede verificar a partir de (2.24)
1 1
T = mij qi qj = mij i j (15.6)
2 2
la Ec. (2.24) muestra que los coeficientes mij son funciones de las coordenadas y que mij = mji . Por tanto
tambien pueden ser expandidos alrededor de la configuracion de equilibrio.
mij
mij (q1 , . . . , qn ) = mij (q01 , . . . , q0n ) + k + . . . (15.7)
qk 0
pero dado que la ecuacion (15.6) ya es cuadratica en los i , el termino mas bajo que no se anula (primer
termino no trivial) en T , se obtiene del primer termino en la expansion (15.7). Definimos entonces
1
T Tij i j (15.9)
2
es claro de (15.8), que los coeficientes Tij tambien son simetricos, de modo que la expresion total no se afecta
con un intercambio de ndices. El Lagrangiano se obtiene entonces a partir de las Ecs. (15.5) y (15.9)
1
L= (Tij i j Vij i j ) (15.10)
2
tomando las s como coordenadas generalizadas, podemos construr las ecuaciones de Lagrange
donde hemos usado la simetra de los Tij y el hecho de que los ndices de suma son mudos, tenemos entonces
que
L d L
= Tki i = Tki i
k dt k
similarmente, usando la simetra de las Vij
L Vij i j Vij
= j + i = (ik j + jk i )
k 2 k k 2
Vkj Vik
= j i = Vki i
2 2
las ecuaciones de Lagrange quedan
Tki i + Vki i = 0 (15.11)
cada una de las Ecs. (15.11) involucra en general a todos los i y forman un conjunto acoplado de ecuaciones
diferenciales simultaneas que debemos resolver para describir el movimiento del sistema alrededor del equilibrio.
En la mayora de aplicaciones, la energa cinetica se puede escribir de modo que no posea productos
cruzados, con lo cual el Lagrangiano (15.10) se escribe como
1
L= Ti i2 Vij i j (15.12)
2
y las ecuaciones de movimiento (15.11) quedan
que es la parte real de (15.14) la que corresponde a la solucion fsica del problema. Sustituyendo (15.14) en
(15.11) se obtiene
El sistema (15.15), consiste en un conjunto de n ecuaciones homogeneas para las ai , y por tanto solo tendran
solucion no trivial si el determinante de los coeficientes se anula
V11 2 T11 V12 2 T12 V13 2 T13
2
V21 2 T21 V22 2 T22 V23 2 T23
det V T = V 2 T 2 2 =0 (15.16)
31 31 V32 T32 V33 T33
.. .. .. . .
. . . .
esta condicion secular, que consiste en encontrar las n races i2 del polinomio caracterstico, nos provee de
los valores de las frecuencias para los cuales (15.14) es solucion de (15.11). Para cada valor de 2 las Ecs.
(15.15) pueden ser resueltas para las amplitudes ai o mas exactamente para los cocientes de n 1 amplitudes
con la amplitud restante.
Matricialmente podemos reescribir las Ecs. (15.15) sustituyendo 2 en la forma
Va = Ta (15.17)
que coincide con la ecuacion de valores propios modificada que se estudio en la seccion 12.14 como se puede
ver de la Ec. (12.117)2 . Tenemos ademas que tanto T como V son matrices simetricas y reales. Por otro lado,
la energa cinetica dada por (15.9) se puede reescribir en forma matricial
1
T = e
T
2
pero la energa cinetica es positiva y solo es cero cuando todas las velocidades generalizadas son cero, esto
nos lleva a conclur que T es una matriz definida positiva ya que un termino de la forma zTz corresponde
a dos veces la energa cinetica cuando z se interpreta como arreglo vectorial de velocidades generalizadas .
Finalmente, la condicion de que el potencial se este evaluando en un mnimo local nos lleva a la condicion
i Vij j 0 eV 0
de modo que la matriz V es positiva. Como consecuencia se cumplen todas las hipotesis establecidas en la
seccion 12.14 es decir tenemos una ecuacion de valores propios modificada de la forma (15.17) donde T y V
son matrices reales y simetricas, siendo T definida positiva y V positiva. En dicha seccion se concluyo que
bajo estas hipotesis
1. Los valores propios en (15.17) son reales no negativos: en este contexto, significa que 2 es no negativo
y por lo tanto las frecuencias son reales. De la Ec. (12.123) se puede ver claramente que si V no fuera
positiva (i.e. no estuvieramos en un mnimo local del potencial) entonces es posible que sea negativo
y por lo tanto sera imaginario. Por otro lado, se puede ver que introducir un imaginario en el
ansatz (15.14) producira movimiento no acotado en i con el tiempo. Este movimiento sera obviamente
inestable con lo cual se ve desde otro punto de vista, que la estabilidad requiere un mnimo local de
potencial.
2. Las componentes de los autovectores a son reales, excepto por una posible fase global: En nuestro
contexto, vemos que una fase compleja global en la amplitud se puede absorber en el factor C de la Ec.
(15.14), de modo que la posibilidad de a complejo resulta aun mas irrelevante.
2
Similarmente, (15.16), corresponde a la ecuacion secular modificada (12.131).
15.2. SOLUCION DE LAS ECS. DE MOV. COMO PROBLEMA DE VALORES PROPIOS 421
3. Los autovectores a correspondientes a valores propios diferentes son ortogonales bajo la metrica definida
por T. En este caso, si interpretamos a z como un vector cuyas componentes son velocidades genera-
lizadas, podemos decir que la norma al cuadrado inducida para z viene dada por dos veces la energa
cinetica
zTz e
kzk2 e T = 2T
kzk = 2T
la ortogonalidad con la metrica T esta definida por la propiedad (12.125). Si queremos normalizar los
vectores propios debemos imponer una condicion de normalizacion de la forma (12.126), recordando que
ambas ecuaciones se sintetizan en la Ec. (12.127)
e
ATA =1 (15.18)
el denominador es dos veces la energa cinetica con velocidades generalizadas ai(k) , en tanto que el
numerador es dos veces la energa potencial asociada a coordenadas ai(k) . Insistimos nuevamente en que
la positividad del numerador esta asociada con el hecho de que la energa potencial esta evaluada en un
mnimo local.
para i = 1 queda
solo una del par de ecuaciones para cada i es linealmente independiente, tomemos las Ecs. (15.21) y (15.24) y
asumiendo suma sobre j pero no sobre i reescribimos estas ecuaciones en la forma
este problema se puede resolver en forma general. Sin embargo, nos restringiremos aqu a estudiar dos casos
lmites
Primer caso: Asumimos V11 > V22 > 0 y 0 6= |V21 | = |V12 | << (V11 V22 ). Con estas condiciones podemos
definir un parametro pequeno de la forma
V12
(V11 V22 )
escribiendo los autovalores (15.20) en terminos de
s !
1 2
4V12 1 p
2
1,2 = V11 + V22 (V11 V22 ) 1 + = V 11 + V22 (V11 V22 ) 1 + 4
2 (V11 V22 )2 2
1 1
1,2 = V11 + V22 (V11 V22 ) 1 + 22 = V11 + V22 (V11 V22 ) 22 (V11 V22 )
2 2
1 2 (V11 V22 ) 1 2 1
1,2 = V11 + V22 (V11 V22 ) 2 V12 = V11 + V22 (V11 V22 ) 2 V12
2 V12 2
1
1,2 = [V11 + V22 (V11 V22 ) 2V12 ]
2
los valores propios quedan finalmente
1
= V11 + V12 ; 2
= V22 V12 (15.27)
4
Recordemos que la normalizacion se hace de acuerdo con la metrica impuesta por T. Pero al ser las cooordenadas cartesianas,
esta se reduce a la metrica trivial Eucldea.
15.2. SOLUCION DE LAS ECS. DE MOV. COMO PROBLEMA DE VALORES PROPIOS 423
veamos como quedan los autovectores a primer orden en . Para ello reemplacemos (15.27) en la Ec. (15.21)
donde hemos tomado la raz positiva, recuerdese que aun con la condicion de normalizacion, hay una am-
biguedad en el vector propio concerniente al sentido de dicho vector. El vector propio normalizado asociado a
1 se obtiene entonces de (15.29) y (15.28) y se escribe como
a11 1 12 2 1
a(1) = = + O 2
a21 12 3
reemplazando (15.27) en (15.24) y con un procedimiento analogo se obtiene el vector propio asociado a 2
a12 + 12 3
a(2) = 1 2 = + O 2
a22 1 2 1
Segundo caso: Examinemos el caso en el cual V12 > V22 > 0 y |V11 V22 | << V12 = V21 . En este caso
un parametro conveniente es = (V11 V22 ) / (8V12 ) que es una cantidad pequena. A primer orden en , los
autovalores y autovectores estan descritos por
1
1 (V11 + V22 ) + V12 + (V11 V22 )
2
1
2 (V11 + V22 ) V12 (V11 V22 )
2
!
1 (1 + 2) 1 (1 2)
A 2 2 (15.32)
1 (1 2) 1 (1 + 2)
2 2
en este caso tambien se cumplen las relaciones (15.31), aunque los valores numericos difieren fuertemente. En
la primera matriz los valores fuera de la diagonal son de orden en tanto que los diagonales
son de orden 1.
En cambio, los elementos de la matriz en el segundo caso son todos del orden de 1/ 2.
Es facil ver que las matrices (15.30, 15.32) son ortogonales propias a primer orden en y . Por tanto, la
transformacion de congruencia que diagonaliza a V es en ambos casos una transformacion de similaridad (ver
ejercicio 1, Pag. 450). En realidad, esto es cierto incluso para el problema exacto, en virtud de que la matriz
de la energa cinetica ya es trivial (ver seccion 12.15).
Con esta formulacion, podemos resolver problemas que involucren a dos osciladores acoplados, cada uno con
un grado de libertad. Se deja como ejercicio al lector, el planteamiento de la solucion de pequenas oscilaciones
para dichos sistemas.
424 CAPITULO 15. OSCILACIONES
al = c1 ak + c2 al (15.33)
donde c1 , c2 son constantes elegidas de tal forma que al sea ortogonal a ak . Multiplicando ambos miembros
de (15.33) por Tak y usando las condiciones de ortonormalidad (12.125) y (12.126) se obtiene
al Tak = c1 e
e ak Tak + c2 e
al Tak = 0
al Tak = c1 + c2 e
e al Tak = 0
requiriendo ademas que al este normalizado segun (12.126), tenemos una condicion adicional sobre tales cons-
tantes
al Tal = 1 = c21 + c22 + 2c1 c2 l
e (15.35)
las condiciones (15.34) y (15.35) fijan a c1 y c2 en forma casi unvoca. Hemos formado entonces el conjunto
ortonormal al y ak = ak . Estos ademas son ortogonales a los otros vectores propios correspondientes a valores
propios diferentes, lo cual ya se ha demostrado. De esta forma ya tenemos un conjunto de n autovectores aj
cuyas componentes pueden formar la matriz A que diagonaliza simultaneamente a T y a V.
Este procedimiento constituye un caso particular del llamado proceso de ortogonalizacion de Gram-Schmidt
(ver ejercicio 8, Pag. 336). Cuando tenemos una raz de multiplicidad m, los vectores ortonormalizados se
forman por combinaciones lineales de una conjunto original de vectores propios linealmente independientes
a1 , . . . , am . El conjunto ortonormal a1 , . . . , am se forma de la siguiente forma: el primero se elige igual a un
multiplo (normalizado) de a1 ; a2 se toma como una combinacion lineal de a1 y a2 y as sucesivamente. Con este
algoritmo, el numero de constantes a determinar equivale a la suma de los primeros m numeros i.e. 12 m (m + 1).
Las condiciones de normalizacion nos dan m condiciones, junto con 12 m (m 1) condiciones de ortogonalidad,
de esta forma los vectores quedan definidos casi unvocamente excepto por sus sentidos pues si se cambia ak por
ak el nuevo vector sigue siendo ortogonal a los otros y normal, esto esta relacionado con el hecho de que las
condiciones de normalizacion son cuadraticas e invariantes ante una cambio de signo en todas las componentes
de un vector dado5 . Finalmente, cabe destacar que este conjunto ortogonal no es en general unico.
Recordemos ademas que en general la degeneracion esta ligada con alguna simetra, por ejemplo en el caso
de matrices 3x3 (como el tensor de inercia), la indeterminacion en las componentes de los autovectores para
una raz doble indican que todos los vectores en un cierto plano son vectores propios, con lo cual basta elegir
dos vectores perpendiculares en dicho plano para formar ejes principales, y los vectores en A son vectores
normalizados que van a lo largo de tales ejes.
5
De hecho se le puede colocar una fase global eik a cada vector propio ak , sin alterar la ortonormalidad ni la condicion de
vector propio. En particular, un cambio de signo en un vector se puede interpretar como una fase global de la forma ei .
15.4. FRECUENCIAS DE VIBRACION LIBRE Y COORDENADAS NORMALES 425
y la matriz de transformacion es no singular (por tanto invertible) de manera que se conserva la independencia
lineal. Notese que ambos pares de vectores (15.36) y (15.37) poseen la estructura generica
c1 c2
c1 = ; c2 = (15.38)
c2 c1
de modo que los anteriores resultados se generalizan para pares de vectores propios con la estructura (15.38).
Por tanto, los vectores propios estan determinados por cualquier par de numeros c1 y c2 que formen la estructura
(15.38) y cumplan la condicion de normalizacion definida en (12.126). Esto nos muestra que hay un conjunto
infinito de pares de vectores propios normalizados y linealmente independientes en el caso en que hay presencia
de degeneracion.
Existe otra forma de ver los resultados anteriores. Notese que los autovectores aproximados dados por
(15.30) corresponden al caso en el cual los terminos principales de la energa potencial V11 y V22 , estan sobre
la diagonal en tanto V12 esta en las posiciones fuera de la diagonal. Si tomamos los autovectores de las Ecs.
(15.32) en el lmite 0 y hacemos que los autovectores (15.32) transformen a V segun la prescripcion
e
V = AVA, obtenemos el tensor de energa potencial transformado
1 1
2 (V11 + V22 ) + V12 2 (V11 V22 )
V = 1 1
2 (V11 V22 ) 2 (V11 + V22 ) V12
en el cual el termino diferencia (V11 V22 ) esta fuera de la diagonal. En consecuencia, el conjunto de auto-
vectores dados por las Ecs. (15.32) corresponden a la situacion fsica en la cual el pequeno termino de energa
(V11 V22 ) esta fuera de la diagonal.
es necesariamente la solucion mas general del problema ya que no ha tenido en cuenta las condiciones iniciales.
Por otro lado, en virtud de la linealidad de la Ec. (15.11) se observa inmediatamente que una superposicion
de soluciones de tal ecuacion es tambien una solucion. Combinando este hecho con el teorema matematico que
nos dice que las funciones ein t son completas en un intervalo acotado (teorema de Fourier) podemos deducir
que la solucion mas general a las Ecs. (15.11) consiste en una superposicion de soluciones de la forma (15.14).
Por tanto, si el sistema se desva ligeramente del equilibrio, es posible que realice oscilaciones alrededor de la
configuracion de equilibrio con alguna de las frecuencias permitidas 1 , . . . , n . Por esta razon a las soluciones
de la ecuacion secular se les conoce usualmente como frecuencias de vibracion libre o frecuencias de resonancia
del sistema.
Escribamos entonces la solucion general como superposicion de soluciones del tipo (15.14), representada
como una suma sobre el ndice k
i = Ck aik eik t (15.39)
donde Ck es un factor complejo asociado a cada frecuencia de resonancia k . Podra objetarse que para cada
solucion k de la ecuacion secular tanto k como k son frecuencias de resonancia ya que ambas estan
asociadas al mismo vector propio ak pero los factores de escala para cada frecuencia denotados por Ck+ y Ck
podran ser en general diferentes. Con esta argumentacion la solucion debe escribirse como
i = aik Ck+ eik t + Ck e+ik t (15.40)
recordemos sin embargo que el movimiento fsico esta descrito por la parte real de la solucion compleja plan-
teada, y la parte real de cualquiera de las dos ecuaciones (15.39) o (15.40) se puede escribir en la forma
donde las amplitudes fk y fases k se determinan a partir de las condiciones iniciales. Por tanto cualquiera
de las soluciones (15.39, 15.40, 15.41) puede representar al movimiento fsico. Tomaremos entonces la mas
conveniente para nuestros propositos Ec. (15.39). Notese que en la Ec. (15.39), la fase del movimento real k
esta contenida en la fase compleja de Ck , en tanto que la magnitud de Ck estara relacionada con la amplitud
asociada a cada frecuencia k .
Los factores de escala Ck se pueden determinar facilmente gracias a las propiedades de ortonormalidad de
A Ec. (12.127)6 . En el tiempo t = 0 la parte real de (15.39) se reduce a
donde hemos tenido en cuenta que los elementos de A son reales. Para las velocidades generalizadas i se
obtiene una expresion analoga. Derivando (15.39) y evaluando la parte real de la solucion en t = 0
i = ik Ck aik eik t ; Rei (0) = k aik Re (iCk ) = k aik Re [i (ReCk + i ImCk )] = k aik Re [iReCk ImC
i (0) = k aik ImCk (15.43)
las 2n ecuaciones (15.42) y (15.43) nos permiten evaluar las n partes reales y n partes imaginarias a partir de
las condiciones iniciales7 . Para resolver (15.42) es mas conveniente escribir dicha ecuacion en notacion matricial
(0) = A ReC
e
ReC = AT (0) ReCl = ajl Tjk k (0) (15.44)
6
Es necesario recordar que la condicion de ortonormalidad dada en la Ec. (12.127), no coincide con la condicion usual de
ortogonalidad, de modo que en general A1 6= A, e como se discutio en la seccion 12.15.
7
Estrictamente, las Ecs. (15.42) y (15.43) deberan contener i (0) y i (0) a la izquierda de estas expresiones. Sin embargo,
asumimos que las condiciones iniciales son reales y por ello dicha notacion no es necesaria.
15.4. FRECUENCIAS DE VIBRACION LIBRE Y COORDENADAS NORMALES 427
1
ImCl = ajl Tjk k (0) no suma sobre l (15.45)
l
Las Ecs. (15.44) (15.45), permiten calcular directamente los factores complejos (y por tanto las amplitudes y
fases) en terminos de las condiciones iniciales (0) , (0) y las matrices A y T.
La solucion para cada coordenada dada por (15.39) es en general una suma de oscilaciones armonicas
simples en todas las frecuencias k que satisfacen la ecuacion secular. A menos que todas las frecuencias
sean conmesurables, el conjunto de todas las i no retornan en general a sus valores iniciales en ningun
instante posterior, esto significa que la configuracion de las i no es una funcion periodica simple del tiempo8 .
No obstante, la condicion de ortonormalidad de A nos permite encontrar a partir de las i un conjunto de
coordenadas generalizadas i que son todas funciones periodicas en el tiempo. A este conjunto de coordenadas
generalizadas las llamaremos coordenadas normales. Partiendo de (15.39) y multiplicando por a1 ni a ambos
lados
ik t
a1 1
ni i = ani aik Ck e = nk Ck eik t
in t
a1
ni i = Cn e
notese que el resultado de la derecha en la ultima ecuacion depende solo de la frecuencia n y de su correspon-
diente factor de escala Cn ; es por tanto natural definir las nuevas coordenadas generalizadas en la forma
a1
ni i n n = Cn ein t (15.46)
amn a1
ni i = amn n mi i = amn n
m = amn n (15.47)
matricialmente se escribe
= A ; A1 = (15.48)
comparando con el procedimiento de la seccion 12.14.1, Ecs. (12.134), (12.136), vemos que las coordenadas i
son precisamente las que diagonalizan la forma cuadratica positiva, que en nuestro contexto esta asociada con
el potencial
1
V = e V (15.49)
2
por tanto podemos tomar el resultado (12.137) para escribir
1e 1
V = = k2 k k (15.50)
2 2
la energa cinetica es una forma cuadratica definida positiva que se escribe como
1
T = e
T (15.51)
2
8
Si las coordenadas generalizadas i son todas funciones periodicas simples en el tiempo, esto implicara que la trayectoria en
el espacio de fase es cerrada como vimos en el movimiento periodico de libracion en el captulo de Hamilton Jacobi, seccion 9.10.
428 CAPITULO 15. OSCILACIONES
comparando con la Ec. (12.134) vemos que y la coordenada normal asociada es simplemente . Es
decir que en este caso las coordenadas normales asociadas a la matriz definida positiva se obtienen simplemente
derivando temporalmente (15.48)9
= A ; A1 = (15.52)
y la forma cuadratica para la energa cinetica se obtiene de (12.138)
1 e 1
T = = i i (15.53)
2 2
Usando (15.50) y (15.53) podemos construir el Lagrangiano y las Ecuaciones de movimiento en coordenadas
normales
1
L = k k k2 k2 (15.54)
2
k + k2 k = 0 (15.55)
Notese que el punto de partida fue la estipulacion de que la oscilacion del movimiento es pequena. Esto
fue lo que permitio representar el potencial como una forma cuadratica, la cual es caracterstica del movimiento
armonico simple. La transformacion a coordenadas normales enfatiza este hecho puesto que el Lagrangiano en
tales coordenadas se puede escribir como la suma de Lagrangianos desacoplados correspondientes a osciladores
armonicos de frecuencias k (ver Ec. 15.54). Por lo tanto, podemos considerar que el movimiento completo
para pequenas oscilaciones se puede obtener excitando los osciladores armonicos con diferentes intensidades
y fases. Este punto de vista es muy util en mecanica cuantica, por ejemplo para la cuantizacion del campo
electromagnetico. Las frecuencias de los osciladores armonicos se identifican con las frecuencias de los fotones y
las amplitudes de excitacion se convierten en los numeros de ocupacion discretos y cuantizados, i.e. el numero
de fotones para cada frecuencia. Caso similar se presenta en el estudio de otras excitaciones colectivas que se
pueden desacoplar en sumas de osciladores armonicos tales como las redes de fonones y magnones en la Fsica
del estado solido.
En este punto surge otra analoga interesante, el Lagrangiano (15.10) describe un conjunto acoplado (in-
teractuante) de partculas reales. La transformacion a coordenadas normales nos lleva a un Lagrangiano
(15.54) que puede pensarse como un conjunto de partculas (imaginarias), desacopladas (no interactuantes)
i.e. un conjunto independiente de osciladores armonicos cada uno con su frecuencia caracterstica11 . Para re-
solver el problema real con base en el problema desacoplado (mas simple), basta con aplicar la transformacion
inversa que nos regresa a las coordenadas que describen a las partculas reales. La estrategia fue pasar desde
un problema acoplado o interactuante, hacia un problema desacoplado o no interactuante, para resolver el
problema desacoplado y luego regresarse al problema real acoplado. Ya usamos esta estrategia en la seccion
10.1, en la cual un problema de dos cuerpos acoplados de coordenadas r1 y r2 , se convirtio en un problema
de dos cuerpos desacoplados (imaginarios), uno asociado a la coordenada relativa r y otro a la coordenada del
centro de masa R. Podemos decir en este nuevo lenguaje, que las componentes de r y R son las coordenadas
normales del problema de dos cuerpos. Es interesante ver como la Fsica recurre una y otra vez a las mismas
estrategias generales, aunque difiera en los detalles.
Figura 15.2: Molecula triatomica lineal. La masa de cada atomo de los extremos es m, en tanto que el atomo
central tiene masa M . (a) Los puntos x0i senalan las posiciones de equilibrio y (b) los puntos xi indican los
valores de las posiciones de los atomos en un instante dado.
Ilustraremos la obtencion de los modos normales de oscilacion considerando el caso de una molecula
triatomica lineal, la cual en estado de equilibrio consiste de dos masas m en los extremos y una masa M
en el centro, la distancia entre cada masa m y la masa M se denota por b. Todos los atomos estan en lnea
recta como lo indica la figura 15.2. Por simplicidad asumiremos que solo hay vibraciones longitudinales y el
11
Esta es sin embargo, solo una imagen conveniente, ya que los Lagrangianos (15.10) y (15.54) describen exactamente el mismo
problema Fsico real, aunque en coordenadas distintas.
430 CAPITULO 15. OSCILACIONES
potencial interatomico se aproximara a aquel equivalente a dos resortes acoplados identicos que unen a la masa
M con las dos masas m. Esta aproximacion esta justificada siempre que haya pequenas oscilaciones alrededor
del equilibrio. No obstante, este modelo hace implcitamente una aproximacion adicional, ya que se desprecia
la interaccion entre las masas m. De acuerdo con la figura 15.2, la energa potencial se puede escribir en la
forma
k k
V = (x2 x1 b)2 + (x3 x2 b)2
2 2
introducimos entonces las coordenadas relativas a la posicion de equilibrio
i = xi x0i
comparando (15.58) con (15.59) y escribiendo los terminos de tal modo que Vij sea simetrico, el tensor V se
escribe de la forma
k k 0
V = k 2k k (15.60)
0 k k
la energa cinetica en estas coordenadas tiene la forma
m 2 M 2 1 m 0 0 1
T = 1 + 32 + = 1 2 3 0 M 0 2 (15.61)
2 2 2 2
0 0 m 3
de modo que el tensor T es diagonal
m 0 0
T= 0 M 0 (15.62)
0 0 m
con base en los tensores (15.60) y (15.62), la ecuacion secular (15.16) queda
k 2m k 0
det V T =
2
k 2k 2 M k =0
0 k k 2m
1 = C1
este resultado es a priori sorprendente ya que no corresponde a un movimiento oscilatorio, sino a una traslacion
de la molecula como un todo a lo largo del eje de la molecula (dado que solo estamos permitiendo movimiento
longitudinal). Pero precisamente hay que tener en cuenta que la traslacion rgida de la molecula a lo largo de
su eje no produce ningun cambio en la energa potencial12 , este es un ejemplo del equilibrio indiferente que ya
hemos comentado. Este modo de frecuencia nula corresponde entonces a una traslacion rgida de la molecula,
pues no hay fuerza restauradora asociada a este movimiento. Hemos hecho la suposicion de que la molecula
posee tres grados de libertad para el movimiento vibracional, pero en realidad uno de ellos es un grado de
libertad asociado a este movimiento rgido. Otro aspecto interesante de las frecuencias de resonancia nulas se
puede ver a traves de la Ec. (12.123), la cual muestra que un valor nulo de solo se puede obtener si la energa
potencial es positiva singular13 . La Ec. (15.57) muestra que con k 6= 0, la condicion necesaria y suficiente para
que V sea nulo es que 1 = 2 = 3 . Es decir existe un vector propio no nulo de la forma
= (, , )T (15.64)
con valor propio nulo, que efectivamente corresponde a traslacion rgida de la molecula. Equivalentemente, el
vector (15.64) es un vector no nulo que hace que la forma bilineal (15.59) se anule cuando Vij viene dado por
(15.60).
Por otro lado, si relajamos la condicion de movimiento longitudinal (que solo nos da un grado de liber-
tad traslacional) y permitimos vibraciones en todas las tres direcciones, el numero de grados de libertad de
traslacion rgida se incremente a 6 ya que la molecula podra moverse a lo largo de los tres ejes, o realizar ro-
taciones uniformes alrededor de tales ejes. Por lo tanto, en un sistema general de n grados de libertad habra 6
frecuencias nulas (3 traslacionales y 3 rotacionales) y solo n 6 frecuencias verdaderas de vibracion.
Ademas de la traslacion o rotacion rgida, existe una condicion adicional bajo la cual ocurren frecuencias
nulas y es el caso en el cual tanto la primera como la segunda derivada del potencial se anulan en la posicion
de equilibrio. En este escenario k = 0 (no hay termino cuadratico en la expansion de Taylor del potencial) y
aun son posibles pequenas oscilaciones si la cuarta derivada es no nula (la tercera debe ser nula para que haya
equilibrio estable). No obstante, en este caso la oscilacion no sera de tipo armonico pues el primer termino
no nulo en la expansion del potencial sera de orden cuartico, el caso mas simple es un potencial de la forma
V = ax4 con a positivo, siendo x = 0 el punto de equilibrio. Este es un caso de pequenas oscilaciones diferente
a la aproximacion armonica usual, pero no se presenta con mucha frecuencia.
De la discusion anterior se ve entonces que las frecuencias nulas de resonancia no tienen ninguna incidencia
en el estudio de los modos vibracionales. Una forma de remover los modos traslacionales (aunque no los
rotacionales) es imponer la condicion de que el centro de masa permanezca estacionario en el origen. Es decir,
ubicar el sistema de referencia inercial en el CM
m (x1 + x3 ) + M x2 = 0 (15.65)
el lector puede chequear que esta matriz es invertible siempre que las masas sean no nulas. Adicionalmente,
se observa que el determinante no es la unidad, y A1 6= A, e de modo que esta matriz no es ortogonal. Como
ya se menciono, esto se debe al caracter no trivial del tensor cinetico (15.62). Esto implica entonces que la
diagonalizacion simultanea de T y V (en la cual T se convierte en la identidad) requiere de una transformacion
de contraccion o dilatacion (ver seccion 12.15). Notese en particular que si m = M se obtiene A1 = mA, e con
lo cual A es una matriz cuasi-ortogonal, esto se debe a que en este lmite el tensor cinetico (15.62) se vuelve
proporcional a la identidad, con lo cual todos los ejes requieren el mismo factor de contraccion o dilatacion
para trivializar a T. En contraste, cuando m 6= M , se requieren dos factores diferentes de contraccion para tal
trivializacion.
Por simplicidad utilizaremos las condiciones iniciales i (0) = Ai , i (0) = 0 para i = 1, 2, 3; que correspon-
den a colocar las partculas en t = 0 fuera del equilibrio con velocidades iniciales nulas. La Ec. (15.45) nos
muestra que para estas condiciones iniciales la parte imaginaria de los Cl es nula15 . Por tanto los Cl son reales
y vienen dados por la Ec. (15.44)
m M m
a(M +2m) a(M +2m) a(M +2m) A1
ReC = C = A1 (0) = 1
2b 0 1
2b A2
M
2c(M +2m) c(MM+2m)
M
2c(M +2m)
A3
M A2 +mA1 +mA3
a(M +2m)
A1 A3
C = 2b (15.73)
M (A1 2A2 +A3 )
2c(M +2m)
Aplicando (15.63, 15.73), obtenemos las ecuaciones asociadas a los modos normales de oscilacion
M A2 + mA1 + mA3
1 = C1 ei1 t = ;1 = 0
a (M + 2m)
r
A1 A3 i2 t k
2 = C2 ei2 t = e ; 2
2b m
s
i3 t M (A1 2A2 + A3 ) i3 t k 2m
3 = C3 e = e ; 3 1+ (15.74)
2c (M + 2m) m M
donde las constantes a, b, c estan definidas en (15.71). Las amplitudes fsicas i (t) se obtienen aplicando (15.71,
15.63) en las Ecs. (15.39) y teniendo en cuenta que 1 = 0
15
Para l = 0, no podemos utilizar (15.45). La Ec. (15.43) nos muestra que la parte imaginaria de Ck asociada a un k = 0,
puede elegirse arbitrariamente para reproducir adecuadamente las condiciones iniciales. Por tanto, elegiremos ImCk = 0 tambien
en este caso.
434 CAPITULO 15. OSCILACIONES
El primer termino a la derecha de estas ecuaciones es constante e igual para todas las coordenadas reales.
Por tanto, representa una traslacion rgida de la molecula16 . Como ya se menciono, este termino se puede
anular exigiendo que la coordenada del centro de masa permanezca en el origen para todo tiempo (es decir
montandose en el sistema de referencia del CM). Esto nos lleva a exigir
m (x1 + x3 ) + M x2
XCM = =0
2m + M
es claro que solo el numerador es relevante en esta ligadura
m (x1 + x3 ) + M x2 = m (1 + 3 ) + M 2 = 0
(A1 A3 ) i2 t 1 m (A1 + A3 ) i3 t
1 (t) = e + (A1 + A3 ) ei3 t ; 2 (t) = e
2 2 M
(A1 A3 ) i2 t 1
3 (t) = e + (A1 + A3 ) ei3 t (15.78)
2 2
aplicando la ligadura (15.77) a los modos normales (15.74) se obtiene
A1 A3 i2 t 1
1 = 0 ; 2 = e ; 3 = (A1 + A3 ) ei3 t
2b 2c q
2m (A1 A3 ) i2 t 2m 1 + 2m M
1 = 0 ; 2 = e ; 3 = (A1 + A3 ) ei3 t (15.79)
2 2
donde hemos usado las definiciones de las constantes a, b, c Ec. (15.71). Recordemos que los modos normales
son soluciones que se pueden interpretar como un conjunto de osciladores (imaginarios) desacoplados. Pe-
ro las soluciones (15.78) s son soluciones reales cuando se interpretan como elongaciones de las partculas.
16
La igualdad de estos terminos se debe a la igualdad de las componentes del vector (a, a, a) asociado a 1 = 0, como se ve en
la primera columna de la matriz (15.71). Otra manera de ver que este vector esta asociado a un modo traslacional, es observando
que la energa potencial no cambia al pasar desde el vector cero (equilibrio) al vector (15.68), puesto que en ambos casos la
energa potencial es cero. La unica manera de que la energa potencial permanezca intacta es que todas las partculas conserven
sus distancias relativas, y dado que solo se permiten modos longitudinales, esto solo puede asociarse a una traslacion rgida del
sistema.
15.5. VIBRACIONES LIBRES DE UNA MOLECULA TRIATOMICA 435
Las soluciones para las elongaciones reales i son superposiciones de los modos normales, mostrando que las
partculas reales estan acopladas. Es claro que si hacemos A1 = A3 en las Ecs. (15.78, 15.79), se eliminan las
contribuciones asociadas a 3 tanto para los modos normales como para los reales
Recordando que hemos considerado i = 0, Fsicamente estas condiciones iniciales significan que soltamos las
partculas desde el reposo de modo que las partculas de los extremos se estiran ambas o se contraen ambas en
la misma magnitud (movimiento en antifase i.e. A1 = ei A3 ), dejando sin elongar a la partcula de la mitad17 .
Examinemos las soluciones para todo tiempo con estas condiciones iniciales. En este caso, la Ec. (15.81)
muestra que solo sobrevive el modo normal asociado a 2 , de modo que estamos en el segundo modo normal
puro. En cuanto al movimiento Fsico, las Ecs. (15.80) muestran que este corresponde a que la partcula M
esta en reposo, en tanto que las partculas de los extremos oscilan armonicamente siempre en antifase. Estas
soluciones son las esperadas por argumentos de simetra18 . Ademas, ya que la masa M actua como extremo
fijo, es logico que el movimiento armonico de cada masa m, este dado por el valor que se obtendra si cada una
estuviera sola, atadap a un resorte de constante k y fija a una pared. Efectivamente la frecuencia real de cada
masa m es 2 = k/m.
Es facil ver de las Ecs. (15.79) que la obtencion del tercer modo normal puro se obtiene haciendo A1 = A3 .
Sustituyendo estas condiciones en las Ecs. (15.78, 15.79), las coordenadas reales y normales quedan
de nuevo examinemos fsicamente las condiciones iniciales. La condicion A1 = A3 indica que las dos partculas
de los extremos se elongan en la misma direccion (en fase) y con la misma amplitud. A fin de mantener el CM
fijo, la ligadura (15.77) nos da A2 = 2mA1 /M , de modo que la partcula M se elonga en direccion contraria a
las otras (antifase con las masas de los extremos), con una amplitud que depende de la amplitud de las masas
de los extremos y del cociente entre las masas (por ejemplo si m = M , la amplitud de M debe ser el doble de
la de las partculas de los extremos).
Las soluciones fsicas i (t) muestran que en el tercer modo normal puro, las masas de los extremos oscilan
siempre en fase y la del centro siempre en antifase con respecto a las anteriores. Todas las partculas oscilan
con la misma frecuencia, que es la asociada al tercer modo normal puro.
En general, cualquier vibracion longitudinal de la molecula que no involucre traslacion rgida sera una
combinacion lineal de los modos asociados a 2 y 3 . Las amplitudes de los modos normales y reales, as como
las fases relativas en los modos reales, estaran determinadas por las condiciones iniciales.
En el caso de una molecula lineal habra tres grados de libertad de traslacion pero solo dos grados de libertad
de rotacion rgida, puesto que una rotacion alrededor del eje de la molecula no es relevante y no aparecera como
un modo de rotacion rgida. Esto implica que tendremos cuatro grados de libertad asociados a la vibracion:
2 de las vibraciones longitudinales como ya vimos, y otros dos asociados a vibraciones perpendiculares al
eje (transversales). No obstante, la simetra axial de la molecula nos dice que los dos modos vibracionales
transversales deben ser degenerados. No hay nada que distinga a una vibracion a lo largo de cualquier eje
perpendicular a la lnea de la molecula, por lo cual las frecuencias asociadas deben ser identicas.
La indeterminacion de los autovectores inherentes a los modos degenerados se refleja en el hecho de que
todas las direcciones perpendiculares al eje de la molecula son equivalentes, cualquier par ortogonal de ejes
que yace en el plano perpendicular a tal eje se pueden escoger como las direcciones de los modos normales
de vibracion. El movimiento transversal depende de las amplitudes y fases de estos modos degenerados. Por
ejemplo, si ambos modos estan presentes y en fase los atomos se moveran en lnea recta pasando a traves de
la configuracion de equilibrio. Pero si estan en antifase, el movimiento compuesto producira una elipse que
corresponde a una figura de Lissajous, tal como ocurre con el oscilador armonico bidimensional isotropico.
Esto significa que los dos modos representan una rotacion mas que una vibracion.
Figura 15.3: Movimiento de los atomos de una molecula triatomica lineal, cuando los modos degenerados estan
en desfase de /2. Observese que la masa M gira en direccion contraria a las masas m de los extremos. Los
puntos a lo largo de la recta son las posiciones de equilibrio de las masas.
La simetra tambien nos lleva a que las amplitudes asociadas a modos normales de los atomos de los
extremos, sean identicas en magnitud. El calculo detallado muestra ademas que los atomos de los extremos
viajan en la misma direccion que las figuras de Lissajous. Por tanto el atomo del centro viaja en direccion
opuesta con el fin de mantener el centro de masa en reposo. La figura 15.3 muestra el movimiento de los atomos
en el caso en el.cual los modos degenerados estan en desfase /2.
Cuando la complejidad de la molecula crece, la complejidad de la ecuacion secular aumenta significativamen-
te. No obstante, en muchos casos las simetras de la molecula han jugado un papel simplificador fundamental a
traves de la teora de grupos, gracias a la cual es a veces posible factorizar la ecuacion secular en bloques mas
pequenos que se pueden diagonalizar por separado para encontrar las amplitudes y las frecuencias normales del
sistema. Estos metodos encuentran importantes aplicaciones en espectroscopa infraroja y en espectroscopa
Raman.
Ck = km Cm k = 1, . . . , n ; m es fijo (15.82)
ik t
k = km Ck e ; m es fijo (15.83)
por tanto, deben ajustarse las condiciones iniciales i (0) y i (0) de tal modo que las Ecs. (15.44, 15.45) me
reproduzcan (15.82). Una vez realizado dicho ajuste, vemos de las Ecs. (15.39) que las elongaciones reales de
las partculas estan dadas por
de (15.84) se ve que la solucion Fsica para cada partcula i, consta de un solo termino tambien armonico y
de la misma frecuencia que el modo normal, a menos que aim sea nulo en cuyo caso la partcula estara en
reposo. Este fue el caso de 2 (t) para el segundo modo normal en la Ec. (15.80), ya que a22 = 0 como se puede
ver en (15.71). Es decir, en el movimiento real asociado al mesimo modo normal puro, cada partcula tiene
movimiento armonico simple con la frecuencia m del correspondiente modo, o esta en reposo. Por otro lado,
teniendo en cuenta que los elementos aik son reales, al comparar la solucion real (15.84) con el modo normal
(15.83) vemos que si aim > 0, entonces i (t) tiene la misma fase que m (t)
m (t) = Cm eim t = |Cm | eim eim t = |Cm | ei(m t+m ) ; no suma sobre m
im t im im t i(m t+m )
i (t) = Cm aim e = |Cm | e |aim | e = |Cm aim | e ; no suma sobre m
i (t) = Cm aim eim t = |Cm | eim |aim | ei eim t = |Cm aim | ei(m t+m +)
Por tanto, en el mesimo modo normal puro, la iesima partcula vibrante esta en fase (desfase) con tal modo
normal si aim es positivo (negativo); si aim = 0, la iesima partcula estara en reposo.
Insistimos en este punto en que los modos normales no son estrictamente imaginarios pues de hecho son
una solucion totalmente equivalente a la que se encuentra con las coordenadas de elongacion i de las partculas,
solo que en otras coordenadas en donde la apariencia algebraica de las ecuaciones es mas simple. De hecho la
Ec. (15.52) nos muestra que la matriz A de transformacion (matriz de vectores propios de la Ec. 15.17) nos
lleva de un sistema coordenado al otro. Lo que es imaginario, es la interpretacion de las coordenadas normales
k como elongaciones de partculas desacopladas, ya que estas partculas desacopladas s son imaginarias.
Por simplicidad, asumiremos que las fuerzas externas si las hay, tambien son longitudinales al igual que las
posiciones y velocidades iniciales. Esto garantiza que los modos vibracionales de la molecula continuan siendo
longitudinales. Si denotamos por Fj a la fuerza generalizada correspondiente a la coordenada j , tenemos que
en virtud de la Ec. (2.9) la fuerza generalizada Qi asociada a la coordenada normal i se escribe como19
donde hemos utilizado la Ec. (15.48) en componentes. En notacion matricial (15.85) se escribe como
e
Q = AF (15.86)
las ecuaciones para las coordenadas i son identicas a las Ecs. (15.11) pero agregando las fuerzas generalizadas
asociadas Fj en el miembro derecho como se ve en la Ec. (2.35). Matricialmente escribimos estas ecuaciones
en la forma
T + V = F TA + VA = F
donde hemos usado (15.48). Aplicando A e a la izquierda de la ecuacion y utilizando las Ecs. (15.18, 15.19,
15.86) se tiene
e
ATA e
+ AVA e
= AF + = Q
que son las ecuaciones para las coordenadas normales. En componentes, estas ecuaciones quedan
i + i2 i = Qi (15.87)
en este caso las n ecuaciones (15.87) son inhomogeneas y para solucionarlas se debe conocer Qi en funcion
de tiempo. Vale recalcar que estas ecuaciones para las coordenadas normales aunque inhomogeneas, siguen
estando desacopladas como ya se haba anticipado.
A menudo la fuerza externa es de tipo senoidal como ocurre por ejemplo si el forzamiento lo da una onda
incidente sobre el sistema (mecanica o electromagnetica), o si el forzamiento lo produce un sistema mecanico
externo que a su vez tambien esta vibrando. En otros casos aunque el forzamiento no sea senoidal, se puede
escribir como una superposicion de componentes senoidales, por ejemplo si el forzamiento es periodico se puede
escribir como una serie de Fourier y si no es periodico una integral de Fourier podra representar el forzamiento.
Teniendo en cuenta que las ecuaciones (15.87) son lineales las soluciones para frecuencias particulares se pueden
superponer para generar la solucion general para Qi dado.
Escribiremos entonces un forzamiento de la forma
de acuerdo con la teora de ecuaciones diferenciales, la solucion de (15.89) consta de una solucion general de la
ecuacion homogenea correspondiente mas una solucion particular de la inhomogenea. Por medio de una eleccion
apropiada de condiciones iniciales, es posible hacer que las vibraciones libres superpuestas se cancelen21 . Por
lo tanto vamos a centrar nuestra atencion en las soluciones particulares de (15.89), teniendo presente que es de
19
Puesto que j es una coordenada esencialmente cartesiana, las fuerzas generalizadas son las fuerzas newtonianas.
20
Notese que no depende de i. La Ec. (15.85), nos indica que tampoco depende de j. Es decir, estamos asumiendo que el
forzamiento tiene la misma frecuencia para cada partcula, aunque la amplitud del forzamiento s puede depender de la partcula.
21
Las vibraciones libres son basicamente los transientes generados por la aplicacion de la fuerza externa. Si consideramos que
el sistema esta inicialmente en reposo en la configuracion de equilibrio y que la fuerza crece desde cero en forma contnua, estos
transientes no aparecen. Alternativamente, las fuerzas disipativas cuando estan presentes amortiguan las oscilaciones libres.
15.7. VIBRACIONES FORZADAS Y AMORTIGUADAS 439
esperarse que el sistema termine oscilando con la frecuencia del forzamiento externo. Por tanto, emplearemos
un ansatz de la forma
i = Bi cos (t + i ) (15.90)
las amplitudes Bi se obtienen sustituyendo este ansatz en (15.89)
Q0i
Bi = (15.91)
i2 2
de nuevo, la vibracion de cada partcula esta compuesta por una combinacion lineal de los modos normales,
pero en este caso cada oscilacion normal posee la frecuencia de la fuerza externa.
A partir de (15.92) se puede observar que la excitacion de cada modo esta determinada por la amplitud
del forzamiento Q0i y por la diferencia i2 2 . Si la fuerza sobre cada partcula no tiene componente en la
direccion de vibracion de algun modo normal particular es obvio que la fuerza generalizada asociada a tal
modo sera nula i.e. Q0i = 0, como se puede ver de (15.85) si Fj = 0 para todo j. En consecuencia, una fuerza
externa solo puede excitar un modo normal si tiende a mover a las partculas en la misma direccion que el
modo dado. Por otro lado, se puede ver que a medida que disminuye la diferencia i2 2 aumenta el valor
de la amplitud del modo asociado, entre mas cerca este la frecuencia natural de un modo dado a la frecuencia
externa, mayor sera la intensidad de este modo relativo a los otros. Se puede ver incluso que la ecuacion (15.92)
predice una divergencia cuando i = (resonancia). Sin embargo, hay que tener en cuenta que el formalismo
que nos llevo a (15.92) presupone pequenas oscilaciones alrededor de la configuracion de equilibrio, de modo
que cuando la formula predice amplitudes grandes ya no es valida.
De la Ec. (15.92), podemos examinar la contribucion de un modo normal dado (i fijo) para una partcula
especfica (j fijo). Si aji Q0i > 0 para un par de valores fijos de i, j tendremos que cuando < i ( > i ) las
oscilaciones estan en fase (antifase) con la fuerza externa. Similarmente, si aji Q0i < 0 las oscilaciones estan
en antifase (fase) con la fuerza externa. cuando < i ( > i ). Es decir, si hacemos una variacion contnua
de la frecuencia externa, encontraremos un cambio brusco en la fase relativa al forzamiento de un modo dado
sobre una partcula, cuando pasamos por la resonancia asociada a dicho modo.
esto implica que los coeficientes de viscosidad seran trabajados en aproximacion de medio homogeneo. Sin
embargo, si los coeficientes ij son diferentes para diferentes ndices, tendremos que la viscosidad del medio
depende de la direccion del desplazamiento, es decir que el medio es anisotropico.
440 CAPITULO 15. OSCILACIONES
Recordemos que de acuerdo con la Ec. (5.19), 2 representa la rata de disipacion de energa debida a
las fuerzas de friccion. Por lo tanto no puede ser nunca negativa. Por otra parte, incluso para un medio
anisotropico, es de esperarse que la viscosidad sea diferente de cero en todas las direcciones aunque sus valores
especficos sean distintos en cada una. En otras palabras, se espera que haya una disipacion diferente de cero
para cualquier configuracion no nula de velocidades i . En consecuencia, se espera que la forma bilineal (15.93)
sea positiva y solo sea cero para = 0. Por tanto, en la mayor parte de los casos de interes la matriz ij
sera definida positiva. Si se desprecia la viscosidad en ciertas direcciones, es posible modelar a ij como una
matriz positiva singular, pero esto no ocurre con frecuencia22 .
Las ecuaciones de Lagrange en este caso se pueden extraer de (2.38) y (15.10)
ij = Tij (15.96)
Esto ocurre en el caso en el cual el medio disipador es homogeno e isotropico. Notese sin embargo, que ij
es anisotropico ya que es un tensor de segundo rango. Debe observarse sin embargo, que tal anisotropa se
debe al sistema de osciladores que esta inmerso y no al fludo en el que se encuentra inmerso. Por ejemplo,
para un oscilador dado, las componentes de las velocidades en cada direccion son distintas, lo cual es fuente de
anisotropa para . La isotropa del fluido se manifiesta en el hecho de que es un escalar y la homogeneidad
en el hecho de que es independiente de la posicion.
Con la condicion (15.96) y empleando las coordenadas normales (15.48), la Ec. (15.95) queda
T + T + V = e
0 TA + TA + VA = 0 ATA e
+ ATA e
+ AVA =0
+ + = 0
Donde hemos usado las Ecs. (15.18, 15.19). En componentes, esta ecuacion se escribe como
vemos entonces que la dinamica de las coordenadas normales nos da un factor de amortiguamiento para la
amplitud debido a la componente imaginaria de i , que como era de esperarse es causada por la funcion de
disipacion i.e. por las fuerzas disipativas. Notese que este termino es siempre decreciente ya que no puede
ser negativo (en virtud del caracter definido positivo de T y ). Desde el punto de vista de la energa se ve
que cuando las partculas vibran, las fuerzas disipativas hacen un trabajo negativo sobre ellas con lo cual el
sistema que vibra pierde energa traduciendose en una disminucion de la amplitud con el tiempo. Por otro
lado, la Ec. (15.101) muestra que la parte real de i produce un termino oscilatorio, se ve ademas que la
friccion tambien afecta las frecuencias de oscilacion y que como es de esperarse, a medida que disminuye
el efecto de la friccion, tales frecuencias se acercan a las frecuencias naturales del sistema. Por otro lado, si
/2 > i la cantidad i tambien se vuelve imaginaria y deja de ser oscilante para convertirse en otro termino de
decaimiento (sobreamortiguamiento). Cuando /2 = i la forma de la solucion cambia ligeramente pero sigue
siendo decayente sin oscilacion (amortiguamiento crtico), el caso en el cual el amortiguamiento es pequeno y
se presenta oscilacion se conoce como subamortiguamiento.
Debemos recordar en todo caso, que la solucion para las elongaciones de las partculas esta dada por las
coordenadas i , que se obtienen a partir de i por medio de (15.48).
definimos
i = 2i (15.104)
El conjunto de ecuaciones (15.103) se puede escribir en terminos de los tensores T, y V as como de las
constante en la forma
Va + a + 2 Ta = 0 (15.105)
el conjunto de ecuaciones homogeneas (15.103) o (15.105) se puede resolver para las aj solo para ciertos valores
de o de . Solo podemos encontrar soluciones no triviales para a, si es solucion de la ecuacion secular
det V + + 2 T = 0
Sin embargo, es posible demostrar que tiene que ser no negativo sin necesidad de resolver la ecuacion secular
completa. En primer lugar, convertimos la Ec. (15.105) en una ecuacion escalar multiplicando a ambos lados
por a a la izquierda de tal ecuacion
a Va + a a + 2 a Ta = 0 (15.106)
que es una ecuacion cuadratica para cuyos coeficientes son productos matriciales con una estructura semejante
a los que aparecen en la Ec. (12.115). Descompondremos al vector a de la misma forma que en (12.114)
a = + i ; a = + i ; , Rn (15.107)
442 CAPITULO 15. OSCILACIONES
a Ma = e
e M + M ; a = + i ; , Rn (15.108)
Por tanto, en virtud de la simetra de T, V, y todos los productos matriciales en (15.106) son reales
2 b2 4ac
b
a + b + c = 0 ; 1,2 =
2a
a a Ta ; b a a ; c a Va
debido al caracter real de a, b, c; tenemos que si es una solucion de la Ec. (15.106), tambien lo sera . Es
claro que la suma de las dos races nos da
b a a
1 + 2 = =
a a Ta
como en este caso nuestras races son 1 y 1 tenemos que
a a
1 + 1 = 2Re1 = = 21
a Ta
donde tambien se tuvo en cuenta la definicion de Ec. (15.104). Usando (15.108) podemos expresar de la
forma
1 (i ij j + i ij j )
1 =
2 (k Tkl l + k Tkl l )
ya vimos que la matriz ij debe ser positiva, en tanto que la matriz Tkl es definida positiva, por lo tanto 1 no
puede ser negativo. Es decir, la oscilacion del sistema puede decrecer exponencialmente pero no puede crecer
en el tiempo23 . Es de anotar que si ij es definida-positiva, como ocurre en la mayora de los casos, entonces
sera estrictamente positivo y todos los modos normales estaran amortiguados. Como antes, las frecuencias de
oscilacion estaran afectadas por el factor de amortiguamiento, aunque naturalmente estas frecuencias deben
tender a las frecuencias libres cuando el factor de amortiguamiento es muy pequeno.
donde F0j es complejo de modo que absorbe cualquier fase inicial que pueda existir. Las ecuaciones de movi-
miento quedan en la forma
Vij j + ij j + Tij j = F0i eit (15.110)
coloquemos como solucion particular (fase estacionaria) un ansatz de la forma
j = Aj eit (15.111)
que al ser insertado en (15.110) nos da el siguiente conjunto de ecuaciones lineales inhomogeneas para las
amplitudes Aj
Vij iij 2 Tij Aj = F0i (15.112)
23
No es posible tener una funcion creciente de la amplitud (que implica aumento de la energa del sistema), si el sistema solo
esta sometido a fuerzas disipativas.
15.7. VIBRACIONES FORZADAS Y AMORTIGUADAS 443
las soluciones de estas ecuaciones se obtienen por regla de Cramer para los determinantes
Dj ()
Aj = (15.113)
D ()
D () es el determinante correspondiente a la version homogenea de (15.110) o (15.112), en tanto que Dj ()
es el determinante que resulta de modificar D () cuando la jesima columna se reemplaza por los terminos
inhomogeneos F01 , . . . , F0n . Para la presente discusion, nos centraremos en las propiedades de D () solamente,
ya que las caractersticas de las resonancias en la amplitud dependen fundamentalmente del denominador en
(15.113). D () es el determinante que aparece en la ecuacion secular correspondiente a la version homogenea
de las Ecs. (15.110) i.e. las Ecs. (15.103), sus races son las frecuencias complejas de las vibraciones sin el
forzamiento armonico. Por otro lado, el requerimiento de que y sean ambas races de la Ec. (15.106)
significa teniendo en cuenta la Ec. (15.104) que si i es una raz de D () entonces i tambien lo es. Por lo
anterior es posible representar D () para un sistema de n grados de libertad en la forma
D () = G ( 1 ) ( 2 ) . . . ( n ) ( + 1 ) ( + 2 ) . . . ( + n ) (15.114)
siendo G una constante compleja. En notacion de productoria y usando la frecuencia en lugar de la frecuencia
angular , podemos escribir24
n
Y
D () = G [2 ( i ) + ii ] [2 ( + i ) + ii ] (15.115)
i=1
las amplitudes de la oscilacion forzada exhiben entonces resonancia en las cercanas de las frecuencias de las
oscilaciones libres i . Se ve tambien de la Ec. (15.116) que la presencia de la constante de amortiguamiento
i remueve las divergencias que aparecan en las resonancias forzadas sin amortiguamiento. Las frecuencias
del forzamiento externo para las cuales la amplitud alcanza maximos locales ya no coincide exactamente con
las frecuencias de los modos libres debido a la dependencia con la frecuencia de terminos en Aj diferentes al
denominador. No obstante, de nuevo estas frecuencias de resonancia se aproximan a las frecuencias de vibracion
libre cuando el factor de amortiguamiento se vuelve muy pequeno.
Ahora bien, la solucion mas general se obtiene adicionando la solucion particular (15.111) con la solucion
de la ecuacion homogenea asociada Ec. (15.102)25 . Puesto que la solucion de la ecuacion homogenea decae
con el tiempo tendiendo a cero para tiempos suficientemente largos, a esta parte de la solucion se le conoce
como fase transitoria. Es importante definir un tiempo caracterstico en el cual la solucion transitoria
ha decaido en forma significativa. Este se define usualmente como el tiempo en el cual la amplitud asociada a
dicha fase ha decaido en un factor 1/e con respecto a su amplitud inicial. De la Ec. (15.102) se observa que
este factor de decaimiento viene dado por
1
24
Al pasar de (15.114) a (15.115), hemos supuesto que en la solucion (15.111) es real y representa la frecuencia angular del
forzamiento. A diferencia de la solucion para el caso amortiguado sin forzamiento Ec. (15.102) en el cual es complejo generando
un factor oscilatorio y otro de decaimiento. La idea es por supuesto, demostrar la consistencia de este ansatz.
25
Debe tenerse cuidado en distinguir los s de las dos ecuaciones.
444 CAPITULO 15. OSCILACIONES
si el tiempo transcurrido es menor que , la contribucion de la fase transitoria es significativa. Para t >>
podemos quedarnos solo con la solucion particular (15.111) conocida como fase estacionaria, puesto que
esta parte de la solucion predice un movimiento con amplitud estable y la frecuencia del forzamiento externo.
Ya habamos visto que la presencia de decaimiento cuando se consideraba friccion con el medio, se deba a la
perdida de energa por friccion. En consecuencia, para que exista un movimiento estacionario se debe dar un
efecto de cancelacion entre la energa disipada por los osciladores debida a la friccion y la energa entregada
al sistema por el forzamiento externo.
Aunque la presente discusion se realizo en el marco de sistemas mecanicos, hay en realidad diversos sistemas
fsicos que estan descritos por ecuaciones de la forma (15.110). Quizas el ejemplo mas conocido es el de
los circuitos electricos en donde las Ecs. (15.110) representan la dinamica de un conjunto de n circuitos
acoplados donde los coeficientes Vij representan coeficientes recprocos de capacitancia, las ij son resistencias,
y las Tij son inductancias. Adicionalmente, el termino de forzamiento representara generadores senoidales de
determinada frecuencia aplicada a uno o mas de los circuitos (ver ejercicio 4 Pag. 450).
Hay una serie de consideraciones generales que solo mencionaremos por efecto de espacio. Por ejemplo,
cuando el forzamiento sobre un sistema oscilante lineal tiene una dependencia temporal de forma arbitraria, la
tecnica de la transformada de Laplace resulta muy util para estudiar la respuesta de estos sistemas. Cuando
tomamos la expansion del potencial mas alla del termino cuadratico en (15.5) aparecen oscilaciones no linea-
les (oscilaciones anarmonicas), que discutiremos brevemente en la seccion 15.8. Otro aspecto relevante es la
generalizacion a oscilaciones de sistemas contnuos, este tema solo lo trataremos brevemente en la seccion 18.2.
I = Ng (15.117)
d2
mR2 + mgR sin = 0 (15.118)
dt2
Para desplazamientos pequenos se hace la aproximacion sin = lo cual linealiza las ecuaciones haciendo que
el torque sea proporcional al desplazamiento, y el movimiento sera armonico simple con frecuencia caracterstica
0 r
g
0 =
R
Si aplicamos un torque externo adicional N a un pendulo estacionario, este oscilara hasta un cierto angulo .
El valor de este angulo puede ser acotado gracias a la accion del torque gravitacional restaurador y el pendulo
15.8. EJEMPLOS DE OSCILACIONES ANARMONICAS (OPCIONAL) 445
asume una posicion de equilibrio cuando el torque externo se cancela con el torque gravitacional, esto se da a
un angulo dado por
d
N + Ng = 0 N = mgR sin =0 (15.119)
dt
de modo que es un angulo de retorno ( = 0). Por supuesto que entre mayor sea N , mayor es el angulo .
Por ejemplo, para N = 0 se tiene que = 0; para N = 12 mgR se tiene = /6 y para N = mgR se tiene que
= /2, este ultimo caso define un valor crtico Nc para el torque
Nc = mgR ; = (15.120)
2
si N excede este valor crtico, el torque aplicado sera siempre mayor al torque restaurador N > mgR sin . En
consecuencia, el pendulo girara en forma indefinida hasta que dejemos de aplicar dicho torque (o deje de ser
valida la condicion N > Nc ) aunque naturalmente el movimiento puede continuar despues de que ha cesado
el torque.
Si ahora el pendulo esta amortiguado debido por ejemplo a algun medio viscoso en el cual esta inmerso, es
usual considerar que la fuerza viscosa es proporcional a la velocidad lineal, en nuestro caso sera mas conveniente
(y equivalente26 ) asumir que es proporcional a la velocidad angular
d d
F = = ; N = R =
dt dt
anadimos entonces a las ecuaciones de movimiento (15.117), el torque externo N y el asociado a la fuerza
viscosa con lo cual queda
Ng + N + N = I
d2 d
mR2 2 + mgR sin + = N (15.121)
dt dt
ahora definimos una frecuencia crtica c a la cual el torque se iguala al torque crtico mgR
mgR Nc
c = = (15.122)
con lo cual la Ec. (15.121) se puede escribir en una forma normalizada
N R d2 d
= + sin +
mgR g dt2 mgR dt
N 1 d2 1 d
= 2 2
+ + sin (15.123)
Nc 0 dt c dt
N = Nc sin (15.124)
en el cual se anulan todas las derivadas temporales despues de que se han extinguido todas las oscilaciones
transitorias iniciales. Esto se ilustra en la Fig. 15.4, que nos muestra un pendulo estacionario en el angulo .
26
Tal equivalencia es valida solo si se desprecia la fuerza viscosa ejercida a lo largo de la varilla, de modo que todo el torque se
concentra a una distancia fija R, i.e. sobre la lenteja.
446 CAPITULO 15. OSCILACIONES
Figura 15.4: Solucion para el pendulo amortiguado forzado con torque pequeno i.e. N Nc = mgR. (a)
Es obvio que si el pendulo esta inicialmente en reposo entonces = 0 para todo tiempo cuando N = 0.
(b) Para 0 < N < Nc tendremos un angulo constante en la fase estacionaria tal que 0 < < /2, donde
esta determinado por la Ec. (15.119). (c) Cuando N = Nc = mgR la Ec. (15.119) nos dice que = /2 en
todo tiempo cuando se ha extinguido la fase transitoria.
Figura 15.5: Comportamiento de y hi en funcion del tiempo para N > Nc y amortiguamiento pequeno.
El valor promedio hi se representa por la lnea punteada en tanto que la lnea contnua representa el valor
instantaneo (t). La lnea punteada presenta un valor asintotico hiL en presencia de amortiguamiento.
Cuando el amortiguamiento se anula, la lnea punteada se convierte en lnea recta y no hay valor asintotico
para hi .
2) Para movimiento no amortiguado ( = 0) con torque aplicado constante N , la Ec. (15.121) toma la
forma
d2
NT = N mgR sin = mR2 2 (15.125)
dt
que nos muestra que el torque neto NT depende del angulo. Es facil ver el valor de este torque para ciertos
angulos particulares
NT = N ; =0
NT = N Nc ; = /2
NT = N ; =
NT = N + Nc ; = 3/2 (15.126)
si el torque aplicado excede al valor del torque crtico Nc el movimiento sera de rotacion contnuamente
acelerada, de modo que el pendulo incrementa su energa cinetica con el tiempo. La velocidad angular tambien
se incrementara con el tiempo, pero con fluctuaciones que varan cclicamente. Sin embargo, el promedio sobre
15.8. EJEMPLOS DE OSCILACIONES ANARMONICAS (OPCIONAL) 447
estas oscilaciones nos da una velocidad angular hi = hd/dti que se comporta linealmente con el tiempo.
Cuando se introduce un pequeno amortiguamiento, el valor promedio hi sera una curva suave monotonamente
creciente en el tiempo como se ve en la Fig. 15.5. El valor instantaneo de (t) fluctuara cclicamente alrededor
de hi como lo muestra la figura 15.5.
Figura 15.6: Grafica de N vs hi con base en las Ecs. (15.127, 15.129) con c << 0 . La lnea punteada
representa el valor asintotico para N >> Nc dado por la Ec. (15.130).
Figura 15.7: Grafica de hi vs t, para los puntos A y B de la Figura 15.6. (a) El punto A de la Fig. 15.6
corresponde a N = 1,2Nc y es la curva en la parte inferior de la grafica. (b) El punto B de la Fig. 15.6
corresponde a N = 2Nc y es la curva en la parte superior de la grafica.
3) Cuando hay atenuacion con c << 0 y N > Nc , la velocidad angular continua aumentando hasta
que el termino de atenuacion d/dt alcanza el valor del torque aplicado. En tal caso, la velocidad angular
promedio hi alcanza un valor
asintotico
hiL como muestra la Fig. 15.5, y la aceleracion fluctua de tal forma
que su valor promedio es nulo d2 /dt2 = 0. En este regimen asintotico, el pendulo experimenta un movimiento
cuasi-estatico rotando con una velocidad angular que fluctua alrededor de hiL pero que permanece cerca
al valor promedio hiL .
448 CAPITULO 15. OSCILACIONES
Es facil obtener informacion cuantitativa de este regimen asintotico cuasi-estatico, ya que solo hay que
despreciar el termino de aceleracion en (15.123)
N 1 d
= + sin (15.127)
Nc c dt
que tiene solucion analtica de acuerdo con los siguientes casos (a) Si N Nc , una solucion estacionaria es la
dada por la Ec. (15.124) de modo que
d
= hi = 0 para N Nc (15.128)
dt
(c) Para mirar el comportamiento asintotico de N versus hi, examinamos el lmite N >> Nc , para el cual
(N/Nc )2 1 (N/Nc )2 de modo que la ecuacion (15.129) queda
como antes, el valor instantaneo (t) fluctua cclicamente alrededor de su valor promedio hi (t). La figura
15.6 muestra el comportamiento de N versus hi, en tanto que la figura 15.7 muestra el comportamiento
temporal de las fluctuaciones en los puntos A y B de la figura 15.6. En A se ha tomado N = 1,2Nc de modo
que a partir de las Ecs. (15.126) se ve que el torque neto vara entre 0,2Nc y 2,2Nc alrededor del ciclo, y la
velocidad angular es grande en la parte baja y lenta en la parte superior, con las variaciones que se muestran
en la parte de abajo de la fig. 15.7. Para el punto B se tomo N = 2Nc de tal modo que segun (15.126), el
torque vara entre Nc y 3Nc , produciendo variaciones mas regulares en la rapidez angular que se muestran en
la parte superior de la fig. 15.7. En el lmite N >> Nc que implica hi >> c , la rapidez angular se aproxima
a una variacion sinusoidal en el tiempo
(t)
= hi + sin t
que es en forma aproximada el perfil que se ve para las fluctuaciones del punto B en la fig. 15.7.
Figura 15.8: Grafica de N vs hi, con amortiguamiento despreciable 0 y c >> 0 . El sistema presenta
histeresis para hi < c .
15.8. EJEMPLOS DE OSCILACIONES ANARMONICAS (OPCIONAL) 449
= 0 para N Nc (15.131)
N
hi = c para N 0 (15.132)
Nc
esto significa que hay dos soluciones diferentes para el mismo intervalo 0 N Nc . Un analisis detallado
muestra que esto implica que el sistema exhibe histeresis. Es decir que la respuesta del sistema es diferente
cuando el torque se incrementa que cuando se disminuye. Cuando el torque se incrementa desde N = 0 hasta
N = Nc el pendulo se estabiliza en el angulo que satisface la relacion N = Nc sin de la Ec. (15.124), por
tanto = 0 durante este incremento, lo cual se muestra con la flecha vertical sobre el eje Y en la Fig. 15.8.
Cuando N alcanza el valor crtico Nc , la velocidad angular promedio cambia abruptamente desde cero hasta
c (transicion de fase), como lo indica la flecha horizontal sobre la lnea punteada de la Fig. 15.8. Finalmente,
incrementando el torque desde Nc se obtiene un crecimiento lineal de hi como lo muestra la figura 15.8.
Ahora bien, si empezamos con un torque N > Nc y comenzamos a disminurlo, se aplica la Ec. (15.132)
y por tanto hi decrece linealmente hasta el origen, como lo muestra la Fig. 15.8, cuando la flecha indica
decrecimiento de N . Tenemos entonces que hay histeresis cuando hi < c .
Figura 15.9: Grafica de N vs hi, con c 0 . Para torques pequenos, el pendulo oscila y hi = 0, en tanto
que para torques grandes N > Nc el movimiento es contnuo y la grafica es lineal. El sistema presenta histeresis
para hi < c .
5) Hemos analizado los casos de c mucho menor y mucho mayor que 0 . El caso, c 0 es el mas
complejo, puesto que no se puede hacer ninguna aproximacion y la ecuacion (15.123) debe resolverse completa.
La Fig. 15.9 muestra el comportamiento de la solucion N versus hi para c = 20 . Una vez mas el fenomeno
de histeresis se hace presente. Al incrementar el torque desde cero hasta Nc , el valor de hi permanece nulo. Al
alcanzar el valor de c se obtiene de nuevo un cambio abrupto de hi desde cero hasta el valor c (transicion
de fase), para continuar con un crecimiento lineal.
La Fig. 15.9, tambien muestra que cuando empezamos con un valor de N > Nc nos regresamos por el mismo
camino de comportamiento lineal hasta llegar a N = Nc , aqu el comportamiento de regreso se desva del
camino de ida, si bien la curva que describe el camino de regreso no es discontnua. Finalmente, se alcanza
un valor de hi = 0 para un nuevo torque crtico Nc < Nc .
450 CAPITULO 15. OSCILACIONES
15.9. Ejercicios
e
1. Demuestre que las matrices (15.30, 15.32) son ortogonales a primer orden y que AVA coincide con la
matriz de valores propios de V en cada caso, a primer orden.
2. Encuentre los modos reales y normales de vibracion de una molecula triatomica, emulando el procedi-
miento de la seccion 15.5.3 pero con las condiciones iniciales mas generales i (0) = Ai y i (0) = Bi .
3. Partiendo de los modos normales (15.74), encuentre las elongaciones de las partculas de la molecula
triatomica lineal Ecs. (15.76) empleando la ecuacion de transformacion (15.52) entre modos normales y
elongaciones, y la matriz de transformacion (15.71).
4. Para los conjuntos de circuitos acoplados de la Fig. 15.10, plantee las Ecs. de movimiento y describa las
soluciones. Discuta los analogos mecanicos.
Figura 15.10: (a) Circuitos acoplados por condensador. (b) Circuitos acoplados por inductancia y condensador.
5. Una barra uniforme de longitud L y masa M esta sostenida por dos resortes iguales de longitud natural b
y constante de restitucion k, como se ilustra en la Fig. 15.11, encuentre los modos normales de pequenas
oscilaciones en el plano.
Figura 15.11: Barra suspendida por resortes identicos que inicialmente hacen un angulo 0 con la vertical. Se
asumen solo modos planos de oscilacion.
6. Dos masas puntuales identicas estan unidas entre s y a puntos fijos mediante tres resortes de longitud
natural b y constantes de restitucion k, como se indica en la Fig. 15.12. Las masas poseen cargas electricas
+q de modo que se repelen. Escriba la ecuacion secular para las frecuencias propias de oscilacion.
Figura 15.12: (a) Dos masas puntuales cada una de carga +q, unidas entre s y a puntos fijos por tres resortes
identicos.
Captulo 16
Relatividad especial
La mecanica newtoniana tiene como premisa que la descripcion de las leyes de la naturaleza se puede realizar
indistintamente en cualquier sistema de referencia inercial. Si a este postulado le agregamos el postulado de
que la velocidad de la luz es la misma en todos los sistemas de referencia inerciales, obtenemos la llamada
teora de la relatividad especial o restringida. En el presente captulo no discutiremos las motivaciones teoricas
o experimentales que pueden inducir a la construccion de estos postulados, ni tampoco desarrollaremos los
detalles que nos conducen a las transformaciones de Lorentz con base en tales postulados. Por tanto, es
recomendable que el lector haya tenido un contacto previo con los aspectos mas basicos de la teora especial
de la relatividad.
En este captulo tenemos dos objetivos basicos (a) Estudiar las propiedades de las transformaciones de
Lorentz con base en el formalismo de las matrices ortogonales y (b) desarrollar una formulacion Lagrangiana
para la teora. Con el fin de alcanzar el primer objetivo, utilizaremos el formalismo de eje temporal imaginario.
A pesar de que dicho formalismo ha cado en desuso, resulta muy directa su relacion con el formalismo
de matrices ortogonales que se ha desarrollado en el texto1 . Adicionalmente, el formalismo de ejes reales y
metrica de Minkowski, solo muestra claras ventajas en el marco de la relatividad general que no trataremos
aqu. Finalmente, la traduccion entre uno u otro formalismo es facil de realizar, y se estudiara en la seccion
16.3.
x1 = x1 ; x2 = x2
vx3
x vt t v
p3
2
x3 = ; t = p c ; (16.1)
1 2 1 2 c
siendo c la velocidad de la luz en el vaco. Estas leyes de transformacion cumplen con los postulados de la
relatividad especial. Por ejemplo, la velocidad de la luz es la misma en ambos sistemas. Supongamos que con
1
Adicionalmente, este formalismo nos clarificara la diferencia entre las matrices unitarias y las matrices ortogonales complejas.
451
452 CAPITULO 16. RELATIVIDAD ESPECIAL
respecto al sistema S se emite una onda esferica desde el origen en t = 0, la ecuacion del frente de onda vista
por S es
xi xi = c2 t2 (16.2)
Usando las transformaciones de Lorentz (16.1) y la Ec. (16.2) vemos que
y definiendo
v 1
; p
c 1 2
se obtiene
( r)
r = r + ( 1) ct (16.4)
2
y para la transformacion de la coordenada temporal
t vx
c 2
3
v r
t = p = t 2
1 2 c
t = t ( r) (16.5)
c
dado que no hay nada especial en la direccion x3 elegida (por la isotropa del espacio) las ecuaciones vectoriales
(16.4, 16.5) son validas para direcciones arbitrarias de v siempre que los ejes de S y S sean paralelos.
recordemos que esta cantidad es invariante debido a la exigencia de que la velocidad de la luz sea invariante2 .
En consecuencia debemos usar matrices ortogonales en cuatro dimensiones3 , por tanto las transformaciones
de Lorentz se describiran con matrices ortogonales en el espacio de Minkowski.
Dado que la cuarta coordenada es imaginaria, los elementos de la matriz de transformacion pueden ser com-
plejos. La representacion matricial se puede obtener de las ecuaciones vectoriales (16.4, 16.5). Representando
por L a la matriz de transformacion de Minkowski se tiene que
x = Lx (16.7)
siendo L un elemento generico. Las letras griegas representaran a las cuatro coordenadas en tanto que las
letras latinas representaran solo coordenadas espaciales. Las ecuaciones vectoriales (16.4, 16.5) en componentes
se escriben como
j k xk
xj = xj + ( 1) + ij x4 (16.8)
2
x4 = ik xk + x4 (16.9)
Con lo cual se pueden determinar los elementos de L para una direccion arbitraria de
j k
xj = jk + 2 ( 1) xk + ij x4 ; x4 = ik xk + x4
(16.10)
2 j3 k3
Ljk = jk + ( 1) = jk + j3 k3 ( 1) ; Lj4 = ij3
2
L4k = ik3 ; L44 = (16.13)
e jk () = Lkj () = kj + k j [ () 1] = jk + (j ) (k ) [ () 1] = Ljk ()
L
2 ()2
ej4 () = L4j () = ij = i (j ) = Lj4 ()
L
e 4k () = Lk4 () = ik = i (k ) = L4k ()
L ; e44 () = L44 () = () = () = L44 ()
L
donde hemos usado el hecho de que () = () lo cual es evidente de su definicion. Tenemos por tanto
que
e () = L ()
L
y como la traspuesta es la inversa llegamos a la propiedad esperada de que L1 (v) = L (v).
Notemos que la submatriz inferior 22 en (16.14) se asemeja a una rotacion en un plano, la cual se escribira
de la forma
cos sin
sin cos
en este caso lo que tenemos es una rotacion en los ejes x3 x4 del espacio de Minkowski, pero en un angulo
imaginario
cos = ; sin = i (16.15)
podemos definir un angulo real en la forma i con lo cual
cosh = ; sinh =
esta parametrizacion facilita muchas operaciones matriciales. Por ejemplo, si hacemos dos transformaciones de
Lorentz sucesivas en donde ambas poseen velocidades relativas a lo largo de x3 , la transformacion matricial
solo es no trivial en el plano x3 x4 y se puede ver que simplemente se suman los angulos y correspondientes
como ocurre en una rotacion en el plano, de modo que L ( ) L () = L ( + ). De las Ecs. (16.15) se tiene
que
tan + tan i + i
tan = i ; i = tan = tan + = i
=
1 tan tan 1 (i) (i )
16.2. TRANSFORMACIONES DE LORENTZ RESTRINGIDAS 455
de modo que estas dos transformaciones de Lorentz sucesivas corresponden a una sola transformacion de
Lorentz equivalente de la forma
+
= (16.17)
1 +
la Ec. (16.17) corresponde a la ley de adicion de velocidades para velocidades paralelas. En esta ecuacion se
ve que la velocidad equivalente no es simplemente la suma de las velocidades de las dos transformaciones en
virtud del factor de correccion en el denominador. Podemos ver ademas que incluso tomando valores de
y cercanos a la unidad, se tiene que < 1. Esto indica que no se puede obtener una velocidad mayor que c
con transformaciones de Lorentz sucesivas. En conclusion, mientras asumamos la validez de los postulados de
la relatividad especial, no hay manera de que un sistema de referencia vaya mas rapido que la luz con respecto
a otro.
x = Lx + a (16.18)
donde a representa una traslacion del origen en el espacio de Minkowski (i.e. de espacio y tiempo) y L es una
matriz ortogonal. A las transformaciones del tipo (16.18) se les conoce como transformaciones de Poincare o
transformaciones de Lorentz inhomogeneas. La condicion de ortogonalidad
e = LL
LL e = 1 ; L L = o L L = (16.19)
representa diez ligaduras sobre los elementos de L (cuatro condiciones diagonales y seis no diagonales) de
modo que solo hay seis cantidades independientes en L. Por otro lado, vemos que las transformaciones de
Lorentz (16.12) involucran tres grados de libertad (las tres componentes de la velocidad) en tanto que las
rotaciones eucldeas involucran otros tres grados de libertad (e.g. los angulos de Euler). Esto parece indicarnos
que las transformaciones de Lorentz del tipo (16.12) junto con las rotaciones espaciales (o combinaciones de
ambas) forman el conjunto mas general de transformaciones ortogonales en el espacio de Minkowski. Por otro
lado, para la transformacion (16.18) existen cuatro grados de libertad adicionales con lo cual la cantidad de
elementos independientes sera diez. En el presente estudio nos restringimos a las transformaciones de Lorentz
homogeneas de modo que requerimos manejar seis elementos independientes de L
x = Lx
(det L)2 = 1
y ya hemos visto que si nos restringimos a las transformaciones contnuas debemos exclur las matrices de
determinante 1. Las matrices L de determinante +1 representan entonces transformaciones de Lorentz
456 CAPITULO 16. RELATIVIDAD ESPECIAL
propias. Sin embargo, no hay garanta de que todas las matrices de determinante +1 correspondan a trans-
formaciones contnuas. Efectivamente, en el caso de la inversion simultanea de todas las coordenadas espacio
temporales, el determinante sigue siendo +1. Necesitamos entonces un criterio para excluir las transformacio-
nes propias no contnuas4 . Examinemos el comportamiento de L44 , usando las Ecs. (16.19) se puede escribir
con = = 4
L4 L4 = 44 L244 + L4j L4j = 1 (16.20)
y como los elementos L4j conectan una coordenada espacial (real) con una temporal (imaginaria), estos ele-
mentos deben ser imaginarios puros. En contraste L44 debe ser real porque conecta al eje imaginario consigo
mismo, estas caractersticas se pueden apreciar en (16.12). En consecuencia L4j L4j debe ser negativo y L244 debe
ser positivo de modo que
3
X
|L44 |2 > |L4j L4j | y L244 1 (16.21)
j=1
La Ec. (16.21) plantea dos posibilidades: L44 1 que implica una inversion del tiempo y L44 1 que implica
una transformacion contnua a partir de la identidad5 . Las transformaciones de Lorentz con L44 1 se denomi-
nan ortocronas en tanto que las de L44 1 se denominan no ortocronas. Solamente las transformaciones
ortogonales propias ortocronas pueden evolucionar en forma contnua a partir de la identidad. De las cuatro
subclases solo las transformaciones propias ortocronas forman un grupo, las otras tres subclases no.
A las transformaciones de Lorentz propias ortocronas se les conoce como transformaciones de Lorentz restrin-
gidas, solo ellas pueden generar rotaciones contnuas en el espacio y reducirse a las transformaciones de Galileo
en el lmite de bajas velocidades. En consecuencia, solo trabajaremos transformaciones de Lorentz restringidas
denominandolas simplemente transformaciones de Lorentz.
siendo 2 , 3 las componentes de . Las Ecs. (16.14, 16.30) nos dan la matriz producto, que con la misma
aproximacion nos da
1 0 0 0 1 0 0 0
0 1 0 i2 0
L = L L () = 0 1 0
0 0 1 i3 0 0
i
0 i2 i3 1 0 0 i
1 0 0 0 1 0 0 0
0 1 2 i2 0 1 2 i2
L = 0
=
0 + 3 i + i3 0 0 (1 + 3 ) i ( + 3 )
0 i2 i i3 + 3 0 i2 i ( + 3 ) (1 + 3 )
1 0 0 0
0 1 2 i2
L = L L ()
= 0
(16.31)
0 i
0 i2 i
donde se ha despreciado 3 frente a por considerar a pequena y se ha usado 3 << 1. Se puede ver
que (16.31) no representa una transformacion de Lorentz pura ya que por ejemplo los elementos Lij de las
coordenadas espaciales no son simetricos como lo demandan las Ecs. (16.12) para transformaciones de Lorentz
puras o boosts. Usando la Ec. (16.25), podemos ver que las componentes de la velocidad relativa entre O1 y
O3 se escriben en la forma
iL42 2
2 =
= ; 3 = ; 1 = 0 (16.32)
L44
2 2 2 2 22
= 1 + 2 + 3 =0+ + 2
2
2
2
con esto, podemos aproximar la transformacion de Lorentz pura L P , asociada a la velocidad
relativa reemplazando estas aproximaciones en (16.12)
j k j k
Pjk = jk + 1
= jk + ( 1) ; Pj4 = ij
= ij
2 2
P4k = ik
= ik ; P44 = = ; (16.33)
combinando las Ecs. (16.32, 16.33) y despreciando los terminos de orden 22 , podemos construr P
1 0 0 0
2
0 1 ( 1) i2
P 2 (16.34)
0 ( 1) i
0 i2 i
Para obtener P que es el que nos interesa, podemos utilizar el hecho de que = y
observar de las Ecs. (16.33) que al invertir se obtiene
( )
j k
Pjk = jk + 2 1 = Pjk ; Pj4 = i j = Pj4
( )
P4k = i k = P4k
; P44 = = P44 (16.35)
16.2. TRANSFORMACIONES DE LORENTZ RESTRINGIDAS 459
1 0 0 0
2
0 1 (2 )2 ( 1) i2 2 2 + 2 1
=
0 2 ( 1) 2
2 1 2 0
i(2 ) 2
2
2 2
0 i2 [ 1 ( 1)] ( 1) 1 (2 )
1 0 0 0
2
0 1 (2 )2 ( 1) i2 2 1 2 1
=
0 2 1 2 1
1 0
i( ) 2
0 0 2 ( 1) 1 (2 )2
1 0 0 0
0 2
1 (2 )2 ( 1) 0
h i
=
0 2 1
1 1 0
i( )2
0 0 2 ( 1) 1 (2 )2
Suprimiendo los terminos de orden superior en 2 se obtiene9
1 0 0 0
0 2
1 ( 1) 0
R = L P = (16.37)
0 2 ( 1) 1 0
0 0 0 1
esta ecuacion se puede reescribir en la forma
0 0 0 0
2
0 0 ( 1) 0
R =1+ ; = (16.38)
0 2 ( 1) 0 0
0 0 0 0
9
De hecho, para obtener consistentemente los terminos cuadraticos en 2 para R ( ), es necesario tener en cuenta los terminos
de orden 22 en la Ec. (16.34).
460 CAPITULO 16. RELATIVIDAD ESPECIAL
donde los ndices 1230 representan las tres coordenadas espaciales y la coordenada temporal. El modulo al
cuadrado de un vector en tal espacio viene dado por
eGx = xi xi x20 = xi xi c2 t2
x (16.43)
que nos representa al invariante que queremos. Una transformacion de Lorentz homogenea es una transforma-
cion lineal en este espacio real que mantiene invariante este modulo de los vectores. Es evidente que la matriz
asociada a estas transformaciones debe ser real en este espacio, de modo que la denotaremos por . La con-
dicion de invarianza del modulo de los vectores ante una transformacion de Lorentz se escribe matricialmente
en la forma
xe Gx = x ] (x) = x
eGx (x)G eGx x e
eGx =x eGx
y como esto es valido para un vector arbitrario en este espacio, la condicion para las transformaciones de
Lorentz resulta
e
G =G (16.44)
La Ec. (16.44) es una transformacion de congruencia que deja invariante al tensor metrico. Haciendo la analoga
con las matrices ortogonales del espacio eucldeo (donde el tensor metrico cartesiano es 1), podemos decir que
(16.44) es la condicion de ortogonalidad de en el espacio real de Riemann con tensor metrico G11 .
La relacion entre las formulas expresadas en el espacio de Minkowski y las expresadas en el espacio real de
Riemann se logra con las siguientes asociaciones simples
en tanto que los demas elementos no varan, lo cual es de esperarse ya que ambos contienen al subespacio R3
dotado de la misma estructura. A manera de ejemplo, la transformacion de Lorentz pura con velocidad relativa
a lo largo de x3 correspondiente a la Ec. (16.14), tiene la siguiente representacion matricial real en este espacio
de Riemann
1 0 0 0
0 1 0 0
= 0 0
0 0
el producto escalar se escribe usando el tensor metrico
eGy = y
(x, y) x eGx = (y, x)
eGy = x g y
x
11
Es claro que esta condicion se reduce a la ortogonalidad usual cuando G = 1. Adicionalmente, la Ec. (16.44) es una transfor-
macion de similaridad puesto que es real.
462 CAPITULO 16. RELATIVIDAD ESPECIAL
donde la igualdad entre (x, y) y (y, x) viene dada por el caracter real de este producto interno. La condicion
de ortogonalidad de la Ec. (16.44) garantiza la invarianza del producto escalar ante una transformacion de
Lorentz .
Es usual escribir estas formulas de manera mas compacta mediante un conveniente cambio de notacion.
Supongamos que formamos un vector en el espacio de Riemann con los elementos de coordenadas dx y
estudiemos su comportamiento ante una trasnformacion general de coordenadas del tipo
y = f (x1 , x2 , ...)
f y
dy = dx = dx (16.45)
x x
las derivadas son los elementos de la matriz jacobiana de la transformacion entre (x) e (y). Cuando la trans-
formacion A es lineal, seran simplemente los elementos matriciales A . Por otro lado, las componentes de un
vector gradiente se transforman de acuerdo con la ecuacion
x
= (16.46)
y y x
notese que en (16.46) los coeficientes corresponden a los elementos de la matriz jacobiana de la transformacion
inversa de (y) hacia (x). Los vectores que se transforman de acuerdo con la regla dada por la Ec. (16.45) se
denominan vectores contravariantes y se denotan con suprandices
y
D = D
x
en contraste, los vectores que transforman de la manera prescrita por la Ec. (16.46) se denominan covariantes
y se denotan con subndices
x
F = F
y
El producto de las matrices jacobianas correspondientes a una transformacion y a su inversa debe ser la matriz
unidad ya que corresponde a pasar de (x) a (y) y volver de nuevo a (x). De aqu se desprende que la contraccion
entre un vector contravariante y un vector covariante queda invariante ante la transformacion,
y x
D F = D F = D F = D F
x y
veremos mas adelante que la contraccion de un vector covariante con otro contravariante equivale al producto
interno entre dos vectores contravariantes. En el caso de espacios cartesianos, no hay diferencia entre vectores
covariantes y contravariantes ante transformaciones lineales ortogonales. Para verlo, observemos que si la
matriz ortogonal A describe la transformacion, un vector contravariante en el espacio cartesiano transforma
como
D = A D
en tanto que un vector covariante transforma en la siguiente forma
F = A1 F = A e F = A F
de modo que no es necesario distinguir hasta ahora entre los dos tipos de comportamiento ante la transforma-
cion. Un argumento similar vale para el espacio de Minkowski con eje temporal imaginario y con la metrica
usual, de modo que en dicho espacio no hay diferencia entre vectores covariantes y contravariantes.
De la misma manera en que definimos tensores cartesianos segun la prescripcion (12.172) Pag. 329, heredada
de la transformacion de los vectores cartesianos, podemos definir las propiedades de transformacion de tensores
16.3. TRANSF. DE LORENTZ EN ESPACIOS DE RIEMANN 463
de cualquier rango en espacios no eucldeos. Por tanto, un tensor de Lorentz covariante R de segundo rango
se transforma con la prescripcion
x x
R = R
y y
y se puede demostrar que la contraccion de un tensor de segundo rango covariante con un tensor de segundo
rango contravariante (o con dos vectores contravariantes) es invariante ante la transformacion. Similarmente,
la contraccion de un tensor de segundo rango covariante con un vector contravariante transforma como un
vector covariante
R H = s1 R R M = s2 ; R D = F
donde s1 y s2 son invariantes ante la transformacion (escalares) y F es un vector covariante. Veamos la
demostracion de que F de la tercera ecuacion es un vector de Lorentz covariante
x x y x x
F = R
D = R D = R D = R D
y y x y y
x
F = F
y
En un espacio de Riemann el tensor metrico se construye a traves de un elemento diferencial de longitud
de arco
(ds)2 = g dx dx
que se construye de tal manera que sea invariante ante las transformaciones de interes. De esto se desprende
que el tensor metrico es covariante de segundo rango. Notese que en el caso particular de las transformaciones
de Lorentz, esto se puede ver directamente de la condicion de ortogonalidad (16.44) si la escribimos en la forma
G= e 1 G1 considerada como transformacion de congruencia en G.
Vemos entonces que en el espacio de Riemann real de cuatro dimensiones, el producto escalar de dos
vectores contravariantes A , B se puede escribir en la forma
g A B = (g A ) B = A B (16.47)
donde hemos tenido en cuenta el caracter covariante del tensor metrico para obtener el vector covariante A . En
este punto se puede ver con claridad que si la metrica fuera la usual i.e. , los vectores covariantes y contra-
variantes seran identicos. En particular, el cuadrado del modulo del vector cuadriposicion en el cuadriespacio
real se puede escribir en la forma
g x x = x x
de esta forma los productos internos se pueden construir sin alucion directa al tensor metrico, teniendo en
cuenta que un factor del producto escalar se sustituye por el vector covariante que se obtiene al contraer
con el tensor metrico como se ve en (16.47). Si nos interesa el producto escalar de dos vectores covariantes,
debemos subir el ndice por contraccion con el inverso del tensor metrico, el cual se puede demostrar que es
contravariante. En el caso del cuadriespacio real donde el tensor metrico es diagonal con elementos 1, el tensor
metrico coincide con su inverso y no hay diferencias entre tensores metricos covariantes y contravariantes.
Es claro que esta no es la unica forma de construr el tensor metrico, el cual fue disenado para generar el
invariante (16.43) por medio del modulo al cuadrado del vector posicion en tal espacio, podemos en cambio
construr el invariante en la forma
eG x x G x = xi xi + c2 t2
x
es claro que bajo la metrica (16.48) se mantiene invariante la velocidad de la luz y las matrices que describen
a las transformaciones de Lorentz no se modifican. Todo el formalismo permanece inalterado excepto que el
producto interno cambia de signo12 . El tensor G tiene la signatura (+ + +) en tanto que el tensor G tiene
la signatura ( +). Tambien podemos identificarlos por sus trazas T rG = 2, T rG = 2.
El uso del formalismo de Minkowski o de Riemann presenta cada uno sus ventajas y desventajas. En teora
general de la relatividad sera necesario usar la metrica de un espacio curvo para lo cual es muy adecuado el uso
de espacios de Riemann, por otro lado en mecanica cuantica donde la funciones de onda o vectores de estado
son complejos, el uso de una coordenada compleja complica la operacion de conjugacion compleja. Por otro
lado, cuando nos restringimos al marco de la relatividad especial, las operaciones en el espacio de Minkowski
suelen tener analogas muy cercanas al espacio eucldeo y no es necesaria la distincion entre vectores covariantes
y contravariantes, debido a la trivialidad del tensor metrico. En todo caso la mayora de formulas presentan el
mismo aspecto en ambos casos o su transicion de uno a otro esquema es muy sencilla. Un aspecto comun en
ambos formalismos es la idea de que el elemento de longitud de arco tiene un caracter indefinido, pues (ds)2
puede ser positivo, negativo o cero.
a=b
y dado que los dos miembros de la igualdad por ser escalares euclidianos son invariantes ante rotaciones
espaciales de los ejes, es evidente que la relacion sera valida para todos los sistemas de coordenadas con origen
comun. Una relacion vectorial sera de la forma
F=G
que se puede escribir en terminos de tres relaciones numericas entre las componentes13
Fi = Gi (16.49)
Claramente, estas componentes no son invariantes ante rotaciones espaciales. En general, se transforman a
nuevas componentes Fi , Gi que son las componentes de los vectores transformados (pasivamente) F , G . Pero
como los dos miembros de las ecuaciones se transforman de igual manera, entre las componentes transformadas
se debe cumplir la misma relacion
Fi = Gi
12
En ambos casos el tensor G describe una pseudometrica ya que la norma de un vector en este espacio no esta necesariamente
definida positiva.
13
Notese que las Ecs. (16.49) son relaciones numericas pero no son relaciones escalares.
16.4. EL CONCEPTO DE FORMULACION COVARIANTE EN FISICA 465
y por tanto la relacion vectorial tambien se preserva con la rotacion espacial; en el nuevo sistema coordenado
escribimos
F = G
Es importante enfatizar que la invarianza en la forma se debe a que ambos miembros de la ecuacion son
vectores cartesianos. Decimos que los terminos de la ecuacion son covariantes. Es necesario aclarar que el
concepto de covarianza empleado aqu tiene un significado muy distinto al de la covarianza de vectores en el
espacio de Riemann. La covarianza en espacios de Riemann se refiere a la propiedad segun la cual algunos
vectores transforman bajo un cambio de coordenadas segun la matriz jacobiana de la transformacion, en este
escenario el termino se usa por contraposicion a los vectores (o tensores) contravariantes que transforman con
el inverso de la matriz jacobiana bajo el cambio de coordenadas. En el caso que nos ocupa ahora, la covarianza
se define para los terminos de una ecuacion que expresa alguna ley de la Fsica, para indicar que todos los
terminos involucrados en la ecuacion (escalares, vectores, tensores) transforman en la misma manera de modo
que se mantiene la forma de la ecuacion.
La covarianza por supuesto se puede generalizar para ecuaciones que involucran tensores de rango arbitrario,
si tenemos una ecuacion tensorial de la forma C = D los tensores transformados implicaran la misma igualdad
C = D siempre que los tensores de ambos miembros sean del mismo rango. Por ejemplo, si
una ecuacion posee terminos que son escalares, otros que son vectores etc, no se podra mantener invariante
ante una transformacion ortogonal tridimensional. Podemos concluir que la invarianza de una ley Fsica ante
una rotacion del sistema de coordenadas espaciales, exige la covarianza de los terminos de la ecuacion ante
transformaciones ortogonales tridimensionales.
Vamos ahora al espacio extendido de Minkowski o espacio de universo. El manejo all es identico una
vez que hemos caracterizado a las transformaciones ortogonales en este espacio y por ende la estructura
de sus tensores de cualquier rango. A los tensores en este espacio los llamamos tensores de Minkowski, de
Lorentz o de universo, genericamente escalares de universo, vectores de universo (cuadrivectores), etc. En
consecuencia, la invarianza de una ley Fsica ante transformaciones de Lorentz sera inmediata si se expresa
en forma cuadridimensional covariante, de modo que todos los terminos son tensores de universo del mismo
rango. De lo anterior se deriva que una teora Fsica en el marco de la relatividad especial solo tiene validez si
es covariante ante transformaciones de Lorentz (boosts y rotaciones espaciales).
Notemos por ejemplo que el producto de un numero por un cuadrivector solo sera otro cuadrivector si
el numero es un escalar de universo. Supongamos que es un numero que no es escalar de universo, en un
sistema S el producto de este numero por un cuadrivector es
F = W
ante una transformacion de Lorentz, F y W transforman como cuadrivectores con una cierta matriz M de
transformacion, por otro lado transforma en la forma = N siendo N un operador diferente a la identidad
(ya que no es escalar de universo). Tenemos entonces
F + T + H = R
y supongamos que F , T , H no son tensores de universo pero que R s lo es. En general esta ecuacion
no sera covariante, pero puede ocurrir que la suma de los tres terminos no tensoriales s transforme como
un tensor gracias a ciertos efectos de cancelacion, ciertamente si estos terminos no son tensores sera mucho
mas complejo demostrar la covarianza de la ecuacion (si es que es covariante). Esta anotacion es util, porque
a menudo ocurre que se construye una teora en forma manifiestamente covariante, pero luego para efectos
practicos de calculo se transforma a una estructura en donde la covarianza no es evidente.
466 CAPITULO 16. RELATIVIDAD ESPECIAL
componente (temporal). Por otro lado, un cuadrivector del genero temporal tiene su cuarta componente no
nula, pero se puede transformar de tal forma que se anulen todas sus tres componentes espaciales. A manera
de ilustracion veamos el comportamiento del vector diferencia o relativo entre dos puntos de universo. Este
vector relativo puede ser del genero espacial, temporal o de luz, definiremos a este vector relativo como
X x1 x2 (16.52)
donde los subndices 1 y 2 denotan los dos sucesos. El modulo de este cuadrivector relativo sera14
X X = |r1 r2 |2 c2 (t1 t2 )2
de modo que X sera del genero espacial si los dos puntos de universo estan separados de modo que
|r1 r2 |2 = c2 (t1 t2 )2
la condicion para que el vector diferencia sea temporal equivale a decir que se puede cubrir la distancia entre
los dos eventos o sucesos mediante una senal luminosa (e incluso algunas senales mas lentas que la luminosa),
en cuyo caso se habla de sucesos o eventos causalmente conectados. La condicion de cuadrivector del genero
espacial equivale a que estos eventos no podran conectarse con ninguna onda luminosa o senal que viaje a
velocidad menor o igual que c, decimos que los eventos estan causalmente desconectados. Finalmente, si el
cuadrivector diferencia es como de Luz, solo una senal que viaje a velocidad c podra conectar a estos sucesos (y
no se pueden conectar con senales que viajen a velocidades menores), claramente estos son eventos causalmente
conectados.
Podemos elegir el eje x3 de modo que quede alineado con los ejes espaciales r1 r2 del cuadrivector relativo.
Adicionalmente, podemos asumir sin perdida de generalidad que x3(1) x3(2) > 0. En tal caso15 se tiene que
|r1 r2 | = x3(1) x3(2) . Si realizamos una transformacion de Lorentz pura con velocidad v a lo largo de x3
podemos aplicar las transformaciones dadas en (16.1) para la cuarta componente de X
vx vx
t1 c3(1)
2 t2 c3(2)
2
t1 = p ; t2 = p
1 2 1 2
vx vx vx vx
t1 c3(1)
2 t2 c3(2)
2 t1 t2 3(1)c2 3(2)
t1 t2 = p p = p
1 2 1 2 1 2
c (t1 t2 ) vc x3(1) x3(2)
c t1 t2 = p (16.53)
1 2
si X es del genero espacial y los sucesos son tales que t1 > t2 nos queda que
y sera posible encontrar una velocidad v < c de modo que se anule la cuarta componente ic (t1 t2 ) X4 .
Fsicamente la anulacion de la componente temporal significa que es posible encontrar un sistema inercial
14
Recordemos que en el espacio de Minkowski con metrica trivial, los vectores covariantes coinciden con los contravariantes de
modo que usaremos solo subndices en las contracciones.
15
En el espacio cartesiano, el vector relativo suele definirse de manera causal, i.e. r r (t1 ) r (t2 ) con t1 > t2 . En contraste,
la relacion (16.52) no se define causalmente, sino de modo que se cumpla la condicion x3(1) x3(2) > 0.
468 CAPITULO 16. RELATIVIDAD ESPECIAL
que viaje a velocidad v < c en el cual los dos sucesos sean simultaneos. Adicionalmente, tambien es posible
encontrar valores de v < c que hagan que el miembro de la derecha en (16.53) se vuelva negativo lo cual
indicara que t2 > t1 , de modo que encontramos un sistema de referencia inercial en el cual se invierte la
secuencia de los sucesos. El que pueda invertirse la secuencia de sucesos entre eventos del genero espacial
no constituye una violacion de la causalidad ya que estos eventos estan causalmente desconectados y no hay
manera de que un suceso pueda influr en el otro. Por ejemplo, nada de lo que ocurra ahora en la tierra puede
afectar a la estrella alfa centauri dentro de los siguientes cuatro anos en virtud de su distancia a la tierra de
unos cuatro anos luz.
En contraste, para separaciones del genero temporal entre sucesos, no es posible encontrar una transfor-
macion de Lorentz que los haga simultaneos y menos aun que pueda invertir el orden temporal de los sucesos.
As debe ser, puesto que estos eventos s estan causalmente conectados y pueden influr el uno sobre el otro.
Esto implica que el antes y el despues, o la causa y el efecto, son conceptos invariantes de Lorentz y se preserva
la causalidad.
v2 c2 v 2 c2
u u = = = c2 (16.56)
1 2 1 2 1 (v 2 /c2 )
y es ademas del genero temporal. Por supuesto, la cuadrivelocidad no tiene un significado Fsico directo ya que
para medir dx y d se estan usando en general sistemas de referencia diferentes. Sin embargo, la Ec. (16.55)
nos muestra que la cuadrivelocidad contiene toda la informacion sobre la velocidad Fsica y tiene la ventaja
de que si escribimos las expresiones en terminos de la cuadrivelocidad, sera mas facil chequear la covarianza
de las ecuaciones gracias a la naturaleza cuadrivectorial de u .
Otro cuadrivector de enorme importancia es el cuadrivector j formado con la corriente electrica j unida con
la cantidad ic siendo la densidad de corriente electrica. Para obtener esta forma cuadrivectorial comenzamos
con la ecuacion de continuidad
j+ =0 (16.57)
t
que me expresa la conservacion de la carga16 . Si asumimos que la conservacion de la carga es valida en todos los
sistemas de referencia inerciales, entonces esta ecuacion debe conservar su forma ante una transformacion de
16
La ecuacion de continuidad (16.57) puede extenderse para cualquier carga generalizada que se conserve. Por ejemplo, la
energa o la masa pueden ser tambien cargas generalizadas, de modo que el desarrollo presente se puede extender a estas cantidades.
Para mas detalles ver seccion 18.1, Pag. 523.
16.5. FORMULACIONES COVARIANTES EN EL ESPACIO DE MINKOWSKI 469
Lorentz. Dado que j esta asociado en la ecuacion de continuidad a derivadas en el espacio es razonable pensar
que haga parte de las componentes espaciales de un cuadrivector, similarmente dado que esta asociado a una
derivada temporal resulta razonable pensar que hace parte de la componente temporal del cuadrivector. Para
escribir esta ecuacion en forma manifiestamene covariante escribamosla en componentes
jk jk (ic) j
+ = 0 + =0 =0
xk t xk (ict) x
j = 0 ; j (j1 , j2 , j3 , ic) (16.58)
en primer lugar, es facil ver que el operador cuadrigradiente se transforma en el espacio de Minkowski como
un cuadrivector17
x
=
= L = L1
= L
x x x x x x
donde hemos usado la ortogonalidad de L. Dado que es un cuadrivector, se tiene que j tambien debe serlo
si la ecuacion de continuidad ha de ser covariante, es decir si la carga se ha de conservar en todos los sistemas
inerciales. Para ver el caracter cuadrivectorial de j basta con demostrar que j = 0 u siendo 0 la densidad
de carga en el sistema en el cual las cargas estan en reposo18 , es decir es la densidad de carga propia. Se deja
esta demostracion como ejercicio al lector.
Vemos pues que la cantidad j es invariante ante una transformacion de Lorentz (escalar de universo)
ya que es la contraccion de dos cuadrivectores. Este ejemplo nos muestra una forma de escribir una ley Fsica
en una forma manifiestamente covariante.
Veamos otro ejemplo de cuadrivector muy importante en la Fsica. Es bien conocido de la teora clasica
electromagnetica que los potenciales escalar y vectorial obedecen ecuaciones de onda desacopladas
1 2A 4 1 2
2 A = j ; 2 = 4 (16.59)
c2 t2 c c2 t2
siempre y cuando se imponga la condicion de Lorentz.
1
A+ =0 (16.60)
c t
Notese que la condicion de Lorentz es semejante en estructura a la ecuacion de continuidad, por ello usando
un argumento similar al usado para la ecuacion de continuidad es natural pensar que A esta asociado a
las componentes espaciales de un cuadrivector y a la componente temporal. Esta asociacion parece estar
reforzada por las Ecs. (16.59) donde A tiene como fuente a j (que a su vez forma parte de la componente
espacial del cuadrivector j ) en tanto que tiene como fuente a (donde este ultimo es parte de la componente
temporal de j ). Comencemos por la condicion gauge Ec. (16.60) que se puede reescribir como
(i)
i Ai + = 0 , = , ; A (A, i) (16.61)
(ict) x4 ict
A = 0 (16.62)
2A 4 1 2 i 4
2 A + 2 = c j ; 2 i = ic (16.63)
(ict) c2 t2 c
17
Recordemos que en la formulacion de espacios de Riemann, este operador se transforma covariantemente y la ecuacion (16.58)
es el producto escalar de un vector covariante con un contravariante, esto se denota como j = 0. En general los invariantes en
el espacio de Riemann son combinaciones de tensores covariantes con tensores contravariantes, de modo que deben escribirse con
ndice arriba contrado con ndice abajo e.g. j k , k p .
18
Debe tenerse en cuenta que la densidad de corriente y de carga son cantidades locales, es decir estan definidos en cada punto
del espacio-tiempo. Por lo tanto, esta bien definido el sistema de referencia en el cual la carga en un punto (r, t) esta en reposo
instantaneo. Es decir que en este sistema de referencia no hay densidad de corriente en dicho punto.
470 CAPITULO 16. RELATIVIDAD ESPECIAL
1 2
2 = 2 + = i i + 4 4
c2 t2 (ict)2
2
= (16.64)
x x
Primero buscaremos una generalizacion cuadrivectorial del miembro izquierdo en (16.66), es claro que la
cuadrivelocidad definida en (16.55) posee una parte espacial que se reduce a v cuando 0. Tomaremos a m
como un invariante que lo llamaremos la masa en reposo o masa propia de la partcula. En cuanto al tiempo
t, este no es un invariante relativista pero sabemos que el tiempo propio s es un invariante que ademas se
reduce a t cuando 0. Los argumentos anteriores sugieren que la generalizacion de la ley de Newton (16.66)
para una partcula tenga la forma
d
(mu ) = K (16.67)
d
donde K debe ser un cuadrivector llamado fuerza de Minkowski.
16.6. FUERZA Y MOMENTO EN RELATIVIDAD ESPECIAL 471
Notese que en general las componentes espaciales de K no tienen que coincidir con las componentes de la
fuerza, salvo por supuesto en el lmite no relativista con 0. Podemos pensar por ejemplo que Ki se puede
construr como el producto de Fi con cierta funcion h () que se reduzca a la unidad en el lmite no relativista.
Para conocer la forma de h () debemos conocer el comportamiento de la fuerza ante una transformacion de
Lorentz. Utilizaremos dos procedimientos.
En el primer procedimiento, tendremos en cuenta que las fuerzas fundamentales son solo cuatro: las in-
teracciones gravitacional, electromagnetica, nuclear debil y nuclear fuerte. La idea sera expresar las leyes que
gobiernan a estas interacciones de manera covariante. No obstante, no se conoce teoras covariantes para las
fuerzas nucleares, entre otras cosas porque tales interacciones no se pueden modelar clasicamente en forma
satisfactoria (en la teora cuantica la fuerza pierde su significado y es reemplazada por la energa potencial). Sin
embargo, en el caso electromagnetico clasico es de esperarse que podamos construr una expresion de la fuerza
que nos proporcione una ecuacion covariante, despues de todo la teora especial de la relatividad fue cons-
truda justamente para que las ecuaciones de Maxwell fueran covariantes de Lorentz. Afortunadamente, esta
construccion sera suficiente ya que las propiedades de transformacion de las fuerzas deben ser las mismas in-
dependientemente de su origen. Por ejemplo, el hecho de que una partcula este en equilibrio (suma de fuerzas
cero) debe ser independiente del sistema de referencia inercial utilizado y esto solo es posible si las fuerzas
transforman todas igual, incluso si cada una es de diferente naturaleza.
Vimos que a partir de la expresion para la fuerza de Lorentz escrita en terminos de potenciales en lugar
de campos, la fuerza electromagnetica que se ejerce sobre una partcula cargada viene dada por
1 1 dAi
Fi = q vA +
xi c c dt
recordando la definicion del cuadripotencial (16.61), y de la cuadrivelocidad (16.55) podemos escribir la ex-
presion (1/c) v A en forma covariante
! p p
1 1p ic 1 1 1 2 v
v A = i 1 2 p vi Ai = A4 1 2 u4 p i Ai
c c 1 2 c c c 1 2
1 1p 1p 1p
vA = 1 2 A4 u4 1 2 ui Ai = 1 2 [A4 u4 + ui Ai ]
c c c c
1 1p
vA = 1 2 u A
c c
y las componentes Fi de las fuerzas son
" p #
1 1 p dAi
Fi = q 1 2 u A + 1 2 p
xi c c 1 2 dt
p
q dAi
Fi = 1 2 (u A ) (16.68)
c xi d
puesto que q/c es un escalar de Lorentz, una extension cuadrivectorial del termino entre parentesis cuadrados
es de la forma
q dA
(u A )
c x d
este termino es claramente un cuadrivector, pues el primer termino dentro del parentesis es la derivada
(operador cuadrivectorial) de un escalar de universo (u A ), el segundo termino es el producto de un cuadri-
vector dA por un escalar de universo (d )1 . En consecuencia, la expresion en parentesis cuadrados
p en (16.68)
esta asociada a las componentes espaciales de un cuadrivector. Por tanto, Fi es el producto de 1 2 por
la componente espacial de un cuadrivector, el cual identificamos como la fuerza de Minkowski K . Por tanto
la relacion entre la fuerza ordinaria y la de Minkowski esta dada por
p
Fi = Ki 1 2 (16.69)
472 CAPITULO 16. RELATIVIDAD ESPECIAL
esta relacion debe ser general e independiente del origen de las fuerzas. Para el caso de partculas cargadas
sometidas a un campo electromagnetico, la fuerza de Minkowski se obtiene de la extrapolacion de la expresion
(16.68)
q dA
K = (u A ) (16.70)
c x d
En un segundo procedimiento, se define la fuerza como la variacion del momento lineal por unidad de
tiempo, en todos los sistemas de Lorentz se tiene entonces que
dpi
Fi = (16.71)
dt
pero para ello sera necesario redefinir el momento lineal pi de modo que en el lmite no relativista se reduzca
a mvi . Podemos hallar la forma que toma el momento y el significado de K haciendo que la Ec. (16.67)
se parezca en lo posible a (16.71). A partir de la relacion entre y t y de la definicion de cuadrivelocidad,
podemos escribir las componentes espaciales de (16.67) en la forma
!
d mvi p
p = Ki 1 2 (16.72)
dt 1 2
y comparando (16.72) con (16.71) vemos que el teorema de conservacion del momento lineal (reemplazante
mas general que la tercera ley de Newton) sera invariante de Lorentz si definimos la cantidad de movimiento
en la forma
mvi
pi = p (16.73)
1 2
y que Fi y Ki esten relacionadas como lo indica la ecuacion (16.69). Notese que la ecuacion (16.73) se reduce
a mvi cuando 0 como se esperaba. Los dos procedimientos conducen entonces a los mismos resultados.
Comparando (16.73) con la definicion (16.55) de la cuadrivelocidad vemos que pi es la parte espacial del
llamado cuadrivector momento energa
p mu (16.74)
la ecuacion de movimiento generalizada para una partcula se escribe entonces
dp
= K (16.75)
d
de lo cual se obtiene !
d mc2
p =Fv (16.77)
dt 1 2
recordemos ahora el escenario no relativista. En este escenario F v corresponde al trabajo por unidad de
tiempo que se hace sobre la partcula dW/dt. Teniendo en cuenta ademas el teorema fundamental del trabajo
y la energa resulta dW = dT siendo T la energa cinetica. De esto se concluye que
dW dT
Fv = = (lmite no relativista)
dt dt
Extrapolando esta definicion al caso relativista tenemos que
dT
= F v (escenario relativista) (16.78)
dt
Comparando (16.77) con (16.78) se obtiene la generalizacion relativista de la energa cinetica
mc2
T =p (16.79)
1 2
K T mc2 = mc2 ( 1)
no existe una unica designacion para T . En ocasiones se le llama energa total (si bien esto solo sera apropiado
para partcula libre) y en otras simplemente energa. En todo caso T posee propiedades interesantes. Por
ejemplo se puede demostrar que la T dada por (16.79) se conserva siempre que se conserve el momento
lineal espacial definido en (16.73). Para verificar este teorema, podemos tener en cuenta que la conservacion
del momento espacial debe ser invariante ante una transformacion de Lorentz, en realidad esta invarianza
esta implcita en la definicion de sistema inercial dada por Einstein. Las componentes transformadas pj seran
funciones lineales de las pi pero tambien de p4 i.e. de la energa T . En consecuencia, la conservacion de pj para
todos los sistemas inerciales exige la conservacion conjunta de todas las componentes de p . Es facil calcular
el valor del invariante p p
p p = (mu ) (mu ) = m2 u u = m2 c2 (16.81)
474 CAPITULO 16. RELATIVIDAD ESPECIAL
T 2 = p2 c2 + m2 c4 (16.83)
M = 2m + M (16.86)
donde M nos da informacion sobre la posible perdida o ganancia de masa del estado final (de masa M ) con
respecto a la masa del sistema inicial (de masa 2m). La conservacion de P4 en el choque manifestada en la Ec.
(16.84) muestra que
Tf = 2T (16.87)
la cual combinada con (16.85) nos da
2T = M c2 (16.88)
16.8. FORMULACION LAGRANGIANA DE LA MECANICA RELATIVISTA 475
es claro que se ha perdido energa cinetica en el proceso, la energa cinetica al principio y al final del proceso
estan dadas por
K0 = 2T 2mc2 ; Kf = 0
y usando (16.87), (16.86) y (16.88)
por lo tanto, el choque inelastico ha convertido toda la energa del movimiento inicial vista por el laboratorio
en un incremento en la masa en reposo del sistema. En esta clase de choque inelastico se suele decir que la
energa cinetica perdida en el choque se convierte en calor (para ver el tratamiento no relativista del choque
perfectamente inelastico ver seccion 11.1.1, Pag. 263). La relatividad restringida nos dice que la masa en reposo
o inercia del sistema aumenta en proporcion al calor que se produce. Este incremento de masa se podra detectar
poniendo al sistema en movimiento a traves de una fuerza conocida, no obstante para sistemas macroscopicos
estos cambios de masa son muy difciles de detectar ya que un joule de energa posee un equivalente de masa de
aproximadamente 1,1 1017 Kg. No es de extranarse entonces que las evidencias sobre los cambios de la masa
en reposo se hayan visto en sistemas de escala atomica, nuclear o subnuclear. En estos casos no podemos hablar
de produccion de calor sino de cambios en la energa interna del sistema. A la escala subnuclear, estos cambios
en la energa en reposo suelen ser suficientes para permitir la creacion de una o mas partculas adicionales.
Es de anotar ademas que estos cambios tambien pueden ocurrir en el sentido opuesto: la energa en reposo se
puede convertir en energa en movimiento, fenomeno particularmente visible en las explosiones nucleares, por
supuesto en estas explosiones el valor de T permanece constante durante la explosion. A pesar de la enorme
energa liberada en estas explosiones, la perdida de masa suele ser del orden del 0,1 % de la masa original.
y obtener con base en las ecuaciones de Euler Lagrange ecuaciones de movimiento que concuerden con las
generalizaciones obtenidas para el formalismo Newtoniano Ec. (16.71). Estudiaremos el caso de una partcula
sometida a fuerzas conservativas que no dependen de la velocidad, en cuyo caso escribimos
p
L = mc2 1 2 V (16.90)
siendo V un potencial que solo depende de la posicion y 2 = v 2 /c2 donde v es la velocidad de la partcula en el
sistema inercial particular que se toma. Veamos que este Lagrangiano nos conduce a las ecuaciones correctas,
partiendo de las ecuaciones de Lagrange
d L L
=0
dt vi xi
y teniendo en cuenta la relacion
r v
L 2 vk vk mc2 k mvi
= mc 1 2 = q 2 2 ki = p = pi (16.91)
vi vi c 2 1 vk 2vk c 1 2
c
se obtiene
dpi V dpi V dpi
+ =0 = = Fi
dt xi dt xi dt
que concuerda con (16.71). Notese que el lagrangiano NO es de la forma L = T V . No obstante, la expresion
L/vi sigue siendo el momento lineal como ocurre en la formulacion no relativista con coordenadas cartesianas
y potencial independiente de las velocidades. En realidad es este hecho lo que garantiza la correccion adecuada
de las ecuaciones de Lagrange. Por tanto, hubieramos podido proceder hacia atras desde (16.91) para obtener
al menos la dependencia de la velocidad del Lagrangiano.
La generalizacion de (16.90) a sistemas de muchas partculas o a sistemas de coordenadas generalizadas qj
es directa. Las cantidades de movimiento canonicas siguen definiendose en la forma
L
pj = (16.92)
qj
de modo que se mantiene la relacion entre coordenadas cclicas y la conservacion de los momentos asociados
a ellas. Adicionalmente, si el Lagrangiano no depende explcitamente del tiempo se sigue manteniendo a la
funcion h como constante de movimiento
h = qj pj L (16.93)
p
hay sin embargo, una diferencia importante con el caso no relativista: debido al factor 1 2 en el Lagran-
giano (16.90), dicho Lagrangiano no es una funcion homogenea de la velocidad, de modo que la demostracion
realizada en el caso no relativista para llegar a que h es la energa del sistema (en el caso de potenciales
dependientes de la posicion y coordenadas que no dependen explcitamente del tiempo) no es valida en el caso
relativista. Veremos sin embargo que para potenciales que solo dependen de la posicion, h continua siendo la
energa total del sistema
mvi vi p
h = xi pi L = p + mc2 1 2 + V
1 2
p ! !
1 2 mvi mvi p
h = p p + mc2 1 2 + V
m 1 2 1 2
p hp p i
i i
h = 1 2 + mc2 + V (16.94)
m
por otro lado de la Ec. (16.83) vemos que
T2
pi pi = p2 = m2 c2 (16.95)
c2
16.9. FORMULACION NO MANIFIESTAMENTE COVARIANTE 477
esta relacion es analoga a la Ec. (5.2) obtenida para el caso no relativista. El Lagrangiano (16.97) no es
manifiestamente covariante pues no esta escrito en terminos de tensores de Lorentz. Sin embargo, en este caso
se espera que estos resultados sean validos en cualquier sistema de referencia inercial en virtud de la covarianza
relativista de la fuerza de Lorentz, de la cual proviene el potencial dependiente de la velocidad que se usa en
(16.97).
De lo anterior se desprende que muchas de las estrategias y propiedades desarrolladas para la mecanica no
relativista se pueden aplicar en un escenario relativista como veremos en los siguientes ejemplos
siendo una constante de integracion. Podemos despejar de esta ecuacion elevando al cuadrado a ambos
lados
" #
2 (at + )2 2 (at + )2 2
2 (at + )2 (at + )2
= = 1 1 + =
1 2 c2 c2 c2 c2
" # q
2
2
2 c + (at + ) (at + )2 2 + (at + )2 = (at + )
= c
c2 c2
at +
=q (16.99)
2
c2 + (at + )
la Ec. (16.99) sera util para examinar el lmite no relativista, por el momento continuamos manipulando la
expresion
x at + at +
=q dx = c q dt (16.100)
c
c2 + (at + )2 c2 + (at + )2
cuya solucion es q
c p
2 2 2 2
x = x0 + c + (at + ) c + (16.101)
a
la velocidad se obtiene de (16.100)
c ( + at)
x = v = (16.102)
c2 + 2at + 2 + a2 t2
y al evaluarla en t = 0 tenemos
c
v0 = (16.103)
c2 + 2
la Ec. (16.103) muestra que esta directamente relacionado con la velocidad inicial. Si la partcula parte del
reposo en el origen, las condiciones iniciales quedan x0 = v0 = = 0, y la Ec. (16.101) se puede escribir en la
forma
q q 2
c c2 c c2 c2
x = c2 + (at)2 c x+ = c2 + (at)2 x+ = 2 c2 + a2 t2
a a a a a
2
c2 c4
x+ c2 t2 = 2 (16.104)
a a
1
= r 2
c
at+ +1
y como el lmite no relativista corresponde a 0, se ve que esto es equivalente a la condicion [c/ (at + )]2 >>
1, o lo que es lo mismo
at +
<< 1 si << 1 (16.105)
c
16.9. FORMULACION NO MANIFIESTAMENTE COVARIANTE 479
c2 2
v02 = c2 v02 + 2 v02 = 2 c2 v02 + 2 02 = 2 v02 = 2 1 02
c2 + 2
v02 2 si 0 << 1. (16.106)
mc2 m2 c4 m2 c4 m2 c4
E=p +V (E V )2 = 1 2 = 2 = 1
1 2 1 2 (E V )2 (E V )2
2
1 dx m2 c4
=1 (16.107)
c2 dt (E V )2
podemos generalizar un poco antes de entrar en el potencial del oscilador armonico. Sea un potencial tal que
V (x) = V (x) y tal que V (0) es un mnimo local. Si la energa E esta entre V (0) y el maximo de V , el
movimiento sera oscilatorio entre los lmites x = b donde b esta determinado por
V (b) = E
un periodo consistira en ir y volver desde b hasta b. Por simetra esto se puede escribir como cuatro veces la
integral entre 0 y b
Z
4 b dx
= q (16.108)
c 0 1 m c 2
2 4
[EV (x)]
480 CAPITULO 16. RELATIVIDAD ESPECIAL
cuando (16.108) se aplica al potencial de Hooke, se puede expresar en terminos de integrales elpticas. No
obstante, sera mas ilustrativo examinar las correcciones relativistas de primer orden cuando V (x) << mc2 .
Escribiremos la energa total E de la forma
E = mc2 (1 + E)
1 + 34 y
+ O y2
2y
y retornando a la definicion de y
1 1 + 3 b2 x2
q p4
1 m2 c4 2 (b2 x2 )
[EV (x)]2
donde 0 es el periodo en el caso no relativista. Vemos entonces que las correcciones relativistas introducen
una dependencia con la amplitud, dada aproximadamente por
3
= = E (16.112)
0 0 8
16.10. FORMULACIONES LAGRANGIANAS COVARIANTES 481
La expresion (16.113) nos garantiza que la fuerza de Lorentz magnetica no efectua trabajo sobre la partcula
de modo que F v = 0. Este hecho junto con las Ecs. (16.77, 16.78) nos dice que T permanece constante, en
tanto que la expresion (16.83) nos dice que p y tambien lo son. Adicionalmente, (16.113) nos indica que F
es perpendicular a B de modo que la componente del momento a lo largo de B se debe conservar. Finalmente,
la ortogonalidad entre F y v nos indica que la partcula no cambia su rapidez.
Por lo anterior sera posible sin perdida de generalidad asumir que x3 es la direccion de B y que el movimiento
es en el plano x1 x2 . Descompondremos a p en la forma p = p3 u3 + p . Con base en lo anterior sabemos que
p3 es constante as como el modulo de p. Por tanto, el modulo de p es claramente constante de modo que p
realiza una precesion alrededor de la direccion del campo magnetico con una frecuencia dada por
qB
= (16.114)
mc
al ser constante se deduce que la proyeccion de la velocidad en el plano x1 x2 tiene modulo constante y gira
con la misma frecuencia. Si no hay componente de la velocidad en u3 , la partcula se mueve entonces en un
plano y describe una orbita circular uniforme con velocidad angular . De esto se obtiene el modulo de p
p = mv = mr
siendo r el radio de la circunferencia. Si combinamos esta ecuacion con (16.114) obtenemos el radio de la
circunferencia en funcion del momento lineal
p
r= (16.115)
qB/c
el radio de curvatura solo depende de las propiedades de la partcula a traves del factor pc/q (= Br), que se
conoce como la rigidez magnetica de la partcula. Se puede ver que aunque presenta correcciones relativistas
contenidas en el factor , la relacion entre radio y momento es la misma que en el caso no relativista (justamente
porque el momento a su vez se redefine con el mismo factor ). Debe tenerse en cuenta que aunque r solo
depende de p , en el calculo de debe usarse tanto la componente perpendicular como la paralela a B a fin
de calcular .
covariante. Finalmente, en vez de ser funciones de xi y xi el lagrangiano debe ser funcion de las coordenadas
del espacio de Minkowski y de sus derivadas respecto al parametro invariante.
Veamos el caso de un partcula. La eleccion natural del parametro invariante es aparentemente el tiempo
propio de la partcula. Sin embargo, las componentes de la velocidad generalizada, deben entonces cumplir la
relacion
u u = c2 (16.116)
que demuestra que no todas sus componentes son independientes. Por lo tanto, supondremos que el parametro
invariante es mas bien una funcion que crece monotonamente a medida que el punto de universo evoluciona a
lo largo de la lnea de universo de la partcula y que es ademas invariante de Lorentz. La derivada con respecto
al parametro y con respecto al parametro t seran simbolizadas en la forma
dx dx
x ; x
d dt
Un principio de Hamilton covariante debe ser entonces del tipo
Z 2
I = (x , x ) d = 0 (16.117)
1
siendo un escalar de universo. Notese que la dependencia explcita del tiempo esta contenida en el hecho
de que depende de x4 . Las ecuaciones de Euler Lagrange que surgen de aplicar el principio de Hamilton a
(16.117) son
d
=0 (16.118)
d x x
de modo que debemos encontrar un tal que las Ecs. (16.118) sean equivalentes a las Ecs. (16.67). Una manera
de hacerlo es partir de la integral de accion usual con parametro t y transformando dicha integral de modo
que el parametro tiempo sea reemplazado por el parametro invariante y el tiempo en cambio aparezca no
como parametro sino como otra coordenada generalizada. Como debe ser funcion monotona de t medida en
cierto sistema inercial, se tiene
con lo cual la integral de accion usual (con parametro t) se transforma de la manera siguiente
Z t2 Z 2
i xj
I= L (xj , t, xj ) dt = L x , ic x4 d (16.119)
t1 c 1 x4
comparando la accion definida en (16.117) con (16.119), vemos que una receta adecuada para el lagrangiano
transformado sera de la forma
ix4 xj
(x , x ) = L x , ic (16.120)
c x4
este Lagrangiano tiene una caracterstica no vista hasta ahora en los Lagrangianos, depende del cociente entre
derivadas de las coordenadas generalizadas xj /x4 y de un factor global x4 . La primera caracterstica hace
que sea una funcion homogenea de primer grado de las velocidades generalizadas independientemente de la
forma funcional de L
i (ax4 ) (axj ) ix4 xj
(x , ax ) = L x , ic = a L x , ic
c (ax4 ) c x4
(x , ax ) = a (x , x ) (16.121)
este no es un fenomeno de la fsica relativista como tal, sino de la forma en que se ampla el espacio de
configuracion para incluir a t como coordenada generalizada, y usar otro parametro para seguir la evolucion
16.10. FORMULACIONES LAGRANGIANAS COVARIANTES 483
del punto figurativo de la partcula en el espacio de universo. Un Lagrangiano de la forma (16.121) recibe el
nombre de Lagrangiano homogeneo y el correspondiente problema homogeneo del calculo de variaciones exige
un tratamiento especial. La dificultad mas seria surge en la formulacion Hamiltoniana. Para verlo, observemos
que al ser homogenea de primer grado en x , podemos aplicar el teorema de Euler Ec. (5.16) Pag. 77, para
obtener
= x (16.122)
x
con esto vemos que la funcion energa h definida en (5.13) Pag. 76, es identicamente nula19 . Por otro lado, de
la Ec. (16.122) vemos tambien que se satisface la relacion
d
x = 0 (16.123)
d x x
la cual nos indica que si se satisfacen tres de las Ecs. (16.118) entonces la cuarta se satisface automaticamente.
Notese que esto es consecuencia de la homogeneidad de .
Veamos como se escribe esta transformacion para una partcula libre. La Ec. (16.90) nos indica la expresion
no covariante para el Lagrangiano de una partcula libre
p
L (xi , xi ) = mc c2 xi xi (16.124)
y aplicando la transformacion (16.120) a (16.124), resulta un posible Lagrangiano covariante
" s # " s #
ix4 xj ix4 x i x i x i x i
(x , x ) = L x , ic = mc c2 ic ic = ix4 m c2 + c2 2
c x4 c x4 x4 x4
"s # q
xi xi
(x , x ) = imcx4 1 + 2 = imc x24 + xi xi
x4
Para llegar a (x , x ) hay una ambiguedad de signo que debe fijarse para que L dt tenga el mismo valor que
d. El paso final se escribe en la forma
q q q
2
= mc (i) x4 + xj xj = mc x24 xj xj
2
quedando finalmente
p
(x , x ) = mc x x (16.125)
con la cual las ecuaciones de Euler-Lagrange (16.118), equivalen a
d d
mc x x mc x x = 0 mc x x = 0
d x x d x
d mcx
= 0
d x x
como el parametro debe ser funcion monotona del tiempo propio , las derivadas con respecto a estan
relacionadas con las derivadas en funcion de a traves de la expresion
d d d dx d dx d
= ; x = = u
d d d d d d d
y las ecuaciones de Lagrange quedan de la forma
d
d d mc d u d d mcu d mcu
q 2 = 0 =0 =0
d d d d u u d c2
d
d u u
d (mu )
=0
d
19
De hecho se observa que la funcion energa definida en la Ec. (5.17) Pag. 77, no posee parte homogenea de primer grado.
484 CAPITULO 16. RELATIVIDAD ESPECIAL
que coincide con las Ecs. (16.67) aplicadas a una partcula libre. La cuarta de estas ecuaciones no es indepen-
diente, lo cual tambien se vio anteriormente ya que esta ecuacion nos manifiesta la conservacion de la energa
cinetica, que se puede deducir de las tres ecuaciones anteriores.
Notese que este metodo resulta laborioso incluso para una partcula libre. Una forma mas directa y practica
propuesta por Dirac, evita la introduccion del parametro y permite trabajar con el tiempo propio . Para ello
basta con observar que la relacion que nos previene de usar el tiempo propio como parametro invariante Ec.
(16.116) no es una verdadera ligadura dinamica de movimiento20 sino una consecuencia geometrica del modo
de definir , esta ecuacion nos dice basicamente que hay una region permitida en el espacio tetradimensional
u y que no todos los puntos de esta region son accesibles, la region accesible es una hipersuperficie de 3
dimensiones. A las Ecs. del tipo (16.116) Dirac las denomina ecuaciones debiles. Podemos en consecuencia,
trabajar las u como cantidades sin ligaduras y solo despues de efectuar todas las operaciones de derivacion
necesitaremos imponer la ligadura (16.116). Este procedimiento se puede aplicar al Lagrangiano libre. En cuyo
caso se podra haber hecho igual a desde el principio y se aplica la Ec. (16.116) solo en el ultimo paso. De
esta forma se puede escribir directamente en funcion de las ecuaciones de Lagrange covariantes
d
=0 (16.126)
d u x
por otro lado, no es necesario que la integral de accion del principio de Hamilton deba tener el mismo valor
cuando se expresa en funcion de t que cuando se expresa en funcion de o de , de modo que el Lagrangiano no
tiene que estar descrito por la Ec. (16.120). Solo se le exige a que sea un escalar de universo y que conduzca
a las ecuaciones de movimiento correctas, despues de todo el principio de Hamilton se escribio con esta idea.
no tiene que ser necesariamente homogenea de primer grado en las velocidades generalizadas. Por ejemplo,
un Lagrangiano adecuado para partcula libre es el siguiente
1
= mu u (16.127)
2
y mas en general puede tener la forma mf (u u ) mf (y) donde f (y) es una funcion arbitraria con la
condicion de que
f 1
= (16.128)
y y=c2 2
donde (16.128) es una forma de tener en cuenta la ligadura (16.116) en la funcion f (u u ). Notese que las
funciones f (u u ) = 12 u u y f (u u ) = c u u cumplen esta condicion y conducen a los Lagrangianos
(16.125) y (16.127) respectivamente. De aqu en adelante, usaremos la Ec. (16.127) para la parte de la energa
cinetica del Lagrangiano.
Si la partcula no es libre, es necesario introducir terminos escalares de universo que den cuenta de la
interaccion con el exterior correspondientes a ciertas fuerzas de Minkowski. Usualmente estos terminos seran
la contraccion de un cuadrivector exterior con un cuadrivector del sistema que representan la interaccion de la
partcula con un campo exterior. Por ejemplo, si el termino de interaccion es de la forma x siendo un
cuadrivector exterior y si ademas en algun sistema de referencia 1 = ma y las demas componentes son nulas,
tendramos un ejemplo de fuerza constante. La forma concreta dependera de la formulacion covariante que se
utilice para la teora del campo. Ya tenemos a mano un ejemplo cual es la interaccion de una carga puntual
con un campo electromagnetico, para el cual, un Lagrangiano adecuado es
1 q
(x , u ) = m u u + u A (x ) (16.129)
2 c
y las ecuaciones de Lagrange (16.126) asociadas al Lagrangiano (16.129) son
d 1 q 1 q
m u u + u A (x ) m u u + u A (x ) = 0
d u 2 c x 2 c
d h q i q A (x )
m u + A (x ) u = 0
d c c x
20
La Ec. (16.55), Pag. 468, nos muestra que la cuarta componente de u es totalmente espurea, y solo se agrego con el fin de
construir un cuadrivector que contuviera la informacion Fsica de la velocidad.
16.11. EJERCICIOS 485
d q dA
(mu ) = (u A )
d c x d
que corresponden a las ecuaciones de movimiento generalizadas (16.67) donde la fuerza de Minkowski K
esta dada por la Ec. (16.70). Como antes, el cuadrimomento lineal p es diferente del momento canonico
asociado a x que denotaremos por P
q q
P = = mu + A = p + A (16.130)
u c c
las tres primeras componentes corresponden a las dadas en la Ec. (5.2). La cantidad canonica asociada a x4 se
obtiene sustituyendo (16.61, 16.80) en (16.130) y viene dada por
q iT iq i
P4 = p4 + A4 = + = E
c c c c
siendo E = T + q la energa total de la partcula. Una vez mas, el momento conjugado a la coordenada
tiempo es proporcional a la energa total21 . La relacion entre el modulo del momento lineal y la energa T sigue
estando dada por (16.83). Es notable el hecho de que dado que p y A son trivectores cartesianos entonces las
tres componentes espaciales de P dadas por
~ = p + qA
P
c
forman un trivector cartesiano (recordemos que en general, los momentos canonicos no forman vectores). Por
~
esta razon es util escribir la Ec. (16.83) en terminos del trivector canonico P
2
T 2 = P ~ q A c2 + m2 c4 (16.131)
c
~ El ejemplo de la carga en campo electromagnetico
relacion muy util entre la energa T y el momento canonico P.
es un ejemplo de interaccion con un campo vectorial. Podramos tener por ejemplo interaccion con un campo
escalar (x ) usualmente acoplado a alguna cantidad escalar del sistema, tales como q (x ) o m (x ) siendo
m masa propia y carga respectivamente, hay por supuesto otras posibilidades como la contraccion de dos
tensores (uno externo y otro interno) de la forma F K etc. La unica restriccion es que los terminos de
interaccion formen un escalar de universo. La forma explcita de estos terminos depende entonces de la teora
de campo especfica que se esta considerando.
16.11. Ejercicios
1. Demuestre que j = 0 u , siendo j el cuadrivector densidad de corriente, 0 la densidad de carga propia,
y u la cuadrivelocidad.
2. Demuestre que la cantidad A definida en 16.65, es un cuadrivector.
3. Encuentre el equivalente energetico (energa en reposo o autoenerga) de una masa de 1Kg. Compare
este valor con cantidades energeticas tpicas a la escala humana.
4. Para el movimiento relativista de una partcula sometida a una fuerza constante, encuentre la ecuacion
de la trayectoria para valores arbitrarios de la velocidad y posicion inicial.
5. Demuestre que si el Lagrangiano satisface las ecuaciones de Lagrange (16.118), entonces se cumple
la relacion (16.123) como consecuencia de la homogeneidad de primer grado de con respecto a x
expresada en (16.121).
21
En el caso no relativista, esta relacion de conjugacion era mas bien artificial ya que el tiempo era un parametro y no una
coordenada generalizada. En el caso relativista, el tiempo se convierte en coordenada y por tanto podemos hablar en firme de su
momento conjugado.
Captulo 17
Teora canonica de perturbaciones
Es un hecho que la mayora de problemas fsicos reales no poseen soluciones matematicas exactas. A
manera de ilustracion el problema de Kepler para dos cuerpos es soluble de manera exacta, pero para el
movimiento clasico de tres cuerpos puntuales bajo interaccion gravitacional no ha sido posible una solucion
analtica exacta. Lo anterior nos motiva a estudiar tecnicas que permitan encontrar soluciones aproximadas
analticas o numericas.
Por otro lado, ocurre con frecuencia que el Hamiltoniano del problema que no se puede resolver de forma
exacta, difiere solo ligeramente de un Hamiltoniano que se puede resolver rigurosamente. Escribimos entonces
H (q, p, t) = H0 (q, p, t) + H (q, p, t) (17.1)
siendo H0 el Hamiltoniano no perturbado del cual conocemos su solucion exacta, H es el Hamiltoniano
perturbado del cual queremos conocer una solucion aproximada y H es el Hamiltoniano de perturba-
cion. La hipotesis de trabajo basica de la tecnica de perturbaciones es la pequenez de H con respecto a H0 .
Genericamente decimos que el problema mas complicado es una perturbacion del sistema soluble.
Vale la pena tener en cuenta que incluso cuando el Hamiltoniano de perturbacion H sea pequeno con
respecto al Hamiltoniano no perturbado H0 , el efecto de la perturbacion sobre la solucion puede ser conside-
rable. Por ejemplo, para un oscilador bidimensional isotropico i.e. de frecuencas iguales en x e y, la trayectoria
es una curva cerrada simple, mas especficamente una elipse. Supongamos que aplicamos una perturbacion
que cambie ligeramente la constante de rigidez en la direccion y de tal forma que las frecuencias son ahora
diferentes e inconmesurables. Como consecuencia de esta pequena perturbacion de H, la trayectoria ya no
sera cerrada y en el transcurso del tiempo llenara todo el espacio conformado por el rectangulo que se forma
con las amplitudes en x e y. Otro ejemplo ilustrativo es el efecto gravitatorio debido al achatamiento de la
tierra visto como desviacion del problema no perturbado con la tierra perfectamente esferica, las pequenas per-
turbaciones producidas por este achatamiento producen un cambio apreciable en la trayectoria de un satelite
puntual. En particular el campo central sin perturbar produce un movimiento en un plano en tanto que toda
perturbacion cuadrupolar gravitatoria por pequena que sea hace que el movimiento se salga del plano inicial
a menos que el eje del cuadrupolo sea perpendicular a dicho plano.
La mayor parte del desarrollo formal de la teora clasica de perturbaciones se realizo para la mecanica
celeste. Por ejemplo, el efecto gravitacional del sol sobre la luna se puede considerar una perturbacion con
respecto a la interaccion gravitacional dominante debida a la tierra. La necesidad de predecir con precision las
orbitas de satelites ha impulsado fuertemente el desarrollo de metodos perturbativos.
En general podemos dividir la teora de perturbaciones en dos tipos de teora: teora de perturbaciones
dependiente del tiempo e independiente del tiempo. Buena parte de las tecnicas aqu desarrolladas poseen
analoga con la teora de perturbaciones para la mecanica cuantica, si bien la teora de perturbaciones clasi-
ca es mucho mas complicada que su contraparte cuantica. En general, la teora de perturbaciones clasica se
puede tratar con cualquiera de los formalismos desarrollados hasta ahora: Newtoniano, Lagrangiano y Hamil-
toniano. Sin embargo, la formulacion mas conveniente es la de Hamilton-Jacobi. Comenzaremos con la teora
de perturbaciones dependiente del tiempo que es la forma mas simple
486
17.1. VARIACION DE CTES PARA PERTURBACIONES DEPENDIENTES DEL TIEMPO 487
K (, ) K (, , t)
i = ; i = (17.3)
i i
las ecuaciones (17.3) son formalmente exactas de modo que no hemos hecho ninguna aproximacion aun. Tales
ecuaciones nos dan formalmente los valores de i , i en funcion del tiempo. Por otro lado, las ecuaciones
de transformacion desde (q, p) hacia (, ) nos permitiran a su vez encontrar a q, p en funcion del tiempo a
traves del inverso de dicha transformacion, lo cual resuelve el problema completo. No obstante, la solucion
para el nuevo Hamiltoniano perturbado K (, , t) no es usualmente mas sencilla que la del Hamiltoniano
perturbado original H (q, p, t), la razon es que aunque la transformacion se mantiene canonica, ya no trivializa
las ecuaciones de Hamilton como lo haca con el Hamiltoniano no perturbado, por lo tanto no es claro que tal
transformacion canonica simplifique el problema perturbado. De lo anterior se desprende que las Ecs. (17.3)
no seran especialmente fructferas si buscamos una solucion exacta.
Sin embargo, estas ecuaciones seran de gran utilidad para obtener soluciones aproximadas si tenemos en
cuenta que H debe ser pequeno con respecto a H0 . Es de esperarse entonces que los valores de y
en el nuevo problema no difieran significativamente de su valor constante original de modo que no varen
rapidamente, al menos en comparacion con la dependencia explcita de K con respecto al tiempo. Una primera
aproximacion a la dependencia temporal de (, ) se obtendra entonces asumiendo la validez de las ecuaciones
(17.3) pero con los miembros derechos de cada ecuacion evaluados en los valores constantes no perturbados 0i
y 0i . Denotando 1i y 1i las soluciones de primer orden en teora de perturbaciones para i , i tenemos
que
K (, ) K (, , t)
1i = ; 1i = (17.4)
i i =0i , i =0i i i =0i , i =0i
488 CAPITULO 17. TEORIA CANONICA DE PERTURBACIONES
de modo que despues de la derivacion se deben sustitur las variables , por sus valores constantes no
perturbados. Como estas son ecuaciones de Hamilton, se pueden escribir matricialmente en forma simplectica
como en (6.33)
K (, t)
1 = J ; e 1 (11 , 12 , . . . , 1n , 11 , 12 , . . . , 1n ) (17.5)
= 0
donde la matriz J esta definida por la Ec. (6.31). Las Ecs. (17.4) o (17.5) se pueden integrar directamente para
obtener la dependencia temporal de las 1i , 1i en aproximacion de primer orden. Usando las ecuaciones de
transformacion se obtiene la dependencia temporal para la correspondiente aproximacion de primer orden en
las q, p.
Ahora bien, si queremos proceder a la aproximacion de segundo orden, debemos utilizar la aproximacion
de primer orden de la dependencia temporal de y en los miembros de la derecha de las Ecs. (17.3)
K (, ) K (, , t)
2i = ; 2i = (17.6)
i i =1i , =1i i i =1i , =1i
en general, si queremos proceder a la aproximacion de orden m, debemos utilizar la aproximacion de orden
m 1 de la dependencia temporal de y en los miembros de la derecha de las Ecs. (17.3), en notacion
matricial simplectica esto se escribe como
K (, t)
m = J e m (m1 , m2 , . . . , mn , m1 , m2 , . . . , mn )
; (17.7)
= m1
por otro lado, las inversas de las ecuaciones (17.8) permiten a su vez considerar a K (, , t) como funcion de
los ci y el tiempo i.e. K = K (ci , t)
ci K ci K cj
[ci , K] J = J
cj
K
[ci , K] = [ci , cj ]
cj
donde hay suma sobre el ndice repetido j. Reemplazando esta ecuacion en (17.9) se tiene
K
ci = [ci , cj ] (17.10)
cj
al igual que las ecuaciones de Hamilton (17.3) las ecuaciones (17.10) son exactas y no se ha realizado todava
ninguna aproximacion. De manera analoga a la teora de perturbaciones para los , , el calculo de primer
orden consiste en evaluar a la derecha de la ecuacion (17.10) incluyendo los corchetes de Poisson con los valores
de los parametros correspondientes al movimiento no perturbado. En la aproximacion de orden m, se hacen
todas las derivadas a la derecha de (17.10) luego de lo cual se reemplazan las expresiones resultantes, por los
valores de los parametros obtenidos en la perturbacion de orden m 1.
K
cmi = [ci , cj ] ; i = 1, ..., 2n (17.11)
cj ci =cm1,i ; cj =cm1,j
esta ecuacion es el analogo de (17.7). En mecanica celeste aparece a menudo la Ec. (17.11) en terminos de
corchetes de Lagrange. Multipliquemos la Ec. (17.10) por el corchete de Lagrange {ck , ci } y sumamos sobre
ndices repetidos
K
{ck , ci } ci = {ck , ci } [ci , cj ] (17.12)
cj
usando la propiedad (8.15) se tiene
K
= {ck , ci } ci (17.13)
cj
de nuevo en la terminologa de la mecanica celeste es usual definir R K de modo que la Ec. (17.13) queda
en la forma
R
= {ck , ci } ci (17.14)
cj
las ecuaciones (17.11) o sus formas equivalentes (17.13, 17.14) se conocen como ecuaciones de perturbacion
de Lagrange.
Hay dos maneras en las cuales pueden variar los parametros en una orbita osculatriz visto en el esquema
perturbativo. Es posible que haya una variacion periodica en la cual el parametro vuelve a su valor inicial
en un intervalo de tiempo que en primera aproximacion suele ser el periodo de la orbita no perturbada. En
contraste, es posible que se mantenga un incremento (o decremento) neto del valor del parametro al final de
cada periodo orbital sucesivo. En el primer caso hablamos de una variacion periodica en tanto que en el
segundo caso se habla de una variacion secular. Cuando la variacion de un parametro dado es periodica, su
valor promediado sobre un periodo suele ser muy similar a su valor no perturbado, y si todos los parametros
tienen variacion periodica la trayectoria perturbada tiene un aspecto muy similar a la no perturbada. Si en
cambio la variacion es secular, por pequena que sea la desviacion en cada periodo, los valores de los parametros
pueden diferir fuertemente respecto a los valores no perturbados para un numero suficientemente grande de
periodos. Correspondientemente, la perturbacion llevara a una trayectoria muy diferente a la no perturbada
para tiempos mucho mayores al periodo. Por esta razon, para multiples propositos suele eliminarse los efectos
periodicos3 y quedarse solo con los efectos seculares en los calculos perturbativos.
Vale la pena mencionar que el uso de la orbita osculatriz requiere de rectificaciones en periodos de tiempo
determinados por el problema especfico, ya que para tiempos suficientemente grandes la orbita no perturbada
y la perturbada pueden diferir significativamente, en especial si hay efectos seculares. En consecuencia se suele
rectificar la orbita osculatriz de referencia pasando a otra orbita osculatriz y tal vez otro tipo de rectificaciones
a medida que transcurre el tiempo.
Aunque la solucion es inmediata, el uso de la tecnica de Hamilton-Jacobi nos garantiza que y son variables
canonicas.
Ahora agregaremos una interaccion tipo Hooke que consideraremos como perturbacion. El Hamiltoniano
de perturbacion sera entonces
m 2 x2
H = (17.19)
2
siendo una constante. El Hamiltoniano perturbado sera
1
H = H0 + H = p 2 + m 2 2 x2 (17.20)
2m
Debemos proceder ahora a calcular el nuevo Hamiltoniano perturbado K, en terminos de , , t, para lo
cual sustitumos las ecuaciones (17.15), (17.16), (17.19), en (17.2)
S 2 m 2 x2 2
K (, , t) = H0 + H + = +
t 2m 2 2m
m 2 x2
K (, , t) =
2
y usamos (17.17) para escribir el miembro derecho en terminos de , , t
2
m 2 t
K (, , t) = + (17.21)
2 m
para este caso muy particular es posible obtener la solucion exacta sustituyendo el Kamiltoniano (17.21) en
las Ecs. (17.3)
2 t 2 t
= m + ; = t + (17.22)
m m
derivando la primera de las Ecs. (17.22) con respecto al tiempo resulta
2 2 t
= m + (17.23)
m
lo cual nos da una variacion armonica simple con el tiempo para en el sistema perturbado. Reemplazando
(17.17) en la primera de las ecuaciones (17.22) resulta
= m 2 x x =
m 2
que facilmente se puede ver que conduce a la solucion armonica exacta. Es importante enfatizar en que este
es un caso excepcional en el cual se puede obtener la solucion exacta usando la transformacion canonica
obtenida del sistema no perturbado. El punto es que aunque esta misma transformacion canonica no trivializa
al Hamiltoniano perturbado, lo deja con una estructura suficientemente simple.
Veamos ahora como se obtendran las soluciones aproximadas en cada orden en teora de perturbaciones.
Vale decir que para poder tratar a esta interaccion como perturbacion, es necesario que la energa potencial
armonica (H) sea mucho menor que la energa cinetica de la partcula (H0 ). Es claro que esto implicara que
el metodo podra fallar por ejemplo en los instantes en los cuales la elongacion es muy cercana a la amplitud, ya
que en estos casos la energa cinetica es muy pequena. Veremos sin embargo que para este caso muy particular,
492 CAPITULO 17. TEORIA CANONICA DE PERTURBACIONES
la solucion completa se podra obtener via teora de perturbaciones, aunque esto constituye de nuevo un caso
excepcional.
Para la aproximacion de primer orden, procedemos a escribir las Ecs. (17.4)
K (, ) K (, , t)
1 = ; 1 =
0 , 0 0 , 0
donde los subndices 0 , 0 son los valores no perturbados. Por simplicidad tomemos x0 = 0 lo cual segun la
Ec. (17.17) implica que 0 = 0 4 . Para el Kamiltoniano (17.21) resulta
t t
1 = m 2
+ ; 1 = t 2
+
m 0 , 0 m 0 , 0
0 t2
1 = 2 0 t ; 1 = 2
m
estas ecuaciones tienen soluciones inmediatas
2 0 t2 0 2 t3
1 = 10 ; 1 = + 10 (17.24)
2 3m
donde 10 y 10 denotan los valores iniciales de 1 y 1 . Debemos tener en cuenta que las condiciones iniciales
son las mismas para el sistema perturbado que para el sistema sin perturbar. La diferencia es que en el sistema
sin perturbar estos valores iniciales 0 , 0 permanecen inalterados en el tiempo, en tanto que en el sistema
perturbado ellos evolucionaran en el tiempo. En consecuencia, los valores iniciales de los y en cualquier
orden en teora de perturbaciones corresponden a los valores sin perturbar, por tanto
n0 = 0 ; n0 = 0 = 0
ahora escribamos la solucion de segundo orden, para lo cual usamos las ecuaciones (17.6)
K (, ) K (, , t)
2 = ; 2 =
1 , 1 ,
1 1
t t
2 = m 2 + ; 2 = 2 t +
m , m 1 , 1
1 1
1 t 1 t
2 = m 2 + 1 ; 2 = 2 t + 1 (17.26)
m m
4
Notese que el subndice 0 en x0 y 0 tiene significados muy diferentes, ya que x0 indica la posicion del sistema en t = 0 en
tanto que 0 indica el valor (constante) de en el sistema no perturbado i.e. el valor de para la perturbacion de orden cero.
17.4. EJEMPLOS EN TEORIA DE PERTURB. DEPENDIENTE DEL TIEMPO 493
2 t
p2 = 2 ; x2 = + 2
m
2 0 t2 4 0 t4 2 0 t2 4 0 t4 t 0 2 t3 2 t5
p2 = 0 + ; x2 = 0 + +
2 24 2 24 m m 3 30
3 3
2 t2 4 t4 0 3 t3 5 t5 0 t 5
t 5
p2 = 0 1 + ; x2 = t + +
2 24 m 2 24 m 3 30
2 t2 4 t4 0 3
t 3 5
t 5
p2 = 0 1 + ; x2 = t + (17.27)
2! 4! m 6 120
adicionalmente, de las Ecs. (17.18) se observa que 0 = p, siendo p el momento lineal constante asociado
al sistema sin perturbar (partcula libre). Es mas conveniente reescribir 0 = p0 para indicar que esta aso-
ciado a la condicion inicial en el momento lineal tanto del sistema perturbado como sin perturbar. Por otra
parte, redefiniremos p como el momento lineal del sistema perturbado, el cual ya no es constante. Con estas
consideraciones, reescribimos x y p a segundo orden en la Ec. (17.27) en la forma
" # " #
(t)2 (t)4 p0 (t)3 (t)5
p2 = p0 1 + ; x2 = t +
2! 4! m 3! 5!
con estos terminos es suficiente para observar la secuencia que nos lleva a la contribucion del termino nesimo,
aunque la demostracion formal debe realizarse por induccion (ver ejercicio 1, Pag. 522). En las expresiones
a segundo orden vemos que los terminos entre corchetes para p2 y x2 son los tres primeros terminos en la
expansion de coseno y seno respectivamente. En el lmite de orden infinito en la perturbacion resulta claramente
p0
p = lm pn = p0 cos t ; x = lm xn = sin t (17.28)
n n m
que son las soluciones exactas compatibles con la condiciones iniciales.
a traves de la variacion temporal del angulo de fase perturbado. Un pendulo plano consistente en una masa
puntual m situado al extremo de una varilla sin peso de longitud l posee el Hamiltoniano
p2
H= + mgl (1 cos ) (17.29)
2ml2
siendo p el momento conjugado a , (p tiene unidades de momento angular). Este es el Hamiltoniano perturbado
ya que incluye el efecto de amplias oscilaciones. Podemos obtener una forma simplificada aunque aproximada
del Hamiltoniano de perturbacion, realizando una expansion en serie de Taylor del cos en el Hamiltoniano
2
p2 2 4 6 p2 4 6
H = + mgl 1 1 + + ... = + mgl + ...
2ml2 2! 4! 6! 2ml2 2 24 720
p2 mgl 2 2 4
H = + 1 + ... (17.30)
2ml2 2 12 360
el lmite de pequenas oscilaciones se obtiene manteniendo solo el primer termino de la expansion de la energa
potencial en (17.30), con lo cual se ve claramente un potencial de tipo armonico. Es claro que el Hamiltoniano
es la energa del sistema incluso para el problema perturbado. En el momento de maxima altura i.e. cuando
se alcanza el valor de la amplitud angular 1 , la energa cinetica se anula, por tanto en el regimen de pequenas
oscilaciones se tiene que:
mgl12
H0 = E0 = (17.31)
2
Lo cual sugiere que 1 se pueda usar como parametro adimensional para analizar el efecto de los terminos
perturbativos. Usaremos dos parametros para realizar dicho analisis
2E0 12 E0
12 = ; = = (17.32)
mgl 6 3mgl
recordemos que 1 es la amplitud angular maxima de oscilacion cuando E y por tanto la amplitud son pe-
quenas. Por tanto el cociente /1 es del orden de uno para valores de cercanos a 1 i.e. de la amplitud
maxima. En consecuencia, el orden de magnitud del factor sera el que regule la convergencia de la serie
(17.33)5 . Si conservamos solo el primer termino de correccion y trabajamos perturbaciones a primer orden,
solo se introduciran en los calculos terminos del orden de . La perturbacion a segundo orden con el mismo
Hamiltoniano de perturbacion introduce terminos de orden 2 , por lo tanto para obtener una correccion cohe-
rente hay que calcular una perturbacion de segundo orden en el termino proporcional a del Hamiltoniano y
una perturbacion de primer orden en el termino 2 de dicho Hamiltoniano.
A continuacion realizaremos un calculo perturbativo de primer orden. El Hamiltoniano no perturbado lo
podemos escribir en la forma
p2 mgl 2 p2 mgl 2 2
p2 1 mgl 2 p2 1
H0 = 2
+ = 2
+ 2
ml = + I = + 22I
2ml 2 2 (ml ) 2 (ml ) 2I 2 I 2I 2
1 2 mgl g
H0 = p + I 222 ; I ml2 ; 2 = (17.34)
2I I l
5
De (17.32) podemos observar que 1 y son pequenos cuando la energa total E es mucho menor que la energa potencial
maxima 2mgl que podra alcanzar el pendulo.
17.4. EJEMPLOS EN TEORIA DE PERTURB. DEPENDIENTE DEL TIEMPO 495
donde I y denotan el momento de inercia del pendulo y su frecuencia angular respectivamente. Como ya
vimos en la seccion 9.9.1, un sistema adecuado de variables canonicas que nos conduce a un K0 completamente
cclico es el sistema de variables accion angulo (J, w) definido por las Ecs. (9.110, 9.113) Pag. 195
2E
w = vt + ; v= ; J= (17.35)
2
en el sistema no perturbado la variable canonica J es constante y la variacion temporal de w es lineal, lo cual se
traduce en que las cantidades J, v, son constantes en el sistema no perturbado. Lo que hace el Hamiltoniano
de perturbacion es introducir una variacion temporal para estas cantidades. En el presente analisis vamos a
absorber toda la modificacion de la dependencia temporal de w en el parametro con lo cual escribiremos6
w1 = v1 t + v1 + 1 v + 1 (17.36)
de modo que estudiaremos la variacion temporal generada por la perturbacion de J y del termino de fase 1
que absorbe la dependencia temporal de w1 .
Las Ecs. (9.115) nos daban la transformacion canonica entre las variables originales q, p y las finales w y J
del oscilador armonico unidimensional. Hay no obstante una diferencia sutil entre el Hamiltoniano (9.109) y
el Hamiltoniano (17.29) ya que en el primero las coordenadas q, p tienen dimensiones de longitud y momento
lineal en tanto que en el segundo las coordenadas , p tienen unidades de angulo (adimensional) y momento
angular. Para escribir adecuadamente las transformaciones canonicas basta con reemplazar m I = ml2
como se ve comparando los Hamiltonianos (9.109) y (17.34), de esta forma la transformacion canonica (9.115)
queda r r
J IJ
= sin 2w ; p= cos 2w ; w = vt + (17.37)
I
estas son ecuaciones exactas para el sistema no perturbado. Ahora bien, dentro de la filosofia de la teora de
perturbaciones dependiente del tiempo (variacion de constantes), la transformacion canonica continua siendo
valida pero los valores de J y w adquieren una dependencia temporal.
El nuevo Hamiltoniano no perturbado K0 se puede extraer de las Ecs. (9.111, 9.112) de modo que K0 = Jv.
Por otro lado, el nuevo Hamiltoniano perturbado coincide numericamente con el Hamiltoniano perturbado
original puesto que la funcion generatriz W no depende explcitamente del tiempo7 , solo hay que escribirlo en
terminos de las nuevas variables canonicas J, w. Usando el Hamiltoniano (17.33) hasta orden se obtiene
K = K0 + K
2
mgl 2 2 mgl 2 12 2 mgl 4 mgl J
K = = = = sin4 2w
2 2 1 4 6 1 24 24 I
2
mgl J 4 gJ 2 4 gJ 2
K = sin 2w = sin 2w = sin4 2w
24 ml2 24 2 ml3 2 24 2 ml3 (g/l)
donde hemos usado (17.32, 17.34) y (17.37), con lo anterior queda finalmente
J2
K = K0 + K ; K0 = Jv ; K = sin4 2w ; w = vt + (17.38)
24 2 ml2
ahora aplicamos las Ecs. (17.4, 17.36) para obtener
K (J, w) K (J, w)
J1 = ; w1 = v + 1 = (17.39)
w J0 , w0 J J0 , w0
6
Esto equivale a usar la frecuencia del sistema no perturbado para los calculos en el sistema perturbado.
7
Recordemos que el formalismo de variables accion-angulo desarrollado en la seccion 9.8, supone que el Hamiltoniano es constante
y se utiliza el formalismo de Hamilton-Jacobi para la funcion caracterstica de Hamilton de la seccion 9.3, en la cual la funcion
generatriz W no depende explcitamente del tiempo y el nuevo Hamiltoniano K coincide numericamente con el antiguo Hamiltoniano
H.
496 CAPITULO 17. TEORIA CANONICA DE PERTURBACIONES
J0
1 = sin4 2 (vt + 0 ) (17.40)
12 2 ml2
donde hemos usado la notacion J0 y 0 para enfatizar que corresponde a los valores no perturbados. La ecuacion
(17.40) nos dice que en primera aproximacion 1 vara a lo largo del ciclo de la oscilacion sin perturbar. Notese
sin embargo que 1 posee un valor promedio no nulo a lo largo de un periodo no perturbado, haciendo el
cambio de variable x = 2vt + 20
Z 1/v Z 2+20
J0 1 4 J0 1 1
1 = sin 2 (vt + 0 ) dt = sin4 x dx
12 2 ml2 (1/v) 0 12 2 ml2 (1/v) 2v 20
Z 2
J0 4 J0 3
1 = 3 2
sin x dx = 3 2
24 ml 0 24 ml 4
quedando finalmente
J0
1 = (17.41)
32 2 ml2
por lo cual la variacion de 1 corresponde a una perturbacion secular. A primer orden, el incremento por
periodo se da a una razon constante dada por la Ec. (17.41). Para tiempos mucho mayores a un periodo no
perturbado, la variacion temporal de 1 se puede aproximar en la forma
1
1 1 t + 0 para t >> (17.42)
insertando (17.42) en la Ec. (17.37) obtenemos
r r
J1 IJ1 1
sin 2 vt + 1 t + 0 ; p = cos 2 vt + 1 t + 0 para t >> (17.43)
I
con lo cual vemos que al menos en promedio la solucion de primer orden sigue siendo armonica simple con
frecuencia
v = v + 1 (17.44)
podemos observar que v es una correccion para la frecuencia, pero no para el parametro v. Notese que ademas
J1 introduce una ligera modificacion en las amplitudes en (17.43). Usando la tercera de las Ecs. (17.35)
2E0 E0 l
J0 = 2
= 2
g
donde hemos usado (17.32). La variacion relativa de primer orden de la frecuencia para una amplitud finita 1
esta dada por
v v v 2
= = 1 = 1 (17.45)
v v v 16
17.4. EJEMPLOS EN TEORIA DE PERTURB. DEPENDIENTE DEL TIEMPO 497
a partir de la Ec. (17.38) y de la primera de las Ecs. (17.39), se puede obtener la variacion temporal de J en
primera aproximacion
K (J, w) J2 4
4J02
J1 = = Jv sin 2w = 2 sin3 2w0 cos 2w0
w J0 , w0 w 24 2 ml2 J0 , w0 24 2 ml2
J02
J1 = sin3 [2 (vt + 0 )] cos [2 (vt + 0 )]
3ml2
se ve de inmediato que la variacion de J1 es periodica y no secular ya que su valor promedio se anula incluso
para medio periodo. Fsicamente esto era de esperarse puesto que J es una medida de la amplitud de las
oscilaciones y dado que la perturbacion no es de naturaleza disipativa (o donativa), esta no sera tal que
produzca una disminucion o aumento sistematico de la amplitud en cada periodo.
Por otro lado, si estamos interesados en la correccion a primer orden para tiempos menores o del orden de
un periodo, ya no sera valida la aproximacion (17.42), y 1 debera obtenerse con base en la Ec. (17.40).
p2r p2 k h h
H= + +V ; V = n ; H = ; n2
2m 2mr 2 r r rn
donde h posee un valor pequeno tal que el segundo termino sea mucho menor al primero y se pueda considerar
una perturbacion. Nuevamente, consideremos el problema de Kepler no perturbado en el lenguaje de las
variables accion-angulo. En el problema no perturbado la posicion angular del periapside en el plano de la
orbita viene dada por la constante = 2w2 (ver Ec. 10.154). La perturbacion genera una dependencia
temporal para que generara la precesion del periapside, esta dependencia temporal se determina a traves de
las ecuaciones
K (K0 + K)
w2 = = =
2 J2 J20 ,0 J2
J20 ,0
teniendo en cuenta que los Hamiltonianos perturbado y no perturbado H y H0 coinciden numericamente con
los nuevos Hamiltonianos K y K0 respectivamente, y que K0 solo depende de J3 (ver Ec. 10.136, Pag. 254)
tenemos que
(K) (H)
w2 = = =
2 J2 J2
1 (H)
w2 = = (17.46)
2 2 l
donde hemos usado la relacion J2 = 2l siendo l el modulo del momento angular (ver Ec. 10.137, Pag. 255). En
la practica el valor de es muy pequeno de modo que la variacion de es casi imperceptible a lo largo de un
periodo. Por lo tanto, resulta mas interesante medir la variacion secular de tomada sobre muchos periodos
y es de poco interes el valor instantaneo de la variacion de . De lo anterior se sigue que la cantidad de interes
es el promedio de realizada sobre un periodo de la orbita no perturbada, que segun la Ec. (17.46) se escribe
como Z
1 (H)
dt
0 l
498 CAPITULO 17. TEORIA CANONICA DE PERTURBACIONES
la derivada se puede sacar de la integral puesto que solo es funcion de J3 como se ve en las Ecs. (9.174,
9.182), en tanto que la derivacion es con respecto a l = J2 /2. Por tanto
Z
1 H
= K dt = (17.47)
l 0 l
usamos ahora la conservacion del momento angular en la forma de la Ec. (10.100) l dt = mr 2 d escribimos
entonces la integral en terminos de
Z 2 n2 Z 2
mh d mh mk n2
H = = 1 + cos d (17.48)
l 0 r n2 l l2 0
donde hemos escrito a r en funcion de usando la ecuacion de la orbita (10.85). Solo los terminos que
contengan potencias pares de la excentricidad daran contribuciones no nulas a la integral. Vale decir ademas
que la derivada con respecto a l tambien contiene potencias de , puesto que solo es funcion de J2 y J3 .
Hay dos casos particularmente interesantes para los posibles valores de n, el primero es el caso en el cual
n = 2. Reemplazando n = 2 en (17.48), el promedio del Hamiltoniano de perturbacion es
2mh
H = ; n=2 (17.49)
l
y sustituyendo (17.49) en (17.47) la velocidad promedio de precesion secular es
2mh
= ; n=2 (17.50)
l2
Otro caso de interes es n = 3 para el cual las cantidades anteriores estan dadas por
Z 2
mh mk
H = 2
1 + cos d
l l 0
2m2 hk 6m2 hk
H = ; = (17.51)
l3 l4
este caso es de gran interes ya que la teora de la relatividad general predice una correccion del movimiento
Newtoniano con un potencial asociado de la forma h/r 3 . Mas especficamente, corresponde a la solucion
esfericamente simetrica de Schwarzchild de las ecuaciones de campo de Einstein, la cual corresponde a un
Hamiltoniano de perturbacion para el problema de Kepler de la forma
h kl2
H = ; h= (17.52)
r3 m2 c2
siendo c la velocidad de la luz en el vaco. Reemplazando este resultado en (17.51) se obtiene
6k2
= (17.53)
l2 c2
veamos una estimacion numerica para la precesion secular de un cuerpo que gira alrededor del sol. En tal caso
k = GmM y utilizamos la ecuacion (10.96) para la elipse no perturbada
l2 = mka 1 2
17.5. PERTURBACIONES INDEP. DEL TIEMPO: PRIMER ORDEN CON UN GRADO DE LIBERTAD499
donde R es el llamado radio gravitatorio del sol. Para el planeta Mercurio el valor numerico de (17.54) se
estima en
42,98/siglo
la precesion secular de este planeta es mas de 100 veces mayor que este valor, la razon estriba en que el efecto
dominante es la precesion de los equinoccios ( 90 %), seguido por el efecto perturbativo de los otros planetas
( 10 %), el efecto aqu calculado debido a la relatividad general equivale a 1 % del efecto total.
Vale la pena aclarar que al hallar no hemos puesto a actuar sobre h la derivada con respecto a l tal como
lo sugerira la Ec. (17.52). La razon es que h no depende funcionalmente de l como momento canonico, lo que
nos dice la Ec. (17.52) es como se determina el valor de la constante h en funcion del valor del parametro orbital
l. El potencial de perturbacion es funcion de las variables dinamicas solo a traves de r, no esta construido en
una forma dependiente de la velocidad.
H = H0 (J0 ) + H1 (17.57)
500 CAPITULO 17. TEORIA CANONICA DE PERTURBACIONES
siendo un parametro pequeno que podemos variar contnuamente a partir de cero. Dado que el sistema
perturbado sigue siendo periodico, la idea es encontrar un nuevo conjunto de variables accion angulo (w, J)
para tal sistema con H = H (J), que cumplan relaciones analogas a (17.55)
H (J)
v= ; w = vt + (17.58)
J
debemos tener en cuenta que de todas maneras (w0 , J0 ) siguen siendo variables canonicas para el sistema per-
turbado, puesto que la transformacion (q, p) (w0 , J0 ) es canonica independientemente de la forma particular
del Hamiltoniano como ya se ha mencionado en varias ocasiones. No obstante J0 ya no es constante y w0 ya
no es funcion lineal del tiempo. Sin embargo, la relacion (17.56) sigue siendo valida en el sistema perturbado
ya que esta ecuacion expresa la transformacion canonica (q, p) (w0 , J0 ), simplemente los valores de w0 y J0
deben ser modificados apropiadamente. En conclusion, q y p siguen siendo funciones periodicas de w0 con lo
cual se deduce que cuando q y p realizan un periodo completo del movimiento, tanto w como w0 deben avanzar
una unidad.
El hecho de que los dos conjuntos (w0 , J0 ) y (w, J) formen variables canonicas para el problema perturbado,
significa que deben estar conectados por una transformacion canonica con funcion generatriz W (w0 , J) que
se puede hallar mediante la ecuacion de Hamilton Jacobi para la funcion caracterstica de Hamilton. El hecho
de que el Hamiltoniano de perturbacion sea pequeno se debe manifestar en que la transformacion canonica
generada por W (w0 , J) solo se desve en una pequena cantidad con respecto a la identidad. Por tanto, tomando
la funcion generatriz tipo 2 para la identidad Ec. (7.22) Pag. 125, podemos escribir a primer orden en
ahora bien, la primera de las Ecs. (7.19), Pag. 124 en este caso queda
notese sin embargo, que H0 y H1 siguen dependiendo de a traves de la funcion generatriz W , como se aprecia
en (17.59), es necesario tener en cuenta que si el miembro derecho de la Ec. (17.63) es una aproximacion a
primer orden, debemos conservar terminos hasta primer orden tambien en el miembro izquierdo, lo cual implica
expandir H0 hasta primer orden y H1 hasta orden cero en . Teniendo en cuenta (17.59) y usando (17.60),
17.5. PERTURBACIONES INDEP. DEL TIEMPO: PRIMER ORDEN CON UN GRADO DE LIBERTAD501
en realidad la forma de W1 dada por (17.67) es la que nos garantiza que la nuevas variables (w, J) tambien sean
del tipo accion angulo8 . De la Ec. (17.67) se observa que el termino con k = 0 para la expansion de W1 /w0
(es decir el termino constante) debe anularse. Si en la Ec. (17.65) tomamos a ambos lados el promedio sobre
un periodo completo de w0 , tenemos que este promedio ya no dependera de w0 .
W1
v0 + H1 (w0 , J) = 1 (J) = 1 (J) (17.68)
w0
Donde hemos usado el hecho de que 1 solo depende de J, y por tanto dicho promedio no afectara a esta
cantidad. Por otra parte, puede verse que el promedio de W1 /w0 es nulo9
Z w0 +1
W1 W1
= dw0 = W1 w0 + 1, J W1 w0 , J = 0 (17.69)
w0 w0 w0
8
Estrictamente, la funcion que debe ser periodica de acuerdo con la Ec. (17.66), es W1 /J. En todo caso, puesto que la
derivada es con respecto a J, ello no afecta la periodicidad con respecto a la variable w o w0 .
9
Notese que para que el promedio de W1 /w0 sea nulo, es necesario que el termino constante en la expansion de esta derivada
sea nulo como ya se menciono.
502 CAPITULO 17. TEORIA CANONICA DE PERTURBACIONES
donde hemos usado la periodicidad de W1 con respecto a w0 Ec. (17.67). En consecuencia, la Ec. (17.68) queda
y teniendo en cuenta que 1 (J) es de orden cero en , las Ecs. (17.73, 17.74) se pueden escribir finalmente en
la forma
teniendo en cuenta las Ecs. (17.57, 17.62), se observa que la Ec. (17.75) nos dice como completar la depen-
dencia funcional de H con respecto a J a primer orden en . El Hamiltoniano de perturbacion se puede expresar
en funcion de las variables sin perturbar (w0 , J0 ) y se promedia para un periodo completo de movimiento. La
restante dependencia de J0 es la misma (hasta ese orden) que la de J correspondiente a 1 . La nueva frecuencia
se escribe usando (17.58, 17.62)
17.5.1. Pendulo plano con oscilacion finita usando metodo de perturbacion independiente
del tiempo
Ya habamos escrito el Hamiltoniano de perturbacion de este problema en la ecuacion (17.38), que lo
reescribimos en la forma
J2
H1 (w0 , J) = sin4 2w0
24 2 ml2
donde l corresponde a la longitud del pendulo. Lo mas conveniente para la asignacion del parametro es la
cantidad 12 que representa el cuadrado de la amplitud angular de oscilacion en el caso no perturbado. Por
tanto
J2
H1 (w0 , J) 12 H1 (w0 , J) H1 (w0 , J) = sin4 2w0
24 2 12 ml2
Para aplicar la Ec. (17.75), debemos calcular el valor medio de este Hamiltoniano promediado sobre un periodo
no perturbado
Z
J2 1 0 4
1 (J) = H1 (w0 , J) = sin [2 (v0 t + 0 )] dt
24 2 12 ml2 0 0
Z 1/v0
J 2 0
= sin4 [2 (v0 t + 0 )] dt
24 2 12 ml2 0
J2 3
1 (J) = 2 2 2
24 1 ml 8
J2
1 (J) = H1 (w0 , J) = (17.78)
6412 2 ml2
1 J
v v0 = = (17.79)
J 32 2 ml2 12
en virtud de (17.60), vemos que con el fin de calcular v v0 hasta primer orden en , podemos sustitur J por
J0 10
(J0 J1 )
v v0 =
32 2 ml2 12
J0
v v0 = 2 2 2 + O 2 (17.80)
32 ml 1
Por otro lado, de las Ecs. (9.111, 17.31) y (17.34) se deduce que
20 2E0 mgl12 2 2
J0 = = = = 1 mgl = 1 02 I = 12 0 ml2
0 0 0 0 0
2 2 2
J0 = 2 ml 1 v0
J0 2 2 ml2 12 v0 v0
v v0 2 2 2 = 2 2 2 =
32 ml 1 32 ml 1 16
v0 2 v0
v = 1
16 16
10
Esto respalda el hecho de que el promedio H1 (w0 , J) se puede reemplazar a primer orden por el promedio sobre variables no
perturbadas H1 (w0 , J0 ), como ya se discutio.
504 CAPITULO 17. TEORIA CANONICA DE PERTURBACIONES
lo cual concuerda con la Ec. (17.45). Notese que hemos encontrado el corrimiento en la frecuencia, sin resolver
la ecuacion (17.76) para W1 .
Por supuesto, es necesario extender el presente formalismo al caso en que hay varios grados de libertad.
Adicionalmente, las perturbaciones a orden superior a uno pueden ser de gran importancia, bien porque se
requiera una gran precision en los calculos o bien porque las contribuciones a primer orden sean nulas (este es
el caso del oscilador anarmonico como veremos mas adelante). Por estas razones, procederemos a estudiar el
caso de ordenes superiores para sistemas de varios grados de libertad.
siendo j, w0 , J0 vectores ndimensionales de los ndices enteros, variables accion y coordenadas angulares
respectivamente. Nuevamente el conjunto (w0 , J0 ) sigue siendo canonico en el sistema perturbado. El Ha-
miltoniano perturbado en funcion de estas variables se puede desarrollar en serie con respecto al parametro
con los valores de 0 , 1 , 2 etc. se pueden hallar las frecuencias perturbadas hasta un orden dado de . Con
un procedimiento analogo al que nos llevo a la Ec. (17.77) tenemos que
1 2
v = v0 + + 2 + ... (17.83)
J J
la funcion generatriz de la transformacion canonica (w0 , J0 ) (w, J) se escribe como W (w0 , J, ) y su
desarrollo en potencias de se escribe
posteriormente se expanden los dos miembros de (17.84) en potencias de y se igualan coeficientes de las
mismas potencias en . Ilustremos el caso de segundo orden para el cual la expansion de ambos miembros en
(17.84) se escribe
W W 2 W
H0 + H1 w0 , + H2 w0 , = 0 (J) + 1 (J) + 2 2 (J) (17.85)
w0 w0 w0
donde hemos usado (17.81, 17.82). Nuevamente cada termino del miembro izquierdo depende de a traves de
W/w0 . El analogo a la Ec. (17.60), se escribe como
W W1 W2
J0 = =J+ + 2
w0 w0 w0
ahora desarrollamos los terminos Hi en serie de Taylor en torno a J0 = J conservando en H0 los terminos
hasta 2 , en H1 los terminos hasta orden y en H2 los terminos de orden cero, lo ultimo equivale a sustitur
J0 J en H2 . Escribamos H0 y H1 en notacion matricial
W W1 2 W2 W1 2 W2 H0
H0 = H0 J + + = H0 (J) + + +
w0 w0 w0 w0 w0 J
1 W1^2 W2 2 H0 W1 2 W2
+ + + + ...
2 w0 w0 J J w0 w0
W W1 2 W2 H0 2 ^ W1 2 H0 W1
H0 = H0 (J) + + + + O 3
w0 w0 w0 J 2 w0 J J w0
W W1 H1
H1 w0 , = H1 (w0 , J) + 2 + O 3
w0 w0 J
W
2 H2 w0 , = 2 H2 (w0 , J) + O 3 (17.86)
w0
la ecuacion que relaciona a w con w0 , analoga a la Ec. (17.66) esta dada por
W W1 W2
w= = w0 + + 2 + ... (17.91)
J J J
506 CAPITULO 17. TEORIA CANONICA DE PERTURBACIONES
cuando se completa un periodo de movimiento en el plano (qm , pm ), tanto wm como w0m aumentan en la unidad.
Por tanto, cuando se cumple un ciclo en (qm , pm ), las cantidades Wk /J, deben retornar a sus valores iniciales
para que se cumpla la Ec. (17.91). En consecuencia, todos los terminos Wk deberan ser funciones periodicas
de w0 , por tanto X (k)
Wk (w0 , J) = Bj (J) e2ijw0 (17.92)
j
de modo que las expansiones de todas las derivadas Wk /w0i careceran de termino constante. Tomando
promedio sobre un periodo de todas las w0 a ambos lados de las Ecs. (17.88, 17.89) y teniendo en cuenta que
las i no dependen de w0 se tiene que
W1
1 (J) = 1 (J) = v0 + H1 (w0 , J) (17.93)
w0
W2
2 (J) = 2 (J) = v0 + 2 (w0 , J) (17.94)
w0
con el mismo argumento que nos llevo a la Ec. (17.69), tenemos que
W1 W2
= =0 (17.95)
w0 w0
Sumando y restando los promedios H 1 , 2 , las Ecs. (17.87, 17.88, 17.89, 17.90) se pueden escribir en la forma
y teniendo en cuenta las Ecs. (17.96, 17.97), los terminos entre parentesis cuadrados en las Ecs. (17.99, 17.100)
deben anularse y se obtiene
muestra que 2 contiene productos de W1 /w0 con funciones periodicas en w0 , y aunque el promedio de
W1 /w0 es nulo, no hay garanta de que el promedio de los productos se anule. Esto nos da como consecuencia
que 2 = 2 es en general no nulo. Ahora bien, puesto que 2 es funcion de W1 , vemos que la correccion de
segundo orden en las frecuencias requiere conocer la transformacion canonica a primer orden. No obstante, la
Ec. (17.90) es independiente de W2 de modo que la correccion de W a segundo orden no es necesaria para
(1)
calcular la correccion a segundo orden de la frecuencia11 . En principio los coeficientes Bj (J) que definen a
W1 a traves de la ecuacion (17.92) se pueden hallar directamente de (17.104) con i = 1.
W1
v0 = H 1 H1 (w0 , J) (17.105)
w0
Ahora bien, dado que W1 es funcion periodica de las w0 segun (17.92), tenemos que w0 W1 tambien es funcion
periodica de las w0 con coeficiente constante nulo como ya se discutio. Por tanto, el miembro derecho de
(17.105) se puede desarrollar en serie de Fourier similar a la Ec. (17.56) o a la Ec. (17.92) pero sin termino
constante X
H 1 H1 = Cj (J) e2ijw0 (17.106)
j6=0
reemplazando la Ec. (17.92) con k = 1 en (17.105), tenemos que el producto punto a la izquierda de (17.105)
se puede escribir como
W1 X (1)
v0 = 2i Bj (J) (j v0 ) e2ijw0 (17.107)
w0
j6=0
(1)
y recurriendo a la independencia lineal de los exponenciales, tenemos que los coeficientes Bj de la expansion
de W1 se escriben como
(1) Cj (J)
Bj (J) = , j 6= 0 (17.108)
2i (j v0 )
vemos que no hemos obtenido el termino constante i.e. con j = 0, pero en las expresiones para las i Ecs.
(17.87, 17.88, 17.89, 17.90) solo intervienen las derivadas W1 /w0 y estas no contendran terminos constantes.
Para ordenes superiores al segundo el procedimiento es analogo, aunque las transformaciones algebraicas
seran mas complejas. En general, para la transformacion de orden kesimo podemos escribir k en la forma
Wk
k (J) = v0 + k (w0 , J) (17.109)
w0
donde el primer termino a la derecha de (17.109) viene del termino de primera derivada del desarrollo de Taylor
de H (J0 ) alrededor de J0 = J donde todos los terminos de la diferencia J0 J se conservan hasta orden k . La
funcion Wk solo aparece en este termino de modo que k solo podra contener las funciones generatrices Wm
para ordenes menores que k. Por los razonamientos hechos para primer y segundo orden el primer termino
del miembro derecho en (17.109) tiene media nula cuando se promedia para ciclos completos de w0 y por
tanto las Ecs. (17.103, 17.104) seran validas a todos los ordenes. Es claro que para k > 2, k se vuelve mucho
mas complicado que la Ec. (17.90), y contiene a todas las funciones encontradas en los calculos de los ordenes
precedentes.
Veremos mas adelante que en presencia de degeneracion de las frecuencias del sistema no perturbado,
aparecen problemas con esta formulacion. De momento veamos un ejemplo sencillo.
11
De nuevo esto tiene su contrapartida en la teora cuantica de perturbaciones, ya que la correccion perturbativa de segundo
orden para la energa, requiere conocer la funcion de onda a primer orden.
508 CAPITULO 17. TEORIA CANONICA DE PERTURBACIONES
recordando que q0 es una amplitud de referencia, es natural tomarla como la amplitud maxima que tendra el
oscilador con una energa dada E0 en el sistema sin perturbar i.e.
con esta amplitud de referencia12 , podemos decir a partir de la Ec. (17.117) que la variacion relativa de segundo
orden de la frecuencia esta dada por
v v v0 v0 1 2 1516 v0
= =
v0 v0 v0
quedando finalmente
v 15
= 2
v0 16
de modo que el efecto de la perturbacion es disminur ligeramente la frecuencia armonica asociada.
donde w0 representa las m variables degeneradas que tienen valor cero en el problema no perturbado y J0 son
naturalmente sus momentos conjugados. Las variables no primadas estan entonces asociadas a las variables no
degeneradas. Se ve entonces que la transformacion canonica elimina a las variables rapidas de modo que todo
queda en funcion de las variables lentas. Por otro lado, puesto que es cclica en w, los momentos transformados
J son verdaderas constantes de movimiento y se puede considerar (J, J0 , w0 , ) como un Hamiltoniano de un
sistema con m grados de libertad. Adicionalmente, dado que 0 (J) es constante, y por tanto independiente
de las demas variables, este termino no sera necesario para plantear las ecuaciones de movimiento asociadas a
las variables (w0 , J0 ) y se podran suprimir en . En consecuencia, el nuevo Hamiltoniano efectivo es de orden
, y podemos redefinir el Hamiltoniano no perturbado como
1 J, J0 , w0
y en este problema no perturbado w0 ya no consiste en valores nulos. Si solo hay una condicion de degeneracion,
el problema efectivo es de un solo grado de libertad y formalmente integrable. Con la presencia de mas de
una degeneracion se suele buscar una segunda transformacion canonica para eliminar los terminos de variables
lentas de forma similar a como se eliminaron las variables rapidas, este procedimiento es muy complejo en la
practica.
Puede aducirse a partir de la Ec. (17.108) que incluso cuando las frecuencias no son degeneradas, apareceran
inevitablemente valores pequenos del divisor j v0 a medida que los ndices j se hacen mas grandes. Este
fenomeno se conoce como resonancia, e implica que la amplitud de uno de los terminos de Fourier se haga muy
grande. Sin embargo, esto no supone un gran problema para la mayora de Hamiltonianos de perturbacion que
se usan en la practica. Para ver esto, notemos que en (17.108) lo que cuenta es el factor completo
Cj
(17.118)
j v0
donde Cj es el coeficiente de Fourier del Hamiltoniano de perturbacion H1 como se ve en (17.106). En mecanica
celeste ocurre que la mayora de Hamiltonianos de perturbacion poseen la caractersitca de DAlembert
que en terminos eursticos nos dice que cuando los valores de los enteros en j son mayores que el exponente del
parametro en el Hamiltoniano, las magnitudes de Cj caen rapidamente, usualmente en forma exponencial,
cuando aumentan los valores de los ndices j. Los cocientes del tipo dado en (17.118) no crecen entonces
demasiado y la expansion converge cuando las frecuencias v0 satisfacen una condicion de inconmesurabilidad.
El comportamiento resonante cuando se tiene la caracterstica de DAlembert o en general cuando se cumple
la condicion
Cj
<O
(j v0 )
13
Debemos recordar que las frecuencias nulas no perturbadas no eran frecuencias fsicas sino una manifestacion de la degeneracion.
En tal sentido, sus pequenos valores perturbados estan relacionados no con frecuencias fsicas perturbadas sino con desdoblamientos
de frecuencias que eran degeneradas antes de la introduccion de la perturbacion.
17.8. ASPECTOS CUALITATIVOS DE LA TEORIA CLASICA DE PERTURBACIONES 511
se conoce como resonancia superficial. Estas resonancias en general no son un problema para la expansion
perturbativa. En ocasiones sin embargo, el anterior cociente se hace grande, i.e. mayor que O ( ) en cuyo caso
hablamos de resonancias profundas. Cuando aparecen resonancias profundas se requiere de tecnicas especiales
tales como el desarrollo de Bohlin en el cual se expande en potencias de en lugar de potencias de .
Un estudio profundo de este tema requiere un tratamiento exhaustivo de los fenomenos de resonancia en
oscilaciones alineales.
Hemos mencionado que la teora de perturbaciones ha evolucionado junto con la mecanica celeste desde
los tiempos de Newton. De otra parte, la exploracion espacial y la tecnologa desarrollada alrededor de esta,
junto con el rapido desarrollo de los recursos computacionales, ha impulsado enormemente el desarrollo de los
metodos perturbativos. A manera de ejemplo, la correccion de la relatividad general estudiada en la seccion
(17.4.3) resulta lo suficientemente grande para la precision requerida en los sistemas de posicionamiento global
satelital (GPS).
A grandes rasgos se distingue entre los metodos perturbativos generales que conducen a formulas analticas
y metodos de perturbacion especiales, que nos llevan a respuestas numericas correspondientes al sistema
perturbado. Hay tambien metodos mixtos de modo que esta clasificacion es en realidad aproximada. Los
metodos numericos solo alcanzaron un desarrollo considerable con el desarrollo de las calculadoras y mas
adelante de los computadores.
Vale mencionar sin embargo, que las soluciones numericas no pueden resolver cuestiones referentes a la
estabilidad a largo plazo de los sistemas perturbados. En esa direccion, un debate de gran interes concierne a
la estabilidad del sistema solar. Por ejemplo, las perturbaciones podran llevar a colisiones interplanetarias o
a que un planeta abandone el sistema solar. Por esta razon, desde el principio del desarrollo de los metodos
perturbativos existio un gran interes en estudiar los terminos perturbativos seculares. Por ejemplo, si se iden-
tifica un termino de perturbacion secular para el semieje mayor de la trayectoria de un planeta, se concluira
que el planeta abandonara el sistema solar o colapsara hacia el sol. Si bien al principio se demostro que no
existan terminos seculares a primer orden, los trabajos de Poincare en donde demuestra que las series de
Fourier multiperiodicas que aparecen a orden superior solo son semiconvergentes llevo a una indeterminacion
en el problema de la estabilidad.
La cuestion de la estabilidad solo se aclaro a raz de la aplicacion mas bien reciente de tecnicas matematicas
avanzadas. Por medio del uso de la topologa diferencial es posible examinar el comportamiento global de las
posibles orbitas en el espacio de fase. Con base en estos estudios se demostro que es posible el movimiento
acotado estable de un sistema de n cuerpos bajo interaccion exclusivamente gravitatoria. Especficamente un
grupo de medida finita de orbitas estan confinadas a regiones concretas del espacio de fase y permanecen
as indefinidamente en movimiento cuasi periodico. Debe decirse sin embargo, que aunque algunas orbitas
(un conjunto de medida finita) mantienen un movimiento cuasiperiodico permanente, la inmensa mayora de
condiciones iniciales conducen a movimientos ergodicos es decir que llenan completamente una cierta region
del espacio de fase, de modo que la trayectoria en el espacio de fase pasa por un punto dado en el interior de
esta region en uno o mas instantes de tiempo.
De lo anterior se deduce que el problema de la estabilidad no esta del todo resuelto puesto que solo un
conjunto de condiciones iniciales permite este movimiento estable y adicionalmente las fuerzas disipativas y
otras fuerzas no gravitatorias (e.g. interacciones magneticas entre los planetas y el sol) deben ser tenidas en
cuenta en tal estudio. El sistema puede ser ademas muy sensible a las condiciones iniciales o a efectos de
cuerpos fuera del sistema solar.
512 CAPITULO 17. TEORIA CANONICA DE PERTURBACIONES
la conveniencia de usar una funcion de tipo F1 en lugar de la funcion tipo F2 que sale de la solucion de
Hamilton Jacobi, proviene del hecho de que W es funcion periodica de w0 como veremos mas adelante14 .
Cuando a vara en el tiempo (w0 , J0 ) continuan siendo variables canonicas pero la funcion generatriz ahora
depende explcitamente del tiempo por medio de la dependencia temporal de a. Por tanto el Hamiltoniano
perturbado para el sistema (w0 , J0 ) vendra dado por la Ec. (7.17) Pag. 123
W a W
K (w0 , J0 , a) = H (J0 , a) + = H (J0 , a) +
t t a
W
K (w0 , J0 , a) = H (J0 , a) + a (17.120)
a
notese que en el ultimo paso hemos usado el hecho de que a solo depende del tiempo. Ahora J0 no es constante
y w0 ya no es funcion lineal del tiempo. El segundo termino a la derecha de (17.120) es un Hamiltoniano
14
Ver tambien la discusion en la Pag. 202, despues de la Ec. (9.142).
17.9. INVARIANTES ADIABATICOS 513
de perturbacion. Notese que hemos usado la misma transformacion canonica para generar dos Hamiltonianos
diferentes a partir del mismo Hamiltoniano original H (q, p). Primero usando la transformacion canonica con
a constante llegamos de H (q, p, a) a H (J0 , a); ambos Hamiltonianos coinciden numericamente ya que la
funcion caracterstica no depende explcitamente del tiempo. Posteriormente, usamos la misma transformacion
canonica pero ahora con a variable en el tiempo para ir desde H (q, p, a (t)) hacia K (w0 , J0 , a (t)), en este caso
los Hamiltonianos no coinciden numericamente ya que W adquiere dependencia explcita con el tiempo15 por
medio de a (t). De lo anterior se concluye que la relacion entre los Hamiltonianos K (w0 , J0 , a) y H (J0 , a) en
(17.120) no proviene de una transformacion canonica adicional, sino mas bien de la diferencia entre la misma
TC cuando a se considera constante y cuando a se considera variable en el tiempo.
La dependencia temporal de J0 viene regida por una de las ecuaciones de Hamilton
K W
J0 = = a (17.121)
w0 w0 a
donde hemos aplicado (17.120). Al igual que en el metodo de variacion de constantes, tanto la derivada entre
parentesis como el nuevo Hamiltoniano K se expresan en terminos de J0 , es decir del valor de J a orden cero
en perturbaciones. Dentro de un desarrollo perturbativo a primer orden buscaremos un termino secular, que
sera el valor medio de J0 a lo largo de un periodo del movimiento no perturbado para un valor apropiado de
a. La variacion adiabatica de a, nos permite considerar al parametro a como una constante a lo largo de un
periodo y el valor medio se puede escribir en la forma
Z Z
1 W a W
J0 = a dt = dt + O a2 , a (17.122)
0 w0 a 0 w0 a
De la Ec. (9.16) recordamos que W se puede ver como una accion abreviada indefinida Ec. (9.16) Pag. 171
Z
W = p dq
y teniendo en cuenta la definicion de J0 Ec. (9.102), Pag. 193, vemos que en un periodo de movimiento, la
funcion generatriz W aumenta en una cantidad J0 . Similarmente, J0 w0 tambien aumenta en J0 puesto que
w0 aumenta en la unidad. En consecuencia, los terminos a la derecha en la Ec. (17.119) cancelan su variacion
en un periodo, con lo cual se obtiene que W es funcion periodica de w0 y tanto ella como su derivada con
respecto a a, pueden expresarse como expansion de Fourier
W X
= Ak (J0 , a) e2ikw0 (17.123)
a
k
la integral se anula puesto que el integrando no tiene ningun termino constante. Se obtiene entonces finalmente
J0 = O a2 , a (17.124)
de modo que J0 no tendra variacion secular de primer orden en a, por tanto tenemos la propiedad de invarianza
adiabatica a primer orden. Es importante insistir en el hecho de que a debe ser un parametro que solo dependa
del tiempo, de modo que sea independiente de las variables canonicas.
15
Podra decirse que la dependencia temporal de W es en realidad implcita por medio de a (t). No obstante, dado que a (t) es
un parametro pero no es una variable canonica, esta dependencia se considera explcita para efectos de las Ecuaciones de Hamilton.
Es decir, cuando el tiempo se mueve manteniendo constantes las variables w0 , J0 del problema, W cambia numericamente (en
virtud del cambio en el parametro a (t)), por lo cual hablamos de dependencia explcita. Por tanto, este formalismo requiere que
el parametro a (t) sea independiente de las variables canonicas.
514 CAPITULO 17. TEORIA CANONICA DE PERTURBACIONES
es decir su expansion de Fourier consta de solo dos terminos. La expresion para J0 se obtiene reemplazando
(17.131) en la Ec. (17.121)
W J0
J0 = = sin 4w0
w0 w0 4
J0 = J0 cos 4w0 (17.132)
La Ec. (17.132) es formalmente exacta. Similarmente, la dependencia temporal exacta de w0 la determina la
ecuacion de Hamilton para w0 usando el Hamiltoniano perturbado (17.120) junto con (17.131)
K (w0 , J0 , ) H (J0 , ) W (w0 , J0 , ) J0
w0 = = + = v0 + sin 4w0
J0 J0 J0 J0 4
w0 = + sin 4w0 (17.133)
2 4
de acuerdo a la Ec. (17.124), si queremos calcular un valor medio de J0 que incluya una correccion no nula,
debemos hacer algunas aproximaciones. En primer lugar, asumamos que para un periodo del movimiento
perturbado el cociente definido por
(17.134)
es constante y cumple la relacion << 1. La Ec. (17.134) tiene una solucion de la forma
= = 0 et 0 (1 + t) para t . (17.135)
donde t se mide desde el inicio del intervalo donde se mide el periodo y (0) = 0 . Reemplazando (17.134) y
(17.135) en (17.133) resulta
0 (1 + t)
w0 = + sin 4w0 + sin 4w0 (17.136)
2 4 2 4
cuya solucion a orden cero en , es
(0) 0 (0)
w0 = 2w0 = 0 t
2
donde se ha hecho cero la constante de integracion a traves de una eleccion adecuada de la fase inicial. Con
esta eleccion de fase se tiene que
4w0 = 20 t
Reemplazando esta expresion en la Ec. (17.136), obtenemos w0 a primer orden en
(1) 0 (1 + t)
w0 = + sin 20 t
2 4
(1)
2 w0 = 0 + 0 t + sin 20 t
2
cuya solucion es
(1) 2 1 cos 20 t
2w0 (t) = 0 t + 0 t + (17.137)
2 20
(1)
donde por simplicidad hemos elegido w0 (0) = 0.
Veamos ahora la solucion para J0 . De la Ec. (17.132) tenemos que
J0 d ln J0
= cos 4w0 = cos 4w0 (17.138)
J0 dt
516 CAPITULO 17. TEORIA CANONICA DE PERTURBACIONES
donde hemos usado (17.134). Ahora reemplazamos (17.137) en la segunda de las Ecs. (17.138) con lo cual se
obtiene
d ln J0 4 2 1 cos 20 t
= cos 0 t + 0 t + + O 3
dt 2 2 20
lo cual nos da la ecuacion a segundo orden para d ln J0 /dt, o equivalentemente, para J0 /J0
d ln J0 1 cos 20 t
2
= cos 20 t + 0 t + + O 3
dt 20
d ln J0 1 cos 20 t
= cos [x + y] + O 3 ; x 20 t ; y 0 t2 +
dt 20
expandiendo la suma en el coseno y luego los senos y cosenos en serie, usando a como parametro de expansion,
se obtiene
d ln J0
= cos [x + y] + O 3 = sin x sin (y) cos x cos (y) + O 3
dt
= ( sin x) y + O 3 cos x 1 + O 2
d ln J0
= 2 y sin x cos x + O 3
dt
y recordando las definiciones de x e y se tiene que
d ln J0 2 2 1 cos 20 t
= cos 20 t + 0 t + sin 20 t + O 3
dt 20
como se indico en el formalismo general, el comportamiento secular se obtiene promediando esta ecuacion
sobre un periodo de movimiento es decir desde t = 0 hasta 2/0 . En el miembro derecho solo sobrevive el
termino proporcional a t2 una vez que se hace el promedio.
Z Z 2/0
d ln J0 1 2 2 0 2
= 0 t sin 20 t dt = 0 t2 sin 20 t dt
dt 0 2 0
2
d ln J0 2 2
2 ( ) 0 ( )2
= = = =
dt 0 0 2 0 (2/0 )2 4
!
d ln J0 J0 0 2
= = ; = << 1
dt J0 4
de modo que es la variacion relativa de a lo largo de un periodo completo . La variacion secular relativa
de J se calcula aproximando el valor de J al valor constante no perturbado J0 de modo que
!
J J0 J0 0 2 0 2 2
= =
J J0 J0 4 4 0
J 2
para t . (17.139)
J 2
donde la condicion t . , proviene de la Ec. (17.135). La Ec. (17.139) nos dice que la variacion secular de la
variable de accion es de segundo orden tal como se vio en el formalismo general, Ec. (17.124). Solo considerando
terminos del orden 2 = (/)2 podemos encontrar variaciones de J a largo plazo. Notese que hemos supuesto
que es constante, con lo cual despreciamos las contribuciones debidas a , que en principio pueden ser
comparables a las de 2 como se aprecia en la Ec. (17.124).
17.9. INVARIANTES ADIABATICOS 517
d d
= =
d (t) dt
el parametro temporal reescalado nos mide si vara lenta o rapidamente. Consideraremos el cambio de J no
sobre un periodo de movimiento sino a lo largo de su valor inicial y final asintotico es decir desde t hasta
t . En cada estado asintotico se asume que J adquiere valor constante. Es posible llegar al sorprendente
resultado de que para (t ) bien comportado, la variacion entre los estados asintoticos es mucho menor de lo
que se podra esperar en la Ec. (17.139)16 . Mas especficamente se ha demostrado que si (t ) es real, acotada
y analtica sobre y en torno al eje real, la variacion de J es exponencialmente decreciente con en la forma
J (+) J ()
O ed/
J (+)
siendo d un numero real positivo, que esta relacionado con la anchura de la franja de analiticidad de en el
plano t complejo.
17.9.3. Un invariante exacto del oscilador armonico con frecuencia dependiente del tiem-
po (opcional)
Es interesante ver que el oscilador armonico con frecuencia dependiente del tiempo, posee un invariante
exacto que en el lmite de variacion lenta se reduce a la variable de accion J. Supongamos un oscilador armonico
lineal con Lagrangiano y Hamiltoniano dados por
m 2 1 2
L= x 2 (t) x2 ; H= p + m2 2 (t) x2 (17.140)
2 2m
el invariante (adimensional) que mencionamos tiene la forma
" #
1 x2 (r x xr)2
I= + (17.141)
2 r2 h20
donde h0 es una constante arbitraria con unidades de longitud al cuadrado sobre tiempo, y la variable r (t) es
una funcion que satisface la ecuacion diferencial
por simplicidad podemos elegir h0 como la unidad en el sistema de unidades en el que estamos trabajando
(aunque esto no es obligatorio). Por ejemplo, si estamos en MKS es conveniente elegir h0 = 1m2 seg 1 , si
estamos en cgs conviene tomar h0 = 1cm2 seg1 . La deduccion matematica de la invarianza de I es mas bien
compleja y resulta mas ilustrativo hacer algunas consideraciones que nos den su significado fsico y la razon
de porque es constante. Consideremos el movimiento del oscilador armonico unidimensional con frecuencia
constante, como la proyeccion sobre x de un oscilador bidimensional isotropo. Esta consideracion permanece
16
En todo caso la ecuacion (17.139) es valida bajo la condicion t . . Por tanto, no es de esperarse que se pueda extrapolar
mucho mas alla de esta condicion.
518 CAPITULO 17. TEORIA CANONICA DE PERTURBACIONES
valida incluso cuando depende del tiempo. Consideremos entonces un potencial central de tipo armonico17
pero dependiente del tiempo
m
V = 2 (t) r 2 (17.143)
2
su Lagrangiano es
mh 2 i m
L= r + r 2 2 2 (t) r 2 = x2 2 (t) x2 + y 2 2 (t) y 2 (17.144)
2 2
en coordenadas cartesianas esto se desdobla en dos osciladores armonicos lineales independientes con la misma
frecuencia. Cada uno de ellos cumple con la estructura dada por la Ec. (17.140). En coordenadas polares planas
se ve que es cclica, de modo que se sigue conservando el momento angular con = (t), de esto se sigue
que una de las ecuaciones de movimiento se reduce a18
l
r 2 = h (17.145)
m
donde hemos introducido la constante de movimiento h, la cual tiene las mismas unidades que h0 . Con esto
podemos seguir considerando al oscilador lineal como la proyeccion en x de un oscilador bidimensional isotropo,
donde h nos da su momento angular por unidad de masa. La ecuacion radial asociada al Lagrangiano (17.144)
resulta
d L L
= mr ; = mr 2 mr 2 (t)
dt r r
r 4 2
mr + m 2 r mr 2 = 0 r + 2 r r 2 = 0 r + 2 r =0
r3
y teniendo en cuenta la Ec. (17.145) resulta
h2
r + 2 r =0 (17.146)
r3
y usando la conservacion de h se puede construr una constante de movimiento dada por
" #
2 x2 2
1 h (r x x r)
I = + (17.147)
2 h20 r 2 h20
por otro lado, dada la arbitrariedad en la amplitud inicial de y y de la fase inicial del movimiento bidimensional
en x e y es posible escoger estos valores de tal manera que h coincida numericamente con h0 . Para ver esto,
supongamos que durante un cierto periodo de tiempo permanece constante con valor 0 , en este intervalo
la dependencia temporal de x e y esta dada por
x = x0 sin 0 t ; y = y0 cos (0 t + )
y teniendo en cuenta que el movimiento bajo potencial central descrito por la ecuacion (17.146), es en un
plano (el plano XY ), el momento angular va en la direccion Z de modo que el modulo del momento angular
esta dado por l = |Lz |, y usando la definicion de h se tiene
ahora hacemos variar con el tiempo, en tal caso h conservara su valor inicial que se puede hacer igual a h0
eligiendo adecuadamente y0 o para un valor dado de x0 , es decir para un valor especfico de la amplitud
del movimiento unidimensional real. De esto se concluye que siempre es posible asociar a cualquier oscilador
unidimensional dependiente del tiempo, un oscilador isotropo bidimensional con h/h0 = 1. Notese que para
este problema asociado, la ecuacion de movimiento radial (17.146) se reduce a la Ec. (17.142) cuando h = h0 .
De la misma forma I de la Ec. (17.147) se convierte en el invariante I de la Ec. (17.141) cuando se toma
h = h0 .
De lo anterior vemos que Fsicamente la invarianza exacta de la cantidad I asociada a un oscilador uni-
dimensional y expresada en la Ec. (17.141), es una manifestacion de la conservacion del momento angular en
el problema del oscilador isotropo bidimensional asociado, que tiene como proyeccion en x al oscilador unidi-
mensional en cuestion. A su vez, la conservacion del momento angular en el oscilador bidimensional isotropo
esta relacionada con el hecho de que el caracter central de la fuerza no se modifica cuando se introduce la
variacion temporal de .
Veamos ahora la relacion de I con la variable
p de accion J. Si es constante, una solucion posible para
la ecuacion radial (17.146) con h = h0 es r = h0 / que es obviamente constante. Esto corresponde a una
trayectoria circular en el problema bidimensional asociado. Dado que en este caso r = 0, la ecuacion (17.141)
nos da
r !2
1 x2 1 h0 2 1 2 x2 m E J0 v0
I = p 2 + 2 x = x + = x2 + 2 x2 = =
2 h0 2h0 2mh0 mh0 2mv0 h0
h0 /
J0
I =
2mh0
de modo que en la aproximacion de orden cero el invariante exacto es proporcional a la variable de accion J,
la cual es invariante solo a primer orden en un proceso adiabatico.
dv qB
=v (17.148)
dt mc
520 CAPITULO 17. TEORIA CANONICA DE PERTURBACIONES
la Ec. (17.148) nos dice que v es perpendicular a su razon de cambio y por tanto la rapidez es constante.
En particular si v y B son perpendiculares en un instante dado, el movimiento se realizara en un plano
perpendicular a las lneas de campo. En tal caso veremos que el vector v gira alrededor de una lnea de campo
magnetico con velocidad angular
qB
c = (17.149)
mc
Elijamos uz a lo largo de B y escribamos en coordenadas cilndricas
dv
B = Buz ; v = rur + r u + zuz ; a = = r r 2 ur + 2r + r u + zuz
dt
la Ec. (17.148) queda
q h i q q
r r 2 ur + 2r + r u + zuz = rur + r u + zuz Buz = rBu + Br ur
mc mc mc
q q
r r 2 = Br ; 2r + r = rB ; z = 0
mc mc
q q
r r 2 Br = 0 ; 2r + r + rB = 0 ; z = 0 (17.150)
mc mc
antes de analizar las soluciones veremos que el problema lo podemos plantear en el marco de la mecanica
lagrangiana usando el siguiente Lagrangiano no relativista para el sistema
mv 2
L= +MB (17.151)
2
siendo M el momento dipolar magnetico de la partcula en movimiento. En terminos del momento angular
esto se escribe
qL
M= (17.152)
2mc
usando coordenadas cilndricas, el vector L se escribe como
L = r p = m r v = m (rur + zuz ) rur + r u + zuz = m r 2 uz r zu + z ru rz ur
h i
L = m r 2 uz + (z r r z) u rz ur
q h 2 i qr 2
M= r uz + (z r r z) u rz ur ; Mz = (17.153)
2c 2c
y teniendo en cuenta que B = Buz , el Lagrangiano (17.151) queda
m 2
L = r + r 2 2 + z 2 + Mz B
2
m 2 q
L = r + r 2 2 + z 2 + Br 2
2 2c
es cclica de modo que se conserva su momento conjugado
qBr 2
p = mr 2 + (17.154)
2c
la ecuacion de movimiento radial se obtiene de la ecuacion de Lagrange para r
d L L 2 qB qB
= mr ; = mr + r mr r m + =0
dt r r c c
17.9. INVARIANTES ADIABATICOS 521
qB
r r + =0 (17.155)
mc
la cual coincide con la primera de las Ecs. (17.150). La segunda de las Ecs. (17.150) se obtiene de la ecuacion
de Lagrange para o combinando las Ecs. (17.154, 17.155).
Una solucion de movimiento estacionario para las Ecs. (17.150) consiste en tomar r constante19 , con lo cual
la segunda de las Ecs. (17.150) nos conduce a c constante. Reemplazando r y constantes en la primera
de las Ecs. (17.150) se obtiene
q q
rc2 Brc = 0 c + B c = 0
mc mc
de modo que el valor de sera
qB
= c (17.156)
mc
que coincide con (17.149). De la tercera de las Ecs. (17.150), podemos ver que la ecuacion para la coordenada
z esta totalmente desacoplada y que la velocidad en z es constante. Si z = 0 el movimiento es circular uniforme
con frecuencia c dada por (17.156), si z 6= 0 el movimiento sera un helicoide con la misma frecuencia angular
y las mismas ecuaciones para r y .
Reemplazando (17.156) en (17.154) vemos que p adquiere el valor
qB qBr 2 qBr 2 1 qBr 2
p = mr 2 + = +
mc 2c c 2 c
qBr 2
p =
2c
y puesto que r es constante, la cantidad p es constante de movimiento como ya se anticipo. Ahora calcularemos
la variable de accion asociada a , como esta coordenada es cclica tiene movimiento periodico de rotacion en
el espacio de fase y su periodo natural sera 2 (ver discusion de la Ec. 9.122) con lo cual
I
qBr 2
J = p d = (17.157)
c
si asumimos que z = z = 0, y puesto que r = = 0, el movimiento es circular uniforme y el momento angular
(y por tanto el momento dipolar magnetico) va a lo largo de z, de modo que Mz = M . Usando ademas (17.153),
podemos escribir
qr 2 c qr 2 2M
M= = (17.158)
2c c c
sustituyendo (17.158) en (17.157), y usando (17.156), la variable canonica J puede escribirse en la forma
2M B 2mc
J = = M (17.159)
c q
Ahora bien, el campo magnetico puede tomarse como parametro dependiente del tiempo (a (t) B (t)) para
examinar la invarianza adiabatica de J . El teorema de invarianza adiabatica Ec. (17.124), dice que ante
una variacion temporal lenta del campo magnetico, J permanece constante al menos a primer orden. La Ec.
(17.159) nos dice ademas que el momento magnetico M tambien es un invariante adiabatico. A partir de la
Ec. (17.157), se tiene que
q q
J = B r 2 = BA
c c
siendo A el area del crculo descrito por la orbita de la carga. Por tanto, la invarianza adiabatica de M (o de
J ) se puede enunciar de forma alternativa diciendo que el producto del campo por el area encerrada por la
orbita se mantiene constante a primer orden20 , bajo una ligera variacion temporal del campo magnetico.
19
Esto implica (como condicion inicial) que la proyeccion de la velocidad en el plano XY es totalmente transversal.
20
Por supuesto, una ligera variacion temporal de B implica que A debe variar ligeramente para que BA sea constante. Por tanto
la trayectoria solo es aproximadamente circular.
522 CAPITULO 17. TEORIA CANONICA DE PERTURBACIONES
Habamos enfatizado que la validez del teorema de invarianza adiabatica estaba supeditada a que el parame-
tro en cuestion dependiera exclusivamente del tiempo. Si por ejemplo B = B (r) entonces el parametro (campo
magnetico) sera funcion de las variables canonicas del sistema fsico (carga puntual), y por tanto ya no es valida
la Ec. (17.124). En consecuencia, es posible que aparezca una variacion adiabatica de M si permanece estatica
la configuracion del campo magnetico pero este es ligeramente no uniforme. Si por ejemplo el campo depende
de z y la partcula tiene una pequena componente z de la velocidad, esta se desplazara lentamente a regiones
con valor diferente de B. Las Ecs. (17.152, 17.156) nos dicen que la energa cinetica transversal, es decir la
correspondiente al movimiento alrededor de las lneas de B viene dada por
1 2 mr 2 2 1 2 1 1 2M mc qB
T = mv = = mr = |L| |c | =
2 2 2 2 2 q mc
T = M B (17.160)
supongamos que la partcula cargada es llevada hacia una direccion en donde B crece, la Ec. (17.160) nos
dice que en tal caso la energa cinetica transversal aumenta. Ahora bien, dado que la energa cinetica total se
conserva (puesto que la rapidez es constante como se puede ver de la Ec. 17.148), es necesario que disminuya
la componente de la velocidad que va a lo largo de las lneas de fuerza i.e. la componente radial, tambien puede
haber variacion de la componente en z pero si asumimos que esta velocidad es muy pequena, la mayor parte de
la variacion sera en las velocidades radial y transversal. La componente radial de la velocidad se ve entonces
disminuda hasta anularse, luego de lo cual se invierte el sentido radial del movimiento. Adicionalmente, si
hacemos que B crezca en sentido contrario, la partcula cargada quedara confinada, moviendose en uno y
otro sentido entre los extremos, fenomeno que se conoce como confinamiento especular. Hay en realidad
varios efectos adicionales debidos por ejemplo a la radiacion de ciclotron y a efectos inductivos debido a la
no uniformidad y posible variacion temporal de los campos. Sin embargo, esta descripcion simplificada da un
buena idea de las implicaciones Fsicas de la no invarianza adiabatica de M .
17.10. Ejercicios
1. Utilizando el procedimiento perturbativo de la seccion 17.4.1, encuentre las ecuaciones de movimiento
exactas del oscilador armonico Ecs. (17.28), por induccion.
2. Un oscilador armonico lineal con constante de restitucion k incrementa subitamente su masa en una can-
tidad fraccional . Asumiendo como sistema no perturbado al oscilador con la masa original, utilice teora
de perturbaciones independiente del tiempo a primer orden, para encontrar el corrimiento resultante en
la frecuencia del oscilador a primer orden en . Repita el procedimiento si el incremento fraccional es
para la constante de restitucion k.
3. Calcule la correccion de segundo orden para la frecuencia de un pendulo plano con amplitud finita.
H1 = bp2x p2y
siendo b una constante. Calcule la contribucion de primer orden de este Hamiltoniano al corrimiento de
las frecuencias, en el esquema de la teora de perturbaciones independiente del tiempo.
5. El efecto Stark en Fsica atomica se puede modelar como una perturbacion a una orbita plana elptica
de Kepler, donde el potencial de perturbacion es H V = kx. Encuentre perturbativamente el
corrimiento de las frecuencias de movimiento a primer orden. Este modelo tambien constituye una primera
aproximacion para calcular el efecto de la presion de la luz solar sobre la orbita de un satelite.
Captulo 18
Formulacion Lagrangiana y Hamiltoniana para
Sistemas Contnuos y Campos
La formulacion que se ha trabajado hasta el momento inclua un numero finito (o a lo mas infinito numerable
y discreto) de grados de libertad. No obstante, algunos problemas mecanicos como la vibracion de un solido
elastico, involucran sistemas contnuos. Cada punto del solido toma parte en la oscilacion, y el movimiento
completo puede ser descrito solo si especificamos los desplazamientos de las partculas con respecto al equilibrio
en todos los puntos. La extension a un sistema contnuo se puede realizar partiendo de un sistema discreto,
resolviendo el problema para luego hacer un paso al lmite apropiado. El paso al contnuo nos lleva de manera
natural al concepto de campo y a la teora de campos, siendo un campo una funcion que asigna a cada punto
del espacio tiempo una cantidad escalar, vectorial, tensorial, etc. con lo cual hablamos de campos escalares,
vectoriales, tensoriales etc. Vale decir ademas que el concepto de campo es de gran utilidad en muchas ramas de
la Fsica incluso en escenarios mas alla de la mecanica, quizas el lector ya este familiarizado con campos tales
como la densidad de carga, la densidad de masa, el potencial electrico, campos de temperaturas, de presiones
etc. los cuales son campos escalares, entre los campos vectoriales se destacan el campo gravitacional, el campo
electrico, el campo magnetico, el potencial vectorial magnetico, la densidad de corriente electrica etc.
Antes de hacer un estudio detallado del paso al contnuo que nos lleva a la teora de campos, es conveniente
recapitular algunos aspectos de la ecuacion de continuidad, la cual jugara un papel vital en esta formulacion.
523
524 CAPITULO 18. FORMULACION LAGRANGIANA Y HAMILTONIANA PARA CAMPOS
apunta hacia afuera y cuya magnitud es el area dS del elemento diferencial, denotando los vectores unitarios
normal y tangencial a la superficie como uN , uT se tiene que
dS = dS uN ; J = JN uN + JT uT
notese que la componente normal de J es la unica que cruza la superficie, ya que la componente tangencial
va a lo largo de esta. En particular si la corriente es puramente tangencial, la carga se propagara a lo largo
de la superficie pero sin cruzarla y por lo tanto esta carga no abandonara el volumen. De lo anterior es claro
que la cantidad de carga que sale del volumen en la unidad de tiempo estara definida por la componente de la
densidad de corriente que cruza dicha superficie, es decir la componente normal de J. Dado que J es la cantidad
de carga por unidad de tiempo que cruza una superficie unidad perpendicular a la direccion de propagacion,
se tiene que la cantidad de carga por unidad de tiempo que cruza la superficie dS estara dada por
JN dS = J dS
Notese que si esta cantidad es negativa, significa que la componente normal de J va en direccion uN es
decir, esta entrando al volumen. Por tanto, la carga neta que sale por unidad de tiempo del volumen V que
esta delimitado por la superficie cerrada S es1
I
J dS
S
y esta cantidad debe ser igual a la disminucion de carga en el interior por unidad de tiempo
I
dqint
J dS = (18.1)
dt
S
siendo J la densidad de corriente y qint la carga contenida en el volumen V . El signo menos se puede entender
teniendo en cuenta que cuando la carga sale (entra) el signo de la integral de superficie es positivo (negativo),
esto implica que la carga en el interior debe disminuir (aumentar) es decir debe ser una funcion decreciente
(creciente) del tiempo y por lo tanto su derivada debe ser negativa (positiva). Por tanto, el signo menos
garantiza que ambos miembros tengan el mismo signo en ambas circunstancias. La carga en el interior se
puede escribir en la forma Z
dqint d
= (r, t) dV
dt dt
siendo (r, t) la densidad de carga en el punto r y en el instante t. La integral de volumen se realiza en un
instante fijo de tiempo y la derivada depende de este valor evaluado en t y en t + dt. Sin embargo, el volumen
y un cierto punto x, y, z dentro de este son fijos en el proceso, de modo que esta es realmente una derivada
parcial en el tiempo.
Z I Z I Z
dqint
= dV J dS = dV J dS + dV = 0
dt t t t
S S
esta ecuacion diferencial se conoce como ecuacion de continuidad y expresa la conservacion de la carga
generalizada en procesos donde existen corrientes que pueden incluso depender del tiempo. Cuando fluye una
cierta cantidad de carga hacia afuera (adentro) del volumen, la cantidad de carga disminuye (aumenta) a la
misma rata en que tal carga sale (entra). Vale la pena reiterar que la ecuacion diferencial (18.2) es valida para
expresar la conservacion de muchas cantidades escalares a las que se les pueda definir una densidad y una
densidad de corriente.
Por otro lado, tambien existen principios de conservacion asociados a cargas vectoriales generalizadas,
la conservacion del momento es quizas el mayor ejemplo en esta direccion. En tal caso definimos las componentes
de esta carga vectorial en coordenadas cartesianas de la forma
q = (q1 , q2 , q3 )
y cada componente se debe conservar por separado, es decir habra una ecuacion de continuidad para cada
escalar qi por separado. Para ello es necesario definir una densidad para la componente iesima de la carga
vectorial generalizada i y una densidad de corriente asociada Ji . La ecuacion de continuidad se escribe para
cada i en la forma
i
Ji + =0
t
y denotando la componente kesima de Ji en la forma Ji k podemos escribir esta ecuacion en componentes,
con lo cual queda (suma sobre ndices repetidos)
i
k Ji k + =0 (18.3)
t
notese entonces que hay en total tres corrientes, una por cada componente conservada. Podemos formar un
tensor Ji k que nos da cuenta de las tres corrientes (denotadas por el ndice i) y sus componentes (denotadas
por k). Por ejemplo J1 2 denota que la cantidad escalar conservada q1 se puede propagar en la direccion x2 .
En otras palabras, cuando el vector q se propaga en la direccion x2 su primera componente q1 puede cambiar.
Puede formularse la conservacion de un tensor de un rango arbitrario n y las corrientes asociadas se pueden
organizar en un tensor de rango n + 1. Por ejemplo, es mas util organizar al momento angular en un tensor
antisimetrico de segundo rango que en un vector.
Debemos observar que el numero de componentes del vector es arbitrario en realidad. Por ejemplo, ocurre
con frecuencia que tenemos un vector y un escalar conservados y resulta comodo construir un vector de 4
componentes que de cuenta de todas las cargas conservadas
q = (q0 , q1 , q2 , q3 ) (18.4)
esta formulacion es comoda por ejemplo para inclur la conservacion de la energa y el momento lineal en un solo
arreglo. Por supuesto, la Ec. (18.7) tambien puede estarme expresando la conservacion de cuatro cantidades
escalares independientes que no forman ningun vector. En ese sentido la cantidad J no necesariamente
expresa un tensor, aunque para la mayora de casos practicos, se buscaran cantidades vectoriales y tensoriales
para construr ecuaciones de continuidad.
Si una cantidad escalar determinada se conserva, entonces es claro que si definimos un volumen V delimitado
por una superficie S tal que la carga generalizada no cruza la superficie i.e. esta completamente contenida en
526 CAPITULO 18. FORMULACION LAGRANGIANA Y HAMILTONIANA PARA CAMPOS
el volumen, entonces la carga total dentro del volumen qint se conserva ya que no hay perdidas por radiacion
dentro de este volumen. Similarmente ocurre para cada componente de un arreglo vectorial que se conserve,
esto se escribe en la forma Z
q = dV = K (constante) (18.8)
V
Vale la pena observar que la conservacion de esta cantidad tambien se puede ver invirtiendo los pasos que
hemos seguido hasta ahora, es decir partimos de la formulacion diferencial y llegamos a la forma integral.
Integrando la Ec. (18.5) sobre el volumen V resulta
Z Z Z
k
k J + dV = 0 J dV + dV = 0
V t V V t
Z Z
d
J dS + dV = 0 (18.9)
S dt V
donde hemos usado el teorema de la divergencia. Ahora bien, dado que la carga generalizada no cruza la
superficie, el valor del flujo J dS sobre cada elemento diferencial de area se anula2 , con lo cual la integral de
superficie se anula de modo que Z Z
d
dV = 0 dV = cte (18.10)
dt V V
una anotacion de terminologa es pertinente en este punto, hemos visto que si tenemos una carga generalizada
q que se conserva en el sentido de que no se puede crear espontaneamente, la ecuacion de continuidad se puede
escribir en forma sintetica usando una configuracion de cuatro componentes
J (, J) J = 0
es usual llamar a la configuracion J una corriente conservada. No obstante, este es un termino un tanto
desafortunado ya que lo que se conserva es una propiedad global cual es la carga total cuando se encierra en
una superificie donde la carga generalizada no cruza la frontera. El termino corriente conservada parece sugerir
en forma erronea que las densidades de carga y corriente son constantes de movimiento. Con esta aclaracion
utilizaremos el termino corriente conservada de aqu en adelante.
Por otro lado, ocurre con frecuencia que la carga y corriente generalizadas estan presentes en todo el espacio
pero tienden a cero en el infinito. En tal caso sera necesario calcular la integral de volumen de la densidad
de carga generalizada en todo el espacio para asegurar que la carga generalizada total dentro del volumen se
conserva. Sin embargo, aun integrando sobre todo el espacio puede ocurrir que la integral de superficie en 18.9
no se anule, ya que aunque J tienda a cero la superficie crece como el cuadrado de la distancia, si J decrece
mas rapido que 1/r 2 la integral de superficie tendera a cero, pero si por ejemplo J decrece como 1/r 2 la integral
puede dar un valor finito incluso si se integra sobre todo el espacio. Esto implica que la carga generalizada no
se conserva para ningun volumen y que por tanto se presenta perdida de carga generalizada por radiacion.
Un ejemplo notable del fenomeno de radiacion ocurre en electrodinamica cuando tenemos cargas electricas
aceleradas. Tomemos a la densidad de energa asociada al campo electromagnetico como nuestra densidad
de carga generalizada, la densidad de corriente generalizada sera entonces la cantidad de energa por unidad
de area por unidad de tiempo en la direccion de propagacion de la onda electromagnetica, que sera tambien
la direccion de propagacion de la energa transportada por el campo, esta densidad de corriente de energa
asociada al campo se conoce como vector de Poynting. Puede demostrarse que para sistemas de cargas
electricas aceleradas la integral de superficie del vector de Poynting en el infinito no es nula. Esto significa que
parte de la energa asociada al campo se aleja indefinidamente de la carga electrica sin regresar, hay tambien
una fraccion de la energa asociada al campo que se transporta junto con la carga sin alejarse indefinidamente
de ella, es decir solo una fraccion de la energa electromagnetica se pierde por radiacion. Es importante enfatizar
que en este caso hemos considerado que la carga generalizada es la energa asociada al campo y NO la carga
electrica. Efectivamente si la carga electrica esta en un volumen finito, dicha carga se conserva aunque no se
conserve nuestra carga generalizada.
2
Esto no significa necesariamente que no haya corriente sobre la superficie, pero si tal corriente existe, es totalmente tangencial
a la superficie en todos los puntos de S, de modo que la corriente evaluada en la superficie va a lo largo de esta sin cruzarla y por
tanto sin abandonar el volumen, de modo que el flujo es nulo.
18.2. TRANSICION DE UN SISTEMA DISCRETO A UN SISTEMA CONTINUO 527
Figura 18.1: Sistema discreto de masas identicas puntuales conectadas por resortes identicos. Utilizaremos este
sistema para estudiar el paso al contnuo en una vara elastica.
Utilizaremos como ejemplo ilustrativo, las vibraciones longitudinales de una varilla infinita. Partiremos
entonces del sistema discreto que consiste en una cadena infinita de masas iguales espaciadas una distancia
a, y conectadas a traves de resortes sin masa y uniformes (ver Fig. 18.1), todos con la misma constante de
restitucion k, la infinitud de la cadena nos evita por el momento trabajar el problema de las condiciones en
los extremos. Asumiremos que las masas puntuales solo se pueden mover a lo largo de la cadena, en pequenas
oscilaciones alrededor del equilibrio. Denotando i al desplazamiento de la iesima partcula a partir de su
posicion de equilibrio, la energa cinetica es
1X
T = mi2
2
i
donde m es la masa de cada partcula. La energa potencial correspondiente, resulta ser la suma de las energas
potenciales de cada resorte, que surgen como resultado del estiramiento o compresion de los resortes
1X
V = k (i+1 i )2
2
i
1 Xh 2 i
L=T V = mi k (i+1 i )2
2
i
" # X
1X m 2 i+1 i 2
L= a ka = aLi (18.11)
2 a i a
i i
donde a es la distancia entre los puntos de equilibrio. Obtengamos las ecuaciones de movimiento de Lagrange
528 CAPITULO 18. FORMULACION LAGRANGIANA Y HAMILTONIANA PARA CAMPOS
y dividiendo por a esta ecuacion, las ecuaciones de movimiento de Lagrange correspondientes a las coordenadas
i son
m i+1 i i i1
i ka + ka =0 (18.12)
a a2 a2
las ecuaciones (18.11, 18.12) se escogieron de esa forma con el fin de obtener una facil interpretacion de los
parametros en el lmite cuando a 0. Es claro por ejemplo, que m/a se reduce en el contnuo a la densidad
lineal de masa que denotaremos por . No obstante, el lmite de ka no es tan directo. Para una varilla elastica
que obedece la ley de Hooke, la elongacion de la varilla por unidad de longitud es proporcional a la fuerza o
tension ejercida a lo largo de esta, lo cual de puede escribir como
F =Y
donde es la elongacion por unidad de longitud y Y es el modulo de Young. Por otro lado, la elongacion de
un segmento a, por unidad de longitud del sistema discreto en cuestion, se escribe como
(i+1 i )
=
a
la fuerza necesaria para estirar el resorte en esta cantidad es
i+1 i
F = k (i+1 i ) = ka
a
con lo cual se ve que ka debe corresponder al modulo de Young de la varilla contnua. Al ir del sistema
discreto al contnuo, el ndice i, que identifica a una masa puntual especfica, se convierte en una coordenada
contnua de posicion x; en vez de la variable discreta i ahora tendramos una variable de campo contnua
(x). Adicionalmente, la cantidad
i+1 i (x + a) (x) d
lm = lm =
a0 a a0 a dx
18.2. TRANSICION DE UN SISTEMA DISCRETO A UN SISTEMA CONTINUO 529
de modo que a hace el rol de dx. Finalmente, la suma sobre el ndice discreto i se convierte en una integral
sobre x a lo largo de la longitud de la varilla. El Lagrangiano (18.11) queda
Z " 2 # Z
1 d
L= dx 2 Y dx L (18.13)
2 dx
en el lmite cuando a 0, los ultimos dos terminos de (18.12) quedan
i i1 i+1 i Y i i1 i+1 i
Y Y =
a2 a2 a a a
Y (x) (x a) (x + a) (x)
a a a
escribiendo explcitamente el lmite resulta
Y d d (x) (x a) d2
lm = Y lm = Y 2
a0 a dx xa dx x a0 a dx
por lo tanto, la extension al contnuo de (18.12), es decir la ecuacion de movimiento para la varilla elastica
contnua es
d2 d2
2 Y 2 =0 (18.14)
dt dx
es decir la ecuacion de onda unidimensional, correspondiente a una velocidad de propagacion
s
Y
v= (18.15)
la Ec. (18.15) corresponde a la bien conocida expresion para la velocidad de las ondas longitudinales elasticas.
Este ejemplo sencillo ilustra la mayor parte de las caractersticas generales que presenta el paso al contnuo.
Un aspecto muy relevante es el papel de la coordenada de posicion x. Esta variable no representa una
coordenada generalizada, es simplemente el ndice contnuo que reemplaza a i. As como cada diferente
valor de i corresponde a una coordenada generalizada diferente i del sistema discreto, de la misma forma hay
una coordenada generalizada (x) por cada valor de x en el sistema contnuo. Dado que tambien es en general
funcion del parametro contnuo tiempo debemos escribir (x, t), esto indica que x al igual que el tiempo se
puede considerar como un parametro que entra en el Lagrangiano. Si el sistema contnuo fuera tridimensional
en lugar de unidimensional, las coordenadas generalizadas se rotularan con tres ndices contnuos x, y, z, y las
coordenadas generalizadas se escribiran como (x, y, z, t).
Vale la pena enfatizar que en la formulacion en el contnuo, las cantidades x, y, z, t son completamente
independientes unas de otras, y solo aparecen como variables explcitas en . Por lo tanto, las derivadas de
con respecto a cualquiera de ellas se pueden escribir como derivadas totales sin ninguna ambiguedad3 . Por
otro lado la Ec. (18.13) nos muestra que el Lagrangiano aparece como una integral sobre el ndice contnuo
x, hemos denotado al integrando como L, en el correspondiente caso tridimensional el Lagrangiano tendra la
forma Z Z Z Z
L= L dx dy dz = L dV (18.16)
donde L es conocido como densidad Lagrangiana. De acuerdo con (18.13), la densidad Lagrangiana asociada
a las vibraciones longitudinales de la varilla viene dada por
" 2 #
1 d 2 d
L= Y (18.17)
2 dt dx
que corresponde al paso al lmite contnuo de la cantidad Li que aparece en la Ec. (18.11). Como veremos mas
adelante, para los sistemas contnuos la densidad Lagrangiana sera de mucha mas utilidad que el Lagrangiano.
3
La independencia de los parametros x, y, z, t se puede ver teniendo en cuenta que ellos representan lugares geometricos (espacio
temporales) en el espacio euclidiano, y no posiciones de una determinada partcula. Es decir las variables de posicion no tienen
ninguna dinamica en esta formulacion.
530 CAPITULO 18. FORMULACION LAGRANGIANA Y HAMILTONIANA PARA CAMPOS
el Lagrangiano total es de acuerdo con (18.16), la integral de L sobre el rango de x que define al sistema. Por
otra parte, el principio de Hamilton Ec. (4.2) en el lmite de sistemas contnuos unidimensionales se escribe
como Z Z t2 x2
I = L dx dt = 0 (18.19)
t1 x1
Si el principio de Hamilton para un sistema contnuo ha de ser de alguna utilidad, entonces debe ser posible
obtener el lmite contnuo de las ecuaciones de movimiento a partir de dicho principio, como por ejemplo la
Ec. (18.14). Las ecuaciones de movimiento deben obtenerse haciendo una variacion de la integral (ahora doble)
de L en (18.19). El procedimiento es muy similar al caso discreto. La variacion se hace solo sobre y sus
derivadas; los parametros x, t no son afectados por la variacion ni directamente ni a traves de los lmites de
integracion4 . As como la variacion de se toma como nula en los extremos temporales t1 y t2 , as mismo la
variacion de en los extremos x1 , x2 de la integracion en x tambien se tomara como cero, en otras palabras
tenemos condicion de extremo fijo en los parametros. Al igual que en la seccion 3.2 una familia de caminos
variados muy conveniente en el espacio de las se obtiene escogiendo a a partir de una familia uniparametrica
de posibles funciones
(x, t; ) = (x, t; 0) + (x, t) (18.20)
donde (x, t; 0) denota la funcion correcta que satisface el principo de Hamilton, y es cualquier funcion bien
comportada que se anula en los puntos extremos de x y t. Si I se considera una funcion de , de tal modo que
tenga un extremo en (x, t; 0) la derivada de I con respecto a se anula en = 0. A traves de la diferenciacion
directa se obtiene5
Z t2 Z x2
dI L L d L d
= dx dt + + (18.21)
d t1 x1 d dt d dx
dt dx
puede verse que a pesar de que L puede depender tambien explcitamente de x y t, estos terminos no aparecen
en (18.21) en virtud de que x/ = t/ = 0 ya que los parametros no cambian cuando se hace una
variacion de la coordenada (x, t). Ahora bien, debido a que la variacion de es decir , se anula en los
extremos de ambos parametros, una integracion por partes en x y t nos da las relaciones
Z t2 Z t2
L d d L
dt = dt
t1 d
dt
dt t1 dt d
dt
4
Recordemos que los parametros espaciales son solo lugares geometricos de modo que no se ven afectados por la variacion de
una coordenada , ademas al igual que en el caso discreto el camino variado no implica variacion en el parametro temporal.
5
Notese que este es un problema variacional multiparametrico, ya que involucra a los parametros x y t.
18.4. FORMULACION LAGRANG. PARA 3 DIM. Y VARIAS VARIABLES DE CAMPO 531
y
Z x2 Z x2
L d d L
dx = dx
x1 d
dx
dx x1 dx d
dx
y por los mismos argumentos usados en la seccion 3.2 la naturaleza arbitraria de los caminos variados implica
que el termino entre parentesis cuadrados debe anularse
d L d L L
+ =0 (18.22)
dt d dx d
dt dx
las ecuaciones de Euler Lagrange definidas por (18.22) corresponden a las ecuaciones de movimiento que se
derivan del principio de Hamilton Ec. (18.19).
Un sistema de n grados de libertad posee n ecuaciones de Lagrange, sin embargo, pareciera que para un
sistema contnuo solo tuvieramos una ecuacion de Lagrange!. Debe recordarse sin embargo que en el discreto
la ecuacion de movimiento para cada i es una ecuacion diferencial que solo involucra al tiempo, en tal sentido
la Ec. (18.22) nos da una ecuacion de movimiento para cada valor del ndice contnuo x. La naturaleza
contnua de x se manifiesta en que la Ec. (18.22) es una ecuacion diferencial parcial en x y t, cuya solucion
es de la forma (x, t). De lo anterior se desprende ademas que la dimension del espacio de configuraciones
corresponde a la cardinalidad del espacio real (en una dos o tres dimensiones) ya que cada ndice contnuo x
corresponde a un eje en el espacio de configuraciones.
Para el ejemplo especfico de las vibraciones longitudinales de la varilla elastica, la forma de la densidad
Lagragiana (18.17) conduce a las relaciones
L = d ; L = Y d ; L = 0 (18.23)
d dt d dx
dt dx
de modo que se obtiene la consistencia deseada puesto que al reemplazar (18.23) en las Ecs. (18.22) llegamos
efectivamente a las relaciones (18.14).
deben ser tratadas como variables independientes. No hay por ejemplo, variacion de los campos en los lmites
de integracion en el principio de Hamilton tanto sobre el espacio como sobre el tiempo. Debe tenerse en cuenta
sin embargo, que aunque en esta formulacion las coordenadas espaciales y temporales entran en forma mas
simetrica, el tiempo NO corresponde a un ndice para la coordenada generalizada (r, t), esto se puede ver
del hecho de que en el sistema discreto el campo i (t) esta rotulado por el ndice i pero no por la variable
temporal, la cual simplemente mide la evolucion de una coordenada generalizada especfica i .
En consecuencia de lo anterior, es conveniente introducir una notacion en terminos de un espacio de cuatro
dimensiones con coordenadas x0 = ct, x1 = x, x2 = y, x3 = z. Esta notacion no tiene ningun significado
Fsico adicional. El factor c en x0 es la velocidad de la luz en el vaco y es usada solo con el fin de que x0
tenga las mismas unidades que xi . El tensor metrico g es el correspondiente a una geometra Euclidiana,
donde las transformaciones del grupo de Galileo son las transformaciones de coordenadas permitidas sobre las
componentes del espacio con el tensor metrico restringido por gij = ij . Las letras latinas en los suprandices
indicaran ndices que involucran solo a las variables espaciales en tanto que las letras griegas como subndices
o suprandices se referiran a todas las cuatro coordenadas. Se retomara la convencion de suma sobre ndices
repetidos. Las variables de campo se rotularan con el subndice , que puede barrer una multitud de formas.
En algunas ocasiones simbolizara un ndice simple de dos tres, cuatro o mas valores, pero tambien puede
simbolizar un conjunto de multiples ndices. Por ejemplo, si la variable de campo es un tensor espacial de
segundo rango, entonces realmente se refiere a dos subndices. Finalmente, una derivada de las variables de
campo con respecto a cualquiera de las cuatro coordenadas x se denotara por el subndice separado de
por una coma. Si solo hay una variable de campo, el ndice no aparecera. Algunos ejemplos son los siguientes
d d d2 i
, ; ,j ; i, =
dx dxj dx dx
solo las derivadas de las variables de campo seran simbolizadas de esta manera. En esta notacion la densidad
Lagrangiana mas general que consideraremos se escribe como
L = L ( , , , x )
(x , ) = (x , 0) + (x )
las funciones (x ) son funciones de clase C 2 en todos los parametros. Dichas funciones se deben anular sobre
la hipersuperficie que delimita a la region de integracion. La anulacion del variacional de I, es equivalente
a establecer que la derivada de I con respecto a sea cero.
Z
dI L L ,
= + (dx )
d ,
integrando por partes se obtiene
Z Z
dI L d L d L
= (dx ) + (dx ) (18.25)
d dx , dx ,
18.4. FORMULACION LAGRANG. PARA 3 DIM. Y VARIAS VARIABLES DE CAMPO 533
la segunda integral se elimina cuando se va para cero, lo cual se puede ver de varias formas: si miramos
termino a termino, al realizar la integracion para el x particular para cada termino de derivada, se ve que
estos terminos se tienen que ir porque la derivada con respecto a es cero en los extremos. Por otro lado,
la integral se puede transformar por medio de un teorema de la divergencia en 4 dimensiones en una integral
sobre la hipersuperficie que delimita la region de integracion en el cuadriespacio (euclidiano). La integral de
superficie tambien se anula porque la variacion de en la vecindad de la funcion de campo correcta es cero
sobre la superficie. Para ver esto calculemos la segunda integral a la derecha en (18.25). Recordando que la
derivada total en x es equivalente a una derivada parcial podemos escribir el segundo termino en la forma
Z Z Z
d L L L
(dx ) = (dx ) (dx )
dx , x , ,
lo cual es basicamente una cuadridivergencia del termino entre parentesis. La aplicacion del teorema de la
divergencia en el espacio de 4 dimensiones convierte la integral de volumen en una integral sobre la hipersu-
perficie delimitadora donde la variacion del termino entre parentesis es cero. En smbolos, la variacion relevante
se escribe como Z Z
d L L
(dx ) = d = 0
dx , ,
donde d representa las componentes de un elemento de hipersuperficie (en el espacio Euclidiano de cuatro
dimensiones) orientado a lo largo de la direccion de la normal hacia afuera (para las tres dimensiones espaciales).
Por lo anterior, en el lmite 0, la Ec. (18.25) se reduce a
Z
dI L d L
= (dx ) = 0 (18.26)
d 0 dx , 0
nuevamente, la naturaleza arbitraria de la variacion de cada significa que la Ec. (18.26) se satisface solo si
se anula el termino entre parentesis cuadrados.
d L L
=0 (18.27)
dx ,
la Ec. (18.27) representa un conjunto de ecuaciones diferenciales parciales para las variables de campo, el
numero de ecuaciones esta determinado por los valores posibles de . Vale la pena enfatizar de nuevo que dado
que cada xi corresponde a un ndice para las variables de campo, cada una de las Ecs. (18.27) para fijo,
corresponde a un conjunto completo de ecuaciones diferenciales de movimiento de Lagrange en el caso discreto.
Es sencillo ver que las Ecs. (18.27) se reducen al caso particular (18.22) en el caso unidimensional (es decir
con un solo parametro espacial x), con una sola variable de campo (i.e. = 1). Comparando las dos ecuaciones
se puede apreciar la ventaja de la notacion introducida (y aun mas si se introducen las tres dimensiones). Es
necesario insistir que a pesar de la similitud de la notacion con aquella usada en relatividad especial, en este
caso estamos trabajando en el regimen no relativista con espacio y metrica Euclidianos.
En sistemas discretos, el Lagrangiano tiene un grado de arbitrariedad ya que se puede adicionar una
derivada total en el tiempo de una funcion arbitraria de las coordenadas generalizadas y el tiempo sin alterar
las ecuaciones de movimiento. Con sistemas contnuos, la densidad Lagrangiana posee una simetra gauge
similar bajo la adicion de un termino de la forma
dF ( , x )
L = L + (18.28)
dx
recordando de nuevo que la derivada total en x es equivalente a una derivada parcial, podemos escribir el
segundo termino en (18.28) en la forma
dF ( , x ) F ( , x )
= F
dx x
con convencion de suma sobre ndices repetidos. Este termino se puede ver como la extension de una divergencia
en 4 dimensiones (en tres dimensiones la divergencia es i Fi ). F son cuatro funciones arbitrarias de las variables
534 CAPITULO 18. FORMULACION LAGRANGIANA Y HAMILTONIANA PARA CAMPOS
J = 0 (18.32)
y teniendo en cuenta las Ecs. (18.4, 18.6) vemos que J0 0 es 0 , es decir la densidad del escalar q0 que se
conserva, J0 i representa la iesima componente de la corriente asociada con la propagacion de 0 . Ji 0 es i
i.e. la densidad de una de las componentes del vector que se conserva, y Ji k es la kesima componente del
vector densidad de corriente asociado a i .
De lo anterior es claro que la Ec. (18.30) me esta expresando la conservacion de cuatro cantidades escalares
(posiblemente un escalar y un trivector). Veamos la interpretacion fsica de estas cargas generalizadas que se
conservan.
Figura 18.2: Ilustracion de las fuerzas sobre un punto x de la varilla elastica, con el cual se realiza el calculo
de la densidad de corriente de energa en la varilla.
Con base en lo anterior, es de esperarse que el vector T0 con componentes T0 i , juegue el rol de una densidad
de corriente de energa. Nuevamente recurrimos al ejemplo del campo que describe la vibracion longitudinal
de una varilla elastica. Dividamos la varilla por medio de un corte imaginario en el punto x (ver figura 18.2).
A partir de las consideraciones que nos llevaron al Lagrangiano (18.13) la fuerza ejercida por la parte derecha
de la varilla para alargar la parte izquierda del corte es
d
Fder = Y
dx
por tanto hay una tension en x en la porcion izquierda de igual magnitud pero direccion opuesta Ften = Fder .
Ademas, la porcion izquierda esta siendo estirada por una cantidad que en x vale (x), y la rata a la cual esta
extension cambia en el tiempo es . Por tanto, la rata de trabajo que la tension ha hecho en el corte es
dW d
= Ften = Y (18.35)
dt dx
la cual es en consecuencia la rata a la cual la energa esta siendo transferida desde la izquierda hacia la derecha
por unidad de tiempo. Reemplazando (18.34) en (18.31) podemos calcular T0 1 y verificar que coincide con el
valor dado en (18.35)
L d
T0 1 ,t Ltx = Y ,x = Y
,x dx
Lo cual nos muestra la consistencia de definir T0 i como la componente iesima de la densidad de corriente
de energa. En la mecanica ondulatoria en tres dimensiones, el vector que representa la propagacion de energa
por unidad de area por unidad de tiempo se conoce como vector de Poynting. Este vector correspondera
entonces a las componentes T0 i .
o
dT 0
T, = + T = 0 (18.37)
cdt
donde T cuyas componentes son T son un conjunto de 4 vectores en el 4-espacio. Ya vimos que T0 contiene la
densidad de energa y la densidad de corriente de energa. Las Ecs. (18.36, 18.37) son ecuaciones de continuidad,
que nos dicen que la rata de cambio en el tiempo de la densidad T 0 mas la divergencia de la densidad de
corriente T es nula.
Para extraer el significado Fsico de las componentes de Ti 0 examinamos de nuevo las vibraciones de la
varilla elastica. Si las partculas en la varilla se mueven todas en la misma cantidad a lo largo de esta, el
movimiento sera como una traslacion de un cuerpo rgido, de modo que no hay oscilaciones. El cambio neto de
masa en una longitud dx de la varilla como resultado del movimiento sera claramente cero, dado que pasa la
misma cantidad de masa por x+dx que la que pasa por x. Habra sin embargo, una densidad de momento lineal
neta v para esta traslacion rgida, siendo v la velocidad de traslacion de la barra6 . Por otro lado, cuando
tiene lugar el movimiento ondulatorio, existe un cambio neto de masa en el segmento dx, que para un cierto
tiempo viene dada por
d
dm = [ (x) (x + dx)] = dx
dx
el momento adicional en el intervalo, que resulta del movimiento ondulatorio es por tanto
d
dP = dm = dx
dx
de modo que una densidad adicional de momento (densidad lineal en este caso), mas alla de la que surge del
movimiento estacionario, puede ser identificada como la onda o densidad del campo de momento
dP d
p =
dx dx
veamos ahora que esta cantidad es justamente T1 0 para la densidad Lagrangiana dada por (18.17).
L d
T1 0 = ,x + Lxt = ,x =
,t dx
Esto nos lleva a identificar Ti 0 como las componentes del campo de densidad de momento.
Las ecuaciones de continuidad, (18.37) sugieren entonces que Ti debe representar la densidad de flujo
vectorial para la iesima componente del campo de densidad de momento. Ascribimos una propiedad de
vector a Ti porque puede haber por ejemplo, un flujo en la direccion y de la componente x de la densidad de
momento, que se determinara por Tx y T1 2 . Una interpretacion alternativa de Ti j proviene de considerar
el campo de desplazamiento de un solido tridimensional elastico. Es bien sabido que en un solido de este tipo
hay tambien fuerzas de cizalladura tangenciales a la superficie (ademas de las fuerzas de compresion normales a
la superficie) a lo largo del elemento de superficie. El ensamble completo de fuerzas se puede describir diciendo
que la fuerza dF que actua sobre un elemento de area dA se expresa en terminos de un tensor de esfuerzos
T de modo que
dF = T dA
que explcitamente se escribe
T1 1 T1 2 T1 3 dA1
(dF1 , dF2 , dF3 ) = T2 1 T2 2 T2 3 dA2 (18.38)
T3 1 T3 2 T3 3 dA3
dAi es un elemento de area en la direccion de xi de modo que
en consecuencia la fuerza neta digamos en la direccion x1 , sobre un elemento de volumen rectangular dx1 dx2 dx3
tiene contribuciones que provienen de las fuerzas sobre las superficies paralelas a los planos x2 x3 , x1 x3 y x1 x2 .
Calculemos primero la contribucion en la direccion x1 que proviene de las fuerzas sobre las dos superficies
paralelas al plano x2 x3 . Estos planos poseen coordenadas x1 y x1 + dx1 respectivamente (ver figura 18.3).
Para el plano asociado a la coordenada x1 el elemento de area (que apunta hacia afuera del volumen) va en la
direccion ux1 con lo cual tenemos que para este plano la Ec. (18.38) queda en la forma
T1 1 (x1 ) T1 2 (x1 ) T1 3 (x1 ) dx2 dx3
(dF1 (x1 ) , dF2 (x1 ) , dF3 (x1 ))(23) = T2 1 (x1 ) T2 2 (x1 ) T2 3 (x1 ) 0
1 2 3
T3 (x1 ) T3 (x1 ) T3 (x1 ) 0
(23)
dF1 (x1 ) = T1 1 (x1 ) dx2 dx3
para el plano paralelo a x2 x3 con coordenada x1 + dx1 , el elemento de area apunta hacia +ux1 de modo que
la suma de las dos contribuciones de los planos paralelos a x2 x3 nos da
Figura 18.3: Fuerza en la direccion x1 sobre un elemento de volumen dx1 dx2 dx3 de un solido elastico.
veamos ahora las contribuciones de los dos planos paralelos a x1 x3 . Estos planos estan asociados a las coorde-
nadas x2 y x2 + dx2 como se aprecia en la Fig. 18.3, para el plano inferior de coordenada x2 el vector de area
es dx1 dx3 ux2 de modo que la Ec. (18.38) nos queda en la forma
T1 1 (x2 ) T1 2 (x2 ) T1 3 (x2 ) 0
(dF1 (x2 ) , dF2 (x2 ) , dF3 (x2 ))(13) = T2 1 (x2 ) T2 2 (x2 ) T2 3 (x2 ) dx1 dx3
T3 1 (x2 ) T3 2 (x2 ) T3 3 (x2 ) 0
(13)
dF1 (x2 ) = T1 2 (x2 ) dx1 dx3
para la superficie paralela a x1 x3 con coordenada x2 + dx2 el vector de area es dx1 dx3 ux2 . Por tanto, la
contribucion proveniente de las dos superficies paralelas al plano x1 x3 da
Cuadro 18.1: Interpretacion fsica de las componentes del tensor de esfuerzo energa.
T es simetrico. Esto no solo es fsicamente deseable sino que es una caracterstica casi necesaria para la parte
espacial del tensor de esfuerzo energa.
Debemos recordar que aunque el ejemplo y la nomenclatura provienen de un sistema mecanico, este for-
malismo es extendible a muchas configuraciones de campos sin importar su naturaleza u origen. Una teora
7
Para la contribucion a la fuerza a lo largo de x1 , las contribuciones de los planos paralelos a x2 x3 son de compresion y las
otras contribuciones son de cizalladura.
540 CAPITULO 18. FORMULACION LAGRANGIANA Y HAMILTONIANA PARA CAMPOS
clasica de campos se puede construr para las vibraciones elasticas de un solido, campos electromagneticos,
campos termicos, campos de presion, la funcion de onda de Schrodinger etc. Debe tenerse presente sin embargo,
que en el caso mas general, las cuatro ecuaciones de continuidad dadas por (18.30) expresan la conservacion
de cuatro cargas generalizadas que podran ser independientes entre s. Notese que la interpretacion de estas
cuatro cargas como energa y momento implican que las cuatro cargas estan organizadas como un escalar y
un trivector euclidiano (en el caso relativista usualmente representaran un cuadrivector de Lorentz), pero no
hay nada en el formalismo general que me garantice este nivel de organizacion.
Por otro lado, recordemos que en el caso mas general la densidad Lagrangiana puede depender de los
parametros x en la Ec. (18.29) con lo cual la Ec. (18.32) se convierte en una ecuacion de continuidad con
fuentes
L
J =
x
lo cual corresponde a tener campos adicionales externos al sistema de campos en cuestion, o partculas puntuales
interactuando con los campos. Cuando se encuentran ecuaciones de continuidad con fuentes no se conserva
la carga generalizada asociada. No obstante, ocurre con frecuencia que es posible extender el sistema Fsico
para inclur los campos o partculas que actuan de fuentes y sumideros a fin de llegar a una nueva ecuacion
de continuidad que sea homogenea y que por tanto me conduzca a una carga generalizada conservada. Este
es el caso con el campo electromagnetico (aunque para las Ecs. de Maxwell se debe usar una formulacion
relativista), cuando se considera la densidad lagrangiana para el sistema del campo electromagnetico se llega
a ecuaciones de continuidad para la energa y el momento con fuentes, que corresponden al hecho de que las
cargas que interactuan con el campo pueden absorber o transferir energa y momento al campo. Sin embargo,
el sistema extendido de cargas y campos s conserva estas cantidades.
donde el volumen de integracion es tal que el campo esta completamente contenido en el, y los flujos de
los campos y de todas sus derivadas se anulan en la superficie que delimita al volumen. Es debido a estos
teoremas de conservacion, derivados a partir de (18.30), que los cuatro arreglos de la forma T , = 0, 1, 2, 3
se conocen como corrientes conservadas, en analoga con las ecuaciones de conservacion para las corrientes
electromagneticas.
Si T0 0 es una densidad de energa, entonces la cantidad R0 definida por
Z
R0 = T 0 dV
V
se puede identificar como la energa total en el campo siempre que T0 i se anule en la superficie de delimitacion,
esto es si el sistema no rada energa al exterior.
Con base en la interpretacion de las componentes Ti 0 es claro que la conservacion de las otras cargas
generalizadas Z
Ri = Ti 0 dV
V
nos dicen que para un sistema cerrado no interactuante el momento lineal total del campo Ri se conserva
como se esperaba.
8
En realidad el volumen podra tomarse en el infinito cuando los campos no estan acotados. Pero se requiere que los campos
y todas sus derivadas tiendan a cero en el infinito mas rapido de lo que crece la superficie de integracion, a fin de que la integral
(18.9) se anule para que sea valida la Ec. (18.10).
18.5. EL TENSOR ESFUERZO ENERGIA Y TEOREMAS DE CONSERVACION ASOCIADOS 541
recordando que en el lmite a 0, que nos lleva al contnuo, se tiene que Li L, a dx, y la suma se
convierte en integral Z
L
H = dx L (18.46)
Por otro lado, los momentos canonicos individuales pi dados por (18.45), tienden a cero en el lmite contnuo,
pero podemos definir una densidad de momento que permanece finita
pi L
lm = (18.47)
a0 a
la Ec. (18.46) nos muestra que el Hamiltoniano tambien viene dado por una integral de tal forma que se puede
definir una densidad Hamiltoniana H
H L (18.48)
aunque la formulacion Hamiltoniana es facil de introducir para campos clasicos, es de anotar que el procedi-
miento le otorga a la variable tiempo, un tratamiento diferente a los parametros de espacio9 , en contraste con
la formulacion Lagrangiana en la cual los parametros espacio temporales aparecen en forma muy simetrica.
Por esta razon el formalismo Hamiltoniano al menos como se describe aqu, no es muy adecuado para trabajar
una formulacion covariante relativista de los campos. El metodo Hamiltoniano no es entonces tan fructfero
como el Lagrangiano para trabajar sistemas contnuos relativistas.
La ruta obvia para generalizar a campos en tres dimensiones, consiste en definir las densidades de momento
canonico (18.47) para un cierto campo xi , t de la forma
L
(x ) = (18.49)
las cantidades xi , t , xi , t definen el espacio de fase infinito dimensional que describe los campos
clasicos y su evolucion en el tiempo. Por otro lado, existe una ley de conservacion asociada a muy similar a
la que se obtiene en el caso discreto. Si el campo no esta contenido explcitamente en L, es decir es una
variable de campo cclica, entonces la ecuacion de Lagrange (18.27) asociada a este campo, se asemeja a una
ecuacion de continuidad que describe una corriente conservada
d L d L d L
= 0 + i =0
dx , dt dx ,i
d d L
+ i = 0
dt dx ,i
9
Esto proviene del hecho de que la definicion de densidad de momento Ec. (18.47), solo depende de y no de las derivadas de
con respecto a las coordenadas espaciales.
18.6. FORMULACION HAMILTONIANA PARA MEDIOS CONTINUOS 543
se sigue de aqu que si es cclica, hay una integral que define una cantidad conservada
Z
= dV xi , t
es importante enfatizar que no es el que se conserva, sino su variable global asociada . La generalizacion
de la Ec. (18.48) sera
H , ,i , , xi L (18.50)
donde se asume que la dependencia funcional sobre se puede eliminar por inversion de la ecuacion de
definicion (18.49) tal como en el caso discreto. A partir de la definicion (18.50) y usando (18.49) se sigue que
H L
= + = (18.51)
La otra mitad de las ecuaciones canonicas de campo son menos directas de obtener. Cuando se expresa en
terminos de variables canonicas, H es una funcion de a traves de la dependencia explcita de L, as como a
traves de , (notese que al despejar la Ec. 18.49 tenemos como funcion de , , ,i y x ). Por tanto,
H L L L
= = (18.52)
donde hemos usado (18.49). Ahora usando las Ecuaciones de Lagrange en el contnuo Ecs. (18.27) esto queda
H d L d L
= = i (18.53)
dx , dx ,i
debido a la presencia de L esta forma no es todava util. No obstante una derivacion paralela de (18.50) muestra
que
H L L L
= = (18.54)
,i ,i ,i ,i ,i
donde de nuevo hemos usado (18.49). Podemos escribir entonces la segunda mitad de ecuaciones de campo
reemplazando (18.54) en (18.53) resultando
H d H
i = (18.55)
dx ,i
las Ecs. (18.51) y (18.55) se pueden colocar en una notacion en la cual su apariencia se asemeja mas a la de
las ecuaciones de Hamilton en el discreto. Para ello introducimos la nocion de funcional derivativa definida
por
d
i (18.56)
dx ,i
y teniendo en cuenta que H no es funcion de ,i , las Ecs. (18.51) y (18.55) se pueden escribir como
H H
=
; = (18.57)
notese que en esta notacion las Ecuaciones de Lagrange en el contnuo (18.27), quedan de la forma
d L L
=0
dt
la unica ventaja de la funcional derivativa sin embargo es la similaridad de las ecuaciones (tanto de Hamilton
como de Lagrange) con respecto a aquellas en el discreto. Sin embargo, en el caso de las Ecs. de Lagrange, esta
notacion destruye la simetra con la que las coordenadas del espacio y el tiempo aparecan en esta formulacion.
544 CAPITULO 18. FORMULACION LAGRANGIANA Y HAMILTONIANA PARA CAMPOS
dH d d L d L d L d,i L
= +
dt dt dt dt dt ,i dt t
el segundo y cuarto termino a la derecha se cancelan entre s en virtud de la definicion (18.49) quedando
dH L L d,i L
= (18.58)
dt ,i dt t
por otra parte cuando consideramos H en terminos de sus momentos canonicos, en cuyo caso los argumentos
de H son , , ,i y x la derivada temporal total adquiere la forma
dH H H H d,i H
=
+ + + (18.59)
dt ,i dt t
comparando (18.58) con (18.59), se ve que los primeros terminos a la derecha de estas, son iguales en virtud del
primer conjunto de ecuaciones de Hamilton Ecs. (18.51), los segundos terminos a la derecha tambien coinciden
debido a (18.52), finalmente los terceros terminos coinciden en virtud de (18.54). Por lo tanto, los ultimos
terminos deben coincidir
H L
= (18.60)
t t
que es el equivalente de (6.11) cuando el medio es discreto, y nos dice que cuando L no contenga explcitamente
al tiempo tampoco lo contendra H y viceversa.
Por otro lado, la analoga de la ecuacion (6.38) no se cumple, es decir, las derivadas temporales parcial y
total de la densidad Hamiltoniana no coinciden. Para calcular la relacion que hay entre ellas partimos de la
Ec. (18.59) y usamos las Ecuaciones de movimiento de Hamilton (18.51, 18.55)
dH H d H H H H H d d H
= + + +
dt dxi ,i ,i dxi dt t
dH H d H H d H
= i
+ +
dt dx ,i ,i dxi t
hemos intercambiado las derivadas sobre el campo en xi y el tiempo dado que las derivadas totales del campo
con respecto a los parametros coinciden con las derivadas parciales. Usando de nuevo (18.51) resulta
dH d H H d H
= i
+ +
dt dx ,i ,i dxi t
dH d H H
= + (18.61)
dt dxi ,i t
de modo que las derivadas temporales total y parcial de H no coinciden como se predijo10 . Recordando que el
elemento T0 0 del tensor de esfuerzo energa se interpretaba como densidad de la funcion energa (y por tanto
con la densidad Hamiltoniana) podemos identificar a H con T0 0 . Por otro lado, usando la Ec. (18.54) se deduce
que
H L
= = T0 i
,i ,i
10
Es importante notar que las derivadas parciales y totales con respecto a x solo coinciden para funciones que solo dependan de
x como ocurre con los campos y sus derivadas. En contraste, cantidades tales como las densidades Lagrangiana y Hamiltoniana
dependen no solo de x sino tambien de campos y derivadas de los campos, de modo que sus derivadas totales y parciales con
respecto a x no coinciden en general.
18.6. FORMULACION HAMILTONIANA PARA MEDIOS CONTINUOS 545
observese que aun en el caso en el cual H no depende explcitamente del tiempo, la cantidad que se conserva
es H y no H. Notese que al contrario del caso Lagragiano, aqu primero definimos las densidades y luego las
cantidades totales. Debe tenerse presente que el volumen de integracion debe contener a todos los campos.
Finalmente, notemos que en el caso en el cual el Hamiltoniano no sea la energa del sistema, lo que se conserva
es el Hamiltoniano y no la energa, pues T0 0 realmente corresponde a la densidad de la funcion energa que
numericamente es el Hamiltoniano.
donde la integral se realiza sobre un volumen fuera del cual y se deben anular (tambien deben ser nulas
estas cantidades en el contorno que define al volumen). Derivando U respecto al tiempo resulta
Z
dU U U U U U
= dV + ,i + + ,i + (18.63)
dt ,i ,i t
consideremos un termino tal como
Z Z
U U d
dV ,i = dxi
,i ,i dxi
integrando por partes
U d
u= ; dv = dxi i
,i dx
Z Z
i U d U d U
dx = i
dx
,i dxi ,i S dxi ,i
y recordando que y las derivadas se anulan en la superfice del contorno, tenemos
Z Z
U d U
dV ,i = dV
,i dxi ,i
y para el termino con ,i se hace una reduccion analoga. Con lo cual la Ec. (18.63) queda en la forma
Z
dU U d U U d U U
= dV + +
dt dxi ,i dxi ,i t
Z
dU U d U U d U U
= dV + + (18.64)
dt dxi ,i dxi ,i t
546 CAPITULO 18. FORMULACION LAGRANGIANA Y HAMILTONIANA PARA CAMPOS
ahora introduciendo la notacion de derivada funcional descrita por (18.56), la Ec. (18.64) se reduce a
Z
dU U U U
= dV + + (18.65)
dt t
por ultimo introducimos las ecuaciones de Hamilton en notacion de derivadas funcionales Ecs. (18.57), con lo
cual la Ec. (18.65) queda Z Z
dU U H H U U
= dV
+ dV (18.66)
dt t
La primera integral tiene la forma de un corchete de Poisson aunque reemplazando al operador derivada
ordinaria por la derivada funcional. Si U y W son dos funciones densidad cualquiera, lo anterior nos sugiere
definir como los corchetes de Poisson a las siguientes cantidades integrales
Z
U W W U
[U, W ] dV (18.67)
dU U
= [U, H] + (18.68)
dt t
que es el analogo a la Ec. (8.25) para sistemas discretos, aunque debe tenerse en cuenta que los corchetes de
Poisson han sido redefinidos en forma integral y con la derivada funcional. Haciendo U = H en (18.68) y tenien-
do en cuenta que por definicion el corchete de Poisson de H consigo mismo es nulo, se obtiene inmediatamente
que
dH H
= (18.69)
dt t
que es la forma integral de (18.61)11 y la version en teora de campos de (6.38). Notese que aunque las derivadas
total y parcial no coinciden para la densidad Hamiltoniana, s coinciden para el Hamiltoniano total.
Se ve entonces que el formalismo de los corchetes de Poisson aparece como consecuencia de la formulacion
de Hamilton. Sin embargo, no se puede desarrollar una teora de campos en terminos de corchetes de Poisson
de tal manera que guarde una analoga pasa a paso con la de los sistemas discretos. Por ejemplo, aqu definimos
los corchetes de Poisson solo en funcion de un par de densidades. Por tanto no se puede con facilidad plantear
corchetes de Poisson fundamentales como lo hacamos en sistemas discretos. Esto se debe a que aunque es
una densidad, no lo es. Ademas si xi desempena el papel de ndices contnuos de las variables mecanicas,
los corchetes de Poisson fundamentales contendran funciones para diferentes valores de xi , lo cual no se
introduce facilmente en la presente formulacion. Por esta razon las transformaciones canonicas no son muy
usadas en teoras de campos clasicos a pesar de ser tan fructferas en sistemas discretos. Tambien es difcil
en este formalismo seguir los pasos de la cuantizacion, que requieren cambiar los corchetes de Poisson por
conmutadores cuanticos.
una vez mas el ejemplo de la varilla elastica. Supongamos que dicha varilla posee una longitud L = x2 x1 .
Pondremos como condicion de contorno que se anule en los extremos, lo cual se logra colocando a la varilla
con sus extremos en contacto con dos paredes rgidas. La amplitud de la oscilacion se podra escribir en una
descomposicion de Fourier discreta
X
2n (x x1 )
(x) = qn sin (18.70)
2L
n=0
en lugar del ndice contnuo x aqu tenemos el ndice discreto n. Esta representacion solo es valida si (x) es
una funcion regular, lo cual usualmente se cumple.
Para el caso general, supondremos por simplicidad, que hay solo una cantidad de campo real que se puede
desarrollar en serie de Fourier tridimensional
1 X
(r, t) = qk (t) eikr (18.71)
V k
donde k es un vector de onda que solo puede tomar modulos y direcciones discretos de modo que en una
dimension lineal dada solo encaje un numero entero (o tal vez semientero) de longitudes de onda. Decimos
que k tiene un espectro discreto. El ndice escalar k representa entonces una ordenacion del sistema de ndices
enteros que se utiliza para enumerar los valores discretos de k, y V es el volumen del sistema que actua como
un factor de normalizacion. Como este factor es real se tiene que qk = qk .
La ortogonalidad de las exponenciales en el volumen se manifiesta como
Z
1
ei(kk )r dV = k,k (18.72)
V
en realidad los valores permitidos de k son aquellos para los que se cumple la condicion de ortogonalidad. Los
coeficientes de la expansion se pueden calcular con base en la ortonormalidad de la siguiente forma
Z Z
1 ikr 1
qk (t) = e (r, t) dV e (k, r, t) dV ; e (k, r, t) eikr (r, t)
V V
donde e (k, r, t) es la funcion densidad correspondiente a la variable global qk , como se puede ver por com-
paracion con la Ec. (18.62). De manera analoga, la densidad de cantidad de movimiento se puede escribir
como
1 X
(r, t) = pk (t) eikr (18.73)
V k
donde tambien se cumple que pk = pk . Los coeficientes pk (t) tambien se obtienen por ortonormalidad
Z Z
1 ikr 1
pk (t) = e (r, t) dV e (k, r, t) dV ; e (k, r, t) eikr (r, t)
V V
siendo
e (k, r, t) la funcion densidad asociada a pk (t). Tanto qk como pk son cantidades integrales de la
forma descrita por (18.62). Podemos entonces calcular los corchetes de Poisson de dichas cantidades. Como
las exponenciales no contienen variables de campo, tenemos en virtud de la definicion (18.67)
Z
e (k , r, t) e
(k, r, t) e (k , r, t) e
(k, r, t)
[qk , pk ] = dV
Z
1
[qk , pk ] = dV ei(k k)r
V
Z
1
[qk , pk ] = dV ei(k k)r
V
y usando la ortonormalidad (18.72)
[qk , pk ] = kk (18.74)
548 CAPITULO 18. FORMULACION LAGRANGIANA Y HAMILTONIANA PARA CAMPOS
por tanto, los corchetes de Poisson de qk , pk forman un conjunto de corchetes fundamentales con las mismas
propiedades que aparecen en el discreto Ecs. (8.3). Esto nos sugiere considerar a estas cantidades como coor-
denadas canonicamente conjugadas. Vale la pena entonces estudiar las ecuaciones de movimiento que surgen
para estas coordenadas. Empleando la Ec. (18.68), la evolucion temporal de qk (t) se escribe como
Z Z
e
(k, r, t) H H e (k, r, t) 1 H H
qk (t) = [qk , H] = dV = dV eikr
V
Z
1 H
qk (t) = dV eikr (18.76)
V
por otra parte, tenemos Z Z
H H H
= dV = dV (18.77)
pk pk pk
donde hemos tenido en cuenta que H no es funcion del gradiente de y por tanto su derivada parcial con
respecto a coincide con su derivada funcional. Teniendo en cuenta (18.73) resulta
1
= eikr
pk V
con lo cual (18.77) coincide con (18.76) resultando
H
qk = (18.78)
pk
veamos ahora como se obtiene la ecuacion de movimiento para pk . Los pasos son similares
Z
1 H H
pk (t) = [pk , H] = dV eikr
V
Z
1 H
pk (t) = dV eikr (18.79)
V
y calculamos Z
H H H ,j
= dV + (18.80)
qk qk ,j qk
la diferencia fundamental con el calculo anterior es que H no depende del gradiente de pero s depende del
gradiente de . El termino que contiene las componentes del gradiente de se integra por partes,
Z Z
H ,j j H d
dV = dx
,j qk ,j dxj qk
H d
u = ; dv = dxj j
,j dx qk
Z Z
H ,j H j d H
dV = dx
,j qk ,j qk S qk dxj ,j
la integral de superficie se anula de modo que la integral (18.80) queda
Z Z
H H d H H d H
= dV = dV
qk qk qk dxj ,j dxj ,j qk
la cual se puede reducir a otra que contenga la derivada funcional
Z
H H
= dV
qk qk
18.7. EJEMPLOS DE TEORIAS DE CAMPOS 549
H
pk (t) = (18.82)
qk
las cantidades qk y pk obedecen entonces las ecuaciones de movimiento de Hamilton. En general k denota un
conjunto de ndices enteros.
Notese que en el captulo se comenzo con un sistema discreto (coordenadas generalizadas numerables)
para el cual se estudio el paso al contnuo (coordenadas generalizadas no numerables). Posteriormente, hemos
descrito al sistema contnuo mediante un sistema de coordenadas discreto y numerable que posee una estrucutra
matematica similar a la del sistema discreto del cual se partio. Debido a esta correspondencia entre qk , pk
con las variables canonicamente conjugadas en el discreto, estas cantidades son buenos candidatos para la
cuantizacion cuando pasemos a una teora cuantica de campos. Las qk corresponden a lo que se denomina
numero de ocupacion para el campo.
La razon por la cual se pudo describir el sistema contnuo por medio de coordenadas discretas, es que
el tamano finito del sistema y las condiciones de contorno permiten un desarrollo de Fourier discreto12 . El
desarrollo presente se efectuo sobre un espectro discreto de ondas planas. Dado que el vector de onda k es
en mecanica cuantica directamente proporcional a la cantidad de movimientode la partcula asociada a la
onda plana, los desarrollos que hemos utilizado reciben a veces el nombre de representacion por cantidad de
movimiento. Sin embargo, este desarrollo se puede realizar en cualquier conjunto ortonormalizable y numerable
de funciones que cumplan la propiedad de completez en el volumen en cuestion. Las ondas planas son solo un
caso particular de estas funciones. El empleo de otras bases para estas expansiones puede ser mas conveniente,
dependiendo del problema a estudiar, pero el procedimiento es analogo al aqu expuesto.
d1 d2 1
a2 1 + b c 2 = f 2
dt dt
d2 d2 2
a2 2 b c 2 = g1 (18.83)
dt dt
el siguiente paso natural es encontrar una densidad Lagrangiana que a traves de las ecuaciones de Euler-
Lagrange Ecs. (18.27) me genere las ecuaciones de campo (18.83), recordemos que esta densidad Lagrangiana
no es unica, una de ellas es
b 1
L = c1 2 + (1 2 1 2 ) a1 2 f 22 + g12
2 2
12
Por ejemplo, si el sistema no es acotado la descomposicion de Fourier se vuelve en general contnua. Por otro lado, la anulacion
del campo en los extremos permitio que las sumatorias fueran desde n = 0 hasta . En general estas sumatorias iran desde
hasta .
550 CAPITULO 18. FORMULACION LAGRANGIANA Y HAMILTONIANA PARA CAMPOS
para esta densidad Lagrangiana, las componentes del tensor esfuerzo energa son
1
T00 = c1 2 + a1 2 + f 22 + g12
2
d2 d1
T0i = a 1 + 2
dxi dxi
d2 d1 b d1 d2
Ti0 = c 1 + 2 + 2 1
dxi dxi 2 dxi dxi
d1 d2 d1 d2
Tij = a + Lij
dxi dxj dxj dxi
observese que en este ejemplo, el tensor tridimensional Tij es simetrico.
Hagamos los calculos explcitos. Podemos escribir la densidad lagrangiana en una notacion mas conveniente
b 1
L = c1 2 + (1 2 1 2 ) a (i 1 ) (i 2 ) f 22 + g12
2 2
b 1
L = c1 2 + (1 2 1 2 ) a1,i 2,i f 22 + g12
2 2
Usando las ecuaciones de Lagrange para el contnuo
d L L
=0
dx ,
tenemos que para el campo 1
d L d L L
+ k =0
dt 1 dx 1,k 1
L b b d L b
= c1 2 + 1 2 = c2 + 2 = c2 + 2
1 1 2 2 dt 1 2
L d L
= [a1,i 2,i ] = aik 2,i = a2,k k = a2,kk
1,k 1,k dx 1,k
L b 1 2 b
= (1 2 ) g1 = 2 + g1
1 1 2 2 2
la ecuacion de Lagrange es
b b
c2 + 2 a2,kk + 2 + g1 = 0
2 2
d2 2 d2
a2 2 + c 2 + b + g1 = 0
dt dt
similarmente se obtiene la ecuacion de Lagrange para 2
d L d L L
+ k =0
dt 2 dx 2,k 2
L b b d L b
= c1 2 (1 2 ) = c1 1 = c1 1
2 2 2 2 dt 2 2
L d L
= [a1,i 2,i ] = aik 1,i = a1,k k = a1,kk
2,k 2,k dx 2,k
L b 1 2 b
= 1 2 f 2 = 1 + f 2
2 2 2 2 2
18.8. TEORIA DE CAMPOS RELATIVISTA 551
la ecuacion de Lagrange es
b b
c1 1 a1,kk 1 + f 2 = 0
2 2
d2 d
1 1
a2 1 + c 2 b + f 2 = 0
dt dt
finalmente la densidad de energa se obtiene recordando la definicion del tensor esfuerzo energa
L L L
T , L T0 0 ,0 L00 = L
, ,0
L L
T0 0 = 1 + 2 L
2
1
b b b 1
T0 0 = c2 + 2 1 + c1 1 2 c1 2 + (1 2 1 2 ) a1,i 2,i 2 2
f 2 + g1
2 2 2 2
b b b 1
T0 0 = c2 1 + 2 1 + c1 2 1 2 c1 2 (1 2 1 2 ) + a1,i 2,i + f 22 + g12
2 2 2 2
b b b 1
T0 0 = c2 1 c1 2 + c1 2 + 2 1 1 2 (1 2 1 2 ) + a1 2 + f 22 + g12
2 2 2 2
1
T0 0 = c2 1 + a1 2 +
f 22 + g12
2
De la misma forma se pueden calcular los otros elementos del tensor esfuerzo energa. Notese que si podemos
encerrar todos los campos y sus derivadas en un volumen, podemos garantizar que
Z
R0 = T0 0 dV = cte
para saber que volumen es adecuado para incluir la carga conservada generalizada (hay cuatro estrictamente),
sera necesario conocer el comportamiento del campo y sus condiciones de frontera. Por otro lado, para esta
teora de campo es posible que T0 0 no este asociado a una densidad de energa, ni que las otras cargas
conservadas esten asociadas a momentos. Todo lo que podemos afirmar es que hay cuatro cargas generalizadas
conservadas que incluso pueden ser totalmente independientes unas de otras. Cualquier interpretacion adicional
depende del modelo de campo especfico.
usual pero con metrica no trivial (metrica de Minkowski, ver cap. 16). Al igual que en el cap. 16 trabajaremos
en el espacio de Minkowski con la metrica usual. Como hasta ahora, los ndices latinos indican coordenadas
espaciales y los ndices griegos nos denotan las coordenadas espacio temporales, pero en este caso la coordenada
temporal se escribira como x4 = ict. En primer lugar vemos que las Ecuaciones 18.27 de Lagrange en el contnuo
no se afectan por este cambio, ya que el termino
d L
dx ,
queda invariante ante un cambio de escala de cualquiera de los parametros x , poe ejemplo para x4 tenemos
que
d L d L d L
= = 0
dx4 ,4 idx0 d dx ,0
idx0
y por otro lado el otro termino en las ecuaciones de Lagrange no contiene coordenadas. En lo que respecta
al principio de Hamilton, el cambio de espacio no lo afecta dado que simplemente se introduce una constante
multiplicativa.
Z
I = L ( , , , x ) dx = 0 ; dx dx0 dx1 dx2 dx3 = idx4 dx1 dx2 dx3
Z ix4,2 Z
I = i L ( , , , x ) dx = 0 ; dx dx4 dx1 dx2 dx3
ix4,1 V
el cambio de variable x4 = ix4 saca otra constante multiplicativa de modo que el principio variacional
permanece inmodificado.
Los campos y las cantidades relacionadas con estos deben formar tensores de Lorentz de determinado rango
para que se puedan escribir ecuaciones de campo manifiestamente covariantes. Si tenemos varios campos cada
uno de ellos puede ser un tensor de rango diferente, lo imporante es que las ecuaciones de movimiento sean
manifiestamente covariantes. Las densidades lagrangiana y Hamiltoniana tambien deben ser covariantes. En
el principio de Hamilton el elemento de cuadrivolumen es invariante de Lorentz. Si hemos de asumir que la
accion es escalar de Lorentz (ya que es un escalar euclidiano en el regimen no relativista) esto implica que las
densidades Lagrangiana y Hamiltoniana sean escalares de Lorentz. De lo anterior se desprende que el tensor
de esfuerzo energa en la Ec. (18.31) debe ser un tensor de Lorentz de segundo rango. No obstante, el cambio
de espacio implica que las componentes de tal tensor pueden cambiar su valor. Es claro que para la misma
densidad Lagrangiana, el cambio de (t, x1 , x2 , x3 ) a (x1 , x2 , x3 , ict) no altera a las componentes Ti j . Para las
otras componentes el cambio en su valor se puede obtener de las Ecs. (18.31, 18.33)
L
T , L
,
0 L L d L d
T0 L = L= L
d
dt dt d
d(ict) d (ict)
L d
= 4
L T4 4
dx4
d dx
L L d L d L d T 4
Tj 0 = ,j = j = j = j = j
dt dx
d d
ic d(ict) dx ic dx4 dx
d ic
icTj 0 = Tj 4
18.8. TEORIA DE CAMPOS RELATIVISTA 553
L d L d
T0 j = = ic = icT4 j
d dt
d d (ict)
dxj dxj
si la densidad Lagrangiana es un escalar de universo, la integral (18.87) sera claramente covariante de Lorentz
pero no as los lmites de integracion. La integracion espacial se realiza sobre un volumen fijo del espacio
tridimensional seguido de una integracion en el tiempo entre los lmites t1 y t2 . Pero la integracion sobre
un volumen extendido para tiempo fijo no es un concepto covariante puesto que la simultaneidad no es un
concepto invariante de Lorentz. Por otro lado, si tenemos en cuenta que la conexion causal s es un invariante de
Lorentz (eventos del genero espacial del genero temporal y como de luz), una descripcion covariante adecuada
sera decir que la integracion se hace sobre una hipersuperficie de tres dimensiones del genero espacial, es
decir una superficie en la cual todos los vectores de universo contenidos en ella sean del genero espacial. Los
vectores normales a dicha superficie son del genero temporal. En particular, los vectores que unan dos puntos
de universo en una superficie de tiempo constante seran del genero espacial ya que se anula su componente
x4 . Aunque la anulacion de x4 no permanece cuando se hace una transformacion de Lorentz (no se conserva la
simultaneidad) el vector continuara siendo del genero espacial. Por tanto, una superficie de tres dimensiones a
tiempo constante es un tipo particular de superficie del genero espacial. Analogamente, lo que en un sistema
especfico es una integracion en el tiempo para un punto espacial fijo, se puede describir covariantemente por
una integracion extendida a una superficie del genero temporal.
En un sistema unidimensional en el espacio fsico, la integracion en el principio de Hamilton descrita en
(18.19) se extiende al rectangulo que se ilustra en la Fig. 18.4a. Una transformacion de Lorentz es una rotacion
en el espacio de Minkowski y los lados paralelos a los ejes originales ya no lo seran en los ejes del sistema
transformado, pero los lados horizontales seguiran siendo del genero espacial y los lados verticales seguiran
siendo del genero temporal. Por tanto, en todos los sistemas de Lorentz podremos describir la integracion como
extendida a una region del cuadriespacio contenida entre dos hipersuperficies del genero espacial limitadas por
superficies del genero temporal que cortan a las anteriores.
13
En algunas ocasiones se usa en el regimen no relativista la coordenada x0 ct. En tal caso las equivalencias son las indicadas
en (18.84) pero omitiendo el factor c.
554 CAPITULO 18. FORMULACION LAGRANGIANA Y HAMILTONIANA PARA CAMPOS
Figura 18.4: (a) Region de integracion para el principio de Hamilton en un sistema unidimensional relativista.
(b) Volumen de integracion esquematico en el espacio tiempo de Minkowski.
Veamos ahora la descripcion covariante de cantidades del tipo P descritas por las Ecs. (18.85, 18.86). Una
forma apropiada para esta descripcion covariante es de la forma
Z
i
P = T dS (18.88)
c S
en donde la integracion se realiza sobre una hipersuperficie del genero espacial para la cual los vectores que
describen los elementos de superficie y que son normales a esta son los dS . T debe ser un tensor de universo de
segundo orden para garantizar la covarianza de P es decir que P defina un vector de universo o cuadrivector.
Veremos a continuacion que las componentes de P en (18.88) se reducen a integrales de volumen en el espacio
ordinario tridimensional del tipo descrito en (18.86) siempre que la divergencia del tensor T sea nula
T = 0
para ilustrarlo tomemos una region volumetrica V4 del cuadriespacio definida por tres superficies (ver Fig.
18.4b); S1 y S2 son del genero espacial y S3 es del genero temporal. Usando el teorema de la divergencia en
cautro dimensiones, podemos escribir
Z Z
dT
dx = T dS (18.89)
V4 dx S1 +S2 +S3
la integral sobre S3 es con respecto al tiempo a r constante. Tomando el volumen suficientemente grande, la
integral extendida a esta superficie mantendra a r fuera del sistema, en donde se anulan todas las cantidades
de campo. Por tanto Z Z
dT
dx = T dS (18.90)
V4 dx S1 +S2
Nuestra hipotesis de nulidad de la divergencia de T hace que tambien se anule el miembro izquierdo de
(18.90). Por tanto, si tomamos en el mismo sentido las normales a la superficie del genero espacial resulta
Z Z
T dS = T dS (18.91)
S1 S2
en la Fig. 18.4b, hemos tomado a S1 como una superficie del genero espacial arbitraria en tanto que S2 es una
superficie con tiempo constante es decir con x4 constante. En consecuencia, el vector normal a un elemento
de superficie de S2 es un vector del genero temporal que solo tiene componente en x4 i.e. dS = 4 dS2 y
recordando que S2 es una hipersuperficie tridimensional, la integracion sobre esta superficie es una integral de
volumen a tiempo constante. De lo anterior, se ve que la Ec. (18.91) queda
Z Z
T dS = T 4 dV
S1
18.9. ALGUNAS TEORIAS DE CAMPOS RELATIVISTAS 555
es claro que el miembro izquierdo se transforma como cuadrivector si T es un tensor de segundo rango, por
tanto el segundo miembro tambien transforma como vector de universo. Teniendo en cuenta (18.85) vemos por
tanto que R transforma como cuadrivector bajo la condicion de que el tensor T tenga divergencia nula. Si
adicionalmente las dos superficies S1 y S2 son superficies a tiempos constantes t1 y t2 respectivamente la Ec.
(18.91) conduce a
R (t1 ) = R (t2 )
que corresponde a la forma covariante de demostrar que R se conserva en el tiempo.
En consecuencia, sera posible con un poco de cuidado utilizar las cantidades conservadas ya obtenidas en
el regimen no relativista. Sin embargo, la correspondencia detallada no siempre es posible, pero en la mayora
de los casos es suficiente que la integracion de volumen se refiera a un sistema de Lorentz especfico en el cual
la hipersuperficie del genero espacial sea una region en el espacio de tres dimensiones a tiempo constante, ya
que siempre que tenemos eventos del genero espacial es posible encontrar un sistema de referencia en donde
los eventos son simultaneos.
Para la densidad de momento angular, notemos que el analogo covariante de Mi j Ec. (18.43) es un cua-
dritensor de tercer rango
i
M = x T x T (18.92)
c
el cual es antisimetrico en , . La integral conservada es
Z
M = M dS (18.93)
y la integracion se extiende a lo largo de una hipersuperficie del genero espacial. Si en particular se toma un
sistema de Lorentz en el cual la hipersuperficie sea a t constante se obtiene
Z
M M 4 dV
que corresponde a la definicion en el regimen no relativista. Por tanto, el razonamiento hecho en la seccion 18.5.4
sobre la conservacion de Mi j para tensores esfuerzo-energa simetricos (o simetrizados) puede extrapolarse
considerando el sistema de Lorentz particular con hipersuperficie a tiempo constante.
Ya mencionamos en la seccion 18.6 que la formulacion Hamiltoniana distingue las coordenadas espaciales
y temporales de forma explcita. Esto no significa que no se pueda construr una teora covariante de Lorentz,
simplemente implica que la formulacion no sera manifiestamente covariante. Podemos imaginar la formulacion
Hamiltoniana en el tiempo como la que ve cada observador particular. Si los campos y sus derivadas transforman
adecuadamente, es posible que la formulacion sea compatible con la relatividad especial en cada sistema de
Lorentz particular.
Otro punto importante se refiere a la descripcion de sistemas fsicos que involucran un conjunto de campos
que pueden interactuar entre s. En este caso la densidad Lagrangiana usualmente consistira en sumas de
densidades Lagrangianas que representan a los campos libres mas terminos que describen la interaccion entre
los campos. Ya habamos mencionado que parte de la dificultad para realizar una formulacion relativista de la
mecanica del punto tena que ver con el hecho de que la accion a distancia no es compatible con la relatividad
especial. La ventaja de las formulaciones de campo es que las interacciones entre campos pueden ser de
naturaleza local, es decir pueden tener lugar en un punto lo cual facilita la construccion de una formulacion
covariante. Mas aun, se puede trabajar interacciones de tipo local (en un punto del espacio tiempo) para
campos interactuando con partculas. Por tanto, tambien es factible una formulacion relativista de partculas
inmersas en uno o mas campos y que interactuan con estos. Un ejemplo notable es la interaccion de cargas
electricas puntuales con campos electromagneticos.
por tanto y se pueden tomar como variables de campo independientes. Tomando entonces a y
como las variabels independientes, la densidad Lagrangiana y todas las funciones asociadas las escribiremos en
terminos de estas dos variables de campo. Cada uno de estos campos sera un escalar de universo. Mas adelante
veremos que los campos complejos conducen de forma natural a una densidad asociada de carga y de corriente
y esta es la principal razon para considerar este tipo de campos.
Tomaremos en este caso la siguiente densidad Lagrangiana
L = c2 , , 20 c2 (18.94)
donde 0 es una constante. Observese que si los campos son escalares de universo, esta densidad Lagrangiana
tambien lo sera como se requirio en la seccion 18.8. Expresando esta densidad Lagrangiana en terminos de
espacio y tiempo separados nos queda
2
2
L = c2 2 2
0 c
= c c 20 c2
x x x4 x4 xi xi
L = c2 c2 20 c2
(ict) (ict)
quedando finalmente
L = c2 20 c2 (18.95)
encontremos la ecuacion de Lagrange asociada al campo
L 2 d L L
= c , ; = c2 , ; = 20 c2
, dx ,
, 20 = 0 (18.96)
1 d2
2 20 = 0 (18.97)
c2 dt2
y recordando la definicion del operador DAlembertiano Ec. (16.64) pag. 470, la ecuacion de campo se puede
reescribir en forma manifiestamente covariante en la forma
2 20 = 0 (18.98)
en (16.42) que produce un cambio de signo en el DAlembertiano. La ecuacion de Klein Gordon es en realidad
el analogo relativista de la ecuacion de Schrodinger para una partcula cargada de espn cero y masa en reposo
0 .
Veamos la forma del tensor esfuerzo energa definido en la Ec. (18.31), explcitamente se escribe para este
caso
L L L
T , L = , + L
, , , ,
= c2 , , c2 , , c2 , , 20 c2
T = c2 , , c2 , , + c2 , , + 20 (18.100)
el cual es claramente simetrico. Notese que L no depende explcitamente de los x lo cual nos dice que esta
densidad Lagrangiana describe un campo libre sin interaccion con el resto del universo. Adicionalmente, la no
dependencia de L con x nos dice que se cumplen los teoremas de conservacion expresados por la Ec. (18.30).
y usando de nuevo el DAlambertiano, vemos que estas corresponden a las ecuaciones de Klein Gordon.
Veamos ahora la representacion de Fourier de momentos canonicos totales. Para ello se introducen las
expansiones de Fourier (18.71, 18.73)
1 X 1 X
(r, t) = qk (t) eikr ; (r, t) = pk (t) eikr
V k V k
en la densidad Hamiltoniana. Debe tenerse en cuenta que como el campo no es real, no se cumple la condicion
qk = qk . En este caso qk y qk representan dos conjuntos independientes de coordenadas discretas (de la
misma forma en que y se consideran independientes). El Hamiltoniano total es la integral de volumen de
la densidad Hamiltoniana dada por (18.102)
Z
H= + c2 + 20 c2 dV
X Z X Z
1 i(jk)r 2 1 i(kj)r
H = pk (t) pj (t) e dV + c (k j) qk (t) qj (t) e dV
V V
k,j k,j
X Z
1
+20 c2 qk (t) qj (t) i(kj)r
e dV
V
k,j
H = pk pk + k2 qk qk ; k2 c2 k2 + 20 c2 (18.104)
donde se usa suma sobre ndices repetidos. Notese que este Hamiltoniano tiene la forma de una suma de
osciladores armonicos desacoplados de masa unidad y con frecuencia angular k . Esto se puede ver en forma
explcita utilizando las ecuaciones de Hamilton globales dadas por (18.78, 18.82)
H H
qj = = pj ; qj = = pj
pj pj
H H
pj = = j2 qj ; pj = = j2 qj (no suma)
qj qj
qj = pj ; qj = pj
18.9. ALGUNAS TEORIAS DE CAMPOS RELATIVISTAS 559
qj = j2 qj ; qj = j2 qj (no suma)
que son ecuaciones de oscilador armonico para cada coordenada discreta qj . Por lo tanto, en la representacion
por expansion de Fourier en ondas planas se sustituyen los campos y por sistemas discretos de osciladores
armonicos. Un proceso similar se realiza cuando el campo sonoro en un solido finito se construye como una
superposicion discreta de fonones. El espectro discreto de vibraciones de nuestro campo cargado escalar
viene dado por la Ec. (18.104) que actua como una relacion de dispersion. Es muy sencillo hacer una
teora cuantica (conocida como segunda cuantizacion) de estos campos cuando se trabaja con el formalismo de
expansion de Fourier pues en este caso cada oscilador se cuantiza como se cuantizan los osciladores armonicos
en la mecanica cuantica del discreto.
donde se ha introducido un factor 1/2 por conveniencia, pues claramente este factor no altera las ecuaciones de
movimiento. La ecuacion de campo asociada (ecuacion de Klein Gordon unidimensional para partcula neutra)
es
2 1 2
= 20 (18.106)
x2 c2 t2
esta es una ecuacion lineal en el campo (x, t). Podemos considerar la densidad Lagrangiana en (18.105) como
una aproximacion de campo debil de la densidad Lagrangiana dada por
" 2 #
c2 2
L= 2
20 2 (1 cos )
2 c x
por otro lado, la representacion por expansion de Fourier en ondas planas del campo de Klein Gordon real
unidimensional conduce a la relacion
qk (t) = A0 (k) ei(krk t)
donde k y k estan enlazadas por la relacion de dispersion dada por la segunda de las Ecs. (18.104). Para un
campo que sea solucion de la ecuacion de seno Gordon es mucho mas difcil construr una representacion por
expansion de Fourier debido al termino cos en la densidad Hamiltoniana. Sin emabrgo, la relacion de seno
Gordon se puede resolver con una estrucutra similar a una onda progresiva. Una solucion de la Ec. (18.107)
que tenga la forma de una perturbacion que se propaga con velocidad v, pero que por lo demas conserva su
forma, debe ser funcion exclusiva de = t x/v (notese la similitud con las soluciones generales de la ecuacion
de onda). Con base en lo anterior la Ec. (18.107) queda en la forma
d2 20 c2 v 2
A sin = 0 ; A
d 2 c2 v 2
y en funcion de lo que resulta es la ecuacion de un pendulo simple con amplitud finita. Si la amplitud
es pequena sabemos que describe un movimiento armonico simple en con dado por la segunda de las
Ecs. (18.104) para un numero separado de onda k = /v independiente de la amplitud. Si la amplitud es
finita sabemos que el pendulo deja de ser isocrono, es decir la frecuencia comienza a depender de la amplitud,
aun cuando nuestra continue siendo periodica. La relacion de dispersion tambien dependera entonces de la
amplitud. Esto es caracterstico de la ecuaciones alineales, ya que en particular la ecuacion de seno Gordon es
no lineal. Por otro lado, la ecuacion de Klein Gordon s es lineal pero la relacion de dispersion en (18.104) es
alineal puesto que k no es funcion lineal de k y solo se vuelve lineal cuando 0 se anula, es decir cuando la
ecuacion de Klein Gordon se convierte en la ecuacion de onda lineal.
De lo anterior se ve que la ecuacion de seno Gordon es alineal y con relacion de dispersion alineal no isocrona.
Un estudio mas detallado muestra que esta ecuacion admite soluciones de caractersticas muy peculiares incluso
entre las ecuaciones alineales. Estas soluciones peculiares son del tipo onda progresiva que pueden interactuar
entre s atravesandose unas a otras y que emergen sin variar su forma salvo por un posible cambio de fase.
Estas ondas solitarias que conservan su forma incluso a traves de interacciones se denominan solitones, los
cuales tienen amplias aplicaciones especialmente en Fsica de Partculas Elementales y en Fsica del Estado
Solido.
Bibliografa
[1] Classical Mechanics (3rd edition). Herbert Goldstein, Charles P. Poole, John L. Safko. Addison-
Wesley (2001).
[2] Physics Vol. I-Mechanics. Marcelo Alonso, Edward Finn. Addison-Wesley Publishing Co. Inc. Massa-
chusetts (1967).
[3] An introduction to Mechanics. Daniel Kleppner, Robert Kolenkow. McGraw-Hill International Edi-
tions, (1973).
[4] On the transformation of torques between the laboratory and center of mass reference
frames. Rodolfo A. Diaz, William J. Herrera. Revista Mexicana de Fisica, vol. E51 #2 p.112 - 115
(2005).
[5] Work and energy in inertial and noninertial reference frames. Rodolfo A. Daz, William J.
Herrera, Diego A. Manjarres. American Journal of Physics 77(3), 270-273 (2009).
[6] Normal Forces Can do Work. Diego A. Manjarres, Rodolfo A. Daz, William J. Herrera,
http://demonstrations.wolfram.com/NormalForcesCan DoWork.
[7] The physical meaning of Lagrange multipliers. Hasan Karabulut. European Journal of Physics 27,
709 (2006).
[8] Moments of inertia for solids of revolution and variational methods. Rodolfo A. Diaz, William
J. Herrera, R. Martinez. European Journal of Physics 27, 183 (2006).
[9] Classical Dynamics: A Contemporary Approach. Jorge V. Jose, Eugene J. Saletan. Cambridge
University Press (1998).
[10] Mathematical Methods of Classical Mechanics, 2nd Ed. Arnold V. I. Springer-Verlag, Berlin
(1988).
[11] Classical Dynamics: A Modern Perspective. E. C. G. Sudarshan, N. Mukunda. John Wiley & Sons
(1974).
[12] A theorem on moments of inertia. J. F. Streib. American Journal of Physics 57, 181 (1989).
[13] Using symmetries and generating functions to calculate and minimize moments of inertia.
Rodolfo A. Diaz, William J. Herrera, R. Martinez. arXiv:physics/0404005v2.
[14] Another reversing gyroscope. K. Hara. Journal of Technical Physics vol 49, #1, 27-37 (2008). On
the possible reversal of a satellite spin axis. K. Hara. J. Tech. Phys. vol 50, #2, 75-85 (2009). On
the possible reversal of an earth-scale top. K. Hara. J. Tech. Phys. vol 50, #4, 375-385 (2009).
561
562 BIBLIOGRAFIA
[15] New conditional integrable cases of motion of a rigid body with Kovalevskayas configuration.
H.M. Yehia, A.A Elmandouh. Journal of Physis A: Math. Theor. 44, 012001 (2011).