Matematicas para Las Ciencias A - Steiner, Erich
Matematicas para Las Ciencias A - Steiner, Erich
Matematicas para Las Ciencias A - Steiner, Erich
Edición en español
© Editorial Reverté, S. A., 2005
Edición en papel
ISBN: 978-84-291-5159-6
Edición e-book (PDF)
ISBN: 978-84-291-9439-5
Propiedad de:
EDITORIAL REVERTÉ, S. A.
Loreto, 13-15, Local B
08029 Barcelona
Tel: (34) 93 419 33 36
Fax: (34) 93 419 51 89
[email protected]
www.reverte.com
Reservados todos los derechos. La reproducción total o parcial de esta obra, por cualquier medio o
procedimiento, comprendidos la reprografía y el tratamiento informático, queda rigurosamente prohi-
bida, salvo excepción prevista en la ley. Asimismo queda prohibida la distribución de ejemplares
mediante alquiler o préstamo públicos, la comunicación pública y la transformación de cualquier
parte de esta publicación (incluido el diseño de la cubierta) sin la previa autorización de los titulares
de la propiedad intelectual y de la Editorial. La infracción de los derechos mencionados puede ser
constitutiva de delito contra la propiedad intelectual (Art. 270 y siguientes del Código Penal). El
Centro Español de Derechos Reprográficos (CEDRO) vela por el respeto a los citados derechos.
# 1257
Este libro describe las matemáticas necesarias para todo el conjunto de temas que con-
forman una carrera universitaria de quı́mica (u otra ciencia aplicada). Ha sido ideado
para que sirva de libro de texto para asignaturas de ‘matemáticas para quı́micos’.
Los temas se desarrollan de forma lógica y consistente con pocas suposiciones de
un conocimiento previo de matemáticas. El material está organizado en tres partes inde-
pendientes en gran medida: los Capı́tulos 1 al 15 tratan de álgebra, cálculo, ecuaciones
diferenciales y desarrollos en series; los Capı́tulos 16 a 19 de vectores, determinantes
y matrices; los Capı́tulos 20 y 21 son introducciones a los grandes temas de análisis
numérico y estadı́stica.
Una caracterı́stica de este libro es el uso extenso de ejemplos para ilustrar todos los
conceptos y métodos importantes del texto. Algunos de esos ejemplos se usan también
para mostrar aplicaciones de las matemáticas en quı́mica y varios conceptos básicos de
fı́sica. Los ejercicios al final de cada capı́tulo, 900 en total, son un elemento esencial
del desarrollo de los temas, y han sido ideados para dar al estudiante un conocimiento
operativo del material del texto. Se dan las soluciones a todos los ejercicios numéricos.
El texto se acompaña de una historia de las matemáticas en notas a pie de página.
Algunos temas de quı́mica reciben un tratamiento extenso. Entre ellos el concepto de
trabajo presión-volumen en termodinámica en el Capı́tulo 5, los sistemas periódicos en
el Capı́tulo 8, las ecuaciones diferenciales de la cinética quı́mica en el Capı́tulo 11, y
varias aplicaciones de la ecuación de Schrödinger en los Capı́tulos 12 y 14. Además, el
contenido de varios capı́tulos viene determinando en gran medida por sus aplicaciones
en las ciencias fı́sicas: Capı́tulo 9, las matemáticas de la termodinámica; Capı́tulos 10
y 16, descripción de sistemas y procesos en tres dimensiones; Capı́tulo 13 (avanzado),
algunas ecuaciones diferenciales y funciones especiales importantes en quı́mica y fı́si-
ca matemáticas; Capı́tulo 15 (avanzado), fuerzas intermoleculares, analisis ondulatorio
y espectroscopı́a de transformada de Fourier; Capı́tulos 18 y 19, simetrı́a molecular y
operaciones de simetrı́a, teorı́a de orbitales moleculares, dinámica molecular y mecánica
cuántica avanzada.
Agradecimientos
Quiero expresar mi gratitud a mis colegas de Departamento de Quı́mica por su estı́mu-
lo, crı́tica y ayuda en la preparación de este libro. Quiero dar las gracias en particular
a los Doctores John Sandall y David Rosseinsky, a los Profesores Ken Schofield y An-
thony Legon, por sus valiosos comentarios sobre determinados capı́tulos, y al Profesor
Patrick Fowler por su constante apoyo y crı́tica constructiva durante todas las etapas de
la redacción del libro.
VI Prefacio
Estoy en deuda con mis alumnos por convencerme de que este libro era necesario, y
con los revisores por persuadir a Oxford University Press de que lo publicase.
Sobre todo, quiero agradecer a Mary Steiner su paciencia y su fe en mı́.
02 Funciones algebraicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
02.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
02.20 Representación gráfica de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . 25
02.30 Factorización y simplificación de expresiones . . . . . . . . . . . . . . . . . 27
02.40 Funciones inversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
02.50 Polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
02.60 Funciones racionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
02.70 Resolución de sistemas de ecuaciones . . . . . . . . . . . . . . . . . . . . . . . . 43
02.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
03 Funciones trascendentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
03.10 Funciones trigonométricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
03.20 Relaciones trigonométricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
03.30 Coordenadas polares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
03.40 Funciones trigonométricas inversas . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
03.50 La función exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
03.60 La función logarı́tmica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
03.70 Valores de las funciones exponencial y logarı́tmica . . . . . . . . . . . . . 69
03.80 Funciones hiperbólicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
03.90 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
04 Derivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
04.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
04.20 El proceso de derivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
04.30 Continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
04.40 Lı́mites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
VIII Índice de contenidos
05 Integración . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
05.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
05.20 La integral indefinida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
05.30 La integral definida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
05.40 El cálculo integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
05.50 Usos del cálculo integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
05.60 Propiedades estáticas de la materia . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
05.70 Dinámica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
05.80 Trabajo presión-volumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
05.90 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
16 Vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397
16.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397
16.20 Álgebra vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398
16.30 Componentes de los vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401
16.40 Derivada escalar de un vector . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405
16.50 Producto escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407
16.60 Producto vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
16.70 Campos escalares y vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
16.80 Gradiente de un campo escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
16.90 Divergencia y rotacional de un campo vectorial . . . . . . . . . . . . . . . . 418
16.10 Espacios vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419
16.11 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420
17 Determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425
17.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425
17.20 Determinantes de orden 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427
17.30 Caso general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431
17.40 Resolución de ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
17.50 Propiedades de los determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 438
17.60 Reducción a forma triangular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
17.70 Funciones alternadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
17.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445
1.1. Conceptos
La Quı́mica, en común con las otras ciencias fı́sicas y otras ciencias aplicadas, com-
prende:
= 2,478 × 10−3 m3 .
V = f (p, T, n)
y significa que, conocidos los valores de p, T y n, el valor de V viene dado por el valor
de una función f (p, T, n) que, en el presente caso, es f (p, T, n) = nRT/p.
Una forma ligeramente diferente, utilizada a menudo en ciencias, es
V = V(p, T, n),
y significa que V es alguna función de p, T y n, que puede ser conocida o no. Trataremos
las funciones en el Capı́tulo 2.
Constantes: una cantidad cuyo valor es fijo para el caso que se está tratando. La canti-
dad R = 8,31451 J K−1 mol−1 es una cantidad fı́sica constante. Un número constante es
cualquier número especı́fico, por ejemplo, a = 0,1 o π = 3,14159 . . .
Variables: una cantidad que puede tomar cualquier valor dentro de un conjunto de
valores permitidos. Las cantidades p, T y n son las variables de la función f (p, T, n) =
nRT/p.
Podemos distinguir dos tipos de variables. Una variable independiente es una cuyo
valor no depende del valor de ninguna otra variable. Escribir la ecuación (1.1) en la
forma V = nRT/p supone que las variables independientes son p, T y n. La cantidad
V es entonces una variable dependiente porque su valor depende de los valores de las
variables independientes. Podrı́amos haber escogido T como variable dependiente y p, V
y n como variables independientes, es decir: T = pV/nR. En la práctica, la elección de
las variables independientes es por conveniencia matemática, pero puede también estar
determinada por las condiciones de un experimento. En algunos casos es más fácil medir
la presión p, la temperatura T y la cantidad de materia n, y calcular V a partir de ellas.
Tratamos los números en los Apartados 1.2 y 1.3, y las variables en el Apartado 1.5.
El álgebra de los números (aritmética) lo tratamos en el Apartado 1.6.
(iii) Una cantidad fı́sica es siempre el producto de dos cantidades, un número y una
unidad. Por ejemplo, T = 298,15 K o R = 8,31451 J K−1 mol−1 . En aplicaciones de
matemáticas en ciencias, los números por sı́ mismos no tienen sentido salvo que se es-
pecifiquen las unidades de las cantidades fı́sicas. Es importante saber cuáles son esas
unidades, pero las matemáticas no dependen de ellas.
01. El signo para la igualdad fue introducido por Robert Recorde (hacia 1510-1558) en su The whets-
tone of witte (La piedra de afilar el ingenio, Londres 1557).‘Voy a fijar, como suelo hacer en mis trabajos,
un par de lı́neas paralelas o gemelas de misma longitud, ası́: ==, porque no hay dos cosas que puedan ser
más iguales.’
1.2. Números reales 3
Las unidades obedecen las leyes ordinarias del álgebra y pueden manipularse co-
mo números. Por ejemplo, en el cálculo del volumen presentado en el Ejemplo 1.1, las
cantidades fı́sicas estaban dadas en unidades SI: mol para cantidad de materia, K para
temperatura, Pa para presión y J para energı́a (o trabajo). Los números y las unidades se
separan en el cálculo, dando la expresión para las unidades
presión = fuerza/área
J Nm
= = m3 ,
Pa N m−2
que es la unidad SI de volumen.
Tratamos las unidades con más detalle en el Apartado 1.7.
Las operaciones de suma y resta de enteros tanto positivos como negativos son posibles
gracias a las reglas
m + (– n) = m − n
m − (– n) = m + n (1.2)
4 Capı́tulo 1. Números, variables y álgebra
de manera que, por ejemplo, la resta de un número negativo es equivalente a la suma del
correspondiente número positivo. La operación de multiplicación es posible gracias a las
reglas
(– m) × (– n) = + (m × n)
(– m) × (+ n) = – (m × n) . (1.3)
(– 2) × (– 3) = 2 × 3 = 6 , (2) × (– 3) = −2 × 3 = −6 .
En las ecuaciones (1.2) y (1.3) las letras m y n son sı́mbolos empleados para representar
cualquier par de enteros. Son variables enteras, cuyos valores pertenecen al conjunto
(infinito) de los enteros.
La división de un entero por otro no da siempre un entero. Por ejemplo 6 ÷ 3 = 2,
pero 6 ÷ 4 no es un entero. Un conjunto de números para el que la división siempre es
válida es el conjunto de los número racionales, que consiste en todos los números m/n
donde m y n son enteros. La expresión m/n se lee ‘m partido por n’ y es la notación más
común para ‘m dividido por n’. La definición excluye el caso n = 0 porque la división
por cero no está definida (véase el Apartado 1.6), pero incluye el caso de los enteros
puesto que un entero m puede escribirse como m/1. Las reglas para la combinación de
números racionales (y, en general, de fracciones) son
m p mq + np
+ = (1.4)
n q nq
m p mp
× = (1.5)
n q nq
m p m q mq
÷ = × = (1.6)
n q n p np
2 4
2. Sume y .
3 5
Un denominador común es 3 × 5 = 15. Por lo tanto
2 4 2×5 3×4 10 12 22
+ = + = + = .
3 5 3×5 3×5 15 15 15
1 5
3. Sume y .
4 6
Un denominador común es 4 × 6 = 24, pero el mı́nimo (menor) denominador común es 12:
1 5 3 10 13
+ = + = .
4 6 12 12 12
2 4 2×4 8
× = = .
3 5 3×5 15
Podemos interpretarlo como tomar dos tercios de 4/5 (o cuatro quintos de 2/3).
2 4 2 5 10
÷ = × = .
3 5 3 4 12
El número 10/12 puede simplificarse ‘dividiendo arriba y abajo’ por el factor común 2: 10/12 = 5/6.
mx = n (1.7)
x2 = 2
√ √
es x = 2, la raı́z cuadrada positiva de 2 (la otra solución es − 2), y este número no
puede escribirse como un número racional 4m/n. Se dice que es un número irracional.
Otros números irracionales se obtienen como soluciones de la ecuación cuadrática más
general
mx2 + nx + p = 0 ,
x3 = 2
√
3
√ √
3
es la raı́z cúbica de 2, 2. Los números irracionales como 2y 2 se llaman sordos.
6 Capı́tulo 1. Números, variables y álgebra
a 0 + a 1 x + a 2 x 2 + a 3 x 3 + . . . + an x n = 0 , (1.8)
9 8 7 6 5 4 3 2 1
con estos mismos nueve caracteres y con este signo 0, que llaman los
árabes sefir, se escribe cualquier número, como se demostrará más
abajo.
(Fibonacci)4
02. Leonhard Euler (1707-1783). Nacido en Suiza, trabajó la mayor parte de su vida en San Peters-
burgo y en Berlı́n. Fue uno de los matemáticos más prolı́ficos del mundo, escribió ‘voluminosos trabajos
y gigantescos libros de texto’. Contribuyó a casi todas las ramas de las matemáticas y a sus aplicacio-
nes a problemas fı́sicos, incluyendo cálculo, ecuaciones diferenciales, series infinitas, funciones complejas,
mecánica e hidrodinámica, y su nombre se asocia con muchos teoremas y fórmulas. Una de sus contribu-
ciones importantes, si bien no espectacular, fue la notación matemática. Introdujo el sı́mbolo e, dio a las
funciones trigonométricas su definición moderna, y por su uso de los sı́mbolos sen, cos, i y π, los hizo ser
universalmente aceptados.
03. El sı́mbolo π fue empleado por vez primera por William Jones (1675-1749) en un libro de texto
sobre matemáticas, Synopsis palmariorum mathesos (Una nueva introducción a las matemáticas) en 1706.
El que Euler adoptara el sı́mbolo determinó su aceptación.
04. Leonardo de Pisa, llamado Fibonacci (hacia 1170 - después de 1240). El matemático sobresaliente
del medioevo en occidente. En sus viajes a Egipto, Siria, Grecia y Sicilia, Fibonacci estudió los textos
matemáticos griegos y arábigos, y se familiarizó con el sistema posicional arábigo desarrollado por los
matemáticos indios del valle del Indo, en el noroeste de la India. El primer libro de Fibonacci, el Liber
abaci o Libro de los ábacos (1202, revisado en 1228), circuló ampliamente en forma de manuscrito pero
fue únicamente publicado en 1857 en Scritti di Leonardo Pisano. El primer capı́tulo empieza con la cita
que aparece más arriba en el texto.
1.3. Representación decimal de los números 7
300 + 70 + 2 = 3 × 102 + 7 × 10 + 2
y se denota con el sı́mbolo 372, en el cual el valor de cada dı́gito depende de su posición
dentro del sı́mbolo del número. El sistema decimal tiene base 10, y es el único sistema
en uso general.
Aunque los números racionales pueden siempre expresarse exactamente como co-
cientes de enteros, esto no ocurre con los números irracionales. Para efectuar los cálcu-
los, todo número que no es entero se expresa convenientemente como una fracción
decimal,6 por ejemplo: 5/4 = 1,25 . La forma general de una fracción decimal consiste
en un entero a la izquierda de la coma decimal, la parte entera del número, y uno o más
dı́gitos a la derecha de la coma decimal, la parte decimal o fraccionaria del número. El
valor de cada dı́gito viene determinado por su posición. Por ejemplo
5 6 7
234,567 = 200 + 30 + 4 + + +
10 100 1000
= 2 × 102 + 3 × 101 + 4 × 100 + 5 × 10−1 + 6 × 10−2 + 7 × 10−3 ,
05. Una de las principales fuentes que introdujeron el sistema posicional indo-arábigo en la Europa
occidental fue la Aritmética de Al-Khwarizmi. Muhammad ibn Musa Al-Khwarizmi (Mohammed hijo de
Moisés de Khorezm, la moderna Khiva en Uzbekistán) ejerció en los tiempos del califa de Bagdad Al-
Mamún (813-833), y fue probablemente un miembro de su “Casa de la sabidurı́a” (Academia) en la época
en que Bagdad era la mayor ciudad del mundo. El Álgebra de Al-Khwarizmi fue utilizado ampliamente en
árabe y en su traducción latina como fuente sobre ecuaciones lineales y cuadráticas. La palabra algoritmo
proviene del nombre del autor y la palabra álgebra proviene del tı́tulo, Liber algebrae et almucabala, que
puso Robert de Chester en la traducción latina (hacia 1140) del trabajo sobre las ecuaciones.
06. El uso de fracciones decimales fue introducido en las matemáticas europeas por el matemático e
ingeniero flamenco Simon Stevin (1548-1620) en su De Thiende (El arte de las décimas) en 1585. Aunque
las fracciones decimales ya eran usadas por los chinos desde varios siglos antes, y el astrónomo persa Al-
Kashi utilizó fracciones decimales y sexagesimales en su Llave de la Aritmética a principios del siglo XV, el
uso generalizado de las fracciones decimales en las matemáticas europeas se remonta directamente a Stevin,
especialmente después que John Napier modificase la notación y diese la actual con el punto decimal (o
la coma, como se usa en gran parte de la Europa continental). Esto simplifica mucho las operaciones de
multiplicación y división.
8 Capı́tulo 1. Números, variables y álgebra
los puntos suspensivos indican que la fracción debe extenderse de manera indefinida.
Redondeado a cuatro cifras decimales, el número tiene por cotas inferior y superior
0,3333 y 0,3334:
1
0,3333 < < 0,3334,
3
donde el sı́mbolo < significa ‘menor que’. Otros sı́mbolos del mismo tipo son > para
‘mayor que’ y ≤ para ‘menor o igual que’. Otros ejemplos de fracciones decimales que
no terminan son
1 1
= 0,142857 142857 . . . , = 0,083333 333333 . . .
7 12
En ambos casos se repite indefinidamente una secuencia finita de dı́gitos tras la coma
decimal, ya sea inmediatamente después de la coma decimal, como la secuencia 142857
en 1/7, o después de un número finito de dı́gitos previos, como 3 en 1/12. Ésta es una
propiedad caracterı́stica de los números racionales. √
Un número irracional no puede ser expresado exactamente. El número 2 tiene como
valor aproximado con 16 cifras significativas
√
2 = 1,41421 35623 73095 . . .
y puede ser calculado hasta cualquier precisión deseada por medio de un método numéri-
co como el de Newton-Raphson que tratamos en el Capı́tulo 20. En contraste con el caso
racional, los dı́gitos tras la coma decimal no muestran una secuencia que se repita.
El número arquimediano π
El número π se define como la razón de la circunferencia de un cı́rculo a su diámetro.
Es un número trascendente y no puede ser representado exactamente mediante un núme-
ro finito de dı́gitos.7 Su valor ha sido calculado con muchas cifras significativas. Euler lo
dio con 127 cifras decimales en 1748. Su valor con 16 cifras significativas es
El valor de π ha sido de importancia práctica desde hace miles de años. Por ejemplo, un
manuscrito egipcio de aproximadamente 1650 a.C. (el papiro Rhind del Museo Británico
de Londres) contiene una receta para el cálculo del volumen de un silo cilı́ndrico de la
07. La prueba de la irracionalidad de π fue dada primero en 1761 por el fı́sico y matemático alemán
Johann Heinrich Lambert (1728-1777) que es también conocido por haber introducido las funciones hi-
perbólicas en trigonometrı́a. La prueba de que el número π es trascendente se debe a Carl Louis Ferdinand
von Lindemann (1852-1939), quien lo demostró en 1882 con un método similar al empleado por Hermite
para e.
1.3. Representación decimal de los números 9
cual se deduce el valor aproximado 256/81 ≈ 3,160. Arquı́medes8 usó por primera vez
un método para generar aproximaciones precisas, determinando las cotas
223 22
<π< ,
71 7
y la cota superior tiene un error de sólo 2 partes por mil.
El número e de Euler
El número e se define mediante la ‘serie infinita’ (véase el Capı́tulo 7)
1 1 1 1
e = 1+ + + + + ...
1! 2! 3! 4!
= 2,71828 18284 59045 . . .
n! = 1 × 2 × 3 × . . . × n ,
EJEMPLO 1.6 Demuestre que la suma de los 10 primeros términos de la serie da un valor aproximado
de e que es correcto al menos con 6 cifras significativas.
1 1 1 1 1 1 1 1 1
e = 1+1+ + + + + + + + + + ...
2 6 24 120 720 5040 40320 362880 3628800
≈ 2,71828 .
08. Arquı́medes (287-212 a.C.) nació en Siracusa, en Sicilia. Hizo contribuciones a las matemáticas,
la mecánica y la astronomı́a, y fue un gran inventor de máquinas. Sus principales contribuciones a las ma-
temáticas y a las ciencias matemáticas fueron la invención de métodos para determinar áreas y volúmenes,
que anticiparon el cálculo integral, y el descubrimiento de la primera ley de la hidrostática y de la ley de la
palanca.
09. Charles Hermite (1822-1901). Matemático francés, profesor en la Sorbona, es conocido por sus
trabajos en álgebra y en teorı́a de números. Su trabajo sobre el álgebra de los números complejos (las
‘formas hermı́ticas’) adquirió importancia con la formulación de la teorı́a cuántica. La ecuación diferencial
de Hermite y los polinomios de Hermite son importantes en la resolución de la ecuación de Schrödinger
para el oscilador armónico.
10 Capı́tulo 1. Números, variables y álgebra
El valor es correcto hasta las seis cifras dadas porque cada término adicional de la serie es por lo menos
diez veces menor que el anterior.
tienen todos 3 cifras decimales. En la representación en coma flotante, utilizada más ge-
neralmente en ciencias, los números se dan con un número fijo de ‘cifras significativas’,
donde los ceros a la izquierda no cuentan. Por ejemplo,
x2 = −1
1.5. Variables 11
i2 = −1 .
Las dos raı́ces cuadradas de un número real negativo arbitrario −x2 son entonces ix y
−ix. Por ejemplo,
√ √ √
−16 = 16 × −1 = ±4i .
Estos números se llaman imaginarios para distinguirlos de los números reales. Más
generalmente, el número
z = x + iy,
donde x e y son reales, se llama un número complejo. Tratamos los números complejos
en el Capı́tulo 8.
1.5. Variables
En los apartados previos hemos usado sı́mbolos (letras) para representar números
arbitrarios. Una cantidad que puede tomar cualquier valor escogido dentro de un con-
junto de valores se llama una variable. Si {x1 , x2 , x3 , . . . , xn } es un conjunto de objetos,
no necesariamente números, entonces podemos definir mediante ese conjunto una va-
riable x que tenga como valor cualquiera de los miembros del conjunto. El conjunto es
el dominio de la variable. En teorı́a de números (reales), los objetos del conjunto son
números reales, y una variable real puede tener como dominio o bien todo el continuo
de los números reales o bien un subconjunto de éste. Si el dominio de la variable x es un
intervalo desde a hasta b,
a ≤ x ≤ b,
y los objetos contados son una muestra de algún conjunto discreto. Sin embargo, a veces
una cantidad fı́sica puede tener valores que en algunos casos pertenecen a un conjunto
discreto y en otros a un conjunto continuo. Es el caso de los niveles de energı́a y de las
frecuencias espectrales observadas en un átomo o en una molécula.
1
En = − , n = 1, 2, 3 . . .
2n2
Los estados correspondientes del átomo son los estados ligados, en los cuales el movimiento del electrón
está confinado a las proximidades del núcleo. Las transiciones entre niveles de energı́a dan lugar a lı́neas
discretas en el espectro del átomo.
(ii) Niveles de energı́a continuos, con todas las energı́as positivas, E ≥ 0. Los correspondientes estados del
átomo son los de un electrón que se mueve en presencia del campo electrostático de la carga nuclear. Las
transiciones entre esos niveles de energı́a y los de los estados ligados dan lugar a intervalos continuos de
frecuencias espectrales.
La importancia del concepto de variable se debe a que las variables se pueden utilizar
para hacer afirmaciones sobre propiedades de conjuntos completos de números (u otros
objetos) y a que permiten la formulación de un conjunto de reglas para manipular núme-
ros. El conjunto de reglas se llama el álgebra.
6. a + 0 = 0 + a = a (suma de cero)
7. a × 0 = 0 × a = 0 (multiplicación por cero)
8. a × 1 = 1 × a = a (multiplicación por la unidad)
negativo:
|a| = +a si a > 0 ,
|a| = −a si a < 0 .
Por ejemplo
a2 a3 = (a × a) × (a × a × a) = a × a × a × a × a = a5 .
1
a−n = .
an
Por ejemplo, 25 × 2−2 = 25−2 = 23 por la regla 9, y 25 /22 = 25−2 = 23 por la regla 10, de
manera que 2−2 = 1/22 = 1/4. Además, tomar m = n en la regla 10 nos da
am /am = am−m = a0 = 1
21/2 × 21/2 = 21 = 2 .
√
De donde se deduce que 21/2 = 2, la raı́z cuadrada de 2. En general, a1/m es la raı́z
m-ésima de a,
√
a1/m = m
a.
Por ejemplo, 21/3 es la raı́z cúbica de 2 porque (21/3 )3 = 21 = 2. Vemos que para un
exponente no entero,
√ am puede ser complejo si a es negativo. Por ejemplo, (– 2)1/2 =
(– 1)1/2 × 21/2 = i 2 es complejo (véanse el Apartado 1.4 y el Capı́tulo 8).
1.7. Unidades 15
43/2 = (41/2 )3 = 8 .
o, de forma equivalente,
√ √
am/n = n
am = ( a)m .
n
Aunque hemos demostrado las reglas de los exponentes únicamente para exponentes en-
teros y racionales, se aplican también a los números con exponentes irracionales y, si se
permiten números complejos, a todo número escrito en la forma base/exponente. Cuando
m es una variable, am se llama función exponencial (véase el Apartado 3.5 para expo-
nentes reales y el Capı́tulo 8 para exponentes complejos). Si x = am , m es el logaritmo
en base a de x (véase el Apartado 3.6).
Hemos tratado en detalle la ley de los exponentes porque es una fuente común de
errores en las manipulaciones algebraicas.
1.7. Unidades
Una cantidad fı́sica tiene dos atributos esenciales, magnitud y dimensiones. Por
ejemplo, la cantidad ‘2 metros’ tiene dimensiones de longitud y tiene magnitud igual a
dos veces la del metro. El metro es una cantidad fı́sica constante que define las dimensio-
nes de la cantidad y proporciona una escala para especificar la magnitud de una longitud
arbitraria; es una unidad de longitud. En general, una cantidad fı́sica es el producto de
un número y de una unidad. Toda cantidad fı́sica puede expresarse en términos de sie-
te cantidades ‘fundamentales’ cuyos nombres y sı́mbolos aparecen en las dos primeras
columnas de la Tabla 1.1.
longitud l metro m
masa m kilogramo kg
tiempo t segundo s
corriente eléctrica I amperio A
temperatura T kelvin K
cantidad de materia n mol mol
intensidad lumı́nica Iν candela cd
Los sı́mbolos en la segunda columna definen las dimensiones de las cantidades fı́sicas
fundamentales, y las dimensiones de todas las demás cantidades pueden expresarse en
función de ellas. Por ejemplo, la velocidad es la distancia recorrida por unidad de tiempo
y tiene dimensiones de longitud dividida por tiempo, lt−1 . Las dimensiones de una can-
tidad fı́sica son independientes del sistema de unidades utilizado para describir su valor.
Todo sistema de unidades debe, sin embargo, ajustarse a las dimensiones. Por ejemplo,
en un sistema de unidades en el cual la unidad de longitud es el metro, m, y la unidad
de tiempo es el segundo, s, la unidad de velocidad es metro por segundo, ms−1 . Algunas
cantidades fı́sicas no tienen dimensiones. Ese es el caso de una cantidad que es el cocien-
te de dos otras con las mismas dimensiones. Ejemplos de esto son la densidad relativa, la
masa molar relativa y la fracción molar. Un ejemplo menos evidente es el ángulo (plano)
que se define en términos del cociente entre dos longitudes (véase el Apartado 3.1).
Vimos en el Apartado 1.1 que las unidades obedecen las leyes del álgebra ordinaria.
Una de las lecciones del ejemplo es que las dimensiones, y por lo tanto las unidades, a
ambos lados de una ecuación tienen que coincidir.
EJEMPLO 1.11 Para la ecuación de los gases ideales, pV = nRT, las dimensiones de pV (utilizando las
Tablas 1.1 y 1.2) son las de trabajo (o energı́a)
(ml−1 t−2 ) × l3 = ml2 t−2 .
La correspondiente expresión en términos de unidades SI es Pa m3 = J. En el segundo miembro de (1.1),
para nRT,
(mol)(JK−1 mol−1 )(K) = J
como es necesario.
1.7. Unidades 17
Se utiliza toda una variedad de sistemas de unidades, muchos adaptados a las necesida-
des de las disciplinas particulares de las ciencias fı́sicas. El sistema recomendado para
las ciencias fı́sicas, y para la quı́mica en particular, es el Sistema Internacional de Unida-
des (SI) que se basa en las siete unidades de base cuyos nombres y sı́mbolos se reseñan
en la Tabla 1.1. Toda cantidad fı́sica tiene una unidad SI determinada por sus dimensio-
nes. La unidad SI de velocidad es el metro por segundo, ms−1 . Además de las unidades
fundamentales, un cierto número de cantidades que son particularmente importantes en
las ciencias fı́sicas tienen asignados nombres y sı́mbolos SI. Algunos de estos aparecen
en la Tabla 1.2.
Los múltiplos de diez de las unidades SI tienen nombres formados con los nom-
bres de las unidades y los prefijos reseñados en la Tabla 1.3. Por ejemplo, un pico-
metro es pm = 10−12 m, un decı́metro es dm = 10−1 m. Estas unidades de longitud
se usan frecuentemente en quı́mica: concentraciones en moles por decı́metro cúbico,
mol dm−3 = 103 mol m−3 , y longitudes de enlaces moleculares en picometros.
Cálculos aproximados
A menudo se utilizan las potencias de 10 como una descripción del orden de mag-
nitud. Por ejemplo, si una longitud A es dos órdenes de magnitud mayor que la longitud
B, entonces es unas 102 = 100 veces mayor. En algunos cálculos que involucran una
18 Capı́tulo 1. Números, variables y álgebra
variedad amplia de órdenes de magnitud puede ser de ayuda, para evitar errores, calcular
el orden de magnitud de la respuesta antes de embarcarse en todo el cálculo detallado.
La manera más sencilla de hacer tal ‘cálculo del orden de magnitud’ es convertir todas
las cantidades fı́sicas a la unidades SI fundamentales y aproximar la magnitud de cada
una por una potencia apropiada de diez, posiblemente multiplicada por un entero. Tales
cálculos son a menudo sorprendentemente exactos.
EJEMPLO 1.12 Para el Ejemplo del Apartado 1.1 (desechando las unidades),
nRT 0,1 × 8,31451 × 298
V= = = 2,478 × 10−3
p 105
dos estimaciones de la respuesta son
10−1 × 10 × 102
1. V≈ = 10−3
105
10−1 × 8 × 300
2. V≈ = 2,4 × 10−3
105
Unidades atómicas
Las ecuaciones del movimiento en mecánica cuántica se complican por la presencia
de las cantidades fı́sicas me , masa en reposo del electrón, e, carga del protón, h, constante
de Planck, y 0 , permitividad del vacı́o. Por ejemplo, la ecuación de Schrödinger para el
movimiento de un electrón alrededor del núcleo estacionario en el átomo de hidrógeno
es
h2 e2
− ∇ 2
ψ − ψ = Eψ . (1.9)
8π 2 me 4π0 r
1.4. Las unidades atómicas de longitud y energı́a tienen nombre: la unidad de longitud,
a0 se llama el bohr, y es la distancia más probable del electrón al núcleo en el estado
fundamental del átomo de hidrógeno (el radio de la órbita del estado fundamental en la
‘vieja teorı́a cuántica’ de Bohr). La unidad de energı́a, Eh , se llama el hartree, y es igual
a dos veces la energı́a de ionización del átomo de hidrógeno. Las unidades atómicas
son de amplio uso en quı́mica cuántica. El convenio es dar cada cantidad fı́sica como
una expresión de las unidades atómicas, y eliminar la unidad de la expresión: para una
distancia r, por ejemplo, la cantidad adimensional r/a0 se sustituye por r. Si hacemos
esto en la ecuación (1.9), la ecuación adimensional resultante es
1 1
− ∇2 ψ − ψ = Eψ . (1.10)
2 r
A menudo se refiere uno a la ecuación en esta forma como la “ecuación de Schrödin-
ger en unidades atómicas”. Los resultados de los cálculos son entonces números que
deben ser reinterpretados como cantidades fı́sicas. Por ejemplo, la cantidad E en la
ecuación (1.9) es una energı́a. La resolución de la ecuación (1.10) nos da los núme-
ros E = −1/2n2 , para todo entero positivo n, y estos números se interpretan entonces
como las energı́as E = (– 1/2n2 )Eh .
1.8. Ejercicios
Apartado 1.2
Calcule y exprese cada resultado en su forma más sencilla:
1 1 1 1 3 5
1. + 2. + 3. −
4 8 3 6 4 7
2 5 3 1 3 5
4. − 5. + − 6. − +
9 6 4 8 4 8
1 3 1 1 1 3
7. − + − 8. − − 9. − − −
5 10 4 8 4 8
1 3 3 2 5
10. × 11. 2× 12. ×
2 4 4 3 6
1 3 1 3 1 3
13. × − 14. − × 15. − × −
2 4 4 2 2 4
3 4 2 5 2 4
16. ÷ 17. ÷ 18. ÷
4 5 3 3 15 5
3 4 3 4 3 4
19. ÷ − 20. − ÷ 21. − ÷ −
4 5 4 5 4 5
Apartado 1.3
22. Exprese como fracciones decimales:
23. Halle la secuencia de dı́gitos que se repite en la representación con fracciones decimales de
2 1 13 1
, , , .
9 6 3 21
24. Halle cotas superiores e inferiores con 6 cifras significativas exactas para
1 2 1
, , , π, e.
7 9 11
25. Halle los valores de los factoriales 5!, 6!, 7!, 8!, 9!, 10! .
3! 6! 5!
26. Calcule , , .
2! 3! 2!3!
Apartado 1.6
Simplifique cuando sea posible:
Apartado 1.7
Identifique una cantidad fı́sica con cada una de las siguientes dimensiones (columna 2 de la Tabla 1.1) e
indique sus unidades SI:
2.1. Conceptos
Escribir la ecuación de estado (1.1) de los gases ideales en la forma
nRT
V=
p
supone que, para cualquier estado del sistema, el valor del volumen V (la variable depen-
diente) se determina mediante los valores de la presión p, la temperatura T y la cantidad
de materia n (las variables independientes). En general, decimos que una variable de-
pendiente es función de la variable o de las variables de las que depende.1 En el ejemplo
precedente, V es una función de las tres variables p, T y n. En este capı́tulo trataremos
las funciones de una variable únicamente. El caso de más de una variable independiente
lo comentamos en el Capı́tulo 9.
Sea la variable y una función de la variable x. Por ejemplo, la ecuación
y = 2x2 − 3x + 1 (2.1)
nos da y como una función particular de x. Para cada valor de x el valor de y viene dado
por el segundo miembro de la ecuación. Esta expresión define una función f
cuyo valor para cada valor de x dado es asignado a la variable y (se lee f (x) como ‘f de
x’). La función f es la regla para calcular y a partir de x.
Una función toma valores numéricos cuando se asignan valores numéricos a las va-
riables.
01. La palabra ‘función’ fue utilizada por primera vez en este contexto por el matemático alemán
Gottfried Wilhelm Leibniz (1646-1716).
24 Capı́tulo 2. Funciones algebraicas
f (2) = 2 × 22 − 3 × 2 + 1 = 3
f (1) = 2 × 12 − 3 × 1 + 1 = 0
f (0) = 2 × 02 − 3 × 0 + 1 = 1
Sin embargo, el concepto de función es más general que esto, porque la variable x puede
ser sustituida por otra variable, por otra función o por una cantidad más complicada,
como un operador diferencial o una matriz.
f (a) = 2a2 − 3a + 1
y
g(x) = 2x2 + 5x + 3
es una nueva función de x que está relacionada con f (x) a través de g(x) = f (x + 2).
d
EJEMPLO 2.4 Sustituya la variable x en (2.2) por el operador diferencial
dx
d d 2 d d2 d
f =2 −3 +1=2 2 −3 +1
dx dx dx dx dx
es un nuevo operador diferencial.
EJEMPLO 2.5 Por la ecuación de estado de los gases ideales, el volumen es una función de la presión, la
temperatura y la cantidad de materia,
nRT
V = f (p, T, n) = ,
p
y por el cálculo hecho en el Ejemplo 1.1
Al calcular el valor de una función puede ser necesario algún cuidado para que la ex-
presión que define la función sea interpretada correctamente. Una función sencilla como
(2.2) aparece libre de ambigüedades, como hemos visto en el Ejemplo (2.1), pero incluso
un caso tan sencillo admite malas interpretaciones.
Resolución de ambigüedades
La expresión aritmética
2+3×4
puede resultar ambigua porque su valor depende del orden en el que se combinan los
números. Puede ser interpretada como (2 + 3) × 4 = 20, o puede ser interpretada como
2 + (3 × 4) = 14. Las ambigüedades pueden resolverse siempre con un uso adecuado de
los paréntesis, como en este ejemplo. Ante la duda, utilice paréntesis.
Si no se usan paréntesis, se pueden evitar las ambigüedades siguiendo las reglas, uti-
lizadas en la programación por ordenador,
Decimos que la función dada por la ecuación (2.2) es una función cuadrática porque
la potencia mayor de x es un cuadrado (en geometrı́a plana, cuadratura es el acto de
cuadrar, es decir, de hallar un cuadrado cuya área sea igual a la de una figura dada).
Es un ejemplo de una clase general de funciones llamadas polinomios. Tratamos los
polinomios y otras funciones algebraicas en los apartados que siguen. Otras funciones
que son importantes en las ciencias fı́sicas son las funciones trigonométricas, la función
exponencial y la función logarı́tmica; estas funciones trascendentes las tratamos en el
Capı́tulo 3.
y = f (x) = x2 − 2x − 3 . (2.3)
Para cada valor de x existe un valor de y. Podemos hacer una tabla, como la Tabla 2.1,
dando los valores de y correspondientes a un conjunto de valores de x. Además, puede
26 Capı́tulo 2. Funciones algebraicas
considerarse que cada par de números (x, y) de la tabla define la posición de un punto en
un plano, y puede dibujarse en una gráfica como en la Figura 2.1.
Tabla 2.1
x y
−3 12
−2 5 Figura 2.1
−1 0
0 −3
1 −4
2 −3
3 0
4 5
5 12
Figura 2.2
02. René Descartes (1596-1650), o Renatus Cartesius, filósofo y matemático francés. Relacionó su
búsqueda de una matemática universal con una experiencia mı́stica en 1619 en la cual “lleno de entusiasmo,
descubrı́ el fundamento de una ciencia maravillosa”. Desarrolló la relación entre el álgebra y la geometrı́a
en su Géométrie, publicada como un apéndice al Discours de la méthode pour bien conduire sa raison et
chercher la vérité dans les sciences (Discurso del método para conducir bien la razón y buscar la verdad en
las ciencias) en 1637. Antes de Descartes, las cantidades x, x2 y x3 se asociaban siempre con los concep-
tos geométricos de lı́nea, superficie y volumen. Descartes eliminó esa limitación: “la raı́z (x), el cuadrado,
el cubo, etc. son meramente magnitudes en proporción continua”. Su obra marca el principio del álgebra
moderno. Descartes introdujo el convenio de utilizar letras del principio del alfabeto (a, b, . . .) para las cons-
tantes y los parámetros, y letras del final (x, y, z) para las incógnitas y las variables. La Géométrie contiene
la formulación del teorema fundamental del álgebra y el primer uso de las palabras ‘real’ e ‘imaginario’ en
el contexto de los números complejos.
Fermat también desarrolló la geometrı́a coordenada al mismo tiempo que Descartes, pero su obra no se
publicó hasta 1679, tras su muerte. Pierre de Fermat (1601-1665), abogado en el parlamento provincial de
Toulouse, hizo importantes contribuciones a la teorı́a de números y al cálculo.
2.3. Factorización y simplificación de expresiones 27
3xy + 6x2
Esto es una factorización: hemos escrito la expresión algebraica como el producto de los
dos factores (3x) y (y + 2x).
La operación inversa a la factorización suele llamarse ‘desarrollo’. Los casos (2) y (4) de
los Ejemplos 2.7 son ejemplos de factorización de una función cuadrática. Ilustran las
siguientes formas generales importantes:
28 Capı́tulo 2. Funciones algebraicas
(x + a)(x + b) = x2 + (a + b)x + ab
(a + b)2 = a2 + 2ab + b2
(2.4)
(a − b)2 = a2 − 2ab + b2
(a + b)(a − b) = a2 − b2
Figura 2.3
3xy + 6x2
9x + 9xy
numerador y denominador tienen ambos 3x como factor común, y pueden ser divididos
por ese factor (si x = 0) sin modificar el valor de la fracción:
4x 2 × (2x) 2x
(1) = =
2y 2 × (y) y
2 + 4y 2(1 + 2y) 1 + 2y
(2) = =
4 + 8x 4(1 + 2x) 2(1 + 2x)
a2 − b2 (a + b)(a − b) a−b
(3) = =
a + 2ab + b
2 2
(a + b) 2 a +b
2.4. Funciones inversas 29
ax + b
EJEMPLO 2.10 Si y = , halle x = f −1 (y).
cx + d
Para despejar la x,
Entonces
(cy − a)x = −(dy − b)
y dividiendo ambos miembros por (cy − a) obtenemos la solución
dy − b
x=− = f −1 (y) .
cy − a
Es necesario señalar que este procedimiento no es válido si x = −d/c porque y no está definida para
ese valor de x. Además, x tampoco está definida para y = a/c. Tales complicaciones pueden ignorarse
normalmente.
Hemos dado este ejemplo en detalle porque muestra el tipo de manipulaciones algebraicas usadas de
manera rutinaria en la resolución de problemas reales.
Figura 2.4
EJEMPLO 2.12
y = f (x) = x5 − 2x .
En este caso la función inversa existe para todos los valores de x, pero no puede escribirse de manera sencilla
en forma algebraica, aunque puede ser tabulada y dibujada como en la Figura 2.5.
Figura 2.5
f (x, y) = 0 ,
2.5. Polinomios 31
donde f es una función de ambas variables x e y, decimos que y es una función implı́cita
de x. En muchas ecuaciones de las ciencias fı́sicas no es posible expresar una variable
como una función explı́cita de las otras, o puede ser que no resulte conveniente hacerlo.
2.5. Polinomios
La forma general de un polinomio de grado n es
f (x) = a0 + a1 x + a2 x2 + · · · + an xn (2.8)
n
f (x) = ai x i , (2.9)
i=0
donde el sı́mbolo representa un sumatorio. La notación nos dice que sumemos los
términos ai xi en los cuales la variable i va tomando por orden los valores 0, 1, 2, . . . , n:
n
= a 0 + a 1 x + a 2 x 2 + · · · + an x n
3
(1) ixi = 0 × x0 + 1 × x1 + 2 × x2 + 3 × x3 = x + 2x2 + 3x3
i=0
3
x2n−1 x−1 x1 x3 x5 1 x x3 x5
(2) = + + + = + + +
n=0
n+1 1 2 3 4 x 2 3 4
4
(3) (– x)i = (– x)2 + (– x)3 + (– x)4 = x2 − x3 + x4
i=2
f (x) = a0 + a1 x . (2.10)
y = mx + c . (2.11)
La gráfica de esta función es una lı́nea recta de pendiente m, que corta el eje vertical y
(cuando x = 0) en el punto y = c, como se muestra en la Figura 2.6.
Figura 2.6
Si tomamos dos puntos arbitrarios en la recta con valores (x, y), o coordenadas,
(x1 , y1 ) y (x2 , y2 ) entonces
y1 = mx1 + c
y2 = mx2 + c
2.5. Polinomios 33
y y2 − y1
m= (2.12)
x2 − x1
f (x) = 0 . (2.14)
EJEMPLO 2.15 La gráfica de la función lineal y = 2x − 4 es una lı́nea recta como en la Figura 2.6. La
pendiente de la recta es 2, lo que supone que el valor de y crece el doble de rápido que el de x. Ası́, cuando x
se incrementa en 1, y se incrementa en 2. La recta cruza (corta) el eje y en el punto y = −4, cuando x = 0.
Cruza el eje x en el punto x = 2, y ésa es la raı́z de la función lineal.
f (x) = a0 + a1 x + a2 x2 . (2.15)
y = ax2 + bx + c . (2.16)
Una gráfica tı́pica se muestra en la Figura 2.1, donde vemos que la curva corta el eje
x (cuando y = 0) en dos puntos: x = −1 y x = 3. Ésas son las raı́ces de la función
cuadrática y son las soluciones de la ecuación cuadrática
x2 − 2x − 3 = 0 .
En este sencillo ejemplo las raı́ces se obtienen fácilmente factorizando, sin necesidad de
dibujar la gráfica. La función se expresa como el producto de dos factores lineales,
x2 − 2x − 3 = (x + 1)(x − 3) ,
Si bien es posible factorizar toda una serie de funciones cuadráticas tanteando, siem-
pre se pueden hallar las raı́ces mediante una fórmula:3
ax2 + bx + c = 0
para
√
−b ± b2 − 4ac
x= . (2.17)
2a
Entonces, si x1 y x2 son las raı́ces obtenidas mediante (2.17),
√ √
−b + b2 − 4ac −b − b2 − 4ac
x1 = , x2 =
2a 2a
la función cuadrática tiene la forma factorizada
La cantidad
b2 − 4ac (2.19)
03. Una tableta de arcilla del primer periodo babilonio (hacia 1800-1600 a.C.) tiene inscrita en escritu-
ra cuneiforme sumeria el siguiente problema (en notaciónmoderna): dado que xy = 60 y que x−y = 7, halle
x e y. La receta dada para la solución corresponde a x = (7/2)2 + 60+(7/2), y = (7/2)2 + 60−(7/2).
El método y el enfoque de recetario es casi idéntico al utilizado por Al-Khwarizmi dos milenios y medio
después. El álgebra moderno se hizo posible con el desarrollo entre los siglos XV y XVII de una notación
abstracta general. Un paso importante fue dado por François Viète (1540-1603). Abogado, polı́tico, criptoa-
nalista y matemático aficionado francés, hizo contribuciones en trigonometrı́a y en álgebra. Se le recuerda
sobre todo como el hombre que, en su In artem analyticem isagoge (Introducción al arte analı́tico) de 1591,
introdujo el uso sistemático de sı́mbolos (letras) en la teorı́a de ecuaciones, distinguiendo entre constantes
y variables.
2.5. Polinomios 35
negativo. Vemos una explicación gráfica de los tres posibles casos de discriminante en
la Figura 2.7.
Figura 2.7
√
EJEMPLO 2.18 Caso b2 − 4ac < 0.
La función cuadrática
x2 − 3x + 4
tiene raı́ces (complejas) x1 y x2 dadas por
√
3± −7 1 √
x= = (3 ± i 7)
2 2
y puede escribirse como (x − x1 )(x − x2 ).
Esto significa que para valores muy grandes de x, positivos o negativos (cuando |x| →
∞), la función se comporta como la función ax2 , más sencilla, y puede ser sustituida por
ella.
EJEMPLO 2.19 Comportamiento de una función cuadrática para valores grandes de la variable
Para valores de |x| menores que 100, aproximadamente, la función x2 − 2x − 3 difiere de la función x2 en
más de un 2 %. Para valores de x mayores la diferencia disminuye rápidamente: para |x| = 103 la diferencia
viene a ser de 0,2 %, para |x| = 105 es 0,002 %, y para |x| = 1010 es 2 × 10−8 %.
Las funciones cuadráticas son importantes en las ciencias fı́sicas porque se emplean para
representar movimientos vibratorios de muchos tipos. El movimiento vibratorio más
sencillo es el movimiento armónico simple y, por ejemplo, una pelota que rueda hacia
adelante y hacia atrás en un recipiente parabólico (un ‘pozo de potencial parabólico’)
describe un movimiento armónico simple.
Figura 2.8
Otros ejemplos son las oscilaciones de un péndulo, las vibraciones de átomos dentro
de moléculas o sólidos, los campos eléctricos y magnéticos oscilantes en la radiación
electromagnética.
Figura 2.9
Un oscilador armónico simple es un cuerpo, de masa m, que se mueve en una lı́nea recta alrededor de
una posición de equilibrio bajo la influencia de una fuerza proporcional a la distancia del cuerpo al punto
de equilibrio y dirigida hacia ese punto, F = −kx, donde k se denomina la constante de la fuerza y el
signo negativo asegura que la fuerza actúa siempre en la dirección opuesta al desplazamiento. La energı́a
del sistema es
1 1
E = mv2 + kx2 ,
2 2
donde v es la velocidad del cuerpo. La expresión de la energı́a es una función cuadrática en las variables v y
x; 12 mv2 es la energı́a cinética y 12 kx2 es la energı́a potencial. En ausencia de influencias externas la energı́a
total es constante (véase el Apartado 12.5 para un tratamiento más completo del oscilador armónico).
2.5. Polinomios 37
2 d 2 ψ 1
− + kx2 ψ = Eψ ,
2m dx2 2
donde ψ = ψ(x) es la función de ondas. La ecuación puede escribirse en la forma
Hψ = Eψ ,
2 d 2 1
H=− + kx2 ,
2m dx2 2
2
d d d2
una función cuadrática de la función y de , puesto que ≡ 2.
dx dx dx
Polinomio general
Un polinomio de grado n siempre puede factorizarse como el producto de n factores
lineales
f (x) = a0 + a1 x + a2 x2 + · · · + an xn
(2.22)
= an (x − x1 )(x − x2 ) · · · (x − xn ) .
Esto se denomina teorema fundamental del álgebra y fue demostrado por primera vez
por el gran matemático Gauss.4 La función es cero cuando cualquiera de los factores
lineales es cero, y los números x1 , x2 , . . . , xn son las n raı́ces del polinomio. Algunas de
esas raı́ces pueden ser iguales entre sı́ (raı́ces múltiples) y algunas pueden ser complejas.
Un polinomio de grado impar (n = 1, 3, 5, . . .) tiene siempre al menos una raı́z real
porque su gráfica está obligada a cruzar el eje x al menos una vez. En general, este
polinomio tiene un número impar de raı́ces reales. Un polinomio de grado par (n =
2, 4, 6, . . .) tiene un número par de raı́ces reales, o ninguna raı́z real si la curva no cruza
el eje x.
04. Carl Friedrich Gauss (1777-1855), niño prodigio y profesor en Göttingen, hizo contribuciones
sustanciales en cada rama importante de las matemáticas puras y aplicadas: teorı́a de números, geometrı́a,
álgebra, estadı́stica, teorı́a de perturbaciones, teorı́a electromagnética. Inventó o inició nuevas ramas de
las matemáticas, entre ellas la teorı́a de funciones de variable compleja y la geometrı́a diferencial, que
constituyó gran parte de la base de las matemáticas del siglo XIX. Dio su primera prueba (de cuatro) del
teorema fundamental del álgebra en su tesis doctoral, Prueba del teorema de que toda función racional
integral de una variable puede ser resuelta en factores reales de primer o segundo grado, en 1799.
38 Capı́tulo 2. Funciones algebraicas
x3 − 3x2 + 4x − 2 = (x − 1)(x2 − 2x + 2) .
√
Las raı́ces del factor cuadrático son 1 ± i, siendo i = −1,
x2 − 2x + 2 = x − (1 + i) x − (1 − i)
Los Ejemplos 2.22 y 2.23 muestran que, si no se permiten números complejos, un poli-
nomio puede siempre factorizarse como el producto de factores lineales, uno por cada
raı́z real, y, como mucho, factores cuadráticos, todos reales.5 Utilizamos el teorema en
el Apartado 2.6 para construir fracciones simples.
Toda relación de la forma
05. Este es el enunciado del teorema fundamental del álgebra dado por Gauss en su primera prueba
de 1799.
2.6. Funciones racionales 39
donde P(x), Q(x), . . . , V(x) son polinomios de cualquier grado (finito) en x, define la
variable y como una función algebraica de x. Por ejemplo, la ecuación
es una ecuación cúbica en y, y puede resolverse para cada valor de x.6 Las funciones
que no pueden ser definidas de esta forma, mediante un número finito de polinomios, se
llaman funciones trascendentes. Algunos ejemplos son las funciones trigonométricas, la
función exponencial y la función logarı́tmica. Tratamos esas funciones en el Capı́tulo 3.
P(x) = a0 + a1 x + a2 x2 + · · · + an xn ,
(2.24)
Q(x) = b0 + b1 x + b2 x2 + · · · + bm xm .
P(x) a 0 + a1 x + a 2 x 2 + · · · + an x n
y = f (x) = = . (2.25)
Q(x) b 0 + b 1 x + b 2 x 2 + · · · + bm x m
En cada caso la función está definida para todos los valores de x para los cuales el
denominador no es cero, ya que la división por cero no está permitida. Por ejemplo, la
función (i) en (2.26) no está definida en x = 0, y (iii) no está definida en x = −2. En
general, la función racional (2.25) está definida para todos los valores de x salvo para
las raı́ces del polinomio Q(x) del denominador, para las cuales Q(x) = 0. La gráfica de
06. La fórmula para la solución general de una ecuación cúbica fue descubierta en Bolonia a comien-
zos del siglo XVI por Scipio del Ferro y Nicolo Tartaglia. El método de resolución (método de Cardano)
fue descrito por Girolamo Cardano (1501-1576) en su Ars magna de 1545. Cardano demostró que algunas
soluciones eran complejas. El libro también contiene una descripción de un método para resolver ecuacio-
nes cuárticas debido a Ludovico Ferrari (1522-1565). El matemático noruego Niels Enrik Abel (1802-1829)
demostró en su Sobre la resolución algebraica de ecuaciones (1824) que no existe una solución algebraica
de la ecuación general de quinto grado, o de ninguna ecuación polinómica de grado mayor que 4. ‘La corta
vida de Abel estuvo llena de pobreza y tragedia’; murió de tisis con 27 años de edad. Dio la primera prueba
rigurosa del teorema del binomio, hizo contribuciones pioneras en la teorı́a de grupos, e hizo un trabajo
importante e innovador en la teorı́a de funciones elı́pticas y otras funciones trascendentes superiores. La
ecuación general de quinto grado fue resuelta mediante funciones elı́pticas por Hermite en 1858.
40 Capı́tulo 2. Funciones algebraicas
la función y = 1/x en la Figura 2.10 ilustra varias propiedades tı́picas de las funciones
racionales.
Cuando x se acerca a cero desde la derecha (x > 0) el valor
de 1/x se hace arbitrariamente grande. Decimos que y = 1/x
tiende a infinito cuando x tiende a cero. Igualmente, y tiende a
menos infinito cuando x tiende a cero desde el lado negativo.
El punto x = 0 se llama punto singular, y la mayorı́a de las
funciones racionales tienen al menos uno de esos puntos (uno
por cada raı́z de Q(x)). La gráfica también muestra que cuando
x → 0 desde cualquiera de los dos lados, la curva se acerca al
eje y tanto como queramos pero no lo llega a cruzar. El eje y es
la recta x = 0 y lo llamamos una ası́ntota a la curva. Decimos
Figura 2.10
que la curva se aproxima a la recta x = 0 asintóticamente. La
recta y = 0 (el eje x) es también una ası́ntota.
La factorización se consigue bien sea por división o por el siguiente método. Por conocer
(o suponer) que x = 1 es una raı́z, escribimos
Para que esta ecuación se cumpla para todo valor de x es necesario que los coeficientes
de cada potencia de x sean los mismos a ambos lados de la igualdad. Por lo tanto
1 = a, −7 = b − a , 16 = c − b , −10 = −c .
Fracciones simples
Consideremos
1 1 1 1
= = − . (2.27)
x2 + 3x + 2 (x + 1)(x + 2) x+1 x+2
La función cuadrática del denominador se expresa como el producto de dos factores li-
neales, y la fracción se descompone en dos fracciones simples más sencillas. Veremos
en los Capı́tulos 6 y 11 que la descomposición en fracciones simples es una herramienta
importante en la resolución de algunas ecuaciones diferenciales en la teorı́a de veloci-
dades de reacción, y en integración en general. Una función racional propia P(x)/Q(x)
cuyo denominador puede ser factorizado, puede siempre descomponerse en fracciones
simples más sencillas. El siguiente ejemplo ilustra dos de los caso sencillos más impor-
tantes. Todos los demás se pueden tratar de la misma manera.
42 Capı́tulo 2. Funciones algebraicas
si x = 3, entonces 5 = 7A y A = 5/7,
y si x = −4, entonces − 2 = −7B y B = 2/7.
siendo x1 , x2 , . . . , xn las raı́ces. Si todas las raı́ces son distintas, entonces P(x)/Q(x) se
descompone en la suma de n fracciones simples, como en el Ejemplo 2.27:
P(x) c1 c2 cn
= + + ··· + . (2.29)
Q(x) x − x1 x − x2 x − xn
Si algunas de las raı́ces son iguales, entonces hay términos adicionales, como en el Ejem-
plo 2.28, con potencias del factor lineal en el denominador. Por ejemplo, si x1 = x2 = x3 ,
entonces
P(x) c1 c2 c3 c4 cn
= + + + + ··· +
Q(x) x − x1 (x − x1 )2 (x − x1 )3 x − x4 x − xn
(2.30)
ax2 + bx + c c4 cn
= + + ··· + .
(x − x1 )3
x − x4 x − xn
2.7. Resolución de sistemas de ecuaciones 43
ax + b
, (2.31)
x + px + q
2
a1 x + b 1 a2 x + b2 a m x + bm
+ + ··· + 2 . (2.32)
x2 + px + q (x2 + px + q)2 (x + px + q)m
1 1 1 1−x
= = + 2 .
x − 3x + 4x − 2
3 2
(x − 1)(x − 2x + 2)
2
x − 1 x − 2x + 2
(1) x + y = 3,
(2) x − y = 1.
y = 3 − x,
y = x − 1.
La Figura 2.11 muestra que las gráficas de esas funciones lineales se cortan en el punto
(x, y) = (2, 1). Las dos ecuaciones tienen la solución común x = 2, y = 1.
En general, una ecuación algebraica con dos variables x e y define una de las variables
como función algebraica de la otra. Por ejemplo, la ecuación
define una segunda función y = g(x). Las dos ecuaciones tienen soluciones comunes para
aquellos valores de x para los cuales f (x) y g(x) son iguales. Gráficamente, las soluciones
comunes reales son aquellos puntos, si los hay, en los cuales las gráficas de y = f (x) y
y = g(x) se cortan. Por ejemplo, las dos ecuaciones lineales
a0 x + b0 y = c0
(2.35)
a1 x + b1 y = c1
c0 b1 − c1 b0 a0 c1 − a1 c0
x= , y= . (2.36)
a0 b1 − a 1 b0 a0 b1 − a 1 b0
Figura 2.11
(1) x+y = 3
(2 ) y = −2
La ecuación (1) puede resolverse para y en función de x y el resultado ser sustituido en la ecuación (2). Ası́,
por (1), y = 3 − x, y (2) se transforma en
x2 − 3x + 2 = 0
con raı́ces x = 1 y x = 2. En este caso las dos soluciones son los puntos en los cuales la recta corta la curva
cuadrática, (1, 2) y (2, 1). En otros ejemplos del mismo tipo puede haber una sola solución, cuando la recta
es tangente a la curva cuadrática, o no haber soluciones reales, cuando la recta no corta la curva cuadrática.
Las ecuaciones pueden ser resueltas ahora en orden inverso: (3 ) es z = 4, entonces (2 ) es y + 8 = 6 de
manera que y = −2, y (1) es x − 2 + 4 = 3 de manera que x = 1.
El método utilizado en este ejemplo es un método sistemático general para resolver sistemas con cual-
quier número de ecuaciones lineales. Lo trataremos más en el Capı́tulo 20.
2.8. Ejercicios
Apartado 2.1
1. Halle los valores de y = 2 − 3x para (i) x = 0, (ii) x = 2, (iii) x = −3.
2. Halle los valores de y = 2x2 + 3x − 1 para (i) x = 0, (ii) x = 1, (iii) x = −1.
3. Dada f (x) = x2 − 3x − 4, halle (i) f (5), (ii) f (0), (iii) f (– 2).
4. Halle el valor de f (x) = 3x + 2 siendo 2x + 1 = 0.
5. Si f (x) = x2 − 3x − 4, ¿qué es f (a + 3)?
6. Dadas f (x) = 2x − 1 y g(x) = 3x + 1, exprese f (g) como una función de x.
7. Utilizando las reglas de precedencia de las operaciones aritméticas, calcule
Apartado 2.3
Desarrolle
8. 2(x + 2) 9. x(x − 3) 10. (x − 2)(2x + 3) 11. (x − 2)(2x + 3)(x − 5)
Factorice al máximo:
12. 2x2 + 3x 13. x2 − 4 14. 4x2 − 9 15. x2 + 6x + 5
Simplifique si es posible:
x x+2 x2 − 4 x2 + 3x + 2
16. 17. 18. 19.
3x2 + 2x x+4 x−2 x+2
x2 + 3x + 2 2x2 − 3x + 1
20. 21.
x2 + x + 2 x2 − 3x + 2
Apartado 2.4
Exprese x como función de y y en cada caso esboce y como función de x y x como función de y:
√ √
22. y = x − 2 23. y = x2 + 1 24. y = x2 + 1
x 2x + 3 x−1
25. y= 26. y= 27.
1−x 3x − 2 2x + 1
28. La ecuación de estado del virial para un gas puede aproximarse a baja presión por
B
pVm = RT 1 +
Vm
siendo p la presión, Vm el volumen molar, T la temperatura, R la constante de los gases y B el segundo
coeficiente del virial. Exprese B como una función explı́cita de las otras variables.
2.7. Resolución de sistemas de ecuaciones 47
29. La ley de Kohlrausch para la conductividad molar Λm de un electrolito fuerte a baja concentración c
es √
Λm = Λ0m − K c
siendo Λ0m la conductividad molar en disolución infinita y K una constante. Exprese c como una función
explı́cita de Λm .
30. La isoterma de adsorción de Langmuir
Kp
θ=
1 + Kp
da el grado de recubrimiento θ de la superficie por un gas adsorbido a presión p, siendo K una constante.
Exprese p en función de θ.
31. En el Ejemplo 2.13 sobre la ecuación de van der Waals, compruebe las expresiones explı́citas dadas
para T y p, y la ecuación cúbica en V.
Apartado 2.5
Desarrolle:
2
3
3
3
2
32. (n + 1)xn 33. ixi−1 34. k(k + 1)x−k 35. n! xn
n=0 i=0 k=1 n=0
αc2
Ka =
1−α
donde α es el grado de ionización. Exprese α en función de Ka y c (recuerde que α, Ka y c son cantidades
positivas).
Apartado 2.6
46. Divida 2x − 1 por x + 3 y exprese el resultado en forma adecuada.
47. Divida 3x3 − 2x2 − x + 4 por x + 2 y exprese el resultado en forma adecuada.
48 Capı́tulo 2. Funciones algebraicas
Apartado 2.7
Resuelva el sistema de ecuaciones y dé una interpretación gráfica del resultado:
54. x + y = 3, x−y=1 55. 3x − 2y = 1, 2x + 3y = 2
56. 3x − 2y = 1, 6x − 4y = 3 57. 2x − y = 2, x2 − xy + y2 = 2
58. 2x − y = 2, x2 − xy + y2 = 1 59. 2x − y = 2, x2 − xy + y2 = 0
60. x − 2y + 3z = 3, 2x − y − 2z = 8, 3x + 3y − z = 1
Funciones trascendentes
Definiciones geométricas
Las principales funciones trigonométricas del ángulo θ, el ángulo interno en A en la
Figura 3.1, son el seno, el coseno y la tangente del ángulo:
01. Las primeras ‘tablas trigonométricas’ fueron elaboradas hacia 150 a.C. por el astrónomo Hipar-
co de Nicea (la actual Iznik en Turquı́a), a quien debemos el cı́rculo de 360◦ , y por Claudio Tolomeo de
Alejandrı́a (hacia 100-178 d.C.) cuya Syntaxis mathematica (Sı́ntesis matemática), conocida como el Alma-
gesto, fue denominado por los Árabes al-magisti (el mejor) y sus tablas fueron utilizadas por los astrónomos
durante más de mil años. Las tablas del Siddhantas indio (hacia 400 d.C.) son esencialmente tabulaciones
de la función seno. Los matemáticos árabes (hacia 950 d.C.) añadieron nuevas tabulaciones y teoremas. La
trigonometrı́a europea fue desarrollada por Johann Müller (Regiomontanus) de Königsberg (1436-1476), y
por Georg Joachim Rheticus (1514-1576) de Wittenburg, un alumno de Copérnico, cuya Opus palatinum
de triangulis (Trabajo palatino sobre triángulos), 1595, se centró por vez primera en las propiedades del
triángulo rectángulo. François Viète (1540-1603) continuó ese trabajo con nuevas tablas extensas para las
seis funciones comunes, nuevas fórmulas, y el uso de funciones trigonométricas para resolver problemas de
ecuaciones algebraicas. El término ‘trigonometrı́a’ se acuñó hacia 1600.
50 Capı́tulo 3. Funciones trascendentes
opuesto bc
sen θ = = (3.1)
hipotenusa ac
adyacente ab
cos θ = = (3.2)
hipotenusa ac
opuesto bc sen θ
tg θ = = = (3.3)
adyacente ab cos θ
Figura 3.1
A partir de éstas se definen otras funciones, las más importantes son la secante, la cose-
cante y la cotangente:
1 1 1 cos θ
sec θ = , cosec θ = , cotg θ = = . (3.4)
cos θ sen θ tg θ sen θ
Una de las propiedades más conocidas del triángulo rectángulo es el teorema de Pitágo-
ras2
02. Pitágoras (hacia 580-hacia 500 a.C.). Nacido en la isla de Samos, viajó mucho y fue uno de los
principales introductores de las matemáticas y la astronomı́a egipcias y babilónicas al mundo griego. Se
afincó en Crotona, en el sur de Italia, donde fundó una sociedad religiosa y filosófica con una fuerte base
matemática, su lema era ‘todo son números’. Se le atribuye haber acuñado el vocablo ‘matemáticas’: lo que
es aprendido. Es tradicional atribuirle descubrimientos matemáticos. El teorema de Pitágoras era conocido
en el primer periodo babilonio, y la existencia de números irracionales fue posiblemente un descubrimiento
de pitagóricos posteriores hacia 400 a.C.. La escuela pitagórica introdujo el estudio sistemático de los prin-
cipios de las matemáticas: la teorı́a de números y la geometrı́a.
La expresión general del teorema de Pitágoras es: “En un triángulo rectángulo, el área de la figura en la hi-
potenusa es igual a la suma de las áreas de figuras similares en los otros dos lados” (Euclides, “Elementos”,
Libro VI, Proposición 31).
3.1. Funciones trigonométricas 51
Podemos escribir esto como una ecuación trigonométrica dividiendo ambos miembros
por ac2 :
ab2 bc2
+ 2 =1
ac2 ac
o bien
(una cantidad como ( sen θ)2 , el cuadrado de sen θ, se escribe habitualmente sen2 θ).
EJEMPLO 3.2 Para el triángulo del Ejemplo 3.1,
4 2 3 2 42 + 32 25
sen2 θ + cos2 θ = + = = = 1.
5 5 52 25
Unidades de ángulo
La unidad de ángulo usual es el grado. La Figura 3.3 muestra el ángulo recto (90◦ ),
el ángulo plano (180◦ ) y el ángulo alrededor de un punto (360◦ ).
Figura 3.3
s θ
= (3.7)
2πr 360◦
de manera que
s 360◦
θ= × . (3.8)
r 2π
52 Capı́tulo 3. Funciones trascendentes
360◦
1 rad = ≈ 57◦ 18 (3.9)
2π
(rad es la unidad de ángulo SI, a veces se usa un superı́ndice c, de tal modo que 1c =
1 rad). En la práctica se omite el sı́mbolo para la unidad, y un ángulo dado sin unidades
se supone que está en radianes. Por ejemplo
π π
90◦ = , 180◦ = π, 360◦ = 2π, sen = sen 30◦ .
2 6
La longitud de un arco de circunferencia es s = rθ cuando θ está en radianes.
Figura 3.5
3.1. Funciones trigonométricas 53
Las definiciones pueden extenderse a cualquier valor de los ángulos considerando las
coordenadas de un punto en un cı́rculo, como se muestra en la Figura 3.5.
Las funciones trigonométricas se definen para todos los puntos del cı́rculo como
y x y
sen θ = , cos θ = , tg θ = . (3.10)
r r r
En el primer cuadrante, I, con ángulos 0 < θ < π/2, los valores de x y de y son ambos
positivos y
Sin embargo, en el segundo cuadrante, con π/2 < θ < π, x es negativo e y es positivo.
Los signos de las funciones trigonométricas en los cuatro cuadrantes se dan en la Tabla
3.1
Tabla 3.1 Signos de las funciones trigonométricas
Cuadrante I II III IV
Ángulos 0 < θ < π/2 π/2 < θ < π π < θ < 3π/2 3π/2 < θ < 2π
0◦ < θ < 90◦ 90◦ < θ < 180◦ 180◦ < θ < 270◦ 270◦ < θ < 360◦
sen θ + + − −
cos θ + − − +
tg θ + − + −
√ √
EJEMPLO 3.4 Por la Tabla 3.2, sen π/3 = 3/2, cos π/3 = 1/2 y tg π/3 = 3. ¿Cuáles son los
valores del seno, coseno y tangente para 2π/3, 4π/3 y 5π/3?
El ángulo 2π/3 está en el segundo cuadrante, 4π/3 en el tercero y 5π/3 en el cuarto. Por lo tanto
√ √
sen 2π/3 = +√3/2 , cos 2π/3 = −1/2 , tg 2π/3 = −√3 ,
sen 4π/3 = −√3/2 , cos 4π/3 = −1/2 , tg 4π/3 = +√3 ,
sen 5π/3 = − 3/2 , cos 5π/3 = +1/2 , tg 5π/3 = − 3 .
Valores especiales
Los valores para los ángulos en las fronteras de los cuatro cuadrantes, y para algunos
otros pocos ángulos, aparecen en la Tabla 3.2.
Ángulos negativos
Cada punto sobre el cı́rculo puede alcanzarse ya sea mediante un giro en sentido antiho-
rario o bien mediante un giro en sentido horario. Definimos los ángulos positivos para
los giros en sentido antihorario y negativos para giros en sentido horario.
El punto P en la Figura 3.8, correspondiente al ángulo negativo −θ, puede alcanzarse
mediante un giro en sentido antihorario con ángulo 2π − θ, y los dos ángulos tienen los
mismos valores trigonométricos:
Figura 3.8
3.1. Funciones trigonométricas 55
Otros ángulos
El intervalo de valores permitidos para los ángulos puede extenderse de manera adi-
cional permitiendo uno o más giros completos alrededor del centro. Cada giro com-
pleto añade o sustrae 2π, y los ángulos θ ± 2πn, para todos los valores del entero
n = 0, 1, 2, 3, . . . , tienen los mismos valores trigonométricos:
tg (θ ± πn) = tg θ . (3.13)
Figura 3.9
56 Capı́tulo 3. Funciones trascendentes
Vemos que, mientras que cada ángulo corresponde a un punto en el cı́rculo, cada
punto corresponde a un número infinito de ángulos. En la Figura 3.9 se muestran las
gráficas del seno, coseno y tangente.3
Funciones periódicas
Una función con la propiedad
f (x ± a) = f (x) (3.14)
se llama función periódica de x con periodo a. Las funciones seno y coseno son pe-
riódicas con periodo 2π, la tangente es periódica con periodo π. Las curvas del seno y
del coseno de la Figura 3.9 se llaman ondas armónicas, y las funciones son la base de
la descripción de todos los tipos de ondas y otros movimientos oscilatorios.
EJEMPLO 3.7 Una onda armónica que se mueve en la dirección x positiva (una onda plana) se representa
por la función de ondas
x
φ(x, t) = A sen 2π − νt
λ
(o por una función coseno equivalente), y se muestra en la Figura 3.10 a tiempo t = 0.
Figura 3.10
La distancia más corta entre puntos equivalentes de la curva (el periodo con respecto a cambios en x) es la
longitud de onda λ. La velocidad de propagación de la onda es v = λν, siendo ν la frecuencia, o número de
oscilaciones por unidad de tiempo, y 1/ν es el periodo (temporal) τ , el tiempo de una oscilación completa.
El número A es la amplitud de la onda.
03. La gráfica de la función seno fue dibujada por vez primera en 1635 por Gilles Personne de Ro-
berval (1602-1675).
3.2. Relaciones trigonométricas 57
EJEMPLO 3.8 Para el oscilador armónico simple (véase el Ejemplo 2.20 y el Apartado 12.5) la ecuación
del movimiento clásica es la segunda ley del movimiento de Newton, que dice que la fuerza ejercida sobre
un cuerpo es igual a la masa del cuerpo multiplicada por la aceleración:
f = ma .
En este caso, la fuerza es f = −kx y la aceleración es la derivada segunda de la distancia con respecto al
tiempo (véase el Capı́tulo 4 sobre derivación):
d2 x
−kx = m .
dt2
Ésta es una de las ecuaciones de segundo orden más sencillas (Capı́tulo 12) y una solución es
x(t) = A cos ωt ,
k
donde A, la amplitud, es el desplazamiento máximo con respecto al equilibrio y ω = se denomina la
m
frecuencia angular. El desplazamiento x(t) es periódico con respecto al tiempo con periodo
2π 1
τ = = ,
ω ν
1 k
siendo ν = la frecuencia de oscilación. La gráfica del desplazamiento frente al tiempo es muy
2π m
similar a la de la Figura 3.10.
Demostraciones
a2 = h2 + (b − x)2 = h2 + b2 + x2 − 2bx , c2 = h2 + x2 ,
EJEMPLO 3.9 Dadas las longitudes a = 2, c = 3 y el ángulo b = π/3 del triángulo de la Figura 3.11,
halle el tercer lado y los otros ángulos.
Dados dos lados y su ángulo, utilizamos la regla del coseno para hallar b:
sen b sen a
= ,
b a
de manera que
a sen b 2 sen π/3 3
sen a = = √ = .
b 7 7
Por lo tanto a ≈ 40,89◦ (con una calculadora de bolsillo) y c ≈ 180◦ − 60◦ − 40,89◦ = 79,11◦ .
Además, tomando x = y,
sen2 x + cos2 x = 1 .
3.2. Relaciones trigonométricas 59
EJEMPLO 3.10 Exprese sen 5θ y sen θ en función de los senos y cosenos de 2θ y 3θ.
sen 5θ = sen (3θ + 2θ) = sen 3θ cos 2θ + cos 3θ sen 2θ ,
sen θ = sen (3θ − 2θ) = sen 3θ cos 2θ − cos 3θ sen 2θ .
1
sen x cos y = [sen (x + y) + sen (x − y)] (3.21)
2
y por lo tanto
1
sen 3θ cos 2θ = [sen 5θ + sen θ] .
2
EJEMPLO 3.12 Exprese sen 3θ sen 2θ y cos 3θ cos 2θ en función de cos θ y cos 5θ.
De las ecuaciones (3.18) se deduce que
1
sen x sen y = [cos (x − y) − cos (x + y)]
2
(3.22)
1
cos x cos y = [cos (x − y) + cos (x + y)]
2
y por lo tanto
1
sen 3θ sen 2θ = [cos θ − cos 5θ]
2
1
cos 3θ cos 2θ = [cos θ + cos 5θ] .
2
π π
EJEMPLO 3.13 Exprese sen ± θ y cos ± θ en función de sen θ y de cos θ.
2 2
De las ecuaciones (3.17) π
π π
sen± θ = sen cos θ ± cos sen θ .
2 2 2
π π
La Figura 3.9 muestra que sen = 1 y que cos = 0 (véase también el Ejemplo 3.5). Por lo tanto
2 2
π
sen ± θ = cos θ .
2
De manera similar, usando las ecuaciones (3.18),
π π π
cos ± θ = cos cos θ ∓ sen sen θ
2 2 2
= ∓ sen θ .
Las expresiones para la suma y la diferencia de ángulos son importantes para el cálculo
de integrales (véase el Capı́tulo 6) y para describir la combinación (interferencia) de
ondas.
60 Capı́tulo 3. Funciones trascendentes
EJEMPLO 3.14 La onda armónica que se mueve en la dirección x positiva descrita en el Ejemplo 3.7 y
representada en la Figura 3.20 tiene como función de ondas
x
φ+ = A sen 2π − νt .
λ
La función de la misma onda pero moviéndose en la dirección opuesta es
x
φ− = A sen 2π + νt .
λ
Si las ondas se superponen, éstas interfieren y producen una nueva onda cuya función de ondas es una
combinación lineal de la forma
ψ = aφ+ + bφ−
x x
= aA sen 2π − νt + bA sen 2π + νt .
λ λ
Utilizando las expresiones (3.17) para los senos de la suma y la diferencia de ángulos,
2πx 2πx
ψ = a A sen cos 2πνt − A cos sen 2πνt
λ λ
2πx 2πx
+ b A sen cos 2πνt + A cos sen 2πνt
λ λ
2πx 2πx
= (a + b)A sen cos 2πνt − (a − b)A cos sen 2πνt .
λ λ
Un caso especial importante se obtiene para a = b = 1:
2πx
ψ = 2A sen cos 2πνt .
λ
2πx
Esto se denomina una onda estacionaria. Su forma viene dada por el factor dependiente de x: 2A sen ,
λ
como se muestra en la Figura 3.13.
Figura 3.13
Es una interferencia constructiva. La amplitud se dobla pero no hay cambio en la longitud de onda. El
movimiento temporal viene dado por la función periódica cos 2πνt. La onda oscila con frecuencia ν, pero
las posiciones de los nodos (ceros) de la onda no se mueven. La onda es, por lo tanto, estacionaria en el
espacio.
3.3. Coordenadas polares 61
Figura 3.14
La figura muestra que la posición del punto P puede especificarse no sólo por sus coor-
denadas cartesianas (x, y), sino también por el par de números (r, θ), la distancia r al
punto del origen y el ángulo θ que da la orientación de la recta OP con respecto a la di-
rección x positiva (con el convenio habitual del signo). Los números r y θ se denominan
coordenadas polares del punto en el plano.4 Mientras que las coordenadas cartesia-
nas pueden tomar cualquier valor positivo o negativo, r es necesariamente positivo, con
valores r = 0 hasta ∞, y el ángulo θ toma valores θ = 0 hasta 2π.
Los dos conjuntos de coordenadas están relacionados por cos θ = x/r y sen θ = y/r,
de manera que
EJEMPLO 3.15 Halle las coordenadas cartesianas de un punto cuyas coordenadas polares son r = 2 y
θ = π/6. Utilizando los valores que aparecen en la Tabla 3.2,
π √
x = r cos θ = 2 cos = 3
6
π
y = r sen θ = 2 sen = 1 .
6
04. En su Methodus fluxionum (Método de fluxiones), escrito alrededor de 1671, Newton sugiere
ocho nuevos tipos de sistemas de coordenadas. Las coordenadas polares fueron su ‘séptima manera, para
espirales’.
62 Capı́tulo 3. Funciones trascendentes
Sin embargo, por ser tg θ una función periódica con periodo π, estas ecuaciones no
definen el ángulo de manera unı́voca, y hay que tener cierto cuidado al convertir de
coordenadas cartesianas a polares.
EJEMPLO 3.16 Halle las coordenadas polares (r, θ) del punto cuyas coordenadas cartesianas son (x, y) =
(– 1, 2).
√ y
r 2 = x 2 + y2 = 5 , r = + 5, tg θ = = −2 .
x
Usando las teclas de tangente inversa en una calculadora de bolsillo obtenemos el ángulo θ ≈ −63◦ ,
pero esto está obviamente equivocado porque este ángulo está en el cuarto cuadrante (véase la Figura 3.5)
mientras que el punto (– 1, 2) está en el segundo cuadrante, con 90◦ < θ < 180◦ . El ángulo correcto
se obtiene haciendo uso de la periodicidad de tg θ: sumar 180◦ al valor calculado nos da el ángulo en el
segundo cuadrante (≈ 117◦ ) con el mismo valor para la tangente (véase también el Ejemplo 3.18).
x = sen−1 y . (3.25)
Dada la posible confusión entre la notación para la inversa del seno, sen−1 y, y el in-
verso del seno, (sen y)−1 , a menudo se usa una notación alternativa para las funciones
trigonométricas inversas:
Las funciones inversas son funciones multivaluadas. Por ejemplo, como se indica en la
Figura 3.15, muchos ángulos tienen el mismo seno:
Figura 3.15
3.5. La función exponencial 63
Para superar esta ambigüedad, se define un valor principal para cada función inversa:
π π
x = arcsen y , − ≤x≤ ,
2 2
x = arccos y , 0 ≤ x ≤ π, (3.28)
π π
x = arctg y , − ≤x≤ .
2 2
Son los valores que se calculan, por ejemplo, en una calculadora de bolsillo o en un
ordenador.
EJEMPLO 3.17
π √
π 13π 3
cos = cos − = cos = ··· = .
6 6 6 2
El valor principal de la función inversa es
√
3 π
arccos = .
2 6
f (x) = ax , (3.29)
∞
xn x x2 x3 x4
ex = =1+ + + + + ··· (3.31)
n=0
n! 1! 2! 3! 4!
El valor de la función exponencial puede calcularse a partir de la serie con cualquier pre-
cisión deseada, aunque el número de términos necesarios aumenta rápidamente cuando
|x| aumenta (véase el Ejemplo 1.6 para x = 1).
EJEMPLO 3.19 Calcule exp (– 2x2 ) con 8 cifras significativas para x = 0,1.
El valor de la exponencial se obtiene directamente sustituyendo x por (– 0,02) en (3.31). De manera alter-
nativa,
(– 2x2 ) (– 2x2 )2 (– 2x2 )3 (– 2x2 )4 (– 2x2 )5
exp (– 2x2 ) = 1 + + + + + + ···
1! 2! 3! 4! 5!
4 2 4
= 1 − 2x2 + 2x4 − x6 + + x8 − x10 + · · ·
3 3 15
Sustituyendo x = 0,01, y usando para los cálculos intermedios dos cifras significativas más de las 8 pedidas,
Figura 3.16
05. En su influyente libro de texto Introductio in analysin infinitorum de 1748, Euler definió las fun-
ciones exponencial y logarı́tmica mediante series infinitas, y demostró que eran funciones inversas una de
la otra. En su libro, Euler sentó las bases para la rama de las matemáticas denominada análisis, el estudio
de los procesos infinitos, como en las series infinitas y en el cálculo.
3.5. La función exponencial 65
dex
= ex . (3.33)
dx
La función exponencial aparece en casi todas las ramas de la matemática aplicada, in-
cluyendo estadı́stica, cinética, teorı́a electromagnética, mecánica cuántica y mecánica
estadı́stica.
x(t) = x0 e±kt ,
donde x0 es el tamaño en el instante t = 0. Como ejemplo, consideremos un sistema cuyo tamaño x se dobla
tras cada intervalo de tiempo τ . Empezando con un tamaño x = x0 , el tamaño después del tiempo τ es 2x0 ,
después del tiempo 2τ es 4x0 , después del tiempo 3τ es 8x0 , etcétera. Después de un tiempo t,
x = 2t/τ x0 .
Igualando esto con la solución de la ecuación diferencial, vemos que la constante de proporcionalidad k es
inversamente proporcional al intervalo de tiempo τ , k = (ln 2)/τ , donde ln 2 es el logaritmo natural del
número 2 (véase más abajo).
ψ = e−r ,
siendo r la distancia del electrón al núcleo. Todos los orbitales del átomo de hidrógeno son de la forma
ψ = f (x, y, z)e−ar
donde (x, y, z) son las coordenadas cartesianas del electrón, relativas al núcleo en el origen, y a es una
constante. La función f (x, y, z) es un polinomio en x, y y z, y determina la forma del orbital. Por ejemplo,
f = z da un orbital px .
66 Capı́tulo 3. Funciones trascendentes
y = ex , x = loge y = ln y . (3.36)
Para representar el logaritmo común se usa a menudo el sı́mbolo log, omitiendo la base
10; y para el logaritmo natural casi siempre se utiliza el sı́mbolo ln.
EJEMPLOS 3.23
23 = 8 , 3 = log2 8 ,
103 = 1000 , 3 = log10 1000 ,
10−2 = 0,01 , −2 = log 0,01 ,
e3 = 20,0855 . . . , 3 = ln e3 = ln 20,0855 . . . ,
30 = 1 , 0 = log3 1 .
Nota: el logaritmo de 1 en cualquier base es cero.
06. John Napier o Neper (1550-1617), barón escocés y matemático aficionado, publicó su invento de
lo que llamó logaritmos en la Mirifici logarithmorum canonis descriptio (Una descripción del maravilloso
canon de los logaritmos) en 1614. Los logaritmos de Napier se basaban en un logaritmo de 107 = 0. La
primera tabla de logaritmos comunes, con log 1 = 0 y log 10 = 1, fue publicada tras consultas con Napier
por Henry Briggs (1561-1630), profesor de geometrı́a de Oxford, en la Arithmetica logarithmica de 1624.
Los logaritmos simplificaron mucho los cálculos que implicaban multiplicaciones y divisiones.
3.6. La función logarı́tmica 67
Las propiedades de combinación de los logaritmos son las propiedades de los exponentes
de las correspondientes exponenciales. Para el logaritmo natural:
ln x + ln y = ln xy , (3.37)
x
ln x − ln y = ln , (3.38)
y
ln xn = n ln x . (3.39)
ln 2 + ln 4 = ln (2 × 4) = ln 8 , ln 30 = ln (2 × 3 × 5) = ln 2 + ln 3 + ln 5 ,
6
ln 6 − ln 3 = ln = ln 2 , ln 23 = 3 ln 2 = ln 2 + ln 2 + ln 2 ,
3
1 −1 1
ln = ln 2 = − ln 2 , ln = ln 1 − ln 2 = 0 − ln 2 = − ln 2 ,
2 2
1 1
ln 27 = ln (27)1/3 = ln 3 , −2 ln 5 = ln 5−2 = ln .
3 25
ln (1 − x2 ) + ln (1 + x)−1 − ln (1 − x) = ln (1 − x2 ) − ln (1 + x) − ln (1 − x)
(1 − x2 ) 1 − x2
= ln = ln
(1 + x)(1 − x) 1 − x2
= ln 1 = 0 .
Los únicos casos en los cuales ln (x + y) = ln x + ln y son cuando x + y = xy, esto es, cuando x = y/(y − 1).
68 Capı́tulo 3. Funciones trascendentes
Figura 3.17
Las gráficas de todas las funciones logarı́tmicas son similares, con propiedades
pH = − log10 [H+ ] ,
donde [H+ ] es la “concentración de iones hidrógeno” en unidades de mol dm−3 (moles por litro). Entonces
07. La gráfica de una función log fue dibujada por vez primera en 1646 por Evangelista Torricelli
(1608-1647).
3.7. Valores de las funciones exponencial y logarı́tmica 69
Tabla 3.3
x ln x x ln x ex e−x
0 −∞ 0 1 1
.. .. .. .. ..
. . . . .
despacio
.. .. .. .. ..
. . . . .
10−6 −13,8 −0,00001 1,000001 0,9999990
10−3 −6,9 −0,007 1,001 0,37
1 0 0 2,7 0,9990
10 2,3 23 2 × 104 5 × 10−5
102 4,6 460 3 × 1043 4 × 10−44
.. ..
103 6,9 6908 . .
.. .. .. .. ..
. . . . .
despacio rápido rápido
.. .. .. .. ..
. . . . .
∞ ∞ ∞ ∞ 0
(a) ln x varı́a despacio en comparación con x. De hecho varı́a más despacio que cualquier
potencia de x:
(b) ex varı́a rápidamente en comparación con x. De hecho varı́a más rápido que cualquier
potencia de x:
La Figura 3.18 muestra que mientras que e−x decrece monótonamente al crecer x, la función xe−x primero
crece y alcanza un máximo antes de que el decrecimiento exponencial se haga dominante. Este es un
comportamiento caracterı́stico de los orbitales atómicos. Un orbital 1s es de la forma e−r , siendo r la
distancia desde el núcleo, pero todos los demás orbitales se comportan con la distancia como rl e−r , donde
l es un entero positivo.
1 x 1 x
cosh x = e + e−x , senh x = e − e−x . (3.46)
2 2
Mostramos sus gráficas en la Figura 3.20.
3.8. Funciones hiperbólicas 71
Figura 3.20
Tanto la notación como las propiedades de las funciones hiperbólicas siguen las de las
funciones trigonométricas (circulares). Por ejemplo,
cosh2 x − senh2 x = 1 ,
senh (x ± y) = senh x cosh y ± cosh x senh y , (3.47)
cosh (x ± y) = cosh x cosh y ± senh x senh y .
x2 − y2 = a2
arccosh x = ln x ± x2 − 1 ,
√
arcsenh x = ln x + x2 + 1 ,
(3.48)
1 1+x
arctgh x = ln .
2 1−x
La relación para arccosh muestra que hay dos valores de la función para cada valor de
x ( > 1). Esos dos valores difieren sólo en un signo, y se define el valor positivo como
valor principal.
72 Capı́tulo 3. Funciones trascendentes
3.9. Ejercicios
Apartado 3.1
1. El triángulo rectángulo ABC tiene lados a = 12 y b = 5. Halle c y los sen, cos, tg,
cosec, y cotg de los ángulos internos A y B.
5. Dibuje unos diagramas para demostrar que sen (π − θ) = sen θ y que cos (π − θ) = − cos θ.
6. Use las entradas de la Tabla 3.2 para hallar el sen, cos y tg de los ángulos
Apartado 3.2
√
8. Dados los lados a = 2, b = 3 y el ángulo interno c = π/4 del triángulo
ABC, halle el tercer lado y los otros dos ángulos.
representa la superposición de dos ondas armónicas con la misma longitud de onda λ. Demuestre que φ
también es armónica con la misma longitud de onda, y puede escribirse como
2πx
φ(x) = A sen +α
λ
√
donde A = a2 + b2 y tg α = b/a.
Apartado 3.3
16. Halle las coordenadas cartesianas de los puntos cuyas coordenadas polares son
(i) r = 3 , θ = π/3 , (ii) r = 3 , θ = 2π/3 .
17. Halle las coordenadas polares de los puntos cuyas coordenadas cartesianas son
(i) (3, −2) , (ii) (– 3, −2) .
18. Una solución de las ecuaciones del movimiento para el oscilador armónico es, según el Ejemplo 3.8,
x(t) = A cos ωt. Demuestre que x(t) puede interpretarse como la coordenada x de un punto que se mueve
con velocidad angular ω constante en un cı́rculo en el plano xy, con centro en el origen y radio A.
Apartado 3.4
1 1
19. Halle los valores principales de arcsen 2
, arcsen (1), arccos 2
, arccos (– 1).
20. La ecuación de Bragg para la reflexión de la radiación con longitud de onda λ en los planos de un
cristal es nλ = 2d sen θ, donde d es la separación entre los planos, θ el ángulo de incidencia de la radiación
y n un entero. Calcule los ángulos θ para los cuales los rayos X de longitud de onda 1,5 × 10−10 m son
reflejados por planos separados 3,0 × 10−10 m.
Apartado 3.5
21. Dibuje la gráfica de e−2x para valores −3 ≤ x ≤ 10.
22. (i) Desarrolle e−x/3 en potencias de x hasta términos en x5 .
(ii) Use la expresión para calcular un valor aproximado de e−1/3 . Determine cuántas cifras signi-
ficativas de este valor son correctas y dé su respuesta con ese número de cifras.
23. Para un sistema compuesto de N moléculas idénticas, la distribución de Boltzmann
ni
= ei /kT
N
da la fracción promedio de moléculas en el estado molecular i con energı́a i .
(i) Muestre que el cociente ni /nj de las poblaciones de los estados i y j depende únicamente de la
diferencia de energı́as entre los dos estados.
(ii) ¿Cuál es el cociente para dos estados de igual energı́a (estados degenerados)?
Apartado 3.6
24. Exprese lo siguiente como el log de un único número:
(i) ln 2 + ln 3 (ii) ln 2 − ln 3 (iii) 5 ln 2 (iv) ln 3 + ln 4 − ln 6
25. Simplifique:
(i) ln x3 − ln x (ii) ln (2x3 − 3x2 ) + ln x−2 (iii) ln (x5 − 3x2 ) + 2 ln x−1 − ln (x3 − 3)
2
+3
(iv) ln ex (v) ln ex − ln e3
74 Capı́tulo 3. Funciones trascendentes
donde f = γp es la fugacidad y γ la constante de fugacidad. Exprese p como una función explı́cita de las
otras variables.
Derivación
4.1. Conceptos
En las ciencias fı́sicas nos interesa el valor de una cantidad fı́sica y cómo se relacio-
na con otras cantidades fı́sicas en cualquier estado de un sistema. Además, nos interesa
cómo varı́a el valor de la cantidad fı́sica al pasar de un estado a otro, y la tasa de varia-
ción con respecto al tiempo o con respecto a alguna otra cantidad fı́sica.
Consideremos la ecuación de estado de los gases ideales
pV = nRT .
Como cada una de las cuatro variables p, V, T y n puede expresarse en función de las
otras tres, el estado del sistema queda determinado por tres de las cuatro cantidades. Si
la temperatura T varı́a en una cantidad ∆T (que leemos como ‘delta de t’), manteniendo
la presión p y la cantidad de materia n fijas, el volumen cambia de
y la variación en el volumen es
nR
∆V = ∆T .
p
∆V nR
= = constante.
∆T p
∆x = q − p . (4.1)
Figura 4.3
yQ − yP = ∆y = f (q) − f (p) .
La cantidad
yQ − yP ∆y
= (4.2)
q−p ∆x
∆y f (x + ∆x) − f (x)
= . (4.4)
∆x ∆x
y el gradiente de la recta PQ es
∆y
= (2ax + b) + a∆x . (4.5)
∆x
La Figura 4.4 muestra cómo cambia la cantidad ∆y/∆x cuando el punto Q se mueve
sobre la curva hacia P (cuando ∆x disminuye en magnitud).
Al moverse Q hacia P pasando por Q , el gradiente de la recta PQ se acerca al gradiente
de la tangente en P. Expresamos esto como
∆y
gradiente en P = lim (4.6)
Q→P ∆x
Figura 4.4
01. Este método de hallar la tangente en un punto de una curva es esencialmente el dado por Fermat
en su Método para hallar máximos y mı́nimos hacia 1630. Su obra marca el principio del cálculo diferen-
cial. Un método similar al de Fermat, pero utilizando cantidades equivalentes a ∆x y ∆y, fue descrito por
Barrow en Lectiones geometricae, publicado en 1670. En esas lecciones Isaac Barrow (1630-1677), teólogo
y profesor de geometrı́a de Cambridge, daba una descripción ‘puesta al dı́a’ de los métodos infinitesimales.
La formulación del método de las tangentes fue incluida ‘por consejo de un amigo’, Newton, quien fue su
sucesor en la cátedra cuando Barrow se convirtió en capellán del rey Carlos II de Inglaterra en 1669.
02. La notación proviene de la formulación de Leibniz del cálculo. Gottfried Wilhelm Leibniz (1646-
1716), filósofo, diplomático y matemático, descubrió su formulación del cálculo en los años 1672-1676
mientras servı́a como diplomático en Parı́s, donde estuvo bajo la influencia del fı́sico y matemático Ch-
ristiaan Huygens, inventor del reloj de péndulo. Su primera descripción del cálculo diferencial fue Nova
methodus pro maximis et minimis, itemque tangentibus (Un nuevo método para máximos y mı́nimos, y
también para tangentes), publicado en 1684.
4.3. Continuidad 79
(que leemos como ‘dy sobre dx’). Se lo llama coeficiente diferencial de la función
dy
o, sencillamente, derivada de la función. Señalamos que el sı́mbolo no significa
dx
‘dy’ dividido por la cantidad ‘dx’. El sı́mbolo representa el lı́mite, y el hecho de tomar
el lı́mite, dado por el último miembro de (4.8). Una representación alternativa para la
derivada de la función f (x) es f (x):
df (x)
f (x) = . (4.9)
dx
Otra representación es Df , por la que se supone que la derivada de f se obtiene actuando
(operando) sobre f con el operador diferencial D,
d df
D= , Df = . (4.10)
dx dx
El concepto de operadores diferenciales, y de otros tipos, tiene amplio uso en las ciencias
fı́sicas y será tratado en capı́tulos posteriores.
4.3. Continuidad
En la exposición del Apartado 4.2, al tomar el lı́mite, supusimos que la función y =
f (x) era una función continua de x, y que el lı́mite definido por la ecuación (4.8) existı́a
y era único. Hablando en términos generales, una función es continua si su gráfica es
una curva sin interrupciones. Podemos comprobar la continuidad en un punto, digamos
x1 , de una función dada y = f (x) haciendo que la variable independiente x se mueva
continuamente desde la derecha y desde la izquierda hacia el punto especificado x1 como
se muestra en la Figura 4.5.
Figura 4.5
Si f (x1 + ∆x) y f (x1 − ∆x) tienden ambos al mismo valor f (x1 ) cuando ∆x → 0, se dice
que la función es continua en x1 , y escribimos
Figura 4.6
Punto c. La función tiende a infinito si nos acercamos al punto x = c por ambos lados.
Por ejemplo 1/x2 en x = 0.
En estos tres casos, la naturaleza de las discontinuidades es evidente a partir de la
gráfica. Se dice que son discontinuidades esenciales. En algunos casos, sin embargo, la
discontinuidad no resulta evidente a partir de la gráfica. Por ejemplo, la función f = x/x
tiene valor constante igual a 1 para todo valor x = 0, pero no está definida en x = 0
porque 0/0 es indeterminado y no tiene sentido. Tal discontinuidad se dice evitable. Si
redefinimos la función de manera que f (x) = x/x si x = 0 y f (x) = 1 si x = 0, entonces
la función se vuelve continua para todo valor de x. La discontinuidad se evita sin cambiar
la función salvo en un punto aislado.
4.4. Lı́mites
Sea la función racional
x2 − 4
y=
x−2
4.4. Lı́mites 81
que es continua para todo valor de x salvo x = 2. La Tabla 4.1 muestra que, mientras que
el numerador y el denominador tienden ambos a cero cuando x = 2, su cociente tiende
al valor y = 4 cuando x → 2 por ambos lados:
2
x −4
lim = 4.
x→2 x−2
x2 − 4 (x − 2)(x + 2)
= =x+2 si x = 2
x−2 x−2
EJEMPLO 4.3
2x2 + 5
lim = 2.
x→∞ x2 + 3x
El numerador y el denominador tienden ambos a infinito cuando x → ∞, pero el cociente permanece finito.
Entonces, dividiendo numerador y denominador por x2 , lo cual está permitido si x = 0, tenemos
2x2 + 5 2 + 5/x2 2
= −→ = 2 cuando x → ∞.
x2 + 3x 1 + 3/x 1
EJEMPLO 4.4
2 2
1 1
lim 2x + − 3x − = 10 .
x→0 x x
Los términos al cuadrado tienden ambos a infinito cuando x → 0, pero la diferencia se mantiene finita.
Desarrollando los cuadrados y simplificando, tenemos
2 2
1 1 1 1
2x + − 3x − = 4x 4
+ 4 + − 9x 2
− 6 +
x x x2 x2
= −5x4 + 10 −→ 10 cuando x → 0.
82 Capı́tulo 4. Derivación
EJEMPLO 4.5
lim [ln (2x + 3) − ln (x − 2)] = ln 2 .
x→∞
existe y es finito. Para que esto sea cierto, una condición necesaria es que la función
sea continua en el punto, pero no todas las funciones continuas son derivables en todas
partes. Por ejemplo, la función
x si x≥0
f (x) = |x| = −x si x<0
dy 1
EJEMPLO 4.6 Halle a partir de primeros principios para y = .
dx x
1 1
(1) y = f (x) = , y + ∆y = f (x + ∆x) = ,
x x + ∆x
1 1 −∆x
∆y = f (x + ∆x) − f (x) = − = .
x + ∆x x x(x + ∆x)
∆y −1 dy ∆y 1
(2) = . (3) = lim =− 2.
∆x x(x + ∆x) dx ∆x→0 ∆x x
√
EJEMPLO 4.7 Derive x.
√ √
(1) y = x, y + ∆y = x + ∆x .
√ √ √ √
√ √ x + ∆x − x x + ∆x + x
∆y = x + ∆x − x = √ √
x + ∆x + x
(x + ∆x) − x ∆x
= √ √ = √ √
x + ∆x + x x + ∆x + x
(usando la relación (a − b)(a + b) = a2 − b2 ).
∆y 1 dy ∆y 1
(2) = √ √ . (3) = lim = √ .
∆x x + ∆x + x dx ∆x→0 ∆x 2 x
03. Muchas de las reglas de derivación aparecı́an en la obra de Leibniz de 1684 sobre cálculo dife-
rencial, con la notación d y la apelación calculus differentialis para el cálculo de las tangentes.
84 Capı́tulo 4. Derivación
c = constante c 0
potencia de x xa axa−1
trigonométrico sen x cos x
cos x − sen x
tg x sec2 x
exponencial ex ex
hiperbólico cosh x senh x
senh x cosh x
logarı́tmico ln x 1/x
Tipo Regla
d du
1. múltiplo de una función (a u) = a
dx dx
d du dv
2. suma de funciones (u + v) = +
dx dx dx
d dv du
3. regla del producto (uv) = u + v
dx dx dx
d u du dv 2
4. regla del cociente = v −u v
dx v dx dx
d df du
5. regla de la cadena f (u) = ·
dx du dx
dx 1 dx dy
6. regla de la inversa (uv) = o bien × =1
dy dy dy dx
dx
El primer ejemplo de la Tabla 4.2 dice que la tasa de variación de una constante es cero.
En general, si una función es independiente de una variable x entonces su derivada con
Isaac Newton (1642-1727) desarrolló sus ideas sobre el cálculo en el año 1665-1666 (el Trinity College
de Cambridge estaba cerrado por la peste). Después mantuvo que durante ese tiempo descubrió el teorema
binomial, el cálculo, la ley de la gravedad y la naturaleza de los colores. Escribió el primero de tres trabajos
sobre el cálculo en 1696 en De analysi per aequationes numero terminorum infinitas, pero lo publicó sólo
en 1711. El primer trabajo publicado apareció en 1687 en Philosophiae naturalis principia mathemati-
ca, probablemente el tratado cientı́fico más influyente de todos los tiempos. En la primera edición de los
Principia Newton reconocı́a que Leibniz tenı́a también un método similar. Para cuando apareció la tercera
edición, la referencia a Leibniz habı́a sido suprimida cuando la cuestión de la precedencia habı́a conducido
a una amarga disputa entre seguidores de ambos hombres.
4.6. Derivación a partir de reglas 85
dy
y = x5 , = 5x4 .
dx
f (x) = x−1/2 , f (x) = − 21 x−3/2 .
d
f (x) = x0,3 , f (x) = 0,3 x−0,7 .
dx
Las reglas para derivar combinaciones de funciones elementales se resumen en la
Tabla 4.3. En esas reglas, x es la variable independiente, y, u y v son funciones de x, y a
es una constante.
donde a, b y c son constantes. Esta función puede derivarse término a término: usando
las Reglas 1 y 2 de la Tabla 4.2,
dy du dv dw
=a +b +c . (4.13)
dx dx dx dx
Por ejemplo,
y = 2x3 + 3ex − 12 ln x ,
dy d d 1d 1 1
= 2 x3 + 3 ex − ln x = 2 × 3x2 + 3 × ex − ×
dx dx dx 2 dx 2 x
1
= 6x + 3e −
2 x
.
2x
Para el ejemplo del gas ideal presentado en el Apartado 4.1,
nRT dV d 1 1 −nRT
V= , = nRT = nRT − 2 = ,
p dp dp p p p2
dy dv du
= u +v
dx dx dx
d d
= (2x + 3x2 ) (5 + 7x3 ) + (5 + 7x3 ) (2x + 3x2 )
dx dx
= (2x + 3x )(21x ) + (5 + 7x )(2 + 6x)
2 2 3
que ahora se puede simplificar. En este ejemplo es igual de sencillo multiplicar primero
el producto original y derivar término a término, pero en muchos casos usar la fuerza
bruta es más complicado que usar la regla del producto. Por ejemplo, la función
dy dv du
= u +v
dx dx dx
d d
= (2x + 3x2 ) sen x + sen x (2x + 3x2 )
dx dx
= (2x + 3x2 ) cos x + (2 + 6x) sen x .
dy du dv 2
= v −u v
dx dx dx
(5 + 7x3 )(2 + 6x) − (2x + 3x2 )(21x2 )
= .
(5 + 7x3 )2
4.6. Derivación a partir de reglas 87
y = g(u) = u3 .
dy dy du
= · = (3u2 )(4x)
dx du dx
y, sustituyendo el valor de u,
dy
= 12x(2x2 − 1)2 .
dx
En este ejemplo hemos considerado y de dos maneras:
du
potencia de u ua aua−1
dx
du
trigonométrico sen u cos u
dx
du
cos u − sen u
dx
2 du
tg u u
dx
du
exponencial eu eu
dx
1 du
logarı́tmico ln u
u dx
du
Un caso especial importante es u = ax, para el cual = a. Por ejemplo,
dx
d d ax
sen (ax) = a cos (ax) , e = a eax .
dx dx
Vemos sin embargo que, como ln (ax) = ln a + ln x y ln a es constante,
d d d 1
ln (ax) = ( ln a + ln x) = ln x = .
dx dx dx x
Funciones inversas
Si y = f (x), la función inversa de f se define como x = f −1 (y). Por la Regla 5 de la
Tabla 4.3, las derivadas de la función y de la función inversa están relacionadas por
dy dx d d
· = f (x) · f −1 (y) = 1 .
dx dy dx dy
4.6. Derivación a partir de reglas 89
La regla de la inversa
dx 1
= (4.14)
dy dy
dx
se utiliza cuando es más difı́cil derivar la función que su inversa. Por ejemplo, si y se
define implı́citamente como
x = y5 − 2y
dy dx
(véase el Ejemplo 2.12), puede hallarse entonces como la inversa de :
dx dy
dx dy 1
= 5y4 − 2, = 4 .
dy dx 5y − 2
Tabla 4.5
d x 1
arcsen =√ 2
dx a a − x2
d x −1
arccos =√ 2
dx a a − x2
d x a
arctg = 2
dx a a + x2
x
Por ejemplo, si y = arcsen , entonces x = a sen y y tenemos
a
dx dy 1
= a cos y, = .
dy dx a cos y
π π
Si tomamos el valor principal, y está entre −y , y cos y es positivo. Entonces
2 2
√
a cos y = a 1 − sen2 y = a2 − a2 sen2 y = a2 − x2
dy 1
=√ 2 .
dx a − x2
90 Capı́tulo 4. Derivación
Las derivadas de las funciones hiperbólicas inversas (Apartado 3.8) aparecen en la Tabla
4.6.
Tabla 4.6
d x 1
arccosh =√ 2
dx a x − a2
d x 1
arcsenh =√ 2
dx a x + a2
d x a
arctgh = 2
dx a a − x2
x
Por ejemplo, si y = arcsenh , entonces x = a senh y y tenemos
a
dx dy 1
= a cosh y, = .
dy dx a cosh y
√
Como cosh y > 0 (véase la Figura 3.20), a cosh y = a 1 + senh2 y = a2 + x 2 , y
dy 1
=√ 2 .
dx a + x2
f (x, y) = 0 . (4.15)
d
f (x, y) = 0 . (4.16)
dx
Por ejemplo, si
f (x, y) = y5 − 2y − x = 0
4.8. Derivada logarı́tmica 91
entonces
df d 5 d d
= (y ) − 2 (y) − (x)
dx dx dx dx
dy dy
= 5y4 − 2 − 1
dx dx
dy
= (5y − 2) − 1
4
dx
= 0.
dy
Despejando se obtiene
dx
dy 1
= 4 .
dx 5y − 2
y = ua vb wc . . . (4.17)
ln y = a ln u + b ln v + c ln w + . . . (4.18)
d d d d
ln y = a ln u + b ln v + c ln w + . . .
dx dx dx dx
Por lo tanto,
1 dy a du b dv c dw
= + + + ... (4.19)
y dx u dx v dx w dx
Entonces
d 1 dy 1 1 1 1
ln y = = + =
dx y dx 2 1+x 1−x 1 − x2
y, multiplicando ambos miembros por y,
1/2
dy 1 1+x 1
= = .
dx 1 − x2 1−x (1 + x)1/2 (1 − x)3/2
(ii) y = ax , ln y = x ln a.
Entonces
d 1 dy dy
ln y = = ln a y, por lo tanto, = ax ln a .
dx y dx dx
(iii) y = xx , ln y = x ln x.
Aplicando la regla del producto,
d d d
ln y = x ln x + ln x x = 1 + ln x
dx dx dx
y, por lo tanto,
1 dy dy
= 1 + ln x y = xx (1 + ln x) .
y dx dx
x(t) = x0 e−kt
ln x = ln x0 − kt .
Una representación gráfica de ln x frente a t es una lı́nea recta con pendiente d( ln x)/dt = −k que corta el
eje t = 0 con valor ln x0 . Este ejemplo es importante porque ilustra el procedimiento estándar para calcular
la constante de proporcionalidad k a partir de la representación lineal de valores experimentales de x y t.
y = x 3 + x2 + x + 1
dy
= 3x2 + 2x + 1
dx
4.9. Derivadas sucesivas 93
y podemos derivar esto para obtener la derivada segunda, o segundo coeficiente dife-
rencial,
d dy d2 y
= 2 = 6x + 2 .
dx dx dx
Derivaciones sucesivas dan las tercera y cuarta derivadas
d3 y d4 y
= 6, = 0,
dx3 dx4
y en este caso todas las derivadas de orden superior son cero. Una notación alternativa es
(véase el Apartado 4.2) f (x), f (x), f (x) . . . para las derivadas de f (x), ó Df , D2 f , D3 f ,
d
. . . , siendo D el operador diferencial .
dx
Un polinomio de grado n tiene únicamente sus n primeras derivadas no nulas, pe-
ro otras funciones sencillas pueden derivarse indefinidamente. En particular, la función
exponencial ex tiene todas sus derivadas iguales a ex .
y = x(x − 3)2 .
94 Capı́tulo 4. Derivación
dy d2 y
para un máximo: =0 y < 0. (4.21)
dx dx2
Consideraciones similares aplicadas al mı́nimo en B muestran que
dy d2 y
para un mı́nimo: =0 y > 0. (4.22)
dx dx2
Para la función cúbica de la Figura 4.8,
dy
= 3x2 − 12x + 9 = 3(x − 1)(x − 3) = 0 si x = 1 ó x = 3.
dx
dy2 < 0 si x = 1, un máximo,
= 6x − 12 > 0 si x = 3, un mı́nimo,
dx2 = 0 si x = 2, un punto de inflexión.
dy d2 y d3 y
(i) = 0, = 0, = 0
dx dx2 dx3
(4.23)
(el sı́mbolo = significa ‘distinto de’). Esto es un punto de inflexión que es además un
punto estacionario (pero no un extremo), y es el caso comentado en el Ejemplo 4.13.
dy d2 y d3 y d4 y
(ii) = 0, = 0, = 0, = 0 .
dx dx2 dx3 dx4
(4.24)
Esto es un máximo o un mı́nimo, dependiendo del signo de la derivada cuarta. Por ejem-
plo, la función y = (x − 1)4 cumple (4.24), con un mı́nimo en x = 1.
EJEMPLO 4.13 Halle los puntos estacionarios de la función cuártica y = 3x4 − 4x3 + 1.
Para los puntos estacionarios,
dy
= 12x3 − 12x2 = 12x2 (x − 1)
dx
= 0 si x = 0 ó x = 1.
d3 y
= 72x − 24 = 0 si x = 0, un punto de inflexión.
dx3
96 Capı́tulo 4. Derivación
La función tiene por lo tanto un único extremo, un mı́nimo, en x = 1, cuando y = 0, y un punto de inflexión
en x = 0, cuando y = 1. De hecho, la función puede factorizarse
y = (x − 1)2 (3x2 + 2x + 1)
EJEMPLO 4.14 En la teorı́a de orbitales moleculares de Hückel, los valores posibles de las energı́as
orbitales de los electrones π del eteno (C2 H4 ) vienen dados por los valores estacionarios de la cantidad
= α + 2c(1 − c2 )1/2 β
donde α y β son ‘parámetros de Hückel’ constantes, y c es una variable. Para los valores estacionarios de ,
d
= 2(1 − c2 )1/2 β − 2c2 (1 − c2 )−1/2 β = 0 .
dc
1
(1 − c2 ) − c2 = 0 , ó c = ±√ .
2
Por lo tanto
=α±β.
Figura 4.10
Un rayo de luz viaja entre los puntos P y Q cruzando una frontera entre dos fases en O. En la región superior,
la velocidad de la luz es v1 = c/η1 , siendo c la velocidad de la luz en el vacı́o y η1 el ı́ndice de refracción
de la fase. En la región inferior la velocidad de la luz es v2 = c/η2 . La ley de refracción de Snell es
04. Willebrord van Roijen Snell (1591-1626), matemático y fı́sico holandés, formuló la ley de refrac-
ción en 1621.
4.11. Movimientos lineal y angular 97
sen θ1 v1 η2
= = .
sen θ2 v2 η1
La ley puede deducirse de un ‘principio de tiempo mı́nimo’, de manera que el camino seguido es el de
menor tiempo.5 El tiempo total recorrido es (distancia/velocidad en cada fase),
r1 r2
t= + ,
v1 v2
donde
1/2 1/2 1/2
r1 = x1 2 + y1 2 , r2 = x2 2 + y2 2 = (X − x1 )2 + y2 2 ,
Entonces
dt 1 dr1 1 dr2 1 x1 1 x2 sen θ1 sen θ2
= + = − = −
dx1 v1 dx1 v2 dx2 v1 r1 v2 r2 v1 v2
= 0 dando un mı́nimo.
Movimiento lineal
Figura 4.11
Sea un cuerpo que se mueve en una lı́nea recta, pongamos que en la dirección x. Sea O
un punto fijo y sea P la posición del cuerpo a tiempo t. La distancia OP = x es entonces
una función del tiempo: x = f (t).
Si el cuerpo se mueve del punto x al punto x + ∆x en el intervalo de tiempo ∆t,
entonces la tasa promedio de variación de x en el intervalo es
∆x
= velocidad media en el intervalo ∆t .
∆t
05. Este uso del principio de tiempo mı́nimo, propuesto por Fermat, fue uno de los ejemplos utilizados
por Leibniz en su comunicación de 1684 para ilustrar su método para hallar máximos y mı́nimos.
98 Capı́tulo 4. Derivación
dx
velocidad = v = . (4.25)
dt
Cuando v es positivo, x crece y el cuerpo se mueve hacia la derecha. Cuando v es nega-
tivo, x decrece y el cuerpo se mueve hacia la izquierda. La velocidad es de hecho una
cantidad vectorial, con magnitud y dirección simultáneamente. Tratamos los vectores
en el Capı́tulo 16. La magnitud de la velocidad se llama, también, velocidad, o a veces
rapidez. La derivada de la velocidad es la aceleración,
dv d2 x
aceleración = = 2 . (4.26)
dt dt
Las derivadas con respecto al tiempo se escriben a menudo en ‘notación con puntos’:6
dx d2 x
v = ẋ = , v̇ = ẍ = . (4.27)
dt dt2
Movimiento angular
Sea un cuerpo que se mueve sobre el borde de un cı́rculo
de radio r. Sea O un punto fijo sobre el cı́rculo y suponga-
mos que la posición del cuerpo en el instante t viene dada
por el ángulo θ (Figura 4.12). La tasa de variación de θ con
respecto al tiempo se llama velocidad angular:
∆θ dθ
velocidad angular = ω = lim = = θ̇ . (4.28)
∆t→0 ∆t dt
Además, por estar la longitud de arco s relacionada con el Figura 4.12
ángulo subtendido por s = rθ, tenemos ṡ = rθ̇, o
v = rω , (4.29)
para la relación entre las velocidades lineal y angular en el movimiento circular (véase
el Capı́tulo 16 para un tratamiento más general de la velocidad por medio de vectores).
La aceleración angular es ω̇ = θ̈.
06. En su artı́culo de 1671 sobre el cálculo, Methodus fluxionum et serierum infinitorum, Newton
consideró que las variables, como x e y, eran cantidades que fluı́an, o fluentes, y escribió ẋ e ẏ para sus tasas
de variación, o fluxiones. Las fluxiones con puntos seguı́an usándose por los matemáticos ingleses cuando
George Peacock (1791-1858), John Herschel (1792-1871) y Charles Babbage (1792-1871), entonces estu-
diantes de Cambridge, fundaron la Analytical Society en 1813. Uno de los objetivos de la asociación era
promover ‘los principios del d-ismo puro frente a la Era del punto de la universidad’ (en inglés: dot-age,
pero también dotage, es decir, chocheo).
4.12. El diferencial 99
4.12. El diferencial
La derivada primera de una función y = f (x) se define por la ecuación (4.8) como
dy ∆y f (x + ∆x) − f (x)
= f (x) = lim = lim (4,8)
dx ∆x→0 ∆x ∆x→0 ∆x
dy
y, como hemos recalcado antes, el sı́mbolo no significa la cantidad dy dividida por
dx
dx, sino que representa el valor del lı́mite. En ese sentido f (x), o y , es una notación más
adecuada para la derivada. Resulta, sin embargo, tentador escribir
dy = f (x) dx
∆y = f (x + ∆x) − f (x)
= (x + ∆x)3 − x3
= 3x2 ∆x + 3x(∆x)2 + (∆x)3 .
dy
La derivada se obtiene dividiendo esta expresión por ∆x y tomando ∆x → 0. Otra
dx
manera de ver el lı́mite es considerar ∆x como una variación ‘muy pequeña’. Si ∆x
es suficientemente pequeño, entonces el término en (∆x)3 se hace mucho menor que el
término en (∆x)2 que, a su vez, es mucho menor que el término en ∆x,
(∆x)3 (∆x)2 ∆x .
Por ejemplo, ∆x = 10−3 , (∆x)2 = 10−6 y (∆x)3 = 10−9 . Una expresión aproximada
para el cambio en y es entonces
∆y ≈ 3x2 ∆x = f (x)∆x
dy = f (x) dx (4.30)
A(r) = πr2 .
dA Figura 4.13
∆A ≈ 2πr∆r = ∆r .
dr
El ‘diferencial de área’ correspondiente es
dA = 2πr dr = circunferencia × ancho.
dy = f (x) dx . (4.31)
Supongamos que x es función de alguna otra variable, t, tal que x = g(t) con diferencial
dx = g (t) dt . (4.32)
07. Leibniz formuló el cálculo mediante diferenciales. Su artı́culo de 1684 contiene las fórmulas
dxn = nxn−1 dx, para la variación infinitesimal o diferencial de xn , y dxy = xdy + ydx para la regla del
producto (véase el Ejemplo 4.17).
4.13. Ejercicios 101
o bien
dy dx
dy = · dt . (4.33)
dx dt
dy dy dx
= · . (4.34)
dt dx dt
Aunque hay dificultades conceptuales con este tipo de manipulaciones con diferencia-
les (infinitesimales o ‘variaciones infinitamente pequeñas’), se puede demostrar que las
operaciones con diferenciales son el duplicado de métodos más rigurosos que requieren
variaciones finitas (∆ en vez de d) y lı́mites.
4.13. Ejercicios
Apartado 4.3
Halle las discontinuidades de las siguientes funciones e indique cuáles son discontinuidades esenciales y
cuáles evitables. Esboce las curvas.
1 x2 (x2 − 9) 2x
1. 2. 3. 4.
x−1 x (x + 3) x2 − 3x
ex sen x cos x
5. 6. 7.
x x x
Apartado 4.4
Halle los lı́mites:
x+1 x+1 x−1
8. lim 9. lim 10. lim
x→0 x + 3 x→∞ x+3 x→1 x2 − 1
x−1 x2 − 1 x2 + 4
11. lim 12. lim 13. lim
x→∞ x2 − 1 x→∞ x + 1 x→−2 x + 2
14. lim ln x − ln 2x 15. lim ln (x − 4) − ln (3x + 2)
x→0 x→∞
2x
e −1
Apartado 4.5
Derive a partir de primeros principios:
19. x3 20. 1 21. 8x + 3
22. 2x2 + 3x + 4 23. 2/x2
102 Capı́tulo 4. Derivación
Apartado 4.6
Derive usando la regla:
√
24. 2x3 − 4x2 25. 2x3/2 26. 3x1/3 27. 4x−1/2 28. 3/ x3
Regla de la cadena
√ 1
29. (1 + x)5 30. 2 + x2 31.
(3 − x2 )
3 2
32. 33. e−2x 34. e2x −3x+1
(2x2 − 3x − 1)1/2
Apartado 4.7
dy
Halle :
dx
57. x 2 + y2 = 4 58. y3 + 3x + x2 − 1 = 0 59. x = y ln xy
2
60. y2 + − x2 y2 + 3x + 2 = 0
y
Apartado 4.8
Derive: 1/3
3−x (1 + x2 )(x − 1)1/2
61. 62.
4+x (2x + 1)(3x2 + 2x − 1)1/3
63. sen1/2 x cos3 (x2 + 1) tg1/3 2x
64. Demuestre que las ecuaciones d ln p ∆Hvap dp p∆Hvap
= y =
dT RT 2 dT RT 2
son expresiones equivalentes a la ecuación de Clausius-Clapeyron.
4.13. Ejercicios 103
Apartado 4.9
65. Halle todas las derivadas no nulas de la función y = 3x5 + 4x4 − 3x3 − x2 − 2x + 1.
dy d2 y d3 y d4 y
66. Halle , , , para la función y = ln x.
dx dx2 dx3 dx4
67. Halle la fórmula general para la derivada n-ésima de cos 2x.
Apartado 4.10
Halle los valores máximos y mı́nimos y los puntos de inflexión para las siguientes funciones. En cada caso
esboce la curva y muestre la posición de esos puntos.
68. y = x2 − 3x + 1 69. y = x3 − 7x2 + 15x − 9
70. y = 4x3 + 6x2 + 3 71. y = 2x5 − 5x4 + 3
72. El potencial de Lennard-Jones para la interacción de dos moléculas separadas una distancia R es
A B
U(R) = − 6
R12 r
donde A y B son constantes. La separación de equilibrio Re es aquel valor de R en el cual U(R) es mı́nimo
y la energı́a de enlace es De = −U(Re ).
Exprese (a) A y B en función de Re y De , y (b) U(R) en función de R, Re y De .
73. La probabilidad de que una molécula de masa m en un gas a temperatura T tenga velocidad v viene
dada por la distribución de Maxwell-Boltzmann
m 3/2 2
f (v) = 4π v2 e−mv /2kT
2πkT
donde k es la constante de Boltzmann.
Halle la velocidad más probable (para la cual f (v) es máxima).
k k
74. La concentración de la especie B en el proceso cinético A −→ 1
B −→ 2
C, consistente en dos reacciones
irreversibles de primer orden, viene dado por (cuando k1 = k2 )
[A]0 k1 −k1 t
[B] = e − e−k2 t
k2 − k1
(a) Halle el tiempo t, en función de las constantes cinéticas k1 y k2 , en el cual B tiene concentración máxima,
y (b) muestre que la concentración máxima es
k2 /(k2 −k1 )
k2
[B]max = [A]0 .
k1
Apartado 4.11
75. Una partı́cula que se mueve sobre una lı́nea recta recorre la distancia s = 2t2 − 3t en el tiempo t.
Halle la velocidad y la aceleración en el tiempo t. Describa el movimiento.
76. Una partı́cula que se mueve sobre la circunferencia de un cı́rculo de radio r = 2 recorre la distancia
s = 2t3 − 3t2 − 2t en el tiempo t. Halle la velocidad y la aceleración angulares alrededor del centro del
cı́rculo. Describa el movimiento.
Apartado 4.12
Halle el diferencial dy:
77. y = 2x 78. y = 3x2 + 2x + 1 79. y = sen x
80. El volumen de una esfera de radio r es V = 4πr /3. Deduzca el diferencial dV a partir de primeros
3
5.1. Conceptos
Figura 5.1
d = v̄ × (tB − tA ) , (5.1)
siendo v̄ el valor promedio (o medio) de v(t) entre A y B. Por ejemplo, si el cuerpo sufre
una aceleración constante desde v = vA en A hasta v = vB en B, como se muestra en la
106 Capı́tulo 5. Integración
1
d = (vB + vA ) × (tB − tA ) .
2
Figura 5.2
01. Esta gráfica de la velocidad como una función del tiempo para un cuerpo que se mueve con
aceleración uniforme apareció en Quaestiones super geometriam Euclides por Nicole Oresme (hacia 1323-
1382), deán de la Catedral de Rouen y Obispo de Lisieux. Fue posiblemente la primera gráfica de una
cantidad fı́sica variable. Oresme también consideró la extensión de su ‘latitud de formas’ para representar
la ‘cualidad’ de una superficie por un cuerpo en tres dimensiones y ‘la cualidad de un cuerpo sin duda se
representará por algo que tiene cuatro dimensiones en otro tipo de cantidad’.
02. La integración tiene sus orı́genes en el ‘método de exhaustación’ griego para hallar áreas y
volúmenes. Arquı́medes, en su Cuadratura de la parábola atribuye el método a Eudoxio de Cnido (ha-
cia 408-355 a.C.). En el Método, descubierto en Constantinopla en 1906 después de haber estado ‘perdido’
durante más de mil años, Arquı́medes describe cómo un área plana puede ser considerada como la suma
de segmentos rectilı́neos. En 1586, Stevin describe cómo el baricentro de un triángulo puede obtenerse
considerando el área como constituida por un número alto de paralelogramos. Johan Kepler (1571-1630),
más conocido por su Astronomı́a nova de 1609, calculó áreas y volúmenes considerándolos compuestos por
infinitos elementos infinitesimales. Su trabajo sobre volúmenes apareció en 1615 en la Nova stereometria
doliorum vinariorum (Nueva geometrı́a sólida de barricas de vino). Galileo Galilei (1564-1642) utilizó lo
infinitamente pequeño en su trabajo sobre dinámica. Bonaventura Cavalieri (1598-1647), un discı́pulo de
Galileo, describió en su influyente Geometria indivisibilibus continuorum, 1635, cómo un área puede ser
entendida como constituida por lı́neas o ‘indivisibles’ y un volumen por áreas, y desarrolló un método
geométrico para hallar la integral de xn para enteros positivos n. Por la misma época, Fermat resolvió el
mismo problema para enteros positivos y negativos (excepto n = −1) y para fracciones dividiendo sus
áreas en bandas rectangulares adecuadas. El caso n = −1 fue tratado por Gregoire de Saint Vincent (1584-
1667). Roberval integró la función seno en 1635, y Torricelli la función log en 1646. Otras contribuciones
se deben a Pascal, de cuyo Traité des sinus du quart de cercle de 1658 dijo Leibniz que le inspiró su des-
5.2. La integral indefinida 107
dy
donde C es una constante arbitraria. Por ejemplo, si y = x2 entonces = 2x, y la
dx
integral indefinida de la función 2x es
d 2
2x dx = x2 + C porque (x + C) = 2x .
dx
El sı́mbolo se llama signo de integración; es una ‘S’ (por suma) estirada y tiene su
origen en la formulación de Leibniz del cálculo integral. Su significado se hará patente
en el Apartado 5.4 cuando discutamos la integral como el lı́mite de una suma. La función
por integrar, F (x) en (5.2), se llama el integrando, x es la variable de integración y
dx se denomina el elemento de x. C es una constante arbitraria llamada constante de
integración. Se incluye como parte de la integral indefinida porque, dada y = F(x) con
derivada F (x), la función y + C también tiene por derivada F (x)
d dy dC dy
(y + C) = + = . (5.3)
dx dx dx dx
La Tabla 5.1 es una corta lista de ‘integrales estándar’ que incumben a algunas de las
más importantes funciones elementales (compárese con la Tabla 4.2). Cada entrada en
la lista puede ser comprobada por derivación del segundo miembro de la ecuación. Por
ejemplo,
d a 1 1
[ ln (ax + b) + C] = y por lo tanto dx = ln (ax + b) + C .
dx ax + b ax + b a
cubrimiento del Teorema Fundamental; a John Wallis (1616-1703), cuyo trabajo sobre procesos infinitos
influyó en Newton y a quien debemos el sı́mbolo ∞; al escocés James Gregory (1638-1675), cuyo traba-
jo sobre series infinitas y el cálculo anticipó el de Newton; y a Barrow, cuyas clases Newton siguió y de
quien Leibniz compró una copia de sus Lectiones durante una visita a Londres en 1673. El paso final en
la sı́ntesis del cálculo diferencial e integral fue dado por Newton (nota al pie 3, capı́tulo 4) y por Leibniz,
quien publicó la primera memoria de su cálculo integral, Analisi indivisibilium atque infinitorum (Análisis
de indivisibles e infinitos), en 1686.
108 Capı́tulo 5. Integración
xa+1
xa dx = + C, para a = −1
a+1
1 1
dx = ln (ax + b) + C
ax + b a
1 ax
eax dx = e +C
a
1
sen ax dx = − cos ax + C
a
1
cos ax dx = sen ax + C
a
dx x−1 1
1. = x−2 dx = +C =− +C
x2 −1 x
dx x1/2 √
2. √ = x−1/2 dx = + C = 2x1/2 + C = 2 x + C
x 1/2
3. dx = 1 dx = x + C
1
4. cos 2x dx = sen 2x + C
2
1 2x
5. e2x dx = e +C
2
1
6. dx = ln (x + 3) + C
x+3
1
Señalamos que si tomamos C = ln b en (vi), entonces dx = ln (x + 3) + ln b = ln b(x + 3).
x+3
En cada caso, el efecto de la operación . . . dx es invertir el efecto de la derivación; la
integral de la derivada de una función recobra la función. Además, derivando ambos
miembros en la ecuación (5.2) tenemos
d d
F (x) dx = F(x) + C = F (x) (5.4)
dx dx
Una manera alternativa de describir la operación inversa de la derivación sin recurrir al simbolismo de
d
Leibniz, es utilizar el operador diferencial D = introducido en el apartado 4.2, con la propiedad
dx
DF(x) = F (x) .
El efecto de D sobre F(x) es transformarlo en su derivada F (x), y el operador inverso correspondiente D−1
se define con el efecto inverso al de D. Por lo tanto
D−1 F (x) = F(x) + C
es la expresión con operadores de la ecuación (5.2). Los operadores D y D−1 tienen la propiedad
DD−1 = D−1 D = 1
Esta ecuación representa una familia de curvas, con una curva para cada valor de C
(Figura 5.3).
Figura 5.3
Si se precisa que la curva pase por un punto concreto, el punto (1, 2) por ejemplo, la
condición auxiliar sobre (5.5) es que y = 2 cuando x = 1; esto es, 2 = 1 + C, de manera
que C = 1. Entonces, y = x2 + 1 es la ecuación de la curva particular cuyo gradiente
viene dado por dy/dx = 2x y que pasa por el punto (1, 2).
En capı́tulos posteriores veremos cómo, en un problema fı́sico, el valor de la cons-
tante de integración se determina por la naturaleza y el estado del sistema.
110 Capı́tulo 5. Integración
Dos reglas
1 Para un múltiplo de una función:
a u(x) dx = a u(x) dx . (5.6)
A = (b − a)ȳ . (5.10)
5.3. La integral definida 111
Figura 5.4
En el caso especial de una función lineal, como en la Figura 5.5, la altura promedio es
1
ȳ = f (a) + f (b)
2
y el área bajo la curva (lı́nea recta) es la de un rectángulo de ancho (b − a) y altura ȳ.
Figura 5.5
donde F(x) es la función cuya derivada es f (x) = F (x), y los números F(a) y F(b) son
los valores de F(x) en los lı́mites de la integración a y b; a se denomina lı́mite inferior,
b lı́mite superior, y el intervalo de a a b se llama intervalo de integración. b
La diferencia F(b) − F(a) en la ecuación (5.11) se representa a menudo por F(x) ,
a
de manera que
b b
f (x) dx = F(x) = F(b) − F(a) . (5.12)
a a
Vemos que la constante arbitraria ha sido omitida de F(x) porque se cancela para el valor
de la integral definida. La integral indefinida de f (x) en el intervalo desde x = a hasta
x = b (‘la integral de a hasta b’) es entonces
b b
(2x + 3) dx = x2 + 3x = (b2 + 3b) − (a2 + 3a) .
a a
Esto es un ejemplo del caso especial de una función lineal, como en la Figura 5.5, de
manera que el valor de la integral puede obtenerse directamente como el área A =
= (b − a)ȳ con b − a = 4 − 1 = 3 y
1 1
ȳ = [f (1) + f (4)] = (5 + 11) = 8 .
2 2
Por lo tanto A = 3 × 8 = 24, como hemos visto.
3
3
x3 33 23 19
1. x2 dx = = − =
2 3 2 2 3 3
4
4
dx −1 1 1 1 1 1
2. = = − − − =− + =
2 x2 x 2 4 2 4 2 4
b b
3. dx = x = b − a
a a
π/2
π/2
π
4. sen θ dθ = – cos θ = – cos − – cos 0 = (0) − (– 1) = 1
0 0 2
+1
+1
−1 −2x −1 −2 −1 2 1 2
5. e−2x dx = e = e − e = e − e−2
−1 2 −1 2 2 2
3 3
dx 3
6. = ln x = ln 3 − ln 2 = ln
2 x 2 2
5.3. La integral definida 113
Por ejemplo, la integral (iv) de los Ejemplos 5.3 muestra que el valor medio de sen θ en
el intervalo 0 ≤ θ ≤ π/2 es
π/2
1 2
sen θ = sen θ dθ = .
π/2 0 π
Si c está entre a y b entonces el área representada por la integral del primer miembro
de la ecuación (5.15) es igual a la suma de las áreas representadas por las integrales del
segundo miembro.
Áreas negativas
Consideremos la integral
2π 2π
sen x dx = – cos x = (– cos 2π) − (– cos 0) = (– 1) − (– 1) = 0 .
0 0
sen x dx = A1 + A2 ,
0
A1 = sen x dx = +2 y A2 = sen x dx = −2 .
0 π
Este ejemplo muestra que las áreas correspondientes a valores negativos de la integral
dan contribuciones negativas al total. En este caso las contribuciones positivas y negati-
vas se cancelan y el valor medio de sen a en el intervalo es cero.
es discontinua en x = 2, pero la Figura 5.7 muestra que la función puede ser integrada
sobre la discontinuidad si el intervalo de integración es dividido en el punto de disconti-
nuidad. Por ejemplo,
8
3 2 3
6
f (x) dx = f (x) dx + f (x) dx
1 1 2 4
2 3 2
= 2x dx + (2x + 1) dx
1 2
= 3 + 6 = 9.
Figura 5.7
5.3. La integral definida 115
Esto siempre puede hacerse cuando el integrando tiene únicamente un número finito de
discontinuidades dentro del intervalo de integración.
Integrales impropias
Una integral definida se dice impropia cuando el integrando tiene una discontinuidad
infinita en un punto dentro del intervalo de integración. Si la discontinuidad es en el
punto x = c, siendo a ≤ c ≤ b, entonces la integral se define como el lı́mite
b
c− b
f (x) dx = lim f (x) dx + f (x) dx . (5.17)
→0
a a c+
Como se muestra en la Figura 5.8, el punto c se excluye porque el integrando no está de-
finido allı́. Cuando el lı́mite en (5.17) es finito y único, el valor de la integral es el ‘área
bajo la curva’.
Figura 5.8
Si la discontinuidad queda en uno de los extremos del intervalo de integración, por ejem-
plo en x = a, la integral se define como
b b
√
Por ejemplo, la función 1/ x no está definida en x = 0. La integral definida entre los
lı́mites x = 0 y x = 1 se define como
1 1
dx dx
√ = lim √
0 x →0 x
y tenemos
1
dx 1
1
√ = x−1/2 dx = 2x1/2 = 2 − 21/2 .
x
Sin embargo, el lı́mite en (5.17) o en (5.18) no tiene por qué existir necesariamente.
Por ejemplo,
1 1
dx
= lim ln x = lim(– ln )
0 x →0 →0
Si a < 1 el lı́mite tiene por valor 1/(1 − a), pero si a > 1 el lı́mite es infinito y la integral
no está definida.
Integrales infinitas
A menudo ocurre en aplicaciones en las ciencias fı́sicas que uno o ambos lı́mites de
integración son infinitos. Las integrales con intervalos de integración infinitos se denomi-
nan integrales infinitas. Si el lı́mite superior es infinito, la integral definida se considera
como
∞ b
f (x) dx = lim f (x) dx . (5.19)
b→∞
a a
Por ejemplo,
∞ b b
e−r dr = lim e−r dr = lim −e−r
b→∞ b→∞ 0
0 0
= lim −e−b + 1 = 1 ,
b→∞
b
x−2 b−2 2 3
= lim ln = lim ln − ln = ln ,
b→∞ x − 1 4 b→∞ b−1 3 2
porque (b − 2)/(b − 1) → 1 cuando b → ∞ y ln 1 = 0.
Cuando el lı́mite de la definición (5.19) es finito y único, se dice que la integral es con-
vergente. Una integral es divergente cuando el lı́mite es indeterminado. Por ejemplo,
∞ b
dx
= lim ln x = lim ln b
1 x b→∞ 1 b→∞
Este resultado es válido para todo valor positivo del parámetro a, por pequeño que sea,
y se deduce que
∞
lim e−ax cos x dx = 0
a→0
0
Hay que señalar que el lı́mite debe tomarse después de la integración; tomar el lı́mite
antes de la integración conduce a una integral diferente, y divergente.
f (– x) = f (x) (5.20)
se dice que es una función par de x, tiene paridad par (o paridad +1) y es simétrica con
respecto al eje x = 0 (el eje y). Son funciones pares, por ejemplo, x2 , cos x (representada
en la Figura 5.9a), y exp −x2 . En cada caso el valor de la función no cambia al sustituir
x por −x. Por otra parte, de una función con la propiedad
f (– x) = −f (x) (5.21)
118 Capı́tulo 5. Integración
se dice que es una función impar, tiene paridad impar (o paridad −1) y es antisimétri-
ca con respecto al eje x = 0. Son funciones impares, por ejemplo, x3 , sen x (representada
en la Figura 5.9b), y x cos x. En cada caso el valor de la función cambia de signo al
sustituir x por −x.
Figura 5.9
1 1
f (x) = f (x) + f (– x) + f (x) − f (– x)
2 2 (5.22)
= f+ (x) + f− (x) ,
donde f+ (x) es la componente par de f (x) y f− (x) la componente impar. Por ejemplo, un
polinomio arbitrario
f (x) = a0 + a1 x + a2 x2 + · · · + an xn
y, puesto que cada potencia par de x es una función par mientras que cada potencia impar
de x es una función impar, el primer conjunto de términos conforma la componente par
y el segundo conjunto conforma la componente impar. Las propiedades de integrales de
funciones con simetrı́a bien definida son de gran importancia en las ciencias fı́sicas. El
área representada por la integral
+a
A= f (x) dx (5.23)
−a
5.4. El cálculo integral 119
Si f (x) es una función par de x, las dos áreas A< y A> son iguales en magnitud y signo,
y el área total es dos veces cada una de ellas:
+a +a
Por otra parte, si f (x) es una función impar de x, entonces A< y A> son iguales en mag-
nitud pero tiene signos opuestos, A> = −A< , y el valor de la integral es cero:
+a
Figura 5.10
Obtenemos una estimación del área al sustituir cada banda por un rectángulo. El ancho
de la banda r-ésima es ∆xr = xr − xr−1 y podemos escoger la altura yr del rectángulo
entre todos los valores de la función en esa banda. Entonces
n
A≈ yr ∆xr . (5.29)
r=1
En la Figura 5.10 se muestran dos maneras de escoger las alturas de los rectángulos. En
la Figura (a) la altura de cada rectángulo se escoge como el mayor valor de y = f (x) en
el subintervalo. A esta cantidad la llamamos yr (max) para la r-ésima banda. En la Figura
(b) la altura se escoge como el menor valor. A esta cantidad la llamamos yr (min) para la
r-ésima banda. Claramente, la primera elección da un valor que sobrestima el área bajo
la curva, mientras que la segunda elección da un valor que subestima dicha área:
n
n
n
n
Esta sı́ntesis de los cálculos diferencial e integral se llama teorema fundamental del
cálculo. La integral definida, como la hemos definido en este Apartado, se denomina
integral de Riemann.3 Al calcular el área encerrada por una curva no es ni esencial
ni siempre conveniente dividir el área en bandas lineales como hemos descrito antes.
Ilustramos este punto en el Ejemplo 5.5 con dos maneras de calcular el área de un cı́rculo.
Se divide el área en n bandas verticales como se describe en la deducción de la ecuación (5.33) más arriba.
Figura 5.11
03. Georg Friedrich Bernhard Riemann (1826-1866), profesor de matemáticas en Göttingen, contri-
buyó a la teorı́a de números, funciones de variable compleja y ecuaciones diferenciales. En su disertación de
1854 Über die Hypothesen welche der Geometrie zu Grunde liegen (Sobre las hipótesis en las que se basa
la geometrı́a), Riemann desarrolló un sistema de geometrı́a no euclı́dea e inició el estudio de los espacios
métricos curvos que acabarı́a conformando la base de las matemáticas de la teorı́a de la relatividad general.
122 Capı́tulo 5. Integración
√
Un valor aproximado del área de la banda entre x y x + ∆x es ∆A ≈ a2 − x2 ∆x y, por la ecuación (5.33),
el área total es a
A= a2 − x2 dx .
0
La integral se evalúa en el Ejemplo 6.10. Su valor es πa2 /4, y el área del cı́rculo es cuatro veces esto.
Método 2. Se divide el área del cı́rculo en bandas circulares concéntricas como en la Figura 5.12. Dado que
la circunferencia de un cı́rculo de radio r es 2πr (véase el Ejemplo 5.6), el área de la banda entre r y r + ∆r
queda entre 2πr∆r y 2π(r + ∆r)∆r:
Figura 5.12
Señalamos que la integral indefinida puede entenderse como un caso especial de la inte-
gral definida (ecuación (5.34)) en el que el lı́mite superior de integración, b, se sustituye
por la variable x, y el lı́mite inferior a, y por lo tanto F(a), es una constante arbitraria:
x
f (x) dx = f (x) dx = F(x) − F(a) = F(x) + C . (5.36)
a
Uso de diferenciales
Otra perspectiva conveniente, si bien menos rigurosa, de ver la integral definida como
un área, es utilizando el concepto de diferencial introducido en el Apartado 4.12. Este
enfoque se usa a menudo en textos elementales de cálculo, y se utiliza ampliamente en
la aplicación del cálculo a la formulación de los problemas fı́sicos.
Consideremos la expresión (5.35) presentada en el Ejemplo 5.5. Dividiendo por ∆r se
obtiene
∆A
2πr < < 2π(r + ∆r)
∆r
y, en el lı́mite ∆r → 0,
∆A dA
→ = 2πr .
∆r dr
5.4. El cálculo integral 123
La cantidad dA/dr es el coeficiente de variación del área A(r) del cı́rculo con respecto al
radio r. El diferencial correspondiente dA = 2πr dr es, en el lenguaje de diferenciales,
el área de una banda circular de radio r y ancho ‘infinitesimal’ dr; es un elemento de
área o diferencial de área. La ‘suma’ de estos elementos es la integral
A a
A= dA = 2πr dr .
0 0
Figura 5.13
Para calcular esta longitud dividimos el arco AB en segmentos de longitud ∆s. Entonces,
por el teorema de Pitágoras, un valor aproximado de la longitud del segmento entre x y
x + ∆x es
1/2 ∆y 2 1/2
∆s ≈ (∆x)2 + (∆y)2 = 1+ ∆x .
∆x
El correspondiente elemento de longitud es
dy 2 1/2
ds = 1 + dx (5.37)
dx
y la longitud total del arco AB es
s b dy 2 1/2
s= ds = 1+ dx . (5.38)
0 a dx
Figura 5.14
N
N
N
N
mi xi = MX, (5.40)
i=1
entonces X es la posición del centro de masas. El primer momento del sistema de masas
es por lo tanto igual al momento de la masa total concentrada en el centro de masas.
Figura 5.15
N
T= Fi xi = MgX = FX , (5.41)
i=1
donde F = Fi es la fuerza total que actúa sobre el sistema de masas. Entonces la
posición
X del centro de masas se llama, además, centro de gravedad, y la cantidad
T = Fi xi se llama momento de la fuerza o par de torsión del sistema de fuerzas con
respecto al punto O. Si las masas están sujetas a una barra rı́gida y uniforme (de masa
despreciable), el par de torsión es una medida de la tendencia de las fuerzas a hacer
girar el sistema en torno a O, y, por la ecuación (5.41), es igual al par producido por la
fuerza total F concentrada en el centro de masas. Si el punto O está en el centro de masas
(gravedad), entonces X = 0 y
N
T= Fi xi = 0 (5.42)
i=1
Figura 5.16
Las fuerzas F1 y F2 son los pesos de los cuerpos, y F es una fuerza de reacción que actúa sobre el pivote O.
Si el pivote está en el centro de masas, entonces (x1 = −r1 y x2 = r2 en la ecuación (5.42))
F1 r1 = F2 r2 (ley de la palanca)
y el conjunto está en equilibrio con respecto a giros en torno al pivote O. La fuerza vertical total que actúa
sobre el conjunto es F1 +F2 −F, de manera que el sistema está en equilibrio con respecto a desplazamientos
verticales si F = F1 + F2 .
El momento de inercia de las dos masas es I = m1 r12 + m2 r22 . Cuando O está en el centro de masas,
entonces X = 0 en (5.40) de manera que m1 r1 = m2 r2 y las distancias r1 y r2 pueden escribirse como
m2 r m1 r
r1 = , r2 = ,
m1 + m2 m1 + m2
siendo r = r1 + r2 la distancia entre las masas. El momento de inercia es entonces
m1 m 2 2
I = m1 r12 + m2 r22 = r = µr2 ,
m1 + m2
5.6. Propiedades estáticas de la materia 127
donde la cantidad µ = m1 m2 /(m1 + m2 ) se llama masa reducida del sistema de las dos masas. El momento
de inercia con respecto al centro de masas de un sistema de dos masas es por lo tanto el mismo que el
momento de inercia de una única masa µ situada a una distancia r del centro de masas.
El caso continuo
Sea una distribución de masa continua como una barra rectilı́nea de materia de lon-
gitud l (Figura 5.17).
Figura 5.17
Sea ∆m la masa del segmento desde x hasta x + ∆x, de manera que ∆m/∆x es la masa
por unidad de longitud en el segmento. Si la masa está distribuida por igual sobre la
longitud, entonces ∆m/∆x es independiente del segmento escogido y se llama densidad
(o, más correctamente, densidad lineal de masa) ρ del cuerpo y es una constante a lo
largo de toda la longitud. La masa total es entonces M = ρl. Si la masa de la barra no
está repartida por igual sobre su longitud entonces ∆m/∆x es la densidad promedio en
el segmento x a x + ∆x y su valor depende de la posición del segmento y de su longitud.
Cuando esa longitud se hace tender a cero, la proporción se acerca al lı́mite
∆m dm
ρ(x) = lim = . (5.43)
∆x→0 ∆x dx
El valor de la función ρ(x) en un punto cualquiera es la densidad en ese punto, y la
cantidad diferencial dm = ρ(x)dx es la masa de un segmento dx en x. La masa total del
cuerpo es entonces
M l
M= dm = ρ(x) dx . (5.44)
0 0
Por lo tanto, cuando sustituimos una distribución discreta de masas por una distribu-
ción continua, las sumas del caso discreto se sustituyen por integrales. Ası́, la densidad
promedio es
l
M ρ(x) dx
ρ= = 0
l . (5.45)
l dx
0
La posición del centro de masas viene dada por (véase la ecuación 5.40)
l
l
ρ(x)x dx
MX = ρ(x)x dx, o bien X = 0 l , (5.46)
0
0
ρ(x) dx
128 Capı́tulo 5. Integración
I= ρ(x)(x − x0 )2 dx . (5.47)
0
Vemos que, por ejemplo, la masa total puede ser interpretada como el ‘área bajo la curva’
de la gráfica de la función de densidad ρ(x).
EJEMPLO 5.8 Halle la masa total, el centro de masas y el momento de inercia de una distribución lineal
de masa de longitud a y densidad ρ(x) = b(a − x), 0 ≤ x ≤ a.
La masa total es igual al área a2 b/2 del triángulo sombreado en la Figura
5.18. Por lo tanto
a a
a2 b
M= ρ(x) dx = b(a − x) dx = .
0 0 2
La posición del centro de masas es
a a
1 2 a
X= ρ(x)x dx = 2 (a − x)x dx = .
M 0 a 0 3
Figura 5.18
5.7. Dinámica
Velocidad y distancia
Consideremos, como en el Apartado 5.1, un cuerpo que se mueve sobre una curva
desde el punto A en el instante t = ta hasta el punto B en el instante t = tB , y sea
s(t) la distancia sobre la curva desde A en algún instante intermedio t. Siguiendo el
razonamiento del Apartado 4.11, la cantidad v(t) = ds/dt es la velocidad del cuerpo en
el instante t. La longitud diferencial ds = vdt es la distancia recorrida en el intervalo de
tiempo infinitesimal dt, y la distancia total recorrida es entonces
s tB
s= ds = v(t) dt . (5.48)
0 tA
5.7. Dinámica 129
Por lo tanto, dado que g ≈ 9,8 m s−2 , la distancia recorrida en el primer segundo de caı́da es 4,9 m y en el
siguiente segundo es 4,9 (22 − 12 ) m = 14,7 m.
Fuerza y trabajo
Sea un cuerpo que se mueve en la dirección x entre los puntos A y B con velocidad v =
dx/dt. Si sobre el cuerpo actúa una fuerza F, entonces, por la segunda ley de Newton, la
aceleración a que experimenta el cuerpo viene dada por
d2 x
F = ma = m (5.49)
dt2
donde m es la masa del cuerpo. La aplicación de una fuerza sobre el cuerpo supone
un trabajo, y, si la fuerza es constante, entonces el trabajo efectuado es W = F(A−B)
(trabajo = fuerza × distancia).
Si la fuerza no es constante entre A y B, sino que es una función de la posición,
F = F(x), entonces el trabajo efectuado se obtiene mediante cálculo integral. El trabajo
efectuado sobre el cuerpo entre las posiciones x y x + ∆x es ∆W ≈ F(x)∆x. En el lı́mite
∆x → 0, el elemento de trabajo correspondiente es dW = F(x)dx y el trabajo total
efectuado es la integral
W B
W= dW = F(x) dx . (5.50)
0 A
Figura 5.19
la fuerza que actúa sobre q2 debido a la presencia de q1 lo hace en la dirección positiva de x, alejándose
de q1 . Cargas opuestas (de signo opuesto, como las del protón y el electrón en el átomo de hidrógeno) se
atraen, y la fuerza sobre q2 está dirigida hacia q1 (en la Figura 5.19 F es negativa).
Sean dos cargas semejantes infinitamente separadas inicialmente. Puesto que las cargas se repelen, para
llevar q2 a una distancia x de q1 hay que efectuar trabajo sobre el sistema. Hay que aplicar una fuerza −F
para vencer la repulsión y el trabajo efectuado es
x
q1 q2 x dx q1 q2 1 x q1 q2
W=− F(x) dx = − 2
=− − = .
∞ 4π 0 ∞ x 4π 0 x ∞ 4π 0x
Este trabajo es positivo para cargas semejantes. La misma fórmula se aplica al caso de cargas opuestas, pero
entonces el trabajo es negativo.
Trabajo y energı́a
Si se efectúa un trabajo en un sistema mediante una fuerza externa, la energı́a del
sistema aumenta en una cantidad igual al valor del trabajo efectuado. Y al revés: si un
sistema efectúa trabajo contra una fuerza externa, la energı́a del sistema disminuye en
una cantidad igual al valor del trabajo efectuado. La energı́a de un sistema se expresa
generalmente como la suma de dos partes. Para un sistema sencillo, sin estructura in-
terna, esas partes son (i) la energı́a cinética, o energı́a de traslación, que proviene del
movimiento del sistema en el espacio, y (ii) la energı́a potencial, que proviene de la
posición del sistema en el espacio y de las fuerzas que actúan sobre el sistema en esa
posición. En el caso de un sistema con estructura interna, la energı́a cinética es la suma
de las energı́as cinéticas de las partes constitutivas, y la energı́a potencial es la suma de
las energı́as potenciales de las partes.
(i) Energı́a cinética El trabajo efectuado sobre un cuerpo por una fuerza externa F(x)
cuando el cuerpo se mueve del punto A al punto B es
B B
dv
Wab = F(x) dx = m dx . (5.51)
A A dt
0* La presencia del factor 4π0 asegura que la fuerza que actúa entre dos cargas de un culombio
separadas entre sı́ un metro es un newton: N = C2 /4π0 m2 en unidades del SI.
5.7. Dinámica 131
donde hemos usado que d(v2 )/dt = 2v dv/dt, y los lı́mites de integración se refieren a
los tiempos en A y en B. Deducimos que el trabajo hecho entre A y B es
1
Wab = m (v2B − v2A ) , (5.53)
2
siendo vA y vB las velocidades del cuerpo en A y en B, respectivamente. La cantidad
1
2
mv2 se llama energı́a cinética del cuerpo y se representa habitualmente por el sı́mbolo
T. El trabajo efectuado sobre el cuerpo es, por lo tanto, igual a la variación de la energı́a
cinética:
Wab = TB − TA . (5.54)
Vemos que la energı́a cinética de un cuerpo en reposo se define como igual a cero.
(ii) Energı́a potencial y energı́a total Sea una fuerza que actúa sobre un cuerpo y que
sólo depende de la posición de éste, de manera que F = F(x). Esta condición excluye
fuerzas que dependen del tiempo y, más importante, fuerzas disipativas como las debidas
a la fricción. Entonces, por el teorema fundamental del cálculo (ecuación (5.34)), existe
una función f (x) tal que F(x) = f (x) y
B
El trabajo efectuado entre A y B puede por lo tanto expresarse como la variación de una
cantidad que depende únicamente de los puntos extremos A y B, y no del camino desde
A hasta B . Esta cantidad se representa normalmente por −V, y V se denomina energı́a
potencial del cuerpo. El trabajo de A hasta B es por lo tanto
B
Tres tipos sencillos pero importantes de fuerzas conservativas, y sus respectivas energı́as
potenciales, son
Figura 5.20
En cada caso, el gradiente de la gráfica es dV/dx = −F, de manera que la fuerza actúa
en la dirección de energı́a potencial decreciente.
Vemos que, mientras que la energı́a cinética tiene un valor absoluto bien definido,
eso no ocurre con la energı́a potencial, para la cual las ecuaciones (5.56) y (5.57) sólo
definen valores relativos. Los ejemplos 5.12 y 5.13 más abajo, muestran cómo se escoge
el cero de la energı́a potencial en dos situaciones fı́sicas diferentes.
Un sistema en el cual todas las fuerzas son conservativas se llama sistema conserva-
tivo. En un sistema ası́, el trabajo efectuado al mover un cuerpo alrededor de un bucle
cerrado A→B→A es cero:
Las fuerzas disipativas, como las debidas a la fricción, no son fuerzas conservativas
porque el trabajo efectuado contra la fricción siempre es positivo.
Combinando las expresiones (5.54) y (5.56) obtenemos el resultado
TA + VA = TB + VB (5.62)
donde V(x) es la energı́a potencial del cuerpo en la altura x. La elección natural del cero de la energı́a
potencial en este ejemplo es V(0) = 0, cero en la superficie. Entonces, V(x) = mgx es la energı́a potencial
del cuerpo en la altura x, y la fuerza está relacionada con ella por F = −dV/dx = −mg.
Supongamos que el cuerpo parte en reposo desde x = h y sea T(x) la energı́a cinética en la altura x.
Entonces T(h) = 0 y, por la ecuación (5.54), la energı́a cinética del cuerpo cuando alcanza la superficie es
T(0) = mgh. Además, al ser la fuerza (una constante) conservativa, la energı́a total del cuerpo se conserva y
es igual a E = mgh, que es la energı́a potencial en x = h (donde la energı́a cinética es nula) y es la energı́a
cinética en x = 0 (donde la energı́a potencial es nula). En una altura intermedia, E = mgh = T(x) + V(x) y
la energı́a cinética es
1
T(x) = mv2 = mg(h − x) . (5.63)
2
Si tanto el cuerpo como la superficie son totalmente elásticos, la velocidad del cuerpo se invierte en contacto
con la superficie, y el cuerpo retorna a su altura original en x = h invirtiendo exactamente el movimiento
de caı́da. Ası́, despejando la velocidad de la ecuación (5.63), tenemos
v = ± 2g(h − x) .
La velocidad del cuerpo es negativa cuando cae y positiva cuando sube. En ausencia de fuerzas disipativas
el movimiento de rebote se repite indefinidamente.
Figura 5.22
Un fluido con presión interna p ejerce una fuerza de magnitud |F| = pA sobre la super-
ficie del pistón, y el pistón se mueve hacia adentro o afuera según sea la presión externa
pext mayor o menor que p. Si pext > p el fluido se comprime y el trabajo efectuado por la
fuerza externa Fext al mover el pistón desde a hasta b es
b
En este caso la fuerza externa tiene magnitud |Fext | = pext A y una longitud del cilindro
|dx| contiene un volumen |dV| = A|dx|. El trabajo puede por lo tanto expresarse en
forma ‘presión-volumen’ como
b
donde los lı́mites de integración se refieren ahora al volumen, y el signo negativo se in-
cluye para hacer que el trabajo de compresión sea positivo. Puede demostrarse que esta
expresión del trabajo mecánico efectuado sobre un sistema termodinámico es indepen-
diente de la forma del recipiente.
Para comprimir el fluido es necesario que la presión externa sea mayor que la presión
interna del fluido. Sea pext = (p + ∆p), siendo ∆p una sobrepresión positiva que, por
sencillez, suponemos que es constante durante toda la compresión. Entonces, siendo
Va > Vb ,
b b b
Wab = − p dV − ∆p dV = − p dV − ∆p (Va − Vb )
a b a a
(5.66)
>− p dV .
a
5.9. Ejercicios 135
Expansión de un gas
W= p dV = p dV = p (Vb − Va ) . (5.70)
a a
5.9. Ejercicios
Apartado 5.2
Evalúe las integrales indefinidas:
3x2 + 2x + 1
1. 2 dx 2. (2x3 + 2x + 3) dx 3. dx
x2
4. x2/3 dx 5. x−1/3 dx 6. e3x dx 7. 3e−2x dx
dx dx
8. sen 4x dx 9. 10.
x−1 3−x
11. Halle y = (x2 + 3) dx tal que y = 0 cuando x = 3.
Apartado 5.3
Evalúe las integrales definidas:
5 2 3 5 π
du dv
12. dx 13. 14. 15. e−3t dt 16. cos 3θ dθ
3 1 u
3
2 v+2 1 1
0 +3
x2 + 2 si x < 1
17. sen 2x dx 18. f (x) dx donde f (x) =
−π/4 −1 x2 si x ≥ 1
1 ∞ 1 1
dx dx dx
19. √ 20. e−3t dt 21. 22.
0
3
x 0 0 x(x − 1) 0 (x − 2)(2x − 3)
23. La ecuación de Clausius-Clapeyron para el equilibrio lı́quido-vapor es
d ln p ∆Hvap 2
= T .
dT R
Si la entalpı́a de vaporización ∆Hvap es constante en el intervalo de temperaturas desde T1 a T2 , demuestre,
integrando ambos miembros de la ecuación, que
p1 ∆Hvap 1 1
ln =− − .
p2 R T1 T2
RTZ
24. El coeficiente de fugacidad γ de un gas cuya ecuación de estado es p = , donde Vm es el volumen
Vm
molar y Z es el factor de compresión, viene dada por
p
Z−1
ln γ = dp .
0 p
Apartado 5.6
27. Para un sistema de N masas discretas mi situadas en las posiciones xi , i = 1, 2, . . . , N, sobre una lı́nea
recta, halle la expresión del momento de inercia con respecto a un punto x0 arbitrario de la recta. Demuestre
que el momento de inercia toma el valor más pequeño posible cuando x0 está en el centro de masas.
28. Tres masas m1 , m2 y m3 , están situadas en una recta con m1 en x1 = −4, m2 en x2 = −1 y m3 en
x3 = 4, con respecto a un punto O de la recta.
Calcule (i) la posición del centro de masas, (ii) el momento de inercia con respecto a O, y (iii) el
momento de inercia con respecto al centro de masas.
29. La distribución de masa en una barra recta de longitud l viene dada por la función de densidad
ρ(x) = x2 , 0 ≤ x ≤ l. Halle: (i) la masa total, (ii) la densidad media, (iii) el centro de masas, y (iv) el
momento de inercia con respecto al centro de masas.
Apartado 5.7
30. Un cuerpo se mueve en lı́nea recta con velocidad v = 3t2 en el instante t. Calcule la distancia recorrida
en el intervalo de tiempo desde t = 1 hasta t = 2.
31. Un cuerpo de masa m se mueve en lı́nea recta (en la dirección x) bajo la acción de una fuerza F = kx,
donde k es positiva. Si el cuerpo parte inicialmente del reposo en la posición x = 1, halle las siguientes
cantidades en función de x: (i) el trabajo efectuado sobre el cuerpo, (ii) la energı́a cinética del cuerpo, (iii)
la velocidad, (iv) la variación de la energı́a potencial, y (v) la variación de la energı́a total.
Dibuje la gráfica de la función energı́a potencial. (vi) ¿Cuál serı́a el movimiento del cuerpo si estuviera
inicialmente en reposo en x = 0?
Apartado 5.8
32. Un gas ligeramente imperfecto obedece la ecuación de estado de van der Waals
n2 a
p + 2 (V − nb) = nRT .
V
Halle las expresiones para el trabajo efectuado por el gas al expandirse reversiblemente desde un volumen
V1 hasta un volumen V2 (i) a presión constante, y (ii) a temperatura constante.
Métodos de integración
6.1. Conceptos
Para calcular el valor de una integral definida es necesario normalmente evaluar la
correspondiente integral indefinida. Esto es, dada
f (x) dx = F(x) + C
necesitamos hallar la función F(x) cuya derivada es f (x) = F (x). Vimos en el Apartado
4.6 que toda función continua puede ser derivada aplicando unas pocas reglas. Cada
una de esas reglas, invirtiéndola, proporciona en principio una regla de integración. En
particular, la regla de la cadena y la regla del producto proporcionan, al invertirlas, los
dos métodos principales para calcular integrales: el método de sustitución (Apartado
6.3) y la integración por partes (Apartado 6.4).
El objeto de esos métodos generales de integración, y de otros particulares presenta-
dos en los apartados que siguen, es reducir una integral dada a forma estándar. Esto es,
transformarla en una integral cuyo valor aparece en una tabla de integrales estándar.
Una integral estándar es sencillamente una integral cuyo valor se conoce y cuya forma
puede usarse para evaluar otras integrales ‘no estándar’. Las integrales estándar más ele-
mentales se dan en la Tabla 5.1, y una lista más amplia se da en el Apéndice. Se han
publicado extensas listas de integrales estándar, y nuestro propósito en este capı́tulo es
mostrar cómo se obtienen (algunas de) esas integrales estándar y, lo más importante,
cómo reducir otras a forma estándar. Hay que recordar, sin embargo, que hay muchas
funciones cuyas integrales no pueden expresarse mediante un número finito de funcio-
nes elementales. En esos casos, los métodos numéricos dan valores aproximados. Con la
evolución de las máquinas de cálculo, los métodos numéricos de integración (cuadratu-
ras numéricas) se han hecho rutinarios y precisos, y algunos de los métodos numéricos
más sencillos se presentan en el Capı́tulo 20.
Consideramos primero el uso de relaciones trigonométricas (Apartado 3.2) para la
integración de algunas funciones trigonométricas.
140 Capı́tulo 6. Métodos de integración
Para a = b:
1 sen (a − b)x sen (a + b)x
4. sen ax sen bx dx = − +C
2a a−b a+b
1 sen (a − b)x sen (a + b)x
5. cos ax cos bx dx = + +C
2a a−b a+b
1 cos (a − b)x cos (a + b)x
6. sen ax cos bx dx = + +C
2a a−b a+b
La Tabla 6.1 contiene un número de integrales que pueden evaluarse haciendo uso de
las relaciones trigonométricas (3.17) a (3.22) presentadas en el Apartado 3.2. Las formas
útiles de esas relaciones son
1
cos2 x = 1 + cos 2x , (6.1)
2
1
sen2 x = 1 − cos 2x , (6.2)
2
1
sen x cos x = sen 2x , (6.3)
2
1
sen x sen y = cos (x − y) − cos (x + y) , (6.4)
2
1
cos x cos y = cos (x − y) + cos (x + y) , (6.5)
2
1
sen x cos y = sen (x − y) + sen (x + y) . (6.6)
2
Más generalmente, las relaciones pueden usarse para expresar una función senm x cosn x,
con m y n enteros positivos, mediante senos y cosenos sencillos, pero si m o n son
mayores que 2, otros métodos alternativos son a menudo más sencillos.
1
Por la ecuación (6.1), cos2 2x = (1 + cos 4x). Por lo tanto
2
1 1 1 1
cos2 2x dx = (1 + cos 4x)dx = [x + sen 4x] + C = [2x + sen 2x cos 2x] + C .
2 2 4 4
Integral 3: sen 2x cos 2x dx.
1
Por la ecuación (6.3), sen 2x cos 2x = sen 4x. Por lo tanto
2
1 1
sen 2x cos 2x dx = sen 4x dx = − cos 4x + C
2 8
1 1 1 1
= − (1 − 2 sen 2x) + C = sen2 2x + C − = sen2 2x + C ,
2
8 4 8 4
siendo C una nueva constante arbitraria. La mayorı́a de las tablas de integrales indefinidas omiten la cons-
tante arbitraria, y este ejemplo muestra por qué diferentes tablas dan a veces resultados aparentemente
diferentes para integrales indefinidas.
Integral 4: sen 2x sen 4x dx.
1 1
Por la ecuación (6.4), sen 2x sen 4x = cos (– 2x) − cos 6x = cos 2x − cos 6x . Por lo tanto
2 2
1 1 sen 2x sen 6x
sen 2x sen 4x dx = cos 2x − cos 6x dx = − +C.
2 2 2 6
du
u = 2x − 1 , du = dx = 2 dx ,
dx
142 Capı́tulo 6. Métodos de integración
donde la integral a la derecha es una integral estándar, esto es, g(u) es más fácil de inte-
grar que f (x). Derivando ambos lados de (6.7) con respecto a x tenemos:
Por lo tanto
du
f (x) = g(u) (6.8)
dx
y, sustituyendo en (6.7),
du
f (x) dx = g(u) dx = g(u) du . (6.9)
dx
du
u = u(x), du = dx , (6.10)
dx
dx
o, como alternativa, x = x(u), dx = du.
du
6.3. El método de sustitución 143
EJEMPLO 6.2 Halle la integral f (x) dx = (x + x2 )−1/2 (1 + 2x)dx.
d
Como (1 + 2x) = (x + x2 ), hacemos el cambio u = x + x2 , du = (1 + 2x)dx.
dx
Entonces
du
f (x) = (x + x2 )−1/2 (1 + 2x) = u−1/2
dx
y
(x + x2 )−1/2 (1 + 2x)dx = u−1/2 du = 2u1/2 + C = 2(x + x2 )1/2 + C .
El resultado se confirma derivando:
d
2(x + x2 )1/2 + C = (x + x2 )−1/2 (1 + 2x) .
dx
2
EJEMPLO 6.3 Halle la integral I = (4x + 3)e−(2x +3x+1)
dx.
1
EJEMPLO 6.4 Demuestre que (ax + b)n dx = (ax + b)n+1 + C
a(n + 1)
donde los números a, b y n son arbitrarios, salvo que n = −1.
Sea u = ax + b, du = a dx. Entonces
1 1 un+1
(ax + b)n dx = un du = +C
a an+1
y u se sustituye por ax + b.
No hay una regla que abarque todos los casos y permita hallar el cambio de variable
adecuado que transforme una integral a forma estándar. Dominar el arte de la integración
es el resultado de mucha práctica. Algunos de los tipos más sencillos de sustitución se
recogen en la Tabla 6.2
Tabla 6.2
1. f (x)f (x) dx u = f (x), du = f (x) dx u du = 12 u2 + C
f (x) du
2. dx u = f (x), du = f (x) dx = ln u + C
f (x) u
3. f ( sen x) cos x dx u = sen x, du = cos x dx f (u) du
4. f ( cos x) sen x dx u = cos x, du = − sen x dx − f (u) du
144 Capı́tulo 6. Métodos de integración
EJEMPLOS 6.5 Integrales de tipo 1: f (x)f (x) dx.
(i) I= sen ax cos ax dx.
En este caso, cos ax es proporcional a la derivada de sen ax (y viceversa):
Vemos que esta integral es idéntica al caso 3 de la Tabla 6.1, y este ejemplo ilustra cómo hay a menudo
varias maneras de evaluar una integral en particular.
ln x
(ii) I = dx.
x
1 d 1
Como = ln x, tomamos u = ln u y du = dx. Entonces
x dx x
1 1
I = u du = u2 + C = (ln x)2 + C .
2 2
f (x)
EJEMPLOS 6.6 Integrales de tipo 2: dx.
f (x)
x
(i) I= dx.
2x2 + 3
En este caso, x es proporcional a la derivada de 2x2 + 3: f (x) = 2x2 + 3, f (x) = 4x.
Por lo tanto, tomando u = 2x2 + 3, du = 4x dx,
1 du 1 1
I= = ln u + C = ln (2x2 + 3) + C .
4 u 4 4
cos x
(ii) I= cotg x dx = dx.
sen x
Sea u = sen x. Entonces du = cos x dx, y
du
I= = ln u + C = ln (sen x) + C .
u
1
(iii) I= dx.
x ln x
1
Sea u = ln x. Entonces du = dx y
x
du
I= = ln u + C = ln (ln x) + C .
u
6.3. El método de sustitución 145
EJEMPLOS 6.7 Integrales de tipo 3: f (sen x) cos x dx.
(i) I= sena x cos x dx, siendo a un número arbitrario (pero a = −1).
Tabla 6.3
x
dx
1. √ = arcsen +C, |x| < |a| .
a2 − x2 a
x
dx
2. √ = arccosh + C = ln x + x2 − a2 + C , |x| > |a| .
x2 − a2 a
dx x
3. √ = arcsenh + C = ln x + x2 + a2 + C .
x2 + a2 a
dx 1 x
4. = arctg +C.
a2 + x2 a a
x
dx 1 1 a + x
5. = arctgh + C = ln +C.
a2 − x2 a a 2a a − x
1
a2 − x2 dx = a2 arcsen + x a2 − x2 + C .
2 a 2
Integrales definidas
Cuando se cambia la variable de integración en una integral definida con el método
de sustitución, por ejemplo de x a u(x), los lı́mites de integración tienen también que
cambiarse. Si el intervalo de integración en x es desde a hasta b, entonces el intervalo en
u(x) es desde u(a) hasta u(b):
b u(b)
π
EJEMPLO 6.9 Halle la integral I= cos2 x sen x dx.
0
Sustituimos u = cos x y du = − sen x dx. Cuando x = 0, u = cos 0 = +1. Cuando x = π, u = cos π = −1.
Por lo tanto −1 +1
I=− u2 du = + u2 du
+1 −1
puesto que al intercambiar los lı́mites el signo de la integral cambia. Tenemos entonces
π +1 +1
u3 2
cos2 x sen x dx = u2 du = = .
0 −1 3 −1 3
6.4. Integración por partes 147
A= a2 − x2 dx .
0
Al igual que en el Ejemplo 6.8, la integral se evalúa con el cambio x = a sen θ, y los nuevos lı́mites de
integración son θ = 0 cuando x = 0 y θ = π/2 cuando x = a. Por lo tanto,
π/2
a2 π/2 πa2
A = a2 cos2 θ dθ = θ + sen θ cos θ = .
0 2 0 4
y = x sen x + cos x + C
dy d d
= x sen x + cos x
dx dx dx
= sen x + x cos x + − sen x = x cos x .
Hemos usado la regla del producto para derivar el producto x sen x, y el método de
integración por partes se usa para integrar productos de este tipo. En general, sea y = uv,
donde u y v son funciones de x. Entonces
dy dv du
=u +v (6.12)
dx dx dx
e, integrando ambos miembros con respecto a x,
dy dv du
dx = u dx + v dx . (6.13)
dx dx dx
148 Capı́tulo 6. Métodos de integración
Esta ecuación, que es la inversa de la regla del producto, es la regla de integración por
partes. Dado un integrando como x cos x, uno de los factores se identifica con u en (6.14),
el otro con dv/dx. Por ejemplo, sea
dv
u = x, = cos x .
dx
Entonces
du
= 1, v = sen x ,
dx
y (6.14) se transforma en
d d
x (sen x) dx = x sen x − sen x (x) dx
dx dx
= x sen x − sen x dx
= x sen x + cos x + C .
y el problema se ha hecho más complicado. Este ejemplo ilustra la regla de que si uno de
los factores es un polinomio, entonces, salvo una única excepción importante, se debe
escoger el polinomio como la función u de la ecuación (6.14).
EJEMPLO 6.11 Integre por partes x2 cos x dx.
dv du
Sea u = x2 y = cos x. Entonces = 2x y v = sen x, y
dx dx
x2 cos x dx = x2 sen x − 2 x sen x dx .
El grado del polinomio bajo el signo de integración ha disminuido una unidad: x2 ha sido sustituido por x.
6.4. Integración por partes 149
dv
Integrando por partes la nueva integral, con u = x y = sen x, tenemos
dx
x sen x dx = −x cos x + cos x dx = −x cos x + sen x .
Por lo tanto
x2 cos x dx = x2 sen x − 2 −x cos x + sen x + C
En este caso, tomar u = xn conduce a una integral más complicada. La elección correcta es u = ln x y
dv du 1
= xn . Entonces = y v = xn+1 /(n + 1), y
dx dx x
1 n+1 1 1
xn ln x dx = x ln x − xn+1 × dx
n+1 n+1 x
1 n+1 1
= x ln x − n
x dx
n+1 n+1
1 n+1 1
= x ln x − xn+1 + C
n+1 (n + 1)2
1
= x n+1
(n + 1) ln x − 1 +C.
(n + 1)2
Un caso particular de esta integral es, para n = 0,
xn ln x dx = x ln x − x .
dv
En este caso la sustitución es u = ln x, = 1.
dx
Entonces, despejando I,
1
I= e−ax cos x dx = e−ax (sen x − a cos x) + C
1 + a2
y
∞
a
e−ax cos x dx = .
0 1 + a2
dv
donde n es un entero positivo. Tomando u = xn y = eax en la fórmula (6.14),
dx
1 n
In = xn eax − xn−1 eax dx
a a
o bien
1 n ax n
In = x e − In−1 . (6.15)
a a
Este resultado se denomina una fórmula de reducción para In , o una relación de re-
currencia entre In e In−1 . Por ejemplo
1 3 ax 3 1 2 ax 2 1 ax 1
I3 = x e − I2 , I2 = x e − I1 , I1 = xe − I0 ,
a a a a a a
1 ax
I0 = eax dx = e +C.
a
Entonces
1 ax 3 3 2 6 6
I3 = e x − x + 2 x − 3 .
a a a a
Más importante aún, la relación de recurrencia es perfecta para calcular uno o más miem-
bros de una familia de integrales.
6.5. Fórmulas de reducción 151
Hay fórmulas especialmente sencillas para algunas integrales definidas que son im-
portantes en las ciencias fı́sicas. Por ejemplo, la integral
∞
In = e−ar rn dr (a > 0) , (6.16)
0
Despejando In obtenemos
1 n−1
In = cosn−1 x sen x + In−2 .
n n
152 Capı́tulo 6. Métodos de integración
n−1
In = In−2 , n ≥ 2,
n
con
π/2 π/2
π
I1 = cos x dx = 1, I0 = dx = .
0 0 2
Por ejemplo,
3 3 1 3π 4 4 2 8
I4 = I2 = × I0 = , I5 = I3 = × I1 = .
4 4 2 16 5 5 3 15
d 2 2 1 2
Como e−ar = −2ar e−ar , el integrando se escribe como − −2ar e−ar rn−1 . Entonces, por partes,
dr 2a
∞ ∞
2 1 2 (n − 1) ∞ −ar2 n−2
e−ar rn dr = − e−ar rn−1 + e r dr .
0 2a 0 2a 0
2
Ahora bien, e−ar → 0 cuando r → ∞ y, si n > 1, rn−1 = 0 cuando r = 0. Entonces, para n ≥ 2,
∞ ∞
2 (n − 1) 2 (n − 1)
e−ar rn dr = e−ar rn−2 dr, In = In−2 .
0 2a 0 2a
Para n = 1, ∞
∞ 2 1 2 1
I1 = e−ar r dr = − e−ar = .
0 2a 0 2a
Para n = 0,
∞
−ar2 1 π
I0 = e dr = . (6.18)
0 2 a
Esta última integral es una integral estándar que no puede calcularse con los métodos descritos en este
capı́tulo (véase el Apartado 9.11).
Las integrales In son importantes, por ejemplo, en quı́mica molecular cuántica. En los métodos actuales
de cálculo para hallar funciones de onda moleculares, los orbitales moleculares se expresan en función de
2
‘funciones de base gaussianas’. Tales funciones son esencialmente la exponencial e−ar multiplicada por un
polinomio, y la utilización de esas funciones lleva a integrales del tipo presentado en este ejemplo.
6.6. Integrandos racionales. El método de fracciones simples 153
1 ax + b
(i) , (ii) , (6.19)
(x + a)n (x + px + q)n
2
dx
EJEMPLO 6.17 Integre .
(2 − x)(4 − x)
El integrando puede expresarse en fracciones simples como
1 1 1 1
= − .
(2 − x)(4 − x) 2 2−x 4−x
Por lo tanto
dx 1 1 1
= − dx
(2 − x)(4 − x) 2 2−x 4−x
1 1 4−x
= – ln (2 − x) + ln (4 − x) + C = ln +C.
2 2 2−x
5x + 1
EJEMPLO 6.18 Integre dx.
x3 − 3x + 2
La función cúbica del denominador puede factorizarse como x3 − 3x + 2 = (x − 1)2 (x + 2) de manera que
el integrando puede expresarse en fracciones simples como
5x + 1 1 2 1
= + − .
x3 − 3x + 2 x−1 (x − 1)2 x+2
Entonces
5x + 1 dx dx dx
dx = +2 −
x3 − 3x + 2 x−1 (x − 1)2 x+2
2 x−1 2
= ln (x − 1) − − ln (x + 2) + C = ln − +C.
x−1 x+2 x−1
154 Capı́tulo 6. Métodos de integración
En este caso, la integral es o bien del tipo 2 de la Tabla 6.2 o bien una generalización
sencilla del mismo:
2x + p f (x)
dx = n dx . (6.21)
(x2 + px + q)n [f (x)]
Por lo tanto
⎧
⎨ ln (x + px + q) + C si n = 1,
2
2x + p
dx = −1 (6.23)
(x2 + px + q)n ⎩ + C si n > 1.
(n − 1)(x + px + q)n−1
2
dx
El numerador es la unidad:
(x2 + px + q)n
La integral se evalúa transformando primero el denominador en una expresión de la
forma u2 + a2 . Podemos escribir
2
p 2 p − 4q
x + px + q = x +
2
− (6.24)
2 4
Para n = 1,
u
du 1 θ 1
= dθ = + C = arctg +C, (6.27)
u +a
2 2
a a a a
que es una de las integrales estándar de la Tabla 6.3. Para n > 1, la integral (6.26) puede
evaluarse, por ejemplo, mediante reducción como en el Ejemplo 6.14.
dx
EJEMPLO 6.19 Integre .
x2 + 2x + 5
La función cuadrática x2 + 2x + 5 puede escribirse como (x + 1)2 + 22 . Entonces, por la ecuación (6.27),
con a = 2 y u = x + 1,
dx dx 1 x+1
= = arctg +C.
x2 + 2x + 5 (x + 1)2 + 22 2 2
dx
EJEMPLO 6.20 Integre .
(x2 + 2x + 5)3
Por la ecuación (6.26), con n = 3, a = 2 y u = x + 1,
dx 1
= cos4 θ dθ
(x2 + 2x + 5)3 32
Tenemos que deshacer el cambio de la variable θ a u (y luego a x). Si tg θ = u/a entonces θ = arctg (u/a)
y se comprueba fácilmente que
u a
sen θ = √ , cos θ = √ .
u2 + a2 u2 + a2
Entonces
1 ua3 3 ua 3 u
cos4 θ dθ = + + arctg +C
4 (u2 + a2 )2 8 u2 + a2 8 a
y
dx 1 2(x + 1) 3(x + 1) 3 x+1
= + + arctg +C.
(x2 + 2x + 5)3 32 (x2 + 2x + 5)2 4(x2 + 2x + 5) 8 2
156 Capı́tulo 6. Métodos de integración
ax + b
Forma general: dx
(x2 + px + q)n
El numerador puede escribirse como
a ap
ax + b = 2x + p + b − (6.28)
2 2
de manera que la integral se expresa en función de los casos especiales tratados anterior-
mente:
ax + b a 2x + p ap dx
dx = dx + b − . (6.29)
(x2 + px + q)n 2 (x2 + px + q)n 2 (x2 + px + q)n
Entonces, dividiendo los numeradores y los denominadores por cos2 θ/2 y tomando t =
tg θ/2, obtenemos
2t 1 − t2 θ
sen θ = , cos θ = , t = tg . (6.31)
1 + t2 1 + t2 2
Las funciones trigonométricas sen θ y cos θ son funciones racionales de t. Una función
trigonométrica de θ que se convierte en una función (algebraica) racional de t cuando
se hace el cambio t = tg θ/2 se denomina función trigonométrica racional de θ. Cada
una de esas funciones puede ser integrada con los métodos descritos previamente en
este apartado. Ası́, si el integrando de la integral f (θ) dθ es una función trigonométrica
racional de θ, el cambio
θ 2
t = tg , dθ = dt , (6.32)
2 1 + t2
da
2f (θ)
f (θ) dθ = dt , (6.33)
1 + t2
dθ 2 1 − t2
(ii) = 3+5 dt
3 + 5 cos θ 1 + t2 1 + t2
2 2
= dt = dt
3(1 + t2 ) + 5(1 − t2 ) 8 − 2t2
dt 1 2 + t
= = ln +C
4 − t2 4 2 − t
1 2 + tg θ/2
= ln +C,
4 2 − tg θ/2
Este método puede aplicarse en todos los casos pero no es siempre el más sencillo en la
práctica. Por ejemplo, aplicar el método a la integración de las funciones trigonométri-
cas elementales sen θ y cos θ es considerablemente más complicado que usar integrales
estándar.
La integral puede considerarse como una función del parámetro α. Derivando se obtiene
d d 1 −αx 1 x
e dx =
−αx
− e +C = + e−αx .
dα dα α α2 α
Se deduce que
d d −αx
e−αx
dx = e dx
dα dα
158 Capı́tulo 6. Métodos de integración
de manera que en este caso se pueden intercambiar el orden de la integración con res-
pecto a x y la derivación con respecto a α. Este resultado es cierto en el caso general
f (x, α) dx = F(x, α) + C , (6.34)
d
si f (x, α) y f (x, α) son funciones continuas de x y α:
dα
d d d
f (x, α) dx = f (x, α) dx = F(x, α) . (6.35)
dα dα dα
Para la correspondiente integral definida, si los lı́mites son independientes del parámetro
α,
b b
d d d d
f (x, α) dx = f (x, α) dx = F(b, α) − F(a, α) . (6.36)
dα a a dα dα dα
Cuando uno o ambos lı́mites de integración son infinitos, es necesario asegurarse de que
la integral de la función y la de su derivada son ambas convergentes.
∞
EJEMPLO 6.22 Integre e−ax xn dx.
0
En el Apartado 6.5 evaluamos la integral a partir de una fórmula de reducción obtenida mediante sucesivas
iteraciones por partes. Un método alternativo es derivar la sencilla integral estándar
∞
1
e−ax dx = , (a = 0) .
0 a
∞
sen x
EJEMPLO 6.23 Integre dx.
0 x
La integral no puede ser evaluada con los métodos estándar presentados en este capı́tulo y el método de
integración por partes no funciona. Consideramos en su lugar la integral relacionada
∞ −αx
e sen x
I(α) = dx .
0 x
Entonces ∞
d
I(α) = − e−αx sen x dx
dα 0
y la nueva integral puede integrarse por partes como en el Ejemplo 6.13. Entonces
d 1
I(α) = − 2 (6.37)
dα α
6.8. Ejercicios 159
Cuando los lı́mites de integración también dependen del parámetro, el resultado de de-
rivar la integral viene dado por el teorema de Leibniz: si a(α) y b(α) son funciones
continuas de α,
b(α) b(α)
d d db da
f (x, α) dx = f (x, α) dx = f (b, α) − f (a, α) . (6.39)
dα a(α) a(α) dα dα dα
6.8. Ejercicios
Apartado 6.2
Evalúe las integrales indefinidas:
1. sen2 3x dx 2. sen 3x cos 3x dx 3. sen 3x cos 2x dx
4. sen x cos 3x dx 5. sen 3x sen x dx 6. cos 5x cos 2x dx
10. Las funciones de onda para una partı́cula en una caja de longitud l son
nπx
2
ψn (x) = sen , n = 1, 2, 3, . . .
l l
Demuestre que las funciones satisfacen la condición de ortonormalidad
l
1 si m = n,
ψn ψm dx =
0
0 si m = n.
Apartado 6.3
Evalúelas integrales indefinidas (utilice el cambiodado entre paréntesis):
11. (3x + 1)5 dx (u = 3x + 1) 12. sen (4x − 1) dx (u = 4x − 1)
160 Capı́tulo 6. Métodos de integración
13. (3x2 + 2x + 5)3 (3x + 1) dx (u = 3x2 + 2x + 5)
3
14. (3x2 + 2)e−(x +2x)
dx (u = x3 + 2x)
2x + 1
15. dx (u = x2 + x + 2) 16. sen3 x cos x dx (u = sen x)
x2 + x + 2
17. tg x dx (u = cos x) 18. ex (1 + ex )1/2 dx (u = 1 + ex )
dx
19. (u = ln x) 20. x 4 − x2 dx (u = 4 − x2 )
x ln x
x dx
21. √ (x = 2 sen θ)
4 − x2
Apartado 6.4
Evalúelas integrales indefinidas:
36. x sen x dx 37. x3 sen x dx 38. (x + 1)2 cos 2x dx
ln x
39. x ln x dx 40. dx 41. x2 e2x dx
x2
42. e−x sen 2x dx 43. eax cos bx dx
48. Una expresión aproximada para la función de partición rotacional de un rotor lineal es
∞
qr = (2J + 1)e−J(J+1)Θr /T dJ ,
0
49. La probabilidad de que una molécula de masa m en un gas a temperatura T tenga velocidad v viene
dada por la distribución de Maxwell-Boltzmann
m 3/2 2
f (v) = 4π v2 e−mv /2kT ,
2πkT
∞
donde k es la constante de Boltzmann. Halle la velocidad media v̄ = v f (v) dv,
0
(véase el Ejercicio 73 del Capı́tulo 4).
Apartado 6.5
50. Determine una fórmula de reducción para senn x dx, siendo n un entero positivo.
55. En espectroscopia, la forma de las lı́neas se analiza algunas veces usando segundos momentos. El
segundo momento de una señal centrada en la frecuencia angular ω0 es
∞
(ω − ω0 )2 g(ω) dω
ω0
donde g(ω) es una función para la forma de la señal. Evalúe la integral para la curva gaussiana
2 1
g(ω) = T exp − T 2 (ω − ω0 )2 .
π 2
56. Para la distribuciónde Maxwell-Boltzmann del ejercicio 49, halle la raı́z de la velocidad cuadrática
∞
media v2 , siendo v2 = v2 f (v) dv.
0
Apartado 6.6
Evalúelas integrales indefinidas:
dx (x + 2) dx dx
57. 58. 59.
(2x − 1)(x + 3) (x + 3)(x + 4) 3x2 − 5x − 2
162 Capı́tulo 6. Métodos de integración
x2 dx (x2 − 3x + 3) dx
60. 61.
(x − 1)(x − 2) (x + 1)(x + 2)(x + 3)
x dx dx dx
62. 63. 64.
(x2 + 3)(x2 + 4) x2 + 4x + 2 x2 + 4x + 5
x dx x2 dx dx
65. 66. 67.
x2 + 4x + 5 x + 4x + 5
2 (x2 + 4x + 5)2
Apartado 6.7
71. Derivando la integral
∞
−ax2 1 π
e dx =
0 2 a
con respecto a a, demuestre que
∞
2n −ax2 1 · 3 · 5 · · · (2n − 1) π
x e dx = .
0 2n+1 an a
Sucesiones y series
7.1. Conceptos
Una serie es un conjunto de términos que han de ser sumados. Los términos pue-
den ser números, variables, funciones, o cantidades más complejas. Una serie puede ser
finita, con un número finito de términos,
u 1 + u2 + u 3 + · · · + un
u1 + u 2 + u3 + u 4 + · · ·
donde los puntos suspensivos indican que la suma ha de extenderse indefinidamente (ad
infinitum). Los términos por sı́ mismos forman una sucesión. Tratamos las sucesiones en
el Apartado 7.2, las series finitas en 7.3, las series infinitas y los criterios de convergencia
en 7.4 y 7.5. En el Apartado 7.6 tratamos de cómo las series de MacLaurin y de Taylor
pueden utilizarse para representar ciertos tipos de funciones en series de potencias (‘po-
linomios infinitos’), y en 7.7 cómo pueden usarse para obtener valores aproximados de
funciones. Algunas propiedades de las series de potencias se describen en el Apartado
7.8.
Las series aparecen en todas las ramas de las ciencias fı́sicas, y la representación
de funciones como series es una herramienta esencial para la resolución de muchos
problemas fı́sicos. Algunas funciones, como la función exponencial y otras funciones
trascendentes, se definen mediante series, lo mismo que importantes cantidades fı́sicas,
como por ejemplo la función de partición en termodinámica estadı́stica. Veremos en los
Capı́tulos 12-14 que las ecuaciones diferenciales relevantes en las ciencias fı́sicas a me-
nudo tienen soluciones que pueden representarse únicamente como series. A menudo
los métodos de resolución aproximados o numéricos se basan en series. Por ejemplo,
las soluciones de la ecuación de Schrödinger se representan a menudo como series, bien
sea en la teorı́a formal o en los métodos aproximados, como el método de ‘combinación
lineal de orbitales atómicos’ en la teorı́a de orbitales moleculares (OM CLOA). Una
aplicación importante de las series es el análisis de formas de onda mediante series de
Fourier y transformadas de Fourier. El análisis de Fourier lo tratamos en el Capı́tulo 15.
164 Capı́tulo 7. Sucesiones y series
7.2. Sucesiones
Una sucesión es un conjunto ordenado de términos
u1 , u2 , u3 , . . .
con una regla que especifica cada término. Por ejemplo, los números
1, 3, 5, 7, . . .
ur = 1 + 2(r − 1), r = 1, 2, 3, . . .
De manera alternativa, la regla puede expresarse como una relación de recurrencia más
un término inicial:
ur = ur−1 + 2 , u1 = 1 ,
con la regla
con la regla
ur = axr−1 , r = 1, 2, 3, . . . (7.4)
2. Progresión geométrica:1
Lı́mites de sucesiones
1
Los términos de la sucesión armónica ,
r
1 1 1
1, , , , ...
2 3 4
decrecen en magnitud al crecer r, y tienden hacia el valor cero cuando r tiende a infinito.
La cantidad
1
lim =0
r→∞ r
01. El papiro de Rhind (hacia 1650 a.C.) contiene un problema sobre “7 casas, 49 gatos, 343 ratones,
2401 espigas de grano, 16807 hekats”. La versión del ‘Problema de Saint Ives’ en el Liber abaci de Fibo-
nacci (1202 d.C.) es “7 ancianas van a Roma. Cada una tiene 7 mulas y cada mula lleva 7 sacos. Cada saco
contiene 7 hogazas, en cada hogaza hay 7 cuchillos y cada cuchillo está guardado en 7 fundas”.
02. Esta es la solución al paria coniculorum, o problema de los conejos, dado en el Liber abaci de
Fibonacci: “¿cuántas parejas de conejos se crı́an a partir de una pareja en un año si cada pareja crı́a otra
pareja cada mes y empiezan a criar a partir del segundo mes de haber nacido?”
166 Capı́tulo 7. Sucesiones y series
Ası́,
Figura 7.1
(a) x>1 1, 2, 4, 8, . . .
(b) x=1 1, 1, 1, 1, . . .
1 1 1
(c) 0<x<1 1, , , , ...
2 4 8
1 1 1
(d) −1 < x < 0 1, − , , − , . . .
2 4 8
(e) x = −1 1, −1, 1, −1, . . .
La sucesión es convergente sólo para x = +1 y |x| < 1, tipos (b), (c) y (d), (y para el
caso trivial x = 0).
El comportamiento de una sucesión en el lı́mite no depende necesariamente del
comportamiento de una parte finita de la sucesión. La sucesión {1/(2,5 − r)2 } con
r = 0, 1, 2, . . ., por ejemplo, aumenta su valor inicialmente, pero se comporta como la
sucesión {1/r2 } cuando r → ∞. Un ejemplo más importante es la sucesión de los térmi-
7.3. Series finitas 167
nos de la serie exponencial, xr /r! . Esta sucesión tiene lı́mite cero para todo valor de
x. De esta manera, la razón de dos términos consecutivos es
r
xr+1 x x
=
(r + 1)! r! r+1
y los términos aumentan en magnitud cuando r + 1 < |x|, y disminuyen cuando r + 1 >
|x|.
r−2
1. ur = .
2r
1 1 1
Tenemos ur = − , ası́ que ur → cuando r → ∞.
2 r 2
2r2 + 2r + 1
2. ur = .
r2 − r + 1
2 + 2/r + 1/r2
Dividiendo arriba y abajo por r2 , ur = → 2 cuando r → ∞.
1 − 1/r + 1/r2
De manera alternativa, como el polinomio (a0 + a1 r + a2 r2 + · · · + an rn ) se comporta como (an rn )
cuando r → ∞,
2r2 + 2r + 1 2r2
→ = 2 cuando r → ∞ .
r2 − r + 1 r2
3. ur = (– 1)r .
Ésta es la sucesión −1, +1, −1, +1, . . . y el lı́mite no está definido.
1
4. ur = sen → sen 0 = 0 cuando r → ∞.
r
S1 = u1
S2 = u 1 + u2
S3 = u 1 + u2 + u 3
...
Sn = u 1 + u 2 + u 3 + · · · + u n = ur (7.5)
r=1
168 Capı́tulo 7. Sucesiones y series
u r = u 1 + u 2 + u 3 + · · · + un
r=1
ur = u 1 + u2 + u 3 + · · ·
r=1
Series aritméticas
Sn = [a + (n − 1)d] + [a + (n − 2)d] + · · · + a .
de manera que n
Sn = [2a + (n − 1)d] . (7.7)
2
En particular, la suma de los n primeros números naturales es (a = d = 1)
1
Sn = 1 + 2 + 3 + · · · + n = n(n + 1) . (7.8)
2
7.3. Series finitas 169
Series geométricas
La suma de los n primeros términos de la progresión geométrica (7.3) es
n−1
Por lo tanto3
1 − xn
Sn = a , (x = 1) . (7.9)
1−x
Entonces, para a = 1,
1 − xn
= 1 + x + x2 + x3 + · · · + xn−1 . (7.10)
1−x
(1 + x)2 = 1 + 2x + x2 ,
03. Una exposición de las series geométricas aparece en el Libro IX de los Stoichia (Elementos) de
Euclides. Euclides fue uno de los primeros en enseñar en el Museo de Alejandrı́a fundado por Tolomeo
I hacia el 300 a.C. tras haber ganado el control de Egipto cuando el imperio de Alejandro se disgregó en
323 a.C.
170 Capı́tulo 7. Sucesiones y series
(1 + x)3 = 1 + 3x + 3x2 + x3 ,
(1 + x)4 = 1 + 4x + 6x2 + 4x3 + x4 .
En el caso general
n(n − 1)(n − 2) . . . (n − r + 1) r
x .
r!
6×5×4×3×2 5 6×5×4×3×2×1 6
+ x + x
5×4×3×2×1 6×5×4×3×2×1
y se llama coeficiente binomial (a veces se lee como ‘n sobre r’). Los coeficientes bino-
miales son importantes en teorı́a de probabilidades,
n donde se los suele denotar como n Cr
n
(o Cr ). Veremos en el Capı́tulo 21 que r es el número de combinaciones de n objetos
tomados de r en r. Usando los coeficientes binomiales, el desarrollo es
n
n
(1 + x) =n
xr . (7.13)
r=0
r
5
EJEMPLO 7.4 Calcule los coeficientes binomiales , y utilı́celos para desarrollar (i) (1 + x)5 y (ii)
r
(x + 3)5 en potencias de x.
Por la definición de los coeficientes,
5 5 5!
= = , r = 0, 1, 2, . . . , 5 .
r 5−r r! (5 − r)!
04. Blaise Pascal (1623-1662). Filósofo y matemático francés que hizo contribuciones a la geometrı́a,
el cálculo y, junto con Fermat, desarrolló la teorı́a matemática de la probabilidad (instigado por el jugador
Antoine Gombard, Chevalier de Méré). El triángulo de Pascal aparece en el Traité du triangle arithmétique,
avec quelques autres petits traités sur la même manière, publicado póstumamente en 1665. El trabajo
contiene una exposición de las propiedades de los coeficientes binomiales, con aplicaciones a juegos de
azar. El triángulo era conocido desde mucho antes. Apareció en un libro del matemático chino Yang Hui en
1261, y las propiedades de los coeficientes binomiales fueron tratadas por el persa Jamshid Al-Kashi en su
Llave de la aritmética (hacia 1425).
172 Capı́tulo 7. Sucesiones y series
El método de diferencias
Muchas series finitas sencillas pueden sumarse si el término general ur puede escri-
birse como la diferencia
ur = vr − vr−1 .
Entonces
ur = vr − vr−1
r=1 r=1 r=1
n
1 1 1 1
= + + ··· + .
r=1
r(r + 1) 1·2 2·3 n(n + 1)
El término general puede escribirse como
1 1 1
= −
r(r + 1) r r+1
y, por lo tanto,
n
1
n
1
1
n
= −
r=1
r(r + 1) r=1
r r=1
r+1
1 1 1 1 1 1 1 1
= + + + ··· + − + + ··· + +
1 2 3 n 2 3 n n+1
1 n
= 1− = .
n+1 n+1
05. El método general para generar estas sumas se debe al matemático suizo Jakob Bernoulli (1654-
1705), profesor de matemáticas en Basilea. Con su hermano Johann (1667-1748), profesor de matemáticas
en Groningen y en Basilea, y en colaboración con Leibniz, contribuyó también al cálculo, la teorı́a de
ecuaciones diferenciales, las series y el cálculo de variaciones. Fue esta colaboración la que condujo al éxito
de la formulación de Leibniz del cálculo. Por el año 1700, la mayor parte del cálculo elemental (descrito en
este libro) habı́a sido desarrollado. El método de Newton de las fluxiones nunca fue bien conocido fuera de
Inglaterra. Fue Jakob Bernoulli quién usó por primera vez el término ‘integral’.
7.4. Series infinitas 173
n
1 2 1 1
r = 1 + 2 + 3 + ··· + n = n + n = n(n + 1)
r=1
2 2 2
n
1 3 1 2 1 1
r2 = 1 + 22 + 32 + · · · + n2 = n + n + n = n(n + 1)(2n + 1)
r=1
3 2 6 6
n
1 4 1 3 1 2 1
r3 = 1 + 23 + 33 + · · · + n3 = n + n + n = n2 (n + 1)2
r=1
4 2 4 4
n
1 5 1 4 1 3 1
r4 = 1 + 24 + 34 + · · · + n4 = n + n + n − n
r=1
5 2 3 30
n
1
r(r + 1) = n(n + 1)(n + 2)
r=1
3
n
1
r(r + 1)(r + 2) = n(n + 1)(n + 2)(n + 3)
r=1
4
n
1 n
=
r=1
r(r + 1) n+1
n
1 1 1
= −
r=1
r(r + 1)(r + 2) 4 2(n + 1)(n + 2)
2 · 5 + 3 · 7 + 4 · 9 + ···
El término general es ur = (r + 1)(2r + 3) para r = 1, 2, 3, . . . . Entonces
ur = 2r(r + 1) + 3r + 3
n
ur = 2 r(r + 1) + 3 r+3 1
r=1 r=1 r=1 r=1
1 1
= 2 × n(n + 1)(n + 2) + 3 × n(n + 1) + 3 × n
3 2
1
= n(4n + 21n + 35) .
2
6
174 Capı́tulo 7. Sucesiones y series
S = lim u r = u1 + u 2 + u 3 + · · · (7.15)
n→∞
r=1
donde los puntos suspensivos indican que la suma debe extenderse indefinidamente. La
serie tiene suma sólo si el lı́mite es finito y único, esto es, cuando la sucesión de las
sumas parciales converge.
La serie geométrica
La serie geométrica es el lı́mite de la sucesión de sumas parciales
1 − xn
Sn = 1 + x + x2 + x3 + · · · + xn−1 = , x = 1
1−x
1
de manera que la serie geométrica es el desarrollo de la función en potencias de x:
1−x
1
= 1 + x + x 2 + x3 + · · · , |x| < 1 . (7.16)
1−x
La serie armónica
1 1 1
S=1+ + + + ···
2 3 4
A pesar de las apariencias, la serie diverge. Puede ser escrita como la suma de sumas
parciales
7.5. Criterios de convergencia 175
1 1 1 1 1 1 1
S = 1+ + + + + + +
2 3 4 5 6 7 8
1 1 1 1 1 1 1 1
+ + + + + + + + + ···
9 10 11 12 13 14 15 16
1
= 1 + + s1 + s2 + s3 + · · ·
2
donde sn tiene 2n términos de los cuales el último, y menor, tiene valor 1/2n+1 . Cada una
de esas sumas es por lo tanto mayor que 2n × (1/2n+1 ) = 1/2. Por ejemplo,
1 1 1 1 1 1 1 1 1 1 1 1
s1 = + > + , s2 = + + + > + + + .
3 4 4 4 5 6 7 8 8 8 8 8
Se deduce que
1 1 1 1
S>1+ + + + + ···
2 2 2 2
y la serie diverge.6
El ejemplo de la serie geométrica muestra que es inmediato ver si una serie con-
verge, o lo contrario, si se tiene una expresión para las sumas parciales. La suma de la
serie infinita es el lı́mite de la sucesión de sumas parciales. Por otra parte, el ejemplo
de la serie armónica muestra que cuando no se conoce tal expresión, hay que emplear
procedimientos menos directos.
Dada una serie
ar = a1 + a 2 + a3 + · · ·
r=1
una primera condición necesaria para la convergencia es que el lı́mite de la sucesión {ar }
sea cero:
{ar } → 0 cuando r → ∞.
06. Esta demostración de la divergencia de la serie armónica y el tratamiento de otras series infinitas
aparece en las Quaestiones super geometriam Euclidis de Oresme (hacia 1350).
176 Capı́tulo 7. Sucesiones y series
El criterio de comparación
Sean A = a1 + a 2 + · · · + a r + · · ·
B = b 1 + b2 + · · · + br + · · ·
= 1 + s1 + s2 + · · ·
donde sn tiene 2n términos
np
nde los cuales el primero, y mayor, es 1/2 . Cada suma sn es entonces
2n 1
menor que np = y
2 2p−1
2 3
1 1 1
S<1+ + + + ···
2p−1 2p−1 2p−1
r
La serie de la derecha es una serie geométrica convergente x con x = 1/2p−1 < 1.
La serie S es por lo tanto convergente para todo p > 1.
07. Jean LeRond d’Alembert (1717-1783). Secretario de la Academia Francesa, es más conocido
por su contribución al desarrollo post-newtoniano de la mecánica con su principio de los trabajos virtuales
(principio de d’Alembert) publicado en su Traité de Dynamique (1743). Contribuyó a la teorı́a de ecuaciones
diferenciales, al cálculo y a las series infinitas. En su Différentiel (1754) en la Encyclopédie des sciences,
des arts et des métiers (1751-1772) dio por primera vez la derivada como el lı́mite de un cociente de
incrementos pero, a causa de las dificultades conceptuales asociadas al lı́mite como proceso consistente en
un número infinito de pasos, la definición no fue aceptada hasta el trabajo de Cauchy (1821). Dio la solución
completa de la precesión de los equinoccios. Aunque el criterio del cociente se le suele atribuir a él, y a
veces también a Cauchy, fue probablemente dado por primera vez en 1776 por el matemático de Cambridge
Edward Waring (1734-1793).
7.5. Criterios de convergencia 177
ar+1
2. diverge si lim > 1,
r→∞ ar
3. puede hacer cualquiera de las dos cosas si el lı́mite es igual a 1, y otras pruebas son
necesarias.
y la serie converge si |x| < 1, diverge si |x| > 1, y el criterio falla para x = ±1. En este caso se demuestra
fácilmente por inspección que la serie diverge cuando x = ±1.
x x2 x3
(ii) La serie exponencial 1 + + + + ···
1! 2! 3!
r
x xr+1 ar+1 x
El término general es ar = , ası́ que ar+1 = y = . Entonces
r! (r + 1)! ar r+1
ar+1
lim = lim x = 0
r→∞ ar r→∞ r + 1
Entonces la serie ∞
converge si a(x) dx converge (es finita y única),
∞1
diverge si a(x) dx diverge.
1
1 1
EJEMPLO 7.9 La serie armónica 1 + + ···
2 3
1 1 ∞ ∞
En este caso, ar = y a(x) = . Entonces 1
r x dx = ln x
1 x 1
y ln x → ∞ cuando x → ∞. Por lo tanto la serie armónica diverge.
08. Augustin-Louis Cauchy (1789-1857). El principal matemático francés de la primera mitad del
siglo XIX, es sobre todo conocido por su trabajo sobre la teorı́a de funciones de variable compleja, con el
teorema integral de Cauchy y el cálculo de residuos. Hizo contribuciones, entre otras, a las ecuaciones en
derivadas parciales, la teorı́a de la elasticidad, las series infinitas y los lı́mites (véase d’Alembert). Inventó el
término determinante para su clase de funciones simétricas alternadas (1812). El criterio integral se asocia
a veces con MacLaurin.
178 Capı́tulo 7. Sucesiones y series
Series alternadas
Si los términos de la serie a1 + a2 + a3 + · · · se van haciendo progresivamente más
pequeños y alternan su signo entonces la serie converge. Por ejemplo, la serie armónica
alternada
1 1 1
1− + − ···
2 3 4
converge. Veremos en el Apartado 7.2 que la suma de esta serie es ln 2.
c0 + c1 x + c2 x2 + c3 x3 + · · ·
o, de manera equivalente, si
cr
|x| < lim = R, (7.17)
r→∞ cr+1
Serie de MacLaurin9
Vimos en el Apartado 7.4 que la serie geométrica puede entenderse como el desarro-
llo de la función 1/(1 − x) en potencias de x. De manera similar, la serie exponencial
09. Colin MacLaurin (1698-1746), profesor de matemáticas en Edimburgo. La serie que lleva su
nombre apareció en su Treatise of fluxions (1742), pero la serie de Taylor, más general, fue publicada en
1715, y era ya conocida por el matemático escocés James Gregory (1638-1675). El Treatise contiene además
el método para decidir la cuestión del máximo/mı́nimo analizando el signo de una derivada superior.
7.6. Series de MacLaurin y de Taylor 179
puede entenderse como el desarrollo de aquella función f (x) = ex cuya derivada es igual
a sı́ misma, f (x) = f (x). Muchas otras funciones pueden desarrollarse de esta manera.
Sea f (x) una función de x que puede ser representada por una serie de potencias
f (x) = c0 + c1 x + c2 x2 + c3 x3 + c4 x4 + · · · (7.18)
Entonces, tomando x = 0,
x x2 x3
xn ∞
Figura 7.2
180 Capı́tulo 7. Sucesiones y series
f (x) = (1 + x)a
f (x) = a(1 + x)a−1
f (x) = a(a − 1)(1 + x)a−2
f (x) = a(a − 1)(a − 2)(1 + x)a−3
...
f (n) (x) = a(a − 1)(a − 2) . . . (a − n + 1)(1 + x)a−n
...
f (0) = 1, f (0) = a, f (0) = a(a − 1), f (0) = a(a − 1)(a − 2), ...
y el desarrollo de MacLaurin es
a(a − 1)(a − 2) . . . (a − n + 1) n
x .
n!
La serie (7.20) se llama serie binomial, y es la generalización del desarrollo binomial,
ecuación (7.11), a una potencia arbitraria. De hecho, si a = n es un entero positivo,
las derivadas de órdenes n + 1 y superiores son cero, y (7.20) se reduce al desarrollo
binomial. Si a no es un entero positivo, la serie tiene radio de convergencia R = 1. De
esta manera, aplicando el criterio del cociente,
cr r
R = lim = lim =1
r→∞ cr+1 r→∞ a − r
y la serie binomial converge para valores −1 < x < +1. Puede converger además para
x = ±1.
010. El teorema (serie) binomial fue descubierto por Newton en 1665 y descrito en 1676 en cartas
dirigidas a Henry Oldenburg, secretario de la Royal Society, para su trasmisión a Leibniz. El teorema fue
publicado por Wallis en su Algebra de 1685.
7.6. Series de MacLaurin y de Taylor 181
y la serie converge puesto que |y/x| < 1. La ecuación (7.21) puede también escribirse
como
a(a − 1) a−2 2 a(a − 1)(a − 2) a−3 3
(x + y)a = xa + axa−1 y + x y + x y + ··· (7.22)
2! 3!
EJEMPLOS 7.10
1. La serie geométrica:
1 (– 1)(– 2) (– 1)(– 2)(– 3)
= (1 − x)−1 = 1 + (– 1)(– x) + (– x)2 + (– x)3 + · · ·
1−x 2! 3!
= 1 + x + x2 + x3 + · · ·
1
1
1
1
3
1 −2 2 −2 −2 3
2. (1 + x)1/2 = 1 + x+ 2 x + 2 x + ···
2 2! 3!
x x2 x3 5x4
=1+ − + − + ···
2 8 16 128
1
1
3. (8 + x)1/2 = √8 1 + x 1/2 = √8 1 + 1 x
+ 2
−2 x 2
8 2 8
1
1
3 2! 8
−2 −2 x 3
+ 2 + ···
3! 8
√ x x2 x3 5x4
= 8 1+ − + − + ··· .
16 512 8192 524288
Por ejemplo, si x = 1, tomando los cinco primeros términos de la serie,
√ √ 1 1 1 5 √
9 = 8 1+ − + − + · · · ≈ 8 × 1,06065941 ≈ 2,999998 .
16 512 8192 524288
2. Funciones trigonométricas
Las funciones trigonométricas sen x, cos x y tg x tienen derivada continua en x = 0, y
pueden desarrollarse en serie de MacLaurin. Por ejemplo, para la función seno,
f (x) = sen (x), f (x) = cos (x), f (x) = − sen (x), f (x) = − cos (x), . . .
f (0) = 0, f (0) = 1, f (x) = 0, f (x) = −1, . . .
182 Capı́tulo 7. Sucesiones y series
Entonces
x3 x5 x7
sen x = x − + − + ···
3! 5! 7!
Comparándola con la serie exponencial, se demuestra que la serie del seno converge para
todo x.
3. La función logarı́tmica
se comporta bien en x = 0:
f (x) = ln (1 + x) f (0) = 0
1
f (x) = f (0) = 1
1+x
−1
f (x) = f (0) = −1
(1 + x)2
2
f (x) = f (0) = 2
(1 + x)3
−6
f (x) = f (0) = −3!
(1 + x)4
...
x 2 x3 x4
ln (1 + x) = x − + − + ···
2 3 4
La serie converge para |x| < 1. Ası́, cr /cr+1 = −(r + 1)/r → 1 cuando r → ∞, y por el
criterio del cociente (7.17), el radio de convergencia es R = 1. Además, para x = 1, la
serie es la serie armónica alternada (convergente):
1 1 1
ln 2 = 1 − + − + ···
2 3 4
x2 x4 x6
3. cos x = 1 − + − + ··· para todo x
2! 4! 6!
x 3
2x5 17x7 π π
4. tg x = x + + + + ··· − <x<
3 15 315 2 2
x2 x3 x4
5. ln (1 + x) = x − + − + · · · −1 < x ≤ 1
2 3 4
2 3 4
x x x
6. ex = 1 + x + + + + · · · para todo x
2! 3! 4!
x3 x 5 x 7
7. senh x = x + + + + · · · para todo x
3! 5! 7!
x2 x4 x6
8. cosh x = 1 + + + + · · · para todo x.
2! 4! 6!
Series de Taylor11
La serie de MacLaurin, el desarrollo de una función f (x) en torno al punto x = 0, es
un caso especial del desarrollo más general de una función en torno al punto x = a:
x x2 x3
xn
∞
Esta serie de potencias se llama desarrollo en serie de Taylor de la función f (x). Una
expresión alternativa, y equivalente, para la serie es
x 2 x3 x4
ln (1 + x) = x − + − + ··· , −1 < x ≤ 1 .
2 3 4
011. Brook Taylor (1685-1731), secretario de la Royal Society. La serie que lleva su nombre apare-
ció en su Methodus incrementorum (1715), pero ya era conocida por James Gregory.
184 Capı́tulo 7. Sucesiones y series
u1 = x u2 = x − x2 /2 u3 = x − x2 /2 + x3 /3 ln (1 + x) = lim (un )
n→∞
0 0 0 0
0,0001 0,0000 9999 5 0,0000 9999 5000 0,0000 9999 5000
0,001 0,0009 995 0,0009 9950 0333 0,0009 9950 0333
0,01 0,0099 5 0,0099 5033 33 0,0099 5033 08
0,1 0,095 0,0953 333 0,0953 310
0,2 0,18 0,1826 66 0,1823 21
1,0 0,5 0,83 0,69
El teorema de Taylor
Sea f (x) una función continua y univaluada de x con derivadas f (x), f (x), . . . , f (n) (x)
continuas en el intervalo desde a a x, y suponemos que f (n+1) (x) existe en el intervalo.
Entonces
(x − a) (x − a)2 (x − a)n (n)
f (x) = f (a) + f (a) + f (a) + · · · + f (a) + Rn (x) (7.25)
1! 2! n!
donde
(x − a)n+1 (n+1)
Rn (x) = f (b) (7.26)
(n + 1)!
y a < b < x es algún punto del intervalo. El término Rn (x) se llama resto y es el error
que comporta aproximar la función por un polinomio de grado n. Los valores menor y
mayor de Rn (x) son las cotas inferior y superior del error. La serie infinita se obtiene en
el lı́mite n → ∞ si Rn (x) → 0 cuando n → ∞.
7.7. Valores aproximados y lı́mites 185
x2 xn
ex = 1 + x + + ··· + + Rn (x)
2! n!
donde
xn+1
Rn (x) = eb
(n + 1)!
para algún punto 0 < b < x. Cuando x > 0, los valores menor y mayor de Rn vienen dados por
xn+1 xn+1
< Rn (x) < ex .
(n + 1)! (n + 1)!
Entonces
x2 xn xn+1 x2 xn xn+1
1+x+ + ··· + + < ex < 1 + x + + ··· + + ex
2! n! (n + 1)! 2! n! (n + 1)!
Por ejemplo, para x = 0,2 y n = 3 (y redondeando todos los números a seis cifras decimales), la aproxima-
ción cúbica tiene por valor
(0,2)2 (0,2)3
e0,2 ≈ 1 + 0,2 + + = 1,221333
2 6
y las cotas del error son
0,000067 < R3 < 0,000067e0,2
de manera que
1,221333 + 0,000067 < e0,2 < 1,221333 + 0,000067e0,2
La cota inferior es 1,221400. Para la cota superior,
Lı́mites
La serie de MacLaurin muestra el comportamiento de una función cuando la variable
es muy pequeña. Ası́, ln (1 + x) ≈ x cuando x es suficientemente pequeño, de manera
que en las proximidades de x = 0 la función y = ln (1 + x) se puede aproximar por la
recta y = x. De manera similar, cuando x es suficientemente pequeño,
x 3 x5
sen x = x − + − ··· ≈ x,
3! 5!
x2 x4 x2
cos x = 1 − + − ··· ≈ 1 − .
2! 4! 2
186 Capı́tulo 7. Sucesiones y series
Otra manera de expresar los mismos resultados es mediante lı́mites. Ası́ (Figura 7.3)
sen x x2 x4
= 1 − + − ···
x 3! 5!
de manera que en el lı́mite x → 0,
sen x
lim = 1. (7.27)
x→0 x
De manera similar,
1 − cos x 1
lim = . (7.28)
x→0 x 2
2 Figura 7.3
f (x)
lim ,
x→a g(x)
(x − a)2
f (x) f (a) + (x − a)f (a) + f (a) + · · ·
= 2!
g(x) (x − a)2
g(a) + (x − a)g (a) + g (a) + · · ·
2!
Entonces, como f (a) = g(a) = 0,
(x − a)
f (x) f (a) + f (a) + · · ·
= 2!
g(x) (x − a)
g (a) + g (a) + · · ·
2!
y, si g (a) no es cero,
Este método para hallar lı́mites se denomina la regla de l’Hôpital.12 Si g (a) = 0 pero
012. Guillaume François Antoine de l’Hôpital (1661-1704). Noble francés y matemático aficionado,
fue instruido por Johann Bernoulli en el nuevo cálculo. La regla que se le atribuye estaba contenida en una
7.8. Operaciones con series de potencias 187
f (a) = 0 el lı́mite es infinito. Si f (a) y g (a) son ambos cero se repite el proceso y se
obtiene
f (x) f (a)
lim = (7.30)
x→a g(x) g (a)
y ası́ sucesivamente.
Por lo tanto,
x 2 ex x2 (1 + x + · · · )
= 2 → 1 cuando x → 0 .
− 1)
(ex 2 x (1 + x + · · · )
Este ejemplo es importante en mecánica estadı́stica de sólidos. Según la teorı́a de Einstein sobre
capacidades calorı́ficas de sólidos atómicos simples, cada átomo del sólido se supone que vibra con
la misma frecuencia ν. La capacidad calorı́fica molar del sólido es entonces
x 2 ex
Cv = 3R
(ex− 1)2
con x = hν/kT, donde h es la constante de Planck, k la constante de Boltzmann, R la constante
de los gases y T la temperatura. Tomar el lı́mite x → 0 corresponde a hacer T → ∞. Por lo tanto
Cv → 3R.
A(x) = ar x r
y B(x) = br x r
r=0 r=0
carta de Bernoulli en 1694 y apareció en el influyente libro de texto de l’Hôpital sobre cálculo, Analyse des
infiniment petits (1696).
188 Capı́tulo 7. Sucesiones y series
Las series de potencias pueden ser sumadas o restadas término a término para dar
una serie de potencias
(ii) Multiplicación.
donde
cr = ai br−i . (7.32)
i=0
(3x)2 (– 2x)2
e3x × e−2x = 1 + 3x + + · · · 1 + (– 2x) + + ···
2! 2!
(– 2)2 32
= 1 + 1 × (– 2) + 3 × 1 x + 1 × + 3 × (– 2) + × 1 x2 + · · ·
2! 2!
x2
= 1+x+ + · · · = ex .
2!
Una serie de potencias puede ser derivada o integrada término a término dando lugar a
una serie de potencias cuyo radio de convergencia es el mismo que el de la serie original.
7.9. Ejercicios 189
A(x) = ar x r = a0 + a1 x + a 2 x 2 + a3 x 3 + · · ·
r=0
da
dA
∞
∞
ar r+1
A(x) dx = ar xr dx = x +c
r+1
r=0 r=0 (7.34)
a1 a2
= c + a0 x + x 2 + x 3 + · · · ,
2 3
siendo c una constante de integración arbitraria. El radio de convergencia tanto de la
serie derivada como de la integrada es R = RA .
7.9. Ejercicios
Apartado 7.2
Halle (a) el término general y (b) la relación de recurrencia para las sucesiones:
1 1 1
1. 1, 4, 7, 10, . . . 2. 1, 3, 9, 27, . . . 3. 1, − , ,− , ...
5 25 125
Halle los 4 primeros términos de las sucesiones definidas por:
i
1 2
4. ur+1 = ur + , u1 = 0 5. vi = , i = 0, 1, 2, . . .
2 3
1 wn
6. ux = , x = 1, 2, 3, . . . 7. wn+1 = , w1 = 1
x(x + 2) n
190 Capı́tulo 7. Sucesiones y series
Apartado 7.3
Halle la suma de las series finitas:
17. 3 − 2 − 7 − 12 − . . . 18. 1 + 4 + 16 + 64 + . . .
1 1 1
19. 1+ + + + ... 20. x + 3x + 5x + 7x + . . .
3 9 27
21. x3 + x5 + x7 + . . . 22. 1 + 2x + 4x2 + . . .
n
23. Calcule los coeficientes binomiales , r = 0, 1, . . . n, para
r
(i) n = 3 (ii) n = 4 (iii) n = 6
Desarrolle en potencias de x:
24. (1 − x)3 25. (1 + 3x)4 26. (1 − 4x)5 27. (3 − 2x)4 28. (3 + x)6
10
1
29. Halle .
n=1
n(n + 1)
1 1 1 1
30. Compruebe que = − , y pruebe entonces que
r(r + 2) 2 r r+2
n
1 3 1 1 1
= − − .
r=1
r(r + 2) 4 2 n+1 n+2
1
31. Expresando en fracciones simples , demuestre que
r(r + 1)(r + 2)
n
1 1 1
= − .
r=1
r(r + 1)(r + 2) 4 2(n + 1)(n + 2)
n
1
r2 = n(n + 1)(2n + 1) .
r=1
6
33. Desarrolle (1 + r) − r , y use entonces las series de la Tabla 7.1 para demostrar que
6 6
n
1 6 1 5 5 1
r5 = n + n + n4 − n2 .
r=1
6 2 12 12
7.9. Ejercicios 191
Apartado 7.4
34. La función de partición vibracional de un oscilador armónico viene dada por la serie
∞
qv = e−nθv /T ,
n=0
donde θv = hνe /k es la temperatura vibracional. Confirme que la serie es una serie geométrica convergente,
y halle su suma.
Apartado 7.5
Estudie la convergencia de las siguientes series:
∞
1
∞
1
∞
1
∞
sa
35. 36. 37. 38.
r=1
r 2
n=2
ln n k=0
2k + 1 s=0
s!
∞
r+2
∞
mπ
∞
ln r
∞
1
39. 40. sen 41. 42.
r=0
(r + 3)2 m=0
2 r=1
r3 n=2
n ln n
Apartado 7.6
Halle el radio de convergencia para cada una de las siguientes series:
∞
xm
∞
43. 44. (– 1)r x2r 45. nxn
m=0
4m r=0 n=1
∞
xn
∞
∞
(– 1)n (x − 1)2n
46. 47. mm x m 48.
n=1
n2 m=1 n=0
3n
Escriba los 5 primeros términos de la serie de MacLaurin de las siguientes funciones:
1 1
49. (1 + x)1/3 50. 51. (1 − x)−1/2 52.
1 + x2 3+x
2
ln (1 − 2x) + 2x ex − 1
53. sen 2x2 54. e−3x 55. 2
56.
x x
Desarrolle cada una de las siguientes funciones en serie de Taylor en torno al punto indicado, y determine
los valores de x para los cuales la serie converge:
1
57. ,1 58. ex , 2 59. sen (x + 1), −1 60. ln x, 2
x
61. Un cuerpo con masa en reposo m0 y velocidad v tiene una energı́a relativista
m0 c2
E = mc2 =
1 − v2 /c2
∞ n i
pV = nRT Bi (T) ,
i=0
V
donde los Bi se denominan coeficientes del virial. Halle los tres primeros coeficientes para
192 Capı́tulo 7. Sucesiones y series
n2 a
(i) la ecuación de van der Waals, p+ (V − nb) = nRT,
V2
(ii) la ecuación de Dieterici, p(V − nb) = nRTe−an/RTV .
Apartado 7.7
63. (i) Halle el desarrollo de MacLaurin de la función (8 + x)1/3 hasta términos en x4 .
√
(ii) Use ese desarrollo para dar un valor aproximado de 3 9.
(iii)√Use ese valor y el teorema de Taylor para el resto, para acotar superior e inferiormente el valor
de 3 9.
Halle los lı́mites:
ex − 1 tg x − sen x ex + e−x − 2 ln x
64. lim 65. lim 66. lim 67. lim
x→0 x x→0 x3 x→0 cos x − 1 x→1 x2 − 1
68. La densidad de energı́a de la radiación de cuerpo negro a temperatura T viene dada por la fórmula de
Planck
8πhc hc/λkT −1
ρ(λ) = e −1 ,
λ 5
Apartado 7.8
69. Halle el producto de Cauchy para el desarrollo en serie de potencias de sen x y cos x, y demuestre que
es igual a 12 sen 2x.
70. Derive el desarrollo en serie de potencias de sen x y demuestre que el resultado es cos x.
71. Integre la serie de potencias de sen x y demuestre que el resultado es c − cos x, donde c es una
constante.
Números complejos
8.1. Conceptos
i2 = −1 . (8.1)
√
Un número que contiene i = −1 se llama número complejo. Algunos ejemplos son
2i, −3i y 2 + 5i. Un número complejo general tiene la forma (normalmente se usa la
letra z para representar un número complejo)
z = x + iy , (8.2)
01. Las raı́ces cuadradas de números negativos se mencionan en la Ars Magna de Cardano de 1545
en relación con la solución de ecuaciones cuadráticas y cúbicas. Cardano calificó tal resultado de ‘tan sutil
como inútil’. Rafael Bombelli (1526-1572),
√ ingeniero italiano, llamaba ‘più di meno’ (más de menos) y
‘meno di meno’ (menos de menos) a ± −1, y presentó la aritmética de los números complejos en su Alge-
bra de 1572. La primera consideración seria de los números complejos la hizo Albert Girard (1595-1632),
quien en su L’invention nouvelle en l’algèbre (La nueva invención en álgebra), 1629, publicó la primera
formulación del teorema fundamental del álgebra. Decı́a de las soluciones complejas de las ecuaciones que
eran ‘imposibles’ pero ‘buenas por tres cosas: por la certeza de la regla general (el teorema), por el hecho
de que no hay otras soluciones
√ y por
√ su uso’.√Descartes usó
√ los términos ‘real’ e ‘imaginario’. √ Leibniz
factorizó x4 + a4 = (x + a i)(x − a i)(x + a −i)(x − a −i). Euler propuso el sı́mbolo i para −1 en
1777, y Gauss lo adoptó en su Disquisitiones arithmeticae de 1801.
194 Capı́tulo 8. Números complejos
Potencias de i
Cada potencia de i es uno de los números i, −i, 1, −1. Por ejemplo,
1 i i
i3 = i2 × i = −i, i4 = (i2 )2 = 1, i−1 = = 2 = = −i .
i i −1
En general, para los enteros n = 0, ±1, ±2, . . . ,
Igualdad
Dos números complejos son iguales si sus partes reales son iguales y si sus partes
imaginarias son iguales:
z1 = z2 si x1 = x2 e y1 = y2 . (8.6)
Suma
Las partes reales de z1 y de z2 se suman para dar la parte real de la suma, las partes
imaginarias se suman para dar la parte imaginaria de la suma.
8.2. El álgebra de los números complejos 195
Multiplicación
Conjugación
Sea z = x + iy un número complejo arbitrario, el número que se obtiene a partir de él
sustituyendo i por −i es
z∗ = x − iy (8.9)
1 1
(i) (z + z∗ ) = (x + iy) + (x − iy) = x = Re (z) (8.10)
2 2
1 1
(ii) (z − z∗ ) = (x + iy) − (x − iy) = iy = i Im (z) (8.11)
2 2
(iii) zz∗ = (x + iy)(x − iy) = x2 + y2 (real y positivo) (8.12)
División
z1 (x1 + iy1 )
z1 ÷ z2 = = .
z2 (x2 + iy2 )
La división puede hacerse usando las reglas de la división entera. Un método más senci-
llo es utilizar la propiedad (8.12) de los pares conjugados para transformar el denomina-
dor en un número real. Ası́, multiplicando arriba y abajo por z∗2 = x2 − iy2 , el complejo
conjugado del denominador z2 , tenemos
2 + 3i (2 + 3i)(3 − 4i) 18 + i 18 i
1. = = 2 = +
3 + 4i (3 + 4i)(3 − 4i) 3 + 42 25 25
1+i (1 + i)(1 + i) 0 + 2i
2. = = =i
1−i (1 − i)(1 + i) 1+1
02. John Wallis (1616-1703) fue el primero en sugerir que los números imaginarios puros podrı́an
representarse en una recta perpendicular al eje de los números reales. Caspar Wessel (1745-1818), agrimen-
sor noruego, trató la representación gráfica de números complejos en Sobre la representación analı́tica de
la dirección de 1797, y Jean Robert Argand (1768-1822), tenedor de libros suizo, lo hizo en su Essai de
1806. Gauss utilizó la misma interpretación de los números complejos en su cuarta y última demostración
del teorema fundamental del álgebra en 1848, pensando que para entonces los matemáticos estarı́an ya su-
ficientemente acostumbrados a los números complejos como para aceptarla. El plano complejo también se
llama plano gaussiano.
8.3. Representación gráfica 197
Figura 8.1
√
La distancia del punto z al origen, r = x2 + y2 , se llama el módulo de z y se representa
como
Los números complejos con mismo módulo r = |z| están en el cı́rculo de radio r en el
plano. Si |z| = 1, se dice que el punto está en el cı́rculo unidad.
Representación polar
La posición del punto z = x + iy en el plano puede especificarse utilizando las coor-
denadas r y θ, como en la Figura 8.1. En ese caso
x = r cos θ , y = r sen θ ,
θ = arg z . (8.16)
El ángulo puede tener cualquier valor real pero, como vimos en el Capı́tulo 3, las funcio-
nes trigonométricas de (8.15) son funciones periódicas en θ de manera que el número z
no cambia si se añade a θ un múltiplo de 2π. Al transformar de coordenadas cartesianas
a polares se obtiene a partir de x y de y un único valor si utilizamos el convenio dado en
el Apartado 3.4. Ası́, dado que tg θ = y/x,
y
arg z = arctg , si x > 0,
x
y (8.17)
= arctg + π , si x < 0,
x
donde estamos tomando para el arco tangente su valor principal.
198 Capı́tulo 8. Números complejos
z1 + z2 = (x1 + x2 ) + i(y1 + y2 ) .
Figura 8.4
8.3. Representación gráfica 199
Multiplicación y división
entonces
Se deduce que el producto de dos números complejos tiene módulo igual al producto de
los módulos de los números, y tiene argumento igual a la suma de los argumentos:
|z1 z2 | = |z1 | × |z2 |, arg (z1 z2 ) = arg (z1 ) + arg (z2 ) . (8.20)
Figura 8.5
En el caso de la división,
z1 |z1 | z1
= = arg (z1 ) − arg (z2 ) ,
z2 |z2 | , arg
z2
(8.21)
200 Capı́tulo 8. Números complejos
y
z1 r1
= cos (θ1 − θ2 ) + i sen (θ1 − θ2 ) . (8.22)
z2 r2
1 1
= cos (– θ) + i sen (– θ) (8.23)
z r
1 1
= cos (θ) − i sen (θ) . (8.24)
z r
EJEMPLOS 8.6 Exprese cada uno de los números z1 z2 , z1 /z2 y z2 /z1 como un único número complejo,
siendo (véanse los Ejemplos 8.5)
√ π π 4π 4π
z1 = 2 cos + i sen , z2 = cos + i sen .
4 4 3 3
√
Tenemos r1 = 2, r2 = 1, θ1 = π/4 y θ2 = 4π/3. Por lo tanto
√
1. r1 r2 = 2, θ1 + θ2 = 19π/12 y, por la ecuación (8.19),
√ 19π 19π
z1 z2 = r1 r2 (cos (θ1 + θ2 ) + i sen (θ1 + θ2 )) = 2 cos + i sen .
12 12
√
2. r1 /r2 = 2, θ1 − θ2 = −13π/12 y, por la ecuación (8.22),
z1 r1
= cos (θ1 − θ2 ) + i sen (θ1 − θ2 )
z2 r2
√ 13π 13π
= 2 cos − + i sen −
12 12
√ 13π 13π
= 2 cos − i sen .
12 12
Fórmula de De Moivre
Se deduce de las relaciones (8.20) que el producto de tres o más números complejos
tiene módulo igual al producto de los módulos de los números y tiene argumento igual a
la suma de los argumentos. Por ejemplo, para el producto de tres números
arg (z1 z2 z3 ) = arg (z1 z2 ) + arg (z3 ) = arg (z1 ) + arg (z2 ) + arg (z3 ) .
Por lo tanto
z1 z2 z3 = r1 r2 r3 cos (θ1 + θ2 + θ3 ) + i sen (θ1 + θ2 + θ3 )
y, en general,
z1 z2 . . . zn = r1 r2 . . . rn cos (θ1 + θ2 + · · · + θn ) + i sen (θ1 + θ2 + · · · + θn ) . (8.25)
En el caso especial en que todos los números son iguales a z = r(cos θ + i sen θ),
Para un número en el cı́rculo unidad del plano complejo (r = 1), z = cos θ + i sen θ, y
1 1
= = cos (– nθ) + i sen (– nθ) ,
(cos θ + i sen θ)n cos nθ + i sen nθ
de manera que
(cos θ + i sen θ)−n = cos (– nθ) + i sen (– nθ) = cos nθ − i sen nθ . (8.28)
La fórmula de De Moivre puede usarse para obtener muchas de las fórmulas de trigono-
metrı́a (véase el Apartado 3.2). Por ejemplo, la ecuación (8.27) es para n = 2
03. Abraham de Moivre (1668-1754) llegó a Inglaterra en 1688 huyendo de la persecución que su-
frı́an los hugonotes franceses. La primera expresión de la fórmula aparece en un artı́culo de 1707 de las
Philosophical Transactions. De Moivre fue amigo de Newton. En sus últimos años, Newton decı́a a quien
viniera a visitarle con preguntas matemáticas: ‘vaya a ver a Mr. De Moivre, él sabe de esas cosas más que
yo’.
202 Capı́tulo 8. Números complejos
Una única ecuación entre dos números complejos es equivalente a dos ecuaciones entre
números reales: dos números complejos son iguales sólo si las partes reales son iguales
y las partes imaginarias son iguales. Por lo tanto,
De esta misma manera se obtienen fórmulas similares para expresar sen nθ y cos nθ en
función de potencias de sen θ y cos θ para cualquier entero positivo n: la expresión del
primer miembro de la ecuación (8.27) se desarrolla por medio de la fórmula binomial,
ecuación (7.14), y sus partes real e imaginaria se igualan con las correspondientes del
segundo miembro de la ecuación.
Por lo tanto,
cos 5θ = cos5 θ − 10 cos3 θ sen2 θ + 5 cos θ sen4 θ = 16 cos5 θ − 20 cos3 θ + 5 cos θ
sen 5θ = sen5 θ − 10 sen3 θ cos2 θ + 5 sen θ cos4 θ = 16 sen5 θ − 20 sen3 θ + 5 sen θ
con la propiedad
f (z) = z2 + 2z + 1
donde g(x, y) y h(x, y), las partes real e imaginaria de f (z), son funciones reales de x e y.
Las propiedades de f (z) como función de la variable compleja z son más generales que
las propiedades de las funciones reales. Para la mayorı́a de las consideraciones en las
ciencias fı́sicas, sólo una función de este tipo es importante, y la tratamos en el siguiente
apartado.
(iθ)2 (iθ)3
eiθ = 1 + (iθ) + + + ···
2! 3!
θ2 θ4 θ6 θ3 θ5 θ7
= 1 − + − + ··· + i θ − + − + ··· .
2! 4! 6! 3! 5! 7!
04. El primer comentario sobre funciones complejas lo hizo Gauss en una carta a Bessel en 1811,
junto con una descripción de la interpretación geométrica de los números complejos. La teorı́a fue desarro-
llada de manera independiente por Cauchy desde aproximadamente 1814. Cauchy fue el matemático más
prolı́fico del siglo XIX. Apabulló el boletı́n semanal de la Academia de Ciencias de Parı́s, Comptes Rendus,
forzándolo a introducir una regla, todavı́a en uso, que limita las contribuciones a cuatro páginas.
204 Capı́tulo 8. Números complejos
Las partes real e imaginaria de esta función son los desarrollos en serie de las funciones
trigonométricas cos θ y sen θ, respectivamente (véase el Apartado 7.6), de manera que
La pareja de ecuaciones (8.33) y (8.34) puede invertirse para dar la expresión de las
funciones trigonométricas mediante exponenciales:
1 iθ
cos θ = (e + e−iθ ) , (8.35)
2
1 iθ
sen θ = (e − e−iθ ) . (8.36)
2i
De la forma polar de un número complejo, ecuación (8.15), se deduce que todo número
complejo puede escribirse como
z = x + iy = reiθ , (8.37)
1 1
z∗ = x − iy = re−iθ , z−1 = = e−iθ . (8.38)
x + iy r
05. La fórmula, y otras para las funciones logarı́tmica y trigonométricas de z, apareció en la Introduc-
tio de 1748 de Euler.
8.4. Funciones complejas 205
1 1 π π
z−1 = √ e−iπ/4 = √ cos − i sen .
2 2 4 4
Además,
π 1 iπ/4 π 1 iπ/4
cos = e + e−iπ/4 , sen = e − e−iπ/4 .
4 2 4 2i
eiπ = −1 . (8.39)
Esta expresión, que incluye los números trascendentes e y π, la unidad negativa −1 y la unidad imaginaria
i, es probablemente la relación más notable en matemáticas.
Fórmula de De Moivre
Si se sustituye en la fórmula de Euler (8.33) θ por nθ, siendo n un número arbitrario,
el resultado es
Operadores de rotación
z = x + iy = r(cos α + i sen α) ,
eiθ z = z = x + iy = r(cos (θ + α) + i sen (θ + α)) ,
o bien
x = x cos θ − y sen θ ,
(8.41) Figura 8.7
y = x sen θ + y cos θ .
8.6. Periodicidad
ei(θ+2π) = eiθ .
8.6. Periodicidad 207
zk = e(2πk/3)i , k = 0, 1, 2,
de manera que cada uno de ellos es una raı́z cúbica del número 1:
z0 = e0 = 1 ,
√
2π 2π 1 3
z1 = e 2πi/3
= cos + i sen =− + i,
3 3 2 √2
4π 4π 1 3
z2 = e4πi/3 = cos + i sen =− − i.
3 3 2 2
Figura 8.8
208 Capı́tulo 8. Números complejos
zk = e2πki/3 , k = 0, ±1,
o bien
z0 = e0 = 1 ,
√
±πi/3 π π 1 3
z±1 = e = cos ± i sen = ± i,
3 3 2 2
√
2π 2π 1 3
z±2 = e±2πi/3 = cos ± i sen =− ± i,
3 3 2 2
πi Figura 8.9
z3 = e = cos π + i sen π = −1 .
Una función que tiene la misma periodicidad circular que la figura con n puntos equidis-
tantes sobre un cı́rculo es
06. Las n raı́ces de un número complejo fueron tratadas por De Moivre en un artı́culo en la revista
Philosophical Transactions de 1739.
8.6. Periodicidad 209
Figura 8.10
La Figura 8.10 muestra una cadena lineal simple de puntos equidistantes representando,
por ejemplo, una red lineal. Una función de x con la misma periodicidad que la red tiene
que satisfacer la condición de periodicidad
f (x + a) = f (x) . (8.46)
En efecto,
Las funciones como (8.47) son importantes para describir las propiedades de sistemas
periódicos como los cristales. Las funciones se generalizan fácilmente a sistemas pe-
riódicos tridimensionales: la función
2 d2 ψ
− = Eψ , (8.49)
2I dθ2
d2 ψ
= −a2 ψ , (8.50)
dθ2
siendo a2 = 2IE/2 > 0, y se comprueba fácilmente que una solución de esta ecuación
es
donde C es una constante arbitraria (véase el Apartado 12.7 para un tratamiento más
completo). Tenemos
dψ d2 ψ
= iaCeiaθ , = (ia)2 Ceiaθ = −a2 Ceiaθ = −a2 ψ .
dθ dθ2
Para que la solución (8.51) tenga significado fı́sico, y represente la rotación, es necesario
que la función de ondas sea invariante si se sustituye θ por θ + 2π: tiene que satisfacer
la condición de periodicidad
con lo que la condición de periodicidad se satisface si 2πa es un múltiplo de 2π, esto es,
si a = n con n = 0, ±1, ±2, . . . Las soluciones con significado fı́sico de la ecuación de
Schrödinger son por lo tanto
donde se usa el ‘número cuántico’ n para etiquetar las soluciones. Los valores corres-
pondientes de la energı́a E = 2 a2 /2I son
2 n2
E= . (8.54)
2I
Vemos que la cuantización de la energı́a del sistema surge como consecuencia de aplicar
la condición de periodicidad (condición de contorno periódica) a las soluciones. Vemos
además que el conjunto de funciones de onda incluye todas las funciones (8.45) para las
posibles periodicidades en torno a un cı́rculo.
8.7. Cálculo de integrales 211
Por ser cos bx la parte real de eibx , se deduce que la integral I es la parte real de la integral
que se obtiene a partir de I sustituyendo cos bx por eibx :
I = Re e e dx = Re
ax ibx
e(a+ib)x dx .
La integral compleja se evalúa por medio de la regla para integrar una función exponen-
cial. Ası́ (ignorando la constante de integración),
e(a+ib)x eibx
e(a+ib)x dx = = eax
a + ib a + ib
y podemos separar esto en sus partes real e imaginaria:
cos bx + i sen bx
e(a+ib)x
dx = e ax
a + ib
eax
= 2 (a cos bx + b sen bx) + i(a sen bx − b cos bx) .
a + b2
eax (a cos bx + b sen bx)
eax cos bx dx = . (8.55)
a2 + b 2
La parte imaginaria es un regalo:
eax (a sen bx − b cos bx)
eax sen bx dx = . (8.56)
a2 + b 2
212 Capı́tulo 8. Números complejos
8.8. Ejercicios
Apartado 8.2
Escriba como un único número complejo:
Apartado 8.3
Represente como un punto en el plano complejo. Halle entonces el módulo y el argumento:
√ √
17. 1 − i 18. −2 + i 19. 1 − i 3 20. −1 − i/ 2
√
21. 3−i 22. 3 23. 3i 24. 1/i
Exprese en forma polar r( cos θ + i sen θ):
√
25. 2i 26. −3 27. 1−i 28. 3+i
√
29. −6 + 6i 30. −2 − 12i
Exprese cada uno de (i) z1 z2 , (ii) z1 /z2 (iii) z2 /z1 como un único número complejo:
π π π π
31. z1 = 2 cos + i sen , z2 = 3 cos + i sen ,
2 2 3 3
3π 3π 2π 2π
32. z1 = 5 cos + i sen , z2 = cos + i sen .
4 4 3 3
π π
33. Para z = 3 cos + i sen halle (i) z4 , (ii) z−4 .
8 8
34. Use la fórmula de De Moivre para demostrar que
cos 4θ = cos4 θ − 6 cos2 θ sen2 θ + sen4 θ , sen 4θ = 4 sen θ cos θ cos2 θ − sen2 θ .
35. Use la fórmula de De Moivre para desarrollar cos 8x como un polinomio en cos x.
Apartado 8.5
Exprese en forma cartesiana x + iy:
d2 y
+ ω2 y = 0
dx2
donde ω es real.
(i) Demuestre por sustitución que la solución de la ecuación puede escribirse como
y = Aeiωx + Be−iωx ,
y = C cos ωx + D sen ωx .
Halle C y D en función de A y B.
Apartado 8.6
Halle todas las raı́ces y represéntelas en el plano complejo:
√ √ √
51. 4
1 52. i 53. (2 + 2i)1/3 54. 6
−1
Apartado 8.7
Use números complejos para integrar:
∞
∞
55. e−x cos 2x dx 56. e−2x sen3 x dx
0 0
Funciones de varias variables
9.1. Conceptos
Cuando se escribe la ecuación de estado de los gases ideales en la forma
nRT
V = f (p, T, n) =
p
queda implı́cito que, para cualquier estado del sistema, el valor del volumen V (la varia-
ble dependiente) queda determinado por los valores de la presión p, la temperatura T y
la cantidad de materia n (las variables independientes); es decir, V es una función de las
tres variable p, T y n. Las funciones de varias variables se dan a menudo en las ciencias
fı́sicas. Las funciones termodinámicas de estado, como la que acabamos de mencionar,
son un ejemplo de ello y también toda propiedad fı́sica de un sistema cuyos valores de-
pendan de la posición. En el Capı́tulo 5 vimos, por ejemplo, la densidad de masa y la
energı́a potencial como funciones de una única variable, la posición en la recta. Más
generalmente, las funciones de la posición son funciones de las tres coordenadas de un
punto en el espacio ordinario de tres dimensiones.
Sea la variable z una función de dos variables x e y. Por ejemplo, la ecuación
z = x2 − 2xy − 3y2
nos da z como una función particular de x e y. La expresión en el segundo miembro de
la ecuación define la función
f (x, y) = x2 − 2xy − 3y2 (9.1)
cuyo valor para una pareja de valores de x e y se asocia a la variable z. Se dice que las
variables x e y son variables independientes si no hay ninguna relación entre ellas que
haga que el valor de una dependa del valor de la otra.
EJEMPLO 9.1 Los valores de la función (9.1) para (x, y) = (2, 1), (x, y) = (1, 0) y (x, y) = (0, 1) son
f (2, 1) = 22 − 2 × 2 × 1 − 3 × 12 = −3 ,
f (1, 0) = 12 − 2 × 1 × 0 − 3 × 02 = 1 ,
f (0, 1) = 02 − 2 × 0 × 1 − 3 × 12 = −3 .
216 Capı́tulo 9. Funciones de varias variables
Figura 9.1
En la Figura 9.1, Ox, Oy y Oz son tres ejes perpendiculares. La pareja de valores (x, y) es-
pecifica un punto en el plano (horizontal) xy, y el valor de la función se representa por el
punto P con altura z sobre el plano (en el Capı́tulo 10 se tratan los sistemas coordenados
en tres dimensiones). Al moverse el punto (x, y) en el plano xy, el lugar geométrico de los
puntos P corresponde a una superficie. Es decir, el punto P se mueve sobre la superficie,
y la superficie es la representación de la función.
Es posible dibujar bonitas representaciones de funciones de dos variables utilizando
las modernas gráficas por ordenador, pero para funciones de tres o más variables no es
posible hacer tales representaciones fı́sicas completas. En el caso general, una función
de varias variables se visualiza, al menos en parte, fijando el valor de todas las variables
salvo una, y dibujando la correspondiente función de la única variable que queda. Las
Figuras 4.1 y 4.2 son ejemplos de ese tipo de gráficas para el volumen de un gas perfecto,
V = f (p, T, n) = nRT/p. La Figura 4.1 es la gráfica de V como función de T manteniendo
p y n constantes, mientras que la Figura 4.2 es la gráfica de V como función de P a T
y n constantes. A menudo estas sencillas gráficas son la representación más útil de una
función. La Figura 9.2 muestra gráficas de la función (9.1) como función de x para varios
valores de y.
Cada una de esas gráficas es un ‘corte’ de la superficie tridimensional por un plano.
En el caso general, una función de n variables define una ‘superficie’ en un espacio
de (n + 1) dimensiones, y su gráfica como función de una de las variables se obtiene
tomando un corte de esa superficie (n + 1)-dimensional por un ‘plano’.
Figura 9.2
∂z
= 2x − 2y ,
∂x
y se puede derivar con respecto a y, a x constante, y se obtiene la derivada parcial con
respecto a y
∂z
= −2x − 6y .
∂y
∂z
02. La notación ∂x fue utilizada por primera vez por Legendre en 1788, pero sólo empezó a ser
aceptada después de que Jacobi la usase en su teorı́a de los determinantes en 1841.
218 Capı́tulo 9. Funciones de varias variables
Figura 9.3
El plano ABC es paralelo al plano xz, de manera que y = constante en el plano y los
valores de ∂z/∂x para ese valor de y son las pendientes de las rectas tangentes a la curva
APB . De la misma manera, el plano DEF es paralelo al plano z, y los valores de ∂z/∂y
son las pendientes de las rectas tangentes a la curva DPE. Las dos rectas tangentes en
el punto P de la Figura 9.3 representan por lo tanto las tasas de variación de la función
z = f (x, y), con ∂z/∂x para la tasa de variación en la dirección x y ∂z/∂y para la tasa de
variación en la dirección y.
Las dos rectas tangentes en P en la Figura 9.3 definen el plano tangente en P, es decir,
el plano que toca la superficie que representa a la función en el punto P únicamente.
Cualquier otra recta que pasa por P en el plano tangente es entonces una recta tangente
y su pendiente es la derivada de la función en alguna dirección. Esa derivada se puede
expresar mediante las derivadas ‘estándar’ ∂z/∂x y ∂z/∂y.
Figura 9.4
∂z ∂z ∂z
= cos θ + sen θ (9.5)
∂s ∂x ∂y
∂z ∂z
= 3x2 + 4xy + 3y2 , = 2x2 + 6xy + 12y2 .
∂x ∂y
Ambas pueden derivarse con respecto a cada una de las variables y se obtienen cuatro
derivadas segundas. Derivar ∂z/∂x nos da
∂ ∂z ∂2z ∂ ∂z ∂2z
= 2 = 6x + 4y , = = 4x + 6y ,
∂x ∂x ∂x ∂y ∂x ∂y∂x
220 Capı́tulo 9. Funciones de varias variables
∂2z ∂2z
= . (9.6)
∂x∂y ∂y∂x
Otras notaciones
notación La notación anterior se hace inmanejable para derivadas de orden superior,
y se suele utilizar la siguiente representación más compacta:
Con esta notación, la ecuación (9.6) se convierte en fxy = fyx y, por ejemplo, fxxy = fxyx =
fyxx (siempre que se cumplan las pertinentes condiciones de continuidad).
En algunas aplicaciones, en particular en termodinámica, es necesario especificar ex-
plı́citamente qué variable (o combinación de variables) se mantienen constantes. Esto se
hace añadiendo las variables constantes como subı́ndices de la expresión para la derivada
parcial. Por ejemplo, para una función de tres variables f (x, y, z), la expresión
∂f
(9.8)
∂x y, z
∂u ∂u ∂2u ∂3u
= 1, = 2y + 6y2 , = 2 + 12y , = 12 .
∂x ∂y ∂y2 ∂y3
(iii) Las derivadas parciales primeras y segundas de u = sen x cos x + x/y son
∂u 1 ∂u x
= cos x cos y + , = − sen x sen y − 2 ,
∂x y ∂y y
∂2u ∂2u 2x
= − sen x cos y , = − sen x cos y + 3 ,
∂x2 ∂y2 y
∂2u ∂2u 1
= = − cos x sen y − 2 .
∂x∂y ∂y∂x y
∂f ∂f
= =0 en (a, b) , (9.9)
∂x ∂y
o bien fx (a, b) = fy (a, b) = 0. A la vista de la ecuación (9.5), esto es suficiente para que
todas las derivadas primeras de una función continua sean cero en un punto.
y además
Si la cantidad ∆ = fxx fyy − fxy2 es negativa el punto es un punto silla: un máximo en una
dirección y un mı́nimo en la otra. Si ∆ = 0 se necesitan más pruebas para determinar
la naturaleza del punto. Para funciones de más de dos variables, las correspondientes
condiciones son más complicadas.
Tabla 9.1
2 0 12 24 0 >0 mı́nimo
2 4
4 −8 16 <0 punto silla
3 3
2 4
− − −4 8 −16 <0 punto silla
3 3
Optimización condicionada
Se denomina optimización al proceso de hallar los máximos y mı́nimos (los valores
extremos) de una función. En el Ejemplo 9.4 las variables x e y son variables indepen-
dientes, sin restricciones en sus valores. En muchas aplicaciones en las ciencias fı́sicas,
sin embargo, la optimización puede estar sujeta a una o más condiciones o ligaduras: se
trata de la optimización condicionada. Dicho condicionamiento normalmente toma la
forma de una o más relaciones entre las variables.
9.4. Puntos estacionarios 223
con la ligadura x + y = 2.
En ausencia de la ligadura, la función tiene un punto silla en x = y = 0, y no tiene ni máximos ni mı́nimos.
La ligadura es una relación entre las variables x e y que reduce el número de variables independientes a 1.
De esta forma, sustituyendo y = 2 − x en la función se obtiene
F (x) = 2x + 8 = 0 , F (x) = 2 ,
de manera que la función tiene un valor mı́nimo para x = −4. El punto extremo de f (x, y) es por lo tanto un
mı́nimo situado en (x, y) = (– 4, 6), y el valor extremo de la función es f (– 4, 6) = −24.
∂f ∂g ∂f ∂g ∂f ∂g
−λ = 0, −λ = 0, −λ = 0, (9.11)
∂x ∂x ∂y ∂y ∂z ∂z
en los puntos estacionarios. Estas tres ecuaciones, junto con la ligadura, son suficientes
para determinar los valores de los puntos estacionarios y de los correspondientes valores
del multiplicador de Lagrange λ.
EJEMPLO 9.7 Use el método de los multiplicadores de Lagrange para hallar el valor extremo de la
función f (x, y) = 3x2 − 2y2 sujeta a la ligadura x + y = 2 (Ejemplo 9.6).
Tenemos g = x + y y f − λg = 3x2 − 2y2 − λ(x + y), de manera que las tres ecuaciones por resolver son
∂ ∂
(f − λg) = 6x − λ = 0 , (f − λg) = −4y − λ = 0 , g = x + y = 2.
∂x ∂y
La solución es x = −4, y = 6, λ = −24, y f (– 4, 6) = −24 como en el Ejemplo 9.6.
03. Joseph-Louis Lagrange (1736-1813), nacido en Turı́n, hizo importantes contribuciones a muchas
ramas de las matemáticas, y ha sido llamado el más grande de los matemáticos del siglo XVIII (‘Lagrange
es la encumbrada pirámide de las ciencias matemáticas’, Napoleón Bonaparte). Su mayor logro fue el
desarrollo del cálculo variacional, y en su Mécanique analytique de 1788 extendió la mecánica de Newton y
Euler. Señaló que los problemas en mecánica pueden ser generalmente resueltos reduciéndolos a ecuaciones
diferenciales. Lagrange inventó el término ‘función derivada’ y la notación f (x) para la derivada de f (x).
224 Capı́tulo 9. Funciones de varias variables
f (x1 , x2 , x3 , . . . , xn ), (9.12a)
gk (x1 , x2 , x3 , . . . , xn ) = ak , k = 1, 2, 3, . . . , m, (9.12b)
m
φ = f − λ 1 g1 − λ 2 g2 − λ 3 g3 − · · · − λ m gm = f − λk gk (9.13)
k=1
∂φ ∂f ∂gk m
= − λk = 0, i = 1, 2, 3, . . . , n,
∂xi ∂xi k=1
∂xi (9.14)
g k = ak , k = 1, 2, 3, . . . , m,
EJEMPLO 9.8 Halle las dimensiones de la caja rectangular de mayor volumen para una superficie dada.
El volumen de una caja de lados x, y y z es V = xyz y el área de su superficie es A = 2(xy + yz + zx). El
problema es por lo tanto hallar el valor máximo de V sujeto a la ligadura A = constante. Por el método de
los multiplicadores de Lagrange, construimos la función auxiliar φ = V − λA, y resolvemos el conjunto de
ecuaciones
∂φ ∂φ ∂φ
= yz − 2λ(y + z) = 0 , = xz − 2λ(x + z) = 0 , = xy − 2λ(x + y) = 0 .
∂x ∂y ∂z
n
n
f (x1 , x2 , . . . , xn ) = Cij xi xj
i=1 j=1
9.5. El diferencial total 225
sujeta a la ligadura
n
g(x1 , x2 , . . . , xn ) = xi2 = 1 ,
i=1
donde las Cij son constantes (con Cij = Cji ). Por ejemplo, para n = 3,
f (x1 , x2 , x3 ) = C11 x12 + 2C12 x1 x2 + 2C13 x1 x3 + C22 x22 + 2C23 x2 x3 + C33 x32
Derivando con respecto a x1 , x2 y xn , e igualando cada derivada a cero, obtenemos el sistema de ecuaciones
Las ecuaciones de este tipo se llaman a menudo ecuaciones seculares. Se dan, por ejemplo, en el método de
‘combinaciones lineales’ en quı́mica cuántica, cuando la forma cuadrática representa la energı́a del sistema
(o una energı́a orbital en la teorı́a de orbitales moleculares). En los Capı́tulos 17 y 19 tratamos el significado
y la resolución de estos sistemas de ecuaciones.
Figura 9.5
∂z ∂z
= 2ax + by , = bx + 2cy ,
∂x ∂y
Esta expresión es exacta para el presente caso y para toda función cuyas derivadas ter-
ceras y superiores sean cero. Para una función general, (9.15) representa los primeros
términos de un desarrollo de Taylor de la función en el punto (x + ∆x, y + ∆y), en torno
al punto (x, y) (compárese con la ecuación (7.23) para una función de una variable).
Si ∆x y ∆y son suficientemente pequeños, los términos cuadráticos en ∆ son pe-
queños comparados con los términos lineales, y un valor aproximado de ∆z es
∂z ∂z
∆z ≈ ∆x + ∆y . (9.16)
∂x y ∂y x
Este resultado, válido para cualquier función continua de dos variables, muestra que
cuando las variaciones ∆x y ∆y son suficientemente pequeñas, la variación total de z
9.5. El diferencial total 227
como el caso lı́mite de (9.16). Esta cantidad se denomina el diferencial total de z con
respecto a x e y.4
El concepto del diferencial total se generaliza fácilmente a funciones con cualquier
número de variables. Para una función de n variables
z = f (x1 , x2 , . . . , xn )
el diferencial total es
n
∂z ∂z ∂z ∂z
dz = dx1 + dx2 + · · · + dxn = dxi , (9.18)
∂x1 y ∂x2 y ∂xn y i=1
∂xi y
donde, por ejemplo, ∂z/∂x1 es la derivada parcial con respecto a la variable x1 , mante-
niendo todas las demás variables x2 , x3 , . . . , xn constantes.
2. u = (x2 + y2 + z2 )1/2
∂u x ∂u y ∂u z
= x(x2 + y2 + z2 )−1/2 = , = , = ,
∂x u ∂y u ∂z u
∂u ∂u ∂u 1
du = dx + dy + dz = (x dx + y dy + z dz) .
∂x y, z ∂y z, x ∂z x, y u
3. x = r sen θ cos φ
∂x ∂x ∂x
= sen θ cos φ , = r cos θ cos φ , = −r sen θ sen φ ,
∂r ∂θ ∂φ
04. El diferencial total y la igualdad de las derivadas segundas cruzadas fueron descubiertos en 1719
por Nicolaus (II) Bernoulli (1687-1759). Sobrino de Johann (I) y de Jakob (o Jean y Jacques), no hay que
confundirlo con Nicolaus (I), su padre, ni con Nicolaus (III) hijo de Johann (I) y hermano de Daniel y de
Johan (II). Fue Daniel Bernoulli (1700-1782) quien escribió la Hydrodynamica de 1738 que contiene el
concepto del ‘Teorema de Bernoulli’ y un desarrollo de la teorı́a cinética de los gases.
228 Capı́tulo 9. Funciones de varias variables
∂x ∂x ∂x
dx = dr + dθ + dφ
∂r θ, φ ∂θ r, φ ∂φ r, θ
= αV dT − κV dp + Vm dn ,
siendo
1 ∂V
α= la expansividad térmica (coeficiente de expansión térmica,)
V ∂T p, n
1 ∂V
κ=− la compresibilidad isotérmica,
V ∂p T, n
∂V
Vm = el volumen molar.
∂n p, T
Una de las principales aplicaciones del diferencial total en las ciencias fı́sicas es en la
formulación de las leyes de la termodinámica (véanse los Ejemplo 9.22 y 9.27). En los
apartados que siguen utilizaremos (9.16) y su forma lı́mite (9.17) para deducir una serie
de propiedades diferenciales e integrales de las funciones.
Entonces z = f (x(t), y(t)) es esencialmente una función de una única variable t, y existe
su derivada ordinaria dz/dt. Esta derivada, también llamada la derivada total de f con
respecto a t, puede obtenerse directamente sustituyendo las funciones x(t) e y(t) en las
variables de f (x, y) y derivando la función de t resultante. También puede obtenerse,
indirectamente, dividiendo la expresión (9.16) por ∆t y tomando el lı́mite ∆t → 0. De
esta manera, dividir
∂z ∂z
∆z ≈ ∆x + ∆y (9.16)
∂x y ∂y x
9.6. Algunas propiedades diferenciales 229
por ∆t nos da
∆z ∂z ∆x ∂z ∆y
≈ + (9.20)
∆t ∂x y ∆t ∂y x ∆t
y en el lı́mite ∆t → 0,
dz ∂z dx ∂z dy
= + . (9.21)
dt ∂x y dt ∂y x dt
Vemos que si x = x(t), esta derivada total con respecto a x se relaciona con la derivada
total con respecto a t (9.21) mediante la regla de la cadena:
dz dz dx ∂z dx ∂z dy dx
= = + (9.24)
dt dx dt ∂x y dt ∂y x dx dt
dy dx dy
y = .
dx dt dt
EJEMPLO 9.14 Dada z = x2 + y3 , donde y = 1/x, halle dz/dx. Si x = et , halle entonces dz/dt.
dy 1
1. Por la ecuación (9.23), ya que = − 2 = −y2 ,
dx x
dz ∂z ∂z dy
= + = 2x + (3y2 ) × (– y2 ) = 2x − 3y4 .
dx ∂x ∂y dx
dx
2. Si x = et , entonces = et = x, y
dt
dz dz dx
= = 2x2 − 3xy4 .
dt dx dt
Esto es idéntico al resultado del Ejemplo 9.12, ya que x = 1/y.
Figura 9.6
El mismo resultado se obtiene directamente a partir del diferencial total (9.17) consi-
derando variaciones infinitesimales dx y dy tales que dz = 0:
∂z ∂z
dz = 0 = dx + dy .
∂x y ∂y x
y ésta es la pendiente de la gráfica de la función y(x) para la cual z es constante, esto es,
la pendiente de la curva ab en el plano xy de la Figura 9.6 para la cual AB es una curva
de nivel. Además, como
∂z ∂x
=1 (9.28)
∂x y ∂z y
232 Capı́tulo 9. Funciones de varias variables
EJEMPLOS 9.15
∂y
(i) Dada z = x2 y3 , halle .
∂x z
∂z ∂z
= 2xy3 , = 3x2 y3 ,
∂x y ∂y x
∂y ∂z ∂z 2xy3 2y
Por la ecuación (9.27), =− =− 2 2 =− .
∂x z ∂x y ∂y x 3x y 3x
∂y
(ii) Para r = (x2 + y2 )1/2 , halle .
∂x r
∂r x ∂r y ∂y x
= , = y =− .
∂x r ∂y r ∂x r y
La superficie que representa la función r = (x2 + y2 )1/2 es un cono vertical cuyas curvas de nivel
(r = constante) son cı́rculos de radio r paralelos al plano xy. La cantidad −x/y es la pendiente en
(x, y) sobre el cı́rculo.
(iii) El diferencial de volumen de un fluido es (véase el Ejemplo 9.11)
∂V ∂V
dV = dT + dp (para una cantidad fija n).
∂T p ∂p T
∂V ∂p ∂T
Por la ecuación (9.29), −1 = ,
∂p T ∂T V ∂V p
∂p ∂V ∂V α expansividad
de manera que =− = = .
∂T V ∂T p ∂p T κ compresibilidad
9.6. Algunas propiedades diferenciales 233
Esta ecuación muestra cómo la derivada parcial con respecto a x a y constante está re-
lacionada con la derivada parcial con respecto a x cuando cierta función (u) de x e y se
mantiene constante.
EJEMPLO 9.16 Sea z = f (x, y) y sea u = x2 + y2 , que es la ecuación de un cı́rculo de radio a cuando
u = a2 = constante. Entonces por la ecuación (9.27),
∂y ∂u ∂u x
=− =− ,
∂x u ∂x y ∂y x y
y, por lo tanto, por la ecuación (9.30),
∂z ∂z x ∂z
= − .
∂x u ∂x y y ∂y x
∂z
Si, por ejemplo, z = xy, entonces = y − x2 /y. Este resultado está relacionado con el del Ejemplo
∂x u
dx
9.13. Cuando x2 + y2 = a2 , x = a cos θ y = −y, de manera que por la regla de la cadena
dθ
dz ∂z dx ∂z
= = −y = x 2 − y2 .
dθ ∂x u dθ ∂x u
Sean las variables x e y funciones ellas mismas de otras dos variables independientes u
y v:
La relación entre las derivadas parciales de (9.32) y las de (9.17) puede obtenerse de la
siguiente manera. Dividimos el diferencial total (9.17) por du a v constante para obtener
la ecuación (9.33a), y por dv a u constante para obtener (9.33b):
∂z ∂z ∂x ∂z ∂y
= + ,
∂u v ∂x y ∂u v ∂y x ∂u v (9.33a)
∂z ∂z ∂x ∂z ∂y
= + .
∂v u ∂x y ∂v u ∂y x ∂v u (9.33b)
La primera de éstas es idéntica a la ecuación (9.5) y tiene la misma interpretación gráfica. La segunda
es idéntica al resultado obtenido en el Ejemplo 9.13 para el desplazamiento alrededor de un cı́rculo. Las
relaciones inversas son, por las ecuaciones (9.34),
∂z ∂z ∂r ∂z ∂θ ∂z sen θ ∂z
= + = cos θ − ,
∂x y ∂r θ ∂x y ∂θ r ∂x y ∂r θ r ∂θ r
(9.36)
∂z ∂z ∂r ∂z ∂θ ∂z cos θ ∂z
= + = sen θ + .
∂y x ∂r θ ∂y x ∂θ r ∂y x ∂r θ r ∂θ r
9.6. Algunas propiedades diferenciales 235
∂2f ∂2f
+ = 0, (9.37)
∂x2 ∂y2
El operador diferencial ∂2 ∂2
∇2 = +
∂x2 ∂y2
(9.38)
∂2 1∂ 1 ∂2
= 2+ + 2 2
∂r r ∂r r ∂θ
(que se lee como ‘laplaciano’ o ‘nabla cuadrado’) se denomina operador laplaciano (si
bien tanto el sı́mbolo como el nombre se suelen reservar a la forma tridimensional; véase
el Capı́tulo 10). La ecuación de Laplace es entonces
∇2 f = 0 (9.39)
05. Pierre Simon de Laplace (1749-1827). Su Traité de mécanique céleste (Tratado de mecánica ce-
leste) en 5 volúmenes (1799-1825) marcó la culminación del enfoque newtoniano de la gravitación. Cuenta
la leyenda que mientras estaba en la École Militaire, donde enseñaba matemáticas elementales a los cadetes,
examinó, y aprobó, a Napoleón en 1785.
236 Capı́tulo 9. Funciones de varias variables
De manera similar
∂2f ∂2f cos2 θ ∂f cos2 θ ∂ 2 f 2 sen θ cos θ 1 ∂f ∂2f
= sen2 θ 2 + + − − .
∂y 2 ∂r r ∂r r2 ∂θ 2 r r ∂θ ∂r∂θ
Por lo tanto
∂2f ∂2f ∂2f 1 ∂f 1 ∂2f
+ 2 = 2 + + 2 2.
∂x 2 ∂y ∂r r ∂r r ∂θ
1. En coordenadas cartesianas,
∂f ∂2f ∂f ∂2f
= 2x , = 2; = −2y , = −2 .
∂x ∂x2 ∂y ∂y2
∂2f ∂2f
Por lo tanto, + 2 = 0.
∂x 2 ∂y
2. En coordenadas polares, f = r2 ( cos2 θ − sen2 θ) = r2 cos 2θ,
∂f 2f ∂2f 2f
= 2r cos 2θ = , = 2 cos 2θ = 2 ,
∂r r ∂r2 r
∂f ∂2f
= −2r2 sen 2θ , = −4r2 cos 2θ = −4f .
∂θ ∂θ 2
∂2f 1 ∂f 1 ∂2f 2f 2f 4f
Por lo tanto, + + 2 = 2 + 2 − 2 = 0.
∂r 2 r ∂r r ∂θ 2 r r r
9.7. Diferenciales exactos 237
EJEMPLO 9.20 Demuestre que la función f = ln r, con r = x2 + y2 , cumple la ecuación de Laplace.
Como la función depende únicamente de r, ∂f /∂θ = 0, y las derivadas con respecto a r son derivadas
totales:
d2 f 1 df
∇2 f (r) = 2 + .
dr r dr
Tenemos df /dr = 1/r y d f /dr = −1/r . Por lo tanto ∇ f
2 2 2 2
= 0.
Este ejemplo es importante porque es posible demostrar que la única solución de la ecuación de Laplace
en dos dimensiones que depende únicamente de r = x2 + y2 tiene la forma general f = a ln r + b. Esta
función aparece en la teorı́a del potencial en dos dimensiones.
dU = T dS − p dV , (9.40)
F dx + G dy (9.43)
∂z ∂z
F dx + G dy = dz = dx + dy . (9.45)
∂x y ∂y x
La condición para que el diferencial en dos variables sea exacto es que las funciones F
y G satisfagan
∂F ∂G
= . (9.46)
∂y x ∂x y
Por las igualdades (9.44), cada una de esas derivadas parciales es igual a la derivada cru-
zada segunda de z, ∂ 2 x/∂x∂y. La condición (9.46) se llama a veces relación de recipro-
cidad de Euler, y se usa en termodinámica para obtener varias relaciones, llamadas las
relaciones de Maxwell, entre las propiedades termodinámicas (véase el Ejemplo 9.22).6
El significado de la exactitud lo analizamos en el siguiente apartado.
de modo que
∂T ∂p
=− .
∂V S ∂S V
Ésta es una de las cuatro relaciones de Maxwell importantes en termodinámica. Las otras tres se obtienen
de los diferenciales de la entalpı́a H = U + pV, de la función de Helmholtz (energı́a libre) A = U − TS,
06. Clairaut utilizó en 1739 la igualdad entre las derivadas parciales segundas cruzadas para analizar
la exactitud de un diferencial (y también Euler hacia la misma época). Alexis Claude Clairaut (1713-1765)
fue miembro de una familia de 20 hermanos, de los cuales sólo uno sobrevivió al padre. Presentó un trabajo
sobre geometrı́a en la Académie des Sciences con 13 años de edad, y fue admitido como miembro con 18
años (un hermano menor, conocido como ‘le cadet Clairaut’, publicó un libro de cálculo en 1731 con 15
años de edad, y murió de viruela un año después). Sus Recherches sur les courbes à double courbure (In-
vestigaciones sobre curvas de doble curvatura) de 1731 marcaron el principio del desarrollo de la geometrı́a
cartesiana en tres dimensiones.
9.8. Integrales de lı́nea 239
y de la función de Gibbs (energı́a libre) G = H − TS. Para la entalpı́a, por ejemplo (y usando (9.40) para
dU),
dH = dU + pdV + Vdp = TdS + Vdp .
La cantidad dH es el diferencial total de H como función de S y p, de modo que
∂H ∂H
T= , V= ,
∂S p ∂p S
De manera similar,
∂S ∂p
dA = −SdT − pdV −→ = ,
∂V T ∂T V
∂S ∂V
dG = −SdT + Vdp −→ = .
∂p T ∂T p
f (x) dx . (9.47)
a
Figura 9.7
Una integral de lı́nea se puede convertir en una integral ordinaria de la siguiente ma-
nera. Vimos en el Apartado 5.4, sobre la integral como una longitud, que para cantidades
infinitesimales
2 1/2
dy
ds = 1 + dx . (9.50)
dx
EJEMPLO 9.23 Integre la función f (x, y) = xy sobre la curva y = x2 /2 desde el punto (x, y) = (0, 0)
hasta el punto (1, 1/2).
07. Maxwell empleó el concepto y la notación de la integral de lı́nea en sus estudios sobre los cam-
pos eléctricos en 1855. James Clerk Maxwell (1831-1879), nacido en Edimburgo, está al mismo nivel que
Newton y Einstein en las teorı́as fı́sicas precuánticas. Basándose en el trabajo de Michael Faraday, Max-
well presentó sus ecuaciones de campo en su Dynamical theory of the electromagnetic field en 1864. La
Dynamical theory of gases de 1859 describe la distribución de Maxwell, con aplicaciones a la teorı́a de la
viscosidad, la conducción del calor y la difusión de los gases.
La notación para la integral de lı́nea apareció en un texto de fı́sica de Charles Delauney (1816-1872) en
1856 para el trabajo realizado a lo largo de una curva, y se adoptó rápidamente en fı́sica.
9.8. Integrales de lı́nea 241
Esto puede convertirse en una integral ordinaria sobre una de las dos variables si se
conoce la ecuación de la curva C. Por ejemplo, para una curva y = f (x) desde x = a
dy
hasta x = b, sustituyendo dy por dx en (9.52) tenemos
dx
b
dy
I= F(x, y) + G(x, y) dx . (9.53)
a dx
EJEMPLO 9.24 Halle el valor de la integral de lı́nea (9.52) si F = −y, G = xy y C es la recta de la Figura
9.8 de A a B (x = 1 a x = 0).
La ecuación de la recta es y = 1 − x. Entonces dy = −dx y por la ecuación
(9.53)
0
−y dx + xy dy = − (1 − x) − x(1 − x) dx
C 1
1
2
= (1 − x2 ) dx = .
0 3
Figura 9.8
En general, el valor de una integral de lı́nea depende del camino de integración entre sus
puntos extremos. Esto queda de manifiesto en el siguiente ejemplo.
242 Capı́tulo 9. Funciones de varias variables
EJEMPLO 9.25 Halle el valor de la integral de lı́nea (9.52) cuando F y G son como en el Ejemplo 9.24,
pero C es ahora el arco de cı́rculo que se muestra en la Figura 9.9.
√
La ecuación del arco de cı́rculo es y = + 1 − x2 . Entonces dy =
−x x
√ dx = − dx y
1 − x2 y
0
π 1
I= −y dx + xy dy = − 1 − x2 − x2 dx = +
C 1 4 3
1
(véase el Ejemplo 6.10 para la integral 1 − x2 dx). Este resultado es dis-
0 Figura 9.9
tinto del obtenido en el Ejemplo 9.24.
Las integrales de lı́nea son importantes en varias ramas de las ciencias fı́sicas. Por ejem-
plo, cuando se generalizan a curvas en tres dimensiones, proporcionan un método de
calcular el trabajo efectuado por una fuerza a lo largo de un camino arbitrario en el es-
pacio ordinario. Volveremos a este tema en el Capı́tulo 16. La dependencia de la integral
de lı́nea con el camino puede entenderse, por ejemplo, en función del trabajo efectuado
sobre un cuerpo al moverse desde A a B a lo largo del camino. Del estudio sobre traba-
jo y energı́a potencial del Apartado 5.7, cabe esperar que el trabajo efectuado dependa
del camino si las fuerzas que actúan sobre el cuerpo son fuerzas no conservativas, por
ejemplo cuando el trabajo se hace oponiéndose a la fricción. En particular, se efectúa un
trabajo neto al mover el cuerpo a lo largo de una curva cerrada. Por otra parte, si las
fuerzas son conservativas y se pueden derivar de una función de energı́a potencial, como
en la ecuación (5.57) del Apartado 5.7, entonces el trabajo es independiente del camino,
y no se efectúa trabajo neto en una curva cerrada. En el presente caso general, el valor
de una integral de lı́nea es independiente del camino entre dos puntos fijos si la cantidad
entre corchetes de la ecuación (9.52) es un diferencial exacto.8 Si es ası́, según el estudio
del Apartado 9.7, existe una función z(x, y) tal que
∂z ∂z
F(x, y)dx + G(x, y)dy = dz = dx + dy (9.55)
∂x y ∂y x
Entonces, como en la Figura 9.10, tenemos que para un camino desde A en (x1 , y1 ) hasta
B en (x2 , y2 )
B
I = dz = z = z(x2 , y2 ) − z(x1 , y1 ) (9.57)
C A
08. Esta independencia del camino para la integral de lı́nea de un diferencial exacto fue observada
por Riemann en 1857.
9.8. Integrales de lı́nea 243
y esto sólo depende de los valores de z en los extremos (vemos que el valor de la integral
cambia de signo si se cambia el sentido de la integración desde B a A).
Figura 9.10
es exacto e igual al diferencial total de z = ax2 + bxy + cy2 + d. Consideremos los dos caminos desde A
hasta B que se muestran en la Figura 9.10: el camino C y el camino C1 + C2 .
(i) El camino C es el segmento con ecuaciones paramétricas
x = x1 + (x2 − x1 )t , y = y1 + (y2 − y1 )t , t = 0 → 1.
Se deduce a partir del diferencial de entalpı́a dH = TdS + Vdp (Ejemplo 9.22) que
∂H ∂S
=T = Cp ,
∂T p ∂T p
dividiendo dH por dT a p constante. Por otra parte, la relación de Maxwell que se obtiene del diferencial de
la función de Gibbs es
∂S ∂V
=− = −αV .
∂p T ∂T p
Por lo tanto,
T2 p2
Cp
∆S1→3 = dT (en p = p1 ), ∆S3→2 = − αV dp (en T = T2 ).
T1 T p1
Se demuestra fácilmente que para una función continua como la función cuadrática
del ejemplo 9.26, la integral de lı́nea alrededor de una curva cerrada es cero. Hay que
señalar, sin embargo, que este resultado es válido en general únicamente si el diferencial
Fdx + Gdy es exacto en todos los puntos de la curva y del interior de la curva cerrada.
Consideraciones adicionales sobre este punto quedan fuera del propósito de este libro.
EJEMPLO 9.28 Integre f (x, y) = 2xy + 3y2 con respecto a x en el intervalo a ≤ x ≤ b, y con respecto a
y en el intervalo c ≤ y ≤ d.
b
1. (2xy + 3y2 ) dx = [x2 y + 3y2 x]ba = y(b2 − a2 ) + 3y2 (b − a) .
a
d
2. (2xy + 3y2 ) dy = [xy2 + y3 ]dc = x(d2 − c2 ) + (d3 − c3 ) .
c
Esto se denomina integral doble y se calcula integrando primero con respecto a una
variable y luego con respecto a la otra. El valor de la integral no depende del orden
en el cual se haga la integración si la función es continua dentro de los intervalos de
integración, pero hay que tener cierto cuidado si hay discontinuidades.
I= f (x, y, z) dx dy dz
e c a
el convenio es que la integración ha de hacerse de dentro hacia afuera, siendo (a, b) los
lı́mites para x, (c, d) para y, y (e, f ) para z:
f d
b
I= f (x, y, z) dx dy dz .
e c a
Figura 9.12
d b
n
m
f (x, y) dx dy = lim
→∞ m
f (xr , ys )∆xr ∆ys (9.59)
c a n→∞
s=1 r=1
donde vr es la suma de los elementos para una franja vertical y luego se suman todas las
franjas verticales, o como
n m
n
donde hs es la suma de los elementos para una franja horizontal y luego se suman todas
las franjas horizontales. Esos dos órdenes de la suma corresponden a los dos órdenes de
integración de (9.58).
Ası́ como la integral de una variable se interpretó en el Apartado 5.4 como el área
bajo la curva, la integral doble puede interpretarse como el ‘volumen bajo la superficie’,
es decir, el volumen entre la superficie que representa a la función f (x, y) y el plano xy.9
De manera alternativa, la integral doble puede ser interpretada como una propiedad de la
región rectangular del plano xy. Por ejemplo, si f (x, y) es la densidad de masa superficial,
el diferencial de masa en el elemento de área dA = dx dy es dm = f (x, y)dA y la masa
total es
d b
M = f (x, y) dA = f (x, y) dx dy , (9.62)
R c a
donde R representa la integración sobre la región (rectangular). En el caso particular
f (x, y) = 1, la integral es el área del rectángulo:
d b b d
dA = dx dy = dx dy = (b − a)(d − c) .
R c a a c
En general, no es necesario que la región del plano xy sea rectangular. Sea f (x, y) continua
en el interior y en la frontera de una región R del plano xy.
La forma de la integral en la región depende de como se defina la frontera. En la
Figura 9.13a la frontera se compone de dos partes: y = g(x) ‘por debajo’ de los puntos
extremos x = a y x = b, e y = h(x) ‘por encima’ de esos puntos. El interior de R es
entonces
Figura 9.13
1 x
I = 0
(1 + 2xy) dy dx
x2
1 1
= 0
[y + xy2 ]xx2 dx = 0 [x + x3 − x2 − x5 ] dx
= 1
4
.
Figura 9.14
9.11. Cambio de variables 249
√
(ii) utilizando la ecuación (9.63b) con p(y) = y y q(y) = y,
1 √
y
I = (1 + 2xy) dx dy
0 y
1 √
y
1
√ 1
= [x + x2 y]y dy = [ y + y2 − y − y3 ] dy = .
0 0 4
El área de la región R es
1 x 1
1
A= dy dx = (x − x2 ) dx = .
0 x2 0 6
dx
x = x(u) , dx = du ,
du
de manera que
b u(b)
dx
f (x) dx = f (x(u)) du .
a u(a) du
Los cambios de variable son incluso más importantes para integrales dobles (y múltiples)
porque tanto la función como la frontera de la región pueden ser fuentes de dificultades si
se expresan en variables inadecuadas. Consideremos por ejemplo la integral de f (x, y) =
/
e−(x +y ) en una región circular (Figura 9.15).
2 2 1 2
Figura 9.15
En este ejemplo, tanto la función como la frontera se expresan de manera más sencilla
mediante coordenadas polares (r, θ). En efecto,
x = r cos θ , y = r sen θ .
1
∆A = r∆r∆θ + (∆r)2 ∆θ
2 Figura 9.16
I= e r dr dθ =
−r
dθ × e−r r dr = 2π[1 − e−a (a + 1)] .
0 0 0 0
2
EJEMPLO 9.31 Evalúe la integral de f (r, θ) = e−r sen2 θ, (i) en el área de un cı́rculo de radio a y (ii) en
todo el plano.
2π a
2 2
(i) e−r sen2 θ dA = e−r sen2 θ r dr dθ .
R 0 0
Por ser la integral el producto de una función de r y de una de θ
2 2
e−r sen2 θ r = (e−r r)( sen2 θ) ,
y por ser los lı́mites de integración constantes, la integral doble se puede factorizar:
a 2π
2
I= e−r r dr × sen2 θ dθ .
0 0
Como sen θ =
2 1
2
(1 − cos 2θ), tenemos
2π 2π
1 1 1
sen2 θ dθ = (1 − cos 2θ) dθ = [θ − sen 2θ]2π
0 = π,
0 2 0 2 2
π 2
Por lo tanto I = (1 − e−a ) .
2
2π ∞
2 π
(ii) Tomando a → ∞, e−r sen2 θ r dr dθ = .
0 0 2
Caso general
El paso de coordenadas cartesianas a polares es un caso particular de transformación
de variables (o de coordenadas). Es también el más importante en la práctica, y aquı́ sólo
daremos una escueta presentación del caso general. Sean
funciones continuas y derivables de las variables u y v, de manera que a cada punto (x, y)
de una región R del plano xy le corresponde un único punto (u, v) en la correspondiente
región R∗ del plano uv. Entonces
f (x, y) dx dy = f x(u, v), y(u, v) |J| du dv , (9.67)
R R∗
∂(x, y) ∂x ∂y ∂x ∂y
J= = − . (9.68)
∂(u, v) ∂u ∂v ∂v ∂u
∂x ∂y ∂x ∂y
J= − = r cos2 θ + r sen2 θ = r
∂r ∂θ ∂θ ∂r
y dA = dxdy → dA = r dr dθ, como obtuvimos por consideraciones geométricas a partir
de la Figura 9.16. El jacobiano se emplea en la formulación avanzada de la termodinámi-
ca para los cambios de variables termodinámicas. El método puede generalizarse a tres
variables o más.
∞
e−x dx
2
La integral
0
En el Ejemplo 6.16 del Apartado 6.5 se dijo que esta integral no se podı́a evaluar con
los métodos descritos en los Capı́tulos 5 y 6. Sin embargo, se puede evaluar utilizando un
‘truco’ que implica el paso de una integral doble de coordenadas cartesianas a polares.11
010. Carl Gustav Jacobi (1804-1851), nacido en Berlı́n, trató las cantidades llamadas jacobianos en
su De determinantibus functionalibus (Sobre determinantes funcionales) de 1841. El cambio de variables
en una integral doble fue dado por Euler para el caso general en 1769.
011. De Moivre calculó la integral por vez primera en 1733. Laplace, siguiendo a Euler, utilizó en
1774 el método que describimos aquı́.
252 Capı́tulo 9. Funciones de varias variables
Tenemos que
∞ ∞
1
I= −x2
dx = e−x dx
2
e
0 2 −∞
por ser el integrando una función par de x (véase el Apartado 5.3). Además
1 ∞ −y
I=
2
e dy ,
2 −∞
ya que el valor de una integral definida no depende del sı́mbolo que se emplee como
variable de integración. Por lo tanto
∞
1 ∞ −x 1 ∞ ∞ −(x +y )
I = e dy =
−y
2 2 2 2
2
e dx e dx dy
4 −∞ −∞ 4 −∞ −∞
y la integral doble es sobre todo el plano xy. Transformando a coordenadas polares tene-
mos entonces
∞
1 2π ∞ −r 1 2π π
I2 = e r dr dθ = e−r r dr = .
2 2
dθ
4 0 0 4 0 0 4
Por lo tanto
∞ √
π
−x2
e dx = . (9.69)
0 2
9.12. Ejercicios
Apartado 9.2
1. Halle el valor de la función f (x, y) = 2x2 + 3xy − y2 + 2x − 3y + 4 para
(i) (x, y) = (0, 1) (ii) (x, y) = (2, 0) (iii) (x, y) = (3, 2).
Apartado 9.3
∂z ∂z
Halle y :
∂x ∂y
Apartado 9.4
Halle los puntos estacionarios, y su naturaleza, para las siguientes funciones:
(i) Halle el punto estacionario que corresponde a cada uno de los valores de λ (suponga que z es positivo).
(ii) Demuestre que los tres valores estacionarios de la función E son iguales a los correspondientes valores
de λ.
(Este es el problema de Hückel para el radical alilo, CH2 CHCH2 . Véase también el Ejemplo 17.9.)
254 Capı́tulo 9. Funciones de varias variables
Apartado 9.5
Halle el diferencial total df :
1
26. f (x, y) = x2 + y2 27. f (x, y, z) =
x2 + y2 + z2
28. f (r, θ, φ) = r sen θ sen φ
Apartado 9.6
dz
29. Dada z = x2 + 2xy + 3y2 , con x = (1 + t)1/2 e y = (1 − t)1/2 , halle
dt
(i) por sustitución, (ii) por la regla de la cadena (9.21).
du
30. Dada u = ln (x + y + z), con x = a cos t, y = b sen t y z = ct, halle .
dt
df
31. Dada f = sen (u + v), con v = cos u, halle .
du
∂y
32. Si z = x5 y − sen y, halle .
∂x z
∂p
33. Halle para un gas de van der Waals
∂T V, n
∂V ∂V
(i) a partir de las expresiones para y obtenidas en el Ejercicio 18,
∂T p, n ∂p T, n
(ii) directamente a partir de la ecuación de van der Waals.
∂z
34. Si z = x2 + y2 y u = xy, halle (i) por sustitución (ii) por la ecuación (9.30).
∂y u
∂z
35. Sean z = x sen y y u = x + 2xy + 3y , halle
2 2
.
∂y u
36. Si U = U(V, T) y p = p(V, T) son funciones of V y T, y si H = U + pV, demuestre que
∂H ∂U ∂U ∂V
− = +p .
∂T p ∂T V ∂V T ∂T p
∂x ∂y
37. Si x = un + vn e y = un − vn , donde n es una constante arbitraria, halle y .
∂u v ∂v u
∂u ∂v
Expresando un y vn en función de x e y, halle y , y demuestre que
∂x y ∂y x
∂x ∂u 1 ∂y ∂v
= = .
∂u v ∂x y 2 ∂v u ∂y x
∂f ∂f
38. Si x = au + bv e y = bu − av, siendo a y b constantes, y f es una función de x e y, exprese y
∂u ∂v
∂f ∂f
en función de y . Demuestre entonces que
∂x ∂y
Demuestre que las siguientes funciones de la posición en un plano cumplen la ecuación de Laplace:
B
39. x5 − 10x3 y2 + 5xy4 40. Ar + eiθ 41. rn cos nθ, n = 1, 2, 3 . . .
r
9.12. Ejercicios 255
Apartado 9.7
Estudie la exactitud:
Apartado 9.8
46. Evalúe la integral de lı́nea [xy dx + 2y dy] desde x = 0 hasta x = 2
C
(i) sobre la recta y = 2x (ii) sobre la curva y = x2 .
47. Demuestre que Fdx + Gdy, con F = 9x2 + 4y2 + 4xy y G = 8xy + 2x2 + 3y2 , es un diferencial
exacto. Escogiendo un camino adecuado, evalúe la integral [F dx + G dy] desde (x, y) = (0, 0) hasta
C
(1, 2). Demuestre que el resultado es consistente con que el diferencial sea el diferencial total de z(x, y) =
3x3 + 4xy2 + 2x2 y + y3 .
Evalúe la integral.
Apartado 9.11
Transforme a coordenadas polares y evalúe:
1 √1−x2 ∞ ∞ 3
e−2(x )
2 +y2 1/2
54. x2 + 2xy dy dx 55. x 2 + y2 dx dy
0 0 −∞ −∞
∞ ∞
e−(x +y2 ) 2
2
56. x dx dy
0 0
Funciones en tres dimensiones
10.1. Conceptos
Una función de tres variables, f (x, y, z), en la cual las variables son las coordenadas
de un punto en el espacio ordinario tridimensional, se denomina función de posición,
función del punto o campo. Un gran número de cantidades fı́sicas se describen median-
te estas funciones. Por ejemplo, la distribución de masas en un cuerpo se describe por
la densidad de masa (volumétrica), que es una función de posición. La temperatura en
cada punto de un cuerpo define un campo de temperaturas y la velocidad de cada punto
de una masa de fluido en movimiento es una función vectorial de posición, un campo
de velocidades (véase el Capı́tulo 16). Los campos eléctricos y magnéticos son funcio-
nes de posición vectoriales, las funciones de onda atómicas y moleculares son funciones
escalares de posición.
Cuando escribimos una función de posición en la forma f (x, y, z) estamos suponiendo
que se trata de una función de las coordenadas cartesianas de un punto.1 Sin embargo,
el valor de una función en un punto no puede depender del sistema de coordenadas que
se use en concreto para especificar su posición. Vimos en el Capı́tulo 9 para puntos en
un plano que una función y la región donde está definida pueden a veces (de hecho, a
menudo) expresarse de manera mucho más sencilla usando coordenadas distintas de las
cartesianas. Las coordenadas más importantes y más ampliamente utilizadas, aparte de
las cartesianas, son las coordenadas esféricas. Las presentamos en el Apartado 10.2. En
01. La geometrı́a analı́tica en tres dimensiones tiene su origen en las Recherches de Clairaut de 1731,
en las cuales dio x2 + y2 + z2 = a2 como la ecuación de una esfera de radio a, y en el segundo volumen de
la Introductio de Euler de 1748. La teorı́a sistemática fue desarrollada por Monge en artı́culos desde 1771
y en dos influyentes libros que escribió para sus alumnos de la École Polytechnique. Gaspar Monge (1746-
1818), hijo de Jacques Monge, buhonero y afilador que valoraba la educación, desarrolló una ‘geometrı́a
descriptiva’ que constituyó la base del dibujo moderno en ingenierı́a. El método fue considerado secreto
militar durante un tiempo y publicado en 1799 en el libro de texto Géométrie descriptive. Monge fue el pri-
mer Director de la École Polytechnique fundada en 1794 por la convención Nacional de la Revolución para
adiestrar ingenieros y cientı́ficos (que demostrasen ‘un amor constante a la libertad, la igualdad y el odio a
los tiranos’). La École se convirtió en un modelo universitario en toda Europa y Estados Unidos. Algunos de
los profesores de la École fueron Laplace, Lagrange y Sylvestre François Lacroix (1765-1843), cuyo libro
de texto de cálculo fue traducido al inglés en 1816 y contribuyó (junto con otros textos de la École) a intro-
ducir los métodos europeos en Inglaterra y los Estados Unidos. En el libro de texto Application de l’analyse
à la géométrie, 1807, Monge trató la geometrı́a analı́tica en dos y tres dimensiones. Demostró cómo las
coordenadas de un punto se determinan por las perpendiculares a tres planos coordenados.
258 Capı́tulo 10. Funciones en tres dimensiones
el Apartado 10.3 tratamos las funciones de posición y en 10.4 las integrales de volumen.
El operador laplaciano, tan importante en las ciencias fı́sicas, lo tratamos en el Apartado
10.5. En todos estos apartados nos limitamos al uso de sistemas de coordenadas carte-
sianas y esféricas. El sistema de coordenadas general es el tema del Apartado 10.6. En
los Capı́tulos 16, 18 y 19, tratamos el uso de vectores y matrices para describir sistemas
y procesos en tres dimensiones.
A partir del sistema cartesiano se definen normalmente otros sistemas coordenados. En la Figura 10.2 se
muestra el sistema de coordenadas esféricas. La distancia r del punto al origen se llama coordenada radial.
Sus valores posibles van desde 0 a +∞. El ángulo θ, la colatitud, es el ángulo entre la recta radial OP y
el eje z. Sus valores posibles van de 0 a π. En este contexto, el eje z se llama eje polar. El ángulo φ, la
longitud, es el ángulo entre el eje x y la recta OQ, proyección de OP sobre el plano xy. Sus valores posibles
van de 0 a 2π. Los cambios en φ describen giros en torno al eje polar. Las coordenadas esféricas y las
cartesianas se relacionan mediante las ecuaciones
x = r sen θ cos φ , y = r sen θ sen φ , z = r cos θ . (10.1)
Al igual que para las coordenadas polares en el plano (Apartado 3.3), convertir las coordenadas esféricas a
cartesianas es inmediato.
EJEMPLO 10.1 Halle las coordenadas cartesianas del punto cuyas coordenadas esféricas son (r, θ, φ) =
(2, π/6, π/4).
√
x = r sen θ cos φ = 2 sen (π/6) cos (π/4) = 1/ 2 ,
√
y = r sen θ sen φ = 2 sen (π/6) sen (π/4) = 1/ 2 ,
√
z = r cos θ = 2 cos (π/6) = 3 .
10.3. Funciones de posición 259
La conversión de coordenadas cartesianas a coordenadas esféricas se hace mediante las siguientes relacio-
nes: ⎧
z ⎨ arctg xy si x > 0,
r = x + y + z , θ = arccos
2 2 2 2
, φ= y (10.2)
r ⎩ arctg + π si x < 0,
x
donde se toman los valores principales para las funciones inversas (véase el Apartado 3.4).
EJEMPLO 10.2 Halle las coordenadas esféricas del punto (x, y, z) = (– 1, 2, −3).
√
r2 = x2 + y2 + z2 = 14, 14 , r=
√
θ = arccos (z/r) = arccos (– 3/ 14) ≈ 143,3◦ ,
T = f (xP , yP , zP ) .
El campo de temperaturas se describe por lo tanto igual de bien usando la función g(r, θ, φ) =
= r2 ( cos2 θ − sen2 θ) tal que, en cualquier punto de V,
T = f (x, y, z) = g(r, θ, φ) .
En este ejemplo, el paso de coordenadas cartesianas a coordenadas esféricas ha supuesto dos simplificacio-
nes en la representación del campo. La primera: mientras que T depende de las tres coordenadas cartesianas,
x, y y z, sólo depende de dos coordenadas esféricas, r y θ; esto es, el campo es independiente del valor del
ángulo φ, y tiene por lo tanto simetrı́a cilı́ndrica en torno al eje polar (z). La segunda simplificación es
que las variables de la función g han sido separadas, es decir, la función g(r, θ) ha sido factorizada como
el producto de una función de r y una función de θ. Estas simplificaciones son importantes para evaluar
integrales múltiples y para resolver ecuaciones en derivadas parciales.
260 Capı́tulo 10. Funciones en tres dimensiones
Funciones de densidad
Consideremos la distribución de masa en un cuerpo tridimensional (véase el Apartado 5.6 para una
distribución lineal de masa). Sea P un punto cualquiera del cuerpo, y sea ∆m la masa de un volumen ∆v
alrededor del punto P, como se muestra en la Figura 10.4. El cociente ∆m/∆v es la masa por unidad de
volumen, o densidad de masa promedio, en ∆v. Si la masa no está distribuida de manera uniforme por todo
el cuerpo, el valor de este cociente depende no sólo de la posición del volumen ∆v sino también del tamaño
y forma de ∆v. A medida que las dimensiones del volumen se reducen a cero, ∆v → 0, el cociente se
acerca al lı́mite ∆m
ρ = lim , (10.3)
∆v→0 ∆v
Figura 10.4
En el Apartado 10.4 tratamos estas integrales triples, o integrales de volumen, en las tres
coordenadas del espacio.
La idea de densidad se aplica a cualquier propiedad distribuida en una región. Un
ejemplo importante es la densidad de probabilidad de una distribución en teorı́a de pro-
babilidades y en estadı́stica, que tratamos en el Capı́tulo 21. Las densidades de probabi-
lidad se usan también en mecánica cuántica para interpretar las funciones de onda y para
el cálculo de las propiedades de átomos y moléculas.
La función radial R(r) determina el tamaño del orbital y el movimiento radial (‘de adentro hacia afuera’) del
electrón en el orbital. Las funciones angulares Θ(θ) y Φ(φ) determinan la forma del orbital y el movimiento
angular del electrón (su momento angular). Veremos estas funciones con más detalle en el Capı́tulo 14.
10.4. Integrales de volumen 261
1
ψ1s = e−r/a0
πa30
1
ψ2s = (2 − r/a0 )e−r/2a0
4 2πa30
1
ψ2px = re−r/2a0 sen θ cos φ
4 2πa50
1
ψ2py = re−r/2a0 sen θ sen φ
4 2πa50
1
ψ2pz = re−r/2a0 cos θ
4 2πa50
La interpretación fı́sica de un orbital se hace usando la densidad de probabilidad electrónica: para un elec-
trón en el orbital ψ, la cantidad
|ψ(r, θ, φ)|2 dv (10.6)
se interpreta como la probabilidad de hallar el electrón en el elemento de volumen dv en la posición (r, θ, φ).
El módulo cuadrado, |ψ|2 = ψψ ∗ , se utiliza porque las funciones de onda son en general funciones com-
plejas. La probabilidad de hallar el electrón en una región V es entonces la integral de volumen V |ψ|2 dv.
donde V es una región en el espacio xyz. Cuando las variables son las coordenadas de
un punto en el espacio ordinario la integral se llama a menudo integral de volumen. Si
los lı́mites de integración de (10.7) son constantes, la región V es una caja rectangular
de lados x2 − x1 , y2 − y1 , z2 − z1 .
EJEMPLO 10.4 Evalúe la integral de la función f (x, y, z) = 1 + xyz en la caja rectangular de lados a, b, c
que se muestra en la Figura 10.5.
La integral (10.7) es
f (x, y, z) dv = dv + xyz dv .
V V V
Tenemos entonces
c b a a b c
(i) dv = dx dy dz = dx dy dz
V 0 0 0 0 0 0
= a×b×c=V.
Figura 10.5
262 Capı́tulo 10. Funciones en tres dimensiones
c b a a b z
(ii) xyz dv = xyz dx dy dz = x dx y dy z dz .
V 0 0 0 0 0 0
La factorización de la integral tripe es posible porque el integrando es el producto de tres funciones, una en
cada variable, y los lı́mites son constantes (véase el Ejemplo 9.31). Con esto
a2 b2 c2 V2
xyz dv = × × = .
V 2 2 2 8
Coordenadas esféricas
La integral de volumen en coordenadas esféricas es
f (r, θ, φ) dv =
φ θ r
V
2 2 2
dv = r2 sen θ dr dθ dφ . (10.9)
∆v ≈ r2 sen θ ∆r ∆θ ∆φ , (10.10)
EJEMPLO 10.5 Halle el volumen ∆v de la Figura 10.6 y demuestre que se reduce a la expresión aproxi-
mada (10.10) para valores pequeños de los ∆.
1
= [r2 ∆r + r(∆r)2 + (∆r)3 ][ cos θ − cos (θ + ∆θ)]∆φ .
3
Hay que señalar que esto no supone una demostración de (10.9) puesto que el elemento de volumen se
utiliza para la construcción de la integral de volumen.
EJEMPLO 10.6 Evalúe la integral de la función f (r, θ, φ) = 1 + r2 cos2 θ sen2 φ en la esfera de radio a y
centro en el origen.
Estas integrales son importantes, por ejemplo, en quı́mica cuántica para calcular propie-
dades atómicas y moleculares a partir de funciones de onda obtenidas como soluciones
de la ecuación de Schrödinger. Por ejemplo, la integral en todo el espacio de la densidad
de probabilidad electrónica del orbital 1s del átomo de hidrógeno, ψ1s2 = (1/πa30 )e−2r/a 0
1
= e−2r/a 2
r dr sen θ dθ dφ .
0
πa30 0 0 0
sen θ dθ dφ = 4π (10.13)
0 0
es
∞el ángulo sólido completo en torno a un punto. Entonces, utilizando la integral estándar
e−ar rn dr = n!/an+1 ,
0
1 2
ψ1s2 dv = × × 4π = 1 .
πa0 (2/a0 )3
3
Valores promedio
Veremos en el Capı́tulo 21 que, si x es una variable continua en el intervalo a ≤ x ≤ b
y si p(x) dx es la probabilidad de que la variable tome valores entre x y x + dx, la cantidad
b
f̄ = f (x)p(x) dx (10.14)
a
10.5. El operador laplaciano 265
EJEMPLO 10.7 Halle la distancia promedio del electrón al núcleo para (i) el orbital 1s y (ii) para el
orbital 2pz del átomo de hidrógeno (véase la Tabla 10.1 del Ejemplo 10.3).
Para ambos casos, f (r, θ, φ) = r en la ecuación (10.17), y
r̄ = r|ψ|2 dv .
1 −2r/a0
(i) ψ1s
2
= e ,
πa30
2π π ∞
1
r̄1s = e−2r/a0 r3 sen θ dr dθ dφ
πa30 0 0 0
1
(ii) ψ2p
2
= r2 e−r/a0 cos2 θ,
z
32πa50
∞ π 2π
1 5 −r/a0
r̄2pz = r e dr cos 2
θ sen θ dθ dφ
32πa50 0 0 0
1 2
= × 5! a60 × × 2π = 5a0 .
32πa50 3
266 Capı́tulo 10. Funciones en tres dimensiones
en coordenadas esféricas:
1 ∂ 2 ∂ 1 ∂ ∂ 1 ∂2
∇2 = r + sen θ + 2
r ∂r
2
∂r r sen θ ∂θ
2
∂θ r sen θ ∂φ2
2 (10.19a)
∂2 2 ∂ 1 ∂2 cos θ ∂ 1 ∂2
= + + + + .
∂r2 r ∂r r2 ∂θ2 r2 sen θ ∂θ r2 sen2 θ ∂φ2 (10.19b)
1 ∂ 2 ∂f 1 2 ∂2f ∂f ∂ 2 f 2 ∂f
r = r + 2r = 2+ . (10.20)
r2 ∂r ∂r r2 ∂r2 ∂r ∂r r ∂r
El operador laplaciano aparece en ecuaciones del movimiento relacionadas con la pro-
pagación de ondas y la teorı́a del potencial tanto en mecánica clásica (por ejemplo en las
ecuaciones de Maxwell del electromagnetismo) como en mecánica cuántica (por ejem-
plo en la mecánica ondulatoria de Schrödinger, véase el Capı́tulo 14).
EJEMPLO 10.8 Evalúe ∇2 f para f = e−r (i) en coordenadas esféricas y (ii) en coordenadas cartesianas.
EJEMPLO 10.10 Demuestre que la función f = 1/r cumple la ecuación de Laplace en tres dimensiones.
La ecuación de Laplace es
∇2 f = 0 .
Como ocurrı́a en el Ejemplo 10.8, la función no depende de los ángulos θ y φ, por lo tanto
d2 f 2 df
∇2 f = + .
dr2 r dr
d2 f 2 df 2 2
+ = 3 − 3 =0 (r = 0) .
dr2 r dr r r
Esta demostración no es válida si r = 0, y este punto singular necesita un tratamiento especial en las
aplicaciones fı́sicas.
Este ejemplo muestra que las funciones potenciales gravitacional y de Coulomb cumplen la ecuación
de Laplace (véase el Ejemplo 9.20 para el caso bidimensional).
02. Las coordenadas curvilı́neas ortogonales fueron introducidas por Lamé en su trabajo Sur les coor-
données curvilignes et leurs diverses applications. Gabriel Lamé (1795-1870), ingeniero y profesor en la
École Polytechnique, hizo contribuciones a la teorı́a de la elasticidad de los sólidos y participó en la cons-
trucción de los primeros ferrocarriles en Francia.
10.6. Otros sistemas de coordenadas 269
Figura 10.7
donde
2
2
2
∂x ∂y ∂z
h =
2
+ + . (10.24)
i
∂qi ∂qi ∂qi
270 Capı́tulo 10. Funciones en tres dimensiones
cartesianas: hx = hy = hz = 1,
esféricas: hr = 1, hθ = r, hφ = r sen θ.
Coordenadas cilı́ndricas
Estas coordenadas son las coordenadas polares en el plano
xy más la coordenada z, son útiles para describir sistemas
con simetrı́a cilı́ndrica.
x = ρ cos φ, y = ρ sen φ, z = z,
ρ = 0 → ∞, φ = 0 → 2π, z = −∞ → +∞,
hρ = 1, hφ = ρ, hz = 1,
dv = ρ dρ dφ dz,
Figura 10.8
1 ∂ ∂ 1 ∂ 2
∂ 2
∇2 = ρ + + 2.
ρ ∂ρ ∂ρ ρ ∂φ
2 2
∂z
ξ = 1 → ∞, η = −1 → +1, φ = 0 → 2π,
ξ2 − η2 ξ2 − η2
hξ = a , hη = a , hφ = a (ξ 2 − 1)(1 − η 2 ),
ξ2 − 1 1 − η2
dv = a3 (ξ 2 − η 2 ) dξ dη dφ,
1 ∂ ∂ ∂ ∂ (ξ 2 − η 2 ) ∂2
∇ = 2 2
2
(ξ − 1)
2
+ (1 − η )
2
+ 2 .
a (ξ − η 2 ) ∂ξ ∂ξ ∂η ∂η (ξ − 1)(1 − η 2 ) ∂φ2
Figura 10.9
10.7. Ejercicios
Apartado 10.2
Halle las coordenadas cartesianas (x, y, z) de los puntos cuyas coordenadas esféricas son:
1. (r, θ, φ) = (1, 0, 0) 2. (r, θ, φ) = (2, π/2, π/2) 3. (r, θ, φ) = (2, 2π/3, 3π/4)
Apartado 10.3
Transforme a coordenadas esféricas:
1/2 x 2 + y2
10. x2 + y2 + z2 11. x 2 − y2 12. 13. 2z2 − x2 − y2
z2
Apartado 10.4
Halle la masa total de una distribución de masa con densidad ρ en una región V del espacio:
14. ρ = x2 + y2 + z2 , V: el cubo 0 ≤ x ≤ 1, 0 ≤ y ≤ 1, 0 ≤ z ≤ 1.
15. ρ = xy z , 2 3
V: la caja 0 ≤ x ≤ a, 0 ≤ y ≤ b, 0 ≤ z ≤ c.
16. ρ = y2 , V: la región 0 ≤ x ≤ 1, 1 − x ≤ y ≤ 1, 0 ≤ z ≤ 2.
−(x+y+z)
17. ρ=e , V: la región infinita x ≥ 0, y ≥ 0, z ≥ 0.
18. ρ=x +y +z ,
2 2 2
V: la esfera de radio a y centro en el origen.
sen θ cos φ
2 2
19. ρ= , V: la esfera de radio a y centro en el origen.
r
20. ρ = r3 e−r V: todo el espacio.
1
El orbital 2s del átomo de hidrógeno es ψ2s = (2 − r/a0 )e−r/2a0 :
4 2πa30
El orbital 3pz del átomo de hidrógeno es ψ3pz = C(6 − r)re−r/3 cos θ (en unidades atómicas) donde C es
una constante:
Apartado 10.5
Halle ∇2 para las siguientes funciones:
e−r
25. f = x2 y3 z4 26. rn e−ar 27. 28. e−r/3 sen θ sen φ 29. xze−r/2
r
Demuestre que las siguientes funciones cumplen la ecuación de Laplace:
cos 2φ
30. 2x3 − 3x(y2 + z2 ) 31. 32. rn senn θ cos nφ, n = 1, 2, 3 . . .
r2 sen2 θ
2f f
33. Si f = (2 − r)e−r/2 demuestre que ∇2 f + = .
r 4
6f 9f
34. Si f = ze−3r/2 demuestre que ∇2 f + = .
r 4
6f
35. Si f = xye−r demuestre que ∇2 f + = f.
r
ear
36. Demuestre que f (r) = , siendo a un número cualquiera, cumple ∇2 f = a2 f .
r
10.7. Ejercicios 273
∂2 ∂2 ∂2 1 ∂2
2
= + 2 + 2 − 2 2,
∂x 2 ∂y ∂z c ∂t
donde x, y, z son coordenadas, t es el tiempo y c es la velocidad de la luz. Demuestre que si la función
f (x, y, z) cumple la ecuación de Laplace, entonces la función g(x, y, z, t) = f (x, y, z)eikct cumple la ecuación
2
g = k2 g.
Apartado 10.6
39. Integre la función f = y2 z3 en la región cilı́ndrica de radio a, entre z = 0 y z = 1, simétrica en torno
al eje z.
rA + rB ra − rB
Use coordenadas elı́pticas confocales, ξ = ,η = , φ, para integrar las siguientes funciones
R R
en todo el espacio:
e−(rA +rB )
40. e−(rA +rB ) 41. cos2 φ
ra
Ecuaciones diferenciales de primer
orden
11.1. Conceptos
Una ecuación diferencial es una ecuación que contiene derivadas. Por ejemplo, si y es
una función de x, entonces una ecuación que contiene únicamente y y x es una ecuación
ordinaria, pero una ecuación que también contiene una o más derivadas dy/dx, d 2 y/dx2 , o
derivadas de orden superior es una ecuación diferencial. Algunos ejemplo de ecuaciones
diferenciales que se usan en las ciencias fı́sicas son
dx
1. = kx proceso cinético de primer orden
dt
dx
2. = k(a − x)(b − x) proceso cinético de segundo orden
dt
d2 h
3. = −g cuerpo que cae bajo la acción de la gravedad
dt2
d2 x
4. = −ωx2 oscilador armónico clásico
dt2
−2 d2 ψ 1 2
5. + kx ψ = Eψ ecuación de ondas para el oscilador armónico
2m dx2 2
Los cinco ejemplos describen procesos fı́sicos.1 Las ecuaciones 1 y 2 se usan para des-
cribir algunos procesos cinéticos sencillos en fı́sica y quı́mica, y también en biologı́a,
ingenierı́a, economı́a y ciencias sociales. Las ecuaciones 3, 4 y 5 son ecuaciones del
movimiento. En todas ellas la función incógnita es una función de una única variable, x(t)
en 1, 2 y 4, h(t) en 3, ψ(x) en 5. Las derivadas son derivadas ordinarias y las ecuaciones
son ecuaciones diferenciales ordinarias. En el Capı́tulo 14 tratamos las ecuaciones en
derivadas parciales.
01. Tanto Newton como Leibniz reconocieron que los problemas fı́sicos pueden formularse mediante
ecuaciones diferenciales, y la resolución de problemas fı́sicos proporcionó gran parte de la motivación para
el desarrollo posterior del cálculo en el siglo XVIII.
276 Capı́tulo 11. Ecuaciones diferenciales de primer orden
dy
= 2x (11.2)
dx
tiene como solución
y = x2 + c , (11.3)
siendo c una constante arbitraria, ya que d(x2 + c)/dx = 2x. La ecuación diferencial
se resuelve haciendo una integración (indefinida). Ası́, integrando ambos miembros de
(11.2) con respecto a x tenemos
dy
dx = 2x dx ; y = x2 + c . (11.4)
dx
la solución general representa toda una familia de posibles situaciones fı́sicas, y escoger
una solución particular viene determinado por la naturaleza y el estado del sistema.
x(t) = ae−kt ,
donde a es la constante arbitraria. En este caso, la constante se determina por la cantidad de materia en un
instante de tiempo cualquiera. Ası́, si x = x0 es la cantidad de materia en el instante t = 0, tenemos
x(0) = x0 = a
y
x(t) = x0 e−kt
es la solución particular para ese valor de x0 . Vemos que la aplicación de una condición inicial especifica el
significado de la constante arbitraria al igual que su valor, y es un paso necesario para resolver un problema
fı́sico.
En el caso de una ecuación de segundo orden, con una derivada segunda, son necesa-
rias dos integraciones para eliminar la derivada segunda, de manera que aparecen dos
constantes arbitrarias (constantes de integración) en la solución general. Por ejemplo, la
ecuación de segundo orden
d2 y
=2 (11.5)
dx2
se integra una primera vez para dar
dy
= 2x + a (11.6)
dx
y una segunda vez para dar
y = x2 + ax + b . (11.7)
Ésta es la solución general y son necesarias dos condiciones para especificar las cons-
tantes. La solución general de una ecuación diferencial de orden n tiene n constantes
arbitrarias.*
0* Algunas ecuaciones diferenciales no tienen solución general, otras tienen únicamente una o más
soluciones particulares, y finalmente otras tienen solución general más algunas soluciones particulares que
no se obtienen a partir de la solución general. Estos caso no se suelen presentar a menudo en las ciencias
fı́sicas.
278 Capı́tulo 11. Ecuaciones diferenciales de primer orden
Sea h la altura del cuerpo en el instante t. La fuerza (dirigida hacia abajo) que actúa sobre el cuerpo es
F = −mg de manera que, por la segunda ley de Newton, F = md2 h/dt2 ,
d2 h
= −g .
dt2
1
h(t) = − gt2 + at + b ,
2
siendo a y b constantes arbitrarias. La solución particular viene dada en este caso por las condiciones
iniciales del sistema, la altura h0 y la velocidad v0 en el instante t = 0. Entonces, h(0) = h0 = b y, como la
velocidad viene dada por
dh
v(t) = = −gt + a ,
dt
la velocidad inicial es v0 = v(0) = a. La solución particular que satisface las condiciones iniciales h(0) = h0
y v(0) = v0 es por lo tanto
1
h(t) = − gt2 + v0 t + h0 .
2
Todas las ecuaciones diferenciales pueden resolverse por los métodos numéricos pre-
sentados en el Capı́tulo 20. Hay sin embargo varios tipos estándar importantes cuyas
soluciones se expresan mediante funciones elementales y que aparecen frecuentemente
en los modelos matemáticos de los sistemas fı́sicos. Son estos tipos estándar los que
tratamos en este capı́tulo y en los siguientes.
La ecuación diferencial general de primer orden tiene la forma
dy
= F(x, y) , (11.8)
dx
donde F(x, y) es una función de x e y, siendo y una función de x. Llamamos problema
de valor inicial a una de estas ecuaciones diferenciales junto con una condición inicial,
y(x0 ) = y0 (y = y0 cuando x = x0 ). Tratamos aquı́ dos tipos especiales importantes
de ecuaciones que pueden resolverse por métodos elementales: ecuaciones separables y
ecuaciones lineales.
dy f (x)
= (11.9)
dx g(y)
11.3. Ecuaciones separables 279
con todos los términos en los que aparece y en un miembro de la ecuación, y todos los
términos en los que aparece x en el otro. De esta ecuación se dice que es una ecuación
diferencial separable y se resuelve por integración (indefinida) de ambos miembros con
respecto a la variable relevante:
g(y) dy = f (x) dx + c (11.11)
con la constante arbitraria en uno de los dos miembros. De manera más formal, escri-
biendo (11.9) como
dy
g(y) = f (x) (11.12)
dx
la integración con respecto a x nos da
dy
g(y) dx = f (x) dx + c (11.13)
dx
02. Mucha de la formulación de Leibniz del cálculo implicaba ecuaciones con diferenciales (ecua-
ciones diferenciales). El método de separación de variables y el método de reducción de una ecuación
homogénea a forma separable que tratamos en este apartado, fueron inventados por Leibniz en 1691.
280 Capı́tulo 11. Ecuaciones diferenciales de primer orden
dy
(ii) = ky, y(x0 ) = y0 .
dx
Separando variables e integrando tenemos
dy dy
= k dx , =k dx ,
y y
ln y = kx + c .
Una forma alternativa de presentar la solución general se obtiene tomando la exponencial de cada
miembro:
eln y = ekx+c , y = ec ekx = aekx
(utilizando que eln y = y), y siendo ahora a la constante arbitraria. Por la condición inicial, y = y0
cuando x = x0 , tenemos
y(x0 ) = y0 = aekx0
de manera que a = y0 e−kx0 , y la solución particular es
y(x) = y0 ek(x−x0 ) .
dy 1
(iii) + 3x2 y2 = 0, y(1) = .
dx 2
Separando variables e integrando tenemos
dy dy 1
− = 3x2 dx , − =3 x2 dx , = x3 + c ,
y2 y2 y
y la solución general es
1
y(x) = .
x3 + c
1
Por la condición inicial, y = cuando x = 1,
2
1 1
y(1) = =
1+c 2
1
y(x) = .
x3 + 1
x2 + y2 y y y
F(x, y) = = +1 =f .
xy x x x
Entonces
y
λy
F(λx, λy) = f =f = F(x, y) . (11.15)
λx x
La ecuación diferencial
dy y
= F(x, y) = f (11.16)
dx x
se convierte en separable mediante el cambio v = y/x. Tenemos
dy d(xv) dv
= = v + x = f (v) (11.17)
dx dx dx
de manera que, separando las variables x y v,
dv dx
= (11.18)
f (v) − v x
y la solución de la ecuación es
dv
= ln x + c . (11.19)
f (v) − v
Una ecuación de este tipo se llama a menudo ecuación homogénea porque una función
del tipo (11.14) es una función homogénea. En general, una función de una o más
variables es una función homogénea de grado n si
y2
= ln x + c .
2x2
El resultado puede verificarse mediante derivación implı́cita:
2
d y d y dy y2 1
= ( ln x + c) , − = ,
dx 2x2 dx x2 dx x3 x
y
dy x2 1 y2 x y x 2 + y2
= + 3 = + = .
dx y x x y x xy
aA + bB + · · · = pP + qQ + · · · (11.21)
2H2 + O2 = 2H2 O
significa que dos moléculas de hidrógeno reaccionan con una molécula de oxı́geno para
dar dos moléculas de agua.
En termodinámica y en cinética, una reacción quı́mica se escribe en general como
0= νB B , (11.22)
B
donde el sumatorio es sobre todas las especies presentes, tanto reactivos como produc-
tos, y los νB , llamados coeficientes estequiométricos, son los números a, b, p, q, . . . en
(11.21), pero con un cambio de signo en los reactivos. En esta forma la ecuación (11.21)
es
0 = −aA − bB + pP + qQ + · · ·
= ν A A + νB B + νP P + νQ Q + · · ·
Velocidad de reacción
Sea nA0 la cantidad inicial de la especie A en el instante t = 0 y sea nA la cantidad en
el instante t. La ‘cantidad’ de reacción que ha tenido lugar en el instante t viene dada por
el grado de avance de la reacción ξ, definido por
nA = nA0 + νA ξ (11.23)
dξ
r= . (11.24)
dt
Esta velocidad también puede expresarse en función de la tasa de variación de la cantidad
de cada especie que toma parte en la reacción. Derivando (11.23), tenemos
dnA dξ
= νA (11.25)
dt dt
(puesto que nA0 y νA son constantes), de manera que
dξ 1 dnA
r= = . (11.26)
dt νA dt
r 1 d[A]
v= = . (11.27)
V νA dt
0* Por convenio, el sı́mbolo nA es la cantidad de la especie A en unidades (SI) de mol, que es también
la unidad para ξ. Otras cantidades que se usan en vez del número de moles son la concentración [ A], la
presión parcial pA para un gas, y la fracción molar adimensional xA . Seguimos la práctica habitual en libros
de quı́mica fı́sica de utilizar concentraciones para el tratamiento de la cinética, pero omitiendo las unidades.
284 Capı́tulo 11. Ecuaciones diferenciales de primer orden
El mecanismo de una reacción quı́mica es en general complejo, pasando por varias eta-
pas cinéticas elementales, que pueden ser consecutivas, competitivas o ambas, y es tarea
de los quı́micos cinéticos desentrañar el mecanismo y relacionar la velocidad de la re-
acción quı́mica global con las velocidades de las etapas elementales. Se sabe de manera
experimental que la velocidad global puede depender de las cantidades de todas las es-
pecies quı́micas presentes en cualquier instante, tanto reactivos como productos, y de
la temperatura, la presión y la naturaleza del recipiente. Consideramos aquı́ únicamen-
te las reacciones más sencillas, aquellas cuyas velocidades dependen únicamente de las
cantidades de los reactivos. Representamos tales reacciones mediante
aA + bB + · · · → productos. (11.29)
dx
= −kx . (11.32)
dt
dx
= −k dt , ln x = −kt + c o bien ln [A] = −kt + c . (11.33)
x
Si la concentración inicial de A es [A]0 , en el instante t = 0, entonces c = ln [A]0 y la
solución de la ecuación cinética diferencial es la ecuación cinética integrada
11.4. Ecuaciones separables en cinética quı́mica 285
La gráfica de ln [A] frente a t es una recta (Figura 11.1) cuya pendiente es −k y cuyo
corte con el eje ln [A] es ln [A]0 .
Una expresión más convencional para la ecuación cinética integrada se obtiene de
(11.34) tomando exponenciales en cada miembro,
Figura 11.1
dx 1
− = 2k dt , = 2kt + c .
x2 x
Si x0 es la concentración inicial de reactivo, entonces c = 1/x0 y
1 1
− = 2kt (11.38)
x x0
o bien
1 1 [A]0
− = 2kt , [A] = . (11.39)
[A] [A]0 1 + 2kt[A]0
286 Capı́tulo 11. Ecuaciones diferenciales de primer orden
Figura 11.2
La gráfica de 1/[A] frente a t es una recta (Figura 11.2) con pendiente 2k que corta el
eje vertical en 1/[A]0 .
d(a − x) dx
− = = k(a − x)(b − x) . (11.41)
dt dt
Tenemos que distinguir dos casos.
dx
= k(a − x)2 (11.42)
dt
y, separando variables e integrando,
dx 1 1
= k dt , = = kt + c . (11.43)
(a − x)2 a−x [A]
1 1
− = kt . (11.44)
[A] [A]0
Esto es lo mismo que en el caso (2) anterior salvo por el factor 2, que diferencia el caso
A + A del caso A + B.
(b) Las concentraciones iniciales de A y B no son iguales.
11.5. Ecuaciones lineales de primer orden 287
1 A B A(b − x) + B(a − x)
= + = .
(a − x)(b − x) a−x b−x (a − x)(b − x)
1 = A(b − x) + B(a − x) .
Tomar x = b nos da B = 1/(a − b); mientras que tomar x = a nos da A = 1/(b − a).
Por lo tanto
1 1 1 1
= −
(a − x)(b − x) b−a a−x b−x
y
dx 1 1 1
= − dx
(a − x)(b − x) b−a a−x b−x
1 1 b−x
= − ln (a − x) + ln (b − x) = ln .
b−a b−a a−x
Por lo tanto
1 b − x
ln = kt + c .
b−a a−x
1 b
En el instante t = 0, tenemos x = 0 y c = ln , de manera que
b−a a
1 a(b − x)
ln = kt (11.45)
b − a b(a − x)
1 [A]0 [B]
ln = kt . (11.46)
[B]0 − [A]0 [B]0 [A]
La ecuación homogénea
dy
+ p(x)y = 0 . (11.48)
dx
La ecuación es separable:
dy
= −p(x) dx , ln y = − p(x) dx + c ,
y
donde a es una constante arbitraria (si se toma a nula, y = 0 se llama solución trivial).
La ecuación no homogénea
La ecuación lineal general se transforma en una expresión directamente integrable si
se multiplican ambos miembros de (11.47) por la función
F(x) = e p(x) dx
(11.50)
dF(x)
= F(x)p(x) , (11.51)
dx
03. Este método para resolver la ecuación diferencial general de primer orden fue descubierto por
Leibniz en 1694.
11.6. Un ejemplo de ecuaciones lineales en cinética quı́mica 289
d
dado que p(x) dx = p(x). Ası́, multiplicando (11.47) por F(x),
dx
dy
F(x) + F(x)p(x)y = F(x)r(x) (11.52)
dx
y, según (11.51), el primer miembro es la derivada del producto F(x)y:
dy dy dF(x) d
F(x) + F(x)p(x)y = F(x) + y= F(x)y .
dx dx dx dx
La ecuación (11.52) puede por lo tanto escribirse como
d
F(x)y = F(x)r(x)
dx
que se integra para dar
F(x)y = F(x)r(x) dx + c . (11.53)
= 3ex + c ,
y = ex (3ex + c) = 3e2x + cex .
dy 2
2. + y = 3x3
dx x
El factor integrante es
F(x) = e (2/x)dx = e2 ln x = x2 .
Por lo tanto, por la fórmula (11.53),
x6
x2 y = x2 × 3x3 dx + c = + c,
2
x4 c
y = + 2.
2 x
290 Capı́tulo 11. Ecuaciones diferenciales de primer orden
d[A]
= −k1 [A] , (11.54)
dt
d[B]
= k1 [A] − k2 [B] . (11.55)
dt
Suponemos que las concentraciones iniciales, en el instante t = 0, son [A]0 = a, [B]0 =
0, y [C]0 = 0, y que las concentraciones en el instante t son [A] = a − x y [B] = y, de
manera que [C] = x − y. Entonces
d(a − x)
= −k1 (a − x) , (11.56)
dt
dy
= k1 (a − x) − k2 y . (11.57)
dt
La primera de estas ecuaciones es la ecuación separable (11.32), con solución
a − x = ae−k t . 1
(11.58)
dy
= ak1 e−k t − k2 y1
dt
o bien
dy
+ k2 y = ak1 e−k t 1
(11.59)
dt
y ésta es una ecuación lineal con p(t) = k2 , r(t) = ak1 e−k t y factor integrante
1
F(t) = e p(t) dt
= ek t .
2
11.6. Un ejemplo de ecuaciones lineales en cinética quı́mica 291
dt + c = k2 − k1
1 2
e y = ak1 e
k t2 (k −k )t
2 1
⎩
ak1 t + c si k1 = k2 .
c= 2 1
0 si k1 = k2 ,
y= k2 − k1 (11.60)
⎩
ak1 te−k t 1
si k1 = k2 .
⎧
⎨ [A]0 k1 (e−k t − e−k t ) si k = k ,
1 2
k2 − k1
1 2
[B] = (11.61)
⎩
[A]0 k1 te−k t 1
si k1 = k2 ,
[C] = [A]0 − [A] − [B] .
Figura 11.3
La figura 11.3 ilustra los tres tipos de comportamiento que presenta el sistema. En
cada caso [A]0 = 1 y k1 = 1 (en las coordenadas apropiadas). La Figura (a), con k2 /k1 =
292 Capı́tulo 11. Ecuaciones diferenciales de primer orden
10, muestra cómo se comporta el sistema cuando k2 >> k1 . La etapa que limita la
reacción es A → B, y la cantidad de B intermedio se mantiene pequeña a largo de la
reacción porque B se convierte rápidamente en C. La Figura (c), con k1 /k2 = 10, muestra
el comportamiento cuando k1 >> k2 . La etapa limitadora es B → C, y la cantidad de
B se hace grande porque el proceso B → C es lento, y B disminuye sólo cuando el
suministro de A se agota.
dI
EL = L , (11.63)
dt
donde L es la inductancia, y para un condensador es
Q
EC = , (11.64)
C
dQ
donde C es la capacidad. La carga Q se relaciona con la corriente mediante I = .
dt
Figura 11.4
11.8. Ejercicios 293
Consideramos aquı́ un circuito RL, con una resistencia y una bobina, como se repre-
senta en la Figura 11.4. Por la ley de Kirchhoff,
dI
L + RI = E , (11.65)
dt
que es una ecuación diferencial lineal de primer orden. Tenemos p =
R/L (constante)
y r = E/L en la ecuación (11.47). El factor integrante es F(x) = e (R/L) dt = eRt/L y la
solución general es
Rt/L E
I(t) = e −Rt/L
e dt + c . (11.66)
L
E0
I(t) = 1 − e−Rt/L . (11.68)
R
Cuando se cierra el circuito la corriente crece desde cero al valor estacionario E0 /R en
un tiempo que depende de la constante de tiempo de inducción τL = L/R.
11.8. Ejercicios
Apartado 11.2
Establezca el orden de la ecuación diferencial y compruebe que la función dada es una solución:
dy d2 y
1. − 2y = 2 ; y = e2x − 1 2. + 4y = 0 ; y = A cos 2x + B sen 2x
dx dx2
d3 y dy 3y x3 c
3. = 12 ; y = 2x3 + 3x2 + 4x + 5 4. + = 3x2 ; y= + 3
dx3 dx x 2 x
Halle la solución general de la ecuación diferencial:
dy dy d2 y d3 y
5. = x2 6. = e−3x 7. = cos 2x 8. = 24x
dx dx dx2 dx3
Compruebe que la función dada es una solución de la ecuación diferencial, y determine c para la condición
inicial dada:
dy
9. x = 2y ; y = cx2 ; y = 24 para x = 2
dx
dy 2
10. + 2xy = 0 ; y = ce−x ; y = 2 para x=2
dx
dy
11. + 2y + 2 = 0 ; y = ce−2x − 1 ; y(0) = 4
dx
294 Capı́tulo 11. Ecuaciones diferenciales de primer orden
12. Un cuerpo se mueve en la dirección x bajo la acción de la fuerza F(t) = cos 2πt, siendo t el tiempo. (i)
Escriba la ecuación del movimiento. (ii) Halle la solución que satisface las condiciones iniciales x(0) = 0 y
ẋ(0) = 1.
Apartado 11.3
Halle la solución de la ecuación diferencial:
dy 3x2 dy dy
13. = 14. = 4xy2 15. = 3x2 y
dx y dx dx
dy dy dy y
16. y2 = ex 17. = y(y − 1) 18. =
dx dx dx x
Resuelva los problemas de valor inicial:
dy y+2 dy x2 − 1
19. = ; y(0) = 1 20. = ; y(0) = −1
dx x−3 dx 2y + 1
dy y(y + 1) dy
21. = ; y(2) = 1 22. = ex+y ; y(0) = 0
dx x(x − 1) dx
dy x+y dy
23. = ; y(1) = 2 24. 2xy = −(x2 + y2 ) ; y(1) = 0
dx x dx
dy
25. xy3 = x4 + y4 ; y(2) = 0
dx
dy
26. Demuestre que una ecuación diferencial de la forma = f (ax + by + c) se reduce a forma separable
dx
mediante el cambio u = ax + by.
Apartado 11.4
29. Resuelva el problema de valor inicial para el proceso cinético de orden n A → productos
dx
= −kxn x(0) = a (n = 1) .
dt
30. La reacción reversible A B, de primer orden en ambas direcciones, tiene la ecuación cinética
dx
= k1 (a − x) − k−1 x .
dt
Halle x(t) para la condición inicial x(0) = 0.
31. Un proceso de tercer orden A + 2 B → productos tiene la ecuación cinética
dx
= k(a − x)(b − 2x)2 ,
dt
donde a y b son las cantidades iniciales de A y de B respectivamente. Demuestre que la solución que
satisface la condición x(0) = 0 viene dada por
1 a(b − 2x) 2x
kt = ln + .
(2a − b)2 b(a − x) b(2a − b)(b − 2x)
11.8. Ejercicios 295
Apartado 11.5
Halle la solución general:
dy dy dy
32. + 2y = 4 33. − 4xy = x 34. + 3y = e−3x
dx dx dx
dy 2y dy y 4 dy
35. + = 2 cos x 36. − 2 = 2 37. + (2 tg x)y = sen x
dx x dx x x dx
dy dy y
38. + axn y = bxn , (n = −1) 39. + a = xn
dx dx x
Apartado 11.6
k k k
40. El sistema de tres procesos de primer orden consecutivos A −→
1
B −→
2
C −→
3
D está representado
por el conjunto de ecuaciones
d(a − x) dy dz
= −k1 (a − x) , = k1 (a − x) − k2 y , = k2 y − k3 z ,
dt dt dt
donde (a − x), y y z son las cantidades en el instante t de A, B y C respectivamente. Dadas las condiciones
iniciales x(0) = y(0) = z(0) = 0, halle la cantidad de C como función de t. Suponga k1 = k2 , k1 = k3 , k2 =
k3 .
k k
41. El proceso de primer orden A −→
1
B es seguido por los procesos paralelos de primer orden B −→
2
C
k
y B −→
3
D, y el sistema se representa por las ecuaciones
d(a − x) dy dz dw
= −k1 (a − x) , = k1 (a − x) − (k2 + k3 )y , = k2 y , = k3 y ,
dt dt dt dt
donde (a − x), y, z y w son las cantidades en el instante t de A, B, C y D respectivamente. Dadas las condi-
ciones iniciales x = y = z = w = 0 a t = 0, halle la cantidad de C como función del tiempo.
Apartado 11.7
42. Demuestre que la corriente en un circuito RC que contiene una resistencia y un condensador viene
dada por la ecuación
dI I dE
R + = .
dt C dt
Resuelva la ecuación para (i) una f.e.m. constante, E = E0 , (ii) una f.e.m. periódica, E(t) = E0 sen ωt.
Ecuaciones diferenciales de segundo
orden. Coeficientes constantes
12.1. Conceptos
Las ecuaciones diferenciales de segundo orden que son importantes en las ciencias
fı́sicas son ecuaciones lineales con forma general
d2 y dy
+ p(x) + q(x)y = r(x) . (12.1)
dx 2
dx
Si la función r(x) es cero, se dice que la ecuación
d2 y dy
+ p(x) + q(x)y = 0 (12.2)
dx2 dx
es homogénea. En caso contrario se dice que es no homogénea.1 Las funciones p(x) y
q(x) son los coeficientes de la ecuación. Cuando estos coeficientes son constantes las
soluciones de la ecuación se pueden expresar mediante funciones elementales, y estas
ecuaciones lineales con coeficientes constantes son las que tratamos en este capı́tulo. En
el Capı́tulo 13 tratamos las ecuaciones diferenciales con coeficientes no constantes.
01. Muchos de los métodos y ejemplos de los libros de texto se remontan a los Institutiones calculi
differentiales (1755) e Institutiones calculi integralis (1768-70, 3 volúmenes) de Euler. Fue Euler quien
introdujo la distinción entre ecuaciones homogéneas y no homogéneas y entre soluciones generales y parti-
culares, el uso de factores integrantes, y la resolución de ecuaciones lineales con coeficientes constantes de
segundo orden y de órdenes superiores.
298 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes
EJEMPLO 12.1 Demuestre que y1 = e2x e y2 = e3x son dos soluciones de la ecuación
d2 y dy
− 5 + 6y = 0 .
dx2 dx
Tenemos
dy1 d 2 y1
y1 = e2x , = 2e2x , = 4e2x .
dx dx2
Por lo tanto
d 2 y1 dy1
−5 + 6y1 = 4e2x − 5 × 2e2x + 6e2x = e2x (4 − 10 + 6) = 0 .
dx2 dx
De manera similar,
dy2 d 2 y2
y2 = e3x , = 3e3x , = 9e3x ,
dx dx2
y
d 2 y2 dy2
−5 + 6y2 = 9e3x − 15e3x + 6e3x = 0 .
dx2 dx
Este ejemplo ilustra el resultado general de que siempre es posible hallar dos soluciones
particulares y1 (x) e y2 (x) para una ecuación lineal homogénea. Si multiplicamos cada
una de esas soluciones por una constante, la nueva función es también una solución. Por
ejemplo, sea y1 (x) una solución de la ecuación general homogénea (12.2),
d2 y1 dy1
+ p(x) + q(x)y1 = 0 ,
dx 2
dx
y sea y3 (x) = cy1 (x), siendo c una constante. Entonces,
de manera que y3 = cy1 es también una solución. Sin embargo, las funciones y1 e y3 no se
consideran diferentes, porque cada una es sencillamente un múltiplo de la otra: se dice
que las funciones son linealmente dependientes. En general, dos funciones y1 e y2 son
linealmente dependientes si existe una relación
Demostraremos ahora que si y1 e y2 son dos soluciones de una ecuación lineal ho-
mogénea, entonces cualquier combinación lineal de ellas,
y = c1 y1 + c2 y2 (12.5)
El resultado es cero ya que ambos términos entre corchetes son cero por ser y1 e y2
soluciones. Esta importante propiedad de las ecuaciones lineales homogéneas se lla-
ma principio de superposición (no se cumple para ecuaciones no homogéneas ni para
ecuaciones no lineales). En particular, cuando y1 e y2 son soluciones linealmente inde-
pendientes, la función (12.5), que tiene dos constantes arbitrarias, es la solución general
de la ecuación homogénea (véase el apartado 11.2).
d2 y dy
+ a + by = 0 (12,3) ,
dx2 dx
300 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes
es
y = eλx . (12.6)
Entonces
d λx d2 λx
e = λeλx , e = λ2 eλx ,
dx dx2
y sustituyendo en (12.3) tenemos
o bien
eλx (λ2 + aλ + b) = 0 .
λ2 + aλ + b = 0 . (12.7)
1 √ 1 √
λ1 = (− a + a2 − 4b ) , λ2 = (− a − a2 − 4b ) , (12.8)
2 2
y las posibles soluciones de tipo (12.6) son
y1 = eλ x ,
1
y2 = eλ x .
2
(12.9)
y = c1 y1 + c2 y2 = c1 e2x + c2 e3x .
02. En una carta de 1739 a Johann Bernoulli, Euler describió su descubrimiento de la solución de las
ecuaciones lineales con coeficientes constantes por medio de la ecuación caracterı́stica: ‘después de tratar
el problema de muchas maneras, llegué a mi solución de forma totalmente inesperada. Antes de ello no
sospechaba que la solución de ecuaciones algebraicas tuviese tanta importancia en este asunto’.
12.3. Solución general 301
En el Ejemplo 12.3 la ecuación caracterı́stica tiene dos raı́ces reales distintas de manera
que y1 e y2 son linealmente independientes y la solución general es una combinación
lineal de ellas. La naturaleza de las raı́ces depende del discriminante a2 − 4b. Si a y b
son números reales, los tres tipos posibles son
Las raı́ces vienen dadas por (12.8), las soluciones particulares por (12.9) y, al igual
que en el Ejemplo 12.3, la solución general es
Cuando a2 − 4b = 0 las dos raı́ces de (12.8) son iguales, con λ1 = λ2 = −a/2. Por
lo tanto sólo se obtiene una solución particular de la ecuación caracterı́stica:
y1 (x) = eλ x = e−ax/2 .
1
(12.11)
Dada una solución particular de una ecuación homogénea, siempre se puede obtener una
segunda. En este caso una segunda solución, linealmente independiente de la primera,
es
dy2 d2 y2
= 1 − ax/2 e−ax/2 , = – a + a 2
x/4 e−ax/2 ,
dx dx2
de manera que
d2 y2 dy2 a2 x −ax/2 ax −ax/2
+ a + by2 = −a + e + a 1 − e + bxe−ax/2
dx2 dx 4 2
a2 x a2 x
= −a + +a− + bx e−ax/2
4 2
2
ax x
= − + bx e−ax/2 = − (a2 − 4b) e−ax/2
4 4
= 0,
302 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes
Ésta es la forma exponencial de la solución. Se puede dar una forma trigonométrica expresando e±ix me-
diante sen x y cos x a través de la fórmula de Euler (ecuaciones (8.33) y (8.34)),
Entonces
En el caso complejo general, las raı́ces de la ecuación caracterı́stica (12.7) son, a partir
de (12.8),
a a 2
λ=− ± − b,
2 2
donde en este caso (a/2)2 − b < 0. Sea (a/2)2 − b = −ω 2 , siendo ω real. Entonces
a 2 √ √
− b = −ω 2 = −1 ω = iω
2
con d1 = c1 + c2 y d2 = i(c1 − c2 ).
Una ecuación diferencial de segundo orden con condiciones iniciales se llama un pro-
blema de valor inicial.
y(0)=1= e0 (d1 cos 0 + d2 sen 0) = d1 , y(π/2)=2= eπ/2 (d1 cos π/2 + d2 sen π/2) = d2 eπ/2 .
y(x) = e−3x .
La ecuación y + ω 2 y = 0
En los ejemplos 12.6 a 12.8, las dos condiciones aplicadas a la solución de la ecuación
diferencial son suficientes para especificar una solución particular. En algunos casos, sin
embargo, cuando en la ecuación diferencial hay parámetros por determinar, se necesitan
una o más condiciones adicionales para especificar completamente la solución. Varios
ejemplos de esas ecuaciones se tratan en el Capı́tulo 13. Uno de los ejemplos sencillos
más importantes en las ciencias fı́sicas es la ecuación
d2 y
+ ω2 y = 0 , (12.20)
dx2
donde ω es un número real. La solución general viene dada bien sea por (12.16) con
a = 0,
Si ω es una constante dada, las dos condiciones iniciales o de contorno son suficientes
para especificar una solución particular. Esto se ve, por ejemplo, en el Apartado 12.5
para el oscilador armónico como problema de valor inicial. Sin embargo, si ω es un
parámetro por determinar, es necesaria una condición adicional. Éste es el caso de la
‘partı́cula en un pozo’ en mecánica cuántica, como problema de contorno, que tratamos
en el Apartado 12.6.
Una tercera posibilidad se produce cuando la situación fı́sica necesita que se cumpla
una condición de contorno periódica (cı́clica)(véase el Apartado 8.6)
Los valores posibles de ω son entonces ωn = 2πn/λ (utilizando n para etiquetar los
valores), y las correspondientes soluciones son
2πnx 2πnx
yn = d1 cos + d2 sen . (12.26)
λ λ
Las constantes c1 y c2 , o d1 y d2 , no están determinadas. En el Apartado 12.7 tratamos un
ejemplo del caso de condiciones de contorno periódicas con el problema de la ‘partı́cula
en un aro’ en mecánica cuántica.
Figura 12.1
El oscilador armónico (lineal) simple (Figura 12.1) consiste en un cuerpo que se mueve
en lı́nea recta bajo la acción de una fuerza
F = −kx (12.27)
d2 x
F=m (12.28)
dt2
12.5. El oscilador armónico 307
d2 x
m = −kx . (12.29)
dt2
Una gran variedad de sistemas fı́sicos se pueden modelar mediante el movimiento armóni-
co simple: las oscilaciones de una balanza de resorte (la ecuación (12.27) se llama en-
tonces ley de Hooke), el balanceo de un péndulo, las oscilaciones de un trampolı́n y, de
importancia en quı́mica, las vibraciones de los átomos en las moléculas o cristales.
V = De [a2 (R − Re )2 − a3 (R − Re )3 + · · · ]
≈ a2 De (R − Re )2 . (12.31)
Figura 12.2
La fuerza que actúa entre los núcleos de la molécula es (véase el Apartado 5.7, ecuación (5.57))
dV
F=− . (12.32)
dR
Por lo tanto, derivando (12.31) tenemos para pequeños desplazamientos
F ≈ −2a2 De (R − Re ) . (12.33)
La ecuación (12.29) puede escribirse en la forma estándar (12.3) de una ecuación lineal
homogénea con coeficientes constantes,
d2 x k
+ x=0 (12.34)
dt2 m
o, definiendo k/m = ω 2 , en la forma de la ecuación (12.20),
d2 x
+ ω2 x = 0 , (12.35)
dt2
308 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes
El estado del sistema queda determinado por las condiciones iniciales. Por ejemplo, sean
el desplazamiento y la velocidad en el instante t = 0
y para la velocidad:
Figura 12.3
12.5. El oscilador armónico 309
Análisis energético
El oscilador armónico es un sistema conservativo (véase el Apartado 5.7) y la fuerza
F = −kx es la derivada de la función energı́a potencial, F = −dV/dx. La energı́a
potencial es por lo tanto la integral
dV 1
V(x) = dx = − F dx = kx2 + c .
dx 2
La energı́a potencial se elige, por convenio, que sea cero en la posición de equilibrio,
cuando x = 0. Entonces
1
V = kx2 . (12.40)
2
La energı́a cinética es T = mv2 /2, donde v es la velocidad, y la energı́a total es E =
T + V. Para el estado del sistema descrito por la solución (12.38),
de manera que
1 1
V = kx2 = kA2 cos2 ωt ,
y 2 2
1 1 1
T = mv2 = mω 2 A2 sen2 ωt = kA2 sen2 ωt ,
2 2 2
ya que ω 2 = k/m. La energı́a total es por lo tanto la constante
1
E = T + V = kA2 . (12.41)
2
Figura 12.4
310 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes
El valor constante de V dentro del pozo asegura que en esa región no se ejerce fuerza
alguna sobre la partı́cula. Tomar V = 0 supone que la energı́a E es la energı́a cinética
(positiva) de la partı́cula. El valor infinito de V en las ‘paredes’ y fuera del pozo asegura
que la partı́cula no puede salir del pozo: en mecánica cuántica eso significa que la función
de onda es cero en las paredes y fuera del pozo.
Para la partı́cula dentro del pozo tenemos por lo tanto el problema de contorno
2 d2 ψ(x)
− = Eψ(x) (12.44)
2m dx2
con las condiciones de contorno
2mE
ω2 = (12.46)
2
12.6. Partı́cula en un pozo unidimensional 311
tenemos
d2 ψ
+ ω2 ψ = 0 (12.47)
dx2
con solución general, en forma trigonométrica,
y a x = l (tomando d1 = 0 en (12.48)),
n2 h 2
En = (12.52)
8ml2
(usando que E = 2 ω 2 /2m = h2 ω 2 /8π 2 m). Vemos que la cuantificación de la energı́a
es una consecuencia de restringir el movimiento de la partı́cula a una región finita del
espacio mediante las condiciones de contorno: este es un resultado general en mecánica
cuántica. Señalamos que estos resultados no se limitan al movimiento sobre una lı́nea
recta: también son válidos para cualquier curva de longitud l con la variable x medida
sobre la curva.
Las funciones de onda (12.51) no están completamente determinadas porque el coefi-
ciente d2 no ha sido definido. Para determinar d2 recurrimos a la interpretación mecánico-
cuántica del cuadrado de la función de onda como la densidad de probabilidad (véase
también el ejemplo 10.3):
312 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes
Las gráficas de estas soluciones se representan en la Figura 12.6 para los tres primeros
valores de n.
Figura 12.6
Estas gráficas muestran cómo la función de onda ψn tiene (n−1) ceros, o nodos, entre
los extremos. Esto ilustra una propiedad general de las funciones de onda: el número de
ceros (puntos, curvas o superficies nodales) aumenta a medida que la energı́a del sistema
aumenta.
El caso de la partı́cula en un pozo es importante en las ciencias fı́sicas no sólo como
uno de los problemas más sencillos resolubles que ilustra el fenómeno de la cuantización,
sino también porque el sistema, generalizado a tres dimensiones, se utiliza en termo-
dinámica estadı́stica para obtener las propiedades termodinámicas de los gases ideales.
Empleamos ahora las soluciones (12.53) para hacer ver una propiedad importante de las
soluciones de la ecuación de Schrödinger.
Ortogonalidad
La ecuación de Schrödinger para la partı́cula en un pozo puede escribirse como
2 d2
− ψ = Eψ
2m dx2
o bien Hψ = Eψ , (12.54)
12.6. Partı́cula en un pozo unidimensional 313
2 d2
H=− (12.55)
2m dx2
se denomina operador hamiltoniano, o sencillamente hamiltoniano, del sistema. El
efecto de operar con H sobre ψ es generar un múltiplo de ψ. La ecuación de Schrödin-
ger (independiente del tiempo) siempre puede escribirse en la forma (12.54) como una
ecuación de autovalores, con el sistema especificado por el operador hamiltoniano y
condiciones de contorno adecuadas. Las funciones de onda permitidas ψ = ψn se deno-
minan autofunciones del hamiltoniano, y las energı́as correspondientes E = En son los
autovalores de H.
Una propiedad importante de las autofunciones es su ortogonalidad. En este caso
concreto, consideramos la integral
l
de manera que
1 l
(m − n)πx 1 l
(m + n)πx
I= cos dx − cos dx .
2 0 l 2 0 l
Ahora bien,
l
l
(m ± n)πx l (m ± n)πx
cos dx = sen
0 l (m ± n)π l 0
l
= sen (m ± n)π − sen 0
(m ± n)π
= 0,
Las funciones se dice que son ortogonales. Para las funciones de onda normalizadas,
l
que cumplen 0 ψn (x)ψn (x) dx = 1, podemos escribir
l
1 si m = n,
ψm (x)ψn (x) dx = δmn = (12.59)
0 0 si m = n.
2 d2 ψ(θ)
H ψ(θ) = − = Eψ(θ) (12.60)
2I dθ2
donde E es la energı́a cinética (positiva) de la partı́cula e I =
mr2 es su momento de inercia con respecto al centro del cı́rculo.
Tomando
2IE
ω2 = (12.61)
2
tenemos
d2 ψ Figura 12.7
+ ω2 ψ = 0 (12.62)
dθ2
Para que la función de onda sea continua en el cı́rculo tiene que cumplir la condición de
contorno periódica
con autovalores
2 n2
En = . (12.66)
2I
Señalamos que los estados del sistema con número cuántico n = 0 aparecen en pares
degenerados, ψn y ψ−n ,
H ψn = En ψn , H ψ−n = En ψ−n .
Por el principio de superposición (Apartado 12.2), toda combinación lineal de una pareja
de autofunciones degenerada es a su vez una autofunción con el mismo autovalor,
√
y esto es 1 si c1 = 1/ 2π. Las autofunciones normalizadas son por lo tanto
1
ψn (θ) = √ einθ , n = 0, ±1, ±2, . . . (12.69)
2π
2π
Tenemos
2π 2π 2π
1 1
ψ∗1 (θ)ψ2 (θ) dθ = e−iθ e2iθ dθ = eiθ dθ
0 2π 0 2π 0
2π
1 1 iθ 1
2πi
= e = e −1
2π i 0 2πi
Las funciones (12.69) pueden interpretarse como giros de la partı́cula, en sentido horario
si n > 0 y antihorarios si n < 0 (véase el Apartado 8.6, para el rotor rı́gido). Cuando
n = 0 se trata de funciones complejas, pero para algunas aplicaciones es más conveniente
tener soluciones de la ecuación de Schrödinger que sean funciones reales. El convenio
es utilizar funciones trigonométricas obtenidas mediante la fórmula de Euler. Tenemos
1
ψ±n (θ) = √ (cos nθ ± i sen nθ)
2π
y las combinaciones
1 1 1 1
√ (ψn + ψ−n ) = √ cos nθ , √ (ψn − ψ−n ) = √ sen nθ (12.71)
2 2 π i 2 2 π
Figura 12.8
Señalamos que estas simetrı́as son también las simetrı́as alrededor del eje molecular
de los orbitales moleculares en una molécula lineal, con n = 0 para orbitales σ, n = ±1
para π, n = ±2 para δ, y ası́ sucesivamente.
12.8. Ecuaciones lineales no homogéneas 317
El caso general
Si se unen los extremos del pozo que vimos en el Apartado 12.6 para formar un
contorno cerrado simple, la ecuación de Schrödinger no varı́a
d2 ψ 2mE
+ ω2 ψ = 0 , ω2 = , (12.72)
dx2 2
si la variable x se mide a lo largo del contorno. Pero las dos condiciones de contorno
(12.45) han de ser sustituidas por una única condición periódica
Las ecuaciones (12.72) y (12.73) son el problema de contorno que hemos tratado en el
Apartado 12.4 (sustituyendo λ por l). Los valores permitidos de ω son ωn = 2πn/l, y las
soluciones vienen dadas en forma trigonométrica por la ecuación (12.26),
2πnx 2πnx
ψn (x) = d1 cos + d2 sen . (12.74)
l l
Estos resultados son válidos para cualquier contorno cerrado con la forma que sea. Los
resultados para el cı́rculo de radio r se obtienen sustituyendo l por la circunferencia 2πr
y la variable x por rθ.
y = a0 + a1 x + a2 x2 .
Entonces
y = a1 + 2a2 x , y = 2a2 ,
y
y + 3y + 2y = (2a2 + 3a1 + 2a0 ) + (6a2 + 2a1 )x + 2a2 x2 .
Esto es igual a 2x2 si
d2 yp dyp
+a + byp = r(x) . (12.76)
dx 2
dx
Sea yh la solución general (12.5) de la correspondiente ecuación homogénea (12.3), que
se llama en este contexto la ecuación reducida:
d2 yh dyh
+a + byh = 0 . (12.78)
dx2 dx
Se deduce que la suma de esas dos funciones,
donde hemos usado las ecuaciones (12.76) y (12.78). La función (12.79) tiene dos cons-
tantes arbitrarias y es la solución general de la ecuación no homogénea. La función yh
se llama a menudo función complementaria e yp una integral particular:
Tabla 12.1
1. ceαx keαx
2. cx (n = 0, 1, 2, . . . )
n
a0 + a1 x + a2 x2 + · · · + an xn
3. c cos ωx o c sen ωx k cos ωx + l sen ωx
4. ceαx cos ωx o ceαx sen ωx eαx (k cos ωx + l sen ωx)
Además, si r(x) es suma de dos o más términos, la solución particular total es la corres-
pondiente suma de las yp correspondientes.
yp = kxe−2x .
320 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes
Entonces
yp = ke−2x − 2kxe−2x , yp = −4ke−2x + 4kxe−2x ,
de manera que
yp + 3yp + 2yp = −ke−2x
y esto es igual a 3e−2x si k = −3. Entonces yp = −3xe−2x y la solución general es
En este caso, por la receta (b), la función yp = ke2x se multiplica por x2 . Entonces
yp = kx2 e2x , yp = 2kxe2x + 2kx2 e2x , yp = 2ke2x + 8kxe2x + 4kx2 e2x ,
de manera que
yp − 4yp + 4yp = 2ke2x
y esto es igual a e2x si k = 1/2. La solución general es por lo tanto
1
y(x) = yh (x) + yp (x) = c1 + c2 x + x2 e2x .
2
d2 x dx
m + c + kx = F0 cos ωt . (12.80)
dt2 dt
Esta es la ecuación del movimiento de un cuerpo sometido a la acción de la fuerza
d2 x dx
F=m = −kx − c + F0 cos ωt . (12.81)
dt2 dt
El término −kx nos indica que se trata de un oscilador armónico. El término −c dx/dt es
una ‘fuerza disipativa’ proporcional a la velocidad que representa, por ejemplo, la resis-
tencia al avance que encuentra el cuerpo al moverse en un fluido. El término F0 cos ωt es
una fuerza periódica externa que interactúa con el movimiento del oscilador. Por ejem-
plo, una fuerza q en presencia de un campo eléctrico experimenta una fuerza qE en la
dirección del campo. En el caso de un campo alterno, E = E0 cos ωt, la fuerza que actúa
12.9. Oscilaciones forzadas 321
sobre un electrón con carga q = −e, es −eE0 cos ωt. Si el electrón experimenta un mo-
vimiento armónico simple (en ausencia del campo) la fuerza total que actúa sobre él
es3
Esto es un ejemplo de (12.81) sin disipación, y es el caso que consideramos aquı́. Cuando
c = 0, la ecuación (12.80) tiene la forma
d2 x
+ ω02 x = A cos ωt , (12.83)
dt2
donde ω0 = k/m es la frecuencia angular del oscilador en ausencia de campo externo.
La cantidad ν0 = ω0 /2π se llama frecuencia natural del oscilador.
La solución general de la ecuación homogénea correspondiente a (12.83),
d2 x
+ ω20x = 0 ,
dt2
es (véase el Apartado 12.4)
Entonces
dxp d2 xp
= −ωc sen ωt + ωd cos ωt , = −ω 2 (c cos ωt + d sen ωt) ,
dt dt2
y
d 2 xp
+ ω02 xp = (ω02 − ω 2 )(c cos ωt + d sen ωt) .
dt2
Esto es igual a A cos ωt si d = 0 y c = A/(ω02 − ω 2 ). La integral particular es por lo tanto
A cos ωt
xp (t) = (12.85)
ω02 − ω 2
03. Euler expuso su solución al problema del oscilador armónico forzado ante la Academia de Cien-
cias de San Petersburgo el 30 de marzo de 1739.
322 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes
La gráfica de esta función (Figura 12.9) muestra cómo en el caso resonante la ampli-
tud de la oscilación crece indefinidamente con el tiempo. En los sistemas mecánicos la
resonancia se puede evitar aplicando una fuerza disipativa adecuada.
Figura 12.9
12.10. Ejercicios
Apartado 12.2
1. Demuestre que e−2x y e2x/3 son soluciones particulares de la ecuación diferencial
3y + 4y − 4y = 0, y escriba la solución general.
Apartado 12.3
Halle la solución general de las ecuaciones diferenciales:
4. y − y − 6y = 0 5. 2y − 8y + 3y = 0 6. y − 8y + 16y = 0
7. 4y + 12y + 9y = 0 8. y + 4y + 5y = 0 9. y + 3y + 5y = 0
Apartado 12.4
Resuelva los problemas de valor inicial:
d2 x dx dx
10. + − 2x = 0 ; x(0) = 1 , (0) = 0
dt2 dt dt
d2 x dx dx
11. + 6 + 9x = 0 ; x(1) = 0 , (1) = 1
dt2 dt dt
d2 x dx
12. + 9x = 0 ; x(π/3) = 0 , (π/3) = −1
dt2 dt
d2 x dx dx
13. − 2 + 2x = 0 ; x(0) = 1 , (0) = 0
dt2 dt dt
Resuelva los problemas de contorno:
d2 y dy
14. + − 2y = 0 ; y(0) = 2 , y → 0 cuando x → ∞
dx2 dx
d2 y
15. + 9y = 0 ; y = 0 para x ≤ 0y x ≥ π
dx2
Apartado 12.5
16. Dado que la solución general de la ecuación de la ecuación del movimiento mẍ = −kx para el
oscilador armónico es x(t) = a cos ωt + b sen ωt, con ω = k/m,
1. demuestre que la solución puede escribirse en la forma x(t) = A cos (ωt − δ) donde A es la amplitud
y δ es el defasaje, y exprese A y δ en función de a y b;
2. halle la amplitud y el defasaje para las condiciones iniciales x(0) = 1 , ẋ(0) = ω.
Apartado 12.6
(i) Resuelva la ecuación de Schrödinger (12.44) para una partı́cula en un pozo con las condiciones
17. de contorno ψ(– l/2) = ψ(l/2) = 0.
(ii) Demuestre que las soluciones ψn son funciones pares de x cuando n es impar y funciones
impares cuando n es par.
(iii) Demuestre que las soluciones son las mismas que las dadas por (12.53) si se sustituye x por
x + l/2, salvo por un posible cambio de signo.
Apartado 12.7
18. Los diagramas de la figura 12.8 son la representación de los signos y nodos de las funciones de onda
reales (12.72). Dibuje los diagramas correspondientes a n = ±3 y n = ±4.
324 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes
19. Compruebe que la ecuación (12.72) y sus soluciones (12.74) se transforman en (12.60) y (12.63)
mediante el cambio de variable θ = x/r.
Apartado 12.8
Halle la solución general de las ecuaciones diferenciales:
Apartado 12.9
28. Un circuito RLC consiste en una resistencia (con resistencia R), una bobina de inducción (con induc-
tancia L) y un condensador (con capacidad C) conectados en serie con una fuente de f.e.m. E.
1. Utilice la ley del voltaje de Kirchhoff (Apartado 11.7) para demostrar que la corriente I(t) en el
circuito viene dada por la ecuación no homogénea
d2 I dI I dE
L +R + = .
dt2 dt C dt
2. Halle la solución de la ecuación homogénea (para E = 0), y confirme que decae exponencialmente
cuando t → ∞.
3. Demuestre que una integral particular para la f.e.m. periódica E(t) = E0 sen ωt es
13.1. Conceptos
Hemos visto en los Apartados 12.5 a 12.7 como tres problemas fı́sicos muy dife-
rentes se modelan mediante la misma ecuación diferencial: la ecuación (12.35) para el
oscilador armónico clásico como problema de valor inicial, la misma ecuación (12.47)
para una partı́cula mecánico-cuántica en un pozo como problema de contorno, y
(12.62) para una partı́cula mecánico-cuántica en un aro como problema de contorno pe-
riódico. Éste es un fenómeno común en el modelado matemático de los sistemas fı́sicos,
y varias ecuaciones son suficientemente importantes como para tener nombre. Algunas
se presentan en la Tabla 13.1
Tabla 13.1
Nombre Ecuación
Las ecuaciones de la Tabla 13.1 son todas ecuaciones de segundo orden lineales con
coeficientes variables, y tienen soluciones particulares que juegan un papel importante en
las matemáticas de las ciencias fı́sicas. Estas soluciones se llaman a menudo funciones
especiales.
Los métodos estándar utilizados para resolver las ecuaciones de la Tabla 13.1, y mu-
chas otras ecuaciones diferenciales lineales en ciencias, son el método de series de po-
326 Capı́tulo 13. Ecuaciones diferenciales de segundo orden. Algunas funciones especiales
tienen al menos una solución particular que puede expresarse como serie de potencias
∞
y(x) = a0 + a1 x + a2 x + a3 x + · · · =
2 3
am x m . (13.2)
m=0
Entonces
dy ∞
= a1 + 2a2 x + 3a3 x2 + · · · = mam xm−1 ,
dx m=1
y, sustituyéndolo en la ecuación diferencial,
dy
+ y = (a1 + 2a2 x + 3a3 x2 + · · · ) + (a0 + a1 x + a2 x2 + · · · )
dx
= (a1 + a0 ) + (2a2 + a1 )x + (3a3 + a2 )x2 + · · ·
13.2. El método de series de potencias 327
Para que esto se anule para todo valor de x (dentro del radio de convergencia de la serie) los coeficientes de
cada potencia de x deben ser cero:
a1 + a0 = 0 , 2a2 + a1 = 0 , 3a3 + a2 = 0 , . . .
de manera que
a1 a0 a2 a0
a1 = −a0 , a2 = − =+ , a3 = − = − , ...
2 2! 3 3!
(– 1)m a0
y, en general, am = . Por lo tanto,
m!
∞ ∞
a0 (– 1)m xm ∞
(– x)m
y= am xm = = a0 .
m=0 m=0
m! m=0
m!
Reconocemos esta serie infinita como el desarrollo en serie de potencias de la función e−x :
x2 x3 (– x)m
∞
e−x = 1 − x + − + ··· = .
2! 3! m=0
m!
Podemos expresar
∞
y = m(m − 1)am xm−2 = (2 × 1)a2 + (3 × 2)a3 x + (4 × 3)a4 x2 + · · ·
m=2
∞
= (m + 2)(m + 1)am+2 xm .
m=0
Entonces
∞
∞
y + y = am xm + (m + 2)(m + 1)am+2 xm
m=0 m=0
∞
= [am + (m + 2)(m + 1)am+2 ]xm
m=0
01. Leibniz descubrió la ecuación diferencial para la función seno en 1693 mediante un argumento
geométrico. Resolvió entonces la ecuación por un método equivalente al presentado en este ejemplo para
obtener la representación en series de potencias de la función. La posibilidad de representar funciones como
series de potencias fue un elemento vital en el desarrollo del cálculo tanto por parte de Leibniz como de
Newton.
328 Capı́tulo 13. Ecuaciones diferenciales de segundo orden. Algunas funciones especiales
∞
donde r (que puede ser cero) es un parámetro indicial por determinar y a0 = 0. Vamos
a tratar primero el caso b(x) = b0 , c(x) = c0 , donde b0 y c0 son constantes:
02. Georg Frobenius (1849-1917), matemático alemán, también conocido por su trabajo en álgebra
matricial. Organizó en 1878 en una monografı́a la teorı́a de matrices en su forma actual.
13.3. El método de Frobenius 329
En esta ecuación, el coeficiente de cada potencia de x tiene que ser cero de manera que,
para el coeficiente de xr ,
r(r − 1) + b0 r + c0 = 0 . (13.8)
Esto se denomina ecuación indicial, y sus raı́ces son los valores posibles del parámetro
r en (13.4).
1 1
(i) x2 y − xy + y = 0
2 2
r 1
La ecuación indicial es r(r − 1) − + = 0 con raı́ces r1 = 1 y r2 = 1/2.
2 2
(ii) x2 y − xy + y = 0
La ecuación indicial es r(r − 1) − r + 1 = (r − 1)2 = 0 con raı́z doble r1 = r2 = 1.
(iii) x2 y + xy + y = 0
La ecuación indicial es r(r − 1) + r + 1 = 0 con raı́ces complejas ±i.
Cuando en (13.3) b(x) y c(x) no son constantes, b0 y c0 son, respectivamente, los términos
constantes de sus desarrollos en potencias de x.
Una vez determinados los valores del parámetro indicial, la resolución de la ecuación
diferencial puede seguir como en el método de series de potencias. La solución general
es
donde c1 y c2 son constantes arbitrarias, e y1 (x) e y2 (x) son soluciones particulares inde-
pendientes. Al menos una de las dos, y1 (x) o y2 (x), tiene la forma (13.4) y la otra depende
de las soluciones de la ecuación indicial, r1 y r2 . Tenemos los tres casos siguientes.
330 Capı́tulo 13. Ecuaciones diferenciales de segundo orden. Algunas funciones especiales
y1 (x) = xr (a0 + a1 x + a2 x2 + · · · ) ,
1
(13.10a)
y2 (x) = xr (A0 + A1 x + A2 x2 + · · · ) .
2
(13.10b)
2 Raı́z doble
y la otra solución es
y1 (x) = xr (a0 + a1 x + a2 x2 + · · · ) ,
1
(13.12a)
y la otra solución es
siendo l un número real. Esta ecuación aparece siempre que se formula un problema
fı́sico en tres dimensiones usando coordenadas esféricas r, θ y φ (véase el Apartado
10.2), en cuyo caso la variable x se sustituye por cos θ. Son de interés en las ciencias
fı́sicas las soluciones finitas en el intervalo −1 ≤ x ≤ +1 (correspondiendo a 0 ≤ θ ≤
π).
La ecuación (13.13) puede resolverse por el método de series de potencias del modo
descrito en el Ejemplo 13.2. Se sustituyen en (13.13) la serie de potencias
y= am x m = a0 + a1 x + a 2 x 2 + · · · (13.14)
m
13.4. La ecuación de Legendre 331
Convergencia
Consideramos primero el caso de valores de l no enteros. Ambas series tienen radio
de convergencia R = 1 para valores de l arbitrarios. En efecto, por la ecuación (13.15)
la razón de dos términos consecutivos es
am m(m + 1) − l(l + 1)
= → 1 cuando m → ∞
am+2 (m + 1)(m + 2)
de manera que por el criterio del cociente de d’Alembert para series de potencias (7.17),
ambas series convergen si |x| < 1 y divergen si |x| > 1 (salvo que l sea un entero, ver
más abajo). Ambas series también divergen si x = ±1 (x2 = 1). La función (13.16), con
dos constantes arbitrarias, es por lo tanto la solución general de la ecuación de Legendre
en el intervalo −1 < x < 1. Es posible también hallar una solución en potencias inversas
de x que es válida para |x| > 1.
332 Capı́tulo 13. Ecuaciones diferenciales de segundo orden. Algunas funciones especiales
Polinomios de Legendre
La función (13.17) queda reducida a un polinomio de grado l si l es un entero par
o cero. Por ejemplo, si l = 2, la serie se termina después del segundo término para
dar y1 (x) = 1 − 3x2 . Entonces, tomando a1 = 0 en (13.16) se obtiene una solución
particular para valores de l pares que es finita para todo valor de x. Igualmente, la función
(13.18) queda reducida a un polinomio de grado l si l es un entero impar, y tomando
a0 = 0 en (13.16) se obtiene una solución particular que es válida para todo valor de
x. Las mismas ideas se aplican para valores enteros de l negativos, pero el conjunto
de polinomios que resulta es idéntico al obtenido para cero y valores positivos. Estas
soluciones particulares se llaman polinomios de Legendre Pl (x), y son las soluciones
de la ecuación de Legendre de interés en las ciencias fı́sicas.3 Por convenio, la constante
arbitraria no nula de (13.16) se escoge de manera que Pl (1) = 1. Entonces, para l =
0, 1, 2, 3, . . . , tenemos
1 · 3 · 5 · · · (2l − 1)
Pl (x) =
l!
l(l − 1) l−2 l(l − 1)(l − 2)(l − 3) l−4
× x − l
x + x − ··· (13.19)
2(2l − 1) 2 · 4(2l − 1)(2l − 3)
y hay que seguir la serie hasta llegar al término constante. Los primeros de estos polino-
mios son
P0 (x) = 1 , P1 (x) = x ,
1 1
P2 (x) = (3x2 − 1) , P3 (x) = (5x3 − 3x) , (13.20)
2 2
1 1
P4 (x) = (35x4 − 30x2 + 3) , P5 (x) = (63x5 − 70x3 + 15x) .
8 8
EJEMPLO 13.4 Demuestre que el polinomio P3 (x) es una solución de la ecuación de Legendre (13.13)
para l = 3.
Tenemos
1 3 3 2
y = P3 (x) = (5x − 3x) , y = (5x − 1) , y = 15x .
2 2
03. Adrien-Marie Legendre (1752-1833) tiene el dudoso merecimiento de la siguiente nota al pie en
el libro Hombres de matemáticas de E. T. Bell: ‘Consideraciones de espacio me impiden dar una visión de
su vida. Sus mejores trabajos fueron en muchos casos superados o evitados por matemáticos más jóvenes’.
Los polinomios aparecieron en las Recherches sur l’attraction des sphéroı̈des homogènes de Legendre en
1785 como los coeficientes del desarrollo de la función potencial (1 − 2h cos θ + h2 )−1/2 en potencias
de h. Su libro de texto Éléments de géométrie de 1794 hizo mucho por la reforma de la enseñanza de la
geometrı́a (hasta entonces basada en Euclides) y una edición americana, ‘el Legendre de Davies’ (1851),
fue influyente en los Estados Unidos.
13.4. La ecuación de Legendre 333
3 1
(1 − x2 )y − 2xy + l(l + 1)y = (1 − x2 ) × 15x − 2x × (5x2 − 1) + 3 × 4 × (5x3 − 3x)
2 2
= (– 15 − 15 + 30)x3 + (15 + 3 − 18)x = 0 .
de manera que dados P0 (x) = 1 y P1 (x) = x, se deducen todos los polinomios siguientes.
EJEMPLO 13.5 Use la relación de recurrencia (13.21) para hallar P2 (x) y P3 (x).
Para l = 1 la relación (13.21) es 2P2 − 3xP1 + P0 = 0. Por lo tanto,
1 1
P2 = (3xP1 − P0 ) = (3x2 − 1) .
2 2
Para l = 1 la relación (13.21) es 3P3 − 5xP2 + 2P1 = 0. Por lo tanto,
1 1 1 1
P3 = (5xP2 − 2P1 ) = 5x × (3x2 − 1) − 2x = (5x3 − 3x) .
3 3 2 2
d|m|
P|m|
l (x) = (1 − x )
2 |m|/2
Pl (x) (13.24)
dx|m|
con P0l = Pl .
334 Capı́tulo 13. Ecuaciones diferenciales de segundo orden. Algunas funciones especiales
EJEMPLO 13.6 Use la fórmula (13.24) para obtener las funciones asociadas de Legendre Pm3 (x) para
m = 1, 2 y 3, y expréselas como funciones θ si x = cos θ y (1 − x2 )1/2 = sen θ.
Tenemos
1 3 3 2
y = P3 (x) = (5x − 3x) , y = (5x − 1) , y = 15x , y = 15 .
2 2
Entonces
3 3
P13 (x) = (1 − x2 )1/2 (5x2 − 1) , P13 ( cos θ) = sen θ(5 cos2 θ − 1) ,
2 2
P23 (x) = 15(1 − x2 )x , P23 ( cos θ) = 15 sen2 θ cos θ ,
Ortogonalidad y normalización
Vimos en el Apartado 12.6 que las soluciones de la ecuación de Schrödinger para una
partı́cula en un pozo son funciones ortogonales (ecuación (12.58)). La ortogonalidad es
una propiedad que cumplen las soluciones de un tipo de ecuaciones diferenciales lineales
llamadas ecuaciones de Sturm-Liouville que incluye a la ecuación de Legendre. Los
polinomios de Legendre son ortogonales en el intervalo −1 ≤ x ≤ 1:
+1
En este caso, P1 (x) es una función impar de x mientras que P2 (x) es una función par. El integrando es impar
y la integral es cero (véase el Apartado 5.3).
+1
1 +1 1 5 +1 1
(b) P1 (x)P3 (x) dx = (5x4 − 3x2 ) dx = x − x3 = 0 − 0 = 0.
−1 2 −1 2 −1 2
En este caso tanto P1 como P3 son funciones impares de manera que la ortogonalidad de las funciones es
una propiedad nueva y no una consecuencia de la paridad/imparidad.
P|m| |m|
l (x)Pl (x) dx = 0 si l = l . (13.26)
−1
13.5. La ecuación de Hermite 335
Además, si l = l ,
+1 2 2 (l + |m|)!
P|m|
l (x) dx = (13.27)
−1 (2l + 1) (l − |m|)!
con la propiedad
+1
1 si l = l ,
Θl,m (x)Θl ,m (x) dx = δl,l = (13.29)
−1 0 si l = l .
H0 (x) = 1 , H1 (x) = 2x ,
H2 (x) = 4x2 − 2 , H3 (x) = 8x3 − 12x , (13.32)
H4 (x) = 16x4 − 48x2 + 12 , H5 (x) = 32x5 − 160x3 + 120x .
Funciones de Hermite
son soluciones particulares de (13.34). Estas funciones son finitas para todo valor de x y
ortogonales, cumpliendo la propiedad
+∞ +∞
√
ym (x)yn (x) dx = e−x Hm (x)Hn (x) dx = 2n n! πδm,n .
2
(13.37)
−∞ −∞
Las funciones de Hermite tienen importancia en quı́mica por ser las autofunciones del
problema mecánico-cuántico del oscilador armónico. Las gráficas de las tres primeras
funciones (normalizadas) se muestran en la Figura 13.1.
13.6. La ecuación de Laguerre 337
Figura 13.1
2 √
EJEMPLO 13.8 Demuestre que la función de Hermite e−αx /2 Hn ( αx), siendo α = km/2 , es una
solución de la ecuación de Schrödinger para el oscilador armónico
2 d 2 ψ 1
− 2
+ kx2 ψ = Eψ .
√ √ 2m dx 2
Sea z = αx. Entonces para ψ = ψ( αx) = ψ(z),
dψ dψ dz √ dψ √ d2 ψ
= = α = α ψ , = αψ .
dx dz dx dz dx2
Con esto
2 k 2
− αψ + z ψ = Eψ .
2m 2α
Dividiendo ambos miembros por − α/2m y recordando que α = mω/, donde ω = k/m es la fre-
2
donde n es un número real, tiene una solución en serie de potencias que, si n es un entero
positivo o cero, es un polinomio de grado n llamado polinomio de Laguerre Ln (x):
n2 n−1 n2 (n − 1)2 n−2
Ln (x) = (– 1) x − x +
n n
x − · · · + (– 1) n!
n
(13.39)
1! 2!
L0 (x) = 1 , L1 (x) = 1 − x ,
(13.40)
L2 (x) = 2 − 4x + x2 , L3 (x) = 6 − 18x + 9x2 − x3 .
y tiene soluciones polinómicas cuando n y m son ambos enteros positivos o cero, sien-
do m ≤ n. Esas soluciones son los polinomios asociados de Laguerre Lnm (x). Están
relacionados con los polinomios de Laguerre mediante la expresión diferencial
dm
Lnm (x) = Ln (x) . (13.43)
dxm
Los polinomios asociados de Laguerre aparecen en la resolución de la parte radial de la
ecuación de Schrödinger para el átomo de hidrógeno (Apartado 14.6), y lo hacen bajo la
forma de funciones asociadas de Laguerre
2n{(n + l)!}
3
= δn,n . (13.46)
(n − l − 1)!
13.7. Funciones de Bessel 339
siendo n un número real. Esta ecuación tiene en las ciencias fı́sicas la misma importancia
que la de Legendre, si bien aparece menos frecuentemente en quı́mica que en fı́sica y en
ingenierı́a. Las funciones de Bessel se dan, por ejemplo, en las soluciones de la ecuación
de ondas clásica para las vibraciones de una membrana circular o esférica, y las mismas
soluciones se encuentran para la ecuación de Schrödinger para una partı́cula en un pozo
circular o en un pozo esférico. Las funciones son importantes en la formulación de la
teorı́a de los procesos de difusión.
Una vez dividida por x2 , la ecuación (13.47) es del tipo (13.3) y se resuelve por el
método de Frobenius, es decir, expresando la solución en la forma (13.4)
y(x) = xr (a0 + a1 x + a2 x2 + · · · ) .
Se demuestra que los valores posibles de r son r = ±n, y las dos soluciones particulares
para esos valores de r son
x2 x4
y1 (x) = a0 x 1 −
n
+ − ··· , (13.48)
2(2n + 2) 2 · 4(2n + 2)(2n + 4)
x2 x4
y2 (x) = a0 x −n
1+ + + ··· . (13.49)
2(2n − 2) 2 · 4(2n − 2)(2n − 4)
Los valores importantes del parámetro n son los valores enteros y los semienteros.
1 x 2 1 x 4 1 x 6
J0 (x) = 1 − + − + ··· (13.51)
(1!)2 2 (2!)2 2 (3!)2 2
x 1 x 3 1 x 5 1 x 7
J1 (x) = − 2+ − + ··· (13.52)
2 1! 2! 2 2! 3! 2 3! 4! 2
y mostramos sus gráficas en la Figura 13.2
Figura 13.2
Tanto los desarrollos como las gráficas muestran que las funciones de Bessel tienen
propiedades similares a las de las funciones trigonométricas. Sin embargo, los ceros de
las funciones, los valores de x para los cuales Jn (x) = 0, no están igualmente espaciados
de manera que las funciones no tienen una longitud de onda determinada. Algunos de
los ceros son (con 3 cifras decimales)
Para valores de n positivos la solución particular (13.49) es J−n (x) y puede demostrarse
que está relacionada con Jn (x) mediante J−n (x) = (– 1)n Jn (x). El método de series de po-
tencias proporciona por lo tanto una única solución particular para valores de n enteros.
13.8. Ejercicios 341
Se puede hallar una segunda solución: es la función de Bessel de segunda especie Yn (x),
de menor importancia en aplicaciones fı́sicas.
y todas las demás pueden obtenerse por la relación de recurrencia (válida para funciones
de Bessel en general)
2n
Jn+1 (x) − Jn (x) + Jn−1 (x) = 0 . (13.56)
x
EJEMPLO 13.9 Use la relación de recurrencia (13.56) y las fórmulas (13.55) para deducir las funciones
de Bessel J±3/2 (x).
1
J3/2 (x) − J1/2 (x) + J−1/2 = 0
x
de manera que
1 2 sen x
J3/2 (x) = J1/2 (x) − J−1/2 (x) = − cos x .
x πx x
De manera similar, tomando n = −1/2 en (13.56),
1 2 cos x
J−3/2 (x) = − J−1/2 (x) − J1/2 (x) = − + sen x .
x πx x
Las funciones de órdenes semienteros son las funciones de Bessel que aparecen en el
método de ondas parciales en la teorı́a de procesos de difusión. En ese caso se presentan
en la forma
π π
jl (x) = Jl+1/2 (x) , ηl (x) = (– 1) l+1
J−l−1/2 (x) , (13.57)
2x 2x
con l ≥ 0. Las funciones jl se llaman funciones de Bessel esféricas de orden l, las fun-
ciones ηl son las funciones de Neumann esféricas. Estas funciones aparecen a menudo
junto con los polinomios de Legendre cuando se formula un sistema fı́sico en coordena-
das esféricas.
342 Capı́tulo 13. Ecuaciones diferenciales de segundo orden. Algunas funciones especiales
13.8. Ejercicios
Apartado 13.2
Use el método de series de potencias para resolver las ecuaciones:
a
1. (1 − x)y = y. Compruebe que la solución puede expresarse como y = para |x| < 1.
1−x
2. y − 9y = 0. Compruebe que la solución puede expresarse como y = ae3x + be−3x .
3. (1 − x2 )y − 2xy + 2y = 0 (esta
es la ecuación
de Legendre para n = 1). Demuestre que la solución
x 1−x
puede escribirse como y = a1 + a0 1 + ln para |x| < 1.
2 1+x
4. y − xy = 0 (ecuación de Airy).
Apartado 13.3
Para cada una de las ecuaciones siguientes, (i) halle la ecuación indicial y resuélvala, y (ii) dé la forma de
la solución general y = c1 y1 + c2 y2 (ecuaciones (13.10), (13.11) o (13.12)):
Apartado 13.4
9. Confirme que los polinomios P4 (x) y P5 (x) son soluciones de la ecuación de Legendre para l = 4 y
l = 5, respectivamente.
10. Use la relación de recurrencia (13.21) para hallar P6 (x) a partir de P4 (x) y P5 (x).
−1/2
11. Desarrolle la función 1 − 2xh + h2 en potencias de h hasta términos en h3 , y demuestre que el
coeficiente de h es Pn (x), para n = 0, 1, 2, 3.
n
12. Use la fórmula (13.24) para hallar las funciones asociadas de Legendre Pm4 (x) para m = 1, 2, 3, 4.
Expréselas en función de cos θ = x y sen θ = (1 − x2 )1/2 .
Apartado 13.6
13. Use la relación de recurrencia (13.33) para hallar H6 (x). Esboce la gráfica de la función de Hermite
2
e−x /2 H6 (x).
Apartado 13.7
14. Halle, y resuelva, la ecuación indicial para la ecuación de Bessel (13.47).
15. Confirme que J1/2 (x) y J−1/2 (x), ecuaciones (13.55), son las soluciones de la ecuación de Bessel para
|n| = 1/2.
Ecuaciones en derivadas parciales
14.1. Conceptos
Una ecuación que contiene derivadas parciales es una ecuación en derivadas par-
ciales. Por ejemplo, si f es función de las variables independientes x e y, toda ecuación
que contenga ∂f /∂x o ∂f /∂y, o derivadas de orden superior, y también f , x o y, es una
ecuación en derivadas parciales. Algunos ejemplos importantes en las ciencias fı́sicas
son
∂2f 1 ∂2f
1. = ecuación de ondas en una dimensión
∂x2 v2 ∂t2
∂f
2
1 ∂f
2. = ecuación de difusión en una dimensión
∂x 2
D ∂t
∂f
2
∂2f ∂2f
3. + + = ∇2 f = 0 ecuación de Laplace en tres dimensiones
∂x2 ∂y2 ∂z2
4. ∇2 f = g(x, y, z) ecuación de Poisson en tres dimensiones
2
2
5. − ∇ ψ + V(x, y, z)ψ = Eψ ecuación de Schrödinger independiente
2m
del tiempo
2 2 ∂ψ
6. − ∇ ψ + V(x, y, z)ψ = i ecuación de Schrödinger dependiente
2m ∂t
del tiempo
las vibraciones de una cuerda elástica, como una cuerda de guitarra (Apartado 14.7).
Estos ejemplos ilustran varios principios importantes en la resolución de ecuaciones en
derivadas parciales. Muestran cómo condiciones de contorno o iniciales diferentes pue-
den conducir a tipos muy diferentes de soluciones particulares, cómo las propiedades
de simetrı́a del sistema representado pueden conducir al fenómeno de degeneración, y
cómo, en algunos casos, las soluciones se expresan en forma de ‘desarrollos ortogonales’
presentados en el Capı́tulo 15.
∂ 2f 1 ∂2f
= , (14.1)
∂x2 v2 ∂t2
tiene como solución
∂f dF ∂u dF ∂2f d2 F
= = , = ,
∂x du ∂x du ∂x2 du2
∂f dF ∂u dF ∂2f 2
2d F
= =v , = v ,
∂t du ∂t du ∂t2 du2
por lo que se cumple la ecuación (14.1). La solución general de la ecuación es
01. Esta forma de la solución general la obtuvo por primera vez d’Alembert en 1747. Los orı́genes
de la ecuación de ondas están en el tratado De motu nervi tensi (Sobre el movimiento de una cuerda tensa)
de Brook Taylor en 1713. En 1727 Johann Bernoulli sugirió a su hijo Daniel que retomase el problema de
14.3. Separación de variables 345
∂f ∂2f ∂f ∂2f
= 6x − 2vt , = 6; = −2xv + 6v2 t , = 6v2 .
∂x ∂x2 ∂t ∂t2
Por lo tanto, se cumple
∂2f 1 ∂2f
6= = 2 2 ,
∂x 2 v ∂t
como era necesario. La función puede expresarse en la forma
Taylor: ‘Para una cuerda musical, de longitud y peso dados, tensada por un peso dado, hallar sus vibra-
ciones’. D’Alembert dedujo la ecuación en Recherches sur la courbe que forme une corde tendue mise en
vibration, 1747, considerando la cuerda compuesta por masas infinitesimales y aplicando la ley de Newton
de las fuerzas a cada elemento de masa. Euler publicó su propia solución en Sur la vibration des cordes en
1750, y Daniel Bernoulli exploró la idea de superposición de modos normales en sus Réflexions et éclaircis-
sements en 1755. El debate sobre los tipos de funciones aceptables como soluciones de la ecuación de ondas
continuó durante unos treinta años entre los tres autores, sin que ninguno se dejase convencer por los otros
dos. El problema fue resuelto gracias a los trabajos de Fourier, de Dirichlet, de Riemann y de Weierstrass
en los siguientes cien años, y necesitó que se reconsiderase el significado de función, de continuidad y de
convergencia.
346 Capı́tulo 14. Ecuaciones en derivadas parciales
∂f ∂f
+ = 0. (14.4)
∂x ∂y
Vamos a ver que una solución de esta ecuación puede escribirse como
donde la solución, que es una función de las dos variables x e y, se expresa como producto
de una función sólo de x y otra función sólo de y. Tenemos
∂f ∂(XY) dX
= =Y ,
∂x ∂x dx
ya que Y(y) no depende de x. Del mismo modo,
∂f dY
=X ,
∂y dy
dX(x) dY(y)
Y(y) + X(x) = 0, (14.6)
dx dy
El primer término entre corchetes del primer miembro de (14.7) depende sólo de la
variable x, el segundo sólo de y. Puesto que el total es constante (cero en este caso) se
deduce que cada uno de esos términos debe ser una constante por separado, si x e y son
variables independientes. En efecto, una variación en el valor de x no puede conducir a
una variación en el valor del término que sólo depende de y, y viceversa. Por lo tanto, si
el primer término es igual a una constante C, el segundo es igual a −C (para que el total
sea cero):
1 dX 1 dY
= C, = −C , (14.8)
X dx Y dy
dX
= CX (14.9)
dx
dY
= −CY (14.10)
dy
2 2
− ∇ ψ(x, y) + V(x, y)ψ(x, y) = Eψ(x, y) (14.13)
2m
donde
∂2 ∂2
∇2 = + (14.14)
∂x2 ∂y2
1 d2 X 1 d2 Y 2mE
+ =− 2 . (14.19)
X dx 2
Y dy2
El término que sólo depende de x tiene que ser constante, y el término que sólo depende
de y tiene que ser también constante. Por lo tanto,
1 d2 X 1 d2 Y
= Cx , = Cy , (14.20)
X dx2 Y dy2
h2 p 2 h2 q 2
Ep = y Eq = (14.25)
8ma2 8mb2
deben ser interpretadas como las energı́as cinéticas de los movimientos a lo largo de las
direcciones x e y, respectivamente.
h2
Ep,q = (p2 + q2 ) (14.26)
8ma2
y los autovalores para p = q se dan por parejas con Ep,q = Eq,p : por ejemplo, E1,2 =
E2,1 = 5h2 /8ma2 . Los estados del sistema con la misma energı́a se denominan estados
degenerados.
350 Capı́tulo 14. Ecuaciones en derivadas parciales
2 pπx qπy
ψp,q (x, y) = sen sen (14.27)
a a a
e intercambiando las coordenadas x e y tenemos
2 pπy qπx
ψp,q (y, x) = sen sen = ψq,p (x, y) (14.28)
a a a
es decir, las autofunciones degeneradas se han intercambiado (si p = q).* En la Figura
14.2 se representan las simetrı́as de algunas de las funciones de onda.
Figura 14.2
Las lı́neas discontinuas son lı́neas nodales, en las cuales la función es cero. Vemos,
por ejemplo, que ψ1,2 y ψ2,1 son idénticas salvo por la orientación.
2 2
− ∇ ψ(x, y) + V(x, y)ψ(x, y) = Eψ(x, y) (14.29)
2m
como en el Apartado 14.4, pero con una función energı́a potencial
√
0 para r = x2 + y2 < a
V(x, y) = (14.30)
∞ en el resto
0* Puede ocurrir también una degeneración ‘accidental’ que no es una consecuencia obvia de la
simetrı́a. Por ejemplo, los estados (7, 1) y (1, 7) son degenerados junto con el estado (5, 5).
14.5. Partı́cula en un pozo circular 351
∂2 1∂ 1 ∂2
∇2 = + + . (14.31)
∂r2 r ∂r r2 ∂θ2
Para la partı́cula en el interior del pozo, con V = 0, la ecuación (14.29) es entonces
2 ∂ 2 ψ 1 ∂ψ 1 ∂2ψ
− + + 2 2 = Eψ (14.32)
2m ∂r2 r ∂r r ∂θ
2mE
α2 = (14.33)
2
y reordenando,
∂2ψ ∂ψ ∂2ψ
r2 + r + α 2 2
r ψ + = 0. (14.34)
∂r2 ∂r ∂θ2
Esta ecuación puede separarse en dos ecuaciones ordinarias expresando la función de
onda como el producto
Cada uno de los términos entre corchetes debe ser constante de manera que, siendo C la
constante de separación, tenemos
d2 R dR
r2 +r + α2 r2 R = CR (14.37)
dr 2
dr
para el movimiento radial de la partı́cula en el pozo, y
d2 Θ
= −CΘ (14.38)
dθ2
para el movimiento angular de la partı́cula. Empezamos por la ecuación angular.
352 Capı́tulo 14. Ecuaciones en derivadas parciales
Ecuación angular
para asegurar la continuidad alrededor del cı́rculo. Se trata por lo tanto del mismo pro-
blema de contorno visto en el Apartado 12.7 para la partı́cula en un aro. Las soluciones
normalizadas son (ecuación (12.69))
1
Θn (θ) = √ einθ , n = 0, ±1, ±2, . . . (14.40)
2π
Ecuación radial
d2 R dR
r2 +r + (α2 r2 − n2 )R = 0 . (14.41)
dr 2
dr
La ecuación se transforma en la ecuación de Bessel (Apartado 13.7) mediante el cambio
de variable x = αr. Tenemos que
dR dR dx dR d2 R 2
2 d R
= =α , = α ,
dr dx dr dx dr2 dx2
con lo cual (14.41) se convierte en la ecuación de Bessel (13.47)
d2 R dR
x2 +x + (x2 − n2 )R = 0 .
dx 2
dx
Si n es un entero positivo o cero, la solución de esta ecuación es la función de Bessel
Jn (x) dada por (13.50), de manera que las soluciones de la ecuación radial son
y los valores de α posibles vienen determinados por los ceros de la función de Bessel,
algunos de los cuales se dan en (13.53) en el Apartado 13.7. Si denotamos los ceros de
14.6. El átomo de hidrógeno 353
Por la ecuación (14.33), la energı́a del sistema viene dada por E = α2 2 /2m, de manera
que la energı́a resulta cuantizada, con valores
αn,k
2
2 x 2 h2
En,k = = n,k 2 , n = 0, ±1, ±2, . . . (14.46)
2m 8ma
y las correspondientes funciones de onda globales son
(las funciones radiales dependen sólo del valor absoluto de n). Las simetrı́as de estas
funciones de onda se representan en la Figura 14.3, utilizando las expresiones reales
(12.71) de las funciones angulares.
Figura 14.3
Señalamos que estos diagramas también representan los modos normales de vibra-
ción, las ondas estacionarias, de una membrana circular (como por ejemplo un tambor).
siendo r la distancia entre las cargas. Suponemos el núcleo fijo en el origen de un sistema
coordenado, con el electrón en la posición (x, y, z). La ecuación de Schrödinger para el
354 Capı́tulo 14. Ecuaciones en derivadas parciales
−Ze2
V(x, y, z) = . (14.50)
4π0 (x2 + y2 + z2 )1/2
Empezamos por simplificar la ecuación expresando todas las cantidades fı́sicas en unida-
des atómicas (véase el Apartado 1.7): la ecuación de Schrödinger ‘en unidades atómicas’
es
1 ∂2ψ ∂2ψ ∂2ψ Z
− + 2 + 2 − 2 ψ = Eψ . (14.51)
2 ∂x 2
∂y ∂z (x + y + z2 )1/2
2
Separación de variables
El primer paso para la resolución de la ecuación en derivadas parciales en tres va-
riables es separarla, es decir, reducirla a tres ecuaciones ordinarias. Esto no es posible
de hacer en coordenadas cartesianas porque la función potencial V no puede expresarse
como una suma de términos cada uno en una sola variable. Existen varios sistemas de
coordenadas, sin embargo, en los cuales la separación es posible. Uno de ellos es el
sistema de coordenadas esféricas presentado en el Capı́tulo 10. El operador laplaciano
es en esas coordenadas (Apartado 10.5)
1 ∂ ∂ 1 ∂ ∂ 1 ∂2
∇2 = 2 r2 + 2 sen θ + 2
r ∂r ∂r r sen θ ∂θ ∂θ r sen θ ∂φ2
2
Empezamos por separar los términos radiales de los términos angulares expresando la
función de onda como el producto
Tomamos la constante de separación como l(l+1) por motivos que se verán más adelante.
Con esto la ecuación radial para el átomo de hidrógeno es
1 d 2 dR
r + 2Zr + 2Er2 = l(l + 1)
R dr dr
o bien
1 d 2 dR l(l + 1) 2Z
r + − + + 2E R = 0 (14.55)
r2 dr dr r2 r
y la ecuación angular es
1 ∂ ∂Y 1 ∂2Y
sen θ + + l(l + 1)Y = 0 . (14.56)
sen θ ∂θ ∂θ sen2 θ ∂φ2
d2 Φ(φ)
= −m2 Φ(φ) , (14.59)
dφ2
1 d dΘ m2
sen θ + l(l + 1) − Θ = 0. (14.60)
sen θ dθ dθ sen2 θ
Ecuación para Φ
d2 Φ(φ)
= −m2 Φ(φ) . (14.59)
dφ2
para asegurar la continuidad alrededor del cı́rculo. Se trata por lo tanto del mismo pro-
blema de contorno visto en el Apartado 12.7 para la partı́cula en un aro y en 14.5 para el
movimiento angular de una partı́cula en un pozo circular. Las soluciones normalizadas
son
1
Φm (φ) = √ eimφ , m = 0, ±1, ±2, . . . (14.62)
2π
1 1 1 1
√ (Φm + Φ−m ) = √ cos mφ , √ (Φm − Φ−m ) = √ sen mφ (14.63)
2 2 π i 2 2 π
Ecuación para Θ
1 d dΘ m2
sen θ + l(l + 1) − Θ = 0. (14.60)
sen θ dθ dθ sen2 θ
d2 Θ dΘ 2 d Θ
2
2 d Θ
2
dΘ
= − cos θ + sen θ = (1 − x ) −x .
dθ 2
dx dx 2
dx 2
dx
Por lo tanto
1 d dΘ d2 Θ cos θ dΘ 2 d Θ
2
dΘ
sen θ = + = (1 − x ) − 2x
sen θ dθ dθ dθ 2
sen θ dθ dx 2
dx
Armónicos esféricos
Los productos de las funciones angulares Θl,m y Φm ,
2l + 1 (l − |m|)! |m|
Yl,m (θ, φ) = Θl,m (θ)Φm (φ) = P ( cos θ) eimφ , (14.68)
4π (l + |m|)! l
1 1
√ (Yl,m + Yl,−m ) , √ (Yl,m − Yl,−m ) , m > 0. (14.69)
2 i 2
Momento angular
La ecuación angular (14.56) puede escribirse como la ecuación de autovalores (en
unidades apropiadas)
0* Los armónicos esféricos se definen a menudo con un ‘factor de fase’ adicional (– 1)(m+|m|)/2 que
multiplica la función por (– 1) cuando m es impar y positivo.
358 Capı́tulo 14. Ecuaciones en derivadas parciales
Tabla 14.1
1/2 1/2
1 1
Y0,0 = s=
4π 4π
1/2 1/2
3 3
Y1,0 = cos θ pz = z
4π 4π
1/2 1/2 1/2
3 3 3
Y1,±1 = sen θe±iφ px = x , py = y
8π 4π 4π
1/2 1/2
5 5
Y2,0 = (3 cos2 θ − 1) dz2 = (3z2 − r2 )
16π 8π
1/2 1/2 1/2
15 15 15
Y2,±1 = sen θ cos θe±iφ dxz = xz , dyz = yz
8π 4π 4π
1/2 1/2 1/2
15 15 15
Y2,±2 = sen2 θe±2iφ dx2 −y2 = (x2 − y2 ) , dxy = xy
32π 16π 4π
1 ∂ ∂ 1 ∂2
− 2
sen θ + Yl,m = l(l + 1)2 Yl,m (14.71)
sen θ ∂θ ∂θ sen2 θ ∂φ2
o bien
donde L2 es el operador cuántico para el cuadrado del momento angular. Los armóni-
cos esféricos son por lo tanto autofunciones de L2 . Describen los estados posibles del
momento angular del sistema, y los autovalores l(l + 1)2 son los valores permitidos del
cuadrado del momento angular. Además, de la ecuación (14.62) se deduce que
dΦm
−i = mΦm
dφ
∂Yl,m
−i = mYl,m (14.73)
∂φ
o bien
Ecuación radial
1 d 2 dR l(l + 1) 2Z
r + − + + 2E R = 0. (14.55)
r2 dr dr r2 r
Esta ecuación tiene dos conjuntos de soluciones para el átomo de hidrógeno. En los es-
tados ligados del átomo el electrón resulta confinado a las proximidades del núcleo por
aplicarse la condición de contorno R(r) → 0 cuando r → ∞. Las energı́as de esos esta-
dos son negativas (el cero de energı́a corresponde a dos cargas en reposo infinitamente
separadas) y hay que aportar energı́a al sistema para ionizar el átomo. Los estados con
energı́a positiva son estados de colisión (estados del continuo) en los que el electrón se
mueve libremente en presencia del núcleo pero no está ligado a él. Vamos a considerar
aquı́ únicamente los estados ligados, con E < 0. Tomamos
Z
α2 = −2E , λ= , (14.75)
α
y definimos la nueva variable
ρ = 2αr . (14.76)
dR dR d2 R 2
2d R
Entonces = 2α , = 4α , y la ecuación radial se transforma en
dr dρ dr2 dρ2
d2 R 2 dR l(l + 1) λ 1
+ + − + − R=0 (14.77)
dρ2 ρ dρ ρ2 ρ 4
que es idéntica a la ecuación (13.45) para las funciones asociadas de Laguerre, con
λ = n un entero positivo. Las soluciones de la ecuación vienen dadas por lo tanto por la
ecuación (13.44)
e−ρ/2 ρl Ln+l
2l+1
(ρ) .
Estas funciones son finitas y continuas para todo valor de ρ positivo, y por lo tanto
de r, y cumplen las condiciones de contorno para los estados ligados. Las funciones
pueden ser normalizadas, utilizando la ecuación (13.46), y las funciones de onda radiales
normalizadas que se obtienen son*
0* Por convenio, las funciones radiales (14.78) se definen con un signo negativo como parte de la
constante de normalización.
360 Capı́tulo 14. Ecuaciones en derivadas parciales
3 1/2
2Z (n − l − 1)!
Rn,l (r) = − e−ρ/2 ρl Ln+l
2l+1
(ρ) (14.78)
2n{(n + l)!}
3
n
2Z
ρ= r (14.79)
n
y los valores permitidos de los números cuánticos son
n = 1, 2, 3, . . . l = 0, 1, 2, . . . , (n − 1) . (14.80)
Las funciones radiales forman un conjunto ortonormal con respecto a la función peso r2
en el intervalo 0 ≤ r ≤ ∞ :
∞
Rn,l (r) Rn,l (r) r2 dr = δn,n . (14.81)
0
En la Figura 14.4 dibujamos sus gráficas. El número de nodos radiales (superficies esféri-
cas nodales de la función de onda global) es n − l − 1, sin contar el cero en r = 0 si
l > 0.
14.6. El átomo de hidrógeno 361
Figura 14.4
Energı́a
Los valores permitidos de la energı́a se obtienen a partir de (14.75): si λ = n, α =
Z/n y E = −α2 /2. Por lo tanto
Z2
En = − , n = 1, 2, 3, . . . (14.82)
2n2
El número n se llama número cuántico principal.
La función de onda global
Las soluciones globales de la ecuación de Schrödinger para los estados ligados del
átomo hidrogenoideo son
ψ ∗
n,l,m ψn,l,m dv = ψn,l,m
∗
(r, θ, φ) ψn,l,m(r, θ, φ) r2 sen θ dr dθ dφ
0 0 0
En la Figura 14.5 se representan las funciones de onda globales, los orbitales atómicos,
mediante diagramas de curvas de nivel en un plano apropiado que contiene al núcleo.*
Los trazos continuos representan valores positivos de los orbitales, los discontinuos va-
lores negativos y los punteados nodos. Señalamos que las funciones de onda ψn,l,m con
0* Los diagramas de la Figura 14.5 están a escala en cuadrados de 20 (a0 ) de lado. Los valores de las
curvas de nivel son ±0,002 × 2i , i = 0, 1, 2, 3, . . .
362 Capı́tulo 14. Ecuaciones en derivadas parciales
energı́a En tienen un total de (n − 1) superficies nodales. Son estos diagramas los que
han llevado a la representación pictórica convencional de los orbitales atómicos.
Figura 14.5
Consideramos una cuerda elástica, como una cuerda de guitarra por ejemplo, de lon-
gitud l y densidad de masa lineal uniforme ρ, estirada y fijada en los extremos con una
tensión T. Si deformamos transversalmente la cuerda
(pulsándola hacia un lado), la soltamos, y le permitimos
vibrar (Figura 14.6), su desplazamiento transversal es en-
tonces una función de la posición x y del tiempo t,
y = y(x, t) , (14.85)
∂2y 1 ∂2y
= (14.86)
∂x2 v2 ∂t2
donde v2 = T/ρ. Las condiciones de frontera e iniciales que se aplican a las soluciones
de la ecuación son
Separación de variables
Escribimos la función del desplazamiento (una función de onda) como el producto
1 d2 F 1 d2 G
= . (14.90)
F dx2 Gv2 dt2
Ambos miembros de la ecuación deben ser constantes de manera que, tomando la cons-
tante de separación −λ2 , el problema en dos variables se reduce al problema de contorno
d2 F
+ λ2 F = 0 , F(0) = F(l) = 0 , (14.91)
dx2
y al problema de valor inicial
d2 G
+ λ2 v2 G = 0 (14.92)
dt2
con condiciones iniciales dadas por (14.88), siendo f (x) y g(x) unas funciones dadas.
El problema de contorno es idéntico al visto en el Apartado 12.6 para una partı́cula
en un pozo. Los valores permitidos de la constante de separación vienen dados por
nπ
λn = , n = 1, 2, 3, . . . (14.93)
l
y las correspondientes soluciones particulares (no normalizadas) son
nπx
Fn (x) = sen . (14.94)
l
Para cada valor de λn , la ecuación (14.92) es
d2 G
+ ωn2 G = 0 (14.95)
dt2
364 Capı́tulo 14. Ecuaciones en derivadas parciales
donde
nπv
ωn = λn v = (14.96)
l
y su solución es
Figura 14.7
El modo n-ésimo tiene n − 1 nodos entre los extremos, es decir, puntos con desplaza-
miento cero que no se mueven. Las soluciones (14.98) representan ondas estacionarias.
La solución completa
Cada uno de los modos normales contiene dos constantes, An y Bn , que hay que fijar
según las condiciones iniciales (14.88), es decir, según se inicia el movimiento. Es po-
sible elegir las condiciones iniciales de manera que el movimiento sea el de uno de los
14.8. Ejercicios 365
En general, sin embargo, un único modo no cumple las condiciones iniciales: el movi-
miento no es un modo normal puro sino una mezcla o superposición de modos normales.
Para obtener la solución en el caso general, usamos el principio de superposición
presentado en el Apartado 12.2: si y1 , y2 , y3 , . . . son soluciones de una ecuación lineal
homogénea, cualquier combinación lineal de ellas es también una solución. Ası́, para
cada modo normal tenemos
∂ 2 yn 1 ∂ 2 yn
= (14.100)
∂x2 v2 ∂t2
de manera que si
y = c1 y1 + c2 y2 + c3 y3 + . . . (14.101)
entonces
∂2y 1 ∂2y
= . (14.102)
∂x2 v2 ∂t2
La solución general de la ecuación de ondas que cumple las condiciones de contorno es
por lo tanto una superposición de modos normales
nπx
∞
∞
nπx
y(x, 0) = f (x) = An sen ,
n=1
l
∞
(14.104)
∂y nπx
= g(x) = Bn ωn sen .
∂t t=0 n=1
l
Las dos series de (14.104) son ejemplos de las series de Fourier que trataremos en el
Capı́tulo 15. Volveremos a este problema en el Apartado 15.5 para determinar los An y
Bn para funciones iniciales tı́picas f (x) y g(x).
366 Capı́tulo 14. Ecuaciones en derivadas parciales
14.8. Ejercicios
Apartado 14.2
1. Demuestre que la función f (x, t) = a sen (bx) cos (vbt) cumple la ecuación de ondas en una dimensión
(14.1), y que es de la forma
f (x, t) = F(x + vt) + G(x − vt) .
2. La ecuación de difusión
∂f ∂2f
=D 2
∂t ∂x
representa, por ejemplo, la transmisión de calor por conducción de una región caliente a una región frı́a
si f es la temperatura, o la transmisión de materia de una región con concentraciones altas a una con
concentraciones bajas si f es la concentración. Halle todas las posibles soluciones de la ecuación que tengan
la forma
f (x, t) = a + bect V(x) .
3. (i) En el Ejemplo 14.2 se demuestra que la función
f (x, t) = a exp −b(x − vt)2
es una solución de la ecuación de ondas (14.1). Dibujando las gráficas de f en función de x para los instantes
t = 0, t = 2/v y t = 4/v (tomando, por ejemplo, a = b = 1), demuestre que la función representa una
onda (una onda gaussiana) que viaja hacia la derecha (dirección x positiva) con velocidad v constante.
(ii) La correspondiente función que se mueve hacia la izquierda es
g(x, t) = a exp −b(x + vt)2 .
Demuestre que la función f (x, t) + g(x, t) es también una solución de la ecuación de ondas, y dibuje unas
gráficas apropiadas para ver cómo evoluciona con el tiempo.
Apartado 14.3
Halle por el método de separación de variables algunas soluciones f (x, y) para las siguientes ecuaciones:
∂f ∂f ∂f ∂f ∂2f ∂2f ∂2f
4. 2 + =0 5. y −x = 0 6. + = 0 7. +f =0
∂x ∂t ∂x ∂y ∂x2 ∂y2 ∂x∂y
8. Resuelva la ecuación de Laplace
∂2u ∂2u
+ =0
∂x2 ∂y2
con las condiciones de contorno:
u(x, 0) = 0 , u(x, 1) = 0 (0 < x < 1)
u(0, y) = 0 , u(1, y) = sen 3πy (0 < y < 2)
9. Una barra fina o alambre homogéneo de longitud l y sección transversal constante se aı́sla perfecta-
mente en toda su longitud con los extremos mantenidos a temperatura constante T = 0 (en alguna escala
de temperatura). El perfil de temperaturas de la barra es una función T(x, t) de la posición x (0 ≤ x ≤ l) y
del tiempo t, y cumple la ecuación de conducción del calor (difusión)
∂T ∂2T
=D 2
∂t ∂x
siendo D el coeficiente de difusión térmico del material.
Si el perfil de temperaturas a t = 0 es T(x, 0) = 3 sen πx/l, halle la solución de la ecuación que decae
exponencialmente con el tiempo en cada punto x.
14.8. Ejercicios 367
Apartado 14.4
10. Resuelva la ecuación de Schrödinger para una partı́cula en un pozo rectangular tridimensional con
función energı́a potencial
V(x, y, z) = 0 para 0 < x < a , 0 < y < b, 0 < z < c,
= ∞ en el resto .
¿Cuáles son las posibles degeneraciones de los autovalores para un pozo cúbico?
Apartado 14.5
11. Algunos ceros de las funciones de Bessel Jn (x) son:
J0 (x) = 0 para x = 2,4048; 5,5201; 8,6537
J1 (x) = 0 x = 3,8317; 7,0156; 10,1736
J2 (x) = 0 x = 5,1356; 8,4172
J3 (x) = 0 x = 6,3802; 9,7610
J4 (x) = 0 x = 7,5883
1. Halle las energı́as (en unidades de h2 /8ma2 ) de los 10 estados más bajos para una partı́cula en un
pozo circular de radio a, y dibuje el correspondiente diagrama de niveles de energı́a.
2. Los seis diagramas de la Figura 14.3 son representaciones de los signos y nodos de las funciones
de onda (14.47) para los seis estados más bajos, utilizando la forma real de las funciones angulares.
Dibuje los correspondientes diagramas para los 4 siguientes estados más bajos.
Apartado 14.6
12. (i) Use las Tablas 14.1 y 14.2 para dar la función de onda global ψ1,0,0 (r, θ, φ) para el átomo de
hidrógeno.
(ii) Sustituya esta función de ondas en la ecuación de Schrödinger (14.52) y compruebe que se trata
de una solución con E dada por (14.82).
13. Repita el Ejercicio 12 para la función de onda ψ2,1,1 .
14. Demuestre que las funciones radiales R1,0 y R2,0 , dadas en la Tabla 14.2, cumplen la condición de
ortogonalidad (14.81) (recuerde utilizar la expresión de ρ adecuada).
Apartado 14.7
15. Halle la solución general de (14.103) para la cuerda vibrante que cumpla la condición inicial
∂y
(x, 0) = 0.
∂t
∂T ∂2T
16. Halle la solución general de la ecuación de difusión = D 2 que cumple las condiciones de
∂t ∂x
contorno T(0, t) = T(l, t) = 0 para t ≥ 0 (véase el Ejercicio 9), y que decae exponencialmente con el
tiempo.
∂2u ∂2u
17. Halle la solución general de la ecuación de Laplace 2 + 2 = 0 sujeta a las
∂x ∂y
condiciones de contorno
u(x, 0) = 0 , u(x, 1) = 0 ,
u(0, y) = 0 (0 < y < 1) ,
(véase el Ejercicio 8).
Desarrollos ortogonales.
Análisis de Fourier
15.1. Conceptos
Vimos en el Apartado 7.6 que muchas funciones pueden desarrollarse en serie de
potencias y que, de hecho, algunas se definen mediante esas series. En general, una
función f (x) puede desarrollarse en potencias de x como una serie de MacLaurin si la
función y sus derivadas existen en x = 0 y en todo el intervalo que va de 0 a x. El
desarrollo es válido entonces dentro del radio de convergencia de la serie.
El desarrollo en serie de potencias de una función es un caso particular de un tipo
más general de desarrollo. Sea la función
∞
f (x) = a0 + a1 x + a2 x2 + · · · = al x l . (15.1)
l=0
∞
Este formalismo sugiere que puede ser posible encontrar otros conjuntos de funciones
{gl } que usar en vez de simples potencias, y que puede ser posible desarrollar de esa
manera funciones que no pueden desarrollarse en serie de potencias.
Los conjuntos de funciones de particular importancia para desarrollos en serie con-
sisten en funciones con la propiedad de ortogonalidad. En el Apartado 15.2 presentamos
la teorı́a de desarrollos ortogonales. En el apartado 15.3 tratamos dos ejemplo de des-
arrollos en polinomios de Legendre, importantes en la teorı́a del potencial y en la teorı́a
de difusión, con una aplicación a la electrostática. En el Apartado 15.4 consideramos las
series de Fourier y las usamos en el Apartado 15.5 para resolver la ecuación de ondas
para la cuerda vibrante con unas condiciones iniciales dadas. En el apartado 15.6 tra-
tamos la transformada de Fourier, imprescindible para el análisis de los resultados de
experimentos de difracción y para la espectroscopia de análisis de Fourier.
370 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier
∞
P0 (x) = 1 , P1 (x) = x ,
1 1 3
P2 (x) = (3x2 − 1) , P3 (x) = (5x − 3x) , (15.4)
2 2
1 1
P4 (x) = (35x4 − 30x2 + 3) , P5 (x) = (63x5 − 70x3 + 15x) .
8 8
La función Pl (x) es un polinomio de grado l en x, y es posible expresar cada potencia xl
como una combinación lineal de polinomios de Legendre hasta grado l. Por ejemplo, a
partir de (15.4) tenemos
x0 = P0 , x1 = P1 ,
1 1
x2 = (2P2 + P0 ) , x3 = (2P3 + 3P1 ) , (15.5)
3 5
1 1
x4 = (8P4 + 20P2 + 7P0 ) , x5 = (8P5 + 28P3 + 27P1 ) .
35 63
Usando únicamente los términos de (15.5), la serie de potencias (15.1) se puede escribir
por lo tanto como
a2 a3 a4
f (x) = a0 P0 + a1 P1 + (2P2 + P0 ) + (2P3 + 3P1 ) + (8P4 + 20P2 + 7P0 )
3 5 35
a5
+ (8P5 + 28P3 + 27P1 ) + · · ·
63
a2 a4 3a3 3a5 2a 4a4
= a0 + + + · · · P0 + a1 + + + · · · P1 + + + · · · P2
2
3 5 5 7 3 7
3a 4a 8a 8a
+ + + · · · P3 + + · · · P4 + + · · · P5 + · · ·
3 5 4 5
(15.6)
5 9 35 63
y esto tiene la forma pedida (15.3). Los polinomios de Legendre aparecen en las ciencias
fı́sicas en la variable x = cos θ, de manera que estamos interesados únicamente en el
15.2. Desarrollos ortogonales 371
y podemos usar esto para obtener una fórmula general para los coeficientes cl de (15.3).
Multiplicamos la ecuación (15.3) por Pk (x) e integramos. Tenemos entonces
+1 +1
∞
∞ +1
y como, por (15.7), cada integral en el segundo miembro es cero salvo para l = k, sólo
ese término contribuye a la suma:
+1 +1
2
Pk (x)f (x) dx = ck Pk (x)Pk (x) dx = ck .
−1 −1 2k + 1
Por lo tanto
+1
2k + 1
ck = Pk (x)f (x) dx . (15.8)
2 −1
Este importante resultado nos da los valores de los coeficientes cl del desarrollo de una
función finita y continua de x (|x| ≤ 1) en serie de los polinomios de Legendre.
Aplicamos ahora la fórmula a la serie de potencias (15.1):
2k + 1
+1 ∞ ∞ +1
2k + 1
ck = Pk (x) al x dx =
l
al Pk (x)xl dx . (15.9)
2 −1 l=0
2 l=0 −1
donde ⎧
+1 l+1
+1 ⎨ 2
x si l es par,
xl dx = = l+1
−1 l+1 −1
⎩
0 si l es impar.
372 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier
Por lo tanto
a2 a4 a6 a2l ∞
c0 = a0 + + + + ··· =
3 5 7 l=0
2l + 1
que está de acuerdo con el coeficiente de P0 que aparece en (15.6).
El caso general
Sean gn (x), n = 1, 2, 3, . . . un conjunto de funciones, posiblemente complejas, orto-
gonales en el intervalo a ≤ x ≤ b con respecto a la función peso w(x):
b
∞
Entonces, multiplicando por g∗m (x) e integrando con respecto a la función peso w(x) entre
a y b, tenemos
b
∞ b
b
1
cn = g∗m (x)f (x) w(x) dx . (15.14)
||gn ||2 a
A menudo es más conveniente que las funciones del desarrollo estén normalizadas,
además de ser ortogonales. La normalización se consigue dividiendo cada función por
su norma,
1
gn (x) = gn (x) . (15.15)
||gn ||
∞
∞ b
Esta definición de la completitud es suficiente para la mayorı́a de los casos. Hay que
tener en cuenta dos precisiones:
374 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier
(1) Por toda función se entiende no sólo las funciones continuas sino la clase más
general de las funciones continuas a trozos que tienen un número finito de dis-
continuidades finitas y un número finito de máximos y mı́nimos en el intervalo.1
(2) Por la representación de la función se entiende que la función puede aproximarse
con precisión arbitraria mediante una serie finita
Se dice que la serie converge en media a f (x) y en la práctica puede sustituirse la fun-
ción por la serie, aunque (15.21) no supone que la serie converja necesariamente a f (x)
para todo x. Esta convergencia en media permite representar varias funciones disconti-
nuas, aunque hay que tener cuidado a veces si se plantean igualdades entre derivadas o
integrales de la serie y derivadas o integrales de la función que representa.
−1/2
∞
∞
e =
itx
(2l + 1)il jl (t)Pl (x) , (15.23)
l=0
de importancia en teorı́a de la difusión, donde las jl (t) son las funciones de Bessel esféri-
cas (ecuación (13.57)). La serie (15.22) converge para |x| < 1 y |t| < 1, y la obtenemos
en el Ejemplo 15.2. La serie (15.23) converge para |x| < 1 y todo valor de t, y en el
Ejemplo 15.3 mostramos cómo hallarla.
01. Dirichlet fue el primero en demostrarlo para las series de Fourier (‘condiciones de Dirichlet’).
Gustav Peter Lejeune-Dirichlet (1805-1859), matemático alemán, fue influido por el trabajo de Fourier
mientras estudiaba en Parı́s en los primeros años de la década de 1820.
15.3. Dos desarrollos en polinomios de Legendre 375
y de forma similar f (0) = 15x3 − 9x, f (0) = 105x4 − 90x2 + 9, etcétera.
Comparando esto con los polinomios de Legendre que aparecen en (15.4), vemos que para la derivada
l-ésima: f (l) (0) = l! Pl (x). La serie de MacLaurin
t2 t3 t4
f (t) = f (0) + tf (0) + f (0) + f (0) + f (0) + · · ·
2! 3! 4!
es entonces
∞
(it)n n
∞
eitx = x = an xn .
n=0
n! n=0
El correspondiente desarrollo en polinomios de Legendre cl Pl (x) se obtiene usando la expresión (15.9)
+1
2l + 2
∞
cl = an Pl (x)xn dx .
2 n=0 −1
De las ecuaciones (13.55) y (13.57) se deduce para las funciones de Bessel de orden semientero que
π
c0 = J1/2 (t) = j0 (t) .
2t
Puede demostrarse, ya sea de esta manera o de modo más elegante mediante las ecuaciones diferenciales
que cumplen tanto eitx como jl (t), que el coeficiente general es de la forma cl = (2l + 1)il jl (t).
376 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier
q −1/2
V= (R2 − 2rR cos θ + r2 ) . (15.25)
4π0
y, por la ecuación (15.22) con t = r/R y x = cos θ, podemos desarrollar esto en polino-
mios de Legendre como
q r l
∞
r
V= Pl (cos θ) , < 1. (15.26)
4π0 R l=0 R R
N
qi
V= . (15.27)
i=1
4π0 Ri
Figura 15.2
Si el punto P es exterior a la distribución de cargas, de
manera que R > ri para todo i,
15.4. Series de Fourier 377
Q0 = qi carga total Q ,
i=1
N
1 1
2. Q1 = qr cos θ − qr cos (π + θ) = qr cos θ = µ cos θ ,
2 2
donde µ = qr es el momento (escalar) dipolar del par de cargas, y
µ cos θ es la componente del momento dipolar en la dirección OP.
r 2 1 r 2 1
3. Q2 = q (3 cos2 θ−1)−q (3 cos2 (π +θ)−1) = 0 ,
2 2 2 2
y puesto que Pl (cos θ) es una función par de cos θ, todo momento Figura 15.3
multipolar de orden par es cero.
El potencial en el punto P es entonces
µ cos θ Q3
V= + + ···
4π0 R2 4π0 R4
Si R es suficientemente grande (R >> r), el desarrollo del potencial puede truncarse después del término
principal,
µ cos θ
V≈ .
4π0 R2
Este es el potencial que domina la interacción de una molécula polar neutra a grandes distancias.
378 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier
cos nx , n = 0, 1, 2, . . .
(15.31)
sen nx , n = 1, 2, 3, . . .
+π
+π
02. Jean-Baptiste Joseph Fourier (1768-1830) estudió la serie en relación con su trabajo sobre la di-
fusión del calor. Presentó primero el trabajo en la Academia francesa en 1807, y lo publicó en su forma
definitiva en 1822 en la Théorie analytique de la chaleur (Teorı́a analı́tica del calor). Su trabajo generó nue-
vos desarrollos en la teorı́a matemática de las funciones, y proporcionó una herramienta nueva y potente
para el análisis y la resolución de problemas fı́sicos.
15.4. Series de Fourier 379
+π
1
bn = f (x) sen nx dx . (15.39)
π −π
1
cos mx cos nx = [ cos (m + n)x + cos (m − n)x] ,
2
de manera que
+π +π
1
cos mx cos nx dx = [ cos (m + n)x + cos (m − n)x] dx
−π 2 −π
+π
1 sen (m + n)x sen (m − n)x
= + = 0,
2 m+n m−n −π
Para m = n > 0,
+π
+π +π
1 1 sen 2nx
cos2 nx dx = (1 + cos 2nx) dx = x+ = π.
−π −π 2 2 2n −π
Periodicidad
Las funciones trigonométricas (15.31) son funciones periódicas de x con periodo 2π
y, por lo tanto, toda combinación lineal de ellas es también periódica. Esto supone que
la función f (x) puede extenderse a valores fuera del intervalo de base −π ≤ x ≤ π
mediante la relación de periodicidad
3 2 2 3
Figura 15.5
3 2 2 3
Figura 15.6
a0
∞
f (x) = + (an cos nx + bn sen nx) ,
2 n=1
Una propiedad de las series de Fourier es que el valor de la serie en un punto de discontinuidad es el valor
medio de la función en ese punto. En el presente caso ese valor medio es 1/2.
+π 0 +π
1 1 1
a0 = f (x) dx = f (x) dx + f (x) dx .
π −π π −π π 0
La función f (x) es cero en la primera de las integrales del segundo miembro, y es igual a
uno en la segunda. Por lo tanto
+π
1
a0 = dx = 1 . (15.43)
π 0
+π +π
π
1 1 1 sen nx
an = f (x) cos nx dx = cos nx dx = = 0. (15.44)
π −π π 0 π n 0
+π +π
π
1 1 1 cos nx 1
bn = f (x) sen nx dx = sen nx dx = − = (1 − cos nπ) .
π −π π 0 π n 0
nπ
2
bn = , n impar. (15.45)
nπ
382 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier
1 1 2
S1 = S2 = + sen x
2 2 π
1 2 sen 3x 1 2 sen 3x sen 5x
S3 = + sen x + S4 = + sen x + +
2 π 3 2 π 3 5
...
En la Figura 15.7 representamos las gráficas de las cuatro primeras sumas parciales.
1 1
1 1
Figura 15.7
Figura 15.8
15.4. Series de Fourier 383
Este ejemplo muestra cómo se construye una onda arbitraria por interferencia de ondas armónicas, con
interferencia constructiva (aditiva) en unas regiones e interferencia destructiva (sustractiva) en otras. El
término constante S1 es el valor medio de la función en el intervalo. La aproximación con dos términos, S2 ,
incluye la primera corrección a ese valor medio, y S3 , S4 , . . . incluyen sucesivas correcciones más pequeñas.
En la Figura 15.8 representamos la gráfica de la suma parcial S50 , y se ve claramente cómo se comporta la
serie de Fourier, continua en todos los puntos del intervalo, ante las discontinuidades de la función.
Cambio de periodo
Una función periódica f (x) con periodo 2π se transforma en una función periódica
g(z) con periodo 2l si se sustituye la variable x por πz/l en f (x). Ası́, si
πz
f (x) = f = g(z) ,
l
tenemos entonces
π
f (x + 2π) = f (z + 2l) = g(z + 2l) .
l
Por ejemplo, la función sen x = sen (πz/l) es periódica en x con periodo 2π, y es pe-
riódica en z con periodo 2l.
Este sencillo cambio de variable se usa para generalizar el método de Fourier, ecua-
ciones (15.37) a (15.39), para desarrollar funciones con periodos distintos de 2π. De esta
manera, una función f (x) que es periódica en x con periodo 2l,
a0 nπx
∞
nπx
f (x) = + an cos + bn sen (15.48)
2 n=1
l l
+l
1 nπx
bn = f (x) sen dx . (15.50)
l −l l
es cero salvo si g(x) es también una función impar de x, o si contiene una componente impar. De las
funciones del desarrollo (15.48), las funciones seno son impares pero las funciones coseno son pares. Todas
las integrales (15.49) para an son por lo tanto cero, y la serie de Fourier se reduce a la serie de Fourier en
senos para el desarrollo de una función impar:
∞
nπx
f (x) = bn sen , (15.52)
n=1
l
con coeficientes dados por (15.50). También se deduce de lo visto en el Apartado 5.3, ecuación (5.25), que
la integral (15.50) en todo el intervalo −l ≤ x ≤ l es igual a dos veces la integral en el medio intervalo
0 ≤ x ≤ l:
2 +l nπx
bn = f (x) sen dx . (15.53)
l 0 l
Para la función (15.51), tenemos entonces
l/2 l
2 nπx nπx
bn = f (x) sen dx + f (x) sen dx
l 0 l l/2 l
l/2 l
4A nπx nπx
= 2 x sen dx + (l − x) sen dx ,
l 0 l l/2 l
nπx
∞
∞
nπx
y(x, 0) = f (x) = An sen ,
n=1
l
∞
(15.57)
∂y nπx
= g(x) = Bn ωn sen ,
∂t t=0 n=1
l
y los coeficientes An de (15.56) son idénticos a los coeficientes de Fourier bn dados por
(15.54). Además, la velocidad inicial de la cuerda es cero en todos sus puntos, de manera
que
∂y
= g(x) = 0 (15.59)
∂t t=0
y todos los coeficientes Bn de (15.56) son cero. Deducimos entonces que, para las con-
diciones iniciales dadas, el movimiento de la cuerda viene dado por la función de onda
8A πx 1 3πx 1 5πx
y(x, t) = 2 sen cos ω1 t − sen cos ω3 t + sen cos ω5 t − · · · (15.60)
π l 9 l 25 l
portamiento de la función en el primer cuarto del periodo. Hemos obtenido las gráficas
usando la aproximación con 25 términos de la función de onda (términos hasta n = 49).
Figura 15.11
Intervalo infinito
Podemos escribir la serie de Fourier (15.48) para un intervalo arbitrario 2l,
∞
a0 nπx nπx
f (x) = + an cos + bn sen , (15.61)
2 n=1
l l
como
∞
f (x) = cn (15.62)
n=0
donde
a0 nπx nπx
c0 = , cn = an cos + bn sen , n > 0.
2 l l
15.6. Transformada de Fourier 387
Figura 15.12
Una suma como (15.62) puede considerarse como la suma de las áreas de los rectángulos
de ancho ∆n = 1 y altura cn , como se muestra en la Figura 15.12,
∞
f (x) = cn ∆n . (15.63)
n=0
+l
lbn 1
v(yn ) = = f (x) sen xyn dx . (15.67)
π π −l
∞
de manera que, según vimos en el Apartado 5.4 para la integral de Riemann como lı́mite
de una suma,
∞ ∞
siendo
+∞
1
u(y) = f (x) cos xy dx (15.70)
π −∞
+∞
1
v(y) = f (x) sen xy dx (15.71)
π −∞
donde
l k
2 nπx 2A nπx 2Ak sen (nπk/l)
an = f (x) cos dx cos dx = ,
l 0 l l 0 l l (nπk/l)
2Ak
para n > 0, y tomando el lı́mite n → 0, a0 = . La representación en serie de Fourier de la función en
l
el intervalo finito es por lo tanto
2Ak 1 sen (nπk/l)
∞
nπx
f (x) = + cos .
l 2 n=1 (nπk/l) l
0* La ‘deducción’ que damos aquı́ de (15.69) es sólo esquemática, aunque suficiente para la mayorı́a
de los casos. Hemos pasado por alto todo lo relacionado con las posibles discontinuidades de la función y
con la existencia del lı́mite.
15.6. Transformada de Fourier 389
Forma exponencial
Podemos poner en forma exponencial la representación de una función por medio de
la integral de Fourier, ecuaciones (15.69) a (15.71), usando las relaciones de Euler
1 ixy 1 ixy
cos xy = e + e−ixy , sen xy = e − e−ixy . (15.77)
2 2i
Definimos la función
1
w(y) = [u(y) − iv(y)] . (15.78)
2
Hemos visto en el Ejemplo 15.8 que la ecuación (15.69) puede escribirse entonces como
+∞
con
+∞
1
w(y) = f (x)e−ixy dx (15.80)
2π −∞
u( − y) = u(y), v( − y) = −v(y),
y por lo tanto
∞ +∞
1
f (x) = [u(y) − iv(y)] eixy dy = w(y)eixy dy
2 −∞ −∞
siendo +∞
1 1
w(y) = [u(y) − iv(y)] = f (x)e−ixy dy .
2 2π −∞
+∞
1
g(y) = √ f (x)e−ixy dx . (15.82)
2π −∞
Dos funciones relacionadas por las ecuaciones (15.81) y (15.82) forman un par de trans-
formadas de Fourier. Se dice que la función g es la transformada de Fourier de la fun-
ción f , y f se dice que es la transformada (inversa) de g. En general, la transformada
de Fourier de una función f (x) existe si la función es continua a trozos y es integrable
absolutamente, es decir, si
+∞
|f (x)| dx
−∞
existe. En las Figuras 15.14 presentamos tres pares de transformadas de Fourier elemen-
tales.
15.6. Transformada de Fourier 391
La presencia de un exponente complejo no altera la regla habitual para integrar la exponencial, por lo tanto
−(a+iy)x ∞
1 −e 1 1
g(y) = √ = √
2π a + iy 0 2π a + iy
ya que e−(a+iy)x = e−ax e−iyx → 0 cuando x → ∞. La transformada de Fourier es compleja y para hallar su
parte real escribimos
1 a − iy 1 a − iy
g(y) = √ = √ .
2π (a + iy)(a − iy) 2π a2 + y2
392 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier
Con esto
1 a
Re g(y) = √ . (15.83)
2π a2 + y2
Esta función se denomina Lorentziana, y da la forma de las lı́neas espectrales en espectroscopia de trans-
formada de Fourier.
siendo T el tiempo de relajación. Este es un ejemplo del caso (c) de la Figura 15.14, con
x como el tiempo t e y como la frecuencia ω. La transformada de Fourier de la curva de
decrecimiento es por lo tanto una curva lorentziana (véase el ejemplo 15.9)
∞
1 1 T
F(ω) = Re √ I(t)e dt = √
−iωt
. (15.85)
2π 0 2π 1 + ω 2 T 2
EJEMPLO 15.11 Halle la parte real de la transformada de Fourier de la onda armónica amortiguada
exponencialmente, Figura 15.15,
15.7. Ejercicios
Apartado 15.2
Apartado 15.3
1 sen t
es c1 = 3ij1 (t) siendo j1 (t) = − cos t (véase el Ejemplo 15.3 para c0 ).
t t
394 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier
Apartado 15.4
5. Se define una función con periodo 2π como
π
1, si − 2
< x < π2 ,
f (x) = π
0, si 2
< |x| < π.
π2 1 ∞
1 1 1
= 2
=1+ + + + ···
6 n=1
n 4 9 16
π2 (– 1)n+1
∞
1 1 1
= 2
=1− + − + ···
12 n=1
n 4 9 16
(Figura 15.4) es
4 1 cos 2x cos 4x cos 6x
− − − − ···
π 2 1·3 3·5 5·7
(ii) Use la serie para demostrar que
π 1 1 1 1
= + − + − ···
4 2 1·3 3·5 5·7
15.7. Ejercicios 395
Apartado 15.5
10. Halle la solución de la ecuación de difusión
∂T ∂2T
=D 2
∂t ∂x
en el intervalo 0 ≤ x ≤ l que cumple las condiciones de contorno e inicial
y que decrece exponencialmente con el tiempo. (Véase el Ejercicio 16 del Capı́tulo 14 y el ejercicio 9 ante-
rior.)
Apartado 15.6
Halle la transformada
de Fourier para:
1, para a < x < b,
11. f (x) = 12. e−a|x| (a > 0).
0, en el resto.
2
13. Demuestre que la transformada de Fourier de e−ax (a > 0) es
1 2
√ e−y /4a (Figura 15.14b)
2a
√ iy ∞ 2 π
Sugerencia: cambie a la variable t = ax + √ y use e−αt dt = .
2 a −∞ α
Vectores
16.1. Conceptos
Cantidades fı́sicas como la masa, la temperatura o la distancia tienen valores que se
especifican por un único número real en las unidades apropiadas: por ejemplo, 3 kg, 273
K o 12 m. Tales cantidades, que tienen sólo magnitud, se denominan cantidades escala-
res y siguen las reglas del álgebra de los números reales. Otras cantidades fı́sicas, llama-
das vectores, requieren una magnitud y también una dirección para ser especificadas.
Por ejemplo, la velocidad mide la rapidez de movimiento en una dirección dada. Otros
ejemplos son la fuerza, el campo eléctrico, el campo magnético o el desplazamiento.
Para ser vectores, esas cantidades tienen que cumplir las reglas del álgebra vectorial.1
La notación vectorial y el álgebra vectorial son importantes para la formulación y re-
solución de problemas fı́sicos en tres dimensiones: en mecánica, dinámica de fluidos,
teorı́a electromagnética y dibujo técnico. Tratamos algunas de esas aplicaciones de los
vectores, de importancia en dinámica molecular, espectroscopia y quı́mica teórica, en
diversos ejemplos a lo largo de este capı́tulo.
Un vector se representa gráficamente como un segmento de recta orientado, esto es,
un segmento de recta cuya longitud es la magnitud del vector, en las correspondientes
unidades, y cuya orientación en el espacio, junto con una flecha que indica el sentido, da
la dirección.
Figura 16.1
La figura 16.1 muestra dos representaciones gráficas del mismo vector, y dos nota-
ciones. En (a), el vector a se representa por una flecha; en (b), A es el origen y B el
01. El álgebra vectorial tiene su origen en el álgebra de cuaterniones descubierta por Hamilton en
1843 y en la teorı́a sobre espacios vectoriales de dimensión n de Grassmann de 1844. Debemos a Gibbs la
notación moderna de vectores en tres dimensiones.
William Rowan Hamilton (1805-1865), nacido en Dublı́n, tuvo fama de haber dominado el latı́n, el grie-
go, las lenguas europeas modernas, el hebreo, el persa, el árabe, el sánscrito y otras lenguas con diez años.
Ingresó en el Trinity College de Dublı́n en 1823 y en 1827, sin haberse graduado aún, fue nombrado As-
trónomo Real de Irlanda y Catedrático de Astronomı́a. Es sobre todo conocido por su reformulación y
generalización de la mecánica de Newton, Euler y Lagrange que se hizo importante en la formulación de
las mecánicas estadı́stica y cuántica.
398 Capı́tulo 16. Vectores
→
−
extremo del vector, y la notación AB es particularmente útil cuando el vector es un des-
plazamiento en el espacio. La longitud, magnitud o módulo de a se escribe como |a| o
sencillamente a (un escalar). Un vector de longitud cero se llama vector nulo, 0, y en
ese caso no se asigna ninguna dirección.
Las Figuras 16.2(a) y (b) ilustran varios tipos de vectores asociados con el movimien-
to de un cuerpo sobre una curva PQ en el espacio, bajo la acción de fuerzas exteriores.
→
−
En la Figura (a), la posición del punto A de la curva viene dada por a = OA, cuyo origen
es el origen de coordenadas y cuyo extremo está en A. El vector a se llama vector de
posición y su valor (tanto en magnitud como en dirección) cambia a medida que el cuer-
po recorre la curva. Cuando el cuerpo se ha movido de A a B el vector de posición ha
→
−
variado de a a b, y el desplazamiento desde A hasta B viene dado por el vector c = AB.
Veremos que el álgebra vectorial nos da c = b − a, esto es, que el desplazamiento desde
A hasta B es igual a la variación del vector de posición. Vemos que un vector de posición
es un tipo de vector de desplazamiento, pero con su origen situado siempre en un punto
fijo que es el origen de un sistema de coordenadas.
Figura 16.2
Igualdad
a = b, (16.1)
si tienen misma longitud y misma dirección. Los orı́genes de vectores iguales sólo tienen
que coincidir si se trata de vectores ligados, como por ejemplo vectores de posición. De
esa manera dos cuerpos separados que se mueven con la misma velocidad en la misma
dirección tienen vectores velocidad iguales.
16.2. Álgebra vectorial 399
Suma de vectores
La suma, o resultante, a + b de los vectores a y b se define geométricamente en la
Figura 16.3. En (a) los vectores se sitúan de manera que el origen de b coincida con el
extremo de a. La suma a + b es entonces igual al vector trazado desde el origen de a al
extremo de b. La Figura (b) muestra que la suma es conmutativa, con
a + b = b + a. (16.2)
Figura 16.3
Resta
Si a + b = 0, siendo 0 el vector nulo, entonces b = −a
es un vector con la misma longitud que a, |b| = |a|, pero
que apunta en la dirección contraria. La resta de vectores
se define entonces como (Figura 16.4)
a + (– b) = a − b . (16.3)
Figura 16.4
Figura 16.5
EJEMPLO 16.2 Demuestre que el promedio de los vectores de posición de los vértices de un triángulo
es el vector de posición del baricentro del triángulo.
En la figura 16.7, los vértices A y B tienen posiciones (vectores de posición) a y b con respecto al vértice O
(con vector de posición nulo 0). El promedio de los vectores de posición de los vértices es por lo tanto
→
− 1 −→ − → − →
1 1
OX = OO + OA + OB = (0 + a + b) = (a + b) .
3 3 3
→
−
Hemos visto en el Ejemplo 16.1 que si C es el centro de AB entonces OC = (a + b)/2. Por lo tanto
→
− 2 −
→
OX = OC
3
y el promedio está en la recta que une el vértice O con el centro del lado opuesto. Algo similar ocurre con
la posición respecto a los otros dos vértices, de manera que X está en la intersección de esas tres rectas, y
eso corresponde al baricentro del triángulo.
Figura 16.7
16.3. Componentes de los vectores 401
a = (ax , ay ) . (16.6)
a = a x i + ay j . (16.7)
Más generalmente, un vector en tres dimensiones (Figura 16.11) puede especificarse por
sus componentes, ax , ay y az , en las tres direcciones cartesianas i, j y k (k es el vector
unitario en la dirección z). Escribimos
a = (ax , ay , az ) = ax i + ay j + az k . (16.8)
402 Capı́tulo 16. Vectores
Figura 16.11
Las reglas del álgebra vectorial pueden entonces formularse mediante las componen-
tes de los vectores, y es ésta la forma en que los vectores se usan para resolver problemas
fı́sicos.3 Sean los vectores
a = (ax , ay , az ) , b = (bx , by , bz ) .
Figura 16.12
(i) Igualdad. Los vectores son iguales si lo son las correspondientes componentes:
a=b si a x = b x , ay = by y az = b z . (16.9)
a + b = (ax + bx , ay + by , az + bz ) . (16.10)
03. Hamilton descubrió los cuaterniones en su búsqueda de un álgebra de números complejos tri-
dimensionales. Tienen la forma a + bi + cj + dk, con las reglas de combinación i2 = j2 = k2 = −1,
ij = k = −ji, jk = i = −kj, ki = j = −ik. Hamilton llamó parte escalar a a y parte vectorial a bi + cj + dk.
Descubrió las reglas mientras paseaba con su mujer a lo largo del Canal Real el 16 de octubre de 1843, un
lunes, y las grabó sobre una piedra del puente de Brougham.
16.3. Componentes de los vectores 403
EJEMPLO 16.3 Dados a = (2, 3, 1), b = (1, −2, 0) y c = (5, 2, −1), halle: (a) d = 2a + 3b − c y (b) |d|.
dx = 2ax + 3bx − cx = (2 × 2 + 3 × 1 − 5) = 2,
La ecuación (16.9) para la igualdad entre vectores y el ejemplo 16.3 muestran que, para
vectores en tres dimensiones, una ecuación vectorial es equivalente a un sistema de tres
ecuaciones escalares, una por cada componente. Inversamente, las tres ecuaciones esca-
lares se representan por una única ecuación vectorial. El álgebra vectorial proporciona
un método potente para formular y resolver problemas fı́sicos que implican cantidades
vectoriales. A menudo sólo es necesario recurrir a ecuaciones en componentes cuando
la resolución del problema necesita ser completada con los valores numéricos de las
componentes.
EJEMPLO 16.4 El centro de masas de un sistema de N masas, m1 con vector de posición r1 (‘en la
posición r1 ’), m2 en r2 , . . . , mN en rN (Figura 16.13) es
1
N
1
R= (m1 r1 + m2 r2 + · · · + mN rN ) = mi ri ,
M M i=1
(16.12)
N
siendo M = mi la masa total.
i=1
1 1 1
N N N
X= mi x i Y= mi y i Z= mi zi (16.13)
M i=1 M i=1 M i=1
N
µ = (q1 r1 + q2 r2 + · · · + qN rN ) = qi ri . (16.15)
i=1
Figura 16.14
Esta cantidad depende de la posición del punto de referencia si la carga total Q = qi no es cero. En
efecto, la posición de la carga qi con respecto al punto R es ri − R, y el momento dipolar del sistema de
cargas con respecto a R es
N
N
N
µ (R) = qi (ri − R) = qi ri − qi R = µ (0) − QR , (16.16)
i=1 i=1 i=1
N
µ = µ1 + µ2 + · · · + µN = µi . (16.17)
i=1
Por ejemplo, el momento dipolar total de una molécula se interpreta a veces como la suma (vectorial) de
‘momentos de enlace’: se asocia un momento dipolar con cada enlace. En algunos casos de gran simetrı́a el
momento dipolar total puede anularse: los momentos de los enlaces se cancelan unos con otros. Por ejemplo,
la molécula de metano en su estado estable tiene sus cuatro hidrógenos en los vértices de un tetraedro
regular, con el carbono en el centro. Si uno de los vértices se sitúa en la ‘posición 111’, con r1 = (a, a, a),
las posiciones de los otros vértices son r2 =
√ (a, −a, −a), r3 = (– a, a, −a) y r4 = (– a, −a, a). La longitud
de cada uno de esos vectores de enlace es 3a, la distancia de enlace de CH. El momento dipolar de cada
enlace está en la dirección del propio enlace, y es por lo tanto proporcional al vector de enlace, µ i = kri
(i = 1, 2, 3, 4), y el momento dipolar total es
µ = µ1 + µ2 + µ3 + µ4
= k (r1 + r2 + r3 + r4 )
= k(a + a − a − a, a − a + a − a, a − a − a + a)
= k(0, 0, 0)
= 0.
Vectores de la base
Los vectores unitarios cartesianos i, j y k, en las direcciones x, y y z, tienen las com-
ponentes
Las reglas (16.10) y (16.11) confirman que todo vector del espacio tridimensional se
puede expresar como combinación lineal de estos tres vectores de la base:
a = a x i + ay j + az k
= ax (1, 0, 0) + ay (0, 1, 0) + az (0, 0, 1)
(16.19)
= (ax , 0, 0) + (0, ay , 0) + (0, 0, az )
= (ax , ay , az ) .
v = va a + vb b + vc c . (16.20)
da ∆a a(t + ∆t) − a(t)
= lim = lim . (16.21)
dt ∆t→0 ∆t ∆t→0 ∆t
Tomar el lı́mite corresponde a hacer que el punto B se acerque al punto A sobre la curva definida por a(t).
→
−
La dirección AB = ∆a se acerca a la de la tangente a la curva en A, y ésta es la dirección de la derivada en
A.
Utilizando las componentes del vector, si tomamos a = ax i + ay j + az k, siendo i, j y k vectores cons-
tantes, la dependencia de a con t es la de sus componentes:
a(t) = ax (t)i + ay (t)j + az (t)k , (16.22)
y
da dax day daz
= i+ j+ k. (16.23)
dt dt dt dt
dv d2 r
a = = 2
dt dt
dvx dvy dvz
= i+ j+ k (16.28)
dt dt dt
2 2 2
d x d y d z
= i + j + k.
dt2 dt2 dt2
La forma vectorial de la segunda ley de Newton es entonces F = ma, equivalente a tres ecuaciones escala-
res, una por cada componente.
Momento lineal
En mecánica, el momento p de un cuerpo de masa m que se mueve con velocidad v se define como p = mv.
La dirección de p es la dirección según la lı́nea de movimiento y a menudo se lo llama momento lineal (o
también cantidad de movimiento). Podemos escribir entonces la segunda ley de Newton como
dp
F= . (16.29)
dt
La ecuación (16.29) indica que si no actúan fuerzas exteriores sobre un sistema con momento p, entonces
dp
= 0, y p es un vector constante. Ésta es la primera ley del movimiento de Newton: el principio de
dt
conservación del momento lineal.
04. Clerk Maxwell utilizó los cuaterniones de Hamilton en su Treatise on Electricity and Magnetism
(Tratado sobre electricidad y magnetismo) de 1873, pero Heaviside y Gibbs, de manera independiente,
hicieron ver que no era necesario emplear el álgebra completa de los cuaterniones para representar las
cantidades fı́sicas.
Oliver Heaviside (1850-1925), ingeniero eléctrico inglés, destaca por su desarrollo de las técnicas de la
transformada de Laplace. Josiah Willard Gibbs (1839-1903), ingeniero estadounidense, quı́mico y ‘entre
los fı́sicos teóricos más célebres de todos los tiempos’ (Max Planck), nació, vivió y murió en New Haven,
Connecticut. Gibbs es conocido sobre todo por sus trabajos en termodinámica y en mecánica estadı́stica.
Introdujo el concepto de potencial quı́mico en On the equilibrium of heterogeneous substances (Sobre el
equilibro de sustancias heterogéneas) en 1876-78, sentando las bases de la termodinámica quı́mica moderna.
Desarrolló la notación moderna y los conceptos de productos escalar y vectorial al principio de los años
1880 para simplificar el tratamiento matemático del Treatise de Maxwell. Su obra circuló sin publicar, en
forma de apuntes, y fue divulgada por Edwin B. Wilson en su Vector analysis, founded upon the lectures of
J. Willard Gibbs (Análisis vectorial, basado en las lecciones de J. Willard Gibbs) de 1901.
408 Capı́tulo 16. Vectores
a · b = ab cos θ (16.30)
= a2 + b2 − 2 (ax bx + ay by + az bz ) .
EJEMPLO 16.9 Dados a = (3, 1, −1) y b = (1, 2, −3), halle a · b, b · a y el ángulo entre los vectores.
Por la ecuación (16.31),
a · b = 3 × 1 + 1 × 2 + (– 1) × (– 3) = 8 , b · a = 1 × 3 + 2 × 1 + (– 3) × (– 1) = 8 .
Este ejemplo nos hace ver que el producto escalar es conmutativo:
a · b = b · a. (16.32)
a·b √
Por la ecuación (16.30), cos θ = , y las longitudes de los vectores son a = |a| = 11 y b = |b| =
√ ab
14. Por lo tanto
8 8
cos θ = √ , θ = arccos √ ≈ 0,8702 ≈ 49,86◦ .
154 154
El signo del producto escalar es el signo del coseno, de manera que el producto escalar
puede ser positivo, cero o negativo:
Figura 16.19
16.5. Producto escalar 409
Para vectores a y b no nulos, el producto escalar es cero cuando los vectores son
perpendiculares:
a · b = 0. (16.33)
Se dice que los vectores son ortogonales, siendo a ortogonal a b, y b ortogonal a a.*
Señalamos que la ecuación (16.33) indica que en una ecuación vectorial no es posible
simplificar los vectores igual que se hace con los escalares. Ası́, la ecuación
a·b=a·c
EJEMPLO 16.10 Halle el valor de λ para el cual u = (2, λ, 1) y v = (4, −2, −2) son ortogonales.
i · j = 0, j · k = 0, k·i=0 (ortogonalidad),
(16.35)
i · i = 1, j · j = 1, k·k=1 (unitarios).
a · b = (ax i + ay j + az k) · (bx i + by j + bz k)
= ax bx i · i + a x by i · j + a x bz i · k + a y bx j · i + a y by j · j + · · · + a z bz k · k
= a x bx + ay by + a z bz
Los siguientes ejemplos presentan dos aplicaciones de productos escalares en las cien-
cias fı́sicas.
EJEMPLO 16.11 Fuerza y trabajo
Sea un cuerpo que se desplaza de la posición r1 = (x1 , y1 , z1 ) a la posición r2 = (x2 , y2 , z2 ) sometido a una
fuerza constante F. El desplazamiento del cuerpo es
d = r2 − r1 = (x2 − x1 , y2 − y1 , z2 − z1 )
y el trabajo efectuado por la fuerza es
W = F · d = Fd cos θ . (16.36)
Caso general
Si la fuerza no es constante en el recorrido entre r1 y r2 , el trabajo se expresa mediante una integral de lı́nea
(Apartado 9.8). Sea un cuerpo que se mueve desde el punto A en r1 hasta el punto B en r2 sobre la curva C,
sometido a una fuerza F cuyo valor varı́a de un punto de C a otro (Figura 16.21). Sea F(r) la fuerza en el
punto r de la curva. El trabajo efectuado sobre el cuerpo entre las posiciones r y r + ∆r es ∆W ≈ F(r) · ∆r
y, en el lı́mite |∆r| → 0 sobre la curva, el elemento de trabajo
es dW = F · dr. El trabajo total efectuado desde A a B sobre C
es entonces
WAB = F(r) · dr (16.38)
C
y la integral es una integral de lı́nea. Expresado en compo-
nentes, F = (Fx , Fy , Fz ) y dr = (dx, dy, dz), de manera que
F · dr = Fx dx + Fy dy + Fz dz, y
WAB = Fx dx + Fy dy + Fz dz . (16.39)
C Figura 16.21
16.6. Producto vectorial 411
Esto es una generalización de la ecuación (9.52) para una curva en tres dimensiones, y el tratamiento del
Apartado 9.8 se aplica con únicamente algunas pequeñas modificaciones. En particular, si la fuerza es
conservativa, generalizando el tratamiento de las fuerzas conservativas del Apartado 5.7, las componentes
de la fuerza pueden expresarse como las derivadas (parciales) de una función energı́a potencial V (véase la
ecuación (5.57)),
∂V ∂V ∂V
Fx = − , Fy = − , Fz = − . (16.40)
∂x ∂y ∂z
Entonces
∂V ∂V ∂V
Fx dx + Fy dy + Fz dz = − dx + dy + dz = −dV (16.41)
∂x ∂y ∂z
y dV es el diferencial total de la función energı́a potencial V(r) = V(x, y, z). Se deduce que, para una fuerza
conservativa, la integral de lı́nea (16.38) es independiente del camino y es igual a la diferencia de energı́a
potencial entre A y B: B
WAB = − dV = VA − VB . (16.42)
A
N
V = q1 φ(r1 ) + q2 φ(r2 ) + · · · + qN φ(rN ) = qi φ(ri ) .
i=1
µ · E + QC ,
= −µ (16.46) Figura 16.22
donde µ es el momento dipolar del sistema de cargas y Q es la carga total. El término QC es cero para un
campo eléctricamente neutro o si se escoge que el potencial φ sea cero en el origen (la elección habitual).
Entonces
V = −µµ · E = −µE cos θ .
412 Capı́tulo 16. Vectores
Figura 16.23
Además, las Figuras 16.24 muestran que si ponemos un vector detrás del otro, defini-
mos un sentido de giro: antihorario en (a), o ‘hacia arriba’, con a seguido de b, y sentido
horario en (b), o ‘hacia abajo’, con b seguido de a.
Figura 16.24
Estas propiedades de los dos vectores definen un nuevo vector, el producto vectorial
de a y b,
v=a×b (16.47)
b × a = −a × b . (16.49)
a × a = 0. (16.50)
i × j = k, j × k = i, k × i = j,
(16.51)
i × i = 0, j × j = 0, k × k = 0.
a × b = (ax i + ay j + az k) × (bx i + by j + bz k)
= a x bx i × i + a x by i × j + a x bz i × k + a y bx j × i + a y by j × j + a y bz j × k
+az bx k × i + az by k × j + az bz k × k
= ax by k + ax bz (– j) + ay bx (– k) + ay bz i + az bx j + az by (– i)
Esta expresión del producto vectorial se puede escribir, y es más fácil de recordar, en
forma de determinante (Capı́tulo 17):
i j k
a × b = ax ay az . (16.53)
b b b
x y z
EJEMPLO 16.13 Dados a = (3, 1, −1) y b = (1, 2, −3) halle a × b, b × a, y el área |a × b| del
paralelogramo definido por a y b.
= −i + 8 j + 5k = (– 1, 8, 5) .
Además: √
b × a = −a × b = (1, −8, −5) , |a × b| = 12 + 82 + 52 = 90 .
414 Capı́tulo 16. Vectores
es perpendicular a r y a F, y su dirección es la del eje que pasa por O en torno al cual la fuerza tiende a
producir un giro.
N=µ×E (16.55)
N = r1 × F1 + r2 × F2
= q(r1 − r2 ) × E = qr × E = µ × E .
Figura 16.26
v = ωr (16.56)
Figura 16.27
y dirección perpendicular al plano del movimiento (perpendicular a la
página para el movimiento representado en la Figura 16.27).
Más generalmente, sea una partı́cula (que puede formar parte de un cuerpo en rotación) que gira
alrededor del eje OA en torno al punto fijo O, como se muestra en la Figura 16.28. En ese caso la ecuación
(16.56) se sustituye por
v = ωr sen θ (16.57)
16.7. Campos escalares y vectoriales 415
v=ω ×r (16.58)
Momento angular
El momento angular l de una masa m con respecto a un punto se define
como el momento con respecto a ese punto de su momento lineal p =
mv,
l = r × p. (16.59)
Su magnitud con respecto al punto O de la Figura 16.29 es l = pd =
pr sen θ, y su dirección es perpendicular al plano definido por r y p. Esa
dirección no es en general la de la velocidad angular ω , como puede ver-
Figura 16.28
se en la Figura 16.28 (sustituyendo v por p). Puede demostrarse (véase
el Ejercicio 49) que
l = mr2ω − m(r · ω )r (16.60)
de manera que l y ω llevan la misma dirección sólo si r y ω son vectores
perpendiculares, es decir, cuando r · ω = 0. Esto ocurre para el movi-
miento en un cı́rculo tomando el punto de referencia O en el centro de
cı́rculo. Entonces
l = mr2ω = Iωω, (16.61)
siendo I = mr2 el momento de inercia con respecto al eje de giro. La
relación entre l y ω para un movimiento arbitrario de una partı́cula o
para la rotación de un sólido rı́gido es menos sencilla que (16.61). La
relación general es
l = Iω , (16.62)
donde I es una cantidad con nueve componentes denominada tensor (o Figura 16.29
matriz) de inercia, y lo tratamos brevemente en el Ejemplo 19.15.
toma un valor en cada punto r = (x, y, z); es decir, se le asocia un escalar (un número) en
cada punto. En el Capı́tulo 10 hemos tratado ejemplos de campos escalares. Una función
vectorial de posición, un campo vectorial,
∂f ∂f ∂f
grad f = i+ j + k. (16.66)
∂x ∂y ∂z
Se puede interpretar esta cantidad como el resultado de operar sobre la función f con el
operador diferencial vectorial
∂ ∂ ∂
∇= i+ j+ k (16.67)
∂x ∂y ∂z
∂ ∂ ∂
grad f = ∇f = i+ j+ k f =
∂x ∂y ∂z
16.8. Gradiente de un campo escalar 417
∂f ∂f ∂f
= i+ j+ k (16.68)
∂x ∂y ∂z
05. Hamilton introdujo la notación ∇, y (posiblemente) lo llamó nabla por el nombre de un instru-
mento musical parecido al arpa utilizado en Palestina en tiempos bı́blicos.
418 Capı́tulo 16. Vectores
El significado del gradiente de una función de posición f (r) se entiende mejor con-
siderando cómo varı́a el valor de la función de un punto a otro del espacio. Sea un
desplazamiento (infinitesimal) r → r + dr, o en componentes cartesianas, (x, y, z) →
(x + dx, y + dy, z + dz):
∂f ∂f ∂f
df = dx + dy + dz . (16.73)
∂x ∂y ∂z
de manera que
df = ∇f · dr . (16.74)
df
La cantidad ∇f es por lo tanto la generalización de la derivada ordinaria a tres di-
dx
d
mensiones. El operador vectorial ∇ es la generalización del operador y a veces se
dx
d
denota por .
dr
∂ ∂ ∂ ∂f ∂f ∂f
div v = ∇ · ∇f = i+ j+ k · i+ j+ k
∂x ∂y ∂z ∂x ∂y ∂z
∂2f ∂2f ∂2f
= + + 2. (16.76)
∂x2 ∂y2 ∂z
Rotacional
El rotacional (rot v) de un campo vectorial v(r) se define como el vector
∂vz ∂vy ∂vx ∂vz ∂vy ∂vx
rot v = ∇ × v = − i+ − j+ − k
∂y ∂z ∂z ∂x ∂x ∂y
i j k
∂ ∂ ∂
= . (16.77)
∂x ∂y ∂z
v vy vz
x
La ecuación (16.79) es una propiedad del campo magnético. Este campo siempre puede
escribirse como el rotacional de una función vectorial, B = ∇ × A, donde A es el
potencial magnético, y ∇ · B = 0.
Todo vector del espacio vectorial puede entonces expresarse como una combinación
lineal de estos vectores,
a = (a1 , a2 , a3 , . . . , an ) = a1 e1 + a2 e2 + a3 e3 + · · · + an en . (16.81)
a · b = a 1 b1 + a 2 b2 + a3 b3 + · · · + an bn = b · a . (16.82)
El producto interno se denota a menudo por (a, b). Dos vectores son ortogonales (‘per-
pendiculares’) si su producto interno es cero, y la longitud o norma de un vector es
√
|a| = a·a= a 1 2 + a 2 2 + a 3 2 + · · · + an 2 . (16.83)
16.11. Ejercicios
Apartado 16.2
1. Sean a, b, c y d los vectores de posición de los puntos A, B, C y D. Exprese las siguientes cantidades
en función de a, b, c y d:
→ −
− →
(i) AB y BA , (ii) la posición del baricentro de los puntos,
→
−
(iii) la posición del centro de BC ,
→
−
(iv) la posición de un punto arbitrario de la recta BC (ecuación de la recta).
06. Hermann Günther Grassmann (1809-1877), metemático alemán, dio un tratamiento detallado de
los espacio vectoriales de dimensión n en su Die lineale Ausdehnungslere, ein neuer Zweig der Mathematik
(La teorı́a de extensiones lineales, una nueva rama de la matemática) de 1862. El trabajo incluı́a las álgebras
de los cuaterniones de Hamilton y de los vectores de Gibbs como casos particulares, pero fue muy poco
conocido durante su vida.
16.11. Ejercicios 421
Apartado 16.3
Halle: (a) el vector v = (v1 , v2 , v3 ) con origen P(x1 , y1 , z1 ) y extremo Q(x2 , y2 , z2 ) y (b) la longitud de v:
2. P (1, 0, 0), Q (3, 2, 0) 3. P (– 3, 2, 1), Q (– 1, −3, 2)
6. P (– 2, 3, −1), Q (– 2, 3, −1)
14. Se dice que unas fuerzas están en equilibrio si la fuerza total es nula. Halle f tal que f, f1 = 2i−3 j+k
y f2 = 2 j − k estén en equilibrio.
16. Tres masas m1 = 2, m2 = 3, m3 = 1, tienen vectores de posición r1 = (3, −2, 1), r2 = (2, −1, 0),
r3 = (0, 1, −2), respectivamente. Halle
(i) el vector de posición del centro de masas,
(ii) los vectores de posición de las masas con respecto al centro de masas.
Apartado 16.4
Derive con respecto a t:
18. 2ti + 3t2 j 19. ( cos 2t, 3 sen t, 2t)
20. Un cuerpo de masa m se mueve sobre la curva r(t) = x(t)i + y(t) j + z(t)k, siendo x = 2 cos 3t,
y = 2 sen 3t, z = 3t, y t el tiempo.
(i) Halle la velocidad y la aceleración en el instante t.
(ii) Halle la dirección de la fuerza que se ejerce sobre el cuerpo.
(iii) Describa el movimiento del cuerpo (considérelo como una combinación de un mo-
vimiento en el plano xy y un movimiento en la dirección z).
Apartado 16.5
Para a = (1, 3, −2), b = (0, 3, 1), c = (1, −1, −3), halle:
422 Capı́tulo 16. Vectores
Para a = i, b = j, c = 2i − 3 j + k, halle:
30. Demuestre que a = (1, 2, 3), b = (0, −3, 2) y c = (– 13, 2, 3) son vectores ortogonales.
31. Halle el valor de λ para el cual a = (λ, 3, 1) y b = (2, 1, −1) son ortogonales.
√
32. Halle los ángulos entre la dirección de a = i − j + 2k y las direcciones x, y y z.
35. Calcule la energı́a de interacción entre el sistema constituido por las cargas q1 = 2, q2 = −3 y q3 = 1
situadas en r1 = (3, −2, 1), r2 = (0, 1, 2) y r3 = (0, 2, 1), respectivamente, y el campo eléctrico aplicado
E = −2k.
Apartado 16.6
Para a = (1, 3, −2), b = (0, 3, 1), c = (0, −1, 2), halle :
45. Halle el área del paralelogramo cuyos vértices tienen (en el plano xy) las coordenadas (1, 2), (4, 3),
(8, 6), (5, 5).
16.11. Ejercicios 423
46. La fuerza F actúa aplicada en el punto A. Halle el momento de la fuerza con respecto al punto O para
(i) F = (1, −3, 0) , A (2, 1, 0) , O (0, 0, 0),
48. Una carga q que se mueve con velocidad v en presencia de un campo eléctrico E y un campo magnéti-
co B, experimenta una fuerza total
F = qE + qv × B
llamada fuerza de Lorentz.
Calcule la fuerza que se ejerce sobre la carga q = 3 que se mueve con velocidad v = (2, 3, 1) en presencia
del campo eléctrico E = 2i y del campo magnético B = 3 j.
49. Utilice la propiedad del triple producto (Ejercicio 44) para obtener la ecuación (16.60) a partir de
(16.58) y (16.59).
50. La posición de una partı́cula de masa m que se mueve en un cı́rculo de radio R en torno al eje z con
velocidad angular ω viene dada por la función vectorial
siendo
x(t) = R cos ωt, y(t) = R sen ωt, z = constante
(el origen no está en el centro del cı́rculo).
(i) ¿Cuál es la velocidad angular ω en torno al eje z?
(ii) Exprese la velocidad v en función de ω, x, y y z.
(iii) Exprese el momento angular de la partı́cula en función de ω, x, y y z.
(iv) Compruebe que se cumple la ecuación (16.60) para este caso.
52. El momento angular total de un sistema de partı́culas es la suma de los momentos angulares de
cada partı́cula. Si se sustituye el sistema del Ejercicio 50 por un sistema de dos partı́culas de masa m con
posiciones
r1 = x(t)i + y(t) j + zk , r2 = −x(t)i − y(t) j + zk ,
ω , siendo I el momento angular total con
halle el momento angular total l = l1 + l2 , y demuestre que l = Iω
respecto al eje de rotación.
ω si el eje de rotación es un eje de simetrı́a del sistema.
Este ejemplo ilustra que l = Iω
Apartado 16.8
Halle el gradiente ∇f para
53. f = 2x2 + 3y2 − z2 54. f = xy + zx + yz 55. f = (x2 + y2 + z2 )−1/2
424 Capı́tulo 16. Vectores
Apartado 16.9
Halle div v y rot v para
56. v = xi + y j + zk 57. v = zi + x j + yk 58. v = yzi + zx j + xyk
17.1. Conceptos
(1) a1 x + b1 y = c1
(17.1)
(2) a2 x + b2 y = c2
(1 ) a1 b2 x + b1 b2 y = c1 b2
(2 ) b1 a2 x + b1 b2 y = b1 c2
01. Las primeras descripciones del método para resolver conjuntos de ecuaciones lineales mediante
determinantes, conocido como regla de Cramer, las dieron el japonés Seki Kowa (1642-1708) en un ma-
nuscrito de 1683, y Leibniz en una carta a l’Hôpital en 1693 (publicada en 1850) en la cual daba también
la condición para la consistencia de las ecuaciones. La primera mención impresa apareció en el Treatise of
algebra de MacLaurin (póstumamente, en 1748).
426 Capı́tulo 17. Determinantes
(a1 b2 − b1 a2 ) x = c1 b2 − b1 c2 . (17.2)
(a1 b2 − b1 a2 ) y = a1 c2 − c1 a2 . (17.3)
c1 b2 − b1 c2 a1 c2 − c1 a2
x= , y= . (17.4)
a1 b2 − b 1 a2 a1 b2 − b 1 a2
D1 D2
x= , y= (17.6)
D D
siendo
a 1 b1 c1 b1 a1 c1
D= ,
D1 = ,
D2 = . (17.7)
a2 b2 c2 b2 a2 c2
2x − 3y = 5
x + 5y = 9
02. El término determinante fue acuñado por Cauchy en 1812 en el primero de una larga serie de
artı́culos sobre una clase de funciones simétricas alternadas tales como a1 b2 − b1 a2 . Para el caso general,
dispuso las n2 diferentes cantidades en una tabla cuadrada y empleó la abreviatura (a1,n ) para representar la
tabla que se asocia a un determinante. Cauchy usó los determinantes en problemas de geometrı́a y en fı́sica,
y para la cantidad que llamamos hoy en dı́a jacobiano. Introdujo el concepto de menores y el desarrollo con
respecto a cualquier fila o columna.
17.2. Determinantes de orden 3 427
2 −3
Tenemos D = = 2 × 5 − (– 3) × 1 = 13,
1 5
5 −3 2 5
D1 = = 5 × 5 − (– 3) × 9 = 52 , D2 = = 2 × 9 − 5 × 1 = 13 .
9 5 1 9
Por lo tanto x = D1 /D = 4 e y = D2 /D = 1.
El determinante (17.5) es un valor que depende de una tabla con 4 = 22 elementos, los
coeficientes de x e y del sistema de ecuaciones (17.1). Se trata de un determinante de
orden 2. En el caso general, un determinante de orden n es una cantidad que depende de
una tabla cuadrada con n2 elementos, y se representa como
a11 a12 a13 ··· a1n
a21 a22 a23 ··· a2n
a31 a32 a33 ··· a3n
(17.8)
.. .. .. .. ..
. . . . .
an1 an2 an3 ··· ann
D = a11 a22 a33 − a11 a23 a32 − a21 a12 a33 + a21 a13 a32 + a31 a12 a23 − a31 a13 a22 . (17.11)
La solución del sistema de tres ecuaciones puede ser expresada, mediante determinantes
de orden 3, como
D1 D2 D3
x1 = , x2 = , x3 = (17.12)
D D D
donde D = 0 es el determinante de los coeficientes (17.10) y
b1 a12 a13 a11 b1 a13 a11 a12 b1
D1 = b2 a22 a23 , D2 = a21 b2 a23 , D3 = a21 a22 b2 . (17.13)
b3 a32 a33 a31 b3 a33 a31 a32 b3
2x − 3y + 4z = 8
y − 3z = −7
x + 2y + 2z = 11 .
Por la ecuación (17.10), el determinante de los coeficientes es
2 −3 4
1 −3 −3 4
D = 0
1 −3 = 2 + 1 −3 4
2 2 − 0 2 2 1 −3
1 2 2
= 2 × 8 − 0 × (– 14) + 1 × 5 = 21 .
Por lo tanto x = D1 /D = 1, y = D2 /D = 2 y z = D3 /D = 3.
17.2. Determinantes de orden 3 429
Menores y cofactores
Los elementos de la segunda fila son a21 , a22 y a23 . Por lo tanto, utilizando (17.17) para los signos,
a11 a12 a13 a21
fila 2 −→ a22 a23 = −a21 M21 + a22 M22 − a23 M23 .
a
31 a32 a33
El menor M21 es
a11 a12 a13
a12 a13
M21 = a21 a22 a23 =
a32 a33
= a12 a33 − a13 a32 .
a a32 a33
31
430 Capı́tulo 17. Determinantes
De manera similar,
a11 a13 a11 a12
M22 = = a11 a33 − a13 a31 ,
M23 = = a11 a32 − a12 a31 .
a31 a33 a31 a32
El desarrollo completo del determinante en función de sus elementos es por lo tanto
−a21 M21 + a22 M22 − a33 M33 = − a21 (a12 a33 − a13 a32 )
+ a22 (a11 a33 − a13 a31 ) − a23 (a11 a32 − a12 a31 )
que es idéntico al resultado (17.11) obtenido mediante el desarrollo con respecto a la primera columna.
EJEMPLO 17.4 Halle el valor del siguiente determinante desarrollándolo (a) con respecto a la primera
fila y (b) con respecto a la tercera columna:
2 1 3
D = 4 −2 0 .
−1 1 0
(a) El desarrollo con respecto a la primera fila es
−2 0
D = 2 × − 1 × 4 0 + 3 × 4 −2
1 0 −1 0 −1 1
= 2 × 0 − 1 × 0 + 3 × 2 = 6.
(b) El desarrollo con respecto a la tercera columna es
4 −2
D = 3 − 0 + 0 = 3 × 2 = 6.
−1 1
El cofactor Cij del elemento aij es el menor Mij multiplicado por el correspondiente signo,
Un determinante de orden n es una cantidad que depende de una tabla cuadrada con
n2 elementos, representado por
a11 a12 a13 ··· a1n
a21 a22 a23 ··· a2n
a31 a32 a33 ··· a3n
. (17.21)
.. .. .. .. ..
. . . . .
an1 an2 an3 ··· ann
n
La cantidad
= 2 × 5 − 1 × (– 9) + 1 × (– 29) − 3 × 2 = −16 .
Hemos visto en los Apartados 17.1 y 17.2 que las soluciones de dos ecuaciones li-
neales, (17.6), o de tres ecuaciones lineales (17.12), pueden escribirse como cocientes
de determinantes si el determinante de los coeficientes de las incógnitas no es cero. En
general, el sistema de n ecuaciones lineales,
D1 D2 Dn
x1 = , x2 = , ... , xn = , (17.28)
D D D
donde Dk se obtiene a partir de D sustituyendo la columna k de D por la columna con los
elementos b1 , b2 , . . . , bn . Por ejemplo,
03. El suizo Gabriel Cramer (1704-1752) publicó la regla en su Introduction à l’analyse des lignes
courbes algébriques (Introducción al análisis de las lı́neas curvas algebraicas) en 1750.
434 Capı́tulo 17. Determinantes
a11 b1 a13 ··· a1n
a21 b2 a23 ··· a2n
D2 1 a31 b3 a33 ··· a3n
x2 = = . (17.29)
D D .. .. .. .. ..
. . . . .
an1 bn an3 ··· ann
Caso D=0
(1) 2x + 2y + z = 10
(2) x + 2y − 2z = −3 (17.30)
(3) 3x + 2y + 4z = 20
tiene determinante
2 2 1
2 −2 1 −2 1 2
D = 1 2 −2 = 2
2
− 2 + = 24 − 20 − 4 = 0 .
3 2 4 3 4 3 2
4
4x + 4y + 2z = 17 ,
4x + 4y + 2z = 20 .
El sistema puede hacerse compatible si, por ejemplo, cambiamos el segundo miembro
de (3) a 23:
(1) 2x + 2y + z = 10
(2) x + 2y − 2z = −3 (17.31)
(3) 3x + 2y + 4z = 23 .
17.4. Resolución de ecuaciones lineales 435
Ahora la suma de (2) y (3) es igual a dos veces (1), pero eso supone que la ecuación (1)
no contiene información que no esté ya contenida en las otras dos ecuaciones.
Se dice que las ecuaciones son linealmente dependientes, y tenemos en la práctica
únicamente dos ecuaciones con tres incógnitas. Por ejemplo, resolviendo (1) y (2), o
cualquier otro par, para x e y en función de z obtenemos
1
x = 13 − 3z , y= (5z − 16) , (17.32)
2
que es una solución del sistema (17.31) para cada valor de z.
Ecuaciones homogéneas
x1 = x2 = x3 = · · · = xn = 0 si D = 0 . (17.34)
(1) 2x + 2y + z = 0
(2) x + 2y − 2z = 0 (17.35)
(3) 3x + 2y + 4z = 0
5z
x = −3z , y= , (17.36)
2
para cualquier valor de z. Sólo se obtiene una solución única si se conoce una relación
adicional, independiente, entre x, y y z.
436 Capı́tulo 17. Determinantes
Este ejemplo ilustra uno de los teoremas más importantes de los sistemas de ecuacio-
nes lineales:
En el Capı́tulo 19 trataremos los sistemas de ecuaciones lineales con más detalle como
ecuaciones matriciales.
Ecuaciones seculares
EJEMPLO 17.8 Halle los valores de λ para los cuales el siguiente sistema de ecuaciones tiene solución
no nula:
−2x + y + z = λx
− 11x + 4y + 5z = λy
−x + y = λz .
Las ecuaciones pueden expresarse como
(– 2 − λ)x + y + z =0
− 11x + (4 − λ)y + 5z =0
−x + y + (– λ)z = 0
Por lo tanto
4−λ 5 −11 5 −11 4 − λ
D = (– 2 − λ) −
−1 −λ
+
−1
1 −λ 1
y D = 0 si λ = 1, −1, ó 2.
Para cada una de las n raı́ces del determinante secular existe una solución de las ecua-
ciones (17.38).
E = E1 = α : (1) βc2 = 0 −→ c2 = 0 ,
(2) βc1 + βc3 = 0 −→ c1 = −c3 .
√ √ √
E = E2 = α + 2β : (3) βc2 − 2βc3 = 0 −→ c2 = 2c3 ,
√ √
(1) − 2βc1 + βc2 = 0 −→ c 1 = c2 / 2 = c3 .
√ √ √
E = E3 = α − 2β : (3) βc2 + 2βc3 = 0 −→ c2 = − 2c3 ,
√ √
(1) 2βc1 + βc2 = 0 −→ c1 = −c2 / 2 = c3 .
Las tres soluciones del problema secular son, tomando c3 = 1 por comodidad,
E c1 c2 c3
α −1 0 1
√ √
α + 2β 1 2 1
√ √
α − 2β 1 − 2 1
1. Transposición
a1 b1 c1 a1 a2 a3
a2 b2 c2 = b1 b2 b3 . (17.40)
a3 b3 c3 c1 c2 c3
λa1 λb1 λc1 a1 b1 c1
a2 b2 c2 = λ a2 b2 c2 . (17.41)
a3 b3 c3 a3 b3 c3
2 4 6 1 2 3 1 1 3
1 8 9 = 2 1 8 9 = 2 × 2 1 4 9
3 12 27 3 12 27 3 6 27
1 1 1 1 1 1
= 2 × 2 × 3 1 4 3 = 2 × 2 × 3 × 3 1 4 3 = 144 .
3 6 9 1 2 3
4. Regla de la suma
Esto se obtiene del desarrollo de los tres determinantes con respecto a la fila o columna
pertinente; en (17.43) es la columna 1. Ası́,
440 Capı́tulo 17. Determinantes
a1 + d1 b1 c1
a2 + d2 b2 c2 = (a1 + d1 ) b2 c2 − (a2 + d2 ) b1 c1 + (a3 + d3 ) b1 c1
b3 c3 b3 c3 b2 c2
a3 + d3 b3 c3
b2 c2 b1 c1 b1 c1
= a1
− a2
+ a3
b3 c3 b3 c3 b2 c2
b2 c2 b1 c1 b1 c1
+ d1 − d2
+ d3
b3 c3 b3 c3 b2 c2
a1 b1 c1 d1 b1 c1
= a2 b2 c2 + d2 b2 c2 .
a3 b3 c3 d3 b3 c3
a1 b1 c1 a1 c1 b1
a2 b2 c2 = − a2 c2 b2 (intercambio de las columnas 2 y 3) . (17.45)
a3 b3 c3 a3 c3 b3
Intercambio de columnas:
a1 b1
= a1 b2 − b1 a2 = −(b1 a2 − a1 b2 ) = − b1 a1 .
a2 b2 b2 a2
Intercambio de filas:
1 2 3 4
D1 = = 1 × 4 − 2 × 3 = −2 , D2 = = 3 × 2 − 4 × 1 = +2 = −D1 .
3 4 1 2
17.5. Propiedades de los determinantes 441
= −5 − 12 − 4 = −21 = −D .
a1 + λb1 b1 c1 a1 b1 c1 λb1 b1 c1 a1 b1 c1
a2 + λb2 b2 c2 = a2 b2 c2 + λb2 b2 c2 = a2 b2 c2 . (17.48)
a3 + λb3 b3 c3 a3 b3 c3 λb3 b3 c3 a3 b3 c3
9. Derivada de un determinante
D = D1 + D 2 + D 3 + · · · + Dn , (17.49)
f (x1 , x1 , x3 , . . . , xn ) = 0 . (17.52)
Un determinante es una función alternada de sus filas (o de sus columnas). Más impor-
tante, un determinante que es una función alternada de n variables, x1 , x2 , x3 , . . . , xn , tiene
la forma
f1 (x1 ) f1 (x2 ) f1 (x3 ) . . . f1 (xn )
f (x ) f (x ) f (x ) . . . f (x )
2 1 2 2 2 2 2 n
f3 (x1 ) f3 (x2 ) f3 (x3 ) . . . f3 (xn )
, (17.53)
. ..
.. .. .. ..
. . . .
f (x ) f (x ) f (x ) . . . f (x )
n 1 n 2 n 2 n n
Para n = 3,
f1 (x1 ) f1 (x2 ) f1 (x3 )
f2 (x1 ) f2 (x2 ) f2 (x3 ) = f1 (x1 )f2 (x2 )f3 (x3 ) − f1 (x1 )f2 (x3 )f3 (x2 )
f3 (x1 ) f3 (x2 ) f3 (x3 ) + f1 (x2 )f2 (x3 )f3 (x1 ) − f1 (x2 )f2 (x1 )f3 (x3 )
+ f1 (x3 )f2 (x1 )f3 (x2 ) − f1 (x3 )f2 (x2 )f3 (x1 ) . (17.55)
x1 x2 x3 , x1 x3 x2 , x2 x3 x1 , x2 x1 x3 , x3 x1 x2 , x3 x2 x1 . (17.56)
17.8. Ejercicios
Evalúe:
2 3 5 1 1 1 1 3 −2 0 3 2
6. 0 1 2 7. 1 −1 0 8. 0 −1 2 9. 2 0 1
3 4 1 1 1 −2 0 0 4 2 6 0
3 4 0 0 −2 6 17 −5 1 1 0 0
1 2 0 0 0 3 22 −17 3 2 2 −3
10. 11. 0 0 4 12
12. 1 −1
0 0 3 1 2 2
0 0 4 2 0 0 0 −6 5 3 1 −1
Apartado 17.4
Use la regla de Cramer para resolver los sistemas de ecuaciones:
w + 2x + 3y + z = 5
x + y + z= 6 3x − 2y − 2z = 0
2w + x + y + z= 3
13. x + 2y + 3z = 14 14. x + y − z = 0 15.
w + 2x + y = 4
x + 4y + 9z = 36 2x + 2y + z = 0
x + y + 2z = 0
16. Demuestre que las siguientes ecuaciones no tienen solución salvo si k = 3.
2x − y + z = 2
3x + y − 2z = 1
x − 3y + 4z = k
Resuelva las ecuaciones para ese valor de k.
17. Halle k para que las siguientes ecuaciones tengan solución no trivial.
kx + 5y + 3z = 0
5x + y − z = 0
kx + 2y + z = 0
Resuelva las ecuaciones para ese valor de k.
Halle los valores de λ para los que los siguientes sistemas de ecuaciones tengan soluciones no triviales.
Halle las soluciones para esos valores de λ.
3x + y = λx x + 2y − 3z = λx
2x + y = λx
18. 19. x + 2y + 3z = λy 20. 2x + 4y − 6z = λy
x + 2y = λy
4y + 9z = λz − x − 2y + 3z = λz
a1 a2 a3 a4
b1 b2 b3 b4
27. 16
c1 c2 c3 c4
d1 d2 d3 d4
a1 + b1 + c1 + d1 a2 + b2 + c2 + d2 a3 + b3 + c3 + d3 a4 + b4 + c4 + d4
a1 + b1 − c1 − d1 a2 + b2 − c2 − d2 a3 + b3 − c3 − d3 a4 + b4 − c4 − d4
=
a1 − b1 + c1 − d1 a2 − b2 + c2 − d2 a3 − b3 + c3 − d3 a4 − b4 + c4 − d4
a1 − b1 − c1 + d1 a2 − b2 − c2 + d2 a3 − b3 − c3 + d3 a4 − b4 − c4 + d4
17.8. Ejercicios 447
18.1. Conceptos
El álgebra matricial es la rama de las matemáticas que trata la teorı́a de los sistemas de
ecuaciones lineales, y es la herramienta básica para la formulación, el análisis teórico y
la resolución de problemas en las ciencias fı́sicas, ingenierı́a y estadı́stica, que dan lugar
a esos sistemas de ecuaciones. Una de las aplicaciones importantes en quı́mica usa el
concepto de transformaciones lineales para la representación matricial de operaciones de
simetrı́a en la descripción de las propiedades de simetrı́a de las moléculas, las funciones
de onda moleculares y los modos normales de vibración. En este capı́tulo presentamos
los elementos del álgebra matricial en los Apartados 18.2 a 18.4, y en los Apartados 18.5
y 18.6 la teorı́a matricial de las transformaciones lineales. En el Apartado 18.7 tratamos
las operaciones de simetrı́a, con una breve introducción a los grupos de simetrı́a.
Una matriz consiste en m × n cantidades, o elementos, dispuestos en una tabla rec-
tangular de m filas y n columnas situada entre paréntesis.1 Algunos ejemplos son
⎛ ⎞
x1
1 0 0
2 −1 a b c ⎜ x2 ⎟
0 3 , d e f , ⎝x ⎠, 0 1 0 , (18.1)
3
0 0 1
x4
01. Sylvester acuñó el término matriz en 1850 para representar una ‘disposición oblonga de térmi-
nos que consiste, supongamos, en m lı́neas y n columnas’ porque a partir de ella ‘podemos formar varios
sistemas de determinantes’. James Joseph Sylvester (1814-1897) estudió matemáticas en Cambridge pero
no tenı́a derecho a obtener un tı́tulo de Cambridge por motivos religiosos (era judı́o). Recibió su tı́tulo del
Trinity College de Dublı́n. Sus cargos incluyeron la cátedra de matemáticas de la entonces recién fundada
Johns Hopkins University de Baltimore (1876-1883). Fue editor fundador del American Journal of Mathe-
matics (1878). Es conocido sobre todo por su colaboración con su amigo Cayley en la teorı́a de matrices y
formas.
450 Capı́tulo 18. Matrices y transformaciones lineales
x = a1 x + b 1 y
(18.3)
y = a2 x + b2 y
r = Ar , (18.6)
siendo
x x a1 b1
r= , r = , A= . (18.7)
y y a2 b2
Las cantidades r y r son matrices columna (o vectores columna) cuyos elementos son
las coordenadas antes y después de la transformación de coordenadas, y A es la matriz
cuadrada de los coeficientes que representa y determina la transformación. Las transfor-
02. El álgebra de transformaciones de coordenadas fue tratado en 1801 por Gauss, y desarrollado
en 1858 en un álgebra por Cayley en su Memoir on the theory of matrices (Memoria sobre la teorı́a de
matrices), en la cual introdujo la notación con una única letra para una matriz y dedujo las reglas de la suma
y el producto.
Arthur Cayley (1821-1895) se graduó por el Trinity College de Cambridge en 1842, fue Becario durante
siete años y después ejerció la abogacı́a durante 14 años en los cuales publicó varios centenares de artı́culos.
Su producción sólo tiene rival en las de Euler o de Cauchy, con 967 artı́culos en sus Obras Completas. Es
conocido sobre todo por su trabajo sobre matrices y formas, también desarrolló la geometrı́a analı́tica de
espacios de n dimensiones en 1843, dio la primera definición de un grupo abstracto en 1854, y contribuyó a
la teorı́a de grafos, con una aplicación al estudio de isómeros quı́micos en 1874. Era muy solicitado como
referee por su conocimiento enciclopédico de las matemáticas.
18.2. Algunas matrices especiales 451
Sea un punto P del plano xy, con coordenadas (x, y) con respecto al sistema de coordenadas Oxy. Como
vimos en el Apartado 8.5, un giro en sentido antihorario de ángulo θ en torno al eje Oz mueve el punto a la
posición P de coordenadas (x , y ), como en la Figura 18.1, de manera que (ecuaciones (8.41))
x = x cos θ − y sen θ
(18.8)
y = x sen θ + y cos θ .
Una interpretación alternativa de estas ecuaciones (‘pasiva’ en vez de ‘activa’) es el cambio de coordenadas
del punto fijo P si el propio sistema de coordenadas experimenta un giro en sentido horario de ángulo θ,
desde Oxy a Ox y como en la Figura 18.2.
Las coordenadas de P en el sistema girado son entonces (x , y ). La correspondiente ecuación matricial
es
x cos θ − sen θ x
= , (18.9)
y sen θ cos θ y
y la matriz
cos θ − sen θ
(18.10)
sen θ cos θ
Matrices cuadradas
En tales matrices, la diagonal que contiene los elementos a11 , a22 , . . . , ann se llama diago-
nal principal (la palabra ‘principal’ se suele omitir), y los elementos aii de esa diagonal
se llaman elementos diagonales de la matriz. Los elementos aij con i = j, que no están
situados en la diagonal se dicen fuera de la diagonal: los elementos de la matriz (18.11)
situados fuera de la diagonal son a12 , a13 , a23 , a21 , a31 y a32 . Una matriz cuyos elementos
situados fuera de la diagonal son todos cero se llama matriz diagonal, por ejemplo:
⎛ ⎞
a11 0 0
⎝ 0 a22 0 ⎠ (matriz diagonal). (18.12)
0 0 a33
La matriz diagonal de orden n cuyos elementos diagonales son todos la unidad se llama
matriz identidad de orden n I (o In ). Para orden 3
1 0 0
I= 0 1 0 (matriz identidad). (18.13)
0 0 1
La traza de A es
tr A = 2 + (– 2) + 0 + (– 1) = −1 .
Vectores
Una matriz que tiene una única columna se llama matriz columna o vector columna.
Una matriz con una única fila es una matriz fila o vector fila. Los elementos de un
vector se llaman componentes. Aunque las matrices se suelen representar por letras
mayúsculas, los vectores se representan con minúsculas:
⎛ ⎞
b1
⎜ b2 ⎟
⎜ ⎟
⎜b ⎟
a = (a1 2 3
a a · · · a n) , b=⎜ ⎜ 3 ⎟ (18.16)
⎟
⎜ .. ⎟
⎝ . ⎠
bn
Matriz transpuesta
AT = A . (18.18)
Determinante
Igualdad de matrices
Dos matrices, A = (aij ) y B = (bij ), son iguales si tienen las mismas dimensio-
nes (mismo número de filas y mismo número de columnas), y si los correspondientes
elementos son iguales:
Si
a11 a12 a13 1 2 0
A= y B=
a21 a22 a23 −3 4 2
entonces A = B si a11 = 1, a12 = 2, a13 = 0, a21 = −3, a22 = 4 y a23 = 2.
18.3. Álgebra matricial 455
Suma de matrices
La suma de dos matrices se define únicamente si las matrices tienen las mismas di-
mensiones. Si A = (aij ) y B = (bij ) son ambas matrices m × n, su suma es una matriz
m × n que se obtiene sumando los correspondientes elementos de A y B:
cA = (caij ) . (18.22)
Si ⎛ ⎞
1 2
A = ⎝−3 0 ⎠
5 −1
entonces ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
−1 −2 3 6 0 0
−A = ⎝ 3 0 ⎠, 3A = ⎝−9 0 ⎠, 0A = ⎝ 0 0 ⎠ .
−5 1 15 −3 0 0
Se deduce de las reglas de la suma y de la multiplicación por un escalar que una combina-
ción lineal de matrices m×n es una matriz m×n cuyos elementos son las combinaciones
lineales de los correspondientes elementos. Si A = (aij ), B = (bij ) y C = (cij ), entonces
siendo α, β y γ escalares.
456 Capı́tulo 18. Matrices y transformaciones lineales
Multiplicación de matrices
cij = ai1 b1j + ai2 b2j + ai3 b3j + · · · + ain bnj = aik bkj . (18.26)
k=1
= a 1 b1 + a2 b2 + a3 b3 + · · · + an bn = ak bk . (18.27)
k=1
El producto es un número, una matriz 1×1. En este caso el producto matricial es equiva-
lente al producto escalar de dos vectores (de n dimensiones; véanse los Apartados 16.5
y 16.19).
18.3. Álgebra matricial 457
⎛ ⎞
c11 c12 · · · c1j · · · c1p
⎜ c21 c22 · · · c2j · · · c2p ⎟
⎜ ⎟
⎜ .. .. .. . ⎟
⎜ ..
. .. ⎟
⎜ . . . ⎟
=⎜ ⎟. (18.28)
⎜ ci1 ci2 · · · cij · · · cip ⎟
⎜ ⎟
⎜ .. .. .. . .. ⎟
⎝ . . . .. . ⎠
cm1 cm2 · · · cmj · · · cmp
c1 d1 a1 b1 c1 a1 + d1 a2 c1 b1 + d1 b2
= .
c2 d2 a2 b2 c2 a1 + d2 a2 c2 b1 + d2 b2
Ley asociativa
Ley distributiva
A(B + C) = AB + AC . (18.30)
Ley conmutativa
AB = BA . (18.31)
03. El álgebra de los cuaterniones de Hamilton y el álgebra matricial de Cayley fueron los primeros
ejemplos de álgebras sin la limitación de la ley conmutativa para el producto. Llevaron al desarrollo de
álgebras generales que continúa hoy en dı́a.
18.3. Álgebra matricial 459
1 0 1 1
A= 0 0 , B= 1 0 ,
tenemos
1 0 1 1 1 1
AB = 0 0 1 0 = 0 0 ,
pero
1 1 1 0 1 0
BA = 1 0 0 0 = 1 0 ,
y
0 1 2 1 1 2 2 1 0 1
AB = 1 0 1 2 = 2 1 = 1 2 1 0 = BA .
[A, B] = AB − BA . (18.32)
En mecánica cuántica, el espı́n del electrón se representa a veces por las tres matrices de espı́n de Pauli, una
por cada componente cartesiana del momento angular de espı́n,
1 0 1 1 0 −i 1 1 0
Sx = , Sy = , Sz = , (18.33)
2 1 0 2 i 0 2 0 −1
√
donde i = −1 y = h/2π, siendo h la constante de Planck. Estas matrices cumplen las siguientes
propiedades de conmutación:
460 Capı́tulo 18. Matrices y transformaciones lineales
[Sx , Sy ] = Sx Sy − Sy Sx
1 0 1 0 −i 0 −i 0 1
= 2 −
4 1 0 i 0 i 0 1 0
1 i 0 −i 0
= 2 −
4 0 −i 0 i
1 1 0
= i2 = iSz
2 0 −1
Además,
1 2 0 1 0 1 1 2 1 0 1 2
S2x = Sx Sx = = = I
4 1 0 1 0 4 0 1 4
y de manera similar para S2y y S2z . Por lo tanto,
3 2
S2x + S2y + S2z = I (18.35)
4
representa el cuadrado del momento angular de espı́n. La cantidad 34 2 es el cuadrado de la magnitud del
momento angular de espı́n de un electrón, cuyo número cuántico de espı́n (total) es s = 12 ,
3 2 1
s(s + 1)2 = , con s= . (18.36)
4 2
Im A = A = AIn . (18.37)
n
n
Esto es igual a la traza del producto en orden inverso: en efecto, si D = BA, entonces un
elemento diagonal de D es
y la traza es
n
n
La transpuesta del producto de dos o más matrices es igual al producto de las matrices
transpuestas tomado en orden inverso:
(AB) = BT AT .
T
(18.41)
462 Capı́tulo 18. Matrices y transformaciones lineales
Sean ⎛ ⎞
2 3 4 1
2 0 −3
A= , B=⎝ 1 2 2 0 ⎠.
1 1 −2
0 −1 2 0
Entonces ⎛ ⎞
2 3 4 1
2 0 −3 ⎝ 1 ⎠ 4 9 2 2
AB = 2 2 0 =
1 1 −2 3 7 2 1
0 −1 2 0
y
⎛ ⎞⎛ ⎞ ⎛ 4 3 ⎞
2 1 0
2 1
⎜ 3 2 −1 ⎟ ⎝ ⎜ 9 7 ⎟
BT AT = ⎝ 1 ⎠=⎝ = (AB)T .
2 ⎠ 2 2 ⎠
0
4 2
−3 −2
1 0 0 2 1
BA = AB = I ,
se llama adjunta de A.
La matriz A
3. Divida la matriz adjunta por el determinante de A:
A
A−1 = . (18.45)
det A
La matriz
a11 a12
A=
a21 a22
tiene por determinante det A = a11 a22 − a12 a21 , y los cofactores de sus elementos son C11 = a22 , C12 =
−a21 , C21 = −a12 , C22 = a11 . Entonces
de manera que
−1 1 a22 −a12
A = .
a11 a22 − a12 a21 −a21 a11
Esto es lo mismo que la fórmula (18.43).
⎛
⎞
2 1 3
EJEMPLO 18.20 Halle la inversa de A = ⎝ 4 −2 0 ⎠.
−1 1 0
El determinante de esta matriz se ha calculado en el Ejemplo 17.4 y vale det A = 6, y los cofactores de
varios de sus elementos se han calculado en el Ejemplo 17.5. La matriz de los cofactores es
⎛ ⎞
0 0 2
⎝ 3 3 −3 ⎠ ,
6 12 −8
Comprobación:
⎛ ⎞⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 0 3 6 2 1 3 1 6 0 0 1 0 0
A−1 A = ⎝ 0 3 12 ⎠ ⎝ 4 −2 0 ⎠ = ⎝ 0 6 0 ⎠ = ⎝ 0 1 0 ⎠ .
6 2 −3 −8 −1 1 0 6 0 0 6 0 0 1
Señalamos que el método anterior para hallar la inversa de una matriz implica evaluar el
determinante y n2 cofactores. Como mencionamos en la nota del Apartado 17.3, éste no
es un método práctico salvo para matrices muy pequeñas (véase el Capı́tulo 20).
La inversa del producto de dos o más matrices es igual al producto de las matrices
inversas tomado en orden inverso,
−1
(AB) = B−1 A−1 . (18.46)
x = Ax , (18.48)
donde
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
x1 a11 a12 a13 ··· a1n x1
⎜ x2 ⎟ ⎜ ··· ⎟ ⎜ ⎟
⎜ ⎟ ⎜ a21 a22 a23 a2n ⎟ ⎜ x2 ⎟
⎜ x3 ⎟ ⎜ ··· ⎟ ⎜ ⎟
x =⎜
⎜
⎟,
⎟ A=⎜
⎜
a31 a32 a33 a3n ⎟,
⎟ x=⎜
⎜
x3 ⎟.
⎟
⎜ .. ⎟ ⎜ .. .. .. .. .. ⎟ ⎜ .. ⎟
⎝ . ⎠ ⎝ . . . . . ⎠ ⎝ . ⎠
xn an1 an2 an3 ··· ann xn
Sean (x, y) las coordenadas cartesianas de un punto en el plano xy, y supongamos que las matrices
cos θ − sen θ 0 1 1 0 1 0
A= , B= , C= , D= ,
sen θ cos θ 1 0 0 −1 0 a
Figura 18.3
Supongamos que a la transformación A dada por (18.47) y (18.48) le sigue una segunda
transformación B,
Sean (x, y) las coordenadas de un punto en el plano xy, y sean las matrices
⎛ √ ⎞
1 3
⎜ 2 − 2 ⎟ 0 1 −1 0
A=⎜ ⎝ √
⎟
⎠ , B = , C = ,
3 1 1 0 0 −1
2 2
transformaciones en el espacio. La matriz A representa una rotación en sentido antihorario de π/3 en torno
al origen, B es la reflexión con respecto a la recta x = y, y C es la inversión con respecto al origen. En la
Figura 18.4 ilustramos la secuencia A seguida de B seguida de C, que es equivalente a la transformación
⎛ √ ⎞ ⎛ √ ⎞
1 3 3 1
− − −
−1 0 0 1 ⎜ ⎜ 2 2 ⎟ ⎟=⎜ 2
⎜ 2 ⎟.
D = CBA =
0 −1 1 0 ⎝ √3 ⎠ ⎝ √ ⎟ ⎠
1 1 3
−
2 2 2 2
18.5. Transformaciones lineales 467
Figura 18.4
√ √
3 1 1 3
La posición final del punto es (x , y ) = – x − y, − x + y .
2 2 2 2
AX = A (x1 x2 x3 · · · xn )
= (Ax1 Ax2 Ax3 · · · Axn )
(18.52)
= (x1 x2 x3 · · · xn )
= X ,
EJEMPLO 18.23 Gire π/4 en torno al origen el cuadrado con esquinas situadas en las posiciones del
plano (x, y)
(x, y) = (2, 1), (3, 1), (3, 2), (2, 2) .
√
Por ser cos π/4 = sen π/4 = 1/ 2, la matriz de la transformación es
1 1 −1
√ .
2 1 1
468 Capı́tulo 18. Matrices y transformaciones lineales
⎛ ⎞
1 2 1
⎜ √2 √ √ 0 ⎟
= ⎜ 2 2 ⎟.
⎝ 3 4 5 4 ⎠
√ √ √ √
2 2 2 2
Figura 18.5
Transformaciones inversas
Si A es una matriz cuadrada no singular, tiene una inversa única A−1 tal que
La propiedad caracterı́stica de una matriz ortogonal es que sus columnas (y sus filas)
forman un sistema de vectores ortogonales unitarios (vectores ortonormales). Para orden
3, sea
⎛ ⎞
a1 b1 c1
A = ⎝ a2 b2 c2 ⎠ = (a b c) , (18.57)
a3 b3 c3
donde
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
a1 b1 c1
a = ⎝ a2 ⎠ , b = ⎝ b2 ⎠ , c = ⎝ c2 ⎠ . (18.58)
a3 b3 c3
La transpuesta de A es
⎛ ⎞ ⎛ T ⎞
a 1 a2 a3 a
AT = ⎝ b1 b2 b3 ⎠ = ⎝ bT ⎠ , (18.59)
c1 c2 c3 cT
y, por lo tanto, AT = A−1 . Se deduce también que el determinante de una matriz ortogonal
tiene por valor ±1. En efecto, por ser det AT = det A y det I = 1, tenemos
(i) ⎛ ⎞⎛ ⎞
2 2 1 2 1 2
⎜ 3 ⎟⎜ − ⎟ ⎛ 1 0 0 ⎞
⎜ 3 3 ⎟⎜ 3 3 3 ⎟
⎜ 1 ⎟⎜ ⎟ ⎜
AT A = ⎜ −
2 2 ⎟⎜ 2
−
2 1 ⎟=⎝ 0 1 0 ⎟
⎠
⎜ 3 ⎟⎜ ⎟
⎜ 3 3 ⎟⎜ 3 3 3 ⎟
⎝ 2 1 2 ⎠⎝ 1 2 2 ⎠ 0 0 1
−
3 3 3 3 3 3
T
y AAT = AT A = I.
(ii) Las columnas de A forman los vectores
2 2 1 1 2 2 2 1 2
a= , , , b= ,− , , c= – , , ,
3 3 3 3 3 3 3 3 3
con propiedades:
2 2
2
1 2 2
a·a=b·b=c·c= + + =1
3 3 3
18.7. Operaciones de simetrı́a 471
2 4 2 2 2 4 4 2 2
a·b= − + = 0, b · c = − − + = 0, c · a = − + + = 0.
9 9 9 9 9 9 9 9 9
De manera similar para las filas de A (las columnas de AT ).
(iii) El determinante de A es
2 1 −2
1
det A = 3 2 −2 1 = −1 .
3
1 2 2
Transformaciones ortogonales
x = Ax (18.65)
La molécula de agua en su estado fundamental tiene la geometrı́a nuclear de equilibrio no lineal represen-
tada en la Figura 18.6, con ángulo de enlace 105◦ . El sistema tiene tres elementos de simetrı́a cada uno con
su operación asociada:
472 Capı́tulo 18. Matrices y transformaciones lineales
Figura 18.6
Las tres operaciones de simetrı́a tiene efectos distintos sobre la distribución electrónica de la molécula, y
son operaciones de simetrı́a distintas.
La teorı́a matemática de la simetrı́a es la teorı́a de grupos. 4 Damos aquı́ sólo una breve
introducción al concepto de grupos de simetrı́a y a la representación matricial de los
grupos.
Grupos de simetrı́a
Consideremos la figura plana simétrica formada por tres puntos en los vértices de un
triángulo equilátero (Figura 18.7), con la figura en el plano xy de un sistema de coorde-
nadas fijo con origen O en el baricentro del triángulo.
Figura 18.7
04. La teorı́a de grupos tiene sus orı́genes en los estudios de las ecuaciones algebraicas realizados por
Lagrange, Gauss, Abel y Cauchy. La relación entre ecuaciones algebraicas y el grupo de permutaciones fue
descrita por Évariste Galois (1811-1832), cuya corta vida incluyó dos intentos fallidos de entrar en la École
Polytéchnique (en el segundo intento le tiró un borrador a uno de los examinadores), la expulsión de la
École Normale y dos arrestos, uno por amenazar la vida del rey y otro por llevar el uniforme de la disuelta
Guardia Nacional. Murió en un duelo por un ‘asunto de honor’. Sus manuscritos matemáticos quedaron
sin leer hasta que Liouville los publicó en 1846. En un artı́culo sobre formas cuadráticas de 1882, Heinrich
Weber (1842-1913) dio una descripción axiomática completa de un grupo finito abstracto, definió los grupos
abelianos, y en 1893 extendió el trabajo a los grupos infinitos.
18.7. Operaciones de simetrı́a 473
CA = D , AC = F . (18.66)
Figura 18.8
en cada operación de simetrı́a. En nuestro ejemplo sólo hay un punto que lo cumpla, el
baricentro del triángulo.
E E A B C D F
A A B E F C D
B B E A D F C
C C D F E A B
D D F C B E A
F F C D A B E
PE = EP = P .
(iii) Cada elemento tiene un inverso que también pertenece al grupo: si P pertenece al
grupo entonces su inverso P−1 se define por
PP−1 = P−1 P = E .
G E A B C D F
Γ1 1 1 1 1 1 1
Γ2 1 1 1 −1 −1 −1
√
√
√
√
1 0 − 12 − 23 − 12 3
−1 0 1 3 1
− 3
Γ2 √ √
2
√
2 2
√
2 2
0 1 3
− 21 − 3
− 12 0 1 3
− 12 − 23 − 12
2 2 2
+1 +1 +1 −1 −1 −1
+1 +1 +1 +1 −1 −1 −1
+1 +1 +1 +1 −1 −1 −1
+1 +1 +1 +1 −1 −1 −1
−1 −1 −1 −1 +1 +1 +1
−1 −1 −1 −1 +1 +1 +1
−1 −1 −1 −1 +1 +1 +1
ya que
−1 0 x −x
0 1 y = y . (18.69)
Para todo grupo, es posible construir todas las representaciones que se quiera de todas
las dimensiones posibles, pero se puede demostrar que sólo cierto número de ellas (las
‘representaciones irreducibles’) son distintas e independientes. En el caso que nos ocu-
pa, todas las representaciones posibles del grupo G o bien son equivalentes a las tres
representaciones de la Tabla 18.2, o bien se pueden reducir a ellas.
18.8. Ejercicios
Apartado 18.2
Para las siguientes matrices,
⎛⎞ ⎛ ⎞
−5 3 3 0 0
1 −2 3 0 1 −4
A = , B= , C = ⎝ 4 −1 ⎠ , D = ⎝ 0 2 0 ⎠,
0 3 4 2 −3 0
2 −1 0 0 −1
⎛ ⎞
0
1 −2 3 0
P = , Q= , a = ⎝−3 ⎠ , b = 2 5 −2 ,
0 4 0 1
1
halle, si es posible:
1. AT 2. CT 3. DT 4. PT
5. aT 6. bT 7. det A 8. det D
9. det P 10. tr B 11. tr D 12. tr Q
18.8. Ejercicios 477
Apartado 18.3
Para las matrices de más arriba, halle si es posible:
13. A+B 14. A−B 15. B−A 16. C+D
17. 3P 18. 2A + 3B 19. a+b T
20. aT + b
21. AB 22. BC 23. CB 24. CP
25. PC 26. D2 27. PQ 28. QP
T T
29. ab 30. ba 31. ab 32. bT aT
33. Ca 34. aT C
⎛ ⎞
1 1 1
35. Demuestre que (CP)T = PT CT .36. Si A = ⎝ 2 1 2 ⎠, demuestre que
−2 1 −1
A3 − A2 − 3A + I = 0.
a b 2 1
Siendo A = yB= , halle A tal que:
c d 3 2
−1 0 3 2
37. A+B= 38. AB =
5 1 1 4
41. Las matrices de espı́n para un núcleo con número cuántico de espı́n 1 son
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
⎝ 0 1 0 ⎠ ⎝ 0 −i 0 ⎠ 1 0 0
Ix = √ 1 0 1 , Iy = √ i 0 −i , Iz = ⎝ 0 0 0 ⎠.
2 0 1 0 2 0 i 0 0 0 −1
a b
Halle la matriz general para la cual:
c d
1 2 a b 0 0
42. =
2 4 c d 0 0
1 2 a b a b 1 2 0 0
43. = =
2 4 c d c d 2 4 0 0
478 Capı́tulo 18. Matrices y transformaciones lineales
Apartado 18.4
Halle la matriz inversa, si es posible: ⎛ ⎞ ⎛ ⎞
1 2 3 2 −1 1
2 −3 ⎝−2
44. 45. 1 2 ⎠ 46. ⎝−1 1 −2 ⎠
4 1
3 −1 −1 −3 1 0
⎛ 1 1 ⎞
√ 0 −√ ⎛ ⎞
⎜ 2 2 ⎟ 3 4 0 0
⎜ ⎟ ⎜ 1 2 0 0 ⎟
47. ⎜ 0 ⎟ ⎝ 0 1 ⎠
⎜ 0 1 ⎟ 48.
⎝ 1 0 3
1 ⎠ 0 0 4 2
√ 0 √
2 2
49. Para la matriz A del Ejercicio 45, compruebe que AA−1 = A−1 A = I.
51. Para transformaciones en tres dimensiones, escriba las matrices que representan
52. Demuestre que las matrices del Ejercicio 51 son ortogonales y halle sus inversas.
53. (i) Halle una única matriz A que represente la secuencia de transformaciones conse-cutivas:
(a) rotación en sentido antihorario de ángulo θ en torno al eje x, seguida de
(b) reflexión con respecto al plano xy, seguida de
(c) rotación en sentido antihorario de ángulo φ en torno al eje z.
18.8. Ejercicios 479
−1
Las coordenadas de cuatro puntos en el plano xy vienen dadas por las columnas de la matriz
2 3 3 2
X=
1 1 2 2
Halle X = AX para cada una de las siguientes matrices A, y dibuje unos diagramas adecuados para
ilustrar las transformaciones:
0,8 −0,6 0 −1 2 0 3 1
54. 55. 56. 57.
0,6 0,8 1 0 0 1 −1 2
Apartado 18.7
(i) Construya una representación matricial tridimensional aplicando por turno cada operación de sime-
trı́a a las coordenadas (x, y, z).
(ii) Cada matriz de esta representación tiene la forma ‘diagonal por bloques’
⎛ ⎞
a11 a12 0
⎝ a21 a22 0 ⎠ .
0 0 a33
forman la representación Γ3 de la Tabla 18.2, y que los números a33 forman la representación Γ2 .
Ax = y . (19.3)
482 Capı́tulo 19. El problema de autovalores matriciales
Vimos en el Apartado 17.4 que las ecuaciones tienen solución única si det A = 0, y
pueden resolverse formalmente por medio de determinantes con la regla de Cramer.
También vimos cómo obtener las soluciones en ciertas condiciones cuando A es singular,
con det A = 0.
Los problemas fı́sicos que conducen a sistemas de ecuaciones lineales se formulan
normalmente mediante matrices. Ası́ como el álgebra ordinaria es la herramienta básica
para manipular y resolver una ecuación (o unas pocas ecuaciones), se emplea el álgebra
matricial para manipular sistemas de ecuaciones, y para contruir métodos numéricos de
resolución. La concisión y la sencillez del formalismo matricial también hacen de él la
herramienta ideal para el análisis teórico de las propiedades y de la estructura de los
sistemas de ecuaciones, y de los problemas fı́sicos en los que surgen. Vamos a ver ahora
el tratamiento del Apartado 17.4 formulado mediante matrices.
Si A no es singular, con det A = 0, entonces existe A−1 y premultiplicando el primer
miembro de (19.3) tenemos
A−1 (Ax) = A−1 A x = Ix = x .
Por lo tanto, premultiplicando ambos lados de (19.3) por A−1 tenemos la solución única
x = A−1 y . (19.4)
2x − 3y + 4z = 8
y − 3z = −7
x + 2y + 2z = 11 .
Ax = 0 (19.5)
Ax = λx , (19.6)
(A − λI)x = 0 (19.7)
(ya que I x = x), y representa por lo tanto el sistema de ecuaciones lineales homogéneas
(las ecuaciones seculares del Apartado 17.4)
Las ecuaciones tienen la solución trivial x = 0 para todo valor de λ. Las ecuaciones
también tienen solución no nula si el valor de λ puede escogerse de manera que la matriz
(A − λI) sea singular; es decir, si se escoge λ de manera que el determinante de (A − λI)
sea cero:
o bien
(a11 − λ) a12 a13 ··· a1n
(a22 − λ) ···
a21 a23 a2n
a31 a32 (a33 − λ) ··· a3n = 0. (19.10)
.. .. .. ..
. . . .
an1 an2 an3 · · · (ann − λ)
484 Capı́tulo 19. El problema de autovalores matriciales
y D = 0 para λ = 1, −1 o 2.
Los autovalores del Ejemplo 19.2 son números reales distintos pero, en general, dos o
más autovalores pueden ser iguales (autovalores múltiples o degenerados), o pueden
ser números complejos.
Los dos tipos de matrices cuyos autovalores son de mayor interés en las ciencias fı́sicas
son las matrices reales simétricas (matrices simétricas cuyos elementos son reales), y
las matrices complejas hermı́ticas descritas en el Apartado 19.5. Estas matrices tienen
autovalores reales.1
Correspondiendo a cada autovalor λ = λk existe una solución x = xk de la ecuación de
autovalores, tal que
Axk = λk xk k = 1, 2, 3, . . . , n. (19.11)
En la teorı́a de orbitales moleculares de sistemas de electrones π, los estados de los electrones π son des-
critos por una ecuación de autovalores matriciales
HC = EC
donde la matriz H representa el ‘hamiltoniano efectivo’ para un electrón π del sistema, los autovalores E
de H son las energı́as orbitales de los electrones π, y los autovectores C representan los correspondientes
orbitales moleculares (las componentes de C son los coeficientes de una descripción mediante ‘combinación
lineal de orbitales atómicos’ (CLOA) de un orbital molecular). En la teorı́a de Hückel del ciclobutadieno
(C4 H4 ), H es la matriz simétrica real
⎛ ⎞
α β 0 β
⎜ β α β 0 ⎟
H=⎝
0 β α β ⎠
β 0 β α
(los parámetros de Hückel α y β son escalares reales negativos con dimensiones de energı́a) con ecuación
caracterı́stica
01. D’Alembert consideró los primeros problemas de autovalores entre 1743 y 1758 en relación con
la resolución de sistemas de ecuaciones lineales con coeficientes constantes que aparecen en el movimiento
de una cuerda cargada. Cauchy estudió los autovalores en relación con las formas que describen superficies
cuadráticas. En 1829 demostró que una forma cuadrática puede reducirse a forma diagonal (Apartado 19.4)
mediante el método de optimización con ligaduras que involucra multiplicadores de Lagrange descritos en
el Ejemplo 9.9. Los multiplicadores son los autovalores de la matriz asociada.
486 Capı́tulo 19. El problema de autovalores matriciales
α−E β 0 β
β α−E β 0
det (H − EI) =
0 β α−E β
β 0 β α−E
E1 = α + 2β , E 2 = E3 = α , E4 = α − 2β ,
y los autovectores se obtienen resolviendo este sistema de ecuaciones homogéneas para cada uno de los
autovalores E.
Para E = E1 = α + 2β,
Sólo tres de las cuatro ecuaciones son independientes. Por ejemplo, (1) + (2) + (3) = −(4). Resolviendo
para c2 , c3 y c4 en función de c1 tenemos
c2 = c1 , c3 = c1 , c4 = c1 .
c2 = −c1 , c3 = c1 , c4 = −c1 .
con c1 arbitrario.
Para E2 = E3 = α,
c1 = −c3 , c4 = −c2 .
19.2. El problema de autovalores matriciales 487
con c2 y c3 arbitrarios.
Los autovectores C del Ejemplo 19.5 están normalizados (tienen longitud unidad) si
Por ejemplo
1
C1T C1 = c21 12 + 12 + 12 + 12 = 1 si c1 = ,
2
y el conjunto de los cuatro autovectores normalizados es
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 0 1 1
1⎜ 1 ⎟ 1 ⎜ 1 ⎟ 1 ⎜ 0 ⎟ 1 ⎜−1 ⎟
C1 = ⎝ ⎠ , C2 = √ ⎝ , C3 = √ ⎝ C4 = ⎝ .
2 1 2 0 ⎠ 2 −1
⎠,
2 1 ⎠
1 −1 0 −1
Axk = λk xk (19.13)
Además
Axl = λl xl (19.15)
de manera que, si λk = λl ,
xlT xk = 0 (19.19)
Los autovectores C2 y C3 del Ejemplo 19.5 corresponden al mismo autovalor, E = α. Ya son ortogonales:
⎛ ⎞
1
⎜ 0 ⎟
C2T C3 = c2 c3 0 1 0 −1 ⎝ = c2 c3 (0 + 0 + 0 + 0) = 0 .
−1 ⎠
0
entonces
Sean a y b dos vectores no ortogonales, con aT b = 0. Dos combinaciones lineales de a y b ortogonales son
el propio a y
b = b − ca
donde c se toma tal que aT b = 0. De esta manera
aT b
aT b = aT b − caT a = 0 , c= ,
aT a
y
aT b
b = b − a.
aT a
⎛ ⎞ ⎛ ⎞
1 3
Por ejemplo, si a = ⎝ 1 ⎠ y b = ⎝ 0 ⎠, entonces aT a = 3, aT b = 6, y
1 3
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
3
1 1
6
b =⎝ 0 ⎠−
⎝ 1 ⎠ = ⎝−2 ⎠ .
3 3 1 1
1 si k = l,
xkT xl = δkl = (19.23)
0 si k = l.
Axk = λk xk , k = 1, 2, 3, . . . , n , (19.24)
Entonces
⎜ .. .. .. . . .. ⎟
⎝ . . . . . ⎠
0 0 0 · · · λn
19.3. Diagonalización de matrices 491
D = X−1 AX , (19.28)
de manera que
⎛ ⎞⎛ ⎞⎛ ⎞ ⎛ ⎞
4 −1 −1 −2 1 1 1 0 1 1 0 0
X−1 AX = ⎝ 1 0 −1 ⎠ ⎝−11 4 5 ⎠ ⎝ 2 1 3 ⎠ = ⎝ 0 −1 0 ⎠ = D .
−3 1 1 −1 1 0 1 −1 1 0 0 2
492 Capı́tulo 19. El problema de autovalores matriciales
Transformaciones de semejanza
B = C−1 AC , (19.29)
siendo C una matriz no singular. La ecuación (19.28) es por lo tanto una transformación
de semejanza que reduce A a forma diagonal. Si A es simétrica, los autovectores de A
son ortonormales, por el teorema (19.23), y X en (19.28) es una matriz ortogonal, con
X−1 = XT . Por lo tanto, una matriz simétrica se reduce a forma diagonal mediante la
transformación ortogonal
D = XT AX . (19.30)
Por ejemplo,
det B = det C−1 AC = det ACC−1 = det (AI) = det A .
λk = tr A . (19.33)
k=1
λk = det A (19.34)
k=1
02. En su monografı́a sobre la teorı́a de matrices de 1878, Frobenius definió las matrices semejantes,
estudió las propiedades de las matrices y de las transformaciones ortogonales, y demostró la relación entre
las álgebras de matrices y de cuaterniones al determinar cuatro matrices 2 × 2 cuya álgebra es la de los
cuaterniones 1, i, j, k.
19.4. Formas cuadráticas 493
Traza: tr A = −2 + 4 + 0 = 2 , tr D = 1 − 1 + 2 = 2 .
4 5 −11 5 −11 4
Determinante: det A = −2 − + = 10 − 5 − 7 = −2 ,
1 0 −1 0 −1 1
det D = 1 × (– 1) × 2 = −2 .
donde los coeficientes a, b y c son números reales. Esto puede escribirse en forma ma-
tricial como
a b x
Q(x) = (x y) b c y = x Ax ,
T
(19.36)
siendo A la matriz real y simétrica de los coeficientes, y x el vector cuyos elementos son
las variables x e y.
n
n
Q(x1 , x2 , x3 , . . . , xn ) = aij xi xj
i=1 j=1
494 Capı́tulo 19. El problema de autovalores matriciales
donde los coeficientes aij son reales y aji = aij . En forma matricial
Q(x) = xT Ax , (19.38)
siendo
⎛ ⎞ ⎛ ⎞
x1 a11 a12 a13 · · · a1n
⎜ ⎟ ⎜ · · · a2n ⎟
⎜ x2 ⎟ ⎜ a21 a22 a23 ⎟
⎜ ⎟ ⎜ · · · a3n ⎟
x=⎜
⎜
x3 ⎟,
⎟ A=⎜
⎜
a31 a32 a33 ⎟,
⎟ (19.39)
⎜ .. ⎟ ⎜ .. .. .. .. . ⎟
⎝ . ⎠ ⎝ . . . . .. ⎠
xn an1 an2 an3 · · · ann
y A real y simétrica.
Forma canónica
Hemos visto (ecuación (19.30)) que una matriz simétrica A se reduce a forma dia-
gonal mediante la transformación de semejanza XT AX, donde X es la matriz ortogonal
cuyas columnas son los autovectores ortonormales de A. Dado que XXT = I (para una
matriz ortogonal X), podemos escribir (19.38) como
Q = xT (XXT ) A (XXT ) x
= (xT X) (XT AX) (XT x)
= yT Dy , (19.40)
y = XT x (19.41)
n
Tenemos que
5 4 x1
Q= x 1 x2 = xT Ax
4 5 x2
y que los autovectores ortonormales de la matriz simétrica A son
1 1 1 1
√ y √ ,
2 −1 2 1
entonces ⎛ ⎞
√
1
(x
1 − x2 )
1 0 ⎜ 2 ⎟ y1
D = XT AX = ⎜
y=Xx=⎝ ⎟
⎠=
T
, ,
0 9 1 y2
√ (x1 + x2 )
2
y
Q = yT Dy = y21 + 9y22 .
Q = y21 + 9y22
03. Cayley y Sylvester desarrollaron la teorı́a de las formas entre 1854 y 1878. Sylvester afirmaba
haber descubierto y desarrollado la reducción de una forma cuadrática a forma canónica en una sesión ‘con
una frasca de vino de Oporto para confortar los ánimos de una naturaleza desfallecida’. Camille Jordan
(1838-1922) hizo el estudio general de las formas canónicas en su Traité des substitutions et des équations
algébriques (Tratado sobre las sustituciones y las ecuaciones algebraicas) de 1871, en el cual presentaba
muchos de los conceptos modernos de la teorı́a de grupos en el contexto de los grupos de permutaciones
(sustituciones).
496 Capı́tulo 19. El problema de autovalores matriciales
corresponde por lo tanto a una rotación del sistema de coordenadas, desde (x1 , x2 ) a
(y1 , y2 ), que hace coincidir los ejes coordenados con los ejes principales de la elipse,
como se muestra en la Figura 19.2(b) para Q = 9.
45
Figura 19.2
Un cuerpo que gira con velocidad ω = (ωx , ωy , ωz ) en torno a un eje que pasa por su centro de masas tiene
una energı́a cinética de rotación dada por la forma cuadrática
⎛ ⎞⎛ ⎞
Ixx Ixy Ixz ωx
1 T 1 ⎜ ⎟⎜ ⎟
T = ω Iω = ωx ωy ωz ⎝ Iyx Iyy Iyz ⎠ ⎝ ωy ⎠ , (19.43)
2 2
Izx Izy Izz ωz
donde la matriz simétrica I (a no confundir con la matriz identidad) se llama tensor del momento de
inercia o, sencillamente, tensor de inercia. Por ejemplo, una masa m situada en la posición (x, y, z) tiene
un tensor del momento de inercia con componentes (véase el Ejercicio 20)
Ixx = m y2 + z2 , Iyy = m z2 + x2 , Izz = m x2 + y2 ,
Ixy = −mxy , Iyz = −myz , Izx = −mzx. (19.44)
Una transformación a los ejes principales es una transformación de (x, y, z) a (x , y , z ) que hace coincidir
los ejes coordenados con los ejes principales de inercia del cuerpo. El tensor de inercia es diagonal en el
nuevo sistema de coordenadas, y la energı́a cinética de rotación es
⎛ ⎞⎛ ⎞
Ix x 0 0 ωx
1 ⎜ ⎟⎜ ⎟
T = ωx ωy ωz ⎝ 0 Iy y 0 ⎠ ⎝ ωy ⎠
2
0 0 Iz z ωz
1 1 1
= Ix x ω2x + Iy y ω2y + Iz z ω2z (19.45)
2 2 2
y es la suma de las contribuciones de las rotaciones en torno a los ejes x , y y z .
Momento angular
El momento angular de un cuerpo que gira está en relación con la velocidad angular a través de (véase
el Ejemplo 16.16)
l = Iω (19.46)
19.5. Matrices complejas 497
o, en componentes,
lx = Ixx ωx + Ixy ωy + Ixz ωz ,
ly = Iyx ωx + Iyy ωy + Iyz ωz , (19.47)
lz = Izx ωx + Izy ωy + Izz ωz .
Si los ejes coordenados coinciden con los ejes principales de inercia, I es diagonal y las ecuaciones (19.47)
se reducen a
lx = Ixx ωx , ly = Iyy ωy , lz = Izz ωz . (19.48)
La energı́a cinética de rotación tiene entonces el aspecto familiar
l2x l2y l2
T= + + z (19.49)
2Ixx 2Iyy 2Izz
que se utiliza en consideraciones teóricas en espectroscopia de microondas en moléculas poliatómicas.
Mucho de lo que hemos tratado antes se aplica tanto a las matrices complejas como
a las matrices reales y en este apartado resumimos las propiedades más importantes de
las matrices complejas y sus diferencias con las de las matrices reales.
Una matriz A cuyos elementos son números complejos se llama matriz compleja, y
puede escribirse en la forma
A = B + iC (19.50)
√
donde i = −1, y B y C son matrices reales.
A∗ = B − iC . (19.52)
A† = (A∗ ) = (AT )∗ .
T
(19.53)
498 Capı́tulo 19. El problema de autovalores matriciales
La conjugada hermı́tica juega para las matrices complejas el mismo papel que juega la
transpuesta para las matrices reales. Por ejemplo, el producto interno (escalar) de dos
vectores complejos a = (a1 , a2 , a3 ) y b = (b1 , b2 , b3 ) se define como (compárese con la
ecuación (18.62))
b1
a · b = a b = (a a a )
† ∗
1
∗
2
∗
3 b2 = a∗1 b1 + a∗2 b2 + a∗3 b3 . (19.54)
b3
−1
⎛ ⎞
2−i
†
a b= 1−i 3 −2i ⎝ 4i ⎠ = (1 − i)(2 − i) + 3(4i) + (– 2i)(– 1) = 1 + 11i .
−1
Matrices hermı́ticas
Una matriz cuadrada compleja que es igual a su conjugada hermı́tica se llama matriz
hermı́tica,
Tenemos que
3 2 − 3i 3 2 + 3i
A∗ = A† = (A∗ ) = = A.
T
,
2 + 3i 1 2 − 3i 1
Matrices unitarias
U† = U−1 . (19.57)
La propiedad caracterı́stica de una matriz unitaria es que sus columnas (y sus filas) for-
man un sistema de vectores ortonormales (compárese con lo visto para las matrices or-
togonales en el Apartado 18.6). Sea, para orden 3,
⎛ ⎞
a1 b1 c1
U = (a b c) = ⎝ a2 b2 c2 ⎠ (19.58)
a3 b3 c3
⎛ ⎞ ⎛ ∗ ∗ ∗ ⎞
a† a 1 a2 a3
U† = ⎝ b† ⎠ = ⎝ b∗1 b∗2 b∗3 ⎠ (19.59)
c† c∗1 c∗2 c∗3
y
⎛ ⎞ ⎛ † ⎞ ⎛ ⎞
a† a a a† b a† c 1 0 0
U† U = ⎝ b† ⎠ (a b c) = ⎝ b† a b† b b† c ⎠ = ⎝ 0 1 0 ⎠ = I . (19.60)
c† c† a c† b c† c 0 0 1
Una matriz unitaria real es una matriz ortogonal. Las matrices hermı́ticas y las unitarias
juegan para las matrices complejas los mismos papeles que tienen las matrices ortogona-
les y las simétricas para las matrices reales, y tienen las mismas propiedades importantes:
D = U† AU , (19.61)
19.6. Ejercicios
Apartado 19.1
Halle la inversa de la matriz de los coeficientes y úsela para resolver las ecuaciones:
1. 2x − 3y = 8 2. x + y + z= 6 3. w + x + z= 2
4x + y = 2 x + 2y + 3z = 14 x + y + z= 6
x + 4y + 9z = 36 w + y + z= 3
w + x + y = 4
Apartado 19.2
Halle los autovalores y los autovectores normalizados para las siguientes matrices:
3 1 2 2 2 0 2 −1
4. 5. 6. 7.
1 3 1 3 0 −3 0 3
19.6. Ejercicios 501
⎛ ⎞ ⎛ ⎞
1 2 0 0 2 0
2 1 ⎝ 2 1 0 ⎠ ⎝ 2 0 2 ⎠
8. 9. 10.
−1 4
0 2 1 0 2 0
11. Demuestre que los conjuntos de autovectores de las matrices simétricas del Ejercicio 4 y del ejercicio
10 son conjuntos de vectores ortogonales.
Halle los autovalores (en función de α y β) y los autovectores normalizados. Demuestre que los autovectores
son ortogonales.
(iii) Demuestre que un autovector asociado al autovalor α − β tiene componentes x1 , x2 , x3 que cumplen
x1 + x2 + x3 = 0.
14. (i) Demuestre que una matriz A y su transpuesta AT tienen el mismo conjunto de autovalores, y halle
los autovalores de
3 2
A= .
0 2
(ii) Demuestre que las dos ecuaciones siguientes son equivalentes:
AT y = λy , yT A = λyT .
Los autovectores de AT son en general diferentes de los de A, salvo si A es una matriz simétrica. El vector
yT se llama a veces autovector por la izquierda de A, y un autovector ‘ordinario’ de A se llama entonces
autovector por la derecha.
(ii) Compruebe que D es diagonal y que los elementos diagonales de D son los auto-valores de A.
20. Deduzca las ecuaciones (19.44) para las componentes del tensor de inercia.
[Sugerencia: desarrolle la ecuación (16.60), l = mr2ω − m(r · ω )r, para el momento angular en función de
sus componentes.]
Apartado 19.5
Halle la compleja conjugada y la conjugada hermı́tica de las siguientes matrices. Indique cuáles son hermı́ti-
cas: ⎛ ⎞
0 −i 0
1+i 2−i 2 i
21. 22. 23. ⎝ i 0 −i ⎠
3 + i −i −i 1
0 i 0
⎛ ⎞ ⎛ ⎞
i 2i
24. Si a = ⎝ 1 ⎠ y b = ⎝ 0 ⎠, halle (i) a† a (ii) b† b (iii) a† b (iv) b† a
−i 3
1 1 i
25. (i) Demuestre que A = √ es a la vez hermı́tica y unitaria.
2 −i −1
20.1. Conceptos
20.2. Errores
Por las reglas del redondeo (Apartado 1.3) un número como a = 1,234 obtenido al
redondear a tres cifras decimales, representa todos los números entre 1,2335 y 1,2345.
Se dice que el número a tiene un error absoluto máximo o cota (superior) de error a =
0,0005, y la cota puede indicarse escribiendo
a ± a = 1,2340 ± 0,0005 .
En aritmética de punto fijo todos los números se redondean al mismo número de cifras
decimales, y por lo tanto tienen la misma cota de error, digamos que . La suma o la resta
de dos números tiene entonces una cota de error 2. En general, la suma o la resta de los
números a y b, con cotas de error a y b , tiene como cota de error a + b .
La cota de error para los dos números a y b es = 0,0005. Los mayores y menores valores posibles de
a − b son por lo tanto
(a + a ) (b + b ) = ab + ab + ba + a b ,
20.2. Errores 505
(a − a ) (b − b ) = ab − ab − ba + a b .
EJEMPLO 20.2 Si a = 12,35 y b = 2,345 han sido redondeados a 4 cifras, determine las cotas de error
de q = a/b.
Tenemos que 12,35/2,345 = 5,26652 (con seis cifras). Las cotas de error para a son a = 0,005 y ra =
a /a ≈ 0,0004, y para b b = 0,0005 y rb = b /b ≈ 0,0002. Suponemos entonces que el cociente tiene
rq ≈ 0,0006. Por lo tanto, los mayores y menores valores del cociente son (dando los resultados con 6 cifras)
12,355 12,345
= 5,26978 = 5,26652 + 0,00326 , = 5,26327 = 5,26652 − 0,00325 .
2,3445 2,3455
Tenemos entonces rq ≈ 0,0033/5,26652 ≈ 0,0006, como era de esperar de la ecuación (20.2). Esto es el
error relativo para el producto sin redondear.
Errores al restar
Los errores más graves, con diferencia, que surgen del uso de números redondeados
aparecen al restar dos números casi iguales. Ası́ por ejemplo, para a = 1,234 y b = 1,233
tenemos, redondeando a 4 cifras, a − b = 0,001 con una cota de error 0,001 (a − b =
= 0,001 ± 0,001). A menudo, sin embargo, los errores al restar se pueden minimizar
utilizando un procedimiento numérico (algoritmo) adecuado.
Este ejemplo muestra que el procedimiento correcto para resolver una ecuación cuadráti-
ca es, independientemente de las cifras significativas usadas,
2
b b c c
si b < 0, entonces x1 = − + − , x2 = ,
2a 2a a x1 a
2 (20.3)
b b c c
si b > 0, entonces x1 = − − − , x2 = .
2a 2a a x1 a
1 − cos x
f (x) = (20.4)
x2
con una calculadora normal de 10 dı́gitos.
Un procedimiento alternativo, y correcto, para eliminar los errores de la diferencia es
utilizar el desarrollo de la función en serie de MacLaurin truncada,
1 − cos x 1 x2 x4
≈ − + para |x| ≤ 0,1 (20.5)
x2 2! 4! 6!
que tiene, por el teorema de Taylor, una cota de error de 2,5 × 10−11 para |x| ≤ 0,1.
Una ecuación ordinaria (una ecuación que no implica derivadas ni integrales) en una
variable puede ponerse en la forma
f (x) = 0 , (20.6)
donde f (x) es una función de x. Las soluciones de la ecuación son aquellos valores de x
para los cuales se cumple (20.6): los ceros de la función f (x). Por ejemplo, una ecuación
cuadrática es un caso particular de una ecuación algebraica (polinómica)
f (x) = a0 + a1 x + a2 x2 + · · · + an xn = 0 (20.7)
cuyas soluciones son las raı́ces del polinomio. En el Capı́tulo 2 vimos la expresión ge-
neral de las raı́ces de las funciones cuadráticas pero, aunque existen expresiones exactas
para las raı́ces de ecuaciones cúbicas y cuárticas, una ecuación algebraica general tiene
que ser resuelta numéricamente. Igualmente, las soluciones de ecuaciones trascendentes
(las que incluyen funciones trascendentes) como por ejemplo
algoritmo
xn −−−−−−−→ xn+1 , n = 0, 1, 2, 3 . . . (20.9)
numérico
El proceso iterativo termina si se consigue una precisión dada, por ejemplo si la variación
|xn+1 − xn | es menor que un valor fijado de antemano. El éxito de un método numérico
depende a menudo de una buena elección de la aproximación inicial, pero esto se puede
conseguir normalmente a partir de la gráfica o de los valores tabulados de la función.
Vamos a considerar aquı́ dos métodos sencillos muy usados, y que además sirven de
base para métodos más sofisticados. Señalamos que los métodos para ecuaciones en una
variable se pueden generalizar a varias variables y, a veces, a sistemas de ecuaciones
simultáneas.
Método de bisección
El punto de partida de este antiguo método son dos valores de x en los cuales se sabe
que la función está en lados opuestos de cero. Supongamos que f (x1 ) < 0 y f (x2 ) > 0,
508 Capı́tulo 20. Métodos numéricos
Figura 20.1
1
x3 = (x1 + x2 ) . (20.10)
2
Entonces, si f (x3 ) > 0, el cero está entre x1 y x3 como en la figura, y se repite el proceso
para el intervalo de x1 a x3 , y ası́ sucesivamente.
√
EJEMPLO 20.4 Método de bisección para 5
√
Para hallar 5, planteamos f (x) = x2 − 5 = 0.
La raı́z está entre x< = 2 y x> = 3, siendo f (x< ) = −1 y f (x> ) = 4. Con esto x3 = (x< + x> )/2 = 2,5.
En la Tabla 20.2 se muestran los cálculos con 4 cifras significativas hechos con una calculadora estándar.
Tras 10 iteraciones los valores de x< y x> redondeados a cuatro cifras son ambos 2,236, y este es el valor
pedido (2,2362 = 4,999696).
Método de Newton–Raphson
f (xn )
xn+1 = xn − , n = 0, 1, 2, 3, . . . (20.13)
f (xn )
√
EJEMPLO 20.5 Método de Newton–Raphson para 5
√
Para hallar 5, planteamos f (x) = x2 − 5 = 0. Tenemos entonces que f (x) = 2x, de manera que la
expresión de Newton–Raphson (20.13) es
xn2 − 5
xn+1 = xn − .
2xn
01. Los métodos de resolución de ecuaciones tienen sus orı́genes en la determinación de raı́ces cua-
dradas y cúbicas por los babilonios y los chinos. El capı́tulo 4 del Jiuzhang suanshu (Nueve capı́tulos sobre
el arte matemático) de comienzos de la dinastı́a Han, hacia 200 a.C., describe un método para hallar raı́ces
cuadradas que es similar al método de Newton. Jia Xian generalizó el método a la resolución de ecuaciones
polinómicas en el siglo XI (también describió cómo construir el triángulo de Pascal y sus aplicaciones), y la
primera reseña detallada apareció en el Shuchu jiuzhang (Tratado matemático en nueve apartados) de 1247
por Qin Jiushao (hacia 1202–1261). El método de Newton, descrito en el Methodus fluxionum de 1671 pero
no publicado hasta 1736, es básicamente el método chino para polinomios. Joseph Raphson (1648–1715),
que “era una de las pocas personas a las que Newton permitı́a ver sus trabajos matemáticos”, publicó el
método en 1690.
510 Capı́tulo 20. Métodos numéricos
En la Tabla 20.3 se muestran los cálculos en una caluladora estándar de 10 dı́gitos usando todas las
cifras, empezando con x0 = 3.
La precisión de la calculadora se agota tras 4 iteraciones, y el resultado tiene un error de sólo una unidad en
la décima cifra significativa.
f (xn )
n+1 = −2n . (20.16)
2f (xn )
20.4. Interpolación
La interpolación es el proceso de hallar una función cuya gráfica pase por un número
de puntos dados. En la Figura 20.3 los puntos representan los (n + 1) pares de números
y la curva en trazo discontinuo representa una función continua y = f (x) tal que yi = f (xi )
para los pares de números (20.17).
Figura 20.3
En cuanto a los números, pueden ser por ejemplo los resultados de medidas de la
concentración y el tiempo en un experimento cinético, o la presión y la temperatura en
el estudio de las propiedades termodinámicas de un fluido. De manera alternativa, pue-
den ser los valores tabulados de una función que no puede expresarse en forma funcional
sencilla. El objetivo de la interpolación es hallar una función ‘sencilla’ que pueda usarse
para hallar puntos intermedios en el intervalo de (x0 , y0 ) a (xn , yn ) (fuera de ese intervalo
el proceso es de extrapolación). La interpolación tiene aplicaciones importantes en inte-
gración numérica (Apartado 20.5), en la cual una función que no puede integrarse con
los métodos descritos en los Capı́tulos 5 y 6 se aproxima por una función más senci-
lla que sı́ puede ser integrada, y en la resolución numérica de ecuaciones diferenciales
(Apartado 20.9).
Interpolación polinómica
pn (x) = a0 + a1 x + a2 x2 + · · · + an xn (20.18)
que pasa por todos los puntos. Por ejemplo, por dos puntos cualesquiera pasa una única
recta (n = 1), y por tres puntos cualesquiera pasa una única curva cuadrática (n = 2).2
02. La base teórica para la interpolación polinómica, y uno de los teoremas importantes del análisis
moderno, es el teorema de Weierstrass: ‘Si f (x) es una función arbitraria continua definida en el intervalo
a ≤ x ≤ b, siempre es posible aproximar f (x) en todo el intervalo de manera tan precisa como se quiera
512 Capı́tulo 20. Métodos numéricos
Interpolación lineal
La recta y = p1 (x) = a0 + a1 x que pasa por los dos puntos (x0 , y0 ) y (x1 , y1 ), como en la
Figura 20.4, cumple las dos ecuaciones lineales
y0 = a0 + a1 x0 , y1 = a0 + a1 x1 ,
con solución
y0 x1 − y1 x0 y1 − y0
a0 = , a1 = .
x1 − x0 x1 − x0
Tenemos entonces
y0 x1 − y1 x0 y1 − y0
y= + x,
x1 − x0 x1 − x0
Figura 20.4
y1 − y0
y = y0 + (x − x0 ) . (20.19)
x1 − x0
Dos puntos de la gráfica de f (x) = ex (con 4 decimales) son (x0 , y0 ) = (0,80 , 2,2255) y (x1 , y1 ) =
(0,84 , 2,3164). La fórmula de la interpolación lineal (20.19) es por lo tanto
2,3164 − 2,2255
ex ≈ y = 2,2255 + (x − 0,80) .
0,84 − 0,80
Para x = 0,832 tenemos entonces
Si se usa la interpolación lineal para cada par de puntos consecutivos se obtiene una
interpolación lineal a trozos, como se representa en la Figura 20.5 para los puntos de
la Tabla 20.4 (compárese con las Figuras 20.6 a 20.8).
Tabla 20.4
x y
0,0 1,0000
0,4 1,8902
0,8 1,0517
1,2 0,9577
1,6 0,5207
2,0 1,0000
2,4 2,1184
2,8 1,3809
3,2 1,5690
Figura 20.5
Interpolación cuadrática
La función cuadrática que pasa por tres puntos sucesivos, o nodos, (x0 , y0 ), (x1 , y1 ) y
(x2 , y2 ) puede escribirse como
donde
(x − x1 ) (x − x2 ) (x − x0 ) (x − x2 )
L0 (x) = , L1 (x) = ,
(x0 − x1 ) (x0 − x2 ) (x1 − x0 ) (x1 − x2 )
(x − x0 ) (x − x1 )
L2 (x) = .
(x2 − x0 ) (x2 − x1 )
Tres puntos de la gráfica de f (x) = ex (con 6 decimales) son (x0 , y0 ) = (0,80 , 2,225541), (x1 , y1 ) =
(0,84 , 2,316367) y (x2 , y2 ) = (0,88 , 2,410900). La interpolación cuadrática en x = 0,832 da entonces
(compárese con el Ejemplo 20.6)
03. La fórmula general de interpolación de Lagrange (1795) fue anticipada por Euler en el Institu-
tiones calculi differentialis de 1755 y dada explı́citamente por Edward Waring (1734–1793), profesor en
Cambridge, en un artı́culo en Philosophical Transactions en 1779.
514 Capı́tulo 20. Métodos numéricos
Si se usa la interpolación cuadrática para cada tres puntos consecutivos, tenemos una
interpolación cuadrática a trozos, como se ilustra en la Figura 20.6 para los puntos de la
Tabla 20.4 (compárese con las Figuras 20.5, 20.7 y 20.8).
Figura 20.6
El polinomio interpolador pn (x) que pasa por (n+1) puntos dados puede expresarse de
manera sencilla mediante diferencias divididas. Las dos primeras diferencias divididas
son
y1 − y0 f [x1 , x2 ] − f [x0 , x1 ]
f [x0 , x1 ] = , f [x0 , x1 , x2 ] = ,
x1 − x0 x2 − x0
y en general
p2 (x) = y0 + (x − x0 ) f [x0 , x1 ]
+ (x − x0 ) (x − x1 ) f [x0 , x1 , x2 ] . (20.23)
En general
+ (x − x0 ) (x − x1 ) (x − x2 ) f [x0 , x1 , x2 , x3 ]
···
+ (x − x0 ) (x − x1 ) · · · (x − xk ) f [x0 , x1 , . . . , xk+1 ] . (20.24)
La relación entre las diferencias divididas se muestra en la Tabla 20.5 para 5 puntos.
La columna D1 contiene las primeras diferencias divididas, la columna D2 las segundas
diferencias divididas, etcétera. Cada diferencia dividida es la diferencia de sus ‘progeni-
tores’ de la columna situada a su izquierda, dividida por la diferencia entre los valores
extremos de x.
En las dos primeras columnas de la Tabla 20.6 se dan cinco puntos de la gráfica de ex . Las diferencias
divididas han sido calculadas con una calculadora estándar de 10 dı́gitos, y se dan con 8 decimales.
y todas las cifras que se dan de p4 (x) son exactas (véanse los Ejemplos 20.6 y 20.7).
Los Ejemplos 20.6 a 20.8 muestran que aumentar el grado de los polinomios inter-
poladores conduce a una mayor exactitud para ex , pero eso no es necesariamente cierto
si los nodos presentan máximos y mı́nimos como en la Figura 10.5. En la Figura 20.7 se
presenta el resultado de ajustar el polinomio de grado (máximo) 8 para que pase por los 9
puntos de la Tabla 20.4. Esto muestra que aumentar el grado n de los polinomios interpo-
ladores puede producir oscilaciones espurias entre los nodos, y esas oscilaciones pueden
aumentar de amplitud indefinidamente al aumentar n. La interpolación debe restringirse
por lo tanto en general a polinomios de grado bajo (no mayor de 4 o 5), pero la Figura
20.6 muestra que, en los casos desfavorables, esas interpolaciones pueden adolecer de
fuertes discontinuidades de la derivada en los nodos.
fj (x) = aj + bj (x − xj ) + cj (x − xj ) + dj (x − xj ) .
2 3
(20.25)
Para que las derivadas primeras sean continuas en los nodos, la derivada fj (x) tiene que
relacionarse con las derivadas de las funciones cúbicas en los intervalos adyacentes me-
diante
Vamos a considerar el caso particular de nodos espaciados regularmente, con xj+1 −xj = h
(para todo j = 0 hasta n con (n+1) nodos). Entonces, si denotamos por kj la derivada en el
nodo j, los tres conjuntos de condiciones (20.26) a (20.28) dan las siguientes expresiones
para los coeficientes de la función cúbica de (20.25):
aj = yj , bj = kj ,
3 1
cj = 2 (yj+1 − yj ) − (kj+1 + 2kj ) , (20.29)
h h
2 1
dj = 3 (yj − yj+1 ) + 2 (kj+1 + kj ) ,
h h
y la relación de recurrencia para las derivadas,
3
kj−1 + 4kj + kj+1 = (yj+1 − yj−1 ) . (20.30)
h
04. Los trazadores, ‘splines’ en inglés, son varillas de madera flexibles usadas durante mucho tiempo
por delineantes, ingenieros y carpinteros de ribera para dibujar curvas regulares pasando por unos puntos
dados. El método numérico fue descrito por I. J. Schoenberg en 1946.
518 Capı́tulo 20. Métodos numéricos
Estas relaciones son suficientes para determinar las funciones de interpolación cúbicas
para todos los intervalos interiores (j = 1 a n). Para los intervalos extremos es necesario
especificar además las pendientes k0 y kn . Si se escogen mediante las condiciones en los
extremos
I= f (x) dx (20.32)
a
cuando el integrando f (x) viene dado por una tabla de números o cuando la integral no se
puede evaluar con los métodos descritos en los Capı́tulos 5 y 6 mediante un número finito
de funciones estándar. El problema, geométricamente, consiste en estimar el área bajo
la curva. El método estándar es sustituir la función f (x) por una función diferente que
se pueda integrar, y una manera es usar las fórmulas de interpolación que hemos tratado
en el apartado anterior. Esto da lugar a la familia de métodos de integración numérica
llamados cuadraturas de Newton–Cotes, de las cuales la regla del trapecio y la regla
de Simpson son los ejemplos más sencillos.5
0* Garbage in. Garbage out ! (Anónimo), es decir: “se empieza con basura ¡se acaba con basura!”
05. Las fórmulas de Newton–Cotes aparecieron por primera vez en la carta de Newton a Leibniz del
24 de octubre de 1676 y en los Principia, aunque algunos ejemplos particulares eran conocidos desde mucho
antes. Fueron incluidos en la recopilación de las obras de Cotes, la Harmonia mensurarum, publicada
20.5. Integración numérica 519
Figura 20.9
El área del trapecio entre xj y xj+1 es (fj + fj+1 ) h/2, y el área total es
b
1 1
f (x) dx ≈ T(h) = h f0 + f1 + f2 + · · · + fn−1 + fn . (20.33)
a 2 2
1 2
≈− h [fn − f0 ] , (20.35)
12
donde f0 y fn son las derivadas de f (x) en los puntos extremos. Se deduce que dividir
h por la mitad (o doblar el número de subintervalos n) disminuye el error en un factor
cuatro.
póstumamente en 1722. Roger Cotes (1682–1716), matemático de Cambridge, dedicó gran parte de los
años entre 1709 y 1713 a preparar la segunda edición de los Principia. Sus trabajos incluyen una de las
primeras exposiciones del cálculo de logaritmos y de funciones trigonométricas, con tablas de integrales.
520 Capı́tulo 20. Métodos numéricos
1,2 2
EJEMPLO 20.9 Estime la integral I = 0
xe−x dx usando la regla del trapecio (20.33) y la fórmula de
error (20.35) para n = 3,6 y 12.
1,2 2
Tabla 20.8 Valores de I = 0 xe−x dx
n 3 6 12
T(h) 0,361939 0,376698 0,380330
0,019272 0,004818 0,001205
T(h) + 0,381211 0,381516 0,381535
El valor exacto de la integral es 1
2
1 − e−1,44 = 0,381536.
06. Thomas Simpson (1710–1761), profesor de matemáticas en la Royal Military Academy de Wool-
wich, era un matemático autodidacta. Fue educado como tejedor y en 1735 se unió a la Mathematical
Society de Spitalfields, una comunidad de tejedores en la cual era obligación de cada miembro ‘si le fuese
preguntada cualquier cuestión matemática o filosófica por otro miembro, instruirle en la manera más senci-
lla y directa de la que sea capaz’. La regla que lleva su nombre apareció en sus Mathematical dissertations
on a variety of physical and analytical subjects (Disertaciones matemáticas sobre una variedad de temas
fı́sicos y analı́ticos) de 1743, pero ya habı́a aparecido antes en los trabajos de Cavalieri (1639) y Gregory
(1668).
20.5. Integración numérica 521
o bien
b
h
f (x) dx ≈ (extremos) + 4 (puntos impares) + 2 (puntos pares) .
a 3
1,2 2
EJEMPLO 20.10 Estime la integral I = 0
xe−x dx usando la regla de Simpson (20.36) para n = 2, 4, 6
y 12.
Utilizamos los valores del integrando de la Tabla 20.7 y construimos la Tabla 20.9.
1,2 2
Tabla 20.9 Regla de Simpson para I = 0
xe−x dx
j xj f (xj ) 2n = 2 2n = 4 2n = 6 2n = 12
0 0,0 0,000000 ×1 ×1 ×1 ×1
1 0,1 0,099005 ×4
2 0,2 0,192158 ×4 ×2
3 0,3 0,274179 ×4 ×4
4 0,4 0,340858 ×2 ×2
5 0,5 0,389400 ×4
6 0,6 0,418606 ×4 ×2 ×4 ×2
7 0,7 0,428838 ×4
8 0,8 0,421834 ×2 ×2
9 0,9 0,400372 ×4 ×4
10 1,0 0,367879 ×4 ×2
11 1,1 0,328017 ×4
12 1,2 0,284313 ×1 ×1 ×1 ×1
El valor exacto es 0,381536 , y la regla de Simpson es suficientemente exacta para muchas aplicaciones,
incluso sin corrección.
522 Capı́tulo 20. Métodos numéricos
Fórmula de Euler–MacLaurin
Por otra parte, f (J) y todas sus derivadas tienden a cero cuando J → ∞, y los valores en J = 0 pueden
obtenerse del desarrollo de f (J) en serie de potencias de J,
θ 3θ θ2 2θ 2θ 2 θ3
f (J) = 1 + 2 − J+ – + 2 J2 + – + 2 − 3 J3 + · · ·
T T 2T T T 6T
Tenemos que f (0) = 1, f (0) = 2 − θ/T, f (0) = −12θ/T + 12θ 2 /T 2 − θ 3 /T 3 , y todas las derivadas en
J = 0 son de orden (θ/T)2 o superior. Con esto
2
T 1 1 θ θ
q= + + + términos en y superiores. (20.38)
θ 3 15 T T
El valor más grande de θ para una molécula es θ = 87,5 K para H2 pero la mayorı́a de las moléculas tienen
temperaturas rotacionales próximas a 0 K. En esos casos T/θ >> 1, de manera que el primer término del
segundo miembro de (20.38) es con mucho el mayor, y es la función de partición rotacional que se usa
normalmente en quı́mica (después de corregirla para la simetrı́a).
ln (n!) = ln 1 + ln 2 + · · · + ln n
n
1 1
= ln x dx + [f (n) + f (1)] + [f (n) − f (1)] + · · ·
1 2 12
1 1 1
≈ [x ln x − x]n1 + ( ln n + ln 1) + −1
2 12 n
≈ n ln n − n si n >> 1 .
Cuadratura gaussiana
fórmulas de cuadratura gaussiana los puntos se escogen a fin de obtener la mayor exac-
titud posible para una fórmula de integración dada, y no están igualmente espaciados.7
Existen distintas fórmulas de cuadratura gaussiana apropiadas para diversos tipos
de integrandos. La más sencilla es la fórmula de Gauss–Legendre (o, sencillamente,
gaussiana)
+1
n
donde los puntos xi son los ceros de los polinomios de Legendre Pn (x). Los pesos wi
se escogen para que la fórmula sea exacta si f (x) es un polinomio de grado 2n − 1.
Existen tablas de los pesos y de los puntos con muchas cifras significativas (por lo menos
15) para muchos valores de n (por lo menos hasta 100), y la fórmula puede dar mucha
exactitud para integrales que se puedan escribir en la forma dada por (20.40). Cualquier
integral con intervalo de integración finito desde a hasta b puede transformarse en una
con intervalo desde −1 hasta +1 cambiando la variable a u dada por x = 12 [(b − a)u +
(a + b)].
1,2 2
EJEMPLO 20.13 Cuadratura de Gauss–Legendre para I = xe−x dx.
0
07. Gauss presentó su nuevo método en Methodus nova integralium valores per approximationem
inveniendi en 1816.
20.7. Eliminación gaussiana para la resolución de ecuaciones lineales 525
para toda una variedad de funciones peso W(x) en el integrando y también para integrales
infinitas. Las más importantes son
+1 n
1
Gauss–Chebyshev : f (x) √ dx ≈ wi f (xi ) .
−1 1 − x2
∞ i=1
n
f (x)e−x dx ≈ wi f (xi ) .
2
Gauss–Hermite :
−∞ i=1
Los problemas del álgebra lineal son los asociados con sistemas de ecuaciones linea-
les, como los descritos en los Capı́tulos 17, 18 y 19:
(1) x + 2y + 3z = 26 ,
(2) 2x + 3y + z = 34 , (20.42)
(3) 3x + 2y + z = 39 .
08. Estas ecuaciones aparecen en particular en un problema sobre medidas de grano en el Capı́tulo 8
del Jiuzhang suanshu, y son resueltas por un método básicamente equivalente a la eliminación gaussiana.
Gauss presentó su método en la Theoria motus corporum celestium (Teorı́a del movimiento de los cuerpos
celestes) de 1809.
526 Capı́tulo 20. Métodos numéricos
Paso 2. Eliminación de y
La ecuación (2 ) es la nueva ecuación pivote y se elimina y de las ecuaciones que siguen
restando múltiplos adecuados de (2 ). En este caso restando 4 × (2 ) a (3 ) nos da
(1) x + 2y + 3z = 26 ,
(2 ) −y − 5z = −18 , (20.44)
(3 ) 12z = 33 .
EJEMPLO 20.14 Use la eliminación gaussiana para resolver las ecuaciones (véase el Apartado 17.4)
(1) 2x + 2y + z = 10 ,
(2) x + 2y − 2z = −3 ,
(3) 3x + 2y + 4z = λ ,
siendo λ un número.
Paso 1. Restamos 1
2
× (1) a (2) y 3
2
× (1) a (3):
(1) 2x + 2y + z = 10 ,
5
(2 ) y − z = −8 ,
2
5
(3 ) −y + z = λ − 15 .
2
20.7. Eliminación gaussiana para la resolución de ecuaciones lineales 527
Si λ = 23, la ecuación (3 ) es redundante, y la sustitución hacia arriba nos da y = 5z/2 − 8 y x = 13 − 3z.
Como z queda arbitrario, tenemos infinitas soluciones, una por cada valor de z posible. Por otra parte no
hay soluciones si λ = 23.
Pivotes
El coeficiente de x1 en (1) es ahora el mayor, pero elegir (1) como ecuación pivote vuel-
ve a dar un resultado malo (aunque distinto). El procedimiento correcto, llamado pivo-
te parcial escalado, consiste en tomar como ecuación pivote del primer paso aquella
ecuación para la cual la razón del coeficiente de x1 con el mayor de los demás coefi-
cientes es de mayor magnitud. Esa razón es 0,9000/7539 ≈ 0,0001 en la ecuación (1)
y 0,7003/2,613 ≈ 0,3 en la ecuación (2). Hay que elegir por lo tanto la segunda como
ecuación pivote. Igualmente para x2 en el paso 2, y ası́ sucesivamente. Un refinamiento
adicional, llamado pivote total, consiste en buscar el mayor coeficiente relativo de todas
las variables en cada paso, pero no suele ser normalmente necesario.
Puede reducirse un determinante a forma triangular con la primera parte del méto-
do de eliminación de Gauss. El valor del determinante es entonces el producto de los
elementos diagonales de la forma triangular, como vimos en el Apartado 17.6
AA−1 = I . (20.47)
Podemos escribir
A−1 = ( x1 x2 x3 . . . xn ) , I = ( e1 e2 e3 · · · en ) ,
Axk = ek (k = 1, 2, . . . , n) (20.48)
La primera etapa consiste en reducir A a forma triangular superior usando eliminación gaussiana:
⎛ ⎞
1 2 3 1 0 0
fila 2 + 2 × fila 1 ⎝ 0
fila 3 − 3 × fila 1
−→ 5 8 2 1 0 ⎠
0 −7 −10 −3 0 1
⎛ ⎞
1 2 3 1 0 0
7 ⎜ 0 2 1 0 ⎟
fila 3 + × fila 2 −→ ⎝ 5 8 ⎠.
5
0 0 6
5
− 15 75 1
La segunda etapa es reducir la mitad izquierda de la matriz ampliada a forma diagonal con pasos adicionales
de eliminación:
⎡ ⎤ ⎛ ⎞
5 1 2 0 3
2
− 72 − 52
× fila 3
fila 1 − ⎜ ⎟
⎢ 2 ⎥ ⎜ 0 10
− 25 − 20 ⎟
⎣ ⎦ −→ ⎝
5 0 3 3 3 ⎠
20
fila 2 − × fila 3
3 0 0 6
5
− 15 7
5
1
⎛ ⎞
1 0 0 1
6
− 16 1
6
2 ⎜ ⎟
fila 1 − × fila 2 −→ ⎜ 0 5 0 10
− 25 − 20 ⎟
3 ⎠ .
5 ⎝ 3 3
0 0 6
5
− 15 7
5
1
La mitad izquierda se reduce a la matriz identidad dividiendo la fila 2 por 5 y la fila 3 por 65 . Tenemos
entonces
⎛ 1 ⎞
1 0 0 1
− 16
⎟
6 6
⎜
⎜ 0 1 0 2
− 53 − 43 ⎟ = I | A−1
⎝ 3 ⎠
0 0 1 − 16 7
6
5
6
dy
y (x) = = f (x, y) . (20.49)
dx
Se demuestra en el Apartado 20.10 que una ecuación ordinaria de orden superior puede
siempre expresarse como un sistema de ecuaciones de primer orden simultáneas, y los
métodos numéricos para una ecuación se pueden aplicar también a esos sistemas.
Representación gráfica
2,0
1,5
1,0
0,5
Figura 20.10
20.9. Ecuaciones diferenciales de primer orden 531
La ecuación (20.49) es una expresión de las dos variables x e y de forma que se define
un valor de y (x) en cada punto del plano xy. Una representación gráfica de la ecuación
diferencial se obtiene entonces representando el valor de y (x) en cada punto de una
malla en el plano por un segmento con pendiente f (x, y), como se ilustra en la Figura
20.10 para la ecuación y (x) = 2(x − 2y)/(x + y).
Un diagrama de este tipo se llama campo de direcciones. Una solución de la ecua-
ción diferencial tiene entonces una gráfica que es tangente a las lı́neas de dirección en
cada punto de la curva. En la figura se muestran las gráficas de tres soluciones: la su-
perior para la condición y(1) = 2, la del medio para y(0,25) = 0,5 y la inferior para
y(3) = 1.
Un método numérico para resolver una ecuación diferencial es equivalente a empezar
en un punto concreto en el campo de direcciones y seguir las lı́neas de campo. Se dispone
de varios métodos para resolver la mayorı́a de los tipos de ecuaciones diferenciales que
surgen en las ciencias fı́sicas, y la mayorı́a de ellos tienen su origen en desarrollos de
Taylor. Dado el valor y(x0 ) = y0 de la función y(x) en x = x0 , el valor en un punto
próximo x1 = x0 + h es
1
y(x1 ) = y(x0 ) + hy (x0 ) + h2 y (x0 ) + · · · (20.50)
2
o, puesto que por (20.49) y (x0 ) = f (x0 , y0 ),
1
y(x1 ) = y0 + hf (x0 , y0 ) + h2 y (x0 ) + · · ·
2
= y0 + hF0 , (20.51)
donde F0 es la pendiente de la recta que une los puntos 0 y 1 en la gráfica de y(x) (la
pendiente media de la curva). Los distintos métodos numéricos usan distintas maneras
de estimar esa pendiente, dando lugar a una relación de recurrencia
Método de Euler
y1 = y0 + hf (x0 , y0 ) (20.53)
Los valores calculados de y(1) son 3,9766 con el paso h = 0,2 y 4,1875 con h = 0,1, comparados con
el valor exacto 4,4366. La tabla muestra que el error se reduce aproximadamente a la mitad, como es de
esperar en un método de primer orden.
20.9. Ecuaciones diferenciales de primer orden 533
La exactitud aumenta al disminuir el tamaño del paso, pero el mayor número de pasos
necesarios conduce a errores de redondeo mayores. En la práctica, los métodos usados
para resolver ecuaciones diferenciales son procedimientos que simulan el desarrollo de
Taylor hasta un orden alto en h, y los más sofisticados suponen el uso de pasos de tamaño
variable para controlar la acumulación de errores de redondeo y optimizar la convergen-
cia. La deducción y la justificación de esos métodos queda fuera del ámbito de este
libro y únicamente damos aquı́ una breve descripción de una familia de métodos muy
utilizada.
Métodos de Runge–Kutta
010. Carl David Tolmé Runge (1856–1927) y Wilhelm Kutta (1867–1944), matemáticos alemanes,
publicaron estudios sistemáticos de métodos de ‘sustituciones sucesivas’ en 1895 (Runge) y 1901 (Kut-
ta). Ese trabajo ha sido seguido de muchas elaboraciones y extensiones para dar algunos de los métodos
modernos más ampliamente usados.
534 Capı́tulo 20. Métodos numéricos
EJEMPLO 20.17 Aplique los métodos de Runge–Kutta de órdenes 2 y 4 al problema de valor inicial del
Ejemplo 20.16, con paso h = 0,2.
En la Tabla 20.11 presentamos el resultado de aplicar las relaciones de recurrencia (20.55) para orden 2 y
(20.55) para orden 4.
Tabla 20.11 Ejemplo de métodos de Runge–Kutta
orden n xn yn exacto error orden n xn yn error
2 0 0,0 1,000000 1,000000 0,000000 4 0 0,0 1,000000 0,000000
1 0,2 1,440000 1,442806 0,002805 1 0,2 1,442800 0,000005
2 0,4 1,976800 1,983649 0,006849 2 0,4 1,983636 0,000013
3 0,6 2,631696 2,644238 0,012542 3 0,6 2,644213 0,000025
4 0,8 3,430669 3,451082 0,020413 4 0,8 3,451042 0,000040
5 1,0 4,405416 4,436563 0,031147 5 1,0 4,436502 0,000061
La tabla muestra que el método de segundo orden con paso h = 0,2 es ya considerablemente más exacto
que el método de Euler de primer orden con h = 0,1.
d2 y dy
+ p(x) + q(x)y = r(x) (20.57)
dx 2
dx
puede escribirse como dos ecuaciones de primer orden
dy
=z
dx (20.58)
dz
= r(x) − p(x)z − q(x)y
dx
para las funciones de x, y(x) y z(x). Si (20.57) es la ecuación diferencial de un problema
de valor inicial con condiciones iniciales y(x0 ) = y0 e y (x0 ) = z(x0 ) = y1 , las ecuaciones
(20.58) son dos problemas de valor inicial (acoplados) de primer orden. El problema
general consiste en N problemas de valor inicial de primer orden para N funciones,
y1 (x), y2 (x), . . . , yN (x):
dyi
yi (x) = = fi (x, y1 , y2 , . . . , yN ) , i = 1, 2, . . . , N (20.59)
dx
con condiciones iniciales y1 (x0 ) = y0,1 , y2 (x0 ) = y0,2 , . . .
20.10. Sistemas de ecuaciones diferenciales 535
Ecuaciones rı́gidas
Una ecuación diferencial rı́gida es aquella cuya solución tiene términos que dependen
en la variable independiente de forma muy distinta. Por ejemplo, el problema de valor
inicial de segundo orden
d2 y
= 100y , y(0) = 1, y (0) = −10 , (20.61)
dx2
tiene solución general y = ae−10x + be+10x , siendo la solución particular y = e−10x . La
resolución numérica de la ecuación por alguno de los métodos presentados hasta ahora
da una solución que se comporta correctamente para valores de x próximos a x = 0
pero que ‘explota’ como e+10x a medida que x crece porque los errores de redondeo y de
truncación conducen inevitablemente a una pequeña mezcla con el término no deseado.
Es decir, la solución numérica es de la forma
con no nulo.
Los problemas con ecuaciones rı́gidas aparecen en cinética si varios procesos ele-
mentales tiene constantes cinéticas muy distintas. Ası́ por ejemplo, el problema (20.61)
es equivalente a los dos problemas de primer orden
dy dz
= z, = 100y , (20.63)
dx dx
que pueden interpretarse como dos procesos cinéticos de primer orden con constantes
536 Capı́tulo 20. Métodos numéricos
cinéticas 1 y 100. Los problemas rı́gidos pueden a veces resolverse con un cambio de
variable, sin embargo existen métodos numéricos especiales para tratar estos problemas.
20.11. Ejercicios
Apartado 20.2
1. Exprese los siguientes números redondeados a (a) 3 cifras decimales, (b) 4 cifras significativas:
(i) 1,21271 (ii) 72,0304 (iii) 0,129914 (iv) 0,0024988
4. Calcule los valores de las siguientes expresiones aritméticas. Suponiendo que todos los números de las
expresiones han sido redondeados correctamente, halle las cotas de error absoluto de sus respuestas:
(i) 2,137 + 3,152 + 4,672 (ii) 12,36 + 14,13 − 16,38 (iii) 22,7 × 2,59
(iv) 22,7/2,59 (v) (17,43 − 12,34)/14,38
√ √
5. (i) Calcule f (x) = x x + 1 − x con una calculadora de 10 dı́gitos (o similar) para x = 1, 102 , 104 ,
106 , 108 .
x
(ii) Demuestre que la función puede escribirse como f (x) = √ √ .
x+1+ x
Úselo para volver a calcular la función.
ex − e−x
6. (i) Calcule − 1 con una calculadora de 10 dı́gitos (o similar) para x = 1,10−2 , 10−4 , 10−6 .
2x
(ii) Use series de Taylor para hallar una expresión para la función que sea precisa para valores pequeños de
x. Vuelva a calcular con x = 10−2 , 10−4 , 10−6 .
Apartado 20.3
Halle una solución con 4 cifras significativas para las siguientes ecuaciones usando
(i) el método de bisección con los valores iniciales de x que se dan,
(ii) el método de Newton–Raphson empezando en cada caso con x0 = 1:
7. x2 − ln x = 2; 1,5, 1,6 8. e−x = tg x; 0,5, 0,6 9. x3 − 3x2 + 6x = 5; 1, 1,5
10. Para un polinomio de grado n, conocida una raı́z x1 , una segunda raı́z se puede obtener dividiendo
primero el polinomio por el factor (x − x1 ) para obtener un polinomio de grado n − 1. Demuestre que la raı́z
calculada para la ecuación cúbica del Ejercicio 9 es la única real.
Apartado 20.4
Seis puntos de la gráfica de una función y = f (x) vienen dados por los pares (x, y)
(0,0, 0,00000) (0,2, 0,19867) (0,4, 0,38942)
(0,6, 0,56464) (0,8, 0,71736) (1,0, 0,84147)
11. Use interpolación lineal para calcular f (0,04), f (0,26), f (0,5), f (0,81).
13. Construya la tabla de interpolación por diferencias divididas, y úsela para calcular f (0,26).
Apartado 20.5
2,6
dx
14. Halle estimaciones de la integral usando la regla del trapecio (20.33) y la fórmula de error
x 1,0
(20.35), empezando con una banda (n = 1) y doblando el número de bandas (n = 2, 4, 8, . . .) hasta conse-
guir una precisión de 4 cifras.
16. Use la regla de Simpson (20.36) con 2n = 2, 4, 8, . . . para hallar un valor de la integral del Ejercicio
14 con 4 cifras decimales.
17. El error de la regla de Simpson es Ah4 si h es suficientemente pequeño, siendo A una constante. Si
S(2n) es la fórmula de Simpson con 2n intervalos, demuestre que
b
1
f (x) dx ≈ [16S(2n) − S(n)]
a 15
(extrapolación de Richardson). Use esto y el resultado del Ejercicio 16 con n = 8 para estimar un valor más
exacto de la integral. Compruebe su precisión comparándolo con el valor exacto (ln 2,6).
Use la regla de Simpson con 2n = 2, 4, 8, . . . para hallar valores con 5 cifras decimales de las siguientes
integrales:
1 z
sen x sen x
18. dx Is(z) = dx es la integral de seno.
0 x 0 x
2 z
2 2 2
19. e−x dx fer(z) = √ e−x dx es la función error.
0 π 0
Apartado 20.7
Resuelva los siguientes sistemas de ecuaciones por el método de eliminación gaussiana:
20. x1 − 4x2 = −2 21. 2x1 + x2 − x3 = 6
3x1 + x2 = 7 4x1 − x3 = 6
−8x1 + 2x2 + 2x3 = −8
22. x+ y+ z= 2 23. w + 2x + 3y + z = 5
−x + 2y − 3z = 32 2w + x + y + z = 3
3x − 4z = 17 w + 2x + y =4
x + y + 2z = 0
538 Capı́tulo 20. Métodos numéricos
24. Use eliminación gaussiana para hallar el valor de λ para el cual las siguientes ecuaciones tienen
solución. Resuelva las ecuaciones para ese valor de λ:
x+ y+ z= 2
−x + 2y − 3z = 32
3x + 5z = λ
26. Repita el Ejercicio 25 usando aritmética de 4 cifras, redondeando a cuatro cifras significativas los
resultados de cada operación aritmética:
(i) sin pivote, (ii) con pivote parcial, (iii) con pivote parcial escalado.
Apartado 20.8
Halle la inversa de las matrices siguientes usando eliminación de Gauss–Jordan:
⎛ ⎞ ⎛ ⎞
−23 11 1 −1 1 2
27. ⎝ 11 −3 −2 ⎠ 28. ⎝ 3 −1 1 ⎠
1 −2 1 −1 3 4
Apartado 20.9
Nota: los siguientes ejercicios se pueden hacer usando una calculadora de bolsillo. Sin embargo los cálcu-
los son tediosos y se le aconseja escribir sus propios programas de ordenador para realizar el trabajo.
31. Aplique el método de Runge–Kutta de segundo orden al problema de valor inicial del Ejercicio 30
con pasos (i) h = 0,2 y (ii) h = 0,1.
32. Aplique el método de Runge–Kutta de cuarto orden al problema de valor inicial del Ejercicio 30 con
pasos (i) h = 0,2 y (ii) h = 0,1.
Aplique el método de Euler con paso h = 0,1 a cada uno de los siguientes problemas de valor inicial para
calcular un valor aproximado de y(1). Compruebe la solución exacta que se da y calcule el error:
20.11. Ejercicios 539
y2 1
34. y = , y(0) = 1; y=
x+1 1 − ln (x + 1)
y + x2 − 2
35. y = , y(0) = 2; y = x2 + 2x + 2 − 2(x + 1) ln (x + 1)
x+1
Aplique el método de Runge–Kutta de cuarto orden con paso h = 0,1 a los problemas de valor inicial de
los Ejercicios 33, 34 y 35 para calcular y(1) y el error:
01. La teorı́a de probabilidades tiene sus orı́genes en la adivinación y en los juegos de azar de tiempos
remotos y ha seguido siendo utilizada para esos propósitos hasta el dı́a de hoy. Oresme utilizó un argumento
probabilı́stico para concluir que la astrologı́a debı́a ser falsa. La teorı́a moderna surgió de la corresponden-
cia entre Pascal y Fermat en 1654 al hilo de las preguntas que sobre los resultados de lanzar dados le hizo a
Pascal el jugador de Méré. Pascal incluyó sus ideas en el Tratado del triángulo aritmético. Cardano habı́a
tratado anteriormente el lanzamiento de dados en su Liber de ludo aleae (Libro sobre los juegos de azar) de
1526, pero el primer estudio sistemático lo hizo Huygens en su De ratiociniis in aleae ludo (Cálculos en jue-
gos de azar) de 1657. El primer tratamiento sustancial de la teorı́a matemática de probabilidades fue el Ars
conjectandi (Arte de la conjetura) de Jakob Bernoulli publicado en 1713, en el cual se proponı́a también la
aplicación de las probabilidades a las ciencias sociales. De Moivre estudió la ley de errores y la distribución
normal en la segunda edición de Doctrine of chances (1718, 1738, 1756). Euler y d’Alembert escribieron
sobre problemas de esperanza de vida, seguros, loterı́as y otros temas. A la publicación en 1812 del trabajo
definitivo de Laplace Théorie analytique des probabilités (‘en el fondo, la teorı́a de probabilidades es sólo
sentido común en números’) siguió la aplicación extensa de los métodos estadı́sticos, especialmente en las
ciencias sociales.
542 Capı́tulo 21. Probabilidad y estadı́stica
Tabla 21.2 10
9
Resultado Frecuencia
8
0 1 7
1 0 6
2 5 5
3 5
4 9 4
5 10 3
6 9 2
7 6 1
8 3
9 2 0 1 2 3 4 5 6 7 8 9 10
10 0
Figura 21.1
21.1. Estadı́stica descriptiva 543
Este tipo de información se simplifica dividiendo el rango que contiene todos los valores
de la muestra en un número adecuado de intervalos, llamados intervalos de clase o
grupos, y asignando los valores de la muestra a las clases correspondientes. El número
de valores en cada clase se llama frecuencia de clase. En nuestro ejemplo el menor
valor y el mayor son respectivamente 33,3 y 53,2 , de manera que todos los valores están
entre 32,0 y 54,0 por ejemplo, y esto se divide de manera conveniente en 11 intervalos
de clase, cada uno con ancho 2,0 . Un valor que cae en la frontera de la clase se asigna
a la clase superior. La distribución de frecuencias que resulta se representa en la Figura
21.2 por un histograma de frecuencias y en la Figura 21.3 por un gráfico de frecuencia
acumulada. En este último, cada punto de la gráfica es la frecuencia de todos los valores
hasta el valor en ese punto, incluidos los anteriores.
Tanto el diagrama de barras de la Figura 21.1 como el histograma de la Figura 21.2 mues-
tran distribuciones de frecuencias que son aproximadamente simétricas con respecto al
valor central: las frecuencias decrecen al alejarse del centro. Éste es el resultado que se
puede esperar en muchos tipos distintos de experimentos. Por ejemplo, las estaturas de
los miembros de una población (humana o de otro tipo) se espera que se distribuyan
por igual alrededor de un valor promedio, con estaturas muy pequeñas y muy grandes
menos probables que estaturas cercanas al promedio. De igual manera, medidas ‘igual
de buenas’ de una cantidad fı́sica tienen errores aleatorios, con errores positivos y ne-
gativos igual de probables y con errores grandes menos probables que errores pequeños.
La forma en ‘S’ del gráfico acumulado es tı́pico de esas distribuciones simétricas.
Las representaciones gráficas o los diagramas de los datos proporcionan una infor-
mación cualitativa sobre el centro de una distribución, su anchura y su forma. Esas pro-
piedades se cuantifican fácilmente mediante un pequeño número de estadı́sticos de la
distribución que se pueden calcular, como la media, la desviación tı́pica y la asimetrı́a.
Consideremos un experimento en el que los posibles resultados de las medidas de
una cantidad representada por la variable discreta x forman un conjunto de k valores
{x1 , x2 , . . . , xk } (la población o espacio muestral). Si los resultados posibles son valores
de un rango continuo, el conjunto representa k intervalos de clase. Para un experimento
concreto, supongamos que los resultados de N medidas de x (una muestra de la pobla-
ción) consisten en n1 valores de x1 , n2 de x2 , etcétera. El número total de medidas (el
tamaño de la muestra) es entonces
k
ni = N . (21.1)
i=1
1
N
x= xi , (21.2)
N i=1
21.1. Estadı́stica descriptiva 545
1
k
1
x = (n1 x1 + n2 x2 + · · · + nk xk ) = ni xi , (21.3)
N N i=1
donde la suma se hace para los k diferentes valores (o clases). Otras medidas del prome-
dio, rara vez utilizadas en ciencias, son:
Moda: el valor de la variable que tiene mayor frecuencia (el valor más frecuente). Si este
valor es único, la distribución se llama unimodal, pero algunas distribuciones pueden
tener dos o más valores máximos (distribuciones bimodales o multimodales).
Mediana: el valor de la variable que divide la distribución en dos mitades iguales. Si los
valores están ordenados y N es impar, la mediana es el valor central, y es el promedio de
los dos valores centrales si N es par. Esta cantidad se usa cuando el orden o la disposición
es más importante que el valor numérico.
Las tres medidas del promedio son iguales para una distribución simétrica unimodal.
1
(1 × 0 + 0 × 1 + 5 × 2 + 5 × 3 + 9 × 4 + 10 × 5
50
+ 9 × 6 + 6 × 7 + 3 × 8 + 2 × 9 + 0 × 10) = 4,98 .
Esto es próximo al ‘valor esperado’ del experimento, 5. Se obtiene la misma media sumando todos los
valores de la Tabla 21.1 y dividiendo por 50. La moda es 5, con frecuencia 10, y la mediana es 5 también.
(ii) La media de los datos sin procesar de la Tabla 21.3 es 43,34 . La media que se obtiene del histograma
de la Figura 21.2, usando los valores de los centros de las clases, es
1
(1 × 33 + 0 × 35 + 5 × 37 + 5 × 39 + 7 × 41 + 10 × 43
50
9 × 45 + 7 × 47 + 4 × 49 + 51 + 53) = 43,28 .
Que ambos valores de la media sean casi iguales supone que nuestra asignación de los datos en clases no
ha distorsionado esta medida de la distribución. El intervalo modal es 42–44. La mediana de los datos sin
procesar es 43,1 , y el intervalo mediano es 42–44, como se muestra con las lı́neas discontinuas en la Figura
21.3.
Las medidas cualitativas de la dispersión son el rango, la diferencia entre los valores
extremos de los datos, y el rango intercuartı́lico, que contiene el 50 % de los valores
centrales, con los rangos del primer cuartil y del último cuartil a cada lado con 25 % cada
uno. Estas medidas se usan poco en aplicaciones fı́sicas. Las medidas cuantitativas de la
dispersión se obtienen de considerar las desviaciones xi − x de los datos con respecto a
la media. La desviación media (sumando para todos los datos) es
1 1 1
N N N
(xi − x) = xi − x 1 = x − x = 0,
N i=1 N i=1 N i=1
es decir, las desviaciones positivas y negativas de la media se cancelan entre sı́. La dis-
persión de una distribución se mide casi siempre en cambio en función de los cuadrados
de las desviaciones,
1
N
1
k
1
N 2
1
11
V= ni (xi − 4,98)2 = 3,80 .
50 i=1
√
La desviación tı́pica es por lo tanto s = V = 1,95, y el 70 % de los datos está a menos de s de la media.
21.1. Estadı́stica descriptiva 547
(ii) Para los datos sin procesar de la Tabla 21.3, x = 43,3 , V = 16,5 y s = 4,06. Para los datos agrupados
de la Figura 21.2, x = 43,3 , V = 16,8 y s = 4,10 . En este caso el 78 % de los datos está a menos de s de
la media.
La varianza (21.5) puede escribirse de manera más sencilla como ‘la media de los cua-
drados menos el cuadrado de la media’:
1
N
= x − 2x x + x2 .
N i=1 i
1 2
N
V(x) = x2 − x2 . (21.7)
1
N
|xi − x| . (21.8)
N i=1
Si bien esto no suele usarse, puede ser útil para distribuciones muy anchas con un número
significativo de puntos muy alejados del centro.
Asimetrı́a y curtosis
Esta cantidad es cero para una distribución simétrica, positiva si una cola se extiende
más hacia la derecha que hacia la izquierda, y negativa si una cola se extiende más hacia
548 Capı́tulo 21. Probabilidad y estadı́stica
El experimento estadı́stico más sencillo no trivial es uno en que hay sólo dos resulta-
dos posibles: verdadero o falso, encendido o apagado, éxito o fracaso. En la Tabla 21.4
mostramos algunos resultados de lanzar una moneda (una moneda no trucada). N es el
número de lanzamientos, n(C) es el número, o frecuencia, de caras y f (C) = n(C)/N es
la fracción, o frecuencia relativa, de caras.
Los resultados no son sorprendentes porque esperamos que las caras (o las curces) salgan
más o menos la mitad de las veces. Se dice que los dos resultados son ‘equiprobables’.
Este experimento es un ejemplo de experimento aleatorio en el que los resultados de-
penden por completo del ‘azar’ (el problema del significado de las palabras ‘aleatorio’,
‘azar’ y ‘probabilidad’ ha generado una extensa literatura propia). La experiencia mues-
tra que los experimentos aleatorios presentan regularidad estadı́stica, es decir, la frecuen-
cia relativa de un resultado concreto en una sucesión larga de pruebas se mantiene más
o menos igual si se realizan varias de esas sucesiones. En nuestro ejemplo f (C) ≈ 12 y,
para las cruces, f (X) = 1 − f (C) ≈ 12 . El valor teórico de la frecuencia relativa de un
resultado, el valor esperado, es la probabilidad del resultado: P(C) = P(X) = 12 .
Distribuciones de probabilidad
P(xi ) = 1 . (21.10)
i=1
Las dos propiedades más importantes de una distribución de probabilidad son su media
y su varianza (o su desviación tı́pica).
Tabla 21.4
N n(C) f (C)
256 118 0,461
4040 2068 0,512
12000 6062 0,505
24000 11942 0,498
21.3. Probabilidades combinadas 549
k
µ= xi P(xi ) . (21.11)
i=1
Esto es el sumatorio de (21.3) sustituyendo las frecuencias relativas ni /N por las proba-
bilidades. La notación µ se usa más a menudo para la media poblacional, y se reserva x
para una muestra de la población. Otras notaciones que ponen de manifiesto que µ es el
valor esperado son E(x) y x. Si f (x) es una función de x, se define el promedio o valor
esperado de f como
k
k
(véanse las ecuaciones (21.5) a (21.7) para las cantidades correspondientes para una
distribución de frecuencias).
Los dos resultados posibles del lanzamiento de una moneda son sucesos mutuamen-
te excluyentes: si se da uno el otro no puede darse. De esta forma, la probabilidad de
que el resultado sea C y a la vez X en cualquier lanzamiento es cero (suceso imposible),
pero la probabilidad de que el resultado sea C o bien X es uno (suceso seguro):
0* La notación σ se usa siempre para la desviación tı́pica poblacional, aunque a veces también se usa
en vez de s para una muestra. Véase el Aparatado 21.10.
550 Capı́tulo 21. Probabilidad y estadı́stica
Los posibles resultados de lanzar un dado son los números {1, 2, 3, 4, 5, 6}, cada uno con probabilidad 1
6
(para un dado honrado).
(i) La probabilidad de que el resultado de lanzar el dado sea mayor que 4 (sea 5 ó 6) es
1 1
P( > 4) = P(5 ó 6) = P(5) + P(6) = 2 × = .
6 3
(ii) La probabilidad de que el resultado sea par es
1 1
P(par) = P(2 ó 4 ó 6) = P(2) + P(4) + P(6) = 3 × = .
6 2
Sucesos independientes
Los posibles resultados de lanzar una moneda dos veces son {CC, CX, XC, XX},
cada uno con probabidad 14 . El resultado del segundo lanzamiento (suceso B) es inde-
pendiente del resultado del primero (suceso A), y la probabilidad del suceso A y B es
entonces el producto de las probabilidades de A y de B por separado:
De los 36 resultados posibles, los que son iguales a 10 son (5, 5), (4, 6) y (6, 4). La segunda tirada es
independiente de la primera (o si es una única tirada de dos dados, el resultado de cada uno es independiente
del otro). Cada resultado tiene probabilidad 16 × 16 = 361
y por ser mutuamente excluyentes
1 1
P(10) = P(5 y 5) + P(4 y 6) + P(6 y 4) = 3 × = .
36 12
En termodinámica estadı́stica, la probabilidad P(E) de que un sistema esté en un estado con energı́a E es
una función únicamente de E. Dos sistemas sin interacción (independientes) con energı́as E1 y E2 tienen
una energı́a combinada E1 + E2 y una probabilidad combinada
P(E1 + E2 ) = P(E1 ) × P(E2 ) . (21.17)
βE
Una función que cumple esta ecuación es P(E) = e , siendo β una constante; tenemos que
Puede demostrarse que esta función (multiplicada por una constante) es la única que cumple (21.17). En
termodinámica estadı́stica el parámetro β es inversamente proporcional a la temperatura, β = −1/kT,
siendo k la constante de Boltzmann, y la función de probabilidad exponencial describe la distribución de
Boltzmann.
21.4. Distribución binomial 551
4 caras
4
1 1
P(4C) = P(CCCC) = = .
2 16
3 caras y 1 cruz
4
1
P(3C + 1X) = P(CCCX) + P(CCXC) + P(CXCC) + P(XCCC) = 4 × .
2
2 caras y 2 cruces
P(2C + 2X) = P(CCXX) + P(CXCX) + P(CXXC)
4
1
+ P(XXCC) + P(XCXC) + P(XCCX) = 6 × .
2
1 cara y 3 cruces
4
1
P(1C + 3X) = P(XXXC) + P(XXCX) + P(XCXX) + P(CXXX) = 4 × .
2
4 cruces
4
1
P(4X) = P(XXXX) = .
2
4
Vemos que los coeficientes del factor 12 de las probabilidades son los números {1,
4, 6, 4, 1} que
constituyen la quinta fila del triángulo de Pascal. Son los coeficientes
binomiales m4 , para m caras y 4 − m cruces. En el caso de n pruebas, el número total de
resultados posibles es 2n (2 por cada prueba) y la probabilidad de m caras y n − m cruces
es
n
n 1
P mC + (n − m)X = Pm = × . (21.18)
m 2
552 Capı́tulo 21. Probabilidad y estadı́stica
EJEMPLO 21.6 La probabilidad de que el resultado de lanzar 10 veces una moneda consista en m caras
(y 10 − m cruces) es
10
10 1
Pm = ×
m 2
con µ = 5, V = 2,5 y σ = 1,58. En la Tabla 21.5 comparamos la correspondiente distribución binomial
con las frecuencias relativas fm obtenidas de la Tabla 21.2.
Tabla 21.5
m 0 1 2 3 4 5 6 7 8 9 10
Pm 0,001 0,01 0,04 0,12 0,21 0,25 0,21 0,12 0,04 0,01 0,001
fm 0,02 0,00 0,10 0,10 0,18 0,20 0,18 0,12 0,09 0,04 0,00
La media, la varianza y la desviación tı́pica de la distribución de frecuencias son n = 4,98 , V(n) = 3,8 y
s = 1,95 . Las diferencias entre la teorı́a y el experimento se deben al pequeño tamaño de la muestra (50
conjuntos de 10 lanzamientos).
EJEMPLO 21.7 Halle la probabilidad de conseguir al menos 2 ‘seises’ en cuatro tiradas de un dado no
trucado.
P = P2 + P3 + P4
2 2 3 4
4 1 5 4 1 5 4 1
= + +
2 6 6 3 6 6 4 6
4
1 171
= (150 + 20 + 1) = = 0,132 .
6 1294
21.5. Permutaciones y combinaciones 553
Los resultados posibles de lanzar una moneda o de tirar un dado son sucesos mu-
tuamente incompatibles con misma probabilidad: cada uno de los k posibles resultados
tiene probabilidad 1/k. El recuento de resultados equiprobables es importante en cien-
cias en varias aplicaciones de la teorı́a de probabilidades y a menudo implica contar las
permutaciones y las combinaciones de conjuntos de objetos o de sucesos. Los teoremas
que siguen son algunos de los resultados importantes de la teorı́a combinatoria.2
Permutaciones
n!
n
Pr = n(n − 1)(n − 2) · · · (n − r + 1) = . (21.21)
(n − r)!
Combinaciones
5! 5·4·3·2·1
5
C3 = = = 10 .
3!2! (3 · 2 · 1)(2 · 1)
Ası́ por ejemplo, para A, B, C, D, E:
ABC, ABD, ABE, ACD, ACE, ADE, BCD, BCE, BDE, CDE.
Hay 3! permutaciones posibles de cada combinación, de manera que 3! × n C3 = nP3 . En general, como
puede verse a partir de (21.21) y (21.22), nPr = r! × n Cr .
n!
. (21.23)
n1 !n2 !n3 ! . . . nk !
Hemos considerado los teoremas anteriores para conjuntos de objetos distintos o dis-
tinguibles, y han de ser modificados o reinterpretados si algunos de los objetos o todos
son indistinguibles. Se dice que dos objetos son indistinguibles si no se
aprecia una variación al intercambiarlos, y por lo tanto no da lugar a una permutación
o combinación nueva o diferente. Por ejemplo, el teorema 4 puede reinterpretarse para
el número de permutaciones diferentes de n objetos distribuidos en k grupos, siendo los
21.5. Permutaciones y combinaciones 555
objetos de cada grupo indistinguibles entre sı́, pero distintos de los objetos de los demás
grupos.
5. El número de permutaciones de n objetos indistinguibles es 1.
6. El número de maneras de distribuir k objetos indistinguibles (por ejemplo,
electrones) entre n (≥ k ) cajas (estados cuánticos)
con no más de un objeto por
n
caja (el principio de exclusión de Pauli) es n Ck = .
k
Las n cajas o bien están ocupadas por un elemento o bien están vacı́as, de manera que
el teorema 3 se puede aplicar a las cajas. Este resultado es importante en mecánica es-
tadı́stica para sistemas de partı́culas que cumplen el principio de exclusión de Pauli. Da
lugar a la estadı́stica cuántica llamada estadı́stica de Fermi–Dirac que es importante
en la descripción de algunos sistemas termodinámicos a muy baja temperatura y, por
ejemplo, para describir las propiedades de los electrones de conducción en sólidos.
Grandes números
EJEMPLO 21.9 El número de permutaciones de 52 objetos (una baraja de cartas) es 52! ≈ 8,1 × 1067 .
1
ln n! ∼ n ln n − n + ln 2πn . (21.25)
2
1
El uso de esta expresión asintótica supone errores de aproximadamente 12n para ln n! si
n es grande (véase el Ejemplo 20.12). Si n es suficientemente grande, podemos tomar
03. James Stirling (1692–1770), matemático escocés y, como Cotes y De Moivre, amigo de Newton.
La fórmula que lleva su nombre apareció en su Methodus differentialis de 1730 y en la Miscellanea analytica
de De Moivre, también de 1730.
556 Capı́tulo 21. Probabilidad y estadı́stica
ln n! ≈ n ln n − n . (21.26)
La ecuación (21.25) es ya una muy buena aproximación para n = 52, y puede suponerse
exacta para los valores mayores de n que aparecen en la tabla. La diferencia entre (21.25)
y la ‘aproximación peor’ (21.26) es 12 ln 2πn, que sólo crece muy despacio con n. El error
absoluto 27,4 para n = 1023 corresponde al error relativo 5 × 10−24 para ln n! .
En el Ejemplo 21.10 que sigue damos una aplicación importante de la fórmula de
Stirling. Vamos a considerar antes cómo se comporta una distribución, como la distribu-
ción binomial, si los números que aparecen son grandes. En la Figura 21.4 mostramos la
distribución binomial (21.18) para n = 10 y n = 100. Las gráficas son de Pm /Pn/2 frente
a m/n, con valor máximo 1 para m/n = 1/2.
Figura 21.4
En termodinámica estadı́stica, la distribución de Boltzmann para un sistema de n partı́culas con energı́a total
E se deduce a menudo considerando las maneras en que las partı́culas pueden distribuirse entre los estados
de partı́culas. Supongamos que hay k estados disponibles con energı́as 1 , 2 , . . . , k , supongamos que n1
partı́culas tienen energı́a 1 , n2 tienen energı́a 2 , y ası́ sucesivamente. El número de maneras de distribuir
las n partı́culas de esta forma (suponiendo partı́culas distinguibles) viene dado entonces por el teorema 4:
n!
W= . (21.27)
n1 ! n2 ! · · · nk !
Si n es grande, como ocurre en un sistema termodinámico, las propiedades del sistema vienen dominadas
por la distribución para la cual W alcanza su valor máximo. Esta distribución más probable se obtiene
optimizando W con respecto a los números de ocupación (considerados variables continuas) sujeto a las
ligaduras de que el número total de partı́culas n sea constante y de que la energı́a total E sea constante:
k
k
n= ni = constante, E= ni i = constante. (21.28)
i=1 i=1
El valor máximo de W sujeto a las ligaduras se obtiene entonces por el método de los multiplicadores de
Lagrange, esto es, hallamos el máximo de la función auxiliar
k
k
φ = ln W − α ni − β ni i (21.30)
i=1 i=1
siendo α y β los multiplicadores (véase el Apartado 9.4). Para obtener un valor estacionario (máximo) con
respecto a ni , tiene que cumplirse
∂φ ∂
= ln W − α − βi = 0 .
∂ni ∂ni
∂
Puesto que ln W = ln ni , tenemos por lo tanto que ln ni = α + βi , de manera que la distribución más
∂ni
probable de partı́culas viene dada para los números de ocupación
ni = eα+βi . (21.31)
Este conjunto de números, interpretando adecuadamente las cantidades α y β, se denomina distribución de
Boltzmann. Ası́, por ejemplo, β = −1/kT, de manera que ni = eα e−i /kT y
k
k
ni = n = eα e−i /kT .
i=1 i=1
Las distribuciones que hemos considerado hasta ahora son discretas, implicando una
variable discreta x (o una variable que se considera discreta a efectos prácticos). Cada
valor de esa variable tiene una frecuencia relativa observada y su correspondiente pro-
babilidad teórica. Tales distribuciones describen procesos que implican contar sucesos
discretos, y un ejemplo es la distribución binomial descrita en el Apartado 21.4.
Los procesos que implican medir una variable continua se describen mediante dis-
tribuciones continuas, en las cuales la variable x puede tomar cualquier valor dentro de
un rango continuo, digamos que a ≤ x ≤ b. El número de resultados posibles es enton-
ces infinito, y la probabilidad de un resultado concreto no está definida (la probabilidad
efectiva es cero). En cambio, definimos la probabilidad de que el valor de x esté en un
intervalo especı́fico x1 ≤ x ≤ x2 como:
x 2
La Figura 21.5 ilustra la interpretación gráfica. El área total bajo la curva entre a y b
es igual a 1 y representa la probabilidad total (ecuación (21.34)). La región sombreada
tiene área igual a la probabilidad dada por (21.32).
Figura 21.5
21.6. Distribuciones continuas 559
Las propiedades de una distribución continua se obtienen sustituyendo las sumas para
una distribución discreta por integrales en el rango de valores posibles, con lo que los
valores esperados son entonces (véanse las ecuaciones (21.12) y (21.11) para el caso
discreto)
b
f = f (x)ρ(x) dx , (21.35)
a
con media
b
Una distribución continua en tres variables tiene una función de densidad de probabilidad ρ(x, y, z) tal que
z2
y2
x2
P(x1 < x < x2 ; y1 < y < y2 ; z1 < z < z2 ) = ρ(x, y, z) dx dy dz
z1 y1 x1
es la probabilidad de que las variables estén en los intervalos dados; es decir, (x, y, z) es un punto de la caja
rectangular cuyos lados son x2 − x1 , y2 − y1 , z2 − z1 . La función de densidad es una función de posición en
el espacio de las variables y ρ(r)dv es la probabilidad de que el punto esté en el volumen dv con posición r.
Algunas distribuciones tridimensionales de importancia en quı́mica son las distribuciones de probabilidad
electrónicas que se obtienen de las soluciones de la ecuación de Schrödinger.
Si transformamos las variables a coordenadas esféricas en el espacio, tenemos que
φ2
θ 2
r 2
P(r1 < r < r2 ; θ1 < θ < θ2 ; φ1 < φ < φ2 ) = ρ(r, θ, φ) r2 sen θ dr dθ dφ
φ1 θ1 r1
es la probabilidad de que el punto esté en la sección del casquete esférico entre los radios r1 y r2 , los
ángulos θ1 y θ2 , y los ángulos φ1 y φ2 (véase la explicación de la Figura 10.6). La probabilidad de que el
punto esté en cualquier parte del casquete entre r1 y r2 es entonces
560 Capı́tulo 21. Probabilidad y estadı́stica
P(r1 < r < r2 ) = P(r1 < r < r2 ; 0 < θ < π; 0 < φ < 2π)
r2
2π
π
= ρ(r, θ, φ) r2 sen θ dθ dφ dr .
r1 0 0
1
ρ(x) = √ e−(x−µ) /2σ
2 2
(21.37)
σ 2π
para todos los valores de x. En la Figura 21.7 mostramos las gráficas para tres valores de
σ.
Figura 21.7
21.7. Distribución gaussiana 561
Errores
Función de distribución
04. La primera descripción de la ley normal del error la dio De Moivre en 1738. Gauss la dedujo en
su Teorı́a del movimiento de los cuerpos celestes de 1809 a partir de un principio de probabilidad máxima:
‘si una cantidad ha sido determinada a partir de varias observaciones, hechas en las mismas circunstancias y
con igual cuidado, la media aritmética de los valores observados proporciona el valor más probable’. Gauss
consideraba que la función (21.37) era la función de error ‘correcta’ porque habı́a sido capaz de deducirla
del principio de mı́nimos cuadrados. Laplace dio una deducción alternativa de la ley normal en 1810, y la
incluyó en su Teorı́a analı́tica de la probabilidad de 1812.
562 Capı́tulo 21. Probabilidad y estadı́stica
que se obtiene a partir de (21.38) mediante el cambio z = (x − µ)/σ. Con esto, F(x) =
Φ((x − µ)/σ)), y
b−µ a−µ
P(a < x < b) = Φ −Φ . (21.42)
σ σ
Por lo tanto, es de esperar que cerca del 68 % de los valores observados esté a menos
de una desviación tı́pica de la media (Figura 21.8), 95 % a menos de dos desviaciones
tı́picas, y casi todos a menos de tres desviaciones tı́picas.
Figura 21.8
21.8. Más de una variable 563
Covarianza y correlación
1
cov(x, y) = (xi − x)(yi − y) = xy − x y , (21.44)
N i
donde xy = N1 xi yi . Si las variables son independientes, xy = x y (cada valor de x puede
darse con cada valor de y) y la covarianza es cero. Si los valores de x por encima de la
media tienden a darse con valores de y por encima de la media, la covarianza es positiva
porque los términos (xi − x)(yi − y) resultan positivos. Si los valores de x grandes se dan
con valores de y pequeños, la covarianza es negativa.
Una medida alternativa de la dependencia es el coeficiente de correlación
cov(x, y) xy − x y
ρx,y = = . (21.45)
σx σy σx σy
Se trata de una cantidad adimensional con valores −1 ≤ ρx,y ≤ +1. Las variables x
e y son independientes si ρx,y = 0, tienen correlación positiva si ρx,y es positiva y
correlación negativa si ρx,y es negativa. Si ρx,y = ±1, x e y están totalmente (100 %)
correlacionadas, y puede existir una relación funcional entre las variables. Las nubes de
puntos de la Figura 21.9 muestran algunos ejemplos de correlación.
Las tres primeras representan resultados de los estudiantes de una clase de primer
curso de quı́mica. La Figura (a) muestra la nota global en quı́mica (vertical) frente a la
inicial del nombre del estudiante (horizontal). No se espera que haya correlación y no
se observa ninguna, siendo ρx,y = 0,03. Hay cierta correlación entre la nota global en
quı́mica y la nota de matemáticas, con ρx,y = 0,52, y una mayor correlación (ρx,y = 0,76)
entre las notas de quı́mica inorgánica y quı́mica orgánica. La Figura (d) es tı́pica de los
564 Capı́tulo 21. Probabilidad y estadı́stica
resultados que se obtienen si se espera que exista una relación funcional lineal entre las
variables (también puede obtenerse un coeficiente de correlación alto sin que exista una
relación funcional).
Figura 21.9
Figura 21.10
21.9. Mı́nimos cuadrados 565
y = y(x; m, c) = mx + c , (21.46)
donde m y c son parámetros que determinan la pendiente y el corte de la recta con el eje.
De manera más general, el problema es ajustar los puntos a una función (sencilla) que
sirva de modelo,
El método más sencillo y el más utilizado para ajustar un conjunto de puntos a una
función modelo (21.47) consiste en minimizar la cantidad
N
N
D= [ yi − y(xi ; a) ] = 2i
2
(21.48)
i=1 i=1
∂D ∂D ∂D
= 0, = 0, . . . , = 0. (21.49)
∂a1 ∂a2 ∂ak
i = yi − y(xi ; a)
05. El método de mı́nimos cuadrados (la méthode des moindres quarrés) fue desarrollado por Le-
gendre en 1805 en relación con la determinación de las órbitas de cometas, y se convirtió rápidamente
566 Capı́tulo 21. Probabilidad y estadı́stica
La cantidad que hay que minimizar en el caso del ajuste a una recta y = mx + c es
N
D= [yi − (mxi + c) ] .
2
(21.50)
i=1
Tenemos entonces
∂D N
N
N
N
= −2 xi (yi − mxi − c) = 0 , ó xi yi − m x −c
2
xi = 0 ,
∂m i=1 i=1 i=1
i
i=1
∂D N
N
N
N
= −2 (yi − mxi − c) = 0 , yi − m xi − c 1 = 0.
∂c i=1 i=1 i=1 i=1
N
xy − mx2 − cx = 0
(21.51)
y − mx − c = 0
cuya solución es
xy − x y
m= , c = y − mx . (21.52)
x2 − x 2
La recta resultante pasa por el baricentro (x, y) de los datos.
Si todos los valores yi tienen la misma precisión σ, los parámetros estimados m y c tienen
desviaciones tı́picas dadas por
σ2 σ 2 x2
σm2 = , σc2 = , (21.53)
N x2 − x2 N x2 − x 2
y el ajuste por mı́nimos cuadrados lineal con los errores estimados es y = mx + c con
xy − x y
m= ± σm , c = y − mx ± σc . (21.54)
x2 − x 2
en un método estándar para resolver problemas en astronomı́a y geodesia. El método apareció también en
1809 en la Teorı́a del movimiento de los cuerpos celestes de Gauss. Gauss no citaba a Legendre y afirmaba
que habı́a estado usando el método desde 1795. Legendre argumentó que la primicia en descubrimientos
cientı́ficos puede establecerse únicamente por las publicaciones, y seguı́a acusando a Gauss en 1827 de
haberse apropiado de los descubrimientos de otros.
21.9. Mı́nimos cuadrados 567
EJEMPLO 21.13 Halle el ajuste por mı́nimos cuadrados lineal para los siguientes puntos:
Tabla 21.7
x 0 3 6 9 12 15 18
Ajuste ji-cuadrado
Si los errores (conocidos) de los valores de y no son todos iguales, con σi para yi ,
hay que sustituir el método de mı́nimos cuadrados sencillo por el método más general
de mı́nimos cuadrados ponderado:
N 2
yi − f (xi ; a)
χ =
2
= mı́nimo. (21.55)
i=1
σi
Cada contribución a la suma está ponderada por el factor 1/σi2 , y tiene por efecto dar
mayor peso a los valores de y más precisos (con valores de σi más pequeños). Esta
situación se produce por ejemplo cuando la precisión con la cual se puede medir varı́a
en el rango de los valores de y, o cuando los datos provienen de medidas hechas en
varios instrumentos distintos. Este método de ajuste se reduce al de mı́nimos cuadrados
sencillo si todos los σi son iguales.
Minimizar χ2 para un ajuste a una recta da las mismas ecuaciones que antes, (21.52) para
m y c y (21.53) para σm y σc , si los promedios se sustituyan por promedios ponderados.
Por ejemplo,
N N
1
N
yi 1
y= yi se sustituye por y= , (21.56)
N i=1 i=1
σi2 i=1
σi2
568 Capı́tulo 21. Probabilidad y estadı́stica
Los ajustes a otros tipos de funciones se obtienen de la misma forma, pero conducen
a expresiones más complicadas. El método puede generalizarse también a más de dos
variables.
El uso de la ecuación (21.55) se justifica considerando la distribución normal (21.37)
para errores aleatorios. Si los errores en yi son aleatorios y si f (xi ) es el valor exacto (no
conocido) de y para x = xi , entonces
1
ρ(i ) = √ e− /2σ
2 2
i i
(21.58)
σi 2π
Si se sustituye la función exacta f (x) por una función aproximada, la expresión (21.59)
es una medida de la bondad del ajuste, y la bondad es máxima cuando χ2 es mı́nimo.
Regresión
06. Francis Galton (1822–1911), nacido en Birmingham. Descubrió la importancia de los anticiclones
en meteorologı́a e influyó en la creación del Meteorological Office y del National Physical Laboratory. Se
le conoce sobre todo por su trabajo sobre herencia. Acuñó el término ‘eugenesia’ y abogó por aplicar la
selección cientı́fica a las poblaciones humanas.
21.11. Ejercicios 569
1
N
µ≈x= xi , (21.60)
N i=1
y la varianza y la desviación tı́pica definidas por las ecuaciones (21.5) y (21.6) son esti-
maciones de la varianza y de la desviación tı́pica poblacionales
1
N
σ 2 ≈ s2 = (xi − x) .
2
(21.61)
N i=1
Las consideraciones sobre la ‘mejor estimación’ en teorı́a muestral nos indican que,
si bien (21.60) es la mejor estimación de µ que se puede obtener de la muestra, (21.61)
subestima la mejor estimación de la varianza en un factor (N−1)/N, y ha de ser sustituida
por la estimación corregida
1
N
σ 2 ≈ s2 = (xi − x) .
2
(21.62)
N − 1 i=1
21.11. Ejercicios
Apartado 21.1
1. Los siguientes datos consisten en el número de caras obtenidas al lanzar 10 veces una moneda:
5, 5, 4, 4, 7, 4, 3, 7, 6, 4, 2, 5, 6, 4, 5, 3, 5, 4, 2, 6, 7, 2, 4, 5, 6,
5, 6, 4, 3, 4, 4, 5, 5, 6, 7, 5, 3, 6, 5, 5, 6, 7, 9, 4, 7, 9, 8, 8, 5, 10.
(i) Construya una tabla de frecuencias y un diagrama de barras para las frecuencias.
(ii) Calcule la media, la moda y la mediana.
(iii) Calcule la varianza y la desviación tı́pica.
2. Los siguientes datos consisten en las notas sobre 100 obtenidas por 60 estudiantes en un examen:
66, 68, 70, 48, 56, 54, 48, 47, 45, 53, 73, 60, 68, 75, 61, 62, 61, 61, 52, 59,
58, 56, 58, 69, 48, 62, 72, 71, 49, 69, 59, 48, 64, 59, 53, 62, 66, 55, 41, 66,
60, 38, 54, 69, 60, 53, 60, 64, 57, 54, 73, 46, 73, 58, 50, 66, 37, 60, 47, 70
(i) Construya un histograma de frecuencias con clases de ancho 4.
(ii) Calcule la media, la moda y la mediana (a) para los datos sin agrupar, (b) para los datos agrupados.
3. Calcule x, x2 , x3 y s para los datos del Ejercicio 1. Calcule a partir de ellos el coeficiente de asimetrı́a.
5. Halle las probabilidades para los siguientes resultados totales de 3 lanzamientos de un dado: (i) 8, (ii)
8 ó 12, (iii) más de 15.
6. Una partı́cula puede estar en tres estados con energı́as 0 , 1 y 2 (0 < 1 < 2 ), y con distribución de
probabilidades Pi = e−i /kT /q a temperatura T.
(i) Exprese la función de partición q en función de T y de las energı́as.
(iii) Halle la distribución de probabilidades (combinadas) para un sistema de tres partı́culas independientes.
Apartado 21.4
7. Halle la probabilidad de obtener al menos 3 caras al lanzar (i) una moneda neutral, (ii) una moneda
con probabilidad 0,6 de que salga cruz.
8. Un sistema que puede hallarse en distintos estados con energı́as E0 < E1 < E2 < · · · tiene proba-
bilidad 0,1 de estar en un estado excitado (con E > E0 ). Halle la probabilidad de que en 10 observaciones
independientes, el sistema se encuentre en el estado fundamental (con E = E0 ) (i) todas las veces, (ii) sólo
5 veces, (iii) por lo menos 8 veces.
21.11. Ejercicios 571
Apartado 21.5
14. Sean 3 partı́culas distinguibles, cada una de ellas pudiendo estar en un nivel de energı́a cualquiera
de 4 posibles con energı́as (diferentes) E1 , E2 , E3 y E4 . (i) ¿De cuántas maneras se pueden distribuir las
partı́culas entre los estados? (ii) ¿cuántos estados del sistema tienen energı́a total igual a E1 + E2 + E4 ?
Apartado 21.6
16. La variable x puede tomar cualquier valor en el rango continuo 0 ≤ x ≤ 1 con función de densidad de
probabilidad ρ(x) = 6x(1 − x). (i) Deduzca una expresión para la probabilidad P(x ≤ a), de que el valor de
x no sea mayor que a. (ii) Compruebe que P(0 ≤ x ≤ 1) = 1. (iii) Halle el valor medio x y la desviación
tı́pica σ. (iv) Halle la probabilidad de que x − σ ≤ x ≤ x + σ.
17. La variable r puede tomar cualquier valor en el rango r = 0 → ∞ con función de densidad de
probabilidad ρ(r) = 4r2 e−2r . Deduzca una expresión para la probabilidad P(0 ≤ r ≤ R) de que el valor de
la variable no sea mayor que R.
18. Compruebe que ρ(r) del Ejercicio 17 es la función de densidad radial (en unidades atómicas) del or-
bital 1s del átomo de hidrógeno. Halle (i) el valor medio r, (ii) la desviación tı́pica σ, (iii) el valor de r
más probable.
Apartado 21.9
19. Halle el ajuste a una recta para los puntos siguientes:
x 1 2 3 4 5 6 7 8 9 10 11 12
y 4,4 4,9 6,4 7,3 8,8 10,3 11,7 13,2 14,8 15,3 16,5 17,2
20. Los resultados de las medidas de la constante cinética de la descomposición de un compuesto orgánico
en un rango de temperaturas son:
T/K 282,3 291,4 304,1 313,6 320,2 331,3 343,8 354,9 363,8 371,7
k/10−3 M−1 s−1 0,0249 0,0691 0,319 0,921 1,95 5,98 19,4 57,8 114, 212,
572 Capı́tulo 21. Probabilidad y estadı́stica
La dependencia de la constante cinética con la temperatura viene dada por la ecuación de Arrhenius
k = Ae−Ea /RT , ó ln k = −Ea /RT + ln A, donde la energı́a de activación Ea y el factor de proporcionalidad
A pueden suponerse constantes para todo el rango experimental de temperaturas. Una representación gráfica
de ln k frente a 1/T deberı́a ser por lo tanto una lı́nea recta.
(i) Construya la tabla de los valores de 1/T y ln k, determine el ajuste lineal por mı́nimos cuadrados de los
datos suponiendo que sólo hay error en k y calcule los valores más adecuados de Ea y de A.
(ii) Suponiendo que los errores en ln k son todos iguales a σ = 0,1, use las ecuaciones (21.53) para hallar
estimaciones de los errores de Ea y de A.
Æ
Integrales indefinidas
xn+1
xn dx = (n = −1) cotg x dx = ln sen x
n+1 ⎧
x
(ax + b) n+1
⎪
⎪
(ax + b)n dx = (n = −1) ⎨ ln tg 2
a(n + 1) cosec x dx =
⎪
⎪ 1 1 − cos x
dx ⎩ ln
dx = ln x 2 1 + cos x
x π
⎧
⎪ x
⎪ ln tg +
dx 1 ⎨ 4 2
= ln (ax + b) sec x dx =
ax + b a ⎪
⎩ 1 ln 1 + sen x
⎪
ln x 1 2 1 − sen x
dx = (ln x)2
x 2
eax sen bx dx
xn+1 1
xn ln x dx = ln x −
n+1 n+1 a sen bx − b cos bx
= eax
a2 + b2
(n = −1)
eax cos bx dx
e dx = e
x x
a cos bx + b sen bx
= eax
eax+b dx =
1 ax+b
e a2 + b2
a 1
sen x dx = (x − sen x cos x)
2
2
sen x dx = − cos x
1
cos2 x dx = (x + sen x cos x)
2
1
sen (ax + b) dx = − cos (ax + b)
a tg2 x dx = tg x − x
cos x dx = sen x
cotg2 x dx = − cotg x − x
cos (ax + b) dx =
1
sen (ax + b)
a sec2 x dx = tg x
tg x dx = − ln cos x
cosec2 dx = − cotg x
574 Apéndice. Integrales estándar
x
dx
sen ax sen bx dx √ = arccosh
x − a
2 2 a
1 sen (a − b)x sen (a + b)x
= − x2 − a2 dx
2 a−b a+b
(a = b) x x
a2
=− arccosh + x2 − a2
cos ax cos bx dx 2 a 2
dx x
√ = arcsenh
a +x
2 2 a
1 sen (a − b)x sen (a + b)x
= +
2 a−b a+b
a2 + x2 dx
(a = b)
a2 x x
sen ax cos bx dx = arcsenh + a2 + x2
2 a 2
1 cos (a − b)x cos (a + b)x arcsen x dx = x arcsen x + 1 − x2
=− +
2 a−b a+b
(a = b) arccos x dx = x arccos x − 1 − x2
dx x
= tg
1 + cos x 2
arctg x dx
dx x
= − cotg
1 − cos x 2 1
= x arctg x − ln 1 + x2
2
senh x dx = cosh x arccotg x dx
cosh x dx = senh x 1
= x arccotg x + ln 1 + x2
2
dx
√
tgh x dx = ln cosh x a + bx + x2
b
cotgh x dx = ln senh x = ln x + + a + bx + x 2
2
x dx 2x − b
dx 1 √ = arcsen √
= arctg a + bx − x2 b2 + 4a
+x
a2 2 a a
dx
dx 1
a + x
= ln
ax2 + bx + c
a2 − x2 2a
a − x
x ⎧
dx ⎪ 1
p + q
√ = arcsen ⎪
⎪ ln
si b2 > 4ac
a2 − x2 a ⎨ 2aq
p − q
=
⎪
⎪
⎪
⎩
1
arctg
p
si b2 < 4ac
a2 − x2 dx aq q
2
x x b
b − 4ac
a2 donde p = x + , q2 =
= arcsen + a2 − x2 2a 4a2
2 a 2
Fórmulas de reducción 575
Integrales definidas
∞ a
n! 1 2
xn e−ax dx = a2 − x2 dx = πa
0 an+1 0 4
∞
∞
−ax2 1 π sen ax π
e dx = dx = , (a > 0)
0 2 a 0 x 2
∞
∞
1 · 3 · · · (2n − 1) π cos ax − cos bx b
x e 2n −ax2
dx = dx = ln
2n+1 an a 0 x a
0
∞
∞ b
x2n+1 e−ax dx =
2 n! e−ax sen bx dx =
2an+1 0 a2 + b2
0
∞
a
π a
√
dx
= e−ax cos bx dx =
a2 − x2 2 0 a2 + b2
0
π π
π
sen2 nx dx = cos2 nx dx = (n = 0, n entero)
0 0 2
π
sen mx sen nx dx = 0 (m = n, m y n enteros)
0
π
cos mx cos nx dx = 0 (m = n, m y n enteros)
0
π
sen mx cos nx dx = 0 (para todos m y n enteros)
0
Fórmulas de reducción
xn eax n
x e dx =
n ax
− xn−1 eax dx
a a
sen x cosn−1 x n−1
cosn x dx = + cosn−2 x dx
n n
cos x senn−1 x n−1
senn x dx = − + senn−2 x dx
n n
⎧
⎪ senm+1 x cosn−1 x n−1
⎪
⎨ + senm x cosn−2 x dx
m+n m+n
sen x cos x x dx =
m n
⎪ senm−1 x cosn+1 x
⎪ m−1
⎩− + senm−2 x cosn x dx
m+n m+n
27. a5 28. 1 29. a−1 30. a 31. a9 10. 2x2 − x − 6 11. 2x3 − 11x2 − x + 30
32. a12 33. a−6 34. a8 35. a5/6 36. a3 12. x(2x + 3) 13. (x + 2)(x − 2)
37. a2 b4 38. (a2 + b2 )1/2 39. ±3 40. 4 14. (2x + 3)(2x − 3) 15. (x + 5)(x + 1)
41. 8 42. 3−4 = 1/81 1 x+2
16. 17.
3x + 2 x+4
18. x + 2 19. x + 1
Apartado 1.7 x2 + 3x + 2 2x − 1
20. 2 21.
x +x+2 x−2
43. densidad, kg m−3
44. concentración, mol m−3
Apartado 2.4
45. aceleración, m s−2
46. momento, kg m s−1 22. x = y + 2
47. fuerza, N = kg m s−2 23. x = ± y2 − 1, y ≥ 1
578 Soluciones de los ejercicios
√ 10 2 1
24. x = ± y − 1, y ≥ 1 52. + −
y 9(x − 1) 3(x − 1)2 9(x + 2)
25.
1+y
3 + 2y 1+y
26. 27.
3y − 2 1 − 2y Apartado 2.7
pVm
28. B = Vm −1 54. (x, y) = (2, 1) ; se cortan
RT
0 2 55. (x, y) = (7/13, 4/13) ; se cortan
Λm − Λm
29. c = 56. inconsistente ; rectas paralelas
K 1 2
57. (x, y) = (1 ± √ , ± √ ); la recta y la
θ 3 3
30. p =
K(1 − θ) curva se cortan dos veces
58. (x, y) = (1, 0) doble ; la recta y la
curva se tocan
Apartado 2.5 59. compleja ; la recta y la curva no se
tocan
32. 1 + 2x + 3x2 33. 1 + 2x + 3x2
2 6 12 60. las 3 rectas se cortan en (x, y, z) =
34. + 2 + 3 35. 1 + x + 2x4 + 6x9
x x x
√ (2, −2, −1)
36. Dibuje la recta de Λm frente a c.
Entonces −K es la pendiente y Λ0m el
corte con el eje. Capı́tulo 3
r − 1
37. Dibuje la recta de frente a
ρ(r + 2) Apartado 3.1
1
. Se obtiene µ2 de la pendiente y α 1. c = 13,
T
del corte con el eje. 12 5
sen A = , cos A = ,
38. 1, 2 39. 1/2, −2 13 13
12 13
40. −1/2 (doble) 41. 1/2, −2 tg A = , cosec A = ,
5 12
1 7 1 i 13 5
42. ± 43. ± √ secA = , cotgA =
2 12 2 12 5 12
5 12
1 y+1 sen B = , cos B = ,
44. −1± 1+8 13 13
4 y−1 5 13
tg B = , cosec B = ,
Ka 4c 12 5
45. α = 1+ −1 13 12
2c Ka secB = , cotgB =
12 5
π 87π 2π 13π
2. , , ,
Apartado 2.6 36 180 3 9
3. 18◦ , 67,5◦ , 157,5◦ , 20,25◦
7 1 1
46. 2 − 6. (i) √ , − √ , −1
x+3 2 2
26 1 1
47. 3x2 − 8x + 15 − 6. (ii) − √ , − √ , +1
x+2 2 2
48. (ii) x = 1, −2/3 1 1
6. (iii) − √ , √ , −1
47. (iii) (x − 1)2 (3x + 2) 2 2
49.
1
−
1 7. (i) π (ii) 2π/3 (iii) 2π
3(x − 1) 3(x + 2)
2 1
50. +
3x 3(x + 3) Apartado 3.2
4 3 √
51. −
x+2 x+1 8. c = 5,
Soluciones de los ejercicios 579
1
A = arcsen √ ≈ 26,57◦ , 10. (iii) ln 32 (iv) ln 2
5
π 25. (i) ln x 2
(ii) ln (2x − 3)
B=π− − A ≈ 108,43◦
4 10. (iii) 0 (iv) x (v) x2
9. (i) 2 sen 2θ cos 2θ
RT p
26. h = − ln
9. (ii) cos2 2θ − sen2 2θ Mg p0
−
10. (i) cos 2θ cos 3θ − sen 2θ sen 3θ p◦
27. p = exp [(µ − µ−
◦
)/RT]
10. (ii) cos 2θ cos 3θ + sen 2θ sen 3θ γ
3 1 Capı́tulo 6
7. − e−2x + C 8. − cos 4x + C
2 4
9. ln C(x − 1) 10. ln
C Apartado 6.2
3−x 1
x3 1. (6x − sen 6x) + C
11. + 3x − 18 12
3 1
2. − cos 6x + C
12
1
Apartado 5.3 3. − ( cos 5x + 5 cos x) + C
10
3 5 1
12. 2 13. 14. ln 4. (2 cos 2x − cos 4x) + C
8 4 8
1 −3
1
15. e − e−15 16. 0 5. (2 sen 2x − sen 4x) + C
3 8
1 40 3 1
17. − 18. 19. 20. 6.
1
(3 sen 7x + 7 sen 3x) + C
2 3 2 3 42
3
21. ln 2 22. ln π 2
2 7. 8. 0 9. −
4 4 3
24. γ = exp (bp2 /2RT) 25.
3
26. (i) impar (ii) par (iii) par
Apartado 6.3
26. (iv) impar (v) impar (vi) par
1
26. (vii) ninguna de las dos cosas; 11. (3x + 1)6 + C
18
26. par: 3x2 + 1; impar: 2x
1
26. (viii) ninguna de las dos cosas; 12. − cos (4x − 1) + C
4
1 −x
26. par: e + e+x ; 1 2 4
2 13. 3x + 2x + 5 + C
1 −x 8
26. impar: e − e+x (ix) par 3
2 14. −e−(x +2x)
+C
15. ln (x2 + x + 2) + C
Apartado 5.6 1
16. sen4 x + C
4
28. (i) +1 (ii) 66 (iii) 60
17. − ln ( cos x) + C
l3 l2 3l l5
29. (i) (ii) (iii) (iv) 2
3 3 4 80 18. (1 + ex )3/2 + C
3
19. ln ( ln x) + C
Apartado 5.7 1
20. − (4 − x2 )3/2 + C
3
30. 7
k k 21. − 4 − x2 + C
31. (i) (x2 − 1) (ii) (x2 − 1)
2 2 1
k 2 k 22. (2x − 1)3/2 + C
31. (iii) (x − 1) (iv) − (x2 − 1) 3
m 2 1
23. (2x3 + 3x − 1)4/3 + C
31. (v) 0 (vi) estacionario 4
1
24. sen (3x2 − 1) + C
6
Apartado 5.8 25. − ln (1 − sen x) + C
1
32. (i) p(V2 − V1 ) 26. e2 sen x + C
2
V2 − nb 1 x
31. (ii) nRT ln 27. arctg +C
V1 − nb 2 2
1 1 1
− na2 − 28. arcsen x − x 1 − x2 + C
V1 V2 2
582 Soluciones de los ejercicios
√ √
29. 2 x − arctg x +C (x + 4)2
58. ln +C
1 2 (x + 3)
30. ln 10 31. −4 32. 1 (x − 2)
6 3 59. ln +C
π 1 1 7 (3x + 1)
33. 34. 35.
4 2 2 (x − 2)4
60. x + ln +C
(x − 1)
1
Apartado 6.4 61. (7 ln (x + 1) − 26 ln (x + 2)
2
36. −x cos x + sen x + C +21 ln (x + 3)) + C
2
37. 3(x2 − 2) sen x − x(x2 − 6) cos x + C 1 x +3
62. ln +C
1 1 2 x2 + 4
38. (x + 1)2 sen 2x + (x + 1) cos 2x √
2 2 1 x+2− 2
1 63. √ ln √ +C
− sen 2x + C 2 2 x+2+ 2
4
64. arctg (x + 2) + C
x2
39. (2 ln x − 1) + C 1
4 65. ln (x2 + 4x + 5)
( ln x + 1) 2
40. − +C −2 arctg (x + 2) + C
x
1 2
41. (2x − 2x + 1)e2x + C 66. x − 2 ln (x2 + 4x + 5)
4
1
42. − e−x ( sen 2x + 2 cos 2x) + C +3 arctg (x + 2) + C
5 ax
e
(a cos bx + b sen bx) + C 1 x+2
43. 67. arctg (x + 2) + 2 +C
(a2 + b2 ) 2 x + 4x + 5
44. 1 45.
1
46. −
1
1 + tg θ/2
4 9 68. ln +C
1 1 − tg θ/2
47. 2 − 3e−π
13 1/2 1
T 8kT 69. arctg (2 tg θ/2) + C
48. 49. 2
Θr πm
70. ln (1 + tg θ/2) + C
Apartado 6.5
1
50. senn x dx = − senn−1 x cos x
n
Capı́tulo 7
n−1
+ senn−2
x dx Apartado 7.2
n
sen6 x cos3 x sen6 x cos x 1. ur = 1 + 3(r − 1) = ur−1 + 3
52. +
9 21 2. ur = 3r = 3ur−1
sen4 x cos x 4 sen2 x cos x r
− − 1 ur−1
105 315 3. ur = − =−
5 5
8 cos x
− +C 1 3 2 4 8
315 4. 0, , 1, 5. 1, , ,
1/2 2 2 3 9 27
1 1 3kT
54. 55. 2 56. 1 1 1 1 1 1 1
60 T m 6. , , , 7. 1, , ,
3 8 15 24 2 6 24
8. 0 9. ∞ 10. 0 11. 1
Apartado 6.6 √
3 1+ 5
1 (2x − 1) 12. 0 13. 14.
57. ln +C 5 2
7 (x + 3)
Soluciones de los ejercicios 583
1 v 2 3 v 4
27. 81 − 216x + 216x2 − 96x3 + 16x4 61. E = m0 c2 1 + +
2 c 8 c
28. 729 + 1458x + 1215x2 + 540x3 5 v 6
+ + ···
10 16 c
+135x4 + 18x5 + x6 29.
11 1
lim (E − m0 c2 ) = m0 v2
v/c→0 2
Apartado 7.4 a
62. (i) 1, b − , b2
−1 RT
34. 1 − e−θv /T a ab a2
23. (ii) 1, b − , b2 − + 2 2
RT RT 2R T
Apartado 7.5
Apartado 7.7
35. converge 36. diverge
x x2 5x3 5x4
37. converge 38. converge, para todo a 63. (i) 2 + − + −
12 288 20736 248832
39. diverge 40. diverge 23. (ii) 2,0800821
√
41. converge 42. diverge 23. (iii) 2,0800832 < 3 9 < 2,0800840
2 1
64. 1 65. 66. −2 67.
3 2
Apartado 7.6
43. 4 44. 1 45. 1
√
46. 1 47. 0 48. 1 + 3 Capı́tulo 8
x x2 5x3 10x4
49. 1 + − + − Apartado 8.2
3 9 81 243
50. 1 − x2 + x4 − x6 + x8 1. 6 − 2i 2. 4 3. 6i
x 3x 2
5x 3
35x 4 4. 18 + 4i 5. −8 − 6i 6. 41 − 38i
51. 1 + + + +
2 8 16 128 5 3
7. 10 8. −i 9. − i
1 x x2 x3 x4 34 34
52. − + − + 5 12 12 24
3 9 27 81 243 10. + i 11. + i
4x6 4x10 8x14 4x18 13 13 25 25
53. 2x −
2
+ − + 12. (i) 3 + 2i (ii) 2 + 3i
3 15 315 2835
584 Soluciones de los ejercicios
1 7
(iii) (3 + 2i) 38. −1 39. −2i 40. π
13 12
√
13. ±1 + 2i 14. 1 ± i 3 5 3
41. π 42. π 43. 144
√ 1 √ 12 2
15. −2, 1 ± i 3 16. 3, −3 ± i 3 27 −iπ/3 4 iπ/3
2 44. e 45. e
4 27
√
Apartado 8.3 3 3 3 √
46. (i) − 1 +i + 3
√ 2 2
π √
17. 2, − 3 3 3 √
4 23. (ii) +1 +i − + 3
√ 1 2 2
18. 5, π + arctg −
2 48. cos a cosh b − i sen a senh b
π
19. 2, − 50. (ii) C = A + B, D = i(A − B)
3
3 1
20. , π + arctg √
2 2
π π
Apartado 8.6
21. 2, − 22. 3, 0 23. 3, 1
6
2 51. ±1, ±i 52. ± √ (1 + i)
π π π 2
24. 1, −
2
25. 2 cos + i sen
2 2 √ π π
53. −1 + i, 2 cos + i sen ,
26. 3( cos π + i sen π) 12 12
√ π π √ 7π 7π
27. 2 cos − + i sen − 2 cos − i sen
4 4 12 12
π
28.
π
2 cos + i sen 1 √ 1 √
6 6 54. ±i, ± 3+i , ± 3−i
2 2
3π 3π
29. 6 cos + i sen
4 4
Apartado 8.7
4π 4π
30. 4 cos + i sen 55.
1
56.
6
3 3 5 65
5π 5π
31. (i) 6 cos + i sen
6 6
2 π π
23. (ii) cos + i sen Capı́tulo 9
3 6 6
3 π π
23. (iii) cos − i sen Apartado 9.1
2 6 6
17π 17π 1. (i) 0 (ii) 16 (iii) 36
32. (i) 5 cos + i sen
12 12 3
(ii) −
π
2. (i) 1 (iii) 2
π 2
23. (ii) 5 cos + i sen
12 12
1 π π Apartado 9.3
23. (iii) cos − i sen
5 12 12
1 3. 4x, −2y 4. 2x − 3, 4y + 2
33. (i) 81i (ii) − i 5. 2e 2x+3y
, 3e 2x+3y
81
35. 128 cos8 θ − 256 cos6 θ 6. 2x cos (x2 − y2 ), −2y cos (x2 − y2 )
2
+160 cos4 θ − 32 cos2 θ + 1 7. [2x cos (xy) − y sen (xy)]ex ,
2
−xex sen (xy)
Apartado 8.5 ∂z
8. = 4xy − sen (x + y)
√ ∂x
3 3 1 3 ∂z
36. √ + √ i 37. − i = 2x2 − sen (x + y)
2 2 2 2 ∂y
Soluciones de los ejercicios 585
∂2z 27. −
1
(x dx + y dy + z dz)
= 4y − cos (x + y) r3
∂x2
∂ z
2 28. sen θ sen φ dr + r cos θ sen φ dθ
= − cos (x + y)
∂y2 +r sen θ cos φ dφ
∂ z2
∂ z2
= 4x − cos (x + y) =
∂x∂y ∂y∂x
Apartado 9.6
∂z
9. = [ sen (x + y) + cos (x + y)]ex−y y x b2 x − a2 y + abc
∂x 29. −2 + − 30.
∂z x y ab(x + y + z)
= [ − sen (x+y) + cos (x+y)]ex−y
∂y 31. (1 − sen u) cos (u + v)
∂ z
2 5x4 y nR
= 2 cos (x + y)ex−y 32. − 5 33.
∂x2 x − cos y V − nb
∂2z 2 y2 − x2
= −2 cos (x + y)ex−y 34.
∂y2 y
∂2z ∂2z x + 3y
= −2 sen (x + y)ex−y = 35. x cos y − sen y
∂x∂y ∂y∂x x+y
x y z 2x + yz
15. , , 17. −
r r r 2y + xz Apartado 9.7
2
na 2n3 ab
18. nR p− 2 + , 42. exacto 43. no exacto 44. exacto
V V3
n2 a 2n3 ab
−(V − nb) p− 2 +
V V3 Apartado 9.8
64 √
46. (i) , (ii) 20 47. 31 48. − 5
Apartado 9.4 3
x3 1 · 4x6
4. y = a0 1 + + Apartado 13.6
3! 6!
1 · 4 · 7x9 13. H6 (x) = 64x6 −480x4 +720x2 −120
+ + ···
9!
2x4 2 · 5x7
+a1 x + + Apartado 13.7
4! 7!
2 · 5 · 8x10
14. r2 − n2 = 0, r = ±n
+ + ···
10!
Apartado 13.3
Capı́tulo 14
5. (i) r1 = −1, r2 = 3/2
Apartado 14.2
23. (ii) y1 = x−1 a0 + a1 x + a2 x2 + · · ·
a
23. y2 = x3/2 A0 +A1 x+A2 x2 + · · · 1. f = [ sen (bx + vbt) + sen (bx − vbt)]
2
6. (i) r1 = r2 = 0 2. V = A + Bx (c/D = 0)
23. (ii) y1 = a0 + a1 x + a2 x2 + · · · V = Aeαx + Be−αx α2 = c/D > 0
y2 = y1 ln x+A0 x+A1 x2 +A2 x3 + · · · V = A cos αx + B sen αx
7. (i) r1 = −2, r2 = −3 α2 = −c/D > 0
23. (ii) y1 = x−2 a0 + a1 x + a2 x2 + · · · 4. f = aeb(x−2t)
y2 = ky1 ln x
5. f = a exp [b x2 + y2 ]
+x−3 A0 + A1 x + A2 x2 + · · ·
6. f = aeαx + be−αx
x2 x3 × (c cos αy + d sen αy) para (α = 0)
8. y1 = 1 + x + + + · · · = ex
2! 3!
y2 = ex ln x ó f = (a + bx)(c + dy)
senh 3πx
7. f = aebx−y/b 8. sen 3πy
senh 3π
πx
Apartado 13.4 9. T = 3 sen exp [ − Dπ 2 t/l2 ]
l
1
10. P6 (x)= 231x6 −315x4 +105x2 −5
16 Apartado 14.4
11. (1 − 2xh + h2 )−1/2
8 lπx
1 10. ψlmn = sen
= 1 + xh + (3x2 − 1)h2 abc a
2 mπy nπz
1 3 × sen sen
+ (5x − 3x)h3 + · · · b c
2 2
h2 l m2 n2
= P0 (x) + P1 (x)h + P2 (x)h2 Elmn = + 2 + 2
8m a2 b c
+P3 (x)h3 + · · · para l, m, n = 1, 2, 3, 4, . . .
1
12. P14 = 35 cos3 θ − 15 cos θ sen θ Degeneración 1 si a, b, c son iguales,
2
15 3 si 2 iguales, 6 si todos distintos
P4 =
2
7 cos2 θ − 1 sen2 θ
2
P34 = 105 cos θ sen3 θ
Apartado 14.5
P44 = 105 sen4 θ
11. (i) E0,1 = 5,7831, E±1,1 = 14,6819,
Soluciones de los ejercicios 589
Capı́tulo 16
Apartado 16.2
Capı́tulo 15 1
1. (i) b − a, a − b (ii) (a + b + c + d)
Apartado 15.2 4
aa3 a5 26. (iii)
1
(b + c)
1
1. c1 = 3 + + + ··· 2
3 5 7 26. (iv) b + λ(c − b), λ arbitrario
1 1 5
2. (i) P0 + P1 + P2
4 2 16
Apartado 16.3
Apartado 15.3 √ √
2. (2, 2, 0), 8 3. (2, −5, 1), 30
Q2 √ √
4. V = , Q2 = qr2 (3 cos2 θ − 1) 4. (2, 3, 1), 14 5. (– 1, 0, 3), 10
4π0 R3
6. 0, 0 7. Ambos (– 1, 5, −1)
1 2
Apartado 15.4 8. (3, 6, 9), (– 1, −2, −3), , ,1
3 3
1 2 cos x cos 3x cos 5x
5. (ii) + − + 9. (– 1, 0, 4) 10. Ambos (3, −6, 12)
2 π 1 3 5 √ √ √
−
cos 7x
+ ··· 11. 27, 14 + 29 12. (1, 1, 1)
7
sen x 13. 2i − j 14. −2i + j
sen 2x sen 3x
6. (ii) 2 − +
1 2 3 15. (i) 4i (ii) λj
sen 4x
− + ··· 26. (iii) λi (λ arbitrario)
4
π2 cos x cos 2x 16. (i) (2, −1, 0) (ii) (1, −1, 1),
7. (ii) −4 −
3 12 22 (0, 0, 0), (– 2, 2, −2)
cos 3x
+ 2 − ··· 17. (i) 2i + 6j − 6k, (ii) i + 3j − 3k
3
8l2 πx 1 3πx 18. 2i + 6t j 19. ( − 2 sen 2t, 3 cos t, 2)
9. 3 sen + 3 sen
π l 3 l 20. (i) v = −3yi + 3xj + 3k,
1 5πx a = −9(xi + yj)
+ 3 sen + ···
5 l
590 Soluciones de los ejercicios
1 Capı́tulo 17
26. (ii) − √ (xi + yj); en el plano xy,
2
26. hacia el eje z.
Apartados 17.1 a 17.3
26. (iii) Circular en el plano xy con vel.
26. angular ω = 3, y en la dirección z con 1. 5 2. 6 3. 2 4. 1
26. vel. 3k; esto es, movimiento en una 5. (i) elemento menor cofactor
26. hélice a derechas en torno al eje z. (1, 1) −1 −1
(1, 2) 3 −3
(1, 3) −2 −2
Apartado 16.5 (2, 1) 5 −5
(2, 2) −2 −2
21. Ambos 7 22. 4 23. −6 (2, 3) −3 3
24. Ambos 10 25. (0, 12, 4) 26. 5 (3, 1) −2 −2
(3, 2) −7 7
27. 0 28. −3 29. 2
(3, 3) −4 −4
31. −1 32. π/3, 2π/3, π/4 26. (ii) −13 (iii) −13
√
33. (i) 5i − 5j (ii) 5 2 (iii) π/4 6. −11 7. 6 8. −4
34. (i) 4 (ii) −3 (iii) 0 35. −6 9. 30 10. 4 11. 144 12. 0
Apartado 16.6
Apartado 17.4
36. 9i − j + 3k, −9i + j − 3k
13. x = 1, y = 2, z = 3
37. 7i, 7 38. Ambos 11i − 2j − k
14. x = y = z = 0
39. 0 40. −7
15. w = x = y = 1, z = −1
41. −14j − 21k, i − 18j − 9k
16. x = (z + 3)/5, y = (7z − 4)/5,
45. 5 46. (i) (0, 0, −7) z arbitrario
26. (ii) (1, 0, 0) (iii) (0, −5, 0) 17. k = 1, x = z/3, y = −2z/3,
47. 5i + 6j 48. −3i + 18k z arbitrario
50. (i) ω = ωk (ii) v = −ωyi + ωxj 18. λ = 1, y = −x; λ = 3, y = x
26. (iii) l = mω[ x2 + y2 k − xzi − yzj] 19. λ = 3, y = 0, x = −z;
√ √
52. l = 2m x2 + y2 ωk = Iω ω λ = 3 − 2, x = z, y = − 2z;
√ √
λ = 3 + 2, x = z, y = 2z
20. λ = 0 (doble);
Apartado 16.8
x = 3z − 2y, y, z arbitrarios;
53. 4xi + 6yj − 2zk λ = 8, x = −z, y = −2z, z arbitrario
54. (y + z)i + (x + z)j + (x + y)k
−3/2
55. – x2 + y2 + z2 (xi + yj + zk)
Apartados 17.5 a 17.7
Apartado 16.9 3 2 −2
21. 0 −3 7 = −225
56. 3, 0 57. 0, i + j + k 58. 0, 0 0 0 25
Soluciones de los ejercicios 591
1 0 1 1 Capı́tulo 18
0 1 1 0
22. =1
0 0 −1 0 Apartado 18.2
0 0 0 −1 ⎛ ⎞
1 0
−5 4 2
2 4 6 3 1. ⎝−2 3 ⎠ 2.
3 −1 −1
3 4
0 −1 −10 1
23. = −320 ⎛ ⎞
3 0 0
0 0 42 − 13
2 1 0
0
3. ⎝ 0 2 0 ⎠ 4.
0 0 80 21 0 0 −1
−2 4
√ 1/2 √ √
12. Si x =
3+ 5
y X−1 = √5 −√5
1
3
2 2 2 2
−1/2
c = 2(1 + x2 ) 1 0
, entonces 26. (ii) D =
0 4
⎛ ⎞
1
⎜ x ⎟ 26. (iii) det D = 4 = det A,
λ1 = α + xβ, x1 = c ⎝ ⎠;
x 26. (iii)tr D⎛= 5 = tr A ⎞
1 1 0 1
⎛ ⎞
x 17. (i) X = ⎝−1 0 1 ⎠ ,
⎜ 1 ⎟ 1 1 1
λ2 = α + (x − 1)β, x2 = c ⎝ ⎠;
−1 ⎛ ⎞
⎛ −x ⎞ −1 1 ⎝ 1 −1 0 ⎠
x X = −2 0 2
⎜−1 ⎟ 2 1 1 0
λ3 = α − (x − 1)β, x3 = c ⎝ ⎠;
−1 ⎛ ⎞
x −1 0 0
⎛ ⎞ 26. (ii) D = ⎝ 0 1 0 ⎠
1
0 0 3
⎜ −x ⎟
λ4 = α − xβ, x4 = c ⎝
x ⎠ 26. (iii) det D = −3 = det A,
−1
⎛ ⎞ 26. (iii)tr D = 3 = tr A
1
13. (ii)
1
√ ⎝ 1 ⎠ ⎛ ⎞
1 1 1
3 √
1 ⎜ 2 2 2 ⎟
⎜ ⎟
26. (iv) por ejemplo, ⎜ 1 −1 ⎟
⎛ ⎞ ⎛ ⎞ 18. (i) X = ⎜
⎜ 0 √ √ ⎟,
⎟
⎜ 2 2 ⎟
1 ⎝ 1 ⎠ 1 ⎝ 1 ⎠ ⎝ −1 1 1 ⎠
26. √ −1 , √ 1 √
2 0 6 −2 2 2 2
14. (i) λ1 = 2, λ2 = 3 ⎛ ⎞
1 −1
√ 0 √
26. (iii) derecha:
⎜ 2 2 ⎟
⎜ ⎟
1 −2 1 ⎜ 1 1 1 ⎟
26. x1 = √
1
, x2 =
0 26. X −1
=⎜
⎜ √ ⎟
⎟
5 ⎜ 2 2 2 ⎟
26. (iii)izquierda: ⎝ 1 −1 1 ⎠
√
0 1 1 2 2 2
26. y1 = , y2 = √
1 5 −2 ⎛ ⎞
0 √0 0
26. (ii) D = ⎝ 0 2 2 √0
⎠
Apartados 19.3 y 19.4 0 0 −2 2
1 1 1 26. (iii) det D = 0 = det A,
15. (i) X = √ ,
2 −1 1
26. (iii)tr D = 0 = tr A
1 1 −1
26. X−1 = √
2 1 1 19. Q = 4y21 + 16y22 ,
2 0 √3
26. (ii) D = y1 2
− 12 x1
0 4 = √
y2 1 3 x2
26. (iii) det D = 8 = det A, 2 2
26. (iii)tr D = 6 = tr A
Apartado 19.5
2 1
√ √
5 2 1−i 2+i 1−i 3−i
16. (i) X = −1 1
, 21.
3−i i
,
2+i i
√ √
5 2
Soluciones de los ejercicios 595
2 −i 2 i 23. (ii)1,666666668 × 10−9 ;
22. , , hermı́tica
i 1 −i 1
⎛ ⎞ ⎛ ⎞ 23. (ii)1,6666666667 × 10−13
0 i 0 0 −i 0
23. ⎝−i 0 i ⎠ , ⎝ i 0 −i ⎠,
Apartado 20.3
0 −i 0 0 i 0
hermı́tica 7. 1,564 8. 0,5314 9. 1,322
(ii) 0,810000; 0,656100; (iii) Pi,j,k = e−(i +j +k )/kt /q3
0,531441; 0,430467; 0,348678
(iii) 0,814506; 0,663420; Apartado 21.4
0,540360; 0,440127; 0,358486 7. (i) 0,3125 (ii) 0,2304
31. (i) 0,820000; 0,672400; 8. (i) 0,3487 (ii) 0,001488
0,551368; 0,452122; 0,370740 (iii) 0,9298
(ii) 0,819025; 0,670802;
0,549404; 0,449975; 0,368541 Apartado 21.5
32. (i) 0,818733; 0,670324;
9. AB AC AD AE
0,548817; 0,449335; 0,367885
BA BC BD BE
(ii) 0,818731; 0,670320;
CA CB CD CE
0,548812; 0,449329; 0,367880;
DA DB DC DE
< 10−7
EA EB EC ED
33. 0,892626; 0,027961
10. AB AC AD AE BC BD BE
34. 2,845387; −0,413504
CD CE DE
35. 2,191160; −0,036251
11. AAABB AABAB AABBA
36. 0,864660; −0,000005
ABAAB ABABA ABBAA
37. 3,258822; −0,000070
BAAAB BAABA BABAA
38. 2,227412; < 10−7
BBAAA
8!
12. = 280 13. 38 = 6561
Capı́tulo 21 4!3!1!
43 =
14. (i) 64 (ii) 6
Apartado 21.1 4
15. (i) = 4 (ii) 1
1. (ii) 5,22, 5, 5 (iii) 3,172, 1,78 3
Soluciones de los ejercicios 597