Matematicas para Las Ciencias A - Steiner, Erich

Título de la obra original:
The Chemistry Maths Book

Edición original en lengua inglesa publicada por:
Oxford University Press Inc., New York. U.S.A.
Copyright © E. Steiner 1996, 2003
Edición en español
© Editorial Reverté, S. A., 2005
Edición en papel
ISBN: 978-84-291-5159-6
Edición e-book (PDF)
ISBN: 978-84-291-9439-5
Versión española por:

Salvador Jiménez
Departamento de Matemática y Física Aplicadas
Universidad Alfonso X El Sabio Madrid - España
Propiedad de:
EDITORIAL REVERTÉ, S. A.
Loreto, 13-15, Local B
08029 Barcelona
Tel: (34) 93 419 33 36
Fax: (34) 93 419 51 89
[email protected]
www.reverte.com
Reservados todos los derechos. La reproducción total o parcial de esta obra, por cualquier medio o
procedimiento, comprendidos la reprografía y el tratamiento informático, queda rigurosamente prohi-
bida, salvo excepción prevista en la ley. Asimismo queda prohibida la distribución de ejemplares
mediante alquiler o préstamo públicos, la comunicación pública y la transformación de cualquier
parte de esta publicación (incluido el diseño de la cubierta) sin la previa autorización de los titulares
de la propiedad intelectual y de la Editorial. La infracción de los derechos mencionados puede ser
constitutiva de delito contra la propiedad intelectual (Art. 270 y siguientes del Código Penal). El
Centro Español de Derechos Reprográficos (CEDRO) vela por el respeto a los citados derechos.
# 1257

Este libro describe las matemáticas necesarias para todo el conjunto de temas que con-
forman una carrera universitaria de quı́mica (u otra ciencia aplicada). Ha sido ideado
para que sirva de libro de texto para asignaturas de ‘matemáticas para quı́micos’.
Los temas se desarrollan de forma lógica y consistente con pocas suposiciones de
un conocimiento previo de matemáticas. El material está organizado en tres partes inde-
pendientes en gran medida: los Capı́tulos 1 al 15 tratan de álgebra, cálculo, ecuaciones
diferenciales y desarrollos en series; los Capı́tulos 16 a 19 de vectores, determinantes
y matrices; los Capı́tulos 20 y 21 son introducciones a los grandes temas de análisis
numérico y estadı́stica.
Una caracterı́stica de este libro es el uso extenso de ejemplos para ilustrar todos los
conceptos y métodos importantes del texto. Algunos de esos ejemplos se usan también
para mostrar aplicaciones de las matemáticas en quı́mica y varios conceptos básicos de
fı́sica. Los ejercicios al final de cada capı́tulo, 900 en total, son un elemento esencial
del desarrollo de los temas, y han sido ideados para dar al estudiante un conocimiento
operativo del material del texto. Se dan las soluciones a todos los ejercicios numéricos.
El texto se acompaña de una historia de las matemáticas en notas a pie de página.
Algunos temas de quı́mica reciben un tratamiento extenso. Entre ellos el concepto de
trabajo presión-volumen en termodinámica en el Capı́tulo 5, los sistemas periódicos en
el Capı́tulo 8, las ecuaciones diferenciales de la cinética quı́mica en el Capı́tulo 11, y
varias aplicaciones de la ecuación de Schrödinger en los Capı́tulos 12 y 14. Además, el
contenido de varios capı́tulos viene determinando en gran medida por sus aplicaciones
en las ciencias fı́sicas: Capı́tulo 9, las matemáticas de la termodinámica; Capı́tulos 10
y 16, descripción de sistemas y procesos en tres dimensiones; Capı́tulo 13 (avanzado),
algunas ecuaciones diferenciales y funciones especiales importantes en quı́mica y fı́si-
ca matemáticas; Capı́tulo 15 (avanzado), fuerzas intermoleculares, analisis ondulatorio
y espectroscopı́a de transformada de Fourier; Capı́tulos 18 y 19, simetrı́a molecular y
operaciones de simetrı́a, teorı́a de orbitales moleculares, dinámica molecular y mecánica
cuántica avanzada.
Agradecimientos
Quiero expresar mi gratitud a mis colegas de Departamento de Quı́mica por su estı́mu-
lo, crı́tica y ayuda en la preparación de este libro. Quiero dar las gracias en particular
a los Doctores John Sandall y David Rosseinsky, a los Profesores Ken Schofield y An-
thony Legon, por sus valiosos comentarios sobre determinados capı́tulos, y al Profesor
Patrick Fowler por su constante apoyo y crı́tica constructiva durante todas las etapas de
la redacción del libro.
VI Prefacio
Estoy en deuda con mis alumnos por convencerme de que este libro era necesario, y
con los revisores por persuadir a Oxford University Press de que lo publicase.
Sobre todo, quiero agradecer a Mary Steiner su paciencia y su fe en mı́.
Exeter, julio 1995 Erich Steiner

01 Números, variables y álgebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

01.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
01.20 Números reales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
01.30 Representación decimal de los números . . . . . . . . . . . . . . . . . . . . . . . 6
01.40 Números complejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
01.50 Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
01.60 El álgebra de los números reales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
01.70 Unidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
01.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
02 Funciones algebraicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
02.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
02.20 Representación gráfica de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . 25
02.30 Factorización y simplificación de expresiones . . . . . . . . . . . . . . . . . 27
02.40 Funciones inversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
02.50 Polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
02.60 Funciones racionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
02.70 Resolución de sistemas de ecuaciones . . . . . . . . . . . . . . . . . . . . . . . . 43
02.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
03 Funciones trascendentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
03.10 Funciones trigonométricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
03.20 Relaciones trigonométricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
03.30 Coordenadas polares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
03.40 Funciones trigonométricas inversas . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
03.50 La función exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
03.60 La función logarı́tmica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
03.70 Valores de las funciones exponencial y logarı́tmica . . . . . . . . . . . . . 69
03.80 Funciones hiperbólicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
03.90 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
04 Derivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
04.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
04.20 El proceso de derivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
04.30 Continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
04.40 Lı́mites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
VIII Índice de contenidos
04.50 Derivación a partir de primeros principios . . . . . . . . . . . . . . . . . . . . . 82

04.60 Derivación a partir de reglas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
04.70 Funciones implı́citas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
04.80 Derivada logarı́tmica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
04.90 Derivadas sucesivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
04.10 Puntos estacionarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
04.11 Movimientos lineal y angular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
04.12 El diferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
04.13 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
05 Integración . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
05.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
05.20 La integral indefinida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
05.30 La integral definida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
05.40 El cálculo integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
05.50 Usos del cálculo integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
05.60 Propiedades estáticas de la materia . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
05.70 Dinámica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
05.80 Trabajo presión-volumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
05.90 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
06 Métodos de integración . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

06.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
06.20 El uso de relaciones trigonométricas . . . . . . . . . . . . . . . . . . . . . . . . . . 140
06.30 El método de sustitución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
06.40 Integración por partes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
06.50 Fórmulas de reducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
06.60 Integrandos racionales. El método de fracciones simples . . . . . . . . 153
06.70 Derivación paramétrica de integrales . . . . . . . . . . . . . . . . . . . . . . . . . 157
06.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
07 Sucesiones y series . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

07.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
07.20 Sucesiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
07.30 Series finitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
07.40 Series infinitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
07.50 Criterios de convergencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
07.60 Series de MacLaurin y de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
07.70 Valores aproximados y lı́mites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
07.80 Operaciones con series de potencias . . . . . . . . . . . . . . . . . . . . . . . . . . 187
07.90 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
Índice de contenidos IX
08 Números complejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193

08.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
08.20 El álgebra de los números complejos . . . . . . . . . . . . . . . . . . . . . . . . . 194
08.30 Representación gráfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
08.40 Funciones complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
08.50 Fórmula de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
08.60 Periodicidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
08.70 Cálculo de integrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
08.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
09 Funciones de varias variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215

09.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
09.20 Representación gráfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
09.30 Derivadas parciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
09.40 Puntos estacionarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
09.50 El diferencial total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
09.60 Algunas propiedades diferenciales . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
09.70 Diferenciales exactos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
09.80 Integrales de lı́nea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
09.90 Integrales múltiples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
09.10 La integral doble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
09.11 Cambio de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249
09.12 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
10 Funciones en tres dimensiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257

10.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
10.20 Coordenadas esféricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258
10.30 Funciones de posición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259
10.40 Integrales de volumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261
10.50 El operador laplaciano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266
10.60 Otros sistemas de coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
10.70 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271
11 Ecuaciones diferenciales de primer orden . . . . . . . . . . . . . . . . . . . . . . . . 275

11.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275
11.20 Solución de una ecuación diferencial . . . . . . . . . . . . . . . . . . . . . . . . . 276
11.30 Ecuaciones separables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278
11.40 Ecuaciones separables en cinética quı́mica . . . . . . . . . . . . . . . . . . . . 282
11.50 Ecuaciones lineales de primer orden . . . . . . . . . . . . . . . . . . . . . . . . . . 288
11.60 Un ejemplo de ecuaciones lineales en cinética quı́mica . . . . . . . . . 290
11.70 Circuitos eléctricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
11.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
X Índice de contenidos
12 Ecuaciones diferenciales de segundo orden. Coeficientes constantes 297

12.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297
12.20 Ecuaciones lineales homogéneas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297
12.30 Solución general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299
12.40 Soluciones particulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
12.50 El oscilador armónico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306
12.60 Partı́cula en un pozo unidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . 310
12.70 Partı́cula en un aro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314
12.80 Ecuaciones lineales no homogéneas . . . . . . . . . . . . . . . . . . . . . . . . . . 317
12.90 Oscilaciones forzadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 320
12.10 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322
13 Ecuaciones diferenciales de segundo orden. Algunas funciones

13 especiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325
13.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325
13.20 El método de series de potencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326
13.30 El método de Frobenius . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
13.40 La ecuación de Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330
13.50 La ecuación de Hermite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
13.60 La ecuación de Laguerre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337
13.70 Funciones de Bessel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339
13.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342
14 Ecuaciones en derivadas parciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343

14.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343
14.20 Soluciones generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344
14.30 Separación de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
14.40 Partı́cula en un pozo rectangular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347
14.50 Partı́cula en un pozo circular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350
14.60 El átomo de hidrógeno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353
14.70 La cuerda vibrante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362
14.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 366
15 Desarrollos ortogonales. Análisis de Fourier . . . . . . . . . . . . . . . . . . . . . 369

15.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369
15.20 Desarrollos ortogonales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 370
15.30 Dos desarrollos en polinomios de Legendre . . . . . . . . . . . . . . . . . . . 374
15.40 Series de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 378
15.50 La cuerda vibrante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385
15.60 Transformada de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 386
15.70 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393
Índice de contenidos XI
16 Vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397
16.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397
16.20 Álgebra vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398
16.30 Componentes de los vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401
16.40 Derivada escalar de un vector . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405
16.50 Producto escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407
16.60 Producto vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
16.70 Campos escalares y vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
16.80 Gradiente de un campo escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
16.90 Divergencia y rotacional de un campo vectorial . . . . . . . . . . . . . . . . 418
16.10 Espacios vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419
16.11 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420
17 Determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425
17.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425
17.20 Determinantes de orden 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427
17.30 Caso general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431
17.40 Resolución de ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
17.50 Propiedades de los determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 438
17.60 Reducción a forma triangular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
17.70 Funciones alternadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
17.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445
18 Matrices y transformaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449

18.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449
18.20 Algunas matrices especiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452
18.30 Álgebra matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454
18.40 Matriz inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462
18.50 Transformaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464
18.60 Matrices ortogonales y transformaciones ortogonales . . . . . . . . . . . 469
18.70 Operaciones de simetrı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 471
18.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 476
19 El problema de autovalores matriciales . . . . . . . . . . . . . . . . . . . . . . . . . . 481

19.10 Sistemas de ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 481
19.20 El problema de autovalores matriciales . . . . . . . . . . . . . . . . . . . . . . . 483
19.30 Diagonalización de matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 490
19.40 Formas cuadráticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 493
19.50 Matrices complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 497
19.60 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 500
XII Índice de contenidos
20 Métodos numéricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503

20.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503
20.20 Errores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503
20.30 Resolución de ecuaciones ordinarias . . . . . . . . . . . . . . . . . . . . . . . . . . 507
20.40 Interpolación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 511
20.50 Integración numérica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 518
20.60 Métodos de álgebra lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 525
20.70 Eliminación gaussiana para la resolución de ecuaciones lineales . 525
20.80 Método de eliminación de Gauss–Jordan para la inversa de una
20.80 matriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 528
20.90 Ecuaciones diferenciales de primer orden . . . . . . . . . . . . . . . . . . . . . 530
20.10 Sistemas de ecuaciones diferenciales . . . . . . . . . . . . . . . . . . . . . . . . . 534
20.11 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 536
21 Probabilidad y estadı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 541

21.10 Estadı́stica descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 542
21.20 Frecuencia y probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 548
21.30 Probabilidades combinadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 549
21.40 Distribución binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 551
21.50 Permutaciones y combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553
21.60 Distribuciones continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 558
21.70 Distribución gaussiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 560
21.80 Más de una variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 563
21.90 Mı́nimos cuadrados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 564
21.10 Estadı́stica muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 569
21.11 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 570
Apéndice. Integrales estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 573
Soluciones de los ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 577

Números, variables y álgebra
1.1. Conceptos
La Quı́mica, en común con las otras ciencias fı́sicas y otras ciencias aplicadas, com-
prende:
(i) experimentos: la observación de fenómenos fı́sicos y la medición de cantidades

fı́sicas, y
(ii) teorı́a: la interpretación de los resultados de los experimentos, la correlación de
un conjunto de medidas con otros conjuntos de medidas, el descubrimiento y la
aplicación de reglas para racionalizar e interpretar esas correlaciones.
Ambos, experimentos y teorı́a, suponen la manipulación de números y de los sı́mbolos

empleados para representar los números y las cantidades fı́sicas.
EJEMPLO 1.1 La ecuación de estado de un gas ideal es

pV = nRT (1.1)
donde p es la presión del gas, V su volumen, T la temperatura, n la cantidad de materia, y R = 8,31451 J K−1
mol−1 es la constante de los gases. Supongamos que tenemos un décimo de mol de gas, n = 0,1 mol, a
temperatura T = 298 K y presión p = 105 Pa. La ecuación (1.1) nos permite calcular el volumen del gas:
nRT 0,1 mol × 8,31451 J K−1 mol−1 × 298 K

V= =
p 105 Pa
0,1 × 8,31451 × 298 mol J K−1 mol−1 K
= 5
×
10 Pa
= 2,478 × 10−3 m3 .
Este ejemplo ilustra un cierto número de conceptos:

(i) Dado cualquier conjunto particular de valores de la presión p, la temperatura T y
cantidad de materia n, la ecuación nos permite calcular el correspondiente volumen V.
El valor de V queda, por lo tanto, determinado por los valores de p, T y n. Decimos que
V es una función de p, T y n.
2 Capı́tulo 1. Números, variables y álgebra
Este enunciado se representa normalmente como1
V = f (p, T, n)
y significa que, conocidos los valores de p, T y n, el valor de V viene dado por el valor
de una función f (p, T, n) que, en el presente caso, es f (p, T, n) = nRT/p.
Una forma ligeramente diferente, utilizada a menudo en ciencias, es
V = V(p, T, n),
y significa que V es alguna función de p, T y n, que puede ser conocida o no. Trataremos
las funciones en el Capı́tulo 2.
(ii) La función contiene dos tipos de cantidades.
Constantes: una cantidad cuyo valor es fijo para el caso que se está tratando. La canti-
dad R = 8,31451 J K−1 mol−1 es una cantidad fı́sica constante. Un número constante es
cualquier número especı́fico, por ejemplo, a = 0,1 o π = 3,14159 . . .
Variables: una cantidad que puede tomar cualquier valor dentro de un conjunto de
valores permitidos. Las cantidades p, T y n son las variables de la función f (p, T, n) =
nRT/p.
Podemos distinguir dos tipos de variables. Una variable independiente es una cuyo
valor no depende del valor de ninguna otra variable. Escribir la ecuación (1.1) en la
forma V = nRT/p supone que las variables independientes son p, T y n. La cantidad
V es entonces una variable dependiente porque su valor depende de los valores de las
variables independientes. Podrı́amos haber escogido T como variable dependiente y p, V
y n como variables independientes, es decir: T = pV/nR. En la práctica, la elección de
las variables independientes es por conveniencia matemática, pero puede también estar
determinada por las condiciones de un experimento. En algunos casos es más fácil medir
la presión p, la temperatura T y la cantidad de materia n, y calcular V a partir de ellas.
Tratamos los números en los Apartados 1.2 y 1.3, y las variables en el Apartado 1.5.
El álgebra de los números (aritmética) lo tratamos en el Apartado 1.6.
(iii) Una cantidad fı́sica es siempre el producto de dos cantidades, un número y una
unidad. Por ejemplo, T = 298,15 K o R = 8,31451 J K−1 mol−1 . En aplicaciones de
matemáticas en ciencias, los números por sı́ mismos no tienen sentido salvo que se es-
pecifiquen las unidades de las cantidades fı́sicas. Es importante saber cuáles son esas
unidades, pero las matemáticas no dependen de ellas.
01. El signo para la igualdad fue introducido por Robert Recorde (hacia 1510-1558) en su The whets-
tone of witte (La piedra de afilar el ingenio, Londres 1557).‘Voy a fijar, como suelo hacer en mis trabajos,
un par de lı́neas paralelas o gemelas de misma longitud, ası́: ==, porque no hay dos cosas que puedan ser
más iguales.’
1.2. Números reales 3
Las unidades obedecen las leyes ordinarias del álgebra y pueden manipularse co-
mo números. Por ejemplo, en el cálculo del volumen presentado en el Ejemplo 1.1, las
cantidades fı́sicas estaban dadas en unidades SI: mol para cantidad de materia, K para
temperatura, Pa para presión y J para energı́a (o trabajo). Los números y las unidades se
separan en el cálculo, dando la expresión para las unidades
mol J K−1 mol−1 K J

=
Pa Pa
(recordando que x−1 = 1/x). Ahora bien
trabajo = fuerza × distancia
de manera que la unidad (SI) de trabajo es J = N m, donde el newton N es la unidad SI

de fuerza y m es la unidad de longitud. Además,
presión = fuerza/área
de manera que la unidad (SI) de presión es Pa = N m−2 . Se deduce que
J Nm
= = m3 ,
Pa N m−2
que es la unidad SI de volumen.
Tratamos las unidades con más detalle en el Apartado 1.7.
1.2. Números reales
El concepto de número, y de contar, se aprende muy pronto en la vida, y casi todas

las mediciones en el mundo fı́sico implican de un modo u otro números y cuentas. Los
números más sencillos son los números naturales, números cardinales o números en-
teros sin signo: 1, 2, 3. . . Se comprueba fácilmente que la suma o la multiplicación de
dos números naturales siempre da un número natural, mientras que la resta y la división
no necesariamente. Por ejemplo: 5 − 3 = 2, pero 5 − 6 no es un número natural. Un
conjunto de números para el que la resta siempre es válida es el conjunto de los enteros,
que consiste en todos los números cardinales positivos y negativos más el cero:
· · · − 3, −2, −1, 0, +1, +2, +3, · · ·
Las operaciones de suma y resta de enteros tanto positivos como negativos son posibles
gracias a las reglas
m + (– n) = m − n
m − (– n) = m + n (1.2)
de manera que, por ejemplo, la resta de un número negativo es equivalente a la suma del
correspondiente número positivo. La operación de multiplicación es posible gracias a las
reglas
(– m) × (– n) = + (m × n)
(– m) × (+ n) = – (m × n) . (1.3)
EJEMPLOS 1.2 Suma y resta de números negativos

2 + (– 3) = 2 − 3 = −1 , 2 − (– 3) = 2 + 3 = 5 ,
(– 2) × (– 3) = 2 × 3 = 6 , (2) × (– 3) = −2 × 3 = −6 .
En las ecuaciones (1.2) y (1.3) las letras m y n son sı́mbolos empleados para representar
cualquier par de enteros. Son variables enteras, cuyos valores pertenecen al conjunto
(infinito) de los enteros.
La división de un entero por otro no da siempre un entero. Por ejemplo 6 ÷ 3 = 2,
pero 6 ÷ 4 no es un entero. Un conjunto de números para el que la división siempre es
válida es el conjunto de los número racionales, que consiste en todos los números m/n
donde m y n son enteros. La expresión m/n se lee ‘m partido por n’ y es la notación más
común para ‘m dividido por n’. La definición excluye el caso n = 0 porque la división
por cero no está definida (véase el Apartado 1.6), pero incluye el caso de los enteros
puesto que un entero m puede escribirse como m/1. Las reglas para la combinación de
números racionales (y, en general, de fracciones) son
m p mq + np
+ = (1.4)
n q nq
m p mp
× = (1.5)
n q nq
m p m q mq
÷ = × = (1.6)
n q n p np
donde, por ejemplo, mq significa m × q.
EJEMPLOS 1.3 Suma de fracciones

1 1
1. Sume y .
2 4
El número un medio es igual a dos cuartos y puede ser sumado a un cuarto para dar tres cuartos:
1 1 2 1 3
+ = + = .
2 4 4 4 4
El valor de una fracción como 1/2 no cambia si el numerador y el denominador son ambos multipli-
cados por el mismo número:
1 1×2 2
= =
2 2×2 4
y el método general de sumar fracciones es: (a) hallar un denominador común para las fracciones
por sumar, (b) expresar todas las fracciones en términos de ese denominador común, (c) sumar.
1.2. Números reales 5
2 4
2. Sume y .
3 5
Un denominador común es 3 × 5 = 15. Por lo tanto
2 4 2×5 3×4 10 12 22
+ = + = + = .
3 5 3×5 3×5 15 15 15
1 5
3. Sume y .
4 6
Un denominador común es 4 × 6 = 24, pero el mı́nimo (menor) denominador común es 12:
1 5 3 10 13
+ = + = .
4 6 12 12 12
EJEMPLO 1.4 Multiplicación de fracciones
2 4 2×4 8
× = = .
3 5 3×5 15
Podemos interpretarlo como tomar dos tercios de 4/5 (o cuatro quintos de 2/3).
EJEMPLO 1.5 División de fracciones
2 4 2 5 10
÷ = × = .
3 5 3 4 12
El número 10/12 puede simplificarse ‘dividiendo arriba y abajo’ por el factor común 2: 10/12 = 5/6.
Todo número racional es la solución de una ecuación lineal
mx = n (1.7)
donde m y n son enteros. La solución de la ecuación (1.7) es x = n/m. Sin embargo, no

todos los números son racionales. Por ejemplo, una solución de la ecuación cuadrática
x2 = 2
√ √
es x = 2, la raı́z cuadrada positiva de 2 (la otra solución es − 2), y este número no
puede escribirse como un número racional 4m/n. Se dice que es un número irracional.
Otros números irracionales se obtienen como soluciones de la ecuación cuadrática más
general
mx2 + nx + p = 0 ,
donde m, n y p son enteros arbitrarios, ası́ como de otras ecuaciones algebraicas de

órdenes superiores. Por ejemplo, una solución de la ecuación cúbica
x3 = 2
√
3
√ √
3
es la raı́z cúbica de 2, 2. Los números irracionales como 2y 2 se llaman sordos.
Los números racionales e irracionales que se obtienen como soluciones de ecuacio-

nes algebraicas del tipo
a 0 + a 1 x + a 2 x 2 + a 3 x 3 + . . . + an x n = 0 , (1.8)
donde a0 , a1 , . . . an son enteros, se llaman números algebraicos. Estos números pueden

expresarse de manera exacta mediante un número finito de números racionales y sordos.
Existen otros tipos de números que no son algebraicos; no se obtienen como solucio-
nes de ninguna ecuación algebraica. Esos números son números irracionales llamados
números trascendentes: ‘trascienden el poder de los métodos algebraicos’ (Euler).2 Los
más conocidos y más importantes de ellos son el número de Euler e y el número arqui-
mediano π.3 Los tratamos en el Apartado 1.3.
Los números racionales y los irracionales forman el continuo de números. Todos
juntos son llamados los números reales.
1.3. Representación decimal de los números
Éstos son los nueve caracteres de los Indios
9 8 7 6 5 4 3 2 1
con estos mismos nueve caracteres y con este signo 0, que llaman los
árabes sefir, se escribe cualquier número, como se demostrará más
abajo.
(Fibonacci)4
02. Leonhard Euler (1707-1783). Nacido en Suiza, trabajó la mayor parte de su vida en San Peters-
burgo y en Berlı́n. Fue uno de los matemáticos más prolı́ficos del mundo, escribió ‘voluminosos trabajos
y gigantescos libros de texto’. Contribuyó a casi todas las ramas de las matemáticas y a sus aplicacio-
nes a problemas fı́sicos, incluyendo cálculo, ecuaciones diferenciales, series infinitas, funciones complejas,
mecánica e hidrodinámica, y su nombre se asocia con muchos teoremas y fórmulas. Una de sus contribu-
ciones importantes, si bien no espectacular, fue la notación matemática. Introdujo el sı́mbolo e, dio a las
funciones trigonométricas su definición moderna, y por su uso de los sı́mbolos sen, cos, i y π, los hizo ser
universalmente aceptados.
03. El sı́mbolo π fue empleado por vez primera por William Jones (1675-1749) en un libro de texto
sobre matemáticas, Synopsis palmariorum mathesos (Una nueva introducción a las matemáticas) en 1706.
El que Euler adoptara el sı́mbolo determinó su aceptación.
04. Leonardo de Pisa, llamado Fibonacci (hacia 1170 - después de 1240). El matemático sobresaliente
del medioevo en occidente. En sus viajes a Egipto, Siria, Grecia y Sicilia, Fibonacci estudió los textos
matemáticos griegos y arábigos, y se familiarizó con el sistema posicional arábigo desarrollado por los
matemáticos indios del valle del Indo, en el noroeste de la India. El primer libro de Fibonacci, el Liber
abaci o Libro de los ábacos (1202, revisado en 1228), circuló ampliamente en forma de manuscrito pero
fue únicamente publicado en 1857 en Scritti di Leonardo Pisano. El primer capı́tulo empieza con la cita
que aparece más arriba en el texto.
1.3. Representación decimal de los números 7
En el sistema decimal de números, los diez dı́gitos 0 a 9 (numerales indo-arábigos)5 se

utilizan para el cero y los primeros nueve enteros positivos. El décimo entero positivo
se representa por 10. Un entero mayor, como ‘trescientos setenta y dos’ se expresa en la
forma
300 + 70 + 2 = 3 × 102 + 7 × 10 + 2
y se denota con el sı́mbolo 372, en el cual el valor de cada dı́gito depende de su posición
dentro del sı́mbolo del número. El sistema decimal tiene base 10, y es el único sistema
en uso general.
Aunque los números racionales pueden siempre expresarse exactamente como co-
cientes de enteros, esto no ocurre con los números irracionales. Para efectuar los cálcu-
los, todo número que no es entero se expresa convenientemente como una fracción
decimal,6 por ejemplo: 5/4 = 1,25 . La forma general de una fracción decimal consiste
en un entero a la izquierda de la coma decimal, la parte entera del número, y uno o más
dı́gitos a la derecha de la coma decimal, la parte decimal o fraccionaria del número. El
valor de cada dı́gito viene determinado por su posición. Por ejemplo
5 6 7
234,567 = 200 + 30 + 4 + + +
10 100 1000
= 2 × 102 + 3 × 101 + 4 × 100 + 5 × 10−1 + 6 × 10−2 + 7 × 10−3 ,
donde 100 = 1 (véase el Apartado 1.6).

Un número con un número finito de dı́gitos tras (a la derecha de) la coma decimal
puede escribirse siempre en forma racional m/n. Por ejemplo 1,234 = 1234/1000. Sin
embargo, lo contrario no siempre es cierto. El número 1/3 no puede expresarse exacta-
mente como una fracción decimal finita:
1
= 0,3333 . . .
3
05. Una de las principales fuentes que introdujeron el sistema posicional indo-arábigo en la Europa
occidental fue la Aritmética de Al-Khwarizmi. Muhammad ibn Musa Al-Khwarizmi (Mohammed hijo de
Moisés de Khorezm, la moderna Khiva en Uzbekistán) ejerció en los tiempos del califa de Bagdad Al-
Mamún (813-833), y fue probablemente un miembro de su “Casa de la sabidurı́a” (Academia) en la época
en que Bagdad era la mayor ciudad del mundo. El Álgebra de Al-Khwarizmi fue utilizado ampliamente en
árabe y en su traducción latina como fuente sobre ecuaciones lineales y cuadráticas. La palabra algoritmo
proviene del nombre del autor y la palabra álgebra proviene del tı́tulo, Liber algebrae et almucabala, que
puso Robert de Chester en la traducción latina (hacia 1140) del trabajo sobre las ecuaciones.
06. El uso de fracciones decimales fue introducido en las matemáticas europeas por el matemático e
ingeniero flamenco Simon Stevin (1548-1620) en su De Thiende (El arte de las décimas) en 1585. Aunque
las fracciones decimales ya eran usadas por los chinos desde varios siglos antes, y el astrónomo persa Al-
Kashi utilizó fracciones decimales y sexagesimales en su Llave de la Aritmética a principios del siglo XV, el
uso generalizado de las fracciones decimales en las matemáticas europeas se remonta directamente a Stevin,
especialmente después que John Napier modificase la notación y diese la actual con el punto decimal (o
la coma, como se usa en gran parte de la Europa continental). Esto simplifica mucho las operaciones de
multiplicación y división.
los puntos suspensivos indican que la fracción debe extenderse de manera indefinida.
Redondeado a cuatro cifras decimales, el número tiene por cotas inferior y superior
0,3333 y 0,3334:
1
0,3333 < < 0,3334,
3
donde el sı́mbolo < significa ‘menor que’. Otros sı́mbolos del mismo tipo son > para
‘mayor que’ y ≤ para ‘menor o igual que’. Otros ejemplos de fracciones decimales que
no terminan son
1 1
= 0,142857 142857 . . . , = 0,083333 333333 . . .
7 12
En ambos casos se repite indefinidamente una secuencia finita de dı́gitos tras la coma
decimal, ya sea inmediatamente después de la coma decimal, como la secuencia 142857
en 1/7, o después de un número finito de dı́gitos previos, como 3 en 1/12. Ésta es una
propiedad caracterı́stica de los números racionales. √
Un número irracional no puede ser expresado exactamente. El número 2 tiene como
valor aproximado con 16 cifras significativas
√
2 = 1,41421 35623 73095 . . .
y puede ser calculado hasta cualquier precisión deseada por medio de un método numéri-
co como el de Newton-Raphson que tratamos en el Capı́tulo 20. En contraste con el caso
racional, los dı́gitos tras la coma decimal no muestran una secuencia que se repita.
El número arquimediano π
El número π se define como la razón de la circunferencia de un cı́rculo a su diámetro.
Es un número trascendente y no puede ser representado exactamente mediante un núme-
ro finito de dı́gitos.7 Su valor ha sido calculado con muchas cifras significativas. Euler lo
dio con 127 cifras decimales en 1748. Su valor con 16 cifras significativas es
π = 3,14159 26535 89793 . . .
El valor de π ha sido de importancia práctica desde hace miles de años. Por ejemplo, un
manuscrito egipcio de aproximadamente 1650 a.C. (el papiro Rhind del Museo Británico
de Londres) contiene una receta para el cálculo del volumen de un silo cilı́ndrico de la
07. La prueba de la irracionalidad de π fue dada primero en 1761 por el fı́sico y matemático alemán
Johann Heinrich Lambert (1728-1777) que es también conocido por haber introducido las funciones hi-
perbólicas en trigonometrı́a. La prueba de que el número π es trascendente se debe a Carl Louis Ferdinand
von Lindemann (1852-1939), quien lo demostró en 1882 con un método similar al empleado por Hermite
para e.
1.3. Representación decimal de los números 9
cual se deduce el valor aproximado 256/81 ≈ 3,160. Arquı́medes8 usó por primera vez
un método para generar aproximaciones precisas, determinando las cotas
223 22
<π< ,
71 7
y la cota superior tiene un error de sólo 2 partes por mil.
El número e de Euler
El número e se define mediante la ‘serie infinita’ (véase el Capı́tulo 7)
1 1 1 1
e = 1+ + + + + ...
1! 2! 3! 4!
= 2,71828 18284 59045 . . .
la cantidad n! (que se lee ‘n factorial’) se denomina factorial de n, y se define para

enteros positivos como
n! = 1 × 2 × 3 × . . . × n ,
por ejemplo: 3! = 1 × 2 × 3 = 6, 4! = 1 × 2 × 3 × 4 = 24. Además, el factorial de cero

se define como 0! = 1. El valor de e puede calcularse mediante la serie con cualquier
precisión deseada. Hermite9 demostró en 1873 que es un número trascendente.
EJEMPLO 1.6 Demuestre que la suma de los 10 primeros términos de la serie da un valor aproximado
de e que es correcto al menos con 6 cifras significativas.
1 1 1 1 1 1 1 1 1
e = 1+1+ + + + + + + + + + ...
2 6 24 120 720 5040 40320 362880 3628800
≈ 1 + 1 + 0,5 + 0,1666667 + 0,041667 + 0,008333 + 0,001389 + 0,000198

+ 0,000025 + 0,000003 + 0,0000003
≈ 2,71828 .
08. Arquı́medes (287-212 a.C.) nació en Siracusa, en Sicilia. Hizo contribuciones a las matemáticas,
la mecánica y la astronomı́a, y fue un gran inventor de máquinas. Sus principales contribuciones a las ma-
temáticas y a las ciencias matemáticas fueron la invención de métodos para determinar áreas y volúmenes,
que anticiparon el cálculo integral, y el descubrimiento de la primera ley de la hidrostática y de la ley de la
palanca.
09. Charles Hermite (1822-1901). Matemático francés, profesor en la Sorbona, es conocido por sus
trabajos en álgebra y en teorı́a de números. Su trabajo sobre el álgebra de los números complejos (las
‘formas hermı́ticas’) adquirió importancia con la formulación de la teorı́a cuántica. La ecuación diferencial
de Hermite y los polinomios de Hermite son importantes en la resolución de la ecuación de Schrödinger
para el oscilador armónico.
El valor es correcto hasta las seis cifras dadas porque cada término adicional de la serie es por lo menos
diez veces menor que el anterior.
Cifras significativas y redondeo

En la práctica, la aritmética que trata sólo con enteros da resultados exactos (salvo que
los números sean demasiado grandes para ser escritos). Más generalmente, un número
en el sistema decimal se aproxima ya sea con un número dado de decimales, o con
un número dado de cifras significativas, y el resultado de una operación aritmética es
también aproximado. En la representación en coma fija, todos los números se dan con
un número fijo de decimales. Por ejemplo,
3,142 , 62,358 , 0,013 , 1,000 .
tienen todos 3 cifras decimales. En la representación en coma flotante, utilizada más ge-
neralmente en ciencias, los números se dan con un número fijo de ‘cifras significativas’,
donde los ceros a la izquierda no cuentan. Por ejemplo,
3210 = 0,3210 × 104 , 003,210 = 0,3210 × 101 , 0,003210 = 0,3210 × 10−2 ,
tienen todos 4 cifras significativas.

Un número cuya representación (decimal) exacta necesita más del número dado de
dı́gitos se reduce de manera sencilla por truncación, esto es, suprimiendo o sustituyendo
por ceros los dı́gitos superfluos a la derecha. Por ejemplo, con 4 cifras decimales, o 5
cifras significativas, 3,14159 se trunca a 3,1415. Truncar no es recomendable porque
puede conducir a serios errores de cálculo. Una aproximación más sensata (precisa) de
π con cinco cifras es 3,1416, y se obtiene por redondeo. Las reglas más comúnmente
aceptadas para redondear son:
(i) Si el primer dı́gito desechado es mayor o igual a 5, el dı́gito anterior se incrementa

en 1. El número es redondeado al alza.
(ii) Si el primer dı́gito desechado es menor que 5, el dı́gito anterior se deja como está.
El número es redondeado a la baja. Por ejemplo, para 4, 3, 2 y 1 cifras decimales,
7,36284 es 7,3628 , 7,363 , 7,36 , 7,4 .
1.4. Números complejos

Las soluciones de ecuaciones algebraicas no son siempre números reales. Por ejem-
plo, las soluciones de la ecuación
x2 = −1
1.5. Variables 11
no son ninguno de los números descritos en el Apartado 1.2. Se incorporan al sistema

de números definiendo la raı́z cuadrada de −1 como un nuevo número que se representa
generalmente por el sı́mbolo i (algunas veces j) con la propiedad
i2 = −1 .
Las dos raı́ces cuadradas de un número real negativo arbitrario −x2 son entonces ix y
−ix. Por ejemplo,
√ √ √
−16 = 16 × −1 = ±4i .
Estos números se llaman imaginarios para distinguirlos de los números reales. Más
generalmente, el número
z = x + iy,
donde x e y son reales, se llama un número complejo. Tratamos los números complejos
en el Capı́tulo 8.
1.5. Variables
En los apartados previos hemos usado sı́mbolos (letras) para representar números
arbitrarios. Una cantidad que puede tomar cualquier valor escogido dentro de un con-
junto de valores se llama una variable. Si {x1 , x2 , x3 , . . . , xn } es un conjunto de objetos,
no necesariamente números, entonces podemos definir mediante ese conjunto una va-
riable x que tenga como valor cualquiera de los miembros del conjunto. El conjunto es
el dominio de la variable. En teorı́a de números (reales), los objetos del conjunto son
números reales, y una variable real puede tener como dominio o bien todo el continuo
de los números reales o bien un subconjunto de éste. Si el dominio de la variable x es un
intervalo desde a hasta b,
a ≤ x ≤ b,
entonces x es una variable continua en el intervalo y puede tomar cualquier valor en el

intervalo continuo de valores desde a hasta b (incluidos a y b). Si el dominio consiste
en un conjunto discreto de valores, por ejemplo los n números x1 , x2 , x3 , . . . , xn , se dice
entonces que x es una variable discreta. Si el dominio consiste en enteros, x es una
variable entera. Si el conjunto consiste en un único valor, entonces se dice que es una
variable constante, o sencillamente una constante.
En las ciencias fı́sicas se usan variables para representar números y cantidades fı́sicas
por igual. En el ejemplo del gas ideal comentado en el Apartado 1.1, p, V, n y T son
variables continuas cuyos valores numéricos pueden en principio ser cualquier número
real positivo. Las variables discretas aparecen normalmente cuando los objetos son con-
tados por oposición a medidos. Tı́picamente, se emplea una variable discreta para contar
y los objetos contados son una muestra de algún conjunto discreto. Sin embargo, a veces
una cantidad fı́sica puede tener valores que en algunos casos pertenecen a un conjunto
discreto y en otros a un conjunto continuo. Es el caso de los niveles de energı́a y de las
frecuencias espectrales observadas en un átomo o en una molécula.
EJEMPLO 1.7 El espectro del átomo de hidrógeno

Los niveles de energı́a del átomo de hidrógeno son de dos tipos:
(i) Niveles de energı́a discretos (cuantizados) con energı́as (negativas) dadas por la fórmula (en unidades
atómicas, véase el Apartado 1.7)
1
En = − , n = 1, 2, 3 . . .
2n2
Los estados correspondientes del átomo son los estados ligados, en los cuales el movimiento del electrón
está confinado a las proximidades del núcleo. Las transiciones entre niveles de energı́a dan lugar a lı́neas
discretas en el espectro del átomo.
(ii) Niveles de energı́a continuos, con todas las energı́as positivas, E ≥ 0. Los correspondientes estados del
átomo son los de un electrón que se mueve en presencia del campo electrostático de la carga nuclear. Las
transiciones entre esos niveles de energı́a y los de los estados ligados dan lugar a intervalos continuos de
frecuencias espectrales.
La importancia del concepto de variable se debe a que las variables se pueden utilizar
para hacer afirmaciones sobre propiedades de conjuntos completos de números (u otros
objetos) y a que permiten la formulación de un conjunto de reglas para manipular núme-
ros. El conjunto de reglas se llama el álgebra.
1.6. El álgebra de los números reales

Sean a, b y c variables reales cuyos valores pueden ser cualquier número real. Las re-
glas básicas para combinar dos números reales, el álgebra de números reales o aritmética,
son
1. a+b=b+a (ley conmutativa de la suma)
2. ab = ba (ley conmutativa de la multiplicación)
3. a + (b + c) = (a + b) + c (ley asociativa de la suma)
4. a(bc) = (ab)c (ley asociativa de la multiplicación)
5. a(b + c) = ab + ac (ley distributiva)
Las operaciones de suma y multiplicación, y sus inversas, resta y división, se llaman

operaciones aritméticas. Los sı́mbolos +,−, × y ÷ (o bien /) se llaman operadores
aritméticos. El resultado de multiplicar dos números, ab = a × b, se llama producto.
1.6. El álgebra de los números reales 13
EJEMPLOS 1.8 Leyes de la aritmética (a = 2, b = 3, c = 4)

(1) 2 + 3 = 3 + 2 = 5 ,
(2) 2 × 3 = 3 × 2 = 6 ,
(3) 2 + (3 + 4) = 2 + 7 = 9 , y
(2 + 3) + 4 = 5 + 4 = 9 ,
(4) 2 × (3 × 4) = 2 × 12 = 24 , y
(2 × 3) × 4 = 6 × 4 = 24 ,
(5) 2 × (3 + 4) = 2 × 7 = 14 , y
2 × (3 + 4) = (2 × 3) + (2 × 4) = 6 + 8 = 14 .
Estos ejemplos muestran el convenio de que las expresiones algebraicas (o aritméticas)

entre paréntesis deben ser evaluadas primero.
Tres reglas definen las propiedades del cero y de la unidad:
6. a + 0 = 0 + a = a (suma de cero)
7. a × 0 = 0 × a = 0 (multiplicación por cero)
8. a × 1 = 1 × a = a (multiplicación por la unidad)
Ya hemos visto que la resta de un número es lo mismo que la suma de su opuesto, y

que la división por un número es lo mismo que multiplicar por su inverso. Sin embargo,
la división por cero no está definida: no hay ningún número cuyo inverso sea cero. El
número 1/a para valores de a positivos, por ejemplo, se hace arbitrariamente grande
cuando el valor de a se acerca a cero. Decimos que 1/a tiende a infinito cuando a
tiende a cero:
1
→ ∞ cuando a → 0.
a
Aunque representamos ‘infinito’ por el sı́mbolo ∞, no es un número. Si lo fuera, por las
leyes del álgebra las ecuaciones 1/0 = ∞ y 2/0 = ∞ implicarı́an 1 = 2 .
2
El valor
√ absoluto de un número real a se define como la raı́z cuadrada positiva de a ,
|a| = + a . Es la ‘magnitud’ del número, igual a a si a es positivo, e igual a −a si a es
2
negativo:
|a| = +a si a > 0 ,
|a| = −a si a < 0 .
Por ejemplo, |3| = 3 y | − 3| = 3.
La ley de los exponentes

Los números se escriben a menudo en la forma am , donde a se llama la base y m el
exponente. Por ejemplo, 100 = 102 , ó 16 = 24 . Cuando el exponente m es un entero
positivo, el número am se define como la m-ésima potencia de a y, para números reales,

a puede ser cualquier número tanto positivo como negativo. Por ejemplo,
a3 = a × a × a, (– a)3 = (– a) × (– a) × (– a) = (– 1)3 × a3 = −a3 .
También se pueden definir números con exponentes negativos o no enteros, y la regla

básica para la combinación de tales números es
9. am an = am+n (ley de los exponentes)
Por ejemplo
a2 a3 = (a × a) × (a × a × a) = a × a × a × a × a = a5 .
Otras reglas suplementarias son
10. am /an = am−n 11. (am )n = (an )m = am×n 12. (ab)m = am bm
Las reglas 9 y 10 definen un número con un exponente negativo. Ası́, si sustituimos n

por −n, la regla 9 nos da am a−n = am−n y comparándolo con la regla 10 nos muestra que
1
a−n = .
an
Por ejemplo, 25 × 2−2 = 25−2 = 23 por la regla 9, y 25 /22 = 25−2 = 23 por la regla 10, de
manera que 2−2 = 1/22 = 1/4. Además, tomar m = n en la regla 10 nos da
am /am = am−m = a0 = 1
y cualquier número elevado a la potencia cero es igual a la unidad.

La regla 11 es inmediata si m y n son enteros. Por ejemplo,
(23 )2 = 23 × 23 = 26 = 23×2 , (22 )3 = 22 × 22 × 22 = 26 = 22×3 .
Para exponentes fraccionarios, consideramos
21/2 × 21/2 = 21 = 2 .
√
De donde se deduce que 21/2 = 2, la raı́z cuadrada de 2. En general, a1/m es la raı́z
m-ésima de a,
√
a1/m = m
a.
Por ejemplo, 21/3 es la raı́z cúbica de 2 porque (21/3 )3 = 21 = 2. Vemos que para un
exponente no entero,
√ am puede ser complejo si a es negativo. Por ejemplo, (– 2)1/2 =
(– 1)1/2 × 21/2 = i 2 es complejo (véanse el Apartado 1.4 y el Capı́tulo 8).
1.7. Unidades 15
Para un exponente cualquiera racional, consideramos usando la regla 11
43/2 = (41/2 )3 = 8 .
El exponente racional m/n puede considerarse como el producto del entero m y de la

fracción 1/n, y el número resultante puede escribirse ya sea como la raı́z n-ésima de la
m-ésima potencia o como la m-ésima potencia de la raı́z n-ésima:
am/n = (am )1/n = (a1/n )m ,
o, de forma equivalente,
√ √
am/n = n
am = ( a)m .
n
Aunque hemos demostrado las reglas de los exponentes únicamente para exponentes en-
teros y racionales, se aplican también a los números con exponentes irracionales y, si se
permiten números complejos, a todo número escrito en la forma base/exponente. Cuando
m es una variable, am se llama función exponencial (véase el Apartado 3.5 para expo-
nentes reales y el Capı́tulo 8 para exponentes complejos). Si x = am , m es el logaritmo
en base a de x (véase el Apartado 3.6).
Hemos tratado en detalle la ley de los exponentes porque es una fuente común de
errores en las manipulaciones algebraicas.
EJEMPLOS 1.9 La ley de los exponentes

regla ejemplo
a a =a
m n m+n
23 × 22 = 23+2 = 25
23/4 × 2−1/4 = 23/4−1/4 = 21/2
am /an = am−n 23/4 /21/4 = 23/4−1/4 = 21/2
24 /2−2 = 24−(−2) = 24+2 = 26
(am )n = (an )m = amn (23 )1/3 = (21/3 )3 = 21 = 2
√ √ √ √
(2 2
)2
=2 2× 2
= 22 = 4
(ab)m = am bm (2 × 3)2 = 22 × 32
(– 8)1/3 = (– 1)1/3 × 81/3 = −2
EJEMPLO 1.10 Un ejemplo de lo que no hay que hacer

De la regla de los exponentes se deduce que
√
ab = (ab)1/2 = a1/2 b1/2 .
√ √ √
Por ejemplo, 36 = 4 9 = 2 × 3 = 6.
Pero √ √ √
a + b = a + b
donde = significa ‘no es igual a’. Por ejemplo,
√ √ √ √ √
9 + 16 = 25 = 5 y 9 + 16 = 9 + 16 = 3 + 4 = 7 .
Este es un error sorprendentemente frecuente.
1.7. Unidades
Una cantidad fı́sica tiene dos atributos esenciales, magnitud y dimensiones. Por
ejemplo, la cantidad ‘2 metros’ tiene dimensiones de longitud y tiene magnitud igual a
dos veces la del metro. El metro es una cantidad fı́sica constante que define las dimensio-
nes de la cantidad y proporciona una escala para especificar la magnitud de una longitud
arbitraria; es una unidad de longitud. En general, una cantidad fı́sica es el producto de
un número y de una unidad. Toda cantidad fı́sica puede expresarse en términos de sie-
te cantidades ‘fundamentales’ cuyos nombres y sı́mbolos aparecen en las dos primeras
columnas de la Tabla 1.1.
Tabla 1.1 Cantidades fı́sicas fundamentales y unidades SI
Cantidad Sı́mbolo para Nombre de Sı́mbolo de

fı́sica la cantidad la unidad SI la unidad SI
longitud l metro m
masa m kilogramo kg
tiempo t segundo s
corriente eléctrica I amperio A
temperatura T kelvin K
cantidad de materia n mol mol
intensidad lumı́nica Iν candela cd
Los sı́mbolos en la segunda columna definen las dimensiones de las cantidades fı́sicas
fundamentales, y las dimensiones de todas las demás cantidades pueden expresarse en
función de ellas. Por ejemplo, la velocidad es la distancia recorrida por unidad de tiempo
y tiene dimensiones de longitud dividida por tiempo, lt−1 . Las dimensiones de una can-
tidad fı́sica son independientes del sistema de unidades utilizado para describir su valor.
Todo sistema de unidades debe, sin embargo, ajustarse a las dimensiones. Por ejemplo,
en un sistema de unidades en el cual la unidad de longitud es el metro, m, y la unidad
de tiempo es el segundo, s, la unidad de velocidad es metro por segundo, ms−1 . Algunas
cantidades fı́sicas no tienen dimensiones. Ese es el caso de una cantidad que es el cocien-
te de dos otras con las mismas dimensiones. Ejemplos de esto son la densidad relativa, la
masa molar relativa y la fracción molar. Un ejemplo menos evidente es el ángulo (plano)
que se define en términos del cociente entre dos longitudes (véase el Apartado 3.1).
Vimos en el Apartado 1.1 que las unidades obedecen las leyes del álgebra ordinaria.
Una de las lecciones del ejemplo es que las dimensiones, y por lo tanto las unidades, a
ambos lados de una ecuación tienen que coincidir.
EJEMPLO 1.11 Para la ecuación de los gases ideales, pV = nRT, las dimensiones de pV (utilizando las
Tablas 1.1 y 1.2) son las de trabajo (o energı́a)
(ml−1 t−2 ) × l3 = ml2 t−2 .
La correspondiente expresión en términos de unidades SI es Pa m3 = J. En el segundo miembro de (1.1),
para nRT,
(mol)(JK−1 mol−1 )(K) = J
como es necesario.
1.7. Unidades 17
Se utiliza toda una variedad de sistemas de unidades, muchos adaptados a las necesida-
des de las disciplinas particulares de las ciencias fı́sicas. El sistema recomendado para
las ciencias fı́sicas, y para la quı́mica en particular, es el Sistema Internacional de Unida-
des (SI) que se basa en las siete unidades de base cuyos nombres y sı́mbolos se reseñan
en la Tabla 1.1. Toda cantidad fı́sica tiene una unidad SI determinada por sus dimensio-
nes. La unidad SI de velocidad es el metro por segundo, ms−1 . Además de las unidades
fundamentales, un cierto número de cantidades que son particularmente importantes en
las ciencias fı́sicas tienen asignados nombres y sı́mbolos SI. Algunos de estos aparecen
en la Tabla 1.2.
Tabla 1.2 Unidades SI derivadas con nombres especı́ficos y sı́mbolos
Cantidad fı́sica Nombre Sı́mbolo Descripción
frecuencia hercio Hz eventos por unidad de tiempo s−1

fuerza newton N masa × aceleración kg m s−2
presión pascal Pa fuerza por unidad de área N m−2
energı́a, trabajo, calor julio J fuerza × distancia Nm
potencia vatio W trabajo por unidad de tiempo J s−1
carga eléctrica culombio C corriente × tiempo As
potencial eléctrico voltio V trabajo por unidad de carga J C−1
capacitancia eléctrica faradio F carga por unidad de potencial C V−1
resistencia eléctrica ohmio Ω potencial por unidad de corriente V A−1
conductancia eléctrica siemens S corriente por unidad de potencial Ω−1
flujo magnético weber Wb trabajo por unidad de corriente J A−1
densidad de flujo
magnético tesla T flujo magnético por unidad de área Wb m−2
inductancia henrio H flujo magnético por unidad de
corriente Wb A−1
ángulo plano radián rad ángulo subtendido por la unidad
de arco en el centro del cı́rculo
unidad 1
ángulo sólido estereo- sr ángulo sólido subtendido por la
rradián unidad de superficie en el centro
de la esfera unidad 1
Los múltiplos de diez de las unidades SI tienen nombres formados con los nom-
bres de las unidades y los prefijos reseñados en la Tabla 1.3. Por ejemplo, un pico-
metro es pm = 10−12 m, un decı́metro es dm = 10−1 m. Estas unidades de longitud
se usan frecuentemente en quı́mica: concentraciones en moles por decı́metro cúbico,
mol dm−3 = 103 mol m−3 , y longitudes de enlaces moleculares en picometros.
Cálculos aproximados
A menudo se utilizan las potencias de 10 como una descripción del orden de mag-
nitud. Por ejemplo, si una longitud A es dos órdenes de magnitud mayor que la longitud
B, entonces es unas 102 = 100 veces mayor. En algunos cálculos que involucran una
variedad amplia de órdenes de magnitud puede ser de ayuda, para evitar errores, calcular
el orden de magnitud de la respuesta antes de embarcarse en todo el cálculo detallado.
La manera más sencilla de hacer tal ‘cálculo del orden de magnitud’ es convertir todas
las cantidades fı́sicas a la unidades SI fundamentales y aproximar la magnitud de cada
una por una potencia apropiada de diez, posiblemente multiplicada por un entero. Tales
cálculos son a menudo sorprendentemente exactos.
Tabla 1.3 Prefijos SI
Múltiplo Prefijo Sı́mbolo Múltiplo Prefijo Sı́mbolo
10 deca da 10−1 deci d

102 hecto h 10−2 centi c
103 kilo k 10−3 mili m
106 mega M 10−6 micro µ
109 giga G 10−9 nano n
1012 tera T 10−12 pico p
1015 peta P 10−15 femto f
1018 exa E 10−18 atto a
EJEMPLO 1.12 Para el Ejemplo del Apartado 1.1 (desechando las unidades),
nRT 0,1 × 8,31451 × 298
V= = = 2,478 × 10−3
p 105
dos estimaciones de la respuesta son
10−1 × 10 × 102
1. V≈ = 10−3
105
10−1 × 8 × 300
2. V≈ = 2,4 × 10−3
105
Unidades atómicas
Las ecuaciones del movimiento en mecánica cuántica se complican por la presencia
de las cantidades fı́sicas me , masa en reposo del electrón, e, carga del protón, h, constante
de Planck, y 0 , permitividad del vacı́o. Por ejemplo, la ecuación de Schrödinger para el
movimiento de un electrón alrededor del núcleo estacionario en el átomo de hidrógeno
es
h2 e2
− ∇ 2
ψ − ψ = Eψ . (1.9)
8π 2 me 4π0 r
Las cuatro cantidades determinadas experimentalmente pueden usarse como unidades

fundamentales para construir unidades atómicas para todas aquellas cantidades fı́sicas
que tienen que ver con longitud, masa, tiempo y corriente eléctrica (las cuatro primeras
entradas de la Tabla 1.1). Presentamos algunas de las unidades atómicas en la Tabla
1.8. Ejercicios 19
1.4. Las unidades atómicas de longitud y energı́a tienen nombre: la unidad de longitud,
a0 se llama el bohr, y es la distancia más probable del electrón al núcleo en el estado
fundamental del átomo de hidrógeno (el radio de la órbita del estado fundamental en la
‘vieja teorı́a cuántica’ de Bohr). La unidad de energı́a, Eh , se llama el hartree, y es igual
a dos veces la energı́a de ionización del átomo de hidrógeno. Las unidades atómicas
son de amplio uso en quı́mica cuántica. El convenio es dar cada cantidad fı́sica como
una expresión de las unidades atómicas, y eliminar la unidad de la expresión: para una
distancia r, por ejemplo, la cantidad adimensional r/a0 se sustituye por r. Si hacemos
esto en la ecuación (1.9), la ecuación adimensional resultante es
1 1
− ∇2 ψ − ψ = Eψ . (1.10)
2 r
A menudo se refiere uno a la ecuación en esta forma como la “ecuación de Schrödin-
ger en unidades atómicas”. Los resultados de los cálculos son entonces números que
deben ser reinterpretados como cantidades fı́sicas. Por ejemplo, la cantidad E en la
ecuación (1.9) es una energı́a. La resolución de la ecuación (1.10) nos da los núme-
ros E = −1/2n2 , para todo entero positivo n, y estos números se interpretan entonces
como las energı́as E = (– 1/2n2 )Eh .
Tabla 1.4 Unidades atómicas
Cantidad fı́sica Unidad atómica Valor en unidades SI
masa me 9,10939 × 10−31 kg

carga e 1,60218 × 10−19 C
momento angular = h/2π 1,05457 × 10−34 J s
longitud a0 = 4π0 2 /me e2 5,29177 × 10−11 m
energı́a Eh = me e4 /16π 2 0 2 2 4,35975 × 10−18 J
tiempo /Eh 2,41888 × 10−17 s
corriente eléctrica eEh / 6,62362 × 10−3 A
potencial eléctrico Eh /e 2,72114 × 101 V
momento dipolar eléctrico ea0 8,47836 × 10−30 C m
intensidad de campo eléctrico E Eh /a0 e 5,14220 × 1011 V m−1
polarizabilidad eléctrica α 4πa0 3 1,64857 × 10−41 F m2
momento dipolar magnético e/me 1,85464 × 10−23 J T−1
densidad de flujo magnético /ea0 2 2,35055 × 105 J
magnetizabilidad ξ e2 a0 2 /me 7,89023 × 10−29 J T−2
1.8. Ejercicios
Apartado 1.2
Calcule y exprese cada resultado en su forma más sencilla:
1 1 1 1 3 5
1. + 2. + 3. −
4 8 3 6 4 7

2 5 3 1 3 5
4. − 5. + − 6. − +
9 6 4 8 4 8

1 3 1 1 1 3
7. − + − 8. − − 9. − − −
5 10 4 8 4 8
1 3 3 2 5
10. × 11. 2× 12. ×
2 4 4 3 6

1 3 1 3 1 3
13. × − 14. − × 15. − × −
2 4 4 2 2 4
3 4 2 5 2 4
16. ÷ 17. ÷ 18. ÷
4 5 3 3 15 5

3 4 3 4 3 4
19. ÷ − 20. − ÷ 21. − ÷ −
4 5 4 5 4 5
Apartado 1.3
22. Exprese como fracciones decimales:
10−2 , 2 × 10−3 , 5 × 10−6 , 300 + 2 + 3 × 10−4 .
23. Halle la secuencia de dı́gitos que se repite en la representación con fracciones decimales de
2 1 13 1
, , , .
9 6 3 21
24. Halle cotas superiores e inferiores con 6 cifras significativas exactas para
1 2 1
, , , π, e.
7 9 11
25. Halle los valores de los factoriales 5!, 6!, 7!, 8!, 9!, 10! .
3! 6! 5!
26. Calcule , , .
2! 3! 2!3!
Apartado 1.6
Simplifique cuando sea posible:
27. a2 a3 28. a3 a−3 29. a3 a−4 30. a3 /a2

31. a5 /a−4 32. (a3 )4 33. (a2 )−3 34. (1/a2 )−4
35. a1/2 a1/3 36. (a2 )3/2 37. (a3 b6 )2/3 38. (a2 + b2 )1/2
39. 91/2 40. 82/3 41. (32)3/5 42. (27)−4/3
1.8. Ejercicios 21
Apartado 1.7
Identifique una cantidad fı́sica con cada una de las siguientes dimensiones (columna 2 de la Tabla 1.1) e
indique sus unidades SI:
43. ml−3 44. nl−3 45. lt−2 46. mlt−1

47. mlt−2 48. ml2 t−2 49. ml−1 t−2 50. It
2 −1 −3 −1 −2
51. ml I t 52. mI t
Exprese en unidades fundamentales SI (columna 4 de la Tabla 1.1):
53. dm−3 54. cm ms−2 55. g dm−3 56. mg pm µs−2

57. dg mm−1 ns−2 58. mV cm−1 59. kN dm 60. mmol dm−3
Funciones algebraicas
2.1. Conceptos
Escribir la ecuación de estado (1.1) de los gases ideales en la forma
nRT
V=
p
supone que, para cualquier estado del sistema, el valor del volumen V (la variable depen-
diente) se determina mediante los valores de la presión p, la temperatura T y la cantidad
de materia n (las variables independientes). En general, decimos que una variable de-
pendiente es función de la variable o de las variables de las que depende.1 En el ejemplo
precedente, V es una función de las tres variables p, T y n. En este capı́tulo trataremos
las funciones de una variable únicamente. El caso de más de una variable independiente
lo comentamos en el Capı́tulo 9.
Sea la variable y una función de la variable x. Por ejemplo, la ecuación
y = 2x2 − 3x + 1 (2.1)
nos da y como una función particular de x. Para cada valor de x el valor de y viene dado
por el segundo miembro de la ecuación. Esta expresión define una función f
f (x) = 2x2 − 3x + 1 (2.2)
cuyo valor para cada valor de x dado es asignado a la variable y (se lee f (x) como ‘f de
x’). La función f es la regla para calcular y a partir de x.
Una función toma valores numéricos cuando se asignan valores numéricos a las va-
riables.
01. La palabra ‘función’ fue utilizada por primera vez en este contexto por el matemático alemán
Gottfried Wilhelm Leibniz (1646-1716).
24 Capı́tulo 2. Funciones algebraicas
EJEMPLO 2.1 Los valores de la función (2.2) para x = 2, x = 1 y x = 0 son
f (2) = 2 × 22 − 3 × 2 + 1 = 3
f (1) = 2 × 12 − 3 × 1 + 1 = 0
f (0) = 2 × 02 − 3 × 0 + 1 = 1
Sin embargo, el concepto de función es más general que esto, porque la variable x puede
ser sustituida por otra variable, por otra función o por una cantidad más complicada,
como un operador diferencial o una matriz.
EJEMPLO 2.2 Sustituya la variable x en (2.2) por la variable a
f (a) = 2a2 − 3a + 1
EJEMPLO 2.3 Sustituya la variable x en (2.2) por la función h + 2
f (h + 2) = 2(h + 2)2 − 3(h + 2) + 1

= 2(h2 + 4h + 4) − 3(h + 2) + 1
= 2h2 + 8h + 8 − 3h − 6 + 1
= 2h2 + 5h + 3
= g(h)
y
g(x) = 2x2 + 5x + 3
es una nueva función de x que está relacionada con f (x) a través de g(x) = f (x + 2).
d
EJEMPLO 2.4 Sustituya la variable x en (2.2) por el operador diferencial
dx
d d 2 d d2 d
f =2 −3 +1=2 2 −3 +1
dx dx dx dx dx
es un nuevo operador diferencial.
EJEMPLO 2.5 Por la ecuación de estado de los gases ideales, el volumen es una función de la presión, la
temperatura y la cantidad de materia,
nRT
V = f (p, T, n) = ,
p
y por el cálculo hecho en el Ejemplo 1.1
f (105 Pa, 298 K, 0,1 mol) = 2,478 × 10−3 m3 .

2.2. Representación gráfica de funciones 25
Al calcular el valor de una función puede ser necesario algún cuidado para que la ex-
presión que define la función sea interpretada correctamente. Una función sencilla como
(2.2) aparece libre de ambigüedades, como hemos visto en el Ejemplo (2.1), pero incluso
un caso tan sencillo admite malas interpretaciones.
Resolución de ambigüedades
La expresión aritmética
2+3×4
puede resultar ambigua porque su valor depende del orden en el que se combinan los
números. Puede ser interpretada como (2 + 3) × 4 = 20, o puede ser interpretada como
2 + (3 × 4) = 14. Las ambigüedades pueden resolverse siempre con un uso adecuado de
los paréntesis, como en este ejemplo. Ante la duda, utilice paréntesis.
Si no se usan paréntesis, se pueden evitar las ambigüedades siguiendo las reglas, uti-
lizadas en la programación por ordenador,
(i) la exponenciación tiene preferencia sobre la multiplicación y la división,
(ii) la multiplicación y la división tienen preferencia sobre la suma y la resta.
EJEMPLO 2.6 Precedencia en las expresiones aritméticas

(1) 2 + 3 × 4 = 2 + (3 × 4) = 2 + 12 = 14
(2) 3 × 42 = 3 × (42 ) = 48
(3) 2 + 3 × 4 ÷ 6 + 7 × 23 = 2 + (3 × 4 ÷ 6) + 7 × (23 ) = 2 + 2 + 56 = 60
Decimos que la función dada por la ecuación (2.2) es una función cuadrática porque
la potencia mayor de x es un cuadrado (en geometrı́a plana, cuadratura es el acto de
cuadrar, es decir, de hallar un cuadrado cuya área sea igual a la de una figura dada).
Es un ejemplo de una clase general de funciones llamadas polinomios. Tratamos los
polinomios y otras funciones algebraicas en los apartados que siguen. Otras funciones
que son importantes en las ciencias fı́sicas son las funciones trigonométricas, la función
exponencial y la función logarı́tmica; estas funciones trascendentes las tratamos en el
Capı́tulo 3.
2.2. Representación gráfica de funciones

Una función real puede visualizarse bien por tabulación, bien por el dibujo de su
gráfica. Sea la función
y = f (x) = x2 − 2x − 3 . (2.3)
Para cada valor de x existe un valor de y. Podemos hacer una tabla, como la Tabla 2.1,
dando los valores de y correspondientes a un conjunto de valores de x. Además, puede
considerarse que cada par de números (x, y) de la tabla define la posición de un punto en
un plano, y puede dibujarse en una gráfica como en la Figura 2.1.
Tabla 2.1
x y
−3 12
−2 5 Figura 2.1
−1 0
0 −3
1 −4
2 −3
3 0
4 5
5 12
El sistema de coordenadas cartesianas2

La posición de un punto en un plano se especifica de manera única por sus coorde-
nadas en un sistema de coordenadas dado. El sistema que resulta en general más útil
es el sistema (rectangular) de coordenadas cartesianas representado en la Figura 2.2.
Figura 2.2
02. René Descartes (1596-1650), o Renatus Cartesius, filósofo y matemático francés. Relacionó su
búsqueda de una matemática universal con una experiencia mı́stica en 1619 en la cual “lleno de entusiasmo,
descubrı́ el fundamento de una ciencia maravillosa”. Desarrolló la relación entre el álgebra y la geometrı́a
en su Géométrie, publicada como un apéndice al Discours de la méthode pour bien conduire sa raison et
chercher la vérité dans les sciences (Discurso del método para conducir bien la razón y buscar la verdad en
las ciencias) en 1637. Antes de Descartes, las cantidades x, x2 y x3 se asociaban siempre con los concep-
tos geométricos de lı́nea, superficie y volumen. Descartes eliminó esa limitación: “la raı́z (x), el cuadrado,
el cubo, etc. son meramente magnitudes en proporción continua”. Su obra marca el principio del álgebra
moderno. Descartes introdujo el convenio de utilizar letras del principio del alfabeto (a, b, . . .) para las cons-
tantes y los parámetros, y letras del final (x, y, z) para las incógnitas y las variables. La Géométrie contiene
la formulación del teorema fundamental del álgebra y el primer uso de las palabras ‘real’ e ‘imaginario’ en
el contexto de los números complejos.
Fermat también desarrolló la geometrı́a coordenada al mismo tiempo que Descartes, pero su obra no se
publicó hasta 1679, tras su muerte. Pierre de Fermat (1601-1665), abogado en el parlamento provincial de
Toulouse, hizo importantes contribuciones a la teorı́a de números y al cálculo.
2.3. Factorización y simplificación de expresiones 27
Se define en el plano un sistema de referencia, que consiste en un punto fijo llamado

el origen del sistema de coordenadas y en dos ejes (rectas orientadas) perpendiculares,
llamados ejes coordenados, que se cortan en el origen. En la Figura 2.2 el origen se
denota por O, los ejes coordenados son los de x y de y, y el plano se llama plano xy. La
posición de un punto en el plano se especifica por el par ordenado (x, y), donde x es la
coordenada x o abscisa e y es la coordenada y u ordenada. Un punto con coordenadas
(x, y) está a una distancia |x| perpendicularmente al eje y, e |y| con respecto al eje x. El
punto queda a la derecha del eje (vertical) y si x > 0 y a la izquierda si x < 0; y queda
por encima del eje x si y > 0 y por debajo si y < 0. El origen tiene por coordenadas
(0, 0).
En un ejemplo real, se marcan las escalas adecuadas en los ejes coordenados y cada
par de números, como los de la Tabla 2.1, se representa por un punto en la gráfica. Si se
sabe que la función varı́a de manera suave entre los puntos dibujados (como ocurre en
este ejemplo) entonces se pueden unir los puntos mediante una curva regular. La curva
es la representación gráfica de la función.
2.3. Factorización y simplificación de expresiones

La estructura de una expresión algebraica puede a menudo simplificarse y clarificarse
con el procedimiento de factorización. Por ejemplo, en la expresión
3xy + 6x2
cada término puede escribirse como el producto de 3x y otro término:
3xy + 6x2 = (3x) × y + (3x) × (2x) .
La expresión 3x es un factor común, y la expresión puede escribirse como
3xy + 6x2 = 3x(y + 2x) .
Esto es una factorización: hemos escrito la expresión algebraica como el producto de los
dos factores (3x) y (y + 2x).
EJEMPLOS 2.7 Factorización
(1) 2x + 6y = 2(x + 3y)

(2) x2 + 3x + 2 = (x + 2)(x + 1)
(3) 9x2 − 12x + 4 = (3x − 2)(3x − 2) = (3x − 2)2
(4) x2 − 9 = (x + 3)(x − 3)
La operación inversa a la factorización suele llamarse ‘desarrollo’. Los casos (2) y (4) de
los Ejemplos 2.7 son ejemplos de factorización de una función cuadrática. Ilustran las
siguientes formas generales importantes:
(x + a)(x + b) = x2 + (a + b)x + ab
(a + b)2 = a2 + 2ab + b2
(2.4)
(a − b)2 = a2 − 2ab + b2
(a + b)(a − b) = a2 − b2
Figura 2.3
La Figura 2.3 da la interpretación geométrica de la segunda de ellas.

Las ecuaciones segunda y tercera de (2.4) pueden combinarse utilizando el sı́mbolo
±, que significa ‘más o menos’:
(a ± b)2 = a2 ± 2ab + b2 (2.5)
en donde o bien se usa el sı́mbolo superior en ambos miembros de la ecuación, o bien

el inferior también en ambos miembros. A veces se usa el sı́mbolo ∓ del mismo modo.
Por ejemplo a ∓ b = ±c representa el par de ecuaciones a − b = +c y a + b = −c.
La factorización también se puede usar para simplificar fracciones algebraicas. Por
ejemplo, en
3xy + 6x2
9x + 9xy
numerador y denominador tienen ambos 3x como factor común, y pueden ser divididos
por ese factor (si x = 0) sin modificar el valor de la fracción:
3xy + 6x2 3x(y + 2x) y + 2x y + 2x

= = =
9x + 9xy 3x(3 + 3y) 3 + 3y 3(1 + y)
EJEMPLOS 2.8 Simplificación de fracciones
4x 2 × (2x) 2x
(1) = =
2y 2 × (y) y
2 + 4y 2(1 + 2y) 1 + 2y
(2) = =
4 + 8x 4(1 + 2x) 2(1 + 2x)
a2 − b2 (a + b)(a − b) a−b
(3) = =
a + 2ab + b
2 2
(a + b) 2 a +b
2.4. Funciones inversas 29
2.4. Funciones inversas

Dada una función f y la ecuación y = f (x), suele ser posible definir, al menos para
algunos valores de x e y, una función g tal que x = g(y). Esta nueva función es la función
inversa de f y se representa por el sı́mbolo f −1 (a no confundir con la recı́proca 1/f ):
si y = f (x) entonces x = f −1 (y) . (2.6)
EJEMPLO 2.9 Si y = f (x) = 2x + 3, halle x = f −1 (y).

Tenemos
y−3
y = 2x + 3 , y − 3 = 2x , x= = f −1 (y) .
2
En este ejemplo y es una función univaluada de x: para cada valor de x existe únicamente un valor de y.
Similarmente, x es una función univaluada de y.
ax + b
EJEMPLO 2.10 Si y = , halle x = f −1 (y).
cx + d
Para despejar la x,
(i) se multiplican ambos miembros de la ecuación por (cx + d) : (cx + d)y = ax + b

(ii) se desarrolla el primer miembro: cxy + dy = ax + b
(iii) se resta (ax + b) de ambos miembros: cxy + dy − ax − b =0
(iv) se reagrupan los términos en x1 y en x0 : (cy − a)x + (dy − b) =0
Entonces
(cy − a)x = −(dy − b)
y dividiendo ambos miembros por (cy − a) obtenemos la solución
dy − b
x=− = f −1 (y) .
cy − a
Es necesario señalar que este procedimiento no es válido si x = −d/c porque y no está definida para
ese valor de x. Además, x tampoco está definida para y = a/c. Tales complicaciones pueden ignorarse
normalmente.
Hemos dado este ejemplo en detalle porque muestra el tipo de manipulaciones algebraicas usadas de
manera rutinaria en la resolución de problemas reales.
EJEMPLO 2.11 Si y = f (x) = x2 + 1, halle x = f −1 (y).

Tenemos
y = x2 + 1, x2 = y − 1, x=± y − 1 = f −1 (y) ,
y es una función univaluada de x, pero x es una función bivaluada de y (salvo para y = 1). Para cada valor
real de y > 1 existen dos valores reales de x (si y < 1 entonces x es complejo).
La Figura 2.4 muestra cómo se relacionan la gráfica de la función y la de su inversa. La gráfica (b) se obtiene
de la (a) intercambiando los ejes x e y, o por rotación alrededor de la recta x = y. La gráfica (b) también
muestra la naturaleza bivaluada de la función inversa.
En aplicaciones fı́sicas es habitualmente obvio por el contexto qué valor debe escogerse. Vemos por
otra parte, cuando x e y son números reales, que mientras y está definida para todos los valores de x,
−∞ < x < +∞, x está únicamente definida para 1 ≤ y < +∞.
Figura 2.4
Hallar la función inversa no es siempre tan sencillo.
EJEMPLO 2.12
y = f (x) = x5 − 2x .
En este caso la función inversa existe para todos los valores de x, pero no puede escribirse de manera sencilla
en forma algebraica, aunque puede ser tabulada y dibujada como en la Figura 2.5.
Figura 2.5
En este ejemplo la dependencia funcional de y con x viene dada explı́citamente por

el segundo miembro de la ecuación: y es una función explı́cita de x. Por otra parte,
x no puede expresarse como una función explı́cita de y, y la ecuación define x como
una función implı́cita de y. En general, si y está definida como función de x por una
expresión de la forma
f (x, y) = 0 ,
2.5. Polinomios 31
donde f es una función de ambas variables x e y, decimos que y es una función implı́cita
de x. En muchas ecuaciones de las ciencias fı́sicas no es posible expresar una variable
como una función explı́cita de las otras, o puede ser que no resulte conveniente hacerlo.
EJEMPLO 2.13 La ecuación de van der Waals

La ecuación de estado de un gas ligeramente imperfecto es

n2 a
p + 2 (V − nb) − nRT = 0 . (2.7)
V
En este caso, tanto T como p pueden expresarse fácilmente como funciones explı́citas de las otras variables:

1 n2 a nRT n2 a
T= p + 2 (V − nb) , p= − 2 .
nR V V − nb V
Para V, la ecuación (2.7) puede reescribirse como

RT n2 a n3 ab
V3 − n b + V2 + V− = 0,
p p p
que es una ecuación cúbica en V. Es posible dar las soluciones explı́citas de una ecuación cúbica, pero
son expresiones complicadas y no suelen utilizarse. En este caso, lo más conveniente es considerar que
la ecuación (2.7) define V como una función implı́cita de p, T y n. La ecuación (2.7) puede ser resuel-
ta numéricamente para cualquier valor de las variables independientes y de las constantes, utilizando un
método iterativo como el método de Newton-Raphson descrito en el Capı́tulo 20.
2.5. Polinomios
La forma general de un polinomio de grado n es
f (x) = a0 + a1 x + a2 x2 + · · · + an xn (2.8)
donde a0 , a1 , . . . , an son constantes y n es un entero positivo. Si n = 0, la función es la

constante a0 . Los polinomios se escriben a menudo en forma compacta como

n
f (x) = ai x i , (2.9)
i=0

donde el sı́mbolo representa un sumatorio. La notación nos dice que sumemos los
términos ai xi en los cuales la variable i va tomando por orden los valores 0, 1, 2, . . . , n:

n
ai xi = (a0 x0 ) + (a1 x1 ) + (a2 x2 ) + · · · + (an xn )

i=0
= a 0 + a 1 x + a 2 x 2 + · · · + an x n
(recordando que x0 = 1 y que x1 = x).

EJEMPLO 2.14 Desarrolle.

3
(1) ixi = 0 × x0 + 1 × x1 + 2 × x2 + 3 × x3 = x + 2x2 + 3x3
i=0
3
x2n−1 x−1 x1 x3 x5 1 x x3 x5
(2) = + + + = + + +
n=0
n+1 1 2 3 4 x 2 3 4

4
(3) (– x)i = (– x)2 + (– x)3 + (– x)4 = x2 − x3 + x4
i=2
Grado n = 1, función lineal
f (x) = a0 + a1 x . (2.10)
Este es el tipo más sencillo de función, y es más conocido en la forma
y = mx + c . (2.11)
La gráfica de esta función es una lı́nea recta de pendiente m, que corta el eje vertical y
(cuando x = 0) en el punto y = c, como se muestra en la Figura 2.6.
Figura 2.6
Si tomamos dos puntos arbitrarios en la recta con valores (x, y), o coordenadas,
(x1 , y1 ) y (x2 , y2 ) entonces
y1 = mx1 + c
y2 = mx2 + c
2.5. Polinomios 33
y y2 − y1
m= (2.12)
x2 − x1
define la pendiente constante. La recta cruza el eje horizontal x en un punto:

c
y=0 cuando x = − . (2.13)
m
Este valor de x se llama raı́z de la función lineal. En general, las raı́ces de una función
polinómica son aquellos valores de la variable para los cuales la función es cero. Esto
es, las raı́ces son las soluciones de la ecuación polinómica
f (x) = 0 . (2.14)
EJEMPLO 2.15 La gráfica de la función lineal y = 2x − 4 es una lı́nea recta como en la Figura 2.6. La
pendiente de la recta es 2, lo que supone que el valor de y crece el doble de rápido que el de x. Ası́, cuando x
se incrementa en 1, y se incrementa en 2. La recta cruza (corta) el eje y en el punto y = −4, cuando x = 0.
Cruza el eje x en el punto x = 2, y ésa es la raı́z de la función lineal.
Grado n=2, función cuadrática
f (x) = a0 + a1 x + a2 x2 . (2.15)
La función cuadrática se escribe habitualmente como
y = ax2 + bx + c . (2.16)
Una gráfica tı́pica se muestra en la Figura 2.1, donde vemos que la curva corta el eje
x (cuando y = 0) en dos puntos: x = −1 y x = 3. Ésas son las raı́ces de la función
cuadrática y son las soluciones de la ecuación cuadrática
x2 − 2x − 3 = 0 .
En este sencillo ejemplo las raı́ces se obtienen fácilmente factorizando, sin necesidad de
dibujar la gráfica. La función se expresa como el producto de dos factores lineales,
x2 − 2x − 3 = (x + 1)(x − 3) ,
y la función es cero si alguno de los factores lineales es cero:

ya sea x + 1 = 0 =⇒ x = −1
x − 2x − 3 = 0 si
2
o bien x − 3 = 0 =⇒ x = 3
(el sı́mbolo =⇒ significa ‘implica’).

Si bien es posible factorizar toda una serie de funciones cuadráticas tanteando, siem-
pre se pueden hallar las raı́ces mediante una fórmula:3
ax2 + bx + c = 0
para
√
−b ± b2 − 4ac
x= . (2.17)
2a
Entonces, si x1 y x2 son las raı́ces obtenidas mediante (2.17),
√ √
−b + b2 − 4ac −b − b2 − 4ac
x1 = , x2 =
2a 2a
la función cuadrática tiene la forma factorizada
ax2 + bx + c = a(x − x1 )(x − x2 ) . (2.18)
EJEMPLO 2.16 Las raı́ces de la función cuadrática x2 − 2x − 3 (a = 1, b = −2, c = −3 en la fórmula

2.17) son
√
+2 ± 4 + 12
x= = 1 ± 2 = −1 ó 3 ,
2
y
x2 − 2x − 3 = (x + 1)(x − 3) .
La cantidad
b2 − 4ac (2.19)
en (2.17) se denomina discriminante de la función cuadrática. Su valor es positivo en

el Ejemplo 2.16, y la función tiene dos raı́ces, pero en otros ejemplos puede ser cero o
03. Una tableta de arcilla del primer periodo babilonio (hacia 1800-1600 a.C.) tiene inscrita en escritu-
ra cuneiforme sumeria el siguiente problema (en notaciónmoderna): dado que xy = 60 y que x−y = 7, halle
x e y. La receta dada para la solución corresponde a x = (7/2)2 + 60+(7/2), y = (7/2)2 + 60−(7/2).
El método y el enfoque de recetario es casi idéntico al utilizado por Al-Khwarizmi dos milenios y medio
después. El álgebra moderno se hizo posible con el desarrollo entre los siglos XV y XVII de una notación
abstracta general. Un paso importante fue dado por François Viète (1540-1603). Abogado, polı́tico, criptoa-
nalista y matemático aficionado francés, hizo contribuciones en trigonometrı́a y en álgebra. Se le recuerda
sobre todo como el hombre que, en su In artem analyticem isagoge (Introducción al arte analı́tico) de 1591,
introdujo el uso sistemático de sı́mbolos (letras) en la teorı́a de ecuaciones, distinguiendo entre constantes
y variables.
2.5. Polinomios 35
negativo. Vemos una explicación gráfica de los tres posibles casos de discriminante en
la Figura 2.7.
Figura 2.7
Cuando el discriminante es negativo, la fórmula (2.17) supone tomar la raı́z cuadrada de

un número negativo, y el resultado no es un número real. En ese caso, las raı́ces de la
√ cuadrática son números complejos en los que aparece la raı́z cuadrada de −1:
función
i = −1.
√
EJEMPLO 2.17 Caso b2 − 4ac = 0.
La función cuadrática
2x2 − 8x + 8 = 2(x − 2)2
tiene discriminante nulo y la raı́z doble (dos raı́ces iguales) x = 2.
√
EJEMPLO 2.18 Caso b2 − 4ac < 0.
La función cuadrática
x2 − 3x + 4
tiene raı́ces (complejas) x1 y x2 dadas por
√
3± −7 1 √
x= = (3 ± i 7)
2 2
y puede escribirse como (x − x1 )(x − x2 ).
La forma de la gráfica de la función cuadrática general
f (x) = ax2 + bx + c (2.20)
es la de una parábola. Cuando la constante a es positiva, la función tiene un único mı́nimo

(extremo, valor estacionario) y, si se dibuja su gráfica como en la Figura 2.1, resulta ser
simétrica con respecto a un eje vertical que pasa por el punto de valor mı́nimo (el punto
(1, −4) en la Figura 2.1). Para valores muy grandes de x, el término en x2 en (2.20) es
mucho mayor en magnitud que los otros dos términos:
f (x) → ax2 cuando x → ±∞ . (2.21)

Esto significa que para valores muy grandes de x, positivos o negativos (cuando |x| →
∞), la función se comporta como la función ax2 , más sencilla, y puede ser sustituida por
ella.
EJEMPLO 2.19 Comportamiento de una función cuadrática para valores grandes de la variable
Para valores de |x| menores que 100, aproximadamente, la función x2 − 2x − 3 difiere de la función x2 en
más de un 2 %. Para valores de x mayores la diferencia disminuye rápidamente: para |x| = 103 la diferencia
viene a ser de 0,2 %, para |x| = 105 es 0,002 %, y para |x| = 1010 es 2 × 10−8 %.
Las funciones cuadráticas son importantes en las ciencias fı́sicas porque se emplean para
representar movimientos vibratorios de muchos tipos. El movimiento vibratorio más
sencillo es el movimiento armónico simple y, por ejemplo, una pelota que rueda hacia
adelante y hacia atrás en un recipiente parabólico (un ‘pozo de potencial parabólico’)
describe un movimiento armónico simple.
Figura 2.8
Otros ejemplos son las oscilaciones de un péndulo, las vibraciones de átomos dentro
de moléculas o sólidos, los campos eléctricos y magnéticos oscilantes en la radiación
electromagnética.
EJEMPLO 2.20 El oscilador armónico simple clásico

El oscilador armónico simple clásico
Figura 2.9
Un oscilador armónico simple es un cuerpo, de masa m, que se mueve en una lı́nea recta alrededor de
una posición de equilibrio bajo la influencia de una fuerza proporcional a la distancia del cuerpo al punto
de equilibrio y dirigida hacia ese punto, F = −kx, donde k se denomina la constante de la fuerza y el
signo negativo asegura que la fuerza actúa siempre en la dirección opuesta al desplazamiento. La energı́a
del sistema es
1 1
E = mv2 + kx2 ,
2 2
donde v es la velocidad del cuerpo. La expresión de la energı́a es una función cuadrática en las variables v y
x; 12 mv2 es la energı́a cinética y 12 kx2 es la energı́a potencial. En ausencia de influencias externas la energı́a
total es constante (véase el Apartado 12.5 para un tratamiento más completo del oscilador armónico).
2.5. Polinomios 37
EJEMPLO 2.21 El oscilador armónico simple en mecánica cuántica

Los estados estacionarios del oscilador armónico simple en mecánica cuántica vienen dados por las solu-
ciones de la ecuación de Schrödinger independiente del tiempo
2 d 2 ψ 1
− + kx2 ψ = Eψ ,
2m dx2 2
donde ψ = ψ(x) es la función de ondas. La ecuación puede escribirse en la forma
Hψ = Eψ ,
siendo el operador hamiltoniano para el movimiento armónico,
2 d 2 1
H=− + kx2 ,
2m dx2 2
2
d d d2
una función cuadrática de la función y de , puesto que ≡ 2.
dx dx dx
Polinomio general
Un polinomio de grado n siempre puede factorizarse como el producto de n factores
lineales
f (x) = a0 + a1 x + a2 x2 + · · · + an xn
(2.22)
= an (x − x1 )(x − x2 ) · · · (x − xn ) .
Esto se denomina teorema fundamental del álgebra y fue demostrado por primera vez
por el gran matemático Gauss.4 La función es cero cuando cualquiera de los factores
lineales es cero, y los números x1 , x2 , . . . , xn son las n raı́ces del polinomio. Algunas de
esas raı́ces pueden ser iguales entre sı́ (raı́ces múltiples) y algunas pueden ser complejas.
Un polinomio de grado impar (n = 1, 3, 5, . . .) tiene siempre al menos una raı́z real
porque su gráfica está obligada a cruzar el eje x al menos una vez. En general, este
polinomio tiene un número impar de raı́ces reales. Un polinomio de grado par (n =
2, 4, 6, . . .) tiene un número par de raı́ces reales, o ninguna raı́z real si la curva no cruza
el eje x.
04. Carl Friedrich Gauss (1777-1855), niño prodigio y profesor en Göttingen, hizo contribuciones
sustanciales en cada rama importante de las matemáticas puras y aplicadas: teorı́a de números, geometrı́a,
álgebra, estadı́stica, teorı́a de perturbaciones, teorı́a electromagnética. Inventó o inició nuevas ramas de
las matemáticas, entre ellas la teorı́a de funciones de variable compleja y la geometrı́a diferencial, que
constituyó gran parte de la base de las matemáticas del siglo XIX. Dio su primera prueba (de cuatro) del
teorema fundamental del álgebra en su tesis doctoral, Prueba del teorema de que toda función racional
integral de una variable puede ser resuelta en factores reales de primer o segundo grado, en 1799.
EJEMPLO 2.22 Factorización de una función cúbica

Un polinomio de grado 3 puede tener las tres raı́ces reales o puede tener una raı́z real y dos complejas. Por
ejemplo,
(i) tres raı́ces reales:

x3 − 6x2 + 11x − 6 = (x − 1)(x − 2)(x − 3) ,
(ii) una raı́z real y dos raı́ces complejas:
x3 − 3x2 + 4x − 2 = (x − 1)(x2 − 2x + 2) .
√
Las raı́ces del factor cuadrático son 1 ± i, siendo i = −1,

x2 − 2x + 2 = x − (1 + i) x − (1 − i)
y la factorización completa de la función cúbica es
x3 − 3x2 + 4x − 2 = (x − 1)(x − 1 − i)(x − 1 + i) .
EJEMPLO 2.23 Factorización de una función cuártica

Podemos considerar tres casos.
(i) 4 raı́ces reales, por ejemplo
x4 − x3 − 7x2 + x + 6 = (x − 1)(x + 1)(x + 2)(x − 3) ,

(ii) 2 raı́ces reales y dos raı́ces complejas, por ejemplo
x4 − 2x3 + x2 + 2x − 2 = (x − 1)(x + 1)(x2 − 2x + 2)

= (x − 1)(x + 1)(x − 1 − i)(x − 1 + i) ,
(iii) 4 raı́ces complejas, por ejemplo
x4 − 2x3 + 3x2 − 2x + 2 = (x2 + 1)(x2 − 2x + 2)

= (x − i)(x + i)(x − 1 − i)(x − 1 + i) .
Los Ejemplos 2.22 y 2.23 muestran que, si no se permiten números complejos, un poli-
nomio puede siempre factorizarse como el producto de factores lineales, uno por cada
raı́z real, y, como mucho, factores cuadráticos, todos reales.5 Utilizamos el teorema en
el Apartado 2.6 para construir fracciones simples.
Toda relación de la forma
P(x)yn + Q(x)yn−1 + · · · + U(x)y + V(x) = 0 , (2.23)
05. Este es el enunciado del teorema fundamental del álgebra dado por Gauss en su primera prueba
de 1799.
2.6. Funciones racionales 39
donde P(x), Q(x), . . . , V(x) son polinomios de cualquier grado (finito) en x, define la
variable y como una función algebraica de x. Por ejemplo, la ecuación
y3 + (x + 1)y2 + (x2 + 3x + 2)y + (x3 + 2x2 − x − 1) = 0
es una ecuación cúbica en y, y puede resolverse para cada valor de x.6 Las funciones
que no pueden ser definidas de esta forma, mediante un número finito de polinomios, se
llaman funciones trascendentes. Algunos ejemplos son las funciones trigonométricas, la
función exponencial y la función logarı́tmica. Tratamos esas funciones en el Capı́tulo 3.
2.6. Funciones racionales

Sean P(x) y Q(x) dos polinomios
P(x) = a0 + a1 x + a2 x2 + · · · + an xn ,
(2.24)
Q(x) = b0 + b1 x + b2 x2 + · · · + bm xm .
Una función racional, o función algebraica, tiene la forma general
P(x) a 0 + a1 x + a 2 x 2 + · · · + an x n
y = f (x) = = . (2.25)
Q(x) b 0 + b 1 x + b 2 x 2 + · · · + bm x m
Ejemplos de funciones racionales son
1 x+2 3x2 + 2x − 1 x+1

(i) , (ii) , (iii) , (iv) . (2.26)
x x+1 x+2 3x2 + 2x − 1
En cada caso la función está definida para todos los valores de x para los cuales el
denominador no es cero, ya que la división por cero no está permitida. Por ejemplo, la
función (i) en (2.26) no está definida en x = 0, y (iii) no está definida en x = −2. En
general, la función racional (2.25) está definida para todos los valores de x salvo para
las raı́ces del polinomio Q(x) del denominador, para las cuales Q(x) = 0. La gráfica de
06. La fórmula para la solución general de una ecuación cúbica fue descubierta en Bolonia a comien-
zos del siglo XVI por Scipio del Ferro y Nicolo Tartaglia. El método de resolución (método de Cardano)
fue descrito por Girolamo Cardano (1501-1576) en su Ars magna de 1545. Cardano demostró que algunas
soluciones eran complejas. El libro también contiene una descripción de un método para resolver ecuacio-
nes cuárticas debido a Ludovico Ferrari (1522-1565). El matemático noruego Niels Enrik Abel (1802-1829)
demostró en su Sobre la resolución algebraica de ecuaciones (1824) que no existe una solución algebraica
de la ecuación general de quinto grado, o de ninguna ecuación polinómica de grado mayor que 4. ‘La corta
vida de Abel estuvo llena de pobreza y tragedia’; murió de tisis con 27 años de edad. Dio la primera prueba
rigurosa del teorema del binomio, hizo contribuciones pioneras en la teorı́a de grupos, e hizo un trabajo
importante e innovador en la teorı́a de funciones elı́pticas y otras funciones trascendentes superiores. La
ecuación general de quinto grado fue resuelta mediante funciones elı́pticas por Hermite en 1858.
la función y = 1/x en la Figura 2.10 ilustra varias propiedades tı́picas de las funciones
racionales.
Cuando x se acerca a cero desde la derecha (x > 0) el valor
de 1/x se hace arbitrariamente grande. Decimos que y = 1/x
tiende a infinito cuando x tiende a cero. Igualmente, y tiende a
menos infinito cuando x tiende a cero desde el lado negativo.
El punto x = 0 se llama punto singular, y la mayorı́a de las
funciones racionales tienen al menos uno de esos puntos (uno
por cada raı́z de Q(x)). La gráfica también muestra que cuando
x → 0 desde cualquiera de los dos lados, la curva se acerca al
eje y tanto como queramos pero no lo llega a cruzar. El eje y es
la recta x = 0 y lo llamamos una ası́ntota a la curva. Decimos
Figura 2.10
que la curva se aproxima a la recta x = 0 asintóticamente. La
recta y = 0 (el eje x) es también una ası́ntota.
División de un polinomio por otro

La función racional (2.25) se denomina propia si el numerador P(x) tiene grado
menor que el denominador Q(x), como en los ejemplos (i) y (iv) de (2.26). Si no es ası́,
como en los ejemplos (ii) y (iii), se dice impropia. En la teorı́a de números ordinaria, una
fracción impropia es aquella con valor mayor o igual a 1, por ejemplo 52 = 2 21 ó 22 = 1.
Las fracciones impropias siempre se pueden reducir a una combinación de fracciones
propias por división, y lo mismo es cierto para las funciones algebraicas impropias.
EJEMPLO 2.24 Divida x3 − 7x2 + 16x − 11 por x − 1.

Adaptando el método de plantear la división entera, escribimos
x3 −7x2 +16x −11 x−1

x3 − x2 x2 − 6x + 10 x va x2 veces en x3
−6x2 +16x −11 restamos
−6x2 + 6x x va −6x veces en −6x2
10x −11 restamos
10x −10 x va 10 veces en 10x
−1 resto
Deducimos que
x3 − 7x2 + 16x − 11 1
= x2 − 6x + 10 − .
x−1 x−1
EJEMPLO 2.25 Divida x3 − 7x2 + 16x − 10 por x − 1.

La función cúbica es en este caso una unidad mayor que en el Ejemplo 2.24, y no hay resto de la división.
Deducimos que la función cúbica puede ser factorizada:
x3 − 7x2 + 16x − 10 (x − 1)(x2 − 6x + 10)
= = x2 − 6x + 10 .
x−1 x−1
En este caso, el hecho de que la función racional no esté definida en x = 1 antes o después de eliminar el
factor (x − 1) no tiene consecuencias prácticas y puede ser ignorado.
2.6. Funciones racionales 41
EJEMPLO 2.26 Divida x + 2 por x + 1.

En este caso no es necesario recurrir a la división entera:
x+2 (x + 1) + 1 1
= =1+ .
x+1 x+1 x+1
En el Ejemplo (2.25) la cantidad (x − 1) es un factor de la función cúbica, esto es, x = 1

es una raı́z:
x3 − 7x2 + 16x − 10 = (x − 1)(x2 − 6x + 10) .
La factorización se consigue bien sea por división o por el siguiente método. Por conocer
(o suponer) que x = 1 es una raı́z, escribimos
x3 − 7x2 + 16x − 10 = (x − 1)(ax2 + bx + c) .
Desarrollando el segundo miembro tenemos
x3 − 7x2 + 16x − 10 = ax3 + (b − a)x2 + (c − b)x − c .
Para que esta ecuación se cumpla para todo valor de x es necesario que los coeficientes
de cada potencia de x sean los mismos a ambos lados de la igualdad. Por lo tanto
1 = a, −7 = b − a , 16 = c − b , −10 = −c .
Por lo tanto a = 1, b = −6 y c = 10.

Este método es útil para factorizar polinomios sencillos. Es la base para el método de
‘tanteo’ utilizado a menudo para factorizar funciones cuadráticas.
Fracciones simples
Consideremos
1 1 1 1
= = − . (2.27)
x2 + 3x + 2 (x + 1)(x + 2) x+1 x+2
La función cuadrática del denominador se expresa como el producto de dos factores li-
neales, y la fracción se descompone en dos fracciones simples más sencillas. Veremos
en los Capı́tulos 6 y 11 que la descomposición en fracciones simples es una herramienta
importante en la resolución de algunas ecuaciones diferenciales en la teorı́a de veloci-
dades de reacción, y en integración en general. Una función racional propia P(x)/Q(x)
cuyo denominador puede ser factorizado, puede siempre descomponerse en fracciones
simples más sencillas. El siguiente ejemplo ilustra dos de los caso sencillos más impor-
tantes. Todos los demás se pueden tratar de la misma manera.
EJEMPLO 2.27 Dos factores lineales en el denominador

x+2 5 2
= + .
(x − 3)(x + 4) 7(x − 3) 7(x + 4)
Para obtener este resultado, escribimos
x+2 A B A(x + 4) + B(x − 3)
= + = .
(x − 3)(x + 4) x−3 x+4 (x − 3)(x + 4)
Es necesario por lo tanto que
x + 2 = A(x + 4) + B(x − 3)
para todo valor de x. En particular,
si x = 3, entonces 5 = 7A y A = 5/7,
y si x = −4, entonces − 2 = −7B y B = 2/7.
EJEMPLO 2.28 Un factor lineal repetido en el denominador

3x + 1 A B A(x + 3) + B
= + =
(x + 3)2 x+3 (x + 3)2 (x + 3)2
y deducimos que A = 3 y B = −8.
En el caso general, la descomposición de una función racional propia P(x)/Q(x) en frac-

ciones simples depende del tipo de raı́ces del denominador Q(x) (véase el Apartado 2.5
sobre las raı́ces de un polinomio general).
(i) Todas las raı́ces son reales.
En ese caso Q(x) se factoriza como el producto de factores lineales reales. Si Q es de

grado n entonces
Q(x) = a(x − x1 )(x − x2 ) · · · (x − xn ) , (2.28)
siendo x1 , x2 , . . . , xn las raı́ces. Si todas las raı́ces son distintas, entonces P(x)/Q(x) se
descompone en la suma de n fracciones simples, como en el Ejemplo 2.27:
P(x) c1 c2 cn
= + + ··· + . (2.29)
Q(x) x − x1 x − x2 x − xn
Si algunas de las raı́ces son iguales, entonces hay términos adicionales, como en el Ejem-
plo 2.28, con potencias del factor lineal en el denominador. Por ejemplo, si x1 = x2 = x3 ,
entonces
P(x) c1 c2 c3 c4 cn
= + + + + ··· +
Q(x) x − x1 (x − x1 )2 (x − x1 )3 x − x4 x − xn
(2.30)
ax2 + bx + c c4 cn
= + + ··· + .
(x − x1 )3
x − x4 x − xn
2.7. Resolución de sistemas de ecuaciones 43
(ii) Algunas de las raı́ces son complejas.
Si se permiten números complejos, el punto (i) anterior se puede aplicar. Si no se per-

miten números complejos, el denominador Q(x) se puede factorizar como el producto
de factores lineales, uno por cada raı́z real, y uno o más factores cuadráticos reales. La
descomposición en fracciones simples presenta, además de los términos comentados en
(i) más arriba, una fracción por cada factor cuadrático de la forma
ax + b
, (2.31)
x + px + q
2
o si el mismo factor cuadrático aparece m veces,
a1 x + b 1 a2 x + b2 a m x + bm
+ + ··· + 2 . (2.32)
x2 + px + q (x2 + px + q)2 (x + px + q)m
Por ejemplo (véase el Ejemplo 2.22),
1 1 1 1−x
= = + 2 .
x − 3x + 4x − 2
3 2
(x − 1)(x − 2x + 2)
2
x − 1 x − 2x + 2
2.7. Resolución de sistemas de ecuaciones
Sea la pareja de ecuaciones lineales
(1) x + y = 3,
(2) x − y = 1.
La ecuación (1) define y como función de x
y = 3 − x,
mientras que la ecuación (2) define y como una segunda función de x
y = x − 1.
La Figura 2.11 muestra que las gráficas de esas funciones lineales se cortan en el punto
(x, y) = (2, 1). Las dos ecuaciones tienen la solución común x = 2, y = 1.
En general, una ecuación algebraica con dos variables x e y define una de las variables
como función algebraica de la otra. Por ejemplo, la ecuación
p(x)yn + q(x)yn−1 + · · · + u(x)y + v(x) = 0 (2.33)

define una función particular y = f (x). Una segunda ecuación algebraica
p (x)yn + q (x)yn−1 + · · · + u (x)y + v (x) = 0 (2.34)
define una segunda función y = g(x). Las dos ecuaciones tienen soluciones comunes para
aquellos valores de x para los cuales f (x) y g(x) son iguales. Gráficamente, las soluciones
comunes reales son aquellos puntos, si los hay, en los cuales las gráficas de y = f (x) y
y = g(x) se cortan. Por ejemplo, las dos ecuaciones lineales
a0 x + b0 y = c0
(2.35)
a1 x + b1 y = c1
pueden resolverse para dar la solución
c0 b1 − c1 b0 a0 c1 − a1 c0
x= , y= . (2.36)
a0 b1 − a 1 b0 a0 b1 − a 1 b0
Señalamos que esta solución existe sólo si el denominador (a0 b1 − a1 b0 ) no es cero.

Gráficamente, las ecuaciones (2.35) representan dos lı́neas rectas, y la solución es el
punto en el cual las rectas se cortan.
Figura 2.11
EJEMPLO 2.29 Resuelva

(1) x + y = 3,
(2) 2x + 3y = 4 .
Para resolver, restamos dos veces (1) a (2):
(1) x+y = 3

(2 ) y = −2
y sustituyendo y = −2 en (1) obtenemos x = 5.


(1) x + y = 3,
(2) 2x + 2y = 4 .
Para resolver, restamos dos veces (1) a (2):
(1) x+y = 3

(2 ) 0 = −2 .
La segunda ecuación no es posible. Se dice que las ecuaciones son inconsistentes y no hay solución. Este
es un ejemplo para el cual a0 b1 − a1 b0 = 0 y, gráficamente, corresponde a rectas paralelas.

(1) x + y = 3,
(2) 2x + 2y = 6 .
En este caso, doblando la ecuación (1) obtenemos la ecuación (2) y a efectos prácticos sólo hay una ecua-
ción. Ambas ecuaciones representan la misma recta. Se dice que las ecuaciones son linealmente depen-
dientes y sólo es posible dar una solución parcial: ambas ecuaciones dan x = 3 − y para todo valor de y.
Volveremos al problema general de resolver sistemas de ecuaciones lineales en el Capı́tulo 17.
EJEMPLO 2.32 Una ecuación lineal y otra cuadrática

(1) x + y = 3,
(2) 2x + 3xy + 2y2 = 16 .
2
La ecuación (1) puede resolverse para y en función de x y el resultado ser sustituido en la ecuación (2). Ası́,
por (1), y = 3 − x, y (2) se transforma en
x2 − 3x + 2 = 0
con raı́ces x = 1 y x = 2. En este caso las dos soluciones son los puntos en los cuales la recta corta la curva
cuadrática, (1, 2) y (2, 1). En otros ejemplos del mismo tipo puede haber una sola solución, cuando la recta
es tangente a la curva cuadrática, o no haber soluciones reales, cuando la recta no corta la curva cuadrática.
EJEMPLO 2.33 Tres ecuaciones lineales

(1) x+ y+ z = 3,
(2) 2x + 3y + 4z = 12 ,
(3) x − y − 2z = −5 .
Para resolver, primero eliminamos x de las ecuaciones (2) y (3) restando 2 × (1) a (2) y (1) a (3):
(1) x+ y+ z = 3

(2 ) y + 2z = 6
(3 ) −2y − 3z = −8 .
Ahora eliminamos y de (3 ) sumando 2 × (2 ) a (3 ):

(1) x+ y+ z = 3

(2 ) y + 2z = 6

(3 ) z = 4.
Las ecuaciones pueden ser resueltas ahora en orden inverso: (3 ) es z = 4, entonces (2 ) es y + 8 = 6 de
manera que y = −2, y (1) es x − 2 + 4 = 3 de manera que x = 1.
El método utilizado en este ejemplo es un método sistemático general para resolver sistemas con cual-
quier número de ecuaciones lineales. Lo trataremos más en el Capı́tulo 20.
2.8. Ejercicios
Apartado 2.1
1. Halle los valores de y = 2 − 3x para (i) x = 0, (ii) x = 2, (iii) x = −3.
2. Halle los valores de y = 2x2 + 3x − 1 para (i) x = 0, (ii) x = 1, (iii) x = −1.
3. Dada f (x) = x2 − 3x − 4, halle (i) f (5), (ii) f (0), (iii) f (– 2).
4. Halle el valor de f (x) = 3x + 2 siendo 2x + 1 = 0.
5. Si f (x) = x2 − 3x − 4, ¿qué es f (a + 3)?
6. Dadas f (x) = 2x − 1 y g(x) = 3x + 1, exprese f (g) como una función de x.
7. Utilizando las reglas de precedencia de las operaciones aritméticas, calcule
(i) 2 − 3 × 4 + 6 ÷ 2 , (ii) (2 − 3) × 4 + 6 ÷ 2 , (iii) 2 − 3 × (4 + 6) ÷ 2 .
Apartado 2.3
Desarrolle
8. 2(x + 2) 9. x(x − 3) 10. (x − 2)(2x + 3) 11. (x − 2)(2x + 3)(x − 5)
Factorice al máximo:
12. 2x2 + 3x 13. x2 − 4 14. 4x2 − 9 15. x2 + 6x + 5
Simplifique si es posible:
x x+2 x2 − 4 x2 + 3x + 2
16. 17. 18. 19.
3x2 + 2x x+4 x−2 x+2
x2 + 3x + 2 2x2 − 3x + 1
20. 21.
x2 + x + 2 x2 − 3x + 2
Apartado 2.4
Exprese x como función de y y en cada caso esboce y como función de x y x como función de y:
√ √
22. y = x − 2 23. y = x2 + 1 24. y = x2 + 1
x 2x + 3 x−1
25. y= 26. y= 27.
1−x 3x − 2 2x + 1
28. La ecuación de estado del virial para un gas puede aproximarse a baja presión por

B
pVm = RT 1 +
Vm
siendo p la presión, Vm el volumen molar, T la temperatura, R la constante de los gases y B el segundo
coeficiente del virial. Exprese B como una función explı́cita de las otras variables.
29. La ley de Kohlrausch para la conductividad molar Λm de un electrolito fuerte a baja concentración c
es √
Λm = Λ0m − K c
siendo Λ0m la conductividad molar en disolución infinita y K una constante. Exprese c como una función
explı́cita de Λm .
30. La isoterma de adsorción de Langmuir
Kp
θ=
1 + Kp
da el grado de recubrimiento θ de la superficie por un gas adsorbido a presión p, siendo K una constante.
Exprese p en función de θ.
31. En el Ejemplo 2.13 sobre la ecuación de van der Waals, compruebe las expresiones explı́citas dadas
para T y p, y la ecuación cúbica en V.
Apartado 2.5
Desarrolle:

2
3
3
3
2
32. (n + 1)xn 33. ixi−1 34. k(k + 1)x−k 35. n! xn
n=0 i=0 k=1 n=0
36. Explique la manera de obtener gráficamente K y Λ0m

en la ley de Kohlrausch (Ejercicio 29)
√
Λm = Λ0m − K c
a partir de medidas experimentales de Λm en un intervalo de concentraciones c.

37. La ecuación de Debye
r − 1 ρ Na µ2
= α+
r + 2 M 30 3kT
relaciona la permitividad relativa (constante dieléctrica) r de una sustancia pura con el momento dipolar µ
y la polarizabilidad α de las moléculas constituyentes, siendo ρ la densidad a temperatura T y M, Na , k y 0
constantes. Explique la manera de obtener gráficamente µ y α a partir de medidas experimentales de r y ρ
en un intervalo de temperaturas.
Halle las raı́ces y esboce las gráficas de las funciones cuadráticas:
38. x2 − 3x + 2 39. 2x2 + 3x − 2 40. 4x2 + 4x + 1 41. −2x2 − 3x + 2
42. 3x2 − 3x − 1 43. 3x2 − 3x + 1
2x2 + x + 1
44. Si y = , halle x como función de y.
2x2 + x − 1
45. La constante de acidez Ka de un ácido débil a concentración c es
αc2
Ka =
1−α
donde α es el grado de ionización. Exprese α en función de Ka y c (recuerde que α, Ka y c son cantidades
positivas).
Apartado 2.6
46. Divida 2x − 1 por x + 3 y exprese el resultado en forma adecuada.
47. Divida 3x3 − 2x2 − x + 4 por x + 2 y exprese el resultado en forma adecuada.
48. Dada la función 3x3 − 4x2 − x + 2,

(i) demuestre que una de las raı́ces es x = 1, (ii) encuentre las demás raı́ces, (iii) escriba la función como
un producto de factores lineales, (iv) esboce la gráfica de la función, mostrando donde corta la curva los
ejes, y mostrando cómo se comporta la función cuando x → ±∞.
Exprese en fracciones simples:
1 x+2 x−2 x2 + 2x − 1
49. 50. 51. 52.
(x − 1)(x + 2) x(x + 3) x2 + 3x + 2 (x − 1)2 (x + 2)
53. Esboce la gráfica de cada una de las funciones (49) a (52).
Apartado 2.7
Resuelva el sistema de ecuaciones y dé una interpretación gráfica del resultado:
54. x + y = 3, x−y=1 55. 3x − 2y = 1, 2x + 3y = 2
56. 3x − 2y = 1, 6x − 4y = 3 57. 2x − y = 2, x2 − xy + y2 = 2
58. 2x − y = 2, x2 − xy + y2 = 1 59. 2x − y = 2, x2 − xy + y2 = 0
60. x − 2y + 3z = 3, 2x − y − 2z = 8, 3x + 3y − z = 1
Funciones trascendentes
La descripción matemática de los fenómenos fı́sicos a menudo necesita otras funcio-

nes además de las algebraicas presentadas en el Capı́tulo 2. Las más importantes de esas
funciones trascendentes son las funciones trigonométricas, tratadas en los Apartados 3.1
a 3.4, y la función exponencial y su función inversa, es decir la función logarı́tmica, que
tratamos en los Apartados 3.5 a 3.7. Otras funciones se definen mediante estas funcio-
nes ‘elementales’, y en el Apartado 3.8 damos una breve descripción de las funciones
hiperbólicas.
3.1. Funciones trigonométricas

La trigonometrı́a, como una rama propia de las matemáticas, tiene sus orı́genes co-
mo herramienta para la elaboración de tablas astronómicas, y trata del uso de funcio-
nes trigonométricas para resolver problemas geométricos que implican triángulos.1 Es
importante en diseño estructural y arquitectónico, astronomı́a y navegación, por ejem-
plo. En las ciencias fı́sicas, las funciones trigonométricas son importantes para describir
movimientos circulares y todo tipo de movimientos periódicos, incluido el movimiento
ondulatorio.
Definiciones geométricas
Las principales funciones trigonométricas del ángulo θ, el ángulo interno en A en la
Figura 3.1, son el seno, el coseno y la tangente del ángulo:
01. Las primeras ‘tablas trigonométricas’ fueron elaboradas hacia 150 a.C. por el astrónomo Hipar-
co de Nicea (la actual Iznik en Turquı́a), a quien debemos el cı́rculo de 360◦ , y por Claudio Tolomeo de
Alejandrı́a (hacia 100-178 d.C.) cuya Syntaxis mathematica (Sı́ntesis matemática), conocida como el Alma-
gesto, fue denominado por los Árabes al-magisti (el mejor) y sus tablas fueron utilizadas por los astrónomos
durante más de mil años. Las tablas del Siddhantas indio (hacia 400 d.C.) son esencialmente tabulaciones
de la función seno. Los matemáticos árabes (hacia 950 d.C.) añadieron nuevas tabulaciones y teoremas. La
trigonometrı́a europea fue desarrollada por Johann Müller (Regiomontanus) de Königsberg (1436-1476), y
por Georg Joachim Rheticus (1514-1576) de Wittenburg, un alumno de Copérnico, cuya Opus palatinum
de triangulis (Trabajo palatino sobre triángulos), 1595, se centró por vez primera en las propiedades del
triángulo rectángulo. François Viète (1540-1603) continuó ese trabajo con nuevas tablas extensas para las
seis funciones comunes, nuevas fórmulas, y el uso de funciones trigonométricas para resolver problemas de
ecuaciones algebraicas. El término ‘trigonometrı́a’ se acuñó hacia 1600.
50 Capı́tulo 3. Funciones trascendentes
opuesto bc
sen θ = = (3.1)
hipotenusa ac
adyacente ab
cos θ = = (3.2)
hipotenusa ac
opuesto bc sen θ
tg θ = = = (3.3)
adyacente ab cos θ
Figura 3.1
A partir de éstas se definen otras funciones, las más importantes son la secante, la cose-
cante y la cotangente:
1 1 1 cos θ
sec θ = , cosec θ = , cotg θ = = . (3.4)
cos θ sen θ tg θ sen θ
EJEMPLO 3.1 Para los ángulos de la Figura 3.2,

4 3 4
sen θ = cos θ = tg θ =
5 5 3
5 5 3
cosec θ = θ= cotg θ =
4 3 4
3 4 3
sen φ = cos φ = tg φ =
5 5 4
5 5 4
cosec φ = φ= cotg φ = Figura 3.2
3 4 3
Una de las propiedades más conocidas del triángulo rectángulo es el teorema de Pitágo-
ras2
ab2 + bc2 = ac2 . (3.5)
02. Pitágoras (hacia 580-hacia 500 a.C.). Nacido en la isla de Samos, viajó mucho y fue uno de los
principales introductores de las matemáticas y la astronomı́a egipcias y babilónicas al mundo griego. Se
afincó en Crotona, en el sur de Italia, donde fundó una sociedad religiosa y filosófica con una fuerte base
matemática, su lema era ‘todo son números’. Se le atribuye haber acuñado el vocablo ‘matemáticas’: lo que
es aprendido. Es tradicional atribuirle descubrimientos matemáticos. El teorema de Pitágoras era conocido
en el primer periodo babilonio, y la existencia de números irracionales fue posiblemente un descubrimiento
de pitagóricos posteriores hacia 400 a.C.. La escuela pitagórica introdujo el estudio sistemático de los prin-
cipios de las matemáticas: la teorı́a de números y la geometrı́a.
La expresión general del teorema de Pitágoras es: “En un triángulo rectángulo, el área de la figura en la hi-
potenusa es igual a la suma de las áreas de figuras similares en los otros dos lados” (Euclides, “Elementos”,
Libro VI, Proposición 31).
3.1. Funciones trigonométricas 51
Podemos escribir esto como una ecuación trigonométrica dividiendo ambos miembros
por ac2 :
ab2 bc2
+ 2 =1
ac2 ac
o bien
sen2 θ + cos2 θ = 1 (3.6)
(una cantidad como ( sen θ)2 , el cuadrado de sen θ, se escribe habitualmente sen2 θ).
EJEMPLO 3.2 Para el triángulo del Ejemplo 3.1,
4 2 3 2 42 + 32 25
sen2 θ + cos2 θ = + = = = 1.
5 5 52 25
Unidades de ángulo
La unidad de ángulo usual es el grado. La Figura 3.3 muestra el ángulo recto (90◦ ),
el ángulo plano (180◦ ) y el ángulo alrededor de un punto (360◦ ).
Figura 3.3
La unidad de ángulo empleada siempre en matemáticas y en aplicaciones cientı́ficas es

el radián (su sı́mbolo SI es rad), definido en función de las propiedades de un cı́rculo.
La Figura 3.4 muestra un cı́rculo de radio r y un arco de
longitud s que subtiende el ángulo θ en el centro. La longitud
del arco es proporcional al tamaño del ángulo. Por ejemplo, si
se dobla el ángulo θ, la longitud s también se dobla. Se deduce
que la proporción de s con la circunferencia del cı́rculo (2πr)
es igual a la proporción de θ con el ángulo completo alrededor
del centro (360◦ ):
Figura 3.4
s θ
= (3.7)
2πr 360◦
de manera que
s 360◦
θ= × . (3.8)
r 2π
La unidad de ángulo, el radián, se define como
360◦
1 rad = ≈ 57◦ 18 (3.9)
2π
(rad es la unidad de ángulo SI, a veces se usa un superı́ndice c, de tal modo que 1c =
1 rad). En la práctica se omite el sı́mbolo para la unidad, y un ángulo dado sin unidades
se supone que está en radianes. Por ejemplo
π π
90◦ = , 180◦ = π, 360◦ = 2π, sen = sen 30◦ .
2 6
La longitud de un arco de circunferencia es s = rθ cuando θ está en radianes.
EJEMPLOS 3.3 Radianes y grados

(1) El ángulo 40◦ es en unidades de radianes
2π 2π
40◦ = 40◦ × = ≈ 0,7 rad .
360◦ 9
(2) El ángulo 0,5 rad es en grados
360◦ 90◦
0,5 = 0,5 × = ≈ 28,7◦ .
2π π
(3) La longitud del arco que subtiende un ángulo θ = 2 rad en el centro de la circunferencia de radio r = 3
es
s = rθ = 3 × 2 = 6 .
Funciones trigonométricas para cualquier ángulo

La definición geométrica de las funciones trigonométricas mediante cocientes de los
lados de un triángulo rectángulo limita las funciones a valores de los ángulos entre 0◦ y
90◦ , o bien
π
0≤θ≤ .
2
Figura 3.5
Las definiciones pueden extenderse a cualquier valor de los ángulos considerando las
coordenadas de un punto en un cı́rculo, como se muestra en la Figura 3.5.
Las funciones trigonométricas se definen para todos los puntos del cı́rculo como
y x y
sen θ = , cos θ = , tg θ = . (3.10)
r r r
En el primer cuadrante, I, con ángulos 0 < θ < π/2, los valores de x y de y son ambos
positivos y
sen θ > 0 , cos θ > 0 , tg θ > 0 .
Sin embargo, en el segundo cuadrante, con π/2 < θ < π, x es negativo e y es positivo.
Los signos de las funciones trigonométricas en los cuatro cuadrantes se dan en la Tabla
3.1
Tabla 3.1 Signos de las funciones trigonométricas
Cuadrante I II III IV
Ángulos 0 < θ < π/2 π/2 < θ < π π < θ < 3π/2 3π/2 < θ < 2π
0◦ < θ < 90◦ 90◦ < θ < 180◦ 180◦ < θ < 270◦ 270◦ < θ < 360◦
sen θ + + − −
cos θ + − − +
tg θ + − + −
√ √
EJEMPLO 3.4 Por la Tabla 3.2, sen π/3 = 3/2, cos π/3 = 1/2 y tg π/3 = 3. ¿Cuáles son los
valores del seno, coseno y tangente para 2π/3, 4π/3 y 5π/3?
El ángulo 2π/3 está en el segundo cuadrante, 4π/3 en el tercero y 5π/3 en el cuarto. Por lo tanto
√ √
sen 2π/3 = +√3/2 , cos 2π/3 = −1/2 , tg 2π/3 = −√3 ,
sen 4π/3 = −√3/2 , cos 4π/3 = −1/2 , tg 4π/3 = +√3 ,
sen 5π/3 = − 3/2 , cos 5π/3 = +1/2 , tg 5π/3 = − 3 .
Valores especiales
Los valores para los ángulos en las fronteras de los cuatro cuadrantes, y para algunos
otros pocos ángulos, aparecen en la Tabla 3.2.
EJEMPLO 3.5 Demuestre que sen π/2 = 1 y que cos π/2 = 0.

Por la Figura 3.6,
sen θ = a/c, cos θ = b/c .
Cuando el ángulo θ se incrementa hasta 90◦ , la magnitud del lado b tiende a cero
mientras que la del lado a tiende a c. Por lo tanto
sen θ → c/c = 1 y cos θ → 0/c = 0 cuando θ → π/2 .

Figura 3.6
Tabla 3.2 Algunos valores especiales
θ 0◦ 90◦ 180◦ 270◦ 360◦ 30◦ 60◦ 45◦

π 3π π π π
θ/rad 0 π 2π
2 2 6 3 4
√
1 3 1
sen θ 0 1 0 −1 0 √
2 2 2
√
3 1 1
cos θ 1 0 −1 0 1 √
2 2 2
1 √
tg θ 0 ∞ 0 −∞ 0 √ 3 1
3
EJEMPLO 3.6 Verifique los valores de las funciones trigonométricas

para θ = π/6 en la Tabla 3.2.
Dibuje un triángulo equilátero con lados de longitud 2 y biseccione el triángulo
como
√ √ en la Figura 3.7. Entonces, por el teorema de Pitágoras, h =
se muestra
22 − 12 = 3, y
√ √
sen π/6 = 1/2 , cos π/6 = 3/2 , tg π/6 = 1/ 3 .
Figura 3.7
Ángulos negativos
Cada punto sobre el cı́rculo puede alcanzarse ya sea mediante un giro en sentido antiho-
rario o bien mediante un giro en sentido horario. Definimos los ángulos positivos para
los giros en sentido antihorario y negativos para giros en sentido horario.
El punto P en la Figura 3.8, correspondiente al ángulo negativo −θ, puede alcanzarse
mediante un giro en sentido antihorario con ángulo 2π − θ, y los dos ángulos tienen los
mismos valores trigonométricos:
sen (– θ) = sen (2π − θ) = − sen θ ,

cos (– θ) = cos (2π − θ) = + cos θ , (3.11)
tg (– θ) = tg (2π − θ) = − tg θ .
Figura 3.8
Otros ángulos
El intervalo de valores permitidos para los ángulos puede extenderse de manera adi-
cional permitiendo uno o más giros completos alrededor del centro. Cada giro com-
pleto añade o sustrae 2π, y los ángulos θ ± 2πn, para todos los valores del entero
n = 0, 1, 2, 3, . . . , tienen los mismos valores trigonométricos:
sen (θ ± 2πn) = sen θ , cos (θ ± 2πn) = cos θ . (3.12)
Además, la tangente se repite cada media vuelta,
tg (θ ± πn) = tg θ . (3.13)
Figura 3.9
Vemos que, mientras que cada ángulo corresponde a un punto en el cı́rculo, cada
punto corresponde a un número infinito de ángulos. En la Figura 3.9 se muestran las
gráficas del seno, coseno y tangente.3
Funciones periódicas
Una función con la propiedad
f (x ± a) = f (x) (3.14)
se llama función periódica de x con periodo a. Las funciones seno y coseno son pe-
riódicas con periodo 2π, la tangente es periódica con periodo π. Las curvas del seno y
del coseno de la Figura 3.9 se llaman ondas armónicas, y las funciones son la base de
la descripción de todos los tipos de ondas y otros movimientos oscilatorios.
EJEMPLO 3.7 Una onda armónica que se mueve en la dirección x positiva (una onda plana) se representa
por la función de ondas
x
φ(x, t) = A sen 2π − νt
λ
(o por una función coseno equivalente), y se muestra en la Figura 3.10 a tiempo t = 0.
Figura 3.10
La distancia más corta entre puntos equivalentes de la curva (el periodo con respecto a cambios en x) es la
longitud de onda λ. La velocidad de propagación de la onda es v = λν, siendo ν la frecuencia, o número de
oscilaciones por unidad de tiempo, y 1/ν es el periodo (temporal) τ , el tiempo de una oscilación completa.
El número A es la amplitud de la onda.
03. La gráfica de la función seno fue dibujada por vez primera en 1635 por Gilles Personne de Ro-
berval (1602-1675).
3.2. Relaciones trigonométricas 57
EJEMPLO 3.8 Para el oscilador armónico simple (véase el Ejemplo 2.20 y el Apartado 12.5) la ecuación
del movimiento clásica es la segunda ley del movimiento de Newton, que dice que la fuerza ejercida sobre
un cuerpo es igual a la masa del cuerpo multiplicada por la aceleración:
f = ma .
En este caso, la fuerza es f = −kx y la aceleración es la derivada segunda de la distancia con respecto al
tiempo (véase el Capı́tulo 4 sobre derivación):
d2 x
−kx = m .
dt2
Ésta es una de las ecuaciones de segundo orden más sencillas (Capı́tulo 12) y una solución es
x(t) = A cos ωt ,

k
donde A, la amplitud, es el desplazamiento máximo con respecto al equilibrio y ω = se denomina la
m
frecuencia angular. El desplazamiento x(t) es periódico con respecto al tiempo con periodo
2π 1
τ = = ,
ω ν

1 k
siendo ν = la frecuencia de oscilación. La gráfica del desplazamiento frente al tiempo es muy
2π m
similar a la de la Figura 3.10.
3.2. Relaciones trigonométricas

Las reglas del seno y del coseno
Los ángulos y lados de un triángulo están relacionados por dos reglas:
regla del seno
sen a sen b sen c

= = , (3.15)
a b c
regla del coseno
a2 = b2 + c2 − 2bc cos a . (3.16)

Figura 3.11
Demostraciones
Para la regla del seno, utilizando la Figura 3.12, la demostración es:

h h
sen a = , sen c = ,
c a
de manera que
sen a sen c
h = c sen a = a sen c y = . Figura 3.12
a c
Similarmente para el tercer ángulo y lado.
Para la regla del coseno, de la Figura 3.12 y del teorema de Pitágoras,
a2 = h2 + (b − x)2 = h2 + b2 + x2 − 2bx , c2 = h2 + x2 ,
y la regla se cumple puesto que x = c cos a.
EJEMPLO 3.9 Dadas las longitudes a = 2, c = 3 y el ángulo b = π/3 del triángulo de la Figura 3.11,
halle el tercer lado y los otros ángulos.
Dados dos lados y su ángulo, utilizamos la regla del coseno para hallar b:
b2 = a2 + c2 − 2ac cos b = 9 + 4 − 12 cos π/3

√
y cos π/3 = 1/2. Por lo tanto b2 = 9 + 4 − 6 = 7 y b = 7.
Para hallar los otros dos ángulos usamos la regla del seno. Por ejemplo,
sen b sen a
= ,
b a
de manera que
a sen b 2 sen π/3 3
sen a = = √ = .
b 7 7
Por lo tanto a ≈ 40,89◦ (con una calculadora de bolsillo) y c ≈ 180◦ − 60◦ − 40,89◦ = 79,11◦ .
Identidades de ángulos compuestos

Los senos y cosenos de la suma y de la diferencia de dos ángulos son
sen (x + y) = sen x cos y + cos x sen y ,

sen (x − y) = sen x cos y − cos x sen y , (3.17)
cos (x + y) = cos x cos y − sen x sen y ,

cos (x − y) = cos x cos y + sen x sen y . (3.18)
Además, tomando x = y,
sen 2x = 2 sen x cos x (3.19)

cos 2x = cos2 x − sen2 x
= 1 − 2 sen2 x = 2 cos2 x − 1 , (3.20)
donde hemos obtenido las expresiones alternativas para cos 2x a partir de
sen2 x + cos2 x = 1 .
3.2. Relaciones trigonométricas 59
EJEMPLO 3.10 Exprese sen 5θ y sen θ en función de los senos y cosenos de 2θ y 3θ.
sen 5θ = sen (3θ + 2θ) = sen 3θ cos 2θ + cos 3θ sen 2θ ,
sen θ = sen (3θ − 2θ) = sen 3θ cos 2θ − cos 3θ sen 2θ .
EJEMPLO 3.11 Exprese sen 3θ cos 2θ en función de sen θ y sen 5θ.

De las ecuaciones (3.17) se deduce que
1
sen x cos y = [sen (x + y) + sen (x − y)] (3.21)
2
y por lo tanto
1
sen 3θ cos 2θ = [sen 5θ + sen θ] .
2
EJEMPLO 3.12 Exprese sen 3θ sen 2θ y cos 3θ cos 2θ en función de cos θ y cos 5θ.
De las ecuaciones (3.18) se deduce que
1
sen x sen y = [cos (x − y) − cos (x + y)]
2
(3.22)
1
cos x cos y = [cos (x − y) + cos (x + y)]
2
y por lo tanto
1
sen 3θ sen 2θ = [cos θ − cos 5θ]
2
1
cos 3θ cos 2θ = [cos θ + cos 5θ] .
2
π π
EJEMPLO 3.13 Exprese sen ± θ y cos ± θ en función de sen θ y de cos θ.
2 2
De las ecuaciones (3.17) π
π π
sen± θ = sen cos θ ± cos sen θ .
2 2 2
π π
La Figura 3.9 muestra que sen = 1 y que cos = 0 (véase también el Ejemplo 3.5). Por lo tanto
2 2
π
sen ± θ = cos θ .
2
De manera similar, usando las ecuaciones (3.18),
π π π
cos ± θ = cos cos θ ∓ sen sen θ
2 2 2
= ∓ sen θ .
Las expresiones para la suma y la diferencia de ángulos son importantes para el cálculo
de integrales (véase el Capı́tulo 6) y para describir la combinación (interferencia) de
ondas.
EJEMPLO 3.14 La onda armónica que se mueve en la dirección x positiva descrita en el Ejemplo 3.7 y
representada en la Figura 3.20 tiene como función de ondas
x
φ+ = A sen 2π − νt .
λ
La función de la misma onda pero moviéndose en la dirección opuesta es
x
φ− = A sen 2π + νt .
λ
Si las ondas se superponen, éstas interfieren y producen una nueva onda cuya función de ondas es una
combinación lineal de la forma
ψ = aφ+ + bφ−
x x
= aA sen 2π − νt + bA sen 2π + νt .
λ λ
Utilizando las expresiones (3.17) para los senos de la suma y la diferencia de ángulos,

2πx 2πx
ψ = a A sen cos 2πνt − A cos sen 2πνt
λ λ

2πx 2πx
+ b A sen cos 2πνt + A cos sen 2πνt
λ λ
2πx 2πx
= (a + b)A sen cos 2πνt − (a − b)A cos sen 2πνt .
λ λ
Un caso especial importante se obtiene para a = b = 1:
2πx
ψ = 2A sen cos 2πνt .
λ
2πx
Esto se denomina una onda estacionaria. Su forma viene dada por el factor dependiente de x: 2A sen ,
λ
como se muestra en la Figura 3.13.
Figura 3.13
Es una interferencia constructiva. La amplitud se dobla pero no hay cambio en la longitud de onda. El
movimiento temporal viene dado por la función periódica cos 2πνt. La onda oscila con frecuencia ν, pero
las posiciones de los nodos (ceros) de la onda no se mueven. La onda es, por lo tanto, estacionaria en el
espacio.
3.3. Coordenadas polares 61
3.3. Coordenadas polares

La posición de un punto en el plano puede especificarse por sus coordenadas con
respecto a un sistema de referencia dado (véase el Apartado 2.2), como se muestra en la
Figura 3.14.
Figura 3.14
La figura muestra que la posición del punto P puede especificarse no sólo por sus coor-
denadas cartesianas (x, y), sino también por el par de números (r, θ), la distancia r al
punto del origen y el ángulo θ que da la orientación de la recta OP con respecto a la di-
rección x positiva (con el convenio habitual del signo). Los números r y θ se denominan
coordenadas polares del punto en el plano.4 Mientras que las coordenadas cartesia-
nas pueden tomar cualquier valor positivo o negativo, r es necesariamente positivo, con
valores r = 0 hasta ∞, y el ángulo θ toma valores θ = 0 hasta 2π.
Los dos conjuntos de coordenadas están relacionados por cos θ = x/r y sen θ = y/r,
de manera que
x = r cos θ y = sen θ (3.23)
y la conversión de coordenadas polares a cartesianas es sencilla.
EJEMPLO 3.15 Halle las coordenadas cartesianas de un punto cuyas coordenadas polares son r = 2 y
θ = π/6. Utilizando los valores que aparecen en la Tabla 3.2,
π √
x = r cos θ = 2 cos = 3
6
π
y = r sen θ = 2 sen = 1 .
6
Las coordenadas polares pueden obtenerse a partir de las dos ecuaciones

y
r2 = x2 + y2 , tg θ = . (3.24)
x
04. En su Methodus fluxionum (Método de fluxiones), escrito alrededor de 1671, Newton sugiere
ocho nuevos tipos de sistemas de coordenadas. Las coordenadas polares fueron su ‘séptima manera, para
espirales’.
Sin embargo, por ser tg θ una función periódica con periodo π, estas ecuaciones no
definen el ángulo de manera unı́voca, y hay que tener cierto cuidado al convertir de
coordenadas cartesianas a polares.
EJEMPLO 3.16 Halle las coordenadas polares (r, θ) del punto cuyas coordenadas cartesianas son (x, y) =
(– 1, 2).
√ y
r 2 = x 2 + y2 = 5 , r = + 5, tg θ = = −2 .
x
Usando las teclas de tangente inversa en una calculadora de bolsillo obtenemos el ángulo θ ≈ −63◦ ,
pero esto está obviamente equivocado porque este ángulo está en el cuarto cuadrante (véase la Figura 3.5)
mientras que el punto (– 1, 2) está en el segundo cuadrante, con 90◦ < θ < 180◦ . El ángulo correcto
se obtiene haciendo uso de la periodicidad de tg θ: sumar 180◦ al valor calculado nos da el ángulo en el
segundo cuadrante (≈ 117◦ ) con el mismo valor para la tangente (véase también el Ejemplo 3.18).
3.4. Funciones trigonométricas inversas

Si y = sen x, entonces x es el ángulo cuyo seno es y; x viene dada por la función
inversa del seno
x = sen−1 y . (3.25)
Dada la posible confusión entre la notación para la inversa del seno, sen−1 y, y el in-
verso del seno, (sen y)−1 , a menudo se usa una notación alternativa para las funciones
trigonométricas inversas:
arcsen y = sen−1 y , arccos y = cos−1 y , arctg y = tg−1 y . (3.26)
Las funciones inversas son funciones multivaluadas. Por ejemplo, como se indica en la
Figura 3.15, muchos ángulos tienen el mismo seno:
sen x = sen (π − x) = sen (x ± 2nπ) . (3.27)
Figura 3.15
3.5. La función exponencial 63
Para superar esta ambigüedad, se define un valor principal para cada función inversa:
π π
x = arcsen y , − ≤x≤ ,
2 2
x = arccos y , 0 ≤ x ≤ π, (3.28)
π π
x = arctg y , − ≤x≤ .
2 2
Son los valores que se calculan, por ejemplo, en una calculadora de bolsillo o en un
ordenador.
EJEMPLO 3.17
π √
π 13π 3
cos = cos − = cos = ··· = .
6 6 6 2
El valor principal de la función inversa es
√
3 π
arccos = .
2 6
En una transformación de coordenadas cartesianas a coordenadas polares, el ángulo θ

viene dado por θ = arctg (y/x). El valor concreto de θ se determina por el cuadrante en
el cual está el punto (x, y). Por ejemplo, si x > 0 el punto está en el primer cuadrante
o en el cuarto, y el ángulo es el valor principal. Si x < 0 el ángulo es igual al valor
principal más π.
EJEMPLO 3.18 Como en el Ejemplo 3.16, halle las coordenadas polares (r, θ) del punto cuyas coorde-
nadas cartesianas son (x, y) = (– 1, 2).
√
r 2 = x 2 + y2 = 5 , r = + 5,
y
tg θ = = −2 , θ = arctg (– 2) + π ,
x
donde arctg (– 2) es el valor principal. El punto está en el segundo cuadrante y θ es el valor de arctg θ que
está entre π/2 y π. Esto es, θ = [el valor principal + π].
3.5. La función exponencial

Una función exponencial es de la forma
f (x) = ax , (3.29)
en la cual el número a se llama la base de la función y la variable x es el exponente.

El ejemplo más conocido es la función 10x que, cuando x es un entero, se utiliza para
representar los números en el sistema decimal. La función exponencial que aparece en
estadı́stica y en las ciencias fı́sicas, la función exponencial, es
exp (x) = ex (3.30)

en la cual la base e es el número de Euler (véase el Apartado 1.3). La función se define

mediante la serie infinita (véase el Capı́tulo 7)5

∞
xn x x2 x3 x4
ex = =1+ + + + + ··· (3.31)
n=0
n! 1! 2! 3! 4!
El valor de la función exponencial puede calcularse a partir de la serie con cualquier pre-
cisión deseada, aunque el número de términos necesarios aumenta rápidamente cuando
|x| aumenta (véase el Ejemplo 1.6 para x = 1).
EJEMPLO 3.19 Calcule exp (– 2x2 ) con 8 cifras significativas para x = 0,1.
El valor de la exponencial se obtiene directamente sustituyendo x por (– 0,02) en (3.31). De manera alter-
nativa,
(– 2x2 ) (– 2x2 )2 (– 2x2 )3 (– 2x2 )4 (– 2x2 )5
exp (– 2x2 ) = 1 + + + + + + ···
1! 2! 3! 4! 5!
4 2 4
= 1 − 2x2 + 2x4 − x6 + + x8 − x10 + · · ·
3 3 15
Sustituyendo x = 0,01, y usando para los cálculos intermedios dos cifras significativas más de las 8 pedidas,
exp (– 0,02) ≈ 1 − 0,02 + 0,0002 − 0,0000013333 + 0,0000000067 − 0,3 × 10−10 + · · ·

Los términos van decreciendo rápidamente en magnitud, y los cinco primeros son suficientes (compárese
con el Ejemplo 1.6):
exp (– 0,02) ≈ 0,98019867 .
Figura 3.16
05. En su influyente libro de texto Introductio in analysin infinitorum de 1748, Euler definió las fun-
ciones exponencial y logarı́tmica mediante series infinitas, y demostró que eran funciones inversas una de
la otra. En su libro, Euler sentó las bases para la rama de las matemáticas denominada análisis, el estudio
de los procesos infinitos, como en las series infinitas y en el cálculo.
3.5. La función exponencial 65
En la Figura 3.16 mostramos las gráficas de ex y de su recı́proca e−x . Las gráficas de

todas la funciones exponenciales son muy similares, con propiedades (para todo a > 0)
a0 = 1, ax → ∞ cuando x → ∞, ax → 0 cuando x → −∞ . (3.32)
Veremos en el Capı́tulo 4 que la propiedad singular de ex es que la pendiente de su gráfica

en cualquier punto es igual al valor de la función en ese punto:
dex
= ex . (3.33)
dx
La función exponencial aparece en casi todas las ramas de la matemática aplicada, in-
cluyendo estadı́stica, cinética, teorı́a electromagnética, mecánica cuántica y mecánica
estadı́stica.
EJEMPLO 3.20 Crecimiento y decrecimiento exponenciales

El crecimiento exponencial surge cuando la tasa de crecimiento de un sistema es proporcional en cada
instante de tiempo al tamaño del sistema en ese tiempo. Si x(t) es el tamaño en el instante t, entonces (véase
el Capı́tulo 4) la tasa de variación de x es
dx
= ±kx(t)
dt
con el signo + para crecimiento y − para decrecimiento. El factor de proporcionalidad k se llama constante
de proporcionalidad. La solución de la ecuación diferencial es
x(t) = x0 e±kt ,
donde x0 es el tamaño en el instante t = 0. Como ejemplo, consideremos un sistema cuyo tamaño x se dobla
tras cada intervalo de tiempo τ . Empezando con un tamaño x = x0 , el tamaño después del tiempo τ es 2x0 ,
después del tiempo 2τ es 4x0 , después del tiempo 3τ es 8x0 , etcétera. Después de un tiempo t,
x = 2t/τ x0 .
Igualando esto con la solución de la ecuación diferencial, vemos que la constante de proporcionalidad k es
inversamente proporcional al intervalo de tiempo τ , k = (ln 2)/τ , donde ln 2 es el logaritmo natural del
número 2 (véase más abajo).
EJEMPLO 3.21 Orbitales atómicos

El orbital 1s para un electrón en el estado fundamental del átomo de hidrógeno es
ψ = e−r ,
siendo r la distancia del electrón al núcleo. Todos los orbitales del átomo de hidrógeno son de la forma
ψ = f (x, y, z)e−ar
donde (x, y, z) son las coordenadas cartesianas del electrón, relativas al núcleo en el origen, y a es una
constante. La función f (x, y, z) es un polinomio en x, y y z, y determina la forma del orbital. Por ejemplo,
f = z da un orbital px .
EJEMPLO 3.22 La distribución normal

La distribución normal o gaussiana en estadı́stica se describe mediante la función densidad de probabilidad

1 1 x − µ 2
p(x) = √ exp −
σ 2π 2 σ
donde µ es la media y σ es la desviación estándar de la distribución. La función de probabilidad constituye la
base para el análisis estadı́stico de un amplio sector de fenómenos como, por ejemplo, el análisis de errores
de los resultados de experimentos en las ciencias fı́sicas, el análisis muestral en estudios de poblaciones y
el análisis muestral para control de calidad en la industria manufacturera.
3.6. La función logarı́tmica

La función logarı́tmica6 es la función inversa de la exponencial:
si y = ax entonces x = loga y (3.34)
y se dice que loga y es el logaritmo en base a de y. Las funciones logarı́tmicas más

importantes son el logaritmo común, de base 10,
y = 10x , x = log10 y = log y , (3.35)
y el logaritmo natural (o logaritmo neperiano), de base e,
y = ex , x = loge y = ln y . (3.36)
Para representar el logaritmo común se usa a menudo el sı́mbolo log, omitiendo la base
10; y para el logaritmo natural casi siempre se utiliza el sı́mbolo ln.
EJEMPLOS 3.23
23 = 8 , 3 = log2 8 ,
103 = 1000 , 3 = log10 1000 ,
10−2 = 0,01 , −2 = log 0,01 ,
e3 = 20,0855 . . . , 3 = ln e3 = ln 20,0855 . . . ,
30 = 1 , 0 = log3 1 .
Nota: el logaritmo de 1 en cualquier base es cero.
06. John Napier o Neper (1550-1617), barón escocés y matemático aficionado, publicó su invento de
lo que llamó logaritmos en la Mirifici logarithmorum canonis descriptio (Una descripción del maravilloso
canon de los logaritmos) en 1614. Los logaritmos de Napier se basaban en un logaritmo de 107 = 0. La
primera tabla de logaritmos comunes, con log 1 = 0 y log 10 = 1, fue publicada tras consultas con Napier
por Henry Briggs (1561-1630), profesor de geometrı́a de Oxford, en la Arithmetica logarithmica de 1624.
Los logaritmos simplificaron mucho los cálculos que implicaban multiplicaciones y divisiones.
3.6. La función logarı́tmica 67
Las propiedades de combinación de los logaritmos son las propiedades de los exponentes
de las correspondientes exponenciales. Para el logaritmo natural:
ln x + ln y = ln xy , (3.37)
x
ln x − ln y = ln , (3.38)
y
ln xn = n ln x . (3.39)
EJEMPLO 3.24 Suma de logaritmos. Para demostrar la ecuación (3.37),

sean x = ea , y = eb , de manera que xy = ea+b .
Entonces, por la definición (3.36),
a = ln x, b = ln y, a + b = ln xy .
Por lo tanto ln x + ln y = ln xy.
EJEMPLOS 3.25 Combinaciones de logaritmos
ln 2 + ln 4 = ln (2 × 4) = ln 8 , ln 30 = ln (2 × 3 × 5) = ln 2 + ln 3 + ln 5 ,
6
ln 6 − ln 3 = ln = ln 2 , ln 23 = 3 ln 2 = ln 2 + ln 2 + ln 2 ,
3
1 −1 1
ln = ln 2 = − ln 2 , ln = ln 1 − ln 2 = 0 − ln 2 = − ln 2 ,
2 2
1 1
ln 27 = ln (27)1/3 = ln 3 , −2 ln 5 = ln 5−2 = ln .
3 25
EJEMPLO 3.26 Simplifique la expresión

ln (1 − x2 ) + ln (1 + x)−1 − ln (1 − x) .
Usando la regla ln x = n ln x, se deduce que ln (1 + x)−1 = − ln (1 + x). Entonces
n
ln (1 − x2 ) + ln (1 + x)−1 − ln (1 − x) = ln (1 − x2 ) − ln (1 + x) − ln (1 − x)

(1 − x2 ) 1 − x2
= ln = ln
(1 + x)(1 − x) 1 − x2
= ln 1 = 0 .
EJEMPLO 3.27 Lo que no hay que hacer.

Un error sorprendentemente habitual es tomar
ln (x + y) = ln x + ln y .
Esto no es en general cierto. Por ejemplo,
ln (1 + 2) = ln 3 pero ln 1 + ln 2 = ln 2 ( ln 1 = 0) .
Los únicos casos en los cuales ln (x + y) = ln x + ln y son cuando x + y = xy, esto es, cuando x = y/(y − 1).
La gráfica de ln x y la de su función inversa ex se muestran en la Figura 3.17.7
Figura 3.17
Las gráficas de todas las funciones logarı́tmicas son similares, con propiedades
log 1 = 0, log x → +∞ cuando x → ∞, log x → −∞ cuando x → 0 . (3.40)
Señalamos que el log x (real) no está definido para valores negativos de x.

Antes del invento del microchip y de la calculadora de bolsillo al comienzo de los
años 1970, el logaritmo común se utilizaba principalmente como una ayuda para rea-
lizar multiplicaciones y divisiones largas. Por ejemplo, la multiplicación de números se
puede sustituir por la suma de sus logaritmos. Ahora hay sólo unas pocas aplicaciones
de log10 en las ciencias fı́sicas, por ejemplo en las definiciones de pH como una medida
de la concentración del ion hidrógeno, y de pK donde K es una constante de equilibrio.
EJEMPLO 3.28 pH como una medida de la concentración del ion hidrógeno
El pH de una solución acuosa se define como
pH = − log10 [H+ ] ,
donde [H+ ] es la “concentración de iones hidrógeno” en unidades de mol dm−3 (moles por litro). Entonces
[H+ ] = 10−pH mol dm−3 .
Por ejemplo, un pH de 7 (neutro) corresponde a [H+ ] = 10−7 mol dm−3 .
07. La gráfica de una función log fue dibujada por vez primera en 1646 por Evangelista Torricelli
(1608-1647).
3.7. Valores de las funciones exponencial y logarı́tmica 69
El pH es un ejemplo de la utilización del logaritmo como una escala de medida. Otros

ejemplos de escalas logarı́tmicas son la escala de Richter para la ‘intensidad de terremo-
tos’, la escala en belios para intensidad de sonido, y la escala de magnitudes estelares.
El logaritmo aparece en numerosas expresiones de propiedades y procesos fı́sicos, y
el logaritmo común todavı́a se emplea en la literatura cientı́fica y en los libros de texto.
La conversión a logaritmos naturales viene dada por
ln x = ln 10 × log10 x ≈ 2,30258093 . . . × log10 x . (3.41)
Tabla 3.3
x ln x x ln x ex e−x
0 −∞ 0 1 1
.. .. .. .. ..
. . . . .
despacio
.. .. .. .. ..
. . . . .
10−6 −13,8 −0,00001 1,000001 0,9999990
10−3 −6,9 −0,007 1,001 0,37
1 0 0 2,7 0,9990
10 2,3 23 2 × 104 5 × 10−5
102 4,6 460 3 × 1043 4 × 10−44
.. ..
103 6,9 6908 . .
.. .. .. .. ..
. . . . .
despacio rápido rápido
.. .. .. .. ..
. . . . .
∞ ∞ ∞ ∞ 0
3.7. Valores de las funciones exponencial y logarı́tmica

La Tabla 3.3 muestra los valores de ln x, x ln x, ex , y e−x para un amplio intervalo de
valores de x.
Podemos sacar las siguientes conclusiones a partir de la tabla.
(a) ln x varı́a despacio en comparación con x. De hecho varı́a más despacio que cualquier
potencia de x:
cuando x → 0, ln x → −∞ pero xa ln x → 0 , (3.42)
cuando x → ∞, ln x → ∞ pero x−a ln x → 0 , (3.43)
para cualquier valor positivo de a, por pequeño que sea.

(b) ex varı́a rápidamente en comparación con x. De hecho varı́a más rápido que cualquier
potencia de x:
cuando x → ∞, ex → ∞ y x−a ex → ∞ , (3.44)
cuando x → ∞, e−x → 0 y xa e−x → 0 , (3.45)
para cualquier valor positivo de a, por grande que sea.
EJEMPLO 3.29 Gráficas para xe−x y para x−1 ex .
Figura 3.18 Figura 3.19
La Figura 3.18 muestra que mientras que e−x decrece monótonamente al crecer x, la función xe−x primero
crece y alcanza un máximo antes de que el decrecimiento exponencial se haga dominante. Este es un
comportamiento caracterı́stico de los orbitales atómicos. Un orbital 1s es de la forma e−r , siendo r la
distancia desde el núcleo, pero todos los demás orbitales se comportan con la distancia como rl e−r , donde
l es un entero positivo.
3.8. Funciones hiperbólicas

Las funciones hiperbólicas tienen su origen en geometrı́a en la descripción de las
propiedades de la hipérbola. Las propiedades de las funciones se deducen fácilmente de
las propiedades de las otras funciones trascendentes descritas en este capı́tulo, y sólo se
tratan aquı́ brevemente.
Se definen el coseno y el seno hiperbólicos a partir de la función exponencial como
1 x 1 x
cosh x = e + e−x , senh x = e − e−x . (3.46)
2 2
Mostramos sus gráficas en la Figura 3.20.
3.8. Funciones hiperbólicas 71
Figura 3.20
Tanto la notación como las propiedades de las funciones hiperbólicas siguen las de las
funciones trigonométricas (circulares). Por ejemplo,
cosh2 x − senh2 x = 1 ,
senh (x ± y) = senh x cosh y ± cosh x senh y , (3.47)
cosh (x ± y) = cosh x cosh y ± senh x senh y .
Las funciones se llaman ‘hiperbólicas’ porque, si x = a cosh t e y = a senh t son las

coordenadas de un punto, siendo t un parámetro, entonces por la primera ecuación de
(3.47)
x2 − y2 = a2
y ésta es la ecuación de una hipérbola.
Las funciones hiperbólicas inversas

Las funciones hiperbólicas inversas se definen de la misma manera que las funcio-
nes trigonométricas inversas. Por ejemplo, si x = cosh y entonces y = arccosh x. Esas
funciones pueden expresarse a partir de la función logarı́tmica:
√
arccosh x = ln x ± x2 − 1 ,
√
arcsenh x = ln x + x2 + 1 ,
(3.48)
1 1+x
arctgh x = ln .
2 1−x
La relación para arccosh muestra que hay dos valores de la función para cada valor de
x ( > 1). Esos dos valores difieren sólo en un signo, y se define el valor positivo como
valor principal.
EJEMPLO 3.30 Veamos que

arccosh x = ln x ± x2 − 1 .
√
Si x = cosh y, entonces, como cosh2 y − senh2 y = 1, deducimos que senh y = ± x2 − 1 y

ln x ± x2 − 1 = ln cosh y + senh y = ln ey
por las definiciones (3.46). El resultado se obtiene puesto que ln ey = y = arccosh x.
3.9. Ejercicios
Apartado 3.1
1. El triángulo rectángulo ABC tiene lados a = 12 y b = 5. Halle c y los sen, cos, tg,
cosec, y cotg de los ángulos internos A y B.
2. Exprese los siguiente ángulos en radianes: 5◦ , 87◦ , 120◦ , 260◦ .

3. Exprese los siguiente ángulos en grados: π/10, 3π/8, 7π/8, 9π/80.
4. Utilice las propiedades de los triángulos rectángulos isósceles para demostrar que
√
sen π/4 = cos π/4 = 1/ 2 .
5. Dibuje unos diagramas para demostrar que sen (π − θ) = sen θ y que cos (π − θ) = − cos θ.
6. Use las entradas de la Tabla 3.2 para hallar el sen, cos y tg de los ángulos
(i) 3π/4, (ii) 5π/4, (iii) 7π/4 .
7. Halle los periodos y esboce las gráficas de las funciones
(i) sen 2x, (ii) cos 3x, (iii) sen 2x + cos 3x .
Apartado 3.2
√
8. Dados los lados a = 2, b = 3 y el ángulo interno c = π/4 del triángulo
ABC, halle el tercer lado y los otros dos ángulos.
9. Exprese (i) sen 4θ y (ii) cos 4θ en función de sen 2θ y cos 4θ.

10. Exprese (i) cos 5θ y (ii) cos θ en función de los senos y cosenos de 2θ y 3θ.
11. Exprese cos 4x en función de sen x.
12. Exprese (i) sen 5x cos 3x y (ii) sen 5x sen 3x en función de los senos y cosenos de 8x y 2x.
13. Dados sen 10◦ = 0,1736, sen 30◦ = 1/2, sen 50◦ = 0,7660, halle cos 20◦ (sin usar calculadora).
14. Halle todos los valores de x para los cuales cos 3x = 0.
15. La función
2πx 2πx
φ(x) = a sen + b cos
λ λ
3.9. Ejercicios 73
representa la superposición de dos ondas armónicas con la misma longitud de onda λ. Demuestre que φ
también es armónica con la misma longitud de onda, y puede escribirse como

2πx
φ(x) = A sen +α
λ
√
donde A = a2 + b2 y tg α = b/a.
Apartado 3.3
16. Halle las coordenadas cartesianas de los puntos cuyas coordenadas polares son
(i) r = 3 , θ = π/3 , (ii) r = 3 , θ = 2π/3 .
17. Halle las coordenadas polares de los puntos cuyas coordenadas cartesianas son
(i) (3, −2) , (ii) (– 3, −2) .
18. Una solución de las ecuaciones del movimiento para el oscilador armónico es, según el Ejemplo 3.8,
x(t) = A cos ωt. Demuestre que x(t) puede interpretarse como la coordenada x de un punto que se mueve
con velocidad angular ω constante en un cı́rculo en el plano xy, con centro en el origen y radio A.
Apartado 3.4
1 1
19. Halle los valores principales de arcsen 2
, arcsen (1), arccos 2
, arccos (– 1).
20. La ecuación de Bragg para la reflexión de la radiación con longitud de onda λ en los planos de un
cristal es nλ = 2d sen θ, donde d es la separación entre los planos, θ el ángulo de incidencia de la radiación
y n un entero. Calcule los ángulos θ para los cuales los rayos X de longitud de onda 1,5 × 10−10 m son
reflejados por planos separados 3,0 × 10−10 m.
Apartado 3.5
21. Dibuje la gráfica de e−2x para valores −3 ≤ x ≤ 10.
22. (i) Desarrolle e−x/3 en potencias de x hasta términos en x5 .
(ii) Use la expresión para calcular un valor aproximado de e−1/3 . Determine cuántas cifras signi-
ficativas de este valor son correctas y dé su respuesta con ese número de cifras.
23. Para un sistema compuesto de N moléculas idénticas, la distribución de Boltzmann
ni
= ei /kT
N
da la fracción promedio de moléculas en el estado molecular i con energı́a i .
(i) Muestre que el cociente ni /nj de las poblaciones de los estados i y j depende únicamente de la
diferencia de energı́as entre los dos estados.
(ii) ¿Cuál es el cociente para dos estados de igual energı́a (estados degenerados)?
Apartado 3.6
24. Exprese lo siguiente como el log de un único número:
(i) ln 2 + ln 3 (ii) ln 2 − ln 3 (iii) 5 ln 2 (iv) ln 3 + ln 4 − ln 6
25. Simplifique:
(i) ln x3 − ln x (ii) ln (2x3 − 3x2 ) + ln x−2 (iii) ln (x5 − 3x2 ) + 2 ln x−1 − ln (x3 − 3)
2
+3
(iv) ln ex (v) ln ex − ln e3
26. La fórmula barométrica

p = p0 e−Mgh/RT
da la presión de un gas de masa molar M a la altitud h, cuando p0 es la presión al nivel del mar. Exprese h
en función de las otras variables.
27. El potencial quı́mico de un gas a presión p y temperatura T es
f
µ = µ−
◦
+ RT ln
p−◦
donde f = γp es la fugacidad y γ la constante de fugacidad. Exprese p como una función explı́cita de las
otras variables.
Derivación
4.1. Conceptos
En las ciencias fı́sicas nos interesa el valor de una cantidad fı́sica y cómo se relacio-
na con otras cantidades fı́sicas en cualquier estado de un sistema. Además, nos interesa
cómo varı́a el valor de la cantidad fı́sica al pasar de un estado a otro, y la tasa de varia-
ción con respecto al tiempo o con respecto a alguna otra cantidad fı́sica.
Consideremos la ecuación de estado de los gases ideales
pV = nRT .
Como cada una de las cuatro variables p, V, T y n puede expresarse en función de las
otras tres, el estado del sistema queda determinado por tres de las cuatro cantidades. Si
la temperatura T varı́a en una cantidad ∆T (que leemos como ‘delta de t’), manteniendo
la presión p y la cantidad de materia n fijas, el volumen cambia de
nRT nR(T + ∆T)

V= a V + ∆V =
p p
y la variación en el volumen es
nR
∆V = ∆T .
p
La Figura 4.1 muestra que la gráfica de V frente a T (a p y n constantes) es una lı́nea

recta con gradiente, o pendiente,
∆V nR
= = constante.
∆T p
El gradiente es la variación de V por unidad de variación de T, o la tasa de variación de

V con respecto a T.
Si se varı́a la presión p del gas en una cantidad ∆p a T y n constantes, el cambio en el
volumen es
nRT nRT ∆p
∆V = − = −nRT .
p + ∆p p p(p + ∆p)
76 Capı́tulo 4. Derivación
La Figura 4.2 muestra que la gráfica de V frente a p (a T y n constantes) no es una lı́nea

recta. El gradiente en cada punto se define como el gradiente de la tangente a la curva en
ese punto. El gradiente varı́a de un punto a otro, y no viene dado por ∆V/∆p.
La rama de las matemáticas que trata de la determinación de gradientes y, por lo
tanto, de tasas de variación es el cálculo diferencial.
4.2. El proceso de derivación

Supongamos que el valor de una variable x varı́a de manera continua de p a q. La
diferencia (q − p) se llama variación o incremento de x. En cálculo diferencial esta
variación se denota por*
∆x = q − p . (4.1)
Vemos que ∆x > 0 si q > p, y ∆x < 0 si q < p.

Sea y = f (x) una función de x que varı́a de manera continua y regular desde el punto
P al punto Q (Figura 4.3).
Figura 4.3
0* A veces, si la variación en x se supone ‘pequeña’, se usa δx en vez de ∆x.

4.2. El proceso de derivación 77
Los valores de y en P y en Q son yP = f (p) e yQ = f (q). La variación ∆y en y correspon-

diente a variar ∆x en x es por lo tanto
yQ − yP = ∆y = f (q) − f (p) .
La cantidad
yQ − yP ∆y
= (4.2)
q−p ∆x
es el gradiente de la recta PQ, y puede interpretarse como la tasa de variación promedio

de y con respecto a x entre P y Q.
De manera más general, si la variable varı́a en ∆x desde p = x hasta q = x + ∆x, la
correspondiente variación en la función es la cantidad
∆y = f (x + ∆x) − f (x) (4.3)
y la tasa de variación promedio correspondiente es
∆y f (x + ∆x) − f (x)
= . (4.4)
∆x ∆x
EJEMPLO 4.1 Una función cuadrática general, y = ax2 + bx + c:
En el punto P yP = f (x) = ax2 + bx + c .

En el punto Q yQ = f (x + ∆x) = a(x + ∆x)2 + b(x + ∆x) + c .
El cambio en la función al pasar de P a Q es por lo tanto
∆y = yQ − yP = [a(x + ∆x)2 + b(x + ∆x) + c] − [ax2 + bx + c]

= (2ax + b)∆x + a(∆x)2
y el gradiente de la recta PQ es
∆y
= (2ax + b) + a∆x . (4.5)
∆x
La Figura 4.4 muestra cómo cambia la cantidad ∆y/∆x cuando el punto Q se mueve
sobre la curva hacia P (cuando ∆x disminuye en magnitud).
Al moverse Q hacia P pasando por Q , el gradiente de la recta PQ se acerca al gradiente
de la tangente en P. Expresamos esto como

∆y
gradiente en P = lim (4.6)
Q→P ∆x
(que leemos como ‘el lı́mite cuando Q tiende a P’).

Figura 4.4
Al mismo tiempo, la magnitud de ∆x tiende a cero, ∆x → 0 cuando q → p, y el lı́mite

puede expresarse como1

∆y
gradiente en P = lim . (4.7)
∆x→0 ∆x
EJEMPLO 4.2 Para la función cuadrática y = ax2 + bx + c del Ejemplo 4.1,

∆y ∆y
= (2ax + b) + a∆x de manera que lim = 2ax + b .
∆x ∆x→0 ∆x
El lı́mite es una función de x, y da la pendiente o gradiente de la curva en cada valor x (cada punto de la
curva).
El proceso de tomar el lı́mite en (4.7) se llama derivación. En cálculo diferencial, el

dy
lı́mite se denota por el sı́mbolo :2
dx

dy ∆y f (x + ∆x) − f (x)
= lim = lim (4.8)
dx ∆x→0 ∆x ∆x→0 ∆x
01. Este método de hallar la tangente en un punto de una curva es esencialmente el dado por Fermat
en su Método para hallar máximos y mı́nimos hacia 1630. Su obra marca el principio del cálculo diferen-
cial. Un método similar al de Fermat, pero utilizando cantidades equivalentes a ∆x y ∆y, fue descrito por
Barrow en Lectiones geometricae, publicado en 1670. En esas lecciones Isaac Barrow (1630-1677), teólogo
y profesor de geometrı́a de Cambridge, daba una descripción ‘puesta al dı́a’ de los métodos infinitesimales.
La formulación del método de las tangentes fue incluida ‘por consejo de un amigo’, Newton, quien fue su
sucesor en la cátedra cuando Barrow se convirtió en capellán del rey Carlos II de Inglaterra en 1669.
02. La notación proviene de la formulación de Leibniz del cálculo. Gottfried Wilhelm Leibniz (1646-
1716), filósofo, diplomático y matemático, descubrió su formulación del cálculo en los años 1672-1676
mientras servı́a como diplomático en Parı́s, donde estuvo bajo la influencia del fı́sico y matemático Ch-
ristiaan Huygens, inventor del reloj de péndulo. Su primera descripción del cálculo diferencial fue Nova
methodus pro maximis et minimis, itemque tangentibus (Un nuevo método para máximos y mı́nimos, y
también para tangentes), publicado en 1684.
4.3. Continuidad 79
(que leemos como ‘dy sobre dx’). Se lo llama coeficiente diferencial de la función
dy
o, sencillamente, derivada de la función. Señalamos que el sı́mbolo no significa
dx
‘dy’ dividido por la cantidad ‘dx’. El sı́mbolo representa el lı́mite, y el hecho de tomar
el lı́mite, dado por el último miembro de (4.8). Una representación alternativa para la
derivada de la función f (x) es f (x):
df (x)
f (x) = . (4.9)
dx
Otra representación es Df , por la que se supone que la derivada de f se obtiene actuando
(operando) sobre f con el operador diferencial D,
d df
D= , Df = . (4.10)
dx dx
El concepto de operadores diferenciales, y de otros tipos, tiene amplio uso en las ciencias
fı́sicas y será tratado en capı́tulos posteriores.
4.3. Continuidad
En la exposición del Apartado 4.2, al tomar el lı́mite, supusimos que la función y =
f (x) era una función continua de x, y que el lı́mite definido por la ecuación (4.8) existı́a
y era único. Hablando en términos generales, una función es continua si su gráfica es
una curva sin interrupciones. Podemos comprobar la continuidad en un punto, digamos
x1 , de una función dada y = f (x) haciendo que la variable independiente x se mueva
continuamente desde la derecha y desde la izquierda hacia el punto especificado x1 como
se muestra en la Figura 4.5.
Figura 4.5
Si f (x1 + ∆x) y f (x1 − ∆x) tienden ambos al mismo valor f (x1 ) cuando ∆x → 0, se dice
que la función es continua en x1 , y escribimos
lim f (x) = f (x1 ) . (4.11)

x→x1
Si esto es cierto para todo valor de x1 en un cierto intervalo a ≤ x1 ≤ b, entonces la

función es continua en el intervalo. La Figura 4.6 ilustra tres tipos de discontinuidades.
Figura 4.6
Punto a. La función tiene una discontinuidad finita en x = a. Por ejemplo, la función

x+1 si x > 0
f (x) = x − 1 si x ≤ 0
es discontinua en x = 0, donde su valor es −1. Sin embargo, si nos acercamos al punto

x = 0 por la derecha, f (x) tiende al valor +1.
Punto b. La función tiene una discontinuidad infinita en x = b. Si nos acercamos a este

punto por la izquierda, el valor de la función tiende a −∞. Si nos acercamos por la de-
recha la función tiende a +∞. Infinito no es un número, y la función no está definida en
x = b. Un ejemplo es 1/(x − 1), discontinua en x = 1.
Punto c. La función tiende a infinito si nos acercamos al punto x = c por ambos lados.
Por ejemplo 1/x2 en x = 0.
En estos tres casos, la naturaleza de las discontinuidades es evidente a partir de la
gráfica. Se dice que son discontinuidades esenciales. En algunos casos, sin embargo, la
discontinuidad no resulta evidente a partir de la gráfica. Por ejemplo, la función f = x/x
tiene valor constante igual a 1 para todo valor x = 0, pero no está definida en x = 0
porque 0/0 es indeterminado y no tiene sentido. Tal discontinuidad se dice evitable. Si
redefinimos la función de manera que f (x) = x/x si x = 0 y f (x) = 1 si x = 0, entonces
la función se vuelve continua para todo valor de x. La discontinuidad se evita sin cambiar
la función salvo en un punto aislado.
4.4. Lı́mites
Sea la función racional
x2 − 4
y=
x−2
4.4. Lı́mites 81
que es continua para todo valor de x salvo x = 2. La Tabla 4.1 muestra que, mientras que
el numerador y el denominador tienden ambos a cero cuando x = 2, su cociente tiende
al valor y = 4 cuando x → 2 por ambos lados:
2
x −4
lim = 4.
x→2 x−2
Tabla 4.1 Valores de y = (x2 − 4)/(x − 2)
x 2,1 2,01 2,001 2,0001 ... 1,9999 1,999 1,99 1,9
y 4,1 4,01 4,001 4,0001 ... 3,9999 3,9990 3,990 3,90
Este es un ejemplo de una singularidad evitable. Tenemos
x2 − 4 (x − 2)(x + 2)
= =x+2 si x = 2
x−2 x−2
y la discontinuidad se evita redefiniendo la función para que valga y = 4 cuando x = 2.

Este ejemplo es importante porque tomar el lı́mite para derivar supone siempre hacer
que el denominador tienda a cero.
El cálculo de los lı́mites es necesario siempre que una cantidad se hace indeterminada.
Además del caso 0/0, las indeterminaciones más habituales en las ciencias fı́sicas son
∞/∞ y (∞ − ∞).
EJEMPLO 4.3

2x2 + 5
lim = 2.
x→∞ x2 + 3x
El numerador y el denominador tienden ambos a infinito cuando x → ∞, pero el cociente permanece finito.
Entonces, dividiendo numerador y denominador por x2 , lo cual está permitido si x = 0, tenemos
2x2 + 5 2 + 5/x2 2
= −→ = 2 cuando x → ∞.
x2 + 3x 1 + 3/x 1
EJEMPLO 4.4
2 2
1 1
lim 2x + − 3x − = 10 .
x→0 x x
Los términos al cuadrado tienden ambos a infinito cuando x → 0, pero la diferencia se mantiene finita.
Desarrollando los cuadrados y simplificando, tenemos
2 2
1 1 1 1
2x + − 3x − = 4x 4
+ 4 + − 9x 2
− 6 +
x x x2 x2
= −5x4 + 10 −→ 10 cuando x → 0.
EJEMPLO 4.5
lim [ln (2x + 3) − ln (x − 2)] = ln 2 .
x→∞
Por las propiedades de los logaritmos,

2x + 3
ln (2x + 3) − ln (x − 2) = ln −→ ln 2 cuando x → ∞.
x−2
4.5. Derivación a partir de primeros principios

Decimos que una función es derivable en un punto si el lı́mite, ecuación (4.8),

dy ∆y f (x + ∆x) − f (x)
= lim = lim (4.8)
dx ∆x→0 ∆x ∆x→0 ∆x
existe y es finito. Para que esto sea cierto, una condición necesaria es que la función
sea continua en el punto, pero no todas las funciones continuas son derivables en todas
partes. Por ejemplo, la función

x si x≥0
f (x) = |x| = −x si x<0
es continua en todos los valores de x pero según se ve en la Figura

4.7 su pendiente cambia abruptamente en x = 0, pasando del Figura 4.7
valor −1 cuando x < 0 al valor +1 para x ≥ 0.
La función tiene un punto cúspide en x = 0 y su derivada no está definida por la

ecuación (4.8).
En general, una función es derivable si es continua y ‘regular’, sin discontinuida-
des esenciales ni cúspides. Para una función de ese tipo, tomar el lı́mite en la ecuación
(4.8) se denomina derivación a partir de primeros principios, y ha sido ilustrado en
los Ejemplos 4.1 y 4.2 para una función cuadrática general. Todas las funciones pueden
derivarse de esta manera. Sea y = f (x) una función de x, y supongamos que la función
cambia de y a y + ∆y = f (x + ∆x) cuando la variable cambia de x a x + ∆x. Los pasos
para derivar a partir de primeros principios son:
(1) restar y de y + ∆y para obtener ∆y como una función de x y de ∆x, y simplificar

cuanto sea posible,
(2) dividir ambos miembros de la ecuación por ∆x,
∆y dy
(3) hallar el lı́mite de cuando ∆x → 0. Esto da la derivada pedida .
∆x dx
4.6. Derivación a partir de reglas 83
dy 1
EJEMPLO 4.6 Halle a partir de primeros principios para y = .
dx x
1 1
(1) y = f (x) = , y + ∆y = f (x + ∆x) = ,
x x + ∆x
1 1 −∆x
∆y = f (x + ∆x) − f (x) = − = .
x + ∆x x x(x + ∆x)

∆y −1 dy ∆y 1
(2) = . (3) = lim =− 2.
∆x x(x + ∆x) dx ∆x→0 ∆x x
√
EJEMPLO 4.7 Derive x.
√ √
(1) y = x, y + ∆y = x + ∆x .
√ √ √ √
√ √ x + ∆x − x x + ∆x + x
∆y = x + ∆x − x = √ √
x + ∆x + x
(x + ∆x) − x ∆x
= √ √ = √ √
x + ∆x + x x + ∆x + x
(usando la relación (a − b)(a + b) = a2 − b2 ).

∆y 1 dy ∆y 1
(2) = √ √ . (3) = lim = √ .
∆x x + ∆x + x dx ∆x→0 ∆x 2 x
EJEMPLO 4.8 Derive ex .
(1) y = ex , y + ∆y = ex+∆x = ex e∆x .

De la definición de la función exponencial como una serie infinita,
(∆x)2
y + ∆y = ex (1 + ∆x + + ··· )
2
y, por lo tanto,
(∆x)2 (∆x)2
∆y = ex (1 + ∆x + + · · · ) − ex = ex (∆x + + ··· ).
2 2
∆y ∆x dy
(2) = ex (1 + + ··· ). (3) = ex .
∆x 2 dx
4.6. Derivación a partir de reglas

Mientras que toda función puede ser derivada a partir de primeros principios, en la
práctica la derivación se hace siguiendo un conjunto de reglas.3 Esas reglas se demues-
tran a partir de primeros principios, como en los Ejemplos 4.6 a 4.8. En la Tabla 4.2
presentamos las derivadas de las funciones elementales más importantes.
03. Muchas de las reglas de derivación aparecı́an en la obra de Leibniz de 1684 sobre cálculo dife-
rencial, con la notación d y la apelación calculus differentialis para el cálculo de las tangentes.
Tabla 4.2 Derivación de funciones elementales
Tipo Función Derivada
c = constante c 0
potencia de x xa axa−1
trigonométrico sen x cos x
cos x − sen x
tg x sec2 x
exponencial ex ex
hiperbólico cosh x senh x
senh x cosh x
logarı́tmico ln x 1/x
Tabla 4.3 Derivación de combinaciones de funciones
Tipo Regla
d du
1. múltiplo de una función (a u) = a
dx dx
d du dv
2. suma de funciones (u + v) = +
dx dx dx
d dv du
3. regla del producto (uv) = u + v
dx dx dx
d u du dv 2
4. regla del cociente = v −u v
dx v dx dx
d df du
5. regla de la cadena f (u) = ·
dx du dx
dx 1 dx dy
6. regla de la inversa (uv) = o bien × =1
dy dy dy dx
dx
El primer ejemplo de la Tabla 4.2 dice que la tasa de variación de una constante es cero.
En general, si una función es independiente de una variable x entonces su derivada con
Isaac Newton (1642-1727) desarrolló sus ideas sobre el cálculo en el año 1665-1666 (el Trinity College
de Cambridge estaba cerrado por la peste). Después mantuvo que durante ese tiempo descubrió el teorema
binomial, el cálculo, la ley de la gravedad y la naturaleza de los colores. Escribió el primero de tres trabajos
sobre el cálculo en 1696 en De analysi per aequationes numero terminorum infinitas, pero lo publicó sólo
en 1711. El primer trabajo publicado apareció en 1687 en Philosophiae naturalis principia mathemati-
ca, probablemente el tratado cientı́fico más influyente de todos los tiempos. En la primera edición de los
Principia Newton reconocı́a que Leibniz tenı́a también un método similar. Para cuando apareció la tercera
edición, la referencia a Leibniz habı́a sido suprimida cuando la cuestión de la precedencia habı́a conducido
a una amarga disputa entre seguidores de ambos hombres.
respecto a x es cero. Ejemplos de la derivada de una ‘potencia’ de x se han visto en los

Ejemplos 4.6 para a = −1 y 4.7 para a = 1/2.
Otros ejemplos son (usando distintas notaciones)
dy
y = x5 , = 5x4 .
dx
f (x) = x−1/2 , f (x) = − 21 x−3/2 .
d
f (x) = x0,3 , f (x) = 0,3 x−0,7 .
dx
Las reglas para derivar combinaciones de funciones elementales se resumen en la
Tabla 4.3. En esas reglas, x es la variable independiente, y, u y v son funciones de x, y a
es una constante.
Combinaciones lineales de funciones

Una combinación lineal de las funciones de x: u, v y w, tiene la forma
y = au(x) + bv(x) + cw(x) (4.12)
donde a, b y c son constantes. Esta función puede derivarse término a término: usando
las Reglas 1 y 2 de la Tabla 4.2,
dy du dv dw
=a +b +c . (4.13)
dx dx dx dx
Por ejemplo,
y = 2x3 + 3ex − 12 ln x ,
dy d d 1d 1 1
= 2 x3 + 3 ex − ln x = 2 × 3x2 + 3 × ex − ×
dx dx dx 2 dx 2 x
1
= 6x + 3e −
2 x
.
2x
Para el ejemplo del gas ideal presentado en el Apartado 4.1,

nRT dV d 1 1 −nRT
V= , = nRT = nRT − 2 = ,
p dp dp p p p2
puesto que, a T y n constantes, nRT es constante. Señalamos que mientras que V es

inversamente proporcional a p, es directamente proporcional a 1/p. Esto es, V es una
función lineal de 1/p, y la gráfica de V frente a 1/p es una lı́nea recta con pendiente
dV/d(1/p) = nRT.
Regla del producto

La función
y = (2x + 3x2 )(5 + 7x3 )
puede derivarse considerándola como el producto y = uv con u = (2x + 3x2 ) y v =

(5 + 7x3 ). Entonces, por la Regla 3 de la Tabla 4.3,
dy dv du
= u +v
dx dx dx
d d
= (2x + 3x2 ) (5 + 7x3 ) + (5 + 7x3 ) (2x + 3x2 )
dx dx
= (2x + 3x )(21x ) + (5 + 7x )(2 + 6x)
2 2 3
que ahora se puede simplificar. En este ejemplo es igual de sencillo multiplicar primero
el producto original y derivar término a término, pero en muchos casos usar la fuerza
bruta es más complicado que usar la regla del producto. Por ejemplo, la función
y = (2x + 3x2 ) sen x
se deriva fácilmente sólo si se utiliza la regla del producto. Tomando y = uv con u =

(2x + 3x2 ) y v = sen x,
dy dv du
= u +v
dx dx dx
d d
= (2x + 3x2 ) sen x + sen x (2x + 3x2 )
dx dx
= (2x + 3x2 ) cos x + (2 + 6x) sen x .
Regla del cociente

Para la función
2x + 3x2
y=
5 + 7x3
tomamos y = u/v, siendo u = (2x + 3x2 ) y v = (5 + 7x3 ). Entonces, por la Regla 4 de la

Tabla 4.3,
dy du dv 2
= v −u v
dx dx dx
(5 + 7x3 )(2 + 6x) − (2x + 3x2 )(21x2 )
= .
(5 + 7x3 )2
Regla de la cadena (función de una función)

El polinomio
y = f (x) = (2x2 − 1)3
puede derivarse desarrollando primero el cubo y luego derivando término a término:
y = (2x2 − 1)3 = 8x6 − 12x4 + 6x2 − 1 ,

dy
= 48x5 − 48x3 + 12x = 12x(2x2 − 1)2 .
dx
Una forma más sencilla es utilizando la regla de la cadena. Definimos u = 2x2 − 1 y
reescribimos y como función de u:
y = g(u) = u3 .
Entonces por la Regla 5 de la Tabla 4.3,
dy dy du
= · = (3u2 )(4x)
dx du dx
y, sustituyendo el valor de u,
dy
= 12x(2x2 − 1)2 .
dx
En este ejemplo hemos considerado y de dos maneras:
(i) como una función de x, f (x) = (2x2 − 1)3 ;

(ii) como una función de u, g(u) = u3 siendo u la función u = 2x2 − 1. La sustitución
u = 2x2 − 1 pone de manifiesto la estructura de la función, un cubo, y hace que la
regla de la cadena sea el método natural para derivar.
EJEMPLOS 4.9 Regla de la cadena
1. y = (2x2 − 1)5/2 = u5/2 , siendo u = 2x2 − 1 :

dy dy du
= · = ( 25 u3/2 )(4x) = 10x(2x2 − 1)3/2 .
dx du dx
2. y = sen (2x2 − 1) = sen u, siendo u = 2x2 − 1 :
dy dy du
= · = ( cos u)(4x) = 4x cos (2x2 − 1) .
dx du dx
2
−1
3. y = e2x = eu , siendo u = 2x2 − 1 :
dy dy du 2
= · = (eu )(4x) = 4xe2x −1 .
dx du dx
4. y = ln (2x2 − 1) = ln u, siendo u = 2x2 − 1 :

dy dy du 1 4x
= · = (4x) = 2 .
dx du dx u 2x − 1
5. y = ln ( sen x) = ln u, siendo u = sen x :

dy dy du 1 cos x
= · = ( cos x) = = cotg x .
dx du dx u sen x
Estos ejemplos ilustran la generalización de la Tabla 4.2 a la derivación de funciones

elementales de una función. En la Tabla 4.4, u es una función de x.
Tabla 4.4 Regla de la cadena
Tipo Función Derivada
du
potencia de u ua aua−1
dx
du
trigonométrico sen u cos u
dx
du
cos u − sen u
dx
2 du
tg u u
dx
du
exponencial eu eu
dx
1 du
logarı́tmico ln u
u dx
du
Un caso especial importante es u = ax, para el cual = a. Por ejemplo,
dx
d d ax
sen (ax) = a cos (ax) , e = a eax .
dx dx
Vemos sin embargo que, como ln (ax) = ln a + ln x y ln a es constante,
d d d 1
ln (ax) = ( ln a + ln x) = ln x = .
dx dx dx x
Funciones inversas
Si y = f (x), la función inversa de f se define como x = f −1 (y). Por la Regla 5 de la
Tabla 4.3, las derivadas de la función y de la función inversa están relacionadas por
dy dx d d
· = f (x) · f −1 (y) = 1 .
dx dy dx dy
La regla de la inversa
dx 1
= (4.14)
dy dy
dx
se utiliza cuando es más difı́cil derivar la función que su inversa. Por ejemplo, si y se
define implı́citamente como
x = y5 − 2y
dy dx
(véase el Ejemplo 2.12), puede hallarse entonces como la inversa de :
dx dy
dx dy 1
= 5y4 − 2, = 4 .
dy dx 5y − 2
En la Tabla 4.5 se dan ejemplos particularmente importantes de la derivación de fun-

ciones inversas, donde se toman los valores principales de las funciones trigonométricas
inversas.
Tabla 4.5
d x 1
arcsen =√ 2
dx a a − x2
d x −1
arccos =√ 2
dx a a − x2
d x a
arctg = 2
dx a a + x2
x
Por ejemplo, si y = arcsen , entonces x = a sen y y tenemos
a
dx dy 1
= a cos y, = .
dy dx a cos y
π π
Si tomamos el valor principal, y está entre −y , y cos y es positivo. Entonces
2 2

√
a cos y = a 1 − sen2 y = a2 − a2 sen2 y = a2 − x2
dy 1
=√ 2 .
dx a − x2
Las derivadas de las funciones hiperbólicas inversas (Apartado 3.8) aparecen en la Tabla
4.6.
Tabla 4.6
d x 1
arccosh =√ 2
dx a x − a2
d x 1
arcsenh =√ 2
dx a x + a2
d x a
arctgh = 2
dx a a − x2
x
Por ejemplo, si y = arcsenh , entonces x = a senh y y tenemos
a
dx dy 1
= a cosh y, = .
dy dx a cosh y

√
Como cosh y > 0 (véase la Figura 3.20), a cosh y = a 1 + senh2 y = a2 + x 2 , y
dy 1
=√ 2 .
dx a + x2
4.7. Funciones implı́citas

Toda relación funcional entre dos variables x e y puede expresarse en forma implı́cita
(véase el Apartado 2.4) como
f (x, y) = 0 . (4.15)
En todos los ejemplos de aplicaciones de las reglas de derivación presentados en el Apar-

tado 4.6 ha sido posible expresar por lo menos una de las variables como función explı́ci-
ta de la otra. En algunos casos, sin embargo, ninguna de las variables puede expresarse
ası́, y las reglas han de ser aplicadas a la propia función implı́cita. Supongamos que la
ecuación (4.15) define y como función de x. Entonces la variación en y que acompaña a
una variación de x es tal que la ecuación (4.15) se cumple siempre. De esto se deduce que
la tasa de variación de la función implı́cita f (x, y) es cero para toda variación admisible:
d
f (x, y) = 0 . (4.16)
dx
Por ejemplo, si
f (x, y) = y5 − 2y − x = 0
4.8. Derivada logarı́tmica 91
entonces
df d 5 d d
= (y ) − 2 (y) − (x)
dx dx dx dx
dy dy
= 5y4 − 2 − 1
dx dx
dy
= (5y − 2) − 1
4
dx
= 0.
dy
Despejando se obtiene
dx
dy 1
= 4 .
dx 5y − 2
Este es el resultado obtenido en el Apartado 4.6 derivando la función inversa.
4.8. Derivada logarı́tmica

Para algunas funciones es más fácil derivar el logaritmo natural que la propia función.
Por ejemplo, si
y = ua vb wc . . . (4.17)
donde u, v, w, . . . son funciones de x y a, b, c, . . . son constantes, entonces
ln y = a ln u + b ln v + c ln w + . . . (4.18)
d d d d
ln y = a ln u + b ln v + c ln w + . . .
dx dx dx dx
Por lo tanto,
1 dy a du b dv c dw
= + + + ... (4.19)
y dx u dx v dx w dx
Este método de derivación se denomina derivación logarı́tmica. Cuando y = uv el

método reproduce la regla del producto; cuando y = u/v, reproduce la regla del cociente.
EJEMPLOS 4.10 Derivada logarı́tmica

1/2
1+x
(i) y = , ln y = [ln (1 + x) − ln (1 − x)].
1−x
Entonces
d 1 dy 1 1 1 1
ln y = = + =
dx y dx 2 1+x 1−x 1 − x2
y, multiplicando ambos miembros por y,
1/2
dy 1 1+x 1
= = .
dx 1 − x2 1−x (1 + x)1/2 (1 − x)3/2
(ii) y = ax , ln y = x ln a.
Entonces
d 1 dy dy
ln y = = ln a y, por lo tanto, = ax ln a .
dx y dx dx
(iii) y = xx , ln y = x ln x.
Aplicando la regla del producto,
d d d
ln y = x ln x + ln x x = 1 + ln x
dx dx dx
y, por lo tanto,
1 dy dy
= 1 + ln x y = xx (1 + ln x) .
y dx dx
EJEMPLO 4.11 Representación logarı́tmica

Para un sistema que experimenta un decrecimiento exponencial (cinética de primer orden), el tamaño del
sistema viene dado por (véase el Ejemplo 3.20)
x(t) = x0 e−kt
y, tomando logaritmos en ambos miembros,
ln x = ln x0 − kt .
Una representación gráfica de ln x frente a t es una lı́nea recta con pendiente d( ln x)/dt = −k que corta el
eje t = 0 con valor ln x0 . Este ejemplo es importante porque ilustra el procedimiento estándar para calcular
la constante de proporcionalidad k a partir de la representación lineal de valores experimentales de x y t.
4.9. Derivadas sucesivas

La derivada de una función puede a su vez derivarse si cumple las condiciones de
continuidad y regularidad mencionadas en los Apartados 4.3 a 4.5. Por ejemplo, la fun-
ción cúbica
y = x 3 + x2 + x + 1
tiene como derivada (primera)
dy
= 3x2 + 2x + 1
dx
4.9. Derivadas sucesivas 93
y podemos derivar esto para obtener la derivada segunda, o segundo coeficiente dife-
rencial,
d dy d2 y
= 2 = 6x + 2 .
dx dx dx
Derivaciones sucesivas dan las tercera y cuarta derivadas
d3 y d4 y
= 6, = 0,
dx3 dx4
y en este caso todas las derivadas de orden superior son cero. Una notación alternativa es
(véase el Apartado 4.2) f (x), f (x), f (x) . . . para las derivadas de f (x), ó Df , D2 f , D3 f ,
d
. . . , siendo D el operador diferencial .
dx
Un polinomio de grado n tiene únicamente sus n primeras derivadas no nulas, pe-
ro otras funciones sencillas pueden derivarse indefinidamente. En particular, la función
exponencial ex tiene todas sus derivadas iguales a ex .
EJEMPLO 4.12 Derivadas de sen ax

f (x) = sen ax
f (x) = a cos ax
f (x) = −a2 sen ax = −a2 f (x)
...
En general, para la derivada n-ésima,
f (n) (x) = (– 1)n/2 an sen ax si n es par.
Por ejemplo, para n = 4,

f (4) (x) = (– 1)2 a4 sen ax = a4 sen ax .
Similarmente,
f (n) (x) = (– 1)(n−1)/2 an cos ax si n es impar.
Por ejemplo, para n = 3,
f (3) (x) = −a3 cos ax .
La derivada primera f (x) de una función f (x) da la tasa de variación de la función, o la

pendiente de su gráfica en el punto x. La derivada segunda f (x) es la tasa de variación
de la pendiente, y está relacionada con la curvatura en x.
4.10. Puntos estacionarios

Sea la función cúbica (Figura 4.8)
y = x(x − 3)2 .
La función tiende a ±∞ cuando x → ±∞, pero la

gráfica muestra que la función tiene un máximo local
en el punto A en x = 1 donde su valor es mayor que en
todos los puntos vecinos. La función tiene también un
mı́nimo (local) en el punto B en x = 3 donde su valor
es menor que en todos los puntos vecinos. Llamamos
puntos extremos a los de valores máximos o mı́nimos.
La determinación de los valores máximos y mı́nimos
de una función tiene importancia en las ciencias fı́sicas
porque, por ejemplo, (i) las ecuaciones de movimien-
to se formulan a menudo como ‘principios variaciona-
les’, donde las soluciones se obtienen como máximos o Figura 4.8
mı́nimos de alguna función variacional (véase el Ejem-
plo 4.15), (ii) el ajuste de una curva teórica a un conjunto de puntos experimentales puede
expresarse como un principio de ‘desviación mı́nima’, como en el método de mı́nimos
cuadrados presentado en el Capı́tulo 21.
Consideremos la curva en un entorno del máximo en el punto A de la Figura 4.8. A
la izquierda de A el gradiente es positivo y el valor de la función crece. A la derecha de
A el gradiente es negativo y la función decrece. En el propio punto A la función tiene
gradiente nulo (la tangente a la curva es horizontal), y la tasa de variación de y con
respecto a x es cero. El punto se llama un punto estacionario, y el valor de la función en
el punto se llama un valor estacionario. Consideraciones similares se aplican al mı́nimo
en B, y la condición general para un punto estacionario es que la derivada primera de la
función sea cero:
dy
=0 en un punto estacionario. (4.20)
dx
Para distinguir entre valores máximos y mı́nimos es necesario considerar la derivada
segunda. Al pasar por el máximo en A desde la izquierda hacia la derecha, el gradien-
te decrece desde valores positivos, pasando por cero en A, hasta valores negativos. Se
deduce que la tasa de variación del gradiente es negativa en A, y esto es una condición
suficiente para que la función tenga un valor máximo en ese punto:
dy d2 y
para un máximo: =0 y < 0. (4.21)
dx dx2
Consideraciones similares aplicadas al mı́nimo en B muestran que
dy d2 y
para un mı́nimo: =0 y > 0. (4.22)
dx dx2
Para la función cúbica de la Figura 4.8,
y = x(x − 3)2 = x3 − 6x2 + 9x ,

4.10. Puntos estacionarios 95
dy
= 3x2 − 12x + 9 = 3(x − 1)(x − 3) = 0 si x = 1 ó x = 3.
dx

dy2 < 0 si x = 1, un máximo,
= 6x − 12 > 0 si x = 3, un mı́nimo,
dx2 = 0 si x = 2, un punto de inflexión.
El punto C, en x = 2 en la Figura 4.8, es un ejemplo de un punto de inflexión, en el cual

dy2
el gradiente es un máximo o un mı́nimo, con 2 = 0. La pendiente de la curva decrece
dx
entre A y C y crece entre C y B, con valor mı́nimo en C. Este es un ejemplo de un punto
de inflexión sencillo con
dy dy2
= 0 y = 0.
dx dx2
dy dy2
Cuando en un punto = 0 y a la vez 2 = 0, la naturaleza del punto se determina
dx dx
mediante la primera derivada de orden superior no nula. Dos ejemplos son
dy d2 y d3 y
(i) = 0, = 0, = 0
dx dx2 dx3
(4.23)
(el sı́mbolo = significa ‘distinto de’). Esto es un punto de inflexión que es además un
punto estacionario (pero no un extremo), y es el caso comentado en el Ejemplo 4.13.
dy d2 y d3 y d4 y
(ii) = 0, = 0, = 0, = 0 .
dx dx2 dx3 dx4
(4.24)
Esto es un máximo o un mı́nimo, dependiendo del signo de la derivada cuarta. Por ejem-
plo, la función y = (x − 1)4 cumple (4.24), con un mı́nimo en x = 1.
EJEMPLO 4.13 Halle los puntos estacionarios de la función cuártica y = 3x4 − 4x3 + 1.
Para los puntos estacionarios,
dy
= 12x3 − 12x2 = 12x2 (x − 1)
dx
= 0 si x = 0 ó x = 1.
Para determinar el tipo de los puntos estacionarios,

d2 y = 0 si x = 0,
= 36x 2
− 24x
dx2 > 0 si x = 1, un mı́nimo.
Figura 4.9
Para determinar el tipo del punto estacionario en x = 0,
d3 y
= 72x − 24 = 0 si x = 0, un punto de inflexión.
dx3
La función tiene por lo tanto un único extremo, un mı́nimo, en x = 1, cuando y = 0, y un punto de inflexión
en x = 0, cuando y = 1. De hecho, la función puede factorizarse
y = (x − 1)2 (3x2 + 2x + 1)
y tiene una raı́z doble, x = 1, y dos raı́ces complejas.
EJEMPLO 4.14 En la teorı́a de orbitales moleculares de Hückel, los valores posibles de las energı́as
orbitales de los electrones π del eteno (C2 H4 ) vienen dados por los valores estacionarios de la cantidad
= α + 2c(1 − c2 )1/2 β
donde α y β son ‘parámetros de Hückel’ constantes, y c es una variable. Para los valores estacionarios de ,
d
= 2(1 − c2 )1/2 β − 2c2 (1 − c2 )−1/2 β = 0 .
dc
Dividiendo por 2β y multiplicando por (1 − c2 )1/2 tenemos
1
(1 − c2 ) − c2 = 0 , ó c = ±√ .
2
Por lo tanto
=α±β.
EJEMPLO 4.15 Ley de refracción de Snell4 en óptica geométrica
Figura 4.10
Un rayo de luz viaja entre los puntos P y Q cruzando una frontera entre dos fases en O. En la región superior,
la velocidad de la luz es v1 = c/η1 , siendo c la velocidad de la luz en el vacı́o y η1 el ı́ndice de refracción
de la fase. En la región inferior la velocidad de la luz es v2 = c/η2 . La ley de refracción de Snell es
04. Willebrord van Roijen Snell (1591-1626), matemático y fı́sico holandés, formuló la ley de refrac-
ción en 1621.
4.11. Movimientos lineal y angular 97
sen θ1 v1 η2
= = .
sen θ2 v2 η1
La ley puede deducirse de un ‘principio de tiempo mı́nimo’, de manera que el camino seguido es el de
menor tiempo.5 El tiempo total recorrido es (distancia/velocidad en cada fase),
r1 r2
t= + ,
v1 v2
donde
1/2 1/2 1/2
r1 = x1 2 + y1 2 , r2 = x2 2 + y2 2 = (X − x1 )2 + y2 2 ,
Entonces
dt 1 dr1 1 dr2 1 x1 1 x2 sen θ1 sen θ2
= + = − = −
dx1 v1 dx1 v2 dx2 v1 r1 v2 r2 v1 v2
= 0 dando un mı́nimo.
De ahı́ la ley de Snell.
4.11. Movimientos lineal y angular

La descripción del movimiento de los cuerpos en el espacio es una aplicación impor-
tante del cálculo diferencial. Consideramos únicamente los dos tipos de movimiento más
sencillos: movimiento en lı́nea recta y movimiento en un cı́rculo. Otros tipos generales
de movimiento se tratan en el Capı́tulo 16.
Movimiento lineal
Figura 4.11
Sea un cuerpo que se mueve en una lı́nea recta, pongamos que en la dirección x. Sea O
un punto fijo y sea P la posición del cuerpo a tiempo t. La distancia OP = x es entonces
una función del tiempo: x = f (t).
Si el cuerpo se mueve del punto x al punto x + ∆x en el intervalo de tiempo ∆t,
entonces la tasa promedio de variación de x en el intervalo es
∆x
= velocidad media en el intervalo ∆t .
∆t
05. Este uso del principio de tiempo mı́nimo, propuesto por Fermat, fue uno de los ejemplos utilizados
por Leibniz en su comunicación de 1684 para ilustrar su método para hallar máximos y mı́nimos.
El lı́mite de esto cuando ∆t → 0 es la tasa instantánea de variación de x con respecto a

t, y es la velocidad lineal o sencillamente la velocidad, en el instante t:
dx
velocidad = v = . (4.25)
dt
Cuando v es positivo, x crece y el cuerpo se mueve hacia la derecha. Cuando v es nega-
tivo, x decrece y el cuerpo se mueve hacia la izquierda. La velocidad es de hecho una
cantidad vectorial, con magnitud y dirección simultáneamente. Tratamos los vectores
en el Capı́tulo 16. La magnitud de la velocidad se llama, también, velocidad, o a veces
rapidez. La derivada de la velocidad es la aceleración,
dv d2 x
aceleración = = 2 . (4.26)
dt dt
Las derivadas con respecto al tiempo se escriben a menudo en ‘notación con puntos’:6
dx d2 x
v = ẋ = , v̇ = ẍ = . (4.27)
dt dt2
Movimiento angular
Sea un cuerpo que se mueve sobre el borde de un cı́rculo
de radio r. Sea O un punto fijo sobre el cı́rculo y suponga-
mos que la posición del cuerpo en el instante t viene dada
por el ángulo θ (Figura 4.12). La tasa de variación de θ con
respecto al tiempo se llama velocidad angular:
∆θ dθ
velocidad angular = ω = lim = = θ̇ . (4.28)
∆t→0 ∆t dt
Además, por estar la longitud de arco s relacionada con el Figura 4.12
ángulo subtendido por s = rθ, tenemos ṡ = rθ̇, o
v = rω , (4.29)
para la relación entre las velocidades lineal y angular en el movimiento circular (véase
el Capı́tulo 16 para un tratamiento más general de la velocidad por medio de vectores).
La aceleración angular es ω̇ = θ̈.
06. En su artı́culo de 1671 sobre el cálculo, Methodus fluxionum et serierum infinitorum, Newton
consideró que las variables, como x e y, eran cantidades que fluı́an, o fluentes, y escribió ẋ e ẏ para sus tasas
de variación, o fluxiones. Las fluxiones con puntos seguı́an usándose por los matemáticos ingleses cuando
George Peacock (1791-1858), John Herschel (1792-1871) y Charles Babbage (1792-1871), entonces estu-
diantes de Cambridge, fundaron la Analytical Society en 1813. Uno de los objetivos de la asociación era
promover ‘los principios del d-ismo puro frente a la Era del punto de la universidad’ (en inglés: dot-age,
pero también dotage, es decir, chocheo).
4.12. El diferencial 99
4.12. El diferencial
La derivada primera de una función y = f (x) se define por la ecuación (4.8) como

dy ∆y f (x + ∆x) − f (x)
= f (x) = lim = lim (4,8)
dx ∆x→0 ∆x ∆x→0 ∆x
dy
y, como hemos recalcado antes, el sı́mbolo no significa la cantidad dy dividida por
dx
dx, sino que representa el valor del lı́mite. En ese sentido f (x), o y , es una notación más
adecuada para la derivada. Resulta, sin embargo, tentador escribir
dy = f (x) dx
y, si se interpreta correctamente, ésta es una manera útil de describir las variaciones.

Consideremos la función cúbica
dy
y = f (x) = x3 , = f (x) = 3x2 .
dx
Sea ∆y la variación en y que acompaña la variación ∆x en x:
∆y = f (x + ∆x) − f (x)
= (x + ∆x)3 − x3
= 3x2 ∆x + 3x(∆x)2 + (∆x)3 .
dy
La derivada se obtiene dividiendo esta expresión por ∆x y tomando ∆x → 0. Otra
dx
manera de ver el lı́mite es considerar ∆x como una variación ‘muy pequeña’. Si ∆x
es suficientemente pequeño, entonces el término en (∆x)3 se hace mucho menor que el
término en (∆x)2 que, a su vez, es mucho menor que el término en ∆x,
(∆x)3 (∆x)2 ∆x .
Por ejemplo, ∆x = 10−3 , (∆x)2 = 10−6 y (∆x)3 = 10−9 . Una expresión aproximada
para el cambio en y es entonces
∆y ≈ 3x2 ∆x = f (x)∆x
y ésta es a menudo una manera útil de aproximar pequeñas variaciones. La cantidad

f (x)∆x serı́a la variación en y si ∆x fuese suficientemente pequeño. Resulta útil con-
siderar tales variaciones: una ‘variación infinitesimal’ (una variación arbitrariamente
pequeña) dx tal que los términos en (dx)2 y superiores pueden ser tomados como cero.
La correspondiente variación en y
dy = f (x) dx (4.30)
se denomina el diferencial de y.7

La utilización del diferencial se aclarará en capı́tulos posteriores. Resulta importante
en las ciencias fı́sicas porque los teoremas fundamentales se expresan algunas veces en
forma diferencial. En particular las leyes de la termodinámica casi siempre se expresan
mediante diferenciales.
EJEMPLO 4.16 Diferencial de área de un cı́rculo
El área de un cı́rculo como función del radio es
A(r) = πr2 .
Si el radio crece una cantidad ∆r, el correspondiente cambio en el área

es
∆A = π(r + ∆r)2 − πr2 = 2πr∆r + π(∆r)2
y este es el área de una corona circular de radio r y espesor ∆r. Cuando
∆r es suficientemente pequeño,
dA Figura 4.13
∆A ≈ 2πr∆r = ∆r .
dr
El ‘diferencial de área’ correspondiente es
dA = 2πr dr = circunferencia × ancho.
EJEMPLO 4.17 Forma diferencial de la Regla del Producto

Si y = uv, entonces la variación de y que acompaña variaciones en u y v es
∆y = (u + ∆u)(v + ∆v) − uv = u∆v + v∆u + (∆u)(∆v)
y la forma diferencial es:
dy = u dv + v du .
Si y, u y v son funciones de x, esta expresión es equivalente a la forma normal de la regla del producto.
‘Dividiendo por dx’ tenemos
dy dv du
=u +v .
dx dx dx
Una aplicación importante del diferencial es un procedimiento formal para cambiar la

variable independiente. Consideremos y = f (x) y su diferencial
dy = f (x) dx . (4.31)
Supongamos que x es función de alguna otra variable, t, tal que x = g(t) con diferencial
dx = g (t) dt . (4.32)
07. Leibniz formuló el cálculo mediante diferenciales. Su artı́culo de 1684 contiene las fórmulas
dxn = nxn−1 dx, para la variación infinitesimal o diferencial de xn , y dxy = xdy + ydx para la regla del
producto (véase el Ejemplo 4.17).
4.13. Ejercicios 101
Sustituyendo esto en (4.31) obtenemos
dy = f (x) dx = f (x)g (t) dt
o bien

dy dx
dy = · dt . (4.33)
dx dt
Esto es el diferencial de y con respecto a la variable t. Dividir por dt nos da entonces la

Regla de la Cadena:
dy dy dx
= · . (4.34)
dt dx dt
Aunque hay dificultades conceptuales con este tipo de manipulaciones con diferencia-
les (infinitesimales o ‘variaciones infinitamente pequeñas’), se puede demostrar que las
operaciones con diferenciales son el duplicado de métodos más rigurosos que requieren
variaciones finitas (∆ en vez de d) y lı́mites.
4.13. Ejercicios
Apartado 4.3
Halle las discontinuidades de las siguientes funciones e indique cuáles son discontinuidades esenciales y
cuáles evitables. Esboce las curvas.
1 x2 (x2 − 9) 2x
1. 2. 3. 4.
x−1 x (x + 3) x2 − 3x
ex sen x cos x
5. 6. 7.
x x x
Apartado 4.4
Halle los lı́mites:
x+1 x+1 x−1
8. lim 9. lim 10. lim
x→0 x + 3 x→∞ x+3 x→1 x2 − 1
x−1 x2 − 1 x2 + 4
11. lim 12. lim 13. lim
x→∞ x2 − 1 x→∞ x + 1 x→−2 x + 2

14. lim ln x − ln 2x 15. lim ln (x − 4) − ln (3x + 2)
x→0 x→∞
2x
e −1
16. lim 17. lim |x| ln |x| 18. lim x3 e−x/2

x→0 x x→0 x→∞
Apartado 4.5
Derive a partir de primeros principios:
19. x3 20. 1 21. 8x + 3
22. 2x2 + 3x + 4 23. 2/x2
Apartado 4.6
Derive usando la regla:
√
24. 2x3 − 4x2 25. 2x3/2 26. 3x1/3 27. 4x−1/2 28. 3/ x3
Regla de la cadena
√ 1
29. (1 + x)5 30. 2 + x2 31.
(3 − x2 )
3 2
32. 33. e−2x 34. e2x −3x+1
(2x2 − 3x − 1)1/2
35. ln (2x2 − 3x + 1) 36. sen 4x 37. tg 2x

38. cos (2x2 − 3x + 1) 39. esen x 40. ln (cos x)

− cos (3x2 +2) 2+x
41. e 42. ln 43. ln (sen 2x + sen2 x)
3−x
Productos y cocientes
44. 3x2 (2 + x)1/2 45. sen x cos 2x 46. tg 4x cos2 2x
2
+3 1 − x3 3x2
47. x2 e2x 48. 49.
2x + 5 (2 + x2 )1/2
Funciones inversas
1−x
50. arcsen 2x 51. arctg x2 52. arccos
1+x
dy
53. Si x = 2y2 − 3y + 1, halle .
dx
dV
Halle para las siguientes ecuaciones de estado. Suponga que T y n son constantes.
dp

nB
54. pV = nRT 1 + 55. p(V − nb) − nRT = 0
V

n2 a
56. p + 2 (V − nb) = nRT
V
Apartado 4.7
dy
Halle :
dx
57. x 2 + y2 = 4 58. y3 + 3x + x2 − 1 = 0 59. x = y ln xy
2
60. y2 + − x2 y2 + 3x + 2 = 0
y
Apartado 4.8
Derive: 1/3
3−x (1 + x2 )(x − 1)1/2
61. 62.
4+x (2x + 1)(3x2 + 2x − 1)1/3
63. sen1/2 x cos3 (x2 + 1) tg1/3 2x
64. Demuestre que las ecuaciones d ln p ∆Hvap dp p∆Hvap
= y =
dT RT 2 dT RT 2
son expresiones equivalentes a la ecuación de Clausius-Clapeyron.
Apartado 4.9
65. Halle todas las derivadas no nulas de la función y = 3x5 + 4x4 − 3x3 − x2 − 2x + 1.
dy d2 y d3 y d4 y
66. Halle , , , para la función y = ln x.
dx dx2 dx3 dx4
67. Halle la fórmula general para la derivada n-ésima de cos 2x.
Apartado 4.10
Halle los valores máximos y mı́nimos y los puntos de inflexión para las siguientes funciones. En cada caso
esboce la curva y muestre la posición de esos puntos.
68. y = x2 − 3x + 1 69. y = x3 − 7x2 + 15x − 9
70. y = 4x3 + 6x2 + 3 71. y = 2x5 − 5x4 + 3
72. El potencial de Lennard-Jones para la interacción de dos moléculas separadas una distancia R es
A B
U(R) = − 6
R12 r
donde A y B son constantes. La separación de equilibrio Re es aquel valor de R en el cual U(R) es mı́nimo
y la energı́a de enlace es De = −U(Re ).
Exprese (a) A y B en función de Re y De , y (b) U(R) en función de R, Re y De .
73. La probabilidad de que una molécula de masa m en un gas a temperatura T tenga velocidad v viene
dada por la distribución de Maxwell-Boltzmann
m 3/2 2
f (v) = 4π v2 e−mv /2kT
2πkT
donde k es la constante de Boltzmann.
Halle la velocidad más probable (para la cual f (v) es máxima).
k k
74. La concentración de la especie B en el proceso cinético A −→ 1
B −→ 2
C, consistente en dos reacciones
irreversibles de primer orden, viene dado por (cuando k1 = k2 )
[A]0 k1 −k1 t
[B] = e − e−k2 t
k2 − k1
(a) Halle el tiempo t, en función de las constantes cinéticas k1 y k2 , en el cual B tiene concentración máxima,
y (b) muestre que la concentración máxima es
k2 /(k2 −k1 )
k2
[B]max = [A]0 .
k1
Apartado 4.11
75. Una partı́cula que se mueve sobre una lı́nea recta recorre la distancia s = 2t2 − 3t en el tiempo t.
Halle la velocidad y la aceleración en el tiempo t. Describa el movimiento.
76. Una partı́cula que se mueve sobre la circunferencia de un cı́rculo de radio r = 2 recorre la distancia
s = 2t3 − 3t2 − 2t en el tiempo t. Halle la velocidad y la aceleración angulares alrededor del centro del
cı́rculo. Describa el movimiento.
Apartado 4.12
Halle el diferencial dy:
77. y = 2x 78. y = 3x2 + 2x + 1 79. y = sen x
80. El volumen de una esfera de radio r es V = 4πr /3. Deduzca el diferencial dV a partir de primeros
3
principios. Dé una interpretación del resultado.

Integración
5.1. Conceptos
Consideremos un cuerpo que se mueve a lo largo de una curva, desde el punto A en

el instante de tiempo t = tA hasta el punto B en el instante t = tB . Sea s(t) la distancia
en un instante de tiempo intermedio t sobre la curva desde A, como se representa en la
Figura 5.1.
Figura 5.1
Si v(t) es la velocidad sobre la curva en el instante t entonces, siguiendo lo expuesto

en el Apartado 4.11, v(t) = ds/dt; esto es, la velocidad es el gradiente de la gráfica de
la función s(t). Por lo tanto, si s(t) es una función conocida, obtenemos v(t) mediante
derivación. Recı́procamente, si v(t) es una función conocida, entonces s(t) es aquella
función cuya derivada es v(t); esto es, para hallar s(t) necesitamos invertir la derivación
ds/dt = v.
La distancia recorrida entre dos puntos es igual a la velocidad media multiplicada por
el tiempo empleado; para el movimiento representado en la Figura 5.1, la distancia AB
sobre la curva es por lo tanto
d = v̄ × (tB − tA ) , (5.1)
siendo v̄ el valor promedio (o medio) de v(t) entre A y B. Por ejemplo, si el cuerpo sufre
una aceleración constante desde v = vA en A hasta v = vB en B, como se muestra en la
106 Capı́tulo 5. Integración
Figura 5.2,1 la velocidad media es v̄ = (vB + vA )/2 y la distancia total recorrida es
1
d = (vB + vA ) × (tB − tA ) .
2
Figura 5.2
Se verifica inmediatamente que esta distancia es igual al área, representada en gris en la

figura, limitada por la recta v(t) y el eje ‘t’ entre tA y tB . Veremos que este último resultado
es válido para cualquier función velocidad v(t). Veremos también que la solución de
un problema fı́sico es a menudo equivalente a hallar el área encerrada por una curva
apropiada.
Este ejemplo ilustra los dos problemas centrales de las matemáticas europeas del
siglo XVII: el ‘problema de las tangentes’ y el ‘problema de la cuadratura’. El primero
de ellos, hallar las lı́neas tangentes a una curva arbitraria, condujo a la invención del
cálculo diferencial, tema del Capı́tulo 4. El segundo, hallar el área encerrada por una
curva dada, condujo a la invención del cálculo integral.2 La demostración por Leibniz y
01. Esta gráfica de la velocidad como una función del tiempo para un cuerpo que se mueve con
aceleración uniforme apareció en Quaestiones super geometriam Euclides por Nicole Oresme (hacia 1323-
1382), deán de la Catedral de Rouen y Obispo de Lisieux. Fue posiblemente la primera gráfica de una
cantidad fı́sica variable. Oresme también consideró la extensión de su ‘latitud de formas’ para representar
la ‘cualidad’ de una superficie por un cuerpo en tres dimensiones y ‘la cualidad de un cuerpo sin duda se
representará por algo que tiene cuatro dimensiones en otro tipo de cantidad’.
02. La integración tiene sus orı́genes en el ‘método de exhaustación’ griego para hallar áreas y
volúmenes. Arquı́medes, en su Cuadratura de la parábola atribuye el método a Eudoxio de Cnido (ha-
cia 408-355 a.C.). En el Método, descubierto en Constantinopla en 1906 después de haber estado ‘perdido’
durante más de mil años, Arquı́medes describe cómo un área plana puede ser considerada como la suma
de segmentos rectilı́neos. En 1586, Stevin describe cómo el baricentro de un triángulo puede obtenerse
considerando el área como constituida por un número alto de paralelogramos. Johan Kepler (1571-1630),
más conocido por su Astronomı́a nova de 1609, calculó áreas y volúmenes considerándolos compuestos por
infinitos elementos infinitesimales. Su trabajo sobre volúmenes apareció en 1615 en la Nova stereometria
doliorum vinariorum (Nueva geometrı́a sólida de barricas de vino). Galileo Galilei (1564-1642) utilizó lo
infinitamente pequeño en su trabajo sobre dinámica. Bonaventura Cavalieri (1598-1647), un discı́pulo de
Galileo, describió en su influyente Geometria indivisibilibus continuorum, 1635, cómo un área puede ser
entendida como constituida por lı́neas o ‘indivisibles’ y un volumen por áreas, y desarrolló un método
geométrico para hallar la integral de xn para enteros positivos n. Por la misma época, Fermat resolvió el
mismo problema para enteros positivos y negativos (excepto n = −1) y para fracciones dividiendo sus
áreas en bandas rectangulares adecuadas. El caso n = −1 fue tratado por Gregoire de Saint Vincent (1584-
1667). Roberval integró la función seno en 1635, y Torricelli la función log en 1646. Otras contribuciones
se deben a Pascal, de cuyo Traité des sinus du quart de cercle de 1658 dijo Leibniz que le inspiró su des-
5.2. La integral indefinida 107
por Newton de que la derivación y la integración son esencialmente operaciones inversas

es uno de los hitos de la historia de las matemáticas. El concepto de integración como
operación inversa de la derivación conduce a la definición de la integral indefinida. El
concepto de la integral como un área conduce a la definición de la integral definida.
5.2. La integral indefinida

dy
Sea y = F(x) una función cuya derivada con respecto a x es F (x) = . La integral
dx
indefinida de F (x) con respecto a x se define como

F (x) dx = F(x) + C , (5.2)
dy
donde C es una constante arbitraria. Por ejemplo, si y = x2 entonces = 2x, y la
dx
integral indefinida de la función 2x es

d 2
2x dx = x2 + C porque (x + C) = 2x .
dx

El sı́mbolo se llama signo de integración; es una ‘S’ (por suma) estirada y tiene su
origen en la formulación de Leibniz del cálculo integral. Su significado se hará patente
en el Apartado 5.4 cuando discutamos la integral como el lı́mite de una suma. La función
por integrar, F (x) en (5.2), se llama el integrando, x es la variable de integración y
dx se denomina el elemento de x. C es una constante arbitraria llamada constante de
integración. Se incluye como parte de la integral indefinida porque, dada y = F(x) con
derivada F (x), la función y + C también tiene por derivada F (x)
d dy dC dy
(y + C) = + = . (5.3)
dx dx dx dx
La Tabla 5.1 es una corta lista de ‘integrales estándar’ que incumben a algunas de las
más importantes funciones elementales (compárese con la Tabla 4.2). Cada entrada en
la lista puede ser comprobada por derivación del segundo miembro de la ecuación. Por
ejemplo,

d a 1 1
[ ln (ax + b) + C] = y por lo tanto dx = ln (ax + b) + C .
dx ax + b ax + b a
cubrimiento del Teorema Fundamental; a John Wallis (1616-1703), cuyo trabajo sobre procesos infinitos
influyó en Newton y a quien debemos el sı́mbolo ∞; al escocés James Gregory (1638-1675), cuyo traba-
jo sobre series infinitas y el cálculo anticipó el de Newton; y a Barrow, cuyas clases Newton siguió y de
quien Leibniz compró una copia de sus Lectiones durante una visita a Londres en 1673. El paso final en
la sı́ntesis del cálculo diferencial e integral fue dado por Newton (nota al pie 3, capı́tulo 4) y por Leibniz,
quien publicó la primera memoria de su cálculo integral, Analisi indivisibilium atque infinitorum (Análisis
de indivisibles e infinitos), en 1686.
En el Capı́tulo 6 se discuten los métodos generales de integración y otras integrales

estándar. Una lista más completa de integrales estándar figura en el Apéndice.
Tabla 5.1 Integrales elementales

xa+1
xa dx = + C, para a = −1
a+1

1 1
dx = ln (ax + b) + C
ax + b a

1 ax
eax dx = e +C
a

1
sen ax dx = − cos ax + C
a

1
cos ax dx = sen ax + C
a
EJEMPLOS 5.1 Integrales indefinidas

dx x−1 1
1. = x−2 dx = +C =− +C
x2 −1 x

dx x1/2 √
2. √ = x−1/2 dx = + C = 2x1/2 + C = 2 x + C
x 1/2

3. dx = 1 dx = x + C

1
4. cos 2x dx = sen 2x + C
2

1 2x
5. e2x dx = e +C
2

1
6. dx = ln (x + 3) + C
x+3

1
Señalamos que si tomamos C = ln b en (vi), entonces dx = ln (x + 3) + ln b = ln b(x + 3).
x+3

En cada caso, el efecto de la operación . . . dx es invertir el efecto de la derivación; la
integral de la derivada de una función recobra la función. Además, derivando ambos
miembros en la ecuación (5.2) tenemos

d d
F (x) dx = F(x) + C = F (x) (5.4)
dx dx
de manera que la derivada de la integral de una función recobra la función.

5.2. La integral indefinida 109
Una manera alternativa de describir la operación inversa de la derivación sin recurrir al simbolismo de
d
Leibniz, es utilizar el operador diferencial D = introducido en el apartado 4.2, con la propiedad
dx
DF(x) = F (x) .
El efecto de D sobre F(x) es transformarlo en su derivada F (x), y el operador inverso correspondiente D−1
se define con el efecto inverso al de D. Por lo tanto
D−1 F (x) = F(x) + C
es la expresión con operadores de la ecuación (5.2). Los operadores D y D−1 tienen la propiedad
DD−1 = D−1 D = 1
que es cierta para cada par de operadores inversos.
Valor de la constante de integración

En un problema real el valor de la constante de integración C en (5.2) se determina
por alguna condición auxiliar. Consideremos, por ejemplo, una curva cuyo gradiente en
cada punto viene dado por la función 2x. La ecuación de tal curva es

y = 2x dx = x2 + C . (5.5)
Esta ecuación representa una familia de curvas, con una curva para cada valor de C
(Figura 5.3).
Figura 5.3
Si se precisa que la curva pase por un punto concreto, el punto (1, 2) por ejemplo, la
condición auxiliar sobre (5.5) es que y = 2 cuando x = 1; esto es, 2 = 1 + C, de manera
que C = 1. Entonces, y = x2 + 1 es la ecuación de la curva particular cuyo gradiente
viene dado por dy/dx = 2x y que pasa por el punto (1, 2).
En capı́tulos posteriores veremos cómo, en un problema fı́sico, el valor de la cons-
tante de integración se determina por la naturaleza y el estado del sistema.
Dos reglas
1 Para un múltiplo de una función:

a u(x) dx = a u(x) dx . (5.6)
2 Para una suma de funciones:

u(x) + v(x) dx = u(x) dx + v(x) dx . (5.7)
De estas reglas se deduce que la integral de una combinación lineal de funciones,
f (x) = a u(x) + b v(x) + c w(x) + · · · (5.8)
puede escribirse como la suma de integrales

f (x) dx = a u(x) dx + b v(x) dx + c w(x) dx + · · · (5.9)
EJEMPLO 5.2 Integral de una combinación lineal de funciones

3x3 + 2 sen 3x − e−x dx = 3 x3 dx + 2 sen 3x dx − e−x dx

x4 1 3 2
=3× + 2 × − cos 3x − −e−x + C = x4 − cos 3x + e−x + C .
4 3 4 3
5.3. La integral definida

El cálculo integral fue inventado para resolver el problema de hallar el área encerrada
por una curva dada. En este apartado introducimos, sin prueba, la integral definida como
una medida del área, y mostramos cuál es su relación con la integral indefinida. Para
muchos problemas en las ciencias fı́sicas, esta breve introducción es suficiente. Sin em-
bargo, otros problemas requieren un conocimiento más minucioso del cálculo integral,
y volveremos a él en el Apartado 5.4.
Sea y = f (x) una función de x, continua en el intervalo a ≤ x ≤ b. El área sombreada
de la Figura 5.4 se conoce como área bajo la curva; es el área encerrada por la gráfica
de y = f (x), el eje x, y las verticales en x = a y x = b. En general, esta área es igual al
ancho, (b − a), multiplicado por el promedio ȳ de la altura de la curva por encima del eje
(el promedio del valor de la función entre a y b),
A = (b − a)ȳ . (5.10)
5.3. La integral definida 111
Figura 5.4
En el caso especial de una función lineal, como en la Figura 5.5, la altura promedio es
1
ȳ = f (a) + f (b)
2
y el área bajo la curva (lı́nea recta) es la de un rectángulo de ancho (b − a) y altura ȳ.
Figura 5.5
En el caso general, cuando y = f (x) no es necesariamente una función lineal, el cálculo

integral (véase el Apartado 5.4) nos dice que el área viene dada por la integral definida
b
A= f (x) dx = F(b) − F(a) , (5.11)

a
donde F(x) es la función cuya derivada es f (x) = F (x), y los números F(a) y F(b) son
los valores de F(x) en los lı́mites de la integración a y b; a se denomina lı́mite inferior,
b lı́mite superior, y el intervalo de a a b se llama intervalo de integración. b
La diferencia F(b) − F(a) en la ecuación (5.11) se representa a menudo por F(x) ,
a
de manera que
b b
f (x) dx = F(x) = F(b) − F(a) . (5.12)
a a
De aquı́ se deduce que para calcular el valor de la integral definida, normalmente es

necesario evaluar primero la correspondiente integral indefinida. Por ejemplo, sea y =
f (x) = 2x + 3. La integral indefinida es

f (x) dx = (2x + 3) dx = x2 + 3x = F(x) .
Vemos que la constante arbitraria ha sido omitida de F(x) porque se cancela para el valor
de la integral definida. La integral indefinida de f (x) en el intervalo desde x = a hasta
x = b (‘la integral de a hasta b’) es entonces
b b
(2x + 3) dx = x2 + 3x = (b2 + 3b) − (a2 + 3a) .
a a
Si, por ejemplo, a = 1 y b = 4,

4 4
(2x + 3) dx = x2 + 3x = (42 + 3 × 4) − (12 + 3 × 1) = 28 − 4 = 24 .
1 1
Esto es un ejemplo del caso especial de una función lineal, como en la Figura 5.5, de
manera que el valor de la integral puede obtenerse directamente como el área A =
= (b − a)ȳ con b − a = 4 − 1 = 3 y
1 1
ȳ = [f (1) + f (4)] = (5 + 11) = 8 .
2 2
Por lo tanto A = 3 × 8 = 24, como hemos visto.
EJEMPLOS 5.3 Integrales definidas
3
3
x3 33 23 19
1. x2 dx = = − =
2 3 2 2 3 3

4
4
dx −1 1 1 1 1 1
2. = = − − − =− + =
2 x2 x 2 4 2 4 2 4
b b
3. dx = x = b − a
a a
π/2
π/2
π
4. sen θ dθ = – cos θ = – cos − – cos 0 = (0) − (– 1) = 1
0 0 2
+1
+1
−1 −2x −1 −2 −1 2 1 2
5. e−2x dx = e = e − e = e − e−2
−1 2 −1 2 2 2
3 3
dx 3
6. = ln x = ln 3 − ln 2 = ln
2 x 2 2
Valor medio de una función

Puesto que la integral definida se identifica como el área bajo la curva, se deduce de
(5.10) que el valor medio de la función y = f (x) en el intervalo a ≤ x ≤ b es
b
A f (x) dx
ȳ = = a
b . (5.13)
b−a dx
a
Por ejemplo, la integral (iv) de los Ejemplos 5.3 muestra que el valor medio de sen θ en
el intervalo 0 ≤ θ ≤ π/2 es
π/2
1 2
sen θ = sen θ dθ = .
π/2 0 π
Tres propiedades de la integral definida

Sea f (x) = F (x) de manera que, por la ecuación (5.11),
b
f (x) dx = F(b) − F(a) .

a
1. El valor de la integral no depende del sı́mbolo utilizado para la variable de integración:

b b b
f (x) dx = f (t) dt = f (u) du = · · · (5.14)

a a a
En cada caso el valor de la integral es F(b) − F(a).
2. Si c es otro lı́mite de integración, no necesariamente entre a y b:

b c b
f (x) dx = f (x) dx + f (x) dx . (5.15)

a a c
Esto es cierto porque el valor de la integral puede escribirse como

F(b) − F(a) = F(c) − F(a) + F(b) − F(c) .
Si c está entre a y b entonces el área representada por la integral del primer miembro
de la ecuación (5.15) es igual a la suma de las áreas representadas por las integrales del
segundo miembro.
3. Cuando los lı́mites se intercambian, el valor de la integral cambia de signo:

b a
f (x) dx = − f (x) dx . (5.16)

a b

Esto se deduce porque F(a) − F(b) = − F(b) − F(a) .
Áreas negativas
Consideremos la integral
2π 2π
sen x dx = – cos x = (– cos 2π) − (– cos 0) = (– 1) − (– 1) = 0 .
0 0
La Figura 5.6 muestra que el integrando, sen x, toma va-

lores positivos cuando 0 < x < π y negativos cuando
π < x < 2π. El ‘área bajo la curva’ total es la suma
de las dos áreas denotadas por A1 y A2 en la figura, y la
integral puede escribirse como
2π
sen x dx = A1 + A2 ,
0
donde Figura 5.6

π 2π
A1 = sen x dx = +2 y A2 = sen x dx = −2 .
0 π
Este ejemplo muestra que las áreas correspondientes a valores negativos de la integral
dan contribuciones negativas al total. En este caso las contribuciones positivas y negati-
vas se cancelan y el valor medio de sen a en el intervalo es cero.
Integración de funciones discontinuas

La función

2x si x<2
f (x) = 2x + 1 si x≥2
es discontinua en x = 2, pero la Figura 5.7 muestra que la función puede ser integrada
sobre la discontinuidad si el intervalo de integración es dividido en el punto de disconti-
nuidad. Por ejemplo,
8
3 2 3
6
f (x) dx = f (x) dx + f (x) dx
1 1 2 4
2 3 2
= 2x dx + (2x + 1) dx
1 2
= 3 + 6 = 9.
Figura 5.7
Esto siempre puede hacerse cuando el integrando tiene únicamente un número finito de
discontinuidades dentro del intervalo de integración.
Integrales impropias
Una integral definida se dice impropia cuando el integrando tiene una discontinuidad
infinita en un punto dentro del intervalo de integración. Si la discontinuidad es en el
punto x = c, siendo a ≤ c ≤ b, entonces la integral se define como el lı́mite
b
c− b

f (x) dx = lim f (x) dx + f (x) dx . (5.17)
→0
a a c+
Como se muestra en la Figura 5.8, el punto c se excluye porque el integrando no está de-
finido allı́. Cuando el lı́mite en (5.17) es finito y único, el valor de la integral es el ‘área
bajo la curva’.
Figura 5.8
Si la discontinuidad queda en uno de los extremos del intervalo de integración, por ejem-
plo en x = a, la integral se define como
b b
f (x) dx = lim f (x) dx . (5.18)

→0
a a+
√
Por ejemplo, la función 1/ x no está definida en x = 0. La integral definida entre los
lı́mites x = 0 y x = 1 se define como
1 1
dx dx
√ = lim √
0 x →0 x
y tenemos
1
dx 1
1
√ = x−1/2 dx = 2x1/2 = 2 − 21/2 .
x
Por lo tanto, tomando → 0, 1

dx
√ = 2.
0 x
Sin embargo, el lı́mite en (5.17) o en (5.18) no tiene por qué existir necesariamente.
Por ejemplo,
1 1
dx
= lim ln x = lim(– ln )
0 x →0 →0
y el lı́mite no existe porque ln → −∞ cuando → 0. En el caso más general, al

integrar la inversa de una potencia,
1

1
dx 1 1 1 1
= lim = lim 1 − .
0 xa →0 1−a xa−1
1−a →0 a−1
Si a < 1 el lı́mite tiene por valor 1/(1 − a), pero si a > 1 el lı́mite es infinito y la integral
no está definida.
Integrales infinitas
A menudo ocurre en aplicaciones en las ciencias fı́sicas que uno o ambos lı́mites de
integración son infinitos. Las integrales con intervalos de integración infinitos se denomi-
nan integrales infinitas. Si el lı́mite superior es infinito, la integral definida se considera
como
∞ b
f (x) dx = lim f (x) dx . (5.19)
b→∞
a a
Por ejemplo,
∞ b b
e−r dr = lim e−r dr = lim −e−r
b→∞ b→∞ 0
0 0

= lim −e−b + 1 = 1 ,
b→∞
utilizando la propiedad de la exponencial que e−b → 0 cuando b → ∞. En la práctica

las integrales infinitas se tratan exactamente igual que las integrales ordinarias, pero
teniendo cuidado al asignar el valor infinito a la variable.
EJEMPLO 5.4 Halle el valor de la integral infinita

∞
dx
I= .
4 (x − 1)(x − 2)
El integrando puede escribirse mediante fracciones simples (véase el Apartado 2.6) como
1 1 1
= − .
(x − 1)(x − 2) (x − 2) (x − 1)
Entonces
b
b
1 1
I = lim − dx = lim ln (x − 2) − ln (x − 1)
b→∞ 4 (x − 2) (x − 1) b→∞
4

b
x−2 b−2 2 3
= lim ln = lim ln − ln = ln ,
b→∞ x − 1 4 b→∞ b−1 3 2
porque (b − 2)/(b − 1) → 1 cuando b → ∞ y ln 1 = 0.
Cuando el lı́mite de la definición (5.19) es finito y único, se dice que la integral es con-
vergente. Una integral es divergente cuando el lı́mite es indeterminado. Por ejemplo,
∞ b
dx
= lim ln x = lim ln b
1 x b→∞ 1 b→∞
es divergente porque ln b → ∞ cuando b → ∞.
Un ejemplo más sutil es

∞ b
cos x dx = lim sen x = lim sen b .
b→∞ 0 b→∞
0
En este caso el valor de sen b oscila entre +1 y −1 al crecer b y no se puede asignar un

único valor a la integral tal y como está definida aquı́. Por otra parte, en el Ejemplo 6.13
se muestra que
∞
a
e−ax cos x dx = .
0 1 + a2
Este resultado es válido para todo valor positivo del parámetro a, por pequeño que sea,
y se deduce que
∞
lim e−ax cos x dx = 0
a→0
0
Hay que señalar que el lı́mite debe tomarse después de la integración; tomar el lı́mite
antes de la integración conduce a una integral diferente, y divergente.
Funciones pares e impares

Cuando una función tiene la propiedad
f (– x) = f (x) (5.20)
se dice que es una función par de x, tiene paridad par (o paridad +1) y es simétrica con
respecto al eje x = 0 (el eje y). Son funciones pares, por ejemplo, x2 , cos x (representada
en la Figura 5.9a), y exp −x2 . En cada caso el valor de la función no cambia al sustituir
x por −x. Por otra parte, de una función con la propiedad
f (– x) = −f (x) (5.21)
se dice que es una función impar, tiene paridad impar (o paridad −1) y es antisimétri-
ca con respecto al eje x = 0. Son funciones impares, por ejemplo, x3 , sen x (representada
en la Figura 5.9b), y x cos x. En cada caso el valor de la función cambia de signo al
sustituir x por −x.
Figura 5.9
El producto de dos funciones pares o de dos funciones impares es par. El producto de

una función par y una función impar es impar. Por lo tanto x cos x es una función impar,
con x impar y cos x par.
En general, una función arbitraria no es ni par ni impar, f (– x) = ±f (x). Sin embargo
siempre es posible representar una función como la suma de una componente par y de
otra impar. Podemos escribir
1 1
f (x) = f (x) + f (– x) + f (x) − f (– x)
2 2 (5.22)
= f+ (x) + f− (x) ,
donde f+ (x) es la componente par de f (x) y f− (x) la componente impar. Por ejemplo, un
polinomio arbitrario
f (x) = a0 + a1 x + a2 x2 + · · · + an xn
puede escribirse como

f (x) = a0 + a2 x2 + a4 x4 + · · · + a1 x + a3 x3 + a5 x5 + · · ·
y, puesto que cada potencia par de x es una función par mientras que cada potencia impar
de x es una función impar, el primer conjunto de términos conforma la componente par
y el segundo conjunto conforma la componente impar. Las propiedades de integrales de
funciones con simetrı́a bien definida son de gran importancia en las ciencias fı́sicas. El
área representada por la integral
+a
A= f (x) dx (5.23)
−a
5.4. El cálculo integral 119
es la suma de las áreas a la izquierda y a la derecha del eje x = 0:

0 +a
A= f (x) dx + f (x) dx = A< + A> . (5.24)

−a 0
Si f (x) es una función par de x, las dos áreas A< y A> son iguales en magnitud y signo,
y el área total es dos veces cada una de ellas:
+a +a
A= f (x) dx = 2 f (x) dx , si f (x) par. (5.25)

−a 0
Por otra parte, si f (x) es una función impar de x, entonces A< y A> son iguales en mag-
nitud pero tiene signos opuestos, A> = −A< , y el valor de la integral es cero:
+a
A= f (x) dx = 0 si f (x) impar. (5.26)

−a
En el caso general, cuando f (x) no tiene ninguna simetrı́a en particular, la integral es

igual a la integral de la componente par:
+a +a +a +a
f (x) dx = f+ (x) dx + f− (x) dx = 2 f+ (x) dx (5.27)

−a −a −a −a
El concepto de paridad o simetrı́a de las funciones es ampliamente utilizado en las cien-

cias fı́sicas. La correspondiente rama de las matemáticas se denomina teorı́a de grupos.
En quı́mica molecular, los grupos puntuales se utilizan para describir, por ejemplo, las
propiedades de simetrı́a de las funciones de onda moleculares y de los modos normales
de vibración de las moléculas, y se usan para explicar y predecir las transiciones permi-
tidas entre niveles de energı́a observadas en los espectros moleculares. En quı́mica del
estado sólido, los grupos espaciales describen las propiedades de simetrı́a de las redes y
la estructura del espectro de difracción de rayos X observado.
5.4. El cálculo integral

Sea y = f (x) una función de x continua en el intervalo a ≤ x ≤ b, como se representa
en la Figura 5.4. En el Apartado 5.3 postulamos que el ‘área bajo la curva’, la región
sombreada en la Figura 5.4, viene dada por el valor de la integral definida de f (x) desde
a hasta b. Ahora veremos cómo se establece este resultado.
Para obtener una estimación del área, dividimos el intervalo a hasta b en n subinter-
valos escogiendo n − 1 puntos arbitrarios en el eje x, con
a = x0 < x1 < x2 < · · · < xn−1 < b = xn (5.28)
y dividimos el área en n bandas mediante lı́neas verticales en esos puntos, como se

muestra en la Figura 5.10
Figura 5.10
Obtenemos una estimación del área al sustituir cada banda por un rectángulo. El ancho
de la banda r-ésima es ∆xr = xr − xr−1 y podemos escoger la altura yr del rectángulo
entre todos los valores de la función en esa banda. Entonces

n
A≈ yr ∆xr . (5.29)
r=1
En la Figura 5.10 se muestran dos maneras de escoger las alturas de los rectángulos. En
la Figura (a) la altura de cada rectángulo se escoge como el mayor valor de y = f (x) en
el subintervalo. A esta cantidad la llamamos yr (max) para la r-ésima banda. En la Figura
(b) la altura se escoge como el menor valor. A esta cantidad la llamamos yr (min) para la
r-ésima banda. Claramente, la primera elección da un valor que sobrestima el área bajo
la curva, mientras que la segunda elección da un valor que subestima dicha área:

n

n
yr ( min ) ∆xr < A < yr ( max ) ∆xr . (5.30)

r=1 r=1
Si disminuimos el ancho de cada banda incrementando el número de subdivisiones, los

valores yr (min) e yr (max) en cada banda se acercan entre sı́ (si la función es continua,
como se ha supuesto) y las dos sumas en (5.30) convergen al mismo lı́mite cuando el
número de bandas crece indefinidamente. Cuando n → ∞, cada suma converge al lı́mite
A, el área bajo la curva. Por lo tanto, independientemente de la elección de las alturas que
se tome en cada rectángulo y de cómo se hacen las divisiones de los intervalo, tenemos

n
A = lim yr ∆xr (5.31)

n→∞
r=1
o bien, puesto que podemos escoger yr = f (xr ),

n
A = lim f (xr ) ∆xr (todos los ∆xr → 0) . (5.32)

n→∞
r=1
Siguiendo la notación de Leibniz, este lı́mite se escribe como

b
n
f (x) dx = lim f (xr ) ∆xr (5.33)

n→∞
a r=1
y se llama integral definida de la función f (x) desde x = a hasta x = b.

Tomar el lı́mite de la suma de pequeñas cantidades es lo que caracteriza el cálculo
integral, igual que tomar el lı́mite del cociente de dos pequeñas cantidades es carac-
terı́stico del cálculo diferencial. El descubrimiento esencial, hecho independientemente
por Leibniz y por Newton, es que si F(x) es una función cuya derivada es f (x) = F (x),
entonces
b b
f (x) dx = F (x) dx = F(b) − F(a) . (5.34)
a a
Esta sı́ntesis de los cálculos diferencial e integral se llama teorema fundamental del
cálculo. La integral definida, como la hemos definido en este Apartado, se denomina
integral de Riemann.3 Al calcular el área encerrada por una curva no es ni esencial
ni siempre conveniente dividir el área en bandas lineales como hemos descrito antes.
Ilustramos este punto en el Ejemplo 5.5 con dos maneras de calcular el área de un cı́rculo.
EJEMPLO 5.5 Área de un cı́rculo

La ecuación del cı́rculo de radio a y centro en el origen de coordenadas es x2 + y2 = a2 .
Método 1. Sea A el área del cuarto de cı́rculo que está en el primer cuadrante, en el que x e y son ambas
positivas (Figura 5.11). Entonces

y = a2 − x2 para 0 ≤ x ≤ a.
Se divide el área en n bandas verticales como se describe en la deducción de la ecuación (5.33) más arriba.
Figura 5.11
03. Georg Friedrich Bernhard Riemann (1826-1866), profesor de matemáticas en Göttingen, contri-
buyó a la teorı́a de números, funciones de variable compleja y ecuaciones diferenciales. En su disertación de
1854 Über die Hypothesen welche der Geometrie zu Grunde liegen (Sobre las hipótesis en las que se basa
la geometrı́a), Riemann desarrolló un sistema de geometrı́a no euclı́dea e inició el estudio de los espacios
métricos curvos que acabarı́a conformando la base de las matemáticas de la teorı́a de la relatividad general.
√
Un valor aproximado del área de la banda entre x y x + ∆x es ∆A ≈ a2 − x2 ∆x y, por la ecuación (5.33),
el área total es a
A= a2 − x2 dx .
0
La integral se evalúa en el Ejemplo 6.10. Su valor es πa2 /4, y el área del cı́rculo es cuatro veces esto.
Método 2. Se divide el área del cı́rculo en bandas circulares concéntricas como en la Figura 5.12. Dado que
la circunferencia de un cı́rculo de radio r es 2πr (véase el Ejemplo 5.6), el área de la banda entre r y r + ∆r
queda entre 2πr∆r y 2π(r + ∆r)∆r:
2πr∆r < ∆A < 2π(r + ∆r)∆r (5.35)

y, si ∆r es suficientemente pequeño, ∆A ≈ 2πr∆r. El área total es entonces
a
A= 2πr dr = πa2 .
0
Figura 5.12
Señalamos que la integral indefinida puede entenderse como un caso especial de la inte-
gral definida (ecuación (5.34)) en el que el lı́mite superior de integración, b, se sustituye
por la variable x, y el lı́mite inferior a, y por lo tanto F(a), es una constante arbitraria:
x
f (x) dx = f (x) dx = F(x) − F(a) = F(x) + C . (5.36)
a
Uso de diferenciales
Otra perspectiva conveniente, si bien menos rigurosa, de ver la integral definida como
un área, es utilizando el concepto de diferencial introducido en el Apartado 4.12. Este
enfoque se usa a menudo en textos elementales de cálculo, y se utiliza ampliamente en
la aplicación del cálculo a la formulación de los problemas fı́sicos.
Consideremos la expresión (5.35) presentada en el Ejemplo 5.5. Dividiendo por ∆r se
obtiene
∆A
2πr < < 2π(r + ∆r)
∆r
y, en el lı́mite ∆r → 0,
∆A dA
→ = 2πr .
∆r dr
La cantidad dA/dr es el coeficiente de variación del área A(r) del cı́rculo con respecto al
radio r. El diferencial correspondiente dA = 2πr dr es, en el lenguaje de diferenciales,
el área de una banda circular de radio r y ancho ‘infinitesimal’ dr; es un elemento de
área o diferencial de área. La ‘suma’ de estos elementos es la integral
A a
A= dA = 2πr dr .
0 0
La integral como longitud

Sea y = f (x) continua en el intervalo a ≤ x ≤ b, y sea s la longitud de su gráfica
desde el punto A, cuando x = a, hasta el punto B, cuando x = b (Figura 5.13).
Figura 5.13
Para calcular esta longitud dividimos el arco AB en segmentos de longitud ∆s. Entonces,
por el teorema de Pitágoras, un valor aproximado de la longitud del segmento entre x y
x + ∆x es
1/2 ∆y 2 1/2
∆s ≈ (∆x)2 + (∆y)2 = 1+ ∆x .
∆x
El correspondiente elemento de longitud es
dy 2 1/2
ds = 1 + dx (5.37)
dx
y la longitud total del arco AB es
s b dy 2 1/2
s= ds = 1+ dx . (5.38)
0 a dx
EJEMPLO 5.6 Circunferencia de un cı́rculo

La ecuación de un cı́rculo de radio a y centro en el origen es x2 + y2 = a2 de manera que y = ±(a2 − x2 )1/2
y dy/dx = ∓x/(a2 − x2 )1/2 . Por lo tanto,
2
dy x2 a2
1+ =1+ 2 = 2
dx a −x 2 a − x2
y la circunferencia del cı́rculo es

a dy 2 1/2 a
dx
s=4 1+ dx = 4a √
0 dx 0 a2− x2
(cuatro veces la longitud del cuarto en el primer cuadrante, véase el Ejemplo 5.5). Esta integral es una de
las integrales estándar presentes en la Tabla 6.3:
x a
s = 4a arcsen = 4a arcsen 1 − arcsen 0 .
a 0
Los valores principales del arco seno para 1 y para 0 son π/2 y 0, respectivamente. Por lo tanto s = 2πa.
5.5. Usos del cálculo integral

La presentación del Apartado 5.4 trataba del uso del cálculo integral para determinar
propiedades geométricas. En particular, el área de una figura plana y la longitud de una
curva en un plano. En los Capı́tulos 9 y 10 tratamos la generalización a curvas en tres
dimensiones, superficies curvas y volúmenes.
Vimos en el Apartado 5.3, ecuación (5.13), que la integral definida proporciona el
valor medio de una función. Si la función representa, por ejemplo, la distribución de
masa en un cuerpo fı́sico, el cálculo integral puede utilizarse para determinar propie-
dades estáticas del cuerpo, como la masa total, el centro de masas y los momentos de
inercia, mediante integrales definidas de la densidad de masa. Lo mismo ocurre para
una distribución de carga o para cualquier otra propiedad fı́sica de un sistema que se
halle distribuida en el espacio. En el Apartado 5.6 introducimos este uso del cálculo in-
tegral para determinar propiedades estáticas distribuidas a lo largo de una recta (el caso
unidimensional). El caso tridimensional se trata en el Capı́tulo 10. Estos mismos méto-
dos se emplean en el Capı́tulo 21 para el análisis de distribuciones de probabilidad en
estadı́stica.
En el Apartado 5.1 introdujimos el concepto de integral considerando el movimiento
de un cuerpo a lo largo de una recta. Por la primera ley del movimiento de Newton,
un cuerpo que se desplaza con una velocidad dada sigue moviéndose a lo largo de una
lı́nea recta con la misma velocidad si sobre el cuerpo no actúan fuerza exteriores: v =
constante mientras F = 0. Por otra parte, por la segunda ley de Newton, la aceleración,
o tasa de variación de la velocidad a = dv/dt, que experimenta un cuerpo de masa
m en presencia de una fuerza exterior F viene dada por F = ma. En el Apartado 5.7
presentamos el uso del cálculo integral para describir la dinámica de sistemas fı́sicos
con movimientos a lo largo de una lı́nea recta. El caso más general del movimiento en
dos y tres dimensiones se trata en el Capı́tulo 16. En el Apartado 5.8 comentamos la
aplicación al trabajo presión-volumen en termodinámica.
El uso más extendido del cálculo integral es para resolver (integrar) ecuaciones dife-
renciales, en particular las ecuaciones de la cinética quı́mica y de otros procesos cinéti-
cos, las ecuaciones del movimiento en mecánica clásica (deducidas de la segunda ley
de Newton, por ejemplo), y las ecuaciones del movimiento en mecánica cuántica (co-
mo la ecuación de Schrödinger). Esta utilización del cálculo integral la veremos en los
Capı́tulos 11 al 14.
5.6. Propiedades estáticas de la materia 125
5.6. Propiedades estáticas de la materia

Sea un conjunto de N masas discretas m1 , m2 , . . ., mN distribuidas sobre una lı́nea
recta (horizontal), con la masa mi situada en la posición xi con respecto a un punto fijo O
como en la Figura 5.14.
Figura 5.14
Este sistema de masas tiene las siguientes propiedades

N
(i) masa total: M= mi

i=1

N
(ii) primer momento de la masa con respecto a O: mi xi

i=1

N
(iii) segundo momento de la masa con respecto a O: mi xi2 (5.39)

i=1
y definiciones similares para todos los momentos superiores.

El primer momento de la masa, (ii), define el centro de masas. Si una posición X es
tal que

N
mi xi = MX, (5.40)
i=1
entonces X es la posición del centro de masas. El primer momento del sistema de masas
es por lo tanto igual al momento de la masa total concentrada en el centro de masas.
Figura 5.15
En presencia de gravedad, cada masa experimenta una fuerza Fi = mi g dirigida hacia

abajo (Figura 5.15). La constante fı́sica g = 9,8067 m s−2 se denomina ‘aceleración
estándar de la gravedad’, y la fuerza Fi = mi g que actúa sobre un cuerpo de masa mi es
lo que comúnmente llamamos el peso del cuerpo.
Multiplicando la ecuación (5.40) por g tenemos

N
T= Fi xi = MgX = FX , (5.41)
i=1

donde F = Fi es la fuerza total que actúa sobre el sistema de masas. Entonces la
posición
X del centro de masas se llama, además, centro de gravedad, y la cantidad
T = Fi xi se llama momento de la fuerza o par de torsión del sistema de fuerzas con
respecto al punto O. Si las masas están sujetas a una barra rı́gida y uniforme (de masa
despreciable), el par de torsión es una medida de la tendencia de las fuerzas a hacer
girar el sistema en torno a O, y, por la ecuación (5.41), es igual al par producido por la
fuerza total F concentrada en el centro de masas. Si el punto O está en el centro de masas
(gravedad), entonces X = 0 y

N
T= Fi xi = 0 (5.42)
i=1
de manera que el par total con respecto al centro de masas es nulo.

El segundo momento de la masa, (iii), se denomina momento de inercia del sistema
de masas con respecto al punto O. Esta propiedad de la distribución de masa es la que
resulta importante para describir la dinámica de cuerpos en rotación.
EJEMPLO 5.7 Sistema de dos masas

La Figura 5.16 muestra dos cuerpos, de masas m1 y m2 , unidos por una barra rı́gida (de masa despreciable).
Figura 5.16
Las fuerzas F1 y F2 son los pesos de los cuerpos, y F es una fuerza de reacción que actúa sobre el pivote O.
Si el pivote está en el centro de masas, entonces (x1 = −r1 y x2 = r2 en la ecuación (5.42))
F1 r1 = F2 r2 (ley de la palanca)
y el conjunto está en equilibrio con respecto a giros en torno al pivote O. La fuerza vertical total que actúa
sobre el conjunto es F1 +F2 −F, de manera que el sistema está en equilibrio con respecto a desplazamientos
verticales si F = F1 + F2 .
El momento de inercia de las dos masas es I = m1 r12 + m2 r22 . Cuando O está en el centro de masas,
entonces X = 0 en (5.40) de manera que m1 r1 = m2 r2 y las distancias r1 y r2 pueden escribirse como
m2 r m1 r
r1 = , r2 = ,
m1 + m2 m1 + m2
siendo r = r1 + r2 la distancia entre las masas. El momento de inercia es entonces
m1 m 2 2
I = m1 r12 + m2 r22 = r = µr2 ,
m1 + m2
5.6. Propiedades estáticas de la materia 127
donde la cantidad µ = m1 m2 /(m1 + m2 ) se llama masa reducida del sistema de las dos masas. El momento
de inercia con respecto al centro de masas de un sistema de dos masas es por lo tanto el mismo que el
momento de inercia de una única masa µ situada a una distancia r del centro de masas.
El caso continuo
Sea una distribución de masa continua como una barra rectilı́nea de materia de lon-
gitud l (Figura 5.17).
Figura 5.17
Sea ∆m la masa del segmento desde x hasta x + ∆x, de manera que ∆m/∆x es la masa
por unidad de longitud en el segmento. Si la masa está distribuida por igual sobre la
longitud, entonces ∆m/∆x es independiente del segmento escogido y se llama densidad
(o, más correctamente, densidad lineal de masa) ρ del cuerpo y es una constante a lo
largo de toda la longitud. La masa total es entonces M = ρl. Si la masa de la barra no
está repartida por igual sobre su longitud entonces ∆m/∆x es la densidad promedio en
el segmento x a x + ∆x y su valor depende de la posición del segmento y de su longitud.
Cuando esa longitud se hace tender a cero, la proporción se acerca al lı́mite
∆m dm
ρ(x) = lim = . (5.43)
∆x→0 ∆x dx
El valor de la función ρ(x) en un punto cualquiera es la densidad en ese punto, y la
cantidad diferencial dm = ρ(x)dx es la masa de un segmento dx en x. La masa total del
cuerpo es entonces
M l
M= dm = ρ(x) dx . (5.44)
0 0
Por lo tanto, cuando sustituimos una distribución discreta de masas por una distribu-
ción continua, las sumas del caso discreto se sustituyen por integrales. Ası́, la densidad
promedio es
l
M ρ(x) dx
ρ= = 0
l . (5.45)
l dx
0
La posición del centro de masas viene dada por (véase la ecuación 5.40)
l
l
ρ(x)x dx
MX = ρ(x)x dx, o bien X = 0 l , (5.46)
0
0
ρ(x) dx
y el momento de inercia con respecto a un punto arbitrario x0 en la recta es

l
I= ρ(x)(x − x0 )2 dx . (5.47)
0
Vemos que, por ejemplo, la masa total puede ser interpretada como el ‘área bajo la curva’
de la gráfica de la función de densidad ρ(x).
EJEMPLO 5.8 Halle la masa total, el centro de masas y el momento de inercia de una distribución lineal
de masa de longitud a y densidad ρ(x) = b(a − x), 0 ≤ x ≤ a.
La masa total es igual al área a2 b/2 del triángulo sombreado en la Figura
5.18. Por lo tanto
a a
a2 b
M= ρ(x) dx = b(a − x) dx = .
0 0 2
La posición del centro de masas es
a a
1 2 a
X= ρ(x)x dx = 2 (a − x)x dx = .
M 0 a 0 3
Figura 5.18
El momento de inerciamomento de inercia con respecto a un punto arbitrario x0 sobre la recta es

l a
ba2 2
I= ρ(x)(x − x0 ) dx = b
2
(a − x)(x − x0 )2 dx = a − 4ax0 + 6x02 .
0 0 12
El valor de x0 par el cual I alcanza su valor mı́nimo viene dado por
dI ba2
=0= (−4a + 12x0 )
dx0 12
de manera que x0 = a/3. El momento de inercia por lo tanto tiene su valor mı́nimo cuando se calcula con
respecto al centro de masas. Este es un resultado general.
5.7. Dinámica
Velocidad y distancia
Consideremos, como en el Apartado 5.1, un cuerpo que se mueve sobre una curva
desde el punto A en el instante t = ta hasta el punto B en el instante t = tB , y sea
s(t) la distancia sobre la curva desde A en algún instante intermedio t. Siguiendo el
razonamiento del Apartado 4.11, la cantidad v(t) = ds/dt es la velocidad del cuerpo en
el instante t. La longitud diferencial ds = vdt es la distancia recorrida en el intervalo de
tiempo infinitesimal dt, y la distancia total recorrida es entonces
s tB
s= ds = v(t) dt . (5.48)
0 tA
5.7. Dinámica 129
EJEMPLO 5.9 Caı́da de un cuerpo bajo la acción de la gravedad

Un cuerpo de masa m que cae libremente bajo la acción de la gravedad experimenta una aceleración cons-
tante dv/dt = g (despreciando la resistencia del aire y otras fricciones). Entonces v(t) = gt + v(0), donde
v(0) es la velocidad en el instante t = 0. Si el cuerpo cae desde el reposo en t = 0, entonces v(t) = gt. La
distancia recorrida en el intervalo de tiempo desde tA hasta tB es entonces
tB tB
1
s= v(t) dt = gt dt = g tb2 − tA2 .
tA tA 2
Por lo tanto, dado que g ≈ 9,8 m s−2 , la distancia recorrida en el primer segundo de caı́da es 4,9 m y en el
siguiente segundo es 4,9 (22 − 12 ) m = 14,7 m.
Fuerza y trabajo
Sea un cuerpo que se mueve en la dirección x entre los puntos A y B con velocidad v =
dx/dt. Si sobre el cuerpo actúa una fuerza F, entonces, por la segunda ley de Newton, la
aceleración a que experimenta el cuerpo viene dada por
d2 x
F = ma = m (5.49)
dt2
donde m es la masa del cuerpo. La aplicación de una fuerza sobre el cuerpo supone
un trabajo, y, si la fuerza es constante, entonces el trabajo efectuado es W = F(A−B)
(trabajo = fuerza × distancia).
Si la fuerza no es constante entre A y B, sino que es una función de la posición,
F = F(x), entonces el trabajo efectuado se obtiene mediante cálculo integral. El trabajo
efectuado sobre el cuerpo entre las posiciones x y x + ∆x es ∆W ≈ F(x)∆x. En el lı́mite
∆x → 0, el elemento de trabajo correspondiente es dW = F(x)dx y el trabajo total
efectuado es la integral
W B
W= dW = F(x) dx . (5.50)
0 A
EJEMPLO 5.10 Caı́da de un cuerpo bajo la acción de la gravedad

Un cuerpo de masa m que cae libremente bajo la acción de la gravedad experimenta una fuerza constante
F = mg dirigida hacia abajo. Ésta es la fuerza total que actúa sobre el cuerpo en ausencia de resistencia del
aire y de otras fuerzas de fricción. El trabajo efectuado por la gravedad sobre el cuerpo mientras cae una
altura h es por lo tanto
h h
W= F(x) dx = mg dx = mgh .
0 0
Este es también el trabajo que hay que efectuar contra la fuerza de la gravedad para elevar el cuerpo una
distancia h.
EJEMPLO 5.11 Trabajo electrostático

La fuerza que actúa entre dos cargas eléctricas q1 y q2 separadas una distancia x en el vacı́o viene dada por
la ley de Coulomb de la inversa del cuadrado
q1 q2
F(x) = ,
4π0 x2
donde es la permitividad del vacı́o.* Cargas semejantes (cargas con el mismo signo, como dos núcleos
0
o dos electrones) se repelen, de manera que, en la figura 5.19
Figura 5.19
la fuerza que actúa sobre q2 debido a la presencia de q1 lo hace en la dirección positiva de x, alejándose
de q1 . Cargas opuestas (de signo opuesto, como las del protón y el electrón en el átomo de hidrógeno) se
atraen, y la fuerza sobre q2 está dirigida hacia q1 (en la Figura 5.19 F es negativa).
Sean dos cargas semejantes infinitamente separadas inicialmente. Puesto que las cargas se repelen, para
llevar q2 a una distancia x de q1 hay que efectuar trabajo sobre el sistema. Hay que aplicar una fuerza −F
para vencer la repulsión y el trabajo efectuado es
x
q1 q2 x dx q1 q2 1 x q1 q2
W=− F(x) dx = − 2
=− − = .
∞ 4π 0 ∞ x 4π 0 x ∞ 4π 0x
Este trabajo es positivo para cargas semejantes. La misma fórmula se aplica al caso de cargas opuestas, pero
entonces el trabajo es negativo.
Trabajo y energı́a
Si se efectúa un trabajo en un sistema mediante una fuerza externa, la energı́a del
sistema aumenta en una cantidad igual al valor del trabajo efectuado. Y al revés: si un
sistema efectúa trabajo contra una fuerza externa, la energı́a del sistema disminuye en
una cantidad igual al valor del trabajo efectuado. La energı́a de un sistema se expresa
generalmente como la suma de dos partes. Para un sistema sencillo, sin estructura in-
terna, esas partes son (i) la energı́a cinética, o energı́a de traslación, que proviene del
movimiento del sistema en el espacio, y (ii) la energı́a potencial, que proviene de la
posición del sistema en el espacio y de las fuerzas que actúan sobre el sistema en esa
posición. En el caso de un sistema con estructura interna, la energı́a cinética es la suma
de las energı́as cinéticas de las partes constitutivas, y la energı́a potencial es la suma de
las energı́as potenciales de las partes.
(i) Energı́a cinética El trabajo efectuado sobre un cuerpo por una fuerza externa F(x)
cuando el cuerpo se mueve del punto A al punto B es
B B
dv
Wab = F(x) dx = m dx . (5.51)
A A dt
0* La presencia del factor 4π0 asegura que la fuerza que actúa entre dos cargas de un culombio
separadas entre sı́ un metro es un newton: N = C2 /4π0 m2 en unidades del SI.
5.7. Dinámica 131
Como v = dx/dt, el elemento de longitud dx puede sustituirse por el diferencial v dt, de

manera que
B B
dv 1 d 2
Wab = m v dt = m (v ) dt , (5.52)
A dt 2 A dt
donde hemos usado que d(v2 )/dt = 2v dv/dt, y los lı́mites de integración se refieren a
los tiempos en A y en B. Deducimos que el trabajo hecho entre A y B es
1
Wab = m (v2B − v2A ) , (5.53)
2
siendo vA y vB las velocidades del cuerpo en A y en B, respectivamente. La cantidad
1
2
mv2 se llama energı́a cinética del cuerpo y se representa habitualmente por el sı́mbolo
T. El trabajo efectuado sobre el cuerpo es, por lo tanto, igual a la variación de la energı́a
cinética:
Wab = TB − TA . (5.54)
Vemos que la energı́a cinética de un cuerpo en reposo se define como igual a cero.
(ii) Energı́a potencial y energı́a total Sea una fuerza que actúa sobre un cuerpo y que
sólo depende de la posición de éste, de manera que F = F(x). Esta condición excluye
fuerzas que dependen del tiempo y, más importante, fuerzas disipativas como las debidas
a la fricción. Entonces, por el teorema fundamental del cálculo (ecuación (5.34)), existe
una función f (x) tal que F(x) = f (x) y
B
Wab = F(x) dx = f (A) − f (B) . (5.55)

A
El trabajo efectuado entre A y B puede por lo tanto expresarse como la variación de una
cantidad que depende únicamente de los puntos extremos A y B, y no del camino desde
A hasta B . Esta cantidad se representa normalmente por −V, y V se denomina energı́a
potencial del cuerpo. El trabajo de A hasta B es por lo tanto
B
Wab = F(x) dx = VA − VB , (5.56)

A
donde VA y VB son los valores de la energı́a potencial en A y B. Cuando el trabajo efec-

tuado por una fuerza es independiente del camino, se dice que la fuerza es una fuerza
conservativa y es (–) la derivada de la (función) energı́a potencial:

dV
F(x) = − , V(x) = − F(x) dx + C . (5.57)
dx
Tres tipos sencillos pero importantes de fuerzas conservativas, y sus respectivas energı́as
potenciales, son
(a) F = constante, V(x) = −Fx + C , (5.58)

1
(b) F = −kx , V(x) = kx2 + C , (5.59)
2
1
(c) F = − 12 , V(x) = − + C , (5.60)
x x
siendo C una constante arbitraria. Las gráficas de V(x), para C = 0, aparecen dibujadas
en la Figura 5.20.
Figura 5.20
En cada caso, el gradiente de la gráfica es dV/dx = −F, de manera que la fuerza actúa
en la dirección de energı́a potencial decreciente.
Vemos que, mientras que la energı́a cinética tiene un valor absoluto bien definido,
eso no ocurre con la energı́a potencial, para la cual las ecuaciones (5.56) y (5.57) sólo
definen valores relativos. Los ejemplos 5.12 y 5.13 más abajo, muestran cómo se escoge
el cero de la energı́a potencial en dos situaciones fı́sicas diferentes.
Un sistema en el cual todas las fuerzas son conservativas se llama sistema conserva-
tivo. En un sistema ası́, el trabajo efectuado al mover un cuerpo alrededor de un bucle
cerrado A→B→A es cero:
Waba = Wab Wba = (VA − Vb ) − (VB − VA ) = 0 . (5.61)
Las fuerzas disipativas, como las debidas a la fricción, no son fuerzas conservativas
porque el trabajo efectuado contra la fricción siempre es positivo.
Combinando las expresiones (5.54) y (5.56) obtenemos el resultado
TA + VA = TB + VB (5.62)
y se deduce que, en un sistema conservativo, la cantidad T +V es constante. Esta cantidad

se llama energı́a total del sistema, E = T + V, y (5.62) es una expresión del principio
de conservación de la energı́a.
5.8. Trabajo presión-volumen 133
EJEMPLO 5.12 Movimiento de un cuerpo bajo la acción de la gravedad

Sea un cuerpo de masa m situado a una altura h por encima de una superficie horizontal, como en
la Figura 5.21. La fuerza de la gravedad que actúa sobre el cuerpo es
F = −mg (negativa porque la fuerza se ejerce en la dirección negativa
de x) y el trabajo efectuado sobre el cuerpo a medida que cae libremente
desde la altura h hasta la superficie en x = 0 es
0 0
W= F dx = −mg dx = mgh .
h h
Este trabajo es el cambio en la energı́a potencial
W = mgh = V(h) − V(0) ,

Figura 5.21
donde V(x) es la energı́a potencial del cuerpo en la altura x. La elección natural del cero de la energı́a
potencial en este ejemplo es V(0) = 0, cero en la superficie. Entonces, V(x) = mgx es la energı́a potencial
del cuerpo en la altura x, y la fuerza está relacionada con ella por F = −dV/dx = −mg.
Supongamos que el cuerpo parte en reposo desde x = h y sea T(x) la energı́a cinética en la altura x.
Entonces T(h) = 0 y, por la ecuación (5.54), la energı́a cinética del cuerpo cuando alcanza la superficie es
T(0) = mgh. Además, al ser la fuerza (una constante) conservativa, la energı́a total del cuerpo se conserva y
es igual a E = mgh, que es la energı́a potencial en x = h (donde la energı́a cinética es nula) y es la energı́a
cinética en x = 0 (donde la energı́a potencial es nula). En una altura intermedia, E = mgh = T(x) + V(x) y
la energı́a cinética es
1
T(x) = mv2 = mg(h − x) . (5.63)
2
Si tanto el cuerpo como la superficie son totalmente elásticos, la velocidad del cuerpo se invierte en contacto
con la superficie, y el cuerpo retorna a su altura original en x = h invirtiendo exactamente el movimiento
de caı́da. Ası́, despejando la velocidad de la ecuación (5.63), tenemos

v = ± 2g(h − x) .
La velocidad del cuerpo es negativa cuando cae y positiva cuando sube. En ausencia de fuerzas disipativas
el movimiento de rebote se repite indefinidamente.
EJEMPLO 5.13 Energı́a potencial electrostática

Según el Ejemplo 5.11, el trabajo que debe efectuarse contra la fuerza interna para traer dos cargas desde
una separación infinita a una separación x es W = q1 q2 /4π0 x. Esto es lo mismo que el trabajo efectuado
por la fuerza interna al separar las cargas:
∞
q1 q2
W= F(x) dx = .
x 4π0 x
La fuerza depende sólo de las posiciones relativas de las cargas y es conservativa, de manera que existe
una función energı́a potencial V(x) tal que F(x) = −dV/dx y W = V(x) − V(∞). Es convencional, y
conveniente, tomar el cero de energı́a potencial de las partı́culas en interacción de manera que sea cero para
una separación infinita: V(∞) = 0. Entonces
q1 q2
V(x) =
4π0 x
es la energı́a potencial electrostática del sistema de dos cargas.
5.8. Trabajo presión-volumen

Consideremos un fluido (un gas o un lı́quido) encerrado en un recipiente cilı́ndrico
uniforme, cerrado en un extremo y provisto de un pistón como se muestra en la Figura
5.22. Sea A el área de la sección transversal interna del cilindro.
Figura 5.22
Un fluido con presión interna p ejerce una fuerza de magnitud |F| = pA sobre la super-
ficie del pistón, y el pistón se mueve hacia adentro o afuera según sea la presión externa
pext mayor o menor que p. Si pext > p el fluido se comprime y el trabajo efectuado por la
fuerza externa Fext al mover el pistón desde a hasta b es
b
Wab = Fext dx . (5.64)

a
En este caso la fuerza externa tiene magnitud |Fext | = pext A y una longitud del cilindro
|dx| contiene un volumen |dV| = A|dx|. El trabajo puede por lo tanto expresarse en
forma ‘presión-volumen’ como
b
Wab = − pext dV , (5.65)

a
donde los lı́mites de integración se refieren ahora al volumen, y el signo negativo se in-
cluye para hacer que el trabajo de compresión sea positivo. Puede demostrarse que esta
expresión del trabajo mecánico efectuado sobre un sistema termodinámico es indepen-
diente de la forma del recipiente.
Para comprimir el fluido es necesario que la presión externa sea mayor que la presión
interna del fluido. Sea pext = (p + ∆p), siendo ∆p una sobrepresión positiva que, por
sencillez, suponemos que es constante durante toda la compresión. Entonces, siendo
Va > Vb ,
b b b
Wab = − p dV − ∆p dV = − p dV − ∆p (Va − Vb )
a b a a
(5.66)
>− p dV .
a
5.9. Ejercicios 135
Y al revés: para permitir al fluido expandirse desde Vb hasta Va , es necesario que la

presión externa sea menor que la presión interna. Si pext = (p − ∆p), entonces
a
Wba = − p dV + ∆p (Va − Vb )
a
b
(5.67)
>− p dV .
b
El trabajo total efectuado sobre el fluido en el ciclo a → b → a es por lo tanto
Waba = Wab + Wba = 2∆p (Va − Vb ) > 0 (5.68)
y se dice que el proceso es irreversible. Esto es análogo al caso en dinámica ordinaria

cuando hay presentes fuerzas disipativas no conservativas. El proceso puede hacerse
reversible únicamente haciendo que el exceso de presión, ∆p en nuestro ejemplo, tienda
a cero. En ese lı́mite (ideal) el trabajo es reversible y
b
Wab = −Wba = − p dV . (5.69)

a
Expansión de un gas
La ecuación de estado de un gas es una relación de la forma f (p, V, T) = 0 entre las

tres cantidades termodinámicas p, V y T (para una cantidad de gas dada). Por ejemplo,
la ecuación de estado de los gases perfectos puede escribirse como pV − nRT = 0. Hay
por lo tanto cierta libertad en la elección de las condiciones en las cuales puede darse la
expansión de un gas.
expansión isobárica La expansión de un gas puede ocurrir a presión constante. Por

ejemplo, el gas puede calentarse para que se expanda contra una presión externa cons-
tante, como la presión atmosférica. El trabajo reversible efectuado por el gas contra la
presión externa es entonces
b b
W= p dV = p dV = p (Vb − Va ) . (5.70)
a a
expansión isoterma La expansión de un gas puede ocurrir a temperatura constante. Por

ejemplo, si la expansión se realiza con el recipiente inmerso en un baño térmico a una
temperatura dada. Para calcular el trabajo es necesario conocer la ecuación de estado.
Para un gas perfecto, p = nRT/V, y el trabajo (reversible) es
b b
dV Vb
W= p dV = nRT = nRT ln . (5.71)
a a V Va
5.9. Ejercicios
Apartado 5.2
Evalúe las integrales indefinidas:

3x2 + 2x + 1
1. 2 dx 2. (2x3 + 2x + 3) dx 3. dx
x2
4. x2/3 dx 5. x−1/3 dx 6. e3x dx 7. 3e−2x dx

dx dx
8. sen 4x dx 9. 10.
x−1 3−x

11. Halle y = (x2 + 3) dx tal que y = 0 cuando x = 3.
Apartado 5.3
Evalúe las integrales definidas:
5 2 3 5 π
du dv
12. dx 13. 14. 15. e−3t dt 16. cos 3θ dθ
3 1 u
3
2 v+2 1 1
0 +3
x2 + 2 si x < 1
17. sen 2x dx 18. f (x) dx donde f (x) =
−π/4 −1 x2 si x ≥ 1
1 ∞ 1 1
dx dx dx
19. √ 20. e−3t dt 21. 22.
0
3
x 0 0 x(x − 1) 0 (x − 2)(2x − 3)
23. La ecuación de Clausius-Clapeyron para el equilibrio lı́quido-vapor es
d ln p ∆Hvap 2
= T .
dT R
Si la entalpı́a de vaporización ∆Hvap es constante en el intervalo de temperaturas desde T1 a T2 , demuestre,
integrando ambos miembros de la ecuación, que

p1 ∆Hvap 1 1
ln =− − .
p2 R T1 T2
RTZ
24. El coeficiente de fugacidad γ de un gas cuya ecuación de estado es p = , donde Vm es el volumen
Vm
molar y Z es el factor de compresión, viene dada por
p
Z−1
ln γ = dp .
0 p
Para la ecuación de estado p(Vm − b) = RT,

bp
(i) demuestre que Z = 1 + , (ii) halle γ como función de p y de T.
RT
25. Halle el valor promedio de la función y = x2 en el intervalo 0 ≤ x ≤ 2.
26. Para cada una de las siguientes funciones, estudie si es una función par de x, impar o ninguna de las
dos cosas. En ese último caso, halle las componentes par e impar.
(i) sen 2x (ii) cos 3x (iii) sen2 2x (iv) sen x cos x (v) x
−x x2
(vi) x 4
(vii) 3x + 2x + 1
2
(viii) e (ix) e
5.9. Ejercicios 137
Apartado 5.6
27. Para un sistema de N masas discretas mi situadas en las posiciones xi , i = 1, 2, . . . , N, sobre una lı́nea
recta, halle la expresión del momento de inercia con respecto a un punto x0 arbitrario de la recta. Demuestre
que el momento de inercia toma el valor más pequeño posible cuando x0 está en el centro de masas.
28. Tres masas m1 , m2 y m3 , están situadas en una recta con m1 en x1 = −4, m2 en x2 = −1 y m3 en
x3 = 4, con respecto a un punto O de la recta.
Calcule (i) la posición del centro de masas, (ii) el momento de inercia con respecto a O, y (iii) el
momento de inercia con respecto al centro de masas.
29. La distribución de masa en una barra recta de longitud l viene dada por la función de densidad
ρ(x) = x2 , 0 ≤ x ≤ l. Halle: (i) la masa total, (ii) la densidad media, (iii) el centro de masas, y (iv) el
momento de inercia con respecto al centro de masas.
Apartado 5.7
30. Un cuerpo se mueve en lı́nea recta con velocidad v = 3t2 en el instante t. Calcule la distancia recorrida
en el intervalo de tiempo desde t = 1 hasta t = 2.
31. Un cuerpo de masa m se mueve en lı́nea recta (en la dirección x) bajo la acción de una fuerza F = kx,
donde k es positiva. Si el cuerpo parte inicialmente del reposo en la posición x = 1, halle las siguientes
cantidades en función de x: (i) el trabajo efectuado sobre el cuerpo, (ii) la energı́a cinética del cuerpo, (iii)
la velocidad, (iv) la variación de la energı́a potencial, y (v) la variación de la energı́a total.
Dibuje la gráfica de la función energı́a potencial. (vi) ¿Cuál serı́a el movimiento del cuerpo si estuviera
inicialmente en reposo en x = 0?
Apartado 5.8
32. Un gas ligeramente imperfecto obedece la ecuación de estado de van der Waals

n2 a
p + 2 (V − nb) = nRT .
V
Halle las expresiones para el trabajo efectuado por el gas al expandirse reversiblemente desde un volumen
V1 hasta un volumen V2 (i) a presión constante, y (ii) a temperatura constante.
Métodos de integración
6.1. Conceptos
Para calcular el valor de una integral definida es necesario normalmente evaluar la
correspondiente integral indefinida. Esto es, dada

f (x) dx = F(x) + C
necesitamos hallar la función F(x) cuya derivada es f (x) = F (x). Vimos en el Apartado
4.6 que toda función continua puede ser derivada aplicando unas pocas reglas. Cada
una de esas reglas, invirtiéndola, proporciona en principio una regla de integración. En
particular, la regla de la cadena y la regla del producto proporcionan, al invertirlas, los
dos métodos principales para calcular integrales: el método de sustitución (Apartado
6.3) y la integración por partes (Apartado 6.4).
El objeto de esos métodos generales de integración, y de otros particulares presenta-
dos en los apartados que siguen, es reducir una integral dada a forma estándar. Esto es,
transformarla en una integral cuyo valor aparece en una tabla de integrales estándar.
Una integral estándar es sencillamente una integral cuyo valor se conoce y cuya forma
puede usarse para evaluar otras integrales ‘no estándar’. Las integrales estándar más ele-
mentales se dan en la Tabla 5.1, y una lista más amplia se da en el Apéndice. Se han
publicado extensas listas de integrales estándar, y nuestro propósito en este capı́tulo es
mostrar cómo se obtienen (algunas de) esas integrales estándar y, lo más importante,
cómo reducir otras a forma estándar. Hay que recordar, sin embargo, que hay muchas
funciones cuyas integrales no pueden expresarse mediante un número finito de funcio-
nes elementales. En esos casos, los métodos numéricos dan valores aproximados. Con la
evolución de las máquinas de cálculo, los métodos numéricos de integración (cuadratu-
ras numéricas) se han hecho rutinarios y precisos, y algunos de los métodos numéricos
más sencillos se presentan en el Capı́tulo 20.
Consideramos primero el uso de relaciones trigonométricas (Apartado 3.2) para la
integración de algunas funciones trigonométricas.
140 Capı́tulo 6. Métodos de integración
6.2. El uso de relaciones trigonométricas

Tabla 6.1

1
1. cos2 ax dx = ax + sen ax cos ax + C
2a

1
2. sen2 ax dx = ax − sen ax cos ax + C
2a

1
3. sen ax cos ax dx = sen2 ax + C
2a
Para a = b:

1 sen (a − b)x sen (a + b)x
4. sen ax sen bx dx = − +C
2a a−b a+b

5. cos ax cos bx dx = + +C
2a a−b a+b

1 cos (a − b)x cos (a + b)x
6. sen ax cos bx dx = + +C
2a a−b a+b
La Tabla 6.1 contiene un número de integrales que pueden evaluarse haciendo uso de
las relaciones trigonométricas (3.17) a (3.22) presentadas en el Apartado 3.2. Las formas
útiles de esas relaciones son
1
cos2 x = 1 + cos 2x , (6.1)
2
1
sen2 x = 1 − cos 2x , (6.2)
2
1
sen x cos x = sen 2x , (6.3)
2
1
sen x sen y = cos (x − y) − cos (x + y) , (6.4)
2
1
cos x cos y = cos (x − y) + cos (x + y) , (6.5)
2
1
sen x cos y = sen (x − y) + sen (x + y) . (6.6)
2
Más generalmente, las relaciones pueden usarse para expresar una función senm x cosn x,
con m y n enteros positivos, mediante senos y cosenos sencillos, pero si m o n son
mayores que 2, otros métodos alternativos son a menudo más sencillos.
EJEMPLOS 6.1 Las integrales de la Tabla 3.1

Integral 1: cos2 2x dx.
6.3. El método de sustitución 141
1
Por la ecuación (6.1), cos2 2x = (1 + cos 4x). Por lo tanto
2

1 1 1 1
cos2 2x dx = (1 + cos 4x)dx = [x + sen 4x] + C = [2x + sen 2x cos 2x] + C .
2 2 4 4

Integral 3: sen 2x cos 2x dx.
1
Por la ecuación (6.3), sen 2x cos 2x = sen 4x. Por lo tanto
2

1 1
sen 2x cos 2x dx = sen 4x dx = − cos 4x + C
2 8
1 1 1 1
= − (1 − 2 sen 2x) + C = sen2 2x + C − = sen2 2x + C ,
2
8 4 8 4
siendo C una nueva constante arbitraria. La mayorı́a de las tablas de integrales indefinidas omiten la cons-
tante arbitraria, y este ejemplo muestra por qué diferentes tablas dan a veces resultados aparentemente
diferentes para integrales indefinidas.

Integral 4: sen 2x sen 4x dx.
1 1
Por la ecuación (6.4), sen 2x sen 4x = cos (– 2x) − cos 6x = cos 2x − cos 6x . Por lo tanto
2 2

1 1 sen 2x sen 6x
sen 2x sen 4x dx = cos 2x − cos 6x dx = − +C.
2 2 2 6
6.3. El método de sustitución

El polinomio
f (x) = (2x − 1)3
puede integrarse desarrollando primero el cubo y luego integrando término a término

(véase la parte correspondiente a la regla de la cadena en el Apartado 4.6):
f (x) = (2x − 1)3 = 8x3 − 12x2 + 6x − 1

(2x − 1)3 dx = 8 x3 dx − 12 x2 dx + 6 x dx − dx
= 2x4 − 4x3 + 3x2 − x + C

1
= (2x − 1)4 + C
8
(C = C − 1/8 es una constante arbitraria).
Una manera más sencilla de integrar la función es hacer la sustitución
du
u = 2x − 1 , du = dx = 2 dx ,
dx
donde du es el diferencial de u(x). Entonces, dx = 12 du y

1 1 1
(2x − 1) dx =
3
u3 du = u4 + C = (2x − 1)4 + C .
2 8 8
Hemos transformado la integral en una ‘integral estándar’ cambiando la variable de inte-

gración de x a u. El método de sustitución también se denomina integración mediante
cambio de variable.
En el caso general, dada la integral de una función f (x) cuya forma no es estándar, el
método de sustitución busca una nueva variable tal que

f (x) dx = g(u) du (6.7)
donde la integral a la derecha es una integral estándar, esto es, g(u) es más fácil de inte-
grar que f (x). Derivando ambos lados de (6.7) con respecto a x tenemos:
a la izquierda, por la definición de la integral indefinida,

d
f (x) dx = f (x) ,
dx
a la derecha, aplicando la regla de la cadena,

d d du du
g(u) du = g(u) du × = g(u) .
dx du dx dx
Por lo tanto
du
f (x) = g(u) (6.8)
dx
y, sustituyendo en (6.7),

du
f (x) dx = g(u) dx = g(u) du . (6.9)
dx
La habilidad fundamental para poder aplicar el método de sustitución es la capacidad de

reconocer cuándo un integrando puede escribirse en la forma (6.8). La transformación
de la integral se hace entonces con el cambio
du
u = u(x), du = dx , (6.10)
dx
dx
o, como alternativa, x = x(u), dx = du.
du

EJEMPLO 6.2 Halle la integral f (x) dx = (x + x2 )−1/2 (1 + 2x)dx.
d
Como (1 + 2x) = (x + x2 ), hacemos el cambio u = x + x2 , du = (1 + 2x)dx.
dx
Entonces
du
f (x) = (x + x2 )−1/2 (1 + 2x) = u−1/2
dx
y
(x + x2 )−1/2 (1 + 2x)dx = u−1/2 du = 2u1/2 + C = 2(x + x2 )1/2 + C .
El resultado se confirma derivando:
d
2(x + x2 )1/2 + C = (x + x2 )−1/2 (1 + 2x) .
dx

2
EJEMPLO 6.3 Halle la integral I = (4x + 3)e−(2x +3x+1)
dx.
Sea u = 2x2 + 3x + 1, du = (4x + 3)dx. Entonces

2
I = e−u du = −e−u + C = −e−(2x +3x+1) + C .

1
EJEMPLO 6.4 Demuestre que (ax + b)n dx = (ax + b)n+1 + C
a(n + 1)
donde los números a, b y n son arbitrarios, salvo que n = −1.
Sea u = ax + b, du = a dx. Entonces

1 1 un+1
(ax + b)n dx = un du = +C
a an+1
y u se sustituye por ax + b.
No hay una regla que abarque todos los casos y permita hallar el cambio de variable
adecuado que transforme una integral a forma estándar. Dominar el arte de la integración
es el resultado de mucha práctica. Algunos de los tipos más sencillos de sustitución se
recogen en la Tabla 6.2
Tabla 6.2
Tipo Cambio Resultado

1. f (x)f (x) dx u = f (x), du = f (x) dx u du = 12 u2 + C

f (x) du
2. dx u = f (x), du = f (x) dx = ln u + C
f (x) u

3. f ( sen x) cos x dx u = sen x, du = cos x dx f (u) du

4. f ( cos x) sen x dx u = cos x, du = − sen x dx − f (u) du

EJEMPLOS 6.5 Integrales de tipo 1: f (x)f (x) dx.

(i) I= sen ax cos ax dx.
En este caso, cos ax es proporcional a la derivada de sen ax (y viceversa):
f (x) = sen ax, f (x) = a cos ax .
Por lo tanto, tomando u = sen ax, du = a cos ax dx,

1 1 2 1
I= u du = u +C = sen2 ax + C .
a 2a 2a
Vemos que esta integral es idéntica al caso 3 de la Tabla 6.1, y este ejemplo ilustra cómo hay a menudo
varias maneras de evaluar una integral en particular.

ln x
(ii) I = dx.
x
1 d 1
Como = ln x, tomamos u = ln u y du = dx. Entonces
x dx x

1 1
I = u du = u2 + C = (ln x)2 + C .
2 2

f (x)
EJEMPLOS 6.6 Integrales de tipo 2: dx.
f (x)

x
(i) I= dx.
2x2 + 3
En este caso, x es proporcional a la derivada de 2x2 + 3: f (x) = 2x2 + 3, f (x) = 4x.
Por lo tanto, tomando u = 2x2 + 3, du = 4x dx,

1 du 1 1
I= = ln u + C = ln (2x2 + 3) + C .
4 u 4 4

cos x
(ii) I= cotg x dx = dx.
sen x
Sea u = sen x. Entonces du = cos x dx, y

du
I= = ln u + C = ln (sen x) + C .
u

1
(iii) I= dx.
x ln x
1
Sea u = ln x. Entonces du = dx y
x

du
I= = ln u + C = ln (ln x) + C .
u

EJEMPLOS 6.7 Integrales de tipo 3: f (sen x) cos x dx.

(i) I= sena x cos x dx, siendo a un número arbitrario (pero a = −1).
Sea u = sen x, du = cos x dx, y

1 1
I = ua du = ua+1 + C = sena+1 x + C .
a+1 a+1

(ii) I= esen x cos x dx.
Sea u = sen x. Entonces du = cos x dx, y

I = eu du = eu + C = esen x + C .
Sustituciones trigonométricas e hiperbólicas

Las integrales estándar presentadas en la Tabla 6.3 puede ser evaluadas sustituyendo
x apropiadamente por funciones trigonométricas e hiperbólicas
Tabla 6.3
x
dx
1. √ = arcsen +C, |x| < |a| .
a2 − x2 a
x

dx
2. √ = arccosh + C = ln x + x2 − a2 + C , |x| > |a| .
x2 − a2 a

dx x

3. √ = arcsenh + C = ln x + x2 + a2 + C .
x2 + a2 a

dx 1 x
4. = arctg +C.
a2 + x2 a a
x
dx 1 1 a + x
5. = arctgh + C = ln +C.
a2 − x2 a a 2a a − x
La√integral 1 de√la tabla se evalúa usando

√ el cambio x = a sen θ. Entonces dx = a cos θ dθ
y a2 − x2 = a2 − a2 sen2 θ = a 1 − sen2 θ = a cos θ. Por lo tanto
x
dx a cos θ dθ
√ = = dθ = θ + C = arcsen +C.
a2 − x 2 a cos θ a
De la misma manera, la integral 2 se evalúa mediante el cambio x = cosh u.

Estas sustituciones son útiles cuando el integrando tiene la raı́z cuadrada de una fun-
ción cuadrática.
EJEMPLO 6.8 Halle el valor de a2 − x2 dx.

Sea x = a sen θ. Entonces dx = a cos θ dθ, a2 − x2 = a cos θ y

a2 − x2 dx = a2 cos2 θ dθ .
Ésta es la integral 1 de la Tabla 6.1, por lo tanto

a2 a2
a2 − x2 dx = (1 + cos 2θ) dθ = (θ + sen θ cos θ) + C .
2 2
√
Ahora bien, sen θ = x/a, cos θ = a2 − x2 /a, y θ = arcsen (x/a). Por lo tanto,

x 1
1
a2 − x2 dx = a2 arcsen + x a2 − x2 + C .
2 a 2
La integral 4 de la Tabla 6.3, que se evalúa con el cambio x = a tg θ, se usa en el Apartado

6.6 para integrar funciones racionales.
La integral 5 puede ser evaluada ya sea mediante el cambio x = a tgh u o expresando
el integrando en fracciones simples para dar la forma logarı́tmica (véase el Apartado 6.6).
De manera alternativa, todas las integrales de la tabla se obtienen fácilmente integrando
las derivadas que aparecen en las Tablas 4.5 y 4.6.
Integrales definidas
Cuando se cambia la variable de integración en una integral definida con el método
de sustitución, por ejemplo de x a u(x), los lı́mites de integración tienen también que
cambiarse. Si el intervalo de integración en x es desde a hasta b, entonces el intervalo en
u(x) es desde u(a) hasta u(b):
b u(b)
f (x) dx = g(u) du . (6.11)

a u(a)
π
EJEMPLO 6.9 Halle la integral I= cos2 x sen x dx.
0
Sustituimos u = cos x y du = − sen x dx. Cuando x = 0, u = cos 0 = +1. Cuando x = π, u = cos π = −1.
Por lo tanto −1 +1
I=− u2 du = + u2 du
+1 −1
puesto que al intercambiar los lı́mites el signo de la integral cambia. Tenemos entonces
π +1 +1
u3 2
cos2 x sen x dx = u2 du = = .
0 −1 3 −1 3
6.4. Integración por partes 147
EJEMPLO 6.10 Halle el área del cı́rculo de ecuación x2 + y2 = a2 .

Como en el Ejemplo 5.5, sea A el área del cuarto de √
cı́rculo que está en el primer cuadrante, en el que tanto
x como y son positivos (Figura 5.11). Entonces y = a2 − x2 y
a
A= a2 − x2 dx .
0
Al igual que en el Ejemplo 6.8, la integral se evalúa con el cambio x = a sen θ, y los nuevos lı́mites de
integración son θ = 0 cuando x = 0 y θ = π/2 cuando x = a. Por lo tanto,
π/2
a2 π/2 πa2
A = a2 cos2 θ dθ = θ + sen θ cos θ = .
0 2 0 4
El área del cı́rculo es cuatro veces esto.
6.4. Integración por partes

En la integral

y= x cos x dx
el integrando es el producto de dos funciones de tipo muy distinto: el polinomio x y la

función trigonométrica cos x.
El valor de la integral es
y = x sen x + cos x + C
como puede comprobarse derivando:
dy d d
= x sen x + cos x
dx dx dx

= sen x + x cos x + − sen x = x cos x .
Hemos usado la regla del producto para derivar el producto x sen x, y el método de
integración por partes se usa para integrar productos de este tipo. En general, sea y = uv,
donde u y v son funciones de x. Entonces
dy dv du
=u +v (6.12)
dx dx dx
e, integrando ambos miembros con respecto a x,

dy dv du
dx = u dx + v dx . (6.13)
dx dx dx
El primer miembro es igual a y = uv por definición, y la ecuación puede reescribirse

como

dv du
u dx = uv − v dx . (6.14)
dx dx
Esta ecuación, que es la inversa de la regla del producto, es la regla de integración por
partes. Dado un integrando como x cos x, uno de los factores se identifica con u en (6.14),
el otro con dv/dx. Por ejemplo, sea
dv
u = x, = cos x .
dx
Entonces
du
= 1, v = sen x ,
dx
y (6.14) se transforma en

d d
x (sen x) dx = x sen x − sen x (x) dx
dx dx

= x sen x − sen x dx
= x sen x + cos x + C .
El arte de la integración por partes es la capacidad de elegir correctamente u y v. Ası́, en

nuestro ejemplo anterior la elección u = cos x y dv/dx = x da

1 2 1 2
x cos x dx = x cos x − x × – sen x dx
2 2

1 2 1
= x cos x + x2 sen x dx
2 2
y el problema se ha hecho más complicado. Este ejemplo ilustra la regla de que si uno de
los factores es un polinomio, entonces, salvo una única excepción importante, se debe
escoger el polinomio como la función u de la ecuación (6.14).

EJEMPLO 6.11 Integre por partes x2 cos x dx.
dv du
Sea u = x2 y = cos x. Entonces = 2x y v = sen x, y
dx dx

x2 cos x dx = x2 sen x − 2 x sen x dx .
El grado del polinomio bajo el signo de integración ha disminuido una unidad: x2 ha sido sustituido por x.
6.4. Integración por partes 149
dv
Integrando por partes la nueva integral, con u = x y = sen x, tenemos
dx

x sen x dx = −x cos x + cos x dx = −x cos x + sen x .
Por lo tanto

x2 cos x dx = x2 sen x − 2 −x cos x + sen x + C
= x2 sen x + 2x cos x − 2 sen x + C .

Los resultados se pueden comprobar derivando.
En general, un polinomio de grado n puede ser eliminado con n sucesivas integraciones

por partes. La excepción a la regla es cuando el otro factor es una función logarı́tmica.

EJEMPLO 6.12 Integre por partes xn ln x dx, (n = −1).
En este caso, tomar u = xn conduce a una integral más complicada. La elección correcta es u = ln x y
dv du 1
= xn . Entonces = y v = xn+1 /(n + 1), y
dx dx x

1 n+1 1 1
xn ln x dx = x ln x − xn+1 × dx
n+1 n+1 x

1 n+1 1
= x ln x − n
x dx
n+1 n+1
1 n+1 1
= x ln x − xn+1 + C
n+1 (n + 1)2
1
= x n+1
(n + 1) ln x − 1 +C.
(n + 1)2
Un caso particular de esta integral es, para n = 0,

xn ln x dx = x ln x − x .
dv
En este caso la sustitución es u = ln x, = 1.
dx
La integración por partes es únicamente inmediata si uno de los factores es un polinomio.

∞
EJEMPLO 6.13 Integre e−ax cos x dx, (a > 0).
0
dv
En este caso cualquier factor puede elegirse como u en (6.14). Por ejemplo, si u = e−ax y = cos x,
dx
entonces, para la integral indefinida,

I = e−ax cos x dx = e−ax sen x + a e−ax sen x dx

= e−ax sen x + a −e−ax cos x − a e−ax cos x dx

= e−ax sen x − ae−ax cos x − a2 e−ax cos x dx
= e−ax sen x − ae−ax cos x − a2 I .

Entonces, despejando I,

1
I= e−ax cos x dx = e−ax (sen x − a cos x) + C
1 + a2
y
∞
a
e−ax cos x dx = .
0 1 + a2
6.5. Fórmulas de reducción

El método de integración por partes puede usarse para obtener fórmulas para familias
de integrales relacionadas. Sea la integral

In = xn eax dx ,
dv
donde n es un entero positivo. Tomando u = xn y = eax en la fórmula (6.14),
dx

1 n
In = xn eax − xn−1 eax dx
a a
o bien
1 n ax n
In = x e − In−1 . (6.15)
a a
Este resultado se denomina una fórmula de reducción para In , o una relación de re-
currencia entre In e In−1 . Por ejemplo
1 3 ax 3 1 2 ax 2 1 ax 1
I3 = x e − I2 , I2 = x e − I1 , I1 = xe − I0 ,
a a a a a a

1 ax
I0 = eax dx = e +C.
a
Entonces

1 ax 3 3 2 6 6
I3 = e x − x + 2 x − 3 .
a a a a
Más importante aún, la relación de recurrencia es perfecta para calcular uno o más miem-
bros de una familia de integrales.
6.5. Fórmulas de reducción 151
Hay fórmulas especialmente sencillas para algunas integrales definidas que son im-
portantes en las ciencias fı́sicas. Por ejemplo, la integral
∞
In = e−ar rn dr (a > 0) , (6.16)
0
donde n es un entero positivo o nulo, aparece en la descripción mecánico-cuántica de las

propiedades del átomo de hidrógeno. Integrando por partes
∞
1 n
In = − e−ar rn + In−1 .
a 0
a
Si n = 0, la cantidad e−ar rn es cero en ambos lı́mites de integración, r = 0 y r → ∞. Por

lo tanto
n
In = In−1 , n ≥ 1,
a
y se deduce que
∞
n!
In = e−ar rn dr = , (6.17)
0 an+1
donde n! = n(n − 1)(n − 2) · · · 1 es el factorial de n.
EJEMPLO 6.14 Determine una fórmula de reducción para

In = cosn x dx ,
siendo n un entero positivo.

dv
Escribimos el integrando como cosn−1 x cos x, y tomamos u = cosn−1 x y = cos x. Entonces
dx

In = cosn−1 x sen x + (n − 1) cosn−2 x sen2 x dx
y, como sen2 x = 1 − cos2 x,

In = cosn−1 x sen x + (n − 1) cosn−2 x dx − (n − 1) cosn x dx
= cosn−1 x sen x + (n − 1)In−2 − (n − 1)In .
Despejando In obtenemos
1 n−1
In = cosn−1 x sen x + In−2 .
n n
EJEMPLO 6.15 Determine una fórmula de reducción para la integral definida

π/2
In = cosn x dx .
0
Del resultado del Ejemplo 6.14,

π/2
1 n−1
In = cosn−1 x sen x + In−2 .
n 0 n
Como sen 0 = 0 y cosn−1 π/2 = 0 si n > 1, se deduce que
n−1
In = In−2 , n ≥ 2,
n
con
π/2 π/2
π
I1 = cos x dx = 1, I0 = dx = .
0 0 2
Por ejemplo,
3 3 1 3π 4 4 2 8
I4 = I2 = × I0 = , I5 = I3 = × I1 = .
4 4 2 16 5 5 3 15
EJEMPLO 6.16 Determine una fórmula de reducción para

∞
2
In = e−ar rn dr .
0
d 2 2 1 2

Como e−ar = −2ar e−ar , el integrando se escribe como − −2ar e−ar rn−1 . Entonces, por partes,
dr 2a
∞ ∞
2 1 2 (n − 1) ∞ −ar2 n−2
e−ar rn dr = − e−ar rn−1 + e r dr .
0 2a 0 2a 0
2
Ahora bien, e−ar → 0 cuando r → ∞ y, si n > 1, rn−1 = 0 cuando r = 0. Entonces, para n ≥ 2,
∞ ∞
2 (n − 1) 2 (n − 1)
e−ar rn dr = e−ar rn−2 dr, In = In−2 .
0 2a 0 2a
Para n = 1, ∞
∞ 2 1 2 1
I1 = e−ar r dr = − e−ar = .
0 2a 0 2a
Para n = 0,
∞
−ar2 1 π
I0 = e dr = . (6.18)
0 2 a
Esta última integral es una integral estándar que no puede calcularse con los métodos descritos en este
capı́tulo (véase el Apartado 9.11).
Las integrales In son importantes, por ejemplo, en quı́mica molecular cuántica. En los métodos actuales
de cálculo para hallar funciones de onda moleculares, los orbitales moleculares se expresan en función de
2
‘funciones de base gaussianas’. Tales funciones son esencialmente la exponencial e−ar multiplicada por un
polinomio, y la utilización de esas funciones lleva a integrales del tipo presentado en este ejemplo.
6.6. Integrandos racionales. El método de fracciones simples 153
6.6. Integrandos racionales. El método de fracciones simples

Una función algebraica racional es en general de la forma P(x)/Q(x), donde P(x) y
Q(x) son polinomios. Vimos en el Apartado 2.6 que todas esas funciones pueden expre-
sarse como la suma de un polinomio y una o más fracciones simples de los tipos (si se
excluyen números complejos)
1 ax + b
(i) , (ii) , (6.19)
(x + a)n (x + px + q)n
2
donde n es un entero positivo y la función cuadrática x2 + px + q no tiene raı́ces reales,

es decir, su discriminante p2 − 4q es negativo.
Integrales de tipo (i)

Éstas son las integrales que aparecen en la teorı́a de procesos cinéticos elementales:
⎧

dx ⎨ ln (x + a) + C si n = 1,
= −1 (6.20)
(x + a)n ⎩ + C si n > 1.
(n − 1)(x + a)n−1

dx
EJEMPLO 6.17 Integre .
(2 − x)(4 − x)
El integrando puede expresarse en fracciones simples como

1 1 1 1
= − .
(2 − x)(4 − x) 2 2−x 4−x
Por lo tanto

dx 1 1 1
= − dx
(2 − x)(4 − x) 2 2−x 4−x

1 1 4−x
= – ln (2 − x) + ln (4 − x) + C = ln +C.
2 2 2−x

5x + 1
EJEMPLO 6.18 Integre dx.
x3 − 3x + 2
La función cúbica del denominador puede factorizarse como x3 − 3x + 2 = (x − 1)2 (x + 2) de manera que
el integrando puede expresarse en fracciones simples como
5x + 1 1 2 1
= + − .
x3 − 3x + 2 x−1 (x − 1)2 x+2
Entonces

5x + 1 dx dx dx
dx = +2 −
x3 − 3x + 2 x−1 (x − 1)2 x+2

2 x−1 2
= ln (x − 1) − − ln (x + 2) + C = ln − +C.
x−1 x+2 x−1
Integrales de tipo (ii)

Consideramos primero dos formas especiales.
El numerador es la derivada de la función cuadrática
En este caso, la integral es o bien del tipo 2 de la Tabla 6.2 o bien una generalización
sencilla del mismo:

2x + p f (x)
dx = n dx . (6.21)
(x2 + px + q)n [f (x)]
Si u = f (x) = x2 + px + q, entonces du = f (x) dx = (2x + p)dx, y

⎧
ln u + C si n = 1,
2x + p du ⎨
dx = = −1 (6.22)
(x + px + q)n
2
un ⎩ + C si n > 1.
(n − 1)un−1
Por lo tanto
⎧
⎨ ln (x + px + q) + C si n = 1,
2
2x + p
dx = −1 (6.23)
(x2 + px + q)n ⎩ + C si n > 1.
(n − 1)(x + px + q)n−1
2

dx
El numerador es la unidad:
(x2 + px + q)n
La integral se evalúa transformando primero el denominador en una expresión de la
forma u2 + a2 . Podemos escribir
2
p 2 p − 4q
x + px + q = x +
2
− (6.24)
2 4
donde p2 − 4q es el discriminante de la expresión cuadrática. Como hemos supuesto que

la expresión cuadrática no tiene raı́ces reales, el discriminante es negativo y

p 2 4q − p2
x + px + q = x +
2
+ = u2 + a2 , (6.25)
2 4
siendo u = x + p/2 y a2 = (4q − p2 )/4 > 0.

Entonces, puesto que dx = du,

dx du
= .
(x2 + px + q)n (u2 + a2 )n
Usamos ahora la sustitución trigonométrica u = a tg θ. Entonces du = a2 θ dθ = (a/ cos2 θ)dθ,

6.6. Integrandos racionales. El método de fracciones simples 155
y u2 + a2 = a2 ( tg2 θ + 1) = a2 / cos2 θ. Por lo tanto

du 1
= 2n−1 cos2n−2 θ dθ . (6.26)
(u2 + a2 )n a
Para n = 1,
u
du 1 θ 1
= dθ = + C = arctg +C, (6.27)
u +a
2 2
a a a a
que es una de las integrales estándar de la Tabla 6.3. Para n > 1, la integral (6.26) puede
evaluarse, por ejemplo, mediante reducción como en el Ejemplo 6.14.

dx
x2 + 2x + 5
La función cuadrática x2 + 2x + 5 puede escribirse como (x + 1)2 + 22 . Entonces, por la ecuación (6.27),
con a = 2 y u = x + 1,

dx dx 1 x+1
= = arctg +C.
x2 + 2x + 5 (x + 1)2 + 22 2 2

dx
(x2 + 2x + 5)3
Por la ecuación (6.26), con n = 3, a = 2 y u = x + 1,

dx 1
= cos4 θ dθ
(x2 + 2x + 5)3 32
donde tg θ = u/a = (x + 1)/2. Entonces, por reducción como en el Ejemplo (6.14),

1 3
cos4 θ dθ = sen θ cos3 θ + cos2 θ dθ
4 4
1 3 3
= sen θ cos3 θ + sen θ cos θ + θ + C .
4 8 8
Tenemos que deshacer el cambio de la variable θ a u (y luego a x). Si tg θ = u/a entonces θ = arctg (u/a)
y se comprueba fácilmente que
u a
sen θ = √ , cos θ = √ .
u2 + a2 u2 + a2
Entonces
1 ua3 3 ua 3 u
cos4 θ dθ = + + arctg +C
4 (u2 + a2 )2 8 u2 + a2 8 a
y

dx 1 2(x + 1) 3(x + 1) 3 x+1
= + + arctg +C.
(x2 + 2x + 5)3 32 (x2 + 2x + 5)2 4(x2 + 2x + 5) 8 2

ax + b
Forma general: dx
(x2 + px + q)n
El numerador puede escribirse como

a ap
ax + b = 2x + p + b − (6.28)
2 2
de manera que la integral se expresa en función de los casos especiales tratados anterior-
mente:

ax + b a 2x + p ap dx
dx = dx + b − . (6.29)
(x2 + px + q)n 2 (x2 + px + q)n 2 (x2 + px + q)n
Integrandos trigonométricos racionales

Por trigonometrı́a
θ θ 2 sen θ2 cos θ2
sen θ = 2 sen cos = ,
2 2 cos2 θ2 + sen2 θ2
(6.30)
θ θ cos2 θ2 − sen2 θ
cos θ = cos2 − sen2 = 2

.
2 2 cos2 θ2 + sen2 θ
2
Entonces, dividiendo los numeradores y los denominadores por cos2 θ/2 y tomando t =
tg θ/2, obtenemos
2t 1 − t2 θ
sen θ = , cos θ = , t = tg . (6.31)
1 + t2 1 + t2 2
Las funciones trigonométricas sen θ y cos θ son funciones racionales de t. Una función
trigonométrica de θ que se convierte en una función (algebraica) racional de t cuando
se hace el cambio t = tg θ/2 se denomina función trigonométrica racional de θ. Cada
una de esas funciones puede ser integrada con los métodos descritos previamente en
este apartado. Ası́, si el integrando de la integral f (θ) dθ es una función trigonométrica
racional de θ, el cambio
θ 2
t = tg , dθ = dt , (6.32)
2 1 + t2
da

2f (θ)
f (θ) dθ = dt , (6.33)
1 + t2
donde f (θ), expresada en t, es una función racional de t.

6.7. Derivación paramétrica de integrales 157
EJEMPLO 6.21 Ejemplos del cambio t = tg θ/2.

dθ 2 2t 1
(i) = dt = dt = ln t + C = ln tg θ/2 + C .
sen θ 1 + t2 1 + t2 t

dθ 2 1 − t2
(ii) = 3+5 dt
3 + 5 cos θ 1 + t2 1 + t2

2 2
= dt = dt
3(1 + t2 ) + 5(1 − t2 ) 8 − 2t2

dt 1 2 + t
= = ln +C
4 − t2 4 2 − t

1 2 + tg θ/2
= ln +C,
4 2 − tg θ/2
utilizando la integral estándar 5 de la Tabla 6.3.
Este método puede aplicarse en todos los casos pero no es siempre el más sencillo en la
práctica. Por ejemplo, aplicar el método a la integración de las funciones trigonométri-
cas elementales sen θ y cos θ es considerablemente más complicado que usar integrales
estándar.
6.7. Derivación paramétrica de integrales

Sea la integral indefinida

1
e−αx dx = − e−αx + C, (α = 0) .
α
La integral puede considerarse como una función del parámetro α. Derivando se obtiene

d d 1 −αx 1 x
e dx =
−αx
− e +C = + e−αx .
dα dα α α2 α
Por añadidura, integrando por partes,

d −αx 1 x
e dx = − xe dx =
−αx
+ e−αx .
dα α2 α
Se deduce que

d d −αx
e−αx
dx = e dx
dα dα
de manera que en este caso se pueden intercambiar el orden de la integración con res-
pecto a x y la derivación con respecto a α. Este resultado es cierto en el caso general

f (x, α) dx = F(x, α) + C , (6.34)
d
si f (x, α) y f (x, α) son funciones continuas de x y α:
dα

d d d
f (x, α) dx = f (x, α) dx = F(x, α) . (6.35)
dα dα dα
Para la correspondiente integral definida, si los lı́mites son independientes del parámetro
α,
b b
d d d d
f (x, α) dx = f (x, α) dx = F(b, α) − F(a, α) . (6.36)
dα a a dα dα dα
Cuando uno o ambos lı́mites de integración son infinitos, es necesario asegurarse de que
la integral de la función y la de su derivada son ambas convergentes.
∞
EJEMPLO 6.22 Integre e−ax xn dx.
0
En el Apartado 6.5 evaluamos la integral a partir de una fórmula de reducción obtenida mediante sucesivas
iteraciones por partes. Un método alternativo es derivar la sencilla integral estándar
∞
1
e−ax dx = , (a = 0) .
0 a
La derivada n-ésima de e−ax con respecto a a es (– 1)n xn e−ax de manera que

∞ n ∞ n

n −ax n d −ax n d 1 n!
x e dx = (– 1) n
e dx = (– 1) n
= n+1 .
0 da 0 da a a
∞
sen x
EJEMPLO 6.23 Integre dx.
0 x
La integral no puede ser evaluada con los métodos estándar presentados en este capı́tulo y el método de
integración por partes no funciona. Consideramos en su lugar la integral relacionada
∞ −αx
e sen x
I(α) = dx .
0 x
Entonces ∞
d
I(α) = − e−αx sen x dx
dα 0
y la nueva integral puede integrarse por partes como en el Ejemplo 6.13. Entonces
d 1
I(α) = − 2 (6.37)
dα α
6.8. Ejercicios 159
e, integrando con respecto a α,

dα
I(α) = − = − arctg α + C .
1 + α2
Para obtener el valor de la constante de integración, constatamos que I(α) → ∞ cuando α → ∞, de
manera que
π
C = lim arctg α = .
α→∞ 2
Para recuperar la integral original tomamos ahora α = 0:
∞
sen x π π
I(0) = dx = − arctg 0 + = . (6.38)
0 x 2 2
Cuando los lı́mites de integración también dependen del parámetro, el resultado de de-
rivar la integral viene dado por el teorema de Leibniz: si a(α) y b(α) son funciones
continuas de α,
b(α) b(α)
d d db da
f (x, α) dx = f (x, α) dx = f (b, α) − f (a, α) . (6.39)
dα a(α) a(α) dα dα dα
6.8. Ejercicios
Apartado 6.2
Evalúe las integrales indefinidas:
1. sen2 3x dx 2. sen 3x cos 3x dx 3. sen 3x cos 2x dx

4. sen x cos 3x dx 5. sen 3x sen x dx 6. cos 5x cos 2x dx

π/2 π/2 π
7. cos2 3x dx 8. sen 2x cos 2x dx 9. sen x cos 2x dx
0 0 0
10. Las funciones de onda para una partı́cula en una caja de longitud l son
nπx
2
ψn (x) = sen , n = 1, 2, 3, . . .
l l
Demuestre que las funciones satisfacen la condición de ortonormalidad
l
1 si m = n,
ψn ψm dx =
0
0 si m = n.
Apartado 6.3
Evalúelas integrales indefinidas (utilice el cambiodado entre paréntesis):
11. (3x + 1)5 dx (u = 3x + 1) 12. sen (4x − 1) dx (u = 4x − 1)

13. (3x2 + 2x + 5)3 (3x + 1) dx (u = 3x2 + 2x + 5)

3
14. (3x2 + 2)e−(x +2x)
dx (u = x3 + 2x)

2x + 1
15. dx (u = x2 + x + 2) 16. sen3 x cos x dx (u = sen x)
x2 + x + 2

17. tg x dx (u = cos x) 18. ex (1 + ex )1/2 dx (u = 1 + ex )

dx
19. (u = ln x) 20. x 4 − x2 dx (u = 4 − x2 )
x ln x

x dx
21. √ (x = 2 sen θ)
4 − x2
Evalúelas integrales indefinidas:

22. (2x − 1)1/2 dx 23. (2x3 + 3x − 1)1/3 (2x2 + 1) dx

cos x dx
24. x cos (3x2 − 1) dx 25. 26. cos x e2 sen x dx
1 − sen x
√
dx x2 dx x dx
27. 28. √ 29.
4 + x2 1 − x2 1+x

2 π2 √ π/2 √
x dx sen ( x + π)
30. 31. √ dx 32. sen θ cos θ dθ
1 3x − 2
2 x
0 0
1 ∞
dx 2
33. √ 34. xe−x dx
0 2 − x2 0
35. La forma de las lı́neas en espectroscopia de resonancia

∞ magnética se describen a menudo con la
1 T
función de Lorentz g(ω) = . Halle g(ω) dω.
π 1 + T 2 (ω − ω0 )2 ω0
Apartado 6.4
36. x sen x dx 37. x3 sen x dx 38. (x + 1)2 cos 2x dx

ln x
39. x ln x dx 40. dx 41. x2 e2x dx
x2

42. e−x sen 2x dx 43. eax cos bx dx

1 ∞ 1
44. xex dx 45. x2 e−2x dx 46. x2 ln x dx
0 0 0
π/2
47. e−2x cos 3x dx
0
6.8. Ejercicios 161
48. Una expresión aproximada para la función de partición rotacional de un rotor lineal es
∞
qr = (2J + 1)e−J(J+1)Θr /T dJ ,
0
donde Θr = /2Ik es la temperatura rotacional, I es el momento de inercia y k es la constante de Boltz-

2
mann. Evalúe la integral.
49. La probabilidad de que una molécula de masa m en un gas a temperatura T tenga velocidad v viene
dada por la distribución de Maxwell-Boltzmann
m 3/2 2
f (v) = 4π v2 e−mv /2kT ,
2πkT
∞
donde k es la constante de Boltzmann. Halle la velocidad media v̄ = v f (v) dv,
0
(véase el Ejercicio 73 del Capı́tulo 4).
Apartado 6.5

50. Determine una fórmula de reducción para senn x dx, siendo n un entero positivo.
51. Demuestre que, para los enteros m ≥ 0 y n ≥ 1,

senm+1 θ cosn−1 θ n−1
senm θ cosn θ dθ = + senm θ cosn−2 θ dθ .
m+n m+n

52. Utilice los resultados de los ejercicios 50 y 51 para evaluar sen5 x cos4 x dx.
53. Demuestre que, para los enteros m ≥ 0 y n ≥ 1,

π/2
n − 1 π/2
senm θ cosn θ dθ = senm θ cosn−2 θ dθ
0 m+n 0
π/2
54. Evalúe sen5 x cos5 x dx.
0
55. En espectroscopia, la forma de las lı́neas se analiza algunas veces usando segundos momentos. El
segundo momento de una señal centrada en la frecuencia angular ω0 es
∞
(ω − ω0 )2 g(ω) dω
ω0
donde g(ω) es una función para la forma de la señal. Evalúe la integral para la curva gaussiana

2 1
g(ω) = T exp − T 2 (ω − ω0 )2 .
π 2
56. Para la distribuciónde Maxwell-Boltzmann del ejercicio 49, halle la raı́z de la velocidad cuadrática

∞
media v2 , siendo v2 = v2 f (v) dv.
0
Apartado 6.6
dx (x + 2) dx dx
57. 58. 59.
(2x − 1)(x + 3) (x + 3)(x + 4) 3x2 − 5x − 2

x2 dx (x2 − 3x + 3) dx
60. 61.
(x − 1)(x − 2) (x + 1)(x + 2)(x + 3)

x dx dx dx
62. 63. 64.
(x2 + 3)(x2 + 4) x2 + 4x + 2 x2 + 4x + 5

x dx x2 dx dx
65. 66. 67.
x2 + 4x + 5 x + 4x + 5
2 (x2 + 4x + 5)2
Evalúeutilizando el cambio t = tg θ/2:

dθ dθ dθ
68. 69. 70.
cos θ 5 − 3 cos θ 1 + sen θ + cos θ
Apartado 6.7
71. Derivando la integral
∞
−ax2 1 π
e dx =
0 2 a
con respecto a a, demuestre que
∞

2n −ax2 1 · 3 · 5 · · · (2n − 1) π
x e dx = .
0 2n+1 an a
Sucesiones y series
7.1. Conceptos
Una serie es un conjunto de términos que han de ser sumados. Los términos pue-
den ser números, variables, funciones, o cantidades más complejas. Una serie puede ser
finita, con un número finito de términos,
u 1 + u2 + u 3 + · · · + un
o puede ser infinita,
u1 + u 2 + u3 + u 4 + · · ·
donde los puntos suspensivos indican que la suma ha de extenderse indefinidamente (ad
infinitum). Los términos por sı́ mismos forman una sucesión. Tratamos las sucesiones en
el Apartado 7.2, las series finitas en 7.3, las series infinitas y los criterios de convergencia
en 7.4 y 7.5. En el Apartado 7.6 tratamos de cómo las series de MacLaurin y de Taylor
pueden utilizarse para representar ciertos tipos de funciones en series de potencias (‘po-
linomios infinitos’), y en 7.7 cómo pueden usarse para obtener valores aproximados de
funciones. Algunas propiedades de las series de potencias se describen en el Apartado
7.8.
Las series aparecen en todas las ramas de las ciencias fı́sicas, y la representación
de funciones como series es una herramienta esencial para la resolución de muchos
problemas fı́sicos. Algunas funciones, como la función exponencial y otras funciones
trascendentes, se definen mediante series, lo mismo que importantes cantidades fı́sicas,
como por ejemplo la función de partición en termodinámica estadı́stica. Veremos en los
Capı́tulos 12-14 que las ecuaciones diferenciales relevantes en las ciencias fı́sicas a me-
nudo tienen soluciones que pueden representarse únicamente como series. A menudo
los métodos de resolución aproximados o numéricos se basan en series. Por ejemplo,
las soluciones de la ecuación de Schrödinger se representan a menudo como series, bien
sea en la teorı́a formal o en los métodos aproximados, como el método de ‘combinación
lineal de orbitales atómicos’ en la teorı́a de orbitales moleculares (OM CLOA). Una
aplicación importante de las series es el análisis de formas de onda mediante series de
Fourier y transformadas de Fourier. El análisis de Fourier lo tratamos en el Capı́tulo 15.
164 Capı́tulo 7. Sucesiones y series
7.2. Sucesiones
Una sucesión es un conjunto ordenado de términos
u1 , u2 , u3 , . . .
con una regla que especifica cada término. Por ejemplo, los números
1, 3, 5, 7, . . .
forman una serie definida por el término general
ur = 1 + 2(r − 1), r = 1, 2, 3, . . .
De manera alternativa, la regla puede expresarse como una relación de recurrencia más
un término inicial:
ur = ur−1 + 2 , u1 = 1 ,
de manera que, por ejemplo, u5 = u4 + 2 = 7 + 2 = 9. Esta sucesión es un ejemplo de

una progresión aritmética
a , a + d, a + 2d, a + 3d, . . . (7.1)
con la regla
ur = a + d(r − 1), r = 1, 2, 3, . . . (7.2)
Otra sucesión sencilla, pero importante, es la progresión geométrica
a, ax, ax2 , ax3 , . . . (7.3)
con la regla
ur = axr−1 , r = 1, 2, 3, . . . (7.4)
Una sucesión de términos ur se denota por {ur }.
EJEMPLOS 7.1 Sucesiones

1. Progresión aritmética:
0, 5, 10, 15, . . . ur = ur−1 + 5, u1 = 0 .

7.2. Sucesiones 165
2. Progresión geométrica:1
1, 7, 49, 343, . . . ur = 7ur−1 , u1 = 1 .

1 1 1 1
1, , , , ... ur = , r = 0, 1, 2, 3, . . .
2 4 8 2r
1 1 1 1
1, − , , − , . . . ur = − ur−1 , u1 = 1 .
3 9 27 3
3. Sucesión armónica:
1 1 1 1
1, , , , ... ur = , r = 0, 1, 2, 3, . . .
2 3 4 r
4. Sucesión (‘serie’) de Fibonacci:2
1, 1, 2, 3, 5, 8, 13, . . . ur = rr−1 + ur−2 , u0 = u1 = 1 .
Lı́mites de sucesiones

1
Los términos de la sucesión armónica ,
r
1 1 1
1, , , , ...
2 3 4
decrecen en magnitud al crecer r, y tienden hacia el valor cero cuando r tiende a infinito.
La cantidad

1
lim =0
r→∞ r
se llama lı́mite de la sucesión, y en este caso el lı́mite es finito y único. De manera

similar ocurre con la sucesión
1 2 3 4
, , , , ...
2 3 4 5

r−1 1 r−1
con término general ur = = 1 − , y lı́mite lim = 1.
r r r→∞ r
01. El papiro de Rhind (hacia 1650 a.C.) contiene un problema sobre “7 casas, 49 gatos, 343 ratones,
2401 espigas de grano, 16807 hekats”. La versión del ‘Problema de Saint Ives’ en el Liber abaci de Fibo-
nacci (1202 d.C.) es “7 ancianas van a Roma. Cada una tiene 7 mulas y cada mula lleva 7 sacos. Cada saco
contiene 7 hogazas, en cada hogaza hay 7 cuchillos y cada cuchillo está guardado en 7 fundas”.
02. Esta es la solución al paria coniculorum, o problema de los conejos, dado en el Liber abaci de
Fibonacci: “¿cuántas parejas de conejos se crı́an a partir de una pareja en un año si cada pareja crı́a otra
pareja cada mes y empiezan a criar a partir del segundo mes de haber nacido?”
Ası́,
u10 = 0,9 , u100 = 0,99 , u1000 = 0,999 , ...
y cuando r = 10n , el término ur tiene n nueves detrás de la coma decimal. Si el lı́mite

u de una sucesión es finito y único, se dice que la sucesión converge al lı́mite u. Si el
lı́mite no es finito o no es único, la sucesión es divergente. Por ejemplo, la progresión
aritmética (7.1) es necesariamente divergente para todo valor de a y de d:

lim a + d(r − 1) = ±∞ .
r→∞
La progresión geométrica (7.3) es interesante porque es convergente para algunos valores

de x y divergente para otros. Muestra seis posibles tipos de comportamiento, caracterı́sti-
cos de muchas sucesiones, representados en la Figura 7.1.
Figura 7.1
Los ejemplos mostrados son (para a = 1):
(a) x>1 1, 2, 4, 8, . . .
(b) x=1 1, 1, 1, 1, . . .
1 1 1
(c) 0<x<1 1, , , , ...
2 4 8
1 1 1
(d) −1 < x < 0 1, − , , − , . . .
2 4 8
(e) x = −1 1, −1, 1, −1, . . .
(f) x < −1 1, −2, 4, −8, . . .
La sucesión es convergente sólo para x = +1 y |x| < 1, tipos (b), (c) y (d), (y para el
caso trivial x = 0).
El comportamiento de una sucesión en el lı́mite no depende necesariamente del
comportamiento de una parte finita de la sucesión. La sucesión {1/(2,5 − r)2 } con
r = 0, 1, 2, . . ., por ejemplo, aumenta su valor inicialmente, pero se comporta como la
sucesión {1/r2 } cuando r → ∞. Un ejemplo más importante es la sucesión de los térmi-
7.3. Series finitas 167

nos de la serie exponencial, xr /r! . Esta sucesión tiene lı́mite cero para todo valor de
x. De esta manera, la razón de dos términos consecutivos es
r
xr+1 x x
=
(r + 1)! r! r+1
y los términos aumentan en magnitud cuando r + 1 < |x|, y disminuyen cuando r + 1 >
|x|.
EJEMPLOS 7.2 Halle el lı́mite lim (ur ).

r→∞
r−2
1. ur = .
2r
1 1 1
Tenemos ur = − , ası́ que ur → cuando r → ∞.
2 r 2
2r2 + 2r + 1
2. ur = .
r2 − r + 1
2 + 2/r + 1/r2
Dividiendo arriba y abajo por r2 , ur = → 2 cuando r → ∞.
1 − 1/r + 1/r2
De manera alternativa, como el polinomio (a0 + a1 r + a2 r2 + · · · + an rn ) se comporta como (an rn )
cuando r → ∞,
2r2 + 2r + 1 2r2
→ = 2 cuando r → ∞ .
r2 − r + 1 r2
3. ur = (– 1)r .
Ésta es la sucesión −1, +1, −1, +1, . . . y el lı́mite no está definido.
1
4. ur = sen → sen 0 = 0 cuando r → ∞.
r
7.3. Series finitas

Dada una sucesión u1 , u2 , u3 , . . . , las sumas parciales
S1 = u1
S2 = u 1 + u2
S3 = u 1 + u2 + u 3
...
con término general
Sn = u 1 + u 2 + u 3 + · · · + u n = ur (7.5)
r=1
también forman una sucesión S1 , S2 , S3 , . . . Una sucesión obtenida de esta manera se

llama una serie y, si la sucesión converge, el lı́mite
n

S = lim Sn = lim ur (7.6)

n→∞ n→∞
r=1
se llama suma de la serie.

La palabra serie se usa también comúnmente para las sumas de términos. Una serie
finita de n términos es entonces

u r = u 1 + u 2 + u 3 + · · · + un
r=1
con suma Sn , y la serie infinita es
ur = u 1 + u2 + u 3 + · · ·
r=1
con suma (si existe) dada por (7.6).
Series aritméticas
La suma de los n primeros términos de la progresión aritmética (7.1) es
Sn = [a + d(r − 1)] = a + [a + d] + [a + 2d] + · · · + [a + (n − 1)d] .

r=1
El valor de la serie finita se obtiene considerando la suma ordenada al revés,
Sn = [a + (n − 1)d] + [a + (n − 2)d] + · · · + a .
Entonces, sumando ambas expresiones término a término, se obtiene
2Sn = [2a + (n − 1)d] + [2a + (n − 1)d] + · · · + [2a + (n − 1)d]

= n[2a + (n − 1)d] ,
de manera que n
Sn = [2a + (n − 1)d] . (7.7)
2
En particular, la suma de los n primeros números naturales es (a = d = 1)
1
Sn = 1 + 2 + 3 + · · · + n = n(n + 1) . (7.8)
2
Series geométricas
La suma de los n primeros términos de la progresión geométrica (7.3) es
n−1
Sn = axr = a + ax + ax2 + ax3 + · · · + axn−1 .

r=0
Para obtener el valor de la serie, multiplicamos por x,
xSn = ax + ax2 + ax3 + ax4 · · · + axn
y restamos las dos series término a término:
Sn − xSn = a − axn = a(1 − xn ) .
Por lo tanto3

1 − xn
Sn = a , (x = 1) . (7.9)
1−x
Entonces, para a = 1,
1 − xn
= 1 + x + x2 + x3 + · · · + xn−1 . (7.10)
1−x
Esta ecuación puede verse de dos maneras:

1. el valor de la suma (1 + x + x2 + x3 + · · · + xn−1 ) es (1 − xn )/(1 − x),
2. la serie (1 + x + x2 + x3 + · · · + xn−1 ) es el desarrollo de la función (1 − xn )/(1 − x)
en potencias de x.
Este concepto de desarrollar una función utilizando un conjunto de (otras) funciones
proporciona una herramienta importante para representar funciones complicadas (o des-
conocidas) en las ciencias fı́sicas.
El desarrollo del binomio

El desarrollo del binomio es el desarrollo de la función (1 + x)n en potencias de x
cuando n es un entero positivo. Ejemplos de tales desarrollos son
(1 + x)2 = 1 + 2x + x2 ,
03. Una exposición de las series geométricas aparece en el Libro IX de los Stoichia (Elementos) de
Euclides. Euclides fue uno de los primeros en enseñar en el Museo de Alejandrı́a fundado por Tolomeo
I hacia el 300 a.C. tras haber ganado el control de Egipto cuando el imperio de Alejandro se disgregó en
323 a.C.
(1 + x)3 = 1 + 3x + 3x2 + x3 ,
(1 + x)4 = 1 + 4x + 6x2 + 4x3 + x4 .
En el caso general
n(n − 1) 2 n(n − 1)(n − 2) 3

(1 + x)n = 1 + nx + x + x + · · · + xn , (7.11)
2! 3!
n(n − 1)(n − 2) . . . (n − r + 1) r
x .
r!
EJEMPLO 7.3 Desarrolle (1 + x)6 en potencias de x.

Por la ecuación (7.11), con n = 6,
6×5 2 6×5×4 3 6×5×4×3 4
(1 + x)6 = 1 + 6x + x + x + x
2×1 3×2×1 4×3×2×1
6×5×4×3×2 5 6×5×4×3×2×1 6
+ x + x
5×4×3×2×1 6×5×4×3×2×1
= 1 + 6x + 15x2 + 20x3 + 15x4 + 6x5 + x6 .
El coeficiente de xr en el desarrollo (7.11) es

n n(n − 1)(n − 2) . . . (n − r + 1) n!
= = (7.12)
r r! r!(n − r)!
y se llama coeficiente binomial (a veces se lee como ‘n sobre r’). Los coeficientes bino-
miales son importantes en teorı́a de probabilidades,
n donde se los suele denotar como n Cr
n
(o Cr ). Veremos en el Capı́tulo 21 que r es el número de combinaciones de n objetos
tomados de r en r. Usando los coeficientes binomiales, el desarrollo es
n

n
(1 + x) =n
xr . (7.13)
r=0
r
Una forma más general para el desarrollo del binomio es

n

n
(x + y) =
n
xr yn−r . (7.14)
r=0
r

5
EJEMPLO 7.4 Calcule los coeficientes binomiales , y utilı́celos para desarrollar (i) (1 + x)5 y (ii)
r
(x + 3)5 en potencias de x.
Por la definición de los coeficientes,

5 5 5!
= = , r = 0, 1, 2, . . . , 5 .
r 5−r r! (5 − r)!
Por lo tanto, recordando que 0! = 1,

5 5 5! 5 5 5! 5 5 5!
= = = 1, = = = 5, = = = 10 .
0 5 0! 5! 1 4 1! 4! 2 3 2! 3!
(i) Por la ecuación (7.13),

5 0 5 1 5 2 5 3 5 4 5 5
(1 + x) =
5
x + x + x + x + x + x
0 1 2 3 4 5
= 1 + 5x + 10x2 + 10x3 + 5x4 + x5 .
(ii) Por la ecuación (7.14),

5 0 5 5 1 4 5 2 3 5 3 2 5 4 1 5 5 0
(x + 3) =
5
x3 + x3 + x3 + x3 + x3 + x3
0 1 2 3 4 5
= 243 + 405x + 270x2 + 90x3 + 15x4 + x5 .
Los coeficientes binomiales forman un patrón de números llamado triángulo de Pascal4

1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 ...
Cada fila comienza y termina con el número 1 para los coeficientes de xn y de yn en el
desarrollo de (x + y)n , y cada número interior es la suma de los dos números situados
diagonalmente sobre él.
04. Blaise Pascal (1623-1662). Filósofo y matemático francés que hizo contribuciones a la geometrı́a,
el cálculo y, junto con Fermat, desarrolló la teorı́a matemática de la probabilidad (instigado por el jugador
Antoine Gombard, Chevalier de Méré). El triángulo de Pascal aparece en el Traité du triangle arithmétique,
avec quelques autres petits traités sur la même manière, publicado póstumamente en 1665. El trabajo
contiene una exposición de las propiedades de los coeficientes binomiales, con aplicaciones a juegos de
azar. El triángulo era conocido desde mucho antes. Apareció en un libro del matemático chino Yang Hui en
1261, y las propiedades de los coeficientes binomiales fueron tratadas por el persa Jamshid Al-Kashi en su
Llave de la aritmética (hacia 1425).
El método de diferencias
Muchas series finitas sencillas pueden sumarse si el término general ur puede escri-
birse como la diferencia
ur = vr − vr−1 .
Entonces

ur = vr − vr−1
r=1 r=1 r=1
= (v1 + v2 + · · · + vn−1 + vn ) − (v0 + v1 + · · · + vn−1 )

= vn − v0 .
EJEMPLO 7.5 Halle la suma de la serie

n
1 1 1 1
= + + ··· + .
r=1
r(r + 1) 1·2 2·3 n(n + 1)
El término general puede escribirse como
1 1 1
= −
r(r + 1) r r+1
y, por lo tanto,

n
1
n
1
1
n
= −
r=1
r(r + 1) r=1
r r=1
r+1

1 1 1 1 1 1 1 1
= + + + ··· + − + + ··· + +
1 2 3 n 2 3 n n+1
1 n
= 1− = .
n+1 n+1
Algunas series finitas

m
La serie aritmética (7.8) es el ejemplo más sencillo de las series r , donde m es
un entero positivo, es decir, la suma de potencias de los números naturales.5 Algunas de
esas sumas y otras series finitas aparecen en la Tabla 7.1.
05. El método general para generar estas sumas se debe al matemático suizo Jakob Bernoulli (1654-
1705), profesor de matemáticas en Basilea. Con su hermano Johann (1667-1748), profesor de matemáticas
en Groningen y en Basilea, y en colaboración con Leibniz, contribuyó también al cálculo, la teorı́a de
ecuaciones diferenciales, las series y el cálculo de variaciones. Fue esta colaboración la que condujo al éxito
de la formulación de Leibniz del cálculo. Por el año 1700, la mayor parte del cálculo elemental (descrito en
este libro) habı́a sido desarrollado. El método de Newton de las fluxiones nunca fue bien conocido fuera de
Inglaterra. Fue Jakob Bernoulli quién usó por primera vez el término ‘integral’.
7.4. Series infinitas 173
Tabla 7.1 Algunas series finitas
n
1 2 1 1
r = 1 + 2 + 3 + ··· + n = n + n = n(n + 1)
r=1
2 2 2

n
1 3 1 2 1 1
r2 = 1 + 22 + 32 + · · · + n2 = n + n + n = n(n + 1)(2n + 1)
r=1
3 2 6 6

n
1 4 1 3 1 2 1
r3 = 1 + 23 + 33 + · · · + n3 = n + n + n = n2 (n + 1)2
r=1
4 2 4 4

n
1 5 1 4 1 3 1
r4 = 1 + 24 + 34 + · · · + n4 = n + n + n − n
r=1
5 2 3 30

n
1
r(r + 1) = n(n + 1)(n + 2)
r=1
3

n
1
r(r + 1)(r + 2) = n(n + 1)(n + 2)(n + 3)
r=1
4

n
1 n
=
r=1
r(r + 1) n+1

n
1 1 1
= −
r=1
r(r + 1)(r + 2) 4 2(n + 1)(n + 2)
Las sumas de muchas otras series se pueden deducir a partir de éstas.
EJEMPLO 7.6 Halle la suma de los n primeros términos de la serie
2 · 5 + 3 · 7 + 4 · 9 + ···
El término general es ur = (r + 1)(2r + 3) para r = 1, 2, 3, . . . . Entonces
ur = 2r(r + 1) + 3r + 3
n
ur = 2 r(r + 1) + 3 r+3 1
r=1 r=1 r=1 r=1
1 1
= 2 × n(n + 1)(n + 2) + 3 × n(n + 1) + 3 × n
3 2
1
= n(4n + 21n + 35) .
2
6
7.4. Series infinitas

El lı́mite de la sucesión de las sumas parciales es la (suma de la) serie infinita
n

S = lim u r = u1 + u 2 + u 3 + · · · (7.15)
n→∞
r=1
donde los puntos suspensivos indican que la suma debe extenderse indefinidamente. La
serie tiene suma sólo si el lı́mite es finito y único, esto es, cuando la sucesión de las
sumas parciales converge.
La serie geométrica
La serie geométrica es el lı́mite de la sucesión de sumas parciales
1 − xn
Sn = 1 + x + x2 + x3 + · · · + xn−1 = , x = 1
1−x
(cuando x = 1 la suma es n y la serie diverge). La sucesión de sumas presenta los seis

tipos de comportamiento ilustrados en la Figura 7.1 (el tipo (b) únicamente para el caso
trivial x = 0), y converge sólo cuando |x| < 1. Por lo tanto, para |x| < 1, xn → 0 cuando
n → ∞, y

1 − xn 1
lim =
n→∞ 1−x 1−x
1
de manera que la serie geométrica es el desarrollo de la función en potencias de x:
1−x
1
= 1 + x + x 2 + x3 + · · · , |x| < 1 . (7.16)
1−x
La serie diverge para todos los demás valores de x (|x| ≥ 1).
La serie armónica
1 1 1
S=1+ + + + ···
2 3 4
A pesar de las apariencias, la serie diverge. Puede ser escrita como la suma de sumas
parciales
7.5. Criterios de convergencia 175

1 1 1 1 1 1 1
S = 1+ + + + + + +
2 3 4 5 6 7 8

1 1 1 1 1 1 1 1
+ + + + + + + + + ···
9 10 11 12 13 14 15 16
1
= 1 + + s1 + s2 + s3 + · · ·
2
donde sn tiene 2n términos de los cuales el último, y menor, tiene valor 1/2n+1 . Cada una
de esas sumas es por lo tanto mayor que 2n × (1/2n+1 ) = 1/2. Por ejemplo,
1 1 1 1 1 1 1 1 1 1 1 1
s1 = + > + , s2 = + + + > + + + .
3 4 4 4 5 6 7 8 8 8 8 8
Se deduce que
1 1 1 1
S>1+ + + + + ···
2 2 2 2
y la serie diverge.6
7.5. Criterios de convergencia
El ejemplo de la serie geométrica muestra que es inmediato ver si una serie con-
verge, o lo contrario, si se tiene una expresión para las sumas parciales. La suma de la
serie infinita es el lı́mite de la sucesión de sumas parciales. Por otra parte, el ejemplo
de la serie armónica muestra que cuando no se conoce tal expresión, hay que emplear
procedimientos menos directos.
Dada una serie

ar = a1 + a 2 + a3 + · · ·
r=1
una primera condición necesaria para la convergencia es que el lı́mite de la sucesión {ar }
sea cero:
{ar } → 0 cuando r → ∞.
Si esta condición se satisface, se puede estudiar la convergencia de la serie de varias

maneras.
06. Esta demostración de la divergencia de la serie armónica y el tratamiento de otras series infinitas
aparece en las Quaestiones super geometriam Euclidis de Oresme (hacia 1350).
El criterio de comparación
Sean A = a1 + a 2 + · · · + a r + · · ·
B = b 1 + b2 + · · · + br + · · ·
dos series de términos positivos. Entonces:

1. Si la serie B converge, entonces la serie A converge si ar ≤ br .
2. Si la serie B diverge, entonces la serie A diverge si ar ≥ br .
EJEMPLO 7.7 La serie

1 1 1
S=1+ + p + p + ···
2p 3 4
converge si p > 1 y diverge si p ≤ 1.
1. p = 1: S es la serie armónica y diverge.
2. p < 1: cada término de S (tras el primero) es mayor que el término correspondiente de la serie
armónica y S diverge.
3. p > 1: escribimos la serie como

1 1 1 1 1 1
S = 1+ + + + + + + ···
2p 3p 4p 5p 6p 7p
= 1 + s1 + s2 + · · ·
donde sn tiene 2n términos

np
nde los cuales el primero, y mayor, es 1/2 . Cada suma sn es entonces
2n 1
menor que np = y
2 2p−1
2 3
1 1 1
S<1+ + + + ···
2p−1 2p−1 2p−1
r
La serie de la derecha es una serie geométrica convergente x con x = 1/2p−1 < 1.
La serie S es por lo tanto convergente para todo p > 1.
Criterio del cociente de d’Alembert7

La serie a1 + a2 + · · · +ar + ar+1 + · · ·
ar+1
1. converge si lim < 1,
r→∞ ar
07. Jean LeRond d’Alembert (1717-1783). Secretario de la Academia Francesa, es más conocido
por su contribución al desarrollo post-newtoniano de la mecánica con su principio de los trabajos virtuales
(principio de d’Alembert) publicado en su Traité de Dynamique (1743). Contribuyó a la teorı́a de ecuaciones
diferenciales, al cálculo y a las series infinitas. En su Différentiel (1754) en la Encyclopédie des sciences,
des arts et des métiers (1751-1772) dio por primera vez la derivada como el lı́mite de un cociente de
incrementos pero, a causa de las dificultades conceptuales asociadas al lı́mite como proceso consistente en
un número infinito de pasos, la definición no fue aceptada hasta el trabajo de Cauchy (1821). Dio la solución
completa de la precesión de los equinoccios. Aunque el criterio del cociente se le suele atribuir a él, y a
veces también a Cauchy, fue probablemente dado por primera vez en 1776 por el matemático de Cambridge
Edward Waring (1734-1793).
7.5. Criterios de convergencia 177

ar+1
2. diverge si lim > 1,
r→∞ ar
3. puede hacer cualquiera de las dos cosas si el lı́mite es igual a 1, y otras pruebas son
necesarias.
EJEMPLOS 7.8 El criterio del cociente

(i) La serie geométrica 1 + x + x2 + x3 + · · ·
ar+1
El término general es ar = xr , ası́ que ar+1 = xr+1 y = x, independiente de r. Entonces
ar

ar+1
lim = |x|
r→∞ ar
y la serie converge si |x| < 1, diverge si |x| > 1, y el criterio falla para x = ±1. En este caso se demuestra
fácilmente por inspección que la serie diverge cuando x = ±1.
x x2 x3
(ii) La serie exponencial 1 + + + + ···
1! 2! 3!
r
x xr+1 ar+1 x
El término general es ar = , ası́ que ar+1 = y = . Entonces
r! (r + 1)! ar r+1

ar+1
lim = lim x = 0
r→∞ ar r→∞ r + 1
y la serie converge para todo valor de x.
Criterio integral de Cauchy8

Sea a1 + a2 + · · · + ar + · · · una serie de términos positivos decrecientes (ar+1 < ar ).
Sea a(x) una función de la variable continua x tal que a(x) decrece al crecer x y a(r) = ar .
Entonces la serie ∞
converge si a(x) dx converge (es finita y única),
∞1
diverge si a(x) dx diverge.
1
1 1
EJEMPLO 7.9 La serie armónica 1 + + ···
2 3
1 1 ∞ ∞
En este caso, ar = y a(x) = . Entonces 1
r x dx = ln x
1 x 1
y ln x → ∞ cuando x → ∞. Por lo tanto la serie armónica diverge.
08. Augustin-Louis Cauchy (1789-1857). El principal matemático francés de la primera mitad del
siglo XIX, es sobre todo conocido por su trabajo sobre la teorı́a de funciones de variable compleja, con el
teorema integral de Cauchy y el cálculo de residuos. Hizo contribuciones, entre otras, a las ecuaciones en
derivadas parciales, la teorı́a de la elasticidad, las series infinitas y los lı́mites (véase d’Alembert). Inventó el
término determinante para su clase de funciones simétricas alternadas (1812). El criterio integral se asocia
a veces con MacLaurin.
Series alternadas
Si los términos de la serie a1 + a2 + a3 + · · · se van haciendo progresivamente más
pequeños y alternan su signo entonces la serie converge. Por ejemplo, la serie armónica
alternada
1 1 1
1− + − ···
2 3 4
converge. Veremos en el Apartado 7.2 que la suma de esta serie es ln 2.
7.6. Series de MacLaurin y de Taylor

Series de potencias
Una serie de potencias en la variable x tiene la forma de un ‘polinomio infinito’
c0 + c1 x + c2 x2 + c3 x3 + · · ·
donde c0 , c1 , c2 , . . . son constantes. Las propiedades de convergencia de tales series pue-

den estudiarse con los métodos descritos en el apartado anterior. Ası́, aplicando el criterio
del cociente, una serie de potencias converge si

cr+1 xr+1 cr+1
lim
= |x| lim <1
r→∞ cr xr r→∞ cr
o, de manera equivalente, si

cr
|x| < lim = R, (7.17)
r→∞ cr+1
donde R se llama radio de convergencia de la serie. La serie es por lo tanto convergente

si |x| < R, o −R < x < R, diverge si |x| > R, y para el caso x = ±R es necesario otro
método.
Las series geométrica y exponencial son ejemplos de series de potencias. La serie
geométrica tiene radio de convergencia R = 1, la serie exponencial tiene R = ∞ (véase
el ejemplo 7.8).
Serie de MacLaurin9
Vimos en el Apartado 7.4 que la serie geométrica puede entenderse como el desarro-
llo de la función 1/(1 − x) en potencias de x. De manera similar, la serie exponencial
09. Colin MacLaurin (1698-1746), profesor de matemáticas en Edimburgo. La serie que lleva su
nombre apareció en su Treatise of fluxions (1742), pero la serie de Taylor, más general, fue publicada en
1715, y era ya conocida por el matemático escocés James Gregory (1638-1675). El Treatise contiene además
el método para decidir la cuestión del máximo/mı́nimo analizando el signo de una derivada superior.
7.6. Series de MacLaurin y de Taylor 179
puede entenderse como el desarrollo de aquella función f (x) = ex cuya derivada es igual
a sı́ misma, f (x) = f (x). Muchas otras funciones pueden desarrollarse de esta manera.
Sea f (x) una función de x que puede ser representada por una serie de potencias
f (x) = c0 + c1 x + c2 x2 + c3 x3 + c4 x4 + · · · (7.18)
Los coeficientes c0 , c1 , c2 , . . . pueden obtenerse de la siguiente manera. Las derivadas de

la función son
df
f (x) = = c1 + 2c2 x + 3c3 x2 + 4c4 x3 + · · ·
dx
d2 f
f (x) = = 2c2 + 6c3 x + 12c4 x2 + · · ·
dx2
d3 f
f (x) = = 6c3 + 24c4 x + · · ·
dx3
...
Entonces, tomando x = 0,
f (0) = c0 , f (0) = c1 , f (0) = 2! c2 , f (0) = 3! c3 , . . .
y, en general, para la derivada n-ésima,

n
d f (x) 1 (n)
f (0) =
(n)
= n! cn , cn = f (0) .
dxn x=0 n!
Sustituyendo en (7.18) tenemos entonces
x x2 x3
xn ∞
f (x) = f (0) + f (0) + f (0) + f (0) + · · · = f (n) (0) . (7.19)

1! 2! 3! n=0
n!
Esta serie de potencias se llama desarrollo en serie de MacLaurin de la función f (x).

La serie de MacLaurin es un desarrollo de la función
f (x) en torno al punto x = 0 (Figura 7.2), esto es, el valor
de la función en el punto x se expresa mediante los valores
de la función y de sus derivadas en el punto x = 0. Para
que esto sea posible la función y sus derivadas tienen que
existir en x = 0 y además en todo el intervalo entre 0 y x.
Aparte de esto, el desarrollo sólo es válido dentro del radio
de convergencia de la serie.
Figura 7.2
Ejemplos de series de MacLaurin

1. La serie binomial10
La serie binomial es el desarrollo de MacLaurin de la función (1 − x)a para valores
arbitrarios de a. Tenemos
f (x) = (1 + x)a
f (x) = a(1 + x)a−1
f (x) = a(a − 1)(1 + x)a−2
f (x) = a(a − 1)(a − 2)(1 + x)a−3
...
f (n) (x) = a(a − 1)(a − 2) . . . (a − n + 1)(1 + x)a−n
...
Para x = 0, el factor (1 + x)a−n se sustituye por 1,
f (0) = 1, f (0) = a, f (0) = a(a − 1), f (0) = a(a − 1)(a − 2), ...
y el desarrollo de MacLaurin es
a(a − 1) 2 a(a − 1)(a − 2) 3

(1 + x)a = 1 + ax + x + x + ··· (7.20)
2! 3!
a(a − 1)(a − 2) . . . (a − n + 1) n
x .
n!
La serie (7.20) se llama serie binomial, y es la generalización del desarrollo binomial,
ecuación (7.11), a una potencia arbitraria. De hecho, si a = n es un entero positivo,
las derivadas de órdenes n + 1 y superiores son cero, y (7.20) se reduce al desarrollo
binomial. Si a no es un entero positivo, la serie tiene radio de convergencia R = 1. De
esta manera, aplicando el criterio del cociente,

cr r
R = lim = lim =1
r→∞ cr+1 r→∞ a − r
y la serie binomial converge para valores −1 < x < +1. Puede converger además para
x = ±1.
010. El teorema (serie) binomial fue descubierto por Newton en 1665 y descrito en 1676 en cartas
dirigidas a Henry Oldenburg, secretario de la Royal Society, para su trasmisión a Leibniz. El teorema fue
publicado por Wallis en su Algebra de 1685.
7.6. Series de MacLaurin y de Taylor 181
La expresión más general, el desarrollo de (x + y)a , se obtiene a partir de (7.20)

factorizando el término xa , si |x| > |y|, o ya si |y| > |x|. De esta manera, si |x| > |y|,
y a
(x + y)a = xa 1 +
x
y a(a − 1) y 2 a(a − 1)(a − 2) y 3
= x 1+a
a
+ + + · · · (7.21)
x 2! x 3! x
y la serie converge puesto que |y/x| < 1. La ecuación (7.21) puede también escribirse
como
a(a − 1) a−2 2 a(a − 1)(a − 2) a−3 3
(x + y)a = xa + axa−1 y + x y + x y + ··· (7.22)
2! 3!
EJEMPLOS 7.10
1. La serie geométrica:
1 (– 1)(– 2) (– 1)(– 2)(– 3)
= (1 − x)−1 = 1 + (– 1)(– x) + (– x)2 + (– x)3 + · · ·
1−x 2! 3!
= 1 + x + x2 + x3 + · · ·
1 1 1 1 3
1 −2 2 −2 −2 3
2. (1 + x)1/2 = 1 + x+ 2 x + 2 x + ···
2 2! 3!
x x2 x3 5x4
=1+ − + − + ···
2 8 16 128
1 1
3. (8 + x)1/2 = √8 1 + x 1/2 = √8 1 + 1 x
+ 2
−2 x 2
8 2 8
1 1 3 2! 8

−2 −2 x 3
+ 2 + ···
3! 8

√ x x2 x3 5x4
= 8 1+ − + − + ··· .
16 512 8192 524288
Por ejemplo, si x = 1, tomando los cinco primeros términos de la serie,

√ √ 1 1 1 5 √
9 = 8 1+ − + − + · · · ≈ 8 × 1,06065941 ≈ 2,999998 .
16 512 8192 524288
2. Funciones trigonométricas
Las funciones trigonométricas sen x, cos x y tg x tienen derivada continua en x = 0, y
pueden desarrollarse en serie de MacLaurin. Por ejemplo, para la función seno,
f (x) = sen (x), f (x) = cos (x), f (x) = − sen (x), f (x) = − cos (x), . . .
f (0) = 0, f (0) = 1, f (x) = 0, f (x) = −1, . . .
Entonces
x3 x5 x7
sen x = x − + − + ···
3! 5! 7!
Comparándola con la serie exponencial, se demuestra que la serie del seno converge para
todo x.
3. La función logarı́tmica
La función ln x no puede ser desarrollada en serie de potencias de x porque la fun-

ción y todas sus derivadas son discontinuas en x = 0. Sin embargo, la función ln (1 + x)
se comporta bien en x = 0:
f (x) = ln (1 + x) f (0) = 0
1
f (x) = f (0) = 1
1+x
−1
f (x) = f (0) = −1
(1 + x)2
2
f (x) = f (0) = 2
(1 + x)3
−6
f (x) = f (0) = −3!
(1 + x)4
...
La derivada n-ésima en x = 0 es f (n) (0) = (– 1)n−1 (n − 1)!, y
x 2 x3 x4
ln (1 + x) = x − + − + ···
2 3 4
La serie converge para |x| < 1. Ası́, cr /cr+1 = −(r + 1)/r → 1 cuando r → ∞, y por el
criterio del cociente (7.17), el radio de convergencia es R = 1. Además, para x = 1, la
serie es la serie armónica alternada (convergente):
1 1 1
ln 2 = 1 − + − + ···
2 3 4
4. Una lista con algunas series útiles

a(a − 1) 2 a(a − 1)(a − 2) 3
1. (1 + x)a = 1 + ax + x + x + ··· |x| < 1
2! 3!
x 3 x 5 x7
2. sen x = x − + − + · · · para todo x
3! 5! 7!
7.7. Valores aproximados y lı́mites 183
x2 x4 x6
3. cos x = 1 − + − + ··· para todo x
2! 4! 6!
x 3
2x5 17x7 π π
4. tg x = x + + + + ··· − <x<
3 15 315 2 2
x2 x3 x4
5. ln (1 + x) = x − + − + · · · −1 < x ≤ 1
2 3 4
2 3 4
x x x
6. ex = 1 + x + + + + · · · para todo x
2! 3! 4!
x3 x 5 x 7
7. senh x = x + + + + · · · para todo x
3! 5! 7!
x2 x4 x6
8. cosh x = 1 + + + + · · · para todo x.
2! 4! 6!
Series de Taylor11
La serie de MacLaurin, el desarrollo de una función f (x) en torno al punto x = 0, es
un caso especial del desarrollo más general de una función en torno al punto x = a:
x x2 x3
xn
∞
f (x + a) = f (a) + f (a) + f (a) + f (a) + · · · = f (n) (a) . (7.23)

1! 2! 3! n=0
n!
Esta serie de potencias se llama desarrollo en serie de Taylor de la función f (x). Una
expresión alternativa, y equivalente, para la serie es
(x − a) (x − a)2 (x − a)3

f (x) = f (a) + f (a) + f (a) + f (a) + · · ·
1! 2! 3!

∞
(x − a)n (n)
= f (a) . (7.24)
n=0
n!
La verificación y las condiciones de existencia de la serie de Taylor son como para la

serie de MacLaurin.
7.7. Valores aproximados y lı́mites

Las series de MacLaurin y de Taylor proporcionan una herramienta sistemática para
aproximar funciones por medio de polinomios (véanse los Ejemplos 1.6, 3.19 y 7.10).
Consideremos por ejemplo la serie logarı́tmica
x 2 x3 x4
ln (1 + x) = x − + − + ··· , −1 < x ≤ 1 .
2 3 4
011. Brook Taylor (1685-1731), secretario de la Royal Society. La serie que lleva su nombre apare-
ció en su Methodus incrementorum (1715), pero ya era conocida por James Gregory.
Si la serie se acaba tras un número finito de términos, el resultado es un polinomio que

aproxima la función. La serie proporciona por lo tanto una sucesión de tales aproxima-
ciones:
x2 x2 x3
u1 = x , u2 = x − , u3 = x − + ,···
2 2 3
Algunos de estos valores se muestran en la Tabla 7.2.
Tabla 7.2 Valores de ln (1 + x)
u1 = x u2 = x − x2 /2 u3 = x − x2 /2 + x3 /3 ln (1 + x) = lim (un )
n→∞
0 0 0 0
0,0001 0,0000 9999 5 0,0000 9999 5000 0,0000 9999 5000
0,001 0,0009 995 0,0009 9950 0333 0,0009 9950 0333
0,01 0,0099 5 0,0099 5033 33 0,0099 5033 08
0,1 0,095 0,0953 333 0,0953 310
0,2 0,18 0,1826 66 0,1823 21
1,0 0,5 0,83 0,69
La Tabla muestra que u1 = x es una buena aproximación de ln (1 + x) cuando x ≤ 0,1 y

que la serie converge rápidamente para esos valores pequeños de x, ya que cada término
proporciona al menos una cifra exacta adicional. La convergencia no es tan buena para
valores de x mayores, y ası́ son necesarios ocho términos para tener una precisión del
10 % cuando x = 1. El fundamento teórico para este uso de la serie es el teorema de
Taylor.
El teorema de Taylor
Sea f (x) una función continua y univaluada de x con derivadas f (x), f (x), . . . , f (n) (x)
continuas en el intervalo desde a a x, y suponemos que f (n+1) (x) existe en el intervalo.
Entonces
(x − a) (x − a)2 (x − a)n (n)
f (x) = f (a) + f (a) + f (a) + · · · + f (a) + Rn (x) (7.25)
1! 2! n!
donde
(x − a)n+1 (n+1)
Rn (x) = f (b) (7.26)
(n + 1)!
y a < b < x es algún punto del intervalo. El término Rn (x) se llama resto y es el error
que comporta aproximar la función por un polinomio de grado n. Los valores menor y
mayor de Rn (x) son las cotas inferior y superior del error. La serie infinita se obtiene en
el lı́mite n → ∞ si Rn (x) → 0 cuando n → ∞.
7.7. Valores aproximados y lı́mites 185
EJEMPLO 7.11 La serie exponencial

Por el teorema de Taylor (para a = 0),
x2 xn
ex = 1 + x + + ··· + + Rn (x)
2! n!
donde
xn+1
Rn (x) = eb
(n + 1)!
para algún punto 0 < b < x. Cuando x > 0, los valores menor y mayor de Rn vienen dados por
xn+1 xn+1
< Rn (x) < ex .
(n + 1)! (n + 1)!
Entonces
x2 xn xn+1 x2 xn xn+1
1+x+ + ··· + + < ex < 1 + x + + ··· + + ex
2! n! (n + 1)! 2! n! (n + 1)!
Por ejemplo, para x = 0,2 y n = 3 (y redondeando todos los números a seis cifras decimales), la aproxima-
ción cúbica tiene por valor
(0,2)2 (0,2)3
e0,2 ≈ 1 + 0,2 + + = 1,221333
2 6
y las cotas del error son
0,000067 < R3 < 0,000067e0,2
de manera que
1,221333 + 0,000067 < e0,2 < 1,221333 + 0,000067e0,2
La cota inferior es 1,221400. Para la cota superior,
e0,2 < 1,221333 + 0,000067e0,2

e0,2 − 0,000067e0,2 = 0,999933e0,2 < 1,221333 .
Por lo tanto
e0,2 < 1,221333/0,999933 = 1,221415
y
1,221400 < e0,2 < 1,221415 .
El valor exacto es 1,221403.
Lı́mites
La serie de MacLaurin muestra el comportamiento de una función cuando la variable
es muy pequeña. Ası́, ln (1 + x) ≈ x cuando x es suficientemente pequeño, de manera
que en las proximidades de x = 0 la función y = ln (1 + x) se puede aproximar por la
recta y = x. De manera similar, cuando x es suficientemente pequeño,
x 3 x5
sen x = x − + − ··· ≈ x,
3! 5!
x2 x4 x2
cos x = 1 − + − ··· ≈ 1 − .
2! 4! 2
Otra manera de expresar los mismos resultados es mediante lı́mites. Ası́ (Figura 7.3)
sen x x2 x4
= 1 − + − ···
x 3! 5!
de manera que en el lı́mite x → 0,
sen x
lim = 1. (7.27)
x→0 x
De manera similar,

1 − cos x 1
lim = . (7.28)
x→0 x 2
2 Figura 7.3
Más generalmente, el uso de las series de potencias proporciona un modo sistemático de

determinación del cociente de dos funciones,
f (x)
lim ,
x→a g(x)
cuando f (x) → 0 y simultáneamente g(x) → 0 al tender x → a. No es posible en este

caso sustituir x = a porque el resultado serı́a la indeterminación 0/0. Sin embargo, si se
desarrollan ambas funciones en serie de Taylor, tenemos por la ecuación (7.24)
(x − a)2
f (x) f (a) + (x − a)f (a) + f (a) + · · ·
= 2!
g(x) (x − a)2
g(a) + (x − a)g (a) + g (a) + · · ·
2!
Entonces, como f (a) = g(a) = 0,
(x − a)
f (x) f (a) + f (a) + · · ·
= 2!
g(x) (x − a)
g (a) + g (a) + · · ·
2!
y, si g (a) no es cero,
f (x) f (a) f (a)

lim = = lim (7.29)
x→a g(x) g (a) x→a g (a)
Este método para hallar lı́mites se denomina la regla de l’Hôpital.12 Si g (a) = 0 pero
012. Guillaume François Antoine de l’Hôpital (1661-1704). Noble francés y matemático aficionado,
fue instruido por Johann Bernoulli en el nuevo cálculo. La regla que se le atribuye estaba contenida en una
7.8. Operaciones con series de potencias 187
f (a) = 0 el lı́mite es infinito. Si f (a) y g (a) son ambos cero se repite el proceso y se
obtiene
f (x) f (a)
lim = (7.30)
x→a g(x) g (a)
y ası́ sucesivamente.
EJEMPLOS 7.12 Halle los lı́mites.

sen x − x
1. lim .
x→0 x3
sen x − x (x − x3 /3! + x5 /5! − · · · ) − x

=
x3 x3
−x3 /3! + x5 /5! − · · · −1 x5 1
= = + − ··· → − cuando x → 0.
x3 3! 5! 6

x 2 ex
2. lim . El numerador es x2 (1 + x + x2 /2 + · · · ). El denominador es
x→0 (ex − 1)2
2
(1 + x + x2 /2 + · · · ) − 1 = (x + x2 /2 + · · · )2 = x2 + x3 + · · ·
Por lo tanto,
x 2 ex x2 (1 + x + · · · )
= 2 → 1 cuando x → 0 .
− 1)
(ex 2 x (1 + x + · · · )
Este ejemplo es importante en mecánica estadı́stica de sólidos. Según la teorı́a de Einstein sobre
capacidades calorı́ficas de sólidos atómicos simples, cada átomo del sólido se supone que vibra con
la misma frecuencia ν. La capacidad calorı́fica molar del sólido es entonces
x 2 ex
Cv = 3R
(ex− 1)2
con x = hν/kT, donde h es la constante de Planck, k la constante de Boltzmann, R la constante
de los gases y T la temperatura. Tomar el lı́mite x → 0 corresponde a hacer T → ∞. Por lo tanto
Cv → 3R.
7.8. Operaciones con series de potencias

Sean

A(x) = ar x r
y B(x) = br x r
r=0 r=0
dos series de potencias con radios de convergencia RA y RB , respectivamente.
carta de Bernoulli en 1694 y apareció en el influyente libro de texto de l’Hôpital sobre cálculo, Analyse des
infiniment petits (1696).
(i) Suma y resta.
Las series de potencias pueden ser sumadas o restadas término a término para dar
una serie de potencias
C(x) = A(x) ± B(x) = (ar ± br )xr (7.31)

r=0
cuyo radio de convergencia es al menos tan grande como el menor de RA y RB .
(ii) Multiplicación.
El producto de A(x) y B(x) es la doble suma infinita
C(x) = A(x)B(x) = ar bs xr+s

r=0 s=0
que puede reordenarse como el producto de Cauchy
C(x) = a0 b0 + (a0 b1 + a1 b0 )x + (a0 b2 + a1 b1 + a2 b0 )x2 + · · · = cr xr ,

r=0
donde

cr = ai br−i . (7.32)
i=0
El radio de convergencia es igual al menor de RA y RB .
EJEMPLO 7.13 Multiplicación de series de potencias

(3x)2 (– 2x)2
e3x × e−2x = 1 + 3x + + · · · 1 + (– 2x) + + ···
2! 2!

(– 2)2 32
= 1 + 1 × (– 2) + 3 × 1 x + 1 × + 3 × (– 2) + × 1 x2 + · · ·
2! 2!
x2
= 1+x+ + · · · = ex .
2!
(iii) Derivación e integración.
Una serie de potencias puede ser derivada o integrada término a término dando lugar a
una serie de potencias cuyo radio de convergencia es el mismo que el de la serie original.
7.9. Ejercicios 189
Ası́, la derivación término a término de
A(x) = ar x r = a0 + a1 x + a 2 x 2 + a3 x 3 + · · ·
r=0
da
dA
= rar xr−1 = a1 + 2a2 x + 3a3 x2 + · · · (7.33)

dx r=0
Igualmente, la integración término a término de la serie A(x) da

∞
∞
ar r+1
A(x) dx = ar xr dx = x +c
r+1
r=0 r=0 (7.34)
a1 a2
= c + a0 x + x 2 + x 3 + · · · ,
2 3
siendo c una constante de integración arbitraria. El radio de convergencia tanto de la
serie derivada como de la integrada es R = RA .
EJEMPLO 7.14 Derivación e integración de una serie de potencias

d 1 d
= 1 + x + x2 + x3 + x4 + · · ·
dx 1−x dx
1
= 1 + 2x + 3x2 + 4x3 + · · · = ,
(1 − x)2

1
dx = 1 + x + x2 + x3 + x4 + · · · dx
1−x
x2 x3 x4 x5
= c+x+ + + + + · · · = − ln (1 − x) + c ,
2 3 4 5
siendo c una constante arbitraria y |x| < 1.
7.9. Ejercicios
Apartado 7.2
Halle (a) el término general y (b) la relación de recurrencia para las sucesiones:
1 1 1
1. 1, 4, 7, 10, . . . 2. 1, 3, 9, 27, . . . 3. 1, − , ,− , ...
5 25 125
Halle los 4 primeros términos de las sucesiones definidas por:
i
1 2
4. ur+1 = ur + , u1 = 0 5. vi = , i = 0, 1, 2, . . .
2 3
1 wn
6. ux = , x = 1, 2, 3, . . . 7. wn+1 = , w1 = 1
x(x + 2) n
Halle el lı́mite r → ∞ para:

1 1
8. 9. 2r 10.
3r r+2
r r 3r2 + 3r + 1
11. 12. 13.
r+2 r2 +r+1 5r2 − 6r − 1
1
14. Halle el lı́mite de la sucesión definida por xn+1 = 1 + , x1 = 1.
xn
Apartado 7.3
Halle la suma de las series finitas:
15. 1 + 5 + 9 + . . . + 49 16. 1 + 3 + 9 + 27 + . . . + 729

Halle la suma de los n primeros términos:
17. 3 − 2 − 7 − 12 − . . . 18. 1 + 4 + 16 + 64 + . . .
1 1 1
19. 1+ + + + ... 20. x + 3x + 5x + 7x + . . .
3 9 27
21. x3 + x5 + x7 + . . . 22. 1 + 2x + 4x2 + . . .
n
23. Calcule los coeficientes binomiales , r = 0, 1, . . . n, para
r
(i) n = 3 (ii) n = 4 (iii) n = 6
Desarrolle en potencias de x:
24. (1 − x)3 25. (1 + 3x)4 26. (1 − 4x)5 27. (3 − 2x)4 28. (3 + x)6

10
1
29. Halle .
n=1
n(n + 1)

1 1 1 1
30. Compruebe que = − , y pruebe entonces que
r(r + 2) 2 r r+2
n
1 3 1 1 1
= − − .
r=1
r(r + 2) 4 2 n+1 n+2
1
31. Expresando en fracciones simples , demuestre que
r(r + 1)(r + 2)

n
1 1 1
= − .
r=1
r(r + 1)(r + 2) 4 2(n + 1)(n + 2)
32. Compruebe que (1 + r) − r3 = 3r2 + 3r + 1, y pruebe entonces que

3
n
1
r2 = n(n + 1)(2n + 1) .
r=1
6
33. Desarrolle (1 + r) − r , y use entonces las series de la Tabla 7.1 para demostrar que
6 6
n
1 6 1 5 5 1
r5 = n + n + n4 − n2 .
r=1
6 2 12 12
7.9. Ejercicios 191
Apartado 7.4
34. La función de partición vibracional de un oscilador armónico viene dada por la serie

∞
qv = e−nθv /T ,
n=0
donde θv = hνe /k es la temperatura vibracional. Confirme que la serie es una serie geométrica convergente,
y halle su suma.
Apartado 7.5
Estudie la convergencia de las siguientes series:

∞
1
∞
1
∞
1
∞
sa
35. 36. 37. 38.
r=1
r 2
n=2
ln n k=0
2k + 1 s=0
s!

∞
r+2
∞
mπ
∞
ln r
∞
1
39. 40. sen 41. 42.
r=0
(r + 3)2 m=0
2 r=1
r3 n=2
n ln n
Apartado 7.6
Halle el radio de convergencia para cada una de las siguientes series:

∞
xm
∞
43. 44. (– 1)r x2r 45. nxn
m=0
4m r=0 n=1

∞
xn
∞
∞
(– 1)n (x − 1)2n
46. 47. mm x m 48.
n=1
n2 m=1 n=0
3n
Escriba los 5 primeros términos de la serie de MacLaurin de las siguientes funciones:
1 1
49. (1 + x)1/3 50. 51. (1 − x)−1/2 52.
1 + x2 3+x
2
ln (1 − 2x) + 2x ex − 1
53. sen 2x2 54. e−3x 55. 2
56.
x x
Desarrolle cada una de las siguientes funciones en serie de Taylor en torno al punto indicado, y determine
los valores de x para los cuales la serie converge:
1
57. ,1 58. ex , 2 59. sen (x + 1), −1 60. ln x, 2
x
61. Un cuerpo con masa en reposo m0 y velocidad v tiene una energı́a relativista
m0 c2
E = mc2 =
1 − v2 /c2
y energı́a cinética T = E − m0 c2 . Exprese T en serie de potencias de v y demuestre que la serie se reduce a

la energı́a cinética no relativista en el lı́mite v/c → 0.
62. La ecuación de estado de un gas puede expresarse en función de la serie

∞ n i
pV = nRT Bi (T) ,
i=0
V
donde los Bi se denominan coeficientes del virial. Halle los tres primeros coeficientes para

n2 a
(i) la ecuación de van der Waals, p+ (V − nb) = nRT,
V2
(ii) la ecuación de Dieterici, p(V − nb) = nRTe−an/RTV .
Apartado 7.7
63. (i) Halle el desarrollo de MacLaurin de la función (8 + x)1/3 hasta términos en x4 .
√
(ii) Use ese desarrollo para dar un valor aproximado de 3 9.
(iii)√Use ese valor y el teorema de Taylor para el resto, para acotar superior e inferiormente el valor
de 3 9.
Halle los lı́mites:
ex − 1 tg x − sen x ex + e−x − 2 ln x
64. lim 65. lim 66. lim 67. lim
x→0 x x→0 x3 x→0 cos x − 1 x→1 x2 − 1
68. La densidad de energı́a de la radiación de cuerpo negro a temperatura T viene dada por la fórmula de
Planck
8πhc hc/λkT −1
ρ(λ) = e −1 ,
λ 5
siendo λ la longitud de onda.

8πkT
Demuestre que la fórmula se reduce a la ley clásica de Rayleigh-Jeans ρ = (i) para longitudes de
λ4
onda largas (λ → ∞), (ii) si la constante de Planck se toma como cero (h → 0).
Apartado 7.8
69. Halle el producto de Cauchy para el desarrollo en serie de potencias de sen x y cos x, y demuestre que
es igual a 12 sen 2x.
70. Derive el desarrollo en serie de potencias de sen x y demuestre que el resultado es cos x.
71. Integre la serie de potencias de sen x y demuestre que el resultado es c − cos x, donde c es una
constante.
Números complejos
8.1. Conceptos
Vimos en el Apartado 1.4 y en el Capı́tulo 2 que las soluciones de ecuaciones al-

gebraicas no son siempre
√ números reales. En particular, las soluciones de la ecuación
x2 = −1 son x = ± −1, y la raı́z cuadrada de un número negativo no es un número
real.1 Tales números se incorporan al sistema de números definiendo la raı́z cuadrada
de −1 como un nuevo número representado normalmente por el sı́mbolo i (o j en las
matemáticas utilizadas en ingenierı́a) con la propiedad
i2 = −1 . (8.1)
√
Un número que contiene i = −1 se llama número complejo. Algunos ejemplos son
2i, −3i y 2 + 5i. Un número complejo general tiene la forma (normalmente se usa la
letra z para representar un número complejo)
z = x + iy , (8.2)
donde x e y son números reales. El número x se llama la parte real de z e y se llama la

parte imaginaria de z:
x = Re (z) , y = Im (z) . (8.3)
01. Las raı́ces cuadradas de números negativos se mencionan en la Ars Magna de Cardano de 1545
en relación con la solución de ecuaciones cuadráticas y cúbicas. Cardano calificó tal resultado de ‘tan sutil
como inútil’. Rafael Bombelli (1526-1572),
√ ingeniero italiano, llamaba ‘più di meno’ (más de menos) y
‘meno di meno’ (menos de menos) a ± −1, y presentó la aritmética de los números complejos en su Alge-
bra de 1572. La primera consideración seria de los números complejos la hizo Albert Girard (1595-1632),
quien en su L’invention nouvelle en l’algèbre (La nueva invención en álgebra), 1629, publicó la primera
formulación del teorema fundamental del álgebra. Decı́a de las soluciones complejas de las ecuaciones que
eran ‘imposibles’ pero ‘buenas por tres cosas: por la certeza de la regla general (el teorema), por el hecho
de que no hay otras soluciones
√ y por
√ su uso’.√Descartes usó
√ los términos ‘real’ e ‘imaginario’. √ Leibniz
factorizó x4 + a4 = (x + a i)(x − a i)(x + a −i)(x − a −i). Euler propuso el sı́mbolo i para −1 en
1777, y Gauss lo adoptó en su Disquisitiones arithmeticae de 1801.
194 Capı́tulo 8. Números complejos
Si x = 0, se dice que z = iy es imaginario puro. Si y = 0, z = x es real, de forma que

el conjunto de los números complejos incluye a los números reales como subconjunto.
Potencias de i
Cada potencia de i es uno de los números i, −i, 1, −1. Por ejemplo,
1 i i
i3 = i2 × i = −i, i4 = (i2 )2 = 1, i−1 = = 2 = = −i .
i i −1
En general, para los enteros n = 0, ±1, ±2, . . . ,
i4n = +1, i4n+1 = +i , i4n+2 = −1 , i4n+3 = −i . (8.4)
Aparte de su papel en la extensión de los números, los número complejos aparecen en

varias ramas de las matemáticas y son importantes en las ciencias fı́sicas. Por ejemplo,
las soluciones de las ecuaciones diferenciales del movimiento en mecánica tanto clásica
como cuántica a menudo implican números complejos. También aparecen los números
complejos en la formulación de la teorı́a
√ fı́sica: las ecuaciones básicas de la mecánica
cuántica implican obligatoriamente i = −1.
8.2. El álgebra de los números complejos

Los números complejos pueden sumarse, restarse, multiplicarse y dividirse de mane-
ra muy parecida a la de los números reales ordinarios. Sólo es necesario acordarse de
sustituir i2 por −1 cada vez que aparezca. Sean dos números complejos
z1 = x1 + iy1 , z2 = x2 + iy2 . (8.5)
Igualdad
Dos números complejos son iguales si sus partes reales son iguales y si sus partes
imaginarias son iguales:
z1 = z2 si x1 = x2 e y1 = y2 . (8.6)
Suma
z1 + z2 = (x1 + x2 ) + i(y1 + y2 ) . (8.7)
Las partes reales de z1 y de z2 se suman para dar la parte real de la suma, las partes
imaginarias se suman para dar la parte imaginaria de la suma.
8.2. El álgebra de los números complejos 195
Multiplicación
z1 z2 = (x1 + iy1 )(x2 + iy2 )

= x1 (x2 + iy2 ) + iy1 (x2 + iy2 ) = (x1 x2 + ix1 y2 ) + (iy1 x2 + i2 y1 y2 )
= (x1 x2 − y1 y2 ) + i(x1 y2 + y1 x2 ) , (8.8)
usando que i2 = −1.
EJEMPLOS 8.1 Suma y resta

1. (2 + 3i) + (4 − 3i) = (3 + 4) + (2 − 3)i = 7 − i
2. (3 + 2i) − (3 − 2i) = (3 − 3) + (2 + 2)i = 4i
3. (3 + 2i) + (4 − 2i) = 7
EJEMPLOS 8.2 Multiplicación

1. (2 + 3i)(3 + 4i) = 2(3 + 4i) + 3i(3 + 4i) = 6 + 8i + 9i + 12i2 = −6 + 17i
2. i(2 − 3i) = 2i − 3i2 = 3 + 2i
Conjugación
Sea z = x + iy un número complejo arbitrario, el número que se obtiene a partir de él
sustituyendo i por −i es
z∗ = x − iy (8.9)
y se llama el complejo conjugado de z (a veces se usa z̄ en vez de z∗ ). El par de números

complejos conjugados z y z∗ (z es, a su vez, el complejo conjugado de z∗ ) tiene las
siguientes propiedades:
1 1
(i) (z + z∗ ) = (x + iy) + (x − iy) = x = Re (z) (8.10)
2 2
1 1
(ii) (z − z∗ ) = (x + iy) − (x − iy) = iy = i Im (z) (8.11)
2 2
(iii) zz∗ = (x + iy)(x − iy) = x2 + y2 (real y positivo) (8.12)
EJEMPLOS 8.3 Pares de números complejos conjugados

1. Para z = 2 + 3i, z∗ = 2 − 3i y
1 1
(z + z∗ ) = 2 , (z − z∗ ) = 3i , zz∗ = 22 + 32 = 13 .
2 2
2. Para z = 1 − i, z∗ = 1 + i y
1 1
(z + z∗ ) = 1 , (z − z∗ ) = −i , zz∗ = 1 + 1 = 2 .
2 2
División
z1 (x1 + iy1 )
z1 ÷ z2 = = .
z2 (x2 + iy2 )
La división puede hacerse usando las reglas de la división entera. Un método más senci-
llo es utilizar la propiedad (8.12) de los pares conjugados para transformar el denomina-
dor en un número real. Ası́, multiplicando arriba y abajo por z∗2 = x2 − iy2 , el complejo
conjugado del denominador z2 , tenemos
z1 z1 z∗2 (x1 + iy1 )(x2 − iy2 ) (x1 + iy1 )(x2 − iy2 )

= = =
z2 z2 z∗2 (x2 + iy2 )(x2 − iy2 ) x22 + y22

x1 x2 + y1 y2 y1 x2 − x1 y2
= +i . (8.13)
x2 + y2
2 2
x22 + y22
La división está definida únicamente si z2 = 0, es decir, si x2 = 0 e y2 = 0.
EJEMPLOS 8.4 División
2 + 3i (2 + 3i)(3 − 4i) 18 + i 18 i
1. = = 2 = +
3 + 4i (3 + 4i)(3 − 4i) 3 + 42 25 25
1+i (1 + i)(1 + i) 0 + 2i
2. = = =i
1−i (1 − i)(1 + i) 1+1
8.3. Representación gráfica

El número complejo z = x + iy se representa gráficamente por un punto en un plano
con coordenadas (x, y), como en la Figura 8.1.2 Este plano se denomina plano comple-
jo. Los números reales, con y = 0, se representan por puntos en el eje x o eje real y los
número imaginarios puros, con x = 0, están en el eje y o eje imaginario. La representa-
ción se llama diagrama de Argand.
02. John Wallis (1616-1703) fue el primero en sugerir que los números imaginarios puros podrı́an
representarse en una recta perpendicular al eje de los números reales. Caspar Wessel (1745-1818), agrimen-
sor noruego, trató la representación gráfica de números complejos en Sobre la representación analı́tica de
la dirección de 1797, y Jean Robert Argand (1768-1822), tenedor de libros suizo, lo hizo en su Essai de
1806. Gauss utilizó la misma interpretación de los números complejos en su cuarta y última demostración
del teorema fundamental del álgebra en 1848, pensando que para entonces los matemáticos estarı́an ya su-
ficientemente acostumbrados a los números complejos como para aceptarla. El plano complejo también se
llama plano gaussiano.
8.3. Representación gráfica 197
Figura 8.1
√
La distancia del punto z al origen, r = x2 + y2 , se llama el módulo de z y se representa
como
r = mod z = |z| . (8.14)
Los números complejos con mismo módulo r = |z| están en el cı́rculo de radio r en el
plano. Si |z| = 1, se dice que el punto está en el cı́rculo unidad.
Representación polar
La posición del punto z = x + iy en el plano puede especificarse utilizando las coor-
denadas r y θ, como en la Figura 8.1. En ese caso
x = r cos θ , y = r sen θ ,
y el número complejo se puede escribir en la forma polar
z = r( cos θ + i sen θ) . (8.15)
El ángulo θ se llama argumento o ángulo de z,
θ = arg z . (8.16)
El ángulo puede tener cualquier valor real pero, como vimos en el Capı́tulo 3, las funcio-
nes trigonométricas de (8.15) son funciones periódicas en θ de manera que el número z
no cambia si se añade a θ un múltiplo de 2π. Al transformar de coordenadas cartesianas
a polares se obtiene a partir de x y de y un único valor si utilizamos el convenio dado en
el Apartado 3.4. Ası́, dado que tg θ = y/x,
y
arg z = arctg , si x > 0,
x
y (8.17)
= arctg + π , si x < 0,
x
donde estamos tomando para el arco tangente su valor principal.
EJEMPLOS 8.5 Exprese z = x + iy en forma polar.

(i) z = 1 + i.
Tenemos x = 1 e y = 1 de manera que
√ y
r = |z| = x2 + y2 = 2, arctg = arctg (1) .
x
El valor principal de arctg (1) es π/4 y, como el punto está en el primer
cuadrante, con x > 0, arg z = π/4. Por lo tanto
√ π π
z = 2 cos + i sen .
4 4 Figura 8.2
√
1 3
(ii) z = − − i.
2 2 √
Tenemos x = −1/2 e y = − 3/2 de manera que

2 √ 2
1 3
r= + = 1,
2 2
y √
arctg = arctg ( 3) .
√ x
El valor principal de arctg ( 3) es π/3 y, como x < 0, se sigue que
√ 4π 4π
arg z = arctg ( 3) + π = 4π/3. Por lo tanto z = cos + i sen . Figura 8.3
3 3
Representación de operaciones aritméticas

Suma y resta
En la Figura 8.4 se representan los números z1 = x1 +iy1 y z2 = x2 +iy2 por los puntos
P y Q, respectivamente. La representación de la suma z1 + z2 se obtiene completando el
paralelogramo OPSQ. El punto S tiene coordenadas (x1 + x2 , y1 + y2 ) como es necesario
para que cumpla
z1 + z2 = (x1 + x2 ) + i(y1 + y2 ) .
De manera similar para la resta: la diferencia z1 − z2 es la suma de z1 y de −z2 .
Figura 8.4
Multiplicación y división
Las operaciones de multiplicación y de división se describen más fácilmente cuando

los números se expresan en forma polar. Si
z1 = r1 ( cos θ1 + i sen θ1 ) , z2 = r2 ( cos θ2 + i sen θ2 ) , (8.18)
entonces
z1 z2 = r1 r2 ( cos θ1 + i sen θ1 )( cos θ2 + i sen θ2 )

= r1 r2 ( cos θ1 cos θ2 − sen θ1 sen θ2 ) + i( cos θ1 sen θ2 + sen θ1 cos θ2 )

= r1 r2 cos (θ1 + θ2 ) + i sen (θ1 + θ2 ) . (8.19)
Se deduce que el producto de dos números complejos tiene módulo igual al producto de
los módulos de los números, y tiene argumento igual a la suma de los argumentos:
|z1 z2 | = |z1 | × |z2 |, arg (z1 z2 ) = arg (z1 ) + arg (z2 ) . (8.20)
Figura 8.5
Si dos números forman un par de complejos conjugados, z = x + iy y z∗ = x − iy,

entonces

|z| = |z∗ | = x2 + y2 , arg z = − arg z∗ ,
zz∗ = |z|2 = x2 + y2 , arg zz∗ = 0 .
En el caso de la división,

z1 |z1 | z1
= = arg (z1 ) − arg (z2 ) ,
z2 |z2 | , arg
z2
(8.21)
y
z1 r1
= cos (θ1 − θ2 ) + i sen (θ1 − θ2 ) . (8.22)
z2 r2
Se deduce de (8.22) que para el inverso de un número complejo
1 1
= cos (– θ) + i sen (– θ) (8.23)
z r
y, como cos (– θ) = cos (θ) y sen (– θ) = − sen (θ),
1 1
= cos (θ) − i sen (θ) . (8.24)
z r
EJEMPLOS 8.6 Exprese cada uno de los números z1 z2 , z1 /z2 y z2 /z1 como un único número complejo,
siendo (véanse los Ejemplos 8.5)
√ π π 4π 4π
z1 = 2 cos + i sen , z2 = cos + i sen .
4 4 3 3
√
Tenemos r1 = 2, r2 = 1, θ1 = π/4 y θ2 = 4π/3. Por lo tanto
√
1. r1 r2 = 2, θ1 + θ2 = 19π/12 y, por la ecuación (8.19),

√ 19π 19π
z1 z2 = r1 r2 (cos (θ1 + θ2 ) + i sen (θ1 + θ2 )) = 2 cos + i sen .
12 12
√
2. r1 /r2 = 2, θ1 − θ2 = −13π/12 y, por la ecuación (8.22),
z1 r1
= cos (θ1 − θ2 ) + i sen (θ1 − θ2 )
z2 r2

√ 13π 13π
= 2 cos − + i sen −
12 12

√ 13π 13π
= 2 cos − i sen .
12 12
3. z2 /z1 = (z1 /z2 )−1 y, por la ecuación (8.24),

z2 1 13π 13π
= √ cos + i sen .
z1 2 12 12
Fórmula de De Moivre
Se deduce de las relaciones (8.20) que el producto de tres o más números complejos
tiene módulo igual al producto de los módulos de los números y tiene argumento igual a
la suma de los argumentos. Por ejemplo, para el producto de tres números
|z1 z2 z3 | = |z1 z2 | × |z3 | = |z1 | × |z2 | × |z3 | ,

arg (z1 z2 z3 ) = arg (z1 z2 ) + arg (z3 ) = arg (z1 ) + arg (z2 ) + arg (z3 ) .
Por lo tanto

z1 z2 z3 = r1 r2 r3 cos (θ1 + θ2 + θ3 ) + i sen (θ1 + θ2 + θ3 )
y, en general,

z1 z2 . . . zn = r1 r2 . . . rn cos (θ1 + θ2 + · · · + θn ) + i sen (θ1 + θ2 + · · · + θn ) . (8.25)
En el caso especial en que todos los números son iguales a z = r(cos θ + i sen θ),
zn = rn (cos nθ + i sen nθ) . (8.26)
Para un número en el cı́rculo unidad del plano complejo (r = 1), z = cos θ + i sen θ, y
(cos θ + i sen θ)n = cos nθ + i sen nθ . (8.27)
Ésta es la fórmula de De Moivre para n un entero positivo.3 La fórmula es también

válida para otros valores de n. Por ejemplo, por las ecuaciones (8.27) y (8.23),
1 1
= = cos (– nθ) + i sen (– nθ) ,
(cos θ + i sen θ)n cos nθ + i sen nθ
de manera que
(cos θ + i sen θ)−n = cos (– nθ) + i sen (– nθ) = cos nθ − i sen nθ . (8.28)
La fórmula de De Moivre puede usarse para obtener muchas de las fórmulas de trigono-
metrı́a (véase el Apartado 3.2). Por ejemplo, la ecuación (8.27) es para n = 2
(cos θ + i sen θ)2 = cos 2θ + i sen 2θ .
Desarrollando el primer miembro obtenemos
(cos2 θ − sen2 θ) + i(2 sen θ cos θ) = cos 2θ + i sen 2θ .
03. Abraham de Moivre (1668-1754) llegó a Inglaterra en 1688 huyendo de la persecución que su-
frı́an los hugonotes franceses. La primera expresión de la fórmula aparece en un artı́culo de 1707 de las
Philosophical Transactions. De Moivre fue amigo de Newton. En sus últimos años, Newton decı́a a quien
viniera a visitarle con preguntas matemáticas: ‘vaya a ver a Mr. De Moivre, él sabe de esas cosas más que
yo’.
Una única ecuación entre dos números complejos es equivalente a dos ecuaciones entre
números reales: dos números complejos son iguales sólo si las partes reales son iguales
y las partes imaginarias son iguales. Por lo tanto,
cos 2θ = cos2 θ − sen2 θ, sen 2θ = (2 sen θ cos θ) .
De esta misma manera se obtienen fórmulas similares para expresar sen nθ y cos nθ en
función de potencias de sen θ y cos θ para cualquier entero positivo n: la expresión del
primer miembro de la ecuación (8.27) se desarrolla por medio de la fórmula binomial,
ecuación (7.14), y sus partes real e imaginaria se igualan con las correspondientes del
segundo miembro de la ecuación.
EJEMPLO 8.7 Exprese cos 5θ y sen 5θ en función de sen θ y cos θ.

Por el desarrollo del binomio (7.14), o usando el triángulo de Pascal,
(a + b)5 = a5 + 5a4 b + 10a3 b2 + 10a2 b3 + 5ab4 + b5 ,

de manera que

(cos θ + i sen θ)5 = cos5 θ − 10 cos3 θ sen2 θ + 5 cos θ sen4 θ

+i 5 cos4 θ sen θ − 10 cos2 θ sen3 θ + sen5 θ .
Por lo tanto,
cos 5θ = cos5 θ − 10 cos3 θ sen2 θ + 5 cos θ sen4 θ = 16 cos5 θ − 20 cos3 θ + 5 cos θ
sen 5θ = sen5 θ − 10 sen3 θ cos2 θ + 5 sen θ cos4 θ = 16 sen5 θ − 20 sen3 θ + 5 sen θ
y la expresión final se obtiene utilizando la fórmula sen2 θ + cos2 θ = 1.
La generalización y el significado de la fórmula se tratan en el Apartado 8.5.
8.4. Funciones complejas

Sean g(x) y h(x) funciones (reales) de la variable real x. Una función compleja de x
es entonces
f (x) = g(x) + ih(x) , (8.29)

√
siendo i = −1. Esta función no difiere de manera esencial de una función real de
una variable, salvo porque los valores posibles de la función son números complejos.
El tratamiento de las propiedades de los números complejos se aplica a las funciones
complejas y, por ejemplo, se define la función compleja conjugada f ∗ (x) como
f ∗ (x) = g(x) − ih(x) (8.30)
con la propiedad
f (x)f ∗ (x) = |f (x)|2 = g(x)2 + h(x)2 , (8.31)

8.4. Funciones complejas 203
siendo |f (x)| el módulo de la función. La cantidad ff ∗ juega un papel importante en

teorı́as de ondas, cuando la función de ondas es compleja.
Una aplicación más avanzada de los números complejos es la extensión de los con-
ceptos de variable y de función para incluir variables complejas y funciones de variables
complejas.4 De esta manera, si x e y son dos variables reales, entonces z = x + iy es
una variable compleja y f (z) es una función de la variable compleja z. Por ejemplo, la
función
f (z) = z2 + 2z + 1
puede expresarse como
f (z) = (x + iy)2 + 2(x + iy) + 1 = (x2 − y2 + 2x + 1) + i(2xy + 2y)

= g(x, y) + ih(x, y) ,
donde g(x, y) y h(x, y), las partes real e imaginaria de f (z), son funciones reales de x e y.
Las propiedades de f (z) como función de la variable compleja z son más generales que
las propiedades de las funciones reales. Para la mayorı́a de las consideraciones en las
ciencias fı́sicas, sólo una función de este tipo es importante, y la tratamos en el siguiente
apartado.
8.5. Fórmula de Euler
De la teorı́a de funciones de variable compleja se sabe que la función exponencial

z
e , donde z es un número complejo, puede desarrollarse en la serie infinita que nos es
familiar
z2 z3
ez = 1 + z + + + ··· (8.32)
2! 3!
Si z es el número imaginario iθ entonces
(iθ)2 (iθ)3
eiθ = 1 + (iθ) + + + ···
2! 3!
θ2 θ4 θ6 θ3 θ5 θ7
= 1 − + − + ··· + i θ − + − + ··· .
2! 4! 6! 3! 5! 7!
04. El primer comentario sobre funciones complejas lo hizo Gauss en una carta a Bessel en 1811,
junto con una descripción de la interpretación geométrica de los números complejos. La teorı́a fue desarro-
llada de manera independiente por Cauchy desde aproximadamente 1814. Cauchy fue el matemático más
prolı́fico del siglo XIX. Apabulló el boletı́n semanal de la Academia de Ciencias de Parı́s, Comptes Rendus,
forzándolo a introducir una regla, todavı́a en uso, que limita las contribuciones a cuatro páginas.
Las partes real e imaginaria de esta función son los desarrollos en serie de las funciones
trigonométricas cos θ y sen θ, respectivamente (véase el Apartado 7.6), de manera que
eiθ = cos θ + i sen θ . (8.33)
Esta relación entre la función exponencial y las funciones trigonométricas se llama

fórmula de Euler.5 Es la base de la teorı́a unificada de las funciones elementales, y
es una de las relaciones más importantes en matemáticas.
La función z = eiθ tiene módulo |z| = 1 y argumento
arg z = θ. Para cada valor de θ el número está en el cı́rculo
unidad del plano complejo, y al variar θ de 0 a 2π, la fun-
ción describe el cı́rculo unidad (Figura 8.6). El complejo
conjugado de z = eiθ es
e−iθ = cos θ − i sen θ (8.34)
y esto es también el inverso z−1 = z∗ = e−iθ . Entonces
zz∗ = zz−1 = eiθ e−iθ = e0 = 1 . Figura 8.6
La pareja de ecuaciones (8.33) y (8.34) puede invertirse para dar la expresión de las
funciones trigonométricas mediante exponenciales:
1 iθ
cos θ = (e + e−iθ ) , (8.35)
2
1 iθ
sen θ = (e − e−iθ ) . (8.36)
2i
De la forma polar de un número complejo, ecuación (8.15), se deduce que todo número
complejo puede escribirse como
z = x + iy = reiθ , (8.37)
donde r = |z| y θ = arg z. La función compleja conjugada y la función inversa de z son
1 1
z∗ = x − iy = re−iθ , z−1 = = e−iθ . (8.38)
x + iy r
05. La fórmula, y otras para las funciones logarı́tmica y trigonométricas de z, apareció en la Introduc-
tio de 1748 de Euler.
8.4. Funciones complejas 205
EJEMPLO 8.8 El número z = 1 + i.
Vimos en el Ejemplo 8.5 que

√ π π
z=1+i= 2 cos + i sen .
4 4
El número puede por lo tanto escribirse como
√
z= 2 eiπ/4
con complejo conjugado e inverso

√ √ π π
z∗ = 2 e−iπ/4 = 2 cos − i sen ,
4 4
1 1 π π
z−1 = √ e−iπ/4 = √ cos − i sen .
2 2 4 4
Además,
π 1 iπ/4 π 1 iπ/4
cos = e + e−iπ/4 , sen = e − e−iπ/4 .
4 2 4 2i
EJEMPLO 8.9 El número eiπ .
Por la fórmula de Euler,

eiπ = cos π + i sen π .
Puesto que cos π = −1 y sen π = 0 se deduce que
eiπ = −1 . (8.39)
Esta expresión, que incluye los números trascendentes e y π, la unidad negativa −1 y la unidad imaginaria
i, es probablemente la relación más notable en matemáticas.
Fórmula de De Moivre
Si se sustituye en la fórmula de Euler (8.33) θ por nθ, siendo n un número arbitrario,
el resultado es
einθ = cos nθ + i sen nθ .
Pero, puesto que einθ = (eiθ )n , se deduce que

n
(eiθ )n = cos θ + i sen θ = cos nθ + i sen nθ . (8.40)
Ésta es la fórmula de De Moivre (8.27) generalizada a cualquier número arbitrario n (que

puede ser a su vez complejo).
Operadores de rotación
Si se multiplica un número complejo z = reiα por eiθ , el producto es un número con

el mismo módulo que z pero con argumento aumentado en θ:
eiθ reiα = rei(θ+α) .
Como se muestra en la Figura 8.7, la multiplicación corresponde gráficamente a girar

el punto de representación un ángulo θ en torno al origen en el plano complejo. En
representación cartesiana,
z = x + iy = r(cos α + i sen α) ,
eiθ z = z = x + iy = r(cos (θ + α) + i sen (θ + α)) ,
de manera que las coordenadas del punto girado son
x = r cos (θ + α) = r(cos θ cos α − sen θ sen α) ,

y = r sen (θ + α) = r(sen θ cos α + cos θ sen α) ,
o bien
x = x cos θ − y sen θ ,
(8.41) Figura 8.7
y = x sen θ + y cos θ .
La función eiθ puede considerarse como la representación del operador de rotación Rθ

que transforma las coordenadas (x, y) de un punto z en las coordenadas (x , y ) del punto
girado z :
Rθ (x, y) = (x , y ) . (8.42)
Las ecuaciones (8.41) juegan un papel importante en la formulación matemática de las

rotaciones en el espacio (véase el Capı́tulo 18).
8.6. Periodicidad
La funciones trigonométricas cos θ y sen θ son funciones periódicas de θ con perio-

do 2π (véase el Apartado 3.1). Se deduce que la función exponencial eiθ es también
periódica con periodo 2π. Ası́, si θ se incrementa en 2π,

ei(θ+2π) = eiθ × e2πi = eiθ cos 2π + i sen 2π .
Por lo tanto, puesto que cos 2π = 1 y sen 2π = 0, tenemos que e2πi = 1 y
ei(θ+2π) = eiθ .
8.6. Periodicidad 207
Más generalmente, la función no cambia cuando se suma a θ un múltiplo de 2π:
ei(θ+2πn) = eiθ , n = 0, ±1, ±2, . . . (8.43)
Gráficamente, cambiar el argumento θ en 2πn corresponde a mover el punto de repre-

sentación n giros completos en el cı́rculo unidad dejándolo en su posición original (n
giros antihorarios si n es positivo, |n| giros horarios si n es negativo).
La función eiθ aparece en las ciencias fı́sicas siempre que se describe un movimiento
periódico o cuando un sistema tiene una estructura periódica. Consideramos aquı́ tres
clases representativas importantes de situaciones fı́sicas que presentan un comporta-
miento periódico.
Periodicidad en un cı́rculo. Las n raı́ces n-ésimas de 1

La figura 8.8 muestra tres puntos equidistantes en el cı́rculo unidad, en los vértices
de un triángulo equilátero. Los puntos corresponden a los números complejos
zk = e(2πk/3)i , k = 0, 1, 2,
con módulos unidad y argumentos 2πk/3. Estos números tienen la propiedad

3
(zk )3 = e(2πk/3)i = e2πki = 1 ,
de manera que cada uno de ellos es una raı́z cúbica del número 1:
z0 = e0 = 1 ,
√
2π 2π 1 3
z1 = e 2πi/3
= cos + i sen =− + i,
3 3 2 √2
4π 4π 1 3
z2 = e4πi/3 = cos + i sen =− − i.
3 3 2 2
Figura 8.8
Vemos que z1 y z2 forman un par de complejos conjugados: e−4πi/3 = e2πi/3 . Dada la

periodicidad de la exponencial, las tres raı́ces pueden especificarse mediante tres valores
consecutivos de k cualesquiera; de manera conveniente podemos tomar
zk = e2πki/3 , k = 0, ±1,
siendo entonces z0 = 1, z±1 = e±2πi/3 .

En general, las n raı́ces n-ésimas del número 1 son6

0, ±1, ±2, . . . , ±(n − 1)/2, si n es impar,
zk = e2πki/n con k= (8.44)
0, ±1, ±2, . . . , ±(n/2 − 1), n/2, si n es par.
Ası́, si n es impar, la única raı́z real es +1 y el resto se presenta en pares de complejos

conjugados. Si n es par, dos de las raı́ces son reales, ±1. Los n puntos de representación
se sitúan en los vértices de un polı́gono regular de n lados.
EJEMPLO 8.10 Las seis raı́ces sextas de 1.

Las seis raı́ces son
zk = e2πki/6 , k = 0, ±1, ±2, 3,
o bien
z0 = e0 = 1 ,
√
±πi/3 π π 1 3
z±1 = e = cos ± i sen = ± i,
3 3 2 2
√
2π 2π 1 3
z±2 = e±2πi/3 = cos ± i sen =− ± i,
3 3 2 2
πi Figura 8.9
z3 = e = cos π + i sen π = −1 .
Una función que tiene la misma periodicidad circular que la figura con n puntos equidis-
tantes sobre un cı́rculo es
f (θ) = einθ . (8.45)
Esta función es periódica en θ con periodo 2π/n. En efecto,
f (θ + 2π/n) = ein(θ+2π/n) = einθ × e2πi = f (θ) .
Tales funciones son importantes en la descripción de sistemas con periodicidad circular.

Por ejemplo, las funciones presentadas en el Ejemplo 8.10 se usan tomando n = 6 para
la descripción de las propiedades de la molécula de benceno.
06. Las n raı́ces de un número complejo fueron tratadas por De Moivre en un artı́culo en la revista
Philosophical Transactions de 1739.
8.6. Periodicidad 209
Periodicidad en una recta
Figura 8.10
La Figura 8.10 muestra una cadena lineal simple de puntos equidistantes representando,
por ejemplo, una red lineal. Una función de x con la misma periodicidad que la red tiene
que satisfacer la condición de periodicidad
f (x + a) = f (x) . (8.46)
La función más sencilla que lo cumple es
f (x) = e2πxi/a . (8.47)
En efecto,
f (x + a) = e2π(x+a)i/a = e2πxi/a × e2πi = f (x)e2πi = f (x) .
Las funciones como (8.47) son importantes para describir las propiedades de sistemas
periódicos como los cristales. Las funciones se generalizan fácilmente a sistemas pe-
riódicos tridimensionales: la función
f (x) = e2πxi/a e2πyi/b e2πzi/c (8.48)
tiene periodo a en la dirección x, b en la dirección y y c en la dirección z.
Rotaciones en mecánica cuántica
La Figura 8.11 muestra un sistema de dos masas, m1 y m2 ,

unidas por una barra rı́gida (de masa despreciable) que gira
en torno al centro de masas en O. Como vimos en el Aparta-
do 5.6 (Ejemplo 5.7) el sistema tiene un momento de inercia
I = µr2 , donde µ = m1 m2 /(m1 + m2 ) es la masa reduci-
da y r = r1 + r2 es la distancia entre masas. Este sistema
se denomina un ‘rotor rı́gido’ y la ecuación de movimiento
en mecánica cuántica (la ecuación de Schrödinger) para un
rotor rı́gido en el plano es Figura 8.11
2 d2 ψ
− = Eψ , (8.49)
2I dθ2
donde la función de ondas ψ = ψ(θ) es una función de la variable de orientación θ y E es

la energı́a cinética (positiva) de rotación. El rotor rı́gido se usa en quı́mica para modelar
el movimiento rotacional de una molécula.
La ecuación (8.49) puede escribirse como
d2 ψ
= −a2 ψ , (8.50)
dθ2
siendo a2 = 2IE/2 > 0, y se comprueba fácilmente que una solución de esta ecuación
es
ψ(θ) = Ceiaθ , (8.51)
donde C es una constante arbitraria (véase el Apartado 12.7 para un tratamiento más
completo). Tenemos
dψ d2 ψ
= iaCeiaθ , = (ia)2 Ceiaθ = −a2 Ceiaθ = −a2 ψ .
dθ dθ2
Para que la solución (8.51) tenga significado fı́sico, y represente la rotación, es necesario
que la función de ondas sea invariante si se sustituye θ por θ + 2π: tiene que satisfacer
la condición de periodicidad
ψ(θ + 2π) = ψ(θ) . (8.52)
En el caso de la función (8.51),
ψ(θ + 2π) = Ceia(θ+2π) = Ceiaθ × e2πai = ψ(θ) × e2πai ,
con lo que la condición de periodicidad se satisface si 2πa es un múltiplo de 2π, esto es,
si a = n con n = 0, ±1, ±2, . . . Las soluciones con significado fı́sico de la ecuación de
Schrödinger son por lo tanto
ψn (θ) = Ceinθ , n = 0, ±1, ±2, . . . , (8.53)
donde se usa el ‘número cuántico’ n para etiquetar las soluciones. Los valores corres-
pondientes de la energı́a E = 2 a2 /2I son
2 n2
E= . (8.54)
2I
Vemos que la cuantización de la energı́a del sistema surge como consecuencia de aplicar
la condición de periodicidad (condición de contorno periódica) a las soluciones. Vemos
además que el conjunto de funciones de onda incluye todas las funciones (8.45) para las
posibles periodicidades en torno a un cı́rculo.
8.7. Cálculo de integrales 211
8.7. Cálculo de integrales

La integración con respecto a una variable compleja es una parte importante de la
teorı́a de funciones de variable compleja, pero se usa sólo en aplicaciones avanzadas
en ciencias fı́sicas. La integración corriente de funciones complejas obedece las mismas
reglas que la integración de funciones reales. Además, las funciones complejas pueden
usarse para simplificar el cálculo de ciertos tipos de integrales. Por ejemplo, vimos en el
Ejemplo 6.13 cómo la integral

e−ax cos x dx
puede evaluarse mediante el método de integración por partes. Un método alternativo,

más elegante, es expresar la función trigonométrica usando la función exponencial (com-
pleja). Consideramos la forma general

I= eax cos bx dx .
Por ser cos bx la parte real de eibx , se deduce que la integral I es la parte real de la integral
que se obtiene a partir de I sustituyendo cos bx por eibx :

I = Re e e dx = Re
ax ibx
e(a+ib)x dx .
La integral compleja se evalúa por medio de la regla para integrar una función exponen-
cial. Ası́ (ignorando la constante de integración),

e(a+ib)x eibx
e(a+ib)x dx = = eax
a + ib a + ib
y podemos separar esto en sus partes real e imaginaria:

cos bx + i sen bx
e(a+ib)x
dx = e ax
a + ib
eax
= 2 (a cos bx + b sen bx) + i(a sen bx − b cos bx) .
a + b2

eax (a cos bx + b sen bx)
eax cos bx dx = . (8.55)
a2 + b 2
La parte imaginaria es un regalo:

eax (a sen bx − b cos bx)
eax sen bx dx = . (8.56)
a2 + b 2
8.8. Ejercicios
Apartado 8.2
Escriba como un único número complejo:
1. (2 + 3i) + (4 − 5i) 2. (2 + 3i) + (2 − 3i) 3. (2 + 3i) − (2 − 3i)

4. (5 + 3i)(3 − i) 5. (1 − 3i) 2
6. (1 + 2i)5
1−i 1
7. (1 − 3i)(1 + 3i) 8. 9.
1+i 5 + 3i
3 + 2i 1 3 − 4i
10. 11. −
3 − 2i 5 3 + 4i
12. Para z = 3 − 2i, halle (i) z∗ (ii) iz (iii) 1/z.
∗ ∗
13. Halle z tal que zz + 4(z − z ) = 5 + 16i.
Halle las raı́ces de las ecuaciones:
14. x2 − 2x + 4 = 0 15. x2 + 8 = 0 16. x3 − 6x − 9 = 0
Apartado 8.3
Represente como un punto en el plano complejo. Halle entonces el módulo y el argumento:
√ √
17. 1 − i 18. −2 + i 19. 1 − i 3 20. −1 − i/ 2
√
21. 3−i 22. 3 23. 3i 24. 1/i
Exprese en forma polar r( cos θ + i sen θ):
√
25. 2i 26. −3 27. 1−i 28. 3+i
√
29. −6 + 6i 30. −2 − 12i
Exprese cada uno de (i) z1 z2 , (ii) z1 /z2 (iii) z2 /z1 como un único número complejo:
π π π π
31. z1 = 2 cos + i sen , z2 = 3 cos + i sen ,
2 2 3 3

3π 3π 2π 2π
32. z1 = 5 cos + i sen , z2 = cos + i sen .
4 4 3 3
π π
33. Para z = 3 cos + i sen halle (i) z4 , (ii) z−4 .
8 8
34. Use la fórmula de De Moivre para demostrar que

cos 4θ = cos4 θ − 6 cos2 θ sen2 θ + sen4 θ , sen 4θ = 4 sen θ cos θ cos2 θ − sen2 θ .
35. Use la fórmula de De Moivre para desarrollar cos 8x como un polinomio en cos x.
Apartado 8.5
Exprese en forma cartesiana x + iy:
36. 3eiπ/4 37. e−iπ/3 38. e3πi 39. 2e3πi/2
Dados z1 = e2πi/3 y z2 = e−3πi/4 halle el argumento de:

8.8. Ejercicios 213
40. z1 2 z2 41. z2 3 /z1 2 42. z1 3 /z2 2
Dados z1 = 3e−iπ/3 y z2 = 2e2πi/3 halle:
43. z1 2 z2 4 44. z1 3 /z2 2 45. z2 2 /z1 3

46. Halle el número que se obtiene a partir de z = 3 + 2i mediante
(i) un giro antihorario de 30◦ , (ii) un giro horario de 30◦ , en torno al origen del plano complejo.
47. Use la fórmula de Euler para cos x y sen x para demostrar que
(i) cos ix = cosh x, (ii) sen ix = i senh x, (iii) tg ix = i tgh x.
48. Exprese cos (a + ib) en la forma x + iy.
49. Demuestre que ln z = ln |z| + i arg z.
50. Una ecuación diferencial importante en varias ramas de las ciencias fı́sicas es
d2 y
+ ω2 y = 0
dx2
donde ω es real.
(i) Demuestre por sustitución que la solución de la ecuación puede escribirse como
y = Aeiωx + Be−iωx ,
siendo A y B constantes arbitrarias.

(ii) Una forma alternativa de la solución es
y = C cos ωx + D sen ωx .
Halle C y D en función de A y B.
Apartado 8.6
Halle todas las raı́ces y represéntelas en el plano complejo:
√ √ √
51. 4
1 52. i 53. (2 + 2i)1/3 54. 6
−1
Apartado 8.7
Use números complejos para integrar:
∞ ∞
55. e−x cos 2x dx 56. e−2x sen3 x dx
0 0
Funciones de varias variables
9.1. Conceptos
Cuando se escribe la ecuación de estado de los gases ideales en la forma
nRT
V = f (p, T, n) =
p
queda implı́cito que, para cualquier estado del sistema, el valor del volumen V (la varia-
ble dependiente) queda determinado por los valores de la presión p, la temperatura T y
la cantidad de materia n (las variables independientes); es decir, V es una función de las
tres variable p, T y n. Las funciones de varias variables se dan a menudo en las ciencias
fı́sicas. Las funciones termodinámicas de estado, como la que acabamos de mencionar,
son un ejemplo de ello y también toda propiedad fı́sica de un sistema cuyos valores de-
pendan de la posición. En el Capı́tulo 5 vimos, por ejemplo, la densidad de masa y la
energı́a potencial como funciones de una única variable, la posición en la recta. Más
generalmente, las funciones de la posición son funciones de las tres coordenadas de un
punto en el espacio ordinario de tres dimensiones.
Sea la variable z una función de dos variables x e y. Por ejemplo, la ecuación
z = x2 − 2xy − 3y2
nos da z como una función particular de x e y. La expresión en el segundo miembro de
la ecuación define la función
f (x, y) = x2 − 2xy − 3y2 (9.1)
cuyo valor para una pareja de valores de x e y se asocia a la variable z. Se dice que las
variables x e y son variables independientes si no hay ninguna relación entre ellas que
haga que el valor de una dependa del valor de la otra.
EJEMPLO 9.1 Los valores de la función (9.1) para (x, y) = (2, 1), (x, y) = (1, 0) y (x, y) = (0, 1) son
f (2, 1) = 22 − 2 × 2 × 1 − 3 × 12 = −3 ,
f (1, 0) = 12 − 2 × 1 × 0 − 3 × 02 = 1 ,
f (0, 1) = 02 − 2 × 0 × 1 − 3 × 12 = −3 .
216 Capı́tulo 9. Funciones de varias variables
9.2. Representación gráfica

Vimos en el Apartado 2.2 que una función (real) de una variable define una curva en
el plano. En la Figura 2.1 se muestra, por ejemplo, la gráfica de y = x2 − 2x − 3. Una
función de dos variables independientes, z = f (x, y), define una superficie en el espacio
tridimensional.1
Figura 9.1
En la Figura 9.1, Ox, Oy y Oz son tres ejes perpendiculares. La pareja de valores (x, y) es-
pecifica un punto en el plano (horizontal) xy, y el valor de la función se representa por el
punto P con altura z sobre el plano (en el Capı́tulo 10 se tratan los sistemas coordenados
en tres dimensiones). Al moverse el punto (x, y) en el plano xy, el lugar geométrico de los
puntos P corresponde a una superficie. Es decir, el punto P se mueve sobre la superficie,
y la superficie es la representación de la función.
Es posible dibujar bonitas representaciones de funciones de dos variables utilizando
las modernas gráficas por ordenador, pero para funciones de tres o más variables no es
posible hacer tales representaciones fı́sicas completas. En el caso general, una función
de varias variables se visualiza, al menos en parte, fijando el valor de todas las variables
salvo una, y dibujando la correspondiente función de la única variable que queda. Las
Figuras 4.1 y 4.2 son ejemplos de ese tipo de gráficas para el volumen de un gas perfecto,
V = f (p, T, n) = nRT/p. La Figura 4.1 es la gráfica de V como función de T manteniendo
p y n constantes, mientras que la Figura 4.2 es la gráfica de V como función de P a T
y n constantes. A menudo estas sencillas gráficas son la representación más útil de una
función. La Figura 9.2 muestra gráficas de la función (9.1) como función de x para varios
valores de y.
Cada una de esas gráficas es un ‘corte’ de la superficie tridimensional por un plano.
En el caso general, una función de n variables define una ‘superficie’ en un espacio
de (n + 1) dimensiones, y su gráfica como función de una de las variables se obtiene
tomando un corte de esa superficie (n + 1)-dimensional por un ‘plano’.
01. La representación de superficies mediante funciones de dos variables y el concepto de derivadas

parciales fue tratado por primera vez por Leibniz en los años 1690.
9.3. Derivadas parciales 217
Figura 9.2
9.3. Derivadas parciales

Vimos en el Capı́tulo 4 que la derivada primera de una función de una variable se
interpreta gráficamente como la pendiente de la recta tangente a la gráfica y dinámi-
camente como la tasa de variación de la función con respecto a la variable. Para una
función de dos o más variables existen tantas derivadas primeras independientes como
variables independientes haya. Por ejemplo, la función
z = f (x, y) = x2 − 2xy − 3y2
puede derivarse con respecto a la variable x, considerando y como una constante, y se

obtiene la derivada parcial de la función2 con respecto a x
∂z
= 2x − 2y ,
∂x
y se puede derivar con respecto a y, a x constante, y se obtiene la derivada parcial con
respecto a y
∂z
= −2x − 6y .
∂y
La existencia de las derivadas parciales y la validez de la operación de la derivación

parcial están sujetas a las mismas condiciones de continuidad y regularidad que para la
derivada ordinaria (total). Si esas condiciones son satisfechas, las derivadas parciales de
una función de dos variables se definen mediante los lı́mites (compárese con la ecuación
(4.8))

∂z f (x + ∆x, y) − f (x, y)
= lim , (9.2)
∂x ∆x→0 ∆x

∂z f (x, y + ∆y) − f (x, y)
= lim . (9.3)
∂y ∆y→0 ∆y
∂z
02. La notación ∂x fue utilizada por primera vez por Legendre en 1788, pero sólo empezó a ser
aceptada después de que Jacobi la usase en su teorı́a de los determinantes en 1841.
La interpretación geométrica de estas cantidades se da en la Figura 9.3
Figura 9.3
El plano ABC es paralelo al plano xz, de manera que y = constante en el plano y los
valores de ∂z/∂x para ese valor de y son las pendientes de las rectas tangentes a la curva
APB . De la misma manera, el plano DEF es paralelo al plano z, y los valores de ∂z/∂y
son las pendientes de las rectas tangentes a la curva DPE. Las dos rectas tangentes en
el punto P de la Figura 9.3 representan por lo tanto las tasas de variación de la función
z = f (x, y), con ∂z/∂x para la tasa de variación en la dirección x y ∂z/∂y para la tasa de
variación en la dirección y.
Las dos rectas tangentes en P en la Figura 9.3 definen el plano tangente en P, es decir,
el plano que toca la superficie que representa a la función en el punto P únicamente.
Cualquier otra recta que pasa por P en el plano tangente es entonces una recta tangente
y su pendiente es la derivada de la función en alguna dirección. Esa derivada se puede
expresar mediante las derivadas ‘estándar’ ∂z/∂x y ∂z/∂y.
Figura 9.4
En la Figura 9.4, la distancia s en la dirección con ángulo θ con respecto a la dirección x

viene dada por la pareja de ‘ecuaciones paramétricas’
x = s cos θ , y = s sen θ , (9.4)

9.3. Derivadas parciales 219
y la derivada de la función z = f (x, y) en esa dirección s es
∂z ∂z ∂z
= cos θ + sen θ (9.5)
∂s ∂x ∂y
(véase el Ejemplo 9.17).

EJEMPLOS 9.2 Derivadas parciales
(i) f (x, y, z) = x2 + 2y2 + 3z2 + 4xy + 5xz + 6yz
∂f ∂f ∂f
= 2x + 4y + 5z , = 4y + 4x + 6z , = 6z + 5x + 6y .
∂x ∂y ∂z
(ii) f (x, y) = (x2 + 2y2 )1/2
Sea f = u1/2 , siendo u = x2 + 2y2 . Entonces, por la regla de la cadena,
∂f df ∂u 1
= × = u−1/2 × 2x = x(x2 + 2y2 )−1/2 ,
∂x du ∂x 2
∂f df ∂u 1
= × = u−1/2 × 2y = y(x2 + 2y2 )−1/2 .
∂y du ∂y 2
(iii) f (x, y) = y sen (x2 + y2 )
∂f
Por la regla de la cadena = 2xy cos (x2 + y2 ).
∂x
Sea f = u × v, siendo u = y, v = sen (x2 + y2 ). Entonces, por la regla del producto
∂f ∂v ∂u
= u× +v× = y × 2y cos (x2 + y2 ) + sen (x2 + y2 ) × 1
∂y ∂y ∂y
= 2y2 cos (x2 + y2 ) + sen (x2 + y2 ) .
Derivadas de orden superior

Como para la derivada de una función de una variables (Apartado 4.9), la derivada
parcial de una función de más de una variable puede a su vez ser derivada si satisface las
condiciones necesarias de continuidad y regularidad. Por ejemplo, la función cúbica de
dos variables
z = x3 + 2x2 y + 3xy2 + 4y3
tiene derivadas parciales primeras
∂z ∂z
= 3x2 + 4xy + 3y2 , = 2x2 + 6xy + 12y2 .
∂x ∂y
Ambas pueden derivarse con respecto a cada una de las variables y se obtienen cuatro
derivadas segundas. Derivar ∂z/∂x nos da

∂ ∂z ∂2z ∂ ∂z ∂2z
= 2 = 6x + 4y , = = 4x + 6y ,
∂x ∂x ∂x ∂y ∂x ∂y∂x
y derivar ∂z/∂y nos da

∂ ∂z ∂2z ∂ ∂z ∂2z
= 2 = 6x + 24y , = = 4x + 6y .
∂y ∂y ∂y ∂x ∂y ∂x∂y
Hay 8 derivadas terceras posibles, 16 cuartas, etcétera; en general hay 2n derivadas de

orden n posibles. Con la notación de la Figura 9.3, la derivada primera ∂z/∂x es la
pendiente en un punto, digamos p, de la curva APB, y ∂ 2 z/∂x2 es la tasa de variación de
esa pendiente al moverse P sobre la curva. Por otra parte, la derivada segunda ‘cruzada’
∂ 2 z/∂y∂x = ∂(∂z/∂x)/∂y es la tasa de variación de la pendiente ∂z/∂x (en la dirección
x) al moverse el punto P sobre la curva DPE (en la dirección y).
Vemos que para la función cúbica las dos derivadas segundas cruzadas son idénticas.
Esto se cumple para funciones con derivadas primeras continuas y, por lo tanto, es (casi)
siempre cierto en la práctica:
∂2z ∂2z
= . (9.6)
∂x∂y ∂y∂x
Resultados similares se obtienen para las derivadas de órdenes superiores.
Otras notaciones
notación La notación anterior se hace inmanejable para derivadas de orden superior,
y se suele utilizar la siguiente representación más compacta:
∂f ∂2f ∂2f ∂3f

fx = , fxx = , fxy = , fxyz = , ... (9.7)
∂x ∂x2 ∂x∂y ∂x∂y∂z
Con esta notación, la ecuación (9.6) se convierte en fxy = fyx y, por ejemplo, fxxy = fxyx =
fyxx (siempre que se cumplan las pertinentes condiciones de continuidad).
En algunas aplicaciones, en particular en termodinámica, es necesario especificar ex-
plı́citamente qué variable (o combinación de variables) se mantienen constantes. Esto se
hace añadiendo las variables constantes como subı́ndices de la expresión para la derivada
parcial. Por ejemplo, para una función de tres variables f (x, y, z), la expresión

∂f
(9.8)
∂x y, z
representa la derivada de f con respecto a x, a y y z constantes.
EJEMPLOS 9.3 Más ejemplos de derivadas parciales

(i) Para un gas ideal, V = nRT/p y

∂V nRT ∂V nR ∂V RT
=− 2 , = , = .
∂p T, n p ∂T p, n p ∂n p, T p
(ii) Las derivadas no nulas de u = x + y2 + 2y3 son
∂u ∂u ∂2u ∂3u
= 1, = 2y + 6y2 , = 2 + 12y , = 12 .
∂x ∂y ∂y2 ∂y3
(iii) Las derivadas parciales primeras y segundas de u = sen x cos x + x/y son
∂u 1 ∂u x
= cos x cos y + , = − sen x sen y − 2 ,
∂x y ∂y y
∂2u ∂2u 2x
= − sen x cos y , = − sen x cos y + 3 ,
∂x2 ∂y2 y
∂2u ∂2u 1
= = − cos x sen y − 2 .
∂x∂y ∂y∂x y
9.4. Puntos estacionarios

Vimos en el Apartado 4.10 que una función f (x) de una variable tiene un valor esta-
cionario en el punto x = a si su derivada en ese punto es cero, es decir, si f (a) = 0.
Geométricamente, la gráfica de la función tiene pendiente nula en el punto estacionario:
su recta tangente es ‘horizontal’. La condición correspondiente para una función de dos
variables es que su plano tangente sea horizontal. Una función f (x, y) tiene por lo tanto
un punto estacionario en (x, y) = (a, b) si sus dos primeras derivadas parciales son cero
∂f ∂f
= =0 en (a, b) , (9.9)
∂x ∂y
o bien fx (a, b) = fy (a, b) = 0. A la vista de la ecuación (9.5), esto es suficiente para que
todas las derivadas primeras de una función continua sean cero en un punto.
EJEMPLO 9.4 Halle los puntos estacionarios de la función
f (x, y) = x3 + 6xy2 − 2y3 − 12x .

Tenemos
∂f ∂f
= 3x2 + 6y2 − 12 , = 12xy − 6y2 ,
∂x ∂y
que se anulan si
x2 + 2y2 = 4 , y(2x − y) = 0 .
La segunda ecuación se cumple para y = 0 o y = 2x, y sustituyendo esos valores en la primera ecuación
tenemos los cuatro puntos estacionarios
(2, 0), (– 2, 0) , (2/3, 4/3) , (– 2/3, −4/3) .

Para una función de una variable, un punto estacionario en x = a es un máximo local si

la derivada segunda es negativa, f (a) < 0, un mı́nimo local si f (a) > 0, y puede ser un
punto de inflexión si f (a) = 0. Las condiciones correspondientes para una función de
dos variables son
fxx < 0 y fyy < 0 para un máximo, (9.10a)
fxx > 0 y fyy > 0 para un mı́nimo, (9.10b)
y además
fxx fyy − fxy2 > 0 para ambos: máximo y mı́nimo. (9.10c)
Si la cantidad ∆ = fxx fyy − fxy2 es negativa el punto es un punto silla: un máximo en una
dirección y un mı́nimo en la otra. Si ∆ = 0 se necesitan más pruebas para determinar
la naturaleza del punto. Para funciones de más de dos variables, las correspondientes
condiciones son más complicadas.
EJEMPLO 9.5 Naturaleza de los puntos estacionarios del Ejemplo 9.4

Los puntos estacionarios de la función f (x, y) = x3 + 6xy2 − 2y3 − 12x son
(2, 0) , (– 2, 0) , (2/3, 4/3) , (– 2/3, −4/3) .
La determinación de la naturaleza de esos puntos se resume en la siguiente tabla.
Tabla 9.1
x y fxx fyy fxy fxx fyy − fxy2 naturaleza
2 0 12 24 0 >0 mı́nimo
−2 0 −12 −24 0 >0 máximo
2 4
4 −8 16 <0 punto silla
3 3
2 4
− − −4 8 −16 <0 punto silla
3 3
Optimización condicionada
Se denomina optimización al proceso de hallar los máximos y mı́nimos (los valores
extremos) de una función. En el Ejemplo 9.4 las variables x e y son variables indepen-
dientes, sin restricciones en sus valores. En muchas aplicaciones en las ciencias fı́sicas,
sin embargo, la optimización puede estar sujeta a una o más condiciones o ligaduras: se
trata de la optimización condicionada. Dicho condicionamiento normalmente toma la
forma de una o más relaciones entre las variables.
EJEMPLO 9.6 Halle el valor extremo de la función

f (x, y) = 3x2 − 2y2
con la ligadura x + y = 2.
En ausencia de la ligadura, la función tiene un punto silla en x = y = 0, y no tiene ni máximos ni mı́nimos.
La ligadura es una relación entre las variables x e y que reduce el número de variables independientes a 1.
De esta forma, sustituyendo y = 2 − x en la función se obtiene
f (x, y) = F(x) = 3x2 − 2(2 − x)2 = x2 + 8x − 8 .
Para un valor estacionario tenemos entonces que
F (x) = 2x + 8 = 0 , F (x) = 2 ,
de manera que la función tiene un valor mı́nimo para x = −4. El punto extremo de f (x, y) es por lo tanto un
mı́nimo situado en (x, y) = (– 4, 6), y el valor extremo de la función es f (– 4, 6) = −24.
El problema de optimización se ha simplificado en este ejemplo utilizando la ligadura

para eliminar una de las variables. En general, sin embargo, tal simplificación suele ser
difı́cil o imposible, en particular para funciones con más de dos variables o cuando hay
varias ligaduras. Un procedimiento general para resolver muchos de los problemas de
optimización condicionada en las ciencias fı́sicas es el método de los multiplicadores
de Lagrange.3
Sea una función de tres variables, f (x, y, z), y la ligadura g(x, y, z) = constante. Por el
método de los multiplicadores de Lagrange, existe un número λ tal que
∂f ∂g ∂f ∂g ∂f ∂g
−λ = 0, −λ = 0, −λ = 0, (9.11)
∂x ∂x ∂y ∂y ∂z ∂z
en los puntos estacionarios. Estas tres ecuaciones, junto con la ligadura, son suficientes
para determinar los valores de los puntos estacionarios y de los correspondientes valores
del multiplicador de Lagrange λ.
EJEMPLO 9.7 Use el método de los multiplicadores de Lagrange para hallar el valor extremo de la
función f (x, y) = 3x2 − 2y2 sujeta a la ligadura x + y = 2 (Ejemplo 9.6).
Tenemos g = x + y y f − λg = 3x2 − 2y2 − λ(x + y), de manera que las tres ecuaciones por resolver son
∂ ∂
(f − λg) = 6x − λ = 0 , (f − λg) = −4y − λ = 0 , g = x + y = 2.
∂x ∂y
La solución es x = −4, y = 6, λ = −24, y f (– 4, 6) = −24 como en el Ejemplo 9.6.
03. Joseph-Louis Lagrange (1736-1813), nacido en Turı́n, hizo importantes contribuciones a muchas
ramas de las matemáticas, y ha sido llamado el más grande de los matemáticos del siglo XVIII (‘Lagrange
es la encumbrada pirámide de las ciencias matemáticas’, Napoleón Bonaparte). Su mayor logro fue el
desarrollo del cálculo variacional, y en su Mécanique analytique de 1788 extendió la mecánica de Newton y
Euler. Señaló que los problemas en mecánica pueden ser generalmente resueltos reduciéndolos a ecuaciones
diferenciales. Lagrange inventó el término ‘función derivada’ y la notación f (x) para la derivada de f (x).
En el caso general, se trata de optimizar una función de n variables,
f (x1 , x2 , x3 , . . . , xn ), (9.12a)
sujeta a m (< n) ligaduras
gk (x1 , x2 , x3 , . . . , xn ) = ak , k = 1, 2, 3, . . . , m, (9.12b)
siendo a1 , a2 , . . . , am constantes. El procedimiento es construir la función auxiliar

m
φ = f − λ 1 g1 − λ 2 g2 − λ 3 g3 − · · · − λ m gm = f − λk gk (9.13)
k=1
y resolver las n + m ecuaciones
∂φ ∂f ∂gk m
= − λk = 0, i = 1, 2, 3, . . . , n,
∂xi ∂xi k=1
∂xi (9.14)
g k = ak , k = 1, 2, 3, . . . , m,
para la n variables xi y los m multiplicadores λk .

Los siguientes ejemplos ilustran una aplicación del método de los multiplicadores
de Lagrange en geometrı́a (o empaquetado) y una importante aplicación en quı́mica.
En el Capı́tulo 21 tratamos una tercera aplicación: la deducción de la distribución de
Boltzmann.
EJEMPLO 9.8 Halle las dimensiones de la caja rectangular de mayor volumen para una superficie dada.
El volumen de una caja de lados x, y y z es V = xyz y el área de su superficie es A = 2(xy + yz + zx). El
problema es por lo tanto hallar el valor máximo de V sujeto a la ligadura A = constante. Por el método de
los multiplicadores de Lagrange, construimos la función auxiliar φ = V − λA, y resolvemos el conjunto de
ecuaciones
∂φ ∂φ ∂φ
= yz − 2λ(y + z) = 0 , = xz − 2λ(x + z) = 0 , = xy − 2λ(x + y) = 0 .
∂x ∂y ∂z
Multiplicando la primera ecuación por x, la segunda por y, y la tercera por z tenemos
xyz − 2λ(xy + xz) = xyz − 2λ(xy + yz) = xyz − 2λ(xz + yz) = 0 .

Se deduce que x = y = z, y la caja es un cubo de lado A/6.
EJEMPLO 9.9 Ecuaciones seculares

Los principios variacionales de las ciencias fı́sicas llevan a menudo al problema de hallar los valores esta-
cionarios de una ‘forma cuadrática’ de n variables x1 , x2 , . . . , xn ,

n
n
f (x1 , x2 , . . . , xn ) = Cij xi xj
i=1 j=1
9.5. El diferencial total 225
sujeta a la ligadura

n
g(x1 , x2 , . . . , xn ) = xi2 = 1 ,
i=1
donde las Cij son constantes (con Cij = Cji ). Por ejemplo, para n = 3,
f (x1 , x2 , x3 ) = C11 x12 + 2C12 x1 x2 + 2C13 x1 x3 + C22 x22 + 2C23 x2 x3 + C33 x32
con ligadura g = x12 + x22 + x32 = 1.

Por el método de los multiplicadores de Lagrange, los valores estacionarios de la función se obtienen
construyendo la función auxiliar φ = f − λg y resolviendo las ecuaciones (9.14).
Para el caso n = 3, tenemos
φ = (C11 − λ)x12 + 2C12 x1 x2 + 2C13 x1 x3 + (C22 − λ)x22 + 2C23 x2 x3 + (C33 − λ)x32 .
Derivando con respecto a x1 , x2 y xn , e igualando cada derivada a cero, obtenemos el sistema de ecuaciones
(C11 − λ)x1 + C12 x2 + C13 x3 = 0,
C21 x1 + (C22 − λ)x2 + C23 x3 = 0,
C31 x1 + C32 x2 + (C33 − λ)x3 = 0 .
Las ecuaciones de este tipo se llaman a menudo ecuaciones seculares. Se dan, por ejemplo, en el método de
‘combinaciones lineales’ en quı́mica cuántica, cuando la forma cuadrática representa la energı́a del sistema
(o una energı́a orbital en la teorı́a de orbitales moleculares). En los Capı́tulos 17 y 19 tratamos el significado
y la resolución de estos sistemas de ecuaciones.
9.5. El diferencial total

Sea z = f (x, y) una función de las variables x e y, y supongamos que los valores
de las variables varı́an continuamente desde (x, y), en el punto p de la Figura 9.5, hasta
(x + ∆x, y + ∆y) en el punto q. La correspondiente variación de la función es
∆z = zq − zp = f (x + ∆x, y + ∆y) − f (x, y)
y se representa en la figura como el desplazamiento de P a Q sobre la superficie que

representa la función; ∆z es la variación de ‘altura’ sobre la superficie.
Por ejemplo, para la función cuadrática ax2 + bxy + cy2 ,
zp = f (x, y) = ax2 + bxy + cy2 ,

zq = f (x + ∆x, y + ∆y) = a(x + ∆x)2 + b(x + ∆x)(y + ∆y) + c(y + ∆y)2 ,
∆z = zq − zp = (2ax + by)∆x + (bx + 2cy)∆y + a(∆x)2 + b(∆x)(∆y) + c(∆y)2 .

Figura 9.5
Ahora bien, como
∂z ∂z
= 2ax + by , = bx + 2cy ,
∂x ∂y
1 ∂2z ∂2z 1 ∂2z

= a, = b, = c,
2 ∂x2 ∂x∂y 2 ∂y2
la variación en la función puede escribirse como

∂z ∂z
∆z = ∆x + ∆y
∂x ∂y
2
1 ∂2z ∂z 1 ∂2z
+ (∆x) +
2
(∆x)(∆y) + (∆y)2 . (9.15)
2 ∂x2 ∂x∂y 2 ∂y2
Esta expresión es exacta para el presente caso y para toda función cuyas derivadas ter-
ceras y superiores sean cero. Para una función general, (9.15) representa los primeros
términos de un desarrollo de Taylor de la función en el punto (x + ∆x, y + ∆y), en torno
al punto (x, y) (compárese con la ecuación (7.23) para una función de una variable).
Si ∆x y ∆y son suficientemente pequeños, los términos cuadráticos en ∆ son pe-
queños comparados con los términos lineales, y un valor aproximado de ∆z es

∂z ∂z
∆z ≈ ∆x + ∆y . (9.16)
∂x y ∂y x
Este resultado, válido para cualquier función continua de dos variables, muestra que
cuando las variaciones ∆x y ∆y son suficientemente pequeñas, la variación total de z
9.5. El diferencial total 227
es aproximadamente igual a la variación de z debida únicamente a la variación ∆x (el

primer término del segundo miembro de (9.16)) más la variación de z debida únicamente
a la variación ∆x (el segundo término). Además, la precisión de la expresión aumenta
cuando ∆x y ∆y tienden a cero. Como hicimos en el Apartado 4.12, vamos a considerar
variaciones infinitesimales dx y dy, y definimos la cantidad

∂z ∂z
dz = dx + dy (9.17)
∂x y ∂y x
como el caso lı́mite de (9.16). Esta cantidad se denomina el diferencial total de z con
respecto a x e y.4
El concepto del diferencial total se generaliza fácilmente a funciones con cualquier
número de variables. Para una función de n variables
z = f (x1 , x2 , . . . , xn )
el diferencial total es
n
∂z ∂z ∂z ∂z
dz = dx1 + dx2 + · · · + dxn = dxi , (9.18)
∂x1 y ∂x2 y ∂xn y i=1
∂xi y
donde, por ejemplo, ∂z/∂x1 es la derivada parcial con respecto a la variable x1 , mante-
niendo todas las demás variables x2 , x3 , . . . , xn constantes.
EJEMPLOS 9.10 Halle el diferencial total

x
1. z =
y
∂z 1 ∂z x ∂z ∂z 1 x
= , =− 2, dz = dx + dy = dx − 2 dy .
∂x y ∂y y ∂x y ∂y x y y
2. u = (x2 + y2 + z2 )1/2
∂u x ∂u y ∂u z
= x(x2 + y2 + z2 )−1/2 = , = , = ,
∂x u ∂y u ∂z u

∂u ∂u ∂u 1
du = dx + dy + dz = (x dx + y dy + z dz) .
∂x y, z ∂y z, x ∂z x, y u
3. x = r sen θ cos φ
∂x ∂x ∂x
= sen θ cos φ , = r cos θ cos φ , = −r sen θ sen φ ,
∂r ∂θ ∂φ
04. El diferencial total y la igualdad de las derivadas segundas cruzadas fueron descubiertos en 1719
por Nicolaus (II) Bernoulli (1687-1759). Sobrino de Johann (I) y de Jakob (o Jean y Jacques), no hay que
confundirlo con Nicolaus (I), su padre, ni con Nicolaus (III) hijo de Johann (I) y hermano de Daniel y de
Johan (II). Fue Daniel Bernoulli (1700-1782) quien escribió la Hydrodynamica de 1738 que contiene el
concepto del ‘Teorema de Bernoulli’ y un desarrollo de la teorı́a cinética de los gases.

∂x ∂x ∂x
dx = dr + dθ + dφ
∂r θ, φ ∂θ r, φ ∂φ r, θ
= sen θ cos φ dr + r cos θ cos φ dθ − r sen θ sen φ dφ .
EJEMPLO 9.11 Volumen de un fluido

El volumen de un fluido es una función de la presión p, la temperatura T y la cantidad de materia n:
V(n, p, T). El diferencial de volumen total es

∂V ∂V ∂V
dV = dT + dp + dn
∂T p, n ∂p T, n ∂n p, T
= αV dT − κV dp + Vm dn ,
siendo
1 ∂V
α= la expansividad térmica (coeficiente de expansión térmica,)
V ∂T p, n

1 ∂V
κ=− la compresibilidad isotérmica,
V ∂p T, n

∂V
Vm = el volumen molar.
∂n p, T
Una de las principales aplicaciones del diferencial total en las ciencias fı́sicas es en la
formulación de las leyes de la termodinámica (véanse los Ejemplo 9.22 y 9.27). En los
apartados que siguen utilizaremos (9.16) y su forma lı́mite (9.17) para deducir una serie
de propiedades diferenciales e integrales de las funciones.
9.6. Algunas propiedades diferenciales

La derivada total
En la función de dos variables, z = f (x, y), suponemos que x e y son funciones de una
tercera variable t:
x = x(t) , y = y(t) . (9.19)
Entonces z = f (x(t), y(t)) es esencialmente una función de una única variable t, y existe
su derivada ordinaria dz/dt. Esta derivada, también llamada la derivada total de f con
respecto a t, puede obtenerse directamente sustituyendo las funciones x(t) e y(t) en las
variables de f (x, y) y derivando la función de t resultante. También puede obtenerse,
indirectamente, dividiendo la expresión (9.16) por ∆t y tomando el lı́mite ∆t → 0. De
esta manera, dividir

∂z ∂z
∆z ≈ ∆x + ∆y (9.16)
∂x y ∂y x
9.6. Algunas propiedades diferenciales 229
por ∆t nos da
∆z ∂z ∆x ∂z ∆y
≈ + (9.20)
∆t ∂x y ∆t ∂y x ∆t
y en el lı́mite ∆t → 0,

dz ∂z dx ∂z dy
= + . (9.21)
dt ∂x y dt ∂y x dt
Se obtiene el mismo resultado, de manera alternativa, si se divide el diferencial total

(9.17) por dt (infinitesimal).
La ecuación (9.21) es una generalización de la regla de la cadena (véase el Apartado
4.6). Para una función de n variables, u = f (x1 , x2 , x3 , . . . , xn ), en la cual las variables
son todas funciones de t,
n
du ∂u dxi
=
dt i=1
∂xi dt

∂u dx1 ∂u dx2 ∂u dxn
= + + ··· + . (9.22)
∂x1 dt ∂x2 dt ∂xn dt
EJEMPLO 9.12 Dada z = x2 + y3 , donde x = et e y = e−t , halle dz/dt.

(i) Por sustitución:
dz
z = e2t + e−3t , = 2e2t − 3e−3t = 2x2 − 3y3 .
dt
(ii) Por la regla de la cadena (9.21):
∂z ∂z dx dy
Tenemos = 2x, = −3y2 , y = et = x, = −e−t = −y,
∂x ∂y dt dt
Por lo tanto,
dz ∂z dx ∂z dy
= + = (2x) × (x) + (3y2 ) × (– y) = 2x2 − 3y3 ,
dt ∂x dt ∂y dt
que es idéntico al resultado obtenido por sustitución.
EJEMPLO 9.13 Desplazamiento en un cı́rculo

La ecuación de un cı́rculo en el plano xy con centro en el origen y radio a es x2 + y2 = a2 . Un desplaza-
miento sobre el cı́rculo se describe muy fácilmente si se expresa la ecuación del cı́rculo en función de las
coordenadas polares r y θ:
x = a cos θ , y = a sen θ ,
que tienen la forma de la pareja de ecuaciones (9.19) con θ en vez de t. En general, las ecuaciones de
este tipo se denominan ecuaciones paramétricas de una curva. Sea z = f (x, y). Entonces, por la ecuación
(9.21), y ya que dx/dθ = −y y dy/dθ = x,

dz ∂z dx ∂z dy ∂z ∂z
= + = −y +x .
dθ ∂x y dθ ∂y x dθ ∂x y ∂y x
∂z ∂z dz
Por ejemplo, si z = xy, entonces = y, =xy = x 2 − y2 .
∂x ∂y dθ
Un caso especial de la derivada total (9.21) se obtiene si se sustituye t por x. Entonces

y = y(x) es una función explı́cita de x y z = f (x, y(x)) puede tratarse como función de
una única variable x. A partir de (9.21), tenemos entonces

dz ∂z ∂z dy
= + . (9.23)
dx ∂x y ∂y x dx
Vemos que si x = x(t), esta derivada total con respecto a x se relaciona con la derivada
total con respecto a t (9.21) mediante la regla de la cadena:

dz dz dx ∂z dx ∂z dy dx
= = + (9.24)
dt dx dt ∂x y dt ∂y x dx dt
dy dx dy
y = .
dx dt dt
EJEMPLO 9.14 Dada z = x2 + y3 , donde y = 1/x, halle dz/dx. Si x = et , halle entonces dz/dt.
dy 1
1. Por la ecuación (9.23), ya que = − 2 = −y2 ,
dx x
dz ∂z ∂z dy
= + = 2x + (3y2 ) × (– y2 ) = 2x − 3y4 .
dx ∂x ∂y dx
dx
2. Si x = et , entonces = et = x, y
dt
dz dz dx
= = 2x2 − 3xy4 .
dt dx dt
Esto es idéntico al resultado del Ejemplo 9.12, ya que x = 1/y.
Desplazamiento sobre una curva de nivel

Vamos a considerar variaciones de x e y que dejen el valor de la función invariante.
En la Figura 9.6, el plano ABC es paralelo al plano xy, de manera que todos los
puntos de la curva APB sobre la superficie que representa a la función tienen un valor de
z constante. El desplazamiento de P a Q se hace por lo tanto sobre una curva de nivel de
la superficie. Entonces, por (9.16),

∂z ∂z
∆z = 0 ≈ ∆x + ∆y (9.25)
∂x y ∂y x
y, dividiendo por ∆x,

∂z ∂z ∆y
0≈ + .
∂x y ∂y x ∆x
En el lı́mite ∆x → 0, el cociente ∆y/∆x tiende a la derivada de y con respecto a x a z

constante, y

∂z ∂z ∂y
0= + . (9.26)
∂x y ∂y x ∂x z
Figura 9.6
El mismo resultado se obtiene directamente a partir del diferencial total (9.17) consi-
derando variaciones infinitesimales dx y dy tales que dz = 0:

∂z ∂z
dz = 0 = dx + dy .
∂x y ∂y x
Para obtener (9.26) dividimos (formalmente) por dx y, como el proceso es a z constante,

sustituimos dx/dy por la derivada parcial a z constante.
La ecuación (9.26) puede reescribirse como

∂y ∂z ∂z
=− (9.27)
∂x z ∂x y ∂y x
y ésta es la pendiente de la gráfica de la función y(x) para la cual z es constante, esto es,
la pendiente de la curva ab en el plano xy de la Figura 9.6 para la cual AB es una curva
de nivel. Además, como

∂z ∂x
=1 (9.28)
∂x y ∂z y
la ecuación también puede escribirse como

∂x ∂y ∂z
−1 = . (9.29)
∂y z ∂z x ∂x y
Esta expresión se llama a veces la ‘regla del −1’.

La presencia del signo menos en las ecuaciones (9.27) y (9.29) a veces provoca in-
comodidad, pero se puede explicar geométricamente. En efecto, para la superficie z en
particular que se muestra en las Figuras 9.3 y 9.6, las pendientes a lo largo de las di-
recciones x e y son ambas negativas en P (las lı́neas de fuerza apuntan ‘hacia abajo’),
de manera que (∂z/∂x)y y (∂z/∂y)x son negativas y su cociente en la ecuación (9.27)
es positivo. Sin embargo, según se ve en la Figura 9.6, para un desplazamiento sobre la
curva de nivel desde P a Q, ∆y es necesariamente positivo pero ∆x negativo (o viceversa
para el movimiento de Q a P) de manera que (∂y/∂x)z es negativa. De ahı́ el signo me-
nos. Consideraciones similares se aplican a los otros tres posibles pares de signos de las
pendientes.
Hay que señalar que la distinción entre variables dependientes e independientes ha
desaparecido de las ecuaciones (9.26) a (9.29): cada variable puede ser considerada co-
mo una función de las otras dos. Vemos además que mientras que (9.26) se generaliza
fácilmente para conjuntos de más de tres variables, las ecuaciones (9.27) y (9.29) son
válidas únicamente para tres variables por vez (manteniendo todas las otras constantes).
EJEMPLOS 9.15
∂y
(i) Dada z = x2 y3 , halle .
∂x z

∂z ∂z
= 2xy3 , = 3x2 y3 ,
∂x y ∂y x

∂y ∂z ∂z 2xy3 2y
Por la ecuación (9.27), =− =− 2 2 =− .
∂x z ∂x y ∂y x 3x y 3x

∂y
(ii) Para r = (x2 + y2 )1/2 , halle .
∂x r

∂r x ∂r y ∂y x
= , = y =− .
∂x r ∂y r ∂x r y
La superficie que representa la función r = (x2 + y2 )1/2 es un cono vertical cuyas curvas de nivel
(r = constante) son cı́rculos de radio r paralelos al plano xy. La cantidad −x/y es la pendiente en
(x, y) sobre el cı́rculo.
(iii) El diferencial de volumen de un fluido es (véase el Ejemplo 9.11)

∂V ∂V
dV = dT + dp (para una cantidad fija n).
∂T p ∂p T

∂V ∂p ∂T
Por la ecuación (9.29), −1 = ,
∂p T ∂T V ∂V p

∂p ∂V ∂V α expansividad
de manera que =− = = .
∂T V ∂T p ∂p T κ compresibilidad
Cambio de variable constante

Sea z = f (x, y) una función de las variables x e y, y sea u = g(x, y) alguna otra función
de x e y. Vamos a considerar variaciones de las variables tales que u sea constante. En-
tonces, dividiendo el diferencial total dz por la variación infinitesimal dx, a u constante
tenemos

∂z ∂z ∂z ∂y
= + . (9.30)
∂x u ∂x y ∂y x ∂x u
Esta ecuación muestra cómo la derivada parcial con respecto a x a y constante está re-
lacionada con la derivada parcial con respecto a x cuando cierta función (u) de x e y se
mantiene constante.
EJEMPLO 9.16 Sea z = f (x, y) y sea u = x2 + y2 , que es la ecuación de un cı́rculo de radio a cuando
u = a2 = constante. Entonces por la ecuación (9.27),

∂y ∂u ∂u x
=− =− ,
∂x u ∂x y ∂y x y
y, por lo tanto, por la ecuación (9.30),

∂z ∂z x ∂z
= − .
∂x u ∂x y y ∂y x

∂z
Si, por ejemplo, z = xy, entonces = y − x2 /y. Este resultado está relacionado con el del Ejemplo
∂x u
dx
9.13. Cuando x2 + y2 = a2 , x = a cos θ y = −y, de manera que por la regla de la cadena
dθ

dz ∂z dx ∂z
= = −y = x 2 − y2 .
dθ ∂x u dθ ∂x u
Cambio de variables independientes

Sea z = f (x, y) una función de las variables independientes x e y con diferencial total
de z con respecto a x e y

∂z ∂z
dz = dx + dy . (9.17)
∂x y ∂y x
Sean las variables x e y funciones ellas mismas de otras dos variables independientes u
y v:
x = x(u, v) , y = y(u, v) . (9.31)

Podemos entonces considerar z como una función de u y v, y su diferencial total con

respecto a las nuevas variables es

∂z ∂z
dz = du + dv . (9.32)
∂u v ∂v u
La relación entre las derivadas parciales de (9.32) y las de (9.17) puede obtenerse de la
siguiente manera. Dividimos el diferencial total (9.17) por du a v constante para obtener
la ecuación (9.33a), y por dv a u constante para obtener (9.33b):

∂z ∂z ∂x ∂z ∂y
= + ,
∂u v ∂x y ∂u v ∂y x ∂u v (9.33a)

∂z ∂z ∂x ∂z ∂y
= + .
∂v u ∂x y ∂v u ∂y x ∂v u (9.33b)
Las relaciones inversas se obtienen de la misma manera a partir de (9.32):

∂z ∂z ∂u ∂z ∂v
= + ,
∂x y ∂u v ∂x y ∂v u ∂x y (9.34a)

∂z ∂z ∂u ∂z ∂v
= + .
∂y x ∂u v ∂y x ∂v u ∂y x (9.34b)
EJEMPLO 9.17 De coordenadas polares a cartesianas

Sea z = f (x, y) una función de las coordenadas cartesianas de un punto en el plano xy. La posición del punto
se puede dar igual de bien utilizando las coordenadas polares r y θ, donde
x = r cos θ , y = r sen θ ,
corresponden a las ecuaciones (9.31) con r sustituyendo a u y θ a v. Entonces

∂z ∂z ∂x ∂z ∂y ∂z ∂z
= + = cos θ + sen θ ,
∂r θ ∂x y ∂r θ ∂y x ∂r θ ∂x y ∂y x
(9.35)
∂z ∂z ∂x ∂z ∂y ∂z ∂z
= + = −y +x .
∂θ r ∂x y ∂θ r ∂y x ∂θ r ∂x y ∂y x
La primera de éstas es idéntica a la ecuación (9.5) y tiene la misma interpretación gráfica. La segunda
es idéntica al resultado obtenido en el Ejemplo 9.13 para el desplazamiento alrededor de un cı́rculo. Las
relaciones inversas son, por las ecuaciones (9.34),

∂z ∂z ∂r ∂z ∂θ ∂z sen θ ∂z
= + = cos θ − ,
∂x y ∂r θ ∂x y ∂θ r ∂x y ∂r θ r ∂θ r
(9.36)
∂z ∂z ∂r ∂z ∂θ ∂z cos θ ∂z
= + = sen θ + .
∂y x ∂r θ ∂y x ∂θ r ∂y x ∂r θ r ∂θ r
Vemos que si v = x, la ecuación (9.33b) es idéntica a la ecuación (9.30) para un cambio

de variable constante, de y a u.
Ecuación de Laplace en dos dimensiones

La ecuación de Laplace en dos dimensiones es
∂2f ∂2f
+ = 0, (9.37)
∂x2 ∂y2
donde f = f (x, y) es una función de las coordenadas cartesianas de un punto en un

plano. La ecuación de Laplace aparece en muchas ramas de las ciencias fı́sicas y es la
ecuación fundamental de la ‘teorı́a del potencial’, cuando un sistema fı́sico se describe
mediante una función potencial. Por ejemplo, las funciones potenciales gravitacional y
electrostática en una región libre de materia cumplen la ecuación de Laplace en tres
dimensiones (véase el Capı́tulo 10). La ecuación en dos dimensiones es importante en
teorı́as de flujos: por ejemplo en la teorı́as del flujo de un fluido y de la conducción
térmica.5
La posición de un punto en el plano puede especificarse, como en el Ejemplo 9.17,
mediante las coordenadas polares r y θ, siendo x = r cos θ e y = r sen θ. La función f
puede por lo tanto considerarse como una función de r y θ, f = f (r, θ), y la ecuación
(9.37) puede transformarse de una ecuación en coordenadas cartesianas a una ecuación
en coordenadas polares por el procedimiento descrito en el Ejemplo 9.17. En el Ejemplo
9.18 se muestra como hacer esto, con el resultado
∂ 2f ∂2f ∂2f 1 ∂f 1 ∂2f

+ = + + = 0.
∂x2 ∂y2 ∂r2 r ∂r r2 ∂θ2
El operador diferencial ∂2 ∂2
∇2 = +
∂x2 ∂y2
(9.38)
∂2 1∂ 1 ∂2
= 2+ + 2 2
∂r r ∂r r ∂θ
(que se lee como ‘laplaciano’ o ‘nabla cuadrado’) se denomina operador laplaciano (si
bien tanto el sı́mbolo como el nombre se suelen reservar a la forma tridimensional; véase
el Capı́tulo 10). La ecuación de Laplace es entonces
∇2 f = 0 (9.39)
y las soluciones f de la ecuación se conocen como funciones armónicas.
05. Pierre Simon de Laplace (1749-1827). Su Traité de mécanique céleste (Tratado de mecánica ce-
leste) en 5 volúmenes (1799-1825) marcó la culminación del enfoque newtoniano de la gravitación. Cuenta
la leyenda que mientras estaba en la École Militaire, donde enseñaba matemáticas elementales a los cadetes,
examinó, y aprobó, a Napoleón en 1785.
EJEMPLO 9.18 La ecuación bidimensional de Laplace en coordenadas polares

Por la primera de las ecuaciones (9.36) del Ejemplo 9.17,
∂f ∂f sen θ ∂f
= cos θ − .
∂x ∂r r ∂θ
Entonces

∂2f ∂ sen θ ∂ ∂f sen θ ∂f
= cos θ − cos θ −
∂x2 ∂r r ∂θ ∂r r ∂θ

∂ ∂f sen θ ∂f sen θ ∂ ∂f sen θ ∂f
= cos θ cos θ − − cos θ −
∂r ∂r r ∂θ r ∂θ ∂r r ∂θ

∂2f sen θ ∂f sen θ ∂ 2 f
= cos θ cos θ 2 + 2 −
∂r r ∂θ r ∂r∂θ

sen θ ∂f ∂2f cos θ ∂f sen θ ∂ 2 f
− − sen θ + cos θ − −
r ∂r ∂θ∂r r ∂θ r ∂θ 2

∂2f sen2 θ ∂f sen2 θ ∂ 2 f 2 sen θ cos θ 1 ∂f ∂2f
= cos θ 2 +
2
+ + − .
∂r r ∂r r2 ∂θ 2 r r ∂θ ∂r∂θ
De manera similar

∂2f ∂2f cos2 θ ∂f cos2 θ ∂ 2 f 2 sen θ cos θ 1 ∂f ∂2f
= sen2 θ 2 + + − − .
∂y 2 ∂r r ∂r r2 ∂θ 2 r r ∂θ ∂r∂θ
Por lo tanto
∂2f ∂2f ∂2f 1 ∂f 1 ∂2f
+ 2 = 2 + + 2 2.
∂x 2 ∂y ∂r r ∂r r ∂θ
EJEMPLO 9.19 Demuestre que la función f = x2 − y2 cumple la ecuación de Laplace.
1. En coordenadas cartesianas,
∂f ∂2f ∂f ∂2f
= 2x , = 2; = −2y , = −2 .
∂x ∂x2 ∂y ∂y2
∂2f ∂2f
Por lo tanto, + 2 = 0.
∂x 2 ∂y
2. En coordenadas polares, f = r2 ( cos2 θ − sen2 θ) = r2 cos 2θ,
∂f 2f ∂2f 2f
= 2r cos 2θ = , = 2 cos 2θ = 2 ,
∂r r ∂r2 r
∂f ∂2f
= −2r2 sen 2θ , = −4r2 cos 2θ = −4f .
∂θ ∂θ 2
∂2f 1 ∂f 1 ∂2f 2f 2f 4f
Por lo tanto, + + 2 = 2 + 2 − 2 = 0.
∂r 2 r ∂r r ∂θ 2 r r r
9.7. Diferenciales exactos 237

EJEMPLO 9.20 Demuestre que la función f = ln r, con r = x2 + y2 , cumple la ecuación de Laplace.
Como la función depende únicamente de r, ∂f /∂θ = 0, y las derivadas con respecto a r son derivadas
totales:
d2 f 1 df
∇2 f (r) = 2 + .
dr r dr
Tenemos df /dr = 1/r y d f /dr = −1/r . Por lo tanto ∇ f
2 2 2 2
= 0.
Este ejemplo es importante porque es posible demostrar que la única solución de la ecuación de Laplace

en dos dimensiones que depende únicamente de r = x2 + y2 tiene la forma general f = a ln r + b. Esta
función aparece en la teorı́a del potencial en dos dimensiones.
9.7. Diferenciales exactos

Una de las ecuaciones fundamentales de la termodinámica, que combina tanto la
primera como la segunda ley, es
dU = T dS − p dV , (9.40)
donde U es la energı́a interna del sistema termodinámico, S su entropı́a, y p, V y T son

la presión, el volumen y la temperatura. La cantidad dU es esencialmente el diferencial
total de U como función de S y V, y puede por lo tanto expresarse como

∂U ∂U
dU = dS − dV (9.41)
∂S V ∂V S
de manera que, igualando (9.40) y (9.41),

∂U ∂U
T= , −p = . (9.42)
∂S V ∂V S
La expresión del segundo miembro de (9.40) es de la forma
F dx + G dy (9.43)
y, en el caso general, F = F(x, y) y G = G(x, y) son dos funciones arbitrarias de x e y.

Un caso especial se presenta cuando existe una función z = z(x, y) tal que

∂z ∂z
F= , G= . (9.44)
∂x y ∂y x
El diferencial (9.43) se llama entonces un diferencial exacto, y puede igualarse al dife-

rencial total de z:

∂z ∂z
F dx + G dy = dz = dx + dy . (9.45)
∂x y ∂y x
La condición para que el diferencial en dos variables sea exacto es que las funciones F
y G satisfagan

∂F ∂G
= . (9.46)
∂y x ∂x y
Por las igualdades (9.44), cada una de esas derivadas parciales es igual a la derivada cru-
zada segunda de z, ∂ 2 x/∂x∂y. La condición (9.46) se llama a veces relación de recipro-
cidad de Euler, y se usa en termodinámica para obtener varias relaciones, llamadas las
relaciones de Maxwell, entre las propiedades termodinámicas (véase el Ejemplo 9.22).6
El significado de la exactitud lo analizamos en el siguiente apartado.
EJEMPLO 9.21 Criterio de exactitud
1. F dx + G dy = (x2 − y2 )dx + 2xy dy.

∂F ∂G
Tenemos = −2y y = +2y, por lo que el diferencial no es exacto.
∂y x ∂x y
2. F dx + G dy = (2ax + by)dx + (bx + 2cy)dy.

∂F ∂G
Tenemos =b= , y el diferencial es exacto.
∂y x ∂x y
Se comprueba fácilmente que es el diferencial total de ax2 + bxy + cy2 + d.
EJEMPLO 9.22 Relaciones de Maxwell

Se deduce de las ecuaciones (9.42) que

∂T ∂2U ∂p ∂2U
= , − = ,
∂V S ∂V∂S ∂S V ∂S∂U
de modo que
∂T ∂p
=− .
∂V S ∂S V
Ésta es una de las cuatro relaciones de Maxwell importantes en termodinámica. Las otras tres se obtienen
de los diferenciales de la entalpı́a H = U + pV, de la función de Helmholtz (energı́a libre) A = U − TS,
06. Clairaut utilizó en 1739 la igualdad entre las derivadas parciales segundas cruzadas para analizar
la exactitud de un diferencial (y también Euler hacia la misma época). Alexis Claude Clairaut (1713-1765)
fue miembro de una familia de 20 hermanos, de los cuales sólo uno sobrevivió al padre. Presentó un trabajo
sobre geometrı́a en la Académie des Sciences con 13 años de edad, y fue admitido como miembro con 18
años (un hermano menor, conocido como ‘le cadet Clairaut’, publicó un libro de cálculo en 1731 con 15
años de edad, y murió de viruela un año después). Sus Recherches sur les courbes à double courbure (In-
vestigaciones sobre curvas de doble curvatura) de 1731 marcaron el principio del desarrollo de la geometrı́a
cartesiana en tres dimensiones.
9.8. Integrales de lı́nea 239
y de la función de Gibbs (energı́a libre) G = H − TS. Para la entalpı́a, por ejemplo (y usando (9.40) para
dU),
dH = dU + pdV + Vdp = TdS + Vdp .
La cantidad dH es el diferencial total de H como función de S y p, de modo que

∂H ∂H
T= , V= ,
∂S p ∂p S
y la correspondiente relación de Maxwell es

∂T ∂V
= .
∂p S ∂S p
De manera similar,
∂S ∂p
dA = −SdT − pdV −→ = ,
∂V T ∂T V

∂S ∂V
dG = −SdT + Vdp −→ = .
∂p T ∂T p
9.8. Integrales de lı́nea

Sea la función f (x) y la integral
b
f (x) dx . (9.47)
a
En el Apartado 5.4 interpretamos la integral como el ‘área bajo la curva’ de la gráfica

de f (x) entre x = a y x = b. Una interpretación alternativa se obtiene considerando la
función f (x) como algún tipo de propiedad asociada a los puntos x de una lı́nea. Sea f (x),
por ejemplo, la densidad de masa de una varilla rectilı́nea de material con longitud b − a
(véase el Apartado 5.6). El diferencial
b de masa en el elemento dx es entonces dm =
f (x) dx y la masa total es M = a f (x) dx. De manera similar (véase el Apartado 5.7), si
f (x) es la fuerza que se ejerce sobre un cuerpo a lo largo de una recta, el diferencial de
trabajo es dW = f (x) dx y el trabajo total entre a y b vuelve a ser otra vez la integral
definida.
En estos ejemplo la lı́nea es una lı́nea recta, que se toma como eje x. En vez de
eso, consideremos una curva en el plano xy (Figura 9.7), y sea f (x, y) alguna propiedad
asociada a los puntos de la curva.
Por ejemplo, sea f (x, y) la densidad de masa de una varilla curva de material, AB en
la Figura 9.7. El diferencial de masa en el elemento ds es dm = f (x, y)ds y la masa total
es

M = dm = f (x, y) ds , (9.48)
C C

donde C significa integración a lo largo de la curva C desde A hasta B. Igualmente para
el trabajo realizado a lo largo de la curva. La cantidad

I = f (x, y) ds (9.49)
C
se llama integral de lı́nea o curvilı́nea, e incluye la integral definida ordinaria como

caso particular. La curva C se denomina camino de integración.7
Figura 9.7
Una integral de lı́nea se puede convertir en una integral ordinaria de la siguiente ma-
nera. Vimos en el Apartado 5.4, sobre la integral como una longitud, que para cantidades
infinitesimales

2 1/2
dy
ds = 1 + dx . (9.50)
dx
Entonces, si expresamos la curva C en forma explı́cita y = y(x),

b

2 1/2
dy
I= f (x, y) ds = f (x, y(x)) 1 + dx . (9.51)
C a dx
EJEMPLO 9.23 Integre la función f (x, y) = xy sobre la curva y = x2 /2 desde el punto (x, y) = (0, 0)
hasta el punto (1, 1/2).
07. Maxwell empleó el concepto y la notación de la integral de lı́nea en sus estudios sobre los cam-
pos eléctricos en 1855. James Clerk Maxwell (1831-1879), nacido en Edimburgo, está al mismo nivel que
Newton y Einstein en las teorı́as fı́sicas precuánticas. Basándose en el trabajo de Michael Faraday, Max-
well presentó sus ecuaciones de campo en su Dynamical theory of the electromagnetic field en 1864. La
Dynamical theory of gases de 1859 describe la distribución de Maxwell, con aplicaciones a la teorı́a de la
viscosidad, la conducción del calor y la difusión de los gases.
La notación para la integral de lı́nea apareció en un texto de fı́sica de Charles Delauney (1816-1872) en
1856 para el trabajo realizado a lo largo de una curva, y se adoptó rápidamente en fı́sica.
Tenemos que f (x, y(x)) = x3 /2 y dy/dx = x. Por lo tanto

1 2
dy 1/2 1 1 3
I= f (x, y) 1 + dx = x (1 + x2 )1/2 dx .
0 dx 2 0
Para integrar, sustituimos u = 1 + x2 , du = 2x dx. Tenemos entonces

√
1 2
I= (u − 1)u1/2 du = (1 + 2)/15 .
4 1
Una forma general alternativa para la integral de lı́nea en un plano es

I= F(x, y) dx + G(x, y) dy . (9.52)
C
Esto puede convertirse en una integral ordinaria sobre una de las dos variables si se
conoce la ecuación de la curva C. Por ejemplo, para una curva y = f (x) desde x = a
dy
hasta x = b, sustituyendo dy por dx en (9.52) tenemos
dx
b

dy
I= F(x, y) + G(x, y) dx . (9.53)
a dx
De manera alternativa, si la curva viene dada en forma paramétrica, con x = x(t) e

dx dy
y = y(t) desde t = tA hasta t = tB , entonces dx = dt, dy = dt y (9.52) es
dt dt
t

dx B
dy
I= F(x, y) + G(x, y) dt . (9.54)
t dtA
dt
EJEMPLO 9.24 Halle el valor de la integral de lı́nea (9.52) si F = −y, G = xy y C es la recta de la Figura
9.8 de A a B (x = 1 a x = 0).
La ecuación de la recta es y = 1 − x. Entonces dy = −dx y por la ecuación
(9.53)
0
−y dx + xy dy = − (1 − x) − x(1 − x) dx
C 1
1
2
= (1 − x2 ) dx = .
0 3
Figura 9.8
En general, el valor de una integral de lı́nea depende del camino de integración entre sus
puntos extremos. Esto queda de manifiesto en el siguiente ejemplo.
EJEMPLO 9.25 Halle el valor de la integral de lı́nea (9.52) cuando F y G son como en el Ejemplo 9.24,
pero C es ahora el arco de cı́rculo que se muestra en la Figura 9.9.
√
La ecuación del arco de cı́rculo es y = + 1 − x2 . Entonces dy =
−x x
√ dx = − dx y
1 − x2 y
0 π 1
I= −y dx + xy dy = − 1 − x2 − x2 dx = +
C 1 4 3
1
(véase el Ejemplo 6.10 para la integral 1 − x2 dx). Este resultado es dis-
0 Figura 9.9
tinto del obtenido en el Ejemplo 9.24.
Las integrales de lı́nea son importantes en varias ramas de las ciencias fı́sicas. Por ejem-
plo, cuando se generalizan a curvas en tres dimensiones, proporcionan un método de
calcular el trabajo efectuado por una fuerza a lo largo de un camino arbitrario en el es-
pacio ordinario. Volveremos a este tema en el Capı́tulo 16. La dependencia de la integral
de lı́nea con el camino puede entenderse, por ejemplo, en función del trabajo efectuado
sobre un cuerpo al moverse desde A a B a lo largo del camino. Del estudio sobre traba-
jo y energı́a potencial del Apartado 5.7, cabe esperar que el trabajo efectuado dependa
del camino si las fuerzas que actúan sobre el cuerpo son fuerzas no conservativas, por
ejemplo cuando el trabajo se hace oponiéndose a la fricción. En particular, se efectúa un
trabajo neto al mover el cuerpo a lo largo de una curva cerrada. Por otra parte, si las
fuerzas son conservativas y se pueden derivar de una función de energı́a potencial, como
en la ecuación (5.57) del Apartado 5.7, entonces el trabajo es independiente del camino,
y no se efectúa trabajo neto en una curva cerrada. En el presente caso general, el valor
de una integral de lı́nea es independiente del camino entre dos puntos fijos si la cantidad
entre corchetes de la ecuación (9.52) es un diferencial exacto.8 Si es ası́, según el estudio
del Apartado 9.7, existe una función z(x, y) tal que

∂z ∂z
F(x, y)dx + G(x, y)dy = dz = dx + dy (9.55)
∂x y ∂y x
y la integral de lı́nea (9.52) puede expresarse como

∂z ∂z
I = dz = dx + dy . (9.56)
C C
∂x y ∂y x
Entonces, como en la Figura 9.10, tenemos que para un camino desde A en (x1 , y1 ) hasta
B en (x2 , y2 )
B
I = dz = z = z(x2 , y2 ) − z(x1 , y1 ) (9.57)
C A
08. Esta independencia del camino para la integral de lı́nea de un diferencial exacto fue observada
por Riemann en 1857.
y esto sólo depende de los valores de z en los extremos (vemos que el valor de la integral
cambia de signo si se cambia el sentido de la integración desde B a A).
Figura 9.10
Interpretado en función de la representación gráfica de z(x, y) del Apartado 9.2, la inte-

gral de lı́nea es el cambio en ‘altura’ sobre el plano xy en la superficie que representa a
z. Esto no puede depender el camino recorrido entre los puntos extremos.
EJEMPLO 9.26 Independencia del camino para un diferencial exacto

Vimos en el Ejemplo 9.21 que el diferencial
(2ax + by) dx + (bx + 2cy) dy
es exacto e igual al diferencial total de z = ax2 + bxy + cy2 + d. Consideremos los dos caminos desde A
hasta B que se muestran en la Figura 9.10: el camino C y el camino C1 + C2 .
(i) El camino C es el segmento con ecuaciones paramétricas
x = x1 + (x2 − x1 )t , y = y1 + (y2 − y1 )t , t = 0 → 1.
Entonces, por la ecuación (9.54),

dx dx
I = F(x, y) + G(x, y) dt
C dt dt
1
= [(2ax1 + by1 )(x2 − x1 ) + (bx1 + 2cy1 )(y2 − y1 )]
0

+ 2t[a(x2 − x1 )2 + b(x2 − x1 )(y2 − y1 ) + c(y2 − y1 )2 ] dt
= a(x22 − x12 ) + b(x2 y2 − x1 y1 ) + c(y22 − y21 ) .
(ii) Camino C1 + C2 . El camino C1 es con y = y1 constante, y el camino C2 es con x = x2 constante.

Entonces

I = F(x, y1 ) dx + G(x2 , y) dy
C1 C2
x2 y2
= (2ax + by1 ) dx + (bx2 + 2cy) dy
x1 y1
= a(x22 − x12 ) + b(x2 y2 − x1 y1 ) + c(y22 − y21 ) .
La integral de lı́nea es la misma para ambos caminos, y es igual a z(x2 , y2 ) − z(x1 , y1 ).

EJEMPLO 9.27 Variación de la entropı́a en termodinámica

La variación de la entropı́a cuando un sistema pasa de un estado con presión y temperatura (p1 , T1 ) a un
estado con presión y temperatura (p2 , T2 ) puede obtenerse a partir de medidas calorimétricas de la capacidad
calorı́fica y la expansividad térmica,

∂H 1 ∂V
Cp = , α= ,
∂T p V ∂T p
de la siguiente manera. Considerando la entropı́a como una función de p y T, el diferencial total de la

entropı́a es
∂S ∂S
dS = dT + dp .
∂T p ∂p T
Entonces, por ser la entropı́a una función de estado, el cambio al pasar de un estado a otro es independiente
del camino:

∂S ∂S
∆S1→2 = S(p2 , T2 ) − S(p1 , T1 ) = dT + dp .
C ∂T p ∂p T
Escogiendo el camino mostrado en la Figura 9.11,
∆S1→2 = ∆S1→3 + ∆S3→2 ,
donde ∆S1→3 es con p = p1 constante:
∆S1→3 = S(p1 , T2 ) − S(p1 , T1 )

T2
∂S
= dS = dT ,
C1 T1 ∂T p=p1
y ∆S3→2 es con T = T2 constante:
∆S3→2 = S(p2 , T2 ) − S(p1 , T2 )

p2
∂S
= dS = dp .
C2 p1 ∂p T=T2
Figura 9.11
Se deduce a partir del diferencial de entalpı́a dH = TdS + Vdp (Ejemplo 9.22) que

∂H ∂S
=T = Cp ,
∂T p ∂T p
dividiendo dH por dT a p constante. Por otra parte, la relación de Maxwell que se obtiene del diferencial de
la función de Gibbs es
∂S ∂V
=− = −αV .
∂p T ∂T p
Por lo tanto,
T2 p2
Cp
∆S1→3 = dT (en p = p1 ), ∆S3→2 = − αV dp (en T = T2 ).
T1 T p1
Experimentalmente, la capacidad calorı́fica se mide a distintas temperaturas entre T1 y T2 a presión p1 ,

y la expansividad a distintas presiones entre p1 y p2 a temperatura T2 . Las integrales se calculan ya sea
representando Cp /T frente a T y αV frente a p y midiendo el área bajo la curva en cada caso, o bien
utilizando un método de integración numérico (véase el Capı́tulo 20).
9.9. Integrales múltiples 245
Se demuestra fácilmente que para una función continua como la función cuadrática
del ejemplo 9.26, la integral de lı́nea alrededor de una curva cerrada es cero. Hay que
señalar, sin embargo, que este resultado es válido en general únicamente si el diferencial
Fdx + Gdy es exacto en todos los puntos de la curva y del interior de la curva cerrada.
Consideraciones adicionales sobre este punto quedan fuera del propósito de este libro.
9.9. Integrales múltiples

Una función de dos variables independientes, f (x, y), puede integrarse con respecto a
una de ellas manteniendo la otra constante:
b d
f (x, y) dx o f (x, y) dy .
a c
EJEMPLO 9.28 Integre f (x, y) = 2xy + 3y2 con respecto a x en el intervalo a ≤ x ≤ b, y con respecto a
y en el intervalo c ≤ y ≤ d.
b
1. (2xy + 3y2 ) dx = [x2 y + 3y2 x]ba = y(b2 − a2 ) + 3y2 (b − a) .
a
d
2. (2xy + 3y2 ) dy = [xy2 + y3 ]dc = x(d2 − c2 ) + (d3 − c3 ) .
c
Aparte de estas ‘integraciones parciales’, se define también la integral con respecto a

ambas variables x e y:
d b d b
b d

f (x, y) dx dy = f (x, y) dx dy = f (x, y) dy dx . (9.58)
c a c a a c
Esto se denomina integral doble y se calcula integrando primero con respecto a una
variable y luego con respecto a la otra. El valor de la integral no depende del orden
en el cual se haga la integración si la función es continua dentro de los intervalos de
integración, pero hay que tener cierto cuidado si hay discontinuidades.
EJEMPLO 9.29 Evalúe la integral (9.58) para f (x, y) = 2xy + 3y2 .

1. Integrando primero con respecto a x, utilizando el resultado del Ejemplo 9.28(i),
d b d
(2xy + 3y2 ) dx dy = y(b2 − a2 ) + 3y2 (b − a) dy
c a c
1
= (d2 − c2 )(b2 − a2 ) + (d3 − c3 )(b − a) .
2
2. Integrando primero con respecto a y, utilizando el resultado del Ejemplo 9.28(ii),
b d b
(2xy + 3y2 ) dy dx = x(d2 − c2 ) + (d3 − c3 ) dx
a c a
1
= (d2 − c2 )(b2 − a2 ) + (d3 − c3 )(b − a) .
2
Cuando no se especifica explı́citamente el orden de integración, hay que tener cuidado de

asociar cada pareja de lı́mites de integración con la variable apropiada. Ası́ por ejemplo,
si una integral triple se expresa como
f d b
I= f (x, y, z) dx dy dz
e c a
el convenio es que la integración ha de hacerse de dentro hacia afuera, siendo (a, b) los
lı́mites para x, (c, d) para y, y (e, f ) para z:
f d
b
I= f (x, y, z) dx dy dz .
e c a
Los conceptos y métodos de integración presentados en los Capı́tulos 5 y 6 para inte-

grales de una variable se aplican a las integrales múltiples con algunos cambios en la
interpretación. La integral doble se trata con cierto detalle en los apartados que siguen.
En el Capı́tulo 10 se considera el caso particular de la integral triple y su importancia
para describir sistemas fı́sicos en tres dimensiones.
9.10. La integral doble

La integral doble se puede definir como el lı́mite de una suma (doble), de la misma
forma en que definimos la integral de Riemann en el apartado 5.4. Sea f (x, y) una función
continua de x e y en una región rectangular del plano xy dada por a ≤ x ≤ b y c ≤ y ≤ d
(Figura 9.12).
Figura 9.12
Se divide el intervalo x = a → b en m subintervalos de ancho ∆xr = xr − xr−1 y el

intervalo y = c → d en n subintervalos de ancho ∆ys = ys − ys−1 . Esto es, se divide al
rectángulo en pequeños rectángulos de área ∆Ars = ∆xr ∆ys . La integral (9.58) se define
entonces como el lı́mite
9.10. La integral doble 247
d b
n

m
f (x, y) dx dy = lim
→∞ m
f (xr , ys )∆xr ∆ys (9.59)
c a n→∞
s=1 r=1
(si existe el lı́mite).

El doble sumatorio (9.59) puede hacerse en cualquier orden: bien sea como
m n

m
f (xr , ys )∆ys ∆xr = vr ∆xr , (9.60)

r=1 s=1 r=1
donde vr es la suma de los elementos para una franja vertical y luego se suman todas las
franjas verticales, o como
n m

n
f (xr , ys )∆xr ∆ys = hs ∆ys , (9.61)

s=1 r=1 s=1
donde hs es la suma de los elementos para una franja horizontal y luego se suman todas
las franjas horizontales. Esos dos órdenes de la suma corresponden a los dos órdenes de
integración de (9.58).
Ası́ como la integral de una variable se interpretó en el Apartado 5.4 como el área
bajo la curva, la integral doble puede interpretarse como el ‘volumen bajo la superficie’,
es decir, el volumen entre la superficie que representa a la función f (x, y) y el plano xy.9
De manera alternativa, la integral doble puede ser interpretada como una propiedad de la
región rectangular del plano xy. Por ejemplo, si f (x, y) es la densidad de masa superficial,
el diferencial de masa en el elemento de área dA = dx dy es dm = f (x, y)dA y la masa
total es
d b
M = f (x, y) dA = f (x, y) dx dy , (9.62)
R c a

donde R representa la integración sobre la región (rectangular). En el caso particular
f (x, y) = 1, la integral es el área del rectángulo:
d b b d
dA = dx dy = dx dy = (b − a)(d − c) .
R c a a c
En general, no es necesario que la región del plano xy sea rectangular. Sea f (x, y) continua
en el interior y en la frontera de una región R del plano xy.
La forma de la integral en la región depende de como se defina la frontera. En la
Figura 9.13a la frontera se compone de dos partes: y = g(x) ‘por debajo’ de los puntos
extremos x = a y x = b, e y = h(x) ‘por encima’ de esos puntos. El interior de R es
09. Clairaut trató la integral

doble como un volumen en sus Recherches de 1731. La notación con el
doble signo de integración ( ) fue empleada por primera vez por Lagrange en 1760.
entonces
g(x) ≤ y ≤ h(x) para a≤x≤b
y la integral sobre la región es (la suma de las franjas verticales)

b h(x)

I= f (x, y) dA = f (x, y) dy dx .
R a g(x) (9.63a)
En la Figura 9.13b la frontera se compone de las dos partes: x = p(y) ‘a la izquierda’

de los puntos extremos y = c e y = d, y x = q(y) ‘a la derecha’. El interior de R es
entonces
p(y) ≤ x ≤ q(y) para c≤y≤d
y la integral es (la suma de las franjas horizontales)

d q(y)

I= f (x, y) dA = f (x, y) dx dy .
R c p(y) (9.63b)
Figura 9.13
EJEMPLO 9.30 Evalúe

√ la integral de f (x, y) = 1 + 2xy en la región R acotada por la recta y = x y la
curva y = x2 (o x = y), como en la Figura 9.14. Calcule también el área de R.
(i) utilizando la ecuación (9.63a) con g(x) = x2 y h(x) = x,

1 x
I = 0
(1 + 2xy) dy dx
x2
1 1
= 0
[y + xy2 ]xx2 dx = 0 [x + x3 − x2 − x5 ] dx
= 1
4
.
Figura 9.14
9.11. Cambio de variables 249
√
(ii) utilizando la ecuación (9.63b) con p(y) = y y q(y) = y,
1 √
y
I = (1 + 2xy) dx dy
0 y

1 √
y
1
√ 1
= [x + x2 y]y dy = [ y + y2 − y − y3 ] dy = .
0 0 4
El área de la región R es
1 x 1
1
A= dy dx = (x − x2 ) dx = .
0 x2 0 6
9.11. Cambio de variables

Vimos en el Apartado 6.3 que uno de los métodos generales principales para evaluar
integrales es el método de sustitución, en el cual, dada una integral definida en la variable
x, se puede introducir una nueva variable de integración tomando
dx
x = x(u) , dx = du ,
du
de manera que
b u(b)
dx
f (x) dx = f (x(u)) du .
a u(a) du
Los cambios de variable son incluso más importantes para integrales dobles (y múltiples)
porque tanto la función como la frontera de la región pueden ser fuentes de dificultades si
se expresan en variables inadecuadas. Consideremos por ejemplo la integral de f (x, y) =
/
e−(x +y ) en una región circular (Figura 9.15).
2 2 1 2
Figura 9.15
Por la ecuación (9.63a),

a
√
+ a2 −x2

−(x2 +y2 )1/2
I= f (x, y) dA = √
e dy dx . (9.64)
R −a − a2 −x2
En este ejemplo, tanto la función como la frontera se expresan de manera más sencilla
mediante coordenadas polares (r, θ). En efecto,
f (x, y) = f (r cos θ, r sen θ) = e−r ,
y la ecuación del cı́rculo de radio a es r = a. Es sensato por lo

tanto hacer el cambio a coordenadas polares
x = r cos θ , y = r sen θ .
El correspondiente elemento de área, dA, se puede deducir de

la Figura 9.16. La región sombreada tiene área
1
∆A = r∆r∆θ + (∆r)2 ∆θ
2 Figura 9.16
de manera que, para cantidades infinitesimales, dA = r dr dθ. Tenemos entonces

f (x, y) dx dy = f (r cos θ, r sen θ) r dr dθ . (9.65)
R R
La integral (9.64) es por lo tanto

2π a 2π a
I= e r dr dθ =
−r
dθ × e−r r dr = 2π[1 − e−a (a + 1)] .
0 0 0 0
2
EJEMPLO 9.31 Evalúe la integral de f (r, θ) = e−r sen2 θ, (i) en el área de un cı́rculo de radio a y (ii) en
todo el plano.
2π a
2 2
(i) e−r sen2 θ dA = e−r sen2 θ r dr dθ .
R 0 0
Por ser la integral el producto de una función de r y de una de θ
2 2
e−r sen2 θ r = (e−r r)( sen2 θ) ,
y por ser los lı́mites de integración constantes, la integral doble se puede factorizar:
a 2π
2
I= e−r r dr × sen2 θ dθ .
0 0
Como sen θ =
2 1
2
(1 − cos 2θ), tenemos
2π 2π
1 1 1
sen2 θ dθ = (1 − cos 2θ) dθ = [θ − sen 2θ]2π
0 = π,
0 2 0 2 2
y, por otra parte, haciendo el cambio u = r2 , du = 2r dr,

a a2
2 1 1 2 1 2
e−r r dr = e−u du = [ − e−u ]a0 = (1 − e−a ) .
0 2 0 2 2
9.11. Cambio de variables 251
π 2
Por lo tanto I = (1 − e−a ) .
2
2π ∞
2 π
(ii) Tomando a → ∞, e−r sen2 θ r dr dθ = .
0 0 2
Caso general
El paso de coordenadas cartesianas a polares es un caso particular de transformación
de variables (o de coordenadas). Es también el más importante en la práctica, y aquı́ sólo
daremos una escueta presentación del caso general. Sean
x = x(u, v) , y = y(u, v) , (9.66)
funciones continuas y derivables de las variables u y v, de manera que a cada punto (x, y)
de una región R del plano xy le corresponde un único punto (u, v) en la correspondiente
región R∗ del plano uv. Entonces

f (x, y) dx dy = f x(u, v), y(u, v) |J| du dv , (9.67)
R R∗
donde |J| es el módulo del jacobiano de la transformación,10
∂(x, y) ∂x ∂y ∂x ∂y
J= = − . (9.68)
∂(u, v) ∂u ∂v ∂v ∂u
Por ejemplo, si x = r cos θ e y = r sen θ, entonces
∂x ∂y ∂x ∂y
J= − = r cos2 θ + r sen2 θ = r
∂r ∂θ ∂θ ∂r
y dA = dxdy → dA = r dr dθ, como obtuvimos por consideraciones geométricas a partir
de la Figura 9.16. El jacobiano se emplea en la formulación avanzada de la termodinámi-
ca para los cambios de variables termodinámicas. El método puede generalizarse a tres
variables o más.
∞
e−x dx
2
La integral
0
En el Ejemplo 6.16 del Apartado 6.5 se dijo que esta integral no se podı́a evaluar con
los métodos descritos en los Capı́tulos 5 y 6. Sin embargo, se puede evaluar utilizando un
‘truco’ que implica el paso de una integral doble de coordenadas cartesianas a polares.11
010. Carl Gustav Jacobi (1804-1851), nacido en Berlı́n, trató las cantidades llamadas jacobianos en
su De determinantibus functionalibus (Sobre determinantes funcionales) de 1841. El cambio de variables
en una integral doble fue dado por Euler para el caso general en 1769.
011. De Moivre calculó la integral por vez primera en 1733. Laplace, siguiendo a Euler, utilizó en
1774 el método que describimos aquı́.
Tenemos que
∞ ∞
1
I= −x2
dx = e−x dx
2
e
0 2 −∞
por ser el integrando una función par de x (véase el Apartado 5.3). Además

1 ∞ −y
I=
2
e dy ,
2 −∞
ya que el valor de una integral definida no depende del sı́mbolo que se emplee como
variable de integración. Por lo tanto
∞
1 ∞ −x 1 ∞ ∞ −(x +y )
I = e dy =
−y
2 2 2 2
2
e dx e dx dy
4 −∞ −∞ 4 −∞ −∞
y la integral doble es sobre todo el plano xy. Transformando a coordenadas polares tene-
mos entonces
∞
1 2π ∞ −r 1 2π π
I2 = e r dr dθ = e−r r dr = .
2 2
dθ
4 0 0 4 0 0 4
Por lo tanto
∞ √
π
−x2
e dx = . (9.69)
0 2
9.12. Ejercicios
Apartado 9.2
1. Halle el valor de la función f (x, y) = 2x2 + 3xy − y2 + 2x − 3y + 4 para
(i) (x, y) = (0, 1) (ii) (x, y) = (2, 0) (iii) (x, y) = (3, 2).
2. Halle el valor de f (r, θ, φ) = r2 sen2 θ cos2 φ + 2 cos2 θ − r3 sen 2θ sen φ para

(i) (r, θ, φ) = (1, π/2, 0) (ii) (r, θ, φ) = (2, π/4, π/6) (iii) (r, θ, φ) = (0, π, π/3).
Apartado 9.3
∂z ∂z
Halle y :
∂x ∂y
3. z = 2x2 − y2 4. z = x2 + 2y2 − 3x + 2y + 3 5. z = e2x+3y

2
6. z = sen (x2 − y2 ) 7. z = ex cos (xy)
Halle todas las derivadas primeras y segundas:
8. z = 2x2 y + cos (x + y) 9. z = sen (x + y)ex−y

Demuestre que fxy = fyx :

xy
10. f = x3 − 3x2 y + y3 11. f = x2 cos (y − x) 12. f =
x 2 + y2
Demuestre que fxyz = fyzx = fzxy :
13. f = cos (x + 2y + 3z) 14. f = xyeyz

∂r ∂r ∂r
15. Si r = (x2 + y2 + z2 )1/2 , halle , , .
∂x ∂y ∂z
∂2φ 1 ∂2φ
16. Si φ = f (x − ct) + g(x + ct), con c una constante, demuestre que = 2 2.
∂x 2 c ∂t
∂y
17. Si xyz + x2 + y2 + z2 = 0, halle .
∂x z

∂Y ∂V
18. Halle y para la ecuación de van der Waals
∂T p, n ∂p T, n

n2 a
p+ (V − nb) − nRT = 0 .
V2
Apartado 9.4
Halle los puntos estacionarios, y su naturaleza, para las siguientes funciones:
19. 2x2 − 4xy + y2 + 4x − 2 20. 3 − x2 − xy − y2 + 2y

21. x + y − 3x − 4y + 2
3 2
22. 4x3 − 3x2 y + y3 − 9y
23. Halle el valor estacionario de la función 2x2 + 3y2 + 6z2 sujeta a la ligadura x + y + z = 1.
24. Halle los valores estacionarios de la función (x − 1)2 + (y − 2)2 + (z − 2)2 sujeta a la ligadura
x2 + y2 + z2 = 1. Confirme que se trata de las distancias más corta y más larga de los puntos de la esfera
x2 + y2 + z2 = 1 al punto (1, 2, 2).
25. Demuestre que el problema de hallar los valores estacionarios de la función
E(x, y, z) = α(x2 + y2 + z2 ) + 2β(xy + yz + zx)
sujeta a la ligadura x2 + y2 + z2 = 1 (siendo α y β constantes) es equivalente a resolver las ecuaciones

seculares
(α − λ)x + βy = 0,
βx + (α − λ)y + βz = 0,
βy + (α − λ)z = 0 .
Estas ecuaciones tienen solución para tres posibles valores de los multiplicadores de Lagrange:
√ √
λ1 = α , λ2 = α + 2β , λ3 = α − 2β .
(i) Halle el punto estacionario que corresponde a cada uno de los valores de λ (suponga que z es positivo).
(ii) Demuestre que los tres valores estacionarios de la función E son iguales a los correspondientes valores
de λ.
(Este es el problema de Hückel para el radical alilo, CH2 CHCH2 . Véase también el Ejemplo 17.9.)
Apartado 9.5
Halle el diferencial total df :
1
26. f (x, y) = x2 + y2 27. f (x, y, z) =
x2 + y2 + z2
28. f (r, θ, φ) = r sen θ sen φ
Apartado 9.6
dz
29. Dada z = x2 + 2xy + 3y2 , con x = (1 + t)1/2 e y = (1 − t)1/2 , halle
dt
(i) por sustitución, (ii) por la regla de la cadena (9.21).
du
30. Dada u = ln (x + y + z), con x = a cos t, y = b sen t y z = ct, halle .
dt
df
31. Dada f = sen (u + v), con v = cos u, halle .
du
∂y
32. Si z = x5 y − sen y, halle .
∂x z

∂p
33. Halle para un gas de van der Waals
∂T V, n

∂V ∂V
(i) a partir de las expresiones para y obtenidas en el Ejercicio 18,
∂T p, n ∂p T, n
(ii) directamente a partir de la ecuación de van der Waals.

∂z
34. Si z = x2 + y2 y u = xy, halle (i) por sustitución (ii) por la ecuación (9.30).
∂y u
∂z
35. Sean z = x sen y y u = x + 2xy + 3y , halle
2 2
.
∂y u
36. Si U = U(V, T) y p = p(V, T) son funciones of V y T, y si H = U + pV, demuestre que

∂H ∂U ∂U ∂V
− = +p .
∂T p ∂T V ∂V T ∂T p

∂x ∂y
37. Si x = un + vn e y = un − vn , donde n es una constante arbitraria, halle y .
∂u v ∂v u
∂u ∂v
Expresando un y vn en función de x e y, halle y , y demuestre que
∂x y ∂y x

∂x ∂u 1 ∂y ∂v
= = .
∂u v ∂x y 2 ∂v u ∂y x
∂f ∂f
38. Si x = au + bv e y = bu − av, siendo a y b constantes, y f es una función de x e y, exprese y
∂u ∂v
∂f ∂f
en función de y . Demuestre entonces que
∂x ∂y
∂2f ∂2f ∂2f ∂2f

∂2f

∂2f ∂2f
∂2f
+ = a2
+ b2
+ , = ab − 2 + b2 − a2 .
∂u2 ∂v2 ∂x2 ∂y2 ∂u∂v ∂x 2 ∂y ∂x∂y
Demuestre que las siguientes funciones de la posición en un plano cumplen la ecuación de Laplace:

B
39. x5 − 10x3 y2 + 5xy4 40. Ar + eiθ 41. rn cos nθ, n = 1, 2, 3 . . .
r
Apartado 9.7
Estudie la exactitud:
42. (4x + 3y) dx + (3x + 8y) dy 43. (6x + 5y + 7) dx + (4x + 10y + 8) dy

44. y cos x dx + sen x dy
∂S ∂V
45. Dado el diferencial total dG = −S dT + Vdp, demuestre que =− .
∂p T ∂T p
Apartado 9.8

46. Evalúe la integral de lı́nea [xy dx + 2y dy] desde x = 0 hasta x = 2
C
(i) sobre la recta y = 2x (ii) sobre la curva y = x2 .
47. Demuestre que Fdx + Gdy, con F = 9x2 + 4y2 + 4xy y G = 8xy + 2x2 + 3y2 , es un diferencial
exacto. Escogiendo un camino adecuado, evalúe la integral [F dx + G dy] desde (x, y) = (0, 0) hasta
C
(1, 2). Demuestre que el resultado es consistente con que el diferencial sea el diferencial total de z(x, y) =
3x3 + 4xy2 + 2x2 y + y3 .
48. Integre f (x, y) = x2 − y2 sobre la recta y = 2x entre x = 0 y x = 1.
Apartados 9.9 y 9.10

3 2
49. Evalúe la integral x2 y + xy2 dx dy y demuestre que el resultado es independiente del orden
0 1
de integración.
π R
50. Evalúe la integral e−r cos2 θ sen θ dr dθ.
0 0
Evalúe la integral y esboce la región de integración:

2 2x a √a2 −x2
51. x +y
2 2
dy dx 52. xy2 dy dx
0 x 0 0
53. A partir del dibujo de la región de integración, demuestre que
2 (2−y)/2 1 2−2x 0 (x+4)/2
x3 dx dy = x3 dy dx + x3 dy dx .
0 2y−4 0 0 −4 0
Evalúe la integral.
Apartado 9.11
Transforme a coordenadas polares y evalúe:
1 √1−x2 ∞ ∞ 3
e−2(x )
2 +y2 1/2
54. x2 + 2xy dy dx 55. x 2 + y2 dx dy
0 0 −∞ −∞
∞ ∞
e−(x +y2 ) 2
2
56. x dx dy
0 0
Funciones en tres dimensiones
10.1. Conceptos
Una función de tres variables, f (x, y, z), en la cual las variables son las coordenadas
de un punto en el espacio ordinario tridimensional, se denomina función de posición,
función del punto o campo. Un gran número de cantidades fı́sicas se describen median-
te estas funciones. Por ejemplo, la distribución de masas en un cuerpo se describe por
la densidad de masa (volumétrica), que es una función de posición. La temperatura en
cada punto de un cuerpo define un campo de temperaturas y la velocidad de cada punto
de una masa de fluido en movimiento es una función vectorial de posición, un campo
de velocidades (véase el Capı́tulo 16). Los campos eléctricos y magnéticos son funcio-
nes de posición vectoriales, las funciones de onda atómicas y moleculares son funciones
escalares de posición.
Cuando escribimos una función de posición en la forma f (x, y, z) estamos suponiendo
que se trata de una función de las coordenadas cartesianas de un punto.1 Sin embargo,
el valor de una función en un punto no puede depender del sistema de coordenadas que
se use en concreto para especificar su posición. Vimos en el Capı́tulo 9 para puntos en
un plano que una función y la región donde está definida pueden a veces (de hecho, a
menudo) expresarse de manera mucho más sencilla usando coordenadas distintas de las
cartesianas. Las coordenadas más importantes y más ampliamente utilizadas, aparte de
las cartesianas, son las coordenadas esféricas. Las presentamos en el Apartado 10.2. En
01. La geometrı́a analı́tica en tres dimensiones tiene su origen en las Recherches de Clairaut de 1731,
en las cuales dio x2 + y2 + z2 = a2 como la ecuación de una esfera de radio a, y en el segundo volumen de
la Introductio de Euler de 1748. La teorı́a sistemática fue desarrollada por Monge en artı́culos desde 1771
y en dos influyentes libros que escribió para sus alumnos de la École Polytechnique. Gaspar Monge (1746-
1818), hijo de Jacques Monge, buhonero y afilador que valoraba la educación, desarrolló una ‘geometrı́a
descriptiva’ que constituyó la base del dibujo moderno en ingenierı́a. El método fue considerado secreto
militar durante un tiempo y publicado en 1799 en el libro de texto Géométrie descriptive. Monge fue el pri-
mer Director de la École Polytechnique fundada en 1794 por la convención Nacional de la Revolución para
adiestrar ingenieros y cientı́ficos (que demostrasen ‘un amor constante a la libertad, la igualdad y el odio a
los tiranos’). La École se convirtió en un modelo universitario en toda Europa y Estados Unidos. Algunos de
los profesores de la École fueron Laplace, Lagrange y Sylvestre François Lacroix (1765-1843), cuyo libro
de texto de cálculo fue traducido al inglés en 1816 y contribuyó (junto con otros textos de la École) a intro-
ducir los métodos europeos en Inglaterra y los Estados Unidos. En el libro de texto Application de l’analyse
à la géométrie, 1807, Monge trató la geometrı́a analı́tica en dos y tres dimensiones. Demostró cómo las
coordenadas de un punto se determinan por las perpendiculares a tres planos coordenados.
258 Capı́tulo 10. Funciones en tres dimensiones
el Apartado 10.3 tratamos las funciones de posición y en 10.4 las integrales de volumen.
El operador laplaciano, tan importante en las ciencias fı́sicas, lo tratamos en el Apartado
10.5. En todos estos apartados nos limitamos al uso de sistemas de coordenadas carte-
sianas y esféricas. El sistema de coordenadas general es el tema del Apartado 10.6. En
los Capı́tulos 16, 18 y 19, tratamos el uso de vectores y matrices para describir sistemas
y procesos en tres dimensiones.
10.2. Coordenadas esféricas

La posición de un punto en un espacio tridimensional queda especificada de manera
única por sus tres coordenadas en un sistema de coordenadas dado. En el sistema car-
tesiano de la Figura 10.1 la posición del punto P se especifica por la tripleta ordenada
(x, y, z), las coordenadas cartesianas. La coordenada x es la distancia de P al plano yz, y
es la distancia al plano zx, y z es la distancia al plano xy.
A partir del sistema cartesiano se definen normalmente otros sistemas coordenados. En la Figura 10.2 se
muestra el sistema de coordenadas esféricas. La distancia r del punto al origen se llama coordenada radial.
Sus valores posibles van desde 0 a +∞. El ángulo θ, la colatitud, es el ángulo entre la recta radial OP y
el eje z. Sus valores posibles van de 0 a π. En este contexto, el eje z se llama eje polar. El ángulo φ, la
longitud, es el ángulo entre el eje x y la recta OQ, proyección de OP sobre el plano xy. Sus valores posibles
van de 0 a 2π. Los cambios en φ describen giros en torno al eje polar. Las coordenadas esféricas y las
cartesianas se relacionan mediante las ecuaciones
x = r sen θ cos φ , y = r sen θ sen φ , z = r cos θ . (10.1)
Al igual que para las coordenadas polares en el plano (Apartado 3.3), convertir las coordenadas esféricas a
cartesianas es inmediato.
EJEMPLO 10.1 Halle las coordenadas cartesianas del punto cuyas coordenadas esféricas son (r, θ, φ) =
(2, π/6, π/4).
√
x = r sen θ cos φ = 2 sen (π/6) cos (π/4) = 1/ 2 ,
√
y = r sen θ sen φ = 2 sen (π/6) sen (π/4) = 1/ 2 ,
√
z = r cos θ = 2 cos (π/6) = 3 .
10.3. Funciones de posición 259
La conversión de coordenadas cartesianas a coordenadas esféricas se hace mediante las siguientes relacio-
nes: ⎧
z ⎨ arctg xy si x > 0,
r = x + y + z , θ = arccos
2 2 2 2
, φ= y (10.2)
r ⎩ arctg + π si x < 0,
x
donde se toman los valores principales para las funciones inversas (véase el Apartado 3.4).
EJEMPLO 10.2 Halle las coordenadas esféricas del punto (x, y, z) = (– 1, 2, −3).
√
r2 = x2 + y2 + z2 = 14, 14 , r=
√
θ = arccos (z/r) = arccos (– 3/ 14) ≈ 143,3◦ ,
φ = arctg (y/x) + π = arctg (– 2) + π ≈ 116,6◦ .
10.3. Funciones de posición

Una función de posición, o campo, es una función de las tres coordenadas en alguna región del espacio
tridimensional. En la Figura 10.3, sea V (por volumen) una región que representa, por ejemplo, un cuerpo
con temperatura no uniforme: la temperatura es una función de posición
T = f (x, y, z) .
Entonces, si las coordenadas cartesianas del punto P son
(xP , yP , zP ), la temperatura en ese punto es
T = f (xP , yP , zP ) .
Por ejemplo, si f (x, y, z) = z2 − x2 − y2 tenemos que
TP = z2P − x2P − y2P .
La temperatura en un punto no puede depender del sistema de

coordenadas que se use en concreto para especificar la posición
del punto. Si las coordenadas esféricas de P son (rP , θP , φP ) en-
tonces, por las ecuaciones (10.1), Figura 10.3
TP = rP cos θP − rP sen θP cos φP − rP sen θP sen φP = rP ( cos2 θP − sen2 θP ) .

2 2 2 2 2 2 2 2 2
El campo de temperaturas se describe por lo tanto igual de bien usando la función g(r, θ, φ) =
= r2 ( cos2 θ − sen2 θ) tal que, en cualquier punto de V,
T = f (x, y, z) = g(r, θ, φ) .
En este ejemplo, el paso de coordenadas cartesianas a coordenadas esféricas ha supuesto dos simplificacio-
nes en la representación del campo. La primera: mientras que T depende de las tres coordenadas cartesianas,
x, y y z, sólo depende de dos coordenadas esféricas, r y θ; esto es, el campo es independiente del valor del
ángulo φ, y tiene por lo tanto simetrı́a cilı́ndrica en torno al eje polar (z). La segunda simplificación es
que las variables de la función g han sido separadas, es decir, la función g(r, θ) ha sido factorizada como
el producto de una función de r y una función de θ. Estas simplificaciones son importantes para evaluar
integrales múltiples y para resolver ecuaciones en derivadas parciales.
Funciones de densidad
Consideremos la distribución de masa en un cuerpo tridimensional (véase el Apartado 5.6 para una
distribución lineal de masa). Sea P un punto cualquiera del cuerpo, y sea ∆m la masa de un volumen ∆v
alrededor del punto P, como se muestra en la Figura 10.4. El cociente ∆m/∆v es la masa por unidad de
volumen, o densidad de masa promedio, en ∆v. Si la masa no está distribuida de manera uniforme por todo
el cuerpo, el valor de este cociente depende no sólo de la posición del volumen ∆v sino también del tamaño
y forma de ∆v. A medida que las dimensiones del volumen se reducen a cero, ∆v → 0, el cociente se
acerca al lı́mite ∆m
ρ = lim , (10.3)
∆v→0 ∆v
Figura 10.4
y el valor de ese lı́mite es la densidad en el punto P. Señalamos que aunque ρ se define

como el lı́mite de un cociente, no es una derivada en el sentido normal. Podemos sin
embargo considerar el diferencial de masa dm = ρ dv en el elemento de volumen dv. La
masa total del cuerpo es entonces la integral sobre el volumen del cuerpo

M = dm = ρ dv . (10.4)
V V
En el Apartado 10.4 tratamos estas integrales triples, o integrales de volumen, en las tres
coordenadas del espacio.
La idea de densidad se aplica a cualquier propiedad distribuida en una región. Un
ejemplo importante es la densidad de probabilidad de una distribución en teorı́a de pro-
babilidades y en estadı́stica, que tratamos en el Capı́tulo 21. Las densidades de probabi-
lidad se usan también en mecánica cuántica para interpretar las funciones de onda y para
el cálculo de las propiedades de átomos y moléculas.
EJEMPLO 10.3 Orbitales atómicos y densidad de probabilidad electrónica

La solución de la ecuación de Schrödinger para un átomo, los orbitales atómicos, se expresan casi siempre
en coordenadas esféricas. En la Tabla 10.1 se enumeran algunos de los orbitales para el átomo de hidrógeno
(a0 es el radio de Bohr). Cada orbital es el producto de tres funciones, una por cada coordenada:
ψ(r, θ, φ) = R(r) · Θ(θ) · Φ(φ) (10.5)
La función radial R(r) determina el tamaño del orbital y el movimiento radial (‘de adentro hacia afuera’) del
electrón en el orbital. Las funciones angulares Θ(θ) y Φ(φ) determinan la forma del orbital y el movimiento
angular del electrón (su momento angular). Veremos estas funciones con más detalle en el Capı́tulo 14.
10.4. Integrales de volumen 261
Tabla 10.1 Orbitales atómicos para el átomo de hidrógeno
1
ψ1s = e−r/a0
πa30
1
ψ2s = (2 − r/a0 )e−r/2a0
4 2πa30
1
ψ2px = re−r/2a0 sen θ cos φ
4 2πa50
1
ψ2py = re−r/2a0 sen θ sen φ
4 2πa50
1
ψ2pz = re−r/2a0 cos θ
4 2πa50
La interpretación fı́sica de un orbital se hace usando la densidad de probabilidad electrónica: para un elec-
trón en el orbital ψ, la cantidad
|ψ(r, θ, φ)|2 dv (10.6)
se interpreta como la probabilidad de hallar el electrón en el elemento de volumen dv en la posición (r, θ, φ).
El módulo cuadrado, |ψ|2 = ψψ ∗ , se utiliza porque las funciones de onda son en general funciones com-

plejas. La probabilidad de hallar el electrón en una región V es entonces la integral de volumen V |ψ|2 dv.
10.4. Integrales de volumen

Una integral triple tiene la forma general
z y 2 2 x2
f (x, y, z) dv = f (x, y, z) dx dy dz , (10.7)

V z1 y1 x1
donde V es una región en el espacio xyz. Cuando las variables son las coordenadas de
un punto en el espacio ordinario la integral se llama a menudo integral de volumen. Si
los lı́mites de integración de (10.7) son constantes, la región V es una caja rectangular
de lados x2 − x1 , y2 − y1 , z2 − z1 .
EJEMPLO 10.4 Evalúe la integral de la función f (x, y, z) = 1 + xyz en la caja rectangular de lados a, b, c
que se muestra en la Figura 10.5.
La integral (10.7) es

f (x, y, z) dv = dv + xyz dv .
V V V
Tenemos entonces
c b a a b c
(i) dv = dx dy dz = dx dy dz
V 0 0 0 0 0 0
= a×b×c=V.
Figura 10.5
Este resultado es general: la integral V

dv es el volumen de la región V.
c b a a b z
(ii) xyz dv = xyz dx dy dz = x dx y dy z dz .
V 0 0 0 0 0 0
La factorización de la integral tripe es posible porque el integrando es el producto de tres funciones, una en
cada variable, y los lı́mites son constantes (véase el Ejemplo 9.31). Con esto

a2 b2 c2 V2
xyz dv = × × = .
V 2 2 2 8
Coordenadas esféricas
La integral de volumen en coordenadas esféricas es

f (r, θ, φ) dv =
φ θ r
V
2 2 2
f (r, θ, φ) r2 sen θ dr dθ dφ . (10.8)

φ1 θ1 r1
Utilizando la Figura 10.6, interpretamos la

forma del elemento de volumen
dv = r2 sen θ dr dθ dφ . (10.9)
La región ∆v es una sección de un casque-

te esférico de espesor ∆r entre los radios
r y r + ∆r, los ángulos θ y θ + ∆θ, y φ y
∆φ. Puede demostrarse (véase el Ejemplo
10.5) que el volumen de la región es
Figura 10.6
1
∆v = r2 ∆r + r(∆r)2 + (∆r)3 cos θ − cos (θ + ∆θ) ∆φ .
3
Para valores pequeños de los incremen-
tos ∆, este volumen es aproximadamente
igual al volumen de una caja rectangular
de lados ∆r, r∆θ y r sen θ∆φ,
∆v ≈ r2 sen θ ∆r ∆θ ∆φ , (10.10)
y el elemento de volumen (10.9) se obtiene para cantidades infinitesimales.

10.4. Integrales de volumen 263
EJEMPLO 10.5 Halle el volumen ∆v de la Figura 10.6 y demuestre que se reduce a la expresión aproxi-
mada (10.10) para valores pequeños de los ∆.
φ+∆φ θ+∆θ r+∆r

∆v = r2 sen θ dr dθ dφ
φ θ r
r+∆r θ+∆θ φ+∆φ r3 r+∆r θ+∆θ φ+∆φ
= r2 dr sen θ dθ dφ = − cos θ φ
r φ θ 3 r θ φ
1
= [r2 ∆r + r(∆r)2 + (∆r)3 ][ cos θ − cos (θ + ∆θ)]∆φ .
3
Si ∆r es suficientemente pequeño, se pueden despreciar los términos en (∆r)2 y en (∆r)3 . Si ∆θ es pe-

queño,
cos (θ + ∆θ) = cos θ cos ∆θ − sen θ sen ∆θ ≈ cos θ − sen θ∆θ ,
ya que cos ∆θ → 1 y sen ∆θ → ∆θ cuando ∆θ → 0. Por lo tanto, para valores pequeños de los incremen-
tos ∆,
∆v ≈ r2 sen θ ∆r ∆θ ∆φ .
Hay que señalar que esto no supone una demostración de (10.9) puesto que el elemento de volumen se
utiliza para la construcción de la integral de volumen.
EJEMPLO 10.6 Evalúe la integral de la función f (r, θ, φ) = 1 + r2 cos2 θ sen2 φ en la esfera de radio a y
centro en el origen.
La integral puede calcularse separándola en dos partes, como en el Ejemplo 10.4:

f dv = dv + r2 cos2 θ sen2 φ dv .
V V V
Los intervalos de integración son r = 0 → a, θ = 0 → π, y φ = 0 → 2π. Entonces

2π π a
(i) dv = r2 sen θ dr dθ dφ
V 0 0 0
a π 2π
a3 4
= 2
r dr sen θ dθ dφ = × 2 × 2π = πa3 ,
0 0 0 3 3
que es el volumen de la esfera.

2π π a
(ii) r2 cos2 θ sen2 φ dv = r4 cos2 θ sen θ sen2 φ dr dθ dφ
V 0 0 0
a π 2π
= r4 dr cos2 θ sen θ dθ sen2 φ dφ
0 0 0
5
a 2
= × ×π.
5 3
Integrales en todo el espacio

Cuando la región V es todo el espacio tridimensional la integral de volumen es
+∞ +∞ +∞
f dv = f (x, y, z) dx dy dz en cartesianas, (10.11)

V −∞ −∞ −∞
2π π ∞
= f (r, θ, φ)r2 sen θ dr dθ dφ en esféricas. (10.12)

0 0 0
Estas integrales son importantes, por ejemplo, en quı́mica cuántica para calcular propie-
dades atómicas y moleculares a partir de funciones de onda obtenidas como soluciones
de la ecuación de Schrödinger. Por ejemplo, la integral en todo el espacio de la densidad
de probabilidad electrónica del orbital 1s del átomo de hidrógeno, ψ1s2 = (1/πa30 )e−2r/a 0
(véase la Tabla 10.1), es

2π π ∞
1
ψ dv =
2
e−2r/a r2 sen θ dr dθ dφ 0
1s
πa30 0
∞ π 2π
0 0
1
= e−2r/a 2
r dr sen θ dθ dφ .
0
πa30 0 0 0
La integral de la parte angular

π 2π
sen θ dθ dφ = 4π (10.13)
0 0
es
∞el ángulo sólido completo en torno a un punto. Entonces, utilizando la integral estándar
e−ar rn dr = n!/an+1 ,
0

1 2
ψ1s2 dv = × × 4π = 1 .
πa0 (2/a0 )3
3
Este resultado es consistente con la interpretación (véase el comentario de la ecuación

(10.6)) de |ψ|2 dv como la probabilidad de hallar el electrón en el elemento dv. La proba-
bilidad total, la de hallar el electrón en alguna parte, es la integral en todo el espacio, y
tiene que ser la unidad. De hecho, los coeficientes de la Tabla 10.1 se escogen para que
eso sea cierto. Se dice que los orbitales están normalizados (a la unidad).
Valores promedio
Veremos en el Capı́tulo 21 que, si x es una variable continua en el intervalo a ≤ x ≤ b
y si p(x) dx es la probabilidad de que la variable tome valores entre x y x + dx, la cantidad
b
f̄ = f (x)p(x) dx (10.14)
a
10.5. El operador laplaciano 265
es el valor promedio de la función f (x) en el intervalo. La generalización a funciones

de más de una variable implica la correspondiente integral múltiple. Por ejemplo, sea
f (x, y, z) una función de posición en tres dimensiones, y sea p(x, y, z)dx dy dz la probabi-
lidad de que la coordenada x tome valores entre x y x + dx, de que la coordenada y tome
valores entre y y y + dy, y de que la coordenada z tome valores entre z y z + dz. El valor
promedio de la función es entonces la integral de volumen en todo el espacio
+∞ +∞ +∞
f̄ = f (x, y, z) p(x, y, z)dx dy dz . (10.15)

−∞ −∞ −∞
La expresión correspondiente en coordenadas esféricas es

2π π ∞
f̄ = f (r, θ, φ) p(r, θ, φ)r2 sen θ dr dθ dφ . (10.16)

0 0 0
En mecánica cuántica, si la densidad de probabilidad es el módulo cuadrado de una

función de onda, p = |ψ|2 , el valor promedio

f̄ = f |ψ|2 dv (10.17)
se suele llamar el valor esperado de f en el estado ψ.
EJEMPLO 10.7 Halle la distancia promedio del electrón al núcleo para (i) el orbital 1s y (ii) para el
orbital 2pz del átomo de hidrógeno (véase la Tabla 10.1 del Ejemplo 10.3).
Para ambos casos, f (r, θ, φ) = r en la ecuación (10.17), y

r̄ = r|ψ|2 dv .
1 −2r/a0
(i) ψ1s
2
= e ,
πa30
2π π ∞
1
r̄1s = e−2r/a0 r3 sen θ dr dθ dφ
πa30 0 0 0
y tras integrar la parte angular (véase la ecuación (10.13)),

∞
4 4 3! 3
r̄1s = e−2r/a0 r3 dr = × = a0 .
πa30 0 a30 (2/a0 )4 2
1
(ii) ψ2p
2
= r2 e−r/a0 cos2 θ,
z
32πa50
∞ π 2π
1 5 −r/a0
r̄2pz = r e dr cos 2
θ sen θ dθ dφ
32πa50 0 0 0
1 2
= × 5! a60 × × 2π = 5a0 .
32πa50 3
10.5. El operador laplaciano

En el Apartado 9.6 vimos el operador laplaciano en dos dimensiones. El operador en
tres dimensiones es
en coordenadas cartesianas:
∂2 ∂2 ∂2
∇2 = + 2+ 2, (10.18)
∂x 2
∂y ∂z
en coordenadas esféricas:
1 ∂ 2 ∂ 1 ∂ ∂ 1 ∂2
∇2 = r + sen θ + 2
r ∂r
2
∂r r sen θ ∂θ
2
∂θ r sen θ ∂φ2
2 (10.19a)
∂2 2 ∂ 1 ∂2 cos θ ∂ 1 ∂2
= + + + + .
∂r2 r ∂r r2 ∂θ2 r2 sen θ ∂θ r2 sen2 θ ∂φ2 (10.19b)
La transformación de coordenadas cartesianas a esféricas se consigue de la misma mane-

ra que para el caso bidimensional descrito en el Ejemplo 9.18. En coordenadas esféricas
se suele escribir el operador en la forma más compacta (10.19a), mientras que la forma
desarrollada (10.19b) se obtiene usando la regla de derivación del producto. Por ejem-
plo,
1 ∂ 2 ∂f 1 2 ∂2f ∂f ∂ 2 f 2 ∂f
r = r + 2r = 2+ . (10.20)
r2 ∂r ∂r r2 ∂r2 ∂r ∂r r ∂r
El operador laplaciano aparece en ecuaciones del movimiento relacionadas con la pro-
pagación de ondas y la teorı́a del potencial tanto en mecánica clásica (por ejemplo en las
ecuaciones de Maxwell del electromagnetismo) como en mecánica cuántica (por ejem-
plo en la mecánica ondulatoria de Schrödinger, véase el Capı́tulo 14).
EJEMPLO 10.8 Evalúe ∇2 f para f = e−r (i) en coordenadas esféricas y (ii) en coordenadas cartesianas.
1. Como la función f sólo depende de la coordenada radial, se deduce que

∂f ∂f ∂f df ∂2f d2 f
= 0, = 0, = = −e−r , = = e−r .
∂θ ∂φ ∂r dr ∂r2 dr2
Entonces
d2 f 2 df 2 2
∇2 f = + = e−r − e−r = 1− e−r .
dr2 r dr r r
2. En coordenadas cartesianas,
∂2f ∂2f ∂2f
∇2 f = + 2 + ,
∂x2 ∂y ∂z2
∂r x ∂r y ∂r z
r = (x2 + y2 + z2 )1/2 , = , = , = .
∂x r ∂y r ∂z r
Entonces, por la regla de la cadena,

∂f df ∂r x df ∂2f ∂ x df 1 df x2 df x2 d 2 f
= = , = = − 3 + 2 2.
∂x dr ∂x r dr ∂x2 ∂x r dr r dr r dr r dr
10.5. El operador laplaciano 267
Las derivadas con respecto a y y a z se obtienen de la misma forma. Entonces

2 2
∂2f ∂2f ∂2f 3 x + y2 + z2 df x + y2 + z2 d2 f
∇f = 2 + 2 + 2 =
2
− +
∂x ∂y ∂z r r3 dr r2 dr2
de manera que, puesto que x2 + y2 + z2 = r2 ,

2 df d2 f 2
∇f =
2
+ 2 = − + 1 e−r .
r dr dr r
Vemos que el uso de coordenadas cartesianas en este caso implica de manera natural un cambio a
coordenadas esféricas mediante la regla de la cadena.
EJEMPLO 10.9 Evalúe ∇2 f para f (r, θ, φ) = re−r/2 sen θ cos φ.

Empleando la forma (10.19a),
1 ∂ 2 ∂f 1 ∂ ∂f 1 ∂2f
∇2 = r + 2 sen θ + 2 .
r ∂r
2 ∂r r sen θ ∂θ ∂θ r sen θ ∂φ2
2
La función f tiene la forma factorizada
f (r, θ, φ) = (re−r/2 )( sen θ)( cos φ) = R(r) × Θ(θ) × Φ(φ)

de manera que
∂f dR(r)
= Θ(θ) Φ(φ) ,
∂r dr

∂f dΘ(θ)
= R(r) Φ(φ) ,
∂θ dθ

∂f dΦ(φ)
= R(r) Θ(θ) ,
∂φ dφ
y por lo tanto
2
1 d 2 dR 1 d dΘ RΦ d Φ RΘ
∇2 f = r Θ Φ + sen θ + .
r2 dr dr sen θ dθ dθ r2 dφ2 r2 sen2 θ
Como

−r/2 1 d 2 dR r 2 −r/2 1 2 2
R = re , r = + −2 e = + 2 − R(r) ,
r2 dr dr 4 r 4 r r

1 d dΘ cos2 θ − sen2 θ cos2 θ − sen2 θ
Θ = sen θ , sen θ = = Θ(θ) ,
sen θ dθ dθ sen θ sen2 θ
d2 Φ
Φ = cos φ , = − cos φ = −Φ(φ) ,
dφ2
y por lo tanto

1 2 2 cos2 θ − sen2 θ 1 1 2
∇2 f = + 2 − + − 2 RΘΦ = − f.
4 r r r2 sen2 θ r sen2 θ 4 r
Este resultado puede reescribirse para dar la ecuación

1 1 1
− ∇2 − f =− f
2 r 8
que es esencialmente la ecuación de Schrödinger para el átomo de hidrógeno, siendo f el orbital 2px . El
resultado del Ejemplo 10.8 es la misma ecuación pero para el orbital 1s.
EJEMPLO 10.10 Demuestre que la función f = 1/r cumple la ecuación de Laplace en tres dimensiones.
La ecuación de Laplace es
∇2 f = 0 .
Como ocurrı́a en el Ejemplo 10.8, la función no depende de los ángulos θ y φ, por lo tanto
d2 f 2 df
∇2 f = + .
dr2 r dr
En este caso df /dr = −1/r2 , d2 f /dr2 = 2/r3 . Por lo tanto
d2 f 2 df 2 2
+ = 3 − 3 =0 (r = 0) .
dr2 r dr r r
Esta demostración no es válida si r = 0, y este punto singular necesita un tratamiento especial en las
aplicaciones fı́sicas.
Este ejemplo muestra que las funciones potenciales gravitacional y de Coulomb cumplen la ecuación
de Laplace (véase el Ejemplo 9.20 para el caso bidimensional).
10.6. Otros sistemas de coordenadas

Además de las coordenadas cartesianas y de las esféricas, hay otros sistemas de coor-
denadas útiles para describir sistemas fı́sicos. Los más importantes de éstos son del tipo
denominado coordenadas curvilı́neas ortogonales.2
En el sistema cartesiano (Figura 10.1), la posición del punto P(x, y, z) se define por
la intersección de tres superficies (planos) perpendiculares dos a dos: x = constante
(paralelo al plano Oyz), y = constante (paralelo al plano Ozx), y z = constante (paralelo
al plano Oxy). Los ejes coordenados que pasan por el punto son las rectas de intersección
de esos planos, y son también perpendiculares dos a dos.
En coordenadas esféricas la posición de p(r, θ, φ) se define también por la intersección
de tres superficies coordenadas: r = constante, θ = constante y φ = constante. La
superficie r = constante es la de una esfera de radio r. La superficie θ = constante
es la del cono circular recto con vértice O y base circular BPB en la Figura 10.7. La
superficie φ = constante es el plano (vertical) apa de la figura. Los correspondientes
‘ejes’ que pasan por el punto P son las curvas que resultan de la intersección de dos de
estas superficies. Como se muestra en la figura, la lı́nea coordenada para r es una recta
radial, la lı́nea (curva) coordenada para θ es el semicı́rculo APA , la lı́nea coordenada para
φ es el cı́rculo BPB ; son perpendiculares, u ortogonales, en su punto de intersección P.
Ésta es la caracterı́stica de las coordenadas curvilı́neas ortogonales.
02. Las coordenadas curvilı́neas ortogonales fueron introducidas por Lamé en su trabajo Sur les coor-
données curvilignes et leurs diverses applications. Gabriel Lamé (1795-1870), ingeniero y profesor en la
École Polytechnique, hizo contribuciones a la teorı́a de la elasticidad de los sólidos y participó en la cons-
trucción de los primeros ferrocarriles en Francia.
10.6. Otros sistemas de coordenadas 269
En el caso general, suponemos que las coordenadas cartesianas x, y, z están relacio-

nadas con tres nuevas cantidades q1 , q2 y q3 , mediante las ecuaciones
x = x(q1 , q2 , q3 ) , y = y(q1 , q2 , q3 ) , z = z(q1 , q2 , q3 ) , (10.21)
siendo las relaciones inversas
q1 = q1 (x, y, z) , q2 = q2 (x, y, z) , q3 = q3 (x, y, z) . (10.22)
La posición se define entonces especificando ya sea x, y, z o q1 , q2 , q3 . Cada una de las

ecuaciones (10.22) representa una superficie, y la intersección de las tres superficies sitúa
al punto. Las superficies q1 = constante, q2 = constante, y q3 = constante son las super-
ficies coordenadas, las curvas de las intersecciones dos a dos son las lı́neas coordenadas.
Las cantidades (q1 , q2 , q3 ) son las coordenadas curvilı́neas del punto P(x, y, z).
Figura 10.7
Las coordenadas curvilı́neas no se cortan necesariamente en ángulo recto: no son en

general ortogonales. Los sistemas de coordenadas curvilı́neas ortogonales son aquellos
cuyas lı́neas (y superficies) coordenadas son perpendiculares (ortogonales) dos a dos
en el punto de intersección. Los sistemas cartesiano y esférico son los ejemplos más
conocidos. Estos sistemas de coordenadas tienen las siguientes propiedades.
(i) La distancia (infinitesimal) entre dos puntos sobre una lı́nea coordenada es
dsi = hi dqi , (10.23)
donde
2 2 2
∂x ∂y ∂z
h =
2
+ + . (10.24)
i
∂qi ∂qi ∂qi
(ii) El elemento de volumen es
dv = ds1 ds2 ds3 = h1 h2 h3 dq1 dq2 dq3 . (10.25)
(iii) El operador laplaciano es

1 ∂ h2 h3 ∂ ∂ h3 h1 ∂ ∂ h 1 h2 ∂
∇ = 2
+ + . (10.26)
h1 h2 h3 ∂q1 h1 ∂q1 ∂q2 h2 ∂q2 ∂q3 h3 ∂q3
Para las coordenadas cartesianas y las esféricas tenemos
cartesianas: hx = hy = hz = 1,
esféricas: hr = 1, hθ = r, hφ = r sen θ.
A continuación presentamos dos de los sistemas coordenados alternativos más utiliza-

dos.
Coordenadas cilı́ndricas
Estas coordenadas son las coordenadas polares en el plano
xy más la coordenada z, son útiles para describir sistemas
con simetrı́a cilı́ndrica.
x = ρ cos φ, y = ρ sen φ, z = z,
ρ = 0 → ∞, φ = 0 → 2π, z = −∞ → +∞,
hρ = 1, hφ = ρ, hz = 1,
dv = ρ dρ dφ dz,
Figura 10.8

1 ∂ ∂ 1 ∂ 2
∂ 2
∇2 = ρ + + 2.
ρ ∂ρ ∂ρ ρ ∂φ
2 2
∂z
Coordenadas elı́pticas confocales

Estas coordenadas (también llamadas coordenadas esferoidales prolatas) son útiles
para problemas de potenciales con dos centros.

x = a ξ 2 − 1 1 − η 2 cos φ, y = a ξ 2 − 1 1 − η 2 sen φ, z = aξη,
ξ = 1 → ∞, η = −1 → +1, φ = 0 → 2π,

ξ2 − η2 ξ2 − η2
hξ = a , hη = a , hφ = a (ξ 2 − 1)(1 − η 2 ),
ξ2 − 1 1 − η2
dv = a3 (ξ 2 − η 2 ) dξ dη dφ,

1 ∂ ∂ ∂ ∂ (ξ 2 − η 2 ) ∂2
∇ = 2 2
2
(ξ − 1)
2
+ (1 − η )
2
+ 2 .
a (ξ − η 2 ) ∂ξ ∂ξ ∂η ∂η (ξ − 1)(1 − η 2 ) ∂φ2
Las coordenadas ξ y η se visualizan mejor, como en la Figura 10.9, en función de las

distancias rA y rB a los focos A y B de una elipse (las elipse se define por rA + rB =
constante):
rA + rB rA − ry B
ξ= , η= .
2a 2a
La figura puede representar una molécula diatómica con los núcleos en A y B y un
electrón en P.
Figura 10.9
10.7. Ejercicios
Apartado 10.2
Halle las coordenadas cartesianas (x, y, z) de los puntos cuyas coordenadas esféricas son:
1. (r, θ, φ) = (1, 0, 0) 2. (r, θ, φ) = (2, π/2, π/2) 3. (r, θ, φ) = (2, 2π/3, 3π/4)
Halle las coordenadas esféricas (r, θ, φ) de los puntos:
4. (x, y, z) = (1, 0, 0) 5. (x, y, z) = (0, 1, 0) 6. (x, y, z) = (1, 2, 2)

7. (x, y, z) = (1, −4, −8) 8. (x, y, z) = (– 2, −3, 6) 9. (x, y, z) = (– 3, 4, −12)
Apartado 10.3
Transforme a coordenadas esféricas:
1/2 x 2 + y2
10. x2 + y2 + z2 11. x 2 − y2 12. 13. 2z2 − x2 − y2
z2
Apartado 10.4
Halle la masa total de una distribución de masa con densidad ρ en una región V del espacio:
14. ρ = x2 + y2 + z2 , V: el cubo 0 ≤ x ≤ 1, 0 ≤ y ≤ 1, 0 ≤ z ≤ 1.
15. ρ = xy z , 2 3
V: la caja 0 ≤ x ≤ a, 0 ≤ y ≤ b, 0 ≤ z ≤ c.
16. ρ = y2 , V: la región 0 ≤ x ≤ 1, 1 − x ≤ y ≤ 1, 0 ≤ z ≤ 2.
−(x+y+z)
17. ρ=e , V: la región infinita x ≥ 0, y ≥ 0, z ≥ 0.
18. ρ=x +y +z ,
2 2 2
V: la esfera de radio a y centro en el origen.
sen θ cos φ
2 2
19. ρ= , V: la esfera de radio a y centro en el origen.
r
20. ρ = r3 e−r V: todo el espacio.
1
El orbital 2s del átomo de hidrógeno es ψ2s = (2 − r/a0 )e−r/2a0 :
4 2πa30
21. Demuestre que la integral de ψ2s

2
en todo el espacio es uno.
22. Calcule la distancia promedio al núcleo de un electrón en el orbital 2s.
El orbital 3pz del átomo de hidrógeno es ψ3pz = C(6 − r)re−r/3 cos θ (en unidades atómicas) donde C es
una constante:
23. Halle el valor de C que normaliza el orbital 3pz .
24. Calcule el valor promedio de r2 para el orbital 3pz .
Apartado 10.5
Halle ∇2 para las siguientes funciones:
e−r
25. f = x2 y3 z4 26. rn e−ar 27. 28. e−r/3 sen θ sen φ 29. xze−r/2
r
Demuestre que las siguientes funciones cumplen la ecuación de Laplace:
cos 2φ
30. 2x3 − 3x(y2 + z2 ) 31. 32. rn senn θ cos nφ, n = 1, 2, 3 . . .
r2 sen2 θ
2f f
33. Si f = (2 − r)e−r/2 demuestre que ∇2 f + = .
r 4
6f 9f
34. Si f = ze−3r/2 demuestre que ∇2 f + = .
r 4
6f
35. Si f = xye−r demuestre que ∇2 f + = f.
r
ear
36. Demuestre que f (r) = , siendo a un número cualquiera, cumple ∇2 f = a2 f .
r
37. El operador de d’Alembert es
∂2 ∂2 ∂2 1 ∂2
2
= + 2 + 2 − 2 2,
∂x 2 ∂y ∂z c ∂t
donde x, y, z son coordenadas, t es el tiempo y c es la velocidad de la luz. Demuestre que si la función
f (x, y, z) cumple la ecuación de Laplace, entonces la función g(x, y, z, t) = f (x, y, z)eikct cumple la ecuación
2
g = k2 g.
38. Obtenga el operador laplaciano ∇2 en coordenadas esféricas, ecuaciones (10.19), a partir de ∇2 en

coordenadas cartesianas, ecuación (10.18).
Apartado 10.6
39. Integre la función f = y2 z3 en la región cilı́ndrica de radio a, entre z = 0 y z = 1, simétrica en torno
al eje z.
rA + rB ra − rB
Use coordenadas elı́pticas confocales, ξ = ,η = , φ, para integrar las siguientes funciones
R R
en todo el espacio:
e−(rA +rB )
40. e−(rA +rB ) 41. cos2 φ
ra
Ecuaciones diferenciales de primer
orden
11.1. Conceptos
Una ecuación diferencial es una ecuación que contiene derivadas. Por ejemplo, si y es
una función de x, entonces una ecuación que contiene únicamente y y x es una ecuación
ordinaria, pero una ecuación que también contiene una o más derivadas dy/dx, d 2 y/dx2 , o
derivadas de orden superior es una ecuación diferencial. Algunos ejemplo de ecuaciones
diferenciales que se usan en las ciencias fı́sicas son
dx
1. = kx proceso cinético de primer orden
dt
dx
2. = k(a − x)(b − x) proceso cinético de segundo orden
dt
d2 h
3. = −g cuerpo que cae bajo la acción de la gravedad
dt2
d2 x
4. = −ωx2 oscilador armónico clásico
dt2
−2 d2 ψ 1 2
5. + kx ψ = Eψ ecuación de ondas para el oscilador armónico
2m dx2 2
Los cinco ejemplos describen procesos fı́sicos.1 Las ecuaciones 1 y 2 se usan para des-
cribir algunos procesos cinéticos sencillos en fı́sica y quı́mica, y también en biologı́a,
ingenierı́a, economı́a y ciencias sociales. Las ecuaciones 3, 4 y 5 son ecuaciones del
movimiento. En todas ellas la función incógnita es una función de una única variable, x(t)
en 1, 2 y 4, h(t) en 3, ψ(x) en 5. Las derivadas son derivadas ordinarias y las ecuaciones
son ecuaciones diferenciales ordinarias. En el Capı́tulo 14 tratamos las ecuaciones en
derivadas parciales.
01. Tanto Newton como Leibniz reconocieron que los problemas fı́sicos pueden formularse mediante
ecuaciones diferenciales, y la resolución de problemas fı́sicos proporcionó gran parte de la motivación para
el desarrollo posterior del cálculo en el siglo XVIII.
276 Capı́tulo 11. Ecuaciones diferenciales de primer orden
Hay un sistema de clasificación de los posibles tipos de ecuaciones diferenciales,

pero para lo que nos interesa consideraremos únicamente el orden. El orden de una
ecuación diferencial es el mayor orden de las derivadas de la ecuación. Las ecuaciones 1
y 2 son ecuaciones de primer orden porque contienen únicamente una derivada primera,
las ecuaciones 3 a 5 son ecuaciones de segundo orden. Casi todas las ecuaciones dife-
renciales de importancia en las ciencias fı́sicas son de primer orden (como los procesos
cinéticos elementales) o de segundo orden (ecuaciones del movimiento como la segun-
da ley de Newton, las ecuaciones de Maxwell del electromagnetismo y la ecuación de
Schrödinger).
En este capı́tulo consideramos únicamente ecuaciones diferenciales de primer orden.
En los Capı́tulos 12 a 14 tratamos las ecuaciones de segundo orden. Vamos a empezar
indicando qué se entiende por resolver una ecuación diferencial.
11.2. Solución de una ecuación diferencial

Una ecuación diferencial con una función incógnita y(x) en la variable x tiene la
expresión general

dy d2 y
f x, y, , ,... = 0 (11.1)
dx dx2
en la cual alguna combinación (una función) de x, y y las derivadas de y es igual a

cero. Resolver, o integrar, la ecuación diferencial significa hallar la función (o familia
de funciones) y(x) que satisface la ecuación. Por ejemplo, la ecuación de primer orden
(véase también el Apartado 5.2)
dy
= 2x (11.2)
dx
tiene como solución
y = x2 + c , (11.3)
siendo c una constante arbitraria, ya que d(x2 + c)/dx = 2x. La ecuación diferencial
se resuelve haciendo una integración (indefinida). Ası́, integrando ambos miembros de
(11.2) con respecto a x tenemos

dy
dx = 2x dx ; y = x2 + c . (11.4)
dx
Expresada en la forma (11.3), con la constante arbitraria, la solución se llama solución

general, o integral completa, de la ecuación diferencial. Vimos en el Apartado 5.2 que
la solución general (11.3) representa una familia de curvas, una para cada valor de c,
y que una curva particular de la familia se obtiene dando a c un valor particular. El
resultado es una solución particular de la ecuación diferencial. En el contexto fı́sico,
11.2. Solución de una ecuación diferencial 277
la solución general representa toda una familia de posibles situaciones fı́sicas, y escoger
una solución particular viene determinado por la naturaleza y el estado del sistema.
EJEMPLO 11.1 La ecuación

dx
= −kx
dt
proporciona un modelo para un proceso cinético de primer orden, como una desintegración radiactiva o
una reacción quı́mica de primer orden, donde x(t) es la cantidad de materia que reacciona a tiempo t. En el
Apartado 11.4 se demuestra que la solución general de la ecuación es
x(t) = ae−kt ,
donde a es la constante arbitraria. En este caso, la constante se determina por la cantidad de materia en un
instante de tiempo cualquiera. Ası́, si x = x0 es la cantidad de materia en el instante t = 0, tenemos
x(0) = x0 = a
y
x(t) = x0 e−kt
es la solución particular para ese valor de x0 . Vemos que la aplicación de una condición inicial especifica el
significado de la constante arbitraria al igual que su valor, y es un paso necesario para resolver un problema
fı́sico.
En el caso de una ecuación de segundo orden, con una derivada segunda, son necesa-
rias dos integraciones para eliminar la derivada segunda, de manera que aparecen dos
constantes arbitrarias (constantes de integración) en la solución general. Por ejemplo, la
ecuación de segundo orden
d2 y
=2 (11.5)
dx2
se integra una primera vez para dar
dy
= 2x + a (11.6)
dx
y una segunda vez para dar
y = x2 + ax + b . (11.7)
Ésta es la solución general y son necesarias dos condiciones para especificar las cons-
tantes. La solución general de una ecuación diferencial de orden n tiene n constantes
arbitrarias.*
0* Algunas ecuaciones diferenciales no tienen solución general, otras tienen únicamente una o más
soluciones particulares, y finalmente otras tienen solución general más algunas soluciones particulares que
no se obtienen a partir de la solución general. Estos caso no se suelen presentar a menudo en las ciencias
fı́sicas.
EJEMPLO 11.2 Cuerpo que cae bajo la acción de la gravedad
Sea h la altura del cuerpo en el instante t. La fuerza (dirigida hacia abajo) que actúa sobre el cuerpo es
F = −mg de manera que, por la segunda ley de Newton, F = md2 h/dt2 ,
d2 h
= −g .
dt2
Según acabamos de ver, la solución general de la ecuación diferencial es
1
h(t) = − gt2 + at + b ,
2
siendo a y b constantes arbitrarias. La solución particular viene dada en este caso por las condiciones
iniciales del sistema, la altura h0 y la velocidad v0 en el instante t = 0. Entonces, h(0) = h0 = b y, como la
velocidad viene dada por
dh
v(t) = = −gt + a ,
dt
la velocidad inicial es v0 = v(0) = a. La solución particular que satisface las condiciones iniciales h(0) = h0
y v(0) = v0 es por lo tanto
1
h(t) = − gt2 + v0 t + h0 .
2
Todas las ecuaciones diferenciales pueden resolverse por los métodos numéricos pre-
sentados en el Capı́tulo 20. Hay sin embargo varios tipos estándar importantes cuyas
soluciones se expresan mediante funciones elementales y que aparecen frecuentemente
en los modelos matemáticos de los sistemas fı́sicos. Son estos tipos estándar los que
tratamos en este capı́tulo y en los siguientes.
La ecuación diferencial general de primer orden tiene la forma
dy
= F(x, y) , (11.8)
dx
donde F(x, y) es una función de x e y, siendo y una función de x. Llamamos problema
de valor inicial a una de estas ecuaciones diferenciales junto con una condición inicial,
y(x0 ) = y0 (y = y0 cuando x = x0 ). Tratamos aquı́ dos tipos especiales importantes
de ecuaciones que pueden resolverse por métodos elementales: ecuaciones separables y
ecuaciones lineales.
11.3. Ecuaciones separables

La ecuación (11.8) puede resolverse directamente por integración si tiene la forma
dy f (x)
= (11.9)
dx g(y)
11.3. Ecuaciones separables 279
o puede reducirse a ella. Esta ecuación puede escribirse en forma diferencial2
g(y) dy = f (x) dx (11.10)
con todos los términos en los que aparece y en un miembro de la ecuación, y todos los
términos en los que aparece x en el otro. De esta ecuación se dice que es una ecuación
diferencial separable y se resuelve por integración (indefinida) de ambos miembros con
respecto a la variable relevante:

g(y) dy = f (x) dx + c (11.11)
con la constante arbitraria en uno de los dos miembros. De manera más formal, escri-
biendo (11.9) como
dy
g(y) = f (x) (11.12)
dx
la integración con respecto a x nos da

dy
g(y) dx = f (x) dx + c (11.13)
dx
y, aplicando el método de sustitución (Capı́tulo 6) al primer miembro, esto es lo mismo

que (11.11). La solución de la ecuación diferencial se completa evaluando las integrales
de (11.11) por los métodos presentados en los Capı́tulos 5 y 6 (si es posible; si no,
hay que recurrir a métodos numéricos) y aplicando la condición inicial apropiada. Los
siguientes ejemplos ilustran el método. En el apartado 11.4 presentamos aplicaciones de
las ecuaciones diferenciales separables.
EJEMPLOS 11.3 Ecuaciones separables
Cada una de las siguientes ecuaciones tiene la forma (11.9) con solución (11.11). En cada caso se da una
condición inicial.
dy
(i) = axn , y(0) = 0.
dx
Por la ecuación (11.10), dy = axn dx, e integrando tenemos (si n = −1)

axn+1
dy = a xn dx , y(x) = + c.
n+1
Ésta es la solución general. La solución particular buscada se obtiene sustituyendo la condición
inicial: y = 0 cuando x = 0. Con esto c = 0 e:
axn+1
y(x) = .
n+1
02. Mucha de la formulación de Leibniz del cálculo implicaba ecuaciones con diferenciales (ecua-
ciones diferenciales). El método de separación de variables y el método de reducción de una ecuación
homogénea a forma separable que tratamos en este apartado, fueron inventados por Leibniz en 1691.
dy
(ii) = ky, y(x0 ) = y0 .
dx
Separando variables e integrando tenemos

dy dy
= k dx , =k dx ,
y y
y la solución general de la ecuación, con la constante arbitraria c, es por lo tanto
ln y = kx + c .
Una forma alternativa de presentar la solución general se obtiene tomando la exponencial de cada
miembro:
eln y = ekx+c , y = ec ekx = aekx
(utilizando que eln y = y), y siendo ahora a la constante arbitraria. Por la condición inicial, y = y0
cuando x = x0 , tenemos
y(x0 ) = y0 = aekx0
de manera que a = y0 e−kx0 , y la solución particular es
y(x) = y0 ek(x−x0 ) .
dy 1
(iii) + 3x2 y2 = 0, y(1) = .
dx 2
Separando variables e integrando tenemos

dy dy 1
− = 3x2 dx , − =3 x2 dx , = x3 + c ,
y2 y2 y
y la solución general es
1
y(x) = .
x3 + c
1
Por la condición inicial, y = cuando x = 1,
2
1 1
y(1) = =
1+c 2
de manera que c = 1 y la solución particular buscada es
1
y(x) = .
x3 + 1
Reducción a forma separable

Algunas ecuaciones diferenciales de primer orden que no son separables pueden lle-
gar a serlo mediante un cambio de variables adecuado. Uno de tales ejemplos es cuando
la función F(x, y) en el segundo miembro de la expresión general (11.8) tiene la propie-
dad
F(λx, λy) = F(x, y) , (11.14)

11.3. Ecuaciones separables 281
donde λ es un número o una función arbitrarios. Es decir, ‘reescalar’ x e y por el mismo

factor deja la función invariante. Una función de x e y tiene esta propiedad si puede
expresarse como una función de y/x. Por ejemplo,
x2 + y2 y y y
F(x, y) = = +1 =f .
xy x x x
Entonces
y
λy
F(λx, λy) = f =f = F(x, y) . (11.15)
λx x
La ecuación diferencial
dy y
= F(x, y) = f (11.16)
dx x
se convierte en separable mediante el cambio v = y/x. Tenemos
dy d(xv) dv
= = v + x = f (v) (11.17)
dx dx dx
de manera que, separando las variables x y v,
dv dx
= (11.18)
f (v) − v x
y la solución de la ecuación es

dv
= ln x + c . (11.19)
f (v) − v
Una ecuación de este tipo se llama a menudo ecuación homogénea porque una función
del tipo (11.14) es una función homogénea. En general, una función de una o más
variables es una función homogénea de grado n si
f (λx, λy, . . . ) = λn f (x, y, . . . ) . (11.20)
La función (11.14) es por lo tanto homogénea de grado cero.

EJEMPLO 11.4 Resuelva la ecuación
dy x 2 + y2
= .
dx xy
El cambio y = xv da
dy d(xv) dv 1
= =v+x =v+
dx dx dx v
dv 1
de manera que x = .
dx v
Entonces, separando variables e integrando,

dx v2
v dv = , = ln x + c .
x 2
La solución general de la ecuación, tras el cambio v = y/x, es por lo tanto
y2
= ln x + c .
2x2
El resultado puede verificarse mediante derivación implı́cita:
2
d y d y dy y2 1
= ( ln x + c) , − = ,
dx 2x2 dx x2 dx x3 x
y
dy x2 1 y2 x y x 2 + y2
= + 3 = + = .
dx y x x y x xy
11.4. Ecuaciones separables en cinética quı́mica

Una reacción quı́mica se denota por una ecuación ‘estequiométrica’ de la forma
aA + bB + · · · = pP + qQ + · · · (11.21)
en la cual los sı́mbolos A, B, . . . (en la práctica, fórmulas quı́micas) representan las

especies quı́micas que reaccionan para dar los productos P, Q, . . . La presencia de los
números a, b, . . . y p, q, . . . en la ecuación significa que a moléculas de A reaccionan
con b moléculas de B, . . . para dar p moléculas de P, q moléculas de Q,. . . Por ejemplo,
2H2 + O2 = 2H2 O
significa que dos moléculas de hidrógeno reaccionan con una molécula de oxı́geno para
dar dos moléculas de agua.
En termodinámica y en cinética, una reacción quı́mica se escribe en general como

0= νB B , (11.22)
B
donde el sumatorio es sobre todas las especies presentes, tanto reactivos como produc-
tos, y los νB , llamados coeficientes estequiométricos, son los números a, b, p, q, . . . en
(11.21), pero con un cambio de signo en los reactivos. En esta forma la ecuación (11.21)
es
0 = −aA − bB + pP + qQ + · · ·
= ν A A + νB B + νP P + νQ Q + · · ·
y la ecuación H2 /O2 es 0 = −2H2 − O2 + 2H2 O .

11.4. Ecuaciones separables en cinética quı́mica 283
Velocidad de reacción
Sea nA0 la cantidad inicial de la especie A en el instante t = 0 y sea nA la cantidad en
el instante t. La ‘cantidad’ de reacción que ha tenido lugar en el instante t viene dada por
el grado de avance de la reacción ξ, definido por
nA = nA0 + νA ξ (11.23)
y una medida de la velocidad de una reacción es entonces el grado de variación del

avance de la reacción, o grado de conversión,
dξ
r= . (11.24)
dt
Esta velocidad también puede expresarse en función de la tasa de variación de la cantidad
de cada especie que toma parte en la reacción. Derivando (11.23), tenemos
dnA dξ
= νA (11.25)
dt dt
(puesto que nA0 y νA son constantes), de manera que
dξ 1 dnA
r= = . (11.26)
dt νA dt
Para muchos propósitos en quı́mica fı́sica es más conveniente expresar la velocidad en

función de las concentraciones en vez de las cantidades.* La concentración de la especie
A en el volumen V viene dada por [A] = nA /V, y dividiendo la ecuación (11.26) por el
volumen obtenemos la velocidad de reacción (en función de la concentración de A)
r 1 d[A]
v= = . (11.27)
V νA dt
Para la reacción general escrita en la forma (11.21) tenemos
1 d[A] 1 d[B] 1 d[P] 1 d[Q]

v=− =− = = = ··· (11.28)
a dt b dt p dt q dt
y para la reacción H2 /O2 ,
1 d[H2 ] d[O2 ] 1 d[H2 O]

v=− =− = .
2 dt dt 2 dt
0* Por convenio, el sı́mbolo nA es la cantidad de la especie A en unidades (SI) de mol, que es también
la unidad para ξ. Otras cantidades que se usan en vez del número de moles son la concentración [ A], la
presión parcial pA para un gas, y la fracción molar adimensional xA . Seguimos la práctica habitual en libros
de quı́mica fı́sica de utilizar concentraciones para el tratamiento de la cinética, pero omitiendo las unidades.
El mecanismo de una reacción quı́mica es en general complejo, pasando por varias eta-
pas cinéticas elementales, que pueden ser consecutivas, competitivas o ambas, y es tarea
de los quı́micos cinéticos desentrañar el mecanismo y relacionar la velocidad de la re-
acción quı́mica global con las velocidades de las etapas elementales. Se sabe de manera
experimental que la velocidad global puede depender de las cantidades de todas las es-
pecies quı́micas presentes en cualquier instante, tanto reactivos como productos, y de
la temperatura, la presión y la naturaleza del recipiente. Consideramos aquı́ únicamen-
te las reacciones más sencillas, aquellas cuyas velocidades dependen únicamente de las
cantidades de los reactivos. Representamos tales reacciones mediante
aA + bB + · · · → productos. (11.29)
Se sabe de manera experimental que la velocidad de reacción tiene la forma
v = k[A]α [B]β . . . (11.30)
donde k se denomina constante cinética de la reacción, y los números α, β, . . . , definen

el orden de la reacción. El exponente α se denomina orden con respecto al reactante A,
β es el orden con respecto a B, . . . , y la suma α + β + · · · se denomina orden de la
reacción. Los casos considerados son
(1) A → productos primer orden
(2) 2A → productos segundo orden
(3) A + B → productos segundo orden
(1) El proceso de primer orden: A −→ productos

La ecuación cinética es
d[A]
v=− = k[A] (11.31)
dt
o, si representamos la concentración [A] por la variable x,
dx
= −kx . (11.32)
dt
Ésta es la ecuación diferencial tratada en los Ejemplos 3.20 y 11.1, y la solución es la

que hemos dado en el Ejemplo 11.3(ii). Ası́, separando las variables e integrando,
dx
= −k dt , ln x = −kt + c o bien ln [A] = −kt + c . (11.33)
x
Si la concentración inicial de A es [A]0 , en el instante t = 0, entonces c = ln [A]0 y la
solución de la ecuación cinética diferencial es la ecuación cinética integrada
11.4. Ecuaciones separables en cinética quı́mica 285
ln [A] = −kt + ln [A]0 . (11.34)
La gráfica de ln [A] frente a t es una recta (Figura 11.1) cuya pendiente es −k y cuyo
corte con el eje ln [A] es ln [A]0 .
Una expresión más convencional para la ecuación cinética integrada se obtiene de
(11.34) tomando exponenciales en cada miembro,
[A] = [A]0 e−kt , (11.35)
y muestra que los procesos de primer orden

son un ejemplo de decrecimiento exponen-
cial.
Figura 11.1
(2) El proceso de segundo orden: 2A −→ productos

1 d[A]
v=− = k[A]2 (11.36)
2 dt
o bien
dx
= −2kx2 . (11.37)
dt
Separando variables e integrando, tenemos
dx 1
− = 2k dt , = 2kt + c .
x2 x
Si x0 es la concentración inicial de reactivo, entonces c = 1/x0 y
1 1
− = 2kt (11.38)
x x0
o bien
1 1 [A]0
− = 2kt , [A] = . (11.39)
[A] [A]0 1 + 2kt[A]0
Figura 11.2
La gráfica de 1/[A] frente a t es una recta (Figura 11.2) con pendiente 2k que corta el
eje vertical en 1/[A]0 .
(3) El proceso de segundo orden: A + B −→ productos

d[A] d[B]
v=− =− = k[A][B] . (11.40)
dt dt
Sean [A]0 = a y [B]0 = b las concentraciones iniciales de A y B, respectivamente, y
sean [A] = a − x y [B] = b − x en el instante t. La ecuación cinética es entonces
d(a − x) dx
− = = k(a − x)(b − x) . (11.41)
dt dt
Tenemos que distinguir dos casos.
(a) Las concentraciones iniciales de A y B son iguales: [A]0 = [B]0 , a = b.

La ecuación cinética (11.41) es
dx
= k(a − x)2 (11.42)
dt
y, separando variables e integrando,
dx 1 1
= k dt , = = kt + c . (11.43)
(a − x)2 a−x [A]
Entonces c = 1/a = 1/[A]0 y la ecuación cinética integrada es
1 1
− = kt . (11.44)
[A] [A]0
Esto es lo mismo que en el caso (2) anterior salvo por el factor 2, que diferencia el caso
A + A del caso A + B.
(b) Las concentraciones iniciales de A y B no son iguales.
11.5. Ecuaciones lineales de primer orden 287
Separando variables en (11.41) e integrando,

dx dx
= k dt , = kt + c .
(a − x)(b − x) (a − x)(b − x)
La integral en la variable x se evalúa expresando el integrando en fracciones simples

(véanse los Apartados 2.6 y 6.6, y los Ejemplos 2.27 y 6.17). Escribimos
1 A B A(b − x) + B(a − x)
= + = .
(a − x)(b − x) a−x b−x (a − x)(b − x)
Para todo valor de x tiene que cumplirse
1 = A(b − x) + B(a − x) .
Tomar x = b nos da B = 1/(a − b); mientras que tomar x = a nos da A = 1/(b − a).
Por lo tanto
1 1 1 1
= −
(a − x)(b − x) b−a a−x b−x
y

dx 1 1 1
= − dx
(a − x)(b − x) b−a a−x b−x

1 1 b−x
= − ln (a − x) + ln (b − x) = ln .
b−a b−a a−x
Por lo tanto
1 b − x
ln = kt + c .
b−a a−x

1 b
En el instante t = 0, tenemos x = 0 y c = ln , de manera que
b−a a
1 a(b − x)
ln = kt (11.45)
b − a b(a − x)
y la ecuación cinética integrada es
1 [A]0 [B]
ln = kt . (11.46)
[B]0 − [A]0 [B]0 [A]
La gráfica de ln [B]/[A] frente a t es una recta.

11.5. Ecuaciones lineales de primer orden

Se dice que una ecuación diferencial de primer orden es lineal si puede escribirse en
la forma
dy
+ p(x)y = r(x) . (11.47)
dx
La ecuación es lineal tanto en dy/dx como en y. Cuando el segundo miembro, r(x), es
cero se dice que la ecuación es homogénea, en caso contrario se trata de una ecuación
no homogénea.
La ecuación homogénea
dy
+ p(x)y = 0 . (11.48)
dx
La ecuación es separable:

dy
= −p(x) dx , ln y = − p(x) dx + c ,
y
y, tomando exponenciales de ambos miembros, la solución general es

y = a e− p(x) dx
, (11.49)
donde a es una constante arbitraria (si se toma a nula, y = 0 se llama solución trivial).
La ecuación no homogénea
La ecuación lineal general se transforma en una expresión directamente integrable si
se multiplican ambos miembros de (11.47) por la función

F(x) = e p(x) dx
(11.50)
que cumple la propiedad diferencial3
dF(x)
= F(x)p(x) , (11.51)
dx
03. Este método para resolver la ecuación diferencial general de primer orden fue descubierto por
Leibniz en 1694.
11.6. Un ejemplo de ecuaciones lineales en cinética quı́mica 289

d
dado que p(x) dx = p(x). Ası́, multiplicando (11.47) por F(x),
dx
dy
F(x) + F(x)p(x)y = F(x)r(x) (11.52)
dx
y, según (11.51), el primer miembro es la derivada del producto F(x)y:
dy dy dF(x) d
F(x) + F(x)p(x)y = F(x) + y= F(x)y .
dx dx dx dx
La ecuación (11.52) puede por lo tanto escribirse como
d
F(x)y = F(x)r(x)
dx
que se integra para dar

F(x)y = F(x)r(x) dx + c . (11.53)
Ésta es la solución general de la ecuación no homogénea. La función F(x) se llama factor

integrante de la ecuación diferencial.
EJEMPLOS 11.5 Ecuaciones lineales

dy
1. − y = 3e2x
dx
En este caso, p(x) = −1, p(x) dx = −x, y el factor integrante es

F(x) = e p(x) dx
= e−x
(no hace falta incluir una constante de integración en el exponente porque se canceları́a en (11.53)).
Entonces, por la fórmula (11.53),

e−x y = e−x × 3e2x dx + c = 3 ex dx + c
= 3ex + c ,
y = ex (3ex + c) = 3e2x + cex .
dy 2
2. + y = 3x3
dx x
El factor integrante es
F(x) = e (2/x)dx = e2 ln x = x2 .
Por lo tanto, por la fórmula (11.53),

x6
x2 y = x2 × 3x3 dx + c = + c,
2
x4 c
y = + 2.
2 x
11.6. Un ejemplo de ecuaciones lineales en cinética quı́mica

Vimos en el Apartado 11.4 que muchas reacciones quı́micas (de hecho, la mayorı́a)
atraviesan distintas etapas elementales, y una descripción del proceso cinético global
implica simultáneamente varias ecuaciones diferenciales de primer orden. Estos siste-
mas de ecuaciones pueden resolverse sin recurrir a aproximaciones sólo en los casos
sencillos, si no, hay que utilizar métodos numéricos. Uno de los sistemas resolubles más
sencillos es para dos procesos de primer orden consecutivos
k1 k2
A −→ B −→ C ,
donde A se transforma en C pasando por la especie intermedia B. El proceso se repre-

senta con las dos ecuaciones de primer orden
d[A]
= −k1 [A] , (11.54)
dt
d[B]
= k1 [A] − k2 [B] . (11.55)
dt
Suponemos que las concentraciones iniciales, en el instante t = 0, son [A]0 = a, [B]0 =
0, y [C]0 = 0, y que las concentraciones en el instante t son [A] = a − x y [B] = y, de
manera que [C] = x − y. Entonces
d(a − x)
= −k1 (a − x) , (11.56)
dt
dy
= k1 (a − x) − k2 y . (11.57)
dt
La primera de estas ecuaciones es la ecuación separable (11.32), con solución
a − x = ae−k t . 1
(11.58)
Sustituyendo este resultado en la ecuación (11.57) tenemos
dy
= ak1 e−k t − k2 y1
dt
o bien
dy
+ k2 y = ak1 e−k t 1
(11.59)
dt
y ésta es una ecuación lineal con p(t) = k2 , r(t) = ak1 e−k t y factor integrante
1

F(t) = e p(t) dt
= ek t .
2
11.6. Un ejemplo de ecuaciones lineales en cinética quı́mica 291
La solución de la ecuación (11.59) es por lo tanto

F(t)y = F(t) r(t) dt + c ,
⎧
⎨ ak1 e(k −k )t + c si k = k ,2 1
dt + c = k2 − k1
1 2
e y = ak1 e
k t2 (k −k )t
2 1
⎩
ak1 t + c si k1 = k2 .
Por las condiciones iniciales: y = 0 cuando t = 0. Tenemos entonces

ak
− k −k si k1 = k2 ,
1
c= 2 1
0 si k1 = k2 ,
y la solución particular buscada es

⎧
⎨ ak1
(e−k t − e−k t ) si k1 = k2 ,
1 2
y= k2 − k1 (11.60)
⎩
ak1 te−k t 1
si k1 = k2 .
La concentración de cada especie presente en el instante t es por lo tanto
[A] = [A]0 e−k t ,1
⎧
⎨ [A]0 k1 (e−k t − e−k t ) si k = k ,
1 2
k2 − k1
1 2
[B] = (11.61)
⎩
[A]0 k1 te−k t 1
si k1 = k2 ,
[C] = [A]0 − [A] − [B] .
Figura 11.3
La figura 11.3 ilustra los tres tipos de comportamiento que presenta el sistema. En
cada caso [A]0 = 1 y k1 = 1 (en las coordenadas apropiadas). La Figura (a), con k2 /k1 =
10, muestra cómo se comporta el sistema cuando k2 >> k1 . La etapa que limita la
reacción es A → B, y la cantidad de B intermedio se mantiene pequeña a largo de la
reacción porque B se convierte rápidamente en C. La Figura (c), con k1 /k2 = 10, muestra
el comportamiento cuando k1 >> k2 . La etapa limitadora es B → C, y la cantidad de
B se hace grande porque el proceso B → C es lento, y B disminuye sólo cuando el
suministro de A se agota.
11.7. Circuitos eléctricos

Los modelos de circuitos eléctricos son una aplicación importante de las ecuacio-
nes diferenciales. Un circuito sencillo consiste en una fuente de energı́a eléctrica, como
un generador o una pila, que genera una fuerza electromotriz (f.e.m.) E, y uno o más
elementos conectados en serie: resistencias, bobinas de inducción o condensadores. La
f.e.m. de la fuente es igual a la diferencia de potencial eléctrico entre los dos puntos a
los que se une en el circuito. Cuando el circuito se cierra, fluye una corriente I y cada
elemento del circuito provoca una caı́da de voltaje (potencial eléctrico) en el circuito. La
caı́da total de voltaje es igual a la f.e.m. (ley del voltaje de Kirchhoff).
La caı́da de voltaje ER en una resistencia es proporcional a la corriente,
ER = RI (ley de Ohm) , (11.62)
donde la constante de proporcionalidad R es el valor de la resistencia (véanse las Tablas

1.1 y 1.2 para las unidades SI adecuadas). La caı́da de voltaje EL en una bobina es
proporcional a la tasa de variación de la corriente,
dI
EL = L , (11.63)
dt
donde L es la inductancia, y para un condensador es
Q
EC = , (11.64)
C
dQ
donde C es la capacidad. La carga Q se relaciona con la corriente mediante I = .
dt
Figura 11.4
Consideramos aquı́ un circuito RL, con una resistencia y una bobina, como se repre-
senta en la Figura 11.4. Por la ley de Kirchhoff,
dI
L + RI = E , (11.65)
dt
que es una ecuación diferencial lineal de primer orden. Tenemos p =

R/L (constante)
y r = E/L en la ecuación (11.47). El factor integrante es F(x) = e (R/L) dt = eRt/L y la
solución general es

Rt/L E
I(t) = e −Rt/L
e dt + c . (11.66)
L
Si la f.e.m. es constante, E = E0 , y entonces

E0 E0
I(t) = e−Rt/L
e dt + c =
Rt/L
+ ce−Rt/L . (11.67)
L R
La solución particular para la condición inicial I(0) = 0 es entonces
E0
I(t) = 1 − e−Rt/L . (11.68)
R
Cuando se cierra el circuito la corriente crece desde cero al valor estacionario E0 /R en
un tiempo que depende de la constante de tiempo de inducción τL = L/R.
11.8. Ejercicios
Apartado 11.2
Establezca el orden de la ecuación diferencial y compruebe que la función dada es una solución:
dy d2 y
1. − 2y = 2 ; y = e2x − 1 2. + 4y = 0 ; y = A cos 2x + B sen 2x
dx dx2
d3 y dy 3y x3 c
3. = 12 ; y = 2x3 + 3x2 + 4x + 5 4. + = 3x2 ; y= + 3
dx3 dx x 2 x
Halle la solución general de la ecuación diferencial:
dy dy d2 y d3 y
5. = x2 6. = e−3x 7. = cos 2x 8. = 24x
dx dx dx2 dx3
Compruebe que la función dada es una solución de la ecuación diferencial, y determine c para la condición
inicial dada:
dy
9. x = 2y ; y = cx2 ; y = 24 para x = 2
dx
dy 2
10. + 2xy = 0 ; y = ce−x ; y = 2 para x=2
dx
dy
11. + 2y + 2 = 0 ; y = ce−2x − 1 ; y(0) = 4
dx
12. Un cuerpo se mueve en la dirección x bajo la acción de la fuerza F(t) = cos 2πt, siendo t el tiempo. (i)
Escriba la ecuación del movimiento. (ii) Halle la solución que satisface las condiciones iniciales x(0) = 0 y
ẋ(0) = 1.
Apartado 11.3
Halle la solución de la ecuación diferencial:
dy 3x2 dy dy
13. = 14. = 4xy2 15. = 3x2 y
dx y dx dx
dy dy dy y
16. y2 = ex 17. = y(y − 1) 18. =
dx dx dx x
Resuelva los problemas de valor inicial:
dy y+2 dy x2 − 1
19. = ; y(0) = 1 20. = ; y(0) = −1
dx x−3 dx 2y + 1
dy y(y + 1) dy
21. = ; y(2) = 1 22. = ex+y ; y(0) = 0
dx x(x − 1) dx
dy x+y dy
23. = ; y(1) = 2 24. 2xy = −(x2 + y2 ) ; y(1) = 0
dx x dx
dy
25. xy3 = x4 + y4 ; y(2) = 0
dx
dy
26. Demuestre que una ecuación diferencial de la forma = f (ax + by + c) se reduce a forma separable
dx
mediante el cambio u = ax + by.
Utilice el Ejercicio 26 para hallar la solución general:

dy dy x−y
27. = 2x + y + 3 28. =
dx dx x−y+2
Apartado 11.4
29. Resuelva el problema de valor inicial para el proceso cinético de orden n A → productos
dx
= −kxn x(0) = a (n = 1) .
dt
30. La reacción reversible A B, de primer orden en ambas direcciones, tiene la ecuación cinética
dx
= k1 (a − x) − k−1 x .
dt
Halle x(t) para la condición inicial x(0) = 0.
31. Un proceso de tercer orden A + 2 B → productos tiene la ecuación cinética
dx
= k(a − x)(b − 2x)2 ,
dt
donde a y b son las cantidades iniciales de A y de B respectivamente. Demuestre que la solución que
satisface la condición x(0) = 0 viene dada por
1 a(b − 2x) 2x
kt = ln + .
(2a − b)2 b(a − x) b(2a − b)(b − 2x)
Apartado 11.5
Halle la solución general:
dy dy dy
32. + 2y = 4 33. − 4xy = x 34. + 3y = e−3x
dx dx dx
dy 2y dy y 4 dy
35. + = 2 cos x 36. − 2 = 2 37. + (2 tg x)y = sen x
dx x dx x x dx
dy dy y
38. + axn y = bxn , (n = −1) 39. + a = xn
dx dx x
Apartado 11.6
k k k
40. El sistema de tres procesos de primer orden consecutivos A −→
1
B −→
2
C −→
3
D está representado
por el conjunto de ecuaciones
d(a − x) dy dz
= −k1 (a − x) , = k1 (a − x) − k2 y , = k2 y − k3 z ,
dt dt dt
donde (a − x), y y z son las cantidades en el instante t de A, B y C respectivamente. Dadas las condiciones
iniciales x(0) = y(0) = z(0) = 0, halle la cantidad de C como función de t. Suponga k1 = k2 , k1 = k3 , k2 =
k3 .
k k
41. El proceso de primer orden A −→
1
B es seguido por los procesos paralelos de primer orden B −→
2
C
k
y B −→
3
D, y el sistema se representa por las ecuaciones
d(a − x) dy dz dw
= −k1 (a − x) , = k1 (a − x) − (k2 + k3 )y , = k2 y , = k3 y ,
dt dt dt dt
donde (a − x), y, z y w son las cantidades en el instante t de A, B, C y D respectivamente. Dadas las condi-
ciones iniciales x = y = z = w = 0 a t = 0, halle la cantidad de C como función del tiempo.
Apartado 11.7
42. Demuestre que la corriente en un circuito RC que contiene una resistencia y un condensador viene
dada por la ecuación
dI I dE
R + = .
dt C dt
Resuelva la ecuación para (i) una f.e.m. constante, E = E0 , (ii) una f.e.m. periódica, E(t) = E0 sen ωt.
Ecuaciones diferenciales de segundo
orden. Coeficientes constantes
12.1. Conceptos
Las ecuaciones diferenciales de segundo orden que son importantes en las ciencias
fı́sicas son ecuaciones lineales con forma general
d2 y dy
+ p(x) + q(x)y = r(x) . (12.1)
dx 2
dx
Si la función r(x) es cero, se dice que la ecuación
d2 y dy
+ p(x) + q(x)y = 0 (12.2)
dx2 dx
es homogénea. En caso contrario se dice que es no homogénea.1 Las funciones p(x) y
q(x) son los coeficientes de la ecuación. Cuando estos coeficientes son constantes las
soluciones de la ecuación se pueden expresar mediante funciones elementales, y estas
ecuaciones lineales con coeficientes constantes son las que tratamos en este capı́tulo. En
el Capı́tulo 13 tratamos las ecuaciones diferenciales con coeficientes no constantes.
12.2. Ecuaciones lineales homogéneas

La ecuación lineal de segundo orden con coeficientes constantes tiene la forma gene-
ral
d2 y dy
+ a + by = 0 (12.3)
dx2 dx
01. Muchos de los métodos y ejemplos de los libros de texto se remontan a los Institutiones calculi
differentiales (1755) e Institutiones calculi integralis (1768-70, 3 volúmenes) de Euler. Fue Euler quien
introdujo la distinción entre ecuaciones homogéneas y no homogéneas y entre soluciones generales y parti-
culares, el uso de factores integrantes, y la resolución de ecuaciones lineales con coeficientes constantes de
segundo orden y de órdenes superiores.
298 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes
siendo a y b constantes. Siempre es posible encontrar una solución de esta ecuación de

la forma eλx , donde λ es una constante adecuada.
EJEMPLO 12.1 Demuestre que y1 = e2x e y2 = e3x son dos soluciones de la ecuación
d2 y dy
− 5 + 6y = 0 .
dx2 dx
Tenemos
dy1 d 2 y1
y1 = e2x , = 2e2x , = 4e2x .
dx dx2
Por lo tanto
d 2 y1 dy1
−5 + 6y1 = 4e2x − 5 × 2e2x + 6e2x = e2x (4 − 10 + 6) = 0 .
dx2 dx
De manera similar,
dy2 d 2 y2
y2 = e3x , = 3e3x , = 9e3x ,
dx dx2
y
d 2 y2 dy2
−5 + 6y2 = 9e3x − 15e3x + 6e3x = 0 .
dx2 dx
Este ejemplo ilustra el resultado general de que siempre es posible hallar dos soluciones
particulares y1 (x) e y2 (x) para una ecuación lineal homogénea. Si multiplicamos cada
una de esas soluciones por una constante, la nueva función es también una solución. Por
ejemplo, sea y1 (x) una solución de la ecuación general homogénea (12.2),
d2 y1 dy1
+ p(x) + q(x)y1 = 0 ,
dx 2
dx
y sea y3 (x) = cy1 (x), siendo c una constante. Entonces,
dy3 d(cy1 ) dy1 d2 y3 d2 y1

= =c , = c ,
dx dx dx dx2 dx2
y
2
d2 y3 dy3 d y1 dy1
+ p(x) + q(x)y3 = c + p(x) + q(x)y1 = 0,
dx2 dx dx2 dx
de manera que y3 = cy1 es también una solución. Sin embargo, las funciones y1 e y3 no se
consideran diferentes, porque cada una es sencillamente un múltiplo de la otra: se dice
que las funciones son linealmente dependientes. En general, dos funciones y1 e y2 son
linealmente dependientes si existe una relación
a1 y1 (x) + a2 y2 (x) = 0 (12.4)
tal que a1 y a2 no son ambos cero. Si (12.4) es únicamente cierta cuando a1 = a2 = 0,

entonces las funciones son linealmente independientes, y ninguna de ellas es múltiplo
de la otra. Las soluciones y1 e y2 del ejemplo 12.1 son linealmente independientes.
12.3. Solución general 299
Demostraremos ahora que si y1 e y2 son dos soluciones de una ecuación lineal ho-
mogénea, entonces cualquier combinación lineal de ellas,
y = c1 y1 + c2 y2 (12.5)
donde c1 y c2 son constantes arbitrarias, es también una solución.

Tenemos
dy dy1 dy2 d2 y d2 y1 d2 y2
= c1 + c2 , = c1 + c2 ,
dx dx dx dx2 dx2 dx2
y sustituyendo en la ecuación general homogénea (12.2),
2
d2 y dy d y1 d2 y2
+ p(x) + q(x)y = c1 2 + c2 2
dx2 dx dx dx

dy1 dy2
+p(x) c1 + c2 + q(x) c1 y1 + c2 y2
dx dx
2
d y1 dy1
= c1 + p(x) + q(x)y1
dx2 dx
2
d y2 dy2
+c2 + p(x) + q(x)y2
dx2 dx
= 0.
El resultado es cero ya que ambos términos entre corchetes son cero por ser y1 e y2
soluciones. Esta importante propiedad de las ecuaciones lineales homogéneas se lla-
ma principio de superposición (no se cumple para ecuaciones no homogéneas ni para
ecuaciones no lineales). En particular, cuando y1 e y2 son soluciones linealmente inde-
pendientes, la función (12.5), que tiene dos constantes arbitrarias, es la solución general
de la ecuación homogénea (véase el apartado 11.2).
EJEMPLO 12.2 La solución general de la ecuación del Ejemplo 12.1 es

y(x) = c1 e2x + c2 e3x .
Las soluciones particulares se obtienen asignando valores particulares a c1 y c2 .
12.3. Solución general

Supongamos que una solución de la ecuación (12.3),
d2 y dy
+ a + by = 0 (12,3) ,
dx2 dx
es
y = eλx . (12.6)
Entonces
d λx d2 λx
e = λeλx , e = λ2 eλx ,
dx dx2
y sustituyendo en (12.3) tenemos
λ2 eλx + aλeλx + beλx = 0
o bien
eλx (λ2 + aλ + b) = 0 .
La función (12.6) es por lo tanto una solución de la ecuación (12.3) si
λ2 + aλ + b = 0 . (12.7)
Esta ecuación cuadrática se llama ecuación caracterı́stica o ecuación auxiliar de la

ecuación diferencial.2 Los posibles valores de λ son las raı́ces de la ecuación cuadrática:
1 √ 1 √
λ1 = (− a + a2 − 4b ) , λ2 = (− a − a2 − 4b ) , (12.8)
2 2
y las posibles soluciones de tipo (12.6) son
y1 = eλ x ,
1
y2 = eλ x .
2
(12.9)
EJEMPLO 12.3 La ecuación caracterı́stica de la ecuación diferencial

d2 y dy
− 5 + 6y = 0
dx2 dx
es
λ2 − 5λ + 6 = 0
que puede ser factorizada como
λ2 − 5λ + 6 = (λ − 2)(λ − 3)
y sus raı́ces son λ1 = 2 y λ2 = 3. Dos soluciones particulares de la ecuación diferencial son por lo tanto
y1 = eλ1 x = e2x , y2 = eλ2 x = e3x ,

y, como esas funciones son linealmente independientes, la solución general es
y = c1 y1 + c2 y2 = c1 e2x + c2 e3x .
02. En una carta de 1739 a Johann Bernoulli, Euler describió su descubrimiento de la solución de las
ecuaciones lineales con coeficientes constantes por medio de la ecuación caracterı́stica: ‘después de tratar
el problema de muchas maneras, llegué a mi solución de forma totalmente inesperada. Antes de ello no
sospechaba que la solución de ecuaciones algebraicas tuviese tanta importancia en este asunto’.
12.3. Solución general 301
En el Ejemplo 12.3 la ecuación caracterı́stica tiene dos raı́ces reales distintas de manera
que y1 e y2 son linealmente independientes y la solución general es una combinación
lineal de ellas. La naturaleza de las raı́ces depende del discriminante a2 − 4b. Si a y b
son números reales, los tres tipos posibles son
(i) a2 − 4b > 0 dos raı́ces reales distintas

(ii) a2 − 4b = 0 una raı́z real doble
(iii) a2 − 4b < 0 una pareja de raı́ces complejas conjugadas
(i) Dos raı́ces reales distintas
Las raı́ces vienen dadas por (12.8), las soluciones particulares por (12.9) y, al igual
que en el Ejemplo 12.3, la solución general es
y(x) = c1 y1 (x) + c2 y2 (x) = c1 eλ x + c2 eλ x .

1 2
(12.10)
(ii) Una raı́z real doble
Cuando a2 − 4b = 0 las dos raı́ces de (12.8) son iguales, con λ1 = λ2 = −a/2. Por
lo tanto sólo se obtiene una solución particular de la ecuación caracterı́stica:
y1 (x) = eλ x = e−ax/2 .
1
(12.11)
Dada una solución particular de una ecuación homogénea, siempre se puede obtener una
segunda. En este caso una segunda solución, linealmente independiente de la primera,
es
y2 (x) = xy1 (x) = xe−ax/2 . (12.12)
Se demuestra que esto es una solución sustituyéndolo en la ecuación diferencial: tenemos
dy2 d2 y2
= 1 − ax/2 e−ax/2 , = – a + a 2
x/4 e−ax/2 ,
dx dx2
de manera que

d2 y2 dy2 a2 x −ax/2 ax −ax/2
+ a + by2 = −a + e + a 1 − e + bxe−ax/2
dx2 dx 4 2

a2 x a2 x
= −a + +a− + bx e−ax/2
4 2
2
ax x
= − + bx e−ax/2 = − (a2 − 4b) e−ax/2
4 4
= 0,
ya que a2 − 4b = 0. La solución general es por lo tanto en este caso
y(x) = c1 e−ax/2 + c2 xe−ax/2 = (c1 + c2 x)e−ax/2 . (12.13)
EJEMPLO 12.4 Resuelva la ecuación diferencial

y − 4y + 4y = 0 .
La ecuación caracterı́stica
λ2 − 4λ + 4 = (λ − 2)2 = 0
tiene la raı́z doble λ = 2. Dos soluciones particulares son por lo tanto e2x y xe2x , y la solución general es
y(x) = (c1 + c2 x)e2x .
(iii) Raı́ces complejas

Cuando el discriminante a2 − 4b de la ecuación cuadrática caracterı́stica (12.7) es
negativo, las raı́ces son una pareja de números complejos conjugados.
EJEMPLO 12.5 Resuelva la ecuación diferencial

y − 2y + 2y = 0 .
La ecuación caracterı́stica es
λ2 − 2λ + 2 = 0
1 √
y las raı́ces son λ = (2 ± 4 − 8 ), o
2
λ1 = 1 + i , λ2 = λ∗1 = 1 − i .
Por lo tanto dos soluciones particulares son
y1 (x) = eλ1 x = e(1+i)x , y2 (x) = eλ2 x = e(1−i)x ,
que son linealmente independientes, y la solución general es
y(x) = c1 e(1+i)x + c2 e(1−i)x = ex (c1 eix + c2 e−ix ) .
Ésta es la forma exponencial de la solución. Se puede dar una forma trigonométrica expresando e±ix me-
diante sen x y cos x a través de la fórmula de Euler (ecuaciones (8.33) y (8.34)),
e±ix = cos x ± i sen x .
Entonces
y(x) = ex [c1 ( cos x + i sen x) + c2 ( cos x − i sen x)]
= ex [(c1 + c2 ) cos x + i(c1 − c2 ) sen x]
= ex (d1 cos x + d2 sen x) ,
donde d1 = c1 + c2 y d2 = i(c1 − c2 ) son (nuevas) constantes arbitrarias.

12.4. Soluciones particulares 303
En el caso complejo general, las raı́ces de la ecuación caracterı́stica (12.7) son, a partir
de (12.8),

a a 2
λ=− ± − b,
2 2
donde en este caso (a/2)2 − b < 0. Sea (a/2)2 − b = −ω 2 , siendo ω real. Entonces

a 2 √ √
− b = −ω 2 = −1 ω = iω
2
y las raı́ces son

a a
λ1 = − + iω , λ2 = − − iω . (12.14)
2 2
Dos soluciones particulares de la ecuación diferencial son por lo tanto
y1 (x) = e(−a/2+iω)x , y2 (x) = e(−a/2−iω)x , (12.15)
y por tratarse de funciones linealmente independientes (si ω = 0), la solución general es
y(x) = c1 y1 (x) + c2 y2 (x) = e−ax/2 (c1 eiωx + c2 e−iωx ) . (12.16)
La forma trigonométrica de la solución general es (véase el Ejemplo 12.5)
y(x) = e−ax/2 (d1 cos ωx + d2 sen ωx) (12.17)
con d1 = c1 + c2 y d2 = i(c1 − c2 ).
12.4. Soluciones particulares

Las dos constantes arbitrarias c1 y c2 de la solución general
y(x) = c1 y1 (x) + c2 y2 (x)
se determinan normalmente en aplicaciones fı́sicas mediante dos condiciones (dos por

ser dos las constantes) de alguna de las dos maneras siguientes.
(a) Condiciones iniciales

Se especifican los valores de la función y(x) y también de su derivada y (x) para algún
valor de x:
y(x0 ) = y0 , y (x0 ) = y1 . (12.18)

Una ecuación diferencial de segundo orden con condiciones iniciales se llama un pro-
blema de valor inicial.
EJEMPLO 12.6 Resuelva el problema de valor inicial

y + y − 6y = 0 , y(0) = 0 , y (0) = 5 .
La ecuación caracterı́stica es λ2 + λ − 6 = (λ − 2)(λ + 3) = 0, con raı́ces λ1 = 2 y λ2 = −3. La solución
general es
y(x) = c1 e2x + c2 e−3x
con derivada primera
y (x) = 2c1 e2x − 3c2 e−3x .
Entonces
y(0) = 0 = c1 + c2 , y (0) = 5 = 2c1 − 3c2 ,
cuya solución es c1 = 1, c2 = −1. La solución del problema de valor inicial es por lo tanto
y(x) = e2x − e−3x .
Las condiciones iniciales se asocian normalmente con aplicaciones en dinámica, siendo

x la variable tiempo.
(b) Condiciones de contorno

En muchas aplicaciones en las ciencias fı́sicas la variable x es una coordenada y la
situación fı́sica se determina por condiciones del valor de y(x) en la frontera del sistema.
Las condiciones
y(x1 ) = y1 , y(x2 ) = y2 , (12.19)
se llaman condiciones de contorno, y x1 y x2 son los extremos del intervalo x1 ≤ x ≤

x2 en el cual está definida la ecuación diferencial. Una ecuación diferencial con unas
condiciones de contorno se llama un problema de contorno.
EJEMPLO 12.7 Resuelva el problema de contorno

y − 2y + 2y = 0 , y(0) = 1 , y(π/2) = 2 .
La ecuación diferencial es la que hemos resuelto en el Ejemplo 12.5, con solución general (en forma trigo-
nométrica)
y(x) = ex (d1 cos x + d2 sen x) .
Aplicando las condiciones de contorno
y(0)=1= e0 (d1 cos 0 + d2 sen 0) = d1 , y(π/2)=2= eπ/2 (d1 cos π/2 + d2 sen π/2) = d2 eπ/2 .
Por lo tanto d1 = 1, d2 = 2e−π/2 y la solución del problema de contorno es
y(x) = ex (cos x + 2e−π/2 sen x) .

12.4. Soluciones particulares 305
EJEMPLO 12.8 Resuelva el problema de contorno

y + y − 6y = 0 , y(0) = 1 , y(x) → 0 cuando x → ∞ .
La ecuación diferencial es la del Ejemplo 12.6, con solución general
y(x) = c1 e2x + c2 e−3x .

La primera de las condiciones de contorno nos da
y(0) = 1 = c1 + c2 .
La segunda condición supone que la solución tiende a cero cuando x tiende a infinito. La función e−3x tiene
esa propiedad pero la función e2x tiene que ser eliminada. La condición supone por lo tanto que tomemos
c1 = 0. Entonces c2 = 1 y la solución del problema de contorno es
y(x) = e−3x .
La ecuación y + ω 2 y = 0
En los ejemplos 12.6 a 12.8, las dos condiciones aplicadas a la solución de la ecuación
diferencial son suficientes para especificar una solución particular. En algunos casos, sin
embargo, cuando en la ecuación diferencial hay parámetros por determinar, se necesitan
una o más condiciones adicionales para especificar completamente la solución. Varios
ejemplos de esas ecuaciones se tratan en el Capı́tulo 13. Uno de los ejemplos sencillos
más importantes en las ciencias fı́sicas es la ecuación
d2 y
+ ω2 y = 0 , (12.20)
dx2
donde ω es un número real. La solución general viene dada bien sea por (12.16) con
a = 0,
y(x) = c1 eiωx + c2 e−iωx , (12.21)
o por la forma trigonométrica equivalente (12.17),
y(x) = d1 cos ωx + d2 sen ωx . (12.22)
Si ω es una constante dada, las dos condiciones iniciales o de contorno son suficientes
para especificar una solución particular. Esto se ve, por ejemplo, en el Apartado 12.5
para el oscilador armónico como problema de valor inicial. Sin embargo, si ω es un
parámetro por determinar, es necesaria una condición adicional. Éste es el caso de la
‘partı́cula en un pozo’ en mecánica cuántica, como problema de contorno, que tratamos
en el Apartado 12.6.
Una tercera posibilidad se produce cuando la situación fı́sica necesita que se cumpla
una condición de contorno periódica (cı́clica)(véase el Apartado 8.6)
y(x + λ) = y(x) , (12.23)

donde λ es el periodo. En este caso, sustituir x por x + λ en la solución general (12.21)

nos da
y(x + λ) = c1 eiω(x+λ) + c2 e−iω(x+λ) = c1 eiωx eiωλ + c2 e−iωx e−iωλ .
La condición (12.23) se cumple entonces si eiωλ = 1 y e−iωλ = 1, simultáneamente.

Como vimos en el Apartado 8.6, esto ocurre si ωλ es un múltiplo de 2π,
ωλ = 2πn , n = 0, ±1, ±2, ±3, . . . (12.24)
Los valores posibles de ω son entonces ωn = 2πn/λ (utilizando n para etiquetar los
valores), y las correspondientes soluciones son
yn (x) = c1 e(2πnx/λ)i + c2 e−(2πnx/λ)i , n = 0, ±1, ±2, ±3, . . . (12.25)
La forma trigonométrica de estas soluciones es
2πnx 2πnx
yn = d1 cos + d2 sen . (12.26)
λ λ
Las constantes c1 y c2 , o d1 y d2 , no están determinadas. En el Apartado 12.7 tratamos un
ejemplo del caso de condiciones de contorno periódicas con el problema de la ‘partı́cula
en un aro’ en mecánica cuántica.
12.5. El oscilador armónico
Figura 12.1
El oscilador armónico (lineal) simple (Figura 12.1) consiste en un cuerpo que se mueve
en lı́nea recta bajo la acción de una fuerza
F = −kx (12.27)
cuya magnitud es proporcional al desplazamiento x del cuerpo con respecto al punto

fijo O, el punto de equilibrio, y cuya dirección es hacia ese punto. La cantidad k se llama
constante de la fuerza y el signo negativo nos asegura que la fuerza actúa en la dirección
opuesta al desplazamiento.
Por la segunda ley de Newton, la aceleración que sufre el cuerpo viene dada por
d2 x
F=m (12.28)
dt2
12.5. El oscilador armónico 307
y el movimiento armónico simple se describe entonces con la ecuación diferencial
d2 x
m = −kx . (12.29)
dt2
Una gran variedad de sistemas fı́sicos se pueden modelar mediante el movimiento armóni-
co simple: las oscilaciones de una balanza de resorte (la ecuación (12.27) se llama en-
tonces ley de Hooke), el balanceo de un péndulo, las oscilaciones de un trampolı́n y, de
importancia en quı́mica, las vibraciones de los átomos en las moléculas o cristales.
EJEMPLO 12.9 Vibraciones de moléculas diatómicas

Las vibraciones de una molécula diatómica se modelan a menudo mediante el potencial de Morse
2
V(R) = De 1 − e−a(R−Re ) (12.30)
donde (Figura 12.2) R es la distancia entre los núcleos, Re es la
distancia en el equilibrio (la longitud de enlace de equilibrio),
De es la energı́a de disociación de la molécula y a es una cons-
tante (las vibraciones de la molécula pueden visualizarse como
una bola rodando adelante y atrás en el ‘pozo de potencial’ de
la Figura 12.2). Una molécula estable, en su estado vibracional
fundamental o en uno poco excitado experimenta únicamente
pequeños desplazamientos R − Re en torno al equilibrio. Enton-
ces, desarrollando la energı́a potencial V(R) en serie de poten-
cias de (R − Re ),
V = De [a2 (R − Re )2 − a3 (R − Re )3 + · · · ]
≈ a2 De (R − Re )2 . (12.31)
Figura 12.2
La fuerza que actúa entre los núcleos de la molécula es (véase el Apartado 5.7, ecuación (5.57))
dV
F=− . (12.32)
dR
Por lo tanto, derivando (12.31) tenemos para pequeños desplazamientos
F ≈ −2a2 De (R − Re ) . (12.33)
Si k = 2a2 De y x = (R − Re ), la fuerza es F ≈ −kx, y las vibraciones de la moléculas son (aproximada-

mente) armónicas simples.
La ecuación (12.29) puede escribirse en la forma estándar (12.3) de una ecuación lineal
homogénea con coeficientes constantes,
d2 x k
+ x=0 (12.34)
dt2 m
o, definiendo k/m = ω 2 , en la forma de la ecuación (12.20),
d2 x
+ ω2 x = 0 , (12.35)
dt2
con solución general, en forma trigonométrica,
x(t) = d1 cos ωt + d2 sen ωt . (12.36)
El estado del sistema queda determinado por las condiciones iniciales. Por ejemplo, sean
el desplazamiento y la velocidad en el instante t = 0
x(0) = A , x (0) = 0 . (12.37)
Entonces, para el desplazamiento inicial
x(0) = A = d1 cos 0 + d2 sen 0 = d1 ,
y para la velocidad:
x (t) = −d1 ω sen ωt + d2 ω cos ωt

x (0) = −d1 ω sen 0 + d2 ω cos 0 = d2 ω = 0 .
Por lo tanto d1 = A, d2 = 0, y la solución del problema de valor inicial es
x(t) = A cos ωt . (12.38)
La gráfica de la solución se muestra en la Figura 12.3. El desplazamiento máximo del

cuerpo con respecto al equilibrio es la amplitud A. La longitud de onda de la curva es
el periodo τ = 2π/ω, el tiempo necesario para una oscilación completa. El inverso del
periodo, ν = 1/τ = ω/2π, se denomina frecuencia de oscilación, el número de osci-
laciones por unidad de tiempo. La cantidad ω = 2πν se denomina frecuencia angular.
La frecuencia de oscilación está relacionada con la constante de la fuerza k a través de
ω 2 = k/m:

k 1 k
ω= , ν= . (12.39)
m 2π m
Figura 12.3
12.5. El oscilador armónico 309
Análisis energético
El oscilador armónico es un sistema conservativo (véase el Apartado 5.7) y la fuerza
F = −kx es la derivada de la función energı́a potencial, F = −dV/dx. La energı́a
potencial es por lo tanto la integral

dV 1
V(x) = dx = − F dx = kx2 + c .
dx 2
La energı́a potencial se elige, por convenio, que sea cero en la posición de equilibrio,
cuando x = 0. Entonces
1
V = kx2 . (12.40)
2
La energı́a cinética es T = mv2 /2, donde v es la velocidad, y la energı́a total es E =
T + V. Para el estado del sistema descrito por la solución (12.38),
x = A cos ωt , v = x = −Aω sen ωt ,
de manera que
1 1
V = kx2 = kA2 cos2 ωt ,
y 2 2
1 1 1
T = mv2 = mω 2 A2 sen2 ωt = kA2 sen2 ωt ,
2 2 2
ya que ω 2 = k/m. La energı́a total es por lo tanto la constante
1
E = T + V = kA2 . (12.41)
2
Figura 12.4
La relación entre las energı́as potencial y cinética se muestra en la Figura 12.4.

En el desplazamiento máximo con respecto al equilibrio, x = A, la energı́a potencial
alcanza su valor máximo, V = E, y la energı́a cinética es cero. A medida que el cuerpo
se acerca a la posición de equilibrio, la energı́a potencial se convierte en energı́a cinética
y, a x = 0, V = 0 y la energı́a cinética alcanza el máximo, T = E.
12.6. Partı́cula en un pozo unidimensional
La partı́cula en un ‘pozo de potencial unidimensional con paredes infinitas’ es el

nombre dado a un sistema que consiste en un cuerpo que puede moverse libremente
sobre un segmento de recta de longitud finita. En mecánica cuántica éste es uno de los
sistemas más sencillos que ilustran la cuantización de la energı́a.
La ecuación de Schrödinger para una partı́cula de masa m que se mueve en la direc-
ción x es
2 d2 ψ(x)
− + V(x)ψ(x) = Eψ(x) (12.42)
2m dx2
donde V(x) es la energı́a potencial de la partı́cula en la
posición x, E es la energı́a total (constante) y ψ es la
función de onda. Para este sistema la función energı́a
potencial es (Figura 12.5)
V(x) = 0 para 0 < x < l ,

= ∞ para x ≤ 0 y x ≥ l . (12.43)
Figura 12.5
El valor constante de V dentro del pozo asegura que en esa región no se ejerce fuerza
alguna sobre la partı́cula. Tomar V = 0 supone que la energı́a E es la energı́a cinética
(positiva) de la partı́cula. El valor infinito de V en las ‘paredes’ y fuera del pozo asegura
que la partı́cula no puede salir del pozo: en mecánica cuántica eso significa que la función
de onda es cero en las paredes y fuera del pozo.
Para la partı́cula dentro del pozo tenemos por lo tanto el problema de contorno
2 d2 ψ(x)
− = Eψ(x) (12.44)
2m dx2
con las condiciones de contorno
ψ(0) = ψ(l) = 0 . (12.45)
La ecuación (12.44) es idéntica en su forma a la ecuación (12.20), o a la ecuación (12.35)

para el oscilador armónico. En efecto: tomando
2mE
ω2 = (12.46)
2
12.6. Partı́cula en un pozo unidimensional 311
tenemos
d2 ψ
+ ω2 ψ = 0 (12.47)
dx2
con solución general, en forma trigonométrica,
ψ(x) = d1 cos ωx + d2 sen ωx . (12.48)
Aplicamos ahora las condiciones de contorno (12.45). A t = 0,
ψ(0) = d1 cos 0 + d2 sen 0 = d1 = 0
y a x = l (tomando d1 = 0 en (12.48)),
ψ(l) = d2 sen ωl = 0 . (12.49)
Como la función seno sólo se anula si su argumento es un múltiplo de π, se deduce que

ωl = nπ siendo n un entero:
nπ
ω= , n = 0, ±1, ±2, . . . (12.50)
l
Las soluciones del problema de contorno son por lo tanto
nπx
ψn (x) = d2 sen , n = 1, 2, 3, . . . (12.51)
l
donde las soluciones posibles aparecen etiquetadas por el número cuántico n. El valor
n = 0 se ha descartado ya que la solución trivial ψ0 (x) = 0 no es una solución fı́sica,
y los valores negativos de n se descartan porque ψ−n (x) = −ψn (x) es sencillamente ψn
cambiada de signo.
Para cada una de las soluciones ψn existe una energı́a
n2 h 2
En = (12.52)
8ml2
(usando que E = 2 ω 2 /2m = h2 ω 2 /8π 2 m). Vemos que la cuantificación de la energı́a
es una consecuencia de restringir el movimiento de la partı́cula a una región finita del
espacio mediante las condiciones de contorno: este es un resultado general en mecánica
cuántica. Señalamos que estos resultados no se limitan al movimiento sobre una lı́nea
recta: también son válidos para cualquier curva de longitud l con la variable x medida
sobre la curva.
Las funciones de onda (12.51) no están completamente determinadas porque el coefi-
ciente d2 no ha sido definido. Para determinar d2 recurrimos a la interpretación mecánico-
cuántica del cuadrado de la función de onda como la densidad de probabilidad (véase
también el ejemplo 10.3):
ψ 2 (x) dx = probabilidad de que la partı́cula esté en el elemento dx en la posición x
La probabilidad total de que la partı́cula esté en el pozo es 1 de manera que, integrando

para toda la longitud del pozo,
l l
nπx l
1= ψ (x) dx = d2
2 2
sen2 dx = d2 2 .
0 0 l 2

Por lo tanto d2 = 2/l, y las soluciones normalizadas son

2 nπx
ψn (x) = sen . (12.53)
l l
Las gráficas de estas soluciones se representan en la Figura 12.6 para los tres primeros
valores de n.
Figura 12.6
Estas gráficas muestran cómo la función de onda ψn tiene (n−1) ceros, o nodos, entre
los extremos. Esto ilustra una propiedad general de las funciones de onda: el número de
ceros (puntos, curvas o superficies nodales) aumenta a medida que la energı́a del sistema
aumenta.
El caso de la partı́cula en un pozo es importante en las ciencias fı́sicas no sólo como
uno de los problemas más sencillos resolubles que ilustra el fenómeno de la cuantización,
sino también porque el sistema, generalizado a tres dimensiones, se utiliza en termo-
dinámica estadı́stica para obtener las propiedades termodinámicas de los gases ideales.
Empleamos ahora las soluciones (12.53) para hacer ver una propiedad importante de las
soluciones de la ecuación de Schrödinger.
Ortogonalidad
La ecuación de Schrödinger para la partı́cula en un pozo puede escribirse como

2 d2
− ψ = Eψ
2m dx2
o bien Hψ = Eψ , (12.54)
12.6. Partı́cula en un pozo unidimensional 313
donde el operador diferencial
2 d2
H=− (12.55)
2m dx2
se denomina operador hamiltoniano, o sencillamente hamiltoniano, del sistema. El
efecto de operar con H sobre ψ es generar un múltiplo de ψ. La ecuación de Schrödin-
ger (independiente del tiempo) siempre puede escribirse en la forma (12.54) como una
ecuación de autovalores, con el sistema especificado por el operador hamiltoniano y
condiciones de contorno adecuadas. Las funciones de onda permitidas ψ = ψn se deno-
minan autofunciones del hamiltoniano, y las energı́as correspondientes E = En son los
autovalores de H.
Una propiedad importante de las autofunciones es su ortogonalidad. En este caso
concreto, consideramos la integral
l
I= ψm (x)ψn (x) dx (12.56)

0
donde ψm y ψn son dos autofunciones (12.53) distintas. Entonces

l
2 mπx nπx
I = sen sen dx
l 0 l l
= 0 si m = n . (12.57)
Demostración. Evaluamos la integral utilizando las propiedades de la suma de funciones trigonométricas

que vimos en el Apartado 6.2. Tenemos

mπx nπx 1 (m − n)πx (m + n)πx
sen sen = cos − cos
l l 2 l l
de manera que

1 l
(m − n)πx 1 l
(m + n)πx
I= cos dx − cos dx .
2 0 l 2 0 l
Ahora bien,
l
l
(m ± n)πx l (m ± n)πx
cos dx = sen
0 l (m ± n)π l 0

l
= sen (m ± n)π − sen 0
(m ± n)π
= 0,
ya que sen 0 = 0 y que el seno de un múltiplo, m ± n, de π también es cero.

Se deduce por lo tanto que

l
ψm (x)ψn (x) dx = 0 si m = n . (12.58)

0
Las funciones se dice que son ortogonales. Para las funciones de onda normalizadas,
l
que cumplen 0 ψn (x)ψn (x) dx = 1, podemos escribir

l
1 si m = n,
ψm (x)ψn (x) dx = δmn = (12.59)
0 0 si m = n.
La cantidad δmn , que es 1 si m = n y 0 si m = n, se llama delta de Kronecker. Las funcio-

nes que cumplen (12.59) se dice que son ortonormales (ortogonales y normalizadas).
12.7. Partı́cula en un aro

La ecuación de Schrödinger para una partı́cula de masa m que se mueve libremente
en un cı́rculo de radio r es, Figura 12.7,
2 d2 ψ(θ)
H ψ(θ) = − = Eψ(θ) (12.60)
2I dθ2
donde E es la energı́a cinética (positiva) de la partı́cula e I =
mr2 es su momento de inercia con respecto al centro del cı́rculo.
Tomando
2IE
ω2 = (12.61)
2
tenemos
d2 ψ Figura 12.7
+ ω2 ψ = 0 (12.62)
dθ2
cuya solución general, en forma exponencial, es
ψ(θ) = c1 eiωθ + c2 e−iωθ . (12.63)
Para que la función de onda sea continua en el cı́rculo tiene que cumplir la condición de
contorno periódica
ψ(θ + 2π) = ψ(θ) . (12.64)
Las ecuaciones (12.62) y (12.64) son el problema de contorno tratado en el Apartado

12.4, cambiando x por θ y λ por 2π. Los valores de ω permitidos son por lo tanto ωn = n,
12.7. Partı́cula en un aro 315
y las correspondientes soluciones, o autofunciones, son
ψn (θ) = c1 einθ + c2 e−inθ , n = 0, ±1, ±2, . . . (12.65)
con autovalores
2 n2
En = . (12.66)
2I
Señalamos que los estados del sistema con número cuántico n = 0 aparecen en pares
degenerados, ψn y ψ−n ,
H ψn = En ψn , H ψ−n = En ψ−n .
Por el principio de superposición (Apartado 12.2), toda combinación lineal de una pareja
de autofunciones degenerada es a su vez una autofunción con el mismo autovalor,
H (aψn + bψ−n ) = En (aψn + bψ−n )
donde a y b son arbitrarios. Distinguir entre estados degenerados de un sistema mecánico-

cuántico sólo es posible fı́sicamente aplicando una fuerza externa para romper la dege-
neración. En ausencia de tal fuerza, por lo tanto, cualquier elección de los coeficientes
c1 y c2 es igual de buena. Por convenio se toma c2 = 0 en (12.65), con lo cual se obtiene
el conjunto de autofunciones
ψn (θ) = c1 einθ , n = 0, ±1, ±2, . . . (12.67)
y se escoge c1 de manera a normalizar las funciones. La condición de normalización para

funciones complejas es
2π
ψn∗ (θ)ψn (θ) dθ = 1 (12.68)

0
donde ψ∗n(θ) = c∗1 e−inθ es la función complejo-conjugada de ψn (θ). Entonces

2π 2π 2π
ψ (θ)ψn (θ) dθ = |c1 |

∗
n
2
e dθ = |c1 |
−inθ inθ
e 2
dθ = 2π|c1 |2
0 0 0
√
y esto es 1 si c1 = 1/ 2π. Las autofunciones normalizadas son por lo tanto
1
ψn (θ) = √ einθ , n = 0, ±1, ±2, . . . (12.69)
2π
Estas funciones constituyen un conjunto ortonormal en el intervalo 0 ≤ θ ≤ 2π; son

ortogonales y a la vez están normalizadas:
2π
ψ∗n(θ)ψm (θ) dθ = 0 si n = m . (12.70)

0
EJEMPLO 12.10 Demuestre que las funciones ψ1 y ψ2 cumplen la ecuación (12.70).
Tenemos
2π 2π 2π
1 1
ψ∗1 (θ)ψ2 (θ) dθ = e−iθ e2iθ dθ = eiθ dθ
0 2π 0 2π 0
2π
1 1 iθ 1 2πi
= e = e −1
2π i 0 2πi
y esto es cero puesto que e2πi = 1.
Las funciones (12.69) pueden interpretarse como giros de la partı́cula, en sentido horario
si n > 0 y antihorarios si n < 0 (véase el Apartado 8.6, para el rotor rı́gido). Cuando
n = 0 se trata de funciones complejas, pero para algunas aplicaciones es más conveniente
tener soluciones de la ecuación de Schrödinger que sean funciones reales. El convenio
es utilizar funciones trigonométricas obtenidas mediante la fórmula de Euler. Tenemos
1
ψ±n (θ) = √ (cos nθ ± i sen nθ)
2π
y las combinaciones
1 1 1 1
√ (ψn + ψ−n ) = √ cos nθ , √ (ψn − ψ−n ) = √ sen nθ (12.71)
2 2 π i 2 2 π
son un conjunto ortonormal alternativo. Las simetrı́as de estas funciones se ilustran en

la Figura 12.8.
Figura 12.8
Señalamos que estas simetrı́as son también las simetrı́as alrededor del eje molecular
de los orbitales moleculares en una molécula lineal, con n = 0 para orbitales σ, n = ±1
para π, n = ±2 para δ, y ası́ sucesivamente.
12.8. Ecuaciones lineales no homogéneas 317
El caso general
Si se unen los extremos del pozo que vimos en el Apartado 12.6 para formar un
contorno cerrado simple, la ecuación de Schrödinger no varı́a
d2 ψ 2mE
+ ω2 ψ = 0 , ω2 = , (12.72)
dx2 2
si la variable x se mide a lo largo del contorno. Pero las dos condiciones de contorno
(12.45) han de ser sustituidas por una única condición periódica
ψ(x + l) = ψ(x) . (12.73)
Las ecuaciones (12.72) y (12.73) son el problema de contorno que hemos tratado en el
Apartado 12.4 (sustituyendo λ por l). Los valores permitidos de ω son ωn = 2πn/l, y las
soluciones vienen dadas en forma trigonométrica por la ecuación (12.26),
2πnx 2πnx
ψn (x) = d1 cos + d2 sen . (12.74)
l l
Estos resultados son válidos para cualquier contorno cerrado con la forma que sea. Los
resultados para el cı́rculo de radio r se obtienen sustituyendo l por la circunferencia 2πr
y la variable x por rθ.
12.8. Ecuaciones lineales no homogéneas

La ecuación general lineal de segundo orden no homogénea con coeficientes cons-
tantes es
d2 y dy
+ a + by = r(x) , (12.75)
dx2 dx
siendo a y b constantes. Mediante métodos elementales se pueden hallar soluciones par-
ticulares para varios tipos importantes de la inhomogeneidad r(x).
EJEMPLO 12.11 Halle una solución particular de la ecuación

y + 3y + 2y = 2x2 .
La forma de la función en el segundo miembro sugiere una solución del tipo
y = a0 + a1 x + a2 x2 .
Entonces
y = a1 + 2a2 x , y = 2a2 ,
y
y + 3y + 2y = (2a2 + 3a1 + 2a0 ) + (6a2 + 2a1 )x + 2a2 x2 .
Esto es igual a 2x2 si
(2a2 + 3a1 + 2a0 ) = 0 , (6a2 + 2a1 ) = 0 , a2 = 1 ,

de manera que a2 = 1, a1 = −3 y a0 = 7/2. Una solución particular es por lo tanto

7
y= − 3x + x2 .
2
El método empleado en este ejemplo es el método de coeficientes indeterminados,

siendo a0 , a1 y a2 los coeficientes por determinar en este caso. Vamos a ver primero
cómo se puede obtener la solución general, conocida una solución particular.
Sea yp (x) una solución particular de la ecuación no homogénea (12.75), de manera
que
d2 yp dyp
+a + byp = r(x) . (12.76)
dx 2
dx
Sea yh la solución general (12.5) de la correspondiente ecuación homogénea (12.3), que
se llama en este contexto la ecuación reducida:
yh (x) = c1 y1 (x) + c2 y2 (x) , (12.77)
d2 yh dyh
+a + byh = 0 . (12.78)
dx2 dx
Se deduce que la suma de esas dos funciones,
y(x) = yh (x) + yp (x) (12.79)
es también una solución de la ecuación no homogénea:

2 2
d2 y dy d yh dyh d yp dyp
+ a + by = +a + byh + +a + byp = r(x) ,
dx2 dx dx2 dx dx2 dx
donde hemos usado las ecuaciones (12.76) y (12.78). La función (12.79) tiene dos cons-
tantes arbitrarias y es la solución general de la ecuación no homogénea. La función yh
se llama a menudo función complementaria e yp una integral particular:
solución general = función complementaria + integral particular
EJEMPLO 12.12 Halle la solución general de la ecuación

y + 3y + 2y = 2x2 .
Por el ejemplo 12.11, una integral particular es
7
yp (x) = − 3x + x2 .
2
La ecuación reducida (homogénea) es
y + 3y + 2y = 0
12.8. Ecuaciones lineales no homogéneas 319
y su ecuación caracterı́stica es λ2 + 3λ + 2 = (λ + 1)(λ + 2) = 0, con raı́ces λ1 = −1 y λ2 = −2. La

solución general de la ecuación homogénea, la función complementaria, es por lo tanto
yh (x) = c1 e−x + c2 e−2x

y la solución general de la ecuación no homogénea es
7
y(x) = yh (x) + yp (x) = c1 e−x + c2 e−2x + − 3x + x2 .
2
El método de coeficientes indeterminados

Este método puede usarse para muchas de las funciones elementales r(x) en (12.75),
y lo resumimos en la Tabla 12.1 para varios de los tipos más importantes
Tabla 12.1
Término en r(x) Elección de yp
1. ceαx keαx
2. cx (n = 0, 1, 2, . . . )
n
a0 + a1 x + a2 x2 + · · · + an xn
3. c cos ωx o c sen ωx k cos ωx + l sen ωx
4. ceαx cos ωx o ceαx sen ωx eαx (k cos ωx + l sen ωx)
La tabla nos da la elección inicial de una integral particular yp correspondiente a cada

función r(x). Los coeficientes de yp se determinan sustituyendo yp en la ecuación no ho-
mogénea. El ejemplo 12.11 ilustra el método para el caso 2 de la tabla. Esto es suficiente
salvo si uno de los términos de yp es también una solución de la correspondiente ecuación
homogénea. En ese caso
(a) si la ecuación caracterı́stica de la ecuación homogénea tiene dos raı́ces distintas,

se multiplica yp por x antes de sustituir en (12.75), o
(b) si la ecuación caracterı́stica tiene una raı́z doble, se multiplica yp por x2 antes de
sustituir en (12.75).
Además, si r(x) es suma de dos o más términos, la solución particular total es la corres-
pondiente suma de las yp correspondientes.

y + 3y + 2y = 3e−2x .
Por el Ejemplo 12.12, la solución general de la ecuación homogénea es
yh (x) = c1 e−x + c2 e−2x .

Por la Tabla 12.1, caso 1, la elección de una integral particular deberı́a ser yp = ke−2x , pero esto es una
solución de la ecuación homogénea. Por la receta (a) usamos por lo tanto
yp = kxe−2x .
Entonces
yp = ke−2x − 2kxe−2x , yp = −4ke−2x + 4kxe−2x ,
de manera que
yp + 3yp + 2yp = −ke−2x
y esto es igual a 3e−2x si k = −3. Entonces yp = −3xe−2x y la solución general es
y(x) = yh (x) + yp (x) = c1 e−x + c2 e−2x − 3xe−2x .
y − 4y + 4y = e2x .

Por el Ejemplo 12.4, la ecuación caracterı́stica tiene la raı́z doble λ = 2, y la función complementaria es
yh (x) = (c1 + c2 x)e2x .
En este caso, por la receta (b), la función yp = ke2x se multiplica por x2 . Entonces
yp = kx2 e2x , yp = 2kxe2x + 2kx2 e2x , yp = 2ke2x + 8kxe2x + 4kx2 e2x ,
de manera que
yp − 4yp + 4yp = 2ke2x
y esto es igual a e2x si k = 1/2. La solución general es por lo tanto
1
y(x) = yh (x) + yp (x) = c1 + c2 x + x2 e2x .
2
12.9. Oscilaciones forzadas

Una ecuación importante en la teorı́a de oscilaciones forzadas en sistemas mecánicos
o eléctricos es la ecuación diferencial no homogénea
d2 x dx
m + c + kx = F0 cos ωt . (12.80)
dt2 dt
Esta es la ecuación del movimiento de un cuerpo sometido a la acción de la fuerza
d2 x dx
F=m = −kx − c + F0 cos ωt . (12.81)
dt2 dt
El término −kx nos indica que se trata de un oscilador armónico. El término −c dx/dt es
una ‘fuerza disipativa’ proporcional a la velocidad que representa, por ejemplo, la resis-
tencia al avance que encuentra el cuerpo al moverse en un fluido. El término F0 cos ωt es
una fuerza periódica externa que interactúa con el movimiento del oscilador. Por ejem-
plo, una fuerza q en presencia de un campo eléctrico experimenta una fuerza qE en la
dirección del campo. En el caso de un campo alterno, E = E0 cos ωt, la fuerza que actúa
12.9. Oscilaciones forzadas 321
sobre un electrón con carga q = −e, es −eE0 cos ωt. Si el electrón experimenta un mo-
vimiento armónico simple (en ausencia del campo) la fuerza total que actúa sobre él
es3
F = −kx − eE0 cos ωt . (12.82)
Esto es un ejemplo de (12.81) sin disipación, y es el caso que consideramos aquı́. Cuando
c = 0, la ecuación (12.80) tiene la forma
d2 x
+ ω02 x = A cos ωt , (12.83)
dt2

donde ω0 = k/m es la frecuencia angular del oscilador en ausencia de campo externo.
La cantidad ν0 = ω0 /2π se llama frecuencia natural del oscilador.
La solución general de la ecuación homogénea correspondiente a (12.83),
d2 x
+ ω20x = 0 ,
dt2
es (véase el Apartado 12.4)
xh (t) = d1 cos ω0 t + d2 sen ω0 t . (12.84)
Para la inhomogeneidad r(t) = A cos ωt en (12.83) tenemos la integral particular (caso 3

de la Tabla 12.1)
xp (t) = c cos ωt + d sen ωt .
Entonces
dxp d2 xp
= −ωc sen ωt + ωd cos ωt , = −ω 2 (c cos ωt + d sen ωt) ,
dt dt2
y
d 2 xp
+ ω02 xp = (ω02 − ω 2 )(c cos ωt + d sen ωt) .
dt2
Esto es igual a A cos ωt si d = 0 y c = A/(ω02 − ω 2 ). La integral particular es por lo tanto
A cos ωt
xp (t) = (12.85)
ω02 − ω 2
03. Euler expuso su solución al problema del oscilador armónico forzado ante la Academia de Cien-
cias de San Petersburgo el 30 de marzo de 1739.
y la solución general de la ecuación (12.83) para el oscilador en el campo externo es
x(t) = xh (t) + xp (t)

A cos ωt (12.86)
= d1 cos ω0 t + d2 sen ω0 t + .
ω02 − ω 2
La solución muestra que el comportamiento del sistema depende fuertemente de los

valores relativos de ω y ω0 . En particular, cuando la frecuencia ω de la fuerza externa
es próxima a la frecuencia natural del oscilador, la amplitud máxima de la oscilación
(el valor máximo de x(t)) es grande y tiende a infinito si ω → ω0 . Este fenómeno de
grandes oscilaciones se denomina resonancia, y es un factor importante en el estudio de
la mecánica tanto clásica como cuántica.
En el caso resonante, cuando ω = ω0 , la función (12.85) no es una integral particular
adecuada porque ella misma es solución de la ecuación homogénea. La función que
corresponde es (por la receta (a) del Apartado 12.8)
xp (t) = t(c cos ω0 t + d sen ω0 t) . (12.87)
Sustituyendo en (12.83) nos da c = 0 y d = A/2πω0 , y la integral particular es en este

caso
A
xp (t) = t sen ω0 t . (12.88)
2ω0
La gráfica de esta función (Figura 12.9) muestra cómo en el caso resonante la ampli-
tud de la oscilación crece indefinidamente con el tiempo. En los sistemas mecánicos la
resonancia se puede evitar aplicando una fuerza disipativa adecuada.
Figura 12.9
12.10. Ejercicios
Apartado 12.2
1. Demuestre que e−2x y e2x/3 son soluciones particulares de la ecuación diferencial
3y + 4y − 4y = 0, y escriba la solución general.
2. Demuestre que e3x y xe3x son soluciones particulares de la ecuación diferencial

y − 6y + 9y = 0, y escriba la solución general.
3. Demuestre que cos 2x y sen 2x son soluciones particulares de la ecuación diferencial

y + 4y = 0, y escriba la solución general.
Apartado 12.3
Halle la solución general de las ecuaciones diferenciales:
4. y − y − 6y = 0 5. 2y − 8y + 3y = 0 6. y − 8y + 16y = 0
7. 4y + 12y + 9y = 0 8. y + 4y + 5y = 0 9. y + 3y + 5y = 0
Apartado 12.4
Resuelva los problemas de valor inicial:
d2 x dx dx
10. + − 2x = 0 ; x(0) = 1 , (0) = 0
dt2 dt dt
d2 x dx dx
11. + 6 + 9x = 0 ; x(1) = 0 , (1) = 1
dt2 dt dt
d2 x dx
12. + 9x = 0 ; x(π/3) = 0 , (π/3) = −1
dt2 dt
d2 x dx dx
13. − 2 + 2x = 0 ; x(0) = 1 , (0) = 0
dt2 dt dt
Resuelva los problemas de contorno:
d2 y dy
14. + − 2y = 0 ; y(0) = 2 , y → 0 cuando x → ∞
dx2 dx
d2 y
15. + 9y = 0 ; y = 0 para x ≤ 0y x ≥ π
dx2
Apartado 12.5
16. Dado que la solución general de la ecuación de la ecuación del movimiento mẍ = −kx para el
oscilador armónico es x(t) = a cos ωt + b sen ωt, con ω = k/m,
1. demuestre que la solución puede escribirse en la forma x(t) = A cos (ωt − δ) donde A es la amplitud
y δ es el defasaje, y exprese A y δ en función de a y b;
2. halle la amplitud y el defasaje para las condiciones iniciales x(0) = 1 , ẋ(0) = ω.
Apartado 12.6
(i) Resuelva la ecuación de Schrödinger (12.44) para una partı́cula en un pozo con las condiciones
17. de contorno ψ(– l/2) = ψ(l/2) = 0.
(ii) Demuestre que las soluciones ψn son funciones pares de x cuando n es impar y funciones
impares cuando n es par.
(iii) Demuestre que las soluciones son las mismas que las dadas por (12.53) si se sustituye x por
x + l/2, salvo por un posible cambio de signo.
Apartado 12.7
18. Los diagramas de la figura 12.8 son la representación de los signos y nodos de las funciones de onda
reales (12.72). Dibuje los diagramas correspondientes a n = ±3 y n = ±4.
19. Compruebe que la ecuación (12.72) y sus soluciones (12.74) se transforman en (12.60) y (12.63)
mediante el cambio de variable θ = x/r.
Apartado 12.8
Halle la solución general de las ecuaciones diferenciales:
20. y − y − 6y = 2 + 3x 21. y − 8y + 16y = 1 − 4x3

22. y − y − 6y = 2e−3x 23. y − y − 2y = 3e−x

24. y − 8y + 16y = e 4x
25. y − y − 6y = 2 cos 3x
26. y + 4y = 3 sen 2x 27. y − y − 6y = 2 + 3x + 2e−3x + 2 cos 3x
Apartado 12.9
28. Un circuito RLC consiste en una resistencia (con resistencia R), una bobina de inducción (con induc-
tancia L) y un condensador (con capacidad C) conectados en serie con una fuente de f.e.m. E.
1. Utilice la ley del voltaje de Kirchhoff (Apartado 11.7) para demostrar que la corriente I(t) en el
circuito viene dada por la ecuación no homogénea
d2 I dI I dE
L +R + = .
dt2 dt C dt
2. Halle la solución de la ecuación homogénea (para E = 0), y confirme que decae exponencialmente
cuando t → ∞.
3. Demuestre que una integral particular para la f.e.m. periódica E(t) = E0 sen ωt es
Ip (t) = I0 sen (ωt − δ) ,

E0 S 1 √
donde I0 = √ , tg δ = y S = ωL − . (La cantidad R2 + S2 es la impedancia del
R2 +S 2 R ωC
circuito.)
Ecuaciones diferenciales de
segundo orden.
Algunas funciones especiales
13.1. Conceptos
Hemos visto en los Apartados 12.5 a 12.7 como tres problemas fı́sicos muy dife-
rentes se modelan mediante la misma ecuación diferencial: la ecuación (12.35) para el
oscilador armónico clásico como problema de valor inicial, la misma ecuación (12.47)
para una partı́cula mecánico-cuántica en un pozo como problema de contorno, y
(12.62) para una partı́cula mecánico-cuántica en un aro como problema de contorno pe-
riódico. Éste es un fenómeno común en el modelado matemático de los sistemas fı́sicos,
y varias ecuaciones son suficientemente importantes como para tener nombre. Algunas
se presentan en la Tabla 13.1
Tabla 13.1
Nombre Ecuación
Legendre (1 − x2 )y − 2xy + l(l + 1)y = 0
Legendre asociada (1 − x2 )y − 2xy + [l(l + 1) − m2 /(1 − x2 )]y = 0
Hermite y − 2xy + 2ny = 0

Laguerre xy + (1 − x)y + ny = 0
Laguerre asociada xy + (m + 1 − x)y + (n − m)y = 0
Bessel x2 y + xy + (x2 − n2 )y = 0
Las ecuaciones de la Tabla 13.1 son todas ecuaciones de segundo orden lineales con
coeficientes variables, y tienen soluciones particulares que juegan un papel importante en
las matemáticas de las ciencias fı́sicas. Estas soluciones se llaman a menudo funciones
especiales.
Los métodos estándar utilizados para resolver las ecuaciones de la Tabla 13.1, y mu-
chas otras ecuaciones diferenciales lineales en ciencias, son el método de series de po-
326 Capı́tulo 13. Ecuaciones diferenciales de segundo orden. Algunas funciones especiales
tencias, que describimos en el Apartado 13.2, y el método más general de Frobenius,

perfilado en el Apartado 13.3. El primero lo usamos en el Apartado 13.4 para obtener
las soluciones particulares de la ecuación de Legendre que tienen sentido fı́sico. Éstas
soluciones se llaman polinomios de Legendre y aparecen siempre que se formula un
problema en tres dimensiones usando coordenadas esféricas. Los demás apartados se
dedican a dar únicamente breves descripciones de las otras funciones especiales que son
soluciones de las ecuaciones presentadas en la Tabla 13.1.
13.2. El método de series de potencias

Muchas ecuaciones lineales de segundo orden importantes
y + p(x)y + q(x)y = r(x) (13.1)
tienen al menos una solución particular que puede expresarse como serie de potencias

∞
y(x) = a0 + a1 x + a2 x + a3 x + · · · =
2 3
am x m . (13.2)
m=0
Se sustituye la serie en la ecuación diferencial para determinar los números a0 , a1 , a2 , . . . ,

y las soluciones particulares se obtienen para un sistema fı́sico aplicando las condiciones
iniciales o de contorno adecuadas.
El método de series de potencias puede usarse cuando p(x), q(x) y r(x) son polinomios
o cuando pueden desarrollarse en series de potencias de x. Puede por lo tanto usarse
para resolver las ecuaciones de Legendre, asociada de Legendre y de Hermite (las dos
primeras se transforman a la forma estándar (13.1) dividiendo por (1 − x2 )).
Mostramos el método de series de potencias en los Ejemplos 13.1 y 13.2 resolvien-
do dos ecuaciones cuya solución ya conocemos: una ecuación de primer orden en el
Ejemplo 13.1 y una ecuación de segundo orden en el Ejemplo 13.2.
EJEMPLO 13.1 Use el método de series de potencias para resolver la ecuación

dy
+y=0
dx
cuya solución es y = ae−x (véase el Ejemplo 11.3(ii) con k = −1).
Por la ecuación (13.2), expresamos la solución como la serie de potencias

∞
y = a0 + a1 x + a2 x2 + a3 x3 + · · · = am xm .
m=0
Entonces
dy ∞
= a1 + 2a2 x + 3a3 x2 + · · · = mam xm−1 ,
dx m=1
y, sustituyéndolo en la ecuación diferencial,
dy
+ y = (a1 + 2a2 x + 3a3 x2 + · · · ) + (a0 + a1 x + a2 x2 + · · · )
dx
= (a1 + a0 ) + (2a2 + a1 )x + (3a3 + a2 )x2 + · · ·
13.2. El método de series de potencias 327
Para que esto se anule para todo valor de x (dentro del radio de convergencia de la serie) los coeficientes de
cada potencia de x deben ser cero:
a1 + a0 = 0 , 2a2 + a1 = 0 , 3a3 + a2 = 0 , . . .
de manera que
a1 a0 a2 a0
a1 = −a0 , a2 = − =+ , a3 = − = − , ...
2 2! 3 3!
(– 1)m a0
y, en general, am = . Por lo tanto,
m!

∞ ∞
a0 (– 1)m xm ∞
(– x)m
y= am xm = = a0 .
m=0 m=0
m! m=0
m!
Reconocemos esta serie infinita como el desarrollo en serie de potencias de la función e−x :
x2 x3 (– x)m
∞
e−x = 1 − x + − + ··· = .
2! 3! m=0
m!
Por lo tanto y = a0 e−x , siendo a0 una constante arbitraria.
EJEMPLO 13.2 Use el método de series de potencias para resolver la ecuación1

d2 y
+y=0
dx2
cuya solución es y = c cos x + d sen x (véase la ecuación (12.22) con ω = 1).
Por la ecuación (13.2), tenemos

∞
∞
∞
y= am xm , y = mam xm−1 , y = m(m − 1)am xm−2 .
m=0 m=1 m=2
Podemos expresar

∞
y = m(m − 1)am xm−2 = (2 × 1)a2 + (3 × 2)a3 x + (4 × 3)a4 x2 + · · ·
m=2

∞
= (m + 2)(m + 1)am+2 xm .
m=0
Entonces

∞
∞
y + y = am xm + (m + 2)(m + 1)am+2 xm
m=0 m=0
∞
= [am + (m + 2)(m + 1)am+2 ]xm
m=0
01. Leibniz descubrió la ecuación diferencial para la función seno en 1693 mediante un argumento
geométrico. Resolvió entonces la ecuación por un método equivalente al presentado en este ejemplo para
obtener la representación en series de potencias de la función. La posibilidad de representar funciones como
series de potencias fue un elemento vital en el desarrollo del cálculo tanto por parte de Leibniz como de
Newton.
y esto es cero si, por su parte, el coeficiente de cada potencia de x es cero:

am + (m + 2)(m + 1)am+2 = 0 .
Para los valores de m pares
a0 a2 a0 a4 a0
a2 = − , a4 = − =+ , a6 = − = − , ...
2×1 4×3 4! 6×5 6!
y para los valores impares de m
a1 a1 a3 a1 a5 a1
a3 = − =− , a5 = − =+ , a7 = − = − , ...
3×2 3! 5×5 5! 7×6 7!
Por lo tanto
y = [a0 + a2 x2 + a4 x4 + · · · ] + [a1 x + a3 x3 + a5 x5 + · · · ]

x2 x4 x6 x3 x5 x7
= a0 1 − + − + · · · + a1 x − + − + ··· .
2! 4! 6! 3! 5! 7!
Reconocemos en las dos series entre corchetes los desarrollos en serie de potencias de cos x y sen x. Por lo
tanto y = a0 cos x + a1 sen x, donde a0 y a1 son constantes arbitrarias.
13.3. El método de Frobenius

El método de Frobenius2 es una extensión del método de series de potencias utili-
zado para resolver ecuaciones lineales de segundo orden que pueden ser escritas en la
forma
b(x) c(x)
y + y + 2 y = 0, (13.3)
x x
donde b(x) = xp(x) y c(x) = x2 q(x) son polinomios o pueden desarrollarse en series de
potencias de x. Incluye como caso particular el método de series de potencias sencillo
que hemos tratado en el apartado anterior y puede usarse para todas las ecuaciones de
la Tabla 13.1, y para muchas de las ecuaciones lineales en ciencias. Sólo damos aquı́ un
breve resumen de este método.
Toda ecuación diferencial de la forma (13.3) tiene al menos una solución que puede
expresarse como

∞
y(x) = xr (a0 + a1 x + a2 x2 + a3 x3 + · · · ) = xr am x m (13.4)

m=0
donde r (que puede ser cero) es un parámetro indicial por determinar y a0 = 0. Vamos
a tratar primero el caso b(x) = b0 , c(x) = c0 , donde b0 y c0 son constantes:
x2 y + b0 xy + c0 y = 0 (ecuación de Euler-Cauchy) (13.5)
02. Georg Frobenius (1849-1917), matemático alemán, también conocido por su trabajo en álgebra
matricial. Organizó en 1878 en una monografı́a la teorı́a de matrices en su forma actual.
13.3. El método de Frobenius 329
(hemos multiplicado la ecuación por x2 , por conveniencia). Tenemos

y = x r a0 + a 1 x + · · ·

y = xr−1 ra0 + (r + 1)a1 x + · · · (13.6)

y = xr−2 r(r − 1)a0 + (r + 1)ra1 x + · · ·
y sustituyendo en (13.5) obtenemos

xr r(r − 1)a0 + (r + 1)ra1 x + · · ·

+ b0 xr ra0 + (r + 1)a1 x + · · · + c0 xr a0 + a1 x + · · · = 0 . (13.7)
En esta ecuación, el coeficiente de cada potencia de x tiene que ser cero de manera que,
para el coeficiente de xr ,
r(r − 1) + b0 r + c0 = 0 . (13.8)
Esto se denomina ecuación indicial, y sus raı́ces son los valores posibles del parámetro
r en (13.4).
EJEMPLOS 13.3 Ecuaciones indiciales para ecuaciones de Euler-Cauchy
1 1
(i) x2 y − xy + y = 0
2 2
r 1
La ecuación indicial es r(r − 1) − + = 0 con raı́ces r1 = 1 y r2 = 1/2.
2 2
(ii) x2 y − xy + y = 0
La ecuación indicial es r(r − 1) − r + 1 = (r − 1)2 = 0 con raı́z doble r1 = r2 = 1.
(iii) x2 y + xy + y = 0
La ecuación indicial es r(r − 1) + r + 1 = 0 con raı́ces complejas ±i.
Cuando en (13.3) b(x) y c(x) no son constantes, b0 y c0 son, respectivamente, los términos
constantes de sus desarrollos en potencias de x.
Una vez determinados los valores del parámetro indicial, la resolución de la ecuación
diferencial puede seguir como en el método de series de potencias. La solución general
es
y(x) = c1 y1 (x) + c2 y2 (x) (13.9)
donde c1 y c2 son constantes arbitrarias, e y1 (x) e y2 (x) son soluciones particulares inde-
pendientes. Al menos una de las dos, y1 (x) o y2 (x), tiene la forma (13.4) y la otra depende
de las soluciones de la ecuación indicial, r1 y r2 . Tenemos los tres casos siguientes.
1 Raı́ces distintas que no difieren en un entero
Tanto y1 como y2 tienen la forma (13.4),
y1 (x) = xr (a0 + a1 x + a2 x2 + · · · ) ,
1
(13.10a)
y2 (x) = xr (A0 + A1 x + A2 x2 + · · · ) .
2
(13.10b)
2 Raı́z doble
Si r1 = r2 = r, una solución tiene la forma (13.4),
y1 (x) = xr (a0 + a1 x + a2 x2 + · · · ) , (13.11a)
y la otra solución es
y2 (x) = y1 (x) ln x + xr+1 (A0 + A1 x + A2 x2 + · · · ) . (13.11b)
3 Raı́ces que difieren en un entero
Una solución tiene la forma (13.4),
y1 (x) = xr (a0 + a1 x + a2 x2 + · · · ) ,
1
(13.12a)
y la otra solución es
y2 (x) = ky1 (x) ln x + xr (A0 + A1 x + A2 x2 + · · · ) ,

2
(13.12b)
en la cual r1 > r2 y la constante k puede ser cero.
13.4. La ecuación de Legendre

La ecuación de Legendre es
(1 − x2 )y − 2xy + l(l + 1)y = 0 , (13.13)
siendo l un número real. Esta ecuación aparece siempre que se formula un problema
fı́sico en tres dimensiones usando coordenadas esféricas r, θ y φ (véase el Apartado
10.2), en cuyo caso la variable x se sustituye por cos θ. Son de interés en las ciencias
fı́sicas las soluciones finitas en el intervalo −1 ≤ x ≤ +1 (correspondiendo a 0 ≤ θ ≤
π).
La ecuación (13.13) puede resolverse por el método de series de potencias del modo
descrito en el Ejemplo 13.2. Se sustituyen en (13.13) la serie de potencias

y= am x m = a0 + a1 x + a 2 x 2 + · · · (13.14)
m
13.4. La ecuación de Legendre 331
y sus derivadas y e y . Entonces, igualando a cero el coeficiente de cada potencia de x

se obtiene la relación de recurrencia
m(m + 1) − l(l + 1) (l − m)(l + m + 1)
am+2 = am = − am . (13.15)
(m + 1)(m + 2) (m + 1)(m + 2)
Para los valores pares de m
l(l + 1) (l − 2)(l + 3) (l − 2)l(l + 1)(l + 3)

a2 = − a0 , a4 = − a2 = + a0 , . . .
2 3×4 4!
De manera similar, para los valores impares de m
(l − 1)(l + 2) (l − 3)(l − 1)(l + 2)(l + 4)

a3 = − a1 , a5 = + a1 , . . .
3! 5!
Una solución en serie de potencias de la ecuación es por lo tanto
y(x) = a0 y1 (x) + a1 y2 (x) , (13.16)
con a0 y a1 constantes arbitrarias e
l(l + 1) 2 (l − 2)l(l + 1)(l + 3) 4

y1 (x) = 1 − x + x − ··· (13.17)
2! 4!
(l − 1)(l + 2) 3 (l − 3)(l − 1)(l + 2)(l + 4) 5

y2 (x) = x − x + x − ··· (13.18)
3! 5!
La serie y1 tiene únicamente potencias pares de x, la serie y2 únicamente potencias im-
pares.
Convergencia
Consideramos primero el caso de valores de l no enteros. Ambas series tienen radio
de convergencia R = 1 para valores de l arbitrarios. En efecto, por la ecuación (13.15)
la razón de dos términos consecutivos es
am m(m + 1) − l(l + 1)
= → 1 cuando m → ∞
am+2 (m + 1)(m + 2)
de manera que por el criterio del cociente de d’Alembert para series de potencias (7.17),
ambas series convergen si |x| < 1 y divergen si |x| > 1 (salvo que l sea un entero, ver
más abajo). Ambas series también divergen si x = ±1 (x2 = 1). La función (13.16), con
dos constantes arbitrarias, es por lo tanto la solución general de la ecuación de Legendre
en el intervalo −1 < x < 1. Es posible también hallar una solución en potencias inversas
de x que es válida para |x| > 1.
Polinomios de Legendre
La función (13.17) queda reducida a un polinomio de grado l si l es un entero par
o cero. Por ejemplo, si l = 2, la serie se termina después del segundo término para
dar y1 (x) = 1 − 3x2 . Entonces, tomando a1 = 0 en (13.16) se obtiene una solución
particular para valores de l pares que es finita para todo valor de x. Igualmente, la función
(13.18) queda reducida a un polinomio de grado l si l es un entero impar, y tomando
a0 = 0 en (13.16) se obtiene una solución particular que es válida para todo valor de
x. Las mismas ideas se aplican para valores enteros de l negativos, pero el conjunto
de polinomios que resulta es idéntico al obtenido para cero y valores positivos. Estas
soluciones particulares se llaman polinomios de Legendre Pl (x), y son las soluciones
de la ecuación de Legendre de interés en las ciencias fı́sicas.3 Por convenio, la constante
arbitraria no nula de (13.16) se escoge de manera que Pl (1) = 1. Entonces, para l =
0, 1, 2, 3, . . . , tenemos
1 · 3 · 5 · · · (2l − 1)
Pl (x) =
l!

l(l − 1) l−2 l(l − 1)(l − 2)(l − 3) l−4
× x − l
x + x − ··· (13.19)
2(2l − 1) 2 · 4(2l − 1)(2l − 3)
y hay que seguir la serie hasta llegar al término constante. Los primeros de estos polino-
mios son
P0 (x) = 1 , P1 (x) = x ,
1 1
P2 (x) = (3x2 − 1) , P3 (x) = (5x3 − 3x) , (13.20)
2 2
1 1
P4 (x) = (35x4 − 30x2 + 3) , P5 (x) = (63x5 − 70x3 + 15x) .
8 8
EJEMPLO 13.4 Demuestre que el polinomio P3 (x) es una solución de la ecuación de Legendre (13.13)
para l = 3.
Tenemos
1 3 3 2
y = P3 (x) = (5x − 3x) , y = (5x − 1) , y = 15x .
2 2
03. Adrien-Marie Legendre (1752-1833) tiene el dudoso merecimiento de la siguiente nota al pie en
el libro Hombres de matemáticas de E. T. Bell: ‘Consideraciones de espacio me impiden dar una visión de
su vida. Sus mejores trabajos fueron en muchos casos superados o evitados por matemáticos más jóvenes’.
Los polinomios aparecieron en las Recherches sur l’attraction des sphéroı̈des homogènes de Legendre en
1785 como los coeficientes del desarrollo de la función potencial (1 − 2h cos θ + h2 )−1/2 en potencias
de h. Su libro de texto Éléments de géométrie de 1794 hizo mucho por la reforma de la enseñanza de la
geometrı́a (hasta entonces basada en Euclides) y una edición americana, ‘el Legendre de Davies’ (1851),
fue influyente en los Estados Unidos.
13.4. La ecuación de Legendre 333
Por lo tanto, para l = 3,
3 1
(1 − x2 )y − 2xy + l(l + 1)y = (1 − x2 ) × 15x − 2x × (5x2 − 1) + 3 × 4 × (5x3 − 3x)
2 2
= (– 15 − 15 + 30)x3 + (15 + 3 − 18)x = 0 .
Los polinomios de Legendre cumplen la relación de recurrencia
(l + 1)Pl+1 (x) − (2l + 1)xPl (x) + lPl−1 (x) = 0 (13.21)
de manera que dados P0 (x) = 1 y P1 (x) = x, se deducen todos los polinomios siguientes.
EJEMPLO 13.5 Use la relación de recurrencia (13.21) para hallar P2 (x) y P3 (x).
Para l = 1 la relación (13.21) es 2P2 − 3xP1 + P0 = 0. Por lo tanto,
1 1
P2 = (3xP1 − P0 ) = (3x2 − 1) .
2 2
Para l = 1 la relación (13.21) es 3P3 − 5xP2 + 2P1 = 0. Por lo tanto,

1 1 1 1
P3 = (5xP2 − 2P1 ) = 5x × (3x2 − 1) − 2x = (5x3 − 3x) .
3 3 2 2
Funciones asociadas de Legendre

La ecuación asociada de Legendre es (véase la Tabla 3.1)

m2
(1 − x )y − 2xy + l(l + 1) −
2
y = 0. (13.22)
(1 − x2 )
Como en la ecuación de Legendre (m = 0), en las aplicaciones fı́sicas la variable x se

identifica con cos θ. En este caso, las soluciones obtenidas por el método de series de
potencias convergen en el intervalo −1 ≤ x ≤ 1 si l y m son ambos enteros, con |m| ≤ l:
l = 0, 1, 2, 3, . . . m = 0, ±1, ±2, . . . , ±l . (13.23)
Las correspondientes soluciones particulares se llaman funciones asociadas de Legen-

dre P|m|
l (x). Están relacionadas con los polinomios de Legendre mediante la fórmula
d|m|
P|m|
l (x) = (1 − x )
2 |m|/2
Pl (x) (13.24)
dx|m|
con P0l = Pl .
EJEMPLO 13.6 Use la fórmula (13.24) para obtener las funciones asociadas de Legendre Pm3 (x) para
m = 1, 2 y 3, y expréselas como funciones θ si x = cos θ y (1 − x2 )1/2 = sen θ.
Tenemos
1 3 3 2
y = P3 (x) = (5x − 3x) , y = (5x − 1) , y = 15x , y = 15 .
2 2
Entonces
3 3
P13 (x) = (1 − x2 )1/2 (5x2 − 1) , P13 ( cos θ) = sen θ(5 cos2 θ − 1) ,
2 2
P23 (x) = 15(1 − x2 )x , P23 ( cos θ) = 15 sen2 θ cos θ ,
P33 (x) = 15(1 − x2 )3/2 , P33 ( cos θ) = 15 sen3 θ .
Ortogonalidad y normalización
Vimos en el Apartado 12.6 que las soluciones de la ecuación de Schrödinger para una
partı́cula en un pozo son funciones ortogonales (ecuación (12.58)). La ortogonalidad es
una propiedad que cumplen las soluciones de un tipo de ecuaciones diferenciales lineales
llamadas ecuaciones de Sturm-Liouville que incluye a la ecuación de Legendre. Los
polinomios de Legendre son ortogonales en el intervalo −1 ≤ x ≤ 1:

+1
Pl (x)Pl (x) dx = 0 si l = l . (13.25)

−1
EJEMPLO 13.7 Demuestre que P1 es ortogonal (a) a P2 y (b) a P3 .

1 2 1
Tenemos P1 (x) = 1, P2 (x) = (3x − 1), P3 (x) = (5x3 − 3x). Entonces
2 2

+1
+1
1 +1 3 1 3x4 x2 1 3 1 3 1
(a) P1 (x)P2 (x) dx = (3x − x) dx = − = − − − = 0.
−1 2 −1 2 4 2 −1 2 4 2 4 2
En este caso, P1 (x) es una función impar de x mientras que P2 (x) es una función par. El integrando es impar
y la integral es cero (véase el Apartado 5.3).

+1
1 +1 1 5 +1 1
(b) P1 (x)P3 (x) dx = (5x4 − 3x2 ) dx = x − x3 = 0 − 0 = 0.
−1 2 −1 2 −1 2
En este caso tanto P1 como P3 son funciones impares de manera que la ortogonalidad de las funciones es
una propiedad nueva y no una consecuencia de la paridad/imparidad.
Para las funciones asociadas de Legendre la propiedad correspondiente es

+1
P|m| |m|
l (x)Pl (x) dx = 0 si l = l . (13.26)
−1
13.5. La ecuación de Hermite 335
Además, si l = l ,

+1 2 2 (l + |m|)!
P|m|
l (x) dx = (13.27)
−1 (2l + 1) (l − |m|)!
y este resultado se usa para construir el conjunto de funciones asociadas de Legendre

normalizadas (o polinomios de Legendre normalizados si m = 0),

(2l + 1) (l − |m|)! |m|
Θl,m (x) = P (x) , (13.28)
2 (l + |m|)! l
con la propiedad

+1
1 si l = l ,
Θl,m (x)Θl ,m (x) dx = δl,l = (13.29)
−1 0 si l = l .
Tomando x = cos θ, estas funciones son parte de la solución de la ecuación de Schrödin-

ger para el átomo de hidrógeno (apartado 14.6).
13.5. La ecuación de Hermite

La ecuación de Hermite es
y − 2xy + 2ny = 0 (13.30)
con n un entero. La ecuación aparece en la resolución de la ecuación de Schrödinger

para el oscilador armónico. Se resuelve por el método de potencias y la solución general
es
y(x) = a0 y1 (x) + a1 y2 (x) ,
en la cual la solución particular y1 tiene únicamente potencias pares de x e y2 únicamente

potencias impares de x. Ambas soluciones particulares convergen para todo valor de x,
2
y si n no es un entero positivo ni cero, se comportan como ex para x grande. Como en el
caso de la ecuación de Legendre, y1 se reduce a un polinomio de grado n si n es un entero
par (positivo), y de forma similar para y2 si n es un entero impar. Estos polinomios se
llaman polinomios de Hermite Hn (x), y son las soluciones de la ecuación de Hermite
de interés en las ciencias fı́sicas:
n(n − 1) n(n − 1)(n − 2)(n − 3)
Hn (x) = (2x)n − (2x)n−2 + (2x)n−4 − · · · (13.31)
1! 2!
con n = 0, 1, 2, 3, . . . Los primeros de estos polinomios son
H0 (x) = 1 , H1 (x) = 2x ,
H2 (x) = 4x2 − 2 , H3 (x) = 8x3 − 12x , (13.32)
H4 (x) = 16x4 − 48x2 + 12 , H5 (x) = 32x5 − 160x3 + 120x .
Los polinomios de Hermite cumplen la relación de recurrencia
Hn+1 (x) − 2xHn (x) + 2nHn−1 (x) = 0 (13.33)
de manera que dados H0 = 1 y H1 = 2x, se deducen todos los polinomios siguientes.
Funciones de Hermite
Una ecuación diferencial relacionada con la ecuación de Hermite es
y + (1 − x2 + 2n)y = 0 . (13.34)
Se resuelve con el cambio
y(x) = e−x /2 v(x)

2
(13.35)
que tiene por derivada segunda
y = e−x /2 [v − 2xv − (1 − x2 )] .

2
Sustituyendo y y su derivada segunda en (13.35) nos da
e−x /2 [v − 2xv + 2nv] = 0 .

2
La expresión entre corchetes es el primer miembro de la ecuación de Hermite (13.30),

de manera que las funciones de Hermite
yn (x) = e−x /2 Hn (x) , n = 0, 1, 2, 3, . . .

2
(13.36)
son soluciones particulares de (13.34). Estas funciones son finitas para todo valor de x y
ortogonales, cumpliendo la propiedad

+∞ +∞
√
ym (x)yn (x) dx = e−x Hm (x)Hn (x) dx = 2n n! πδm,n .
2
(13.37)
−∞ −∞
Las funciones de Hermite tienen importancia en quı́mica por ser las autofunciones del
problema mecánico-cuántico del oscilador armónico. Las gráficas de las tres primeras
funciones (normalizadas) se muestran en la Figura 13.1.
13.6. La ecuación de Laguerre 337
Figura 13.1
2 √
EJEMPLO 13.8 Demuestre que la función de Hermite e−αx /2 Hn ( αx), siendo α = km/2 , es una
solución de la ecuación de Schrödinger para el oscilador armónico
2 d 2 ψ 1
− 2
+ kx2 ψ = Eψ .
√ √ 2m dx 2
Sea z = αx. Entonces para ψ = ψ( αx) = ψ(z),
dψ dψ dz √ dψ √ d2 ψ
= = α = α ψ , = αψ .
dx dz dx dz dx2
Con esto
2 k 2
− αψ + z ψ = Eψ .
2m 2α
Dividiendo ambos miembros por − α/2m y recordando que α = mω/, donde ω = k/m es la fre-
2
cuencia angular del oscilador, obtenemos

1
ψ + (1 − z2 + 2n)ψ = 0 si E = (n + )ω , n = 0, 1, 2, 3, . . .
2
Esta ecuación diferencial es idéntica a la ecuación (13.34). Las funciones de Hermite son por lo tanto las
autofunciones del problema del oscilador armónico en mecánica cuántica.
13.6. La ecuación de Laguerre

La ecuación de Laguerre4
xy + (1 − x)y + ny = 0 , (13.38)
donde n es un número real, tiene una solución en serie de potencias que, si n es un entero
positivo o cero, es un polinomio de grado n llamado polinomio de Laguerre Ln (x):

n2 n−1 n2 (n − 1)2 n−2
Ln (x) = (– 1) x − x +
n n
x − · · · + (– 1) n!
n
(13.39)
1! 2!
04. Edmond Laguerre (1834-1886).

con n = 0, 1, 2, 3, . . . Los primeros son
L0 (x) = 1 , L1 (x) = 1 − x ,
(13.40)
L2 (x) = 2 − 4x + x2 , L3 (x) = 6 − 18x + 9x2 − x3 .
Los polinomios de Laguerre cumplen la relación de recurrencia
Ln+1 (x) − (1 + 2n − x)Ln (x) + n2 Ln−1 (x) = 0 (13.41)
a partir de la cual, dados L0 y L1 , se pueden obtener todos los demás polinomios.
Funciones asociadas de Laguerre

La ecuación asociada de Laguerre es
xy + (m + 1 − x)y + (n − m)y = 0 (13.42)
y tiene soluciones polinómicas cuando n y m son ambos enteros positivos o cero, sien-
do m ≤ n. Esas soluciones son los polinomios asociados de Laguerre Lnm (x). Están
relacionados con los polinomios de Laguerre mediante la expresión diferencial
dm
Lnm (x) = Ln (x) . (13.43)
dxm
Los polinomios asociados de Laguerre aparecen en la resolución de la parte radial de la
ecuación de Schrödinger para el átomo de hidrógeno (Apartado 14.6), y lo hacen bajo la
forma de funciones asociadas de Laguerre
fn,l (x) = e−x/2 xl Ln+l

2l+1
(x) (13.44)
siendo n = 1, 2, 3, . . . , l = 0, 1, 2, . . . , (n − 1). Estas funciones satisfacen la ecuación

diferencial

2 n l(l + 1) 1
f + f + − − f =0 (13.45)
x x x2 4
y son ortogonales con respecto a la función peso x2 en el intervalo 0 ≤ x ≤ ∞:

∞
∞
fn,l (x)fn ,l (x) x dx =
2
e−x x2l Ln+l
2l+1
(x)Ln2l+1 2
,l (x) x dx
0 0
2n{(n + l)!}
3
= δn,n . (13.46)
(n − l − 1)!
13.7. Funciones de Bessel 339
13.7. Funciones de Bessel

La ecuación de* Bessel es5
x2 y + xy + (x2 − n2 )y = 0 (13.47)
siendo n un número real. Esta ecuación tiene en las ciencias fı́sicas la misma importancia
que la de Legendre, si bien aparece menos frecuentemente en quı́mica que en fı́sica y en
ingenierı́a. Las funciones de Bessel se dan, por ejemplo, en las soluciones de la ecuación
de ondas clásica para las vibraciones de una membrana circular o esférica, y las mismas
soluciones se encuentran para la ecuación de Schrödinger para una partı́cula en un pozo
circular o en un pozo esférico. Las funciones son importantes en la formulación de la
teorı́a de los procesos de difusión.
Una vez dividida por x2 , la ecuación (13.47) es del tipo (13.3) y se resuelve por el
método de Frobenius, es decir, expresando la solución en la forma (13.4)
y(x) = xr (a0 + a1 x + a2 x2 + · · · ) .
Se demuestra que los valores posibles de r son r = ±n, y las dos soluciones particulares
para esos valores de r son

x2 x4
y1 (x) = a0 x 1 −
n
+ − ··· , (13.48)
2(2n + 2) 2 · 4(2n + 2)(2n + 4)

x2 x4
y2 (x) = a0 x −n
1+ + + ··· . (13.49)
2(2n − 2) 2 · 4(2n − 2)(2n − 4)
Los valores importantes del parámetro n son los valores enteros y los semienteros.
Funciones de Bessel Jn (x) para n entero

Si n es un entero positivo o cero, la solución particular (13.48) es
n
∞ 2m
x (– 1)m x
Jn (x) = , (13.50)
2 m=0 m! (n + m)! 2
0* ‘En esta ocasión

‘Nos las hemos de ver
‘Con una famosa función
‘Debida a Herr Bessel.’
05. Friedrich Wilhelm Bessel (1784-1864), astrónomo alemán. Daniel Bernoulli, Euler y Lagran-
ge trataron ejemplos de funciones de Bessel, pero el primer estudio sistemático apareció en 1824 en un
artı́culo de Bessel sobre perturbaciones de órbitas planetarias. Es sabido que Bessel fue el destinatario de
numerosas cartas de su buen amigo Gauss, quien le escribió en 1810: ‘Este invierno estoy dando clases de
dos asignaturas a tres estudiantes, de los cuales uno está sólo moderadamente preparado, el otro menos que
moderadamente, y el tercero carece por igual de preparación y de aptitud. Tales son las cargas . . . ’
donde hemos asignado a la constante a0 el valor convencional a0 = 1/2n n!. Ésta es

la función de Bessel de primera especie de orden n. La función es finita y converge
para todo valor de x: converge muy rápidamente debido a la pareja de factoriales en el
denominador. Las funciones para n = 0 y n = 1 son
1 x 2 1 x 4 1 x 6
J0 (x) = 1 − + − + ··· (13.51)
(1!)2 2 (2!)2 2 (3!)2 2
x 1 x 3 1 x 5 1 x 7
J1 (x) = − 2+ − + ··· (13.52)
2 1! 2! 2 2! 3! 2 3! 4! 2
y mostramos sus gráficas en la Figura 13.2
Figura 13.2
Tanto los desarrollos como las gráficas muestran que las funciones de Bessel tienen
propiedades similares a las de las funciones trigonométricas. Sin embargo, los ceros de
las funciones, los valores de x para los cuales Jn (x) = 0, no están igualmente espaciados
de manera que las funciones no tienen una longitud de onda determinada. Algunos de
los ceros son (con 3 cifras decimales)
J0 (x) = 0 para x = 2,405; 5,520; 8,654; 11,792; 14,931; . . .

(13.53)
J1 (x) = 0 para x = 0; 3,832; 7,016; 10,173; 13,324; . . .
Además, la amplitud de las ondas decrece al crecer x.

El comportamiento para valores de x grandes es el de una función seno amortiguada,

2 nπ π
Jn (x) ∼ sen x − + , para x grande. (13.54)
πx 2 4
Para valores de n positivos la solución particular (13.49) es J−n (x) y puede demostrarse
que está relacionada con Jn (x) mediante J−n (x) = (– 1)n Jn (x). El método de series de po-
tencias proporciona por lo tanto una única solución particular para valores de n enteros.
Se puede hallar una segunda solución: es la función de Bessel de segunda especie Yn (x),
de menor importancia en aplicaciones fı́sicas.
Funciones de Bessel Jl+1/2 (x) de orden semientero

Las funciones de Bessel de orden semientero pueden expresarse mediante funciones
elementales. Las funciones para n = ±1/2 son

2 2
J1/2 (x) = sen x , J−1/2 (x) = cos x , (13.55)
πx πx
y todas las demás pueden obtenerse por la relación de recurrencia (válida para funciones
de Bessel en general)
2n
Jn+1 (x) − Jn (x) + Jn−1 (x) = 0 . (13.56)
x
EJEMPLO 13.9 Use la relación de recurrencia (13.56) y las fórmulas (13.55) para deducir las funciones
de Bessel J±3/2 (x).
A partir de (13.56), con n = 1/2, tenemos
1
J3/2 (x) − J1/2 (x) + J−1/2 = 0
x
de manera que

1 2 sen x
J3/2 (x) = J1/2 (x) − J−1/2 (x) = − cos x .
x πx x
De manera similar, tomando n = −1/2 en (13.56),

1 2 cos x
J−3/2 (x) = − J−1/2 (x) − J1/2 (x) = − + sen x .
x πx x
Las funciones de órdenes semienteros son las funciones de Bessel que aparecen en el
método de ondas parciales en la teorı́a de procesos de difusión. En ese caso se presentan
en la forma

π π
jl (x) = Jl+1/2 (x) , ηl (x) = (– 1) l+1
J−l−1/2 (x) , (13.57)
2x 2x
con l ≥ 0. Las funciones jl se llaman funciones de Bessel esféricas de orden l, las fun-
ciones ηl son las funciones de Neumann esféricas. Estas funciones aparecen a menudo
junto con los polinomios de Legendre cuando se formula un sistema fı́sico en coordena-
das esféricas.
13.8. Ejercicios
Apartado 13.2
Use el método de series de potencias para resolver las ecuaciones:
a
1. (1 − x)y = y. Compruebe que la solución puede expresarse como y = para |x| < 1.
1−x
2. y − 9y = 0. Compruebe que la solución puede expresarse como y = ae3x + be−3x .
3. (1 − x2 )y − 2xy + 2y = 0 (esta
es la ecuación
de Legendre para n = 1). Demuestre que la solución

x 1−x
puede escribirse como y = a1 + a0 1 + ln para |x| < 1.
2 1+x
4. y − xy = 0 (ecuación de Airy).
Apartado 13.3
Para cada una de las ecuaciones siguientes, (i) halle la ecuación indicial y resuélvala, y (ii) dé la forma de
la solución general y = c1 y1 + c2 y2 (ecuaciones (13.10), (13.11) o (13.12)):
5. 2x2 y + xy − 3y = 0 6. xy + (1 − 2x)y + (x − 1)y = 0

7. x2 y + 6xy + (6 − x2 )y = 0
8. Halle la solución general de la ecuación del ejercicio 6. (Sugerencia: halle y1 y demuestre entonces
que y1 ln x es una solución.)
Apartado 13.4
9. Confirme que los polinomios P4 (x) y P5 (x) son soluciones de la ecuación de Legendre para l = 4 y
l = 5, respectivamente.
10. Use la relación de recurrencia (13.21) para hallar P6 (x) a partir de P4 (x) y P5 (x).
−1/2
11. Desarrolle la función 1 − 2xh + h2 en potencias de h hasta términos en h3 , y demuestre que el
coeficiente de h es Pn (x), para n = 0, 1, 2, 3.
n
12. Use la fórmula (13.24) para hallar las funciones asociadas de Legendre Pm4 (x) para m = 1, 2, 3, 4.
Expréselas en función de cos θ = x y sen θ = (1 − x2 )1/2 .
Apartado 13.6
13. Use la relación de recurrencia (13.33) para hallar H6 (x). Esboce la gráfica de la función de Hermite
2
e−x /2 H6 (x).
Apartado 13.7
14. Halle, y resuelva, la ecuación indicial para la ecuación de Bessel (13.47).
15. Confirme que J1/2 (x) y J−1/2 (x), ecuaciones (13.55), son las soluciones de la ecuación de Bessel para
|n| = 1/2.
Ecuaciones en derivadas parciales
14.1. Conceptos
Una ecuación que contiene derivadas parciales es una ecuación en derivadas par-
ciales. Por ejemplo, si f es función de las variables independientes x e y, toda ecuación
que contenga ∂f /∂x o ∂f /∂y, o derivadas de orden superior, y también f , x o y, es una
ecuación en derivadas parciales. Algunos ejemplos importantes en las ciencias fı́sicas
son
∂2f 1 ∂2f
1. = ecuación de ondas en una dimensión
∂x2 v2 ∂t2
∂f
2
1 ∂f
2. = ecuación de difusión en una dimensión
∂x 2
D ∂t
∂f
2
∂2f ∂2f
3. + + = ∇2 f = 0 ecuación de Laplace en tres dimensiones
∂x2 ∂y2 ∂z2
4. ∇2 f = g(x, y, z) ecuación de Poisson en tres dimensiones
2
2
5. − ∇ ψ + V(x, y, z)ψ = Eψ ecuación de Schrödinger independiente
2m
del tiempo
2 2 ∂ψ
6. − ∇ ψ + V(x, y, z)ψ = i ecuación de Schrödinger dependiente
2m ∂t
del tiempo
Todas son ecuaciones lineales de segundo orden. La ecuación 4 es no homogénea, las

demás son ecuaciones homogéneas. En las ecuaciones 1 y 2, la función incógnita f es
una función de la coordenada x y del tiempo t: f = f (x, t). En 3, 4 y 5, la función depende
de las tres coordenadas de un punto en el espacio ordinario, y en 6 es además una función
del tiempo.
Al igual que para las ecuaciones diferenciales ordinarias, hay varios tipos estándar de
ecuaciones en derivadas parciales importantes que se dan con frecuencia en los mode-
los matemáticos de los sistemas fı́sicos, y cuyas soluciones pueden expresarse mediante
funciones elementales. En este capı́tulo tratamos la ecuación 5 mencionada más arriba
para una partı́cula en un pozo rectangular (Apartado 14.4) y en un pozo circular (Apar-
tado 14.5), y para el átomo de hidrógeno (Apartado 14.6), y la ecuación 1 aplicada a
344 Capı́tulo 14. Ecuaciones en derivadas parciales
las vibraciones de una cuerda elástica, como una cuerda de guitarra (Apartado 14.7).
Estos ejemplos ilustran varios principios importantes en la resolución de ecuaciones en
derivadas parciales. Muestran cómo condiciones de contorno o iniciales diferentes pue-
den conducir a tipos muy diferentes de soluciones particulares, cómo las propiedades
de simetrı́a del sistema representado pueden conducir al fenómeno de degeneración, y
cómo, en algunos casos, las soluciones se expresan en forma de ‘desarrollos ortogonales’
presentados en el Capı́tulo 15.
14.2. Soluciones generales

Hemos visto que la solución general de una ecuación diferencial ordinaria contiene
un cierto número de constantes arbitrarias, normalmente n para una ecuación de orden n,
y que para un caso concreto, los valores de esas constantes se obtienen imponiendo las
condiciones iniciales o de contorno adecuadas. La solución de una ecuación en derivadas
parciales, por su parte, contiene un cierto número de funciones arbitrarias, a menudo
n funciones para una ecuación de orden n. Por ejemplo, la ecuación de ondas en una
dimensión, ecuación 1 en la lista del Apartado 14.1,
∂ 2f 1 ∂2f
= , (14.1)
∂x2 v2 ∂t2
tiene como solución
f (x, t) = F(x + vt) , (14.2)
siendo F una función arbitraria de la variable u = x + vt. En efecto:
∂f dF ∂u dF ∂2f d2 F
= = , = ,
∂x du ∂x du ∂x2 du2
∂f dF ∂u dF ∂2f 2
2d F
= =v , = v ,
∂t du ∂t du ∂t2 du2
por lo que se cumple la ecuación (14.1). La solución general de la ecuación es
f (x, t) = F(x + vt) + G(x − vt) , (14.3)
donde F y G son ambas funciones arbitrarias.1 Las funciones concretas se determinan

en cada aplicación mediante las condiciones iniciales y de contorno adecuadas y en el
apartado 14.7 veremos un ejemplo importante.
01. Esta forma de la solución general la obtuvo por primera vez d’Alembert en 1747. Los orı́genes
de la ecuación de ondas están en el tratado De motu nervi tensi (Sobre el movimiento de una cuerda tensa)
de Brook Taylor en 1713. En 1727 Johann Bernoulli sugirió a su hijo Daniel que retomase el problema de
14.3. Separación de variables 345
EJEMPLO 14.1 Compruebe que la función

f (x, t) = 3x2 − 2xvt + 3v2 t2
es una solución de la ecuación de ondas (14.1), y tiene la forma general (14.3).
Las derivadas parciales son
∂f ∂2f ∂f ∂2f
= 6x − 2vt , = 6; = −2xv + 6v2 t , = 6v2 .
∂x ∂x2 ∂t ∂t2
Por lo tanto, se cumple
∂2f 1 ∂2f
6= = 2 2 ,
∂x 2 v ∂t
como era necesario. La función puede expresarse en la forma
f (x, t) = (x + vt)2 + 2(x − vt)2 = F(x + vt) + G(x − vt) .
EJEMPLO 14.2 Compruebe que la función

f (x, t) = a exp −b(x − vt)2
es una solución de la ecuación de ondas (14.1).
Tenemos que
d2 f
= 2ab −1 + 2b(x − vt) 2
exp −b(x − vt) 2
,
dx2
d2 f
2
= 2abv2 −1 + 2b(x − vt)2 exp −b(x − vt)2 .
dt
d2 f 1 d2 f
Por lo tanto, = 2 2.
dx2 v dt
14.3. Separación de variables

Si una ecuación en derivadas parciales, con dos o más variables independientes, pue-
de reducirse a un conjunto de ecuaciones diferenciales ordinarias, una por cada variable,
la ecuación se dice separable. Las soluciones de la ecuación en derivadas parciales son
entonces productos de las soluciones de las ecuaciones ordinarias. Todos los ejemplos
que tratamos en este capı́tulo son de ese tipo.
Taylor: ‘Para una cuerda musical, de longitud y peso dados, tensada por un peso dado, hallar sus vibra-
ciones’. D’Alembert dedujo la ecuación en Recherches sur la courbe que forme une corde tendue mise en
vibration, 1747, considerando la cuerda compuesta por masas infinitesimales y aplicando la ley de Newton
de las fuerzas a cada elemento de masa. Euler publicó su propia solución en Sur la vibration des cordes en
1750, y Daniel Bernoulli exploró la idea de superposición de modos normales en sus Réflexions et éclaircis-
sements en 1755. El debate sobre los tipos de funciones aceptables como soluciones de la ecuación de ondas
continuó durante unos treinta años entre los tres autores, sin que ninguno se dejase convencer por los otros
dos. El problema fue resuelto gracias a los trabajos de Fourier, de Dirichlet, de Riemann y de Weierstrass
en los siguientes cien años, y necesitó que se reconsiderase el significado de función, de continuidad y de
convergencia.
Ilustramos los principios esenciales del método de separación de variables consi-

derando la ecuación más sencilla de primer orden en dos variables
∂f ∂f
+ = 0. (14.4)
∂x ∂y
Vamos a ver que una solución de esta ecuación puede escribirse como
f (x, y) = X(x) × Y(y) (14.5)
donde la solución, que es una función de las dos variables x e y, se expresa como producto
de una función sólo de x y otra función sólo de y. Tenemos
∂f ∂(XY) dX
= =Y ,
∂x ∂x dx
ya que Y(y) no depende de x. Del mismo modo,
∂f dY
=X ,
∂y dy
ya que X(x) es constante con respecto a y. Sustituyendo f = XY y sus derivadas en la

ecuación diferencial (14.4) se obtiene entonces
dX(x) dY(y)
Y(y) + X(x) = 0, (14.6)
dx dy
y dividiendo ambos miembros por f = XY,

1 dX(x) 1 dY(y)
+ = 0. (14.7)
X(x) dx Y(y) dy
El primer término entre corchetes del primer miembro de (14.7) depende sólo de la
variable x, el segundo sólo de y. Puesto que el total es constante (cero en este caso) se
deduce que cada uno de esos términos debe ser una constante por separado, si x e y son
variables independientes. En efecto, una variación en el valor de x no puede conducir a
una variación en el valor del término que sólo depende de y, y viceversa. Por lo tanto, si
el primer término es igual a una constante C, el segundo es igual a −C (para que el total
sea cero):
1 dX 1 dY
= C, = −C , (14.8)
X dx Y dy
donde C se llama constante de separación. Entonces

14.4. Partı́cula en un pozo rectangular 347
dX
= CX (14.9)
dx
dY
= −CY (14.10)
dy
y la ecuación en derivadas parciales (14.4) se ha reducido a dos ecuaciones diferenciales

ordinarias, ambas resolubles. Las ecuaciones, (14.9) en la variable x y (14.10) en la
variable y, son ecuaciones de primer orden separables del tipo estudiado en el Apartado
11.3, y sus soluciones generales son
X(x) = AeCx , Y(y) = Be−Cy . (14.11)
Una solución de la ecuación en dos variables (14.4) es entonces el producto
f (x, y) = X(x) × Y(y) = AeCx × Be−Cy = DeC(x−y) (14.12)
(hemos sustituido A × B por D). A menudo se pueden obtener soluciones particulares,

incluyendo los valores posibles de la constante de separación, imponiendo condiciones
iniciales y de contorno, como se muestra en los importantes problemas tratados en los
Apartados 14.4 a 14.6. En otros casos, como veremos en el Apartado 14.7 para la cuerda
vibrante, puede ser necesario considerar soluciones más generales como combinaciones
lineales de productos.
14.4. Partı́cula en un pozo rectangular
La ecuación de Schrödinger para una partı́cula de masa m que se mueve en el plano

xy es
2 2
− ∇ ψ(x, y) + V(x, y)ψ(x, y) = Eψ(x, y) (14.13)
2m
donde
∂2 ∂2
∇2 = + (14.14)
∂x2 ∂y2
es el operador laplaciano bidimensional (véase el Apartado 9.6). Para este sistema, la

función energı́a potencial es (Figura 14.1)
V(x, y) = 0 para 0 < x < a y 0<y<b

(14.15)
= ∞ en el resto.
Como en el caso unidimensional, el valor constan-

te de V dentro del pozo supone que no se ejerce
ninguna fuerza sobre la partı́cula en esa región. To-
mar V = 0 supone que E es la energı́a cinética de
la partı́cula. El valor infinito de V en las ‘paredes’
y fuera del pozo supone que la partı́cula no puede
abandonar el pozo: ψ = 0 en las paredes y fuera del
pozo.
Para la partı́cula dentro del pozo, tenemos el proble-

ma de contorno Figura 14.1

2 ∂ 2 ψ ∂ 2 ψ
− + = Eψ (14.16)
2m ∂x2 ∂y2
con las condiciones
ψ(0, y) = ψ(a, y) = 0 (ψ = 0 si x = 0 o x = a), (14.17a)
ψ(x, 0) = ψ(x, b) = 0 (ψ = 0 si y = 0 o y = b). (14.17b)
La ecuación en derivadas parciales se reduce a dos ecuaciones diferenciales si escri-

bimos la ecuación de ondas como el producto
ψ(x, y) = X(x) × Y(y) . (14.18)
Entonces, como en el Apartado 14.3, sustituyendo este producto y sus derivadas en

(14.13) y dividiendo por ψ = XY, tenemos
1 d2 X 1 d2 Y 2mE
+ =− 2 . (14.19)
X dx 2
Y dy2
El término que sólo depende de x tiene que ser constante, y el término que sólo depende
de y tiene que ser también constante. Por lo tanto,
1 d2 X 1 d2 Y
= Cx , = Cy , (14.20)
X dx2 Y dy2
donde Cx y Cy son constantes y Cx + Cy = −2mE/2 .

El problema de contorno bidimensional ha sido reducido a dos problemas de contorno
unidimensionales:
d2 X
= Cx X , X(0) = X(a) = 0 , (14.21a)
dx2
d2 Y
= Cy Y , Y(0) = Y(b) = 0 .
dy2 (14.21b)
14.4. Partı́cula en un pozo rectangular 349
Ambos problemas son el mismo que el de la partı́cula en el pozo unidimensional

que tratamos en el Apartado 12.6. La ecuación (14.21a) describe el movimiento de la
partı́cula a lo largo de la dirección x, y tiene soluciones normalizadas dadas por (12.53),
cambiando apropiadamente la notación:
pπx
2
Xp (x) = sen , p = 1, 2, 3, . . . (14.22a)
a a
y Cx = −p2 π 2 /a2 . De manera similar, (14.21b) describe el movimiento de la partı́cula a

lo largo de la dirección y, y tiene soluciones normalizadas
qπy
2
Yq (y) = sen , q = 1, 2, 3, . . . (14.22b)
b b
y Cy = −q2 π 2 /b2 . Las soluciones globales (autofunciones) de la ecuación de Schrödin-

ger bidimensional (14.13) vienen dadas por los productos
ψp,q (x, y) = Xp (x) × Yq (y)

pπx 2 qπy
2
= sen × sen , p, q = 1, 2, 3, . . . (14.23)
a a b b
y las energı́as totales correspondientes (autovalores) son

h2 p 2 q 2
Ep,q = + . (14.24)
8m a2 b2
Señalamos que las cantidades
h2 p 2 h2 q 2
Ep = y Eq = (14.25)
8ma2 8mb2
deben ser interpretadas como las energı́as cinéticas de los movimientos a lo largo de las
direcciones x e y, respectivamente.
El pozo cuadrado. Degeneración

Cuando los lados del pozo no son iguales, ni un múltiplo entero uno del otro, los
autovalores (14.24) son todos distintos: se dice entonces que los estados del sistema son
no degenerados. Sin embargo, para un pozo cuadrado, con a = b,
h2
Ep,q = (p2 + q2 ) (14.26)
8ma2
y los autovalores para p = q se dan por parejas con Ep,q = Eq,p : por ejemplo, E1,2 =
E2,1 = 5h2 /8ma2 . Los estados del sistema con la misma energı́a se denominan estados
degenerados.
La aparición de la degeneración para el pozo cuadrado es una consecuencia de la

simetrı́a del sistema. Las autofunciones (14.23) son
2 pπx qπy
ψp,q (x, y) = sen sen (14.27)
a a a
e intercambiando las coordenadas x e y tenemos
2 pπy qπx
ψp,q (y, x) = sen sen = ψq,p (x, y) (14.28)
a a a
es decir, las autofunciones degeneradas se han intercambiado (si p = q).* En la Figura
14.2 se representan las simetrı́as de algunas de las funciones de onda.
Figura 14.2
Las lı́neas discontinuas son lı́neas nodales, en las cuales la función es cero. Vemos,
por ejemplo, que ψ1,2 y ψ2,1 son idénticas salvo por la orientación.
14.5. Partı́cula en un pozo circular

El movimiento de una partı́cula en un pozo circular de radio a viene descrito por la
ecuación de Schrödinger
2 2
− ∇ ψ(x, y) + V(x, y)ψ(x, y) = Eψ(x, y) (14.29)
2m
como en el Apartado 14.4, pero con una función energı́a potencial

√
0 para r = x2 + y2 < a
V(x, y) = (14.30)
∞ en el resto
siendo r la distancia al origen en el centro del pozo. La ecuación no es separable en

coordenadas cartesianas por la forma funcional de V en la circunferencia del pozo, pero
sı́ lo es cuando la ecuación se expresa en las coordenadas polares del plano r y θ. En esas
0* Puede ocurrir también una degeneración ‘accidental’ que no es una consecuencia obvia de la
simetrı́a. Por ejemplo, los estados (7, 1) y (1, 7) son degenerados junto con el estado (5, 5).
14.5. Partı́cula en un pozo circular 351
coordenadas, el operador laplaciano en dos dimensiones es (véanse la ecuación (9.38) y

el Ejemplo 9.18)
∂2 1∂ 1 ∂2
∇2 = + + . (14.31)
∂r2 r ∂r r2 ∂θ2
Para la partı́cula en el interior del pozo, con V = 0, la ecuación (14.29) es entonces

2 ∂ 2 ψ 1 ∂ψ 1 ∂2ψ
− + + 2 2 = Eψ (14.32)
2m ∂r2 r ∂r r ∂θ
o, multiplicando ambos miembros por −2mr2 /2 , tomando
2mE
α2 = (14.33)
2
y reordenando,
∂2ψ ∂ψ ∂2ψ
r2 + r + α 2 2
r ψ + = 0. (14.34)
∂r2 ∂r ∂θ2
Esta ecuación puede separarse en dos ecuaciones ordinarias expresando la función de
onda como el producto
ψ(r, θ) = R(r) × Θ(θ) . (14.35)
Sustituyendo en (14.34) y dividiendo por ψ = RΘ tenemos

2 2
r dR r dR 1 d2 Θ
+ +α r +
2 2
= 0. (14.36)
R dr2 R dr Θ dθ2
Cada uno de los términos entre corchetes debe ser constante de manera que, siendo C la
constante de separación, tenemos
d2 R dR
r2 +r + α2 r2 R = CR (14.37)
dr 2
dr
para el movimiento radial de la partı́cula en el pozo, y
d2 Θ
= −CΘ (14.38)
dθ2
para el movimiento angular de la partı́cula. Empezamos por la ecuación angular.
Ecuación angular
La función Θ(θ) está definida en el intervalo 0 ≤ θ ≤ 2π y tiene que cumplir la

condición
Θ(2π) = Θ(0) (14.39)
para asegurar la continuidad alrededor del cı́rculo. Se trata por lo tanto del mismo pro-
blema de contorno visto en el Apartado 12.7 para la partı́cula en un aro. Las soluciones
normalizadas son (ecuación (12.69))
1
Θn (θ) = √ einθ , n = 0, ±1, ±2, . . . (14.40)
2π
y sustituyendo en (14.38) obtenemos los valores de la constante de separación C = n2 .
Ecuación radial
Tomando C = n2 , la ecuación radial (14.37) es
d2 R dR
r2 +r + (α2 r2 − n2 )R = 0 . (14.41)
dr 2
dr
La ecuación se transforma en la ecuación de Bessel (Apartado 13.7) mediante el cambio
de variable x = αr. Tenemos que
dR dR dx dR d2 R 2
2 d R
= =α , = α ,
dr dx dr dx dr2 dx2
con lo cual (14.41) se convierte en la ecuación de Bessel (13.47)
d2 R dR
x2 +x + (x2 − n2 )R = 0 .
dx 2
dx
Si n es un entero positivo o cero, la solución de esta ecuación es la función de Bessel
Jn (x) dada por (13.50), de manera que las soluciones de la ecuación radial son
Rn (r) = Jn (αr) , n = 0, 1, 2, 3, . . . (14.42)
Estas soluciones están obligadas a cumplir la condición de que la función de onda se

anule en la frontera del pozo, cuando r = a. Por lo tanto,
Rn (a) = Jn (αa) = 0 (14.43)
y los valores de α posibles vienen determinados por los ceros de la función de Bessel,
algunos de los cuales se dan en (13.53) en el Apartado 13.7. Si denotamos los ceros de
14.6. El átomo de hidrógeno 353
Jn (x) por xn,1 , xn,2 , xn,3 , . . . , los valores permitidos de α son

xn,k
αn,k = , k = 1, 2, 3, . . . (14.44)
a
y las soluciones de la ecuación radial que cumplen la condición de contorno son
Rn,k (r) = Jn (αn,k r) . (14.45)
Por la ecuación (14.33), la energı́a del sistema viene dada por E = α2 2 /2m, de manera
que la energı́a resulta cuantizada, con valores
αn,k
2
2 x 2 h2
En,k = = n,k 2 , n = 0, ±1, ±2, . . . (14.46)
2m 8ma
y las correspondientes funciones de onda globales son
ψn,k (r, θ) = R|n|,k (r)Θn (θ) (14.47)
(las funciones radiales dependen sólo del valor absoluto de n). Las simetrı́as de estas
funciones de onda se representan en la Figura 14.3, utilizando las expresiones reales
(12.71) de las funciones angulares.
Figura 14.3
Señalamos que estos diagramas también representan los modos normales de vibra-
ción, las ondas estacionarias, de una membrana circular (como por ejemplo un tambor).
14.6. El átomo de hidrógeno

Un átomo hidrogenoideo es un sistema de dos cargas, un núcleo con carga +Ze
(Z = 1 para el propio átomo de hidrógeno) y un electrón con carga −e, que interactúan
mediante una fuerza de Coulomb. La energı́a potencial del sistema es (véase el Ejemplo
5.11)
−Ze2
V= (14.48)
4π0 r
siendo r la distancia entre las cargas. Suponemos el núcleo fijo en el origen de un sistema
coordenado, con el electrón en la posición (x, y, z). La ecuación de Schrödinger para el
movimiento del electrón en torno al núcleo estacionario es entonces

2 2
− ∇ ψ + Vψ = Eψ (14.49)
2me
donde ∇2 es el operador laplaciano tridimensional y la función energı́a potencial es, en

coordenadas cartesianas,
−Ze2
V(x, y, z) = . (14.50)
4π0 (x2 + y2 + z2 )1/2
Empezamos por simplificar la ecuación expresando todas las cantidades fı́sicas en unida-
des atómicas (véase el Apartado 1.7): la ecuación de Schrödinger ‘en unidades atómicas’
es

1 ∂2ψ ∂2ψ ∂2ψ Z
− + 2 + 2 − 2 ψ = Eψ . (14.51)
2 ∂x 2
∂y ∂z (x + y + z2 )1/2
2
Separación de variables
El primer paso para la resolución de la ecuación en derivadas parciales en tres va-
riables es separarla, es decir, reducirla a tres ecuaciones ordinarias. Esto no es posible
de hacer en coordenadas cartesianas porque la función potencial V no puede expresarse
como una suma de términos cada uno en una sola variable. Existen varios sistemas de
coordenadas, sin embargo, en los cuales la separación es posible. Uno de ellos es el
sistema de coordenadas esféricas presentado en el Capı́tulo 10. El operador laplaciano
es en esas coordenadas (Apartado 10.5)

1 ∂ ∂ 1 ∂ ∂ 1 ∂2
∇2 = 2 r2 + 2 sen θ + 2
r ∂r ∂r r sen θ ∂θ ∂θ r sen θ ∂φ2
2
y la ecuación de Schrödinger queda (tras multiplicar por −2 y reordenar los términos)

1 ∂ 2 ∂ψ 1 ∂ ∂ψ 1 ∂ 2 ψ 2Z
r + sen θ + + ψ + 2Eψ = 0 . (14.52)
r2 ∂r ∂r r2 sen θ ∂θ ∂θ r2 sen2 θ ∂φ2 r
Empezamos por separar los términos radiales de los términos angulares expresando la
función de onda como el producto
ψ(r, θ, φ) = R(r) × Y(θ, φ) . (14.53)
Sustituyendo en (14.52), dividiendo ambos miembros por ψ = RY y multiplicando por

r2 tenemos

1 d 2 dR 1 1 ∂ ∂Y 1 ∂2Y
r + 2Zr + 2Er +
2
sen θ + = 0 . (14.54)
R dr dr Y sen θ ∂θ ∂θ sen2 θ ∂φ2
Tomamos la constante de separación como l(l+1) por motivos que se verán más adelante.
Con esto la ecuación radial para el átomo de hidrógeno es

1 d 2 dR
r + 2Zr + 2Er2 = l(l + 1)
R dr dr
o bien

1 d 2 dR l(l + 1) 2Z
r + − + + 2E R = 0 (14.55)
r2 dr dr r2 r
y la ecuación angular es

1 ∂ ∂Y 1 ∂2Y
sen θ + + l(l + 1)Y = 0 . (14.56)
sen θ ∂θ ∂θ sen2 θ ∂φ2
Para separar las variables angulares, tomamos ahora
Y(θ, φ) = Θ(θ) × Φ(φ) . (14.57)
Sustituyendo este producto y sus derivadas en la ecuación angular, dividiendo por Y =

ΘΦ y multiplicando por sen2 θ, tenemos

sen θ d dΘ 1 d2 Φ
sen θ + l(l + 1) sen θ +
2
=0 (14.58)
Θ dθ dθ Φ dφ2
de manera que, si tomamos la constante de separación como −m2 ,
d2 Φ(φ)
= −m2 Φ(φ) , (14.59)
dφ2

1 d dΘ m2
sen θ + l(l + 1) − Θ = 0. (14.60)
sen θ dθ dθ sen2 θ
La separación de variables es completa. Es necesario ahora resolver los tres problemas

de contorno dados por las ecuaciones (14.55), (14.59) y (14.60), con las condiciones de
contorno adecuadas.
Ecuación para Φ
d2 Φ(φ)
= −m2 Φ(φ) . (14.59)
dφ2
La función Φ está definida en el intervalo 0 ≤ φ ≤ 2π y tiene que cumplir la condición

Φ(2π) = Φ(0) (14.61)
para asegurar la continuidad alrededor del cı́rculo. Se trata por lo tanto del mismo pro-
blema de contorno visto en el Apartado 12.7 para la partı́cula en un aro y en 14.5 para el
movimiento angular de una partı́cula en un pozo circular. Las soluciones normalizadas
son
1
Φm (φ) = √ eimφ , m = 0, ±1, ±2, . . . (14.62)
2π
o en su forma real (ecuaciones (12.71))
1 1 1 1
√ (Φm + Φ−m ) = √ cos mφ , √ (Φm − Φ−m ) = √ sen mφ (14.63)
2 2 π i 2 2 π
con m = 0, 1, 2, . . . Las funciones forman un conjunto ortonormal, con la propiedad

2π
Φ∗m (φ)Φm (φ) dφ = δm,m . (14.64)

0
Ecuación para Θ

1 d dΘ m2
sen θ + l(l + 1) − Θ = 0. (14.60)
sen θ dθ dθ sen2 θ
La ecuación se transforma en la ecuación asociada de Lagrange (13.22) mediante el

cambio x = cos θ. Tenemos
dΘ dΘ dx dΘ
= = − sen θ ,
dθ dx dθ dx
d2 Θ dΘ 2 d Θ
2
2 d Θ
2
dΘ
= − cos θ + sen θ = (1 − x ) −x .
dθ 2
dx dx 2
dx 2
dx
Por lo tanto

1 d dΘ d2 Θ cos θ dΘ 2 d Θ
2
dΘ
sen θ = + = (1 − x ) − 2x
sen θ dθ dθ dθ 2
sen θ dθ dx 2
dx
y la ecuación (14.60) se transforma en

d2 Θ dΘ m2
(1 − x ) 2 − 2x
2
+ l(l + 1) − Θ = 0, (14.65)
dx dx (1 − x2 )
que es idéntica a la ecuación asociada de Legendre. Las soluciones finitas en el intervalo

−1 ≤ x ≤ 1 (0 ≤ θ ≤ π) son las funciones asociadas de Legendre (normalizadas,
ecuación (13.28))

(2l + 1) (l − |m|)! |m| l = 0, 1, 2, 3, . . .
Θl,m ( cos θ) = Pl ( cos θ) , (14.66)
2 (l + |m|)! m = 0, ±1, ±2, . . . , ±l .
Estas funciones forman un conjunto ortonormal con la propiedad (ecuación (13.29))

2π
Θl,m ( cos θ)Θl ,m ( cos θ) sen θ dθ = δl,l (14.67)

0
Armónicos esféricos
Los productos de las funciones angulares Θl,m y Φm ,

2l + 1 (l − |m|)! |m|
Yl,m (θ, φ) = Θl,m (θ)Φm (φ) = P ( cos θ) eimφ , (14.68)
4π (l + |m|)! l
se llaman armónicos esféricos. Se dan siempre que se formula un problema fı́sico en

tres dimensiones en coordenadas esféricas.* Presentamos algunas de estas funciones en
la Tabla 14.1. Las funciones son complejas si m = 0 y es a veces más conveniente usar
las funciones reales correspondientes (véanse las ecuaciones (14.63))
1 1
√ (Yl,m + Yl,−m ) , √ (Yl,m − Yl,−m ) , m > 0. (14.69)
2 i 2
Los armónicos esféricos multiplicados por el factor rl se llaman armónicos sólidos,

y sus formas reales se dan también en la tabla, junto con sus nombres convencionales en
la teorı́a de la estructura atómica.
Por las relaciones de ortogonalidad (14.64) y (14.67), los armónicos esféricos forman un
conjunto ortonormal para un ángulo sólido completo (θ = 0 → π, φ = 0 → 2π):
2π π
∗
Yl,m (θ, φ) Yl,m(θ, φ) sen θ dθ dφ = δl,l δm,m . (14.70)
0 0
Momento angular
La ecuación angular (14.56) puede escribirse como la ecuación de autovalores (en
unidades apropiadas)
0* Los armónicos esféricos se definen a menudo con un ‘factor de fase’ adicional (– 1)(m+|m|)/2 que
multiplica la función por (– 1) cuando m es impar y positivo.
Tabla 14.1
armónico esférico armónico sólido (real)
1/2 1/2
1 1
Y0,0 = s=
4π 4π
1/2 1/2
3 3
Y1,0 = cos θ pz = z
4π 4π
1/2 1/2 1/2
3 3 3
Y1,±1 = sen θe±iφ px = x , py = y
8π 4π 4π
1/2 1/2
5 5
Y2,0 = (3 cos2 θ − 1) dz2 = (3z2 − r2 )
16π 8π
1/2 1/2 1/2
15 15 15
Y2,±1 = sen θ cos θe±iφ dxz = xz , dyz = yz
8π 4π 4π
1/2 1/2 1/2
15 15 15
Y2,±2 = sen2 θe±2iφ dx2 −y2 = (x2 − y2 ) , dxy = xy
32π 16π 4π

1 ∂ ∂ 1 ∂2
− 2
sen θ + Yl,m = l(l + 1)2 Yl,m (14.71)
sen θ ∂θ ∂θ sen2 θ ∂φ2
o bien
L2 Yl,m = l(l + 1)2 Yl,m (14.72)
donde L2 es el operador cuántico para el cuadrado del momento angular. Los armóni-
cos esféricos son por lo tanto autofunciones de L2 . Describen los estados posibles del
momento angular del sistema, y los autovalores l(l + 1)2 son los valores permitidos del
cuadrado del momento angular. Además, de la ecuación (14.62) se deduce que
dΦm
−i = mΦm
dφ
y por lo tanto que
∂Yl,m
−i = mYl,m (14.73)
∂φ
o bien
Lz Yl,m = mYl,m . (14.74)
Lz es el operador cuántico que representa la componente del momento angular en la

dirección z, y los autovalores m de Lz son los valores permitidos de esa componente.
El número l se llama número cuántico azimutal (o del momento angular) y m número

cuántico magnético (o número cuántico de la componente del momento angular).
Ecuación radial

1 d 2 dR l(l + 1) 2Z
r + − + + 2E R = 0. (14.55)
r2 dr dr r2 r
Esta ecuación tiene dos conjuntos de soluciones para el átomo de hidrógeno. En los es-
tados ligados del átomo el electrón resulta confinado a las proximidades del núcleo por
aplicarse la condición de contorno R(r) → 0 cuando r → ∞. Las energı́as de esos esta-
dos son negativas (el cero de energı́a corresponde a dos cargas en reposo infinitamente
separadas) y hay que aportar energı́a al sistema para ionizar el átomo. Los estados con
energı́a positiva son estados de colisión (estados del continuo) en los que el electrón se
mueve libremente en presencia del núcleo pero no está ligado a él. Vamos a considerar
aquı́ únicamente los estados ligados, con E < 0. Tomamos
Z
α2 = −2E , λ= , (14.75)
α
y definimos la nueva variable
ρ = 2αr . (14.76)
dR dR d2 R 2
2d R
Entonces = 2α , = 4α , y la ecuación radial se transforma en
dr dρ dr2 dρ2

d2 R 2 dR l(l + 1) λ 1
+ + − + − R=0 (14.77)
dρ2 ρ dρ ρ2 ρ 4
que es idéntica a la ecuación (13.45) para las funciones asociadas de Laguerre, con
λ = n un entero positivo. Las soluciones de la ecuación vienen dadas por lo tanto por la
ecuación (13.44)
e−ρ/2 ρl Ln+l
2l+1
(ρ) .
Estas funciones son finitas y continuas para todo valor de ρ positivo, y por lo tanto
de r, y cumplen las condiciones de contorno para los estados ligados. Las funciones
pueden ser normalizadas, utilizando la ecuación (13.46), y las funciones de onda radiales
normalizadas que se obtienen son*
0* Por convenio, las funciones radiales (14.78) se definen con un signo negativo como parte de la
constante de normalización.
3 1/2
2Z (n − l − 1)!
Rn,l (r) = − e−ρ/2 ρl Ln+l
2l+1
(ρ) (14.78)
2n{(n + l)!}
3
n
donde, por ser α = Z/n si λ = n,
2Z
ρ= r (14.79)
n
y los valores permitidos de los números cuánticos son
n = 1, 2, 3, . . . l = 0, 1, 2, . . . , (n − 1) . (14.80)
Las funciones radiales forman un conjunto ortonormal con respecto a la función peso r2
en el intervalo 0 ≤ r ≤ ∞ :
∞
Rn,l (r) Rn,l (r) r2 dr = δn,n . (14.81)
0
En la Tabla 14.2 presentamos algunas de las funciones radiales. Se ha incluido la unidad

de longitud atómica cuando procede, de manera que ρ = 2Zr/na0 .
Tabla 14.2 Funciones radiales
n l nombre Rn,l (ρ)

3/2
Z
1 0 1s 2 e−ρ/2
a0
3/2
1 Z
2 0 2s √ (2 − ρ) e−ρ/2
2 2 a0
3/2
1 Z
2 1 2p √ ρ e−ρ/2
2 6 a0
3/2
1 Z
3 0 3s √ (6 − 6ρ + ρ2 ) e−ρ/2
9 3 a0
3/2
1 Z
3 1 3p √ (4 − ρ)ρ e−ρ/2
9 6 a0
3/2
1 Z
3 2 3d √ ρ2 e−ρ/2
9 30 a0
En la Figura 14.4 dibujamos sus gráficas. El número de nodos radiales (superficies esféri-
cas nodales de la función de onda global) es n − l − 1, sin contar el cero en r = 0 si
l > 0.
Figura 14.4
Energı́a
Los valores permitidos de la energı́a se obtienen a partir de (14.75): si λ = n, α =
Z/n y E = −α2 /2. Por lo tanto
Z2
En = − , n = 1, 2, 3, . . . (14.82)
2n2
El número n se llama número cuántico principal.
La función de onda global
Las soluciones globales de la ecuación de Schrödinger para los estados ligados del
átomo hidrogenoideo son
ψn,l,m (r, θ, φ) = Rn,l (r)Θl,m (θ)Φm (φ) (14.83)
y los números n, l y m se denominan número cuántico principal (n), número cuántico

azimutal (l), y número cuántico magnético (m). A partir de las relaciones de ortonorma-
lidad (14.64) para Φm , (14.67) para Θl,m y (14.81) para Rn,l se deduce que las funciones
de onda globales forman un conjunto ortonormal en el espacio tridimensional:
2π π ∞
ψ ∗
n,l,m ψn,l,m dv = ψn,l,m
∗
(r, θ, φ) ψn,l,m(r, θ, φ) r2 sen θ dr dθ dφ
0 0 0
= δn,n δl,l δm,m . (14.84)
En la Figura 14.5 se representan las funciones de onda globales, los orbitales atómicos,
mediante diagramas de curvas de nivel en un plano apropiado que contiene al núcleo.*
Los trazos continuos representan valores positivos de los orbitales, los discontinuos va-
lores negativos y los punteados nodos. Señalamos que las funciones de onda ψn,l,m con
0* Los diagramas de la Figura 14.5 están a escala en cuadrados de 20 (a0 ) de lado. Los valores de las
curvas de nivel son ±0,002 × 2i , i = 0, 1, 2, 3, . . .
energı́a En tienen un total de (n − 1) superficies nodales. Son estos diagramas los que
han llevado a la representación pictórica convencional de los orbitales atómicos.
Figura 14.5
14.7. La cuerda vibrante
Consideramos una cuerda elástica, como una cuerda de guitarra por ejemplo, de lon-
gitud l y densidad de masa lineal uniforme ρ, estirada y fijada en los extremos con una
tensión T. Si deformamos transversalmente la cuerda
(pulsándola hacia un lado), la soltamos, y le permitimos
vibrar (Figura 14.6), su desplazamiento transversal es en-
tonces una función de la posición x y del tiempo t,
y = y(x, t) , (14.85)
y si las vibraciones son pequeñas, el movimiento de la

Figura 14.6
cuerda viene descrito por la ecuación de ondas
∂2y 1 ∂2y
= (14.86)
∂x2 v2 ∂t2
donde v2 = T/ρ. Las condiciones de frontera e iniciales que se aplican a las soluciones
de la ecuación son
y(0, t) = y(l, t) = 0 (14.87)

14.7. La cuerda vibrante 363
para extremos de la cuerda fijos, e

∂y
y(x, 0) = f (x) , = g(x) , (14.88)
∂t t=0
para el perfil y la velocidad (las funciones) iniciales.
Separación de variables
Escribimos la función del desplazamiento (una función de onda) como el producto
y(x, t) = F(x) × G(t) . (14.89)
Sustituyendo en la ecuación de ondas y dividiendo por y = FG se obtiene
1 d2 F 1 d2 G
= . (14.90)
F dx2 Gv2 dt2
Ambos miembros de la ecuación deben ser constantes de manera que, tomando la cons-
tante de separación −λ2 , el problema en dos variables se reduce al problema de contorno
d2 F
+ λ2 F = 0 , F(0) = F(l) = 0 , (14.91)
dx2
y al problema de valor inicial
d2 G
+ λ2 v2 G = 0 (14.92)
dt2
con condiciones iniciales dadas por (14.88), siendo f (x) y g(x) unas funciones dadas.
El problema de contorno es idéntico al visto en el Apartado 12.6 para una partı́cula
en un pozo. Los valores permitidos de la constante de separación vienen dados por
nπ
λn = , n = 1, 2, 3, . . . (14.93)
l
y las correspondientes soluciones particulares (no normalizadas) son
nπx
Fn (x) = sen . (14.94)
l
Para cada valor de λn , la ecuación (14.92) es
d2 G
+ ωn2 G = 0 (14.95)
dt2
donde
nπv
ωn = λn v = (14.96)
l
y su solución es
Gn (t) = An cos ωn t + Bn sen ωn t (14.97)
siendo An y Bn constantes determinadas por las condiciones iniciales. Un conjunto de

soluciones de la ecuación de ondas para la cuerda vibrante es por lo tanto
nπx
yn (x, t) = sen An cos ωn t + Bn sen ωn t , n = 1, 2, 3, . . . (14.98)
l
Estas soluciones se denominan autofunciones del sistema. Las cantidades ωn = nπv/l
se denominan autovalores. El conjunto de valores {ω1 , ω2 , ω3 . . . } se denomina espectro
de autovalores.
Modos normales de vibración

Cada una de las autofunciones yn (x, t) es una función periódica del tiempo con periodo
2π/ωn : se trata de un movimiento armónico transverso con frecuencia νn = ωn /2π. Este
movimiento se denomina un modo normal de vibración de la cuerda. El primer modo,
con n = 1, se llama fundamental, el segundo, con n = 2, es el primer armónico, etcétera.
En la Figura 14.7 ilustramos los movimientos espaciales de los tres primeros modos
normales (véase también la Figura 12.6).
Figura 14.7
El modo n-ésimo tiene n − 1 nodos entre los extremos, es decir, puntos con desplaza-
miento cero que no se mueven. Las soluciones (14.98) representan ondas estacionarias.
La solución completa
Cada uno de los modos normales contiene dos constantes, An y Bn , que hay que fijar
según las condiciones iniciales (14.88), es decir, según se inicia el movimiento. Es po-
sible elegir las condiciones iniciales de manera que el movimiento sea el de uno de los
modos normales. Por ejemplo, se obtiene el modo n-ésimo con

nπx
y(x, 0) = f (x) = An sen ,
l
(14.99)
∂y nπx
= g(x) = Bn ωn sen .
∂t t=0 l
En general, sin embargo, un único modo no cumple las condiciones iniciales: el movi-
miento no es un modo normal puro sino una mezcla o superposición de modos normales.
Para obtener la solución en el caso general, usamos el principio de superposición
presentado en el Apartado 12.2: si y1 , y2 , y3 , . . . son soluciones de una ecuación lineal
homogénea, cualquier combinación lineal de ellas es también una solución. Ası́, para
cada modo normal tenemos
∂ 2 yn 1 ∂ 2 yn
= (14.100)
∂x2 v2 ∂t2
de manera que si
y = c1 y1 + c2 y2 + c3 y3 + . . . (14.101)
entonces
∂2y 1 ∂2y
= . (14.102)
∂x2 v2 ∂t2
La solución general de la ecuación de ondas que cumple las condiciones de contorno es
por lo tanto una superposición de modos normales
nπx
∞
y(x, t) = sen An cos ωn t + Bn sen ωn t (14.103)

n=1
l
(las constantes c1 , c2 , . . . de (14.101) han sido incluidas en los correspondientes coefi-

cientes An y Bn ). Esta solución cumple las condiciones iniciales si determinamos los An
y Bn a partir de las ecuaciones

∞
nπx
y(x, 0) = f (x) = An sen ,
n=1
l

∞
(14.104)
∂y nπx
= g(x) = Bn ωn sen .
∂t t=0 n=1
l
Las dos series de (14.104) son ejemplos de las series de Fourier que trataremos en el
Capı́tulo 15. Volveremos a este problema en el Apartado 15.5 para determinar los An y
Bn para funciones iniciales tı́picas f (x) y g(x).
14.8. Ejercicios
Apartado 14.2
1. Demuestre que la función f (x, t) = a sen (bx) cos (vbt) cumple la ecuación de ondas en una dimensión
(14.1), y que es de la forma
f (x, t) = F(x + vt) + G(x − vt) .
2. La ecuación de difusión
∂f ∂2f
=D 2
∂t ∂x
representa, por ejemplo, la transmisión de calor por conducción de una región caliente a una región frı́a
si f es la temperatura, o la transmisión de materia de una región con concentraciones altas a una con
concentraciones bajas si f es la concentración. Halle todas las posibles soluciones de la ecuación que tengan
la forma
f (x, t) = a + bect V(x) .
3. (i) En el Ejemplo 14.2 se demuestra que la función

f (x, t) = a exp −b(x − vt)2
es una solución de la ecuación de ondas (14.1). Dibujando las gráficas de f en función de x para los instantes
t = 0, t = 2/v y t = 4/v (tomando, por ejemplo, a = b = 1), demuestre que la función representa una
onda (una onda gaussiana) que viaja hacia la derecha (dirección x positiva) con velocidad v constante.
(ii) La correspondiente función que se mueve hacia la izquierda es

g(x, t) = a exp −b(x + vt)2 .
Demuestre que la función f (x, t) + g(x, t) es también una solución de la ecuación de ondas, y dibuje unas
gráficas apropiadas para ver cómo evoluciona con el tiempo.
Apartado 14.3
Halle por el método de separación de variables algunas soluciones f (x, y) para las siguientes ecuaciones:
∂f ∂f ∂f ∂f ∂2f ∂2f ∂2f
4. 2 + =0 5. y −x = 0 6. + = 0 7. +f =0
∂x ∂t ∂x ∂y ∂x2 ∂y2 ∂x∂y
8. Resuelva la ecuación de Laplace
∂2u ∂2u
+ =0
∂x2 ∂y2
con las condiciones de contorno:
u(x, 0) = 0 , u(x, 1) = 0 (0 < x < 1)
u(0, y) = 0 , u(1, y) = sen 3πy (0 < y < 2)
9. Una barra fina o alambre homogéneo de longitud l y sección transversal constante se aı́sla perfecta-
mente en toda su longitud con los extremos mantenidos a temperatura constante T = 0 (en alguna escala
de temperatura). El perfil de temperaturas de la barra es una función T(x, t) de la posición x (0 ≤ x ≤ l) y
del tiempo t, y cumple la ecuación de conducción del calor (difusión)
∂T ∂2T
=D 2
∂t ∂x
siendo D el coeficiente de difusión térmico del material.
Si el perfil de temperaturas a t = 0 es T(x, 0) = 3 sen πx/l, halle la solución de la ecuación que decae
exponencialmente con el tiempo en cada punto x.
Apartado 14.4
10. Resuelva la ecuación de Schrödinger para una partı́cula en un pozo rectangular tridimensional con
función energı́a potencial
V(x, y, z) = 0 para 0 < x < a , 0 < y < b, 0 < z < c,
= ∞ en el resto .
¿Cuáles son las posibles degeneraciones de los autovalores para un pozo cúbico?
Apartado 14.5
11. Algunos ceros de las funciones de Bessel Jn (x) son:
J0 (x) = 0 para x = 2,4048; 5,5201; 8,6537
J1 (x) = 0 x = 3,8317; 7,0156; 10,1736
J2 (x) = 0 x = 5,1356; 8,4172
J3 (x) = 0 x = 6,3802; 9,7610
J4 (x) = 0 x = 7,5883
1. Halle las energı́as (en unidades de h2 /8ma2 ) de los 10 estados más bajos para una partı́cula en un
pozo circular de radio a, y dibuje el correspondiente diagrama de niveles de energı́a.
2. Los seis diagramas de la Figura 14.3 son representaciones de los signos y nodos de las funciones
de onda (14.47) para los seis estados más bajos, utilizando la forma real de las funciones angulares.
Dibuje los correspondientes diagramas para los 4 siguientes estados más bajos.
Apartado 14.6
12. (i) Use las Tablas 14.1 y 14.2 para dar la función de onda global ψ1,0,0 (r, θ, φ) para el átomo de
hidrógeno.
(ii) Sustituya esta función de ondas en la ecuación de Schrödinger (14.52) y compruebe que se trata
de una solución con E dada por (14.82).
13. Repita el Ejercicio 12 para la función de onda ψ2,1,1 .
14. Demuestre que las funciones radiales R1,0 y R2,0 , dadas en la Tabla 14.2, cumplen la condición de
ortogonalidad (14.81) (recuerde utilizar la expresión de ρ adecuada).
Apartado 14.7
15. Halle la solución general de (14.103) para la cuerda vibrante que cumpla la condición inicial
∂y
(x, 0) = 0.
∂t
∂T ∂2T
16. Halle la solución general de la ecuación de difusión = D 2 que cumple las condiciones de
∂t ∂x
contorno T(0, t) = T(l, t) = 0 para t ≥ 0 (véase el Ejercicio 9), y que decae exponencialmente con el
tiempo.
∂2u ∂2u
17. Halle la solución general de la ecuación de Laplace 2 + 2 = 0 sujeta a las
∂x ∂y
condiciones de contorno
u(x, 0) = 0 , u(x, 1) = 0 ,
u(0, y) = 0 (0 < y < 1) ,
(véase el Ejercicio 8).
Desarrollos ortogonales.
Análisis de Fourier
15.1. Conceptos
Vimos en el Apartado 7.6 que muchas funciones pueden desarrollarse en serie de
potencias y que, de hecho, algunas se definen mediante esas series. En general, una
función f (x) puede desarrollarse en potencias de x como una serie de MacLaurin si la
función y sus derivadas existen en x = 0 y en todo el intervalo que va de 0 a x. El
desarrollo es válido entonces dentro del radio de convergencia de la serie.
El desarrollo en serie de potencias de una función es un caso particular de un tipo
más general de desarrollo. Sea la función

∞
f (x) = a0 + a1 x + a2 x2 + · · · = al x l . (15.1)
l=0
Podemos considerar cada potencia de x como la función gl (x) = xl , es decir, g0 (x) =

x0 = 1, g1 (x) = x, g2 (x) = x2 , etcétera. El desarrollo es entonces

∞
f (x) = a0 g0 (x) + a1 g1 (x) + a2 g2 (x) + · · · = al gl (x) . (15.2)

l=0
Este formalismo sugiere que puede ser posible encontrar otros conjuntos de funciones
{gl } que usar en vez de simples potencias, y que puede ser posible desarrollar de esa
manera funciones que no pueden desarrollarse en serie de potencias.
Los conjuntos de funciones de particular importancia para desarrollos en serie con-
sisten en funciones con la propiedad de ortogonalidad. En el Apartado 15.2 presentamos
la teorı́a de desarrollos ortogonales. En el apartado 15.3 tratamos dos ejemplo de des-
arrollos en polinomios de Legendre, importantes en la teorı́a del potencial y en la teorı́a
de difusión, con una aplicación a la electrostática. En el Apartado 15.4 consideramos las
series de Fourier y las usamos en el Apartado 15.5 para resolver la ecuación de ondas
para la cuerda vibrante con unas condiciones iniciales dadas. En el apartado 15.6 tra-
tamos la transformada de Fourier, imprescindible para el análisis de los resultados de
experimentos de difracción y para la espectroscopia de análisis de Fourier.
370 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier
15.2. Desarrollos ortogonales
Introducimos el concepto de desarrollo en un conjunto de funciones ortogonales de-

mostrando que la serie de potencias (15.1) puede escribirse como una combinación lineal
de polinomios de Legendre,

∞
f (x) = c0 P0 (x) + c1 P1 (x) + c2 P2 (x) + · · · = cl Pl (x) , (15.3)

l=0
y que, cuando el valor de la variable se limita al intervalo −1 ≤ x ≤ +1, la ortogonalidad

de los polinomios de Legendre permite deducir una fórmula general para los coeficientes
cl de (15.3) en función de los coeficientes al de (15.1). En el Apartado 13.4 tratamos los
polinomios de Legendre, y los primeros son
P0 (x) = 1 , P1 (x) = x ,
1 1 3
P2 (x) = (3x2 − 1) , P3 (x) = (5x − 3x) , (15.4)
2 2
1 1
P4 (x) = (35x4 − 30x2 + 3) , P5 (x) = (63x5 − 70x3 + 15x) .
8 8
La función Pl (x) es un polinomio de grado l en x, y es posible expresar cada potencia xl
como una combinación lineal de polinomios de Legendre hasta grado l. Por ejemplo, a
partir de (15.4) tenemos
x0 = P0 , x1 = P1 ,
1 1
x2 = (2P2 + P0 ) , x3 = (2P3 + 3P1 ) , (15.5)
3 5
1 1
x4 = (8P4 + 20P2 + 7P0 ) , x5 = (8P5 + 28P3 + 27P1 ) .
35 63
Usando únicamente los términos de (15.5), la serie de potencias (15.1) se puede escribir
por lo tanto como
a2 a3 a4
f (x) = a0 P0 + a1 P1 + (2P2 + P0 ) + (2P3 + 3P1 ) + (8P4 + 20P2 + 7P0 )
3 5 35
a5
+ (8P5 + 28P3 + 27P1 ) + · · ·
63
a2 a4 3a3 3a5 2a 4a4
= a0 + + + · · · P0 + a1 + + + · · · P1 + + + · · · P2
2
3 5 5 7 3 7
3a 4a 8a 8a
+ + + · · · P3 + + · · · P4 + + · · · P5 + · · ·
3 5 4 5
(15.6)
5 9 35 63
y esto tiene la forma pedida (15.3). Los polinomios de Legendre aparecen en las ciencias
fı́sicas en la variable x = cos θ, de manera que estamos interesados únicamente en el
15.2. Desarrollos ortogonales 371
intervalo −1 ≤ x ≤ +1. Los polinomios son ortogonales en ese intervalo (véase la

ecuación (13.25)),
⎧
+1 ⎨0 si k = l
2
Pk (x)Pl (x) dx = δk,l = 2 (15.7)
−1 2l + 1 ⎩ si k = l ,
2l + 1
y podemos usar esto para obtener una fórmula general para los coeficientes cl de (15.3).
Multiplicamos la ecuación (15.3) por Pk (x) e integramos. Tenemos entonces
+1 +1

∞
∞ +1
Pk (x)f (x) dx = Pk (x) cl Pl (x) dx = cl Pk (x)Pl (x) dx

−1 −1 l=0 l=0 −1
y como, por (15.7), cada integral en el segundo miembro es cero salvo para l = k, sólo
ese término contribuye a la suma:
+1 +1
2
Pk (x)f (x) dx = ck Pk (x)Pk (x) dx = ck .
−1 −1 2k + 1
Por lo tanto
+1
2k + 1
ck = Pk (x)f (x) dx . (15.8)
2 −1
Este importante resultado nos da los valores de los coeficientes cl del desarrollo de una
función finita y continua de x (|x| ≤ 1) en serie de los polinomios de Legendre.
Aplicamos ahora la fórmula a la serie de potencias (15.1):

2k + 1
+1 ∞ ∞ +1
2k + 1
ck = Pk (x) al x dx =
l
al Pk (x)xl dx . (15.9)
2 −1 l=0
2 l=0 −1
Sustituyendo en las integrales Pk (x) por su expresión en función de x, a partir de tabula-

ciones como (15.4) o de la expresión general (13.19), obtenemos los coeficientes ck en
función de los coeficientes al .
EJEMPLO 15.1 Use la ecuación (15.9) con k = 0 para hallar c0 .

Tenemos P0 = 1, ası́ que la ecuación (15.9) es
+1
1
∞
c0 = al xl dx ,
2 l=0 −1
donde ⎧
+1 l+1
+1 ⎨ 2
x si l es par,
xl dx = = l+1
−1 l+1 −1
⎩
0 si l es impar.
Por lo tanto
a2 a4 a6 a2l ∞
c0 = a0 + + + + ··· =
3 5 7 l=0
2l + 1
que está de acuerdo con el coeficiente de P0 que aparece en (15.6).
El caso general
Sean gn (x), n = 1, 2, 3, . . . un conjunto de funciones, posiblemente complejas, orto-
gonales en el intervalo a ≤ x ≤ b con respecto a la función peso w(x):
b
g∗m (x)gn (x) w(x) dx = 0 si m = n (15.10)

a
(para funciones reales g∗m = gm ). Sea f (x) una función

arbitraria
definida en el intervalo
a ≤ x ≤ b, que puede desarrollarse en el conjunto gn (x) ,

∞
f (x) = cn gn (x) . (15.11)

n=0
Entonces, multiplicando por g∗m (x) e integrando con respecto a la función peso w(x) entre
a y b, tenemos
b
∞ b
g (x)f (x) w(x) dx =

∗
m cn g∗m (x)gn (x) w(x) dx
a n=0 a
b
= cm g∗m (x)gm (x) w(x) dx ,

a
de manera que (sustituyendo m por n),

b
g∗n (x)f (x) w(x) dx

cn = ab . (15.12)
∗
g (x)gn (x) w(x) dx
n
a
El denominador de esta expresión es la integral de normalización para la función gn (x):

es el cuadrado de la norma

b
||gn || = g∗n (x)gn (x) w(x) dx . (15.13)

a
La norma de una función se interpreta a veces como la ‘magnitud’ o la ‘longitud’ de la

función. Los coeficientes del desarrollo (15.11) para f (x) vienen dados por lo tanto por
15.2. Desarrollos ortogonales 373
b
1
cn = g∗m (x)f (x) w(x) dx . (15.14)
||gn ||2 a
A menudo es más conveniente que las funciones del desarrollo estén normalizadas,
además de ser ortogonales. La normalización se consigue dividiendo cada función por
su norma,
1
gn (x) = gn (x) . (15.15)
||gn ||
El conjunto de funciones que resulta es un conjunto ortonormal,

b
gm∗ (x) gn (x) w(x) dx = δm,n . (15.16)

a
El desarrollo (15.11) es entonces

∞
f (x) = cn gn (x) (15.17)

n=0
y la ecuación (15.14) para los coeficientes del desarrollo es

b
cn = gn∗ (x) f (x) w(x) dx . (15.18)

a
El concepto de desarrollos ortogonales se generaliza fácilmente a funciones de más de

una variable.
Completitud de conjuntos ortogonales

En capı́tulos previos hemos visto varios conjuntos de funciones ortogonales, en parti-
cular las distintas ‘funciones especiales’ del Capı́tulo 13 y las soluciones de la ecuación
de Schrödinger (autofunciones del hamiltoniano) de los Capı́tulos 12 y 14. Todos esos
conjuntos comparten la propiedad

de completitud:
Un conjunto ortonormal g(x) definido en el intervalo a ≤ x ≤ b con respec-
to a una función peso w(x) se dice completo si ‘toda’ función f (x) definida en
el intervalo puede representarse por una combinación lineal de las funciones
del conjunto,

∞ b
f (x) = cn gn (x) , cn = g∗n (x) f (x) w(x) dx . (15.19)

n=0 a
Esta definición de la completitud es suficiente para la mayorı́a de los casos. Hay que
tener en cuenta dos precisiones:
(1) Por toda función se entiende no sólo las funciones continuas sino la clase más
general de las funciones continuas a trozos que tienen un número finito de dis-
continuidades finitas y un número finito de máximos y mı́nimos en el intervalo.1
(2) Por la representación de la función se entiende que la función puede aproximarse
con precisión arbitraria mediante una serie finita
f (x) ≈ fk (x) = c0 g0 (x) + c1 g1 (x) + · · · + ck gk (x) (15.20)
y el lı́mite de la serie es tal que

b 2
f (x) − fk (x) w(x) dx → 0 cuando k → ∞. (15.21)
a
Se dice que la serie converge en media a f (x) y en la práctica puede sustituirse la fun-
ción por la serie, aunque (15.21) no supone que la serie converja necesariamente a f (x)
para todo x. Esta convergencia en media permite representar varias funciones disconti-
nuas, aunque hay que tener cuidado a veces si se plantean igualdades entre derivadas o
integrales de la serie y derivadas o integrales de la función que representa.
15.3. Dos desarrollos en polinomios de Legendre

Vimos en el apartado anterior que una serie de potencias de x puede representarse
como una serie en polinomios de Legendre. Dos ejemplos en las ciencias fı́sicas son
−1/2

∞
(1 − 2xt + t2 ) = tl Pl (x) , −1 ≤ x ≤ +1 , (15.22)

l=0
de importancia en la teorı́a del potencial (teorı́as electrostática y gravitatoria), y

∞
e =
itx
(2l + 1)il jl (t)Pl (x) , (15.23)
l=0
de importancia en teorı́a de la difusión, donde las jl (t) son las funciones de Bessel esféri-
cas (ecuación (13.57)). La serie (15.22) converge para |x| < 1 y |t| < 1, y la obtenemos
en el Ejemplo 15.2. La serie (15.23) converge para |x| < 1 y todo valor de t, y en el
Ejemplo 15.3 mostramos cómo hallarla.
01. Dirichlet fue el primero en demostrarlo para las series de Fourier (‘condiciones de Dirichlet’).
Gustav Peter Lejeune-Dirichlet (1805-1859), matemático alemán, fue influido por el trabajo de Fourier
mientras estudiaba en Parı́s en los primeros años de la década de 1820.
15.3. Dos desarrollos en polinomios de Legendre 375
EJEMPLO 15.2 Deduzca el desarrollo (15.22).

Consideramos la función por desarrollar como una función de t, y la desarrollamos en serie de MacLaurin.
Tenemos
f (t) = (1 − 2xt + t2 )−1/2 f (0) = 1

f (t) = (x − t)(1 − 2xt + t2 )−3/2 f (0) = x
f (t) = 3(x − t)2 (1 − 2xt + t2 )−5/2 − (1 − 2xt + t2 )−3/2 f (0) = 3x2 − 1
y de forma similar f (0) = 15x3 − 9x, f (0) = 105x4 − 90x2 + 9, etcétera.
Comparando esto con los polinomios de Legendre que aparecen en (15.4), vemos que para la derivada
l-ésima: f (l) (0) = l! Pl (x). La serie de MacLaurin
t2 t3 t4
f (t) = f (0) + tf (0) + f (0) + f (0) + f (0) + · · ·
2! 3! 4!
es entonces
f (t) = (1 − 2xt + t2 )−1/2 = P0 + tP1 (x) + t2 P2 (x) + t3 P3 (x) + t4 P4 (x) + · · ·
que es la ecuación (15.22).
EJEMPLO 15.3 Deduzca el desarrollo (15.23).

El desarrollo de la función exponencial nos da
∞
(it)n n
∞
eitx = x = an xn .
n=0
n! n=0

El correspondiente desarrollo en polinomios de Legendre cl Pl (x) se obtiene usando la expresión (15.9)
+1
2l + 2
∞
cl = an Pl (x)xn dx .
2 n=0 −1
Del Ejemplo 15.1 tenemos que, por ejemplo, el coeficiente c0 es

a2 a4 a6
c0 = a0 + + + + ··· ,
3 5 7
de manera que, puesto que an = (it)n /n!,

t2 t4 t6 1 t t3 t5 sen t
c0 = 1 − + − + ··· = − + − ··· = .
3! 5! 7! t 1! 3! 5! t
De las ecuaciones (13.55) y (13.57) se deduce para las funciones de Bessel de orden semientero que

π
c0 = J1/2 (t) = j0 (t) .
2t
Puede demostrarse, ya sea de esta manera o de modo más elegante mediante las ecuaciones diferenciales
que cumplen tanto eitx como jl (t), que el coeficiente general es de la forma cl = (2l + 1)il jl (t).
Desarrollo del potencial electrostático

Potencial de una única carga
El potencial electrostático en un punto P debido a la presencia de una carga puntual
q es (véase la figura 15.1)
q
V= , (15.24)
4π0 Rq
donde Rq es la distancia del punto P a la carga (si se sitúa en P

una carga q , la energı́a potencial del sistema de las dos cargas es
Vq = qq /4π0 Rq ; véase el Ejemplo 5.11). Aplicando la regla Figura 15.1
del coseno al triángulo OPq, tenemos que
R2q = r2 + R2 − 2rR cos θ, de manera que podemos expresar (15.24) como
q −1/2
V= (R2 − 2rR cos θ + r2 ) . (15.25)
4π0
Vamos a considerar el caso R > r. Escribimos (15.25) como

−1/2
q r r
V= 1−2 cos θ +
4π0 R R R
y, por la ecuación (15.22) con t = r/R y x = cos θ, podemos desarrollar esto en polino-
mios de Legendre como
q r l
∞
r
V= Pl (cos θ) , < 1. (15.26)
4π0 R l=0 R R
Si r > R, el desarrollo es el mismo intercambiando r y R.
Potencial de una distribución de cargas

Sea un sistema de N cargas, q1 en (x1 , y1 , z1 ), q2 en
(x2 , y2 , z2 ), . . . , qn en (xn , yn , zn ), como se muestra en
la Figura 15.2 (para dos cargas). Cada carga hace su
contribución individual al potencial electrostático en el
punto P, y el potencial total en P es la suma de esas con-
tribuciones,

N
qi
V= . (15.27)
i=1
4π0 Ri
Figura 15.2
Si el punto P es exterior a la distribución de cargas, de
manera que R > ri para todo i,
15.4. Series de Fourier 377
el potencial puede desarrollarse término a término como en (15.26):

∞ l N
N
qi ri 1 1 l
∞
V= Pl (cos θi ) = q r Pl (cos θi ) . (15.28)

i=1
4π0 R l=0 R 4π0 l=0 Rl+1 i=1 i i
Este análisis del potencial es importante para describir la interacción electrostática de

distribuciones de cargas, por ejemplo en la teorı́a de fuerzas intermoleculares. Las can-
tidades

Ql = qi ril Pl (cos θi ) (15.29)
i
en (15.28) se denominan momentos multipolares de orden l, o 2l -polos, de la distribu-

ción de cargas (más estrictamente, Ql es la componente en la dirección OP del multipolo).
El desarrollo (15.28) se llama desarrollo multipolar del potencial. Los primeros mo-
mentos son
N
Q0 = qi carga total Q ,
i=1

N
Q1 = qi ri cos θi momento dipolar µ ,

i=1
N
1
Q2 = qi ri2 (3 cos2 θi − 1) momento cuadrupolar Θ . (15.30)
i=1
2
EJEMPLO 15.4 Campo de un dipolo

Para el sistema mostrado en la Figura 15.3 de dos cargas opuestas +q y −q separadas entre sı́ una distancia
r:
1. Q0 = +q − q = 0, y la carga total es cero.
1 1
2. Q1 = qr cos θ − qr cos (π + θ) = qr cos θ = µ cos θ ,
2 2
donde µ = qr es el momento (escalar) dipolar del par de cargas, y
µ cos θ es la componente del momento dipolar en la dirección OP.
r 2 1 r 2 1
3. Q2 = q (3 cos2 θ−1)−q (3 cos2 (π +θ)−1) = 0 ,
2 2 2 2
y puesto que Pl (cos θ) es una función par de cos θ, todo momento Figura 15.3
multipolar de orden par es cero.
El potencial en el punto P es entonces
µ cos θ Q3
V= + + ···
4π0 R2 4π0 R4
Si R es suficientemente grande (R >> r), el desarrollo del potencial puede truncarse después del término
principal,
µ cos θ
V≈ .
4π0 R2
Este es el potencial que domina la interacción de una molécula polar neutra a grandes distancias.
15.4. Series de Fourier

La representación en serie de Fourier2 de una función f (x) es un desarrollo de la
función mediante el conjunto de funciones trigonométricas
cos nx , n = 0, 1, 2, . . .
(15.31)
sen nx , n = 1, 2, 3, . . .
en el intervalo −π ≤ x ≤ π (más adelante, en este mismo apartado, consideraremos

intervalos de longitud arbitraria). Estas funciones son ortogonales en el intervalo (y en
cualquier intervalo de longitud 2π),
+π
cos mx cos nx dx = 0 , m = n , (15.32)

−π
+π
sen mx sen nx dx = 0 , m = n , (15.33)

−π
+π
cos mx sen nx dx = 0 , para todos m y n , (15.34)

−π
y las correspondientes integrales de normalización son

+π
2π, si n = 0,
cos nx cos nx dx = (15.35)
−π π, si n > 0,
+π
sen nx sen nx dx = π si n > 0. (15.36)

−π
La serie de Fourier (trigonométrica) se suele escribir por lo general en la forma

a0
f (x) = + a1 cos x + a2 cos 2x + a3 cos 3x +· · ·
2
+ b1 sen x + b2 sen 2x + b3 sen 3x +· · ·
a0
∞
= + (an cos nx + bn sen nx) , (15.37)

2 n=1
02. Jean-Baptiste Joseph Fourier (1768-1830) estudió la serie en relación con su trabajo sobre la di-
fusión del calor. Presentó primero el trabajo en la Academia francesa en 1807, y lo publicó en su forma
definitiva en 1822 en la Théorie analytique de la chaleur (Teorı́a analı́tica del calor). Su trabajo generó nue-
vos desarrollos en la teorı́a matemática de las funciones, y proporcionó una herramienta nueva y potente
para el análisis y la resolución de problemas fı́sicos.
y, dada la ortogonalidad de las funciones del desarrollo, los coeficientes de Fourier

vienen dados por
+π
1
an = f (x) cos nx dx , (15.38)
π −π
+π
1
bn = f (x) sen nx dx . (15.39)
π −π
EJEMPLO 15.5 Compruebe las relaciones (15.32) y (15.35).
Por las relaciones trigonométricas (3.22), para m = n,
1
cos mx cos nx = [ cos (m + n)x + cos (m − n)x] ,
2
de manera que
+π +π
1
cos mx cos nx dx = [ cos (m + n)x + cos (m − n)x] dx
−π 2 −π
+π
1 sen (m + n)x sen (m − n)x
= + = 0,
2 m+n m−n −π
y se obtiene cero porque el seno de un múltiplo entero de π es cero.

Para m = n = 0, en que cos mx = cos nx = 1,
+π
dx = [x]+π
−π = 2π .
−π
Para m = n > 0,
+π
+π +π
1 1 sen 2nx
cos2 nx dx = (1 + cos 2nx) dx = x+ = π.
−π −π 2 2 2n −π
Periodicidad
Las funciones trigonométricas (15.31) son funciones periódicas de x con periodo 2π
y, por lo tanto, toda combinación lineal de ellas es también periódica. Esto supone que
la función f (x) puede extenderse a valores fuera del intervalo de base −π ≤ x ≤ π
mediante la relación de periodicidad
f (x + 2π) = f (x) . (15.40)

Por ejemplo, la función

sen x para 0≤x≤π
f (x) = (15.41) 1
0 para −π ≤x≤0
que se muestra en la Figura 15.4, puede extenderse me-

diante la relación (15.40) para dar la función periódica
de la Figura 15.5. Figura 15.4
3 2 2 3
Figura 15.5
Las funciones periódicas aparecen en la representación matemática de sistemas fı́si-

cos que poseen fenómenos periódicos. Por ejemplo, la función representada en la Figura
15.5, tomando f (x) como la corriente y x como el tiempo, puede representar el resul-
tado de hacer pasar una corriente alterna a través de un rectificador que permite que la
corriente fluya sólo en una dirección (un rectificador de media onda). A pesar de las
discontinuidades (de la pendiente) que presenta la función, ésta pertenece a una clase
importante de funciones que pueden representarse en serie de Fourier. En el Ejemplo
15.5 tratamos otra de esas funciones.
En general, una función que cumple la relación de periodicidad (15.40) puede de-
sarrollarse en serie de Fourier si es univaluada y continua a trozos, esto es, continua
salvo en un número finito de discontinuidades finitas y con sólo un número finito de
máximos y mı́nimos en cualquier intervalo finito (cualquier función de comportamiento
razonablemente bueno).
EJEMPLO 15.6 Serie de Fourier de la función

1, para 0 < x < π
f (x) = (15.42)
0 para − π < x < 0 .
3 2 2 3
Figura 15.6
La gráfica de la función (extendida), Figura 15.6, muestra que la función es discontinua si x es un

múltiplo de π, y la función puede ser representada por la serie de Fourier (15.37),
a0
∞
f (x) = + (an cos nx + bn sen nx) ,
2 n=1
en cualquier valor salvo en esos puntos de discontinuidad.
Una propiedad de las series de Fourier es que el valor de la serie en un punto de discontinuidad es el valor
medio de la función en ese punto. En el presente caso ese valor medio es 1/2.
Coeficiente a0 . Por la ecuación (15.38) con n = 0,
+π 0 +π
1 1 1
a0 = f (x) dx = f (x) dx + f (x) dx .
π −π π −π π 0
La función f (x) es cero en la primera de las integrales del segundo miembro, y es igual a
uno en la segunda. Por lo tanto
+π
1
a0 = dx = 1 . (15.43)
π 0
Coeficientes an , n > 0. Por la ecuación (15.38),
+π +π
π
1 1 1 sen nx
an = f (x) cos nx dx = cos nx dx = = 0. (15.44)
π −π π 0 π n 0
Todos los coeficientes de Fourier an son cero salvo a0 = 1.
Coeficientes bn . Por la ecuación (15.39),
+π +π
π
1 1 1 cos nx 1
bn = f (x) sen nx dx = sen nx dx = − = (1 − cos nπ) .
π −π π 0 π n 0
nπ
Tenemos cos nπ = +1 si n es un entero par, y cos nπ = −1 si n es impar. Se deduce que

bn es distinto de cero sólo si n es impar:
2
bn = , n impar. (15.45)
nπ
Por los resultados (15.43)–(15.45), la serie de Fourier de la función (15.43) es por lo

tanto
a0
f (x) = + b1 sen x + b3 sen 3x + b5 sen 5x + · · ·
2
1 2 sen 3x sen 5x
= + sen x + + + ··· . (15.46)
2 π 3 5
Para visualizar el comportamiento de la serie, consideramos las aproximaciones con n
términos (sumas parciales):
1 1 2
S1 = S2 = + sen x
2 2 π
1 2 sen 3x 1 2 sen 3x sen 5x
S3 = + sen x + S4 = + sen x + +
2 π 3 2 π 3 5
...
En la Figura 15.7 representamos las gráficas de las cuatro primeras sumas parciales.
1 1
1 1
Figura 15.7
Figura 15.8
Este ejemplo muestra cómo se construye una onda arbitraria por interferencia de ondas armónicas, con
interferencia constructiva (aditiva) en unas regiones e interferencia destructiva (sustractiva) en otras. El
término constante S1 es el valor medio de la función en el intervalo. La aproximación con dos términos, S2 ,
incluye la primera corrección a ese valor medio, y S3 , S4 , . . . incluyen sucesivas correcciones más pequeñas.
En la Figura 15.8 representamos la gráfica de la suma parcial S50 , y se ve claramente cómo se comporta la
serie de Fourier, continua en todos los puntos del intervalo, ante las discontinuidades de la función.
Cambio de periodo
Una función periódica f (x) con periodo 2π se transforma en una función periódica
g(z) con periodo 2l si se sustituye la variable x por πz/l en f (x). Ası́, si
πz
f (x) = f = g(z) ,
l
tenemos entonces
π
f (x + 2π) = f (z + 2l) = g(z + 2l) .
l
Por ejemplo, la función sen x = sen (πz/l) es periódica en x con periodo 2π, y es pe-
riódica en z con periodo 2l.
Este sencillo cambio de variable se usa para generalizar el método de Fourier, ecua-
ciones (15.37) a (15.39), para desarrollar funciones con periodos distintos de 2π. De esta
manera, una función f (x) que es periódica en x con periodo 2l,
f (x) = f (x + 2l) , (15.47)
puede desarrollarse en serie de Fourier como
a0 nπx
∞
nπx
f (x) = + an cos + bn sen (15.48)
2 n=1
l l
con coeficientes de Fourier

+l
1 nπx
an = f (x) cos dx , (15.49)
l −l l
+l
1 nπx
bn = f (x) sen dx . (15.50)
l −l l
El siguiente ejemplo ilustra la serie de Fourier para un periodo arbitrario, y además

prepara el camino para completar la resolución de la ecuación de ondas para la cuerda
vibrante que vimos en el Apartado 14.7.
EJEMPLO 15.7 Serie de Fourier de la función

⎧
⎪ 2A l
⎪
⎪ − (l + x) para − l ≤ x ≤ − ,
⎪
⎪ l 2
⎪
⎪
⎨
2Ax l l
f (x) = para − ≤ x ≤ + , (15.51)
⎪
⎪ l 2 2
⎪
⎪
⎪
⎪
⎪
⎩ 2A (l − x) para + l ≤ x ≤ +l .
l 2
La Figura 15.9 muestra que la función f (x) es una función impar
de x, con f ( − x) = −f (x). Se deduce de las propiedades de las
funciones pares e impares del Apartado 5.3 que la integral
Figura 15.9
+l
f (x)g(x) dx
−l
es cero salvo si g(x) es también una función impar de x, o si contiene una componente impar. De las
funciones del desarrollo (15.48), las funciones seno son impares pero las funciones coseno son pares. Todas
las integrales (15.49) para an son por lo tanto cero, y la serie de Fourier se reduce a la serie de Fourier en
senos para el desarrollo de una función impar:

∞
nπx
f (x) = bn sen , (15.52)
n=1
l
con coeficientes dados por (15.50). También se deduce de lo visto en el Apartado 5.3, ecuación (5.25), que
la integral (15.50) en todo el intervalo −l ≤ x ≤ l es igual a dos veces la integral en el medio intervalo
0 ≤ x ≤ l:

2 +l nπx
bn = f (x) sen dx . (15.53)
l 0 l
Para la función (15.51), tenemos entonces
l/2 l
2 nπx nπx
bn = f (x) sen dx + f (x) sen dx
l 0 l l/2 l
l/2 l
4A nπx nπx
= 2 x sen dx + (l − x) sen dx ,
l 0 l l/2 l
e integrando por partes

⎧
⎪
⎪ 0 si n
⎪
⎪
⎪
⎨ 8A
+ si n = 1, 5, 9, 13, . . .
bn = n2 π 2 (15.54)
⎪
⎪
⎪
⎪
⎪
⎩ 8A
− si n = 3, 7, 11, 15, . . .
n2 π 2
Por lo tanto
8A 1 πx 1 3πx 1 5πx
f (x) = sen − 2 sen + 2 sen − ··· . (15.55)
π 1
2 2 l 3 l 5 l
15.5. La cuerda vibrante 385
15.5. La cuerda vibrante
Vimos en el Apartado 14.7 que la solución de la ecuación de ondas para la cuerda

vibrante de longitud l es (ecuación (14.103))
nπx
∞
y(x, t) = sen An cos ωn t + Bn sen ωn t (15.56)

n=1
l
donde los coeficientes An y Bn se determinan mediante las condiciones iniciales (ecua-

ciones (14.104))

∞
nπx
y(x, 0) = f (x) = An sen ,
n=1
l

∞
(15.57)
∂y nπx
= g(x) = Bn ωn sen ,
∂t t=0 n=1
l
siendo f (x) y g(x) las funciones que dan los des-

plazamientos y velocidades que describen el sistema en
el instante t = 0.
Supongamos que, a t = 0, tiramos del centro de
la cuerda y soltamos. En la Figura 15.10 mostramos
el perfil inicial de la cuerda, y la función de los des-
plazamientos es por lo tanto idéntica a la función del
Figura 15.10
Ejercicio 15.6, salvo por estar únicamente definida en
medio intervalo: 0 ≤ x ≤ l. La representación de Fourier de la función viene dada por la
ecuación (15.55):

8A 1 πx 1 3πx 1 5πx
y(x, 0) = f (x) = 2 sen − 2 sen + 2 sen − ··· , (15.58)
π 12 l 3 l 5 l
y los coeficientes An de (15.56) son idénticos a los coeficientes de Fourier bn dados por
(15.54). Además, la velocidad inicial de la cuerda es cero en todos sus puntos, de manera
que
∂y
= g(x) = 0 (15.59)
∂t t=0
y todos los coeficientes Bn de (15.56) son cero. Deducimos entonces que, para las con-
diciones iniciales dadas, el movimiento de la cuerda viene dado por la función de onda

8A πx 1 3πx 1 5πx
y(x, t) = 2 sen cos ω1 t − sen cos ω3 t + sen cos ω5 t − · · · (15.60)
π l 9 l 25 l
donde, por la ecuación (14.96), ωn = nπv/l con v constante. La función (15.60) es

periódica en t con periodo τ = 2π/ω1 = 2l/v. En la Figura 15.11 mostramos el com-
portamiento de la función en el primer cuarto del periodo. Hemos obtenido las gráficas
usando la aproximación con 25 términos de la función de onda (términos hasta n = 49).
Figura 15.11
Este comportamiento sorprendente se entiende si consideramos las fuerzas que se

ejercen en cada punto de la cuerda. Como la tensión es uniforme en todas partes, no se
ejerce una fuerza neta en las secciones rectilı́neas. Por lo tanto, la forma esencial de la
cuerda se mantiene, siendo el movimiento determinado por la fuerza instantánea que se
ejerce en los dos puntos donde cambia la pendiente (o el único punto en los puntos de
retroceso del movimiento).
15.6. Transformada de Fourier

En el Apartado 15.4 hemos visto cómo utilizar las series de Fourier para representar
funciones periódicas, pero varias aplicaciones importantes del análisis de Fourier en
las ciencias fı́sicas implican funciones que no son periódicas. El análisis de Fourier de
funciones no periódicas se consigue permitiendo que la longitud del intervalo de base se
haga infinitamente grande, y transformando la serie de Fourier en una integral infinita,
llamada integral de Fourier o transformada de Fourier.
Intervalo infinito
Podemos escribir la serie de Fourier (15.48) para un intervalo arbitrario 2l,
∞
a0 nπx nπx
f (x) = + an cos + bn sen , (15.61)
2 n=1
l l
como

∞
f (x) = cn (15.62)
n=0
donde
a0 nπx nπx
c0 = , cn = an cos + bn sen , n > 0.
2 l l
15.6. Transformada de Fourier 387
Figura 15.12
Una suma como (15.62) puede considerarse como la suma de las áreas de los rectángulos
de ancho ∆n = 1 y altura cn , como se muestra en la Figura 15.12,

∞
f (x) = cn ∆n . (15.63)
n=0
Hacemos ahora el cambio

π π
yn = n, ∆yn = ∆n . (15.64)
l l
La ecuación (15.61) es entonces

a0
∞
l
f (x) = + an cos xyn + bn sen xyn ∆yn ,
π 2 n=1
que podemos escribir como

u(y0 )
∞
f (x) = + u(yn ) cos xyn + v(yn ) sen xyn ∆yn (15.65)

2 n=1
con los coeficientes de Fourier dados por (15.49) y (15.50)

+l
lan 1
u(yn ) = = f (x) cos xyn dx , (15.66)
π π −l
+l
lbn 1
v(yn ) = = f (x) sen xyn dx . (15.67)
π π −l
Ahora ya podemos tomar l → ∞, y ∆yn → 0. La ecuación (15.65) tiene la forma

∞
f (x) = F(yn ) ∆yn (15.68)

n=0
de manera que, según vimos en el Apartado 5.4 para la integral de Riemann como lı́mite
de una suma,

∞ ∞
f (x) = lim F(yn ) ∆yn = F(y) dy

l→∞
0
∞
n=0

= u(y) cos xy + v(y) sen xy dy , (15.69)
0
siendo
+∞
1
u(y) = f (x) cos xy dx (15.70)
π −∞
+∞
1
v(y) = f (x) sen xy dx (15.71)
π −∞
tras tomar el lı́mite en (15.66) y en (15.67). Llamamos integral de Fourier a la repre-

sentación de f (x) en la forma (15.69) (se reserva la expresión transformada de Fourier
normalmente para una forma ligeramente distinta, como veremos más adelante). *
EJEMPLO 15.8 Onda cuadrada

A para − k < x < +k
f (x) = (15.72)
0 en el resto
en el intervalo −l ≤ x ≤ +l, con k ≤ l.
La Figura 15.13 muestra que la función es una función par de x, y
puede por lo tanto ser representada en el intervalo −l ≤ x ≤ +l por
la serie de Fourier en cosenos
l k k l
a0
∞
nπx
f (x) = + an cos
2 n=1
l Figura 15.13
donde
l k
2 nπx 2A nπx 2Ak sen (nπk/l)
an = f (x) cos dx cos dx = ,
l 0 l l 0 l l (nπk/l)
2Ak
para n > 0, y tomando el lı́mite n → 0, a0 = . La representación en serie de Fourier de la función en
l
el intervalo finito es por lo tanto

2Ak 1 sen (nπk/l)
∞
nπx
f (x) = + cos .
l 2 n=1 (nπk/l) l
0* La ‘deducción’ que damos aquı́ de (15.69) es sólo esquemática, aunque suficiente para la mayorı́a
de los casos. Hemos pasado por alto todo lo relacionado con las posibles discontinuidades de la función y
con la existencia del lı́mite.
Para hallar el valor de esta expresión en el lı́mite l → ∞, hacemos el cambio

yn = nπ/l , ∆yn = π/l .
Tenemos entonces
2Ak 1 sen (kyn )
∞
f (x) = + cos xyn ∆yn (15.73)
π 2 n=1 (kyn )
y, en el lı́mite l → ∞,
2Ak ∞ sen (ky)
f (x) = cos xy dy (15.74)
π 0 (ky)
(el término constante, correspondiente a n = 0, no contribuye).
Esta representación de la función por una integral de Fourier en coseno puede ponerse en la forma
(15.69) como ∞
f (x) = u(y) cos xy dy (15.75)
0
con u(y) dado por (15.70). En efecto:

1 +∞ 2 ∞
u(y) = f (x) cos xy dx = f (x) cos xy dx
π −∞ π 0

2A k 2Ak sen (ky)
= cos xy dx = , (15.76)
π 0 π (ky)
como es necesario por (15.74).
Forma exponencial
Podemos poner en forma exponencial la representación de una función por medio de
la integral de Fourier, ecuaciones (15.69) a (15.71), usando las relaciones de Euler
1 ixy 1 ixy
cos xy = e + e−ixy , sen xy = e − e−ixy . (15.77)
2 2i
Definimos la función
1
w(y) = [u(y) − iv(y)] . (15.78)
2
Hemos visto en el Ejemplo 15.8 que la ecuación (15.69) puede escribirse entonces como
+∞
f (x) = w(y)eixy dy (15.79)

−∞
con
+∞
1
w(y) = f (x)e−ixy dx (15.80)
2π −∞
en vez de las ecuaciones (15.70) y (15.71).

EJEMPLOS 15.9 Obtención de la forma exponencial

Sustituyendo las relaciones de Euler (15.77) en (15.69) tenemos

1 ∞
f (x) = u(y) eixy + e−ixy − iv(y) eixy − e−ixy dy
2 0
∞ ∞
1 1
= [u(y) − iv(y)]eixy dy + [u(y) + iv(y)]e−ixy dy
2 0 2 0
o, cambiando y por −y en la segunda integral del segundo miembro,

1 ∞ 1 0
f (x) = [u(y) − iv(y)]eixy dy + [u( − y) + iv( − y)]eixy dy .
2 0 2 −∞
De las ecuaciones (15.70) y (15.71) tenemos que
u( − y) = u(y), v( − y) = −v(y),
y por lo tanto
∞ +∞
1
f (x) = [u(y) − iv(y)] eixy dy = w(y)eixy dy
2 −∞ −∞
siendo +∞
1 1
w(y) = [u(y) − iv(y)] = f (x)e−ixy dy .
2 2π −∞
Pares de transformadas de Fourier

Las ecuaciones (15.79) y√(15.80) se escriben normalmente en forma más simétrica
mediante el cambio g(y) = 2πw(y), siendo entonces
+∞
1
f (x) = √ g(y)eixy dy , (15.81)
2π −∞
+∞
1
g(y) = √ f (x)e−ixy dx . (15.82)
2π −∞
Dos funciones relacionadas por las ecuaciones (15.81) y (15.82) forman un par de trans-
formadas de Fourier. Se dice que la función g es la transformada de Fourier de la fun-
ción f , y f se dice que es la transformada (inversa) de g. En general, la transformada
de Fourier de una función f (x) existe si la función es continua a trozos y es integrable
absolutamente, es decir, si
+∞
|f (x)| dx
−∞
existe. En las Figuras 15.14 presentamos tres pares de transformadas de Fourier elemen-
tales.
Figura 15.14. Pares de transformadas de Fourier
EJEMPLO 15.10 Halle la transformada de Fourier de la función exponencial (Figura 15.14c)

f (x) = e−ax con x > 0 y a > 0.
Por la ecuación (15.82)
+∞ ∞ +∞
1 1 1
g(y) = √ f (x)e−ixy dx = √ e−ax e−ixy dx = √ e−(a+iy)x dx .
2π −∞ 2π 0 2π 0
La presencia de un exponente complejo no altera la regla habitual para integrar la exponencial, por lo tanto
−(a+iy)x ∞
1 −e 1 1
g(y) = √ = √
2π a + iy 0 2π a + iy
ya que e−(a+iy)x = e−ax e−iyx → 0 cuando x → ∞. La transformada de Fourier es compleja y para hallar su
parte real escribimos

1 a − iy 1 a − iy
g(y) = √ = √ .
2π (a + iy)(a − iy) 2π a2 + y2
Con esto
1 a
Re g(y) = √ . (15.83)
2π a2 + y2
Esta función se denomina Lorentziana, y da la forma de las lı́neas espectrales en espectroscopia de trans-
formada de Fourier.
En aplicaciones en las ciencias fı́sicas, las variables x e y son generalmente un par de

variables conjugadas. Los más importantes son el par posición-momento, como por
ejemplo la coordenada x y su momento conjugado, el momento lineal px , y el par tiempo-
frecuencia (o tiempo-energı́a). La transformada de Fourier es entonces una transforma-
ción de la descripción de un sistema fı́sico desde el espacio (o dominio) de una de las
variables de un par conjugado al espacio de la otra variable. La transformación de mo-
mentos a posiciones mediante la transformada de Fourier es una herramienta básica para
analizar los resultados de los experimentos de difracción: las estructuras de difracción
que se observan son la representación de la estructura del sistema en el espacio de mo-
mentos y la transformada de Fourier da la estructura en el espacio ordinario (de posi-
ciones). De mayor importancia en quı́mica es la transformación de tiempo a frecuencia
porque es la base de la espectroscopia de resonancia magnética de transformada de Fou-
rier. En esos experimentos, las moléculas de una muestra (u otras especies con grados
de libertad excitables) se excitan mediante un corto pulso de radiación, y se observa el
sistema mientras se relaja hacia su estado termodinámico estable.
La relajación es básicamente un proceso cinético de primer orden y en su caso más
sencillo, cuando las moléculas sólo pueden experimentar transiciones en una frecuencia,
digamos que ω0 , la intensidad de la señal de salida muestra un decrecimiento exponencial
en función del tiempo:
I(t) = e−t/T , (15.84)
siendo T el tiempo de relajación. Este es un ejemplo del caso (c) de la Figura 15.14, con
x como el tiempo t e y como la frecuencia ω. La transformada de Fourier de la curva de
decrecimiento es por lo tanto una curva lorentziana (véase el ejemplo 15.9)
∞
1 1 T
F(ω) = Re √ I(t)e dt = √
−iωt
. (15.85)
2π 0 2π 1 + ω 2 T 2
El ancho de esta ‘lı́nea espectral’ es inversamente proporcional al tiempo de relajación

T. Su posición (en ω0 ) se determina en la práctica por la estructura fina de la señal de
salida, como se explica en el Ejemplo 15.10.
EJEMPLO 15.11 Halle la parte real de la transformada de Fourier de la onda armónica amortiguada
exponencialmente, Figura 15.15,
f (x) = e−ax cos bx , con x > 0 y a > 0.

Por la ecuación (15.82),

+∞
1
g(y) = √ f (x)e−ixy dx
2π −∞
∞
1
= √ e−ax cos bxe−ixy dx ,
2π 0
o, puesto que cos bx = (eibx + e−ibx )/2, Figura 15.15

o, puesto que cos bx = (eibx + e−ibx )/2,
∞
1 1 1 1
g(y) = √ e−(a+ib−iy)x + e−(a−ib−iy)x dx = √ + .
2 2π 0 2 2π a + ib − iy a − ib − iy
La parte real de esto es (véase el Ejemplo 15.9)

1 a a
Re g(y) = √ + 2 . (15.86)
2 2π a2 + (b − y)2 a + (b + y)2
Si sustituimos (x, y, a, b) por (t, ω, 1/T, ω0 ) en (15.86), obtenemos el par de transformadas de Fourier

−t/T 1 T T
f (t) = e cos ω0 t , g(ω) = √ + .
2 2π 1 + (ω − ω0 )2 T 2 1 + (ω + ω0 )2 T 2
El segundo término de g(ω) es en la práctica pequeño, comparado con el primero, y la función se reduce
entonces a una lorentziana centrada en ω = ω0 .
15.7. Ejercicios
Apartado 15.2
1. Dada la serie de potencias

f (x) = a0 + a1 x + a2 x2 + · · ·
use la ecuación (15.9) para hallar el coeficiente c1 de P1 (x) del desarrollo (15.3) de f (x) mediante polinomios
de Legendre (véase el Ejemplo 15.1 para c0 ).
2. (i) Halle los tres primeros términos del desarrollo de la función

0, si − 1 < x < 0
f (x) =
x, si 0<x<1
mediante polinomios de Legendre.
(ii) Dibuje las gráficas de f (x), y de las aproximaciones con uno, dos y tres términos en polinomios
de Legendre.
Apartado 15.3
3. Use la ecuación (15.9) para demostrar que el coeficiente de P1 (x) en el desarrollo de

∞
eitx = cl Pl (x)
l=0
1 sen t
es c1 = 3ij1 (t) siendo j1 (t) = − cos t (véase el Ejemplo 15.3 para c0 ).
t t
4. Halle el primer término no nulo del desarrollo en potencias de

1/R para el potencial en el punto P del sistema de tres cargas que se
muestra en la figura.
Apartado 15.4
5. Se define una función con periodo 2π como
π
1, si − 2
< x < π2 ,
f (x) = π
0, si 2
< |x| < π.
(i) Dibuje la gráfica de la función en el intervalo −3π < x < 3π.

(ii) Halle la serie de Fourier de la función [sugerencia: f (x) es una función par de x].
(iii) Use la serie para demostrar que
π 1 1 1
= 1 − + − + ···
4 3 5 7
[sugerencia: sustituya en la serie x por un valor adecuado].
f (x) = x, −π < x < π.

(ii) Halle la serie de Fourier de la función [sugerencia: f (x) es una función impar de x].
(iii) Dibuje las gráficas de las tres primeras sumas parciales de la serie.
f (x) = x2 , −π < x < π.

(ii) Halle la serie de Fourier de la función.
(iii) Use la serie para demostrar que
π2 1 ∞
1 1 1
= 2
=1+ + + + ···
6 n=1
n 4 9 16
π2 (– 1)n+1
∞
1 1 1
= 2
=1− + − + ···
12 n=1
n 4 9 16
8. (i) Demuestre que la serie de Fourier de

sen x, si 0≤x≤π
f (x) =
0, si −π ≤x≤0
(Figura 15.4) es
4 1 cos 2x cos 4x cos 6x
− − − − ···
π 2 1·3 3·5 5·7
(ii) Use la serie para demostrar que
π 1 1 1 1
= + − + − ···
4 2 1·3 3·5 5·7
9. Halle la serie de Fourier de la función

f (x) = x(l − x)
en el intervalo 0 ≤ x ≤ l que tiene únicamente senos (la serie de Fourier en
senos).
[Sugerencia: extienda la función como una función impar de x como se muestra
en la figura.]
Apartado 15.5
10. Halle la solución de la ecuación de difusión
∂T ∂2T
=D 2
∂t ∂x
en el intervalo 0 ≤ x ≤ l que cumple las condiciones de contorno e inicial
T(0, t) = T(l, t) = 0 (t ≥ 0), T(x, 0) = x(l − x) ,
y que decrece exponencialmente con el tiempo. (Véase el Ejercicio 16 del Capı́tulo 14 y el ejercicio 9 ante-
rior.)
Apartado 15.6
Halle la transformada
de Fourier para:
1, para a < x < b,
11. f (x) = 12. e−a|x| (a > 0).
0, en el resto.
2
13. Demuestre que la transformada de Fourier de e−ax (a > 0) es
1 2
√ e−y /4a (Figura 15.14b)
2a

√ iy ∞ 2 π
Sugerencia: cambie a la variable t = ax + √ y use e−αt dt = .
2 a −∞ α
Vectores
16.1. Conceptos
Cantidades fı́sicas como la masa, la temperatura o la distancia tienen valores que se
especifican por un único número real en las unidades apropiadas: por ejemplo, 3 kg, 273
K o 12 m. Tales cantidades, que tienen sólo magnitud, se denominan cantidades escala-
res y siguen las reglas del álgebra de los números reales. Otras cantidades fı́sicas, llama-
das vectores, requieren una magnitud y también una dirección para ser especificadas.
Por ejemplo, la velocidad mide la rapidez de movimiento en una dirección dada. Otros
ejemplos son la fuerza, el campo eléctrico, el campo magnético o el desplazamiento.
Para ser vectores, esas cantidades tienen que cumplir las reglas del álgebra vectorial.1
La notación vectorial y el álgebra vectorial son importantes para la formulación y re-
solución de problemas fı́sicos en tres dimensiones: en mecánica, dinámica de fluidos,
teorı́a electromagnética y dibujo técnico. Tratamos algunas de esas aplicaciones de los
vectores, de importancia en dinámica molecular, espectroscopia y quı́mica teórica, en
diversos ejemplos a lo largo de este capı́tulo.
Un vector se representa gráficamente como un segmento de recta orientado, esto es,
un segmento de recta cuya longitud es la magnitud del vector, en las correspondientes
unidades, y cuya orientación en el espacio, junto con una flecha que indica el sentido, da
la dirección.
Figura 16.1
La figura 16.1 muestra dos representaciones gráficas del mismo vector, y dos nota-
ciones. En (a), el vector a se representa por una flecha; en (b), A es el origen y B el
01. El álgebra vectorial tiene su origen en el álgebra de cuaterniones descubierta por Hamilton en
1843 y en la teorı́a sobre espacios vectoriales de dimensión n de Grassmann de 1844. Debemos a Gibbs la
notación moderna de vectores en tres dimensiones.
William Rowan Hamilton (1805-1865), nacido en Dublı́n, tuvo fama de haber dominado el latı́n, el grie-
go, las lenguas europeas modernas, el hebreo, el persa, el árabe, el sánscrito y otras lenguas con diez años.
Ingresó en el Trinity College de Dublı́n en 1823 y en 1827, sin haberse graduado aún, fue nombrado As-
trónomo Real de Irlanda y Catedrático de Astronomı́a. Es sobre todo conocido por su reformulación y
generalización de la mecánica de Newton, Euler y Lagrange que se hizo importante en la formulación de
las mecánicas estadı́stica y cuántica.
398 Capı́tulo 16. Vectores
→
−
extremo del vector, y la notación AB es particularmente útil cuando el vector es un des-
plazamiento en el espacio. La longitud, magnitud o módulo de a se escribe como |a| o
sencillamente a (un escalar). Un vector de longitud cero se llama vector nulo, 0, y en
ese caso no se asigna ninguna dirección.
Las Figuras 16.2(a) y (b) ilustran varios tipos de vectores asociados con el movimien-
to de un cuerpo sobre una curva PQ en el espacio, bajo la acción de fuerzas exteriores.
→
−
En la Figura (a), la posición del punto A de la curva viene dada por a = OA, cuyo origen
es el origen de coordenadas y cuyo extremo está en A. El vector a se llama vector de
posición y su valor (tanto en magnitud como en dirección) cambia a medida que el cuer-
po recorre la curva. Cuando el cuerpo se ha movido de A a B el vector de posición ha
→
−
variado de a a b, y el desplazamiento desde A hasta B viene dado por el vector c = AB.
Veremos que el álgebra vectorial nos da c = b − a, esto es, que el desplazamiento desde
A hasta B es igual a la variación del vector de posición. Vemos que un vector de posición
es un tipo de vector de desplazamiento, pero con su origen situado siempre en un punto
fijo que es el origen de un sistema de coordenadas.
Figura 16.2
En cada punto de la curva PQ, el cuerpo tiene velocidad v en la dirección de movi-

miento en ese punto. Es decir, la dirección de v en cada punto de la curva es tangente a la
curva. La Figura (b) muestra las velocidades en los puntos A y B, y también las fuerzas
que actúan sobre el cuerpo en esos puntos.
16.2. Álgebra vectorial
Igualdad
Dos vectores a y b son iguales,
a = b, (16.1)
si tienen misma longitud y misma dirección. Los orı́genes de vectores iguales sólo tienen
que coincidir si se trata de vectores ligados, como por ejemplo vectores de posición. De
esa manera dos cuerpos separados que se mueven con la misma velocidad en la misma
dirección tienen vectores velocidad iguales.
16.2. Álgebra vectorial 399
Suma de vectores
La suma, o resultante, a + b de los vectores a y b se define geométricamente en la
Figura 16.3. En (a) los vectores se sitúan de manera que el origen de b coincida con el
extremo de a. La suma a + b es entonces igual al vector trazado desde el origen de a al
extremo de b. La Figura (b) muestra que la suma es conmutativa, con
a + b = b + a. (16.2)
Figura 16.3
En este caso a y b definen los pares de lados paralelos de un paralelogramo, y se dice

que la suma de vectores cumple la ley del paralelogramo. Si a y b son los desplaza-
mientos de un cuerpo, su suma a + b es el desplazamiento total. Si a y b son dos fuerzas
que actúan sobre un cuerpo, a + b es la fuerza total. La ley del paralelogramo se llama
entonces ‘paralelogramo de fuerzas’.2
Resta
Si a + b = 0, siendo 0 el vector nulo, entonces b = −a
es un vector con la misma longitud que a, |b| = |a|, pero
que apunta en la dirección contraria. La resta de vectores
se define entonces como (Figura 16.4)
a + (– b) = a − b . (16.3)
Figura 16.4
Multiplicación por un escalar

El vector a + a = 2a tiene dos veces la longitud de a y tiene la misma dirección. En
general, el producto de un escalar (un número) c y un vector a se representa por ca. Tiene
c veces la longitud de a, tiene la misma dirección que a si c es positivo, y la dirección
opuesta si c es negativo (Figura 16.5)
02. Herón de Alejandrı́a (siglo I de nuestra era) describió el paralelogramo de velocidades en su

Mecánica, pero también aparece en un trabajo atribuido a Aristóteles (384-322 a.C.).
Figura 16.5
Si c = 0 entonces ca = 0, y la dirección no está definida. Un vector a dividido por

su longitud |a| es el vector unitario â que tiene la misma dirección que a:
a
â = (16.4)
|a|
Los vectores unitarios se utilizan a menudo para definir direcciones.
EJEMPLO 16.1 Demuestre que las diagonales de un paralelogramo se cortan en su centro.

En la figura 16.6, C es el centro de la diagonal OD, y C es el centro de AB. Entonces
→
− 1−→ 1 −
→ − →
1
OC = OD = OA + AD = (a + b) .
2 2 2
Por otra parte
→
− → −
− → 1
OC = OA + AC = a + AB .
2
→
−
Pero se cumple AB = b − a. Por lo tanto
→
− 1 1 →
−
OC = a + (b − a) = (a + b) = OC Figura 16.6
2 2

y por lo tanto los dos centros C y c coinciden.
EJEMPLO 16.2 Demuestre que el promedio de los vectores de posición de los vértices de un triángulo
es el vector de posición del baricentro del triángulo.
En la figura 16.7, los vértices A y B tienen posiciones (vectores de posición) a y b con respecto al vértice O
(con vector de posición nulo 0). El promedio de los vectores de posición de los vértices es por lo tanto
→
− 1 −→ − → − →
1 1
OX = OO + OA + OB = (0 + a + b) = (a + b) .
3 3 3
→
−
Hemos visto en el Ejemplo 16.1 que si C es el centro de AB entonces OC = (a + b)/2. Por lo tanto
→
− 2 −
→
OX = OC
3
y el promedio está en la recta que une el vértice O con el centro del lado opuesto. Algo similar ocurre con
la posición respecto a los otros dos vértices, de manera que X está en la intersección de esas tres rectas, y
eso corresponde al baricentro del triángulo.
Figura 16.7
16.3. Componentes de los vectores 401
16.3. Componentes de los vectores

La componente de un vector en una dirección dada
es la longitud de su proyección sobre esa dirección.
En la Figura 16.8, la componente de a a lo largo de
la dirección OP es la longitud
ON = |a| cos θ . (16.5)

Figura 16.8
El concepto de componente es esencial en el uso práctico de los vectores para resolver

problemas fı́sicos en tres dimensiones.
Empezamos considerando el caso más sencillo de vectores en un plano, con un siste-
ma de coordenadas cartesiano.
Sean (x1 , y1 ) y (x2 , y2 ) respectivamente, el origen y el extremo de a en el plano xy,

como se muestra en la Figura 16.9. La componente (cartesiana) del vector en la dirección
x es ax = x2 −x1 , y la componente en la dirección y es ay = y2 −y1 . Esas dos componentes
bastan para especificar el vector de manera única. En efecto, la longitud del vector es
|a| = a2x + a2y , y la dirección viene dada por la pendiente ay /ax . Escribimos el vector
mediante sus componentes cartesianas como
a = (ax , ay ) . (16.6)
Además, si designamos las direcciones x e y por los vectores unitarios i y j, como en la

→
−
Figura 16.10, tenemos que a = OP puede expresarse como la suma de los dos vectores
−
→ →
−
OQ = ax i en la dirección x (ax veces el vector unitario i en la dirección x) y QP = ay j en
la dirección y:
a = a x i + ay j . (16.7)
Más generalmente, un vector en tres dimensiones (Figura 16.11) puede especificarse por
sus componentes, ax , ay y az , en las tres direcciones cartesianas i, j y k (k es el vector
unitario en la dirección z). Escribimos
a = (ax , ay , az ) = ax i + ay j + az k . (16.8)
Figura 16.11
Las reglas del álgebra vectorial pueden entonces formularse mediante las componen-
tes de los vectores, y es ésta la forma en que los vectores se usan para resolver problemas
fı́sicos.3 Sean los vectores
a = (ax , ay , az ) , b = (bx , by , bz ) .
Figura 16.12
(i) Igualdad. Los vectores son iguales si lo son las correspondientes componentes:
a=b si a x = b x , ay = by y az = b z . (16.9)
(ii) Suma. La suma a + b se obtiene sumando las correspondientes componentes:
a + b = (ax + bx , ay + by , az + bz ) . (16.10)
Representamos esto en la Figura 16.12 para vectores en el plano.
03. Hamilton descubrió los cuaterniones en su búsqueda de un álgebra de números complejos tri-
dimensionales. Tienen la forma a + bi + cj + dk, con las reglas de combinación i2 = j2 = k2 = −1,
ij = k = −ji, jk = i = −kj, ki = j = −ik. Hamilton llamó parte escalar a a y parte vectorial a bi + cj + dk.
Descubrió las reglas mientras paseaba con su mujer a lo largo del Canal Real el 16 de octubre de 1843, un
lunes, y las grabó sobre una piedra del puente de Brougham.
16.3. Componentes de los vectores 403
(iii) Multiplicación por un escalar. El producto ca del escalar c y el vector a se

obtiene multiplicando cada componente de a por c:
ca = (cax , cay , caz ) . (16.11)
EJEMPLO 16.3 Dados a = (2, 3, 1), b = (1, −2, 0) y c = (5, 2, −1), halle: (a) d = 2a + 3b − c y (b) |d|.
(a) Si d = (dx , dy , dz ), entonces
dx = 2ax + 3bx − cx = (2 × 2 + 3 × 1 − 5) = 2,
dy = 2ay + 3by − cy = (2 × 3 + 3 × (– 2) − 2) = −2,

dz = 2az + 3bz − cz = (2 × 1 + 3 × 0 − (– 1)) = 3,
y d = (2, −2, 3).
√
(b) |d| = dx2 + dy2 + dz2 = 22 + (– 2)2 + 32 = 17 .
La ecuación (16.9) para la igualdad entre vectores y el ejemplo 16.3 muestran que, para
vectores en tres dimensiones, una ecuación vectorial es equivalente a un sistema de tres
ecuaciones escalares, una por cada componente. Inversamente, las tres ecuaciones esca-
lares se representan por una única ecuación vectorial. El álgebra vectorial proporciona
un método potente para formular y resolver problemas fı́sicos que implican cantidades
vectoriales. A menudo sólo es necesario recurrir a ecuaciones en componentes cuando
la resolución del problema necesita ser completada con los valores numéricos de las
componentes.
EJEMPLO 16.4 El centro de masas de un sistema de N masas, m1 con vector de posición r1 (‘en la
posición r1 ’), m2 en r2 , . . . , mN en rN (Figura 16.13) es
1
N
1
R= (m1 r1 + m2 r2 + · · · + mN rN ) = mi ri ,
M M i=1
(16.12)

N
siendo M = mi la masa total.
i=1
Las componentes cartesianas del vector de posición r de un pun-

to son las coordenadas cartesianas del punto: r = (x, y, z). La
ecuación vectorial (16.12) corresponde por lo tanto a tres ecua-
ciones (escalares) ordinarias, una para cada coordenada de R:
Figura 16.13
1 1 1
N N N
X= mi x i Y= mi y i Z= mi zi (16.13)
M i=1 M i=1 M i=1
(véase la ecuación (5.40) para el caso unidimensional).

EJEMPLO 16.5 Momentos dipolares

El sistema de dos cargas de la Figura 16.14, con −q en r1 y q en r2 , define un dipolo eléctrico con vector
momento dipolar
µ = −qr1 + qr2 = q(r2 − r1 ) = qr . (16.14)
Más generalmente, un sistema de N cargas, q1 en r1 , q2 en r2 . . . , qN en
rN , tiene un momento dipolar con respecto al origen O, como punto de
referencia,

N
µ = (q1 r1 + q2 r2 + · · · + qN rN ) = qi ri . (16.15)
i=1
Figura 16.14

Esta cantidad depende de la posición del punto de referencia si la carga total Q = qi no es cero. En
efecto, la posición de la carga qi con respecto al punto R es ri − R, y el momento dipolar del sistema de
cargas con respecto a R es

N
N
N
µ (R) = qi (ri − R) = qi ri − qi R = µ (0) − QR , (16.16)
i=1 i=1 i=1
con µ (R) = µ (0) sólo si Q = 0.

Un sistema de dipolos eléctricos con momentos µ1 , µ2 , . . . , µN , tiene un momento dipolar total

N
µ = µ1 + µ2 + · · · + µN = µi . (16.17)
i=1
Por ejemplo, el momento dipolar total de una molécula se interpreta a veces como la suma (vectorial) de
‘momentos de enlace’: se asocia un momento dipolar con cada enlace. En algunos casos de gran simetrı́a el
momento dipolar total puede anularse: los momentos de los enlaces se cancelan unos con otros. Por ejemplo,
la molécula de metano en su estado estable tiene sus cuatro hidrógenos en los vértices de un tetraedro
regular, con el carbono en el centro. Si uno de los vértices se sitúa en la ‘posición 111’, con r1 = (a, a, a),
las posiciones de los otros vértices son r2 =
√ (a, −a, −a), r3 = (– a, a, −a) y r4 = (– a, −a, a). La longitud
de cada uno de esos vectores de enlace es 3a, la distancia de enlace de CH. El momento dipolar de cada
enlace está en la dirección del propio enlace, y es por lo tanto proporcional al vector de enlace, µ i = kri
(i = 1, 2, 3, 4), y el momento dipolar total es
µ = µ1 + µ2 + µ3 + µ4
= k (r1 + r2 + r3 + r4 )
= k(a + a − a − a, a − a + a − a, a − a − a + a)
= k(0, 0, 0)
= 0.
Vectores de la base
Los vectores unitarios cartesianos i, j y k, en las direcciones x, y y z, tienen las com-
ponentes
i = (1, 0, 0), j = (0, 1, 0), k = (0, 0, 1) . (16.18)

16.4. Derivada escalar de un vector 405
Las reglas (16.10) y (16.11) confirman que todo vector del espacio tridimensional se
puede expresar como combinación lineal de estos tres vectores de la base:
a = a x i + ay j + az k
= ax (1, 0, 0) + ay (0, 1, 0) + az (0, 0, 1)
(16.19)
= (ax , 0, 0) + (0, ay , 0) + (0, 0, az )
= (ax , ay , az ) .
EJEMPLO 16.6 Dados a = 2i + 3j + k y b = i − 2j, halle d = 2a + 3b.
Tenemos: d = 2a + 3b = 2(2i + 3j + k) + 3(i − 2j) = (4i + 6j + 2k) + (3i − 6j)

= 7i + 2k .
Si bien los vectores unitarios cartesianos proporcionan la representación más empleada

para vectores en tres dimensiones, otras representaciones pueden ser más útiles en al-
gunos casos. De hecho, tres vectores cualesquiera no coplanares pueden ser utilizados
como base: si a, b y c son esos tres vectores, no necesariamente unitarios ni perpendicu-
lares, entonces cualquier otro vector del espacio puede escribirse como
v = va a + vb b + vc c . (16.20)
Los números va , vb y vc son las componentes de v en

las direcciones de los vectores de la base. Un ejem-
plo del uso de bases no cartesianas lo encontramos
en cristalografı́a, en la descripción de las propieda-
des de una red regular. En ese caso a, b y c definen
los ejes del cristal y la celda unidad, y todo punto de
la red tiene un vector de posición (16.20) con com-
ponentes enteras. En la Figura 16.15 ilustramos esto
para una red plana.
Figura 16.15
16.4. Derivada escalar de un vector

Un vector a = a(t) es una función de la variable es-
calar t si su magnitud, o su dirección, o ambas, de-
→
−
penden del valor de t. En la Figura 16.16, OA = a(t)
→
−
y OB = a(t + ∆t) son los vectores para los valores t
y t + ∆t de la variable. La variación del vector en el
intervalo ∆t es
∆a = a(t + ∆t) − a(t)
y la derivada del vector con respecto a t se define de

la manera habitual por el lı́mite (si el lı́mite existe) Figura 16.16

da ∆a a(t + ∆t) − a(t)
= lim = lim . (16.21)
dt ∆t→0 ∆t ∆t→0 ∆t
Tomar el lı́mite corresponde a hacer que el punto B se acerque al punto A sobre la curva definida por a(t).
→
−
La dirección AB = ∆a se acerca a la de la tangente a la curva en A, y ésta es la dirección de la derivada en
A.
Utilizando las componentes del vector, si tomamos a = ax i + ay j + az k, siendo i, j y k vectores cons-
tantes, la dependencia de a con t es la de sus componentes:
a(t) = ax (t)i + ay (t)j + az (t)k , (16.22)
y
da dax day daz
= i+ j+ k. (16.23)
dt dt dt dt
Representación paramétrica de una curva

Si r = r(t) es el vector de posición de un punto para cada valor
de t en algún intervalo, entonces, dado un sistema de coordena-
das cartesianas,
r(t) = x(t)i + y(t)j + z(t)k (16.24)
es una representación paramétrica de una curva C en el es-

pacio tridimensional, y t es el parámetro de la representación
(Figura 16.17). El sentido positivo en C se define como el que
corresponde a valores de t crecientes, y define una orientación
dr Figura 16.17
de la curva. La tangente a la curva tiene dirección .
dt
EJEMPLO 16.7 La elipse

La función vectorial
r(t) = (a cos t , b sen t , 0) = (a cos t)i + (b sen t)j
representa una elipse en el plano xy, con centro en el origen y ejes principales en las direcciones x e y. La
ecuación vectorial corresponde a las ecuaciones paramétricas escalares
x(t) = a cos t , y(t) = b sen t , z(t) = 0 ,
(véase el Ejemplo 9.13 para la circunferencia, cuando a = b).
EJEMPLO 16.8 Velocidad, momento y aceleración

Si r = r(t) es el vector de posición de un cuerpo en el espacio, y el parámetro t es la variable tiempo,
dr
entonces = ṙ es la velocidad del cuerpo,
dt

dr dx dy dz
v= = i+ j+ k
dt dt dt dt (16.25)
= vx i + v y j + v z k
siendo vx , vy y vz las componentes de la velocidad en las tres direcciones cartesianas. Por lo tanto la veloci-
dad es la tasa de variación de la posición. La magnitud de la velocidad es entonces

v = |v| = v2x + v2y + v2z (16.26)

16.5. Producto escalar 407
y la energı́a cinética del cuerpo es

1 2 1
T= mv = m v2x + v2y + v2z . (16.27)
2 2
La aceleración del cuerpo es la tasa de variación de la velocidad,
dv d2 r
a = = 2
dt dt

dvx dvy dvz
= i+ j+ k (16.28)
dt dt dt
2 2 2
d x d y d z
= i + j + k.
dt2 dt2 dt2
La forma vectorial de la segunda ley de Newton es entonces F = ma, equivalente a tres ecuaciones escala-
res, una por cada componente.
Momento lineal
En mecánica, el momento p de un cuerpo de masa m que se mueve con velocidad v se define como p = mv.
La dirección de p es la dirección según la lı́nea de movimiento y a menudo se lo llama momento lineal (o
también cantidad de movimiento). Podemos escribir entonces la segunda ley de Newton como
dp
F= . (16.29)
dt
La ecuación (16.29) indica que si no actúan fuerzas exteriores sobre un sistema con momento p, entonces
dp
= 0, y p es un vector constante. Ésta es la primera ley del movimiento de Newton: el principio de
dt
conservación del momento lineal.
16.5. Producto escalar

La aplicación de los vectores a problemas fı́sicos ha conducido a la definición de dos
maneras de multiplicar un vector por otro: una de esas maneras da como producto un
escalar, la otra da un producto vectorial (Apartado 16.6).4
04. Clerk Maxwell utilizó los cuaterniones de Hamilton en su Treatise on Electricity and Magnetism
(Tratado sobre electricidad y magnetismo) de 1873, pero Heaviside y Gibbs, de manera independiente,
hicieron ver que no era necesario emplear el álgebra completa de los cuaterniones para representar las
cantidades fı́sicas.
Oliver Heaviside (1850-1925), ingeniero eléctrico inglés, destaca por su desarrollo de las técnicas de la
transformada de Laplace. Josiah Willard Gibbs (1839-1903), ingeniero estadounidense, quı́mico y ‘entre
los fı́sicos teóricos más célebres de todos los tiempos’ (Max Planck), nació, vivió y murió en New Haven,
Connecticut. Gibbs es conocido sobre todo por sus trabajos en termodinámica y en mecánica estadı́stica.
Introdujo el concepto de potencial quı́mico en On the equilibrium of heterogeneous substances (Sobre el
equilibro de sustancias heterogéneas) en 1876-78, sentando las bases de la termodinámica quı́mica moderna.
Desarrolló la notación moderna y los conceptos de productos escalar y vectorial al principio de los años
1880 para simplificar el tratamiento matemático del Treatise de Maxwell. Su obra circuló sin publicar, en
forma de apuntes, y fue divulgada por Edwin B. Wilson en su Vector analysis, founded upon the lectures of
J. Willard Gibbs (Análisis vectorial, basado en las lecciones de J. Willard Gibbs) de 1901.
El producto escalar de a y b se define como
a · b = ab cos θ (16.30)
(se lee a veces como ‘a escalar b’), donde a = |a| y b = |b|

son las longitudes de los vectores y θ (0 ≤ θ ≤ π) es el
ángulo que forman sus direcciones. Utilizando componen-
tes, si a = (ax , ay , az ) y b = (bx , by , bz ), tenemos
Figura 16.18
a · b = a x bx + a y by + az bz . (16.31)
Demostración
Para demostrar la equivalencia de las definiciones (16.30) y (16.31), aplicamos la regla del coseno al triángu-
lo de la Figura 16.18:
(AB)2 = (OA)2 + (OB)2 − 2(OA)(OB) cos θ = a2 + b2 − 2ab cos θ .

→
−
El vector AB es b − a, y su longitud viene dada por
(AB)2 = (bx − ax )2 + (by − ay )2 + (bz − az )2

= a2x + a2y + a2z + b2x + b2y + b2z − 2 (ax bx + ay by + az bz )
= a2 + b2 − 2 (ax bx + ay by + az bz ) .
Por lo tanto ab cos θ = ax bx + ay by + az bz .
EJEMPLO 16.9 Dados a = (3, 1, −1) y b = (1, 2, −3), halle a · b, b · a y el ángulo entre los vectores.
Por la ecuación (16.31),
a · b = 3 × 1 + 1 × 2 + (– 1) × (– 3) = 8 , b · a = 1 × 3 + 2 × 1 + (– 3) × (– 1) = 8 .
Este ejemplo nos hace ver que el producto escalar es conmutativo:
a · b = b · a. (16.32)
a·b √
Por la ecuación (16.30), cos θ = , y las longitudes de los vectores son a = |a| = 11 y b = |b| =
√ ab
14. Por lo tanto

8 8
cos θ = √ , θ = arccos √ ≈ 0,8702 ≈ 49,86◦ .
154 154
El signo del producto escalar es el signo del coseno, de manera que el producto escalar
puede ser positivo, cero o negativo:
Figura 16.19
16.5. Producto escalar 409
Para vectores a y b no nulos, el producto escalar es cero cuando los vectores son
perpendiculares:
a · b = 0. (16.33)
Se dice que los vectores son ortogonales, siendo a ortogonal a b, y b ortogonal a a.*
Señalamos que la ecuación (16.33) indica que en una ecuación vectorial no es posible
simplificar los vectores igual que se hace con los escalares. Ası́, la ecuación
a·b=a·c
tiene tres posibles soluciones: (i) a = 0, (ii) b = c, (iii) a es ortogonal a (b − c).
EJEMPLO 16.10 Halle el valor de λ para el cual u = (2, λ, 1) y v = (4, −2, −2) son ortogonales.
Para que sean ortogonales, u · v = 0 = 2 × 4 + λ × (– 2) + 1 × (– 2) = 6 − 2λ.

Por lo tanto λ = 3.
Cuando a y b son el mismo vector, (16.31) nos da
a · a = a2x + a2y + a2z = |a|2 .
La longitud de un vector viene dada en función del producto escalar por

√
|a| = a · a. (16.34)
Uso de vectores de la base cartesianos

Los vectores de la base i, j y k son ortogonales y unitarios, de manera que por las
ecuaciones (16.33) y (16.34)
i · j = 0, j · k = 0, k·i=0 (ortogonalidad),
(16.35)
i · i = 1, j · j = 1, k·k=1 (unitarios).
La expresión (16.31) para el producto escalar se deduce de estas propiedades de los

vectores de la base. Ası́ por ejemplo, expresando a y b en función de los vectores de la
base:
a · b = (ax i + ay j + az k) · (bx i + by j + bz k)
= ax bx i · i + a x by i · j + a x bz i · k + a y bx j · i + a y by j · j + · · · + a z bz k · k
= a x bx + ay by + a z bz
0* Para vectores en el espacio ordinario, ortogonal significa perpendicular, pero la definición de la

ortogonalidad se aplica generalmente a vectores en ‘espacios vectoriales’ de dimensión arbitraria.
Los siguientes ejemplos presentan dos aplicaciones de productos escalares en las cien-
cias fı́sicas.
EJEMPLO 16.11 Fuerza y trabajo
Sea un cuerpo que se desplaza de la posición r1 = (x1 , y1 , z1 ) a la posición r2 = (x2 , y2 , z2 ) sometido a una
fuerza constante F. El desplazamiento del cuerpo es
d = r2 − r1 = (x2 − x1 , y2 − y1 , z2 − z1 )
y el trabajo efectuado por la fuerza es
W = F · d = Fd cos θ . (16.36)
La cantidad F cos θ es la componente de la fuerza en la dirección de

d, y es la única componente de la fuerza que contribuye al trabajo.
De esta manera, como en la Figura 16.20, podemos escribir la fuerza
Figura 16.20
como
F = Fd + F⊥ ,
donde Fd actúa en la dirección de d y F⊥ en la dirección perpendicular a d. Esta última no puede provocar
un desplazamiento en la dirección de d.
Utilizando las componentes cartesianas, el trabajo (16.36) es
W = Fx dx + Fy dy + Fz dz = Wx + Wy + Wz (16.37)
donde, por ejemplo, Fx es la componente de F en la dirección x y Wx = Fx dx es el trabajo efectuado al
mover el cuerpo la distancia dx = x2 − x1 en esa dirección (‘trabajo en la dirección x’). Señalamos que el
trabajo efectuado por el cuerpo en contra de la fuerza es −W = −F · d.
Por ejemplo, si la fuerza es F = (2, 1, 0) y el desplazamiento d = (2, −3, 1), en las unidades correspon-
dientes, el trabajo efectuado es
W = F · d = 2 × 2 + 1 × (– 3) + 0 × 1 = 1 .
Además, la componente de F en la dirección de d puede expresarse usando el producto escalar como
F·d
Fd = F cos θ = = F · d̂ ,
d
√
= d/d es un vector unitario en la dirección de d. En este caso tenemos d =
donde d̂ √ 14 de manera que
Fd = 1/ 14.
Caso general
Si la fuerza no es constante en el recorrido entre r1 y r2 , el trabajo se expresa mediante una integral de lı́nea
(Apartado 9.8). Sea un cuerpo que se mueve desde el punto A en r1 hasta el punto B en r2 sobre la curva C,
sometido a una fuerza F cuyo valor varı́a de un punto de C a otro (Figura 16.21). Sea F(r) la fuerza en el
punto r de la curva. El trabajo efectuado sobre el cuerpo entre las posiciones r y r + ∆r es ∆W ≈ F(r) · ∆r
y, en el lı́mite |∆r| → 0 sobre la curva, el elemento de trabajo
es dW = F · dr. El trabajo total efectuado desde A a B sobre C
es entonces
WAB = F(r) · dr (16.38)
C
y la integral es una integral de lı́nea. Expresado en compo-
nentes, F = (Fx , Fy , Fz ) y dr = (dx, dy, dz), de manera que
F · dr = Fx dx + Fy dy + Fz dz, y

WAB = Fx dx + Fy dy + Fz dz . (16.39)
C Figura 16.21
16.6. Producto vectorial 411
Esto es una generalización de la ecuación (9.52) para una curva en tres dimensiones, y el tratamiento del
Apartado 9.8 se aplica con únicamente algunas pequeñas modificaciones. En particular, si la fuerza es
conservativa, generalizando el tratamiento de las fuerzas conservativas del Apartado 5.7, las componentes
de la fuerza pueden expresarse como las derivadas (parciales) de una función energı́a potencial V (véase la
ecuación (5.57)),
∂V ∂V ∂V
Fx = − , Fy = − , Fz = − . (16.40)
∂x ∂y ∂z
Entonces
∂V ∂V ∂V
Fx dx + Fy dy + Fz dz = − dx + dy + dz = −dV (16.41)
∂x ∂y ∂z
y dV es el diferencial total de la función energı́a potencial V(r) = V(x, y, z). Se deduce que, para una fuerza
conservativa, la integral de lı́nea (16.38) es independiente del camino y es igual a la diferencia de energı́a
potencial entre A y B: B
WAB = − dV = VA − VB . (16.42)
A
EJEMPLO 16.12 Cargas en un campo eléctrico

La fuerza experimentada por una carga q en presencia de un campo eléctrico E es F = qE. Si el campo es
un campo electrostático (constante en el tiempo), la fuerza es conservativa de manera que, por la ecuación
(16.40), las componentes del campo E = F/q son (menos) las derivadas de una función φ = V/q:
∂φ ∂φ ∂φ
Ex = − , Ey = − , Ez = − . (16.43)
∂x ∂y ∂z
La función φ es la función potencial electrostático (energı́a potencial por unidad de carga) del campo.
Si el campo E es un campo uniforme, constante en el espacio, integrando las ecuaciones tenemos (véase
(5.58) para una fuerza constante)
φ(r) = − (xEx + yEy + zEz ) + C = −r · E + C (16.44)
donde φ(r) es el potencial electrostático en la posición r = (x, y, z) y C es una constante arbitraria. La

energı́a potencial de la carga q situada en r en el campo es entonces
V = qφ(r) = −qr · E + qC . (16.45)
La energı́a potencial de un sistema de cargas, q1 en r1 , q2 en r2 , . . . , qN en rN , es la suma de las energı́as de

las cargas individuales,

N
V = q1 φ(r1 ) + q2 φ(r2 ) + · · · + qN φ(rN ) = qi φ(ri ) .
i=1
Para el potencial (16.44), tenemos por lo tanto

N N
N
V = (– qi ri · E + qi C) = − qi ri · E + qi C
i=1 i=1 i=1
µ · E + QC ,
= −µ (16.46) Figura 16.22
donde µ es el momento dipolar del sistema de cargas y Q es la carga total. El término QC es cero para un
campo eléctricamente neutro o si se escoge que el potencial φ sea cero en el origen (la elección habitual).
Entonces
V = −µµ · E = −µE cos θ .
16.6. Producto vectorial
Todo par de vectores no paralelos, a y b, define un paralelogramo, Figura 16.23, con

área ab sen θ (base × altura).
Figura 16.23
Además, las Figuras 16.24 muestran que si ponemos un vector detrás del otro, defini-
mos un sentido de giro: antihorario en (a), o ‘hacia arriba’, con a seguido de b, y sentido
horario en (b), o ‘hacia abajo’, con b seguido de a.
Figura 16.24
Estas propiedades de los dos vectores definen un nuevo vector, el producto vectorial
de a y b,
v=a×b (16.47)
(leı́do a veces como ‘a vectorial b’) cuya longitud es
|v| = ab sen θ (16.48)
y cuya dirección es perpendicular tanto a a como a b (perpendicular al paralelogramo),

y tal que los tres vectores (a, b, v), en este orden, forman un triedro directo (como en
la Figura 16.24 (a)). La Figura (b) muestra que la dirección se invierte si se invierte el
orden de a y b en (16.47), de manera que
b × a = −a × b . (16.49)
Por lo tanto, a diferencia del producto escalar, el producto vectorial no es conmutativo:

es anticonmutativo.
16.6. Producto vectorial 413
Se deduce de (16.48) que el producto vectorial es cero si θ = 0 o θ = π, es decir, si

a y b son en la misma dirección o en direcciones opuestas. En particular
a × a = 0. (16.50)
En función de vectores de la base cartesianos

Los vectores unitarios i, j y k forman un triedro directo y tienen las propiedades
i × j = k, j × k = i, k × i = j,
(16.51)
i × i = 0, j × j = 0, k × k = 0.
El producto vectorial a × b puede entonces expresarse mediante componentes cartesia-

nas:
a × b = (ax i + ay j + az k) × (bx i + by j + bz k)
= a x bx i × i + a x by i × j + a x bz i × k + a y bx j × i + a y by j × j + a y bz j × k
+az bx k × i + az by k × j + az bz k × k
= ax by k + ax bz (– j) + ay bx (– k) + ay bz i + az bx j + az by (– i)
(teniendo en cuenta, por ejemplo, que j × i = −i × j). Por lo tanto
a × b = (ay bz − az by ) i + (az bx − ax bz ) j + (ax by − ay bx ) k . (16.52)
Esta expresión del producto vectorial se puede escribir, y es más fácil de recordar, en
forma de determinante (Capı́tulo 17):

i j k

a × b = ax ay az . (16.53)
b b b
x y z
EJEMPLO 16.13 Dados a = (3, 1, −1) y b = (1, 2, −3) halle a × b, b × a, y el área |a × b| del
paralelogramo definido por a y b.
Por la ecuación (16.52)
a × b = [1 × (– 3) − (– 1) × 2]i + [(– 1) × 1 − 3 × (– 3)] j + [3 × 2 − 1 × 1]k
= −i + 8 j + 5k = (– 1, 8, 5) .
Además: √
b × a = −a × b = (1, −8, −5) , |a × b| = 12 + 82 + 52 = 90 .
El producto vectorial se usa en geometrı́a para describir superficies y en cálculo vectorial

integral para evaluar integrales de superficie. En mecánica se usa el producto vectorial
para describir propiedades asociadas con el momento de las fuerzas y los movimientos
angulares.
EJEMPLO 16.14 Momento de una fuerza

En mecánica, la magnitud del momento N de una fuerza F con respecto
a un punto O se define como el producto N = |F| d, siendo d la distan-
cia de O a la lı́nea de acción de la fuerza, medida perpendicularmente
(Figura 16.25).
Si r es el vector que va desde O al punto A sobre la lı́nea, tenemos
d = |r| sen θ y
N = |r| |F| sen θ = |r × F| .
El correspondiente vector
N=r×F (16.54) Figura 16.25
es perpendicular a r y a F, y su dirección es la del eje que pasa por O en torno al cual la fuerza tiende a
producir un giro.
EJEMPLO 16.15 Dipolo eléctrico en un campo eléctrico

Un dipolo eléctrico µ = qr (véase el Ejemplo 16.5) en un campo eléctri-
co E experimenta un momento
N=µ×E (16.55)
que tiende a alinear el dipolo en la dirección del campo. De esta forma,

según la Figura 16.26, el momento total de la fuerza con respecto a O es
N = r1 × F1 + r2 × F2
= q(r1 − r2 ) × E = qr × E = µ × E .
Figura 16.26
EJEMPLO 16.16 Velocidad angular y momento angular

Velocidad angular
Una partı́cula que se mueve en un cı́rculo de radio r con velocidad v
tiene una velocidad angular ω , con respecto a un eje que pasa por el
centro, con magnitud dada por
v = ωr (16.56)
Figura 16.27
y dirección perpendicular al plano del movimiento (perpendicular a la
página para el movimiento representado en la Figura 16.27).
Más generalmente, sea una partı́cula (que puede formar parte de un cuerpo en rotación) que gira
alrededor del eje OA en torno al punto fijo O, como se muestra en la Figura 16.28. En ese caso la ecuación
(16.56) se sustituye por
v = ωr sen θ (16.57)
16.7. Campos escalares y vectoriales 415
que es justamente la magnitud del producto vectorial
v=ω ×r (16.58)
que también define correctamente la dirección de cada uno de los tres

vectores con respecto a los otros. Para un sólido rı́gido que gira con
velocidad angular ω , la ecuación (16.58) nos da la velocidad en cada
punto r del sólido.
Momento angular
El momento angular l de una masa m con respecto a un punto se define
como el momento con respecto a ese punto de su momento lineal p =
mv,
l = r × p. (16.59)
Su magnitud con respecto al punto O de la Figura 16.29 es l = pd =
pr sen θ, y su dirección es perpendicular al plano definido por r y p. Esa
dirección no es en general la de la velocidad angular ω , como puede ver-
Figura 16.28
se en la Figura 16.28 (sustituyendo v por p). Puede demostrarse (véase
el Ejercicio 49) que
l = mr2ω − m(r · ω )r (16.60)
de manera que l y ω llevan la misma dirección sólo si r y ω son vectores
perpendiculares, es decir, cuando r · ω = 0. Esto ocurre para el movi-
miento en un cı́rculo tomando el punto de referencia O en el centro de
cı́rculo. Entonces
l = mr2ω = Iωω, (16.61)
siendo I = mr2 el momento de inercia con respecto al eje de giro. La
relación entre l y ω para un movimiento arbitrario de una partı́cula o
para la rotación de un sólido rı́gido es menos sencilla que (16.61). La
relación general es
l = Iω , (16.62)
donde I es una cantidad con nueve componentes denominada tensor (o Figura 16.29
matriz) de inercia, y lo tratamos brevemente en el Ejemplo 19.15.
Conservación del momento angular

Como hemos visto en el Ejemplo 16.8, la segunda ley del movimiento de Newton puede escribirse como
dp
F= . Tomando el producto vectorial de r con ambos miembros de esta ecuación obtenemos
dt
dp
r×F=r× .
dt
El primer miembro es el momento de la fuerza que actúa sobre el sistema (Ejemplo 16.14). Utilizando la
regla de derivación de un producto (válida tanto para el producto escalar como para el vectorial), el segundo
miembro es
dp d dr
r× = (r × p) − × p.
dt dt dt
dr
Pero = v es paralelo a p, y su producto vectorial es cero. Por lo tanto, como r × p = l,
dt
dl
N= . (16.63)
dt
Esta expresión de la segunda ley de Newton, donde la tasa de variación del momento angular de un sistema
es igual al momento de la fuerza aplicada, pone de manifiesto que el momento angular de un sistema es
constante en ausencia de momentos de fuerzas exteriores.
16.7. Campos escalares y vectoriales

Una función de las coordenadas de un punto en el espacio se llama función de posi-
ción o campo. Una función escalar de posición, un campo escalar,
f = f (r) = f (x, y, z) , (16.64)
toma un valor en cada punto r = (x, y, z); es decir, se le asocia un escalar (un número) en
cada punto. En el Capı́tulo 10 hemos tratado ejemplos de campos escalares. Una función
vectorial de posición, un campo vectorial,
v = v(r) = v(x, y, z) , (16.65)
define un vector asociado a cada punto r. Un ejemplo de campo vectorial es el campo

de velocidades utilizado para describir el flujo de un fluido en hidrodinámica: a cada
punto se le asocia una velocidad. Los campos eléctricos y magnéticos son campos vec-
toriales.
La teorı́a de campos vectoriales es una herramienta esencial en hidrodinámica y en
electromagnetismo. Una caraterı́stica básica de la teorı́a de campos vectoriales es el uso
de operadores diferenciales vectoriales para describir cómo varı́an los campos de un pun-
to a otro en el espacio. En el siguiente apartado tratamos el concepto de gradiente de un
campo escalar, con algunas aplicaciones. En el Apartado 16.9 introducimos la divergen-
cia y el rotacional de un campo vectorial. Estas cantidades se usan en aplicaciones más
avanzadas del cálculo vectorial en la teorı́a de campos y sólo damos aquı́ una muy breve
descripción.
16.8. Gradiente de un campo escalar

El gradiente de una función de posición f = f (x, y, z) se define como el vector
∂f ∂f ∂f
grad f = i+ j + k. (16.66)
∂x ∂y ∂z
Se puede interpretar esta cantidad como el resultado de operar sobre la función f con el
operador diferencial vectorial
∂ ∂ ∂
∇= i+ j+ k (16.67)
∂x ∂y ∂z
(llamado a veces ‘nabla’), de manera que

∂ ∂ ∂
grad f = ∇f = i+ j+ k f =
∂x ∂y ∂z
16.8. Gradiente de un campo escalar 417
∂f ∂f ∂f
= i+ j+ k (16.68)
∂x ∂y ∂z
(suponiendo los vectores i, j y k constantes).5
EJEMPLO 16.17 Halle grad V siendo V = x + 2yz + 3z2 .

∂V ∂V ∂V
Tenemos = 1, = 2z y = 2y + 6z. Por lo tanto ∇V = i + 2z j + (2y + 6z)k .
∂x ∂y ∂z
EJEMPLO 16.18 Fuerza y energı́a potencial

Generalizando a tres dimensiones lo expuesto para fuerzas conservativas en el Apartado 5.7 (véase también
el Ejemplo 16.11), las componentes de una fuerza conservativa son las derivadas de una función energı́a
potencial V,
∂V ∂V ∂V
Fx = − , Fy = − , Fz = − .
∂x ∂y ∂z
La fuerza es por lo tanto (menos) el gradiente de V:

∂V ∂V ∂V
F = −∇V = − i+ j+ k . (16.69)
∂x ∂y ∂z
EJEMPLO 16.19 Fuerzas de Coulomb

q1 q2
La energı́a potencial de interacción de dos cargas q1 y q2 separadas una distancia r es V = (véase el
4π0 r
Ejemplo 5.13). Si r es la posición de q2 relativa a q1 , la fuerza que actúa sobre q2 debida a la presencia de
q1 es

q1 q2 ∂ 1 ∂ 1 ∂ 1
F = −∇V = − i+ j+ k
4π0 ∂x r ∂y r ∂z r
q1 q2 x y z q1 q2
= i + j + k = (xi + y j + zk)
4π0 r3 r3 r3 4π0 r3
q1 q2 r
= .
4π0 r3
r Figura 16.30
El vector unitario de q1 a q2 es r̂ = . Por lo tanto
r
q1 q2 r q1 q2
F= = r̂ . (16.70)
4π0 r3 4π0 r2
q1 q2
La fuerza tiene una intensidad y actúa en la dirección de q1 a q2 para cargas de mismo signo y de q2
4π0 r2
a q1 para cargas de signo opuesto (véase también el Ejemplo 5.11). Además, la fuerza por unidad de carga
que se ejerce en el punto r debida a la presencia de la carga q1 es E = F/q2 . Entonces
q1
E= r̂ = −∇φ (16.71)
4π0 r2
q1
es el campo electróstatico de la carga q1 , y φ = V/q2 = es el correspondiente potencial (escalar)
4π0 r
electrostático.
05. Hamilton introdujo la notación ∇, y (posiblemente) lo llamó nabla por el nombre de un instru-
mento musical parecido al arpa utilizado en Palestina en tiempos bı́blicos.
El significado del gradiente de una función de posición f (r) se entiende mejor con-
siderando cómo varı́a el valor de la función de un punto a otro del espacio. Sea un
desplazamiento (infinitesimal) r → r + dr, o en componentes cartesianas, (x, y, z) →
(x + dx, y + dy, z + dz):
dr = (dx, dy, dz) = i dx + j dy + k dz . (16.72)
La correspondiente variación de la función, df = f (r + dr) − f (r), es el diferencial total
∂f ∂f ∂f
df = dx + dy + dz . (16.73)
∂x ∂y ∂z
Podemos escribir esto como el producto escalar del gradiente ∇f y el desplazamiento dr

(ecuaciones (16.68) y (16.72)),

∂f ∂f ∂f ∂f ∂f ∂f
i+ j + k · (i dx + j dy + k dz) = dx + dy + dz
∂x ∂y ∂z ∂x ∂y ∂z
de manera que
df = ∇f · dr . (16.74)
df
La cantidad ∇f es por lo tanto la generalización de la derivada ordinaria a tres di-
dx
d
mensiones. El operador vectorial ∇ es la generalización del operador y a veces se
dx
d
denota por .
dr
16.9. Divergencia y rotacional de un campo vectorial

Divergencia
La divergencia de un campo vectorial v(r) se define como la cantidad escalar
∂vx ∂vy ∂vz

div v = ∇ · v = + + . (16.75)
∂x ∂y ∂z
En hidrodinámica, el campo vectorial es el campo de velocidades de un fluido y la di-

vergencia es una densidad de flujo: el valor de div v(r) dV en un punto r es una medida
del flujo neto, o tasa de flujo, de fluido a través de un elemento de volumen dV situado
en ese punto.
Consideramos aquı́ únicamente el caso particular de un campo vectorial que es el
gradiente de un campo escalar, v = ∇f . Entonces
16.10. Espacios vectoriales 419

∂ ∂ ∂ ∂f ∂f ∂f
div v = ∇ · ∇f = i+ j+ k · i+ j+ k
∂x ∂y ∂z ∂x ∂y ∂z
∂2f ∂2f ∂2f
= + + 2. (16.76)
∂x2 ∂y2 ∂z
Se deduce que ∇ · ∇ = ∇2 es el operador laplaciano. Si un campo escalar f (r) cumple

la ecuación de Laplace ∇2 f = 0 en un punto, el campo vectorial que se deriva ∇f tiene
divergencia cero en ese punto, y no hay flujo neto a través del elemento de volumen
en ese punto. Eso es lo que ocurre para un fluido incompresible en una región que no
contiene fuentes (de fluido) ni sumideros y para un campo electrostático en una región
libre de cargas.
Rotacional
El rotacional (rot v) de un campo vectorial v(r) se define como el vector

∂vz ∂vy ∂vx ∂vz ∂vy ∂vx
rot v = ∇ × v = − i+ − j+ − k
∂y ∂z ∂z ∂x ∂x ∂y

i j k

∂ ∂ ∂
= . (16.77)
∂x ∂y ∂z
v vy vz
x
En hidrodinámica, el rotacional del campo de velocidades en un punto es una medida de

la circulación de fluido alrededor del punto.
Un campo vectorial que es el gradiente de un campo escalar tiene rotacional nulo:
rot v = 0 si v = grad f . (16.78)
La ecuación (16.78) es una propiedad del campo electrostático, gradiente de un potencial

electrostático: E = −∇φ, y por lo tanto ∇ × E = 0. Por otra parte, un campo vectorial
que es a su vez el rotacional de un campo vectorial tiene divergencia nula:
div v = 0 si v = rot w . (16.79)
La ecuación (16.79) es una propiedad del campo magnético. Este campo siempre puede
escribirse como el rotacional de una función vectorial, B = ∇ × A, donde A es el
potencial magnético, y ∇ · B = 0.
16.10. Espacios vectoriales

Los vectores que hemos visto en este capı́tulo son vectores tridimensionales, o vec-
tores de un espacio vectorial tridimensional. El concepto de vector puede extenderse a
cualquier número de dimensiones definiendo los vectores de n dimensiones como can-

tidades con n componentes que obedecen las leyes del álgebra vectorial descritas en los
Apartados 16.2 y 16.3. En particular, un espacio vectorial de dimensión n puede definirse
mediante n vectores ortogonales,
e1 = (1, 0, 0, . . . , 0) , e2 = (0, 1, 0, . . . , 0) , ... , en = (0, 0, 0, . . . , 1) . (16.80)
Todo vector del espacio vectorial puede entonces expresarse como una combinación
lineal de estos vectores,
a = (a1 , a2 , a3 , . . . , an ) = a1 e1 + a2 e2 + a3 e3 + · · · + an en . (16.81)
Estas cantidades cumplen las leyes del álgebra vectorial.6

En un espacio vectorial definido de esta manera se asocia un producto interno (esca-
lar) a cada par de vectores,
a · b = a 1 b1 + a 2 b2 + a3 b3 + · · · + an bn = b · a . (16.82)
El producto interno se denota a menudo por (a, b). Dos vectores son ortogonales (‘per-
pendiculares’) si su producto interno es cero, y la longitud o norma de un vector es
√
|a| = a·a= a 1 2 + a 2 2 + a 3 2 + · · · + an 2 . (16.83)
Un espacio vectorial con estas propiedades se denomina espacio vectorial euclı́deo. En

concreto, el espacio que hemos descrito en este apartado es el espacio euclı́deo IRn de
dimensión n.
16.11. Ejercicios
Apartado 16.2
1. Sean a, b, c y d los vectores de posición de los puntos A, B, C y D. Exprese las siguientes cantidades
en función de a, b, c y d:
→ −
− →
(i) AB y BA , (ii) la posición del baricentro de los puntos,
→
−
(iii) la posición del centro de BC ,
→
−
(iv) la posición de un punto arbitrario de la recta BC (ecuación de la recta).
06. Hermann Günther Grassmann (1809-1877), metemático alemán, dio un tratamiento detallado de
los espacio vectoriales de dimensión n en su Die lineale Ausdehnungslere, ein neuer Zweig der Mathematik
(La teorı́a de extensiones lineales, una nueva rama de la matemática) de 1862. El trabajo incluı́a las álgebras
de los cuaterniones de Hamilton y de los vectores de Gibbs como casos particulares, pero fue muy poco
conocido durante su vida.
Apartado 16.3
Halle: (a) el vector v = (v1 , v2 , v3 ) con origen P(x1 , y1 , z1 ) y extremo Q(x2 , y2 , z2 ) y (b) la longitud de v:
2. P (1, 0, 0), Q (3, 2, 0) 3. P (– 3, 2, 1), Q (– 1, −3, 2)
4. P (0, 0, 0), Q (2, 3, 1) 5. P (1, 0, −3), Q (0, 0, 0)
6. P (– 2, 3, −1), Q (– 2, 3, −1)
Siendo a = (1, 2, 3), b = (– 2, 3, −4), c = (0, 4, −1), halle

7. a + b, b + a 8. 3a, −a, a/3 9. 3a + 2b − 3c
10. 3a − 3c, 3(a − c) 11. |a + b|, |a| + |b|
→
− →
− →
−
12. Dos lados del triángulo ABC son AB = (2, 1, −1) y AC = (3, 2, 0). Halle BC .
13. Halle la resultante de las fuerzas f1 = 2i − 3 j + k y f2 = 2 j − k.
14. Se dice que unas fuerzas están en equilibrio si la fuerza total es nula. Halle f tal que f, f1 = 2i−3 j+k
y f2 = 2 j − k estén en equilibrio.
15. Para los vectores u = 2i − j + 3k, v = 2 j − 2k, w = −k, halle

(i) x = 2u + v + 4w, (ii) un vector perpendicular a w y a x,
(iii) un vector perpendicular a v y a w.
16. Tres masas m1 = 2, m2 = 3, m3 = 1, tienen vectores de posición r1 = (3, −2, 1), r2 = (2, −1, 0),
r3 = (0, 1, −2), respectivamente. Halle
(i) el vector de posición del centro de masas,
(ii) los vectores de posición de las masas con respecto al centro de masas.
17. Tres cargas q1 = 3, q2 = −2, q3 = 1, tienen vectores de posición r1 = 2i + 2 j + k, r2 = 2i − 2 j + 3k,

r3 = −4 j − 3k, respectivamente. Halle
(i) el momento dipolar del sistema de cargas con respecto al origen,
(ii) la posición del punto respecto del cual el momento dipolar es nulo.
Apartado 16.4
Derive con respecto a t:
18. 2ti + 3t2 j 19. ( cos 2t, 3 sen t, 2t)
20. Un cuerpo de masa m se mueve sobre la curva r(t) = x(t)i + y(t) j + z(t)k, siendo x = 2 cos 3t,
y = 2 sen 3t, z = 3t, y t el tiempo.
(i) Halle la velocidad y la aceleración en el instante t.
(ii) Halle la dirección de la fuerza que se ejerce sobre el cuerpo.
(iii) Describa el movimiento del cuerpo (considérelo como una combinación de un mo-
vimiento en el plano xy y un movimiento en la dirección z).
Apartado 16.5
Para a = (1, 3, −2), b = (0, 3, 1), c = (1, −1, −3), halle:
21. a · b, b·a 22. a·c 23. c·b

24. (a − b) · c , a·c−b·c 25. (a · c)b 26. a·b+b·c+c·a
Para a = i, b = j, c = 2i − 3 j + k, halle:
27. a·b 28. b·c 29. a·c
30. Demuestre que a = (1, 2, 3), b = (0, −3, 2) y c = (– 13, 2, 3) son vectores ortogonales.
31. Halle el valor de λ para el cual a = (λ, 3, 1) y b = (2, 1, −1) son ortogonales.
√
32. Halle los ángulos entre la dirección de a = i − j + 2k y las direcciones x, y y z.
33. Un cuerpo se halla sometido a la acción de las fuerzas f1 = 4i − 2 j y f2 = i − 3 j. Calcule

(i) la fuerza total f que se ejerce sobre el cuerpo, (ii) la intensidad de esa fuerza,
(iii) el ángulo entre f y el eje x.
34. Un cuerpo experimenta un desplazamiento d bajo la acción de una fuerza f = 3i + 2 j. Calcule el

trabajo efectuado
(i) por la fuerza sobre el cuerpo si d = 2i − j,
(ii) por el cuerpo contra la fuerza si d = i − 3k,
(iii) por el cuerpo contra la fuerza si d = 2k.
35. Calcule la energı́a de interacción entre el sistema constituido por las cargas q1 = 2, q2 = −3 y q3 = 1
situadas en r1 = (3, −2, 1), r2 = (0, 1, 2) y r3 = (0, 2, 1), respectivamente, y el campo eléctrico aplicado
E = −2k.
Apartado 16.6
Para a = (1, 3, −2), b = (0, 3, 1), c = (0, −1, 2), halle :
36. a × b, b×a 37. b × c, |b × c| 38. (a + b) × c , a×c+b×c

39. a×c+c×a 40. (a × c) · b 41. a × (b × c) , (a × b) × c
42. Demuestre que a × b es ortogonal a a y a b.
43. La cantidad a(b × c) se denomina triple producto escalar. Demuestre que

(i) a · (b × c) = c · (a × b) = b · (c × a),

a1 a2 a3

(ii) a · (b × c) = b1 b2 b3 (determinante).
c1 c2 c3
44. La cantidad a × (b × c) se denomina triple producto vectorial.

(i) Desarrollando en componentes, demuestre que a × (b × c) = (a · c)b − (a · b)c.
(ii) Compruebe la fórmula para los vectores a = (1, 3, −2), b = (0, 3, 1), c = (0, −1, 2).
45. Halle el área del paralelogramo cuyos vértices tienen (en el plano xy) las coordenadas (1, 2), (4, 3),
(8, 6), (5, 5).
46. La fuerza F actúa aplicada en el punto A. Halle el momento de la fuerza con respecto al punto O para
(i) F = (1, −3, 0) , A (2, 1, 0) , O (0, 0, 0),
(ii) F = (0, 1, −1) , A (1, 1, 0) , O (1, 0, 2),
(iii) F = (1, 0, −2) , A (0, 0, 0) , O (1, 0, 3).
47. Calcule el momento de la fuerza experimentado por el sistema de cargas q1 = 2, q2 = −3 y q3 = 1

situadas en r1 = (3, −2, 1), r2 = (0, 1, 2) y r3 = (0, 2, 1), respectivamente, en el campo eléctrico E = −k.
48. Una carga q que se mueve con velocidad v en presencia de un campo eléctrico E y un campo magnéti-
co B, experimenta una fuerza total
F = qE + qv × B
llamada fuerza de Lorentz.
Calcule la fuerza que se ejerce sobre la carga q = 3 que se mueve con velocidad v = (2, 3, 1) en presencia
del campo eléctrico E = 2i y del campo magnético B = 3 j.
49. Utilice la propiedad del triple producto (Ejercicio 44) para obtener la ecuación (16.60) a partir de
(16.58) y (16.59).
50. La posición de una partı́cula de masa m que se mueve en un cı́rculo de radio R en torno al eje z con
velocidad angular ω viene dada por la función vectorial
r(t) = x(t)i + y(t) j + zk
siendo
x(t) = R cos ωt, y(t) = R sen ωt, z = constante
(el origen no está en el centro del cı́rculo).
(i) ¿Cuál es la velocidad angular ω en torno al eje z?
(ii) Exprese la velocidad v en función de ω, x, y y z.
(iii) Exprese el momento angular de la partı́cula en función de ω, x, y y z.
(iv) Compruebe que se cumple la ecuación (16.60) para este caso.
ω si z = 0, siendo I el momento de inercia en

51. Para el sistema del Ejercicio 50, demuestre que l = Iω
torno al eje de rotación.
52. El momento angular total de un sistema de partı́culas es la suma de los momentos angulares de
cada partı́cula. Si se sustituye el sistema del Ejercicio 50 por un sistema de dos partı́culas de masa m con
posiciones
r1 = x(t)i + y(t) j + zk , r2 = −x(t)i − y(t) j + zk ,
ω , siendo I el momento angular total con
halle el momento angular total l = l1 + l2 , y demuestre que l = Iω
respecto al eje de rotación.
ω si el eje de rotación es un eje de simetrı́a del sistema.
Este ejemplo ilustra que l = Iω
Apartado 16.8
Halle el gradiente ∇f para
53. f = 2x2 + 3y2 − z2 54. f = xy + zx + yz 55. f = (x2 + y2 + z2 )−1/2
Apartado 16.9
Halle div v y rot v para
56. v = xi + y j + zk 57. v = zi + x j + yk 58. v = yzi + zx j + xyk
59. Demuestre que rot v = 0 si v = grad f .
60. Demuestre que div v = 0 si v = rot w.

Determinantes
17.1. Conceptos
Muchos problemas en las ciencias fı́sicas, la ingenierı́a y la estadı́stica dan lugar a

sistemas de ecuaciones lineales. Los métodos de álgebra elemental son adecuados si el
número de ecuaciones es pequeño: dos o tres, como vimos en el Apartado 2.7. En al-
gunos casos, sin embargo, el número de ecuaciones puede ser grande y son necesarios
métodos alternativos para la resolución numérica de ‘sistemas lineales’ grandes, y para
la formulación y el análisis teórico de los problemas de los que provienen. En el Capı́tulo
20 tratamos algunos de los métodos prácticos de resolución, los ‘métodos numéricos’.
La rama de las matemáticas relacionada con la teorı́a de sistemas lineales es el álgebra
matricial, que es el tema de los Capı́tulos 18 y 19, pero varios de los resultados más im-
portantes y útiles de la teorı́a de ecuaciones lineales se obtienen, independientemente, de
cantidades llamadas determinantes. En este capı́tulo tratamos la teorı́a de determinantes
como un tema separado, en parte como preparación para el álgebra matricial más general
de los Capı́tulos 18 y 19, y en parte porque los determinantes tienen ciertas propiedades
de simetrı́a que los convierten en una herramienta importante en mecánica cuántica. Se
usan en quı́mica cuántica para construir funciones de onda electrónicas compatibles con
las exigencias del principio de exclusión de Pauli.
El concepto de determinante tiene su origen en la resolución de sistemas de ecuacio-
nes lineales.1 Sea la pareja de ecuaciones
(1) a1 x + b1 y = c1
(17.1)
(2) a2 x + b2 y = c2
donde a1 , b1 , c1 , a2 , b2 y c2 son constantes. Las ecuaciones son lineales en las ‘incógni-

tas’ x e y, y pueden resolverse por métodos de álgebra elemental. Para resolver para x,
multiplicamos la ecuación (1) por b2 y la ecuación (2) por b1 y tenemos
(1 ) a1 b2 x + b1 b2 y = c1 b2
(2 ) b1 a2 x + b1 b2 y = b1 c2
01. Las primeras descripciones del método para resolver conjuntos de ecuaciones lineales mediante
determinantes, conocido como regla de Cramer, las dieron el japonés Seki Kowa (1642-1708) en un ma-
nuscrito de 1683, y Leibniz en una carta a l’Hôpital en 1693 (publicada en 1850) en la cual daba también
la condición para la consistencia de las ecuaciones. La primera mención impresa apareció en el Treatise of
algebra de MacLaurin (póstumamente, en 1748).
426 Capı́tulo 17. Determinantes
de manera que, restando (2 ) a (1 ),
(a1 b2 − b1 a2 ) x = c1 b2 − b1 c2 . (17.2)
De manera similar, para y,
(a1 b2 − b1 a2 ) y = a1 c2 − c1 a2 . (17.3)
Si a1 b2 − b1 a2 no es cero, los (únicos) valores posibles de x e y son
c1 b2 − b1 c2 a1 c2 − c1 a2
x= , y= . (17.4)
a1 b2 − b 1 a2 a1 b2 − b 1 a2
La cantidad que aparece en los denominadores de (17.4) depende de los coeficientes de

las ecuaciones (17.1), y puede escribirse en la forma

a 1 b1

a2 b2 = a 1 b2 − b 1 a2 . (17.5)
La notación que aparece en el primer miembro se llama determinante;2 la expresión del

segundo miembro define su valor.
La solución (17.4) del sistema de ecuaciones (17.1) puede escribirse entonces como
D1 D2
x= , y= (17.6)
D D
siendo

a 1 b1 c1 b1 a1 c1

D= ,
D1 = ,
D2 = . (17.7)
a2 b2 c2 b2 a2 c2
EJEMPLO 17.1 Utilice determinantes para resolver las ecuaciones
2x − 3y = 5
x + 5y = 9
02. El término determinante fue acuñado por Cauchy en 1812 en el primero de una larga serie de
artı́culos sobre una clase de funciones simétricas alternadas tales como a1 b2 − b1 a2 . Para el caso general,
dispuso las n2 diferentes cantidades en una tabla cuadrada y empleó la abreviatura (a1,n ) para representar la
tabla que se asocia a un determinante. Cauchy usó los determinantes en problemas de geometrı́a y en fı́sica,
y para la cantidad que llamamos hoy en dı́a jacobiano. Introdujo el concepto de menores y el desarrollo con
respecto a cualquier fila o columna.
17.2. Determinantes de orden 3 427

2 −3

Tenemos D = = 2 × 5 − (– 3) × 1 = 13,
1 5

5 −3 2 5

D1 = = 5 × 5 − (– 3) × 9 = 52 , D2 = = 2 × 9 − 5 × 1 = 13 .
9 5 1 9
Por lo tanto x = D1 /D = 4 e y = D2 /D = 1.
El determinante (17.5) es un valor que depende de una tabla con 4 = 22 elementos, los
coeficientes de x e y del sistema de ecuaciones (17.1). Se trata de un determinante de
orden 2. En el caso general, un determinante de orden n es una cantidad que depende de
una tabla cuadrada con n2 elementos, y se representa como

a11 a12 a13 ··· a1n

a21 a22 a23 ··· a2n

a31 a32 a33 ··· a3n
(17.8)
.. .. .. .. ..
. . . . .

an1 an2 an3 ··· ann
En esta notación, el elemento aij está situado en la fila i y en la columna j de la tabla.

Por ejemplo, a23 está en la segunda fila, tercera columna. El determinante se representa a
veces con la notación |aij |. Los determinantes de orden n aparecen al considerar sistemas
de n ecuaciones con n incógnitas.
17.2. Determinantes de orden 3
El sistema de tres ecuaciones con tres incógnitas x1 , x2 y x3 ,
(1) a11 x1 + a12 x2 + a13 x3 = b1

(2) a21 x1 + a22 x2 + a23 x3 = b2 (17.9)
(3) a31 x1 + a32 x2 + a33 x3 = b3
puede resolverse para x1 multiplicando la ecuación

a22 a23
(1) por a22 a33 − a23 a32 = ,

a32 a33

a12 a13
(2) por −(a12 a33 − a13 a32 ) = − ,

a32 a33

a12 a13
(3) por a12 a23 − a13 a22 = ,

a22 a23
y sumando los tres resultados. El coeficiente de x1 en la expresión resultante define el

determinante de orden 3:

a11 a12 a13
a22 a23 a12 a13 a12 a13

D = a21 a22 a23 = a11
a a − a21 a32 a33 + a31 a22 a23 (17.10)
a31 a32 a33 32 33
o, desarrollando los determinantes de orden 2,
D = a11 a22 a33 − a11 a23 a32 − a21 a12 a33 + a21 a13 a32 + a31 a12 a23 − a31 a13 a22 . (17.11)
La solución del sistema de tres ecuaciones puede ser expresada, mediante determinantes
de orden 3, como
D1 D2 D3
x1 = , x2 = , x3 = (17.12)
D D D
donde D = 0 es el determinante de los coeficientes (17.10) y

b1 a12 a13 a11 b1 a13 a11 a12 b1

D1 = b2 a22 a23 , D2 = a21 b2 a23 , D3 = a21 a22 b2 . (17.13)
b3 a32 a33 a31 b3 a33 a31 a32 b3
EJEMPLO 17.2 Resuelva mediante determinantes las ecuaciones
2x − 3y + 4z = 8
y − 3z = −7
x + 2y + 2z = 11 .
Por la ecuación (17.10), el determinante de los coeficientes es

2 −3 4
1 −3 −3 4

D = 0
1 −3 = 2 + 1 −3 4
2 2 − 0 2 2 1 −3
1 2 2
= 2 × 8 − 0 × (– 14) + 1 × 5 = 21 .
Por las ecuaciones (17.13), los determinantes D1 , D2 y D3 son

8 −3 4 2 8 4 2 −3 8

D1 = −7 1 −3 = 21 , D2 = 0 −7 −3 = 42 , D3 = 0 1 −7 = 63 .
11 2 2 1 11 2 1 2 11
Por lo tanto x = D1 /D = 1, y = D2 /D = 2 y z = D3 /D = 3.
17.2. Determinantes de orden 3 429
Menores y cofactores
El menor Mij del elemento aij de un determinante D es el determinante que se obtiene

suprimiendo la fila i y la columna j de D. Por ejemplo, (17.14) muestra el resultado de
suprimir la fila 2 y la columna 3 de un determinante de orden 3.

a11 a12 a13 a a
a21 a22 a23 11 12
= = M23 . (17.14)
a a a a31 a32
31 32 33
En general, los menores de un determinante de orden n son determinantes de orden n−1.

Son importantes porque se usan para el desarrollo de un determinante en función de sus
elementos. Ası́ por ejemplo, podemos escribir la ecuación (17.10) como

a11 a12 a13

a21 a22 a23 = a11 M11 − a21 M21 + a31 M31 . (17.15)

a31 a32 a33
Esto se denomina desarrollo con respecto a la primera columna: cada elemento de la

primera columna se multiplica por su menor, y se suman los productos con unos signos
apropiados. El signo asociado al elemento aij es

+1 si i + j es par,
(– 1) i+j
= (17.16)
−1 si i + j es impar.
Los signos para el determinante de orden tres son

+ − +

− + −. (17.17)

+ − +
Un determinante puede desarrollarse con respecto a cualquier fila o columna.
EJEMPLO 17.3 Desarrolle un determinante de orden 3 con respecto a la segunda fila.
Los elementos de la segunda fila son a21 , a22 y a23 . Por lo tanto, utilizando (17.17) para los signos,

a11 a12 a13 a21

fila 2 −→ a22 a23 = −a21 M21 + a22 M22 − a23 M23 .

a
31 a32 a33
El menor M21 es

a11 a12 a13
a12 a13
M21 = a21 a22 a23 =
a32 a33
= a12 a33 − a13 a32 .

a a32 a33
31
De manera similar,

a11 a13 a11 a12
M22 = = a11 a33 − a13 a31 ,
M23 = = a11 a32 − a12 a31 .

a31 a33 a31 a32
El desarrollo completo del determinante en función de sus elementos es por lo tanto
−a21 M21 + a22 M22 − a33 M33 = − a21 (a12 a33 − a13 a32 )
+ a22 (a11 a33 − a13 a31 ) − a23 (a11 a32 − a12 a31 )
que es idéntico al resultado (17.11) obtenido mediante el desarrollo con respecto a la primera columna.
EJEMPLO 17.4 Halle el valor del siguiente determinante desarrollándolo (a) con respecto a la primera
fila y (b) con respecto a la tercera columna:

2 1 3

D = 4 −2 0 .
−1 1 0
(a) El desarrollo con respecto a la primera fila es

−2 0
D = 2 × − 1 × 4 0 + 3 × 4 −2
1 0 −1 0 −1 1
= 2 × 0 − 1 × 0 + 3 × 2 = 6.
(b) El desarrollo con respecto a la tercera columna es

4 −2
D = 3 − 0 + 0 = 3 × 2 = 6.
−1 1
El cofactor Cij del elemento aij es el menor Mij multiplicado por el correspondiente signo,
Cij = (– 1)i+j Mij . (17.18)
El desarrollo (17.15) con respecto a la primera columna es entonces

a11 a12 a13
3
a21 a22 a23 = a11 C11 + a21 C21 + a31 C31 = ai1 Ci1 .

a31 a32 a33 i=1
Más generalmente, el desarrollo con respecto a la columna j es

a11 a12 a13
3
a21 a22 a23 = a1j C1j + a2j C2j + a3j C3j = aij Cij , (17.19)

a31 a32 a33 i=1
y con respecto a la fila i es

a11 a12 a13
3
a21 a22 a23 = ai1 Ci1 + ai2 Ci2 + ai3 Ci3 = aij Cij . (17.20)

a31 a32 a33 j=1
17.3. Caso general 431
El desarrollo en función de cofactores se denomina desarrollo de Laplace del determi-

nante.
EJEMPLO 17.5 Halle los cofactores de los elementos de la tercera columna de

2 1 3

4 −2 0 .

−1 1 0
Tenemos
4 −2
a13 = 3 M13 = =2 C13 = +M13 = 2 ,
−1 1

2 1
a23 = 0 M23 = =3 C23 = −M23 = −3 ,
−1 1

2 1
a33 = 0 M33 = = −8 C33 = +M33 = −8 .
4 −2
17.3. Caso general
Un determinante de orden n es una cantidad que depende de una tabla cuadrada con
n2 elementos, representado por

a11 a12 a13 ··· a1n

a21 a22 a23 ··· a2n

a31 a32 a33 ··· a3n
. (17.21)
.. .. .. .. ..
. . . . .

an1 an2 an3 ··· ann
El determinante se define para n = 1 como
D = |a11 | = a11 . (17.22)
Se define para n ≥ 2 por su desarrollo con respecto a una fila cualquiera i (i = 1, 2, . . . , n)

n
D = ai1 Ci1 + ai2 Ci2 + · · · + ain Cin = aij Cij , (17.23)

j=1
o de manera equivalente, por el desarrollo con respecto a una columna cualquiera j (j =

1, 2, . . . , n)

n
D = a1j C1j + a2j C2j + · · · + anj Cnj = aij Cij . (17.24)

i=1
La cantidad
Cij = (– 1)i+j Mij (17.25)
es el cofactor del elemento aij y Mij es el menor de aij , el determinante de orden n − 1

que se obtiene a partir de D suprimiendo la fila i y la columna j.
EJEMPLO 17.6 Halle el valor de

2 1 1 3

4 −2 1
0
D= .
−1 1 0 2

0 3 1 −1
Desarrollando con respecto a la primera fila tenemos

−2 0 1 4 0 1 4 −2 1 4 −2 0

D = 2 −1 −1 − 3 −1 1 0 .
1 0 2 − 1 0 2 + 1 1 2
3 1 −1 0 1 −1 0 3 −1 0 3 1
Cada uno de los determinantes de orden tres puede calcularse por el método visto en el Apartado 17.2, esto
es, desarrollándolo en menores de orden 2. Entonces, desarrollando cada uno con respecto a su primera fila,

0 2 1 2 1 0
D = 2 − 2 − 0 + 1
1 −1 3 −1 3 1

0 2 −1 2 −1 0
−1 4 − 0 + 1
1 −1 0 −1 0 1

1 2 2 −1 1
+1 4 − (– 2) −1 + 1
3 −1 0 −1 0 3

1 0
−3 4 − (– 2) −1 0 + 0 −1 1
3 1 0 1 0 3
= 2 × 5 − 1 × (– 9) + 1 × (– 29) − 3 × 2 = −16 .
EJEMPLO 17.7 Halle el valor de

1 2 3 4 5

0 6 7 8 9

D= 0 0 10 11 12 .

0 0 0 13 14

0 0 0 0 15
Desarrollando con respecto a la primera columna, tenemos

6 7 8 9
10 11 12
0 10 11 12 13 14

D = 1 = 1 × 6 0 13 14 = 1 × 6 × 10 = 1 × 6 × 10 × 13 × 15 .

0 0 13 14 0 0 15 0 15

0 0 0 15
El valor de un determinante ‘triangular’ es igual al producto de los elementos de la diagonal, D = a11 ×

a22 × a33 × · · · × ann .
17.4. Resolución de ecuaciones lineales 433
NOTA: sobre el cálculo de determinantes y la resolución de ecuaciones lineales

El desarrollo de un determinante en función de sus elementos consiste en n! produc-
tos de n elementos por vez, e implica n! (n − 1) productos (véase (17.11) para n = 3). Se
deduce por lo tanto que estos desarrollos no proporcionan un método práctico (ni preci-
so) para el cálculo de determinantes grandes. Lo mismo ocurre con la utilización de la
regla de Cramer para resolver ecuaciones lineales que tratamos en el siguiente Apartado.
Salvo para valores muy pequeños de n, deben usarse siempre métodos numéricos como
los que describimos en el Apartado 17.6 y en el Capı́tulo 20.
17.4. Resolución de ecuaciones lineales
Hemos visto en los Apartados 17.1 y 17.2 que las soluciones de dos ecuaciones li-
neales, (17.6), o de tres ecuaciones lineales (17.12), pueden escribirse como cocientes
de determinantes si el determinante de los coeficientes de las incógnitas no es cero. En
general, el sistema de n ecuaciones lineales,
a11 x1 + a12 x2 + a13 x3 + · · · + a1n xn = b1

a21 x1 + a22 x2 + a23 x3 + · · · + a2n xn = b2
a31 x1 + a32 x2 + a33 x3 + · · · + a3n xn = b3 (17.26)
.. .. .. .. ..
. . . . .
an1 x1 + an2 x2 + an3 x3 + · · · + ann xn = bn
tiene una solución única si el determinante

a11 a12 a13 ··· a1n

a21 a22 a23 ··· a2n

···
D = a31 a32 a33 a3n (17.27)
. .. .. .. ..
.. . . . .

a a an3 ··· ann
n1 n2
no es cero. Esa solución viene dada por la regla de Cramer,3
D1 D2 Dn
x1 = , x2 = , ... , xn = , (17.28)
D D D
donde Dk se obtiene a partir de D sustituyendo la columna k de D por la columna con los
elementos b1 , b2 , . . . , bn . Por ejemplo,
03. El suizo Gabriel Cramer (1704-1752) publicó la regla en su Introduction à l’analyse des lignes
courbes algébriques (Introducción al análisis de las lı́neas curvas algebraicas) en 1750.

a11 b1 a13 ··· a1n

a21 b2 a23 ··· a2n
D2 1 a31 b3 a33 ··· a3n

x2 = = . (17.29)
D D .. .. .. .. ..
. . . . .

an1 bn an3 ··· ann
Este resultado puede obtenerse generalizando el método empleado en el caso de tres

ecuaciones del Apartado 17.2. Ası́, para x2 , multiplicando cada ecuación de (17.26) por
el cofactor del coeficiente de x2 y sumando después, tenemos Dx2 = D2 . Entonces x2 =
D2 /D si D = 0. Los Ejemplos 17.1 y 17.2 lo son del uso de la regla de Cramer.
Caso D=0
La regla de Cramer no se puede aplicar si el determinante de los coeficientes es cero.

Por ejemplo, el sistema
(1) 2x + 2y + z = 10
(2) x + 2y − 2z = −3 (17.30)
(3) 3x + 2y + 4z = 20
tiene determinante

2 2 1
2 −2 1 −2 1 2
D = 1 2 −2 = 2
2
− 2 + = 24 − 20 − 4 = 0 .
3 2 4 3 4 3 2
4
En el Apartado 17.5 tratamos la condición general de que un determinante sea cero. En

el caso que nos ocupa, no hay soluciones de (17.30) porque las ecuaciones son incom-
patibles. En efecto, sumando las ecuaciones (2) y (3) tenemos
4x + 4y + 2z = 17 ,
mientras que dos veces la ecuación (1) es
4x + 4y + 2z = 20 .
El sistema puede hacerse compatible si, por ejemplo, cambiamos el segundo miembro
de (3) a 23:
(1) 2x + 2y + z = 10
(2) x + 2y − 2z = −3 (17.31)
(3) 3x + 2y + 4z = 23 .
Ahora la suma de (2) y (3) es igual a dos veces (1), pero eso supone que la ecuación (1)
no contiene información que no esté ya contenida en las otras dos ecuaciones.
Se dice que las ecuaciones son linealmente dependientes, y tenemos en la práctica
únicamente dos ecuaciones con tres incógnitas. Por ejemplo, resolviendo (1) y (2), o
cualquier otro par, para x e y en función de z obtenemos
1
x = 13 − 3z , y= (5z − 16) , (17.32)
2
que es una solución del sistema (17.31) para cada valor de z.
Ecuaciones homogéneas
Si al menos una de las cantidades bi de los primeros miembros de las ecuaciones

(17.26) no es cero, las ecuaciones se dicen ecuaciones no homogéneas y homogéneas
si todos los bi son cero:
a11 x1 + a12 x2 + a13 x3 + · · · + a1n xn = 0

a21 x1 + a22 x2 + a23 x3 + · · · + a2n xn = 0
a31 x1 + a32 x2 + a33 x3 + · · · + a3n xn = 0 . (17.33)
.. .. .. .. ..
. . . . .
an1 x1 + an2 x2 + an3 x3 + · · · + ann xn = 0
La solución de un sistema homogéneo viene dada por la regla de Cramer si el deter-

minante de los coeficientes, D, no es cero. Sin embargo, puesto que b1 = b2 = · · · =
bn = 0, se deduce que los determinantes D1 , D2 , . . . , Dn en (17.28) son también cero, de
manera que la única solución de (17.33) es
x1 = x2 = x3 = · · · = xn = 0 si D = 0 . (17.34)
Por otra parte, hay soluciones no nulas si D = 0. Por ejemplo, el sistema
(1) 2x + 2y + z = 0
(2) x + 2y − 2z = 0 (17.35)
(3) 3x + 2y + 4z = 0
tiene D = 0, y una solución es la solución trivial (nula) x = y = z = 0. Las soluciones

no nulas se obtienen resolviendo cualquier par de ecuaciones para x e y en función de z:
5z
x = −3z , y= , (17.36)
2
para cualquier valor de z. Sólo se obtiene una solución única si se conoce una relación
adicional, independiente, entre x, y y z.
Este ejemplo ilustra uno de los teoremas más importantes de los sistemas de ecuacio-
nes lineales:
Un sistema de ecuaciones lineales homogéneo tiene solución no tri-

vial sólo si el determinante de los coeficientes es cero.
En el Capı́tulo 19 trataremos los sistemas de ecuaciones lineales con más detalle como
ecuaciones matriciales.
Ecuaciones seculares
Varios problemas en las ciencias fı́sicas dan lugar a sistemas de ecuaciones de la

forma
a11 x1 + a12 x2 + a13 x3 + · · · + a1n xn = λx1
a21 x1 + a22 x2 + a23 x3 + · · · + a2n xn = λx2
a31 x1 + a32 x2 + a33 x3 + · · · + a3n xn = λx3 (17.37)
.. .. .. .. ..
. . . . .
an1 x1 + an2 x2 + an3 x3 + · · · + ann xn = λxn
siendo λ un parámetro por determinar. Por ejemplo, en la teorı́a de orbitales moleculares,

la ecuación de Schrödinger se sustituye por uno de estos sistemas donde las cantidades
x1 , x2 , . . . , xn representan un orbital y λ la correspondiente energı́a orbital. Las ecuaciones
pueden expresarse como
(a11 − λ)x1 + a12 x2 + a13 x3 + ··· + a1n xn =0

a21 x1 + (a22 − λ)x2 + a23 x3 + ··· + a2n xn =0
a31 x1 + a32 x2 + (a33 − λ)x3 + · · · + a3n xn =0 . (17.38)
.. .. .. .. ..
. . . . .
an1 x1 + an2 x2 + an3 x3 + · · · + (ann − λ)xn = 0
Estas ecuaciones, denominadas ecuaciones seculares, tienen solución no trivial única-

mente si el determinante de los coeficientes es cero:

(a11 − λ) a12 a13 ··· a1n

a21 (a22 − λ) a23 ··· a2n
(a33 − λ) · · ·
a31 a32 a3n = 0. (17.39)

.. .. .. .. ..
. . . . .
an1 an2 an3 · · · (ann − λ)
El determinante, denominado en este contexto determinante secular, es cero única-

mente para ciertos valores del parámetro λ, y esos valores se obtienen resolviendo la
ecuación (17.39). Como el desarrollo del determinante secular es un polinomio en λ de

grado n, los valores buscados de λ son las n raı́ces del polinomio.
EJEMPLO 17.8 Halle los valores de λ para los cuales el siguiente sistema de ecuaciones tiene solución
no nula:
−2x + y + z = λx
− 11x + 4y + 5z = λy
−x + y = λz .
Las ecuaciones pueden expresarse como
(– 2 − λ)x + y + z =0
− 11x + (4 − λ)y + 5z =0
−x + y + (– λ)z = 0
y tiene solución no nula si

−2 − λ 1 1

D = −11 4−λ 5 = 0.

−1 1 −λ
Por lo tanto

4−λ 5 −11 5 −11 4 − λ
D = (– 2 − λ) −
−1 −λ
+
−1

1 −λ 1
= (– 2 − λ)[ − λ(4 − λ) − 5] − [11λ + 5] + [ − 11 + (4 − λ)]
= −λ3 + 2λ2 + λ − 2 = −(λ − 1)(λ + 1)(λ − 2) ,
y D = 0 si λ = 1, −1, ó 2.
Para cada una de las n raı́ces del determinante secular existe una solución de las ecua-
ciones (17.38).
EJEMPLO 17.9 Resuelva el problema de orbitales moleculares de Hückel
(1) (α − E)c1 + βc2 =0

(2) βc1 + (α − E)c2 + βc3 =0
(3) βc2 + (α − E)c3 = 0
en función de los parámetros de Hückel α y β. Las ecuaciones tienen solución no nula si el determinante
de los coeficientes c1 , c2 y c3 es cero:

α−E β 0

β α−E β = (α − E)[(α − E)2 − 2β 2 ] = 0 .

0 β α−E
√ √
Las tres raı́ces son E1 = α, E2 = α + 2β y E3 = α = 2β. Las correspondientes soluciones se obtienen
sustituyendo en las ecuaciones E por cada una de las raı́ces. Resolvemos para c1 y c2 en función de c3
(arbitrario):
E = E1 = α : (1) βc2 = 0 −→ c2 = 0 ,
(2) βc1 + βc3 = 0 −→ c1 = −c3 .
√ √ √
E = E2 = α + 2β : (3) βc2 − 2βc3 = 0 −→ c2 = 2c3 ,
√ √
(1) − 2βc1 + βc2 = 0 −→ c 1 = c2 / 2 = c3 .
√ √ √
E = E3 = α − 2β : (3) βc2 + 2βc3 = 0 −→ c2 = − 2c3 ,
√ √
(1) 2βc1 + βc2 = 0 −→ c1 = −c2 / 2 = c3 .
Las tres soluciones del problema secular son, tomando c3 = 1 por comodidad,
E c1 c2 c3
α −1 0 1
√ √
α + 2β 1 2 1
√ √
α − 2β 1 − 2 1
17.5. Propiedades de los determinantes
Las propiedades más importantes de los determinantes son las siguientes.
1. Transposición
Como el valor de un determinante es el mismo desarrollándolo por cualquier fila o

columna,
el valor de un determinante no varı́a si se intercambian sus filas y sus
columnas:

a1 b1 c1 a1 a2 a3

a2 b2 c2 = b1 b2 b3 . (17.40)

a3 b3 c3 c1 c2 c3
2. Multiplicación por una constante
Si todos los elemento de alguna fila (o columna) se multiplican por el

mismo factor λ, el valor del nuevo determinante es λ veces el valor
del determinante original:
17.5. Propiedades de los determinantes 439

λa1 λb1 λc1 a1 b1 c1

a2 b2 c2 = λ a2 b2 c2 . (17.41)

a3 b3 c3 a3 b3 c3
EJEMPLO 17.10 Ejemplos de la Propiedad 2.

2 4 6 1 2 3 1 1 3

1 8 9 = 2 1 8 9 = 2 × 2 1 4 9

3 12 27 3 12 27 3 6 27

1 1 1 1 1 1

= 2 × 2 × 3 1 4 3 = 2 × 2 × 3 × 3 1 4 3 = 144 .

3 6 9 1 2 3
3. Fila o columna nula

Si todos los elementos de una fila (o columna) son cero, el valor del
determinante es cero:

0 0 0

a2 b2 c2 = 0 . (17.42)

a3 b3 c2
Esto se deduce de la Propiedad 2 con λ = 0, o desarrollando con respecto a la fila (o

columna) de ceros.
4. Regla de la suma
Si todos los elementos de alguna fila (o columna) se escriben como

la suma de dos términos, el determinante se puede escribir como la
suma de dos determinantes:

a1 + d1 b1 c1 a1 b1 c1 d1 b1 c1

a2 + d2 b2 c2 = a2 b2 c2 + d2 b2 c2 . (17.43)

a3 + d3 b3 c3 a3 b3 c3 d3 b3 c3
Esto se obtiene del desarrollo de los tres determinantes con respecto a la fila o columna
pertinente; en (17.43) es la columna 1. Ası́,

a1 + d1 b1 c1

a2 + d2 b2 c2 = (a1 + d1 ) b2 c2 − (a2 + d2 ) b1 c1 + (a3 + d3 ) b1 c1
b3 c3 b3 c3 b2 c2
a3 + d3 b3 c3

b2 c2 b1 c1 b1 c1
= a1
− a2
+ a3
b3 c3 b3 c3 b2 c2

b2 c2 b1 c1 b1 c1

+ d1 − d2
+ d3
b3 c3 b3 c3 b2 c2

a1 b1 c1 d1 b1 c1

= a2 b2 c2 + d2 b2 c2 .
a3 b3 c3 d3 b3 c3
5. Intercambio de filas (o columnas). Antisimetrı́a
Si se intercambian dos filas (o dos columnas) de un determinante, el

valor del determinante se multiplica por (– 1):

a1 b1 c1 a2 b2 c2

a2 b2 c2 = − a1 b1 c1 (intercambio de las filas 1 y 2) . (17.44)

a3 b3 c3 a3 b3 c3

a1 b1 c1 a1 c1 b1

a2 b2 c2 = − a2 c2 b2 (intercambio de las columnas 2 y 3) . (17.45)

a3 b3 c3 a3 c3 b3
Se dice que el determinante es antisimétrico con respecto al intercambio de filas o de

columnas. Es esta propiedad de los determinantes la que los hace tan útiles para construir
funciones de onda electrónicas.
EJEMPLO 17.11 Determinantes de orden 2.
Intercambio de columnas:

a1 b1
= a1 b2 − b1 a2 = −(b1 a2 − a1 b2 ) = − b1 a1 .
a2 b2 b2 a2
Intercambio de filas:

1 2 3 4

D1 = = 1 × 4 − 2 × 3 = −2 , D2 = = 3 × 2 − 4 × 1 = +2 = −D1 .
3 4 1 2
17.5. Propiedades de los determinantes 441
EJEMPLO 17.12 Determinante de orden 3.
Por el Ejemplo 17.2,

2 −3 4

D = 0 1 −3 = 21 .
1 2 2
Intercambiando las filas 1 y 3 tenemos

1 2 2
1 −3
D = 0 1 −3 = − 2 0 −3 + 2 0 1
−3 4 2 4 2 −3
2 −3 4
= −5 − 12 − 4 = −21 = −D .
6. Dos filas o columnas iguales

Si dos filas (o dos columnas) son iguales, el valor del determinante
es cero:

a1 b1 c1

a1 b1 c1 = 0 . (17.46)

a3 b3 c3
Esto se deduce de la propiedad de antisimetrı́a de los determinantes. Por la Propiedad

5 el signo del determinante cambia si intercambiamos dos filas (o dos columnas). Si
las filas (o las columnas) son idénticas, intercambiarlas tiene que dejar el determinante
inalterado. Por lo tanto −D = D y esto sólo es posible si D = 0.
EJEMPLO 17.13 Ejemplo de la Propiedad 6. Las filas 1 y 2 son iguales.

1 1 1
1 1 1 1 1 1
1 1 1 = − + = 1 − 2 + 1 = 0.
3 4 2 4 2 3
2 3 4
7. Filas o columnas proporcionales

Si una fila (o columna) es un múltiplo de otra fila (o columna), el de-
terminante es cero:

λa2 λb2 λc2 a2 b2 c2

a2 b2 c2 = λ a2 b2 c2 = 0 . (17.47)

a3 b3 c3 a3 b3 c3
Esto se deduce de la Propiedad 2 del múltiplo de un determinante, y de la Propiedad 6

para dos filas iguales.
EJEMPLO 17.14 Ejemplo de la Propiedad 7. Una fila es un múltiplo de otra fila.

4 2 6 2 1 3

2 1 3 = 2 2 1 3 = 0.

3 4 5 3 4 5
8. Suma de filas o columnas

El valor de un determinante no cambia si se suma un múltiplo de
alguna fila (o columna) a cualquier otra fila (o columna):

a1 + λb1 b1 c1 a1 b1 c1 λb1 b1 c1 a1 b1 c1

a2 + λb2 b2 c2 = a2 b2 c2 + λb2 b2 c2 = a2 b2 c2 . (17.48)

a3 + λb3 b3 c3 a3 b3 c3 λb3 b3 c3 a3 b3 c3
Esto se deduce de la Propiedad 4 para la suma de determinantes y de la Propiedad 7 para

el caso de una columna igual a un múltiplo de otra.
EJEMPLO 17.15 Ejemplo de la Propiedad 8. Se ha sumado a la columna 1 tres veces la columna 2.

4 1 1 (1 + 3 × 1) 1 1 1 1 1 1 1 1 1 1 1

8 3 4 = (2 + 3 × 3) 3 4 = 2 3 4 + 3 3 3 4 = 2 3 4 .

15 5 6 (0 + 3 × 5) 5 6 0 5 6 5 5 6 0 5 6
9. Derivada de un determinante
Si los elementos de un determinante D son funciones derivables, la

derivada de D, D , puede expresarse como
D = D1 + D 2 + D 3 + · · · + Dn , (17.49)
donde Di se obtiene derivando los elementos de la fila i de D.
EJEMPLO 17.16 Derivada de un determinante de orden tres.
Si los elementos son funciones de x,

da1 da2 da3 a a1
a1 a2 a3 dx

1 a2 a3 a2 a3
d dx dx db1 db2 db3 b1
b1 b2 b3 = b1 b2 b3 + +

b2 b3 .

dx dx
c1 c2 c3 dc1
dx dx dc2 dc3

c1 c2 c3 c1 c2 c3 dx dx dx
17.7. Funciones alternadas 443
17.6. Reducción a forma triangular
Hemos visto en el Ejemplo 17.6 que el valor de un determinante ‘triangular’ es igual

al producto de los elementos de su diagonal,

a11 a12 a13 a14 · · · a1n

0 a22 a23 a24 · · · a2n

0 0 a33 a34 · · · a3n

0 0 0 a · · · a = a11 × a22 × a33 × · · · × ann . (17.50)
44 4n
.
. .. .. .. . . .
. . . . . ..

0 0 0 0 · · · ann
Todo determinante se puede reducir a forma triangular mediante la aplicación sistemáti-

ca de la Propiedad 8 del Apartado 17.5. El método es un ejemplo de los métodos de
eliminación que tratamos en el Capı́tulo 20, y lo ilustramos en el Ejemplo 17.7 para un
determinante de orden tres.
EJEMPLO 17.17 Ejemplo de reducción a forma triangular.

1 2 3

3 2 5 restando (3 × fila 1) a la fila 2

2 3 6

1 2 3

= 0 −4 −4
restando (2 × fila 1) a la fila 3
2 3 6

1 2 3

= 0 −4 −4
restando ( 41 × fila 2) a la fila 3
0 −1 0

1 2 3

= 0 −4 −4

0 0 1
= 1 × (– 4) × 1 = −4 .
17.7. Funciones alternadas
Una función f (x1 , x2 , x3 , . . . , xn ) de n variables se llama función alternada o total-

mente antisimétrica, si intercambiar dos variables cualesquiera supone multiplicar el
valor de la función por (– 1). Si se intercambian x1 y x2 :
f (x2 , x1 , x3 , . . . , xn ) = −f (x1 , x2 , x3 , . . . , xn ) . (17.51)

Si dos variables son iguales, la función es cero:
f (x1 , x1 , x3 , . . . , xn ) = 0 . (17.52)
Un determinante es una función alternada de sus filas (o de sus columnas). Más impor-
tante, un determinante que es una función alternada de n variables, x1 , x2 , x3 , . . . , xn , tiene
la forma

f1 (x1 ) f1 (x2 ) f1 (x3 ) . . . f1 (xn )

f (x ) f (x ) f (x ) . . . f (x )
2 1 2 2 2 2 2 n

f3 (x1 ) f3 (x2 ) f3 (x3 ) . . . f3 (xn )
, (17.53)
. ..
.. .. .. ..
. . . .

f (x ) f (x ) f (x ) . . . f (x )
n 1 n 2 n 2 n n
donde f1 , f2 , . . . , fn son funciones arbitrarias. Intercambiar cualquier par de variables

supone intercambiar dos columnas y, por lo tanto, cambiar el signo. Para n = 2,

f1 (x1 ) f1 (x2 )
= f1 (x1 )f2 (x2 ) − f1 (x2 )f2 (x1 ) . (17.54)
f (x ) f (x )
2 1 2 2
Para n = 3,

f1 (x1 ) f1 (x2 ) f1 (x3 )

f2 (x1 ) f2 (x2 ) f2 (x3 ) = f1 (x1 )f2 (x2 )f3 (x3 ) − f1 (x1 )f2 (x3 )f3 (x2 )

f3 (x1 ) f3 (x2 ) f3 (x3 ) + f1 (x2 )f2 (x3 )f3 (x1 ) − f1 (x2 )f2 (x1 )f3 (x3 )
+ f1 (x3 )f2 (x1 )f3 (x2 ) − f1 (x3 )f2 (x2 )f3 (x1 ) . (17.55)
El desarrollo del determinante tiene n! productos de las funciones f1 , f2 , . . . , fn , cada uno

con las n variables ordenadas de manera diferente, correspondiendo a las n! permuta-
ciones posibles de n objetos. Ası́, en (17.55), las 3! = 6 permutaciones de x1 , x2 y x3
son
x1 x2 x3 , x1 x3 x2 , x2 x3 x1 , x2 x1 x3 , x3 x1 x2 , x3 x2 x1 . (17.56)
Cada término contribuye a la suma con un signo + si la permutación se obtiene a partir

de x1 x2 x3 mediante un número par de transposiciones, y con un signo − si es mediante
un número impar de transposiciones.
Las funciones alternadas en forma de un único determinante o de sumas de determi-
nantes son importantes en mecánica cuántica para construir funciones de onda electróni-
cas. El electrón es miembro de la clase de partı́culas llamadas fermiones, partı́culas con
espı́n semientero (una partı́cula con espı́n nulo o entero se llama bosón). La función de
onda de un sistema de fermiones idénticos es totalmente antisimétrica con respecto al
intercambio de las coordenadas (incluyendo el espı́n) de los fermiones. Es decir, inter-

cambiar las coordenadas de cualquier par de fermiones supone un cambio de signo en la
función de onda. * Ésta es precisamente la propiedad de una función alternada. De esta
manera, si las funciones f1 , f2 , . . . , fn del determinante (17.53) representan los estados
ocupados de los n electrones de un sistema, y si x1 , x2 , . . . , xn representan las n coordena-
das (incluyendo el espı́n) de los electrones, entonces las funciones se llaman orbitales
de espı́n y el determinante (17.53) se llama determinante de Slater. Por ser el determi-
nante de Slater antisimétrico, intercambiar (las coordenadas y el espı́n de) cualquier par
de electrones supone un cambio de signo en el determinante. Si dos de las funciones (or-
bitales de espı́n) son iguales, dos filas del determinante son iguales y el determinante es
cero. Esto representa el principio de exclusión de Pauli: dos electrones no pueden estar
en el mismo estado (orbital de espı́n).
17.8. Ejercicios
Apartados 17.1 a 17.3

Evalúe:

4 1 2 0 0 1 cos nθ − sen nθ
1. 2. 3. 4.
3 2 0 3 −2 3 sen nθ cos nθ
5. (i) Halle todos los menores y cofactores de

1 2 3

2 0 −1 .

1 −1 1
(ii) Evalúe el determinante desarrollándolo con respecto a la primera fila.

(iii) Compruebe que se obtiene el mismo valor desarrollando con respecto a la segunda
columna.
Evalúe:

2 3 5 1 1 1 1 3 −2 0 3 2

6. 0 1 2 7. 1 −1 0 8. 0 −1 2 9. 2 0 1

3 4 1 1 1 −2 0 0 4 2 6 0

3 4 0 0 −2 6 17 −5 1 1 0 0

1 2 0 0 0 3 22 −17 3 2 2 −3
10. 11. 0 0 4 12
12. 1 −1
0 0 3 1 2 2
0 0 4 2 0 0 0 −6 5 3 1 −1
0* La función de onda de un sistema de bosones es totalmente simétrica, e intercambiar las coorde-

nadas de cualquier par de bosones idénticos deja la función sin cambios.
Apartado 17.4
Use la regla de Cramer para resolver los sistemas de ecuaciones:
w + 2x + 3y + z = 5
x + y + z= 6 3x − 2y − 2z = 0
2w + x + y + z= 3
13. x + 2y + 3z = 14 14. x + y − z = 0 15.
w + 2x + y = 4
x + 4y + 9z = 36 2x + 2y + z = 0
x + y + 2z = 0
16. Demuestre que las siguientes ecuaciones no tienen solución salvo si k = 3.
2x − y + z = 2
3x + y − 2z = 1
x − 3y + 4z = k
Resuelva las ecuaciones para ese valor de k.
17. Halle k para que las siguientes ecuaciones tengan solución no trivial.
kx + 5y + 3z = 0
5x + y − z = 0
kx + 2y + z = 0
Resuelva las ecuaciones para ese valor de k.
Halle los valores de λ para los que los siguientes sistemas de ecuaciones tengan soluciones no triviales.
Halle las soluciones para esos valores de λ.
3x + y = λx x + 2y − 3z = λx
2x + y = λx
18. 19. x + 2y + 3z = λy 20. 2x + 4y − 6z = λy
x + 2y = λy
4y + 9z = λz − x − 2y + 3z = λz

Evalúe los siguientes determinantes reduciéndolos a forma triangular:

3 2 −2 1 0 1 1 2 4 6 3

0 1 1 0 8 15 14 13
21. 6 1 5 22. 23.
−9 3 4 1 0 0 1 7 9 13 9
1 1 1 0 1 2 5 5
Use las propiedades de los determinantes para demostrar que:

3 6 −3 2 2 −1
a b
24. 2 1 5 = 0 25. 3 2 2 = 0 26. = 1 a−b a+b
c d 2 c−d c+d
1 2 −1 −1 0 −3

a1 a2 a3 a4

b1 b2 b3 b4
27. 16
c1 c2 c3 c4
d1 d2 d3 d4

a1 + b1 + c1 + d1 a2 + b2 + c2 + d2 a3 + b3 + c3 + d3 a4 + b4 + c4 + d4

a1 + b1 − c1 − d1 a2 + b2 − c2 − d2 a3 + b3 − c3 − d3 a4 + b4 − c4 − d4
=
a1 − b1 + c1 − d1 a2 − b2 + c2 − d2 a3 − b3 + c3 − d3 a4 − b4 + c4 − d4
a1 − b1 − c1 + d1 a2 − b2 − c2 + d2 a3 − b3 − c3 + d3 a4 − b4 − c4 + d4
28. Desarrolle el determinante

ψ1 (x1 ) ψ1 (x2 ) ψ1 (x3 ) ψ1 (x4 )

ψ2 (x1 ) ψ2 (x2 ) ψ2 (x3 ) ψ2 (x4 )

ψ3 (x1 ) ψ3 (x2 ) ψ3 (x3 ) ψ3 (x4 )
ψ4 (x1 ) ψ4 (x2 ) ψ4 (x3 ) ψ4 (x4 )
Matrices y transformaciones lineales
18.1. Conceptos
El álgebra matricial es la rama de las matemáticas que trata la teorı́a de los sistemas de
ecuaciones lineales, y es la herramienta básica para la formulación, el análisis teórico y
la resolución de problemas en las ciencias fı́sicas, ingenierı́a y estadı́stica, que dan lugar
a esos sistemas de ecuaciones. Una de las aplicaciones importantes en quı́mica usa el
concepto de transformaciones lineales para la representación matricial de operaciones de
simetrı́a en la descripción de las propiedades de simetrı́a de las moléculas, las funciones
de onda moleculares y los modos normales de vibración. En este capı́tulo presentamos
los elementos del álgebra matricial en los Apartados 18.2 a 18.4, y en los Apartados 18.5
y 18.6 la teorı́a matricial de las transformaciones lineales. En el Apartado 18.7 tratamos
las operaciones de simetrı́a, con una breve introducción a los grupos de simetrı́a.
Una matriz consiste en m × n cantidades, o elementos, dispuestos en una tabla rec-
tangular de m filas y n columnas situada entre paréntesis.1 Algunos ejemplos son
⎛ ⎞
x1
1 0 0
2 −1 a b c ⎜ x2 ⎟
0 3 , d e f , ⎝x ⎠, 0 1 0 , (18.1)
3
0 0 1
x4
y la notación general para una matriz m × n, con mn elementos, es (véase el Apartado

17.1 para determinantes)
⎛ ⎞
a11 a12 a13 · · · a1n
⎜ · · · a2n ⎟
⎜ a21 a22 a23 ⎟
⎜ ⎟
⎜ a31 a32 a33 · · · a3n ⎟
A= ⎜ ⎟. (18.2)
⎜ ⎟
⎜ .. .. .. .. .. ⎟
⎝ . . . . . ⎠
am1 am2 am3 · · · amn
01. Sylvester acuñó el término matriz en 1850 para representar una ‘disposición oblonga de térmi-
nos que consiste, supongamos, en m lı́neas y n columnas’ porque a partir de ella ‘podemos formar varios
sistemas de determinantes’. James Joseph Sylvester (1814-1897) estudió matemáticas en Cambridge pero
no tenı́a derecho a obtener un tı́tulo de Cambridge por motivos religiosos (era judı́o). Recibió su tı́tulo del
Trinity College de Dublı́n. Sus cargos incluyeron la cátedra de matemáticas de la entonces recién fundada
Johns Hopkins University de Baltimore (1876-1883). Fue editor fundador del American Journal of Mathe-
matics (1878). Es conocido sobre todo por su colaboración con su amigo Cayley en la teorı́a de matrices y
formas.
450 Capı́tulo 18. Matrices y transformaciones lineales
En esta notación, el elemento aij está situado en la fila i y en la columna j. Aunque

en este texto empleamos paréntesis, las matrices se representan a veces entre corchetes,
y también se usan notaciones como (aij ) y [aij ]. Para ser matrices, las tablas tienen que
cumplir las leyes del álgebra matricial (Apartado 18.3).
El álgebra matricial tiene sus orı́genes en la descripción de transformaciones de coor-
denadas.2 Supongamos que el par de ecuaciones
x = a1 x + b 1 y
(18.3)
y = a2 x + b2 y
representan un cambio de coordenadas en el plano xy de (x, y) a (x , y ). Esta transfor-

mación de coordenadas queda completamente caracterizada por los cuatro coeficientes
a1 , b1 , a2 , b2 , es decir por la tabla

a1 b1
. (18.4)
a2 b2
En álgebra matricial, las ecuaciones (18.3) se escriben como la ecuación matricial

x a1 b 1 x
= (18.5)
y a2 b2 y
o, asignando sı́mbolos a las distintas tablas,
r = Ar , (18.6)
siendo

x x a1 b1
r= , r = , A= . (18.7)
y y a2 b2
Las cantidades r y r son matrices columna (o vectores columna) cuyos elementos son
las coordenadas antes y después de la transformación de coordenadas, y A es la matriz
cuadrada de los coeficientes que representa y determina la transformación. Las transfor-
02. El álgebra de transformaciones de coordenadas fue tratado en 1801 por Gauss, y desarrollado
en 1858 en un álgebra por Cayley en su Memoir on the theory of matrices (Memoria sobre la teorı́a de
matrices), en la cual introdujo la notación con una única letra para una matriz y dedujo las reglas de la suma
y el producto.
Arthur Cayley (1821-1895) se graduó por el Trinity College de Cambridge en 1842, fue Becario durante
siete años y después ejerció la abogacı́a durante 14 años en los cuales publicó varios centenares de artı́culos.
Su producción sólo tiene rival en las de Euler o de Cauchy, con 967 artı́culos en sus Obras Completas. Es
conocido sobre todo por su trabajo sobre matrices y formas, también desarrolló la geometrı́a analı́tica de
espacios de n dimensiones en 1843, dio la primera definición de un grupo abstracto en 1854, y contribuyó a
la teorı́a de grafos, con una aplicación al estudio de isómeros quı́micos en 1874. Era muy solicitado como
referee por su conocimiento enciclopédico de las matemáticas.
18.2. Algunas matrices especiales 451
maciones de coordenadas son ejemplos de las transformaciones lineales que trataremos

en el Apartado 18.5.
EJEMPLO 18.1 La rotación como una transformación de coordenadas
Sea un punto P del plano xy, con coordenadas (x, y) con respecto al sistema de coordenadas Oxy. Como
vimos en el Apartado 8.5, un giro en sentido antihorario de ángulo θ en torno al eje Oz mueve el punto a la
posición P de coordenadas (x , y ), como en la Figura 18.1, de manera que (ecuaciones (8.41))
x = x cos θ − y sen θ
(18.8)
y = x sen θ + y cos θ .
Una interpretación alternativa de estas ecuaciones (‘pasiva’ en vez de ‘activa’) es el cambio de coordenadas
del punto fijo P si el propio sistema de coordenadas experimenta un giro en sentido horario de ángulo θ,
desde Oxy a Ox y como en la Figura 18.2.
Las coordenadas de P en el sistema girado son entonces (x , y ). La correspondiente ecuación matricial
es

x cos θ − sen θ x
= , (18.9)
y sen θ cos θ y
y la matriz

cos θ − sen θ
(18.10)
sen θ cos θ
caracteriza por completo la transformación de coordenadas (el giro de los ejes).

18.2. Algunas matrices especiales
Matrices cuadradas
Si el número de filas es igual al número de columnas, m = n, se dice que la matriz es

una matriz cuadrada de orden n. Por ejemplo, una matriz cuadrada de orden 3 es
⎛ ⎞
a11 a12 a13
⎝ a21 a22 a23 ⎠ (matriz cuadrada). (18.11)
a31 a32 a33
En tales matrices, la diagonal que contiene los elementos a11 , a22 , . . . , ann se llama diago-
nal principal (la palabra ‘principal’ se suele omitir), y los elementos aii de esa diagonal
se llaman elementos diagonales de la matriz. Los elementos aij con i = j, que no están
situados en la diagonal se dicen fuera de la diagonal: los elementos de la matriz (18.11)
situados fuera de la diagonal son a12 , a13 , a23 , a21 , a31 y a32 . Una matriz cuyos elementos
situados fuera de la diagonal son todos cero se llama matriz diagonal, por ejemplo:
⎛ ⎞
a11 0 0
⎝ 0 a22 0 ⎠ (matriz diagonal). (18.12)
0 0 a33
La matriz diagonal de orden n cuyos elementos diagonales son todos la unidad se llama
matriz identidad de orden n I (o In ). Para orden 3

1 0 0
I= 0 1 0 (matriz identidad). (18.13)
0 0 1
Dos cantidades escalares importantes asociadas a un matriz cuadrada A son el determi-

nante de la matriz, denotado por |A| o det A,

a11 a12 a13 · · · a1n

a21 a22 a23 · · · a2n
a a a ··· a
|A| = det A = 31 32 33 3n , (18.14)
... .. .. . . ..
. . . .
an1 an2 an3 · · · ann
y la suma de los elementos diagonales de la matriz, llamada la traza de la matriz,
tr A = a11 + a22 + a33 + · · · + ann = aii . (18.15)

i=1
18.2. Algunas matrices especiales 453
EJEMPLO 18.2 Halle el determinante y la traza de la matriz

⎛ ⎞
2 1 1 3
⎜ 4 –2 0 1 ⎟
A=⎝ .
–1 1 0 2 ⎠
0 3 1 –1
Por el Ejemplo 17.6, el determinante de A es

2 1 1 3

4 –2 0 1
det A = = −16 .
– 1 1 0 2
0 3 1 –1
La traza de A es
tr A = 2 + (– 2) + 0 + (– 1) = −1 .
Vectores
Una matriz que tiene una única columna se llama matriz columna o vector columna.
Una matriz con una única fila es una matriz fila o vector fila. Los elementos de un
vector se llaman componentes. Aunque las matrices se suelen representar por letras
mayúsculas, los vectores se representan con minúsculas:
⎛ ⎞
b1
⎜ b2 ⎟
⎜ ⎟
⎜b ⎟
a = (a1 2 3
a a · · · a n) , b=⎜ ⎜ 3 ⎟ (18.16)
⎟
⎜ .. ⎟
⎝ . ⎠
bn
(sólo es necesario un subı́ndice para las componentes de un vector). El álgebra matricial

incluye el álgebra vectorial como caso particular.
Matriz transpuesta
de una matriz A m×n es la matriz n×m que se obtiene a partir

La transpuesta AT (o A)
de A intercambiando sus filas y sus columnas: la primera columna de AT es la primera
fila de A, la segunda columna de AT es la segunda fila de A, etcétera. Por ejemplo,
⎛ ⎞
a 1 b1
a1 a 2 a 3
si A = ⎝ a2 b2 ⎠ , entonces A =
T
. (18.17)
b1 b2 b3
a3 b3
EJEMPLO 18.3 Matrices transpuestas

⎛ ⎞
1 −1
1 2 0
(i) si A= , entonces A =⎝ 2
T
4 ⎠.
−1 4 2
0 2

1 2 1 −3
(ii) si A= , entonces AT = .
−3 4 2 4
⎛ ⎞
3
(iii) si a = ⎝ 2 ⎠, entonces aT = 3 2 −1 .
−1
⎛ ⎞
1 3 0
(iv) si A=⎝ 3 2 −1 ⎠ , entonces AT = A .
0 −1 0
El caso (iv) es un ejemplo de matriz simétrica, cuya transpuesta es igual a la matriz:
AT = A . (18.18)
Determinante
El valor del determinante de una matriz cuadrada no varı́a si se transpone la matriz,
det AT = det A . (18.19)
18.3. Álgebra matricial
Igualdad de matrices
Dos matrices, A = (aij ) y B = (bij ), son iguales si tienen las mismas dimensio-
nes (mismo número de filas y mismo número de columnas), y si los correspondientes
elementos son iguales:
(aij ) = (bij ) si aij = bij para todo i, j . (18.20)
EJEMPLO 18.4 Igualdad de matrices
Si
a11 a12 a13 1 2 0
A= y B=
a21 a22 a23 −3 4 2
entonces A = B si a11 = 1, a12 = 2, a13 = 0, a21 = −3, a22 = 4 y a23 = 2.
18.3. Álgebra matricial 455
Suma de matrices
La suma de dos matrices se define únicamente si las matrices tienen las mismas di-
mensiones. Si A = (aij ) y B = (bij ) son ambas matrices m × n, su suma es una matriz
m × n que se obtiene sumando los correspondientes elementos de A y B:
A + B = (aij + bij ) . (18.21)
EJEMPLOS 18.5 Suma de matrices

1 2 3 1 −2 0 2 0 3
+ = ,
4 5 6 3 0 −1 7 5 5

1 −2 3 + −3 1 2 = −2 −1 5 ,
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
a1 b1 a1 + b1
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎝ a2 ⎠ + ⎝ b2 ⎠ = ⎝ a2 + b2 ⎠ .
a3 b3 a3 + b3
Multiplicación de una matriz por un escalar
El producto de una matriz A = (aij ), m × n, y un escalar (número) c es la matriz m × n

cuyos elementos se obtienen multiplicando cada elemento de A por c:
cA = (caij ) . (18.22)
EJEMPLOS 18.6 Multiplicación de una matriz por un escalar
Si ⎛ ⎞
1 2
A = ⎝−3 0 ⎠
5 −1
entonces ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
−1 −2 3 6 0 0
−A = ⎝ 3 0 ⎠, 3A = ⎝−9 0 ⎠, 0A = ⎝ 0 0 ⎠ .
−5 1 15 −3 0 0
Se deduce de las reglas de la suma y de la multiplicación por un escalar que una combina-
ción lineal de matrices m×n es una matriz m×n cuyos elementos son las combinaciones
lineales de los correspondientes elementos. Si A = (aij ), B = (bij ) y C = (cij ), entonces
αA + βB + γC = (αaij + βbij + γcij ) (18.23)
siendo α, β y γ escalares.
EJEMPLOS 18.7 Combinaciones lineales de matrices

1 2 3 1 −2 0 −1 10 6
2 −3 = ,
4 5 6 3 0 −1 −1 10 15
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 −1 −2 2 0 0
2⎝ 2 0 ⎠ + ⎝−4 0 ⎠=⎝ 0 0 ⎠.
−2 3 4 −6 0 0
La matriz m × n cuyos elementos son todos cero se llama matriz nula, m × n, 0. Se

deduce de lo anterior que

β
si αA + βB = 0 entonces A=− B. (18.24)
α
Multiplicación de matrices
El producto matricial C = AB (en este orden, con A a la izquierda de B) se define

únicamente si
el número de columnas de A = el número de filas de B . (18.25)
Entonces, si A es una matriz m × n con elementos aij , y B es una matriz n × p con

elementos bij , el producto C = AB es una matriz m × p cuyos elementos son
cij = ai1 b1j + ai2 b2j + ai3 b3j + · · · + ain bnj = aik bkj . (18.26)
k=1
En el caso más sencillo, si a es un vector fila (matriz) de n componentes ai y b es un

vector columna (matriz) de n componentes bi , el producto ab es
⎛ ⎞
b1
⎜ b2 ⎟
⎜ ⎟
⎜ b3 ⎟
ab = (a1 a2 a3 · · · an ) ⎜ ⎟
⎜ .. ⎟
⎝ . ⎠
bn

n
= a 1 b1 + a2 b2 + a3 b3 + · · · + an bn = ak bk . (18.27)
k=1
El producto es un número, una matriz 1×1. En este caso el producto matricial es equiva-
lente al producto escalar de dos vectores (de n dimensiones; véanse los Apartados 16.5
y 16.19).
En el caso general, la receta (18.26) para el elemento ij es el ‘producto escalar’ de la

fila i de A y la columna j de B. De esta manera, destacando en negrita la fila y la columna
implicadas,
⎛ ⎞
a11 a12 a13 · · · a1n ⎛ ⎞
⎜ a21 a22 a23 · · · a2n⎟ b11 b12 · · · b1j ··· b1p
⎜ ⎟⎜ ⎟
⎜ .. .. .. . . ..⎟⎜ b21 b22 · · · b2j ··· b2p ⎟
⎜ ⎟⎜ ⎟
⎜ . . . . .⎟⎜ b31 b32 · · · b3j ··· b3p ⎟
C = AB = ⎜ ⎟ ⎟
⎜ ai1 ai2 ai3 · · · ain ⎟ ⎜ ⎟
⎜ ⎟⎜ .. .. .. .. ..
⎠
⎜ .. .. .. . . .. ⎟ ⎝ . . . . .
⎝ . . . . . ⎠ bn1 bn2 · · · bnj ··· bnp
am1 am2 am3 · · · amn
⎛ ⎞
c11 c12 · · · c1j · · · c1p
⎜ c21 c22 · · · c2j · · · c2p ⎟
⎜ ⎟
⎜ .. .. .. . ⎟
⎜ ..
. .. ⎟
⎜ . . . ⎟
=⎜ ⎟. (18.28)
⎜ ci1 ci2 · · · cij · · · cip ⎟
⎜ ⎟
⎜ .. .. .. . .. ⎟
⎝ . . . .. . ⎠
cm1 cm2 · · · cmj · · · cmp
EJEMPLO 18.8 Dos matrices cuadradas

c1 d1 a1 b1 c1 a1 + d1 a2 c1 b1 + d1 b2
= .
c2 d2 a2 b2 c2 a1 + d2 a2 c2 b1 + d2 b2
EJEMPLO 18.9 Dos matrices rectangulares

⎛ ⎞
2 3 4 1
2 0 −3 ⎝ 1 4 9 2 2
2 2 0 ⎠ = ,
1 1 −2 3 7 2 1
0 −1 2 0
dimensiones: (2 × 3) (3 × 4) (2 × 4) .
EJEMPLO 18.10 Vector fila × vector columna

⎛ ⎞
2
1 2 3 ⎝ −2 ⎠ = (1) = 1 .
1
EJEMPLO 18.11 Vector columna × vector fila

⎛ ⎞ ⎛ ⎞
2 2 4 6
⎝−2 ⎠ 1 2 3 = ⎝−2 −4 −6 ⎠ .
1 1 2 3
EJEMPLO 18.12 Matriz × vector columna

⎛ ⎞
1
2 0 −3 ⎝ 2 ⎠ = −7 .
1 1 −2 −3
3
EJEMPLO 18.13 Vector fila × matriz

⎛ ⎞
2 0 −3
1 2 3 ⎝ 1 1 −2 ⎠ = 1 8 −7 .
−1 2 0
Propiedades de la multiplicación de matrices
Ley asociativa
A(BC) = (AB)C = ABC . (18.29)
El producto de matrices es asociativo y se pueden eliminar los paréntesis.
Ley distributiva
A(B + C) = AB + AC . (18.30)
Ley conmutativa
El producto de matrices no es conmutativo en general (aunque en algunos casos sı́),3
AB = BA . (18.31)
Si A es una matriz m × n y B es una matriz n × p, entonces AB es una matriz m × p, pero

BA no está definido salvo si p = n, en cuyo caso BA es una matriz cuadrada de orden n.
Los Ejemplos 18.10 y 18.11 ilustran la no conmutación del producto de una matriz fila
y una matriz columna. En ese caso AB y BA tienen dimensiones distintas.
Dos matrices no tienen por qué conmutar aunque sean ambas cuadradas y de mismo
orden. Ası́, si
03. El álgebra de los cuaterniones de Hamilton y el álgebra matricial de Cayley fueron los primeros
ejemplos de álgebras sin la limitación de la ley conmutativa para el producto. Llevaron al desarrollo de
álgebras generales que continúa hoy en dı́a.

1 0 1 1
A= 0 0 , B= 1 0 ,
tenemos

1 0 1 1 1 1
AB = 0 0 1 0 = 0 0 ,
pero

1 1 1 0 1 0
BA = 1 0 0 0 = 1 0 ,
de manera que AB = BA. Un ejemplo de matrices que sı́ conmutan es

0 1 2 1
A= 1 0 , B= 1 2 ,
y

0 1 2 1 1 2 2 1 0 1
AB = 1 0 1 2 = 2 1 = 1 2 1 0 = BA .
Dada la posibilidad de la no conmutación, es fundamental preservar el orden correcto

de los factores en un producto. En el producto AB, la matriz B está premultiplicada, o
multiplicada por la izquierda, por A. La matriz A está postmultiplicada, o multipli-
cada por la derecha, por B.
Una cantidad que juega un papel importante en mecánica cuántica es el conmutador
de las matrices A y B,
[A, B] = AB − BA . (18.32)
EJEMPLO 18.14 Matrices de espı́n de Pauli
En mecánica cuántica, el espı́n del electrón se representa a veces por las tres matrices de espı́n de Pauli, una
por cada componente cartesiana del momento angular de espı́n,

1 0 1 1 0 −i 1 1 0
Sx = , Sy = , Sz = , (18.33)
2 1 0 2 i 0 2 0 −1
√
donde i = −1 y = h/2π, siendo h la constante de Planck. Estas matrices cumplen las siguientes
propiedades de conmutación:
[Sx , Sy ] = Sx Sy − Sy Sx

1 0 1 0 −i 0 −i 0 1
= 2 −
4 1 0 i 0 i 0 1 0

1 i 0 −i 0
= 2 −
4 0 −i 0 i

1 1 0
= i2 = iSz
2 0 −1
y de manera similar para los otros emparejamientos. Por lo tanto
[Sx , Sy ] = iSz , [Sy , Sz ] = iSx , [Sz , Sx ] = iSy . (18.34)
Además,
1 2 0 1 0 1 1 2 1 0 1 2
S2x = Sx Sx = = = I
4 1 0 1 0 4 0 1 4
y de manera similar para S2y y S2z . Por lo tanto,
3 2
S2x + S2y + S2z = I (18.35)
4
representa el cuadrado del momento angular de espı́n. La cantidad 34 2 es el cuadrado de la magnitud del
momento angular de espı́n de un electrón, cuyo número cuántico de espı́n (total) es s = 12 ,
3 2 1
s(s + 1)2 = , con s= . (18.36)
4 2
Multiplicación por una matriz identidad
Si A es una matriz m × n y si Im e In son las matrices identidad de órdenes m y n,

respectivamente, entonces
Im A = A = AIn . (18.37)
EJEMPLO 18.15 Multiplicación por una matriz identidad

⎛ ⎞⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 0 0 2 3 2 3 2 3
⎝ 0 1 0 ⎠⎝ 1 ⎠ ⎝ ⎠ ⎝ ⎠ 1 0
2 = 1 2 = 1 2 .
0 1
0 0 1 0 −1 0 −1 0 −1
Producto igual a una matriz nula
Si AB = 0, eso no implica necesariamente que A = 0 o B = 0, o que BA = 0

(aunque exista).
EJEMPLO 18.16 Producto igual a una matriz nula

1 0 0 0 0 0 0 0 1 0 0 0
= pero = .
1 0 1 1 0 0 1 1 1 0 2 0
Determinante y traza de un producto matricial
Sean A y B dos matrices cuadradas de mismo orden, entonces el determinante del

producto AB, y el de BA, es igual al producto de los determinantes de A y de B:
det AB = det A × det B = det BA . (18.38)
Si C = AB, por la receta (18.26), un elemento diagonal del producto es
cii = aik bki .

k=1
Por lo tanto la traza del producto es

n

n
tr C = tr AB = aik bki . (18.39)

i=1 k=1
Esto es igual a la traza del producto en orden inverso: en efecto, si D = BA, entonces un
elemento diagonal de D es
dkk = bki aik

i=1
y la traza es

n

n
tr D = tr BA = bki aik (18.40)

k=1 i=1
que es lo mismo que la suma en (18.39).
Transpuesta de un producto matricial
La transpuesta del producto de dos o más matrices es igual al producto de las matrices
transpuestas tomado en orden inverso:
(AB) = BT AT .
T
(18.41)
EJEMPLO 18.17 Transpuesta de un producto
Sean ⎛ ⎞
2 3 4 1
2 0 −3
A= , B=⎝ 1 2 2 0 ⎠.
1 1 −2
0 −1 2 0
Entonces ⎛ ⎞
2 3 4 1
2 0 −3 ⎝ 1 ⎠ 4 9 2 2
AB = 2 2 0 =
1 1 −2 3 7 2 1
0 −1 2 0
y
⎛ ⎞⎛ ⎞ ⎛ 4 3 ⎞
2 1 0
2 1
⎜ 3 2 −1 ⎟ ⎝ ⎜ 9 7 ⎟
BT AT = ⎝ 1 ⎠=⎝ = (AB)T .
2 ⎠ 2 2 ⎠
0
4 2
−3 −2
1 0 0 2 1
18.4. Matriz inversa
Sean A y B dos matrices cuadradas de orden n, entonces B es la matriz inversa de

A (y viceversa) si
BA = AB = I ,
siendo I la matriz identidad de orden n. La matriz inversa de A se representa por A−1 :
A−1 A = AA−1 = I . (18.42)
Para matrices de orden 2, el par de matrices inversas es

a b −1 1 d −b
A= c d , A = a . (18.43)
ad − bc −c
EJEMPLO 18.18 Matriz inversa de orden 2

1 2 1 4 −2
Demuestre que si A = entonces A−1 = − .
3 4 2 −3 1
Tenemos
1 4 −2 1 2 1 −2 0 1 0
A−1 A = − =− =
2 −3 1 3 4 2 0 −2 0 1
y de manera similar para AA−1 .

18.4. Matriz inversa 463
El denominador de la expresión (18.43) para A−1 es el determinante de la matriz A,

a b
det A = c d = ad − bc .
(18.44)
Se deduce que la inversa de la matriz A sólo existe si el determinante de A es distinto

de cero. Este es un resultado general. Una matriz cuadrada con determinante no nulo se
dice no singular. Una matriz cuyo de terminante es cero se dice singular, y la inversa
de una matriz singular no está definida. La inversa de una matriz no singular se puede
obtener mediante la siguiente receta.
1. Sustituya cada elemento aij por su cofactor Cij del determinante de A (véase el
Apartado 17.2):
⎛ ⎞ ⎛ ⎞
a11 a12 · · · a1n C11 C12 · · · C1n
⎜ a21 a22 · · · a2n ⎟ ⎜ C21 C22 · · · C2n ⎟
⎜ ⎟ ⎜ ⎟
A=⎜ .. .. .. .. ⎟ −→ ⎜ .. .. .. .. ⎟ .
⎝ . . . . ⎠ ⎝ . . . . ⎠
an1 an2 · · · ann Cn1 Cn2 · · · Cnn
2. Transponga la matriz de los cofactores:

⎛ ⎞
C11 C21 · · · Cn1
⎜
⎜ C12 C22 · · · Cn2 ⎟
⎟
−→ ⎜ .. .. .. .. ⎟ = A.
⎝ . . . . ⎠
C1n C2n · · · Cnn
se llama adjunta de A.
La matriz A
3. Divida la matriz adjunta por el determinante de A:
A
A−1 = . (18.45)
det A
EJEMPLO 18.19 Inversa de orden 2
La matriz
a11 a12
A=
a21 a22
tiene por determinante det A = a11 a22 − a12 a21 , y los cofactores de sus elementos son C11 = a22 , C12 =
−a21 , C21 = −a12 , C22 = a11 . Entonces

= C11 C21 a22 −a12

A =
C12 C22 −a21 a11
de manera que
−1 1 a22 −a12
A = .
a11 a22 − a12 a21 −a21 a11
Esto es lo mismo que la fórmula (18.43).
⎛
⎞
2 1 3
EJEMPLO 18.20 Halle la inversa de A = ⎝ 4 −2 0 ⎠.
−1 1 0
El determinante de esta matriz se ha calculado en el Ejemplo 17.4 y vale det A = 6, y los cofactores de
varios de sus elementos se han calculado en el Ejemplo 17.5. La matriz de los cofactores es
⎛ ⎞
0 0 2
⎝ 3 3 −3 ⎠ ,
6 12 −8
y la inversa es la transpuesta de esto dividida por el valor del determinante,

⎛ ⎞
1⎝ 0 3 6
−1
A = 0 3 12 ⎠ .
6 2 −3 −8
Comprobación:
⎛ ⎞⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 0 3 6 2 1 3 1 6 0 0 1 0 0
A−1 A = ⎝ 0 3 12 ⎠ ⎝ 4 −2 0 ⎠ = ⎝ 0 6 0 ⎠ = ⎝ 0 1 0 ⎠ .
6 2 −3 −8 −1 1 0 6 0 0 6 0 0 1
Señalamos que el método anterior para hallar la inversa de una matriz implica evaluar el
determinante y n2 cofactores. Como mencionamos en la nota del Apartado 17.3, éste no
es un método práctico salvo para matrices muy pequeñas (véase el Capı́tulo 20).
Inversa de un producto matricial
La inversa del producto de dos o más matrices es igual al producto de las matrices
inversas tomado en orden inverso,
−1
(AB) = B−1 A−1 . (18.46)
18.5. Transformaciones lineales
La transformación de coordenadas que vimos en el Apartado 18.1, ecuaciones (18.3)

a (18.7), es un caso particular de transformación lineal. Más generalmente, una transfor-
18.5. Transformaciones lineales 465
mación lineal es un sistema de ecuaciones lineales *

x1 = a11 x1 + a12 x2 + a13 x3 + ··· + a1n xn
x2 = a21 x1 + a22 x2 + a23 x3 + ··· + a2n xn
x3 = a31 x1 + a32 x2 + a33 x3 + ··· + a3n xn (18.47)
.. .. .. .. .. ..
. . . . . .
xn = an1 x1 + an2 x2 + an3 x3 + ··· + ann xn
que representa la transformación del vector de componentes (x1 , x2 , . . . , xn ) en el nuevo

vector (x1 , x2 , . . . , xn ). En notación matricial,
x = Ax , (18.48)
donde
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
x1 a11 a12 a13 ··· a1n x1
⎜ x2 ⎟ ⎜ ··· ⎟ ⎜ ⎟
⎜ ⎟ ⎜ a21 a22 a23 a2n ⎟ ⎜ x2 ⎟
⎜ x3 ⎟ ⎜ ··· ⎟ ⎜ ⎟
x =⎜

⎜
⎟,
⎟ A=⎜
⎜
a31 a32 a33 a3n ⎟,
⎟ x=⎜
⎜
x3 ⎟.
⎟
⎜ .. ⎟ ⎜ .. .. .. .. .. ⎟ ⎜ .. ⎟
⎝ . ⎠ ⎝ . . . . . ⎠ ⎝ . ⎠
xn an1 an2 an3 ··· ann xn
Los vectores de n dimensiones se representan por las matrices columna x y x , y A se

llama matriz de la transformación que transforma x en x .
EJEMPLO 18.21 Transformaciones lineales en dos dimensiones
Sean (x, y) las coordenadas cartesianas de un punto en el plano xy, y supongamos que las matrices

cos θ − sen θ 0 1 1 0 1 0
A= , B= , C= , D= ,
sen θ cos θ 1 0 0 −1 0 a
representan transformaciones en el plano. Entonces, como se ilustra en la Figura 18.3,
Figura 18.3
0* La forma más general es una transformación de un vector con n componentes en un vector de m

componentes. La matriz de la transformación es en ese caso rectangular con dimensiones m × n.
(a) A es la rotación de ángulo θ en torno al origen tratada en el Ejemplo 18.1.
(b) Las coordenadas x e y se intercambian,

0 1 x y
=
1 0 y x
y B representa la reflexión (o rotación de 180◦ ) con respecto a la recta x = y.
(c) C cambia el signo de la coordenada y,

1 0 x x
=
0 −1 y −y
y representa la reflexión con respecto al eje x.
(d) Se multiplica por el factor a la coordenada y,

1 0 x x
=
0 a y ay
y D representa una dilatación en la dirección y si a > 1 y una contracción si 0 < a < 1.
Supongamos que a la transformación A dada por (18.47) y (18.48) le sigue una segunda
transformación B,
x = Bx (18.49)
que transforma x en x . Sustituyendo (18.48) en (18.49) nos da entonces
x = BAx = Cx (18.50)
de manera que A seguida de B es equivalente a una única transformación cuya matriz es

el producto matricial C = BA.
EJEMPLO 18.22 Transformaciones consecutivas en dos dimensiones
Sean (x, y) las coordenadas de un punto en el plano xy, y sean las matrices
⎛ √ ⎞
1 3
⎜ 2 − 2 ⎟ 0 1 −1 0
A=⎜ ⎝ √
⎟
⎠ , B = , C = ,
3 1 1 0 0 −1
2 2
transformaciones en el espacio. La matriz A representa una rotación en sentido antihorario de π/3 en torno
al origen, B es la reflexión con respecto a la recta x = y, y C es la inversión con respecto al origen. En la
Figura 18.4 ilustramos la secuencia A seguida de B seguida de C, que es equivalente a la transformación
⎛ √ ⎞ ⎛ √ ⎞
1 3 3 1
− − −
−1 0 0 1 ⎜ ⎜ 2 2 ⎟ ⎟=⎜ 2
⎜ 2 ⎟.
D = CBA =
0 −1 1 0 ⎝ √3 ⎠ ⎝ √ ⎟ ⎠
1 1 3
−
2 2 2 2
18.5. Transformaciones lineales 467
Figura 18.4
√ √
3 1 1 3
La posición final del punto es (x , y ) = – x − y, − x + y .
2 2 2 2
Se puede aplicar una transformación a más de un punto simultáneamente si se sustituye

la matriz columna de los coeficientes para un punto por la matriz rectangular cuyas
columnas son las coordenadas de los distintos puntos. Ası́, si x1 , x2 , x3 , . . . , xn son los
vectores columna de n puntos en un espacio tridimensional, construimos la matriz
⎛ ⎞
x1 x2 x3 · · · xn
X = (x1 x2 x3 · · · xn ) = ⎝ y1 y2 y3 · · · yn ⎠ . (18.51)
z1 z2 z3 · · · zn
Entonces, si Axi = xi ,
AX = A (x1 x2 x3 · · · xn )
= (Ax1 Ax2 Ax3 · · · Axn )
(18.52)
= (x1 x2 x3 · · · xn )
= X ,
y las columnas de X’ son las coordenadas de los puntos transformados.
EJEMPLO 18.23 Gire π/4 en torno al origen el cuadrado con esquinas situadas en las posiciones del
plano (x, y)
(x, y) = (2, 1), (3, 1), (3, 2), (2, 2) .
√
Por ser cos π/4 = sen π/4 = 1/ 2, la matriz de la transformación es

1 1 −1
√ .
2 1 1
Las coordenadas de las esquinas después de la rotación vienen dadas por lo

tanto por

1 1 −1 2 3 3 2 1 1 2 1 0
√ = √
2 1 1 1 1 2 2 2 3 4 5 4
⎛ ⎞
1 2 1
⎜ √2 √ √ 0 ⎟
= ⎜ 2 2 ⎟.
⎝ 3 4 5 4 ⎠
√ √ √ √
2 2 2 2
Figura 18.5
Transformaciones inversas
Si A es una matriz cuadrada no singular, tiene una inversa única A−1 tal que
A−1 Ax = AA−1 x = I x = x . (18.53)
Una transformación A seguida por su transformación inversa A−1 (o A−1 seguida de A)

es por lo tanto equivalente a la transformación identidad I, esto es, la ‘transformación’
que deja todo vector invariante. Por lo tanto
si x = Ax y x = A−1 x entonces x = A−1 Ax = x . (18.54)
EJEMPLO 18.24 La matriz

cos θ − sen θ
A=
sen θ cos θ
no es singular, con determinante det A = cos2 θ + sen2 θ = 1, y representa una rotación de ángulo θ. La
correspondiente transformación inversa es la rotación de ángulo −θ, con matriz

cos (– θ) − sen (– θ) cos θ sen θ
B= =
sen (– θ) cos (– θ) − sen θ cos θ
y B = A−1 es la matriz inversa de A. En efecto,

cos θ sen θ cos θ − sen θ 1 0
BA = = = I.
− sen θ cos θ sen θ cos θ 0 1
En este caso concreto, la inversa es también igual a la transpuesta, A−1 = AT .

18.6. Matrices ortogonales y transformaciones ortogonales 469
18.6. Matrices ortogonales y transformaciones ortogonales
Una matriz cuadrada no singular se dice ortogonal si su inversa es igual a su trans-

puesta
A−1 = AT (matriz ortogonal). (18.55)
Por ejemplo, la matriz que hemos visto en el Ejemplo 18.24 es ortogonal:

cos θ − sen θ cos θ sen θ
A = sen θ cos θ , A = − sen θ cos θ = A−1 .
T
(18.56)
La propiedad caracterı́stica de una matriz ortogonal es que sus columnas (y sus filas)
forman un sistema de vectores ortogonales unitarios (vectores ortonormales). Para orden
3, sea
⎛ ⎞
a1 b1 c1
A = ⎝ a2 b2 c2 ⎠ = (a b c) , (18.57)
a3 b3 c3
donde
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
a1 b1 c1
a = ⎝ a2 ⎠ , b = ⎝ b2 ⎠ , c = ⎝ c2 ⎠ . (18.58)
a3 b3 c3
La transpuesta de A es
⎛ ⎞ ⎛ T ⎞
a 1 a2 a3 a
AT = ⎝ b1 b2 b3 ⎠ = ⎝ bT ⎠ , (18.59)
c1 c2 c3 cT
siendo, por ejemplo, el vector fila aT = ( a1 a2 a3 ) el transpuesto del vector columna a.

El producto AT A, de A con su transpuesta, puede entonces escribirse como
⎛ ⎞ ⎛ T ⎞
aT a a aT b aT c
AT A = ⎝ bT ⎠ (a b c) = ⎝ bT a bT b bT c ⎠ , (18.60)
cT cT a cT b cT c
donde, por ejemplo,

⎛ ⎞
a1
aT a = (a1 a2 a3 ) ⎝ a2 ⎠ = a21 + a22 + a23 , (18.61)
a3
⎛ ⎞
b1
aT b = (a1 a2 a3 ) ⎝ b2 ⎠ = a1 b1 + a2 b2 + a3 b3 . (18.62)
b3
Reconocemos en aT b el producto escalar a · b de los vectores a = (a1 , a2 , a3 ) y b =

= (b1 , b2 , b3 ) (véase el Apartado 16.5), y esos vectores son ortogonales si aT b = a·b = 0.
Además, la cantidad aT a es el cuadrado de la longitud del vector a, y el vector tiene
longitud 1 si aT a = |a|2 = 1. Se deduce que si las columnas de A forman un sistema de
vectores ortonormales, el producto AT A es la matriz identidad:
⎛ ⎞ ⎛ ⎞
aT a aT b aT c 1 0 0
AT A = ⎝ bT a bT b bT c ⎠ = ⎝ 0 1 0 ⎠ = I (18.63)
cT a cT b cT c 0 0 1
y, por lo tanto, AT = A−1 . Se deduce también que el determinante de una matriz ortogonal
tiene por valor ±1. En efecto, por ser det AT = det A y det I = 1, tenemos
det (AT A) = det AT × det A = (det A) = 1 .

2
(18.64)
EJEMPLO 18.25 La matriz

⎛ ⎞
2 1 2
⎜ − ⎟
⎜ 3 3 3 ⎟
⎜ 2 2 1 ⎟
A=⎜
⎜ − ⎟
⎟
⎜ 3 3 3 ⎟
⎝ 1 2 2 ⎠
3 3 3
es ortogonal, con propiedades:
(i) ⎛ ⎞⎛ ⎞
2 2 1 2 1 2
⎜ 3 ⎟⎜ − ⎟ ⎛ 1 0 0 ⎞
⎜ 3 3 ⎟⎜ 3 3 3 ⎟
⎜ 1 ⎟⎜ ⎟ ⎜
AT A = ⎜ −
2 2 ⎟⎜ 2
−
2 1 ⎟=⎝ 0 1 0 ⎟
⎠
⎜ 3 ⎟⎜ ⎟
⎜ 3 3 ⎟⎜ 3 3 3 ⎟
⎝ 2 1 2 ⎠⎝ 1 2 2 ⎠ 0 0 1
−
3 3 3 3 3 3
T
y AAT = AT A = I.
(ii) Las columnas de A forman los vectores

2 2 1 1 2 2 2 1 2
a= , , , b= ,− , , c= – , , ,
3 3 3 3 3 3 3 3 3
con propiedades:
2 2
2
1 2 2
a·a=b·b=c·c= + + =1
3 3 3
18.7. Operaciones de simetrı́a 471
2 4 2 2 2 4 4 2 2
a·b= − + = 0, b · c = − − + = 0, c · a = − + + = 0.
9 9 9 9 9 9 9 9 9
De manera similar para las filas de A (las columnas de AT ).
(iii) El determinante de A es

2 1 −2
1
det A = 3 2 −2 1 = −1 .
3
1 2 2
Transformaciones ortogonales
Una transformación ortogonal es una transformación lineal
x = Ax (18.65)
cuya matriz de la transformación A es ortogonal. Las transformaciones ortogonales son

importantes porque conservan los productos escalares de vectores. Es decir, las longitu-
des de los vectores y los ángulos entre ellos no varı́an con una transformación ortogonal.
Todas las transformaciones de los Ejemplos 18.21 (salvo D), 18.22 y 18.23 son orto-
gonales. La conservación de las longitudes y de los ángulos se ilustra en la Figura 18.5
del ejemplo 18.23: ni el tamaño ni la forma de la figura (cuadrado) varı́an con la trans-
formación ortogonal (rotación). Todas las transformaciones ortogonales en un plano o
en un espacio tridimensional son o bien rotaciones o bien reflexiones, o combinaciones
de éstas, y tales transformaciones son importantes en la descripción matemática de las
propiedades de simetrı́a de las moléculas.
18.7. Operaciones de simetrı́a
La simetrı́a de un sistema fı́sico se caracteriza por un conjunto de elementos de sime-

trı́a, cada uno de ellos asociado a una o más transformaciones denominadas operaciones
de simetrı́a: transformaciones que dejan la descripción del sistema invariante. En quı́mi-
ca molecular resultan de gran importancia las transformaciones espaciales que producen
el intercambio de núcleos idénticos. Los posibles elementos de simetrı́a son entonces los
ejes de simetrı́a, planos de simetrı́a y centros de inversión.
EJEMPLO 18.26 Simetrı́a de la molécula de agua
La molécula de agua en su estado fundamental tiene la geometrı́a nuclear de equilibrio no lineal represen-
tada en la Figura 18.6, con ángulo de enlace 105◦ . El sistema tiene tres elementos de simetrı́a cada uno con
su operación asociada:
(i) Un eje de simetrı́a de orden 2 (Oz en la figura). Un giro de 180◦

en torno al eje supone el intercambio de los núcleos de hidróge-
no.
(ii) Un plano de simetrı́a (Oyz) que biseca el ángulo de enlace. Una
reflexión con respecto al plano supone también el intercambio de
los hidrógenos.
(iii) Un plano de simetrı́a (Oxz) que contiene los tres núcleos (el plano
molecular). Una reflexión con respecto a este plano deja quietos
los tres núcleos.
Figura 18.6
Las tres operaciones de simetrı́a tiene efectos distintos sobre la distribución electrónica de la molécula, y
son operaciones de simetrı́a distintas.
La teorı́a matemática de la simetrı́a es la teorı́a de grupos. 4 Damos aquı́ sólo una breve
introducción al concepto de grupos de simetrı́a y a la representación matricial de los
grupos.
Grupos de simetrı́a
Consideremos la figura plana simétrica formada por tres puntos en los vértices de un
triángulo equilátero (Figura 18.7), con la figura en el plano xy de un sistema de coorde-
nadas fijo con origen O en el baricentro del triángulo.
Figura 18.7
04. La teorı́a de grupos tiene sus orı́genes en los estudios de las ecuaciones algebraicas realizados por
Lagrange, Gauss, Abel y Cauchy. La relación entre ecuaciones algebraicas y el grupo de permutaciones fue
descrita por Évariste Galois (1811-1832), cuya corta vida incluyó dos intentos fallidos de entrar en la École
Polytéchnique (en el segundo intento le tiró un borrador a uno de los examinadores), la expulsión de la
École Normale y dos arrestos, uno por amenazar la vida del rey y otro por llevar el uniforme de la disuelta
Guardia Nacional. Murió en un duelo por un ‘asunto de honor’. Sus manuscritos matemáticos quedaron
sin leer hasta que Liouville los publicó en 1846. En un artı́culo sobre formas cuadráticas de 1882, Heinrich
Weber (1842-1913) dio una descripción axiomática completa de un grupo finito abstracto, definió los grupos
abelianos, y en 1893 extendió el trabajo a los grupos infinitos.
La simetrı́a de la figura puede describirse mediante el siguiente conjunto de seis ope-

raciones de simetrı́a:
E la operación identidad que deja todos los puntos quietos
A la rotación de 120◦ en sentido antihorario en torno al eje Oz
B la rotación de 240◦ en sentido antihorario (o de 120◦ en sentido horario) en torno
al eje Oz
C la rotación de 180◦ en torno al eje Oc
D la rotación de 180◦ en torno al eje Od
F la rotación de 180◦ en torno al eje Of
Otras operaciones de simetrı́a (reflexiones) son posibles, pero son equivalentes a las
seis operaciones anteriores para una figura plana. Las operaciones también se pueden
interpretar como las permutaciones de las etiquetas (1, 2, 3) de los tres puntos.
La aplicación sucesiva de dos operaciones de simetrı́a cualesquiera es equivalente
a la aplicación de una única operación. Los dos ejemplos de la Figura 18.8 muestran
que aplicar la operación A seguida de C es equivalente a aplicar la operación D, y que
C seguida de A es equivalente a F. Tales combinaciones de operaciones de simetrı́a se
representan con las ecuaciones simbólicas
CA = D , AC = F . (18.66)
Figura 18.8
Los resultados de las posibles combinaciones de pares de operaciones se recogen en

la tabla de multiplicación del grupo 18.1.
Las seis operaciones forman un conjunto cerrado llamado grupo. Nos referimos a este
grupo como G = {E, A, B, C, D, F}. Un grupo de simetrı́a constituido por rotaciones,
reflexiones e inversión se llama grupo puntual porque al menos un punto queda quieto
en cada operación de simetrı́a. En nuestro ejemplo sólo hay un punto que lo cumpla, el
baricentro del triángulo.
Tabla 18.1 Tabla de multiplicación de un grupo
E A B C D F (se aplica primero)
E E A B C D F
A A B E F C D
B B E A D F C
C C D F E A B
D D F C B E A
F F C D A B E
Axiomas de la teorı́a de grupos
Un conjunto de elementos {E, P, Q, R, . . . } forma un grupo si se cumplen las siguien-

tes condiciones.
(i) La combinación de cualquier par de elementos del grupo pertenece también al
grupo.
La ley de combinación depende de la naturaleza de los elementos: por ejemplo, suma o
multiplicación si los elementos son números, multiplicación de matrices si son matrices,
aplicación consecutiva de operaciones de simetrı́a o de otro tipo. La combinación de dos
elementos, P y Q, se llama producto de P y Q y se escribe PQ, con algún convenio sobre
el orden de los elementos. La ley asociativa se tiene que cumplir para la combinación de
todos los elementos del grupo: P(QR) = (PQ)R = PQR. La ley conmutativa no tiene
por qué cumplirse: en general PQ = QP. Por ejemplo, para el grupo G, AC = CA. Si
PQ = QP para todos los elementos del grupo, se dice que el grupo es un grupo abeliano.
(ii) Uno de los elementos del grupo, representado por E, tiene las propiedades de un
elemento unidad (o identidad). Para cualquier elemento P,
PE = EP = P .
(iii) Cada elemento tiene un inverso que también pertenece al grupo: si P pertenece al
grupo entonces su inverso P−1 se define por
PP−1 = P−1 P = E .
Para el grupo G = {E, A, B, C, D, F} los elementos inversos son
E−1 = E , A−1 = B , B−1 = A , C−1 = C , D−1 = D , F −1 = F .

Representación matricial de los grupos
Un conjunto de matrices que se multiplican de acuerdo con la tabla de multiplicación

de un grupo se llama una representación matricial Γ del grupo. En la Tabla 18.2 se
muestran tres representaciones del grupo G = {E, A, B, C, D, F}.
Tabla 18.2 Representaciones matriciales del grupo G
G E A B C D F
Γ1 1 1 1 1 1 1
Γ2 1 1 1 −1 −1 −1
√
√
√
√
1 0 − 12 − 23 − 12 3
−1 0 1 3 1
− 3
Γ2 √ √
2
√
2 2
√
2 2
0 1 3
− 21 − 3
− 12 0 1 3
− 12 − 23 − 12
2 2 2
Las representaciones Γ1 y Γ2 se llaman representaciones unidimensionales (las matrices

son los números ±1). La representación Γ1 , en la cual todas las operaciones de simetrı́a
se representan por el número +1, cumple claramente la tabla de multiplicación del gru-
po, Tabla 18.1, y se llama la representación trivial o totalmente simétrica del grupo.
Todo grupo tiene esa representación. La Tabla 18.3, obtenida a partir de la tabla de mul-
tiplicación 18.1 sustituyendo cada operación por su representante ±1 en γ2 , muestra que
γ2 es efectivamente una representación del grupo.
Tabla 18.3 Tabla de multiplicación de Γ2
+1 +1 +1 −1 −1 −1
+1 +1 +1 +1 −1 −1 −1
+1 +1 +1 +1 −1 −1 −1
+1 +1 +1 +1 −1 −1 −1
−1 −1 −1 −1 +1 +1 +1
−1 −1 −1 −1 +1 +1 +1
−1 −1 −1 −1 +1 +1 +1
De la misma manera, sustituyendo cada operación de la Tabla 18.1 por su representante

matricial de la representación bidimensional Γ3 , se comprueba que esas matrices cum-
plen la tabla de multiplicación.
Las matrices de la representación bidimensional Γ3 pueden obtenerse considerando
el resultado de aplicar cada operación de simetrı́a a las coordenadas de un punto en el
plano. Ası́ por ejemplo, la operación A es la rotación en sentido antihorario de ángulo
θ = 120◦ en torno al origen, y su matriz representativa es

⎛ √ ⎞
1 3
cos 120◦ − sen 120◦ ⎜− 2 − 2 ⎟
A= =⎜
⎝ √3
⎟. (18.67)
sen 120◦ cos 120◦ 1 ⎠
−
2 2
La rotación B es la inversa de A, ya que AB = BA = E, y su matriz representativa B
es la matriz transpuesta de A (todas las matrices son ortogonales, con la inversa igual
a la transpuesta). De manera similar, la operación C, rotación de 180◦ en torno al eje
O c (el eje y), transforma un vector r = (x, y) en el vector r = (– x, y). Su representante
matricial es por lo tanto

−1 0
C= 0 1 , (18.68)
ya que

−1 0 x −x
0 1 y = y . (18.69)
Para todo grupo, es posible construir todas las representaciones que se quiera de todas
las dimensiones posibles, pero se puede demostrar que sólo cierto número de ellas (las
‘representaciones irreducibles’) son distintas e independientes. En el caso que nos ocu-
pa, todas las representaciones posibles del grupo G o bien son equivalentes a las tres
representaciones de la Tabla 18.2, o bien se pueden reducir a ellas.
18.8. Ejercicios
Apartado 18.2
Para las siguientes matrices,
⎛⎞ ⎛ ⎞
−5 3 3 0 0
1 −2 3 0 1 −4
A = , B= , C = ⎝ 4 −1 ⎠ , D = ⎝ 0 2 0 ⎠,
0 3 4 2 −3 0
2 −1 0 0 −1
⎛ ⎞
0
1 −2 3 0
P = , Q= , a = ⎝−3 ⎠ , b = 2 5 −2 ,
0 4 0 1
1
halle, si es posible:
1. AT 2. CT 3. DT 4. PT
5. aT 6. bT 7. det A 8. det D
9. det P 10. tr B 11. tr D 12. tr Q
Apartado 18.3
Para las matrices de más arriba, halle si es posible:
13. A+B 14. A−B 15. B−A 16. C+D
17. 3P 18. 2A + 3B 19. a+b T
20. aT + b
21. AB 22. BC 23. CB 24. CP
25. PC 26. D2 27. PQ 28. QP
T T
29. ab 30. ba 31. ab 32. bT aT
33. Ca 34. aT C
⎛ ⎞
1 1 1
35. Demuestre que (CP)T = PT CT .36. Si A = ⎝ 2 1 2 ⎠, demuestre que
−2 1 −1
A3 − A2 − 3A + I = 0.

a b 2 1
Siendo A = yB= , halle A tal que:
c d 3 2

−1 0 3 2
37. A+B= 38. AB =
5 1 1 4
Halle el conmutador de los siguientes pares de matrices:

1 0 0 1 2 −1 −1 3
39. , 40. ,
1 0 −1 0 −1 1 3 2
41. Las matrices de espı́n para un núcleo con número cuántico de espı́n 1 son
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
⎝ 0 1 0 ⎠ ⎝ 0 −i 0 ⎠ 1 0 0
Ix = √ 1 0 1 , Iy = √ i 0 −i , Iz = ⎝ 0 0 0 ⎠.
2 0 1 0 2 0 i 0 0 0 −1
(i) Halle los conmutadores [Ix , Iy ], [Iy , Iz ], [Iz , Ix ].
(ii) Halle I2x + I2y + I2z .

a b
Halle la matriz general para la cual:
c d

1 2 a b 0 0
42. =
2 4 c d 0 0

1 2 a b a b 1 2 0 0
43. = =
2 4 c d c d 2 4 0 0
Apartado 18.4
Halle la matriz inversa, si es posible: ⎛ ⎞ ⎛ ⎞
1 2 3 2 −1 1
2 −3 ⎝−2
44. 45. 1 2 ⎠ 46. ⎝−1 1 −2 ⎠
4 1
3 −1 −1 −3 1 0
⎛ 1 1 ⎞
√ 0 −√ ⎛ ⎞
⎜ 2 2 ⎟ 3 4 0 0
⎜ ⎟ ⎜ 1 2 0 0 ⎟
47. ⎜ 0 ⎟ ⎝ 0 1 ⎠
⎜ 0 1 ⎟ 48.
⎝ 1 0 3
1 ⎠ 0 0 4 2
√ 0 √
2 2
49. Para la matriz A del Ejercicio 45, compruebe que AA−1 = A−1 A = I.

50. La transformación lineal r = Ar, donde
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
x x cos θ − sen θ 0
r =⎝ y ⎠,

r=⎝ y ⎠, A = ⎝ sen θ cos θ 0 ⎠ ,
z z 0 0 1
representa una rotación en sentido antihorario de ángulo θ en torno al eje z.
(i) Escriba las correspondientes ecuaciones lineales.

(ii) Halle A para una rotación en sentido antihorario de ángulo π/4 en torno al eje z.
(iii) Demuestre que ⎛ ⎞
cos 2θ − sen 2θ 0
A = ⎝ sen 2θ
2
cos 2θ 0 ⎠
0 0 1
y dé su interpretación geométrica.
(iv) Dé la interpretación geométrica de la ecuación A3 = I.
51. Para transformaciones en tres dimensiones, escriba las matrices que representan
(i) una rotación en torno al eje x,

(ii) una rotación en torno al eje y,
(iii) una reflexión con respecto al plano xy,
(iv) una reflexión con respecto al plano yz,
(v) una reflexión con respecto al plano zx,
(vi) una inversión con respecto al origen.
52. Demuestre que las matrices del Ejercicio 51 son ortogonales y halle sus inversas.
53. (i) Halle una única matriz A que represente la secuencia de transformaciones conse-cutivas:
(a) rotación en sentido antihorario de ángulo θ en torno al eje x, seguida de
(b) reflexión con respecto al plano xy, seguida de
(c) rotación en sentido antihorario de ángulo φ en torno al eje z.
(ii) Halle A para θ = π/3 y φ = −π/6.

⎛ ⎞
2
(iii) Halle r = Ar con esa A y r = ⎝ 0 ⎠.

−1
Las coordenadas de cuatro puntos en el plano xy vienen dadas por las columnas de la matriz

2 3 3 2
X=
1 1 2 2
(véase el Ejemplo 18.23).
Halle X = AX para cada una de las siguientes matrices A, y dibuje unos diagramas adecuados para
ilustrar las transformaciones:

0,8 −0,6 0 −1 2 0 3 1
54. 55. 56. 57.
0,6 0,8 1 0 0 1 −1 2
Apartado 18.7
58. Para el grupo G = {E, A, B, C, D, F} del Apartado 18.7:
(i) Construya una representación matricial tridimensional aplicando por turno cada operación de sime-
trı́a a las coordenadas (x, y, z).
(ii) Cada matriz de esta representación tiene la forma ‘diagonal por bloques’
⎛ ⎞
a11 a12 0
⎝ a21 a22 0 ⎠ .
0 0 a33
Compruebe que las matrices

a11 a12
a21 a22
forman la representación Γ3 de la Tabla 18.2, y que los números a33 forman la representación Γ2 .
59. Las propiedades de simetrı́a de la figura plana formada por los

cuatro puntos en los vértices de un rectángulo (no cuadrado) pueden
describirse mediante cuatro operaciones de simetrı́a, la operación
identidad y tres rotaciones.
(i) Describa esas operaciones de simetrı́a.
(ii) Construya la tabla de multiplicación del grupo.
(iii) Construya una representación matricial bidimensional del
grupo aplicando por turno cada operación de simetrı́a a las
coordenadas (x, y) de un punto en el plano de la figura.
El problema de autovalores matriciales
La determinación de los autovalores y autovectores de una matriz cuadrada se de-

nomina el problema de autovalores, y es importante en muchas ramas de las ciencias
fı́sicas y la ingenierı́a. Por ejemplo, en quı́mica cuántica, la aplicación del principio va-
riacional a la ecuación de Schrödinger da lugar a sustituir la ecuación diferencial de
autovalores por una ecuación matricial equivalente que puede resolverse por métodos
numéricos. En este capı́tulo empezamos resumiendo, Apartado 19.1, la formulación ma-
tricial de la resolución de sistemas de ecuaciones lineales no homogéneos que ya vimos
en el Capı́tulo 17 mediante determinantes. En el Apartado 19.2 tratamos el problema de
autovalores y las propiedades de los autovalores y autovectores. En los Apartados 19.3 y
19.4 tratamos los problemas relacionados de diagonalización de matrices y de reducción
de formas cuadráticas a forma canónica. El Apartado 19.5 contiene un resumen de las
matrices complejas que son importantes en la teorı́a de grupos avanzada y en mecánica
cuántica.
19.1. Sistemas de ecuaciones lineales
Un sistema de n ecuaciones lineales con n incógnitas, x1 , x2 , x3 , . . . , xn ,
a11 x1 + a12 x2 + a13 x3 + ··· + a1n xn = y1

a21 x1 + a22 x2 + a23 x3 + ··· + a2n xn = y2
a31 x1 + a32 x2 + a33 x3 + ··· + a3n xn = y3 (19.1)
.. .. .. .. .. ..
. . . . . .
an1 x1 + an2 x2 + an3 x3 + ··· + ann xn = yn
puede escribirse como una única ecuación matricial

⎛ ⎞⎛ ⎞ ⎛ ⎞
a11 a12 a13 · · · a1n x1 y1
⎜ a a a ··· a ⎟⎜ x ⎟ ⎜ ⎟
⎜ 21 22 23 2n ⎟ ⎜ 2 ⎟ ⎜ y2 ⎟
⎜ a a a ··· a ⎟⎜ x ⎟ ⎜ ⎟
⎜ 31 32 33 3n ⎟ ⎜ 3 ⎟=⎜ y3 ⎟, (19.2)
⎜ ⎟⎜ ⎟ ⎜ ⎟
⎜ .. .. .. . . .. ⎟ ⎜ .. ⎟ ⎜ .. ⎟
⎝ . . . . . ⎠⎝ . ⎠ ⎝ . ⎠
an1 an2 an3 · · · ann xn yn
Ax = y . (19.3)
482 Capı́tulo 19. El problema de autovalores matriciales
Vimos en el Apartado 17.4 que las ecuaciones tienen solución única si det A = 0, y
pueden resolverse formalmente por medio de determinantes con la regla de Cramer.
También vimos cómo obtener las soluciones en ciertas condiciones cuando A es singular,
con det A = 0.
Los problemas fı́sicos que conducen a sistemas de ecuaciones lineales se formulan
normalmente mediante matrices. Ası́ como el álgebra ordinaria es la herramienta básica
para manipular y resolver una ecuación (o unas pocas ecuaciones), se emplea el álgebra
matricial para manipular sistemas de ecuaciones, y para contruir métodos numéricos de
resolución. La concisión y la sencillez del formalismo matricial también hacen de él la
herramienta ideal para el análisis teórico de las propiedades y de la estructura de los
sistemas de ecuaciones, y de los problemas fı́sicos en los que surgen. Vamos a ver ahora
el tratamiento del Apartado 17.4 formulado mediante matrices.
Si A no es singular, con det A = 0, entonces existe A−1 y premultiplicando el primer
miembro de (19.3) tenemos

A−1 (Ax) = A−1 A x = Ix = x .
Por lo tanto, premultiplicando ambos lados de (19.3) por A−1 tenemos la solución única
x = A−1 y . (19.4)
Esto es equivalente a usar la regla de Cramer.
EJEMPLO 19.1 Resuelva las ecuaciones
2x − 3y + 4z = 8
y − 3z = −7
x + 2y + 2z = 11 .
La matriz de los coeficientes y su inversa son

⎛ ⎞ ⎛ ⎞
2 −3 4 1 ⎝ 8 14 5 ⎠
A=⎝ 0 1 −3 ⎠ , A −1
= −3 0 6 .
1 2 2 21 −1 −7 2
Por lo tanto, por la ecuación (19.4),

⎛ ⎞ ⎛ ⎞⎛ ⎞ ⎛ ⎞ ⎛ ⎞
x 1 8 14 5 8 1 21 1
⎝ y ⎠= ⎝−3 0 6 ⎠ ⎝−7 ⎠ = ⎝ 42 ⎠ = ⎝ 2 ⎠ .
z 21 −1 −7 2 11 21 63 3
Éste es el resultado que obtuvimos en el Ejemplo 17.2 con la regla de Cramer.
La ecuación matricial (19.3) representa el caso de ecuaciones no homogéneas, con y =

0. Para el caso homogéneo tenemos
19.2. El problema de autovalores matriciales 483
Ax = 0 (19.5)
y la solución es x = 0 si A es no singular. Si A es singular, x = 0 es la solución

trivial, pero como vimos en el Apartado 17.4, puede haber otras soluciones. En el si-
guiente apartado consideraremos esas otras soluciones para el caso más importante de
los sistemas homogéneos: el problema de autovalores matriciales.
19.2. El problema de autovalores matriciales
Una ecuación matricial del tipo
Ax = λx , (19.6)
donde A es una matriz cuadrada, x un vector columna y λ un número, es una transforma-

ción lineal en la que la matriz A transforma el vector x en un múltiplo de x. La ecuación
puede escribirse como
(A − λI)x = 0 (19.7)
(ya que I x = x), y representa por lo tanto el sistema de ecuaciones lineales homogéneas
(las ecuaciones seculares del Apartado 17.4)
(a11 − λ)x1 + a12 x2 + a13 x3 + ··· + a1n xn =0

a21 x1 + (a22 − λ)x2 + a23 x3 + ··· + a2n xn =0
a31 x1 + a32 x2 + (a33 − λ)x3 + · · · + a3n xn =0 . (19.8)
.. .. .. .. ..
. . . . .
an1 x1 + an2 x2 + an3 x3 + ··· + (ann − λ)xn = 0
Las ecuaciones tienen la solución trivial x = 0 para todo valor de λ. Las ecuaciones
también tienen solución no nula si el valor de λ puede escogerse de manera que la matriz
(A − λI) sea singular; es decir, si se escoge λ de manera que el determinante de (A − λI)
sea cero:
det (A − λI) = 0 , (19.9)
o bien

(a11 − λ) a12 a13 ··· a1n

(a22 − λ) ···
a21 a23 a2n

a31 a32 (a33 − λ) ··· a3n = 0. (19.10)

.. .. .. ..
. . . .

an1 an2 an3 · · · (ann − λ)
El primer miembro de esta ecuación se llama determinante caracterı́stico (o determi-

nante secular) de la matriz A. Se trata de un polinomio de grado n en λ y sus raı́ces
son los valores de λ para los cuales se cumple (19.9), es decir, los valores de λ para los
cuales la ecuación matricial (19.6) tiene soluciones no nulas. La ecuación (19.9) se llama
ecuación caracterı́stica de la matriz A.
Los valores de λ para los cuales la ecuación de autovalores (19.6) tiene soluciones
no nulas se llaman autovalores o valores propios de la matriz A (también se los llama
valores caraterı́sticos o raı́ces latentes). Una matriz de orden n tiene n autovalores λ1 ,
λ2 , . . . , λn , que forman el espectro de autovalores de A.
EJEMPLO 19.2 Resuelva la ecuación caracterı́stica de la matriz

⎛ ⎞
−2 1 1
A = ⎝−11 4 5 ⎠
−1 1 0
La ecuación caracterı́stica de A es

−2 − λ 1 1

det (A − λI) = D = −11 4−λ 5 = 0.

−1 1 −λ
En el Ejemplo 17.8 hemos resuelto esta ecuación:

D = −(λ − 1)(λ + 1)(λ − 2) = 0
y D = 0 para λ = 1, −1 o 2.
Los autovalores del Ejemplo 19.2 son números reales distintos pero, en general, dos o
más autovalores pueden ser iguales (autovalores múltiples o degenerados), o pueden
ser números complejos.
EJEMPLO 19.3 Autovalores múltiples
La ecuación caracterı́stica de la matriz

⎛ ⎞
4 0 2 4−λ 0 2

⎝−6 1 −4 ⎠ es −6 1 − λ −4 = λ(1 − λ)2 = 0

−6 0 −3 −6 0 −3 − λ
y los autovalores son λ1 = 0, λ2 = λ3 = 1.
EJEMPLO 19.4 Autovalores complejos
La ecuación caracterı́stica de la matriz

1 2 1−λ 2
es = λ2 − 2λ + 5 = 0
−2 1 −2 1 − λ
y los autovalores son λ1 = 1 + 2i, λ2 = 1 − 2i.

Los dos tipos de matrices cuyos autovalores son de mayor interés en las ciencias fı́sicas
son las matrices reales simétricas (matrices simétricas cuyos elementos son reales), y
las matrices complejas hermı́ticas descritas en el Apartado 19.5. Estas matrices tienen
autovalores reales.1
Correspondiendo a cada autovalor λ = λk existe una solución x = xk de la ecuación de
autovalores, tal que
Axk = λk xk k = 1, 2, 3, . . . , n. (19.11)
Estas soluciones se llaman autovectores o vectores propios de A (también se llaman

vectores latentes, vectores caracterı́sticos o polos). Estos vectores se obtienen resolvien-
do el sistema de ecuaciones homogéneas (19.8) para cada uno de los valores de λ (como
en el Ejemplo 17.9). El problema de hallar los autovalores y los autovectores se denomi-
na problema de autovalores matriciales (o problema de autovalores algebraicos).
Si los autovalores λk (k = 1, 2, . . . , n) son distintos (no habiendo dos con el mismo
valor), entonces existen n autovectores distintos (linealmente independientes). Si dos o
más autovalores son iguales puede haber menos de n autovectores distintos, pero las ma-
trices simétricas y las hermı́ticas siempre tienen la totalidad de n autovectores distintos.
EJEMPLO 19.5 Teorı́a de Hückel del ciclobutadieno
En la teorı́a de orbitales moleculares de sistemas de electrones π, los estados de los electrones π son des-
critos por una ecuación de autovalores matriciales
HC = EC
donde la matriz H representa el ‘hamiltoniano efectivo’ para un electrón π del sistema, los autovalores E
de H son las energı́as orbitales de los electrones π, y los autovectores C representan los correspondientes
orbitales moleculares (las componentes de C son los coeficientes de una descripción mediante ‘combinación
lineal de orbitales atómicos’ (CLOA) de un orbital molecular). En la teorı́a de Hückel del ciclobutadieno
(C4 H4 ), H es la matriz simétrica real
⎛ ⎞
α β 0 β
⎜ β α β 0 ⎟
H=⎝
0 β α β ⎠
β 0 β α
(los parámetros de Hückel α y β son escalares reales negativos con dimensiones de energı́a) con ecuación
caracterı́stica
01. D’Alembert consideró los primeros problemas de autovalores entre 1743 y 1758 en relación con
la resolución de sistemas de ecuaciones lineales con coeficientes constantes que aparecen en el movimiento
de una cuerda cargada. Cauchy estudió los autovalores en relación con las formas que describen superficies
cuadráticas. En 1829 demostró que una forma cuadrática puede reducirse a forma diagonal (Apartado 19.4)
mediante el método de optimización con ligaduras que involucra multiplicadores de Lagrange descritos en
el Ejemplo 9.9. Los multiplicadores son los autovalores de la matriz asociada.

α−E β 0 β

β α−E β 0
det (H − EI) =
0 β α−E β
β 0 β α−E
= (α − E)2 (α − E + 2β)(α − E − 2β) = 0 .
Los autovalores (energı́as orbitales) son por lo tanto
E1 = α + 2β , E 2 = E3 = α , E4 = α − 2β ,
y el espectro de autovalores se muestra en la Figura 19.1.

Las ecuaciones seculares del problema son
(1) (α − E)c1 + βc2 + βc4 =0 Figura 19.1

(2) βc1 + (α − E)c2 + βc3 =0
(3) βc2 + (α − E)c3 + βc4 =0
(4) βc1 + βc3 + (α − E)c4 = 0
y los autovectores se obtienen resolviendo este sistema de ecuaciones homogéneas para cada uno de los
autovalores E.
Para E = E1 = α + 2β,
(1) − 2βc1 + βc2 + βc4 =0

(2) βc1 − 2βc2 + βc3 =0
(3) βc2 − 2βc3 + βc4 =0
(4) βc1 + βc3 − 2βc4 = 0.
Sólo tres de las cuatro ecuaciones son independientes. Por ejemplo, (1) + (2) + (3) = −(4). Resolviendo
para c2 , c3 y c4 en función de c1 tenemos
c2 = c1 , c3 = c1 , c4 = c1 .
De forma similar, el autovector correspondiente al autovalor E4 = α − 2β tiene componentes
c2 = −c1 , c3 = c1 , c4 = −c1 .
Los autovectores correspondientes a los autovalores E1 y E4 son por lo tanto

⎛ ⎞ ⎛ ⎞
1 1
⎜ ⎟
1 ⎜ −1 ⎟
C1 = c 1 ⎝ ⎠ , C4 = c 1 ⎝
1 ⎠
,
1
1 −1
con c1 arbitrario.
Para E2 = E3 = α,
(1) = (3) βc2 + βc4 = 0

(2) = (4) βc1 + βc3 = 0 .
Sólo dos de las cuatro ecuaciones son independientes con solución
c1 = −c3 , c4 = −c2 .
Dos autovectores correspondientes al autovalor doblemente degenerado E = α son por lo tanto

⎛ ⎞ ⎛ ⎞
0 1
⎜ 1 ⎟ ⎜ 0 ⎟
C2 = c2 ⎝ C 3 = c3 ⎝
0 ⎠ −1 ⎠
, ,
−1 0
con c2 y c3 arbitrarios.
Propiedades de los autovectores
Propiedad 1. Si x es un autovector correspondiente al autovalor λ, entonces kx es

también un autovector correspondiente al mismo autovalor, para todo valor no nulo del
número k:
si Ax = λx entonces A(kx) = k(Ax) = k(λx) = λ(kx) . (19.12)
Los autovectores que difieren sólo en un factor constante no se consideran distintos. El

factor k se escoge, por conveniencia y por convenio, de manera que el autovector sea
unitario, es decir, que normalice el vector.
EJEMPLO 19.6 Normalización de autovectores
Los autovectores C del Ejemplo 19.5 están normalizados (tienen longitud unidad) si
CT C = c21 + c22 + c23 + c24 = 1 .
Por ejemplo
1
C1T C1 = c21 12 + 12 + 12 + 12 = 1 si c1 = ,
2
y el conjunto de los cuatro autovectores normalizados es
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 0 1 1
1⎜ 1 ⎟ 1 ⎜ 1 ⎟ 1 ⎜ 0 ⎟ 1 ⎜−1 ⎟
C1 = ⎝ ⎠ , C2 = √ ⎝ , C3 = √ ⎝ C4 = ⎝ .
2 1 2 0 ⎠ 2 −1
⎠,
2 1 ⎠
1 −1 0 −1
Propiedad 2. Si A es una matriz simétrica (real), los autovectores correspondientes a

autovalores distintos son ortogonales.
Sean xk y xl autovectores de A correspondientes a los autovalores λk y λl , respectivamen-

te. Entonces
Axk = λk xk (19.13)
y premultiplicando ambos miembros por xlT tenemos
xlT Axk = λk xlT xk . (19.14)

Además
Axl = λl xl (19.15)
y premultiplicando ambos miembros por xkT tenemos
xkT Axl = λl xkT xl . (19.16)
Ahora bien, el transpuesto de un producto de matrices es el producto de las matrices

transpuestas en orden inverso (ecuación (18.41)). Por lo tanto, transponiendo ambos
miembros de (19.16), y recordando que para una matriz simétrica AT = A y que los
autovalores de una matriz simétrica son reales,
xlT Axk = λl xlT xk . (19.17)
Restando (19.17) de (19.14) tenemos entonces
0 = (λk − λl ) xlT xk (19.18)
de manera que, si λk = λl ,
xlT xk = 0 (19.19)
y los vectores son ortogonales.
EJEMPLO 19.7 Ortogonalidad de autovectores
Para los autovectores del Ejemplo 19.5,

⎛ ⎞
0
⎜ 1 ⎟
C1T C2 = c1 c2 1 1 1 1 ⎝ ⎠ = c1 c2 (0 + 1 + 0 − 1) = 0 ,
0
−1
⎛ ⎞
1
⎜−1 ⎟
C1T C4 = c21 1 1 1 1 ⎝ ⎠ = c1 (1 − 1 + 1 − 1) = 0 ,
2
1
−1
y de manera similar para C1T C3 , C2T C4 C2T C3 y C3T C4 .
Propiedad 3. Para una matriz simétrica, los autovectores correspondientes al mismo

autovalor o bien son ortogonales o pueden convertirse en tales.
EJEMPLO 19.8 Ortogonalidad de autovectores
Los autovectores C2 y C3 del Ejemplo 19.5 corresponden al mismo autovalor, E = α. Ya son ortogonales:
⎛ ⎞
1
⎜ 0 ⎟
C2T C3 = c2 c3 0 1 0 −1 ⎝ = c2 c3 (0 + 0 + 0 + 0) = 0 .
−1 ⎠
0
Si xk y xl corresponden al mismo autovalor λk = λl = λ, entonces
Axk = λxk y Axl = λxl , (19.20)
de manera que toda combinación lineal de xk y xl es también un autovector de A con el

mismo autovalor. En efecto, si
x = axk + bxl , (19.21)
entonces
Ax = A (axk + bxl ) = a (Axk ) + b (Axl )

= a (λxk ) + b (λxl ) = λ (axk + bxl ) = λx . (19.22)
Si xk y xl son dos vectores independientes, siempre es posible encontrar dos combina-

ciones lineales suyas que sean ortogonales.
EJEMPLO 19.9 Ortogonalización de vectores
Sean a y b dos vectores no ortogonales, con aT b = 0. Dos combinaciones lineales de a y b ortogonales son
el propio a y
b = b − ca
donde c se toma tal que aT b = 0. De esta manera
aT b
aT b = aT b − caT a = 0 , c= ,
aT a
y

aT b
b = b − a.
aT a
⎛ ⎞ ⎛ ⎞
1 3
Por ejemplo, si a = ⎝ 1 ⎠ y b = ⎝ 0 ⎠, entonces aT a = 3, aT b = 6, y
1 3
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
3
1 1
6
b =⎝ 0 ⎠−
⎝ 1 ⎠ = ⎝−2 ⎠ .
3 3 1 1
Esto es un ejemplo del ampliamente utilizado método de ortogonalización de Schmidt.

De las Propiedades 1 a 3 se deduce el siguiente importante teorema para los autovectores

de matrices simétricas:
Los n autovectores de una matriz real simétrica de orden n forman (o

pueden escogerse de manera que formen) un sistema de n vectores
ortogonales unitarios (ortonormales):

1 si k = l,
xkT xl = δkl = (19.23)
0 si k = l.
19.3. Diagonalización de matrices
Sea una matriz cuadrada A con autovectores x1 , x2 , x3 , . . . , xn asociados a los autova-

lores λ1 , λ2 , λ3 , . . . , λn ,
Axk = λk xk , k = 1, 2, 3, . . . , n , (19.24)
y sea X la matriz cuyas columnas son los vectores de A normalizados:

⎛ ⎞
x11 x12 x13 · · · x1n
⎜ x x x ··· x ⎟
⎜ 21 22 23 2n ⎟
⎜ ⎟
⎜ x x
X = (x1 x2 x3 · · · xn ) = ⎜ 31 32 33x · · · x 3n ⎟ . (19.25)
⎟
⎜ .. .. .. . . .. ⎟
⎝ . . . . . ⎠
xn1 xn2 xn3 · · · xnn
Entonces
AX = (Ax1 Ax2 Ax3 · · · Axn )

= (λ1 x1 λ2 x2 λ3 x3 · · · λn xn )
= XD , (19.26)
donde D es la matriz diagonal cuyos elementos diagonales son los autovalores de A,

⎛ ⎞
λ1 0 0 · · · 0
⎜ 0 λ 0 ··· 0 ⎟
⎜ 2 ⎟
⎜ ⎟
D=⎜ ⎜ 0 0 λ · · · 0 ⎟. (19.27)
⎟
3
⎜ .. .. .. . . .. ⎟
⎝ . . . . . ⎠
0 0 0 · · · λn
19.3. Diagonalización de matrices 491
EJEMPLO 19.10 Los autovectores de la matriz (Ejemplo 19.2)

⎛ ⎞
−2 1 1
A = ⎝−11 4 5 ⎠
−1 1 0
son ⎛ ⎞ ⎛⎞ ⎛⎞
1 0 1
x1 = ⎝ 2 ⎠ , x2 = ⎝ 1 ⎠ , x3 = ⎝ 3 ⎠
1 −1 1
asociados a los autovalores λ1 = 1, λ2 = −1, λ3 = 2. Entonces
⎛ ⎞
1 0 1
X = x1 x2 x3 = ⎝ 2 1 3 ⎠
1 −1 1
y
⎛ ⎞⎛ ⎞ ⎛ ⎞
−2 1 1 1 0 1 1 0 2
AX = ⎝−11 4 5 ⎠⎝ 2 1 3 ⎠ = ⎝ 2 −1 6 ⎠
−1 1 0 1 −1 1 1 1 2
⎛ ⎞⎛ ⎞
1 0 1 1 0 0
= ⎝ 2 1 3 ⎠⎝ 0 −1 0 ⎠
1 −1 1 0 0 2
⎛ ⎞⎛ ⎞
1 0 1 λ1 0 0
= ⎝ 2 1 3 ⎠⎝ 0 λ2 0 ⎠ = XD ,
1 −1 1 0 0 λ3
siendo D la matriz diagonal de los autovalores.
Si la matriz X de los autovectores de A es no singular, premultiplicando ambos miembros

de la ecuación (19.26) por la matriz inversa X−1 tenemos
D = X−1 AX , (19.28)
y hemos reducido A a la forma diagonal D.
EJEMPLO 19.11 Diagonalización
La inversa de la matriz X de los autovectores de A del Ejemplo 19.10 es

⎛ ⎞
4 −1 −1
X−1 = ⎝ 1 0 −1 ⎠
−3 1 1
de manera que
⎛ ⎞⎛ ⎞⎛ ⎞ ⎛ ⎞
4 −1 −1 −2 1 1 1 0 1 1 0 0
X−1 AX = ⎝ 1 0 −1 ⎠ ⎝−11 4 5 ⎠ ⎝ 2 1 3 ⎠ = ⎝ 0 −1 0 ⎠ = D .
−3 1 1 −1 1 0 1 −1 1 0 0 2
Transformaciones de semejanza
Dos matrices cuadradas A y B se dicen matrices semejantes si están relacionadas

por la transformación de semejanza2
B = C−1 AC , (19.29)
siendo C una matriz no singular. La ecuación (19.28) es por lo tanto una transformación
de semejanza que reduce A a forma diagonal. Si A es simétrica, los autovectores de A
son ortonormales, por el teorema (19.23), y X en (19.28) es una matriz ortogonal, con
X−1 = XT . Por lo tanto, una matriz simétrica se reduce a forma diagonal mediante la
transformación ortogonal
D = XT AX . (19.30)
De las ecuaciones (18.38) a (18.40) se deducen dos importantes propiedades de invarian-

cia de las transformaciones de semejanza para el determinante y la traza de un producto
matricial: si B = C−1 AC, entonces
det B = det A invariancia del determinante, (19.31)

tr B = tr A invariancia de la traza. (19.32)
Por ejemplo,

det B = det C−1 AC = det ACC−1 = det (AI) = det A .
Se deduce de estas propiedades de invariancia que para una matriz cuadrada A,
1. La traza de A es igual a la suma de los autovalores de A:

n
λk = tr A . (19.33)
k=1
2. El determinante de A es igual al producto de los autovalores de A:

n
λk = det A (19.34)
k=1
(el determinante de una matriz diagonal es el producto de los elementos diagonales).
02. En su monografı́a sobre la teorı́a de matrices de 1878, Frobenius definió las matrices semejantes,
estudió las propiedades de las matrices y de las transformaciones ortogonales, y demostró la relación entre
las álgebras de matrices y de cuaterniones al determinar cuatro matrices 2 × 2 cuya álgebra es la de los
cuaterniones 1, i, j, k.
19.4. Formas cuadráticas 493
EJEMPLO 19.12 Para las matrices A y D del Ejemplo 19.11,
Traza: tr A = −2 + 4 + 0 = 2 , tr D = 1 − 1 + 2 = 2 .

4 5 −11 5 −11 4
Determinante: det A = −2 − + = 10 − 5 − 7 = −2 ,
1 0 −1 0 −1 1
det D = 1 × (– 1) × 2 = −2 .
19.4. Formas cuadráticas
Una forma cuadrática es un polinomio de segundo grado en un conjunto de variables.

Algunos ejemplos son
x2 + y2 , 3x2 − 4xy + 2y2 , x12 + 2x1 x2 + 3x2 x3 − x22 + 3x32 .
La expresión general de una forma cuadrática (real) en dos variables es
Q(x, y) = ax2 + 2bxy + cy2 (19.35)
donde los coeficientes a, b y c son números reales. Esto puede escribirse en forma ma-
tricial como

a b x
Q(x) = (x y) b c y = x Ax ,
T
(19.36)
siendo A la matriz real y simétrica de los coeficientes, y x el vector cuyos elementos son
las variables x e y.
EJEMPLO 19.13 Compruebe que

3 1 x
Q = 3x2 + 2xy + y2 = x y .
1 1 y

3 1 x 3x + y
Tenemos = y
1 1 y x+y

3x + y
Q= x y = x(3x + y) + y(x + y) = 3x2 + 2xy + y2 .
x+y
La expresión general de una forma cuadrática en n variables es

n

n
Q(x1 , x2 , x3 , . . . , xn ) = aij xi xj
i=1 j=1
= a11 x12 + a12 x1 x2 + a13 x1 x3 + · · · + a1n x1 xn

+ a21 x2 x1 + a22 x22 + a23 x2 x3 + · · · + a2n x2 xn
+ ···
+ an1 xn x1 + an2 xn x2 + an3 xn x3 + · · · + ann xn2 (19.37)
donde los coeficientes aij son reales y aji = aij . En forma matricial
Q(x) = xT Ax , (19.38)
siendo
⎛ ⎞ ⎛ ⎞
x1 a11 a12 a13 · · · a1n
⎜ ⎟ ⎜ · · · a2n ⎟
⎜ x2 ⎟ ⎜ a21 a22 a23 ⎟
⎜ ⎟ ⎜ · · · a3n ⎟
x=⎜
⎜
x3 ⎟,
⎟ A=⎜
⎜
a31 a32 a33 ⎟,
⎟ (19.39)
⎜ .. ⎟ ⎜ .. .. .. .. . ⎟
⎝ . ⎠ ⎝ . . . . .. ⎠
xn an1 an2 an3 · · · ann
y A real y simétrica.
Forma canónica
Hemos visto (ecuación (19.30)) que una matriz simétrica A se reduce a forma dia-
gonal mediante la transformación de semejanza XT AX, donde X es la matriz ortogonal
cuyas columnas son los autovectores ortonormales de A. Dado que XXT = I (para una
matriz ortogonal X), podemos escribir (19.38) como
Q = xT (XXT ) A (XXT ) x
= (xT X) (XT AX) (XT x)
= yT Dy , (19.40)
donde D = XT AX es la matriz diagonal de los autovalores de A, y donde
y = XT x (19.41)
es el vector que se obtiene a partir de x con la transformación ortogonal XT .

La forma cuadrática Q en las n variables x1 , x2 , x3 , . . . , xn se transforma en una forma
equivalente en las n variables y1 , y2 , y3 , . . . , yn que sólo tiene términos cuadráticos puros:

n
Q(y) = λk y2k = λ1 y21 + λ2 y22 + λ3 y23 + · · · + λn y2n . (19.42)

k=1
19.4. Formas cuadráticas 495
Ésta es la forma canónica de Q, y las variables yk son las variables canónicas.3
EJEMPLO 19.14 Transforme la siguiente forma cuadrática a forma canónica:
Q = 5x12 + 8x1 x2 + 5x22 .
Tenemos que

5 4 x1
Q= x 1 x2 = xT Ax
4 5 x2
y que los autovectores ortonormales de la matriz simétrica A son

1 1 1 1
√ y √ ,
2 −1 2 1
asociados a los autovalores λ1 = 1 y λ2 = 9. Si

1 1 1
X= √ ,
2 −1 1
entonces ⎛ ⎞

√
1
(x
1 − x2 )
1 0 ⎜ 2 ⎟ y1
D = XT AX = ⎜
y=Xx=⎝ ⎟
⎠=
T
, ,
0 9 1 y2
√ (x1 + x2 )
2
y
Q = yT Dy = y21 + 9y22 .
La transformación de una forma cuadrática a forma canónica se llama también transfor-

mación a ejes principales, y tiene múltiples aplicaciones en geometrı́a y en las ciencias
fı́sicas. Por ejemplo, la forma cuadrática del Ejemplo 19.14,
Q = 5x12 + 8x1 x2 + 5x22 ,
representa una familia de elipses en el plano x1 x2 para valores de Q positivos. En la

Figura 19.2(a) se representa la elipse para Q = 9.
Los ejes principales de la elipse están situados a 45◦ de los ejes x1 y x2 , y la transfor-
mación a la forma canónica
Q = y21 + 9y22
03. Cayley y Sylvester desarrollaron la teorı́a de las formas entre 1854 y 1878. Sylvester afirmaba
haber descubierto y desarrollado la reducción de una forma cuadrática a forma canónica en una sesión ‘con
una frasca de vino de Oporto para confortar los ánimos de una naturaleza desfallecida’. Camille Jordan
(1838-1922) hizo el estudio general de las formas canónicas en su Traité des substitutions et des équations
algébriques (Tratado sobre las sustituciones y las ecuaciones algebraicas) de 1871, en el cual presentaba
muchos de los conceptos modernos de la teorı́a de grupos en el contexto de los grupos de permutaciones
(sustituciones).
corresponde por lo tanto a una rotación del sistema de coordenadas, desde (x1 , x2 ) a
(y1 , y2 ), que hace coincidir los ejes coordenados con los ejes principales de la elipse,
como se muestra en la Figura 19.2(b) para Q = 9.
45
Figura 19.2
EJEMPLO 19.15 Tensor de inercia
Un cuerpo que gira con velocidad ω = (ωx , ωy , ωz ) en torno a un eje que pasa por su centro de masas tiene
una energı́a cinética de rotación dada por la forma cuadrática
⎛ ⎞⎛ ⎞
Ixx Ixy Ixz ωx
1 T 1 ⎜ ⎟⎜ ⎟
T = ω Iω = ωx ωy ωz ⎝ Iyx Iyy Iyz ⎠ ⎝ ωy ⎠ , (19.43)
2 2
Izx Izy Izz ωz
donde la matriz simétrica I (a no confundir con la matriz identidad) se llama tensor del momento de
inercia o, sencillamente, tensor de inercia. Por ejemplo, una masa m situada en la posición (x, y, z) tiene
un tensor del momento de inercia con componentes (véase el Ejercicio 20)

Ixx = m y2 + z2 , Iyy = m z2 + x2 , Izz = m x2 + y2 ,
Ixy = −mxy , Iyz = −myz , Izx = −mzx. (19.44)
Una transformación a los ejes principales es una transformación de (x, y, z) a (x , y , z ) que hace coincidir
los ejes coordenados con los ejes principales de inercia del cuerpo. El tensor de inercia es diagonal en el
nuevo sistema de coordenadas, y la energı́a cinética de rotación es
⎛ ⎞⎛ ⎞
Ix x 0 0 ωx
1 ⎜ ⎟⎜ ⎟
T = ωx ωy ωz ⎝ 0 Iy y 0 ⎠ ⎝ ωy ⎠
2
0 0 Iz z ωz
1 1 1
= Ix x ω2x + Iy y ω2y + Iz z ω2z (19.45)
2 2 2
y es la suma de las contribuciones de las rotaciones en torno a los ejes x , y y z .
Momento angular
El momento angular de un cuerpo que gira está en relación con la velocidad angular a través de (véase
el Ejemplo 16.16)
l = Iω (19.46)
19.5. Matrices complejas 497
o, en componentes,
lx = Ixx ωx + Ixy ωy + Ixz ωz ,
ly = Iyx ωx + Iyy ωy + Iyz ωz , (19.47)
lz = Izx ωx + Izy ωy + Izz ωz .
Si los ejes coordenados coinciden con los ejes principales de inercia, I es diagonal y las ecuaciones (19.47)
se reducen a
lx = Ixx ωx , ly = Iyy ωy , lz = Izz ωz . (19.48)
La energı́a cinética de rotación tiene entonces el aspecto familiar
l2x l2y l2
T= + + z (19.49)
2Ixx 2Iyy 2Izz
que se utiliza en consideraciones teóricas en espectroscopia de microondas en moléculas poliatómicas.
19.5. Matrices complejas
Mucho de lo que hemos tratado antes se aplica tanto a las matrices complejas como
a las matrices reales y en este apartado resumimos las propiedades más importantes de
las matrices complejas y sus diferencias con las de las matrices reales.
Una matriz A cuyos elementos son números complejos se llama matriz compleja, y
puede escribirse en la forma
A = B + iC (19.50)
√
donde i = −1, y B y C son matrices reales.
Matriz compleja conjugada A∗
La matriz compleja conjugada A∗ se obtiene a partir de A sustituyendo cada elemento

de A por su complejo conjugado:

si A = aij , entonces A∗ = a∗ij , (19.51)
A∗ = B − iC . (19.52)
En el caso de una matriz real, A∗ = A y C = 0.
Matriz conjugada hermı́tica A†
La matriz conjugada hermı́tica de A es la transpuesta de la compleja conjugada,
A† = (A∗ ) = (AT )∗ .
T
(19.53)
Ası́, para orden 3,

⎛ ⎞ ⎛ ⎞
a11 a12 a13 a∗11 a∗21 a∗31
si A = ⎝ a21 a22 a23 ⎠ , entonces A† = ⎝ a∗12 a∗22 a∗32 ⎠ .
a31 a32 a33 a∗13 a∗23 a∗33
La conjugada hermı́tica se llama también matriz transpuesta conjugada, matriz aso-

ciada y (en mecánica cuántica) matriz adjunta (a no confundir con la matriz de mismo
nombre que vimos en el apartado 18.4).
EJEMPLO 19.16 Halle la conjugada hermı́tica de la matriz

3 + i 2 + 3i −1
A= .
1 − 2i 2 2i
La compleja conjugada A∗ y la conjugada hermı́tica A† son

⎛ ⎞

3 − i 1 + 2i
3 − i 2 − 3i −1
∗
A = , A = ⎝ 2 − 3i
†
2 ⎠.
1 + 2i 2 −2i
−1 −2i
La conjugada hermı́tica juega para las matrices complejas el mismo papel que juega la
transpuesta para las matrices reales. Por ejemplo, el producto interno (escalar) de dos
vectores complejos a = (a1 , a2 , a3 ) y b = (b1 , b2 , b3 ) se define como (compárese con la
ecuación (18.62))

b1
a · b = a b = (a a a )
† ∗
1
∗
2
∗
3 b2 = a∗1 b1 + a∗2 b2 + a∗3 b3 . (19.54)
b3
El producto interno es en general complejo, siendo b† a = (a† b)∗ = a† b. Sin embargo la

cantidad

a1
a · a = a† a = (a∗1 a∗2 a∗3 ) a2 = a∗1 a1 + a∗2 a2 + a∗3 a3
a3
= |a1 |2 + |a2 |2 + |a3 |2 (19.55)
√
es un número real positivo, y define la longitud o norma del vector, |a| = a† a.
EJEMPLO 19.17 Para los vectores a = (1 + i, 3, 2i) y b = (2 − i, 4i, −1),

⎞ ⎛
1+i

†
a a= 1−i 3 −2i ⎝ 3 ⎠ = (1 − i)(1 + i) + 32 + (– 2i)(2i) = 2 + 9 + 4 = 15 ,
2i
19.5. Matrices complejas 499
⎞ ⎛
2−i
b b = 2 + i −4i −1 ⎝ 4i ⎠ = (2 + i)(2 − i) + (– 4i)(4i) + 1 = 5 + 16 + 1 = 22 ,
†
−1
⎛ ⎞
2−i
†
a b= 1−i 3 −2i ⎝ 4i ⎠ = (1 − i)(2 − i) + 3(4i) + (– 2i)(– 1) = 1 + 11i .
−1
Dos vectores son ortogonales si su producto interno es cero: a† b = 0.
Matrices hermı́ticas
Una matriz cuadrada compleja que es igual a su conjugada hermı́tica se llama matriz
hermı́tica,
A† = A (matriz hermı́tica). (19.56)
Una matriz hermı́tica real es una matriz simétrica.
EJEMPLO 19.18 Demuestre que la siguiente matriz es hermı́tica:

3 2 + 3i
A= .
2 − 3i 1
Tenemos que

3 2 − 3i 3 2 + 3i
A∗ = A† = (A∗ ) = = A.
T
,
2 + 3i 1 2 − 3i 1
Matrices unitarias
Una matriz cuadrada compleja U se dice unitaria si su conjugada hermı́tica es igual

a su inversa,
U† = U−1 . (19.57)
La propiedad caracterı́stica de una matriz unitaria es que sus columnas (y sus filas) for-
man un sistema de vectores ortonormales (compárese con lo visto para las matrices or-
togonales en el Apartado 18.6). Sea, para orden 3,
⎛ ⎞
a1 b1 c1
U = (a b c) = ⎝ a2 b2 c2 ⎠ (19.58)
a3 b3 c3
con a† a = b† b = c† c = 1 y a† b = b† c = c† a = 0. La conjugada hermı́tica de U es

⎛ ⎞ ⎛ ∗ ∗ ∗ ⎞
a† a 1 a2 a3
U† = ⎝ b† ⎠ = ⎝ b∗1 b∗2 b∗3 ⎠ (19.59)
c† c∗1 c∗2 c∗3
y
⎛ ⎞ ⎛ † ⎞ ⎛ ⎞
a† a a a† b a† c 1 0 0
U† U = ⎝ b† ⎠ (a b c) = ⎝ b† a b† b b† c ⎠ = ⎝ 0 1 0 ⎠ = I . (19.60)
c† c† a c† b c† c 0 0 1
Una matriz unitaria real es una matriz ortogonal. Las matrices hermı́ticas y las unitarias
juegan para las matrices complejas los mismos papeles que tienen las matrices ortogona-
les y las simétricas para las matrices reales, y tienen las mismas propiedades importantes:
(i) Los autovalores de una matriz hermı́tica son reales.

(ii) Los autovectores de una matriz hermı́tica de orden n forman (o pueden escogerse
de manera que formen) un sistema de n vectores ortogonales.
(iii) Una matriz hermı́tica A se reduce a forma diagonal por medio de la transformación
(unitaria) de semejanza
D = U† AU , (19.61)
siendo U la matriz unitaria cuyas columnas son los autovectores de A, y D la matriz

diagonal real cuyos elementos diagonales son los autovalores de A.
19.6. Ejercicios
Apartado 19.1
Halle la inversa de la matriz de los coeficientes y úsela para resolver las ecuaciones:
1. 2x − 3y = 8 2. x + y + z= 6 3. w + x + z= 2
4x + y = 2 x + 2y + 3z = 14 x + y + z= 6
x + 4y + 9z = 36 w + y + z= 3
w + x + y = 4
Apartado 19.2
Halle los autovalores y los autovectores normalizados para las siguientes matrices:

3 1 2 2 2 0 2 −1
4. 5. 6. 7.
1 3 1 3 0 −3 0 3
⎛ ⎞ ⎛ ⎞

1 2 0 0 2 0
2 1 ⎝ 2 1 0 ⎠ ⎝ 2 0 2 ⎠
8. 9. 10.
−1 4
0 2 1 0 2 0
11. Demuestre que los conjuntos de autovectores de las matrices simétricas del Ejercicio 4 y del ejercicio
10 son conjuntos de vectores ortogonales.
12. La matriz de Hückel para el butadieno es

⎛ ⎞
α β 0 0
⎜ β α β 0 ⎟
⎝ 0 .
β α β ⎠
0 0 β α
Halle los autovalores (en función de α y β) y los autovectores normalizados. Demuestre que los autovectores
son ortogonales.
13. (i) Demuestre que los autovalores de la matriz de Hückel

⎛ ⎞
α β β
⎝ β α β ⎠
β β α
para el ciclopropeno son λ1 = α + 2β, λ2 = λ3 = α − β.
(ii) Halle el autovector normalizado asociado a λ1 .
(iii) Demuestre que un autovector asociado al autovalor α − β tiene componentes x1 , x2 , x3 que cumplen
x1 + x2 + x3 = 0.
(iv) Halle dos autovectores ortonormales asociados al autovalor α − β.
14. (i) Demuestre que una matriz A y su transpuesta AT tienen el mismo conjunto de autovalores, y halle
los autovalores de

3 2
A= .
0 2
(ii) Demuestre que las dos ecuaciones siguientes son equivalentes:
AT y = λy , yT A = λyT .
Los autovectores de AT son en general diferentes de los de A, salvo si A es una matriz simétrica. El vector
yT se llama a veces autovector por la izquierda de A, y un autovector ‘ordinario’ de A se llama entonces
autovector por la derecha.
(iii) Halle los autovectores normalizados por la derecha y por la izquierda de

3 2
A= .
0 2

3 1
15. (i) Construya la matriz X que reduce la matriz A = del Ejercicio 4 a forma diagonal me-
1 3
−1
diante la transformación de semejanza D = X AX.
(ii) Compruebe que D es diagonal y que los elementos diagonales de D son los auto-valores de A.
(iii) Compruebe que det D = det A y que tr D = tr A.
Repita el Ejercicio 15 para: ⎛ ⎞

1 2 0
2 2
16. A = del Ejercicio 5 17. A = ⎝ 2 1 0 ⎠ del Ejercicio 9
1 3
0 2 1
⎛ ⎞
0 2 0
18. A = ⎝ 2 0 2 ⎠ del Ejercicio 10
0 2 0
19. Transforme la forma cuadrática

√
Q = 7x12 + 6 3x1 x2 + 13x22
a forma canónica. Interprete el resultado geométricamente.
20. Deduzca las ecuaciones (19.44) para las componentes del tensor de inercia.
[Sugerencia: desarrolle la ecuación (16.60), l = mr2ω − m(r · ω )r, para el momento angular en función de
sus componentes.]
Apartado 19.5
Halle la compleja conjugada y la conjugada hermı́tica de las siguientes matrices. Indique cuáles son hermı́ti-
cas: ⎛ ⎞

0 −i 0
1+i 2−i 2 i
21. 22. 23. ⎝ i 0 −i ⎠
3 + i −i −i 1
0 i 0
⎛ ⎞ ⎛ ⎞
i 2i
24. Si a = ⎝ 1 ⎠ y b = ⎝ 0 ⎠, halle (i) a† a (ii) b† b (iii) a† b (iv) b† a
−i 3

1 1 i
25. (i) Demuestre que A = √ es a la vez hermı́tica y unitaria.
2 −i −1
(ii) Halle los autovalores y los autovectores de A.
(iii) Compruebe que los autovectores son ortogonales.

Métodos numéricos
20.1. Conceptos
Un método numérico es un método para obtener la solución de un problema mate-

mático en forma de números. En muchos casos el problema puede resolverse de manera
‘exacta’ mediante funciones conocidas por medio de los métodos analı́ticos presentados
en los capı́tulos anteriores de este libro. Los métodos numéricos son entonces necesarios
si se precisa una solución en forma numérica. Muchos otros problemas, por otra parte, no
pueden resolverse analı́ticamente y los métodos numéricos son necesarios para el propio
proceso de resolución. Como los métodos numéricos se implementan normalmente en
un ordenador, a veces se los define como ‘métodos para resolver problemas con ordena-
dor’. El desarrollo de los ordenadores en los últimos treinta años ha ido acompañado del
desarrollo de sofisticados procedimientos numéricos para resolver una amplia variedad
de problemas en las ciencias fı́sicas, en ingenierı́a y en estadı́stica. Esos procedimiento
se han agrupado en ‘bibliotecas matemáticas’ o ‘paquetes numéricos’, accesibles en la
mayorı́a de los ordenadores estándar. En este capı́tulo presentamos los principios gene-
rales que subyacen en algunos de los métodos numéricos más importantes y tratamos
con detalle únicamente los más sencillos de todos.
Casi todas las operaciones numéricas están acompañadas invevitablemente de errores
y el análisis de esos errores es una parte integral de todo método numérico.
20.2. Errores
En los cálculos numéricos los errores surgen principalmente de tres maneras.
1. Equivocaciones. Se incluyen aquı́ los errores de cálculo al operar o los errores de

código en un programa de ordenador. Estos errores se pueden eliminar, en princi-
pio, revisando. En las ciencias experimentales aparecen también errores evitables
por la utilización de aparatos defectuosos o mal calibrados. En análisis numérico
las equivocaciones no se consideran errores.
2. Errores matemáticos de truncación. Se deben al uso de representaciones apro-
ximadas de funciones. Por ejemplo, como vimos en el Apartado 7.7, cuando un
desarrollo en serie de Taylor se trunca tras un número de términos dado. El teore-
ma de Taylor proporciona entonces un método para determinar las cotas de error
del resultado.
504 Capı́tulo 20. Métodos numéricos
Muchos métodos numéricos tienen su origen en desarrollos de Taylor y vienen

acompañados inevitablemente de errores de truncación; los métodos numéricos
son métodos aproximados.
3. Errores de redondeo. Como vimos en el Apartado 1.3, los números casi siempre
se aproximan en la práctica por redondeo, ya sea a un cierto número de cifras deci-
males en representación de coma fija, o a un cierto número de cifras significativas
en representación de coma flotante. En este apartado consideramos las consecuen-
cias de este tipo de error.
Por las reglas del redondeo (Apartado 1.3) un número como a = 1,234 obtenido al
redondear a tres cifras decimales, representa todos los números entre 1,2335 y 1,2345.
Se dice que el número a tiene un error absoluto máximo o cota (superior) de error a =
0,0005, y la cota puede indicarse escribiendo
a ± a = 1,2340 ± 0,0005 .
En aritmética de punto fijo todos los números se redondean al mismo número de cifras
decimales, y por lo tanto tienen la misma cota de error, digamos que . La suma o la resta
de dos números tiene entonces una cota de error 2. En general, la suma o la resta de los
números a y b, con cotas de error a y b , tiene como cota de error a + b .
EJEMPLO 20.1 Propagación de errores en la suma y la resta

Los números a = 1,234 y b = 3,468 han sido redondeados a 4 cifras significativas. Determine la cota de
error para a − b.
La cota de error para los dos números a y b es = 0,0005. Los mayores y menores valores posibles de
a − b son por lo tanto
(a + ) − (b − ) = (a − b) + 2 o bien 1,2345 − 3,4675 = −2,2330 = −2,234 + 0,001 ,
(a − ) − (b + ) = (a − b) − 2 o bien 1,2335 − 3,4685 = −2,2350 = −2,234 − 0,001 ,

y la cota de error de la resta es 2 = 0,001.
La propagación del error para la multiplicación y la división se describe mejor usando el

error relativo. Un número cuyo valor viene dado por a y cuyo valor exacto es ae tiene
un error relativo

a − ae

ra = = a . (20.1)
ae |ae |
Si el error es suficientemente pequeño, se puede sustituir en el denominador ae por a y

(20.1) por ra = a /|a|. El error relativo del producto o del cociente de a y b, con errores
relativos ra y rb , es entonces ra + rb . Ası́, para la multiplicación, los mayores y menores
valores posibles de p = a × b son
(a + a ) (b + b ) = ab + ab + ba + a b ,
20.2. Errores 505
(a − a ) (b − b ) = ab − ab − ba + a b .
La cantidad a b puede despreciarse para errores suficientemente pequeños, y la cota de

error del producto es p = ab + ba . Dividiendo por p = ab tenemos entonces
p a b
rp = = + = ra + rb . (20.2)
p a b
De manera similar para la división.
EJEMPLO 20.2 Si a = 12,35 y b = 2,345 han sido redondeados a 4 cifras, determine las cotas de error
de q = a/b.
Tenemos que 12,35/2,345 = 5,26652 (con seis cifras). Las cotas de error para a son a = 0,005 y ra =
a /a ≈ 0,0004, y para b b = 0,0005 y rb = b /b ≈ 0,0002. Suponemos entonces que el cociente tiene
rq ≈ 0,0006. Por lo tanto, los mayores y menores valores del cociente son (dando los resultados con 6 cifras)
12,355 12,345
= 5,26978 = 5,26652 + 0,00326 , = 5,26327 = 5,26652 − 0,00325 .
2,3445 2,3455
Tenemos entonces rq ≈ 0,0033/5,26652 ≈ 0,0006, como era de esperar de la ecuación (20.2). Esto es el
error relativo para el producto sin redondear.
El resultado puede escribirse como 5,2665 ± 0,0033.
Las cotas calculadas de la manera anterior son ejemplos de errores extremos. En la

práctica, en particular cuando se usa aritmética en coma flotante, suele haber casi siem-
pre una compensación entre los errores y se supone que los resultados de varias opera-
ciones aritméticas seguidas tienen errores reales menores. Los errores de redondeo son
un ejemplo de ‘errores aleatorios’, que trataremos en el Capı́tulo 21 y que están sujetos
al análisis estadı́stico.
Errores al restar
Los errores más graves, con diferencia, que surgen del uso de números redondeados
aparecen al restar dos números casi iguales. Ası́ por ejemplo, para a = 1,234 y b = 1,233
tenemos, redondeando a 4 cifras, a − b = 0,001 con una cota de error 0,001 (a − b =
= 0,001 ± 0,001). A menudo, sin embargo, los errores al restar se pueden minimizar
utilizando un procedimiento numérico (algoritmo) adecuado.
EJEMPLO 20.3 Halle las soluciones de la ecuación cuadrática

x2 − 36x + 2 = 0
empleando aritmética con 4 cifras.
Las soluciones de la ecuación cuadrática general ax2 + bx + c = 0 son

b b
2 c b b
2 c
x1 = − + − , x2 = − − − ,
2a 2a a 2a 2a a
de manera que en el presente caso

√
x1 = 18 + 322 = 18,00 + 17,94 = 35,94 ,
√
x2 = 18 − 322 = 18,00 − 17,94 = 0,06 ,
y x2 sólo tiene una cifra significativa.
Sin embargo, como las raı́ces de una ecuación cuadrática cumplen la propiedad x1 x2 = c/a, tenemos que
una fórmula alternativa para la segunda raı́z es x2 = c/x1 a,
2,000
x2 = = 0,05565 ,
35,94
con un error de 1 en la última cifra significativa.
Este ejemplo muestra que el procedimiento correcto para resolver una ecuación cuadráti-
ca es, independientemente de las cifras significativas usadas,
2
b b c c
si b < 0, entonces x1 = − + − , x2 = ,
2a 2a a x1 a
2 (20.3)
b b c c
si b > 0, entonces x1 = − − − , x2 = .
2a 2a a x1 a
De esta manera se minimizan los errores al restar.

En la Tabla 20.1 se muestran algunos resultados obtenidos para la función
1 − cos x
f (x) = (20.4)
x2
con una calculadora normal de 10 dı́gitos.
Un procedimiento alternativo, y correcto, para eliminar los errores de la diferencia es
utilizar el desarrollo de la función en serie de MacLaurin truncada,
1 − cos x 1 x2 x4
≈ − + para |x| ≤ 0,1 (20.5)
x2 2! 4! 6!
que tiene, por el teorema de Taylor, una cota de error de 2,5 × 10−11 para |x| ≤ 0,1.
Tabla 20.1 Valores de (20.4) con

una calculadora de 10 dı́gitos
x f (x) calculada f (x) exacta
0,1 0,4995 8346 3 0,4995 8347 22

0,01 0,4999 95 0,4999 9583 33
0,001 0,4999 0,4999 9995 83
0,0001 0,49 0,4999 9999 96
0,00001 0 0,5000 0000 00
20.3. Resolución de ecuaciones ordinarias 507
20.3. Resolución de ecuaciones ordinarias
Una ecuación ordinaria (una ecuación que no implica derivadas ni integrales) en una
variable puede ponerse en la forma
f (x) = 0 , (20.6)
donde f (x) es una función de x. Las soluciones de la ecuación son aquellos valores de x
para los cuales se cumple (20.6): los ceros de la función f (x). Por ejemplo, una ecuación
cuadrática es un caso particular de una ecuación algebraica (polinómica)
f (x) = a0 + a1 x + a2 x2 + · · · + an xn = 0 (20.7)
cuyas soluciones son las raı́ces del polinomio. En el Capı́tulo 2 vimos la expresión ge-
neral de las raı́ces de las funciones cuadráticas pero, aunque existen expresiones exactas
para las raı́ces de ecuaciones cúbicas y cuárticas, una ecuación algebraica general tiene
que ser resuelta numéricamente. Igualmente, las soluciones de ecuaciones trascendentes
(las que incluyen funciones trascendentes) como por ejemplo
e−x = tg x o f (x) = e−x − tg x = 0 (20.8)
no pueden normalmente escribirse mediante un número finito de funciones conocidas y

la ecuación tiene que ser resuelta numéricamente.
Todos los métodos numéricos de resolución de ecuaciones avanzan por iteración de
manera que, dada una solución aproximada inicial, llamémosla x0 , existe un algoritmo
que a partir de x0 da una nueva solución x1 , que confiamos sea más precisa. El mismo
algoritmo se aplica entonces a x1 para obtener x2 , etcétera:
algoritmo
xn −−−−−−−→ xn+1 , n = 0, 1, 2, 3 . . . (20.9)
numérico
El proceso iterativo termina si se consigue una precisión dada, por ejemplo si la variación
|xn+1 − xn | es menor que un valor fijado de antemano. El éxito de un método numérico
depende a menudo de una buena elección de la aproximación inicial, pero esto se puede
conseguir normalmente a partir de la gráfica o de los valores tabulados de la función.
Vamos a considerar aquı́ dos métodos sencillos muy usados, y que además sirven de
base para métodos más sofisticados. Señalamos que los métodos para ecuaciones en una
variable se pueden generalizar a varias variables y, a veces, a sistemas de ecuaciones
simultáneas.
Método de bisección
El punto de partida de este antiguo método son dos valores de x en los cuales se sabe
que la función está en lados opuestos de cero. Supongamos que f (x1 ) < 0 y f (x2 ) > 0,
Figura 20.1
como en la Figura 20.1, y supongamos que la función es continua en el intervalo de x1 a

x2 . Evaluamos la función en el centro del intervalo,
1
x3 = (x1 + x2 ) . (20.10)
2
Entonces, si f (x3 ) > 0, el cero está entre x1 y x3 como en la figura, y se repite el proceso
para el intervalo de x1 a x3 , y ası́ sucesivamente.
√
EJEMPLO 20.4 Método de bisección para 5
√
Para hallar 5, planteamos f (x) = x2 − 5 = 0.
La raı́z está entre x< = 2 y x> = 3, siendo f (x< ) = −1 y f (x> ) = 4. Con esto x3 = (x< + x> )/2 = 2,5.
En la Tabla 20.2 se muestran los cálculos con 4 cifras significativas hechos con una calculadora estándar.
Tabla 20.2 Raı́z cuadrada de 5 con 4 cifras

n 0 1 2 3 4 5
x< 2 2 2 2,125 2,1875 2,21875

x> 3 2,5 2,25 2,25 2,25 2,25
1
(x + x> )
2 <
2,5 2,25 2,125 2,1875 2,21875 2,23438
n 6 7 8 9 10 11
x< 2,23438 2,23438 2,23438 2,23438 2,23535 2,23584

x> 2,25 2,24219 2,23828 2,23633 2,23633 2,23633
1
(x + x> )
2 <
2,24219 2,23828 2,23633 2,23535 2,23584
Tras 10 iteraciones los valores de x< y x> redondeados a cuatro cifras son ambos 2,236, y este es el valor
pedido (2,2362 = 4,999696).
El método de bisección es un ejemplo de un método de encajonado, donde se sabe que

el cero está en un intervalo de longitud decreciente. En este caso, la longitud del intervalo
20.3. Resolución de ecuaciones ordinarias 509
se reduce a la mitad con cada iteración. La convergencia es lenta, pero el método no

puede fallar. Es el último método al que recurrir cuando todo el resto falla.
Método de Newton–Raphson
El método de Newton–Raphson, también llamado sencillamente método de Newton,

es el método más famoso para hallar los ceros de una función.1 A diferencia del método
de bisección, necesita que se evalue la derivada f (x) además de la propia función f (x).
Ilustramos el método en la Figura 20.2.
Dada una solución aproximada de f (x) = 0, x0 , se prolonga la tangente a la curva
en x0 hasta que corte el eje x, en un punto x1 . La
pendiente de la tangente es
f (x0 )
f (x0 ) = (20.11)
x0 − x1
de manera que
f (x0 )
x1 = x0 − . (20.12)
f (x0 )
Se toma entonces x1 como la nueva estimación del

cero. Se repite el proceso sustituyendo x0 por x1 y
se obtiene x2 , y ası́ sucesivamente: Figura 20.2
f (xn )
xn+1 = xn − , n = 0, 1, 2, 3, . . . (20.13)
f (xn )
√
EJEMPLO 20.5 Método de Newton–Raphson para 5
√
Para hallar 5, planteamos f (x) = x2 − 5 = 0. Tenemos entonces que f (x) = 2x, de manera que la
expresión de Newton–Raphson (20.13) es
xn2 − 5
xn+1 = xn − .
2xn
01. Los métodos de resolución de ecuaciones tienen sus orı́genes en la determinación de raı́ces cua-
dradas y cúbicas por los babilonios y los chinos. El capı́tulo 4 del Jiuzhang suanshu (Nueve capı́tulos sobre
el arte matemático) de comienzos de la dinastı́a Han, hacia 200 a.C., describe un método para hallar raı́ces
cuadradas que es similar al método de Newton. Jia Xian generalizó el método a la resolución de ecuaciones
polinómicas en el siglo XI (también describió cómo construir el triángulo de Pascal y sus aplicaciones), y la
primera reseña detallada apareció en el Shuchu jiuzhang (Tratado matemático en nueve apartados) de 1247
por Qin Jiushao (hacia 1202–1261). El método de Newton, descrito en el Methodus fluxionum de 1671 pero
no publicado hasta 1736, es básicamente el método chino para polinomios. Joseph Raphson (1648–1715),
que “era una de las pocas personas a las que Newton permitı́a ver sus trabajos matemáticos”, publicó el
método en 1690.
En la Tabla 20.3 se muestran los cálculos en una caluladora estándar de 10 dı́gitos usando todas las
cifras, empezando con x0 = 3.
Tabla 20.3 Raı́z cuadrada de 5
n xn f (xn )/f (xn ) xn+1
0 3 0,66666 6666 2,33333 3333

1 2,33333 3333 0,09523 8095 2,23809 5238
2 2,23809 5238 0,00202 6343 2,23606 8896
3 2,23606 8896 0,00000 0918 2,23606 7978
4 2,23606 7978 0
La precisión de la calculadora se agota tras 4 iteraciones, y el resultado tiene un error de sólo una unidad en
la décima cifra significativa.
Newton–Raphson se deduce formalmente del desarrollo en serie de Taylor de una fun-

ción continua alrededor de un punto. Sea x el valor exacto del cero de f (x), y xn un valor
aproximado tal que x = xn + n . Tenemos entonces
2n
f (x) = f (xn + n ) = f (xn ) + n f (xn ) + f (xn ) + · · · (20.14)
2
Los términos en 2n y de orden superior se pueden despreciar si n es suficientemente
pequeño. Dado que f (x) = 0, tenemos entonces
f (xn )
n = − (20.15)
f (xn )
y una nueva estimación es xn+1 = xn + n , como en (20.13).

Puede demostrarse también a partir de la serie de Taylor que si los errores n de xn y n+1
de xn+1 son suficientemente pequeños
f (xn )
n+1 = −2n . (20.16)
2f (xn )
Esto explica la rápida convergencia de Newton–Raphson. El error decre cuadráticamente

y el número de cifras significativas se dobla aproximadamente con cada iteración. El
método se denomina un método iterativo de segundo orden, a diferencia del método
de bisección que, con n+1 ≈ 12 n , es un proceso de primer orden.
El método de Newton–Raphson no es un método de encajonado y, como muestran
las ecuaciones (20.15) y (20.16), puede fallar si por ejemplo |f (xn )| es pequeño (o cero).
La mayorı́a de los problemas se evitan con una elección adecuada del punto inicial x0 o
combinando Newton–Raphson con bisección. Ası́, se hace una iteración con bisección
cuando Newton–Raphson se hace demasiado grande o no converge.
20.4. Interpolación 511
20.4. Interpolación
La interpolación es el proceso de hallar una función cuya gráfica pase por un número
de puntos dados. En la Figura 20.3 los puntos representan los (n + 1) pares de números
(x0 , y0 ) , (x1 , y1 ) , (x2 , y2 ) , ... (xn , yn ) , (20.17)
y la curva en trazo discontinuo representa una función continua y = f (x) tal que yi = f (xi )
para los pares de números (20.17).
Figura 20.3
En cuanto a los números, pueden ser por ejemplo los resultados de medidas de la
concentración y el tiempo en un experimento cinético, o la presión y la temperatura en
el estudio de las propiedades termodinámicas de un fluido. De manera alternativa, pue-
den ser los valores tabulados de una función que no puede expresarse en forma funcional
sencilla. El objetivo de la interpolación es hallar una función ‘sencilla’ que pueda usarse
para hallar puntos intermedios en el intervalo de (x0 , y0 ) a (xn , yn ) (fuera de ese intervalo
el proceso es de extrapolación). La interpolación tiene aplicaciones importantes en inte-
gración numérica (Apartado 20.5), en la cual una función que no puede integrarse con
los métodos descritos en los Capı́tulos 5 y 6 se aproxima por una función más senci-
lla que sı́ puede ser integrada, y en la resolución numérica de ecuaciones diferenciales
(Apartado 20.9).
Interpolación polinómica
Dados (n + 1) puntos, es posible hallar un único polinomio de grado n,
pn (x) = a0 + a1 x + a2 x2 + · · · + an xn (20.18)
que pasa por todos los puntos. Por ejemplo, por dos puntos cualesquiera pasa una única
recta (n = 1), y por tres puntos cualesquiera pasa una única curva cuadrática (n = 2).2
02. La base teórica para la interpolación polinómica, y uno de los teoremas importantes del análisis
moderno, es el teorema de Weierstrass: ‘Si f (x) es una función arbitraria continua definida en el intervalo
a ≤ x ≤ b, siempre es posible aproximar f (x) en todo el intervalo de manera tan precisa como se quiera
Interpolación lineal
La recta y = p1 (x) = a0 + a1 x que pasa por los dos puntos (x0 , y0 ) y (x1 , y1 ), como en la
Figura 20.4, cumple las dos ecuaciones lineales
y0 = a0 + a1 x0 , y1 = a0 + a1 x1 ,
con solución
y0 x1 − y1 x0 y1 − y0
a0 = , a1 = .
x1 − x0 x1 − x0
Tenemos entonces

y0 x1 − y1 x0 y1 − y0
y= + x,
x1 − x0 x1 − x0
Figura 20.4
que puede reordenarse como

y1 − y0
y = y0 + (x − x0 ) . (20.19)
x1 − x0
La fórmula de la interpolación lineal se usa para hallar un valor aproximado de una

función en un punto x del intervalo de x0 a x1 . El método se ilustra en el siguiente ejemplo
para la función (conocida) ex .
EJEMPLO 20.6 Interpolación lineal
Dos puntos de la gráfica de f (x) = ex (con 4 decimales) son (x0 , y0 ) = (0,80 , 2,2255) y (x1 , y1 ) =
(0,84 , 2,3164). La fórmula de la interpolación lineal (20.19) es por lo tanto

2,3164 − 2,2255
ex ≈ y = 2,2255 + (x − 0,80) .
0,84 − 0,80
Para x = 0,832 tenemos entonces
e0,832 ≈ 2,2255 + 0,0727 = 2,2982 .
El valor exacto es 2,2979 (con 4 decimales).
Si se usa la interpolación lineal para cada par de puntos consecutivos se obtiene una
interpolación lineal a trozos, como se representa en la Figura 20.5 para los puntos de
la Tabla 20.4 (compárese con las Figuras 20.6 a 20.8).
mediante un polinomio de grado suficientemente alto’. La condición fundamental es la continuidad; la

función puede tener infinitos maximos o mı́nimos y no es necesario que sea derivable en los puntos del
intervalo.
Tabla 20.4
x y
0,0 1,0000
0,4 1,8902
0,8 1,0517
1,2 0,9577
1,6 0,5207
2,0 1,0000
2,4 2,1184
2,8 1,3809
3,2 1,5690
Figura 20.5
Interpolación cuadrática
La función cuadrática que pasa por tres puntos sucesivos, o nodos, (x0 , y0 ), (x1 , y1 ) y
(x2 , y2 ) puede escribirse como
p2 (x) = L0 (x)y0 + L1 (x)y1 + L2 (x)y2 , (20.20)
donde
(x − x1 ) (x − x2 ) (x − x0 ) (x − x2 )
L0 (x) = , L1 (x) = ,
(x0 − x1 ) (x0 − x2 ) (x1 − x0 ) (x1 − x2 )
(x − x0 ) (x − x1 )
L2 (x) = .
(x2 − x0 ) (x2 − x1 )
Ésta es la fórmula de Lagrange para la interpolación cuadrática, y se usa para hallar un

valor aproximado de una función en el intervalo de x0 a x2 .3
EJEMPLO 20.7 Interpolación cuadrática
Tres puntos de la gráfica de f (x) = ex (con 6 decimales) son (x0 , y0 ) = (0,80 , 2,225541), (x1 , y1 ) =
(0,84 , 2,316367) y (x2 , y2 ) = (0,88 , 2,410900). La interpolación cuadrática en x = 0,832 da entonces
(compárese con el Ejemplo 20.6)
e0,832 = 0,12y0 + 0,96y1 − 0,08y2 = 2,297905 ,
comparado con el valor exacto 2,297910 (con 6 decimales).
03. La fórmula general de interpolación de Lagrange (1795) fue anticipada por Euler en el Institu-
tiones calculi differentialis de 1755 y dada explı́citamente por Edward Waring (1734–1793), profesor en
Cambridge, en un artı́culo en Philosophical Transactions en 1779.
Si se usa la interpolación cuadrática para cada tres puntos consecutivos, tenemos una
interpolación cuadrática a trozos, como se ilustra en la Figura 20.6 para los puntos de la
Tabla 20.4 (compárese con las Figuras 20.5, 20.7 y 20.8).
Figura 20.6
Método de diferencias divididas de Newton
El polinomio interpolador pn (x) que pasa por (n+1) puntos dados puede expresarse de
manera sencilla mediante diferencias divididas. Las dos primeras diferencias divididas
son
y1 − y0 f [x1 , x2 ] − f [x0 , x1 ]
f [x0 , x1 ] = , f [x0 , x1 , x2 ] = ,
x1 − x0 x2 − x0
y en general
f [x1 , x2 , . . . , xk ] − f [x0 , x1 , . . . , xk−1 ]

f [x0 , x1 , . . . , xk ] = . (20.21)
xk − x0
La ecuación (20.19) para p1 (x) es entonces
p1 (x) = y0 + (x − x0 ) f [x0 , x1 ] (20.22)
y para p2 (x) puede reescribirse (20.20) en la forma
p2 (x) = y0 + (x − x0 ) f [x0 , x1 ]
+ (x − x0 ) (x − x1 ) f [x0 , x1 , x2 ] . (20.23)
En general
pk+1 (x) = y0 + (x − x0 ) f [x0 , x1 ]

+ (x − x0 ) (x − x1 ) f [x0 , x1 , x2 ]
+ (x − x0 ) (x − x1 ) (x − x2 ) f [x0 , x1 , x2 , x3 ]
···
+ (x − x0 ) (x − x1 ) · · · (x − xk ) f [x0 , x1 , . . . , xk+1 ] . (20.24)
La relación entre las diferencias divididas se muestra en la Tabla 20.5 para 5 puntos.
La columna D1 contiene las primeras diferencias divididas, la columna D2 las segundas
diferencias divididas, etcétera. Cada diferencia dividida es la diferencia de sus ‘progeni-
tores’ de la columna situada a su izquierda, dividida por la diferencia entre los valores
extremos de x.
Tabla 20.5 Tabla de interpolación por diferencias divididas

x y D1 D2 D3 D4
x0 y0
f [x0 , x1 ]
x1 y1 f [x0 , x1 , x2 ]
f [x1 , x2 ] f [x0 , x1 , x2 , x3 ]
x2 y2 f [x1 , x2 , x3 ] f [x0 , x1 , x2 , x3 , x4 ]
f [x2 , x3 ] f [x1 , x2 , x3 , x4 ]
x3 y3 f [x2 , x3 , x4 ]
f [x3 , x4 ]
x4 y4
EJEMPLO 20.8 Método de diferencias divididas de Newton para exp(x)
En las dos primeras columnas de la Tabla 20.6 se dan cinco puntos de la gráfica de ex . Las diferencias
divididas han sido calculadas con una calculadora estándar de 10 dı́gitos, y se dan con 8 decimales.
Tabla 20.6 Tabla de diferencias divididas para ex

x y D1 D2 D3 D4
0,80 2,22554093
2,27065125
0,84 2,31636698 1,15833750
2,36331825 0,39393233
0,88 2,41089971 1,20560938 0,10058544
2,45976700 0,41002600
0,92 2,50929039 1,25481250
2,56015200
0,96 2,61169647
Usando los números que aparecen en negrita en la tabla,
p1 (x) = 2,22554093 + 2,27065125(x − 0,8) para 0,80 < x < 0,84 ,

p2 (x) = p1 (x) + 1,15833750(x − 0,8)(x − 0,84) 0,80 < x < 0,88 ,
p3 (x) = p2 (x) + 0,39393233(x − 0,8)(x − 0,84)(x − 0,88) 0,80 < x < 0,92 ,
p4 (x) = p3 (x) + 0,10058544(x − 0,8)(x − 0,84)(x − 0,88)(x − 0,92) 0,80 < x < 0,96 .
Para x = 0,832 las sucesivas aproximaciones para e0,832 son
p1 (x) = 2,29820177 , p2 (x) = 2,29790524 , p3 (x) = 2,29791008 , p4 (x) = 2,29790997 ,
y todas las cifras que se dan de p4 (x) son exactas (véanse los Ejemplos 20.6 y 20.7).
Si bien en este ejemplo las xi están espaciadas regularmente, la fórmula de Newton

(20.24) es válida para puntos espaciados irregularmente. Las implementaciones actuales
en ordenadores son básicamente adaptaciones del método de Newton que siguen el me-
jor camino dentro de una tabla de interpolación, como la Tabla 20.5, a fin de obtener la
mayor exactitud posible.
Interpolación con trazadores
Los Ejemplos 20.6 a 20.8 muestran que aumentar el grado de los polinomios inter-
poladores conduce a una mayor exactitud para ex , pero eso no es necesariamente cierto
si los nodos presentan máximos y mı́nimos como en la Figura 10.5. En la Figura 20.7 se
presenta el resultado de ajustar el polinomio de grado (máximo) 8 para que pase por los 9
puntos de la Tabla 20.4. Esto muestra que aumentar el grado n de los polinomios interpo-
ladores puede producir oscilaciones espurias entre los nodos, y esas oscilaciones pueden
aumentar de amplitud indefinidamente al aumentar n. La interpolación debe restringirse
por lo tanto en general a polinomios de grado bajo (no mayor de 4 o 5), pero la Figura
20.6 muestra que, en los casos desfavorables, esas interpolaciones pueden adolecer de
fuertes discontinuidades de la derivada en los nodos.

Ambos inconvenientes se evitan con el método de los trazadores4 (splines). Se trata

de una interpolación polinómica a trozos, pero escogiendo el polinomio en el intervalo
entre cada par de nodos para que la función de interpolación global sea regular en los
nodos; es decir, con derivadas primera, segunda (y quizá de órdenes superiores) conti-
nuas en los nodos. En el procedimiento más sencillo y más usado, la interpolación con
trazadores cúbicos, la función entre cada par de nodos se aproxima por una función
cúbica. Para el intervalo j-ésimo, entre (xj , yj ) y (xj+1 , yj+1 ), la función cúbica fj (x) puede
expresarse como
fj (x) = aj + bj (x − xj ) + cj (x − xj ) + dj (x − xj ) .
2 3
(20.25)
Por otra parte en los nodos tenemos
fj (xj ) = yj , fj (xj+1 ) = yj+1 . (20.26)
Para que las derivadas primeras sean continuas en los nodos, la derivada fj (x) tiene que
relacionarse con las derivadas de las funciones cúbicas en los intervalos adyacentes me-
diante
fj (xj ) = fj−1

(xj ) , fj (xj+1 ) = fj+1

(xj+1 ) . (20.27)
Lo mismo ocurre para las derivadas segundas,
fj (xj ) = fj−1

(xj ) , fj (xj+1 ) = fj+1

(xj+1 ) . (20.28)
Vamos a considerar el caso particular de nodos espaciados regularmente, con xj+1 −xj = h
(para todo j = 0 hasta n con (n+1) nodos). Entonces, si denotamos por kj la derivada en el
nodo j, los tres conjuntos de condiciones (20.26) a (20.28) dan las siguientes expresiones
para los coeficientes de la función cúbica de (20.25):
aj = yj , bj = kj ,
3 1
cj = 2 (yj+1 − yj ) − (kj+1 + 2kj ) , (20.29)
h h
2 1
dj = 3 (yj − yj+1 ) + 2 (kj+1 + kj ) ,
h h
y la relación de recurrencia para las derivadas,
3
kj−1 + 4kj + kj+1 = (yj+1 − yj−1 ) . (20.30)
h
04. Los trazadores, ‘splines’ en inglés, son varillas de madera flexibles usadas durante mucho tiempo
por delineantes, ingenieros y carpinteros de ribera para dibujar curvas regulares pasando por unos puntos
dados. El método numérico fue descrito por I. J. Schoenberg en 1946.
Estas relaciones son suficientes para determinar las funciones de interpolación cúbicas
para todos los intervalos interiores (j = 1 a n). Para los intervalos extremos es necesario
especificar además las pendientes k0 y kn . Si se escogen mediante las condiciones en los
extremos
f0 (x0 ) = fn (xn ) = 0 (20.31)
los trazadores cúbicos se llaman trazadores naturales, y dan un comportamiento apro-

ximadamente lineal en los extremos. Este comportamiento se puede cambiar haciendo
otra elección.
En todos los lenguajes comunes de programación de ordenadores hay programas para
interpolar con trazadores cúbicos, y se usan ampliamente para representar datos experi-
mentales y resultados de estudios numéricos en las ciencias fı́sicas y en ingenierı́a. En la
Figura 20.8 se presenta el resultado de interpolar con trazadores naturales los puntos de
la Tabla 20.4. Esto muestra que el ajuste de una curva con trazadores da como resultado
una curva continua que sigue de cerca los segmentos de recta de la interpolación lineal
a trozos. Esto no garantiza sin embargo que la curva calculada sea una representación
fidedigna de la función que nos proporciona los nodos. Ası́ por ejemplo, en este caso los
puntos de la Tabla 20.4 se han calculado con la función f (x) = 1 − (x − 1)2 (x − 3) sen πx,
que tiene muchos máximos y mı́nimos locales. El ajuste ‘poco realista’ realizado con el
polinomio de grado 8 que se muestra en la Figura 20.7 es de hecho una representación
bastante buena de la función, mientras que el ajuste que se obtiene con los trazadores es
tan bueno como lo permite el pobre muestreo de puntos tomado. *
20.5. Integración numérica
La integración (o cuadratura) numérica consiste en evaluar numéricamente la integral

b
I= f (x) dx (20.32)
a
cuando el integrando f (x) viene dado por una tabla de números o cuando la integral no se
puede evaluar con los métodos descritos en los Capı́tulos 5 y 6 mediante un número finito
de funciones estándar. El problema, geométricamente, consiste en estimar el área bajo
la curva. El método estándar es sustituir la función f (x) por una función diferente que
se pueda integrar, y una manera es usar las fórmulas de interpolación que hemos tratado
en el apartado anterior. Esto da lugar a la familia de métodos de integración numérica
llamados cuadraturas de Newton–Cotes, de las cuales la regla del trapecio y la regla
de Simpson son los ejemplos más sencillos.5
0* Garbage in. Garbage out ! (Anónimo), es decir: “se empieza con basura ¡se acaba con basura!”
05. Las fórmulas de Newton–Cotes aparecieron por primera vez en la carta de Newton a Leibniz del
24 de octubre de 1676 y en los Principia, aunque algunos ejemplos particulares eran conocidos desde mucho
antes. Fueron incluidos en la recopilación de las obras de Cotes, la Harmonia mensurarum, publicada
20.5. Integración numérica 519
La regla del trapecio. Interpolación lineal
La estimación más sencilla de la integral (el área) I se obtiene dividiendo el intervalo

a ≤ x ≤ b en n subintervalos iguales cada uno de longitud h = (b−a)/n, y aproximando
el integrando por interpolación lineal a trozos; esto es, uniendo los correspondientes
puntos adyacentes de la gráfica mediante rectas como se muestra en la Figura 20.9.
Figura 20.9
El área del trapecio entre xj y xj+1 es (fj + fj+1 ) h/2, y el área total es
b

1 1
f (x) dx ≈ T(h) = h f0 + f1 + f2 + · · · + fn−1 + fn . (20.33)
a 2 2
Para un integrando continuo y derivable en el intervalo a ≤ x ≤ b, puede demostrarse

que el error de esta expresión es
b
b − a 2
f (x) dx − T(h) = = − h f (c) , (20.34)
a 12
donde f (c) es la derivada segunda de la función en algún punto x = c del intervalo.

De manera alternativa, si h es suficientemente pequeño, el error puede aproximarse por
(véase la fórmula de Euler–MacLaurin (20.37) más abajo)
1 2
≈− h [fn − f0 ] , (20.35)
12
donde f0 y fn son las derivadas de f (x) en los puntos extremos. Se deduce que dividir
h por la mitad (o doblar el número de subintervalos n) disminuye el error en un factor
cuatro.
póstumamente en 1722. Roger Cotes (1682–1716), matemático de Cambridge, dedicó gran parte de los
años entre 1709 y 1713 a preparar la segunda edición de los Principia. Sus trabajos incluyen una de las
primeras exposiciones del cálculo de logaritmos y de funciones trigonométricas, con tablas de integrales.

1,2 2
EJEMPLO 20.9 Estime la integral I = 0
xe−x dx usando la regla del trapecio (20.33) y la fórmula de
error (20.35) para n = 3,6 y 12.
Los valores pedidos se presentan en la siguiente tabla

2
Tabla 20.7 Valores de f (x) = xe−x
x 0,0 0,1 0,2 0,3 0,4 0,5 0,6
f (x) 0,000000 0,099005 0,192158 0,274179 0,340858 0,389400 0,418606
x 0,7 0,8 0,9 1,0 1,1 1,2
f (x) 0,428838 0,421834 0,400372 0,367879 0,328017 0,284313
Por ejemplo, para n = 3 tenemos entonces

h = 0,4 , f0 = 0 , f1 = 0,340858 , f2 = 0,421834 , f3 = 0,284313 ,
y
1
T(h) = 0,4[0 + 0,340858 + 0,421834 + × 0,284313] = 0,361939 .
2
2
La derivada del integrando es f (x) = e−x 1 − 2x2 , de manera que f0 = f (0) = 1 y fn = f (1,2) =
−0,445424. Con esto = 0,120452h . En la Tabla 20.8 se recogen los resultados.
2

1,2 2
Tabla 20.8 Valores de I = 0 xe−x dx
n 3 6 12
T(h) 0,361939 0,376698 0,380330
0,019272 0,004818 0,001205
T(h) + 0,381211 0,381516 0,381535

El valor exacto de la integral es 1
2
1 − e−1,44 = 0,381536.
Regla de Simpson. Interpolación cuártica
La regla de Simpson es uno de los métodos de integración sencillos más aceptados

desde hace más de dos siglos.6 Se obtiene dividiendo el intervalo a ≤ x ≤ b en un
06. Thomas Simpson (1710–1761), profesor de matemáticas en la Royal Military Academy de Wool-
wich, era un matemático autodidacta. Fue educado como tejedor y en 1735 se unió a la Mathematical
Society de Spitalfields, una comunidad de tejedores en la cual era obligación de cada miembro ‘si le fuese
preguntada cualquier cuestión matemática o filosófica por otro miembro, instruirle en la manera más senci-
lla y directa de la que sea capaz’. La regla que lleva su nombre apareció en sus Mathematical dissertations
on a variety of physical and analytical subjects (Disertaciones matemáticas sobre una variedad de temas
fı́sicos y analı́ticos) de 1743, pero ya habı́a aparecido antes en los trabajos de Cavalieri (1639) y Gregory
(1668).
número par de subintervalos, 2n, cada uno de longitud h = (b − a)/2n, y aproximando

el integrando por interpolación cuadrática a trozos. Entonces
b
h
f (x) dx ≈ [f0 + 4f1 + 2f2 + 4f3 + 2f4 + · · · + 4f2n−1 + f2n ] (20.36)
a 3
o bien
b
h
f (x) dx ≈ (extremos) + 4 (puntos impares) + 2 (puntos pares) .
a 3
El error de la regla de Simpson va como h4 si h es pequeño, de manera que dividir h

por la mitad (o doblar el número de subintervalos n) disminuye el error en un factor
dieciséis. La regla de Simpson converge por lo tanto habitualmente mucho más rápido
que la regla del trapecio (sin corregir).

1,2 2
EJEMPLO 20.10 Estime la integral I = 0
xe−x dx usando la regla de Simpson (20.36) para n = 2, 4, 6
y 12.
Utilizamos los valores del integrando de la Tabla 20.7 y construimos la Tabla 20.9.

1,2 2
Tabla 20.9 Regla de Simpson para I = 0
xe−x dx
j xj f (xj ) 2n = 2 2n = 4 2n = 6 2n = 12
0 0,0 0,000000 ×1 ×1 ×1 ×1
1 0,1 0,099005 ×4
2 0,2 0,192158 ×4 ×2
3 0,3 0,274179 ×4 ×4
4 0,4 0,340858 ×2 ×2
5 0,5 0,389400 ×4
6 0,6 0,418606 ×4 ×2 ×4 ×2
7 0,7 0,428838 ×4
8 0,8 0,421834 ×2 ×2
9 0,9 0,400372 ×4 ×4
10 1,0 0,367879 ×4 ×2
11 1,1 0,328017 ×4
12 1,2 0,284313 ×1 ×1 ×1 ×1
Totales 1,958737 3,819729 5,724269 11,446227

h
× =I 0,391747 0,381973 0,381618 0,381541
3
El valor exacto es 0,381536 , y la regla de Simpson es suficientemente exacta para muchas aplicaciones,
incluso sin corrección.
Fórmula de Euler–MacLaurin
Si el integrando f (x) puede desarrollarse en serie de Taylor en el intervalo a ≤ x ≤ b,

la expresión aproximada de la regla del trapecio (20.33) puede ser sustituida por la
fórmula de Euler–MacLaurin
b
1 1
f (x) dx = h f0 + f1 + f2 + · · · + fn−1 + fn
a 2 2
2 4
h h h6
−B2 (fn − f0 ) − B4 (fn − f0 ) − B6 (fnv − f0v ) − · · · , (20.37)
2! 4! 6!
donde f0 , fn , f0 , fn , . . . son las derivadas de f (x) de orden impar evaluadas en los extre-
mos, y los números B2 = 16 , B4 = − 301 , B6 = 421 , . . . se llaman números de Bernoulli.
Si f (x) es un polinomio de grado n, el desarrollo en h2 se acaba tras un número finito de
términos ya que todas las derivadas de orden mayor que n son cero. La fórmula (20.37)
es entonces exacta. En otros casos, el desarrollo no suele ser una serie convergente para
todo valor de h porque los números de Bernoulli Bn , exceptuando los primeros, aumentan
rápidamente de magnitud al crecer n. Se trata en ese caso de un tipo especial de desarro-
llo llamado desarrollo asintótico y tiene la propiedad de que si se trunca en cualquier
punto el error es menor que la magnitud del último término incluido.
Aparte de su aplicación al análisis del error en integración numérica, la fórmula de
Euler–MacLaurin tiene algunas aplicaciones directas en las ciencias fı́sicas. La usamos
en los siguientes ejemplos para deducir dos resultados importantes en termodinámica
estadı́stica.
EJEMPLO 20.11 La función de partición rotacional del rotor rı́gido lineal
Los niveles de energı́a del rotor rı́gido lineal son

J(J + 1)h2
EJ = , J = 0, 1, 2, 3, . . .
8π 2 I
con degeneraciones gJ = 2J + 1, siendo J el número cuántico rotacional e I el momento de inercia. La
función de partición rotacional es entonces

∞
∞
q= gJ e−EJ /kT = (2J + 1) e−J(J+1)θ/T ,
J=0 J=0
donde θ = h2 /8π 2 Ik se denomina temperatura rotacional.

Si f (J) = (2J + 1) e−J(J+1)θ/T , la fórmula de Euler–MacLaurin nos da (con a = 0, b → ∞ y h = 1 en
(20.37))
∞ ∞
1
q= f (J) = f (J) dJ + [f (0) + f (∞)]
J=0 0 2
1 1
+ [f (∞) − f (0)] − [f (∞) − f (0)] + · · · .
12 720
La integral se evalúa mediante el cambio u = J(J + 1), dando
∞ ∞
T
(2J + 1) e−J(J+1)θ/T dJ = e−uθ/T du = .
0 0 θ
Por otra parte, f (J) y todas sus derivadas tienden a cero cuando J → ∞, y los valores en J = 0 pueden
obtenerse del desarrollo de f (J) en serie de potencias de J,

θ 3θ θ2 2θ 2θ 2 θ3
f (J) = 1 + 2 − J+ – + 2 J2 + – + 2 − 3 J3 + · · ·
T T 2T T T 6T
Tenemos que f (0) = 1, f (0) = 2 − θ/T, f (0) = −12θ/T + 12θ 2 /T 2 − θ 3 /T 3 , y todas las derivadas en
J = 0 son de orden (θ/T)2 o superior. Con esto
2
T 1 1 θ θ
q= + + + términos en y superiores. (20.38)
θ 3 15 T T
El valor más grande de θ para una molécula es θ = 87,5 K para H2 pero la mayorı́a de las moléculas tienen
temperaturas rotacionales próximas a 0 K. En esos casos T/θ >> 1, de manera que el primer término del
segundo miembro de (20.38) es con mucho el mayor, y es la función de partición rotacional que se usa
normalmente en quı́mica (después de corregirla para la simetrı́a).
EJEMPLO 20.12 Aproximación de Stirling de ln (n!)
La cantidad ln (n!), siendo n un entero, aparece en la teorı́a de la probabilidad y se usa en termodinámica

estadı́stica con n igual al número de partı́culas en un mol, es decir, con n ≈ 1023 . La aproximación de
Stirling del logaritmo del factorial de un número muy grande, ln (n!) ≈ n ln n − n, se puede deducir de la
fórmula de Euler–MacLaurin. Tomamos f (x) = ln x. Entonces
ln (n!) = ln 1 + ln 2 + · · · + ln n
n
1 1
= ln x dx + [f (n) + f (1)] + [f (n) − f (1)] + · · ·
1 2 12

1 1 1
≈ [x ln x − x]n1 + ( ln n + ln 1) + −1
2 12 n
≈ n ln n − n si n >> 1 .
Un tratamiento más completo da

1 1 1 1
ln (n!) ≈ n ln n − n + ln 2πn + − + .
2 12n 360n3 1260n5
Cuadratura gaussiana
Todas las fórmulas de integración numérica son de la forma

b
n
f (x) dx ≈ wi f (xi ) (20.39)

a i=1
y suponen evaluar el integrando en n puntos x1 , x2 , . . . , xn , con coeficientes, o pesos

de Gauss, wi determinados por el tipo de fórmula de integración. En las fórmulas de
Newton–Cotes vistas previamente los puntos se toman igualmente espaciados. En las
fórmulas de cuadratura gaussiana los puntos se escogen a fin de obtener la mayor exac-
titud posible para una fórmula de integración dada, y no están igualmente espaciados.7
Existen distintas fórmulas de cuadratura gaussiana apropiadas para diversos tipos
de integrandos. La más sencilla es la fórmula de Gauss–Legendre (o, sencillamente,
gaussiana)
+1
n
f (x) dx ≈ wi f (xi ) (20.40)

−1 i=1
donde los puntos xi son los ceros de los polinomios de Legendre Pn (x). Los pesos wi
se escogen para que la fórmula sea exacta si f (x) es un polinomio de grado 2n − 1.
Existen tablas de los pesos y de los puntos con muchas cifras significativas (por lo menos
15) para muchos valores de n (por lo menos hasta 100), y la fórmula puede dar mucha
exactitud para integrales que se puedan escribir en la forma dada por (20.40). Cualquier
integral con intervalo de integración finito desde a hasta b puede transformarse en una
con intervalo desde −1 hasta +1 cambiando la variable a u dada por x = 12 [(b − a)u +
(a + b)].
1,2 2
EJEMPLO 20.13 Cuadratura de Gauss–Legendre para I = xe−x dx.
0
Cambiando la variable de integración a u, dada por x = 0,6(1 + u), obtenemos

+1
n
2 2
I = 0,36 (1 + u)e−0,36(1+u) du ≈ wi 0,36(1 + ui )e−0,36(1+ui ) .
−1 i=1
Los parámetros de Gauss–Legendre para n = 4 son (con 8 cifras)
u1 = −u4 = −0,86113631 , w1 = w4 = 0,34785485 ,
u2 = −u3 = −0,33998104 , w2 = w3 = 0,65214515 .

Con esto I ≈ 0,381532. El valor exacto es 0,381536, y la integración de Gauss–Legendre con 4 puntos es
más exacta que la regla de Simpson con 12 intervalos.
Existen otras fórmulas de cuadratura gaussiana con expresión más general

b
n
f (x)W(x) dx ≈ wi f (xi ) (20.41)

a i=1
07. Gauss presentó su nuevo método en Methodus nova integralium valores per approximationem
inveniendi en 1816.
20.7. Eliminación gaussiana para la resolución de ecuaciones lineales 525
para toda una variedad de funciones peso W(x) en el integrando y también para integrales
infinitas. Las más importantes son
+1 n
1
Gauss–Chebyshev : f (x) √ dx ≈ wi f (xi ) .
−1 1 − x2
∞ i=1
n
Gauss–Laguerre : f (x)e−x dx ≈ wi f (xi ) .

0
+∞
i=1

n
f (x)e−x dx ≈ wi f (xi ) .
2
Gauss–Hermite :
−∞ i=1
Las fórmulas de cuadratura gaussiana se usan en aplicaciones donde se necesita mucha

exactitud, por ejemplo en quı́mica cuántica.
20.6. Métodos de álgebra lineal
Los problemas del álgebra lineal son los asociados con sistemas de ecuaciones linea-
les, como los descritos en los Capı́tulos 17, 18 y 19:
(a) Resolución de sistemas de ecuaciones lineales simultáneas, o de la ecuación ma-

tricial equivalente Ax = b para el vector incógnita x, siendo A una matriz de
coeficientes dada y b un vector conocido.
(b) Cálculo del determinante de una matriz cuadrada A.
(c) Cálculo de la matriz inversa A−1 de una matriz cuadrada A.
(d) Resolución del problema de autovalores Ax = λx para una matriz cuadrada A.
20.7. Eliminación gaussiana para la resolución de

ecuaciones lineales
El método de eliminación gaussiana es la formalización del método elemental de re-

solución de sistemas de ecuaciones lineales simultáneas. Sean las tres ecuaciones con
tres incógnitas8 (véase también el Ejemplo 2.33)
(1) x + 2y + 3z = 26 ,
(2) 2x + 3y + z = 34 , (20.42)
(3) 3x + 2y + z = 39 .
08. Estas ecuaciones aparecen en particular en un problema sobre medidas de grano en el Capı́tulo 8
del Jiuzhang suanshu, y son resueltas por un método básicamente equivalente a la eliminación gaussiana.
Gauss presentó su método en la Theoria motus corporum celestium (Teorı́a del movimiento de los cuerpos
celestes) de 1809.
El método actúa siguiendo una serie de pasos.

Paso 1. Eliminación de x
La ecuación (1) se llama ecuación pivote y el término en x se llama pivote de este paso.
Se consigue eliminar x de todas las ecuaciones que siguen restando múltiplos adecuados
de (1). Ası́ por ejemplo, restando 2 × (1) a (2) y 3 × (1) a (3) obtenemos el nuevo sistema
de ecuaciones
(1) x + 2y + 3z = 26 ,
(2 ) −y − 5z = −18 , (20.43)
(3 ) −4y − 8z = −39 .
Paso 2. Eliminación de y
La ecuación (2 ) es la nueva ecuación pivote y se elimina y de las ecuaciones que siguen
restando múltiplos adecuados de (2 ). En este caso restando 4 × (2 ) a (3 ) nos da
(1) x + 2y + 3z = 26 ,
(2 ) −y − 5z = −18 , (20.44)
(3 ) 12z = 33 .
Estas ecuaciones están en forma triangular o escalonada y la resolución se completa

con la sustitución hacia arriba.
Paso 3. Sustitución hacia arriba
Las ecuaciones (20.44) se resuelven en orden inverso. La ecuación (3 ) nos da z = 11/4,
sustituyendo esto en (2 ) obtenemos y = 17/4 y sustituyendo y y z en (1) tenemos
x = 37/4. El siguiente ejemplo muestra que la eliminación gaussiana se aplica a cual-
quier sistema de ecuaciones lineales, incluso si no hay una única solución o si no hay
soluciones.
EJEMPLO 20.14 Use la eliminación gaussiana para resolver las ecuaciones (véase el Apartado 17.4)
(1) 2x + 2y + z = 10 ,
(2) x + 2y − 2z = −3 ,
(3) 3x + 2y + 4z = λ ,
siendo λ un número.
Paso 1. Restamos 1
2
× (1) a (2) y 3
2
× (1) a (3):
(1) 2x + 2y + z = 10 ,
5
(2 ) y − z = −8 ,
2
5
(3 ) −y + z = λ − 15 .
2
20.7. Eliminación gaussiana para la resolución de ecuaciones lineales 527
Paso 2. Restamos −(2 ) a (3 ):

(1) 2x + 2y + z = 10 ,
5
(2 ) y − z = −8 ,
2
(3 ) 0 = λ − 23 .
Si λ = 23, la ecuación (3 ) es redundante, y la sustitución hacia arriba nos da y = 5z/2 − 8 y x = 13 − 3z.
Como z queda arbitrario, tenemos infinitas soluciones, una por cada valor de z posible. Por otra parte no
hay soluciones si λ = 23.
Pivotes
El método de eliminación implica restar repetidas veces un múltiplo de una ecua-

ción a otra y puede conducir a errores graves al restar. Por ejemplo, la solución de las
ecuaciones
(1) 0,0003x1 + 2,513x2 = 7,545
(20.45)
(2) 0,7003x1 − 2,613x2 = 6,167
es x1 = 20, x2 = 3. Para resolverlas por el método de eliminación, escogemos (1) como

ecuación pivote y eliminamos x1 de (2) restando (0,7003/0,0003)×(1) a (2). Si el cálculo
se realiza, por ejemplo, usando aritmética de 4 cifras, entonces 0,7003/0,0003 = 2334
y la segunda ecuación se transforma en
(2 ) − 5868x2 = −17600 .
Se obtiene entonces x2 = 2,999, y la ecuación (1) da x1 = 28,38. Un error pequeño en x2

nos ha conducido a un error grande en x1 porque el coeficiente de x1 en la ecuación (1)
es pequeño comparado con el de (2). Los errores al restar que han aparecido se pueden
evitar si se toma la ecuación (2) como ecuación pivote. En ese caso, multiplicar (2) por
0,0003/0,7003 = 0,0004284 y restárselo a (1) da
(1 ) − 2,514x2 = −7,542
de manera que x2 = 3,000. Sustituyéndolo en (2) obtenemos entonces x1 = 20,00.

La elección de la ecuación (2) como ecuación pivote es un ejemplo de pivote parcial, es
decir, se escoge la ecuación pivote del primer paso como la ecuación con el coeficiente
de x1 de mayor magnitud. Igualmente para x2 en el segundo paso, etcétera.
Sin embargo el pivote parcial, equivalente a reordenar las ecuaciones, no es siempre
suficiente. Por ejemplo, podemos escribir las ecuaciones (20.45) con (1) multiplicado
por algún número grande, digamos que 3000:
(1) 0,9000x1 + 7539x2 = 22640

(20.46)
(2) 0,7003x1 − 2,613x2 = 6,167 .
El coeficiente de x1 en (1) es ahora el mayor, pero elegir (1) como ecuación pivote vuel-
ve a dar un resultado malo (aunque distinto). El procedimiento correcto, llamado pivo-
te parcial escalado, consiste en tomar como ecuación pivote del primer paso aquella
ecuación para la cual la razón del coeficiente de x1 con el mayor de los demás coefi-
cientes es de mayor magnitud. Esa razón es 0,9000/7539 ≈ 0,0001 en la ecuación (1)
y 0,7003/2,613 ≈ 0,3 en la ecuación (2). Hay que elegir por lo tanto la segunda como
ecuación pivote. Igualmente para x2 en el paso 2, y ası́ sucesivamente. Un refinamiento
adicional, llamado pivote total, consiste en buscar el mayor coeficiente relativo de todas
las variables en cada paso, pero no suele ser normalmente necesario.
Método de eliminación para calcular determinantes
Puede reducirse un determinante a forma triangular con la primera parte del méto-
do de eliminación de Gauss. El valor del determinante es entonces el producto de los
elementos diagonales de la forma triangular, como vimos en el Apartado 17.6
20.8. Método de eliminación de Gauss–Jordan para la inversa de

una matriz
La inversa A−1 de una matriz no singular A de orden n cumple la ecuación matricial
AA−1 = I . (20.47)
Podemos escribir
A−1 = ( x1 x2 x3 . . . xn ) , I = ( e1 e2 e3 · · · en ) ,
siendo xk el vector columna formado con los elementos de la columna k de A−1 , y ek

está formado con la columna k de la matriz identidad I. La ecuación matricial (20.47) es
por lo tanto igual a las n ecuaciones
Axk = ek (k = 1, 2, . . . , n) (20.48)
cada una de las cuales representa un sistema de n ecuaciones lineales simultáneas, y

puede ser resuelta por lo tanto por eliminación gaussiana. La manera sistemática de
hacer esto se llama eliminación de Gauss–Jordan, donde la matriz ampliada

( A | I ) se transforma en I | A−1 mediante el proceso en dos etapas ilustrado en el
siguiente ejemplo.9
09. Wilhelm Jordan (1842–1899), geodesta alemán.

20.9. Ecuaciones diferenciales de primer orden 529
EJEMPLO 20.15 Eliminación de Gauss–Jordan para la inversa de

⎛ ⎞
1 2 3
A = ⎝−2 1 2 ⎠.
3 −1 −1
La matriz ampliada del problema es

⎛ ⎞
1 2 3 1 0 0
( A | I ) = ⎝−2 1 2 0 1 0 ⎠.
3 −1 −1 0 0 1
La primera etapa consiste en reducir A a forma triangular superior usando eliminación gaussiana:
⎛ ⎞
1 2 3 1 0 0
fila 2 + 2 × fila 1 ⎝ 0
fila 3 − 3 × fila 1
−→ 5 8 2 1 0 ⎠
0 −7 −10 −3 0 1
⎛ ⎞
1 2 3 1 0 0
7 ⎜ 0 2 1 0 ⎟
fila 3 + × fila 2 −→ ⎝ 5 8 ⎠.
5
0 0 6
5
− 15 75 1
La segunda etapa es reducir la mitad izquierda de la matriz ampliada a forma diagonal con pasos adicionales
de eliminación:
⎡ ⎤ ⎛ ⎞
5 1 2 0 3
2
− 72 − 52
× fila 3
fila 1 − ⎜ ⎟
⎢ 2 ⎥ ⎜ 0 10
− 25 − 20 ⎟
⎣ ⎦ −→ ⎝
5 0 3 3 3 ⎠
20
fila 2 − × fila 3
3 0 0 6
5
− 15 7
5
1
⎛ ⎞
1 0 0 1
6
− 16 1
6
2 ⎜ ⎟
fila 1 − × fila 2 −→ ⎜ 0 5 0 10
− 25 − 20 ⎟
3 ⎠ .
5 ⎝ 3 3
0 0 6
5
− 15 7
5
1
La mitad izquierda se reduce a la matriz identidad dividiendo la fila 2 por 5 y la fila 3 por 65 . Tenemos
entonces
⎛ 1 ⎞
1 0 0 1
− 16
⎟
6 6
⎜
⎜ 0 1 0 2
− 53 − 43 ⎟ = I | A−1
⎝ 3 ⎠
0 0 1 − 16 7
6
5
6
y la mitad derecha de la matriz ampliada es la matriz inversa A−1 :

⎛ ⎞
1 ⎝ 1 −1 1
A−1 = 4 −10 −8 ⎠ , A−1 A = AA−1 = I .
6 −1 7 5
20.9. Ecuaciones diferenciales de primer orden
Vimos en los Capı́tulos 11 a 14 que algunas ecuaciones diferenciales importantes

pueden resolverse por métodos analı́ticos dando soluciones expresadas mediante funcio-
nes conocidas. Sin embargo, muchas ecuaciones diferenciales no pueden ser resueltas
de esta forma, ya sea porque no existe un método adecuado o porque no hay soluciones
analı́ticas. Es necesario entonces utilizar métodos de resolución numéricos.
Una solución analı́tica es siempre mejor que una numérica. Por ejemplo, la solución
analı́tica puede ser evaluada para cualquier valor numérico de las variables independien-
tes, mientras que una solución numérica toma la forma de una tabla de valores para un
conjunto discreto fijo de valores de las variables. Una solución analı́tica contiene, en
general, uno o más parámetros arbitrarios cuyos valores pueden determinarse imponien-
do condiciones iniciales o de contorno. En un método numérico, los valores de esos
parámetros tienen que fijarse al principio, antes de que la solución pueda ser calculada.
Además, el comportamiento funcional de la solución puede revelar nuevos aspectos de
la naturaleza del problema fı́sico del cual la ecuación diferencial es un modelo.
Las ecuaciones diferenciales que vamos a tratar en este apartado tienen la forma
general
dy
y (x) = = f (x, y) . (20.49)
dx
Se demuestra en el Apartado 20.10 que una ecuación ordinaria de orden superior puede
siempre expresarse como un sistema de ecuaciones de primer orden simultáneas, y los
métodos numéricos para una ecuación se pueden aplicar también a esos sistemas.
Representación gráfica
2,0
1,5
1,0
0,5
0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0
y (x) = 2(x − 2y)/(x + y)
Figura 20.10
La ecuación (20.49) es una expresión de las dos variables x e y de forma que se define
un valor de y (x) en cada punto del plano xy. Una representación gráfica de la ecuación
diferencial se obtiene entonces representando el valor de y (x) en cada punto de una
malla en el plano por un segmento con pendiente f (x, y), como se ilustra en la Figura
20.10 para la ecuación y (x) = 2(x − 2y)/(x + y).
Un diagrama de este tipo se llama campo de direcciones. Una solución de la ecua-
ción diferencial tiene entonces una gráfica que es tangente a las lı́neas de dirección en
cada punto de la curva. En la figura se muestran las gráficas de tres soluciones: la su-
perior para la condición y(1) = 2, la del medio para y(0,25) = 0,5 y la inferior para
y(3) = 1.
Un método numérico para resolver una ecuación diferencial es equivalente a empezar
en un punto concreto en el campo de direcciones y seguir las lı́neas de campo. Se dispone
de varios métodos para resolver la mayorı́a de los tipos de ecuaciones diferenciales que
surgen en las ciencias fı́sicas, y la mayorı́a de ellos tienen su origen en desarrollos de
Taylor. Dado el valor y(x0 ) = y0 de la función y(x) en x = x0 , el valor en un punto
próximo x1 = x0 + h es
1
y(x1 ) = y(x0 ) + hy (x0 ) + h2 y (x0 ) + · · · (20.50)
2
o, puesto que por (20.49) y (x0 ) = f (x0 , y0 ),
1
y(x1 ) = y0 + hf (x0 , y0 ) + h2 y (x0 ) + · · ·
2
= y0 + hF0 , (20.51)
donde F0 es la pendiente de la recta que une los puntos 0 y 1 en la gráfica de y(x) (la
pendiente media de la curva). Los distintos métodos numéricos usan distintas maneras
de estimar esa pendiente, dando lugar a una relación de recurrencia
yn+1 = yn + hFn , (20.52)
siendo xn = x0 + nh e yn ≈ y(xn ). Consideramos en primer lugar el método más sencillo

posible, el método de Euler.
Método de Euler
El método de Euler consiste en truncar el desarrollo de Taylor después del segundo

término
y(x1 ) ≈ y(x0 ) + hy (x0 ) ,
de manera que se aproxima F0 por la pendiente en el punto inicial (x0 , y0 ). Un valor

aproximado de y(x1 ) es entonces
y1 = y0 + hf (x0 , y0 ) (20.53)
y esto nos proporciona un procedimiento paso a paso

sencillo con el que se obtiene una solución aproximada
de la ecuación aplicando repetidas veces la recurrencia
yn+1 = yn + hf (xn , yn ) , n = 0, 1, 2, . . . , (20.54)
donde xn = x0 + nh e yn ≈ y(xn ). En cada paso la pen-

diente de la recta desde el punto n al punto (n + 1) es la
de la dirección del campo de direcciones en el punto n. Figura 20.11
El procedimiento se representa en la Figura 20.11.
Se dice que el método de Euler es de primer orden porque sólo nos hemos quedado
con la primera potencia de h en el desarrollo de Taylor. El error de truncación en cada
paso es por lo tanto de orden h2 , de manera que dividir el tamaño del paso h a la mitad
reduce el error en un factor 4. Sin embargo, el error acumulado (global) para una serie
de pasos es de orden h.
EJEMPLO 20.16 Dado el problema de valor inicial

y (x) = y + 1 , y(0) = 1 ,
use el método de Euler para obtener un valor aproximado de y(1) usando pasos con tamaños h = 0,2 y
h = 0,1.
En la Tabla 20.10 resumimos los resultados de aplicar la recurrencia

yn+1 = yn + h(yn + 1)
y los comparamos con los valores exactos obtenidos de la solución y(x) = 2ex − 1.
Tabla 20.10 Ejemplo del método de Euler

h n xn yn exacto error h n xn yn exacto error
0,2 0 0,0 1,0000 1,0000 0,0000 0,1 0 0,0 1,0000 1,0000 0,0000
1 0,1 1,2000 1,2103 0,0103
1 0,2 1,4000 1,4428 0,0428 2 0,2 1,4200 1,4428 0,0228
3 0,3 1,6620 1,6997 0,0377
2 0,4 1,8800 1,9836 0,1036 4 0,4 1,9282 1,9836 0,0554
5 0,5 2,2210 2,2974 0,0764
3 0,6 2,4560 2,6442 0,1882 6 0,6 2,5431 2,6442 0,1011
7 0,7 2,8974 3,0275 0,1301
4 0,8 3,1472 3,4511 0,3039 8 0,8 3,2872 3,4511 0,1639
9 0,9 3,7159 3,9192 0,2033
5 1,0 3,9766 4,4366 0,4599 10 1,0 4,1875 4,4366 0,2491
Los valores calculados de y(1) son 3,9766 con el paso h = 0,2 y 4,1875 con h = 0,1, comparados con
el valor exacto 4,4366. La tabla muestra que el error se reduce aproximadamente a la mitad, como es de
esperar en un método de primer orden.
La exactitud aumenta al disminuir el tamaño del paso, pero el mayor número de pasos
necesarios conduce a errores de redondeo mayores. En la práctica, los métodos usados
para resolver ecuaciones diferenciales son procedimientos que simulan el desarrollo de
Taylor hasta un orden alto en h, y los más sofisticados suponen el uso de pasos de tamaño
variable para controlar la acumulación de errores de redondeo y optimizar la convergen-
cia. La deducción y la justificación de esos métodos queda fuera del ámbito de este
libro y únicamente damos aquı́ una breve descripción de una familia de métodos muy
utilizada.
Métodos de Runge–Kutta
Los métodos de Runge–Kutta forman una familia de métodos de orden creciente,

con el método de primer orden de Euler como primer miembro.10 El método de Runge–
Kutta de segundo orden se obtiene sustityendo Fn en (20.52) por una estimación de la
pendiente a mitad de camino entre los puntos n y n + 1. Por el método de Euler, un valor
aproximado de y en el punto central es
h h
yn + f (xn , yn ) = yn + k1
2 2 (20.55a)
y una aproximación de la pendiente en el punto central es

h h
k2 = f xn + , yn + k1 .
2 2 (20.55b)
El valor estimado de y(xn+1 ) es entonces

yn+1 = yn + hk2 .
(20.55c)
El procedimiento representado por las ecuaciones (20.55) es de segundo orden en el paso h.

Uno de los métodos numéricos más ampliamente utilizados para resolver ecuaciones
diferenciales es el método de Runge–Kutta de cuarto orden, definido por el conjunto de
ecuaciones

h h
k1 = f (xn , yn ) , k2 = f xn + , yn + k1 ,
2 2

h h
k3 = f xn + , yn + k2 , k4 = f (xn + h, yn + hk3 ) , (20.56)
2 2
h
yn+1 = yn + [k1 + 2k2 + 2k3 + k4 ] .
6
010. Carl David Tolmé Runge (1856–1927) y Wilhelm Kutta (1867–1944), matemáticos alemanes,
publicaron estudios sistemáticos de métodos de ‘sustituciones sucesivas’ en 1895 (Runge) y 1901 (Kut-
ta). Ese trabajo ha sido seguido de muchas elaboraciones y extensiones para dar algunos de los métodos
modernos más ampliamente usados.
EJEMPLO 20.17 Aplique los métodos de Runge–Kutta de órdenes 2 y 4 al problema de valor inicial del
Ejemplo 20.16, con paso h = 0,2.
En la Tabla 20.11 presentamos el resultado de aplicar las relaciones de recurrencia (20.55) para orden 2 y
(20.55) para orden 4.
Tabla 20.11 Ejemplo de métodos de Runge–Kutta
orden n xn yn exacto error orden n xn yn error
2 0 0,0 1,000000 1,000000 0,000000 4 0 0,0 1,000000 0,000000
1 0,2 1,440000 1,442806 0,002805 1 0,2 1,442800 0,000005
2 0,4 1,976800 1,983649 0,006849 2 0,4 1,983636 0,000013
3 0,6 2,631696 2,644238 0,012542 3 0,6 2,644213 0,000025
4 0,8 3,430669 3,451082 0,020413 4 0,8 3,451042 0,000040
5 1,0 4,405416 4,436563 0,031147 5 1,0 4,436502 0,000061
La tabla muestra que el método de segundo orden con paso h = 0,2 es ya considerablemente más exacto
que el método de Euler de primer orden con h = 0,1.
20.10. Sistemas de ecuaciones diferenciales
Un problema que implica ecuaciones de segundo orden o superior puede siempre

reducirse a otro que implique un sistema de ecuaciones de primer orden simultáneas.
Por ejemplo, la ecuación lineal general de segundo orden
d2 y dy
+ p(x) + q(x)y = r(x) (20.57)
dx 2
dx
puede escribirse como dos ecuaciones de primer orden
dy
=z
dx (20.58)
dz
= r(x) − p(x)z − q(x)y
dx
para las funciones de x, y(x) y z(x). Si (20.57) es la ecuación diferencial de un problema
de valor inicial con condiciones iniciales y(x0 ) = y0 e y (x0 ) = z(x0 ) = y1 , las ecuaciones
(20.58) son dos problemas de valor inicial (acoplados) de primer orden. El problema
general consiste en N problemas de valor inicial de primer orden para N funciones,
y1 (x), y2 (x), . . . , yN (x):
dyi
yi (x) = = fi (x, y1 , y2 , . . . , yN ) , i = 1, 2, . . . , N (20.59)
dx
con condiciones iniciales y1 (x0 ) = y0,1 , y2 (x0 ) = y0,2 , . . .
20.10. Sistemas de ecuaciones diferenciales 535
Estos sistemas de problemas de valor inicial de primer orden surgen en la cinética

quı́mica de reacciones con varias etapas, y son por lo tanto de interés considerable para
los quı́micos (los problemas de contorno son en general mucho más difı́ciles). Se resuel-
ven numéricamente mediante alguno de los métodos descritos en el Apartado 20.9 apli-
cado a las ecuaciones, una tras otra, en cada paso. Por ejemplo, para las dos ecuaciones
y (x) = f1 (x, y, z) , z (x) = f2 (x, y, z) , (20.60)
con condiciones iniciales y(x0 ) = y0 y z(x0 ) = z0 , el método de Euler conduce a la

secuencia recurrente de pasos
(1) y1 = y0 + hf1 (x0 , y0 , z0 ) , z1 = z0 + hf2 (x0 , y0 , z0 ) ,

(2) y2 = y1 + hf1 (x1 , y1 , z1 ) , z2 = z1 + hf2 (x1 , y1 , z1 ) ,
(3) y3 = y2 + hf1 (x2 , y2 , z2 ) , etcétera .
El procedimiento es básicamente el mismo que para una sola ecuación.
Ecuaciones rı́gidas
Una ecuación diferencial rı́gida es aquella cuya solución tiene términos que dependen
en la variable independiente de forma muy distinta. Por ejemplo, el problema de valor
inicial de segundo orden
d2 y
= 100y , y(0) = 1, y (0) = −10 , (20.61)
dx2
tiene solución general y = ae−10x + be+10x , siendo la solución particular y = e−10x . La
resolución numérica de la ecuación por alguno de los métodos presentados hasta ahora
da una solución que se comporta correctamente para valores de x próximos a x = 0
pero que ‘explota’ como e+10x a medida que x crece porque los errores de redondeo y de
truncación conducen inevitablemente a una pequeña mezcla con el término no deseado.
Es decir, la solución numérica es de la forma
y ≈ e−10x + e+10x (20.62)
con no nulo.
Los problemas con ecuaciones rı́gidas aparecen en cinética si varios procesos ele-
mentales tiene constantes cinéticas muy distintas. Ası́ por ejemplo, el problema (20.61)
es equivalente a los dos problemas de primer orden
dy dz
= z, = 100y , (20.63)
dx dx
que pueden interpretarse como dos procesos cinéticos de primer orden con constantes
cinéticas 1 y 100. Los problemas rı́gidos pueden a veces resolverse con un cambio de
variable, sin embargo existen métodos numéricos especiales para tratar estos problemas.
20.11. Ejercicios
Apartado 20.2
1. Exprese los siguientes números redondeados a (a) 3 cifras decimales, (b) 4 cifras significativas:
(i) 1,21271 (ii) 72,0304 (iii) 0,129914 (iv) 0,0024988
2. Halle la cota de error absoluto para cada respuesta del Ejercicio 1.
3. Halle la cota de error relativo para cada respuesta del Ejercicio 1.
4. Calcule los valores de las siguientes expresiones aritméticas. Suponiendo que todos los números de las
expresiones han sido redondeados correctamente, halle las cotas de error absoluto de sus respuestas:
(i) 2,137 + 3,152 + 4,672 (ii) 12,36 + 14,13 − 16,38 (iii) 22,7 × 2,59
(iv) 22,7/2,59 (v) (17,43 − 12,34)/14,38
√ √
5. (i) Calcule f (x) = x x + 1 − x con una calculadora de 10 dı́gitos (o similar) para x = 1, 102 , 104 ,
106 , 108 .
x
(ii) Demuestre que la función puede escribirse como f (x) = √ √ .
x+1+ x
Úselo para volver a calcular la función.
ex − e−x
6. (i) Calcule − 1 con una calculadora de 10 dı́gitos (o similar) para x = 1,10−2 , 10−4 , 10−6 .
2x
(ii) Use series de Taylor para hallar una expresión para la función que sea precisa para valores pequeños de
x. Vuelva a calcular con x = 10−2 , 10−4 , 10−6 .
Apartado 20.3
Halle una solución con 4 cifras significativas para las siguientes ecuaciones usando
(i) el método de bisección con los valores iniciales de x que se dan,
(ii) el método de Newton–Raphson empezando en cada caso con x0 = 1:
7. x2 − ln x = 2; 1,5, 1,6 8. e−x = tg x; 0,5, 0,6 9. x3 − 3x2 + 6x = 5; 1, 1,5
10. Para un polinomio de grado n, conocida una raı́z x1 , una segunda raı́z se puede obtener dividiendo
primero el polinomio por el factor (x − x1 ) para obtener un polinomio de grado n − 1. Demuestre que la raı́z
calculada para la ecuación cúbica del Ejercicio 9 es la única real.
Apartado 20.4
Seis puntos de la gráfica de una función y = f (x) vienen dados por los pares (x, y)
(0,0, 0,00000) (0,2, 0,19867) (0,4, 0,38942)
(0,6, 0,56464) (0,8, 0,71736) (1,0, 0,84147)
(la función es sen x).

11. Use interpolación lineal para calcular f (0,04), f (0,26), f (0,5), f (0,81).
12. Use interpolación cuadrática para calcular f (0,04), f (0,26), f (0,81).
13. Construya la tabla de interpolación por diferencias divididas, y úsela para calcular f (0,26).
Apartado 20.5
2,6
dx
14. Halle estimaciones de la integral usando la regla del trapecio (20.33) y la fórmula de error
x 1,0
(20.35), empezando con una banda (n = 1) y doblando el número de bandas (n = 2, 4, 8, . . .) hasta conse-
guir una precisión de 4 cifras.
15. Sabiendo que el error en la regla del trapecio T(h) es

b
f (x) dx − T(h) = Ah2
a
si h es suficientemente pequeño, siendo A una constante, demuestre que

b
1
f (x) dx ≈ [4T(h/2) − T(h)] .
a 3
Use esto para hallar un valor de la integral del Ejercicio 14 que tenga 5 cifras decimales correctas.
16. Use la regla de Simpson (20.36) con 2n = 2, 4, 8, . . . para hallar un valor de la integral del Ejercicio
14 con 4 cifras decimales.
17. El error de la regla de Simpson es Ah4 si h es suficientemente pequeño, siendo A una constante. Si
S(2n) es la fórmula de Simpson con 2n intervalos, demuestre que
b
1
f (x) dx ≈ [16S(2n) − S(n)]
a 15
(extrapolación de Richardson). Use esto y el resultado del Ejercicio 16 con n = 8 para estimar un valor más
exacto de la integral. Compruebe su precisión comparándolo con el valor exacto (ln 2,6).
Use la regla de Simpson con 2n = 2, 4, 8, . . . para hallar valores con 5 cifras decimales de las siguientes
integrales:
1 z
sen x sen x
18. dx Is(z) = dx es la integral de seno.
0 x 0 x
2 z
2 2 2
19. e−x dx fer(z) = √ e−x dx es la función error.
0 π 0
Apartado 20.7
Resuelva los siguientes sistemas de ecuaciones por el método de eliminación gaussiana:
20. x1 − 4x2 = −2 21. 2x1 + x2 − x3 = 6
3x1 + x2 = 7 4x1 − x3 = 6
−8x1 + 2x2 + 2x3 = −8
22. x+ y+ z= 2 23. w + 2x + 3y + z = 5
−x + 2y − 3z = 32 2w + x + y + z = 3
3x − 4z = 17 w + 2x + y =4
x + y + 2z = 0
24. Use eliminación gaussiana para hallar el valor de λ para el cual las siguientes ecuaciones tienen
solución. Resuelva las ecuaciones para ese valor de λ:
x+ y+ z= 2
−x + 2y − 3z = 32
3x + 5z = λ
25. Use eliminación gaussiana para resolver el siguiente sistema de ecuaciones

6,23x1 + 2,11x2 + 1,97x3 = −2,12
1,92x1 + 0,65x2 + 0,34x3 = 0,98
2,01x1 + 3,92x2 − 1,89x3 = 0,02
26. Repita el Ejercicio 25 usando aritmética de 4 cifras, redondeando a cuatro cifras significativas los
resultados de cada operación aritmética:
(i) sin pivote, (ii) con pivote parcial, (iii) con pivote parcial escalado.
Apartado 20.8
Halle la inversa de las matrices siguientes usando eliminación de Gauss–Jordan:
⎛ ⎞ ⎛ ⎞
−23 11 1 −1 1 2
27. ⎝ 11 −3 −2 ⎠ 28. ⎝ 3 −1 1 ⎠
1 −2 1 −1 3 4
29. Dado el sistema de ecuaciones

−x + y + 2z = b1
3x − y + z = b2
−x + 3y + 4z = b3
use el resultado del Ejercicio 28 para expresar x, y, y z en función de los números arbitrarios b1 , b2 y b3 .
Apartado 20.9
Nota: los siguientes ejercicios se pueden hacer usando una calculadora de bolsillo. Sin embargo los cálcu-
los son tediosos y se le aconseja escribir sus propios programas de ordenador para realizar el trabajo.
30. Aplique el método de Euler al problema de valor inicial

y (x) = −y(x), y(0) = 1,
con pasos (i) h = 0,2, (ii) h = 0,1, (iii) h = 0,05 para calcular valores aproximados de y(x) para x = 0,2 ,
0,4 , 0,6 , 0,8 , 1,0. Compárelos con los valores obtenidos con la solución exacta y = e−x .
31. Aplique el método de Runge–Kutta de segundo orden al problema de valor inicial del Ejercicio 30
con pasos (i) h = 0,2 y (ii) h = 0,1.
32. Aplique el método de Runge–Kutta de cuarto orden al problema de valor inicial del Ejercicio 30 con
pasos (i) h = 0,2 y (ii) h = 0,1.
Aplique el método de Euler con paso h = 0,1 a cada uno de los siguientes problemas de valor inicial para
calcular un valor aproximado de y(1). Compruebe la solución exacta que se da y calcule el error:
33. y = 2 − 2y, y(0) = 0; y = 1 − e−2x
y2 1
34. y = , y(0) = 1; y=
x+1 1 − ln (x + 1)
y + x2 − 2
35. y = , y(0) = 2; y = x2 + 2x + 2 − 2(x + 1) ln (x + 1)
x+1
Aplique el método de Runge–Kutta de cuarto orden con paso h = 0,1 a los problemas de valor inicial de
los Ejercicios 33, 34 y 35 para calcular y(1) y el error:
36. Como en el Ejercicio 33 37. Como en el Ejercicio 34
38. Como en el Ejercicio 35

Probabilidad y estadı́stica
La práctica de la estadı́stica, la recopilación y el análisis estadı́stico de datos, se ha

convertido en una actividad ubicua en la vida cotidiana, y el tema de una amplia litera-
tura. Podemos distinguir tres grandes áreas en la actividad estadı́stica:
(i) los problemas prácticos del diseño de experimentos y de la elección y recopilación
de muestras de datos adecuadas (‘buena práctica experimental’);
(ii) la descripción y presentación de los datos y su análisis en función de modelos
teóricos apropiados;
(iii) la utilización del análisis para extraer consecuencias sobre la naturaleza del sistema
investigado, la calidad del experimento y el método de obtención de datos.
Nuestra principal preocupación en este capı́tulo es dar una introducción a la teorı́a de

probabilidades, la teorı́a matemática de la estadı́stica.1 La teorı́a de probabilidades pro-
porciona los modelos teóricos y las herramientas analı́ticas para organizar, interpretar y
analizar datos estadı́sticos. La teorı́a de probabilidades tiene una importancia adicional
en quı́mica, por ejemplo, en la descripción del comportamiento colectivo de conjuntos
de muchas de partı́culas en mecánica estadı́stica, las descripciones mecánico-cuánticas
de cambios de estado y de procesos cinéticos, la interpretación fı́sica de las funciones de
onda, y la enumeración de las maneras de ensamblar las unidades quı́micas básicas para
formar moléculas largas, como en la construcción de polipéptidos a partir de residuos
de aminoácidos. La estadı́stica convencional (‘práctica’) está representada por breves
presentaciones de la estadı́stica descriptiva en el Apartado 20.1 y del método de mı́ni-
mos cuadrados en el Apartado 21.9. Existen varios textos especializados sobre el uso
de métodos estadı́sticos en las ciencias fı́sicas, y el lector puede consultar cualquiera de
01. La teorı́a de probabilidades tiene sus orı́genes en la adivinación y en los juegos de azar de tiempos
remotos y ha seguido siendo utilizada para esos propósitos hasta el dı́a de hoy. Oresme utilizó un argumento
probabilı́stico para concluir que la astrologı́a debı́a ser falsa. La teorı́a moderna surgió de la corresponden-
cia entre Pascal y Fermat en 1654 al hilo de las preguntas que sobre los resultados de lanzar dados le hizo a
Pascal el jugador de Méré. Pascal incluyó sus ideas en el Tratado del triángulo aritmético. Cardano habı́a
tratado anteriormente el lanzamiento de dados en su Liber de ludo aleae (Libro sobre los juegos de azar) de
1526, pero el primer estudio sistemático lo hizo Huygens en su De ratiociniis in aleae ludo (Cálculos en jue-
gos de azar) de 1657. El primer tratamiento sustancial de la teorı́a matemática de probabilidades fue el Ars
conjectandi (Arte de la conjetura) de Jakob Bernoulli publicado en 1713, en el cual se proponı́a también la
aplicación de las probabilidades a las ciencias sociales. De Moivre estudió la ley de errores y la distribución
normal en la segunda edición de Doctrine of chances (1718, 1738, 1756). Euler y d’Alembert escribieron
sobre problemas de esperanza de vida, seguros, loterı́as y otros temas. A la publicación en 1812 del trabajo
definitivo de Laplace Théorie analytique des probabilités (‘en el fondo, la teorı́a de probabilidades es sólo
sentido común en números’) siguió la aplicación extensa de los métodos estadı́sticos, especialmente en las
ciencias sociales.
542 Capı́tulo 21. Probabilidad y estadı́stica
ellos para un tratamiento en profundidad, y para apreciar en su justo valor la potencia y

la amplia variedad de aplicaciones de la estadı́stica en las ciencias, y en muchos otros
campos de estudio.
21.1. Estadı́stica descriptiva
La tabla 21.1 muestra un conjunto de 50 números que representan los resultados de

un experimento que consiste en contar sucesos.
Tabla 21.1 50 valores experimentales

4 6 7 3 6 3 5 7 6 6
3 4 4 5 8 6 5 2 6 5
7 7 4 4 3 0 8 5 4 4
6 2 8 2 7 6 5 5 5 4
9 5 2 2 9 3 6 5 7 4
Hemos obtenido estos valores simulando con un ordenador el experimento de lanzar

una moneda. Cada entrada es el número de caras obtenidas con 10 lanzamientos, pero
podrı́a ser igualmente el número de fallos por dı́a en un proceso industrial o el número
de partı́culas α emitidas cada segundo por una fuente radiactiva.
El primer paso en el análisis de los datos es determinar su estructura: gráficamen-
te mediante unas representaciones adecuadas y numéricamente calculando un número
pequeño de ‘estadı́sticos’, como el valor medio y la desviación tı́pica, que resumen las
propiedades básicas de los datos. En nuestro ejemplo, los resultados posibles del experi-
mento son los 11 enteros de 0 a 10, y el número de veces que se da cada uno de ellos se
denomina su frecuencia. La agrupación de esas frecuencias es la distribución de fre-
cuencias del experimento, y puede representarse tabulada como en la Tabla 21.2 o en un
diagrama de barras como en la Figura 21.1.
Tabla 21.2 10
9
Resultado Frecuencia
8
0 1 7
1 0 6
2 5 5
3 5
4 9 4
5 10 3
6 9 2
7 6 1
8 3
9 2 0 1 2 3 4 5 6 7 8 9 10
10 0
Figura 21.1
21.1. Estadı́stica descriptiva 543
La distribución anterior es una distribución de frecuencias discreta porque los resultados

posibles del experimento toman valores discretos. Sin embargo, muchos experimentos
implican medidas en lugar de recuentos. Los resultados pueden tomar entonces cual-
quier valor dentro de un rango continuo, dando lugar a una distribución de frecuencias
continua. En la Tabla 21.3 mostramos un conjunto de 50 resultados de un experimento
de ese tipo, que pueden representar, por ejemplo, la estatura (en unidades adecuadas)
de una muestra de la población, los pesos de una muestra de productos manufacturados
o los resultados de medidas de una cantidad fı́sica, como una constante cinética o una
constante de equilibrio.
Tabla 21.3 50 valores experimentales

40,6 44,9 47,1 39,5 45,3 38,9 42,9 47,0 45,0 44,2
39,3 40,7 48,4 43,1 48,9 44,9 43,2 37,1 45,3 42,7
47,5 46,5 40,9 40,5 38,9 33,3 49,1 43,7 41,3 41,3
45,3 36,9 49,3 37,3 47,2 44,3 42,9 43,4 43,1 41,1
51,1 43,3 37,9 36,9 53,2 39,3 45,7 42,7 47,1 46,8
Este tipo de información se simplifica dividiendo el rango que contiene todos los valores
de la muestra en un número adecuado de intervalos, llamados intervalos de clase o
grupos, y asignando los valores de la muestra a las clases correspondientes. El número
de valores en cada clase se llama frecuencia de clase. En nuestro ejemplo el menor
valor y el mayor son respectivamente 33,3 y 53,2 , de manera que todos los valores están
entre 32,0 y 54,0 por ejemplo, y esto se divide de manera conveniente en 11 intervalos
de clase, cada uno con ancho 2,0 . Un valor que cae en la frontera de la clase se asigna
a la clase superior. La distribución de frecuencias que resulta se representa en la Figura
21.2 por un histograma de frecuencias y en la Figura 21.3 por un gráfico de frecuencia
acumulada. En este último, cada punto de la gráfica es la frecuencia de todos los valores
hasta el valor en ese punto, incluidos los anteriores.
Figura 21.2 Histograma de frecuencia Figura 21.3 Gráfico acumulado

Tanto el diagrama de barras de la Figura 21.1 como el histograma de la Figura 21.2 mues-
tran distribuciones de frecuencias que son aproximadamente simétricas con respecto al
valor central: las frecuencias decrecen al alejarse del centro. Éste es el resultado que se
puede esperar en muchos tipos distintos de experimentos. Por ejemplo, las estaturas de
los miembros de una población (humana o de otro tipo) se espera que se distribuyan
por igual alrededor de un valor promedio, con estaturas muy pequeñas y muy grandes
menos probables que estaturas cercanas al promedio. De igual manera, medidas ‘igual
de buenas’ de una cantidad fı́sica tienen errores aleatorios, con errores positivos y ne-
gativos igual de probables y con errores grandes menos probables que errores pequeños.
La forma en ‘S’ del gráfico acumulado es tı́pico de esas distribuciones simétricas.
Las representaciones gráficas o los diagramas de los datos proporcionan una infor-
mación cualitativa sobre el centro de una distribución, su anchura y su forma. Esas pro-
piedades se cuantifican fácilmente mediante un pequeño número de estadı́sticos de la
distribución que se pueden calcular, como la media, la desviación tı́pica y la asimetrı́a.
Consideremos un experimento en el que los posibles resultados de las medidas de
una cantidad representada por la variable discreta x forman un conjunto de k valores
{x1 , x2 , . . . , xk } (la población o espacio muestral). Si los resultados posibles son valores
de un rango continuo, el conjunto representa k intervalos de clase. Para un experimento
concreto, supongamos que los resultados de N medidas de x (una muestra de la pobla-
ción) consisten en n1 valores de x1 , n2 de x2 , etcétera. El número total de medidas (el
tamaño de la muestra) es entonces

k
ni = N . (21.1)
i=1
En general, muestras distintas de la misma población (objetivo) tienen distribuciones de

frecuencia distintas, es decir, tienen conjuntos de frecuencias {n1 , n2 , . . . , nk } distintos.
Cada distribución muestral es una aproximación de la ‘verdadera’ distribución objetivo.
Las muestras pequeñas difieren más que las grandes, y un principio fundamental básico
en estadı́stica es que se espera que las diferencias entre distribuciones muestrales se
hagan pequeñas cuando los tamaños de las muestras son suficientemente grandes, y que
las distribuciones muestrales tienden a la distribución de la población objetivo cuando
N → ∞. Esto se llama a veces la ley de los grandes números.
Trataremos los problemas asociados con tamaños de muestra finitos en el Aparta-
do 21.10. Suponemos mientras tanto que N es suficientemente grande para que estos
problemas carezcan de importancia.
Media, moda y mediana
La medida más útil, en general, del valor promedio de x es la media aritmética,
1
N
x= xi , (21.2)
N i=1
donde la suma se hace para los valores de todos los N datos, o
1
k
1
x = (n1 x1 + n2 x2 + · · · + nk xk ) = ni xi , (21.3)
N N i=1
donde la suma se hace para los k diferentes valores (o clases). Otras medidas del prome-
dio, rara vez utilizadas en ciencias, son:
Moda: el valor de la variable que tiene mayor frecuencia (el valor más frecuente). Si este
valor es único, la distribución se llama unimodal, pero algunas distribuciones pueden
tener dos o más valores máximos (distribuciones bimodales o multimodales).
Mediana: el valor de la variable que divide la distribución en dos mitades iguales. Si los
valores están ordenados y N es impar, la mediana es el valor central, y es el promedio de
los dos valores centrales si N es par. Esta cantidad se usa cuando el orden o la disposición
es más importante que el valor numérico.
Las tres medidas del promedio son iguales para una distribución simétrica unimodal.
EJEMPLOS 21.1 Media, moda y mediana
(i) El valor medio de los datos de la Tabla 21.2 es
1
(1 × 0 + 0 × 1 + 5 × 2 + 5 × 3 + 9 × 4 + 10 × 5
50
+ 9 × 6 + 6 × 7 + 3 × 8 + 2 × 9 + 0 × 10) = 4,98 .
Esto es próximo al ‘valor esperado’ del experimento, 5. Se obtiene la misma media sumando todos los
valores de la Tabla 21.1 y dividiendo por 50. La moda es 5, con frecuencia 10, y la mediana es 5 también.
(ii) La media de los datos sin procesar de la Tabla 21.3 es 43,34 . La media que se obtiene del histograma
de la Figura 21.2, usando los valores de los centros de las clases, es
1
(1 × 33 + 0 × 35 + 5 × 37 + 5 × 39 + 7 × 41 + 10 × 43
50
9 × 45 + 7 × 47 + 4 × 49 + 51 + 53) = 43,28 .
Que ambos valores de la media sean casi iguales supone que nuestra asignación de los datos en clases no
ha distorsionado esta medida de la distribución. El intervalo modal es 42–44. La mediana de los datos sin
procesar es 43,1 , y el intervalo mediano es 42–44, como se muestra con las lı́neas discontinuas en la Figura
21.3.
Varianza y desviación tı́pica
La media x de un conjunto de datos da la posición del centro de la distribución pero

no da información sobre la forma o dispersión de los datos alrededor de la media: dos
distribuciones distintas pueden tener la misma media pero dispersiones muy diferentes.
Las medidas cualitativas de la dispersión son el rango, la diferencia entre los valores
extremos de los datos, y el rango intercuartı́lico, que contiene el 50 % de los valores
centrales, con los rangos del primer cuartil y del último cuartil a cada lado con 25 % cada
uno. Estas medidas se usan poco en aplicaciones fı́sicas. Las medidas cuantitativas de la
dispersión se obtienen de considerar las desviaciones xi − x de los datos con respecto a
la media. La desviación media (sumando para todos los datos) es
1 1 1
N N N
(xi − x) = xi − x 1 = x − x = 0,
N i=1 N i=1 N i=1
es decir, las desviaciones positivas y negativas de la media se cancelan entre sı́. La dis-
persión de una distribución se mide casi siempre en cambio en función de los cuadrados
de las desviaciones,
1
N
V(x) = (xi − x)2 (21.4)

N i=1
o, en función de los k valores distintos (o clases),
1
k
V(x) = ni (xi − x)2 . (21.5)

N i=1
La cantidad V(x) se llama varianza de la distribución. La raı́z cuadrada de la varianza

se llama desviación tı́pica, V = s2 , y
1
1
N 2
s= V(x) = (xi − x)2 (21.6)

N i=1
(pero véase el Apartado 21.10 para correcciones de V y de s cuando N no es grande). La

desviación tı́pica tiene las mismas unidades que los datos.
Señalamos que si interpretamos las ni de (21.3) y (21.5) como masas situadas en
posiciones xi sobre una recta, entonces x es la posición del centro de masas, NV(x) es el
momento de inercia con respecto al centro de masas y s es el radio de giro.
EJEMPLOS 21.2 Desviación tı́pica
(i) La media de los datos de la Tabla 21.2 es 4,98 y la varianza es
1
11
V= ni (xi − 4,98)2 = 3,80 .
50 i=1
√
La desviación tı́pica es por lo tanto s = V = 1,95, y el 70 % de los datos está a menos de s de la media.
(ii) Para los datos sin procesar de la Tabla 21.3, x = 43,3 , V = 16,5 y s = 4,06. Para los datos agrupados
de la Figura 21.2, x = 43,3 , V = 16,8 y s = 4,10 . En este caso el 78 % de los datos está a menos de s de
la media.
La varianza (21.5) puede escribirse de manera más sencilla como ‘la media de los cua-
drados menos el cuadrado de la media’:
1
N
V(x) = (xi − x)2

N i=1
1 2 1 2 1
N N N N
2 1
= (x − 2xxi + x ) =
2
x − 2x xi − x 1
N i=1 i N i=1 i N i=1 N i=1
1 2
N
= x − 2x x + x2 .
N i=1 i
1 2
N
Escribiendo x2 = x para la media de los cuadrados, tenemos por lo tanto

N i=1 i
V(x) = x2 − x2 . (21.7)
Desviación absoluta media
Una medida alternativa de la dispersión de una distribución es la media de las des-

viaciones absolutas |xi − x|,
1
N
|xi − x| . (21.8)
N i=1
Si bien esto no suele usarse, puede ser útil para distribuciones muy anchas con un número
significativo de puntos muy alejados del centro.
Asimetrı́a y curtosis
La asimetrı́a de un conjunto de datos se mide por medio de la desviación cúbica

media, con coeficiente de asimetrı́a definido por
N 3
1 xi − x 1
γ= = 3 x3 − 3xx2 + 2x3 . (21.9)
N i=1 s s
Esta cantidad es cero para una distribución simétrica, positiva si una cola se extiende
más hacia la derecha que hacia la izquierda, y negativa si una cola se extiende más hacia
la izquierda que hacia la derecha. Es un estadı́stico importante para distribuciones, pero

escasamente utilizado en las ciencias fı́sicas. De menor uso aún es la curtosis, definida
mediante la media de la cuarta potencia de la desviación.
21.2. Frecuencia y probabilidad
El experimento estadı́stico más sencillo no trivial es uno en que hay sólo dos resulta-
dos posibles: verdadero o falso, encendido o apagado, éxito o fracaso. En la Tabla 21.4
mostramos algunos resultados de lanzar una moneda (una moneda no trucada). N es el
número de lanzamientos, n(C) es el número, o frecuencia, de caras y f (C) = n(C)/N es
la fracción, o frecuencia relativa, de caras.
Los resultados no son sorprendentes porque esperamos que las caras (o las curces) salgan
más o menos la mitad de las veces. Se dice que los dos resultados son ‘equiprobables’.
Este experimento es un ejemplo de experimento aleatorio en el que los resultados de-
penden por completo del ‘azar’ (el problema del significado de las palabras ‘aleatorio’,
‘azar’ y ‘probabilidad’ ha generado una extensa literatura propia). La experiencia mues-
tra que los experimentos aleatorios presentan regularidad estadı́stica, es decir, la frecuen-
cia relativa de un resultado concreto en una sucesión larga de pruebas se mantiene más
o menos igual si se realizan varias de esas sucesiones. En nuestro ejemplo f (C) ≈ 12 y,
para las cruces, f (X) = 1 − f (C) ≈ 12 . El valor teórico de la frecuencia relativa de un
resultado, el valor esperado, es la probabilidad del resultado: P(C) = P(X) = 12 .
Distribuciones de probabilidad
Un conjunto de resultados posibles (o sucesos) {x1 , x2 , . . . , xk } con probabilidades

P(x1 ), P(x2 ), . . . , P(xk ) se denomina una distribución de probabilidad. Las distribucio-
nes de probabilidad son los modelos teóricos (poblacionales) con los que se comparan
las distribuciones de frecuencias (muestrales) para analizar los datos experimentales. La
probabilidad total, la probabilidad de que ocurra algún suceso, es uno (suceso seguro),
de manera que
k
P(xi ) = 1 . (21.10)
i=1
Las dos propiedades más importantes de una distribución de probabilidad son su media
y su varianza (o su desviación tı́pica).
Tabla 21.4
N n(C) f (C)
256 118 0,461
4040 2068 0,512
12000 6062 0,505
24000 11942 0,498
21.3. Probabilidades combinadas 549
La media o valor esperado de x es

k
µ= xi P(xi ) . (21.11)
i=1
Esto es el sumatorio de (21.3) sustituyendo las frecuencias relativas ni /N por las proba-
bilidades. La notación µ se usa más a menudo para la media poblacional, y se reserva x
para una muestra de la población. Otras notaciones que ponen de manifiesto que µ es el
valor esperado son E(x) y x. Si f (x) es una función de x, se define el promedio o valor
esperado de f como

k
E(f ) = f = f (xi )P(xi ) . (21.12)

i=1
La varianza V y la desviación tı́pica σ de la distribución de probabilidad (poblacional)

vienen dadas por *

k
V(x) = (xi − µ)2 P(xi ) = σ 2 = x2 − x2 (21.13)

i=1
(véanse las ecuaciones (21.5) a (21.7) para las cantidades correspondientes para una
distribución de frecuencias).
21.3. Probabilidades combinadas
Sucesos mutuamente excluyentes
Los dos resultados posibles del lanzamiento de una moneda son sucesos mutuamen-
te excluyentes: si se da uno el otro no puede darse. De esta forma, la probabilidad de
que el resultado sea C y a la vez X en cualquier lanzamiento es cero (suceso imposible),
pero la probabilidad de que el resultado sea C o bien X es uno (suceso seguro):
P(C ó X) = P(C) + P(X) = 1 . (21.14)
En general, si A y B son sucesos mutuamente excluyentes con probabilidades P(A) y

P(B), la probabilidad de que el resultado sea el suceso A o el suceso B es
P(A ó B) = P(A) + P(B) (sucesos mutuamente excluyentes). (21.15)
0* La notación σ se usa siempre para la desviación tı́pica poblacional, aunque a veces también se usa
en vez de s para una muestra. Véase el Aparatado 21.10.
EJEMPLO 21.3 Sucesos mutuamente excluyentes
Los posibles resultados de lanzar un dado son los números {1, 2, 3, 4, 5, 6}, cada uno con probabilidad 1
6
(para un dado honrado).
(i) La probabilidad de que el resultado de lanzar el dado sea mayor que 4 (sea 5 ó 6) es
1 1
P( > 4) = P(5 ó 6) = P(5) + P(6) = 2 × = .
6 3
(ii) La probabilidad de que el resultado sea par es
1 1
P(par) = P(2 ó 4 ó 6) = P(2) + P(4) + P(6) = 3 × = .
6 2
Sucesos independientes
Los posibles resultados de lanzar una moneda dos veces son {CC, CX, XC, XX},
cada uno con probabidad 14 . El resultado del segundo lanzamiento (suceso B) es inde-
pendiente del resultado del primero (suceso A), y la probabilidad del suceso A y B es
entonces el producto de las probabilidades de A y de B por separado:
P(A y B) = P(A) × P(B) (sucesos independientes). (21.16)
EJEMPLO 21.4 Halle la probabilidad de sacar 10 con dos lanzamientos de un dado.
De los 36 resultados posibles, los que son iguales a 10 son (5, 5), (4, 6) y (6, 4). La segunda tirada es
independiente de la primera (o si es una única tirada de dos dados, el resultado de cada uno es independiente
del otro). Cada resultado tiene probabilidad 16 × 16 = 361
y por ser mutuamente excluyentes
1 1
P(10) = P(5 y 5) + P(4 y 6) + P(6 y 4) = 3 × = .
36 12
EJEMPLO 21.5 Sistemas independientes
En termodinámica estadı́stica, la probabilidad P(E) de que un sistema esté en un estado con energı́a E es
una función únicamente de E. Dos sistemas sin interacción (independientes) con energı́as E1 y E2 tienen
una energı́a combinada E1 + E2 y una probabilidad combinada
P(E1 + E2 ) = P(E1 ) × P(E2 ) . (21.17)
βE
Una función que cumple esta ecuación es P(E) = e , siendo β una constante; tenemos que
P(E1 ) × P(E2 ) = eβE1 eβE2 = eβ(E1 +E2 ) = P(E1 + E2 ) .
Puede demostrarse que esta función (multiplicada por una constante) es la única que cumple (21.17). En
termodinámica estadı́stica el parámetro β es inversamente proporcional a la temperatura, β = −1/kT,
siendo k la constante de Boltzmann, y la función de probabilidad exponencial describe la distribución de
Boltzmann.
21.4. Distribución binomial 551
21.4. Distribución binomial
La distribución binomial es la distribución teórica que describe los resultados de un

número dado de realizaciones independientes de un experimento con sólo dos resultado
posibles (véase el Apartado 21.2). Vamos a considerar 4 lanzamientos de una moneda (o
cuatro observaciones del espı́n de un electrón). Cada lanzamiento (cada ‘prueba’) tiene
dos resultados posibles con probabilidades iguales: P(C) = P(X) = 12 . Los 4 resultados
posibles de dos lanzamientos son CC, CX, XC y XX, cada uno con probabilidad ( 12 )2 =
1
4
. Estos resultados son de tres tipos: 2 caras con probabilidad 14 , 1 cara y 1 cruz con pro-
babilidad 14 + 14 = 12 y 2 cruces con probabilidad 14 . De la misma manera, los 16 resultados
equiprobables posibles de 4 lanzamientos son de 5 tipos con las probabilidades siguientes:
4 caras
4
1 1
P(4C) = P(CCCC) = = .
2 16
3 caras y 1 cruz
4
1
P(3C + 1X) = P(CCCX) + P(CCXC) + P(CXCC) + P(XCCC) = 4 × .
2
2 caras y 2 cruces
P(2C + 2X) = P(CCXX) + P(CXCX) + P(CXXC)
4
1
+ P(XXCC) + P(XCXC) + P(XCCX) = 6 × .
2
1 cara y 3 cruces
4
1
P(1C + 3X) = P(XXXC) + P(XXCX) + P(XCXX) + P(CXXX) = 4 × .
2
4 cruces
4
1
P(4X) = P(XXXX) = .
2
4
Vemos que los coeficientes del factor 12 de las probabilidades son los números {1,
4, 6, 4, 1} que
constituyen la quinta fila del triángulo de Pascal. Son los coeficientes
binomiales m4 , para m caras y 4 − m cruces. En el caso de n pruebas, el número total de
resultados posibles es 2n (2 por cada prueba) y la probabilidad de m caras y n − m cruces
es

n
n 1
P mC + (n − m)X = Pm = × . (21.18)
m 2
Esta colección de probabilidades se llama distribución binomial (o distribución de Ber-

noulli).
Más en general, la distribución binomial se aplica a cualquier experimento cuyos
resultados puedan tratarse como dos sucesos mutuamente incompatibles. A menudo se
denominan ‘éxito’, con probabilidad p, y ‘fracaso’ con probabilidad q = 1 − p. La
probabilidad de obtener m éxitos en n pruebas es entonces

n m n−m n!
Pm = p q = pm (1 − p)n−m . (21.19)
m m!(n − m)!
La media, la varianza y la desviación tı́pica son

µ = m = np, V(n) = np(1 − p), σ= np(1 − p) . (21.20)
EJEMPLO 21.6 La probabilidad de que el resultado de lanzar 10 veces una moneda consista en m caras
(y 10 − m cruces) es

10
10 1
Pm = ×
m 2
con µ = 5, V = 2,5 y σ = 1,58. En la Tabla 21.5 comparamos la correspondiente distribución binomial
con las frecuencias relativas fm obtenidas de la Tabla 21.2.
Tabla 21.5
m 0 1 2 3 4 5 6 7 8 9 10
Pm 0,001 0,01 0,04 0,12 0,21 0,25 0,21 0,12 0,04 0,01 0,001
fm 0,02 0,00 0,10 0,10 0,18 0,20 0,18 0,12 0,09 0,04 0,00
La media, la varianza y la desviación tı́pica de la distribución de frecuencias son n = 4,98 , V(n) = 3,8 y
s = 1,95 . Las diferencias entre la teorı́a y el experimento se deben al pequeño tamaño de la muestra (50
conjuntos de 10 lanzamientos).
EJEMPLO 21.7 Halle la probabilidad de conseguir al menos 2 ‘seises’ en cuatro tiradas de un dado no
trucado.
La probabilidad de éxito en una tirada es p = 16 , de forma que q = 56 . La probabilidad total de al menos

dos éxitos (2, 3 ó 4) es entonces
P = P2 + P3 + P4

2 2 3 4
4 1 5 4 1 5 4 1
= + +
2 6 6 3 6 6 4 6
4
1 171
= (150 + 20 + 1) = = 0,132 .
6 1294
21.5. Permutaciones y combinaciones 553
21.5. Permutaciones y combinaciones
Los resultados posibles de lanzar una moneda o de tirar un dado son sucesos mu-
tuamente incompatibles con misma probabilidad: cada uno de los k posibles resultados
tiene probabilidad 1/k. El recuento de resultados equiprobables es importante en cien-
cias en varias aplicaciones de la teorı́a de probabilidades y a menudo implica contar las
permutaciones y las combinaciones de conjuntos de objetos o de sucesos. Los teoremas
que siguen son algunos de los resultados importantes de la teorı́a combinatoria.2
Permutaciones
Un conjunto de n objetos distintos (distinguibles) (objetos reales, números, sucesos,

etcétera) puede colocarse en una fila de maneras diferentes, y cada una de ellas se lla-
ma una permutación de los n objetos. Por ejemplo, las tres letras A, B y C pueden
disponerse de 6 maneras diferentes
ABC, ACB, BAC, BCA, CAB, CBA.
Hay 3! = 6 permutaciones de 4 objetos distintos. En general:
1. El número de permutaciones de n objetos distintos es n!.

El primer objeto puede ponerse en n posiciones distintas, dejando n − 1 posiciones para
el segundo objeto (piénsese en n cajas alineadas y n bolas de distintos colores). Los dos
primeros objetos pueden colocarse por lo tanto de n(n − 1) maneras diferentes. El tercer
objeto puede ocupar n − 2 posiciones, con lo que el número de maneras diferentes de
colocar 3 objetos distintos es n(n − 1)(n − 2). En general:
2. El número de permutaciones de n objetos distintos tomados de r en r es
n!
n
Pr = n(n − 1)(n − 2) · · · (n − r + 1) = . (21.21)
(n − r)!
El número total de permutaciones de n objetos (tomados de n en n) es por lo tanto

n
Pn = n! .
02. Un tratamiento temprano de las permutaciones y combinaciones se encuentra en la obra mı́stica

judı́a Sefer Yetsirah (Libro de la creación), posiblemente del siglo II d.C., donde el autor (desconocido)
calcula las maneras de colocar las 22 letras del alfabeto hebreo y el número de combinaciones tomando 2
por vez. El matemático, astrónomo y comentarista bı́blico francés Levi Ben Gerson (1288–1344) dio una
deducción de las reglas combinatorias en su Maasei Hoshev (Arte del calculador) de 1321. También fue
el inventor de la ballestilla, utilizada por los marinos durante siglos para medir la separación angular de
cuerpos celestes.
Combinaciones
En una permutación, el orden de los objetos seleccionados es importante. Una com-

binación, por su parte, es una selección de objetos sin considerar su orden.
3. El número de combinaciones de n objetos distintos tomados de r en r es

n! n
n
Cr = = . (21.22)
r!(n − r)! r
EJEMPLO 21.8 El número de combinaciones de 5 objetos tomados de 3 en 3 es
5! 5·4·3·2·1
5
C3 = = = 10 .
3!2! (3 · 2 · 1)(2 · 1)
Ası́ por ejemplo, para A, B, C, D, E:
ABC, ABD, ABE, ACD, ACE, ADE, BCD, BCE, BDE, CDE.
Hay 3! permutaciones posibles de cada combinación, de manera que 3! × n C3 = nP3 . En general, como
puede verse a partir de (21.21) y (21.22), nPr = r! × n Cr .
El número de combinaciones de n objetos tomados de r en r es lo mismo que el número

de maneras de dividir los n objetos en 2 grupos de r y n − r (2 cajas, una con r objetos,
la otra con n − r). Más en general:
4. El número de maneras de dividir n objetos distintos en k grupos, con n1
objetos en el grupo 1, n2 en el grupo 2, . . . , nk en el grupo k, es
n!
. (21.23)
n1 !n2 !n3 ! . . . nk !
Este resultado es importante en termodinámica estadı́stica cuando se consideran las ma-

neras de distribuir moléculas entre los niveles de energı́a disponibles. Esto da lugar a la
estadı́stica clásica o de Boltzmann que describe el comportamiento de muchos siste-
mas termodinámicos.
Objetos distinguibles e indistinguibles
Hemos considerado los teoremas anteriores para conjuntos de objetos distintos o dis-
tinguibles, y han de ser modificados o reinterpretados si algunos de los objetos o todos
son indistinguibles. Se dice que dos objetos son indistinguibles si no se
aprecia una variación al intercambiarlos, y por lo tanto no da lugar a una permutación
o combinación nueva o diferente. Por ejemplo, el teorema 4 puede reinterpretarse para
el número de permutaciones diferentes de n objetos distribuidos en k grupos, siendo los
21.5. Permutaciones y combinaciones 555
objetos de cada grupo indistinguibles entre sı́, pero distintos de los objetos de los demás
grupos.
5. El número de permutaciones de n objetos indistinguibles es 1.
6. El número de maneras de distribuir k objetos indistinguibles (por ejemplo,
electrones) entre n (≥ k ) cajas (estados cuánticos)
con no más de un objeto por
n
caja (el principio de exclusión de Pauli) es n Ck = .
k
Las n cajas o bien están ocupadas por un elemento o bien están vacı́as, de manera que
el teorema 3 se puede aplicar a las cajas. Este resultado es importante en mecánica es-
tadı́stica para sistemas de partı́culas que cumplen el principio de exclusión de Pauli. Da
lugar a la estadı́stica cuántica llamada estadı́stica de Fermi–Dirac que es importante
en la descripción de algunos sistemas termodinámicos a muy baja temperatura y, por
ejemplo, para describir las propiedades de los electrones de conducción en sólidos.
Grandes números
EJEMPLO 21.9 El número de permutaciones de 52 objetos (una baraja de cartas) es 52! ≈ 8,1 × 1067 .
El número de objetos considerados en algunas aplicaciones de la teorı́a combinatoria en

ciencias puede ser muy grande. Por ejemplo, en termodinámica estadı́stica nos ocupamos
de la disposición de partı́culas en un mol de materia entre los estados de energı́a dispo-
nibles, de manera que n ≈ 1023 , y n! es del orden de 1010 . El cálculo y la manipulación
25
de estos números se simplifica con la aproximación de Stirling3

√ n
n
n! ∼ 2πn , (21.24)
e
donde el sı́mbolo ∼ se lee como ‘es asintóticamente igual a’ y quiere decir que el co-
ciente de ambos miembros de (21.24) tiende a uno cuando n → ∞. En muchos casos lo
que interesa es ln n! en vez del propio n! , y tenemos
1
ln n! ∼ n ln n − n + ln 2πn . (21.25)
2
1
El uso de esta expresión asintótica supone errores de aproximadamente 12n para ln n! si
n es grande (véase el Ejemplo 20.12). Si n es suficientemente grande, podemos tomar
03. James Stirling (1692–1770), matemático escocés y, como Cotes y De Moivre, amigo de Newton.
La fórmula que lleva su nombre apareció en su Methodus differentialis de 1730 y en la Miscellanea analytica
de De Moivre, también de 1730.
ln n! ≈ n ln n − n . (21.26)
En la Tabla 21.6 damos algunos valores.
Tabla 21.6 Aproximación de Stirling

n ln n! ec.(21.25) n ln n − n ln n! − (n ln n − n)
10 15,104 15,096 13,026 2,078

52 156,361 156,359 153,465 2,896
1010 2,2 × 1011 2,2 × 1011 12,7
1023 5,2 × 1024 5,2 × 1024 27,4
La ecuación (21.25) es ya una muy buena aproximación para n = 52, y puede suponerse
exacta para los valores mayores de n que aparecen en la tabla. La diferencia entre (21.25)
y la ‘aproximación peor’ (21.26) es 12 ln 2πn, que sólo crece muy despacio con n. El error
absoluto 27,4 para n = 1023 corresponde al error relativo 5 × 10−24 para ln n! .
En el Ejemplo 21.10 que sigue damos una aplicación importante de la fórmula de
Stirling. Vamos a considerar antes cómo se comporta una distribución, como la distribu-
ción binomial, si los números que aparecen son grandes. En la Figura 21.4 mostramos la
distribución binomial (21.18) para n = 10 y n = 100. Las gráficas son de Pm /Pn/2 frente
a m/n, con valor máximo 1 para m/n = 1/2.
Figura 21.4
Muestran que si n es grande las propiedades de la distribución están dominadas por el

valor en y cerca del máximo. Una medida de este estrechamiento relativo √ de la curva de
la distribución viene dada por la desviación tı́pica relativa σ/n = 1/(2 n).
21.6. Distribuciones continuas 557
EJEMPLO 21.10 Distribución de Boltzmann
En termodinámica estadı́stica, la distribución de Boltzmann para un sistema de n partı́culas con energı́a total
E se deduce a menudo considerando las maneras en que las partı́culas pueden distribuirse entre los estados
de partı́culas. Supongamos que hay k estados disponibles con energı́as 1 , 2 , . . . , k , supongamos que n1
partı́culas tienen energı́a 1 , n2 tienen energı́a 2 , y ası́ sucesivamente. El número de maneras de distribuir
las n partı́culas de esta forma (suponiendo partı́culas distinguibles) viene dado entonces por el teorema 4:
n!
W= . (21.27)
n1 ! n2 ! · · · nk !
Si n es grande, como ocurre en un sistema termodinámico, las propiedades del sistema vienen dominadas
por la distribución para la cual W alcanza su valor máximo. Esta distribución más probable se obtiene
optimizando W con respecto a los números de ocupación (considerados variables continuas) sujeto a las
ligaduras de que el número total de partı́culas n sea constante y de que la energı́a total E sea constante:

k
k
n= ni = constante, E= ni i = constante. (21.28)
i=1 i=1
Empezamos tomando el logaritmo de W y usamos la aproximación de Stirling (21.26) (considerándola

exacta en este caso) para simplificar la expresión:

k
k
ln W = ln n! − ln ni ! = (n ln n − n) − (ni ln ni − ni ) . (21.29)
i=1 i=1
El valor máximo de W sujeto a las ligaduras se obtiene entonces por el método de los multiplicadores de
Lagrange, esto es, hallamos el máximo de la función auxiliar

k
k
φ = ln W − α ni − β ni i (21.30)
i=1 i=1
siendo α y β los multiplicadores (véase el Apartado 9.4). Para obtener un valor estacionario (máximo) con
respecto a ni , tiene que cumplirse
∂φ ∂
= ln W − α − βi = 0 .
∂ni ∂ni
∂
Puesto que ln W = ln ni , tenemos por lo tanto que ln ni = α + βi , de manera que la distribución más
∂ni
probable de partı́culas viene dada para los números de ocupación
ni = eα+βi . (21.31)
Este conjunto de números, interpretando adecuadamente las cantidades α y β, se denomina distribución de
Boltzmann. Ası́, por ejemplo, β = −1/kT, de manera que ni = eα e−i /kT y

k
k
ni = n = eα e−i /kT .
i=1 i=1
La fracción de partı́culas en el estado i es, por lo tanto,

ni 1
= e−i /kT ,
n q

k
donde q = e−i /kT se denomina función de partición.
i=1
21.6. Distribuciones continuas
Las distribuciones que hemos considerado hasta ahora son discretas, implicando una
variable discreta x (o una variable que se considera discreta a efectos prácticos). Cada
valor de esa variable tiene una frecuencia relativa observada y su correspondiente pro-
babilidad teórica. Tales distribuciones describen procesos que implican contar sucesos
discretos, y un ejemplo es la distribución binomial descrita en el Apartado 21.4.
Los procesos que implican medir una variable continua se describen mediante dis-
tribuciones continuas, en las cuales la variable x puede tomar cualquier valor dentro de
un rango continuo, digamos que a ≤ x ≤ b. El número de resultados posibles es enton-
ces infinito, y la probabilidad de un resultado concreto no está definida (la probabilidad
efectiva es cero). En cambio, definimos la probabilidad de que el valor de x esté en un
intervalo especı́fico x1 ≤ x ≤ x2 como:
x 2
P(x1 ≤ x ≤ x2 ) = ρ(x) dx , (21.32)

x1
donde ρ(x) se denomina distribución de densidad de probabilidad (o función de den-

sidad de probabilidad, o densidad de probabilidad a secas). Si el intervalo es suficiente-
mente pequeño, la probabilidad en el intervalo de x a x + ∆x es
P(x → x + ∆x) ≈ ρ(x)∆x (21.33)
alcanzándose la igualdad para un intervalo infinitesimal dx.

La probabilidad total (la normalización de ρ(x)) es
b
P(a ≤ x ≤ b) = ρ(x) dx = 1 . (21.34)

a
La Figura 21.5 ilustra la interpretación gráfica. El área total bajo la curva entre a y b
es igual a 1 y representa la probabilidad total (ecuación (21.34)). La región sombreada
tiene área igual a la probabilidad dada por (21.32).
Figura 21.5
21.6. Distribuciones continuas 559
Las propiedades de una distribución continua se obtienen sustituyendo las sumas para
una distribución discreta por integrales en el rango de valores posibles, con lo que los
valores esperados son entonces (véanse las ecuaciones (21.12) y (21.11) para el caso
discreto)
b
f = f (x)ρ(x) dx , (21.35)
a
con media
b
µ = x = xρ(x) dx . (21.36)

a
Un ejemplo de distribución continua, y probablemente la más importante en estadı́stica,

es la distribución gaussiana (distribución normal) que tratamos en el Apartado 21.7.
EJEMPLO 21.11 Distribución uniforme
La distribución continua más sencilla tiene probabilidad

⎧
⎨ 1 si a < x < b,
ρ(x) = b−a
⎩
0 en el resto.
La densidad de probabilidad es constante en toda la región, y la

probabilidad de que la variable x esté en el intervalo x1 < x < x2 es
proporcional a la longitud del intervalo: Figura 21.6
x2
x 2 − x1
P(x1 < x < x2 ) = ρ(x) dx = .
x1 b−a
EJEMPLO 21.12 Funciones de distribución radiales
Una distribución continua en tres variables tiene una función de densidad de probabilidad ρ(x, y, z) tal que
z2 y2 x2
P(x1 < x < x2 ; y1 < y < y2 ; z1 < z < z2 ) = ρ(x, y, z) dx dy dz
z1 y1 x1
es la probabilidad de que las variables estén en los intervalos dados; es decir, (x, y, z) es un punto de la caja
rectangular cuyos lados son x2 − x1 , y2 − y1 , z2 − z1 . La función de densidad es una función de posición en
el espacio de las variables y ρ(r)dv es la probabilidad de que el punto esté en el volumen dv con posición r.
Algunas distribuciones tridimensionales de importancia en quı́mica son las distribuciones de probabilidad
electrónicas que se obtienen de las soluciones de la ecuación de Schrödinger.
Si transformamos las variables a coordenadas esféricas en el espacio, tenemos que
φ2 θ 2 r 2
P(r1 < r < r2 ; θ1 < θ < θ2 ; φ1 < φ < φ2 ) = ρ(r, θ, φ) r2 sen θ dr dθ dφ
φ1 θ1 r1
es la probabilidad de que el punto esté en la sección del casquete esférico entre los radios r1 y r2 , los
ángulos θ1 y θ2 , y los ángulos φ1 y φ2 (véase la explicación de la Figura 10.6). La probabilidad de que el
punto esté en cualquier parte del casquete entre r1 y r2 es entonces
P(r1 < r < r2 ) = P(r1 < r < r2 ; 0 < θ < π; 0 < φ < 2π)
r2 2π π
= ρ(r, θ, φ) r2 sen θ dθ dφ dr .
r1 0 0
La cantidad entre corchetes,

2π π
p(r) = ρ(r, θ, φ) r2 sen θ dθ dφ ,
0 0

se denomina función de densidad radial, y p(r)dr es la probabilidad de que la variable r = x2 + y2 + z2
tome valor en el intervalo (infinitesimal) de r a r + dr; es decir, que (x, y, z) esté en un casquete esférico de
radio r y espesor dr.
Por ejemplo, el módulo cuadrado de la función de onda de un electrón, ρ(r, θ, φ) = |ψ(r, θ, φ)|2 es una
función de densidad de probabilidad electrónica. Para un electrón en el átomo de hidrógeno, la función de
onda es de la forma (véase la ecuación 14.83)
ψn,l,m (r, θ, φ) = Rn,l (r)Θl,m (θ)Φm (φ)
y la función de densidad radial correspondiente es
p(r) = r2 R2n,l (r) .
21.7. Distribución gaussiana
La distribución gaussiana, también llamada distribución normal, es la distribución

continua con media µ y desviación tı́pica σ cuya función de densidad de probabilidad es
1
ρ(x) = √ e−(x−µ) /2σ
2 2
(21.37)
σ 2π
para todos los valores de x. En la Figura 21.7 mostramos las gráficas para tres valores de
σ.
Figura 21.7
21.7. Distribución gaussiana 561
La función es simétrica con respecto a x = µ. Es ancha si σ es grande y estrecha si σ

es pequeña, y cae hasta aproximadamente 0,6 veces su valor máximo para x = ±σ, los
puntos de inflexión de la función.
Errores
La distribución gaussiana es importante en ciencias porque describe la distribución

del error de una sucesión de experimentos aleatorios.4 Las medidas, por muy precisas
que sean, siempre están acompañadas de errores. Los hay de dos tipos: determinados y
aleatorios. Los errores determinados pueden ser sencillamente equivocaciones o pueden
ser errores sistemáticos debidos a aparatos defectuosos o mal calibrados. Normalmente
es posible descubrir las causas de esos errores y eliminarlos o hacer correcciones que
los tengan en cuenta. Los errores aleatorios, por otra parte, son indeterminados. Pueden
ser debidos a que ‘tiemble el pulso’, a la resolución imperfecta de un instrumento, a las
fluctuaciones impredecibles de la temperatura o del voltaje.
Los errores se deben en general a varias o muchas causas. El teorema del lı́mite cen-
tral de la teorı́a de probabilidades nos dice que una variable producida por el efecto acu-
mulado de varias variables independientes es aproximadamente gaussiana o ‘normal’.
Muchas cantidades observadas son de este tipo: las medidas anatómicas, como la esta-
tura o la longitud de la nariz por ejemplo, se deben a los efectos combinados de muchos
factores genéticos y ambientales, y sus distribuciones son gaussianas. Además, muchas
distribuciones teóricas se comportan como distribuciones gaussianas si los números
√ son
grandes. La distribución binomial tiende a una gaussiana con µ = np y σ = np(1 − p)
cuando n → ∞. Los números aleatorios tienen una distribución uniforme si se los con-
sidera individualmente. Sin embargo, si se toman n por vez, tienen una distribución que
se hace gaussiana cuando n se hace grande.
Función de distribución
La función de distribución de probabilidad F(x) de la distribución gaussiana se define

como
x x
1
F(x) = ρ(x) dx = √ e(x−µ) /2σ dx ,
2 2
(21.38)
−∞ σ 2π −∞
04. La primera descripción de la ley normal del error la dio De Moivre en 1738. Gauss la dedujo en
su Teorı́a del movimiento de los cuerpos celestes de 1809 a partir de un principio de probabilidad máxima:
‘si una cantidad ha sido determinada a partir de varias observaciones, hechas en las mismas circunstancias y
con igual cuidado, la media aritmética de los valores observados proporciona el valor más probable’. Gauss
consideraba que la función (21.37) era la función de error ‘correcta’ porque habı́a sido capaz de deducirla
del principio de mı́nimos cuadrados. Laplace dio una deducción alternativa de la ley normal en 1810, y la
incluyó en su Teorı́a analı́tica de la probabilidad de 1812.
de manera que F(a) es la probabilidad de que la variable tome un valor x < a, y

∞
F(x → ∞) = ρ(x) dx = 1 (21.39)
−∞
para que la probabilidad esté normalizada a la unidad. La probabilidad de que la variable

tenga un valor en el intervalo a < x < b es por lo tanto
b
1
P(a < x < b) = F(b) − F(a) = √ e(x−µ) /2σ dx ,
2 2
(21.40)
σ 2π a
que es igual al área bajo la curva entre x = a y x = b.

La integral que aparece en (21.38) no puede ser evaluada por los métodos del cálculo
descritos en los Capı́tulos 5 y 6, pero se pueden encontrar detalladas tablas de valores en
la mayorı́a de los textos de estadı́stica. Esas tabulaciones son de la función auxiliar
z
1
Φ(z) = √ e−z /2 dz
2
(21.41)
2π −∞
que se obtiene a partir de (21.38) mediante el cambio z = (x − µ)/σ. Con esto, F(x) =
Φ((x − µ)/σ)), y

b−µ a−µ
P(a < x < b) = Φ −Φ . (21.42)
σ σ
De esas tabulaciones se obtiene que las probabilidades de que x esté a menos de σ, 2σ y

3σ de la media son
P(µ − σ < x < µ + σ) = 0,6827 ,

P(µ − 2σ < x < µ + 2σ) = 0,9545 , (21.43)
P(µ − 3σ < x < µ + 3σ) = 0,9973 .
Por lo tanto, es de esperar que cerca del 68 % de los valores observados esté a menos
de una desviación tı́pica de la media (Figura 21.8), 95 % a menos de dos desviaciones
tı́picas, y casi todos a menos de tres desviaciones tı́picas.
Figura 21.8
21.8. Más de una variable 563
21.8. Más de una variable
En muchos experimentos en las ciencias fı́sicas, los resultados consisten en valores

de más de una cantidad por vez. Por ejemplo, un experimento cinético implica medir
pares (c, t) de concentración y tiempo, en termodinámica podemos tener pares (p, T), en
dinámica podemos estar siguiendo el vuelo de un cuerpo midiendo (x, y, z, t) para obtener
la posición y el tiempo. O también, esos cuatro valores pueden ser la estatura, el cociente
intelectual, la nota en un examen de matemáticas y la mejor marca personal en los 100
metros braza para cada estudiante de una clase de quı́mica.
Covarianza y correlación
Sea un experimento en el cual cada resultado consiste en los valores de un par de

variables, (x, y): (x1 , y1 ), (x2 , y2 ), . . . , (xN , yN ), para una muestra de N pares. Podemos cal-
cular las medias x e y, las varianzas V(x) y V(y), y las desviaciones tı́picas σx y σy , para
cada variable por separado. También podemos considerar las dos variables conjuntamen-
te y determinar si depende una de la otra. Una medida de la dependencia de dos variables
es la covarianza, definida por
1
cov(x, y) = (xi − x)(yi − y) = xy − x y , (21.44)
N i

donde xy = N1 xi yi . Si las variables son independientes, xy = x y (cada valor de x puede
darse con cada valor de y) y la covarianza es cero. Si los valores de x por encima de la
media tienden a darse con valores de y por encima de la media, la covarianza es positiva
porque los términos (xi − x)(yi − y) resultan positivos. Si los valores de x grandes se dan
con valores de y pequeños, la covarianza es negativa.
Una medida alternativa de la dependencia es el coeficiente de correlación
cov(x, y) xy − x y
ρx,y = = . (21.45)
σx σy σx σy
Se trata de una cantidad adimensional con valores −1 ≤ ρx,y ≤ +1. Las variables x
e y son independientes si ρx,y = 0, tienen correlación positiva si ρx,y es positiva y
correlación negativa si ρx,y es negativa. Si ρx,y = ±1, x e y están totalmente (100 %)
correlacionadas, y puede existir una relación funcional entre las variables. Las nubes de
puntos de la Figura 21.9 muestran algunos ejemplos de correlación.
Las tres primeras representan resultados de los estudiantes de una clase de primer
curso de quı́mica. La Figura (a) muestra la nota global en quı́mica (vertical) frente a la
inicial del nombre del estudiante (horizontal). No se espera que haya correlación y no
se observa ninguna, siendo ρx,y = 0,03. Hay cierta correlación entre la nota global en
quı́mica y la nota de matemáticas, con ρx,y = 0,52, y una mayor correlación (ρx,y = 0,76)
entre las notas de quı́mica inorgánica y quı́mica orgánica. La Figura (d) es tı́pica de los
resultados que se obtienen si se espera que exista una relación funcional lineal entre las
variables (también puede obtenerse un coeficiente de correlación alto sin que exista una
relación funcional).
Figura 21.9
21.9. Mı́nimos cuadrados
Muchos experimentos en ciencias se realizan para medir pares de cantidades fı́sicas

de las que se sabe, o se sospecha, que tienen una relación funcional, es decir, que existe
alguna función y = f (x). Un objetivo del experimento es por lo tanto confirmar, o deter-
minar, esa relación. Tales experimentos se diseñan a menudo de tal manera que una de
las cantidades, por ejemplo x, puede medirse con exactitud (con error despreciable), que-
dando los errores para y. Por ejemplo, x puede ser el tiempo en un experimento cinético
e y una concentración.
Sea una muestra de datos con N puntos (xi , yi ), i = 1, 2, . . . , N, donde los valores de x
se consideran exactos y donde a cada valor de y se le asocia una medida de la precisión,
σi para yi , por ejemplo. Si los errores de y son aleatorios, σi es la desviación tı́pica (o
una estimación de la desviación tı́pica) de la distribución normal a la cual pertenece
yi ; es decir, yi ± σi supone que alrededor del 68 % de las medidas de y para x = xi
distan menos de σi de la media. En la Figura 21.10 se muestra una gráfica tı́pica de esos
conjuntos de datos.
Figura 21.10
21.9. Mı́nimos cuadrados 565
Cada punto se representa con la barra de error correspondiente y la curva discontinua

indica que los puntos pueden ajustarse a una recta,
y = y(x; m, c) = mx + c , (21.46)
donde m y c son parámetros que determinan la pendiente y el corte de la recta con el eje.
De manera más general, el problema es ajustar los puntos a una función (sencilla) que
sirva de modelo,
y = y(x; a1 , a2 , . . . , ak ) = y(x; a) , (21.47)
con k parámetros variables a = (a1 , a2 , . . . , ak ) que se determinan mediante algún criterio

de ‘mejor ajuste’.
Ajuste por mı́nimos cuadrados sencillo
El método más sencillo y el más utilizado para ajustar un conjunto de puntos a una
función modelo (21.47) consiste en minimizar la cantidad

N

N
D= [ yi − y(xi ; a) ] = 2i
2
(21.48)
i=1 i=1
con respecto a los parámetros a1 , a2 , . . . , ak :
∂D ∂D ∂D
= 0, = 0, . . . , = 0. (21.49)
∂a1 ∂a2 ∂ak
Como se muestra en la Figura 21.11, cada término de la

suma es el cuadrado de la diferencia
i = yi − y(xi ; a)
entre el valor real de y y el predicho, para cada valor de

x = xi .
Este método de mı́nimos cuadrados puede considerarse
como un procedimiento empı́rico para ajustar curvas que
se justifica porque da a menudo resultados razonables, o
puede ser deducido de la teorı́a de errores aleatorios para el
caso particular en que los valores σi son todos iguales; es
decir, cuando todos los yi tienen la misma precisión. Tam- Figura 21.11
bién es el método que debe usarse cuando no hay informa-
ción disponible sobre la precisión.5
05. El método de mı́nimos cuadrados (la méthode des moindres quarrés) fue desarrollado por Le-
gendre en 1805 en relación con la determinación de las órbitas de cometas, y se convirtió rápidamente
Ajuste a una recta
La cantidad que hay que minimizar en el caso del ajuste a una recta y = mx + c es

N
D= [yi − (mxi + c) ] .
2
(21.50)
i=1
Tenemos entonces
∂D N

N

N

N
= −2 xi (yi − mxi − c) = 0 , ó xi yi − m x −c
2
xi = 0 ,
∂m i=1 i=1 i=1
i
i=1
∂D N

N

N

N
= −2 (yi − mxi − c) = 0 , yi − m xi − c 1 = 0.
∂c i=1 i=1 i=1 i=1

N
Dividiendo por N = 1, obtenemos entonces las dos ecuaciones normales

i=1
xy − mx2 − cx = 0
(21.51)
y − mx − c = 0
cuya solución es
xy − x y
m= , c = y − mx . (21.52)
x2 − x 2
La recta resultante pasa por el baricentro (x, y) de los datos.
Si todos los valores yi tienen la misma precisión σ, los parámetros estimados m y c tienen
desviaciones tı́picas dadas por
σ2 σ 2 x2
σm2 = , σc2 = , (21.53)
N x2 − x2 N x2 − x 2
y el ajuste por mı́nimos cuadrados lineal con los errores estimados es y = mx + c con
xy − x y
m= ± σm , c = y − mx ± σc . (21.54)
x2 − x 2
en un método estándar para resolver problemas en astronomı́a y geodesia. El método apareció también en
1809 en la Teorı́a del movimiento de los cuerpos celestes de Gauss. Gauss no citaba a Legendre y afirmaba
que habı́a estado usando el método desde 1795. Legendre argumentó que la primicia en descubrimientos
cientı́ficos puede establecerse únicamente por las publicaciones, y seguı́a acusando a Gauss en 1827 de
haberse apropiado de los descubrimientos de otros.
21.9. Mı́nimos cuadrados 567
EJEMPLO 21.13 Halle el ajuste por mı́nimos cuadrados lineal para los siguientes puntos:
Tabla 21.7
x 0 3 6 9 12 15 18
y 3,3 2,5 2,3 1,7 1,4 0,5 0,2
Tenemos que N = 7, x = 9, y = 1,7, x2 = 117, xy = 64,5/7 = 9,21429, x2 − x2 = 36 y xy − x y =

−42,6/7 = −6,08571. Por lo tanto

√ 117
σm = σ/ 252 = 0, 0630σ , σc = σ = 0,6814σ ,
252
de manera que
−42,6 σ
m= ±√ = −0,1691 ± 0,0630σ ,
252 252

42,6 × 9 117
c = 1,7 + ±σ = 3,2214 ± 0,6814σ .
252 252
Este es el ejemplo representado en la Figura 21.10. Las barras de error corresponden a σ = 0,25 de manera
que el ajuste por mı́nimos cuadrados lineal es para este caso
y = mx + c, con m = −0,1691 ± 0,0158 , c = 3,2214 ± 0,1704 .
Ajuste ji-cuadrado
Si los errores (conocidos) de los valores de y no son todos iguales, con σi para yi ,
hay que sustituir el método de mı́nimos cuadrados sencillo por el método más general
de mı́nimos cuadrados ponderado:
N 2
yi − f (xi ; a)
χ =
2
= mı́nimo. (21.55)
i=1
σi
Cada contribución a la suma está ponderada por el factor 1/σi2 , y tiene por efecto dar
mayor peso a los valores de y más precisos (con valores de σi más pequeños). Esta
situación se produce por ejemplo cuando la precisión con la cual se puede medir varı́a
en el rango de los valores de y, o cuando los datos provienen de medidas hechas en
varios instrumentos distintos. Este método de ajuste se reduce al de mı́nimos cuadrados
sencillo si todos los σi son iguales.
Minimizar χ2 para un ajuste a una recta da las mismas ecuaciones que antes, (21.52) para
m y c y (21.53) para σm y σc , si los promedios se sustituyan por promedios ponderados.
Por ejemplo,
N N
1
N
yi 1
y= yi se sustituye por y= , (21.56)
N i=1 i=1
σi2 i=1
σi2
y en las ecuaciones (21.53)

N

σ2 1
se sustituye por 1 . (21.57)
N i=1
σi2
Los ajustes a otros tipos de funciones se obtienen de la misma forma, pero conducen
a expresiones más complicadas. El método puede generalizarse también a más de dos
variables.
El uso de la ecuación (21.55) se justifica considerando la distribución normal (21.37)
para errores aleatorios. Si los errores en yi son aleatorios y si f (xi ) es el valor exacto (no
conocido) de y para x = xi , entonces
1
ρ(i ) = √ e− /2σ
2 2
i i
(21.58)
σi 2π
es la densidad de probabilidad para el error i = yi − f (xi ). Si los errores son indepen-

dientes, la densidad de probabilidad total para los N valores 1 , 2 , . . . , N es el producto
−1
N 2
√
N
1 i
ρ(1 )ρ(2 ) · · · ρ(N ) = 2π σi exp −
i=1
2 i=1 σi
−1
√ N
1 2
= 2π σi exp − χ . (21.59)
i=1
2
Si se sustituye la función exacta f (x) por una función aproximada, la expresión (21.59)
es una medida de la bondad del ajuste, y la bondad es máxima cuando χ2 es mı́nimo.
Regresión
El ajuste de datos a funciones se llama a menudo regresión en estadı́stica. Las curvas

en torno a las cuales se agrupan los puntos se llaman ‘curvas de regresión’, y sus ecua-
ciones son las ‘ecuaciones de regresión’. La regresión a una recta se denomina lineal.
El nombre tiene su origen en los estudios de Galton6 sobre herencia en los cuales en-
contró que los padres cuya estatura se desviaba de la estatura media de todos los padres
tenı́an, en promedio, hijos cuyas estaturas se desviaban de la estatura media de todos los
hijos en una cuantı́a menor. Llamó a esto una ‘regresión a la mediocridad’, y el término
se usa ampliamente, especialmente en las ciencias sociales. El tipo de datos que intere-
san en las ciencias fı́sicas y el propósito de su análisis estadı́stico son de una naturaleza
06. Francis Galton (1822–1911), nacido en Birmingham. Descubrió la importancia de los anticiclones
en meteorologı́a e influyó en la creación del Meteorological Office y del National Physical Laboratory. Se
le conoce sobre todo por su trabajo sobre herencia. Acuñó el término ‘eugenesia’ y abogó por aplicar la
selección cientı́fica a las poblaciones humanas.
bastante distinta. El término regresión es totalmente inadecuado como descripción de los

usos de la estadı́stica en quı́mica.
21.10. Estadı́stica muestral
En todo experimento concreto, el número de medidas, el tamaño de la muestra, es ne-

cesariamente finito de manera que a partir de los estadı́sticos de la muestra se obtienen
únicamente estimaciones sobre la población o la distribución objetivo. Ası́ por ejem-
plo, la media muestral definida por la ecuación (21.2) es una estimación de la media
poblacional
1
N
µ≈x= xi , (21.60)
N i=1
y la varianza y la desviación tı́pica definidas por las ecuaciones (21.5) y (21.6) son esti-
maciones de la varianza y de la desviación tı́pica poblacionales
1
N
σ 2 ≈ s2 = (xi − x) .
2
(21.61)
N i=1
Las consideraciones sobre la ‘mejor estimación’ en teorı́a muestral nos indican que,
si bien (21.60) es la mejor estimación de µ que se puede obtener de la muestra, (21.61)
subestima la mejor estimación de la varianza en un factor (N−1)/N, y ha de ser sustituida
por la estimación corregida
1
N
σ 2 ≈ s2 = (xi − x) .
2
(21.62)
N − 1 i=1
Ambas estimaciones de σ dadas por (21.61) y (21.62) se distinguen a menudo de-

notándolas respectivamente por sN y sN−1 (o por σN y σN−1 , como en muchos de los
modelos más usados de calculadoras de bolsillo). Se recomienda al lector que comprue-
be siempre qué versión especı́fica de la desviación tı́pica se usa en cualquier trabajo o
aplicación estadı́sticos. La corrección afecta poco a la estimación de σ si N es gran-
de, pero puede ser significativa para muestras pequeñas, digamos que para N < 10, y
siempre es más seguro utilizar (21.62).
EJEMPLO 21.14 Una muestra muy pequeña
Para la muestra de tres valores x1 = a − b, x2 = a y x3 = a + b, la media es x = a y las dos versiones de

s2 dan
1 2 2 1 2
s2N = b + 0 + b2 = b2 , s2N−1 = b + 0 + b2 = b2 .
3 3 2
21.11. Ejercicios
Apartado 21.1
1. Los siguientes datos consisten en el número de caras obtenidas al lanzar 10 veces una moneda:
5, 5, 4, 4, 7, 4, 3, 7, 6, 4, 2, 5, 6, 4, 5, 3, 5, 4, 2, 6, 7, 2, 4, 5, 6,
5, 6, 4, 3, 4, 4, 5, 5, 6, 7, 5, 3, 6, 5, 5, 6, 7, 9, 4, 7, 9, 8, 8, 5, 10.
(i) Construya una tabla de frecuencias y un diagrama de barras para las frecuencias.
(ii) Calcule la media, la moda y la mediana.
(iii) Calcule la varianza y la desviación tı́pica.
2. Los siguientes datos consisten en las notas sobre 100 obtenidas por 60 estudiantes en un examen:
66, 68, 70, 48, 56, 54, 48, 47, 45, 53, 73, 60, 68, 75, 61, 62, 61, 61, 52, 59,
58, 56, 58, 69, 48, 62, 72, 71, 49, 69, 59, 48, 64, 59, 53, 62, 66, 55, 41, 66,
60, 38, 54, 69, 60, 53, 60, 64, 57, 54, 73, 46, 73, 58, 50, 66, 37, 60, 47, 70
(i) Construya un histograma de frecuencias con clases de ancho 4.
(ii) Calcule la media, la moda y la mediana (a) para los datos sin agrupar, (b) para los datos agrupados.
3. Calcule x, x2 , x3 y s para los datos del Ejercicio 1. Calcule a partir de ellos el coeficiente de asimetrı́a.

4. Un conjunto de 10 bolas consiste en 6 bolas rojas, 3 azules y 1 amarilla. Si se saca una bola al azar,
halle la probabilidad de que (i) sea roja, (ii) sea amarilla, (iii) no sea azul.
5. Halle las probabilidades para los siguientes resultados totales de 3 lanzamientos de un dado: (i) 8, (ii)
8 ó 12, (iii) más de 15.
6. Una partı́cula puede estar en tres estados con energı́as 0 , 1 y 2 (0 < 1 < 2 ), y con distribución de
probabilidades Pi = e−i /kT /q a temperatura T.
(i) Exprese la función de partición q en función de T y de las energı́as.
(ii) Halle la distribución de probabilidades (a) en el lı́mite T → 0, (b) en el lı́mite T → ∞.
(iii) Halle la distribución de probabilidades (combinadas) para un sistema de tres partı́culas independientes.
Apartado 21.4
7. Halle la probabilidad de obtener al menos 3 caras al lanzar (i) una moneda neutral, (ii) una moneda
con probabilidad 0,6 de que salga cruz.
8. Un sistema que puede hallarse en distintos estados con energı́as E0 < E1 < E2 < · · · tiene proba-
bilidad 0,1 de estar en un estado excitado (con E > E0 ). Halle la probabilidad de que en 10 observaciones
independientes, el sistema se encuentre en el estado fundamental (con E = E0 ) (i) todas las veces, (ii) sólo
5 veces, (iii) por lo menos 8 veces.
Apartado 21.5
9. Indique todas las permutaciones de 5 objetos distintos tomados de 2 en 2.
10. Indique todas las combinaciones de 5 objetos distintos tomados de 2 en 2.
11. Indique todas las permutaciones diferentes de los 5 objetos A, A, A, B y B.
12. ¿Cuál es el número de permutaciones diferentes de 8 objetos compuestos de 4 de tipo A, 3 de B y 1

de C?
13. Suponiendo un suministro inagotable de los objetos A, B y C, ¿cuál es el número de permutaciones

diferentes de ellos tomándolos de 8 en 8?
14. Sean 3 partı́culas distinguibles, cada una de ellas pudiendo estar en un nivel de energı́a cualquiera
de 4 posibles con energı́as (diferentes) E1 , E2 , E3 y E4 . (i) ¿De cuántas maneras se pueden distribuir las
partı́culas entre los estados? (ii) ¿cuántos estados del sistema tienen energı́a total igual a E1 + E2 + E4 ?
15. Repita el Ejercicio 14 con 3 electrones.
Apartado 21.6
16. La variable x puede tomar cualquier valor en el rango continuo 0 ≤ x ≤ 1 con función de densidad de
probabilidad ρ(x) = 6x(1 − x). (i) Deduzca una expresión para la probabilidad P(x ≤ a), de que el valor de
x no sea mayor que a. (ii) Compruebe que P(0 ≤ x ≤ 1) = 1. (iii) Halle el valor medio x y la desviación
tı́pica σ. (iv) Halle la probabilidad de que x − σ ≤ x ≤ x + σ.
17. La variable r puede tomar cualquier valor en el rango r = 0 → ∞ con función de densidad de
probabilidad ρ(r) = 4r2 e−2r . Deduzca una expresión para la probabilidad P(0 ≤ r ≤ R) de que el valor de
la variable no sea mayor que R.
18. Compruebe que ρ(r) del Ejercicio 17 es la función de densidad radial (en unidades atómicas) del or-
bital 1s del átomo de hidrógeno. Halle (i) el valor medio r, (ii) la desviación tı́pica σ, (iii) el valor de r
más probable.
Apartado 21.9
19. Halle el ajuste a una recta para los puntos siguientes:
x 1 2 3 4 5 6 7 8 9 10 11 12
y 4,4 4,9 6,4 7,3 8,8 10,3 11,7 13,2 14,8 15,3 16,5 17,2
20. Los resultados de las medidas de la constante cinética de la descomposición de un compuesto orgánico
en un rango de temperaturas son:
T/K 282,3 291,4 304,1 313,6 320,2 331,3 343,8 354,9 363,8 371,7
k/10−3 M−1 s−1 0,0249 0,0691 0,319 0,921 1,95 5,98 19,4 57,8 114, 212,
La dependencia de la constante cinética con la temperatura viene dada por la ecuación de Arrhenius
k = Ae−Ea /RT , ó ln k = −Ea /RT + ln A, donde la energı́a de activación Ea y el factor de proporcionalidad
A pueden suponerse constantes para todo el rango experimental de temperaturas. Una representación gráfica
de ln k frente a 1/T deberı́a ser por lo tanto una lı́nea recta.
(i) Construya la tabla de los valores de 1/T y ln k, determine el ajuste lineal por mı́nimos cuadrados de los
datos suponiendo que sólo hay error en k y calcule los valores más adecuados de Ea y de A.
(ii) Suponiendo que los errores en ln k son todos iguales a σ = 0,1, use las ecuaciones (21.53) para hallar
estimaciones de los errores de Ea y de A.
Æ

Integrales indefinidas
Por sencillez se ha omitido de la tabla la constante de integración.

xn+1
xn dx = (n = −1) cotg x dx = ln sen x
n+1 ⎧
x
(ax + b) n+1
⎪
⎪
(ax + b)n dx = (n = −1) ⎨ ln tg 2
a(n + 1) cosec x dx =
⎪
⎪ 1 1 − cos x
dx ⎩ ln
dx = ln x 2 1 + cos x
x π
⎧
⎪ x
⎪ ln tg +
dx 1 ⎨ 4 2
= ln (ax + b) sec x dx =
ax + b a ⎪
⎩ 1 ln 1 + sen x
⎪
ln x 1 2 1 − sen x
dx = (ln x)2
x 2
eax sen bx dx

xn+1 1
xn ln x dx = ln x −
n+1 n+1 a sen bx − b cos bx
= eax
a2 + b2
(n = −1)
eax cos bx dx
e dx = e
x x

a cos bx + b sen bx
= eax
eax+b dx =
1 ax+b
e a2 + b2
a 1
sen x dx = (x − sen x cos x)
2
2
sen x dx = − cos x
1
cos2 x dx = (x + sen x cos x)
2
1
sen (ax + b) dx = − cos (ax + b)
a tg2 x dx = tg x − x

cos x dx = sen x
cotg2 x dx = − cotg x − x

cos (ax + b) dx =
1
sen (ax + b)
a sec2 x dx = tg x

tg x dx = − ln cos x
cosec2 dx = − cotg x
574 Apéndice. Integrales estándar
x
dx
sen ax sen bx dx √ = arccosh
x − a
2 2 a

= − x2 − a2 dx
2 a−b a+b
(a = b) x x
a2
=− arccosh + x2 − a2
cos ax cos bx dx 2 a 2
dx x
√ = arcsenh
a +x
2 2 a
= +
2 a−b a+b
a2 + x2 dx
(a = b)

a2 x x
sen ax cos bx dx = arcsenh + a2 + x2
2 a 2

1 cos (a − b)x cos (a + b)x arcsen x dx = x arcsen x + 1 − x2
=− +
2 a−b a+b

(a = b) arccos x dx = x arccos x − 1 − x2

dx x
= tg
1 + cos x 2
arctg x dx

dx x
= − cotg
1 − cos x 2 1
= x arctg x − ln 1 + x2
2
senh x dx = cosh x arccotg x dx

cosh x dx = senh x 1
= x arccotg x + ln 1 + x2
2
dx
√
tgh x dx = ln cosh x a + bx + x2

b
cotgh x dx = ln senh x = ln x + + a + bx + x 2
2

x dx 2x − b
dx 1 √ = arcsen √
= arctg a + bx − x2 b2 + 4a
+x
a2 2 a a

dx
dx 1
a + x
= ln

ax2 + bx + c
a2 − x2 2a
a − x
x ⎧

dx ⎪ 1
p + q
√ = arcsen ⎪
⎪ ln

si b2 > 4ac
a2 − x2 a ⎨ 2aq
p − q
=
⎪
⎪
⎪
⎩
1
arctg
p
si b2 < 4ac
a2 − x2 dx aq q

2
x x b
b − 4ac
a2 donde p = x + , q2 =
= arcsen + a2 − x2 2a 4a2
2 a 2
Fórmulas de reducción 575
Integrales definidas
∞ a
n! 1 2
xn e−ax dx = a2 − x2 dx = πa
0 an+1 0 4
∞
∞
−ax2 1 π sen ax π
e dx = dx = , (a > 0)
0 2 a 0 x 2
∞
∞
1 · 3 · · · (2n − 1) π cos ax − cos bx b
x e 2n −ax2
dx = dx = ln
2n+1 an a 0 x a
0
∞
∞ b
x2n+1 e−ax dx =
2 n! e−ax sen bx dx =
2an+1 0 a2 + b2
0
∞
a
π a
√
dx
= e−ax cos bx dx =
a2 − x2 2 0 a2 + b2
0
π π
π
sen2 nx dx = cos2 nx dx = (n = 0, n entero)
0 0 2
π
sen mx sen nx dx = 0 (m = n, m y n enteros)
0
π
cos mx cos nx dx = 0 (m = n, m y n enteros)
0
π
sen mx cos nx dx = 0 (para todos m y n enteros)
0
Fórmulas de reducción

xn eax n
x e dx =
n ax
− xn−1 eax dx
a a

sen x cosn−1 x n−1
cosn x dx = + cosn−2 x dx
n n

cos x senn−1 x n−1
senn x dx = − + senn−2 x dx
n n
⎧
⎪ senm+1 x cosn−1 x n−1
⎪
⎨ + senm x cosn−2 x dx
m+n m+n
sen x cos x x dx =
m n

⎪ senm−1 x cosn+1 x
⎪ m−1
⎩− + senm−2 x cosn x dx
m+n m+n

Capı́tulo 1 48. trabajo, J = kg m2 s−2

49. presión, Pa = kg m−1 s−2
Apartado 1.2 50. carga, A s = C
1. 3/8 2. 1/2 3. 1/28 4. −11/18 51. potencial eléctrico, kg m2 A−1 s−3
5. 5/8 6. −1/8 7. −1/2 8. −3/8 52. densidad de flujo magnético,
9. 1/8 10. 3/8 11. 3/2 12. 5/9 T = kg A−1 s−2
13. −3/8 14. −3/8 15. 3/8 16. 15/16 53. 103 m−3 54. 104 m s−2
17. 2/5 18. 1/6 19. −15/16 20. −15/16 55. kg m−3 56. 10−6 kg m s−2
21. 15/16 57. 1017 kg m−1 s−2
58. 10−1 kg m s−3 A−1
Apartado 1.3 59. 102 kg m2 s−2 60. mol m−3
22. 0,01, 0,002, 0,000005, 302,0003

23. 0,22 . . . , 0,166 . . . , 4,33 . . . , Capı́tulo 2
0,047619047619 . . .
24. 0,1428572 > 1/7 > 0,1428571, Apartado 2.1
0,2222223 > 2/9 > 0,2222222,
1. (i) 2 (ii) −4 (iii) 11
0,09090910 > 1/11 > 0,09090909,
2. (i) −1 (ii) 4 (iii) −2
3,141593 > π > 3,141592,
3. (i) 6 (ii) −4 (iii) 6
2,718282 > e > 2,718281
4. 1/2 5. a2 + 3a − 4 6. 6x + 1
25. 120, 720, 5040, 40320, 362880,
7. (i) −7 (ii) −1 (iii) −13
3628800
26. 3, 120, 10 Apartado 2.3
Apartado 1.6 8. 2x + 4 9. x2 − 3x
27. a5 28. 1 29. a−1 30. a 31. a9 10. 2x2 − x − 6 11. 2x3 − 11x2 − x + 30
32. a12 33. a−6 34. a8 35. a5/6 36. a3 12. x(2x + 3) 13. (x + 2)(x − 2)
37. a2 b4 38. (a2 + b2 )1/2 39. ±3 40. 4 14. (2x + 3)(2x − 3) 15. (x + 5)(x + 1)
41. 8 42. 3−4 = 1/81 1 x+2
16. 17.
3x + 2 x+4
18. x + 2 19. x + 1
Apartado 1.7 x2 + 3x + 2 2x − 1
20. 2 21.
x +x+2 x−2
43. densidad, kg m−3
44. concentración, mol m−3
Apartado 2.4
45. aceleración, m s−2
46. momento, kg m s−1 22. x = y + 2

47. fuerza, N = kg m s−2 23. x = ± y2 − 1, y ≥ 1
578 Soluciones de los ejercicios
√ 10 2 1
24. x = ± y − 1, y ≥ 1 52. + −
y 9(x − 1) 3(x − 1)2 9(x + 2)
25.
1+y
3 + 2y 1+y
26. 27.
3y − 2 1 − 2y Apartado 2.7

pVm
28. B = Vm −1 54. (x, y) = (2, 1) ; se cortan
RT
0 2 55. (x, y) = (7/13, 4/13) ; se cortan
Λm − Λm
29. c = 56. inconsistente ; rectas paralelas
K 1 2
57. (x, y) = (1 ± √ , ± √ ); la recta y la
θ 3 3
30. p =
K(1 − θ) curva se cortan dos veces
58. (x, y) = (1, 0) doble ; la recta y la
curva se tocan
Apartado 2.5 59. compleja ; la recta y la curva no se
tocan
32. 1 + 2x + 3x2 33. 1 + 2x + 3x2
2 6 12 60. las 3 rectas se cortan en (x, y, z) =
34. + 2 + 3 35. 1 + x + 2x4 + 6x9
x x x
√ (2, −2, −1)
36. Dibuje la recta de Λm frente a c.
Entonces −K es la pendiente y Λ0m el
corte con el eje. Capı́tulo 3
r − 1
37. Dibuje la recta de frente a
ρ(r + 2) Apartado 3.1
1
. Se obtiene µ2 de la pendiente y α 1. c = 13,
T
del corte con el eje. 12 5
sen A = , cos A = ,
38. 1, 2 39. 1/2, −2 13 13
12 13
40. −1/2 (doble) 41. 1/2, −2 tg A = , cosec A = ,
5 12
1 7 1 i 13 5
42. ± 43. ± √ secA = , cotgA =
2 12 2 12 5 12
5 12
1 y+1 sen B = , cos B = ,
44. −1± 1+8 13 13
4 y−1 5 13
tg B = , cosec B = ,
Ka 4c 12 5
45. α = 1+ −1 13 12
2c Ka secB = , cotgB =
12 5
π 87π 2π 13π
2. , , ,
Apartado 2.6 36 180 3 9
3. 18◦ , 67,5◦ , 157,5◦ , 20,25◦
7 1 1
46. 2 − 6. (i) √ , − √ , −1
x+3 2 2
26 1 1
47. 3x2 − 8x + 15 − 6. (ii) − √ , − √ , +1
x+2 2 2
48. (ii) x = 1, −2/3 1 1
6. (iii) − √ , √ , −1
47. (iii) (x − 1)2 (3x + 2) 2 2
49.
1
−
1 7. (i) π (ii) 2π/3 (iii) 2π
3(x − 1) 3(x + 2)
2 1
50. +
3x 3(x + 3) Apartado 3.2
4 3 √
51. −
x+2 x+1 8. c = 5,
Soluciones de los ejercicios 579
1
A = arcsen √ ≈ 26,57◦ , 10. (iii) ln 32 (iv) ln 2
5
π 25. (i) ln x 2
(ii) ln (2x − 3)
B=π− − A ≈ 108,43◦
4 10. (iii) 0 (iv) x (v) x2
9. (i) 2 sen 2θ cos 2θ
RT p
26. h = − ln
9. (ii) cos2 2θ − sen2 2θ Mg p0
−
10. (i) cos 2θ cos 3θ − sen 2θ sen 3θ p◦
27. p = exp [(µ − µ−
◦
)/RT]
10. (ii) cos 2θ cos 3θ + sen 2θ sen 3θ γ
11. 1 − 8 sen2 x + 8 sen4 x

1
12. (i) ( sen 8x − sen 2x)
2 Capı́tulo 4
1
10. (ii) ( cos 2x − cos 8x)
2 Apartado 4.3
13. 0,9396
nπ 1. x = 1, esencial
14. , n = ±1, ±3, ±5, . . .
6 2. x = 0, evitable
3. x = −3, evitable
Apartado 3.3 4. x = 3, esencial; x = 0, evitable
3 3√3 3 3√3 5. x = 0, esencial
16. (i) , (ii) − , 6. x = 0, evitable
2 2 2 2 2
√
17. (i) 13, arctg − ≈ −33,7◦ 7. x = 0, esencial
√ 2 3
10. (ii) 13, arctg + π ≈ 213,7◦
3 Apartado 4.4
Apartado 3.4 8. 1/3 9. 1 10. 1/2 11. 0

12. ∞ 13. ∞ 14. − ln 2
π π π
19. , , , π 15. − ln 3 16. 2 17. 0 18. 0
6 2 3
1
20. arcsen ≈ 14,48◦ ,
4

1 Apartado 4.5
arcsen = 30◦ ,
2
19. 3x2 20. 0 21. 8
3
arcsen ≈ 48,59◦ , 22. 4x + 3 23. −4/x3
4
arcsen (1) = 90◦
Apartado 4.6
Apartado 3.5 24. 6x2 − 8x 25. 3x1/2
26. x−2/3 27. −2x−3/2
x x2 x3 x4 √
22. (i) 1 − + − + 28. −9/2 x5 29. 5(1 + x)4
3 18 162 1944
x5 x 2x
− (ii) 0,71653 30. √ 31.
29160 2+x 2 (3 − x 2 )2
23. (i) ni /nj = e (i −j )/kT
(ii) 1 −3(4x − 3)
32.
2(2x2 − 3x − 1)3/2
2
33. −2e−2x 34. (4x − 3)e2x −3x+1
Apartado 3.6 4x − 3
35. 36. 4 cos 4x
2 2x2 − 3x + 1
24. (i) ln 6 (ii) ln
3
37. 2sec2 2x Apartado 4.9

38. −(4x − 3) sen (2x − 3x + 1)
2
65. y = 15x4 + 16x3 − 9x2 + 2x − 2
39. cos x e sen x
40. − tg x
2 y = 60x3 + 48x2 − 18x + 2
41. 6x sen (3x2 + 2)e− cos (3x +2)
1 1 y = 180x2 + 96x − 18
42. + y = 360x + 96, y = 360
2+x 3−x
2 cos 2x + 2 sen x cos x 1 1 2 6
43. 66. , − 2 , , − 4
sen 2x + sen2 x x x x3 x

3x2 (– 1)n/2 2n cos 2x (n par)
44. 6x(2 + x)1/2 + 67. y(n) =
2(2 + x)1/2 (n+1)/2 n
(– 1) 2 sen 2x (n impar)
45. cos x cos 2x − 2 sen x sen 2x
46. 4sec2 4x cos2 2x − 4 tg 4x sen 2x cos 2x
2
47. (2x + 4x3 )e2x +3 Apartado 4.10
4x3 + 15x2 + 2 68. (x, y) = (3/2, −5/4) mı́n
48. −
(2x + 5)2
69. (3, 0) mı́n; (5/3, 32/27) máx;
12x + 3x3 2
49. 50. √ (7/3, 16/27) inflexión
(2 + x2 )3/2 1 − 4x2 70. (0, 3) mı́n; (– 1, 5) máx;
2x 1
51. 52. √ (– 1/2, 4) inflexión
1 + x4 x(1 + x)
71. (0, 3) máx; (2, −13) mı́n;
1 −V 3 (1/2, 11/4) inflexión
53. 54.
4y − 3 nRT(V + 2nB) 72. (a) A = De Re12 , B = 2De Re6
(V − nb)2 12 6
55. − Re Re
nRT (b) U(R) = De −2

−1 R R
nRT 2n2 a
56. − + 2kT 1 k2
(V − nb)2 V3 73.
m
74. (a)
k2 − k1
ln
k1
Apartado 4.7 Apartado 4.11

x 3 + 2x 1 − y/x 75. v = ṡ = 4t − 3; a = s̈ = 4
57. − 58. − 59.
y 3y2 1 + ln xy
2xy − 3
2 76. θ̇ = 3t2 − 3t − 1; θ̈ = 6t − 3
60.
2y − 2/y2 − 2x2 y
Apartado 4.12
Apartado 4.8 77. dy = 2dx 78. dy = (6x + 2)dx
−7 3 − x 1/3
61. 79. dy = cos xdx 80. dV = 4πr2 dr
3(3 − x)(4 + x) 4 + x
2x 1 2
62. + −
1 + x2 2(x − 1) 2x + 1
6x + 2 Capı́tulo 5
−
3(3x + 2x − 1)
2
Apartado 5.2
(1 + x2 )(x − 1)1/2
× x4
(2x + 1)(3x2 + 2x − 1)1/3 1. 2x + C 2. + x2 + 3x + C
1 2
2sec2 2x 1 3
63. cotg x − 6x tg (x2 + 1) + 3. 3x + 2 ln x − + C 4. x5/3 + C
2 3 tg 2x x 5
3 2/3 1 3x
× sen1/2 x cos3 (x2 + 1) tg1/3 2x 5. x + C 6. e + C
2 3
3 1 Capı́tulo 6
7. − e−2x + C 8. − cos 4x + C
2 4
9. ln C(x − 1) 10. ln
C Apartado 6.2
3−x 1
x3 1. (6x − sen 6x) + C
11. + 3x − 18 12
3 1
2. − cos 6x + C
12
1
Apartado 5.3 3. − ( cos 5x + 5 cos x) + C
10
3 5 1
12. 2 13. 14. ln 4. (2 cos 2x − cos 4x) + C
8 4 8
1 −3
1
15. e − e−15 16. 0 5. (2 sen 2x − sen 4x) + C
3 8
1 40 3 1
17. − 18. 19. 20. 6.
1
(3 sen 7x + 7 sen 3x) + C
2 3 2 3 42
3
21. ln 2 22. ln π 2
2 7. 8. 0 9. −
4 4 3
24. γ = exp (bp2 /2RT) 25.
3
26. (i) impar (ii) par (iii) par
Apartado 6.3
26. (iv) impar (v) impar (vi) par
1
26. (vii) ninguna de las dos cosas; 11. (3x + 1)6 + C
18
26. par: 3x2 + 1; impar: 2x
1
26. (viii) ninguna de las dos cosas; 12. − cos (4x − 1) + C
4
1 −x
26. par: e + e+x ; 1 2 4
2 13. 3x + 2x + 5 + C
1 −x 8
26. impar: e − e+x (ix) par 3
2 14. −e−(x +2x)
+C
15. ln (x2 + x + 2) + C
Apartado 5.6 1
16. sen4 x + C
4
28. (i) +1 (ii) 66 (iii) 60
17. − ln ( cos x) + C
l3 l2 3l l5
29. (i) (ii) (iii) (iv) 2
3 3 4 80 18. (1 + ex )3/2 + C
3
19. ln ( ln x) + C
Apartado 5.7 1
20. − (4 − x2 )3/2 + C
3
30. 7
k k 21. − 4 − x2 + C
31. (i) (x2 − 1) (ii) (x2 − 1)
2 2 1
k 2 k 22. (2x − 1)3/2 + C
31. (iii) (x − 1) (iv) − (x2 − 1) 3
m 2 1
23. (2x3 + 3x − 1)4/3 + C
31. (v) 0 (vi) estacionario 4
1
24. sen (3x2 − 1) + C
6
Apartado 5.8 25. − ln (1 − sen x) + C
1
32. (i) p(V2 − V1 ) 26. e2 sen x + C
2
V2 − nb 1 x
31. (ii) nRT ln 27. arctg +C
V1 − nb 2 2

1 1 1
− na2 − 28. arcsen x − x 1 − x2 + C
V1 V2 2
√ √
29. 2 x − arctg x +C (x + 4)2
58. ln +C
1 2 (x + 3)
30. ln 10 31. −4 32. 1 (x − 2)
6 3 59. ln +C
π 1 1 7 (3x + 1)
33. 34. 35.
4 2 2 (x − 2)4
60. x + ln +C
(x − 1)
1
Apartado 6.4 61. (7 ln (x + 1) − 26 ln (x + 2)
2
36. −x cos x + sen x + C +21 ln (x + 3)) + C
2
37. 3(x2 − 2) sen x − x(x2 − 6) cos x + C 1 x +3
62. ln +C
1 1 2 x2 + 4
38. (x + 1)2 sen 2x + (x + 1) cos 2x √
2 2 1 x+2− 2
1 63. √ ln √ +C
− sen 2x + C 2 2 x+2+ 2
4
64. arctg (x + 2) + C
x2
39. (2 ln x − 1) + C 1
4 65. ln (x2 + 4x + 5)
( ln x + 1) 2
40. − +C −2 arctg (x + 2) + C
x
1 2
41. (2x − 2x + 1)e2x + C 66. x − 2 ln (x2 + 4x + 5)
4
1
42. − e−x ( sen 2x + 2 cos 2x) + C +3 arctg (x + 2) + C
5 ax
e
(a cos bx + b sen bx) + C 1 x+2
43. 67. arctg (x + 2) + 2 +C
(a2 + b2 ) 2 x + 4x + 5
44. 1 45.
1
46. −
1
1 + tg θ/2
4 9 68. ln +C
1 1 − tg θ/2
47. 2 − 3e−π
13 1/2 1
T 8kT 69. arctg (2 tg θ/2) + C
48. 49. 2
Θr πm
70. ln (1 + tg θ/2) + C
Apartado 6.5

1
50. senn x dx = − senn−1 x cos x
n
Capı́tulo 7

n−1
+ senn−2
x dx Apartado 7.2
n
sen6 x cos3 x sen6 x cos x 1. ur = 1 + 3(r − 1) = ur−1 + 3
52. +
9 21 2. ur = 3r = 3ur−1
sen4 x cos x 4 sen2 x cos x r
− − 1 ur−1
105 315 3. ur = − =−
5 5
8 cos x
− +C 1 3 2 4 8
315 4. 0, , 1, 5. 1, , ,
1/2 2 2 3 9 27
1 1 3kT
54. 55. 2 56. 1 1 1 1 1 1 1
60 T m 6. , , , 7. 1, , ,
3 8 15 24 2 6 24
8. 0 9. ∞ 10. 0 11. 1
Apartado 6.6 √
3 1+ 5
1 (2x − 1) 12. 0 13. 14.
57. ln +C 5 2
7 (x + 3)
Apartado 7.3 9x2 9x3 27x4

54. 1 − 3x + − +
2 2 8
15. 325 16. 1093 8x 32x 3
32x4
n 1 55. −2 − − 4x2 − −
17. (11 − 5n) 18. (4n − 1) 3 5 3
2 3
n x3 x5 x7 x9
3 1 56. x + + + +
19. 1− 20. n2 x 2 6 24 120
2 3 ∞
x3 1 − x2n 1 − (2x)n 57. (1 − x) , 0 < x < 2
n
21. 22.
1 − x2 1 − 2x n=0

∞
(x − 2)n
23. (i) 1, 3, 3, 1 (ii) 1, 4, 6, 4, 1 58. e 2
, para todo x
n=0
n!
23. (iii) 1, 6, 15, 20, 15, 6, 1
(x + 1)3 (x + 1)5
24. 1 − 3x + 3x − x2 3
59. (x + 1) − + − ··· ,
3! 5!
25. 1 + 12x + 54x2 + 108x3 + 81x4 para todo x
∞ n
1 2−x
26. 1 − 20x + 160x2 − 640x3 60. ln 2 − , 0<x≤4
n=1
n 2
+1280x4 − 1024x5
1 v 2 3 v 4
27. 81 − 216x + 216x2 − 96x3 + 16x4 61. E = m0 c2 1 + +
2 c 8 c

28. 729 + 1458x + 1215x2 + 540x3 5 v 6
+ + ···
10 16 c
+135x4 + 18x5 + x6 29.
11 1
lim (E − m0 c2 ) = m0 v2
v/c→0 2
Apartado 7.4 a
62. (i) 1, b − , b2
−1 RT
34. 1 − e−θv /T a ab a2
23. (ii) 1, b − , b2 − + 2 2
RT RT 2R T
Apartado 7.5
Apartado 7.7
35. converge 36. diverge
x x2 5x3 5x4
37. converge 38. converge, para todo a 63. (i) 2 + − + −
12 288 20736 248832
39. diverge 40. diverge 23. (ii) 2,0800821
√
41. converge 42. diverge 23. (iii) 2,0800832 < 3 9 < 2,0800840
2 1
64. 1 65. 66. −2 67.
3 2
Apartado 7.6
43. 4 44. 1 45. 1
√
46. 1 47. 0 48. 1 + 3 Capı́tulo 8
x x2 5x3 10x4
49. 1 + − + − Apartado 8.2
3 9 81 243
50. 1 − x2 + x4 − x6 + x8 1. 6 − 2i 2. 4 3. 6i
x 3x 2
5x 3
35x 4 4. 18 + 4i 5. −8 − 6i 6. 41 − 38i
51. 1 + + + +
2 8 16 128 5 3
7. 10 8. −i 9. − i
1 x x2 x3 x4 34 34
52. − + − + 5 12 12 24
3 9 27 81 243 10. + i 11. + i
4x6 4x10 8x14 4x18 13 13 25 25
53. 2x −
2
+ − + 12. (i) 3 + 2i (ii) 2 + 3i
3 15 315 2835
1 7
(iii) (3 + 2i) 38. −1 39. −2i 40. π
13 12
√
13. ±1 + 2i 14. 1 ± i 3 5 3
41. π 42. π 43. 144
√ 1 √ 12 2
15. −2, 1 ± i 3 16. 3, −3 ± i 3 27 −iπ/3 4 iπ/3
2 44. e 45. e
4 27
√
Apartado 8.3 3 3 3 √
46. (i) − 1 +i + 3
√ 2 2
π √
17. 2, − 3 3 3 √
4 23. (ii) +1 +i − + 3
√ 1 2 2
18. 5, π + arctg −
2 48. cos a cosh b − i sen a senh b
π
19. 2, − 50. (ii) C = A + B, D = i(A − B)
3
3 1
20. , π + arctg √
2 2
π π
Apartado 8.6
21. 2, − 22. 3, 0 23. 3, 1
6

2 51. ±1, ±i 52. ± √ (1 + i)
π π π 2
24. 1, −
2
25. 2 cos + i sen
2 2 √ π π
53. −1 + i, 2 cos + i sen ,
26. 3( cos π + i sen π) 12 12
√ π π √ 7π 7π
27. 2 cos − + i sen − 2 cos − i sen
4 4 12 12
π
28.
π
2 cos + i sen 1 √ 1 √
6 6 54. ±i, ± 3+i , ± 3−i
2 2
3π 3π
29. 6 cos + i sen
4 4
Apartado 8.7
4π 4π
30. 4 cos + i sen 55.
1
56.
6
3 3 5 65

5π 5π
31. (i) 6 cos + i sen
6 6
2 π π
23. (ii) cos + i sen Capı́tulo 9
3 6 6
3 π π
23. (iii) cos − i sen Apartado 9.1
2 6 6

17π 17π 1. (i) 0 (ii) 16 (iii) 36
32. (i) 5 cos + i sen
12 12 3
(ii) −
π
2. (i) 1 (iii) 2
π 2
23. (ii) 5 cos + i sen
12 12
1 π π Apartado 9.3
23. (iii) cos − i sen
5 12 12
1 3. 4x, −2y 4. 2x − 3, 4y + 2
33. (i) 81i (ii) − i 5. 2e 2x+3y
, 3e 2x+3y
81
35. 128 cos8 θ − 256 cos6 θ 6. 2x cos (x2 − y2 ), −2y cos (x2 − y2 )
2
+160 cos4 θ − 32 cos2 θ + 1 7. [2x cos (xy) − y sen (xy)]ex ,
2
−xex sen (xy)
Apartado 8.5 ∂z
8. = 4xy − sen (x + y)
√ ∂x
3 3 1 3 ∂z
36. √ + √ i 37. − i = 2x2 − sen (x + y)
2 2 2 2 ∂y
∂2z 27. −
1
(x dx + y dy + z dz)
= 4y − cos (x + y) r3
∂x2
∂ z
2 28. sen θ sen φ dr + r cos θ sen φ dθ
= − cos (x + y)
∂y2 +r sen θ cos φ dφ
∂ z2
∂ z2
= 4x − cos (x + y) =
∂x∂y ∂y∂x
Apartado 9.6
∂z
9. = [ sen (x + y) + cos (x + y)]ex−y y x b2 x − a2 y + abc
∂x 29. −2 + − 30.
∂z x y ab(x + y + z)
= [ − sen (x+y) + cos (x+y)]ex−y
∂y 31. (1 − sen u) cos (u + v)
∂ z
2 5x4 y nR
= 2 cos (x + y)ex−y 32. − 5 33.
∂x2 x − cos y V − nb

∂2z 2 y2 − x2
= −2 cos (x + y)ex−y 34.
∂y2 y

∂2z ∂2z x + 3y
= −2 sen (x + y)ex−y = 35. x cos y − sen y
∂x∂y ∂y∂x x+y
x y z 2x + yz
15. , , 17. −
r r r 2y + xz Apartado 9.7
2

na 2n3 ab
18. nR p− 2 + , 42. exacto 43. no exacto 44. exacto
V V3

n2 a 2n3 ab
−(V − nb) p− 2 +
V V3 Apartado 9.8
64 √
46. (i) , (ii) 20 47. 31 48. − 5
Apartado 9.4 3
19. (1, 2) punto silla

2 4
20. − , máximo 2
3 3 49. 24 50. 1 − e−R
3
21. (1, 2) mı́nimo
40 a5 51
(– 1, 2) punto silla 51. 52. 53. −
3 15 2
22. (1, 2) mı́nimo
(– 1, −2) máximo Apartado 9.11
√ 1 π 315π π
(0, ± 3) puntos silla 54. +1 55. 56.
4 4 8 8
1 2 2 1 2 2
23. , , , − ,− ,−
3 3 3 3 3 3

1 1 1
24. , ,
2 3 6 Capı́tulo 10

1 1
25. λ = α : √ , 0, − √ , Apartado 10.2
2 2

√ 1 1 1 1. 0, 0, 1 2. 0, 2, 0
λ = α ± 2β : ,±√ ,
2 2 2 3 3 π
3. − , , −1 4. 1, , 0
2 2 2
π π
5. 1, ,
Apartado 9.5 2 2
2
26. 2x dx + 2y dy 6. 3, arccos , arctg (2)
3

8 1
7. 9, arccos − , arctg (– 4) 7. − cos 2x + ax + b
9 4
8. x4 + ax2 + bx + c 9. 6 10. 2e4
6 3
8. 7, arccos , π + arctg 1 − cos 2πt
7 2 11. 5 12. x(t) = +t
4π 2 m
12 4
9. 13, arccos − , π + arctg −
13 3
Apartado 11.3
−1
Apartado 10.3 13. y2 = 2x3 + c 14. y =
2x2 + c
3
10. r 11. r2 sen2 θ cos 2φ 15. y = cex 16. y3 = 3ex + c

12. tg2 θ 13. r2 3 cos2 θ − 1 1
17. y = 18. y = cx
1 + cex
x3
19. y = −x + 1 20. y2 + y = −x
Apartado 10.4 3
21. y = x − 1 22. y = − ln (2 − ex )
a2 b3 c4 1
14. 1 15. 16. 17. 1
24 2 23. y = x( ln x + 2)

4πa5 2πa2 1 1
18. 19. 20. 480π 24. y2 = − x2
5 3 3 x
√ x
2 25. y = 4x4 ln
4
22. 6 a0 23. √ 24. 180 2
81 π
27. y = cex − 2x − 5
28. (x − y)2 − 4y = c
Apartado 10.5
25. 2y3 z4 + 6x2 yz4 + 12x2 y3 z2 Apartado 11.4

n(n + 1) 2a(n + 1)
26. − + a rn e−ar
2
29.
1 1
− n−1 = (n − 1)kt
r2 r xn−1 a
e−r k1 a
27. 30. x(t) = 1 − e−(k1 +k−1 )t
r k1 + k−1
1 2 2
28. − − 2 e−r/3 sen θ sen φ
9 3r r Apartado 11.5

1 3
29. xze−r/2 − 1
2
4 r 32. y = 2 + ce−2x 33. y = ce2x −

4
34. y = e−3x (x + c)
Apartado 10.6 2
35. y = 2 (x2 sen x + 2x cos x
x
πa4 R2
39. 40. πe−R +R+1 −2 sen x + c) 36. y = ce−1/x − 4
16 3
1 37. y = cos x + c cos2 x
41. πe−R (1 + R) b n+1
2 38. y = + ce−ax /(n+1)
a
xn+1
39. y = + cx−a
a+n+1
Capı́tulo 11
Apartado 11.2 Apartado 11.6

x3 e−3x ak1 k2 e−k1 t − e−k3 t

+c 6. − +c 40. [C] =
5.
3 3 k2 − k1 k3 − k 1
√ π
e−k2 t − e−k3 t (ii) A = 2, δ =
− 4
k3 − k2

ak1 k2 1
41. [C] = 1 − e−k1 t Apartado 12.6
k2 + k 3 − k1 k1

1 2 nπx
− 1 − e−(k2 +k3 )t 17. (i) ψn (x) = cos si n impar,
k2 + k3 l l

2 nπx
ψn (x) = sen si n par
Apartado 11.7 l l
42. (i) I(t) = ce−t/RC

E0 ωC Apartado 12.8
31. (ii) I(t) = ce−t/RC +
1 + (ωRC)2 1 x
20. y = ae3x + be−2x − −
× (cos ωt + ωRC sen ωt) 4 2
21. y = e4x (a + bx)
1
− (1 + 9x + 12x2 + 8x3 )
32
Capı́tulo 12 1
22. y = ae3x + be−2x + e−3x
3
Apartado 12.2 23. y = ae2x + (b − x)e−x

x2
1. y = ae−2x + be2x/3 24. y = e4x a + bx +
2
2. y = e3x (a + bx)
25. y = ae3x + be−2x
3. y = a cos 2x + b sen 2x 1
− (5 cos 3x + sen 3x)
39
Apartado 12.3 3x
26. y = a − cos 2x + b sen 2x
4
4. y = ae3x + be−2x 1 x 1
√ √ 27. y = ae3x + be−2x − − + e−3x
5. y = e2x (ae2 5x
+ be−2 5x
) 4 2 3
1
6. y = e4x (a + bx) − (5 cos 3x + sen 3x)
39
7. y = e−3x/2 (a + bx)
8. y = e−2x (a cos x + b sen x)
√ √
9. y = e−3x/2 (aei 11x/2
+ be−i 11x/2
) Capı́tulo 13
Apartado 13.2
Apartado 12.4
2 1 1. y = a0 (1 + x + x2 + x3 + · · · )
10. x = et + e−2t
3 3 (3x)2 (3x)4
2. y = a0 1 + + + ···
1 2! 4!
11. x=e−3(t−1) (t − 1) 12. x= sen 3t
3 a1 (3x) (3x)3 (3x)5
13. x = et ( cos t − sen t) 14. 2e−2x + + + + ···
3 1! 3! 5!
b sen 3x (0 < x < π) = ae3x + be−3x
15. y =
0 (0 ≤ x, x ≥ π) con a0 = a + b, a1 = 3(a − b)
x4
Apartado 12.5 3. y = a1 x + a0 1 − x2 −
3

b x6 x8
16. (i) A = a2 + b2 , δ = arctg − − − ···
a 5 7
x3 1 · 4x6
4. y = a0 1 + + Apartado 13.6
3! 6!
1 · 4 · 7x9 13. H6 (x) = 64x6 −480x4 +720x2 −120
+ + ···
9!
2x4 2 · 5x7
+a1 x + + Apartado 13.7
4! 7!
2 · 5 · 8x10
14. r2 − n2 = 0, r = ±n
+ + ···
10!
Apartado 13.3
Capı́tulo 14
5. (i) r1 = −1, r2 = 3/2
Apartado 14.2
23. (ii) y1 = x−1 a0 + a1 x + a2 x2 + · · ·
a
23. y2 = x3/2 A0 +A1 x+A2 x2 + · · · 1. f = [ sen (bx + vbt) + sen (bx − vbt)]
2
6. (i) r1 = r2 = 0 2. V = A + Bx (c/D = 0)

23. (ii) y1 = a0 + a1 x + a2 x2 + · · · V = Aeαx + Be−αx α2 = c/D > 0
y2 = y1 ln x+A0 x+A1 x2 +A2 x3 + · · · V = A cos αx + B sen αx

7. (i) r1 = −2, r2 = −3 α2 = −c/D > 0

23. (ii) y1 = x−2 a0 + a1 x + a2 x2 + · · · 4. f = aeb(x−2t)
y2 = ky1 ln x
5. f = a exp [b x2 + y2 ]
+x−3 A0 + A1 x + A2 x2 + · · ·
6. f = aeαx + be−αx
x2 x3 × (c cos αy + d sen αy) para (α = 0)
8. y1 = 1 + x + + + · · · = ex
2! 3!
y2 = ex ln x ó f = (a + bx)(c + dy)
senh 3πx
7. f = aebx−y/b 8. sen 3πy
senh 3π
πx
Apartado 13.4 9. T = 3 sen exp [ − Dπ 2 t/l2 ]
l
1
10. P6 (x)= 231x6 −315x4 +105x2 −5
16 Apartado 14.4
11. (1 − 2xh + h2 )−1/2
8 lπx
1 10. ψlmn = sen
= 1 + xh + (3x2 − 1)h2 abc a
2 mπy nπz
1 3 × sen sen
+ (5x − 3x)h3 + · · · b c
2 2
h2 l m2 n2
= P0 (x) + P1 (x)h + P2 (x)h2 Elmn = + 2 + 2
8m a2 b c
+P3 (x)h3 + · · · para l, m, n = 1, 2, 3, 4, . . .
1
12. P14 = 35 cos3 θ − 15 cos θ sen θ Degeneración 1 si a, b, c son iguales,
2
15 3 si 2 iguales, 6 si todos distintos
P4 =
2
7 cos2 θ − 1 sen2 θ
2
P34 = 105 cos θ sen3 θ
Apartado 14.5
P44 = 105 sen4 θ
11. (i) E0,1 = 5,7831, E±1,1 = 14,6819,
E±2,1 = 26,3744, E0,2 = 30,4715, Apartado 15.5

E±3,1 = 40,7070, E±1,2 = 49,2186 8l2 1 nπx
10. T(x, t) = sen
π n impar n
3 3 l

Apartado 14.7 × exp −Dn2 π 2 t/l2

∞
nπx nπvt
15. y(x, t) = An sen cos
n=1
l l
∞ Apartado 15.6
nπx
16. T(x, t) = An sen e−iay − e−iby
n=1
l 11. g(y) = √
ix 2π
× exp [ − Dn2 π 2 t/l2 ]
2 a

∞
12. g(y) =
17. u(x, y) = An enπx − e−nπx π a2 + y2
n=1
× sen nπy
Capı́tulo 16
Apartado 16.2
Capı́tulo 15 1
1. (i) b − a, a − b (ii) (a + b + c + d)
Apartado 15.2 4
aa3 a5 26. (iii)
1
(b + c)
1
1. c1 = 3 + + + ··· 2
3 5 7 26. (iv) b + λ(c − b), λ arbitrario
1 1 5
2. (i) P0 + P1 + P2
4 2 16
Apartado 16.3
Apartado 15.3 √ √
2. (2, 2, 0), 8 3. (2, −5, 1), 30
Q2 √ √
4. V = , Q2 = qr2 (3 cos2 θ − 1) 4. (2, 3, 1), 14 5. (– 1, 0, 3), 10
4π0 R3
6. 0, 0 7. Ambos (– 1, 5, −1)

1 2
Apartado 15.4 8. (3, 6, 9), (– 1, −2, −3), , ,1
3 3
1 2 cos x cos 3x cos 5x
5. (ii) + − + 9. (– 1, 0, 4) 10. Ambos (3, −6, 12)
2 π 1 3 5 √ √ √

−
cos 7x
+ ··· 11. 27, 14 + 29 12. (1, 1, 1)
7
sen x 13. 2i − j 14. −2i + j
sen 2x sen 3x
6. (ii) 2 − +
1 2 3 15. (i) 4i (ii) λj
sen 4x
− + ··· 26. (iii) λi (λ arbitrario)
4
π2 cos x cos 2x 16. (i) (2, −1, 0) (ii) (1, −1, 1),
7. (ii) −4 −
3 12 22 (0, 0, 0), (– 2, 2, −2)
cos 3x
+ 2 − ··· 17. (i) 2i + 6j − 6k, (ii) i + 3j − 3k
3

8l2 πx 1 3πx 18. 2i + 6t j 19. ( − 2 sen 2t, 3 cos t, 2)
9. 3 sen + 3 sen
π l 3 l 20. (i) v = −3yi + 3xj + 3k,

1 5πx a = −9(xi + yj)
+ 3 sen + ···
5 l
1 Capı́tulo 17
26. (ii) − √ (xi + yj); en el plano xy,
2
26. hacia el eje z.
26. (iii) Circular en el plano xy con vel.
26. angular ω = 3, y en la dirección z con 1. 5 2. 6 3. 2 4. 1
26. vel. 3k; esto es, movimiento en una 5. (i) elemento menor cofactor
26. hélice a derechas en torno al eje z. (1, 1) −1 −1
(1, 2) 3 −3
(1, 3) −2 −2
Apartado 16.5 (2, 1) 5 −5
(2, 2) −2 −2
21. Ambos 7 22. 4 23. −6 (2, 3) −3 3
24. Ambos 10 25. (0, 12, 4) 26. 5 (3, 1) −2 −2
(3, 2) −7 7
27. 0 28. −3 29. 2
(3, 3) −4 −4
31. −1 32. π/3, 2π/3, π/4 26. (ii) −13 (iii) −13
√
33. (i) 5i − 5j (ii) 5 2 (iii) π/4 6. −11 7. 6 8. −4
34. (i) 4 (ii) −3 (iii) 0 35. −6 9. 30 10. 4 11. 144 12. 0
Apartado 16.6
Apartado 17.4
36. 9i − j + 3k, −9i + j − 3k
13. x = 1, y = 2, z = 3
37. 7i, 7 38. Ambos 11i − 2j − k
14. x = y = z = 0
39. 0 40. −7
15. w = x = y = 1, z = −1
41. −14j − 21k, i − 18j − 9k
16. x = (z + 3)/5, y = (7z − 4)/5,
45. 5 46. (i) (0, 0, −7) z arbitrario
26. (ii) (1, 0, 0) (iii) (0, −5, 0) 17. k = 1, x = z/3, y = −2z/3,
47. 5i + 6j 48. −3i + 18k z arbitrario
50. (i) ω = ωk (ii) v = −ωyi + ωxj 18. λ = 1, y = −x; λ = 3, y = x

26. (iii) l = mω[ x2 + y2 k − xzi − yzj] 19. λ = 3, y = 0, x = −z;
√ √
52. l = 2m x2 + y2 ωk = Iω ω λ = 3 − 2, x = z, y = − 2z;
√ √
λ = 3 + 2, x = z, y = 2z
20. λ = 0 (doble);
Apartado 16.8
x = 3z − 2y, y, z arbitrarios;
53. 4xi + 6yj − 2zk λ = 8, x = −z, y = −2z, z arbitrario
54. (y + z)i + (x + z)j + (x + y)k
−3/2
55. – x2 + y2 + z2 (xi + yj + zk)

Apartado 16.9 3 2 −2

21. 0 −3 7 = −225
56. 3, 0 57. 0, i + j + k 58. 0, 0 0 0 25

1 0 1 1 Capı́tulo 18

0 1 1 0
22. =1
0 0 −1 0 Apartado 18.2
0 0 0 −1 ⎛ ⎞
1 0
−5 4 2
2 4 6 3 1. ⎝−2 3 ⎠ 2.
3 −1 −1
3 4
0 −1 −10 1
23. = −320 ⎛ ⎞
3 0 0
0 0 42 − 13
2 1 0

0
3. ⎝ 0 2 0 ⎠ 4.
0 0 80 21 0 0 −1
−2 4
24. fila 1 = 3 × fila 3 ⎛ ⎞

2
25. fila 1 = fila 2 + fila 3 5. 0 −3 1 6. ⎝ 5 ⎠
−2
28. ψ1 (x1 )ψ2 (x2 )ψ3 (x3 )ψ4 (x4 )
−ψ1 (x1 )ψ2 (x2 )ψ3 (x4 )ψ4 (x3 ) 7. imposible 8. −6 9. 4
10. imposible 11. 4 12. 4
+ψ1 (x1 )ψ2 (x3 )ψ3 (x4 )ψ4 (x2 )
−ψ1 (x1 )ψ2 (x3 )ψ3 (x2 )ψ4 (x4 )
+ψ1 (x1 )ψ2 (x4 )ψ3 (x2 )ψ4 (x3 ) Apartado 18.3
−ψ1 (x1 )ψ2 (x4 )ψ3 (x3 )ψ4 (x2 )
1 −1 −1
13.
+ψ1 (x2 )ψ2 (x1 )ψ3 (x4 )ψ4 (x3 ) 2 0 4

−ψ1 (x2 )ψ2 (x1 )ψ3 (x3 )ψ4 (x4 ) 1 −3 7
14.
−2 6 4
+ψ1 (x2 )ψ2 (x3 )ψ3 (x1 )ψ4 (x4 )
−1 3 −7
−ψ1 (x2 )ψ2 (x3 )ψ3 (x4 )ψ4 (x1 ) 15.
2 −6 −4
16. imposible
+ψ1 (x2 )ψ2 (x4 )ψ3 (x3 )ψ4 (x1 )
3 −6 2 −1 −6
17. 18.
−ψ1 (x2 )ψ2 (x4 )ψ3 (x1 )ψ4 (x3 ) 0 12 6 −3 8
⎛ ⎞
+ψ1 (x3 )ψ2 (x1 )ψ3 (x2 )ψ4 (x4 ) 2
19. ⎝ 2 ⎠ 20. 2 2 −1
−ψ1 (x3 )ψ2 (x1 )ψ3 (x4 )ψ4 (x2 )
−1
+ψ1 (x3 )ψ2 (x2 )ψ3 (x4 )ψ4 (x1 )
−4 3
21. imposible 22.
−ψ1 (x3 )ψ2 (x2 )ψ3 (x1 )ψ4 (x4 ) −22 9
⎛ ⎞
+ψ1 (x3 )ψ2 (x4 )ψ3 (x1 )ψ4 (x2 ) 6 −14 20
23. ⎝−2 7 −16 ⎠
−ψ1 (x3 )ψ2 (x4 )ψ3 (x2 )ψ4 (x1 )
−2 5 −8
+ψ1 (x4 )ψ2 (x1 )ψ3 (x3 )ψ4 (x2 ) ⎛ ⎞
−5 22
−ψ1 (x4 )ψ2 (x1 )ψ3 (x2 )ψ4 (x3 ) 24. ⎝ 4 −12 ⎠
2 −8
+ψ1 (x4 )ψ2 (x2 )ψ3 (x1 )ψ4 (x3 )
⎛ ⎞
−ψ1 (x4 )ψ2 (x2 )ψ3 (x3 )ψ4 (x1 ) 9 0 0
25. imposible 26. ⎝ 0 4 0 ⎠
+ψ1 (x4 )ψ2 (x3 )ψ3 (x2 )ψ4 (x1 ) 0 0 1
−ψ1 (x4 )ψ2 (x3 )ψ3 (x1 )ψ4 (x2 )
3 −2 3 −6
27. 28.
0 4 0 4
⎛ ⎞ ⎛ ⎞
0 0 0 1 0 0
29. ⎝−6 −15 6 ⎠ 30. −17 51. (i) ⎝ 0 cos θ − sen θ ⎠
2 5 −2 0 sen θ cos θ
⎛ ⎞
0 −6 2 ⎛ ⎞
31. −17 32. ⎝ 0 −15 5 ⎠ cos θ 0 sen θ
0 6 −2 26. (ii) ⎝ 0 1 0 ⎠
− sen θ 0 cos θ
33. imposible 34. −10 2
⎛ ⎞
−3 −1 0 1 1 0 0
37.
2 −1
38.
−10 7 26. (iii) ⎝ 0 1 0 ⎠
0 0 −1
−1 1 0 0
39.
1 1
40.
0 0 ⎛ ⎞
−1 0 0
41. (i) [Ix , Iy ] = iIz (ii) 22 1 26. (iv) ⎝ 0 1 0 ⎠
0 0 1
[Iy , Iz ] = iIx
[Iz , Ix ] = iIy ⎛ ⎞
1 0 0
−2c −2d 4 −2 26. (v) ⎝ 0 −1 0 ⎠
42. 43. d
c d −2 1 0 0 1
⎛ ⎞
−1 0 0
26. (vi) ⎝ 0 −1 0 ⎠
Apartado 18.4 0 0 −1

44.
1 1 3 ⎛ ⎞
14 −4 2 1 0 0
⎛ ⎞ 52. (i) ⎝ 0 cos θ sen θ ⎠
1 ⎝ 1 −1 1 0 − sen θ cos θ
45. 4 −10 −8 ⎠
6 −1 7 5 ⎛ ⎞
cos θ 0 − sen θ
⎛ 1 1 ⎞ 26. (ii) ⎝ 0 1 0 ⎠
√ 0 √ sen θ 0 cos θ
⎜ 2 2 ⎟
⎜ ⎟
46. singular 47. ⎜
⎜ 0 1 0 ⎟
⎟
⎝ −1 1 ⎠ 26. (iii) hasta (vi) A−1 = A
√ 0 √ ⎛ ⎞
2 2 cos φ − cos θ sen φ sen θ sen φ
⎛ ⎞
2 −4 0 0 53. (i) ⎝ sen φ cos θ cos φ − sen θ cos φ ⎠
1 ⎜−1 3 0 0 ⎟ 0 − sen θ − cos θ
48. ⎝
2 0 0 2 −1 ⎠
0 0 −4 3 ⎛ √3 √ ⎞
2
1
4
− 4
3
⎜ √ ⎟
26. (ii) ⎜
⎝− 2
1
4
3
− 43 ⎟
⎠
√
Apartados 18.5 y 18.6 0 − 23 − 21
⎛ √ ⎞
50. (i) x = x cos θ − y sen θ
1 5 3
y = x sen θ + y cos θ 26. (iii) ⎝ −1 ⎠
4
z = z 2
⎛ 1 1 ⎞
√ √ 0 1 1,8 1,2 0,4
⎜ 2 2 ⎟ 54.
⎜ ⎟ 2 2,6 3,4 2,8
⎜
26. (ii) ⎜ −1 1 ⎟
√ √ 0 ⎟
⎝ 2 2 ⎠

0 0 1 −1 −1 −2 −2
55.
2 3 3 2

4 6 6 4 1 0 −1 0
56. (iii) E A
1 1 2 2 0 1 0 −1

7 10 11 8 1 0 −1 0
(iii) B C
57.
0 −1 1 2 0 −1 0 1
⎛ ⎞
1 0 0
58. E = ⎝ 0 1 0 ⎠
0 0 1
√
Capı́tulo 19
⎛ ⎞
1 3
−
⎜ 2 − 0 ⎟ Apartado 19.1
⎜√ 2 ⎟
A=⎜ ⎜ 3 1 ⎟ 1 1 3 1
⎝ 2 − 0 ⎟
⎠ 1. ,
2 14 −4 2 −2
0 0 1 ⎛ ⎞ ⎛ ⎞
1⎝ 6 −5 1 1
⎛ √ ⎞
1 3 2. −6 8 −2 ⎠ , ⎝ 2 ⎠
− 0 2 2 −3 1 3
⎜ ⎟
⎜ √2 2 ⎟ ⎛ ⎞ ⎛ ⎞
B=⎜ ⎜ − 3 1 ⎟ −2 −1
⎝ 2 − 0 ⎟
⎠
1 1 1
2 1⎜ 1 1 −2 1 ⎟ ⎜ 2 ⎟
3. ⎝
1 ⎠ ⎝ 3 ⎠
,
0 0 1 3 −2 1 1
⎛ ⎞ 1 1 1 −2 1
−1 0 0
C=⎝ 0 1 0 ⎠
0 0 −1 Apartado 19.2
⎛ √ ⎞
1 3 1 1 1 1
⎜ 2 0 ⎟ 4. 2, √ ; 4, √
2 −1 1
⎜√ ⎟ 2 2
D=⎜ 3 1 ⎟
⎜ − 0 ⎟ 1 2 1 1
⎝ 2 2 ⎠ 5. 1, √ ; 4, √
5 −1 2 1
0 0 −1
⎛ √ ⎞ 6. 2,
1
; −3,
0
1 3 0 1
⎜ − 0 ⎟
2 2
⎜ √ ⎟ 1 1 1
F=⎜ ⎜− 3 1 ⎟
⎟ 7. 2, ; 3, √
⎝ 2 − 0 ⎠ 0 2 −1
2

0 0 −1 1 1
8. 3 (doble), √ (sólo un vector)
2 1
59. (i) E = identidad ⎛ ⎞ ⎛ ⎞
A = 180◦ en torno al eje Oz 1 ⎝ 1 ⎠ 0
9. −1, √ −1 ; 1, ⎝ 0 ⎠ ;
B = 180◦ en torno al eje Ox 3 1 1
C = 180◦ en torno al eje Oy ⎛ ⎞
1 1
3, √ ⎝1 ⎠
3 1
se aplica
26. (ii) E A B C primero ⎛ ⎞ ⎛ ⎞
1 ⎝ 1 ⎠ √ 1 √1
E E A B C 10. 0, √ 0 ; 2 2, ⎝ 2 ⎠ ;
2 −1 2 1
A A E C B
⎛ ⎞
B B C E A √ 1 √1
−2 2, ⎝− 2 ⎠
2 1
C C B A E
√ 1/2 √ √
12. Si x =
3+ 5
y X−1 = √5 −√5
1
3
2 2 2 2
−1/2
c = 2(1 + x2 ) 1 0
, entonces 26. (ii) D =
0 4
⎛ ⎞
1
⎜ x ⎟ 26. (iii) det D = 4 = det A,
λ1 = α + xβ, x1 = c ⎝ ⎠;
x 26. (iii)tr D⎛= 5 = tr A ⎞
1 1 0 1
⎛ ⎞
x 17. (i) X = ⎝−1 0 1 ⎠ ,
⎜ 1 ⎟ 1 1 1
λ2 = α + (x − 1)β, x2 = c ⎝ ⎠;
−1 ⎛ ⎞
⎛ −x ⎞ −1 1 ⎝ 1 −1 0 ⎠
x X = −2 0 2
⎜−1 ⎟ 2 1 1 0
λ3 = α − (x − 1)β, x3 = c ⎝ ⎠;
−1 ⎛ ⎞
x −1 0 0
⎛ ⎞ 26. (ii) D = ⎝ 0 1 0 ⎠
1
0 0 3
⎜ −x ⎟
λ4 = α − xβ, x4 = c ⎝
x ⎠ 26. (iii) det D = −3 = det A,
−1
⎛ ⎞ 26. (iii)tr D = 3 = tr A
1
13. (ii)
1
√ ⎝ 1 ⎠ ⎛ ⎞
1 1 1
3 √
1 ⎜ 2 2 2 ⎟
⎜ ⎟
26. (iv) por ejemplo, ⎜ 1 −1 ⎟
⎛ ⎞ ⎛ ⎞ 18. (i) X = ⎜
⎜ 0 √ √ ⎟,
⎟
⎜ 2 2 ⎟
1 ⎝ 1 ⎠ 1 ⎝ 1 ⎠ ⎝ −1 1 1 ⎠
26. √ −1 , √ 1 √
2 0 6 −2 2 2 2
14. (i) λ1 = 2, λ2 = 3 ⎛ ⎞
1 −1
√ 0 √
26. (iii) derecha:
⎜ 2 2 ⎟
⎜ ⎟
1 −2 1 ⎜ 1 1 1 ⎟
26. x1 = √
1
, x2 =
0 26. X −1
=⎜
⎜ √ ⎟
⎟
5 ⎜ 2 2 2 ⎟
26. (iii)izquierda: ⎝ 1 −1 1 ⎠
√
0 1 1 2 2 2
26. y1 = , y2 = √
1 5 −2 ⎛ ⎞
0 √0 0
26. (ii) D = ⎝ 0 2 2 √0
⎠
Apartados 19.3 y 19.4 0 0 −2 2

1 1 1 26. (iii) det D = 0 = det A,
15. (i) X = √ ,
2 −1 1
26. (iii)tr D = 0 = tr A
1 1 −1
26. X−1 = √
2 1 1 19. Q = 4y21 + 16y22 ,

2 0 √3
26. (ii) D = y1 2
− 12 x1
0 4 = √
y2 1 3 x2
26. (iii) det D = 8 = det A, 2 2
26. (iii)tr D = 6 = tr A
Apartado 19.5
2 1
√ √
5 2 1−i 2+i 1−i 3−i
16. (i) X = −1 1
, 21.
3−i i
,
2+i i
√ √
5 2

2 −i 2 i 23. (ii)1,666666668 × 10−9 ;
22. , , hermı́tica
i 1 −i 1
⎛ ⎞ ⎛ ⎞ 23. (ii)1,6666666667 × 10−13
0 i 0 0 −i 0
23. ⎝−i 0 i ⎠ , ⎝ i 0 −i ⎠,
Apartado 20.3
0 −i 0 0 i 0
hermı́tica 7. 1,564 8. 0,5314 9. 1,322
24. (i) 3 (ii) 13 (iii) 2 + 3i (iv) 2 − 3i

√−1 √ −i Apartado 20.4
25. (ii) 1, ; −1,
i( 2−1) 2+1
11. 0,03973; 0,25590; 0,47703; 0,72357
12. 0,04037 (usando x0 , x1 , x2 );
0,25673 (usando x0 , x1 , x2 );
Capı́tulo 20 0,72424 (usando x3 , x4 , x5 )
Apartado 20.2 13. 0,25708 (usando de x0 a x5 )
1. (i) 1,213; 1,213
23. (ii) 72,030; 72,03
Apartado 20.5
23. (iii) 0,130; 0,1299
23. (iv) 0,002; 0,002499 14. n = 8 : 0,95834, 0,95550;
n = 16 : 0,95622,0,95551
2. (i) 0,0005; 0,0005
15. Usando n = 8 y n = 16 : 0,95551
23. (ii) 0,0005; 0,005
23. (iii) 0,0005; 0,00005 16. Usando 2n = 8 : 0,955559;
23. (iv) 0,0005; 0,0000005 2n = 16 : 0,955515
17. 0,955512 18. 0,94608 19. 0,88208
3. (i) 0,0004; 0,0004
23. (ii) 0,000007; 0,00007
23. (iii) 0,004; 0,0004 Apartado 20.7
23. (iv) 0,3; 0,0002
20. x1 = 2, x2 = 1
4. (i) 9,961 ± 0,0015
23. (ii) 10,11 ± 0,015 21. x1 = 1, x2 = 2, x3 = −2
23. (iii) 58,793 ± 0,243 22. x = −1, y = 8, z = −5
23. (iv) 8,7645 ± 0,0362 23. w = x = y = 1, z = −1
23. (v) 0,3540 ± 0,0008 24. λ = −28; x = −(28 + 5z)/3,
5. (i) 0,414213562; 4,9875621; y = (34 + 2z)/3; z arbitrario
23. (i)49,9987; 500; 4900 25. x1 = 3,132, x2 = −4,546,
23. (ii) 0,414213562; 4,98756211; x3 = −6,110
23. (ii)49,9987501; 499,999875; 26. (i) x1 = 2,719, x2 = −3,333,
23. (ii)4999,99999 x3 = −6,106
6. (i) 0,175201194; 1,66585 × 10−5 ; 26. (ii) x1 = 3,136, x2 = −4,554,
−8
23. (ii)5 × 10 ; 0 x3 = −6,116
26. (iii) x1 = 3,133, x2 = −4,551,
x2 x2 x4
23. (ii) 1+ + x3 = −6,112
6 20 840
23. (ii)1,666675000 × 10−5 ;
Apartado 20.8 2. (ii) (a) 58,68, 60, 59,5

⎛ ⎞
7 13 19 (b) 58,67, (56 − 60), (56 − 60)
27. ⎝ 13 24 35 ⎠ 3. 5,22, 30,42, 194,58, 1,78, 0,474
19 35 52
⎛ ⎞
−0,7 0,2 0,3
28. ⎝ −1,3 −0,2 0,7 ⎠ Apartados 21.2 y 21.3
0,8 0,2 −0,2
4. (i) 0,6 (ii) 0,1 (iii) 0,7
29 x = −0,7b1 + 0,2b2 + 0,3b3
5. (i) 21/216 (ii) 46/216
y = −1,3b1 − 0,2b2 + 0,7b3
z = 0,8b1 + 0,2b2 − 0,2b3 (iii) 10/216
6. (i) q = e−0 /kt + e−1 /kt + e−2 /kt
Apartado 20.9
(ii) (a) P0 = 1, P1 = P2 = 0
30. (i) 0,800000; 0,640000; 1
(b) P0 = P1 = P2 =
0,512000; 0,409600; 0,327680 3
(ii) 0,810000; 0,656100; (iii) Pi,j,k = e−(i +j +k )/kt /q3
0,531441; 0,430467; 0,348678
(iii) 0,814506; 0,663420; Apartado 21.4
0,540360; 0,440127; 0,358486 7. (i) 0,3125 (ii) 0,2304
31. (i) 0,820000; 0,672400; 8. (i) 0,3487 (ii) 0,001488
0,551368; 0,452122; 0,370740 (iii) 0,9298
(ii) 0,819025; 0,670802;
0,549404; 0,449975; 0,368541 Apartado 21.5
32. (i) 0,818733; 0,670324;
9. AB AC AD AE
0,548817; 0,449335; 0,367885
BA BC BD BE
(ii) 0,818731; 0,670320;
CA CB CD CE
0,548812; 0,449329; 0,367880;
DA DB DC DE
< 10−7
EA EB EC ED
33. 0,892626; 0,027961
10. AB AC AD AE BC BD BE
34. 2,845387; −0,413504
CD CE DE
35. 2,191160; −0,036251
11. AAABB AABAB AABBA
36. 0,864660; −0,000005
ABAAB ABABA ABBAA
37. 3,258822; −0,000070
BAAAB BAABA BABAA
38. 2,227412; < 10−7
BBAAA
8!
12. = 280 13. 38 = 6561
Capı́tulo 21 4!3!1!
43 =
14. (i) 64 (ii) 6
Apartado 21.1 4
15. (i) = 4 (ii) 1
1. (ii) 5,22, 5, 5 (iii) 3,172, 1,78 3
Apartado 21.6 E a = 89,5 kJ mol−1

1 1 y se obtiene
16. (i) 3a2 − 2a3 (iii) , √
2 20
7 ln A / M−1 s−1 = 27,38,
(iv) √ ≈ 0,6261
5 5 A = 7,8 × 1011 M−1 s−1

17. 1 − e−2R 1 + 2R + 2R2 (ii) σm = 1148,7 σ, σc = 3,5472 σ
√
3 3 Tenemos entonces
18. (i) (ii) (iii) 1
2 2 Ea
= 1,076 × 104 ± 115,
R
Apartado 21.9 E a = 89,5 ± 1,0 kJ mol−1
19. y = 1,257x + 2,727 y se obtiene
20.
ln A / M−1 s−1 = 27,38 ± 0,35,
(i) ln k / M−1 s−1
5,5 × 1011 < A / M−1 s−1 < 11,1 × 1011
−1,076 × 10 4
= + 27,38
T
Tenemos entonces
Ea
= 1,076 × 104 ,
R
Hola

Abel, 39, 472 autovalor degenerado, 484

abscisa, 27 autovalores, 364, 484
aceleración, 407 espectro de, 364, 484
Airy, ecuación de, 342 problema de, 481-502 (capı́tulo)
ajuste χ2 , 567 autovectores, 485
álgebra, 12 normalizados, 487
de números reales, 12-15 ortogonales, 487
teorema fundamental del, 37 por la derecha, 501
álgebra matricial, 425, 450, 454-462 por la izquierda, 501
álgebra vectorial, 398 propiedades de los, 487
algebraica
ecuación, 5
función, 23-48 Babbage, 98
Al-Kashi, 7, 171 babilonios, 34
Al-Khwarizmi, 7, 34 Barrow, 78, 107
ambigüedades, resolución de, 25 base, 7, 13
amplitud, 308 Bell, 332
análisis de Fourier, 386 Bernoulli
angular distribución de, 552
frecuencia, 57 números de, 522
momento, 260 Bernoulli, Daniel, 339, 344
movimiento, 260 Bernoulli, Jakob, 172, 541
ángulo, unidad de, 51 Bernoulli, Johann, 172, 186, 300, 344
ángulos compuestos, identidades de, 58 Bessel, 203, 339
anticonmutativo, 412 ceros de la función de, 352
antisimetrı́a,de determinantes, 440 ecuación de, 325, 339, 352
aproximación de Stirling, 523 función de, 352
área bajo la curva, 110 función esférica de, 374
área negativa, 114 binomio, desarrollo del, 169
Argand, 196 bisección, método de, 507
diagrama de, 196 bivaluada, función, 29
Aristóteles, 399 Boltzmann
aritmética, 12 distribución de, 73, 550, 557
expresión, 25 estadı́stica de, 554
armónico Bombelli, 193
esférico, 357 bosón, 444
oscilador, 36, 57, 73 butadieno, 501
sólido, 357
Arquı́medes, 9, 106 cadena, regla de la, 229
arquimediano, número π, 6, 8 cálculo, teorema fundamental del, 121
asimetrı́a, 547 cálculo integral, 119-124
ası́ntota, 40 cambio de coordenadas, 267
asociatividad del producto de matrices, 458 cartesianas a polares, 234, 250, 251
autofunción, 364 polares a cartesianas, 234
600 Índice alfabético
cambio de variable constante, 2, 11

constante, 233 de la fuerza, 306
independiente, 233 de proporcionalidad, 65
para integrales múltiples, 249-251 de separación, 346
camino de integración, 240 continuidad, 79-81
campo de direcciones, 531 continuo de números, 6
campo escalar, 416 contorno
campo vectorial, 416 condición periódica de, 210
capacidad, 292 problema de, 363
Cardano, 39, 193, 541 convergencia en media, 374
Cauchy, 176, 177, 203, 426, 450, 472, 485 convergencia de una serie, 175-178
Cavalieri, 106, 520 criterios de, 175-178
Cayley, 449, 450, 495 coordenada radial, 258
centro de gravedad, 126 coordenadas, cambio de, 267
centro de inversión, 471 coordenadas cartesianas, 26, 257
centro de masas, 124, 126, 127, 403 coordenadas cilı́ndricas, 270
cero, aritmética del, 13 coordenadas curvilı́neas, 268
ceros, de las funciones de Bessel, 340 coordenadas elı́pticas, 270
ciclobutadieno, 485 coordenadas esféricas, 258-259, 262, 354
ciclopropeno, 501 coordenadas ortogonales, 268
cifra decimal, 10 coordenadas polares, 61, 258, 270
cifras significativas, 10 correlación, 563
cinética, 92 cosecante, 50
ecuación separable en, 282-287 coseno, 49
cı́rculo unidad, 197 regla del, 57
circuito eléctrico, 292 cota de error, 504
Clairaut, 238, 247, 257 cotangente, 50
le cadet, 238 Cotes, 519, 555
Clausius-Clapeyron, ecuación de, 102, 136 Coulomb
coeficiente de Fourier, 379 fuerza de, 353, 417
coeficiente de correlación, 563 ley de, 130
coeficiente diferencial, 93 covarianza, 563
coeficientes constantes, 297 Cramer, 433
cofactor, 430, 463 regla de, 425, 433
colatitud, 258 criterio
coma fija, 10 de comparación, 176
coma flotante, 10 de convergencia de una serie, 175-178
combinación, 553 de exactitud, 238
combinación lineal de soluciones, 299 del cociente de d’Alembert, 176
complejo conjugado, 195 integral de Cauchy, 177
completitud, 373 cuadrante, 53
componentes de un vector, 401-406 cuadrática
condición de contorno, 304, 353 ecuación, 5
cı́clica, 305 función, 33
periódica, 210, 305 cuadratura
condición de periodicidad, 209 de Gauss-Chebyshev, 525
inicial, 277, 303 de Gauss-Hermite, 525
conjunto ortonormal, 315 de Gauss-Laguerre, 525
conmutador, 459 de Gauss-Legendre, 524
conmutatividad de Newton-Cotes, 518
de la suma de vectores, 399 gaussiana, 524, 525
del producto de matrices, 458 cuántico, número, 210
del producto escalar, 408 cuaterniones, 397, 402, 407, 420, 492
conservación cúbica, ecuación, 5, 31
de la energı́a, 132 cuerda vibrante, 362-364, 385, 386
del momento angular, 415 curtosis, 548
del momento lineal, 407 cúspide, 82
Índice alfabético 601
D’Alembert, 344, 485, 541 determinante

operador, 273 cofactores de un, 430
De Moivre, 201, 251, 541, 555, 561 de un producto matricial, 461
fórmula de, 200, 205 de una matriz, 452, 454
decimal derivada de un, 442
cifra, 10 desarrollo de un, 429
fracción, 7 elementos de un, 427
degeneración, 350 menor de un, 429
Delauney, 240 multiplicación por una constante de un, 438
denominador común, 4 orden de un, 427
densidad, 260 reducción a forma triangular, 443
de probabilidad, 260, 261, 265 transposición de un, 438
en un punto, 260 determinante caracterı́stico, 484
densidad promedio, 127 determinante de Slater, 445
derivable, 82 determinante secular, 436, 484
derivación, 75-103, 75 (capı́tulo) determinantes, 425-447 (capı́tulo)
a partir de primeros principios, 82-83 antisimetrı́a de los, 440
a partir de reglas, 83-92 propiedades de los, 438-443
de serie de potencias, 188 regla de la suma para, 439
mediante regla de la cadena, 84, 87-88 diagonal principal, 452
mediante regla de la inversa, 84, 89 diagonalización de matrices, 490-493
mediante regla del cociente, 84, 86 diagrama de Argand, 196
mediante regla del producto, 84, 86 Dieterici, ecuación de, 192
paramétrica de una integral, 157-159 diferencial, 99-101, 122, 123
derivada, 79, 92 coeficiente, 79
de funciones hiperbólicas, 84 de área, 123
de funciones hiperbólicas inversas, 90 operador, 79
de funciones trigonométricas, 84 diferencial exacto, 237, 242
de funciones trigonométricas inversas, 89 diferencial total, 225-228
de función exponencial, 84 diferencias divididas, método de, 514
de función implı́cita, 90 dimensiones, 16
de función logarı́tmica, 84 Dirichlet, 345, 374
de la suma de funciones, 84 condiciones de, 374
de un determinante, 442 discontinuidad, 80
del múltiplo de una función, 84 esencial, 80
derivada escalar de un vector, 405 evitable, 80
derivada logarı́tmica, 91 discriminante, 34
derivada parcial, 217-221 distinguibles (objetos), 553, 554
notación de la, 217, 220 distribución
derivada total, 228 asimetrı́a de una, 547
derivadas sucesivas, 92 curtosis de una, 548
desarrollo asintótico, 522 desviación absoluta media de una, 547
desarrollo de Laplace, 431 desviación tı́pica de una, 546, 549
desarrollo de MacLaurin, 375 estadı́sticos de una, 544
desarrollo del binomio, 169 media de una, 544, 549
desarrollo del potencial electrostático, 376-378 mediana de una, 545
desarrollo en serie moda de una, 545
de funciones hiperbólicas, 183 rango de una, 546
de funciones trigonométricas, 181 valor esperado de una, 549
de función logarı́tmica, 182 varianza de una, 546, 549
desarrollo en polinomios de Legendre, 369-376 distribución binomial, 551, 556, 561
desarrollo multipolar, 377 distribución continua, 543, 558
desarrollo ortogonal, 369-395 (capı́tulo) distribución de Bernoulli, 552
Descartes, 26, 193 distribución de Boltzmann, 73, 550, 557
desviación absoluta media, 547 distribución de frecuencias, 542, 543
desviación tı́pica, 546, 549 continua, 543
poblacional, 569 discreta, 543
distribución de Maxwell-Boltzmann, 103, 161 de segundo orden, 297-324 (capı́tulo)

distribución de probabilidad, 548 funciones especiales, 325-342 (capı́tulo)
distribución discreta, 543 factor integrante para, 289
distribución gaussiana (normal), 66, 560-561 homogéneas, 281, 297-317
distribución normal (gaussiana), 66, 560-561 lineales en cinética quı́mica, 290-292
distribución uniforme, 559, 561 lineales homogéneas, 288
distribución unimodal, 545 lineales no homogéneas, 288
distributividad del producto de matrices, 458 método de series de potencias, 326-328
divergencia de un campo vectorial, 418 métodos numéricos, 530-536
división de números complejos, 196 de Euler, 531
división entera, 40 de Runge-Kutta, 533-534
no homogéneas, 317-322
separables, 279-288
ecuación algebraica, 5 solución general de, 299-303, 318
ecuación asociada de Laguerre, 325, 338 solución particular de, 303-305
ecuación asociada de Legendre, 325, 326, 333-335 ecuaciones homogéneas, 435, 483
ecuación auxiliar, 300 ecuaciones incompatibles, 434
ecuación caracterı́stica, 300, 484 ecuaciones lineales, resolución por eliminación
ecuación cinética integrada, 284 gaussiana, 525-528
ecuación cuadrática, 5, 33, 505 ecuaciones linealmente dependientes, 435
ecuación cúbica, 5, 31, 39 ecuaciones no homogéneas, 435, 481, 482
ecuación de Airy, 342 ecuaciones normales, 566
ecuación de autovalores, 484 ecuaciones ordinarias, resolución de, 507-510
ecuación de Bessel, 325, 339, 352 ecuaciones seculares, 436
ecuación de Clausius-Clapeyron, 102, 136 ecuaciones simultáneas, 425
ecuación de Debye, 47 eje de simetrı́a, 471
ecuación de Dieterici, 192 eje imaginario, 196
ecuación de difusión, 343, 366, 395 eje polar, 258
ecuación de Euler-Cauchy, 328, 329 eje principal, 495
ecuación de Hermite, 325, 326, 335 eje real, 196
ecuación de Laguerre, 325, 337 ejes coordenados, 27
ecuación de Laplace, 235, 254, 268, 343, 366, 367, elemento de simetrı́a, 471
419 elemento de volumen, 262
ecuación de Legendre, 325, 326, 330, 342 elemento diagonal, 452
ecuación de ondas, 343, 366 eliminación de Gauss-Jordan, 528-529
ecuación de Poisson, 343 eliminación gaussiana, 525-529
ecuación de Schrödinger, 9, 310, 312, 314, 316, 317, energı́a, 309
343, 347, 349, 350, 353, 367, 436, 559 conservación de la, 132
ecuación de Sturm-Liouville, 334 energı́a cinética, 309, 497
ecuación de van der Waals, 31, 47, 137, 192 253, energı́a electrostática, 133
254 energı́a potencial, 131, 309, 411, 417
ecuación en derivadas parciales, 343-367 (capı́tulo) energı́a potencial electrostática, 133, 376-377, 411
ecuación indicial, 329 energı́a relativista, 191
ecuación lineal, 5 entropı́a, 237, 244
ecuación paramétrica, 229 equivocación, 503
ecuación pivote, 526, 527 error, 503, 561
ecuación polinómica, 33 error absoluto, 504
ecuación rı́gida, 535 error al restar, 505
ecuación secular, 225, 253 error aleatorio, 544, 561
ecuación separable, 345 error de redondeo, 504
en cinética, 282-287 error de truncación, 504
ecuaciones, sistemas de, 43 error relativo, 504
ecuaciones de Maxwell, 266 escalar, 398
ecuaciones diferenciales espacio euclı́deo, 420
de primer orden, 275-295 (capı́tulo) espacio muestral, 544
lineales, 288-290 espacio vectorial, 419
métodos numéricos para, 530-536 espectro de autovalores, 364, 484
estadı́stica, 541-572 (capı́tulo) frecuencia angular, 57, 308

estadı́stica de Boltzmann, 554 frecuencia de clase, 543
estadı́stica de Fermi-Dirac, 555 frecuencia de oscilación, 57, 308
estadı́stica descriptiva, 542 frecuencia natural, 321
estadı́stica muestral, 569 frecuencia relativa, 548
Euclides, 50, 169, 332 Frobenius, 328, 492
Eudoxio, 106 fuerza, 129, 417
Euler, 6, 8, 64, 193, 203, 223, 251, 257, 297, 300, momento de una, 126, 414
321, 339, 345, 397, 450, 513, 541 fuerza conservativa, 131, 411, 417
fórmula de, 203, 316 fuerza de Coulomb, 353, 417
método de, 531 fuerza de Lorentz, 423
número e de, 6, 9 función, 23
Euler-Cauchy, ecuación de, 328, 329 representación gráfica, 25
Euler-MacLaurin, fórmula de, 519, 522, 523 valor medio, 113
expansión de un gas, 135 función algebraica, 39
experimento aleatorio, 548, 561 función alternada, 426, 443, 444
exponente, 13 función antisimétrica, 443
exponente fraccionario, 14 función asociada de Laguerre, 338
extrapolación de Richardson, 537 función asociada de Legendre, 333-335, 357
extremo, 222 función auxiliar, 224
función bivaluada, 29
función compleja, 202
factor integrante, 289 función complementaria, 318
factor común, 27 función continua a trozos, 374, 380
factorial, 9 función cuadrática, 33
factorización, 27, 41 función de Bessel, 352
Faraday, 240 ceros de la, 352
Fermat, 26, 78, 97, 106, 171, 541 de orden semientero, 341
Fermi-Dirac, estadı́stica de, 555 de primera especie, 340
fermión, 444 esférica, 341, 374
Ferrari, 39 función de densidad, 260
Fibonacci, 6, 165 función de densidad radial, 560
sucesión (‘serie’) de, 165 función de distribución radial, 559
forma canónica, 494 función de Gibbs, 239, 244
forma cuadrática, 485, 493-496 función de Hermite, 336
forma diagonal, 491 función de partición rotacional, 161, 522
forma escalonada, 526 función de partición vibracional, 191
forma triangular, 443, 526 función de posición, 215, 257, 259, 265
fórmula función de varias variables, 215-255 (capı́tulo)
de De Moivre, 200, 205 punto estacionario de una, 221
de Euler, 203 representación gráfica de una, 216
de Euler-MacLaurin, 519, 522, 523 función discontinua, integración de una, 114
de Planck, 192 función especial, 325
de reducción (integración), 150 función explı́cita, 30
Fourier, 345, 378 función exponencial, 63-66
coeficiente de, 379 derivada, 84
serie de, 378-388 función hiperbólica, 70-72
transformada de, 386-393 derivada, 84
fracción algebraica, 28 función hiperbólica inversa, 71
fracción decimal, 7 derivada de, 90
fracciones, 4 función homogénea, 281
división de, 5 función implı́cita, 30
multiplicación de, 5 derivada de, 90
suma de, 4 función inversa, 29-30
fracciones simples, 41, 116 función lineal, 32
frecuencia, histograma de, 543 función logarı́tmica, 66-69
frecuencia acumulada, gráfico de, 543 derivada, 84
función periódica, 56, 379 hipotenusa, 50

función racional, 39-42 histograma, 543
función racional impropia, 40 Hückel, 253, 437
función racional propia, 40 matriz de, 501
función trascendente, 39, 49-73 (capı́tulo) teorı́a de, 96, 485
función trigonométrica, 49-63 Huygens, 78, 541
derivada, 84
función trigonométrica inversa, 62
derivada de, 89 igualdad de matrices, 454
función univaluada, 29, 380 igualdad de números complejos, 194
función vectorial de posición, 416 igualdad de vectores, 398, 402
función algebraica, 23-48 indistinguibles (objetos), 554
funciones en tres dimensiones, 257-273 (capı́tulo) inductancia, 292
funciones ortogonales, 373 infinito, 13
inflexión, 95
integración, 105-162 (capı́tulo)
Galileo, 106 camino de, 240
Galois, 472 constante de, 107, 109
Galton, 568 de serie de potencias, 188
Gauss, 37, 38, 193, 196, 203, 339, 450, 472, 523, de una función discontinua, 114
525, 561, 566 de una función impar, 119
gaussiana, distribución, 66, 560-561 de una función par, 119
Gibbs, 397, 407, 420 de una función racional, 153-157
función de, 239, 244 intervalo de, 111
Girard, 193 lı́mite de, 111
gradiente, 76 mediante cambio de variable, 142-147
de un campo escalar, 416 por el método de sustitución, 141-147
grado de avance de una reacción, 283 por fórmula de reducción, 150
grado de conversión, 283 por método de fracciones simples, 153-157
grado de un polinomio, 31 por partes, 147-149
gráfica, 25 por sustitución hiperbólica, 145
representación de funciones, 25 por sustitución trigonométrica, 145
Grassmann, 397, 420 signo de, 107
Gregoire de Saint Vincent, 106 usando números complejos, 211
Gregory, James, 107, 178, 183, 520 usando relaciones trigonométricas, 139-141
grupo, tabla de multiplicación de un, 473 variable de, 107
grupo abeliano, 474 integración numérica, 518-525
grupo de simetrı́a, 472 integración parcial, 245
grupo puntual, 473 integral
grupos, teorı́a de, 119 como longitud, 123
derivada paramétrica de una, 157-159
independiente del camino, 242
Hamilton, 397, 402, 407, 417, 420 integral convergente, 117
hamiltoniano, 485 integral de Fourier, 386, 388
operador, 37 integral de lı́nea, 239-245, 410, 411
Heaviside, 407 integral de Riemann, 121
Hermite, 8, 9, 39 integral de volumen, 261-265
ecuación de, 9, 325, 326, 335 integral definida, 107-110
funciones de, 336 en el método de sustitución, 146
polinomios de, 9, 335 integral divergente, 117
Herschel, 98 integral doble, 245-251
Herón, 399 integral en todo el espacio, 264
hidrógeno, átomo de, 260, 353-361, 367, 560, 571 integral estándar, 107
Hiparco de Nicea, 49 integral impropia, 115
hiperbólica integral indefinida, 107-110
función, 70-72 integral infinita, 116
función inversa, 71 integral múltiple, 245
integral particular, 318 ecuación de, 325, 326, 330, 342

integral trigonométrica racional, 156-157 función asociada de, 333-335, 357
integral triple, 261 polinomios de, 332
integrando, 107 Leibniz, 23, 78, 83, 97, 100, 106, 107, 109, 121, 180,
racional, 153-157 193, 216, 275, 279, 288, 327, 518
interpolación, 511-518 Leonardo de Pisa (Fibonacci), 6
a trozos, 514 Levi Ben Gerson, 553
con trazadores, 516-518 ley asociativa
cuadrática, 513 de la multiplicación, 12
de Lagrange, 513 de la suma, 12
lineal, 512 ley conmutativa
lineal a trozos, 512 de la multiplicación, 12
polinómica, 511 de la suma, 12
inversa ley de Coulomb, 130
de función hiperbólica, derivada, 90 ley de Kirchhoff, 292, 324
de función trigonométrica, derivada, 89 ley de la inversa del cuadrado, 130
de un producto matricial, 464 ley de los exponentes, 13-15
del seno, 62 ley de los grandes números, 544
función hiperbólica, 71 ley de Newton, segunda, 345
función trigonométrica, 62 ley de Ohm, 292
regla de derivación de la, 84, 89 ley de Rayleigh-Jeans, 192
ley del movimiento de Newton, segunda (fuerza), 57
ley del paralelogramo, 399
Jacobi, 217, 251 ley distributiva, 12
jacobiano, 251, 426 l’Hôpital, 186, 425
Jia Xian, 509 ligadura, 222
Jones, 6 Lindemann, 8
Jordan Camille, 495 lineal
Jordan, Wilhelm, 528 ecuación, 5
función, 32
logaritmo, 66
Kepler, 106 logaritmo natural, 66
Kirchhoff ley de, 292, 324 longitud, 258
Kohlrausch, ley de, 47 Lorentz, fuerza de, 423
Kutta, 533 lorentziana, 392, 393
lı́mite, 80-82, 185-187
lı́mite de una sucesión, 165
Lacroix, 257 lı́nea nodal, 350
Lagrange, 223, 247, 257, 339, 397, 472, 513
multiplicadores de, 557
Laguerre, 337 MacLaurin, 178, 425
ecuación asociada de, 325, 338 desarrollo de, 375
ecuación de, 325, 337 serie de, 178-187
función asociada de, 338 magnitud, 16
polinomio de, 337 masa reducida, 127
Lambert, 8 matemática notación, 6
Lamé, 268 matrices, 481, 449-502(capı́tulo)
Langmuir álgebra matricial, 454-462
isoterma de, 47 asociatividad del producto de, 458
Laplace, 235, 251, 257, 541, 561 diagonalización de, 490-493
desarrollo de, 431 conmutatividad del producto de, 458
ecuación de, 254, 268, 343, 366, 367, 419 distributividad del producto de, 458
laplaciano, operador, 235, 266, 270, 273, 347, 351, igualdad de, 454
354 multiplicación de, 456-462
Legendre, 217, 332, 566 multiplicación por un escalar de, 455
desarrollo en polinomios de, 369-376 problema de autovalores, 481-502 (capı́tulo)
ecuación asociada de, 325, 326, 333-335 producto de, 461
representación de los grupos, 475 mı́nimo, 94, 222

suma de, 455 mı́nimos cuadrados, 564-569
matrices complejas, 497-500 ajuste lineal, 566
matrices de espı́n, 459, 477 moda de una distribución, 545
matrices semejantes, 492 modos normales, 364
matriz adjunta, 463, 498 superposición de, 365
matriz ampliada, 528 módulo de un número complejo, 197
matriz asociada, 498 momento
matriz columna, 450, 453 angular, 260, 358, 415, 496
matriz compleja conjugada, 497 cuadrupolar, 377
matriz conjugada hermı́tica, 497, 499 de inercia, 126-128, 415
matriz cuadrada, 450, 452 tensor del, 496
matriz de Hückel, 501 de una fuerza, 126, 414
matriz de una transformación, 465 dipolar, 377, 404, 411, 414
matriz determinante de una, 452 lineal, 407, 415
matriz diagonal, 452 multipolar, 377
matriz fila, 453 Monge, 257
matriz hermı́tica, 499 Morse, potencial de, 307
matriz identidad, 452 Müller (Regiomontanus), 49
matriz inversa, 462-464, 528 multiplicación
matriz no singular, 463 de matrices, 456-462
matriz nula, 456 de números complejos, 195
matriz ortogonal, 469 de un vector por otro, 407
matriz simétrica, 454 de un vector por un escalar, 399, 403
matriz singular, 463 multiplicador de Lagrange, 223, 253, 485
matriz transpuesta, 453
matriz transpuesta conjugada, 498
matriz traza de una, 452 nabla, 416
matriz unitaria, 499 Napier, 7, 66
máximo, 94, 222 Napoleón, 223, 235
Maxwell, 240, 407 Newton, 61, 78, 84, 107, 121, 172, 180, 223, 240,
ecuaciones de, 266 275, 327, 397, 518, 555
relaciones de, 238 diferencias divididas, 514
relación de, 244 primera ley del movimiento, 407
Maxwell-Boltzmann, distribución de, 103, 161 segunda ley de, 345
media aritmética, 544 segunda ley del movimiento, 407, 415
media de una distribución, 544, 549 Newton-Cotes, 518
media muestral, 569 Newton-Raphson, método de, 509-510
media poblacional, 569 nodo, 513
mediana de una distribución, 545 norma, 372, 373
menor de un determinante, 429 normalización, 334
método normalizado, 264
de bisección, 507 notación
de coeficientes indeterminados, 319 de la derivada parcial, 217, 220
de diferencias divididas, 514 con puntos, 98
de encajonado, 508 notación matemática, 6
de Euler, 531 numerales indo-arábigos, 7
de fracciones simples, 153-157 número cuántico, 210
de Frobenius, 328 número e de Euler, 6, 9
de Newton-Raphson, 509-510 número imaginario puro, 194
de segundo orden, 510 números, continuo de, 6
de series de potencias para una ecuación números complejos, 11, 193-213 (capı́tulo)
diferencial, 326-328 argumento de, 197
de sustitución, 141-147, 249 módulo de, 197
método numérico, 503-539 parte imaginaria de, 193
métodos de eliminación, 525-529 parte real de, 193
métodos de Runge-Kutta, 533-534 representación polar de, 197
números algebraicos, 6 periodicidad

número arquimediano π, 6, 8 condición de, 209
números de Bernoulli, 522 de números complejos, 206-210
números enteros, 3 periodo, 56
números imaginarios, 11 de oscilación, 308
números irracionales, 5 periódica función, 56
números naturales, 3 permutación, 553
números reales, 6, 12 Pitágoras, 50
números trascendentes, 6 pivote, 526
pivote parcial, 527
pivote parcial escalado, 528
pivote total, 528
Ohm, ley de, 292 plano complejo, 196
Oldenburg, 180 plano de simetrı́a, 471
onda armónica, 56, 60 plano gaussiano (complejo), 196
onda estacionaria, 60, 364 plano tangente, 218
operación de simetrı́a, 471-476 población, 544
operación aritmética, 12 Poisson, ecuación de, 343
operador, momento angular, 358 polar, eje, 258
operador de d’Alembert, 273 polares, coordenadas, 61, 258, 270
operador de rotación, 206 polinomio, 31-39
operador diferencial, 79, 416 grado de un, 31
operador hamiltoniano, 37, 313 raı́z de un, 33
operador laplaciano, 235, 266, 270, 273, 347, 351, polinomio de Hermite, 335
354, 419 polinomio de Laguerre, 337
operador vectorial, 418 polinomios de Legendre, 332
operador operador aritmético, 12 polinómica, ecuación, 33
optimización, 222 potencial, teorı́a del, 235
condicionada, 222 potencial de Lennard-Jones, 103
orbital atómico, 260 potencial de Morse, 307
orden de magnitud, 17 potencial electrostático, 411, 417
orden de una ecuación diferencial, 276 desarrollo del, 376-378
ordenada, 27 presión-volumen, trabajo, 134
Oresme, 106, 175, 541 principio de exclusión de Pauli, 445, 555
ortogonal, 409 principio de superposición, 299
desarrollo, 369-395 (capı́tulo) probabilidad
ortogonalización de Schmidt, 489 densidad de, 260, 261, 265, 558
ortonormal, conjunto, 315, 373 distribución de, 548
oscilación forzada, 320-322 probabilidad y estadı́stica, 541-572 (capı́tulo)
oscilador armónico, 36, 57, 73, 306-310 probabilidades combinadas, 549
en mecánica cuántica, 37 problema de contorno, 304, 363
oscilador armónico cuántico, 335 problema de valor inicial, 278, 304
proceso de primer orden, 284
proceso de segundo orden, 286
par de torsión, 126 proceso irreversible, 135
partı́cula proceso reversible, 135
en un aro, 352 producto de Cauchy, 188
en un pozo circular, 350-353 producto escalar, 407-412
en un pozo rectangular, 347-350 triple, 422
en un pozo unidimensional, 310-317 producto interno, 420
Pascal, 106, 171, 541 producto vectorial, 412-416
triángulo de, 509, 551 anticonmutativo, 412
Pauli triple, 422, 423
matrices de espı́n de, 459 progresión aritmética, 164
principio de exclusión de, 445 progresión geométrica, 165
Peacock, 98 promedio, de una función, 265
pendiente, 32, 75 punto estacionario, 94
de una función de varias variables, 221 resultado, 544

punto extremo, 94 reversible, proceso, 135
punto silla, 222 Rheticus, 49
punto singular, 40 Richardson, extrapolación de, 537
Riemann, 121, 242, 345
Robert de Chester, 7
Qin Jiushao, 509 Roberval, 56, 106
rotacional de un campo vectorial, 419
rotación, operador de, 206
racional, función, 39-42 rotor rı́gido, 209, 316, 522
radial, coordenada, 258 Runge, 533
radio de convergencia, 178 Runge-Kutta, métodos de, 533-534
radián, 51
rango intercuartı́lico, 546
Raphson, 509 Schmidt, ortogonalización de, 489
Rayleigh-Jeans, ley de, 192 Schoenberg, 517
raı́ces de números complejos, 207 Schrödinger, ecuación de, 9, 343, 347, 349, 350,
raı́z de un polinomio, 33 353, 367, 436, 559
raı́z de una función cuadrática, 33 secante, 50
reacción secular, ecuación, 225, 253
grado de avance de, 283 segmento de recta orientado, 397
grado de conversión de, 283 Seki Kowa, 425
velocidad de, 283 seno, 49
real regla del, 57
número, 6, 12 separación de variables, 346, 354-355, 363
variable, 11 serie, 163-192 (capı́tulo)
reciprocidad radio de convergencia de una, 178
relación de, 238 serie alternada, 178
Recorde, 2 serie aritmética, 168
redondeo, 10 serie armónica, 175
Regiomontanus, 49 serie binomial, 180
regla serie de Fourier, 378-388
de Cramer, 425, 433, 482 en cosenos, 388
de l’Hôpital, 186 en senos, 384
de la cadena, 84, 87-88, 229 serie de MacLaurin, 178-187
de la inversa, 84, 89 serie de potencias, 178-189
de la suma para determinantes, 439 serie de Taylor, 178-187
de Simpson, 520 serie finita, 163, 167-173
del cociente, 84, 86 serie geométrica, 169, 174
del menos uno, 232 serie infinita, 163, 174-189
del producto, 84, 86 SI, unidades, 16
del trapecio, 518, 519 simetrı́a
regresión, 569 eje de, 471
relaciones de Maxwell, 238, 244 elemento de, 471
relación de recurrencia (integración), 150 operación de, 471-476
representación paramétrica de una curva, 406 plano de, 471
representación gráfica Simpson, 520
de un número complejo, 196 regla de, 520
de una función de varias variables, 216 sistema de ecuaciones lineales, 425, 433-438, 465,
de una ecuación diferencial, 531 481
representación logarı́tmica, 92 sistema conservativo, 132
resistencia, 292 sistema de referencia, 27
resolución de ecuaciones ordinarias, 507-510 sistema decimal, 7
resolución numérica, de ecuaciones diferenciales, sistema posicional, 6
530-536 sistemas de ecuaciones, 43
resonancia, 322 Slater, determinante de, 445
resto (desarrollo de Taylor), 184 Snell, 96
sólido rı́gido, 415 transformación lineal, 464-469

solución de una ecuación en derivadas parciales, 344 transformación ortogonal, 492
solución general de una ecuación diferencial, 276, transformada de Fourier, 386-393
299-303, 318 transpuesta de un producto matricial, 461
solución no trivial, 436 trascendente
solución particular de una ecuación diferencial, 276, función, 39, 49-73 (capı́tulo)
303-305 número, 6
solución trivial, 435 traza de un producto matricial, 461
solución general, 299 traza de una matriz, 452
sordo, 5 trazadores, 516, 517
splines, 517 cúbicos, 517
Stevin, 7, 106 naturales, 518
Stirling, 555 tres dimensiones, funciones en, 257-273 (capı́tulo)
aproximación de, 523, 555, 557 triángulo de Pascal, 171, 509, 551
Sturm-Liouville, ecuación de, 334 trigonometrı́a, 49
sucesión armónica, 165 trigonométrica
sucesos excluyentes, 549 función, 49-63
sucesos independientes, 550 función inversa, 62
suma triple producto
de matrices, 455 escalar, 422
de números complejos, 194 vectorial, 422, 423
de una serie, 168 truncación, 10
de vectores, 399, 402
parcial, 167
superposición, principio de, 299 unidad, 2, 16-19
sustitución hiperbólica, 145 de ángulo, 51
sustitución trigonométrica, 145 unidad SI, 16
Sylvester, 449, 495 unidades atómicas, 18
univaluada, función, 29
tangente (función), 49 valor absoluto, 13

Tartaglia, 39 valor caraterı́stico, 484
tasa de variación, 75, 77 valor esperado, 265
Taylor, 183, 345 de una distribución, 549
serie de, 178-187 valor principal, 63
tensor valor promedio, 264
de inercia, 496 van der Waals, ecuación de, 31, 137, 192, 253, 254
del momento de inercia, 496 variable, 2, 11
teorema de Taylor, 184 variable constante, cambio de, 233
teorema de Weierstrass, 511 variable continua, 11
teorema del lı́mite central, 561 variable dependiente, 2
teorema fundamental del cálculo, 121 variable discreta, 11
teorema fundamental del álgebra, 37, 38 variable entera, 4, 11
teorı́a de grupos, 119, 472 variable independiente, 2, 215
axiomas de la, 474 cambio de, 233
teorı́a del potencial, 235, 266, 374 variable real, 11
Tolomeo, 49 variación, 75
Torricelli, 68, 106 infinitesimal, 99
totalmente antisimétrica, 443 tasa de, 75
trabajo, 129 varianza, 546, 549
presión-volumen, 134 poblacional, 569
transformación vector columna, 450
transformación a ejes principales, 495 vector columna (matriz), 453
transformación de coordenadas, 450, 464 vector de desplazamiento, 398
transformación de semejanza, 492 vector de posición, 398
transformación identidad, 468 vector fila (matriz), 453
transformación inversa, 468 vector nulo, 398
vector propio, 485 velocidad lineal, 98

vector unitario, 400 Viète, 34, 49
vector unitario cartesiano, 401, 404, 409 virial, coeficientes del, 191
vectores, 397-424 (capı́tulo) volumen, elemento de, 262
componentes de, 401-406
de una base, 404, 409, 413
derivada escalar de, 405 Wallis, 107, 180, 196
igualdad de, 398, 402 Waring, 176, 513
multiplicación por un escalar, 399, 403
Weber, 472
suma de, 399, 402
Weierstrass, 345, 511
vectores ortogonales, 409
Wessel, 196
vectores unitarios i, j, k, 401, 404, 409, 413
velocidad, 97, 98, 128, 406
velocidad angular, 98, 414, 496
velocidad de reacción, 283 Yang Hui, 171

Matematicas para Las Ciencias A - Steiner, Erich

Cargado por

Copyright:

Formatos disponibles

Matematicas para Las Ciencias A - Steiner, Erich

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Matematicas para Las Ciencias A - Steiner, Erich

Cargado por

Copyright:

Formatos disponibles

Título de la obra original:

The Chemistry Maths Book

Copyright © E. Steiner 1996, 2003

Versión española por:

Exeter, julio 1995 Erich Steiner

01 Números, variables y álgebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

04.50 Derivación a partir de primeros principios . . . . . . . . . . . . . . . . . . . . . 82

06 Métodos de integración . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

07 Sucesiones y series . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

08 Números complejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193

09 Funciones de varias variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215

10 Funciones en tres dimensiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257

11 Ecuaciones diferenciales de primer orden . . . . . . . . . . . . . . . . . . . . . . . . 275

12 Ecuaciones diferenciales de segundo orden. Coeficientes constantes 297

13 Ecuaciones diferenciales de segundo orden. Algunas funciones

14 Ecuaciones en derivadas parciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343

15 Desarrollos ortogonales. Análisis de Fourier . . . . . . . . . . . . . . . . . . . . . 369

18 Matrices y transformaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449

19 El problema de autovalores matriciales . . . . . . . . . . . . . . . . . . . . . . . . . . 481

20 Métodos numéricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503

21 Probabilidad y estadı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 541

Apéndice. Integrales estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 573

Soluciones de los ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 577

(i) experimentos: la observación de fenómenos fı́sicos y la medición de cantidades

Ambos, experimentos y teorı́a, suponen la manipulación de números y de los sı́mbolos

EJEMPLO 1.1 La ecuación de estado de un gas ideal es

nRT 0,1 mol × 8,31451 J K−1 mol−1 × 298 K

Este ejemplo ilustra un cierto número de conceptos:

Este enunciado se representa normalmente como1

(ii) La función contiene dos tipos de cantidades.

mol J K−1 mol−1 K J

trabajo = fuerza × distancia

de manera que la unidad (SI) de trabajo es J = N m, donde el newton N es la unidad SI

de manera que la unidad (SI) de presión es Pa = N m−2 . Se deduce que

1.2. Números reales

El concepto de número, y de contar, se aprende muy pronto en la vida, y casi todas

· · · − 3, −2, −1, 0, +1, +2, +3, · · ·

EJEMPLOS 1.2 Suma y resta de números negativos

donde, por ejemplo, mq significa m × q.

EJEMPLOS 1.3 Suma de fracciones

EJEMPLO 1.4 Multiplicación de fracciones

EJEMPLO 1.5 División de fracciones

Todo número racional es la solución de una ecuación lineal

donde m y n son enteros. La solución de la ecuación (1.7) es x = n/m. Sin embargo, no

donde m, n y p son enteros arbitrarios, ası́ como de otras ecuaciones algebraicas de

Los números racionales e irracionales que se obtienen como soluciones de ecuacio-

donde a0 , a1 , . . . an son enteros, se llaman números algebraicos. Estos números pueden

1.3. Representación decimal de los números

Éstos son los nueve caracteres de los Indios

En el sistema decimal de números, los diez dı́gitos 0 a 9 (numerales indo-arábigos)5 se

donde 100 = 1 (véase el Apartado 1.6).

π = 3,14159 26535 89793 . . .

la cantidad n! (que se lee ‘n factorial’) se denomina factorial de n, y se define para

por ejemplo: 3! = 1 × 2 × 3 = 6, 4! = 1 × 2 × 3 × 4 = 24. Además, el factorial de cero

≈ 1 + 1 + 0,5 + 0,1666667 + 0,041667 + 0,008333 + 0,001389 + 0,000198

Cifras significativas y redondeo

3,142 , 62,358 , 0,013 , 1,000 .

3210 = 0,3210 × 104 , 003,210 = 0,3210 × 101 , 0,003210 = 0,3210 × 10−2 ,

tienen todos 4 cifras significativas.