Matematicas para Las Ciencias A - Steiner, Erich

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 624

Título de la obra original:

The Chemistry Maths Book


Edición original en lengua inglesa publicada por:
Oxford University Press Inc., New York. U.S.A.

Copyright © E. Steiner 1996, 2003

Edición en español
© Editorial Reverté, S. A., 2005
Edición en papel
ISBN: 978-84-291-5159-6
Edición e-book (PDF)
ISBN: 978-84-291-9439-5

Versión española por:


Salvador Jiménez
Departamento de Matemática y Física Aplicadas
Universidad Alfonso X El Sabio Madrid - España

Propiedad de:
EDITORIAL REVERTÉ, S. A.
Loreto, 13-15, Local B
08029 Barcelona
Tel: (34) 93 419 33 36
Fax: (34) 93 419 51 89
[email protected]
www.reverte.com

Reservados todos los derechos. La reproducción total o parcial de esta obra, por cualquier medio o
procedimiento, comprendidos la reprografía y el tratamiento informático, queda rigurosamente prohi-
bida, salvo excepción prevista en la ley. Asimismo queda prohibida la distribución de ejemplares
mediante alquiler o préstamo públicos, la comunicación pública y la transformación de cualquier
parte de esta publicación (incluido el diseño de la cubierta) sin la previa autorización de los titulares
de la propiedad intelectual y de la Editorial. La infracción de los derechos mencionados puede ser
constitutiva de delito contra la propiedad intelectual (Art. 270 y siguientes del Código Penal). El
Centro Español de Derechos Reprográficos (CEDRO) vela por el respeto a los citados derechos.

# 1257


Este libro describe las matemáticas necesarias para todo el conjunto de temas que con-
forman una carrera universitaria de quı́mica (u otra ciencia aplicada). Ha sido ideado
para que sirva de libro de texto para asignaturas de ‘matemáticas para quı́micos’.
Los temas se desarrollan de forma lógica y consistente con pocas suposiciones de
un conocimiento previo de matemáticas. El material está organizado en tres partes inde-
pendientes en gran medida: los Capı́tulos 1 al 15 tratan de álgebra, cálculo, ecuaciones
diferenciales y desarrollos en series; los Capı́tulos 16 a 19 de vectores, determinantes
y matrices; los Capı́tulos 20 y 21 son introducciones a los grandes temas de análisis
numérico y estadı́stica.
Una caracterı́stica de este libro es el uso extenso de ejemplos para ilustrar todos los
conceptos y métodos importantes del texto. Algunos de esos ejemplos se usan también
para mostrar aplicaciones de las matemáticas en quı́mica y varios conceptos básicos de
fı́sica. Los ejercicios al final de cada capı́tulo, 900 en total, son un elemento esencial
del desarrollo de los temas, y han sido ideados para dar al estudiante un conocimiento
operativo del material del texto. Se dan las soluciones a todos los ejercicios numéricos.
El texto se acompaña de una historia de las matemáticas en notas a pie de página.
Algunos temas de quı́mica reciben un tratamiento extenso. Entre ellos el concepto de
trabajo presión-volumen en termodinámica en el Capı́tulo 5, los sistemas periódicos en
el Capı́tulo 8, las ecuaciones diferenciales de la cinética quı́mica en el Capı́tulo 11, y
varias aplicaciones de la ecuación de Schrödinger en los Capı́tulos 12 y 14. Además, el
contenido de varios capı́tulos viene determinando en gran medida por sus aplicaciones
en las ciencias fı́sicas: Capı́tulo 9, las matemáticas de la termodinámica; Capı́tulos 10
y 16, descripción de sistemas y procesos en tres dimensiones; Capı́tulo 13 (avanzado),
algunas ecuaciones diferenciales y funciones especiales importantes en quı́mica y fı́si-
ca matemáticas; Capı́tulo 15 (avanzado), fuerzas intermoleculares, analisis ondulatorio
y espectroscopı́a de transformada de Fourier; Capı́tulos 18 y 19, simetrı́a molecular y
operaciones de simetrı́a, teorı́a de orbitales moleculares, dinámica molecular y mecánica
cuántica avanzada.

Agradecimientos
Quiero expresar mi gratitud a mis colegas de Departamento de Quı́mica por su estı́mu-
lo, crı́tica y ayuda en la preparación de este libro. Quiero dar las gracias en particular
a los Doctores John Sandall y David Rosseinsky, a los Profesores Ken Schofield y An-
thony Legon, por sus valiosos comentarios sobre determinados capı́tulos, y al Profesor
Patrick Fowler por su constante apoyo y crı́tica constructiva durante todas las etapas de
la redacción del libro.
VI Prefacio

Estoy en deuda con mis alumnos por convencerme de que este libro era necesario, y
con los revisores por persuadir a Oxford University Press de que lo publicase.
Sobre todo, quiero agradecer a Mary Steiner su paciencia y su fe en mı́.

Exeter, julio 1995 Erich Steiner


  

01 Números, variables y álgebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1


01.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
01.20 Números reales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
01.30 Representación decimal de los números . . . . . . . . . . . . . . . . . . . . . . . 6
01.40 Números complejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
01.50 Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
01.60 El álgebra de los números reales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
01.70 Unidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
01.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

02 Funciones algebraicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
02.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
02.20 Representación gráfica de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . 25
02.30 Factorización y simplificación de expresiones . . . . . . . . . . . . . . . . . 27
02.40 Funciones inversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
02.50 Polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
02.60 Funciones racionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
02.70 Resolución de sistemas de ecuaciones . . . . . . . . . . . . . . . . . . . . . . . . 43
02.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

03 Funciones trascendentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
03.10 Funciones trigonométricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
03.20 Relaciones trigonométricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
03.30 Coordenadas polares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
03.40 Funciones trigonométricas inversas . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
03.50 La función exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
03.60 La función logarı́tmica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
03.70 Valores de las funciones exponencial y logarı́tmica . . . . . . . . . . . . . 69
03.80 Funciones hiperbólicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
03.90 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

04 Derivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
04.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
04.20 El proceso de derivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
04.30 Continuidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
04.40 Lı́mites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
VIII Índice de contenidos

04.50 Derivación a partir de primeros principios . . . . . . . . . . . . . . . . . . . . . 82


04.60 Derivación a partir de reglas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
04.70 Funciones implı́citas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
04.80 Derivada logarı́tmica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
04.90 Derivadas sucesivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
04.10 Puntos estacionarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
04.11 Movimientos lineal y angular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
04.12 El diferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
04.13 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

05 Integración . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
05.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
05.20 La integral indefinida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
05.30 La integral definida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
05.40 El cálculo integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
05.50 Usos del cálculo integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
05.60 Propiedades estáticas de la materia . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
05.70 Dinámica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
05.80 Trabajo presión-volumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
05.90 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136

06 Métodos de integración . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139


06.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
06.20 El uso de relaciones trigonométricas . . . . . . . . . . . . . . . . . . . . . . . . . . 140
06.30 El método de sustitución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
06.40 Integración por partes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
06.50 Fórmulas de reducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
06.60 Integrandos racionales. El método de fracciones simples . . . . . . . . 153
06.70 Derivación paramétrica de integrales . . . . . . . . . . . . . . . . . . . . . . . . . 157
06.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

07 Sucesiones y series . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163


07.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
07.20 Sucesiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
07.30 Series finitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
07.40 Series infinitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
07.50 Criterios de convergencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
07.60 Series de MacLaurin y de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
07.70 Valores aproximados y lı́mites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
07.80 Operaciones con series de potencias . . . . . . . . . . . . . . . . . . . . . . . . . . 187
07.90 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
Índice de contenidos IX

08 Números complejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193


08.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
08.20 El álgebra de los números complejos . . . . . . . . . . . . . . . . . . . . . . . . . 194
08.30 Representación gráfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
08.40 Funciones complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
08.50 Fórmula de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
08.60 Periodicidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
08.70 Cálculo de integrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
08.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212

09 Funciones de varias variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215


09.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
09.20 Representación gráfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
09.30 Derivadas parciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
09.40 Puntos estacionarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
09.50 El diferencial total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
09.60 Algunas propiedades diferenciales . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
09.70 Diferenciales exactos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
09.80 Integrales de lı́nea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
09.90 Integrales múltiples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
09.10 La integral doble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
09.11 Cambio de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249
09.12 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252

10 Funciones en tres dimensiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257


10.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
10.20 Coordenadas esféricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258
10.30 Funciones de posición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259
10.40 Integrales de volumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261
10.50 El operador laplaciano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266
10.60 Otros sistemas de coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
10.70 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271

11 Ecuaciones diferenciales de primer orden . . . . . . . . . . . . . . . . . . . . . . . . 275


11.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275
11.20 Solución de una ecuación diferencial . . . . . . . . . . . . . . . . . . . . . . . . . 276
11.30 Ecuaciones separables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278
11.40 Ecuaciones separables en cinética quı́mica . . . . . . . . . . . . . . . . . . . . 282
11.50 Ecuaciones lineales de primer orden . . . . . . . . . . . . . . . . . . . . . . . . . . 288
11.60 Un ejemplo de ecuaciones lineales en cinética quı́mica . . . . . . . . . 290
11.70 Circuitos eléctricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
11.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
X Índice de contenidos

12 Ecuaciones diferenciales de segundo orden. Coeficientes constantes 297


12.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297
12.20 Ecuaciones lineales homogéneas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297
12.30 Solución general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299
12.40 Soluciones particulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
12.50 El oscilador armónico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306
12.60 Partı́cula en un pozo unidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . 310
12.70 Partı́cula en un aro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314
12.80 Ecuaciones lineales no homogéneas . . . . . . . . . . . . . . . . . . . . . . . . . . 317
12.90 Oscilaciones forzadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 320
12.10 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322

13 Ecuaciones diferenciales de segundo orden. Algunas funciones


13 especiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325
13.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325
13.20 El método de series de potencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326
13.30 El método de Frobenius . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
13.40 La ecuación de Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330
13.50 La ecuación de Hermite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
13.60 La ecuación de Laguerre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337
13.70 Funciones de Bessel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339
13.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342

14 Ecuaciones en derivadas parciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343


14.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343
14.20 Soluciones generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344
14.30 Separación de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
14.40 Partı́cula en un pozo rectangular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347
14.50 Partı́cula en un pozo circular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350
14.60 El átomo de hidrógeno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353
14.70 La cuerda vibrante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362
14.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 366

15 Desarrollos ortogonales. Análisis de Fourier . . . . . . . . . . . . . . . . . . . . . 369


15.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369
15.20 Desarrollos ortogonales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 370
15.30 Dos desarrollos en polinomios de Legendre . . . . . . . . . . . . . . . . . . . 374
15.40 Series de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 378
15.50 La cuerda vibrante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385
15.60 Transformada de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 386
15.70 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393
Índice de contenidos XI

16 Vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397
16.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397
16.20 Álgebra vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398
16.30 Componentes de los vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401
16.40 Derivada escalar de un vector . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405
16.50 Producto escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407
16.60 Producto vectorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
16.70 Campos escalares y vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
16.80 Gradiente de un campo escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
16.90 Divergencia y rotacional de un campo vectorial . . . . . . . . . . . . . . . . 418
16.10 Espacios vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419
16.11 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420

17 Determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425
17.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425
17.20 Determinantes de orden 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427
17.30 Caso general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431
17.40 Resolución de ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
17.50 Propiedades de los determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 438
17.60 Reducción a forma triangular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
17.70 Funciones alternadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
17.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445

18 Matrices y transformaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449


18.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449
18.20 Algunas matrices especiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452
18.30 Álgebra matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454
18.40 Matriz inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462
18.50 Transformaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464
18.60 Matrices ortogonales y transformaciones ortogonales . . . . . . . . . . . 469
18.70 Operaciones de simetrı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 471
18.80 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 476

19 El problema de autovalores matriciales . . . . . . . . . . . . . . . . . . . . . . . . . . 481


19.10 Sistemas de ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 481
19.20 El problema de autovalores matriciales . . . . . . . . . . . . . . . . . . . . . . . 483
19.30 Diagonalización de matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 490
19.40 Formas cuadráticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 493
19.50 Matrices complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 497
19.60 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 500
XII Índice de contenidos

20 Métodos numéricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503


20.10 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503
20.20 Errores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503
20.30 Resolución de ecuaciones ordinarias . . . . . . . . . . . . . . . . . . . . . . . . . . 507
20.40 Interpolación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 511
20.50 Integración numérica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 518
20.60 Métodos de álgebra lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 525
20.70 Eliminación gaussiana para la resolución de ecuaciones lineales . 525
20.80 Método de eliminación de Gauss–Jordan para la inversa de una
20.80 matriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 528
20.90 Ecuaciones diferenciales de primer orden . . . . . . . . . . . . . . . . . . . . . 530
20.10 Sistemas de ecuaciones diferenciales . . . . . . . . . . . . . . . . . . . . . . . . . 534
20.11 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 536

21 Probabilidad y estadı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 541


21.10 Estadı́stica descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 542
21.20 Frecuencia y probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 548
21.30 Probabilidades combinadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 549
21.40 Distribución binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 551
21.50 Permutaciones y combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553
21.60 Distribuciones continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 558
21.70 Distribución gaussiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 560
21.80 Más de una variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 563
21.90 Mı́nimos cuadrados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 564
21.10 Estadı́stica muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 569
21.11 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 570

Apéndice. Integrales estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 573

Soluciones de los ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 577


Números, variables y álgebra

1.1. Conceptos
La Quı́mica, en común con las otras ciencias fı́sicas y otras ciencias aplicadas, com-
prende:

(i) experimentos: la observación de fenómenos fı́sicos y la medición de cantidades


fı́sicas, y
(ii) teorı́a: la interpretación de los resultados de los experimentos, la correlación de
un conjunto de medidas con otros conjuntos de medidas, el descubrimiento y la
aplicación de reglas para racionalizar e interpretar esas correlaciones.

Ambos, experimentos y teorı́a, suponen la manipulación de números y de los sı́mbolos


empleados para representar los números y las cantidades fı́sicas.

EJEMPLO 1.1 La ecuación de estado de un gas ideal es


pV = nRT (1.1)
donde p es la presión del gas, V su volumen, T la temperatura, n la cantidad de materia, y R = 8,31451 J K−1
mol−1 es la constante de los gases. Supongamos que tenemos un décimo de mol de gas, n = 0,1 mol, a
temperatura T = 298 K y presión p = 105 Pa. La ecuación (1.1) nos permite calcular el volumen del gas:

nRT 0,1 mol × 8,31451 J K−1 mol−1 × 298 K


V= =
p 105 Pa
0,1 × 8,31451 × 298 mol J K−1 mol−1 K
= 5
×
10 Pa

= 2,478 × 10−3 m3 .

Este ejemplo ilustra un cierto número de conceptos:


(i) Dado cualquier conjunto particular de valores de la presión p, la temperatura T y
cantidad de materia n, la ecuación nos permite calcular el correspondiente volumen V.
El valor de V queda, por lo tanto, determinado por los valores de p, T y n. Decimos que
V es una función de p, T y n.
2 Capı́tulo 1. Números, variables y álgebra

Este enunciado se representa normalmente como1

V = f (p, T, n)

y significa que, conocidos los valores de p, T y n, el valor de V viene dado por el valor
de una función f (p, T, n) que, en el presente caso, es f (p, T, n) = nRT/p.
Una forma ligeramente diferente, utilizada a menudo en ciencias, es

V = V(p, T, n),

y significa que V es alguna función de p, T y n, que puede ser conocida o no. Trataremos
las funciones en el Capı́tulo 2.

(ii) La función contiene dos tipos de cantidades.

Constantes: una cantidad cuyo valor es fijo para el caso que se está tratando. La canti-
dad R = 8,31451 J K−1 mol−1 es una cantidad fı́sica constante. Un número constante es
cualquier número especı́fico, por ejemplo, a = 0,1 o π = 3,14159 . . .

Variables: una cantidad que puede tomar cualquier valor dentro de un conjunto de
valores permitidos. Las cantidades p, T y n son las variables de la función f (p, T, n) =
nRT/p.
Podemos distinguir dos tipos de variables. Una variable independiente es una cuyo
valor no depende del valor de ninguna otra variable. Escribir la ecuación (1.1) en la
forma V = nRT/p supone que las variables independientes son p, T y n. La cantidad
V es entonces una variable dependiente porque su valor depende de los valores de las
variables independientes. Podrı́amos haber escogido T como variable dependiente y p, V
y n como variables independientes, es decir: T = pV/nR. En la práctica, la elección de
las variables independientes es por conveniencia matemática, pero puede también estar
determinada por las condiciones de un experimento. En algunos casos es más fácil medir
la presión p, la temperatura T y la cantidad de materia n, y calcular V a partir de ellas.
Tratamos los números en los Apartados 1.2 y 1.3, y las variables en el Apartado 1.5.
El álgebra de los números (aritmética) lo tratamos en el Apartado 1.6.

(iii) Una cantidad fı́sica es siempre el producto de dos cantidades, un número y una
unidad. Por ejemplo, T = 298,15 K o R = 8,31451 J K−1 mol−1 . En aplicaciones de
matemáticas en ciencias, los números por sı́ mismos no tienen sentido salvo que se es-
pecifiquen las unidades de las cantidades fı́sicas. Es importante saber cuáles son esas
unidades, pero las matemáticas no dependen de ellas.

01. El signo para la igualdad fue introducido por Robert Recorde (hacia 1510-1558) en su The whets-
tone of witte (La piedra de afilar el ingenio, Londres 1557).‘Voy a fijar, como suelo hacer en mis trabajos,
un par de lı́neas paralelas o gemelas de misma longitud, ası́: ==, porque no hay dos cosas que puedan ser
más iguales.’
1.2. Números reales 3

Las unidades obedecen las leyes ordinarias del álgebra y pueden manipularse co-
mo números. Por ejemplo, en el cálculo del volumen presentado en el Ejemplo 1.1, las
cantidades fı́sicas estaban dadas en unidades SI: mol para cantidad de materia, K para
temperatura, Pa para presión y J para energı́a (o trabajo). Los números y las unidades se
separan en el cálculo, dando la expresión para las unidades

mol J K−1 mol−1 K J


=
Pa Pa
(recordando que x−1 = 1/x). Ahora bien

trabajo = fuerza × distancia

de manera que la unidad (SI) de trabajo es J = N m, donde el newton N es la unidad SI


de fuerza y m es la unidad de longitud. Además,

presión = fuerza/área

de manera que la unidad (SI) de presión es Pa = N m−2 . Se deduce que

J Nm
= = m3 ,
Pa N m−2
que es la unidad SI de volumen.
Tratamos las unidades con más detalle en el Apartado 1.7.

1.2. Números reales

El concepto de número, y de contar, se aprende muy pronto en la vida, y casi todas


las mediciones en el mundo fı́sico implican de un modo u otro números y cuentas. Los
números más sencillos son los números naturales, números cardinales o números en-
teros sin signo: 1, 2, 3. . . Se comprueba fácilmente que la suma o la multiplicación de
dos números naturales siempre da un número natural, mientras que la resta y la división
no necesariamente. Por ejemplo: 5 − 3 = 2, pero 5 − 6 no es un número natural. Un
conjunto de números para el que la resta siempre es válida es el conjunto de los enteros,
que consiste en todos los números cardinales positivos y negativos más el cero:

· · · − 3, −2, −1, 0, +1, +2, +3, · · ·

Las operaciones de suma y resta de enteros tanto positivos como negativos son posibles
gracias a las reglas

m + (– n) = m − n
m − (– n) = m + n (1.2)
4 Capı́tulo 1. Números, variables y álgebra

de manera que, por ejemplo, la resta de un número negativo es equivalente a la suma del
correspondiente número positivo. La operación de multiplicación es posible gracias a las
reglas

(– m) × (– n) = + (m × n)
(– m) × (+ n) = – (m × n) . (1.3)

EJEMPLOS 1.2 Suma y resta de números negativos


2 + (– 3) = 2 − 3 = −1 , 2 − (– 3) = 2 + 3 = 5 ,

(– 2) × (– 3) = 2 × 3 = 6 , (2) × (– 3) = −2 × 3 = −6 .

En las ecuaciones (1.2) y (1.3) las letras m y n son sı́mbolos empleados para representar
cualquier par de enteros. Son variables enteras, cuyos valores pertenecen al conjunto
(infinito) de los enteros.
La división de un entero por otro no da siempre un entero. Por ejemplo 6 ÷ 3 = 2,
pero 6 ÷ 4 no es un entero. Un conjunto de números para el que la división siempre es
válida es el conjunto de los número racionales, que consiste en todos los números m/n
donde m y n son enteros. La expresión m/n se lee ‘m partido por n’ y es la notación más
común para ‘m dividido por n’. La definición excluye el caso n = 0 porque la división
por cero no está definida (véase el Apartado 1.6), pero incluye el caso de los enteros
puesto que un entero m puede escribirse como m/1. Las reglas para la combinación de
números racionales (y, en general, de fracciones) son

m p mq + np
+ = (1.4)
n q nq
m p mp
× = (1.5)
n q nq
m p m q mq
÷ = × = (1.6)
n q n p np

donde, por ejemplo, mq significa m × q.

EJEMPLOS 1.3 Suma de fracciones


1 1
1. Sume y .
2 4
El número un medio es igual a dos cuartos y puede ser sumado a un cuarto para dar tres cuartos:
1 1 2 1 3
+ = + = .
2 4 4 4 4
El valor de una fracción como 1/2 no cambia si el numerador y el denominador son ambos multipli-
cados por el mismo número:
1 1×2 2
= =
2 2×2 4
y el método general de sumar fracciones es: (a) hallar un denominador común para las fracciones
por sumar, (b) expresar todas las fracciones en términos de ese denominador común, (c) sumar.
1.2. Números reales 5

2 4
2. Sume y .
3 5
Un denominador común es 3 × 5 = 15. Por lo tanto
2 4 2×5 3×4 10 12 22
+ = + = + = .
3 5 3×5 3×5 15 15 15

1 5
3. Sume y .
4 6
Un denominador común es 4 × 6 = 24, pero el mı́nimo (menor) denominador común es 12:
1 5 3 10 13
+ = + = .
4 6 12 12 12

EJEMPLO 1.4 Multiplicación de fracciones

2 4 2×4 8
× = = .
3 5 3×5 15
Podemos interpretarlo como tomar dos tercios de 4/5 (o cuatro quintos de 2/3).

EJEMPLO 1.5 División de fracciones

2 4 2 5 10
÷ = × = .
3 5 3 4 12
El número 10/12 puede simplificarse ‘dividiendo arriba y abajo’ por el factor común 2: 10/12 = 5/6.

Todo número racional es la solución de una ecuación lineal

mx = n (1.7)

donde m y n son enteros. La solución de la ecuación (1.7) es x = n/m. Sin embargo, no


todos los números son racionales. Por ejemplo, una solución de la ecuación cuadrática

x2 = 2
√ √
es x = 2, la raı́z cuadrada positiva de 2 (la otra solución es − 2), y este número no
puede escribirse como un número racional 4m/n. Se dice que es un número irracional.
Otros números irracionales se obtienen como soluciones de la ecuación cuadrática más
general

mx2 + nx + p = 0 ,

donde m, n y p son enteros arbitrarios, ası́ como de otras ecuaciones algebraicas de


órdenes superiores. Por ejemplo, una solución de la ecuación cúbica

x3 = 2

3
√ √
3
es la raı́z cúbica de 2, 2. Los números irracionales como 2y 2 se llaman sordos.
6 Capı́tulo 1. Números, variables y álgebra

Los números racionales e irracionales que se obtienen como soluciones de ecuacio-


nes algebraicas del tipo

a 0 + a 1 x + a 2 x 2 + a 3 x 3 + . . . + an x n = 0 , (1.8)

donde a0 , a1 , . . . an son enteros, se llaman números algebraicos. Estos números pueden


expresarse de manera exacta mediante un número finito de números racionales y sordos.
Existen otros tipos de números que no son algebraicos; no se obtienen como solucio-
nes de ninguna ecuación algebraica. Esos números son números irracionales llamados
números trascendentes: ‘trascienden el poder de los métodos algebraicos’ (Euler).2 Los
más conocidos y más importantes de ellos son el número de Euler e y el número arqui-
mediano π.3 Los tratamos en el Apartado 1.3.
Los números racionales y los irracionales forman el continuo de números. Todos
juntos son llamados los números reales.

1.3. Representación decimal de los números

Éstos son los nueve caracteres de los Indios

9 8 7 6 5 4 3 2 1

con estos mismos nueve caracteres y con este signo 0, que llaman los
árabes sefir, se escribe cualquier número, como se demostrará más
abajo.
(Fibonacci)4

02. Leonhard Euler (1707-1783). Nacido en Suiza, trabajó la mayor parte de su vida en San Peters-
burgo y en Berlı́n. Fue uno de los matemáticos más prolı́ficos del mundo, escribió ‘voluminosos trabajos
y gigantescos libros de texto’. Contribuyó a casi todas las ramas de las matemáticas y a sus aplicacio-
nes a problemas fı́sicos, incluyendo cálculo, ecuaciones diferenciales, series infinitas, funciones complejas,
mecánica e hidrodinámica, y su nombre se asocia con muchos teoremas y fórmulas. Una de sus contribu-
ciones importantes, si bien no espectacular, fue la notación matemática. Introdujo el sı́mbolo e, dio a las
funciones trigonométricas su definición moderna, y por su uso de los sı́mbolos sen, cos, i y π, los hizo ser
universalmente aceptados.
03. El sı́mbolo π fue empleado por vez primera por William Jones (1675-1749) en un libro de texto
sobre matemáticas, Synopsis palmariorum mathesos (Una nueva introducción a las matemáticas) en 1706.
El que Euler adoptara el sı́mbolo determinó su aceptación.
04. Leonardo de Pisa, llamado Fibonacci (hacia 1170 - después de 1240). El matemático sobresaliente
del medioevo en occidente. En sus viajes a Egipto, Siria, Grecia y Sicilia, Fibonacci estudió los textos
matemáticos griegos y arábigos, y se familiarizó con el sistema posicional arábigo desarrollado por los
matemáticos indios del valle del Indo, en el noroeste de la India. El primer libro de Fibonacci, el Liber
abaci o Libro de los ábacos (1202, revisado en 1228), circuló ampliamente en forma de manuscrito pero
fue únicamente publicado en 1857 en Scritti di Leonardo Pisano. El primer capı́tulo empieza con la cita
que aparece más arriba en el texto.
1.3. Representación decimal de los números 7

En el sistema decimal de números, los diez dı́gitos 0 a 9 (numerales indo-arábigos)5 se


utilizan para el cero y los primeros nueve enteros positivos. El décimo entero positivo
se representa por 10. Un entero mayor, como ‘trescientos setenta y dos’ se expresa en la
forma

300 + 70 + 2 = 3 × 102 + 7 × 10 + 2

y se denota con el sı́mbolo 372, en el cual el valor de cada dı́gito depende de su posición
dentro del sı́mbolo del número. El sistema decimal tiene base 10, y es el único sistema
en uso general.
Aunque los números racionales pueden siempre expresarse exactamente como co-
cientes de enteros, esto no ocurre con los números irracionales. Para efectuar los cálcu-
los, todo número que no es entero se expresa convenientemente como una fracción
decimal,6 por ejemplo: 5/4 = 1,25 . La forma general de una fracción decimal consiste
en un entero a la izquierda de la coma decimal, la parte entera del número, y uno o más
dı́gitos a la derecha de la coma decimal, la parte decimal o fraccionaria del número. El
valor de cada dı́gito viene determinado por su posición. Por ejemplo

5 6 7
234,567 = 200 + 30 + 4 + + +
10 100 1000
= 2 × 102 + 3 × 101 + 4 × 100 + 5 × 10−1 + 6 × 10−2 + 7 × 10−3 ,

donde 100 = 1 (véase el Apartado 1.6).


Un número con un número finito de dı́gitos tras (a la derecha de) la coma decimal
puede escribirse siempre en forma racional m/n. Por ejemplo 1,234 = 1234/1000. Sin
embargo, lo contrario no siempre es cierto. El número 1/3 no puede expresarse exacta-
mente como una fracción decimal finita:
1
= 0,3333 . . .
3

05. Una de las principales fuentes que introdujeron el sistema posicional indo-arábigo en la Europa
occidental fue la Aritmética de Al-Khwarizmi. Muhammad ibn Musa Al-Khwarizmi (Mohammed hijo de
Moisés de Khorezm, la moderna Khiva en Uzbekistán) ejerció en los tiempos del califa de Bagdad Al-
Mamún (813-833), y fue probablemente un miembro de su “Casa de la sabidurı́a” (Academia) en la época
en que Bagdad era la mayor ciudad del mundo. El Álgebra de Al-Khwarizmi fue utilizado ampliamente en
árabe y en su traducción latina como fuente sobre ecuaciones lineales y cuadráticas. La palabra algoritmo
proviene del nombre del autor y la palabra álgebra proviene del tı́tulo, Liber algebrae et almucabala, que
puso Robert de Chester en la traducción latina (hacia 1140) del trabajo sobre las ecuaciones.
06. El uso de fracciones decimales fue introducido en las matemáticas europeas por el matemático e
ingeniero flamenco Simon Stevin (1548-1620) en su De Thiende (El arte de las décimas) en 1585. Aunque
las fracciones decimales ya eran usadas por los chinos desde varios siglos antes, y el astrónomo persa Al-
Kashi utilizó fracciones decimales y sexagesimales en su Llave de la Aritmética a principios del siglo XV, el
uso generalizado de las fracciones decimales en las matemáticas europeas se remonta directamente a Stevin,
especialmente después que John Napier modificase la notación y diese la actual con el punto decimal (o
la coma, como se usa en gran parte de la Europa continental). Esto simplifica mucho las operaciones de
multiplicación y división.
8 Capı́tulo 1. Números, variables y álgebra

los puntos suspensivos indican que la fracción debe extenderse de manera indefinida.
Redondeado a cuatro cifras decimales, el número tiene por cotas inferior y superior
0,3333 y 0,3334:

1
0,3333 < < 0,3334,
3
donde el sı́mbolo < significa ‘menor que’. Otros sı́mbolos del mismo tipo son > para
‘mayor que’ y ≤ para ‘menor o igual que’. Otros ejemplos de fracciones decimales que
no terminan son
1 1
= 0,142857 142857 . . . , = 0,083333 333333 . . .
7 12
En ambos casos se repite indefinidamente una secuencia finita de dı́gitos tras la coma
decimal, ya sea inmediatamente después de la coma decimal, como la secuencia 142857
en 1/7, o después de un número finito de dı́gitos previos, como 3 en 1/12. Ésta es una
propiedad caracterı́stica de los números racionales. √
Un número irracional no puede ser expresado exactamente. El número 2 tiene como
valor aproximado con 16 cifras significativas

2 = 1,41421 35623 73095 . . .

y puede ser calculado hasta cualquier precisión deseada por medio de un método numéri-
co como el de Newton-Raphson que tratamos en el Capı́tulo 20. En contraste con el caso
racional, los dı́gitos tras la coma decimal no muestran una secuencia que se repita.

El número arquimediano π
El número π se define como la razón de la circunferencia de un cı́rculo a su diámetro.
Es un número trascendente y no puede ser representado exactamente mediante un núme-
ro finito de dı́gitos.7 Su valor ha sido calculado con muchas cifras significativas. Euler lo
dio con 127 cifras decimales en 1748. Su valor con 16 cifras significativas es

π = 3,14159 26535 89793 . . .

El valor de π ha sido de importancia práctica desde hace miles de años. Por ejemplo, un
manuscrito egipcio de aproximadamente 1650 a.C. (el papiro Rhind del Museo Británico
de Londres) contiene una receta para el cálculo del volumen de un silo cilı́ndrico de la

07. La prueba de la irracionalidad de π fue dada primero en 1761 por el fı́sico y matemático alemán
Johann Heinrich Lambert (1728-1777) que es también conocido por haber introducido las funciones hi-
perbólicas en trigonometrı́a. La prueba de que el número π es trascendente se debe a Carl Louis Ferdinand
von Lindemann (1852-1939), quien lo demostró en 1882 con un método similar al empleado por Hermite
para e.
1.3. Representación decimal de los números 9

cual se deduce el valor aproximado 256/81 ≈ 3,160. Arquı́medes8 usó por primera vez
un método para generar aproximaciones precisas, determinando las cotas

223 22
<π< ,
71 7
y la cota superior tiene un error de sólo 2 partes por mil.

El número e de Euler
El número e se define mediante la ‘serie infinita’ (véase el Capı́tulo 7)

1 1 1 1
e = 1+ + + + + ...
1! 2! 3! 4!
= 2,71828 18284 59045 . . .

la cantidad n! (que se lee ‘n factorial’) se denomina factorial de n, y se define para


enteros positivos como

n! = 1 × 2 × 3 × . . . × n ,

por ejemplo: 3! = 1 × 2 × 3 = 6, 4! = 1 × 2 × 3 × 4 = 24. Además, el factorial de cero


se define como 0! = 1. El valor de e puede calcularse mediante la serie con cualquier
precisión deseada. Hermite9 demostró en 1873 que es un número trascendente.

EJEMPLO 1.6 Demuestre que la suma de los 10 primeros términos de la serie da un valor aproximado
de e que es correcto al menos con 6 cifras significativas.

1 1 1 1 1 1 1 1 1
e = 1+1+ + + + + + + + + + ...
2 6 24 120 720 5040 40320 362880 3628800

≈ 1 + 1 + 0,5 + 0,1666667 + 0,041667 + 0,008333 + 0,001389 + 0,000198


+ 0,000025 + 0,000003 + 0,0000003

≈ 2,71828 .

08. Arquı́medes (287-212 a.C.) nació en Siracusa, en Sicilia. Hizo contribuciones a las matemáticas,
la mecánica y la astronomı́a, y fue un gran inventor de máquinas. Sus principales contribuciones a las ma-
temáticas y a las ciencias matemáticas fueron la invención de métodos para determinar áreas y volúmenes,
que anticiparon el cálculo integral, y el descubrimiento de la primera ley de la hidrostática y de la ley de la
palanca.
09. Charles Hermite (1822-1901). Matemático francés, profesor en la Sorbona, es conocido por sus
trabajos en álgebra y en teorı́a de números. Su trabajo sobre el álgebra de los números complejos (las
‘formas hermı́ticas’) adquirió importancia con la formulación de la teorı́a cuántica. La ecuación diferencial
de Hermite y los polinomios de Hermite son importantes en la resolución de la ecuación de Schrödinger
para el oscilador armónico.
10 Capı́tulo 1. Números, variables y álgebra

El valor es correcto hasta las seis cifras dadas porque cada término adicional de la serie es por lo menos
diez veces menor que el anterior.

Cifras significativas y redondeo


En la práctica, la aritmética que trata sólo con enteros da resultados exactos (salvo que
los números sean demasiado grandes para ser escritos). Más generalmente, un número
en el sistema decimal se aproxima ya sea con un número dado de decimales, o con
un número dado de cifras significativas, y el resultado de una operación aritmética es
también aproximado. En la representación en coma fija, todos los números se dan con
un número fijo de decimales. Por ejemplo,

3,142 , 62,358 , 0,013 , 1,000 .

tienen todos 3 cifras decimales. En la representación en coma flotante, utilizada más ge-
neralmente en ciencias, los números se dan con un número fijo de ‘cifras significativas’,
donde los ceros a la izquierda no cuentan. Por ejemplo,

3210 = 0,3210 × 104 , 003,210 = 0,3210 × 101 , 0,003210 = 0,3210 × 10−2 ,

tienen todos 4 cifras significativas.


Un número cuya representación (decimal) exacta necesita más del número dado de
dı́gitos se reduce de manera sencilla por truncación, esto es, suprimiendo o sustituyendo
por ceros los dı́gitos superfluos a la derecha. Por ejemplo, con 4 cifras decimales, o 5
cifras significativas, 3,14159 se trunca a 3,1415. Truncar no es recomendable porque
puede conducir a serios errores de cálculo. Una aproximación más sensata (precisa) de
π con cinco cifras es 3,1416, y se obtiene por redondeo. Las reglas más comúnmente
aceptadas para redondear son:

(i) Si el primer dı́gito desechado es mayor o igual a 5, el dı́gito anterior se incrementa


en 1. El número es redondeado al alza.
(ii) Si el primer dı́gito desechado es menor que 5, el dı́gito anterior se deja como está.
El número es redondeado a la baja. Por ejemplo, para 4, 3, 2 y 1 cifras decimales,

7,36284 es 7,3628 , 7,363 , 7,36 , 7,4 .

1.4. Números complejos


Las soluciones de ecuaciones algebraicas no son siempre números reales. Por ejem-
plo, las soluciones de la ecuación

x2 = −1
1.5. Variables 11

no son ninguno de los números descritos en el Apartado 1.2. Se incorporan al sistema


de números definiendo la raı́z cuadrada de −1 como un nuevo número que se representa
generalmente por el sı́mbolo i (algunas veces j) con la propiedad

i2 = −1 .

Las dos raı́ces cuadradas de un número real negativo arbitrario −x2 son entonces ix y
−ix. Por ejemplo,
√ √ √
−16 = 16 × −1 = ±4i .

Estos números se llaman imaginarios para distinguirlos de los números reales. Más
generalmente, el número

z = x + iy,

donde x e y son reales, se llama un número complejo. Tratamos los números complejos
en el Capı́tulo 8.

1.5. Variables
En los apartados previos hemos usado sı́mbolos (letras) para representar números
arbitrarios. Una cantidad que puede tomar cualquier valor escogido dentro de un con-
junto de valores se llama una variable. Si {x1 , x2 , x3 , . . . , xn } es un conjunto de objetos,
no necesariamente números, entonces podemos definir mediante ese conjunto una va-
riable x que tenga como valor cualquiera de los miembros del conjunto. El conjunto es
el dominio de la variable. En teorı́a de números (reales), los objetos del conjunto son
números reales, y una variable real puede tener como dominio o bien todo el continuo
de los números reales o bien un subconjunto de éste. Si el dominio de la variable x es un
intervalo desde a hasta b,

a ≤ x ≤ b,

entonces x es una variable continua en el intervalo y puede tomar cualquier valor en el


intervalo continuo de valores desde a hasta b (incluidos a y b). Si el dominio consiste
en un conjunto discreto de valores, por ejemplo los n números x1 , x2 , x3 , . . . , xn , se dice
entonces que x es una variable discreta. Si el dominio consiste en enteros, x es una
variable entera. Si el conjunto consiste en un único valor, entonces se dice que es una
variable constante, o sencillamente una constante.
En las ciencias fı́sicas se usan variables para representar números y cantidades fı́sicas
por igual. En el ejemplo del gas ideal comentado en el Apartado 1.1, p, V, n y T son
variables continuas cuyos valores numéricos pueden en principio ser cualquier número
real positivo. Las variables discretas aparecen normalmente cuando los objetos son con-
tados por oposición a medidos. Tı́picamente, se emplea una variable discreta para contar
12 Capı́tulo 1. Números, variables y álgebra

y los objetos contados son una muestra de algún conjunto discreto. Sin embargo, a veces
una cantidad fı́sica puede tener valores que en algunos casos pertenecen a un conjunto
discreto y en otros a un conjunto continuo. Es el caso de los niveles de energı́a y de las
frecuencias espectrales observadas en un átomo o en una molécula.

EJEMPLO 1.7 El espectro del átomo de hidrógeno


Los niveles de energı́a del átomo de hidrógeno son de dos tipos:
(i) Niveles de energı́a discretos (cuantizados) con energı́as (negativas) dadas por la fórmula (en unidades
atómicas, véase el Apartado 1.7)

1
En = − , n = 1, 2, 3 . . .
2n2

Los estados correspondientes del átomo son los estados ligados, en los cuales el movimiento del electrón
está confinado a las proximidades del núcleo. Las transiciones entre niveles de energı́a dan lugar a lı́neas
discretas en el espectro del átomo.

(ii) Niveles de energı́a continuos, con todas las energı́as positivas, E ≥ 0. Los correspondientes estados del
átomo son los de un electrón que se mueve en presencia del campo electrostático de la carga nuclear. Las
transiciones entre esos niveles de energı́a y los de los estados ligados dan lugar a intervalos continuos de
frecuencias espectrales.

La importancia del concepto de variable se debe a que las variables se pueden utilizar
para hacer afirmaciones sobre propiedades de conjuntos completos de números (u otros
objetos) y a que permiten la formulación de un conjunto de reglas para manipular núme-
ros. El conjunto de reglas se llama el álgebra.

1.6. El álgebra de los números reales


Sean a, b y c variables reales cuyos valores pueden ser cualquier número real. Las re-
glas básicas para combinar dos números reales, el álgebra de números reales o aritmética,
son
1. a+b=b+a (ley conmutativa de la suma)
2. ab = ba (ley conmutativa de la multiplicación)
3. a + (b + c) = (a + b) + c (ley asociativa de la suma)
4. a(bc) = (ab)c (ley asociativa de la multiplicación)
5. a(b + c) = ab + ac (ley distributiva)

Las operaciones de suma y multiplicación, y sus inversas, resta y división, se llaman


operaciones aritméticas. Los sı́mbolos +,−, × y ÷ (o bien /) se llaman operadores
aritméticos. El resultado de multiplicar dos números, ab = a × b, se llama producto.
1.6. El álgebra de los números reales 13

EJEMPLOS 1.8 Leyes de la aritmética (a = 2, b = 3, c = 4)


(1) 2 + 3 = 3 + 2 = 5 ,
(2) 2 × 3 = 3 × 2 = 6 ,
(3) 2 + (3 + 4) = 2 + 7 = 9 , y
(2 + 3) + 4 = 5 + 4 = 9 ,
(4) 2 × (3 × 4) = 2 × 12 = 24 , y
(2 × 3) × 4 = 6 × 4 = 24 ,
(5) 2 × (3 + 4) = 2 × 7 = 14 , y
2 × (3 + 4) = (2 × 3) + (2 × 4) = 6 + 8 = 14 .

Estos ejemplos muestran el convenio de que las expresiones algebraicas (o aritméticas)


entre paréntesis deben ser evaluadas primero.

Tres reglas definen las propiedades del cero y de la unidad:

6. a + 0 = 0 + a = a (suma de cero)
7. a × 0 = 0 × a = 0 (multiplicación por cero)
8. a × 1 = 1 × a = a (multiplicación por la unidad)

Ya hemos visto que la resta de un número es lo mismo que la suma de su opuesto, y


que la división por un número es lo mismo que multiplicar por su inverso. Sin embargo,
la división por cero no está definida: no hay ningún número cuyo inverso sea cero. El
número 1/a para valores de a positivos, por ejemplo, se hace arbitrariamente grande
cuando el valor de a se acerca a cero. Decimos que 1/a tiende a infinito cuando a
tiende a cero:
1
→ ∞ cuando a → 0.
a
Aunque representamos ‘infinito’ por el sı́mbolo ∞, no es un número. Si lo fuera, por las
leyes del álgebra las ecuaciones 1/0 = ∞ y 2/0 = ∞ implicarı́an 1 = 2 .
2
El valor
√ absoluto de un número real a se define como la raı́z cuadrada positiva de a ,
|a| = + a . Es la ‘magnitud’ del número, igual a a si a es positivo, e igual a −a si a es
2

negativo:

|a| = +a si a > 0 ,
|a| = −a si a < 0 .

Por ejemplo, |3| = 3 y | − 3| = 3.

La ley de los exponentes


Los números se escriben a menudo en la forma am , donde a se llama la base y m el
exponente. Por ejemplo, 100 = 102 , ó 16 = 24 . Cuando el exponente m es un entero
14 Capı́tulo 1. Números, variables y álgebra

positivo, el número am se define como la m-ésima potencia de a y, para números reales,


a puede ser cualquier número tanto positivo como negativo. Por ejemplo,

a3 = a × a × a, (– a)3 = (– a) × (– a) × (– a) = (– 1)3 × a3 = −a3 .

También se pueden definir números con exponentes negativos o no enteros, y la regla


básica para la combinación de tales números es

9. am an = am+n (ley de los exponentes)

Por ejemplo

a2 a3 = (a × a) × (a × a × a) = a × a × a × a × a = a5 .

Otras reglas suplementarias son

10. am /an = am−n 11. (am )n = (an )m = am×n 12. (ab)m = am bm

Las reglas 9 y 10 definen un número con un exponente negativo. Ası́, si sustituimos n


por −n, la regla 9 nos da am a−n = am−n y comparándolo con la regla 10 nos muestra que

1
a−n = .
an
Por ejemplo, 25 × 2−2 = 25−2 = 23 por la regla 9, y 25 /22 = 25−2 = 23 por la regla 10, de
manera que 2−2 = 1/22 = 1/4. Además, tomar m = n en la regla 10 nos da

am /am = am−m = a0 = 1

y cualquier número elevado a la potencia cero es igual a la unidad.


La regla 11 es inmediata si m y n son enteros. Por ejemplo,

(23 )2 = 23 × 23 = 26 = 23×2 , (22 )3 = 22 × 22 × 22 = 26 = 22×3 .

Para exponentes fraccionarios, consideramos

21/2 × 21/2 = 21 = 2 .

De donde se deduce que 21/2 = 2, la raı́z cuadrada de 2. En general, a1/m es la raı́z
m-ésima de a,

a1/m = m
a.

Por ejemplo, 21/3 es la raı́z cúbica de 2 porque (21/3 )3 = 21 = 2. Vemos que para un
exponente no entero,
√ am puede ser complejo si a es negativo. Por ejemplo, (– 2)1/2 =
(– 1)1/2 × 21/2 = i 2 es complejo (véanse el Apartado 1.4 y el Capı́tulo 8).
1.7. Unidades 15

Para un exponente cualquiera racional, consideramos usando la regla 11

43/2 = (41/2 )3 = 8 .

El exponente racional m/n puede considerarse como el producto del entero m y de la


fracción 1/n, y el número resultante puede escribirse ya sea como la raı́z n-ésima de la
m-ésima potencia o como la m-ésima potencia de la raı́z n-ésima:

am/n = (am )1/n = (a1/n )m ,

o, de forma equivalente,
√ √
am/n = n
am = ( a)m .
n

Aunque hemos demostrado las reglas de los exponentes únicamente para exponentes en-
teros y racionales, se aplican también a los números con exponentes irracionales y, si se
permiten números complejos, a todo número escrito en la forma base/exponente. Cuando
m es una variable, am se llama función exponencial (véase el Apartado 3.5 para expo-
nentes reales y el Capı́tulo 8 para exponentes complejos). Si x = am , m es el logaritmo
en base a de x (véase el Apartado 3.6).
Hemos tratado en detalle la ley de los exponentes porque es una fuente común de
errores en las manipulaciones algebraicas.

EJEMPLOS 1.9 La ley de los exponentes


regla ejemplo
a a =a
m n m+n
23 × 22 = 23+2 = 25
23/4 × 2−1/4 = 23/4−1/4 = 21/2
am /an = am−n 23/4 /21/4 = 23/4−1/4 = 21/2
24 /2−2 = 24−(−2) = 24+2 = 26
(am )n = (an )m = amn (23 )1/3 = (21/3 )3 = 21 = 2
√ √ √ √
(2 2
)2
=2 2× 2
= 22 = 4
(ab)m = am bm (2 × 3)2 = 22 × 32
(– 8)1/3 = (– 1)1/3 × 81/3 = −2

EJEMPLO 1.10 Un ejemplo de lo que no hay que hacer


De la regla de los exponentes se deduce que

ab = (ab)1/2 = a1/2 b1/2 .
√ √ √
Por ejemplo, 36 = 4 9 = 2 × 3 = 6.
Pero √ √ √
a + b = a + b
donde = significa ‘no es igual a’. Por ejemplo,
√ √ √ √ √
9 + 16 = 25 = 5 y 9 + 16 = 9 + 16 = 3 + 4 = 7 .
Este es un error sorprendentemente frecuente.
16 Capı́tulo 1. Números, variables y álgebra

1.7. Unidades
Una cantidad fı́sica tiene dos atributos esenciales, magnitud y dimensiones. Por
ejemplo, la cantidad ‘2 metros’ tiene dimensiones de longitud y tiene magnitud igual a
dos veces la del metro. El metro es una cantidad fı́sica constante que define las dimensio-
nes de la cantidad y proporciona una escala para especificar la magnitud de una longitud
arbitraria; es una unidad de longitud. En general, una cantidad fı́sica es el producto de
un número y de una unidad. Toda cantidad fı́sica puede expresarse en términos de sie-
te cantidades ‘fundamentales’ cuyos nombres y sı́mbolos aparecen en las dos primeras
columnas de la Tabla 1.1.

Tabla 1.1 Cantidades fı́sicas fundamentales y unidades SI

Cantidad Sı́mbolo para Nombre de Sı́mbolo de


fı́sica la cantidad la unidad SI la unidad SI

longitud l metro m
masa m kilogramo kg
tiempo t segundo s
corriente eléctrica I amperio A
temperatura T kelvin K
cantidad de materia n mol mol
intensidad lumı́nica Iν candela cd

Los sı́mbolos en la segunda columna definen las dimensiones de las cantidades fı́sicas
fundamentales, y las dimensiones de todas las demás cantidades pueden expresarse en
función de ellas. Por ejemplo, la velocidad es la distancia recorrida por unidad de tiempo
y tiene dimensiones de longitud dividida por tiempo, lt−1 . Las dimensiones de una can-
tidad fı́sica son independientes del sistema de unidades utilizado para describir su valor.
Todo sistema de unidades debe, sin embargo, ajustarse a las dimensiones. Por ejemplo,
en un sistema de unidades en el cual la unidad de longitud es el metro, m, y la unidad
de tiempo es el segundo, s, la unidad de velocidad es metro por segundo, ms−1 . Algunas
cantidades fı́sicas no tienen dimensiones. Ese es el caso de una cantidad que es el cocien-
te de dos otras con las mismas dimensiones. Ejemplos de esto son la densidad relativa, la
masa molar relativa y la fracción molar. Un ejemplo menos evidente es el ángulo (plano)
que se define en términos del cociente entre dos longitudes (véase el Apartado 3.1).
Vimos en el Apartado 1.1 que las unidades obedecen las leyes del álgebra ordinaria.
Una de las lecciones del ejemplo es que las dimensiones, y por lo tanto las unidades, a
ambos lados de una ecuación tienen que coincidir.

EJEMPLO 1.11 Para la ecuación de los gases ideales, pV = nRT, las dimensiones de pV (utilizando las
Tablas 1.1 y 1.2) son las de trabajo (o energı́a)
(ml−1 t−2 ) × l3 = ml2 t−2 .
La correspondiente expresión en términos de unidades SI es Pa m3 = J. En el segundo miembro de (1.1),
para nRT,
(mol)(JK−1 mol−1 )(K) = J
como es necesario.
1.7. Unidades 17

Se utiliza toda una variedad de sistemas de unidades, muchos adaptados a las necesida-
des de las disciplinas particulares de las ciencias fı́sicas. El sistema recomendado para
las ciencias fı́sicas, y para la quı́mica en particular, es el Sistema Internacional de Unida-
des (SI) que se basa en las siete unidades de base cuyos nombres y sı́mbolos se reseñan
en la Tabla 1.1. Toda cantidad fı́sica tiene una unidad SI determinada por sus dimensio-
nes. La unidad SI de velocidad es el metro por segundo, ms−1 . Además de las unidades
fundamentales, un cierto número de cantidades que son particularmente importantes en
las ciencias fı́sicas tienen asignados nombres y sı́mbolos SI. Algunos de estos aparecen
en la Tabla 1.2.

Tabla 1.2 Unidades SI derivadas con nombres especı́ficos y sı́mbolos

Cantidad fı́sica Nombre Sı́mbolo Descripción

frecuencia hercio Hz eventos por unidad de tiempo s−1


fuerza newton N masa × aceleración kg m s−2
presión pascal Pa fuerza por unidad de área N m−2
energı́a, trabajo, calor julio J fuerza × distancia Nm
potencia vatio W trabajo por unidad de tiempo J s−1
carga eléctrica culombio C corriente × tiempo As
potencial eléctrico voltio V trabajo por unidad de carga J C−1
capacitancia eléctrica faradio F carga por unidad de potencial C V−1
resistencia eléctrica ohmio Ω potencial por unidad de corriente V A−1
conductancia eléctrica siemens S corriente por unidad de potencial Ω−1
flujo magnético weber Wb trabajo por unidad de corriente J A−1
densidad de flujo
magnético tesla T flujo magnético por unidad de área Wb m−2
inductancia henrio H flujo magnético por unidad de
corriente Wb A−1
ángulo plano radián rad ángulo subtendido por la unidad
de arco en el centro del cı́rculo
unidad 1
ángulo sólido estereo- sr ángulo sólido subtendido por la
rradián unidad de superficie en el centro
de la esfera unidad 1

Los múltiplos de diez de las unidades SI tienen nombres formados con los nom-
bres de las unidades y los prefijos reseñados en la Tabla 1.3. Por ejemplo, un pico-
metro es pm = 10−12 m, un decı́metro es dm = 10−1 m. Estas unidades de longitud
se usan frecuentemente en quı́mica: concentraciones en moles por decı́metro cúbico,
mol dm−3 = 103 mol m−3 , y longitudes de enlaces moleculares en picometros.

Cálculos aproximados
A menudo se utilizan las potencias de 10 como una descripción del orden de mag-
nitud. Por ejemplo, si una longitud A es dos órdenes de magnitud mayor que la longitud
B, entonces es unas 102 = 100 veces mayor. En algunos cálculos que involucran una
18 Capı́tulo 1. Números, variables y álgebra

variedad amplia de órdenes de magnitud puede ser de ayuda, para evitar errores, calcular
el orden de magnitud de la respuesta antes de embarcarse en todo el cálculo detallado.
La manera más sencilla de hacer tal ‘cálculo del orden de magnitud’ es convertir todas
las cantidades fı́sicas a la unidades SI fundamentales y aproximar la magnitud de cada
una por una potencia apropiada de diez, posiblemente multiplicada por un entero. Tales
cálculos son a menudo sorprendentemente exactos.

Tabla 1.3 Prefijos SI

Múltiplo Prefijo Sı́mbolo Múltiplo Prefijo Sı́mbolo

10 deca da 10−1 deci d


102 hecto h 10−2 centi c
103 kilo k 10−3 mili m
106 mega M 10−6 micro µ
109 giga G 10−9 nano n
1012 tera T 10−12 pico p
1015 peta P 10−15 femto f
1018 exa E 10−18 atto a

EJEMPLO 1.12 Para el Ejemplo del Apartado 1.1 (desechando las unidades),
nRT 0,1 × 8,31451 × 298
V= = = 2,478 × 10−3
p 105
dos estimaciones de la respuesta son

10−1 × 10 × 102
1. V≈ = 10−3
105
10−1 × 8 × 300
2. V≈ = 2,4 × 10−3
105

Unidades atómicas
Las ecuaciones del movimiento en mecánica cuántica se complican por la presencia
de las cantidades fı́sicas me , masa en reposo del electrón, e, carga del protón, h, constante
de Planck, y 0 , permitividad del vacı́o. Por ejemplo, la ecuación de Schrödinger para el
movimiento de un electrón alrededor del núcleo estacionario en el átomo de hidrógeno
es
h2 e2
− ∇ 2
ψ − ψ = Eψ . (1.9)
8π 2 me 4π0 r

Las cuatro cantidades determinadas experimentalmente pueden usarse como unidades


fundamentales para construir unidades atómicas para todas aquellas cantidades fı́sicas
que tienen que ver con longitud, masa, tiempo y corriente eléctrica (las cuatro primeras
entradas de la Tabla 1.1). Presentamos algunas de las unidades atómicas en la Tabla
1.8. Ejercicios 19

1.4. Las unidades atómicas de longitud y energı́a tienen nombre: la unidad de longitud,
a0 se llama el bohr, y es la distancia más probable del electrón al núcleo en el estado
fundamental del átomo de hidrógeno (el radio de la órbita del estado fundamental en la
‘vieja teorı́a cuántica’ de Bohr). La unidad de energı́a, Eh , se llama el hartree, y es igual
a dos veces la energı́a de ionización del átomo de hidrógeno. Las unidades atómicas
son de amplio uso en quı́mica cuántica. El convenio es dar cada cantidad fı́sica como
una expresión de las unidades atómicas, y eliminar la unidad de la expresión: para una
distancia r, por ejemplo, la cantidad adimensional r/a0 se sustituye por r. Si hacemos
esto en la ecuación (1.9), la ecuación adimensional resultante es

1 1
− ∇2 ψ − ψ = Eψ . (1.10)
2 r
A menudo se refiere uno a la ecuación en esta forma como la “ecuación de Schrödin-
ger en unidades atómicas”. Los resultados de los cálculos son entonces números que
deben ser reinterpretados como cantidades fı́sicas. Por ejemplo, la cantidad E en la
ecuación (1.9) es una energı́a. La resolución de la ecuación (1.10) nos da los núme-
ros E = −1/2n2 , para todo entero positivo n, y estos números se interpretan entonces
como las energı́as E = (– 1/2n2 )Eh .

Tabla 1.4 Unidades atómicas

Cantidad fı́sica Unidad atómica Valor en unidades SI

masa me 9,10939 × 10−31 kg


carga e 1,60218 × 10−19 C
momento angular  = h/2π 1,05457 × 10−34 J s
longitud a0 = 4π0 2 /me e2 5,29177 × 10−11 m
energı́a Eh = me e4 /16π 2 0 2 2 4,35975 × 10−18 J
tiempo /Eh 2,41888 × 10−17 s
corriente eléctrica eEh / 6,62362 × 10−3 A
potencial eléctrico Eh /e 2,72114 × 101 V
momento dipolar eléctrico ea0 8,47836 × 10−30 C m
intensidad de campo eléctrico E Eh /a0 e 5,14220 × 1011 V m−1
polarizabilidad eléctrica α 4πa0 3 1,64857 × 10−41 F m2
momento dipolar magnético e/me 1,85464 × 10−23 J T−1
densidad de flujo magnético /ea0 2 2,35055 × 105 J
magnetizabilidad ξ e2 a0 2 /me 7,89023 × 10−29 J T−2
20 Capı́tulo 1. Números, variables y álgebra

1.8. Ejercicios
Apartado 1.2
Calcule y exprese cada resultado en su forma más sencilla:
1 1 1 1 3 5
1. + 2. + 3. −
4 8 3 6 4 7
       
2 5 3 1 3 5
4. − 5. + − 6. − +
9 6 4 8 4 8
           
1 3 1 1 1 3
7. − + − 8. − − 9. − − −
5 10 4 8 4 8
1 3 3 2 5
10. × 11. 2× 12. ×
2 4 4 3 6
           
1 3 1 3 1 3
13. × − 14. − × 15. − × −
2 4 4 2 2 4
3 4 2 5 2 4
16. ÷ 17. ÷ 18. ÷
4 5 3 3 15 5
           
3 4 3 4 3 4
19. ÷ − 20. − ÷ 21. − ÷ −
4 5 4 5 4 5

Apartado 1.3
22. Exprese como fracciones decimales:

10−2 , 2 × 10−3 , 5 × 10−6 , 300 + 2 + 3 × 10−4 .

23. Halle la secuencia de dı́gitos que se repite en la representación con fracciones decimales de

2 1 13 1
, , , .
9 6 3 21

24. Halle cotas superiores e inferiores con 6 cifras significativas exactas para

1 2 1
, , , π, e.
7 9 11

25. Halle los valores de los factoriales 5!, 6!, 7!, 8!, 9!, 10! .
3! 6! 5!
26. Calcule , , .
2! 3! 2!3!
Apartado 1.6
Simplifique cuando sea posible:

27. a2 a3 28. a3 a−3 29. a3 a−4 30. a3 /a2


31. a5 /a−4 32. (a3 )4 33. (a2 )−3 34. (1/a2 )−4
35. a1/2 a1/3 36. (a2 )3/2 37. (a3 b6 )2/3 38. (a2 + b2 )1/2
39. 91/2 40. 82/3 41. (32)3/5 42. (27)−4/3
1.8. Ejercicios 21

Apartado 1.7
Identifique una cantidad fı́sica con cada una de las siguientes dimensiones (columna 2 de la Tabla 1.1) e
indique sus unidades SI:

43. ml−3 44. nl−3 45. lt−2 46. mlt−1


47. mlt−2 48. ml2 t−2 49. ml−1 t−2 50. It
2 −1 −3 −1 −2
51. ml I t 52. mI t
Exprese en unidades fundamentales SI (columna 4 de la Tabla 1.1):

53. dm−3 54. cm ms−2 55. g dm−3 56. mg pm µs−2


57. dg mm−1 ns−2 58. mV cm−1 59. kN dm 60. mmol dm−3
Funciones algebraicas

2.1. Conceptos
Escribir la ecuación de estado (1.1) de los gases ideales en la forma

nRT
V=
p

supone que, para cualquier estado del sistema, el valor del volumen V (la variable depen-
diente) se determina mediante los valores de la presión p, la temperatura T y la cantidad
de materia n (las variables independientes). En general, decimos que una variable de-
pendiente es función de la variable o de las variables de las que depende.1 En el ejemplo
precedente, V es una función de las tres variables p, T y n. En este capı́tulo trataremos
las funciones de una variable únicamente. El caso de más de una variable independiente
lo comentamos en el Capı́tulo 9.
Sea la variable y una función de la variable x. Por ejemplo, la ecuación

y = 2x2 − 3x + 1 (2.1)

nos da y como una función particular de x. Para cada valor de x el valor de y viene dado
por el segundo miembro de la ecuación. Esta expresión define una función f

f (x) = 2x2 − 3x + 1 (2.2)

cuyo valor para cada valor de x dado es asignado a la variable y (se lee f (x) como ‘f de
x’). La función f es la regla para calcular y a partir de x.
Una función toma valores numéricos cuando se asignan valores numéricos a las va-
riables.

01. La palabra ‘función’ fue utilizada por primera vez en este contexto por el matemático alemán
Gottfried Wilhelm Leibniz (1646-1716).
24 Capı́tulo 2. Funciones algebraicas

EJEMPLO 2.1 Los valores de la función (2.2) para x = 2, x = 1 y x = 0 son

f (2) = 2 × 22 − 3 × 2 + 1 = 3
f (1) = 2 × 12 − 3 × 1 + 1 = 0
f (0) = 2 × 02 − 3 × 0 + 1 = 1

Sin embargo, el concepto de función es más general que esto, porque la variable x puede
ser sustituida por otra variable, por otra función o por una cantidad más complicada,
como un operador diferencial o una matriz.

EJEMPLO 2.2 Sustituya la variable x en (2.2) por la variable a

f (a) = 2a2 − 3a + 1

EJEMPLO 2.3 Sustituya la variable x en (2.2) por la función h + 2

f (h + 2) = 2(h + 2)2 − 3(h + 2) + 1


= 2(h2 + 4h + 4) − 3(h + 2) + 1
= 2h2 + 8h + 8 − 3h − 6 + 1
= 2h2 + 5h + 3
= g(h)

y
g(x) = 2x2 + 5x + 3
es una nueva función de x que está relacionada con f (x) a través de g(x) = f (x + 2).

d
EJEMPLO 2.4 Sustituya la variable x en (2.2) por el operador diferencial
dx
d   d 2 d  d2 d
f =2 −3 +1=2 2 −3 +1
dx dx dx dx dx
es un nuevo operador diferencial.

EJEMPLO 2.5 Por la ecuación de estado de los gases ideales, el volumen es una función de la presión, la
temperatura y la cantidad de materia,
nRT
V = f (p, T, n) = ,
p
y por el cálculo hecho en el Ejemplo 1.1

f (105 Pa, 298 K, 0,1 mol) = 2,478 × 10−3 m3 .


2.2. Representación gráfica de funciones 25

Al calcular el valor de una función puede ser necesario algún cuidado para que la ex-
presión que define la función sea interpretada correctamente. Una función sencilla como
(2.2) aparece libre de ambigüedades, como hemos visto en el Ejemplo (2.1), pero incluso
un caso tan sencillo admite malas interpretaciones.

Resolución de ambigüedades
La expresión aritmética
2+3×4

puede resultar ambigua porque su valor depende del orden en el que se combinan los
números. Puede ser interpretada como (2 + 3) × 4 = 20, o puede ser interpretada como
2 + (3 × 4) = 14. Las ambigüedades pueden resolverse siempre con un uso adecuado de
los paréntesis, como en este ejemplo. Ante la duda, utilice paréntesis.
Si no se usan paréntesis, se pueden evitar las ambigüedades siguiendo las reglas, uti-
lizadas en la programación por ordenador,

(i) la exponenciación tiene preferencia sobre la multiplicación y la división,

(ii) la multiplicación y la división tienen preferencia sobre la suma y la resta.

EJEMPLO 2.6 Precedencia en las expresiones aritméticas


(1) 2 + 3 × 4 = 2 + (3 × 4) = 2 + 12 = 14
(2) 3 × 42 = 3 × (42 ) = 48
(3) 2 + 3 × 4 ÷ 6 + 7 × 23 = 2 + (3 × 4 ÷ 6) + 7 × (23 ) = 2 + 2 + 56 = 60

Decimos que la función dada por la ecuación (2.2) es una función cuadrática porque
la potencia mayor de x es un cuadrado (en geometrı́a plana, cuadratura es el acto de
cuadrar, es decir, de hallar un cuadrado cuya área sea igual a la de una figura dada).
Es un ejemplo de una clase general de funciones llamadas polinomios. Tratamos los
polinomios y otras funciones algebraicas en los apartados que siguen. Otras funciones
que son importantes en las ciencias fı́sicas son las funciones trigonométricas, la función
exponencial y la función logarı́tmica; estas funciones trascendentes las tratamos en el
Capı́tulo 3.

2.2. Representación gráfica de funciones


Una función real puede visualizarse bien por tabulación, bien por el dibujo de su
gráfica. Sea la función

y = f (x) = x2 − 2x − 3 . (2.3)

Para cada valor de x existe un valor de y. Podemos hacer una tabla, como la Tabla 2.1,
dando los valores de y correspondientes a un conjunto de valores de x. Además, puede
26 Capı́tulo 2. Funciones algebraicas

considerarse que cada par de números (x, y) de la tabla define la posición de un punto en
un plano, y puede dibujarse en una gráfica como en la Figura 2.1.

Tabla 2.1
x y
−3 12
−2 5 Figura 2.1
−1 0
0 −3
1 −4
2 −3
3 0
4 5
5 12

El sistema de coordenadas cartesianas2


La posición de un punto en un plano se especifica de manera única por sus coorde-
nadas en un sistema de coordenadas dado. El sistema que resulta en general más útil
es el sistema (rectangular) de coordenadas cartesianas representado en la Figura 2.2.

Figura 2.2

02. René Descartes (1596-1650), o Renatus Cartesius, filósofo y matemático francés. Relacionó su
búsqueda de una matemática universal con una experiencia mı́stica en 1619 en la cual “lleno de entusiasmo,
descubrı́ el fundamento de una ciencia maravillosa”. Desarrolló la relación entre el álgebra y la geometrı́a
en su Géométrie, publicada como un apéndice al Discours de la méthode pour bien conduire sa raison et
chercher la vérité dans les sciences (Discurso del método para conducir bien la razón y buscar la verdad en
las ciencias) en 1637. Antes de Descartes, las cantidades x, x2 y x3 se asociaban siempre con los concep-
tos geométricos de lı́nea, superficie y volumen. Descartes eliminó esa limitación: “la raı́z (x), el cuadrado,
el cubo, etc. son meramente magnitudes en proporción continua”. Su obra marca el principio del álgebra
moderno. Descartes introdujo el convenio de utilizar letras del principio del alfabeto (a, b, . . .) para las cons-
tantes y los parámetros, y letras del final (x, y, z) para las incógnitas y las variables. La Géométrie contiene
la formulación del teorema fundamental del álgebra y el primer uso de las palabras ‘real’ e ‘imaginario’ en
el contexto de los números complejos.
Fermat también desarrolló la geometrı́a coordenada al mismo tiempo que Descartes, pero su obra no se
publicó hasta 1679, tras su muerte. Pierre de Fermat (1601-1665), abogado en el parlamento provincial de
Toulouse, hizo importantes contribuciones a la teorı́a de números y al cálculo.
2.3. Factorización y simplificación de expresiones 27

Se define en el plano un sistema de referencia, que consiste en un punto fijo llamado


el origen del sistema de coordenadas y en dos ejes (rectas orientadas) perpendiculares,
llamados ejes coordenados, que se cortan en el origen. En la Figura 2.2 el origen se
denota por O, los ejes coordenados son los de x y de y, y el plano se llama plano xy. La
posición de un punto en el plano se especifica por el par ordenado (x, y), donde x es la
coordenada x o abscisa e y es la coordenada y u ordenada. Un punto con coordenadas
(x, y) está a una distancia |x| perpendicularmente al eje y, e |y| con respecto al eje x. El
punto queda a la derecha del eje (vertical) y si x > 0 y a la izquierda si x < 0; y queda
por encima del eje x si y > 0 y por debajo si y < 0. El origen tiene por coordenadas
(0, 0).
En un ejemplo real, se marcan las escalas adecuadas en los ejes coordenados y cada
par de números, como los de la Tabla 2.1, se representa por un punto en la gráfica. Si se
sabe que la función varı́a de manera suave entre los puntos dibujados (como ocurre en
este ejemplo) entonces se pueden unir los puntos mediante una curva regular. La curva
es la representación gráfica de la función.

2.3. Factorización y simplificación de expresiones


La estructura de una expresión algebraica puede a menudo simplificarse y clarificarse
con el procedimiento de factorización. Por ejemplo, en la expresión

3xy + 6x2

cada término puede escribirse como el producto de 3x y otro término:

3xy + 6x2 = (3x) × y + (3x) × (2x) .

La expresión 3x es un factor común, y la expresión puede escribirse como

3xy + 6x2 = 3x(y + 2x) .

Esto es una factorización: hemos escrito la expresión algebraica como el producto de los
dos factores (3x) y (y + 2x).

EJEMPLOS 2.7 Factorización

(1) 2x + 6y = 2(x + 3y)


(2) x2 + 3x + 2 = (x + 2)(x + 1)
(3) 9x2 − 12x + 4 = (3x − 2)(3x − 2) = (3x − 2)2
(4) x2 − 9 = (x + 3)(x − 3)

La operación inversa a la factorización suele llamarse ‘desarrollo’. Los casos (2) y (4) de
los Ejemplos 2.7 son ejemplos de factorización de una función cuadrática. Ilustran las
siguientes formas generales importantes:
28 Capı́tulo 2. Funciones algebraicas

(x + a)(x + b) = x2 + (a + b)x + ab
(a + b)2 = a2 + 2ab + b2
(2.4)
(a − b)2 = a2 − 2ab + b2
(a + b)(a − b) = a2 − b2

Figura 2.3

La Figura 2.3 da la interpretación geométrica de la segunda de ellas.


Las ecuaciones segunda y tercera de (2.4) pueden combinarse utilizando el sı́mbolo
±, que significa ‘más o menos’:

(a ± b)2 = a2 ± 2ab + b2 (2.5)

en donde o bien se usa el sı́mbolo superior en ambos miembros de la ecuación, o bien


el inferior también en ambos miembros. A veces se usa el sı́mbolo ∓ del mismo modo.
Por ejemplo a ∓ b = ±c representa el par de ecuaciones a − b = +c y a + b = −c.
La factorización también se puede usar para simplificar fracciones algebraicas. Por
ejemplo, en

3xy + 6x2
9x + 9xy

numerador y denominador tienen ambos 3x como factor común, y pueden ser divididos
por ese factor (si x = 0) sin modificar el valor de la fracción:

3xy + 6x2 3x(y + 2x) y + 2x y + 2x


= = =
9x + 9xy 3x(3 + 3y) 3 + 3y 3(1 + y)

EJEMPLOS 2.8 Simplificación de fracciones

4x 2 × (2x) 2x
(1) = =
2y 2 × (y) y
2 + 4y 2(1 + 2y) 1 + 2y
(2) = =
4 + 8x 4(1 + 2x) 2(1 + 2x)
a2 − b2 (a + b)(a − b) a−b
(3) = =
a + 2ab + b
2 2
(a + b) 2 a +b
2.4. Funciones inversas 29

2.4. Funciones inversas


Dada una función f y la ecuación y = f (x), suele ser posible definir, al menos para
algunos valores de x e y, una función g tal que x = g(y). Esta nueva función es la función
inversa de f y se representa por el sı́mbolo f −1 (a no confundir con la recı́proca 1/f ):

si y = f (x) entonces x = f −1 (y) . (2.6)

EJEMPLO 2.9 Si y = f (x) = 2x + 3, halle x = f −1 (y).


Tenemos
y−3
y = 2x + 3 , y − 3 = 2x , x= = f −1 (y) .
2
En este ejemplo y es una función univaluada de x: para cada valor de x existe únicamente un valor de y.
Similarmente, x es una función univaluada de y.

ax + b
EJEMPLO 2.10 Si y = , halle x = f −1 (y).
cx + d
Para despejar la x,

(i) se multiplican ambos miembros de la ecuación por (cx + d) : (cx + d)y = ax + b


(ii) se desarrolla el primer miembro: cxy + dy = ax + b
(iii) se resta (ax + b) de ambos miembros: cxy + dy − ax − b =0
(iv) se reagrupan los términos en x1 y en x0 : (cy − a)x + (dy − b) =0

Entonces
(cy − a)x = −(dy − b)
y dividiendo ambos miembros por (cy − a) obtenemos la solución

dy − b
x=− = f −1 (y) .
cy − a

Es necesario señalar que este procedimiento no es válido si x = −d/c porque y no está definida para
ese valor de x. Además, x tampoco está definida para y = a/c. Tales complicaciones pueden ignorarse
normalmente.
Hemos dado este ejemplo en detalle porque muestra el tipo de manipulaciones algebraicas usadas de
manera rutinaria en la resolución de problemas reales.

EJEMPLO 2.11 Si y = f (x) = x2 + 1, halle x = f −1 (y).


Tenemos 
y = x2 + 1, x2 = y − 1, x=± y − 1 = f −1 (y) ,
y es una función univaluada de x, pero x es una función bivaluada de y (salvo para y = 1). Para cada valor
real de y > 1 existen dos valores reales de x (si y < 1 entonces x es complejo).
La Figura 2.4 muestra cómo se relacionan la gráfica de la función y la de su inversa. La gráfica (b) se obtiene
de la (a) intercambiando los ejes x e y, o por rotación alrededor de la recta x = y. La gráfica (b) también
muestra la naturaleza bivaluada de la función inversa.
En aplicaciones fı́sicas es habitualmente obvio por el contexto qué valor debe escogerse. Vemos por
otra parte, cuando x e y son números reales, que mientras y está definida para todos los valores de x,
−∞ < x < +∞, x está únicamente definida para 1 ≤ y < +∞.
30 Capı́tulo 2. Funciones algebraicas

Figura 2.4

Hallar la función inversa no es siempre tan sencillo.

EJEMPLO 2.12
y = f (x) = x5 − 2x .

En este caso la función inversa existe para todos los valores de x, pero no puede escribirse de manera sencilla
en forma algebraica, aunque puede ser tabulada y dibujada como en la Figura 2.5.

Figura 2.5

En este ejemplo la dependencia funcional de y con x viene dada explı́citamente por


el segundo miembro de la ecuación: y es una función explı́cita de x. Por otra parte,
x no puede expresarse como una función explı́cita de y, y la ecuación define x como
una función implı́cita de y. En general, si y está definida como función de x por una
expresión de la forma

f (x, y) = 0 ,
2.5. Polinomios 31

donde f es una función de ambas variables x e y, decimos que y es una función implı́cita
de x. En muchas ecuaciones de las ciencias fı́sicas no es posible expresar una variable
como una función explı́cita de las otras, o puede ser que no resulte conveniente hacerlo.

EJEMPLO 2.13 La ecuación de van der Waals


La ecuación de estado de un gas ligeramente imperfecto es
 
n2 a
p + 2 (V − nb) − nRT = 0 . (2.7)
V
En este caso, tanto T como p pueden expresarse fácilmente como funciones explı́citas de las otras variables:
 
1 n2 a nRT n2 a
T= p + 2 (V − nb) , p= − 2 .
nR V V − nb V
Para V, la ecuación (2.7) puede reescribirse como
 
RT n2 a n3 ab
V3 − n b + V2 + V− = 0,
p p p
que es una ecuación cúbica en V. Es posible dar las soluciones explı́citas de una ecuación cúbica, pero
son expresiones complicadas y no suelen utilizarse. En este caso, lo más conveniente es considerar que
la ecuación (2.7) define V como una función implı́cita de p, T y n. La ecuación (2.7) puede ser resuel-
ta numéricamente para cualquier valor de las variables independientes y de las constantes, utilizando un
método iterativo como el método de Newton-Raphson descrito en el Capı́tulo 20.

2.5. Polinomios
La forma general de un polinomio de grado n es

f (x) = a0 + a1 x + a2 x2 + · · · + an xn (2.8)

donde a0 , a1 , . . . , an son constantes y n es un entero positivo. Si n = 0, la función es la


constante a0 . Los polinomios se escriben a menudo en forma compacta como


n

f (x) = ai x i , (2.9)
i=0


donde el sı́mbolo representa un sumatorio. La notación nos dice que sumemos los
términos ai xi en los cuales la variable i va tomando por orden los valores 0, 1, 2, . . . , n:


n

ai xi = (a0 x0 ) + (a1 x1 ) + (a2 x2 ) + · · · + (an xn )


i=0

= a 0 + a 1 x + a 2 x 2 + · · · + an x n

(recordando que x0 = 1 y que x1 = x).


32 Capı́tulo 2. Funciones algebraicas

EJEMPLO 2.14 Desarrolle.


3
(1) ixi = 0 × x0 + 1 × x1 + 2 × x2 + 3 × x3 = x + 2x2 + 3x3
i=0

3
x2n−1 x−1 x1 x3 x5 1 x x3 x5
(2) = + + + = + + +
n=0
n+1 1 2 3 4 x 2 3 4

4
(3) (– x)i = (– x)2 + (– x)3 + (– x)4 = x2 − x3 + x4
i=2

Grado n = 1, función lineal

f (x) = a0 + a1 x . (2.10)

Este es el tipo más sencillo de función, y es más conocido en la forma

y = mx + c . (2.11)

La gráfica de esta función es una lı́nea recta de pendiente m, que corta el eje vertical y
(cuando x = 0) en el punto y = c, como se muestra en la Figura 2.6.

Figura 2.6

Si tomamos dos puntos arbitrarios en la recta con valores (x, y), o coordenadas,
(x1 , y1 ) y (x2 , y2 ) entonces

y1 = mx1 + c
y2 = mx2 + c
2.5. Polinomios 33

y y2 − y1
m= (2.12)
x2 − x1

define la pendiente constante. La recta cruza el eje horizontal x en un punto:


c
y=0 cuando x = − . (2.13)
m
Este valor de x se llama raı́z de la función lineal. En general, las raı́ces de una función
polinómica son aquellos valores de la variable para los cuales la función es cero. Esto
es, las raı́ces son las soluciones de la ecuación polinómica

f (x) = 0 . (2.14)

EJEMPLO 2.15 La gráfica de la función lineal y = 2x − 4 es una lı́nea recta como en la Figura 2.6. La
pendiente de la recta es 2, lo que supone que el valor de y crece el doble de rápido que el de x. Ası́, cuando x
se incrementa en 1, y se incrementa en 2. La recta cruza (corta) el eje y en el punto y = −4, cuando x = 0.
Cruza el eje x en el punto x = 2, y ésa es la raı́z de la función lineal.

Grado n=2, función cuadrática

f (x) = a0 + a1 x + a2 x2 . (2.15)

La función cuadrática se escribe habitualmente como

y = ax2 + bx + c . (2.16)

Una gráfica tı́pica se muestra en la Figura 2.1, donde vemos que la curva corta el eje
x (cuando y = 0) en dos puntos: x = −1 y x = 3. Ésas son las raı́ces de la función
cuadrática y son las soluciones de la ecuación cuadrática

x2 − 2x − 3 = 0 .

En este sencillo ejemplo las raı́ces se obtienen fácilmente factorizando, sin necesidad de
dibujar la gráfica. La función se expresa como el producto de dos factores lineales,

x2 − 2x − 3 = (x + 1)(x − 3) ,

y la función es cero si alguno de los factores lineales es cero:



ya sea x + 1 = 0 =⇒ x = −1
x − 2x − 3 = 0 si
2
o bien x − 3 = 0 =⇒ x = 3

(el sı́mbolo =⇒ significa ‘implica’).


34 Capı́tulo 2. Funciones algebraicas

Si bien es posible factorizar toda una serie de funciones cuadráticas tanteando, siem-
pre se pueden hallar las raı́ces mediante una fórmula:3

ax2 + bx + c = 0

para

−b ± b2 − 4ac
x= . (2.17)
2a
Entonces, si x1 y x2 son las raı́ces obtenidas mediante (2.17),
√ √
−b + b2 − 4ac −b − b2 − 4ac
x1 = , x2 =
2a 2a
la función cuadrática tiene la forma factorizada

ax2 + bx + c = a(x − x1 )(x − x2 ) . (2.18)

EJEMPLO 2.16 Las raı́ces de la función cuadrática x2 − 2x − 3 (a = 1, b = −2, c = −3 en la fórmula


2.17) son

+2 ± 4 + 12
x= = 1 ± 2 = −1 ó 3 ,
2
y
x2 − 2x − 3 = (x + 1)(x − 3) .

La cantidad

b2 − 4ac (2.19)

en (2.17) se denomina discriminante de la función cuadrática. Su valor es positivo en


el Ejemplo 2.16, y la función tiene dos raı́ces, pero en otros ejemplos puede ser cero o

03. Una tableta de arcilla del primer periodo babilonio (hacia 1800-1600 a.C.) tiene inscrita en escritu-
ra cuneiforme sumeria el siguiente problema (en notaciónmoderna): dado que xy = 60 y que x−y = 7, halle
x e y. La receta dada para la solución corresponde a x = (7/2)2 + 60+(7/2), y = (7/2)2 + 60−(7/2).
El método y el enfoque de recetario es casi idéntico al utilizado por Al-Khwarizmi dos milenios y medio
después. El álgebra moderno se hizo posible con el desarrollo entre los siglos XV y XVII de una notación
abstracta general. Un paso importante fue dado por François Viète (1540-1603). Abogado, polı́tico, criptoa-
nalista y matemático aficionado francés, hizo contribuciones en trigonometrı́a y en álgebra. Se le recuerda
sobre todo como el hombre que, en su In artem analyticem isagoge (Introducción al arte analı́tico) de 1591,
introdujo el uso sistemático de sı́mbolos (letras) en la teorı́a de ecuaciones, distinguiendo entre constantes
y variables.
2.5. Polinomios 35

negativo. Vemos una explicación gráfica de los tres posibles casos de discriminante en
la Figura 2.7.

Figura 2.7

Cuando el discriminante es negativo, la fórmula (2.17) supone tomar la raı́z cuadrada de


un número negativo, y el resultado no es un número real. En ese caso, las raı́ces de la
√ cuadrática son números complejos en los que aparece la raı́z cuadrada de −1:
función
i = −1.

EJEMPLO 2.17 Caso b2 − 4ac = 0.
La función cuadrática
2x2 − 8x + 8 = 2(x − 2)2
tiene discriminante nulo y la raı́z doble (dos raı́ces iguales) x = 2.


EJEMPLO 2.18 Caso b2 − 4ac < 0.
La función cuadrática
x2 − 3x + 4
tiene raı́ces (complejas) x1 y x2 dadas por

3± −7 1 √
x= = (3 ± i 7)
2 2
y puede escribirse como (x − x1 )(x − x2 ).

La forma de la gráfica de la función cuadrática general

f (x) = ax2 + bx + c (2.20)

es la de una parábola. Cuando la constante a es positiva, la función tiene un único mı́nimo


(extremo, valor estacionario) y, si se dibuja su gráfica como en la Figura 2.1, resulta ser
simétrica con respecto a un eje vertical que pasa por el punto de valor mı́nimo (el punto
(1, −4) en la Figura 2.1). Para valores muy grandes de x, el término en x2 en (2.20) es
mucho mayor en magnitud que los otros dos términos:

f (x) → ax2 cuando x → ±∞ . (2.21)


36 Capı́tulo 2. Funciones algebraicas

Esto significa que para valores muy grandes de x, positivos o negativos (cuando |x| →
∞), la función se comporta como la función ax2 , más sencilla, y puede ser sustituida por
ella.

EJEMPLO 2.19 Comportamiento de una función cuadrática para valores grandes de la variable

Para valores de |x| menores que 100, aproximadamente, la función x2 − 2x − 3 difiere de la función x2 en
más de un 2 %. Para valores de x mayores la diferencia disminuye rápidamente: para |x| = 103 la diferencia
viene a ser de 0,2 %, para |x| = 105 es 0,002 %, y para |x| = 1010 es 2 × 10−8 %.

Las funciones cuadráticas son importantes en las ciencias fı́sicas porque se emplean para
representar movimientos vibratorios de muchos tipos. El movimiento vibratorio más
sencillo es el movimiento armónico simple y, por ejemplo, una pelota que rueda hacia
adelante y hacia atrás en un recipiente parabólico (un ‘pozo de potencial parabólico’)
describe un movimiento armónico simple.

Figura 2.8

Otros ejemplos son las oscilaciones de un péndulo, las vibraciones de átomos dentro
de moléculas o sólidos, los campos eléctricos y magnéticos oscilantes en la radiación
electromagnética.

EJEMPLO 2.20 El oscilador armónico simple clásico


El oscilador armónico simple clásico

Figura 2.9

Un oscilador armónico simple es un cuerpo, de masa m, que se mueve en una lı́nea recta alrededor de
una posición de equilibrio bajo la influencia de una fuerza proporcional a la distancia del cuerpo al punto
de equilibrio y dirigida hacia ese punto, F = −kx, donde k se denomina la constante de la fuerza y el
signo negativo asegura que la fuerza actúa siempre en la dirección opuesta al desplazamiento. La energı́a
del sistema es
1 1
E = mv2 + kx2 ,
2 2
donde v es la velocidad del cuerpo. La expresión de la energı́a es una función cuadrática en las variables v y
x; 12 mv2 es la energı́a cinética y 12 kx2 es la energı́a potencial. En ausencia de influencias externas la energı́a
total es constante (véase el Apartado 12.5 para un tratamiento más completo del oscilador armónico).
2.5. Polinomios 37

EJEMPLO 2.21 El oscilador armónico simple en mecánica cuántica


Los estados estacionarios del oscilador armónico simple en mecánica cuántica vienen dados por las solu-
ciones de la ecuación de Schrödinger independiente del tiempo

2 d 2 ψ 1
− + kx2 ψ = Eψ ,
2m dx2 2
donde ψ = ψ(x) es la función de ondas. La ecuación puede escribirse en la forma

Hψ = Eψ ,

siendo el operador hamiltoniano para el movimiento armónico,

2 d 2 1
H=− + kx2 ,
2m dx2 2
 2
d d d2
una función cuadrática de la función y de , puesto que ≡ 2.
dx dx dx

Polinomio general
Un polinomio de grado n siempre puede factorizarse como el producto de n factores
lineales
f (x) = a0 + a1 x + a2 x2 + · · · + an xn
(2.22)
= an (x − x1 )(x − x2 ) · · · (x − xn ) .

Esto se denomina teorema fundamental del álgebra y fue demostrado por primera vez
por el gran matemático Gauss.4 La función es cero cuando cualquiera de los factores
lineales es cero, y los números x1 , x2 , . . . , xn son las n raı́ces del polinomio. Algunas de
esas raı́ces pueden ser iguales entre sı́ (raı́ces múltiples) y algunas pueden ser complejas.
Un polinomio de grado impar (n = 1, 3, 5, . . .) tiene siempre al menos una raı́z real
porque su gráfica está obligada a cruzar el eje x al menos una vez. En general, este
polinomio tiene un número impar de raı́ces reales. Un polinomio de grado par (n =
2, 4, 6, . . .) tiene un número par de raı́ces reales, o ninguna raı́z real si la curva no cruza
el eje x.

04. Carl Friedrich Gauss (1777-1855), niño prodigio y profesor en Göttingen, hizo contribuciones
sustanciales en cada rama importante de las matemáticas puras y aplicadas: teorı́a de números, geometrı́a,
álgebra, estadı́stica, teorı́a de perturbaciones, teorı́a electromagnética. Inventó o inició nuevas ramas de
las matemáticas, entre ellas la teorı́a de funciones de variable compleja y la geometrı́a diferencial, que
constituyó gran parte de la base de las matemáticas del siglo XIX. Dio su primera prueba (de cuatro) del
teorema fundamental del álgebra en su tesis doctoral, Prueba del teorema de que toda función racional
integral de una variable puede ser resuelta en factores reales de primer o segundo grado, en 1799.
38 Capı́tulo 2. Funciones algebraicas

EJEMPLO 2.22 Factorización de una función cúbica


Un polinomio de grado 3 puede tener las tres raı́ces reales o puede tener una raı́z real y dos complejas. Por
ejemplo,

(i) tres raı́ces reales:


x3 − 6x2 + 11x − 6 = (x − 1)(x − 2)(x − 3) ,
(ii) una raı́z real y dos raı́ces complejas:

x3 − 3x2 + 4x − 2 = (x − 1)(x2 − 2x + 2) .

Las raı́ces del factor cuadrático son 1 ± i, siendo i = −1,
  
x2 − 2x + 2 = x − (1 + i) x − (1 − i)

y la factorización completa de la función cúbica es

x3 − 3x2 + 4x − 2 = (x − 1)(x − 1 − i)(x − 1 + i) .

EJEMPLO 2.23 Factorización de una función cuártica


Podemos considerar tres casos.

(i) 4 raı́ces reales, por ejemplo

x4 − x3 − 7x2 + x + 6 = (x − 1)(x + 1)(x + 2)(x − 3) ,


(ii) 2 raı́ces reales y dos raı́ces complejas, por ejemplo

x4 − 2x3 + x2 + 2x − 2 = (x − 1)(x + 1)(x2 − 2x + 2)


= (x − 1)(x + 1)(x − 1 − i)(x − 1 + i) ,
(iii) 4 raı́ces complejas, por ejemplo

x4 − 2x3 + 3x2 − 2x + 2 = (x2 + 1)(x2 − 2x + 2)


= (x − i)(x + i)(x − 1 − i)(x − 1 + i) .

Los Ejemplos 2.22 y 2.23 muestran que, si no se permiten números complejos, un poli-
nomio puede siempre factorizarse como el producto de factores lineales, uno por cada
raı́z real, y, como mucho, factores cuadráticos, todos reales.5 Utilizamos el teorema en
el Apartado 2.6 para construir fracciones simples.
Toda relación de la forma

P(x)yn + Q(x)yn−1 + · · · + U(x)y + V(x) = 0 , (2.23)

05. Este es el enunciado del teorema fundamental del álgebra dado por Gauss en su primera prueba
de 1799.
2.6. Funciones racionales 39

donde P(x), Q(x), . . . , V(x) son polinomios de cualquier grado (finito) en x, define la
variable y como una función algebraica de x. Por ejemplo, la ecuación

y3 + (x + 1)y2 + (x2 + 3x + 2)y + (x3 + 2x2 − x − 1) = 0

es una ecuación cúbica en y, y puede resolverse para cada valor de x.6 Las funciones
que no pueden ser definidas de esta forma, mediante un número finito de polinomios, se
llaman funciones trascendentes. Algunos ejemplos son las funciones trigonométricas, la
función exponencial y la función logarı́tmica. Tratamos esas funciones en el Capı́tulo 3.

2.6. Funciones racionales


Sean P(x) y Q(x) dos polinomios

P(x) = a0 + a1 x + a2 x2 + · · · + an xn ,
(2.24)
Q(x) = b0 + b1 x + b2 x2 + · · · + bm xm .

Una función racional, o función algebraica, tiene la forma general

P(x) a 0 + a1 x + a 2 x 2 + · · · + an x n
y = f (x) = = . (2.25)
Q(x) b 0 + b 1 x + b 2 x 2 + · · · + bm x m

Ejemplos de funciones racionales son

1 x+2 3x2 + 2x − 1 x+1


(i) , (ii) , (iii) , (iv) . (2.26)
x x+1 x+2 3x2 + 2x − 1

En cada caso la función está definida para todos los valores de x para los cuales el
denominador no es cero, ya que la división por cero no está permitida. Por ejemplo, la
función (i) en (2.26) no está definida en x = 0, y (iii) no está definida en x = −2. En
general, la función racional (2.25) está definida para todos los valores de x salvo para
las raı́ces del polinomio Q(x) del denominador, para las cuales Q(x) = 0. La gráfica de

06. La fórmula para la solución general de una ecuación cúbica fue descubierta en Bolonia a comien-
zos del siglo XVI por Scipio del Ferro y Nicolo Tartaglia. El método de resolución (método de Cardano)
fue descrito por Girolamo Cardano (1501-1576) en su Ars magna de 1545. Cardano demostró que algunas
soluciones eran complejas. El libro también contiene una descripción de un método para resolver ecuacio-
nes cuárticas debido a Ludovico Ferrari (1522-1565). El matemático noruego Niels Enrik Abel (1802-1829)
demostró en su Sobre la resolución algebraica de ecuaciones (1824) que no existe una solución algebraica
de la ecuación general de quinto grado, o de ninguna ecuación polinómica de grado mayor que 4. ‘La corta
vida de Abel estuvo llena de pobreza y tragedia’; murió de tisis con 27 años de edad. Dio la primera prueba
rigurosa del teorema del binomio, hizo contribuciones pioneras en la teorı́a de grupos, e hizo un trabajo
importante e innovador en la teorı́a de funciones elı́pticas y otras funciones trascendentes superiores. La
ecuación general de quinto grado fue resuelta mediante funciones elı́pticas por Hermite en 1858.
40 Capı́tulo 2. Funciones algebraicas

la función y = 1/x en la Figura 2.10 ilustra varias propiedades tı́picas de las funciones
racionales.
Cuando x se acerca a cero desde la derecha (x > 0) el valor
de 1/x se hace arbitrariamente grande. Decimos que y = 1/x
tiende a infinito cuando x tiende a cero. Igualmente, y tiende a
menos infinito cuando x tiende a cero desde el lado negativo.
El punto x = 0 se llama punto singular, y la mayorı́a de las
funciones racionales tienen al menos uno de esos puntos (uno
por cada raı́z de Q(x)). La gráfica también muestra que cuando
x → 0 desde cualquiera de los dos lados, la curva se acerca al
eje y tanto como queramos pero no lo llega a cruzar. El eje y es
la recta x = 0 y lo llamamos una ası́ntota a la curva. Decimos
Figura 2.10
que la curva se aproxima a la recta x = 0 asintóticamente. La
recta y = 0 (el eje x) es también una ası́ntota.

División de un polinomio por otro


La función racional (2.25) se denomina propia si el numerador P(x) tiene grado
menor que el denominador Q(x), como en los ejemplos (i) y (iv) de (2.26). Si no es ası́,
como en los ejemplos (ii) y (iii), se dice impropia. En la teorı́a de números ordinaria, una
fracción impropia es aquella con valor mayor o igual a 1, por ejemplo 52 = 2 21 ó 22 = 1.
Las fracciones impropias siempre se pueden reducir a una combinación de fracciones
propias por división, y lo mismo es cierto para las funciones algebraicas impropias.

EJEMPLO 2.24 Divida x3 − 7x2 + 16x − 11 por x − 1.


Adaptando el método de plantear la división entera, escribimos

x3 −7x2 +16x −11 x−1


x3 − x2 x2 − 6x + 10 x va x2 veces en x3
−6x2 +16x −11 restamos
−6x2 + 6x x va −6x veces en −6x2
10x −11 restamos
10x −10 x va 10 veces en 10x
−1 resto
Deducimos que
x3 − 7x2 + 16x − 11 1
= x2 − 6x + 10 − .
x−1 x−1

EJEMPLO 2.25 Divida x3 − 7x2 + 16x − 10 por x − 1.


La función cúbica es en este caso una unidad mayor que en el Ejemplo 2.24, y no hay resto de la división.
Deducimos que la función cúbica puede ser factorizada:
x3 − 7x2 + 16x − 10 (x − 1)(x2 − 6x + 10)
= = x2 − 6x + 10 .
x−1 x−1
En este caso, el hecho de que la función racional no esté definida en x = 1 antes o después de eliminar el
factor (x − 1) no tiene consecuencias prácticas y puede ser ignorado.
2.6. Funciones racionales 41

EJEMPLO 2.26 Divida x + 2 por x + 1.


En este caso no es necesario recurrir a la división entera:
x+2 (x + 1) + 1 1
= =1+ .
x+1 x+1 x+1

En el Ejemplo (2.25) la cantidad (x − 1) es un factor de la función cúbica, esto es, x = 1


es una raı́z:

x3 − 7x2 + 16x − 10 = (x − 1)(x2 − 6x + 10) .

La factorización se consigue bien sea por división o por el siguiente método. Por conocer
(o suponer) que x = 1 es una raı́z, escribimos

x3 − 7x2 + 16x − 10 = (x − 1)(ax2 + bx + c) .

Desarrollando el segundo miembro tenemos

x3 − 7x2 + 16x − 10 = ax3 + (b − a)x2 + (c − b)x − c .

Para que esta ecuación se cumpla para todo valor de x es necesario que los coeficientes
de cada potencia de x sean los mismos a ambos lados de la igualdad. Por lo tanto

1 = a, −7 = b − a , 16 = c − b , −10 = −c .

Por lo tanto a = 1, b = −6 y c = 10.


Este método es útil para factorizar polinomios sencillos. Es la base para el método de
‘tanteo’ utilizado a menudo para factorizar funciones cuadráticas.

Fracciones simples
Consideremos
1 1 1 1
= = − . (2.27)
x2 + 3x + 2 (x + 1)(x + 2) x+1 x+2

La función cuadrática del denominador se expresa como el producto de dos factores li-
neales, y la fracción se descompone en dos fracciones simples más sencillas. Veremos
en los Capı́tulos 6 y 11 que la descomposición en fracciones simples es una herramienta
importante en la resolución de algunas ecuaciones diferenciales en la teorı́a de veloci-
dades de reacción, y en integración en general. Una función racional propia P(x)/Q(x)
cuyo denominador puede ser factorizado, puede siempre descomponerse en fracciones
simples más sencillas. El siguiente ejemplo ilustra dos de los caso sencillos más impor-
tantes. Todos los demás se pueden tratar de la misma manera.
42 Capı́tulo 2. Funciones algebraicas

EJEMPLO 2.27 Dos factores lineales en el denominador


x+2 5 2
= + .
(x − 3)(x + 4) 7(x − 3) 7(x + 4)
Para obtener este resultado, escribimos
x+2 A B A(x + 4) + B(x − 3)
= + = .
(x − 3)(x + 4) x−3 x+4 (x − 3)(x + 4)
Es necesario por lo tanto que
x + 2 = A(x + 4) + B(x − 3)
para todo valor de x. En particular,

si x = 3, entonces 5 = 7A y A = 5/7,
y si x = −4, entonces − 2 = −7B y B = 2/7.

EJEMPLO 2.28 Un factor lineal repetido en el denominador


3x + 1 A B A(x + 3) + B
= + =
(x + 3)2 x+3 (x + 3)2 (x + 3)2
y deducimos que A = 3 y B = −8.

En el caso general, la descomposición de una función racional propia P(x)/Q(x) en frac-


ciones simples depende del tipo de raı́ces del denominador Q(x) (véase el Apartado 2.5
sobre las raı́ces de un polinomio general).

(i) Todas las raı́ces son reales.

En ese caso Q(x) se factoriza como el producto de factores lineales reales. Si Q es de


grado n entonces

Q(x) = a(x − x1 )(x − x2 ) · · · (x − xn ) , (2.28)

siendo x1 , x2 , . . . , xn las raı́ces. Si todas las raı́ces son distintas, entonces P(x)/Q(x) se
descompone en la suma de n fracciones simples, como en el Ejemplo 2.27:

P(x) c1 c2 cn
= + + ··· + . (2.29)
Q(x) x − x1 x − x2 x − xn

Si algunas de las raı́ces son iguales, entonces hay términos adicionales, como en el Ejem-
plo 2.28, con potencias del factor lineal en el denominador. Por ejemplo, si x1 = x2 = x3 ,
entonces
P(x) c1 c2 c3 c4 cn
= + + + + ··· +
Q(x) x − x1 (x − x1 )2 (x − x1 )3 x − x4 x − xn
(2.30)
ax2 + bx + c c4 cn
= + + ··· + .
(x − x1 )3
x − x4 x − xn
2.7. Resolución de sistemas de ecuaciones 43

(ii) Algunas de las raı́ces son complejas.

Si se permiten números complejos, el punto (i) anterior se puede aplicar. Si no se per-


miten números complejos, el denominador Q(x) se puede factorizar como el producto
de factores lineales, uno por cada raı́z real, y uno o más factores cuadráticos reales. La
descomposición en fracciones simples presenta, además de los términos comentados en
(i) más arriba, una fracción por cada factor cuadrático de la forma

ax + b
, (2.31)
x + px + q
2

o si el mismo factor cuadrático aparece m veces,

a1 x + b 1 a2 x + b2 a m x + bm
+ + ··· + 2 . (2.32)
x2 + px + q (x2 + px + q)2 (x + px + q)m

Por ejemplo (véase el Ejemplo 2.22),

1 1 1 1−x
= = + 2 .
x − 3x + 4x − 2
3 2
(x − 1)(x − 2x + 2)
2
x − 1 x − 2x + 2

2.7. Resolución de sistemas de ecuaciones

Sea la pareja de ecuaciones lineales

(1) x + y = 3,
(2) x − y = 1.

La ecuación (1) define y como función de x

y = 3 − x,

mientras que la ecuación (2) define y como una segunda función de x

y = x − 1.

La Figura 2.11 muestra que las gráficas de esas funciones lineales se cortan en el punto
(x, y) = (2, 1). Las dos ecuaciones tienen la solución común x = 2, y = 1.
En general, una ecuación algebraica con dos variables x e y define una de las variables
como función algebraica de la otra. Por ejemplo, la ecuación

p(x)yn + q(x)yn−1 + · · · + u(x)y + v(x) = 0 (2.33)


44 Capı́tulo 2. Funciones algebraicas

define una función particular y = f (x). Una segunda ecuación algebraica

p (x)yn + q (x)yn−1 + · · · + u (x)y + v (x) = 0 (2.34)

define una segunda función y = g(x). Las dos ecuaciones tienen soluciones comunes para
aquellos valores de x para los cuales f (x) y g(x) son iguales. Gráficamente, las soluciones
comunes reales son aquellos puntos, si los hay, en los cuales las gráficas de y = f (x) y
y = g(x) se cortan. Por ejemplo, las dos ecuaciones lineales

a0 x + b0 y = c0
(2.35)
a1 x + b1 y = c1

pueden resolverse para dar la solución

c0 b1 − c1 b0 a0 c1 − a1 c0
x= , y= . (2.36)
a0 b1 − a 1 b0 a0 b1 − a 1 b0

Señalamos que esta solución existe sólo si el denominador (a0 b1 − a1 b0 ) no es cero.


Gráficamente, las ecuaciones (2.35) representan dos lı́neas rectas, y la solución es el
punto en el cual las rectas se cortan.

Figura 2.11

EJEMPLO 2.29 Resuelva


(1) x + y = 3,
(2) 2x + 3y = 4 .
Para resolver, restamos dos veces (1) a (2):

(1) x+y = 3

(2 ) y = −2

y sustituyendo y = −2 en (1) obtenemos x = 5.


2.7. Resolución de sistemas de ecuaciones 45

EJEMPLO 2.30 Resuelva


(1) x + y = 3,
(2) 2x + 2y = 4 .
Para resolver, restamos dos veces (1) a (2):
(1) x+y = 3

(2 ) 0 = −2 .
La segunda ecuación no es posible. Se dice que las ecuaciones son inconsistentes y no hay solución. Este
es un ejemplo para el cual a0 b1 − a1 b0 = 0 y, gráficamente, corresponde a rectas paralelas.

EJEMPLO 2.31 Resuelva


(1) x + y = 3,
(2) 2x + 2y = 6 .
En este caso, doblando la ecuación (1) obtenemos la ecuación (2) y a efectos prácticos sólo hay una ecua-
ción. Ambas ecuaciones representan la misma recta. Se dice que las ecuaciones son linealmente depen-
dientes y sólo es posible dar una solución parcial: ambas ecuaciones dan x = 3 − y para todo valor de y.
Volveremos al problema general de resolver sistemas de ecuaciones lineales en el Capı́tulo 17.

EJEMPLO 2.32 Una ecuación lineal y otra cuadrática


(1) x + y = 3,
(2) 2x + 3xy + 2y2 = 16 .
2

La ecuación (1) puede resolverse para y en función de x y el resultado ser sustituido en la ecuación (2). Ası́,
por (1), y = 3 − x, y (2) se transforma en

x2 − 3x + 2 = 0

con raı́ces x = 1 y x = 2. En este caso las dos soluciones son los puntos en los cuales la recta corta la curva
cuadrática, (1, 2) y (2, 1). En otros ejemplos del mismo tipo puede haber una sola solución, cuando la recta
es tangente a la curva cuadrática, o no haber soluciones reales, cuando la recta no corta la curva cuadrática.

EJEMPLO 2.33 Tres ecuaciones lineales


(1) x+ y+ z = 3,
(2) 2x + 3y + 4z = 12 ,
(3) x − y − 2z = −5 .
Para resolver, primero eliminamos x de las ecuaciones (2) y (3) restando 2 × (1) a (2) y (1) a (3):
(1) x+ y+ z = 3

(2 ) y + 2z = 6
(3 ) −2y − 3z = −8 .

Ahora eliminamos y de (3 ) sumando 2 × (2 ) a (3 ):


(1) x+ y+ z = 3

(2 ) y + 2z = 6

(3 ) z = 4.
46 Capı́tulo 2. Funciones algebraicas

Las ecuaciones pueden ser resueltas ahora en orden inverso: (3 ) es z = 4, entonces (2 ) es y + 8 = 6 de
manera que y = −2, y (1) es x − 2 + 4 = 3 de manera que x = 1.
El método utilizado en este ejemplo es un método sistemático general para resolver sistemas con cual-
quier número de ecuaciones lineales. Lo trataremos más en el Capı́tulo 20.

2.8. Ejercicios
Apartado 2.1
1. Halle los valores de y = 2 − 3x para (i) x = 0, (ii) x = 2, (iii) x = −3.
2. Halle los valores de y = 2x2 + 3x − 1 para (i) x = 0, (ii) x = 1, (iii) x = −1.
3. Dada f (x) = x2 − 3x − 4, halle (i) f (5), (ii) f (0), (iii) f (– 2).
4. Halle el valor de f (x) = 3x + 2 siendo 2x + 1 = 0.
5. Si f (x) = x2 − 3x − 4, ¿qué es f (a + 3)?
6. Dadas f (x) = 2x − 1 y g(x) = 3x + 1, exprese f (g) como una función de x.
7. Utilizando las reglas de precedencia de las operaciones aritméticas, calcule

(i) 2 − 3 × 4 + 6 ÷ 2 , (ii) (2 − 3) × 4 + 6 ÷ 2 , (iii) 2 − 3 × (4 + 6) ÷ 2 .

Apartado 2.3
Desarrolle
8. 2(x + 2) 9. x(x − 3) 10. (x − 2)(2x + 3) 11. (x − 2)(2x + 3)(x − 5)
Factorice al máximo:
12. 2x2 + 3x 13. x2 − 4 14. 4x2 − 9 15. x2 + 6x + 5
Simplifique si es posible:
x x+2 x2 − 4 x2 + 3x + 2
16. 17. 18. 19.
3x2 + 2x x+4 x−2 x+2
x2 + 3x + 2 2x2 − 3x + 1
20. 21.
x2 + x + 2 x2 − 3x + 2

Apartado 2.4
Exprese x como función de y y en cada caso esboce y como función de x y x como función de y:
√ √
22. y = x − 2 23. y = x2 + 1 24. y = x2 + 1
x 2x + 3 x−1
25. y= 26. y= 27.
1−x 3x − 2 2x + 1
28. La ecuación de estado del virial para un gas puede aproximarse a baja presión por
 
B
pVm = RT 1 +
Vm
siendo p la presión, Vm el volumen molar, T la temperatura, R la constante de los gases y B el segundo
coeficiente del virial. Exprese B como una función explı́cita de las otras variables.
2.7. Resolución de sistemas de ecuaciones 47

29. La ley de Kohlrausch para la conductividad molar Λm de un electrolito fuerte a baja concentración c
es √
Λm = Λ0m − K c
siendo Λ0m la conductividad molar en disolución infinita y K una constante. Exprese c como una función
explı́cita de Λm .
30. La isoterma de adsorción de Langmuir
Kp
θ=
1 + Kp
da el grado de recubrimiento θ de la superficie por un gas adsorbido a presión p, siendo K una constante.
Exprese p en función de θ.

31. En el Ejemplo 2.13 sobre la ecuación de van der Waals, compruebe las expresiones explı́citas dadas
para T y p, y la ecuación cúbica en V.

Apartado 2.5
Desarrolle:

2 
3 
3 
3
2
32. (n + 1)xn 33. ixi−1 34. k(k + 1)x−k 35. n! xn
n=0 i=0 k=1 n=0

36. Explique la manera de obtener gráficamente K y Λ0m


en la ley de Kohlrausch (Ejercicio 29)

Λm = Λ0m − K c

a partir de medidas experimentales de Λm en un intervalo de concentraciones c.


37. La ecuación de Debye  
r − 1 ρ Na µ2
= α+
r + 2 M 30 3kT
relaciona la permitividad relativa (constante dieléctrica) r de una sustancia pura con el momento dipolar µ
y la polarizabilidad α de las moléculas constituyentes, siendo ρ la densidad a temperatura T y M, Na , k y 0
constantes. Explique la manera de obtener gráficamente µ y α a partir de medidas experimentales de r y ρ
en un intervalo de temperaturas.
Halle las raı́ces y esboce las gráficas de las funciones cuadráticas:
38. x2 − 3x + 2 39. 2x2 + 3x − 2 40. 4x2 + 4x + 1 41. −2x2 − 3x + 2
42. 3x2 − 3x − 1 43. 3x2 − 3x + 1
2x2 + x + 1
44. Si y = , halle x como función de y.
2x2 + x − 1
45. La constante de acidez Ka de un ácido débil a concentración c es

αc2
Ka =
1−α
donde α es el grado de ionización. Exprese α en función de Ka y c (recuerde que α, Ka y c son cantidades
positivas).

Apartado 2.6
46. Divida 2x − 1 por x + 3 y exprese el resultado en forma adecuada.
47. Divida 3x3 − 2x2 − x + 4 por x + 2 y exprese el resultado en forma adecuada.
48 Capı́tulo 2. Funciones algebraicas

48. Dada la función 3x3 − 4x2 − x + 2,


(i) demuestre que una de las raı́ces es x = 1, (ii) encuentre las demás raı́ces, (iii) escriba la función como
un producto de factores lineales, (iv) esboce la gráfica de la función, mostrando donde corta la curva los
ejes, y mostrando cómo se comporta la función cuando x → ±∞.
Exprese en fracciones simples:
1 x+2 x−2 x2 + 2x − 1
49. 50. 51. 52.
(x − 1)(x + 2) x(x + 3) x2 + 3x + 2 (x − 1)2 (x + 2)
53. Esboce la gráfica de cada una de las funciones (49) a (52).

Apartado 2.7
Resuelva el sistema de ecuaciones y dé una interpretación gráfica del resultado:
54. x + y = 3, x−y=1 55. 3x − 2y = 1, 2x + 3y = 2
56. 3x − 2y = 1, 6x − 4y = 3 57. 2x − y = 2, x2 − xy + y2 = 2
58. 2x − y = 2, x2 − xy + y2 = 1 59. 2x − y = 2, x2 − xy + y2 = 0
60. x − 2y + 3z = 3, 2x − y − 2z = 8, 3x + 3y − z = 1
Funciones trascendentes

La descripción matemática de los fenómenos fı́sicos a menudo necesita otras funcio-


nes además de las algebraicas presentadas en el Capı́tulo 2. Las más importantes de esas
funciones trascendentes son las funciones trigonométricas, tratadas en los Apartados 3.1
a 3.4, y la función exponencial y su función inversa, es decir la función logarı́tmica, que
tratamos en los Apartados 3.5 a 3.7. Otras funciones se definen mediante estas funcio-
nes ‘elementales’, y en el Apartado 3.8 damos una breve descripción de las funciones
hiperbólicas.

3.1. Funciones trigonométricas


La trigonometrı́a, como una rama propia de las matemáticas, tiene sus orı́genes co-
mo herramienta para la elaboración de tablas astronómicas, y trata del uso de funcio-
nes trigonométricas para resolver problemas geométricos que implican triángulos.1 Es
importante en diseño estructural y arquitectónico, astronomı́a y navegación, por ejem-
plo. En las ciencias fı́sicas, las funciones trigonométricas son importantes para describir
movimientos circulares y todo tipo de movimientos periódicos, incluido el movimiento
ondulatorio.

Definiciones geométricas
Las principales funciones trigonométricas del ángulo θ, el ángulo interno en A en la
Figura 3.1, son el seno, el coseno y la tangente del ángulo:

01. Las primeras ‘tablas trigonométricas’ fueron elaboradas hacia 150 a.C. por el astrónomo Hipar-
co de Nicea (la actual Iznik en Turquı́a), a quien debemos el cı́rculo de 360◦ , y por Claudio Tolomeo de
Alejandrı́a (hacia 100-178 d.C.) cuya Syntaxis mathematica (Sı́ntesis matemática), conocida como el Alma-
gesto, fue denominado por los Árabes al-magisti (el mejor) y sus tablas fueron utilizadas por los astrónomos
durante más de mil años. Las tablas del Siddhantas indio (hacia 400 d.C.) son esencialmente tabulaciones
de la función seno. Los matemáticos árabes (hacia 950 d.C.) añadieron nuevas tabulaciones y teoremas. La
trigonometrı́a europea fue desarrollada por Johann Müller (Regiomontanus) de Königsberg (1436-1476), y
por Georg Joachim Rheticus (1514-1576) de Wittenburg, un alumno de Copérnico, cuya Opus palatinum
de triangulis (Trabajo palatino sobre triángulos), 1595, se centró por vez primera en las propiedades del
triángulo rectángulo. François Viète (1540-1603) continuó ese trabajo con nuevas tablas extensas para las
seis funciones comunes, nuevas fórmulas, y el uso de funciones trigonométricas para resolver problemas de
ecuaciones algebraicas. El término ‘trigonometrı́a’ se acuñó hacia 1600.
50 Capı́tulo 3. Funciones trascendentes

opuesto bc
sen θ = = (3.1)
hipotenusa ac
adyacente ab
cos θ = = (3.2)
hipotenusa ac
opuesto bc sen θ
tg θ = = = (3.3)
adyacente ab cos θ

Figura 3.1

A partir de éstas se definen otras funciones, las más importantes son la secante, la cose-
cante y la cotangente:

1 1 1 cos θ
sec θ = , cosec θ = , cotg θ = = . (3.4)
cos θ sen θ tg θ sen θ

EJEMPLO 3.1 Para los ángulos de la Figura 3.2,


4 3 4
sen θ = cos θ = tg θ =
5 5 3
5 5 3
cosec θ = θ= cotg θ =
4 3 4
3 4 3
sen φ = cos φ = tg φ =
5 5 4
5 5 4
cosec φ = φ= cotg φ = Figura 3.2
3 4 3

Una de las propiedades más conocidas del triángulo rectángulo es el teorema de Pitágo-
ras2

ab2 + bc2 = ac2 . (3.5)

02. Pitágoras (hacia 580-hacia 500 a.C.). Nacido en la isla de Samos, viajó mucho y fue uno de los
principales introductores de las matemáticas y la astronomı́a egipcias y babilónicas al mundo griego. Se
afincó en Crotona, en el sur de Italia, donde fundó una sociedad religiosa y filosófica con una fuerte base
matemática, su lema era ‘todo son números’. Se le atribuye haber acuñado el vocablo ‘matemáticas’: lo que
es aprendido. Es tradicional atribuirle descubrimientos matemáticos. El teorema de Pitágoras era conocido
en el primer periodo babilonio, y la existencia de números irracionales fue posiblemente un descubrimiento
de pitagóricos posteriores hacia 400 a.C.. La escuela pitagórica introdujo el estudio sistemático de los prin-
cipios de las matemáticas: la teorı́a de números y la geometrı́a.
La expresión general del teorema de Pitágoras es: “En un triángulo rectángulo, el área de la figura en la hi-
potenusa es igual a la suma de las áreas de figuras similares en los otros dos lados” (Euclides, “Elementos”,
Libro VI, Proposición 31).
3.1. Funciones trigonométricas 51

Podemos escribir esto como una ecuación trigonométrica dividiendo ambos miembros
por ac2 :

ab2 bc2
+ 2 =1
ac2 ac
o bien

sen2 θ + cos2 θ = 1 (3.6)

(una cantidad como ( sen θ)2 , el cuadrado de sen θ, se escribe habitualmente sen2 θ).
EJEMPLO 3.2 Para el triángulo del Ejemplo 3.1,
 4 2  3 2 42 + 32 25
sen2 θ + cos2 θ = + = = = 1.
5 5 52 25

Unidades de ángulo
La unidad de ángulo usual es el grado. La Figura 3.3 muestra el ángulo recto (90◦ ),
el ángulo plano (180◦ ) y el ángulo alrededor de un punto (360◦ ).

Figura 3.3

La unidad de ángulo empleada siempre en matemáticas y en aplicaciones cientı́ficas es


el radián (su sı́mbolo SI es rad), definido en función de las propiedades de un cı́rculo.
La Figura 3.4 muestra un cı́rculo de radio r y un arco de
longitud s que subtiende el ángulo θ en el centro. La longitud
del arco es proporcional al tamaño del ángulo. Por ejemplo, si
se dobla el ángulo θ, la longitud s también se dobla. Se deduce
que la proporción de s con la circunferencia del cı́rculo (2πr)
es igual a la proporción de θ con el ángulo completo alrededor
del centro (360◦ ):
Figura 3.4

s θ
= (3.7)
2πr 360◦
de manera que

s 360◦
θ= × . (3.8)
r 2π
52 Capı́tulo 3. Funciones trascendentes

La unidad de ángulo, el radián, se define como

360◦
1 rad = ≈ 57◦ 18 (3.9)

(rad es la unidad de ángulo SI, a veces se usa un superı́ndice c, de tal modo que 1c =
1 rad). En la práctica se omite el sı́mbolo para la unidad, y un ángulo dado sin unidades
se supone que está en radianes. Por ejemplo
π π
90◦ = , 180◦ = π, 360◦ = 2π, sen = sen 30◦ .
2 6
La longitud de un arco de circunferencia es s = rθ cuando θ está en radianes.

EJEMPLOS 3.3 Radianes y grados


(1) El ángulo 40◦ es en unidades de radianes
2π 2π
40◦ = 40◦ × = ≈ 0,7 rad .
360◦ 9
(2) El ángulo 0,5 rad es en grados
360◦ 90◦
0,5 = 0,5 × = ≈ 28,7◦ .
2π π
(3) La longitud del arco que subtiende un ángulo θ = 2 rad en el centro de la circunferencia de radio r = 3
es
s = rθ = 3 × 2 = 6 .

Funciones trigonométricas para cualquier ángulo


La definición geométrica de las funciones trigonométricas mediante cocientes de los
lados de un triángulo rectángulo limita las funciones a valores de los ángulos entre 0◦ y
90◦ , o bien
π
0≤θ≤ .
2

Figura 3.5
3.1. Funciones trigonométricas 53

Las definiciones pueden extenderse a cualquier valor de los ángulos considerando las
coordenadas de un punto en un cı́rculo, como se muestra en la Figura 3.5.
Las funciones trigonométricas se definen para todos los puntos del cı́rculo como
y x y
sen θ = , cos θ = , tg θ = . (3.10)
r r r
En el primer cuadrante, I, con ángulos 0 < θ < π/2, los valores de x y de y son ambos
positivos y

sen θ > 0 , cos θ > 0 , tg θ > 0 .

Sin embargo, en el segundo cuadrante, con π/2 < θ < π, x es negativo e y es positivo.
Los signos de las funciones trigonométricas en los cuatro cuadrantes se dan en la Tabla
3.1
Tabla 3.1 Signos de las funciones trigonométricas

Cuadrante I II III IV
Ángulos 0 < θ < π/2 π/2 < θ < π π < θ < 3π/2 3π/2 < θ < 2π
0◦ < θ < 90◦ 90◦ < θ < 180◦ 180◦ < θ < 270◦ 270◦ < θ < 360◦

sen θ + + − −
cos θ + − − +
tg θ + − + −

√ √
EJEMPLO 3.4 Por la Tabla 3.2, sen π/3 = 3/2, cos π/3 = 1/2 y tg π/3 = 3. ¿Cuáles son los
valores del seno, coseno y tangente para 2π/3, 4π/3 y 5π/3?
El ángulo 2π/3 está en el segundo cuadrante, 4π/3 en el tercero y 5π/3 en el cuarto. Por lo tanto
√ √
sen 2π/3 = +√3/2 , cos 2π/3 = −1/2 , tg 2π/3 = −√3 ,
sen 4π/3 = −√3/2 , cos 4π/3 = −1/2 , tg 4π/3 = +√3 ,
sen 5π/3 = − 3/2 , cos 5π/3 = +1/2 , tg 5π/3 = − 3 .

Valores especiales
Los valores para los ángulos en las fronteras de los cuatro cuadrantes, y para algunos
otros pocos ángulos, aparecen en la Tabla 3.2.

EJEMPLO 3.5 Demuestre que sen π/2 = 1 y que cos π/2 = 0.


Por la Figura 3.6,
sen θ = a/c, cos θ = b/c .
Cuando el ángulo θ se incrementa hasta 90◦ , la magnitud del lado b tiende a cero
mientras que la del lado a tiende a c. Por lo tanto

sen θ → c/c = 1 y cos θ → 0/c = 0 cuando θ → π/2 .


Figura 3.6
54 Capı́tulo 3. Funciones trascendentes

Tabla 3.2 Algunos valores especiales

θ 0◦ 90◦ 180◦ 270◦ 360◦ 30◦ 60◦ 45◦


π 3π π π π
θ/rad 0 π 2π
2 2 6 3 4

1 3 1
sen θ 0 1 0 −1 0 √
2 2 2

3 1 1
cos θ 1 0 −1 0 1 √
2 2 2
1 √
tg θ 0 ∞ 0 −∞ 0 √ 3 1
3

EJEMPLO 3.6 Verifique los valores de las funciones trigonométricas


para θ = π/6 en la Tabla 3.2.
Dibuje un triángulo equilátero con lados de longitud 2 y biseccione el triángulo
como
√ √ en la Figura 3.7. Entonces, por el teorema de Pitágoras, h =
se muestra
22 − 12 = 3, y
√ √
sen π/6 = 1/2 , cos π/6 = 3/2 , tg π/6 = 1/ 3 .
Figura 3.7

Ángulos negativos
Cada punto sobre el cı́rculo puede alcanzarse ya sea mediante un giro en sentido antiho-
rario o bien mediante un giro en sentido horario. Definimos los ángulos positivos para
los giros en sentido antihorario y negativos para giros en sentido horario.
El punto P en la Figura 3.8, correspondiente al ángulo negativo −θ, puede alcanzarse
mediante un giro en sentido antihorario con ángulo 2π − θ, y los dos ángulos tienen los
mismos valores trigonométricos:

sen (– θ) = sen (2π − θ) = − sen θ ,


cos (– θ) = cos (2π − θ) = + cos θ , (3.11)
tg (– θ) = tg (2π − θ) = − tg θ .

Figura 3.8
3.1. Funciones trigonométricas 55

Otros ángulos

El intervalo de valores permitidos para los ángulos puede extenderse de manera adi-
cional permitiendo uno o más giros completos alrededor del centro. Cada giro com-
pleto añade o sustrae 2π, y los ángulos θ ± 2πn, para todos los valores del entero
n = 0, 1, 2, 3, . . . , tienen los mismos valores trigonométricos:

sen (θ ± 2πn) = sen θ , cos (θ ± 2πn) = cos θ . (3.12)

Además, la tangente se repite cada media vuelta,

tg (θ ± πn) = tg θ . (3.13)

Figura 3.9
56 Capı́tulo 3. Funciones trascendentes

Vemos que, mientras que cada ángulo corresponde a un punto en el cı́rculo, cada
punto corresponde a un número infinito de ángulos. En la Figura 3.9 se muestran las
gráficas del seno, coseno y tangente.3

Funciones periódicas
Una función con la propiedad

f (x ± a) = f (x) (3.14)

se llama función periódica de x con periodo a. Las funciones seno y coseno son pe-
riódicas con periodo 2π, la tangente es periódica con periodo π. Las curvas del seno y
del coseno de la Figura 3.9 se llaman ondas armónicas, y las funciones son la base de
la descripción de todos los tipos de ondas y otros movimientos oscilatorios.

EJEMPLO 3.7 Una onda armónica que se mueve en la dirección x positiva (una onda plana) se representa
por la función de ondas
x 
φ(x, t) = A sen 2π − νt
λ
(o por una función coseno equivalente), y se muestra en la Figura 3.10 a tiempo t = 0.

Figura 3.10

La distancia más corta entre puntos equivalentes de la curva (el periodo con respecto a cambios en x) es la
longitud de onda λ. La velocidad de propagación de la onda es v = λν, siendo ν la frecuencia, o número de
oscilaciones por unidad de tiempo, y 1/ν es el periodo (temporal) τ , el tiempo de una oscilación completa.
El número A es la amplitud de la onda.

03. La gráfica de la función seno fue dibujada por vez primera en 1635 por Gilles Personne de Ro-
berval (1602-1675).
3.2. Relaciones trigonométricas 57

EJEMPLO 3.8 Para el oscilador armónico simple (véase el Ejemplo 2.20 y el Apartado 12.5) la ecuación
del movimiento clásica es la segunda ley del movimiento de Newton, que dice que la fuerza ejercida sobre
un cuerpo es igual a la masa del cuerpo multiplicada por la aceleración:
f = ma .
En este caso, la fuerza es f = −kx y la aceleración es la derivada segunda de la distancia con respecto al
tiempo (véase el Capı́tulo 4 sobre derivación):
d2 x
−kx = m .
dt2
Ésta es una de las ecuaciones de segundo orden más sencillas (Capı́tulo 12) y una solución es
x(t) = A cos ωt ,

k
donde A, la amplitud, es el desplazamiento máximo con respecto al equilibrio y ω = se denomina la
m
frecuencia angular. El desplazamiento x(t) es periódico con respecto al tiempo con periodo
2π 1
τ = = ,
ω ν

1 k
siendo ν = la frecuencia de oscilación. La gráfica del desplazamiento frente al tiempo es muy
2π m
similar a la de la Figura 3.10.

3.2. Relaciones trigonométricas


Las reglas del seno y del coseno
Los ángulos y lados de un triángulo están relacionados por dos reglas:
regla del seno

sen a sen b sen c


= = , (3.15)
a b c
regla del coseno

a2 = b2 + c2 − 2bc cos a . (3.16)


Figura 3.11

Demostraciones

Para la regla del seno, utilizando la Figura 3.12, la demostración es:


h h
sen a = , sen c = ,
c a
de manera que
sen a sen c
h = c sen a = a sen c y = . Figura 3.12
a c
Similarmente para el tercer ángulo y lado.
58 Capı́tulo 3. Funciones trascendentes

Para la regla del coseno, de la Figura 3.12 y del teorema de Pitágoras,

a2 = h2 + (b − x)2 = h2 + b2 + x2 − 2bx , c2 = h2 + x2 ,

y la regla se cumple puesto que x = c cos a.

EJEMPLO 3.9 Dadas las longitudes a = 2, c = 3 y el ángulo b = π/3 del triángulo de la Figura 3.11,
halle el tercer lado y los otros ángulos.
Dados dos lados y su ángulo, utilizamos la regla del coseno para hallar b:

b2 = a2 + c2 − 2ac cos b = 9 + 4 − 12 cos π/3



y cos π/3 = 1/2. Por lo tanto b2 = 9 + 4 − 6 = 7 y b = 7.
Para hallar los otros dos ángulos usamos la regla del seno. Por ejemplo,

sen b sen a
= ,
b a
de manera que 
a sen b 2 sen π/3 3
sen a = = √ = .
b 7 7
Por lo tanto a ≈ 40,89◦ (con una calculadora de bolsillo) y c ≈ 180◦ − 60◦ − 40,89◦ = 79,11◦ .

Identidades de ángulos compuestos


Los senos y cosenos de la suma y de la diferencia de dos ángulos son

sen (x + y) = sen x cos y + cos x sen y ,


sen (x − y) = sen x cos y − cos x sen y , (3.17)

cos (x + y) = cos x cos y − sen x sen y ,


cos (x − y) = cos x cos y + sen x sen y . (3.18)

Además, tomando x = y,

sen 2x = 2 sen x cos x (3.19)


cos 2x = cos2 x − sen2 x
= 1 − 2 sen2 x = 2 cos2 x − 1 , (3.20)

donde hemos obtenido las expresiones alternativas para cos 2x a partir de

sen2 x + cos2 x = 1 .
3.2. Relaciones trigonométricas 59

EJEMPLO 3.10 Exprese sen 5θ y sen θ en función de los senos y cosenos de 2θ y 3θ.
sen 5θ = sen (3θ + 2θ) = sen 3θ cos 2θ + cos 3θ sen 2θ ,
sen θ = sen (3θ − 2θ) = sen 3θ cos 2θ − cos 3θ sen 2θ .

EJEMPLO 3.11 Exprese sen 3θ cos 2θ en función de sen θ y sen 5θ.


De las ecuaciones (3.17) se deduce que

1
sen x cos y = [sen (x + y) + sen (x − y)] (3.21)
2
y por lo tanto
1
sen 3θ cos 2θ = [sen 5θ + sen θ] .
2

EJEMPLO 3.12 Exprese sen 3θ sen 2θ y cos 3θ cos 2θ en función de cos θ y cos 5θ.
De las ecuaciones (3.18) se deduce que

1
sen x sen y = [cos (x − y) − cos (x + y)]
2
(3.22)
1
cos x cos y = [cos (x − y) + cos (x + y)]
2
y por lo tanto
1
sen 3θ sen 2θ = [cos θ − cos 5θ]
2
1
cos 3θ cos 2θ = [cos θ + cos 5θ] .
2

π  π 
EJEMPLO 3.13 Exprese sen ± θ y cos ± θ en función de sen θ y de cos θ.
2 2
De las ecuaciones (3.17) π
 π π
sen± θ = sen cos θ ± cos sen θ .
2 2 2
π π
La Figura 3.9 muestra que sen = 1 y que cos = 0 (véase también el Ejemplo 3.5). Por lo tanto
2 2
π 
sen ± θ = cos θ .
2
De manera similar, usando las ecuaciones (3.18),
π  π π
cos ± θ = cos cos θ ∓ sen sen θ
2 2 2
= ∓ sen θ .

Las expresiones para la suma y la diferencia de ángulos son importantes para el cálculo
de integrales (véase el Capı́tulo 6) y para describir la combinación (interferencia) de
ondas.
60 Capı́tulo 3. Funciones trascendentes

EJEMPLO 3.14 La onda armónica que se mueve en la dirección x positiva descrita en el Ejemplo 3.7 y
representada en la Figura 3.20 tiene como función de ondas
x 
φ+ = A sen 2π − νt .
λ
La función de la misma onda pero moviéndose en la dirección opuesta es
x 
φ− = A sen 2π + νt .
λ
Si las ondas se superponen, éstas interfieren y producen una nueva onda cuya función de ondas es una
combinación lineal de la forma
ψ = aφ+ + bφ−
x  x 
= aA sen 2π − νt + bA sen 2π + νt .
λ λ
Utilizando las expresiones (3.17) para los senos de la suma y la diferencia de ángulos,
 
2πx 2πx
ψ = a A sen cos 2πνt − A cos sen 2πνt
λ λ
 
2πx 2πx
+ b A sen cos 2πνt + A cos sen 2πνt
λ λ
2πx 2πx
= (a + b)A sen cos 2πνt − (a − b)A cos sen 2πνt .
λ λ
Un caso especial importante se obtiene para a = b = 1:

2πx
ψ = 2A sen cos 2πνt .
λ
2πx
Esto se denomina una onda estacionaria. Su forma viene dada por el factor dependiente de x: 2A sen ,
λ
como se muestra en la Figura 3.13.

Figura 3.13

Es una interferencia constructiva. La amplitud se dobla pero no hay cambio en la longitud de onda. El
movimiento temporal viene dado por la función periódica cos 2πνt. La onda oscila con frecuencia ν, pero
las posiciones de los nodos (ceros) de la onda no se mueven. La onda es, por lo tanto, estacionaria en el
espacio.
3.3. Coordenadas polares 61

3.3. Coordenadas polares


La posición de un punto en el plano puede especificarse por sus coordenadas con
respecto a un sistema de referencia dado (véase el Apartado 2.2), como se muestra en la
Figura 3.14.

Figura 3.14

La figura muestra que la posición del punto P puede especificarse no sólo por sus coor-
denadas cartesianas (x, y), sino también por el par de números (r, θ), la distancia r al
punto del origen y el ángulo θ que da la orientación de la recta OP con respecto a la di-
rección x positiva (con el convenio habitual del signo). Los números r y θ se denominan
coordenadas polares del punto en el plano.4 Mientras que las coordenadas cartesia-
nas pueden tomar cualquier valor positivo o negativo, r es necesariamente positivo, con
valores r = 0 hasta ∞, y el ángulo θ toma valores θ = 0 hasta 2π.
Los dos conjuntos de coordenadas están relacionados por cos θ = x/r y sen θ = y/r,
de manera que

x = r cos θ y = sen θ (3.23)

y la conversión de coordenadas polares a cartesianas es sencilla.

EJEMPLO 3.15 Halle las coordenadas cartesianas de un punto cuyas coordenadas polares son r = 2 y
θ = π/6. Utilizando los valores que aparecen en la Tabla 3.2,
π √
x = r cos θ = 2 cos = 3
6
π
y = r sen θ = 2 sen = 1 .
6

Las coordenadas polares pueden obtenerse a partir de las dos ecuaciones


y
r2 = x2 + y2 , tg θ = . (3.24)
x

04. En su Methodus fluxionum (Método de fluxiones), escrito alrededor de 1671, Newton sugiere
ocho nuevos tipos de sistemas de coordenadas. Las coordenadas polares fueron su ‘séptima manera, para
espirales’.
62 Capı́tulo 3. Funciones trascendentes

Sin embargo, por ser tg θ una función periódica con periodo π, estas ecuaciones no
definen el ángulo de manera unı́voca, y hay que tener cierto cuidado al convertir de
coordenadas cartesianas a polares.

EJEMPLO 3.16 Halle las coordenadas polares (r, θ) del punto cuyas coordenadas cartesianas son (x, y) =
(– 1, 2).
√ y
r 2 = x 2 + y2 = 5 , r = + 5, tg θ = = −2 .
x
Usando las teclas de tangente inversa en una calculadora de bolsillo obtenemos el ángulo θ ≈ −63◦ ,
pero esto está obviamente equivocado porque este ángulo está en el cuarto cuadrante (véase la Figura 3.5)
mientras que el punto (– 1, 2) está en el segundo cuadrante, con 90◦ < θ < 180◦ . El ángulo correcto
se obtiene haciendo uso de la periodicidad de tg θ: sumar 180◦ al valor calculado nos da el ángulo en el
segundo cuadrante (≈ 117◦ ) con el mismo valor para la tangente (véase también el Ejemplo 3.18).

3.4. Funciones trigonométricas inversas


Si y = sen x, entonces x es el ángulo cuyo seno es y; x viene dada por la función
inversa del seno

x = sen−1 y . (3.25)

Dada la posible confusión entre la notación para la inversa del seno, sen−1 y, y el in-
verso del seno, (sen y)−1 , a menudo se usa una notación alternativa para las funciones
trigonométricas inversas:

arcsen y = sen−1 y , arccos y = cos−1 y , arctg y = tg−1 y . (3.26)

Las funciones inversas son funciones multivaluadas. Por ejemplo, como se indica en la
Figura 3.15, muchos ángulos tienen el mismo seno:

sen x = sen (π − x) = sen (x ± 2nπ) . (3.27)

Figura 3.15
3.5. La función exponencial 63

Para superar esta ambigüedad, se define un valor principal para cada función inversa:
π π
x = arcsen y , − ≤x≤ ,
2 2
x = arccos y , 0 ≤ x ≤ π, (3.28)
π π
x = arctg y , − ≤x≤ .
2 2
Son los valores que se calculan, por ejemplo, en una calculadora de bolsillo o en un
ordenador.
EJEMPLO 3.17
 π   √
π 13π 3
cos = cos − = cos = ··· = .
6 6 6 2
El valor principal de la función inversa es
√ 
3 π
arccos = .
2 6

En una transformación de coordenadas cartesianas a coordenadas polares, el ángulo θ


viene dado por θ = arctg (y/x). El valor concreto de θ se determina por el cuadrante en
el cual está el punto (x, y). Por ejemplo, si x > 0 el punto está en el primer cuadrante
o en el cuarto, y el ángulo es el valor principal. Si x < 0 el ángulo es igual al valor
principal más π.
EJEMPLO 3.18 Como en el Ejemplo 3.16, halle las coordenadas polares (r, θ) del punto cuyas coorde-
nadas cartesianas son (x, y) = (– 1, 2).

r 2 = x 2 + y2 = 5 , r = + 5,
y
tg θ = = −2 , θ = arctg (– 2) + π ,
x
donde arctg (– 2) es el valor principal. El punto está en el segundo cuadrante y θ es el valor de arctg θ que
está entre π/2 y π. Esto es, θ = [el valor principal + π].

3.5. La función exponencial


Una función exponencial es de la forma

f (x) = ax , (3.29)

en la cual el número a se llama la base de la función y la variable x es el exponente.


El ejemplo más conocido es la función 10x que, cuando x es un entero, se utiliza para
representar los números en el sistema decimal. La función exponencial que aparece en
estadı́stica y en las ciencias fı́sicas, la función exponencial, es

exp (x) = ex (3.30)


64 Capı́tulo 3. Funciones trascendentes

en la cual la base e es el número de Euler (véase el Apartado 1.3). La función se define


mediante la serie infinita (véase el Capı́tulo 7)5



xn x x2 x3 x4
ex = =1+ + + + + ··· (3.31)
n=0
n! 1! 2! 3! 4!

El valor de la función exponencial puede calcularse a partir de la serie con cualquier pre-
cisión deseada, aunque el número de términos necesarios aumenta rápidamente cuando
|x| aumenta (véase el Ejemplo 1.6 para x = 1).

EJEMPLO 3.19 Calcule exp (– 2x2 ) con 8 cifras significativas para x = 0,1.
El valor de la exponencial se obtiene directamente sustituyendo x por (– 0,02) en (3.31). De manera alter-
nativa,
(– 2x2 ) (– 2x2 )2 (– 2x2 )3 (– 2x2 )4 (– 2x2 )5
exp (– 2x2 ) = 1 + + + + + + ···
1! 2! 3! 4! 5!
4 2 4
= 1 − 2x2 + 2x4 − x6 + + x8 − x10 + · · ·
3 3 15
Sustituyendo x = 0,01, y usando para los cálculos intermedios dos cifras significativas más de las 8 pedidas,

exp (– 0,02) ≈ 1 − 0,02 + 0,0002 − 0,0000013333 + 0,0000000067 − 0,3 × 10−10 + · · ·


Los términos van decreciendo rápidamente en magnitud, y los cinco primeros son suficientes (compárese
con el Ejemplo 1.6):
exp (– 0,02) ≈ 0,98019867 .

Figura 3.16

05. En su influyente libro de texto Introductio in analysin infinitorum de 1748, Euler definió las fun-
ciones exponencial y logarı́tmica mediante series infinitas, y demostró que eran funciones inversas una de
la otra. En su libro, Euler sentó las bases para la rama de las matemáticas denominada análisis, el estudio
de los procesos infinitos, como en las series infinitas y en el cálculo.
3.5. La función exponencial 65

En la Figura 3.16 mostramos las gráficas de ex y de su recı́proca e−x . Las gráficas de


todas la funciones exponenciales son muy similares, con propiedades (para todo a > 0)

a0 = 1, ax → ∞ cuando x → ∞, ax → 0 cuando x → −∞ . (3.32)

Veremos en el Capı́tulo 4 que la propiedad singular de ex es que la pendiente de su gráfica


en cualquier punto es igual al valor de la función en ese punto:

dex
= ex . (3.33)
dx
La función exponencial aparece en casi todas las ramas de la matemática aplicada, in-
cluyendo estadı́stica, cinética, teorı́a electromagnética, mecánica cuántica y mecánica
estadı́stica.

EJEMPLO 3.20 Crecimiento y decrecimiento exponenciales


El crecimiento exponencial surge cuando la tasa de crecimiento de un sistema es proporcional en cada
instante de tiempo al tamaño del sistema en ese tiempo. Si x(t) es el tamaño en el instante t, entonces (véase
el Capı́tulo 4) la tasa de variación de x es
dx
= ±kx(t)
dt
con el signo + para crecimiento y − para decrecimiento. El factor de proporcionalidad k se llama constante
de proporcionalidad. La solución de la ecuación diferencial es

x(t) = x0 e±kt ,
donde x0 es el tamaño en el instante t = 0. Como ejemplo, consideremos un sistema cuyo tamaño x se dobla
tras cada intervalo de tiempo τ . Empezando con un tamaño x = x0 , el tamaño después del tiempo τ es 2x0 ,
después del tiempo 2τ es 4x0 , después del tiempo 3τ es 8x0 , etcétera. Después de un tiempo t,

x = 2t/τ x0 .

Igualando esto con la solución de la ecuación diferencial, vemos que la constante de proporcionalidad k es
inversamente proporcional al intervalo de tiempo τ , k = (ln 2)/τ , donde ln 2 es el logaritmo natural del
número 2 (véase más abajo).

EJEMPLO 3.21 Orbitales atómicos


El orbital 1s para un electrón en el estado fundamental del átomo de hidrógeno es

ψ = e−r ,
siendo r la distancia del electrón al núcleo. Todos los orbitales del átomo de hidrógeno son de la forma

ψ = f (x, y, z)e−ar

donde (x, y, z) son las coordenadas cartesianas del electrón, relativas al núcleo en el origen, y a es una
constante. La función f (x, y, z) es un polinomio en x, y y z, y determina la forma del orbital. Por ejemplo,
f = z da un orbital px .
66 Capı́tulo 3. Funciones trascendentes

EJEMPLO 3.22 La distribución normal


La distribución normal o gaussiana en estadı́stica se describe mediante la función densidad de probabilidad
 
1 1  x − µ 2
p(x) = √ exp −
σ 2π 2 σ
donde µ es la media y σ es la desviación estándar de la distribución. La función de probabilidad constituye la
base para el análisis estadı́stico de un amplio sector de fenómenos como, por ejemplo, el análisis de errores
de los resultados de experimentos en las ciencias fı́sicas, el análisis muestral en estudios de poblaciones y
el análisis muestral para control de calidad en la industria manufacturera.

3.6. La función logarı́tmica


La función logarı́tmica6 es la función inversa de la exponencial:

si y = ax entonces x = loga y (3.34)

y se dice que loga y es el logaritmo en base a de y. Las funciones logarı́tmicas más


importantes son el logaritmo común, de base 10,

y = 10x , x = log10 y = log y , (3.35)

y el logaritmo natural (o logaritmo neperiano), de base e,

y = ex , x = loge y = ln y . (3.36)

Para representar el logaritmo común se usa a menudo el sı́mbolo log, omitiendo la base
10; y para el logaritmo natural casi siempre se utiliza el sı́mbolo ln.
EJEMPLOS 3.23
23 = 8 , 3 = log2 8 ,
103 = 1000 , 3 = log10 1000 ,
10−2 = 0,01 , −2 = log 0,01 ,
e3 = 20,0855 . . . , 3 = ln e3 = ln 20,0855 . . . ,
30 = 1 , 0 = log3 1 .
Nota: el logaritmo de 1 en cualquier base es cero.

06. John Napier o Neper (1550-1617), barón escocés y matemático aficionado, publicó su invento de
lo que llamó logaritmos en la Mirifici logarithmorum canonis descriptio (Una descripción del maravilloso
canon de los logaritmos) en 1614. Los logaritmos de Napier se basaban en un logaritmo de 107 = 0. La
primera tabla de logaritmos comunes, con log 1 = 0 y log 10 = 1, fue publicada tras consultas con Napier
por Henry Briggs (1561-1630), profesor de geometrı́a de Oxford, en la Arithmetica logarithmica de 1624.
Los logaritmos simplificaron mucho los cálculos que implicaban multiplicaciones y divisiones.
3.6. La función logarı́tmica 67

Las propiedades de combinación de los logaritmos son las propiedades de los exponentes
de las correspondientes exponenciales. Para el logaritmo natural:

ln x + ln y = ln xy , (3.37)
x
ln x − ln y = ln , (3.38)
y
ln xn = n ln x . (3.39)

EJEMPLO 3.24 Suma de logaritmos. Para demostrar la ecuación (3.37),


sean x = ea , y = eb , de manera que xy = ea+b .
Entonces, por la definición (3.36),
a = ln x, b = ln y, a + b = ln xy .

Por lo tanto ln x + ln y = ln xy.

EJEMPLOS 3.25 Combinaciones de logaritmos

ln 2 + ln 4 = ln (2 × 4) = ln 8 , ln 30 = ln (2 × 3 × 5) = ln 2 + ln 3 + ln 5 ,
6
ln 6 − ln 3 = ln = ln 2 , ln 23 = 3 ln 2 = ln 2 + ln 2 + ln 2 ,
3
1 −1 1
ln = ln 2 = − ln 2 , ln = ln 1 − ln 2 = 0 − ln 2 = − ln 2 ,
2 2
1 1
ln 27 = ln (27)1/3 = ln 3 , −2 ln 5 = ln 5−2 = ln .
3 25

EJEMPLO 3.26 Simplifique la expresión


ln (1 − x2 ) + ln (1 + x)−1 − ln (1 − x) .
Usando la regla ln x = n ln x, se deduce que ln (1 + x)−1 = − ln (1 + x). Entonces
n

ln (1 − x2 ) + ln (1 + x)−1 − ln (1 − x) = ln (1 − x2 ) − ln (1 + x) − ln (1 − x)
 
(1 − x2 ) 1 − x2
= ln = ln
(1 + x)(1 − x) 1 − x2
= ln 1 = 0 .

EJEMPLO 3.27 Lo que no hay que hacer.


Un error sorprendentemente habitual es tomar
ln (x + y) = ln x + ln y .
Esto no es en general cierto. Por ejemplo,
ln (1 + 2) = ln 3 pero ln 1 + ln 2 = ln 2 ( ln 1 = 0) .

Los únicos casos en los cuales ln (x + y) = ln x + ln y son cuando x + y = xy, esto es, cuando x = y/(y − 1).
68 Capı́tulo 3. Funciones trascendentes

La gráfica de ln x y la de su función inversa ex se muestran en la Figura 3.17.7

Figura 3.17

Las gráficas de todas las funciones logarı́tmicas son similares, con propiedades

log 1 = 0, log x → +∞ cuando x → ∞, log x → −∞ cuando x → 0 . (3.40)

Señalamos que el log x (real) no está definido para valores negativos de x.


Antes del invento del microchip y de la calculadora de bolsillo al comienzo de los
años 1970, el logaritmo común se utilizaba principalmente como una ayuda para rea-
lizar multiplicaciones y divisiones largas. Por ejemplo, la multiplicación de números se
puede sustituir por la suma de sus logaritmos. Ahora hay sólo unas pocas aplicaciones
de log10 en las ciencias fı́sicas, por ejemplo en las definiciones de pH como una medida
de la concentración del ion hidrógeno, y de pK donde K es una constante de equilibrio.

EJEMPLO 3.28 pH como una medida de la concentración del ion hidrógeno

El pH de una solución acuosa se define como

pH = − log10 [H+ ] ,

donde [H+ ] es la “concentración de iones hidrógeno” en unidades de mol dm−3 (moles por litro). Entonces

[H+ ] = 10−pH mol dm−3 .

Por ejemplo, un pH de 7 (neutro) corresponde a [H+ ] = 10−7 mol dm−3 .

07. La gráfica de una función log fue dibujada por vez primera en 1646 por Evangelista Torricelli
(1608-1647).
3.7. Valores de las funciones exponencial y logarı́tmica 69

El pH es un ejemplo de la utilización del logaritmo como una escala de medida. Otros


ejemplos de escalas logarı́tmicas son la escala de Richter para la ‘intensidad de terremo-
tos’, la escala en belios para intensidad de sonido, y la escala de magnitudes estelares.
El logaritmo aparece en numerosas expresiones de propiedades y procesos fı́sicos, y
el logaritmo común todavı́a se emplea en la literatura cientı́fica y en los libros de texto.
La conversión a logaritmos naturales viene dada por

ln x = ln 10 × log10 x ≈ 2,30258093 . . . × log10 x . (3.41)

Tabla 3.3

x ln x x ln x ex e−x

0 −∞ 0 1 1
.. .. .. .. ..
. . . . .
despacio
.. .. .. .. ..
. . . . .
10−6 −13,8 −0,00001 1,000001 0,9999990
10−3 −6,9 −0,007 1,001 0,37
1 0 0 2,7 0,9990
10 2,3 23 2 × 104 5 × 10−5
102 4,6 460 3 × 1043 4 × 10−44
.. ..
103 6,9 6908 . .
.. .. .. .. ..
. . . . .
despacio rápido rápido
.. .. .. .. ..
. . . . .
∞ ∞ ∞ ∞ 0

3.7. Valores de las funciones exponencial y logarı́tmica


La Tabla 3.3 muestra los valores de ln x, x ln x, ex , y e−x para un amplio intervalo de
valores de x.
Podemos sacar las siguientes conclusiones a partir de la tabla.

(a) ln x varı́a despacio en comparación con x. De hecho varı́a más despacio que cualquier
potencia de x:

cuando x → 0, ln x → −∞ pero xa ln x → 0 , (3.42)

cuando x → ∞, ln x → ∞ pero x−a ln x → 0 , (3.43)

para cualquier valor positivo de a, por pequeño que sea.


70 Capı́tulo 3. Funciones trascendentes

(b) ex varı́a rápidamente en comparación con x. De hecho varı́a más rápido que cualquier
potencia de x:

cuando x → ∞, ex → ∞ y x−a ex → ∞ , (3.44)

cuando x → ∞, e−x → 0 y xa e−x → 0 , (3.45)

para cualquier valor positivo de a, por grande que sea.

EJEMPLO 3.29 Gráficas para xe−x y para x−1 ex .

Figura 3.18 Figura 3.19

La Figura 3.18 muestra que mientras que e−x decrece monótonamente al crecer x, la función xe−x primero
crece y alcanza un máximo antes de que el decrecimiento exponencial se haga dominante. Este es un
comportamiento caracterı́stico de los orbitales atómicos. Un orbital 1s es de la forma e−r , siendo r la
distancia desde el núcleo, pero todos los demás orbitales se comportan con la distancia como rl e−r , donde
l es un entero positivo.

3.8. Funciones hiperbólicas


Las funciones hiperbólicas tienen su origen en geometrı́a en la descripción de las
propiedades de la hipérbola. Las propiedades de las funciones se deducen fácilmente de
las propiedades de las otras funciones trascendentes descritas en este capı́tulo, y sólo se
tratan aquı́ brevemente.
Se definen el coseno y el seno hiperbólicos a partir de la función exponencial como

1 x  1 x 
cosh x = e + e−x , senh x = e − e−x . (3.46)
2 2
Mostramos sus gráficas en la Figura 3.20.
3.8. Funciones hiperbólicas 71

Figura 3.20

Tanto la notación como las propiedades de las funciones hiperbólicas siguen las de las
funciones trigonométricas (circulares). Por ejemplo,

cosh2 x − senh2 x = 1 ,
senh (x ± y) = senh x cosh y ± cosh x senh y , (3.47)
cosh (x ± y) = cosh x cosh y ± senh x senh y .

Las funciones se llaman ‘hiperbólicas’ porque, si x = a cosh t e y = a senh t son las


coordenadas de un punto, siendo t un parámetro, entonces por la primera ecuación de
(3.47)

x2 − y2 = a2

y ésta es la ecuación de una hipérbola.

Las funciones hiperbólicas inversas


Las funciones hiperbólicas inversas se definen de la misma manera que las funcio-
nes trigonométricas inversas. Por ejemplo, si x = cosh y entonces y = arccosh x. Esas
funciones pueden expresarse a partir de la función logarı́tmica:

arccosh x = ln x ± x2 − 1 ,

arcsenh x = ln x + x2 + 1 ,
  (3.48)
1 1+x
arctgh x = ln .
2 1−x

La relación para arccosh muestra que hay dos valores de la función para cada valor de
x ( > 1). Esos dos valores difieren sólo en un signo, y se define el valor positivo como
valor principal.
72 Capı́tulo 3. Funciones trascendentes

EJEMPLO 3.30 Veamos que



arccosh x = ln x ± x2 − 1 .

Si x = cosh y, entonces, como cosh2 y − senh2 y = 1, deducimos que senh y = ± x2 − 1 y

ln x ± x2 − 1 = ln cosh y + senh y = ln ey

por las definiciones (3.46). El resultado se obtiene puesto que ln ey = y = arccosh x.

3.9. Ejercicios
Apartado 3.1
1. El triángulo rectángulo ABC tiene lados a = 12 y b = 5. Halle c y los sen, cos, tg,
cosec, y cotg de los ángulos internos A y B.

2. Exprese los siguiente ángulos en radianes: 5◦ , 87◦ , 120◦ , 260◦ .


3. Exprese los siguiente ángulos en grados: π/10, 3π/8, 7π/8, 9π/80.
4. Utilice las propiedades de los triángulos rectángulos isósceles para demostrar que

sen π/4 = cos π/4 = 1/ 2 .

5. Dibuje unos diagramas para demostrar que sen (π − θ) = sen θ y que cos (π − θ) = − cos θ.
6. Use las entradas de la Tabla 3.2 para hallar el sen, cos y tg de los ángulos

(i) 3π/4, (ii) 5π/4, (iii) 7π/4 .

7. Halle los periodos y esboce las gráficas de las funciones

(i) sen 2x, (ii) cos 3x, (iii) sen 2x + cos 3x .

Apartado 3.2

8. Dados los lados a = 2, b = 3 y el ángulo interno c = π/4 del triángulo
ABC, halle el tercer lado y los otros dos ángulos.

9. Exprese (i) sen 4θ y (ii) cos 4θ en función de sen 2θ y cos 4θ.


10. Exprese (i) cos 5θ y (ii) cos θ en función de los senos y cosenos de 2θ y 3θ.
11. Exprese cos 4x en función de sen x.
12. Exprese (i) sen 5x cos 3x y (ii) sen 5x sen 3x en función de los senos y cosenos de 8x y 2x.
13. Dados sen 10◦ = 0,1736, sen 30◦ = 1/2, sen 50◦ = 0,7660, halle cos 20◦ (sin usar calculadora).
14. Halle todos los valores de x para los cuales cos 3x = 0.
15. La función
2πx 2πx
φ(x) = a sen + b cos
λ λ
3.9. Ejercicios 73

representa la superposición de dos ondas armónicas con la misma longitud de onda λ. Demuestre que φ
también es armónica con la misma longitud de onda, y puede escribirse como
 
2πx
φ(x) = A sen +α
λ

donde A = a2 + b2 y tg α = b/a.

Apartado 3.3
16. Halle las coordenadas cartesianas de los puntos cuyas coordenadas polares son
(i) r = 3 , θ = π/3 , (ii) r = 3 , θ = 2π/3 .
17. Halle las coordenadas polares de los puntos cuyas coordenadas cartesianas son
(i) (3, −2) , (ii) (– 3, −2) .

18. Una solución de las ecuaciones del movimiento para el oscilador armónico es, según el Ejemplo 3.8,
x(t) = A cos ωt. Demuestre que x(t) puede interpretarse como la coordenada x de un punto que se mueve
con velocidad angular ω constante en un cı́rculo en el plano xy, con centro en el origen y radio A.

Apartado 3.4
1 1
19. Halle los valores principales de arcsen 2
, arcsen (1), arccos 2
, arccos (– 1).
20. La ecuación de Bragg para la reflexión de la radiación con longitud de onda λ en los planos de un
cristal es nλ = 2d sen θ, donde d es la separación entre los planos, θ el ángulo de incidencia de la radiación
y n un entero. Calcule los ángulos θ para los cuales los rayos X de longitud de onda 1,5 × 10−10 m son
reflejados por planos separados 3,0 × 10−10 m.

Apartado 3.5
21. Dibuje la gráfica de e−2x para valores −3 ≤ x ≤ 10.
22. (i) Desarrolle e−x/3 en potencias de x hasta términos en x5 .
(ii) Use la expresión para calcular un valor aproximado de e−1/3 . Determine cuántas cifras signi-
ficativas de este valor son correctas y dé su respuesta con ese número de cifras.
23. Para un sistema compuesto de N moléculas idénticas, la distribución de Boltzmann
ni
= ei /kT
N
da la fracción promedio de moléculas en el estado molecular i con energı́a i .
(i) Muestre que el cociente ni /nj de las poblaciones de los estados i y j depende únicamente de la
diferencia de energı́as entre los dos estados.
(ii) ¿Cuál es el cociente para dos estados de igual energı́a (estados degenerados)?

Apartado 3.6
24. Exprese lo siguiente como el log de un único número:
(i) ln 2 + ln 3 (ii) ln 2 − ln 3 (iii) 5 ln 2 (iv) ln 3 + ln 4 − ln 6
25. Simplifique:
(i) ln x3 − ln x (ii) ln (2x3 − 3x2 ) + ln x−2 (iii) ln (x5 − 3x2 ) + 2 ln x−1 − ln (x3 − 3)
2
+3
(iv) ln ex (v) ln ex − ln e3
74 Capı́tulo 3. Funciones trascendentes

26. La fórmula barométrica


p = p0 e−Mgh/RT
da la presión de un gas de masa molar M a la altitud h, cuando p0 es la presión al nivel del mar. Exprese h
en función de las otras variables.
27. El potencial quı́mico de un gas a presión p y temperatura T es
f
µ = µ−

+ RT ln
p−◦

donde f = γp es la fugacidad y γ la constante de fugacidad. Exprese p como una función explı́cita de las
otras variables.
Derivación

4.1. Conceptos
En las ciencias fı́sicas nos interesa el valor de una cantidad fı́sica y cómo se relacio-
na con otras cantidades fı́sicas en cualquier estado de un sistema. Además, nos interesa
cómo varı́a el valor de la cantidad fı́sica al pasar de un estado a otro, y la tasa de varia-
ción con respecto al tiempo o con respecto a alguna otra cantidad fı́sica.
Consideremos la ecuación de estado de los gases ideales

pV = nRT .

Como cada una de las cuatro variables p, V, T y n puede expresarse en función de las
otras tres, el estado del sistema queda determinado por tres de las cuatro cantidades. Si
la temperatura T varı́a en una cantidad ∆T (que leemos como ‘delta de t’), manteniendo
la presión p y la cantidad de materia n fijas, el volumen cambia de

nRT nR(T + ∆T)


V= a V + ∆V =
p p

y la variación en el volumen es

nR
∆V = ∆T .
p

La Figura 4.1 muestra que la gráfica de V frente a T (a p y n constantes) es una lı́nea


recta con gradiente, o pendiente,

∆V nR
= = constante.
∆T p

El gradiente es la variación de V por unidad de variación de T, o la tasa de variación de


V con respecto a T.
Si se varı́a la presión p del gas en una cantidad ∆p a T y n constantes, el cambio en el
volumen es
nRT nRT ∆p
∆V = − = −nRT .
p + ∆p p p(p + ∆p)
76 Capı́tulo 4. Derivación

Figura 4.1 Figura 4.2

La Figura 4.2 muestra que la gráfica de V frente a p (a T y n constantes) no es una lı́nea


recta. El gradiente en cada punto se define como el gradiente de la tangente a la curva en
ese punto. El gradiente varı́a de un punto a otro, y no viene dado por ∆V/∆p.
La rama de las matemáticas que trata de la determinación de gradientes y, por lo
tanto, de tasas de variación es el cálculo diferencial.

4.2. El proceso de derivación


Supongamos que el valor de una variable x varı́a de manera continua de p a q. La
diferencia (q − p) se llama variación o incremento de x. En cálculo diferencial esta
variación se denota por*

∆x = q − p . (4.1)

Vemos que ∆x > 0 si q > p, y ∆x < 0 si q < p.


Sea y = f (x) una función de x que varı́a de manera continua y regular desde el punto
P al punto Q (Figura 4.3).

Figura 4.3

0* A veces, si la variación en x se supone ‘pequeña’, se usa δx en vez de ∆x.


4.2. El proceso de derivación 77

Los valores de y en P y en Q son yP = f (p) e yQ = f (q). La variación ∆y en y correspon-


diente a variar ∆x en x es por lo tanto

yQ − yP = ∆y = f (q) − f (p) .

La cantidad
yQ − yP ∆y
= (4.2)
q−p ∆x

es el gradiente de la recta PQ, y puede interpretarse como la tasa de variación promedio


de y con respecto a x entre P y Q.
De manera más general, si la variable varı́a en ∆x desde p = x hasta q = x + ∆x, la
correspondiente variación en la función es la cantidad

∆y = f (x + ∆x) − f (x) (4.3)

y la tasa de variación promedio correspondiente es

∆y f (x + ∆x) − f (x)
= . (4.4)
∆x ∆x

EJEMPLO 4.1 Una función cuadrática general, y = ax2 + bx + c:

En el punto P yP = f (x) = ax2 + bx + c .


En el punto Q yQ = f (x + ∆x) = a(x + ∆x)2 + b(x + ∆x) + c .

El cambio en la función al pasar de P a Q es por lo tanto

∆y = yQ − yP = [a(x + ∆x)2 + b(x + ∆x) + c] − [ax2 + bx + c]


= (2ax + b)∆x + a(∆x)2

y el gradiente de la recta PQ es
∆y
= (2ax + b) + a∆x . (4.5)
∆x

La Figura 4.4 muestra cómo cambia la cantidad ∆y/∆x cuando el punto Q se mueve
sobre la curva hacia P (cuando ∆x disminuye en magnitud).
Al moverse Q hacia P pasando por Q , el gradiente de la recta PQ se acerca al gradiente
de la tangente en P. Expresamos esto como
 
∆y
gradiente en P = lim (4.6)
Q→P ∆x

(que leemos como ‘el lı́mite cuando Q tiende a P’).


78 Capı́tulo 4. Derivación

Figura 4.4

Al mismo tiempo, la magnitud de ∆x tiende a cero, ∆x → 0 cuando q → p, y el lı́mite


puede expresarse como1
 
∆y
gradiente en P = lim . (4.7)
∆x→0 ∆x

EJEMPLO 4.2 Para la función cuadrática y = ax2 + bx + c del Ejemplo 4.1,


 
∆y ∆y
= (2ax + b) + a∆x de manera que lim = 2ax + b .
∆x ∆x→0 ∆x
El lı́mite es una función de x, y da la pendiente o gradiente de la curva en cada valor x (cada punto de la
curva).

El proceso de tomar el lı́mite en (4.7) se llama derivación. En cálculo diferencial, el


dy
lı́mite se denota por el sı́mbolo :2
dx
   
dy ∆y f (x + ∆x) − f (x)
= lim = lim (4.8)
dx ∆x→0 ∆x ∆x→0 ∆x

01. Este método de hallar la tangente en un punto de una curva es esencialmente el dado por Fermat
en su Método para hallar máximos y mı́nimos hacia 1630. Su obra marca el principio del cálculo diferen-
cial. Un método similar al de Fermat, pero utilizando cantidades equivalentes a ∆x y ∆y, fue descrito por
Barrow en Lectiones geometricae, publicado en 1670. En esas lecciones Isaac Barrow (1630-1677), teólogo
y profesor de geometrı́a de Cambridge, daba una descripción ‘puesta al dı́a’ de los métodos infinitesimales.
La formulación del método de las tangentes fue incluida ‘por consejo de un amigo’, Newton, quien fue su
sucesor en la cátedra cuando Barrow se convirtió en capellán del rey Carlos II de Inglaterra en 1669.
02. La notación proviene de la formulación de Leibniz del cálculo. Gottfried Wilhelm Leibniz (1646-
1716), filósofo, diplomático y matemático, descubrió su formulación del cálculo en los años 1672-1676
mientras servı́a como diplomático en Parı́s, donde estuvo bajo la influencia del fı́sico y matemático Ch-
ristiaan Huygens, inventor del reloj de péndulo. Su primera descripción del cálculo diferencial fue Nova
methodus pro maximis et minimis, itemque tangentibus (Un nuevo método para máximos y mı́nimos, y
también para tangentes), publicado en 1684.
4.3. Continuidad 79

(que leemos como ‘dy sobre dx’). Se lo llama coeficiente diferencial de la función
dy
o, sencillamente, derivada de la función. Señalamos que el sı́mbolo no significa
dx
‘dy’ dividido por la cantidad ‘dx’. El sı́mbolo representa el lı́mite, y el hecho de tomar
el lı́mite, dado por el último miembro de (4.8). Una representación alternativa para la
derivada de la función f (x) es f  (x):

df (x)
f  (x) = . (4.9)
dx
Otra representación es Df , por la que se supone que la derivada de f se obtiene actuando
(operando) sobre f con el operador diferencial D,

d df
D= , Df = . (4.10)
dx dx
El concepto de operadores diferenciales, y de otros tipos, tiene amplio uso en las ciencias
fı́sicas y será tratado en capı́tulos posteriores.

4.3. Continuidad
En la exposición del Apartado 4.2, al tomar el lı́mite, supusimos que la función y =
f (x) era una función continua de x, y que el lı́mite definido por la ecuación (4.8) existı́a
y era único. Hablando en términos generales, una función es continua si su gráfica es
una curva sin interrupciones. Podemos comprobar la continuidad en un punto, digamos
x1 , de una función dada y = f (x) haciendo que la variable independiente x se mueva
continuamente desde la derecha y desde la izquierda hacia el punto especificado x1 como
se muestra en la Figura 4.5.

Figura 4.5

Si f (x1 + ∆x) y f (x1 − ∆x) tienden ambos al mismo valor f (x1 ) cuando ∆x → 0, se dice
que la función es continua en x1 , y escribimos

lim f (x) = f (x1 ) . (4.11)


x→x1
80 Capı́tulo 4. Derivación

Si esto es cierto para todo valor de x1 en un cierto intervalo a ≤ x1 ≤ b, entonces la


función es continua en el intervalo. La Figura 4.6 ilustra tres tipos de discontinuidades.

Figura 4.6

Punto a. La función tiene una discontinuidad finita en x = a. Por ejemplo, la función



x+1 si x > 0
f (x) = x − 1 si x ≤ 0

es discontinua en x = 0, donde su valor es −1. Sin embargo, si nos acercamos al punto


x = 0 por la derecha, f (x) tiende al valor +1.

Punto b. La función tiene una discontinuidad infinita en x = b. Si nos acercamos a este


punto por la izquierda, el valor de la función tiende a −∞. Si nos acercamos por la de-
recha la función tiende a +∞. Infinito no es un número, y la función no está definida en
x = b. Un ejemplo es 1/(x − 1), discontinua en x = 1.

Punto c. La función tiende a infinito si nos acercamos al punto x = c por ambos lados.
Por ejemplo 1/x2 en x = 0.
En estos tres casos, la naturaleza de las discontinuidades es evidente a partir de la
gráfica. Se dice que son discontinuidades esenciales. En algunos casos, sin embargo, la
discontinuidad no resulta evidente a partir de la gráfica. Por ejemplo, la función f = x/x
tiene valor constante igual a 1 para todo valor x = 0, pero no está definida en x = 0
porque 0/0 es indeterminado y no tiene sentido. Tal discontinuidad se dice evitable. Si
redefinimos la función de manera que f (x) = x/x si x = 0 y f (x) = 1 si x = 0, entonces
la función se vuelve continua para todo valor de x. La discontinuidad se evita sin cambiar
la función salvo en un punto aislado.

4.4. Lı́mites
Sea la función racional
x2 − 4
y=
x−2
4.4. Lı́mites 81

que es continua para todo valor de x salvo x = 2. La Tabla 4.1 muestra que, mientras que
el numerador y el denominador tienden ambos a cero cuando x = 2, su cociente tiende
al valor y = 4 cuando x → 2 por ambos lados:
 2 
x −4
lim = 4.
x→2 x−2

Tabla 4.1 Valores de y = (x2 − 4)/(x − 2)

x 2,1 2,01 2,001 2,0001 ... 1,9999 1,999 1,99 1,9

y 4,1 4,01 4,001 4,0001 ... 3,9999 3,9990 3,990 3,90

Este es un ejemplo de una singularidad evitable. Tenemos

x2 − 4 (x − 2)(x + 2)
= =x+2 si x = 2
x−2 x−2

y la discontinuidad se evita redefiniendo la función para que valga y = 4 cuando x = 2.


Este ejemplo es importante porque tomar el lı́mite para derivar supone siempre hacer
que el denominador tienda a cero.
El cálculo de los lı́mites es necesario siempre que una cantidad se hace indeterminada.
Además del caso 0/0, las indeterminaciones más habituales en las ciencias fı́sicas son
∞/∞ y (∞ − ∞).

EJEMPLO 4.3
 
2x2 + 5
lim = 2.
x→∞ x2 + 3x
El numerador y el denominador tienden ambos a infinito cuando x → ∞, pero el cociente permanece finito.
Entonces, dividiendo numerador y denominador por x2 , lo cual está permitido si x = 0, tenemos

2x2 + 5 2 + 5/x2 2
= −→ = 2 cuando x → ∞.
x2 + 3x 1 + 3/x 1

EJEMPLO 4.4
 2  2 
1 1
lim 2x + − 3x − = 10 .
x→0 x x
Los términos al cuadrado tienden ambos a infinito cuando x → 0, pero la diferencia se mantiene finita.
Desarrollando los cuadrados y simplificando, tenemos
 2  2    
1 1 1 1
2x + − 3x − = 4x 4
+ 4 + − 9x 2
− 6 +
x x x2 x2
= −5x4 + 10 −→ 10 cuando x → 0.
82 Capı́tulo 4. Derivación

EJEMPLO 4.5
lim [ln (2x + 3) − ln (x − 2)] = ln 2 .
x→∞

Por las propiedades de los logaritmos,


 
2x + 3
ln (2x + 3) − ln (x − 2) = ln −→ ln 2 cuando x → ∞.
x−2

4.5. Derivación a partir de primeros principios


Decimos que una función es derivable en un punto si el lı́mite, ecuación (4.8),
   
dy ∆y f (x + ∆x) − f (x)
= lim = lim (4.8)
dx ∆x→0 ∆x ∆x→0 ∆x

existe y es finito. Para que esto sea cierto, una condición necesaria es que la función
sea continua en el punto, pero no todas las funciones continuas son derivables en todas
partes. Por ejemplo, la función

x si x≥0
f (x) = |x| = −x si x<0

es continua en todos los valores de x pero según se ve en la Figura


4.7 su pendiente cambia abruptamente en x = 0, pasando del Figura 4.7
valor −1 cuando x < 0 al valor +1 para x ≥ 0.

La función tiene un punto cúspide en x = 0 y su derivada no está definida por la


ecuación (4.8).
En general, una función es derivable si es continua y ‘regular’, sin discontinuida-
des esenciales ni cúspides. Para una función de ese tipo, tomar el lı́mite en la ecuación
(4.8) se denomina derivación a partir de primeros principios, y ha sido ilustrado en
los Ejemplos 4.1 y 4.2 para una función cuadrática general. Todas las funciones pueden
derivarse de esta manera. Sea y = f (x) una función de x, y supongamos que la función
cambia de y a y + ∆y = f (x + ∆x) cuando la variable cambia de x a x + ∆x. Los pasos
para derivar a partir de primeros principios son:

(1) restar y de y + ∆y para obtener ∆y como una función de x y de ∆x, y simplificar


cuanto sea posible,
(2) dividir ambos miembros de la ecuación por ∆x,
∆y dy
(3) hallar el lı́mite de cuando ∆x → 0. Esto da la derivada pedida .
∆x dx
4.6. Derivación a partir de reglas 83

dy 1
EJEMPLO 4.6 Halle a partir de primeros principios para y = .
dx x
1 1
(1) y = f (x) = , y + ∆y = f (x + ∆x) = ,
x x + ∆x
1 1 −∆x
∆y = f (x + ∆x) − f (x) = − = .
x + ∆x x x(x + ∆x)
 
∆y −1 dy ∆y 1
(2) = . (3) = lim =− 2.
∆x x(x + ∆x) dx ∆x→0 ∆x x


EJEMPLO 4.7 Derive x.
√ √
(1) y = x, y + ∆y = x + ∆x .
√ √  √ √ 
√ √ x + ∆x − x x + ∆x + x
∆y = x + ∆x − x = √ √
x + ∆x + x
(x + ∆x) − x ∆x
= √ √ = √ √
x + ∆x + x x + ∆x + x
(usando la relación (a − b)(a + b) = a2 − b2 ).
 
∆y 1 dy ∆y 1
(2) = √ √ . (3) = lim = √ .
∆x x + ∆x + x dx ∆x→0 ∆x 2 x

EJEMPLO 4.8 Derive ex .

(1) y = ex , y + ∆y = ex+∆x = ex e∆x .


De la definición de la función exponencial como una serie infinita,
(∆x)2
y + ∆y = ex (1 + ∆x + + ··· )
2
y, por lo tanto,
(∆x)2 (∆x)2
∆y = ex (1 + ∆x + + · · · ) − ex = ex (∆x + + ··· ).
2 2
∆y ∆x dy
(2) = ex (1 + + ··· ). (3) = ex .
∆x 2 dx

4.6. Derivación a partir de reglas


Mientras que toda función puede ser derivada a partir de primeros principios, en la
práctica la derivación se hace siguiendo un conjunto de reglas.3 Esas reglas se demues-
tran a partir de primeros principios, como en los Ejemplos 4.6 a 4.8. En la Tabla 4.2
presentamos las derivadas de las funciones elementales más importantes.

03. Muchas de las reglas de derivación aparecı́an en la obra de Leibniz de 1684 sobre cálculo dife-
rencial, con la notación d y la apelación calculus differentialis para el cálculo de las tangentes.
84 Capı́tulo 4. Derivación

Tabla 4.2 Derivación de funciones elementales

Tipo Función Derivada

c = constante c 0
potencia de x xa axa−1
trigonométrico sen x cos x
cos x − sen x
tg x sec2 x
exponencial ex ex
hiperbólico cosh x senh x
senh x cosh x
logarı́tmico ln x 1/x

Tabla 4.3 Derivación de combinaciones de funciones

Tipo Regla

d du
1. múltiplo de una función (a u) = a
dx dx
d du dv
2. suma de funciones (u + v) = +
dx dx dx
d dv du
3. regla del producto (uv) = u + v
dx dx dx
d u   du dv  2
4. regla del cociente = v −u v
dx v dx dx
d df du
5. regla de la cadena f (u) = ·
dx du dx
dx 1 dx dy
6. regla de la inversa (uv) =   o bien × =1
dy dy dy dx
dx

El primer ejemplo de la Tabla 4.2 dice que la tasa de variación de una constante es cero.
En general, si una función es independiente de una variable x entonces su derivada con

Isaac Newton (1642-1727) desarrolló sus ideas sobre el cálculo en el año 1665-1666 (el Trinity College
de Cambridge estaba cerrado por la peste). Después mantuvo que durante ese tiempo descubrió el teorema
binomial, el cálculo, la ley de la gravedad y la naturaleza de los colores. Escribió el primero de tres trabajos
sobre el cálculo en 1696 en De analysi per aequationes numero terminorum infinitas, pero lo publicó sólo
en 1711. El primer trabajo publicado apareció en 1687 en Philosophiae naturalis principia mathemati-
ca, probablemente el tratado cientı́fico más influyente de todos los tiempos. En la primera edición de los
Principia Newton reconocı́a que Leibniz tenı́a también un método similar. Para cuando apareció la tercera
edición, la referencia a Leibniz habı́a sido suprimida cuando la cuestión de la precedencia habı́a conducido
a una amarga disputa entre seguidores de ambos hombres.
4.6. Derivación a partir de reglas 85

respecto a x es cero. Ejemplos de la derivada de una ‘potencia’ de x se han visto en los


Ejemplos 4.6 para a = −1 y 4.7 para a = 1/2.
Otros ejemplos son (usando distintas notaciones)

dy
y = x5 , = 5x4 .
dx
f (x) = x−1/2 , f  (x) = − 21 x−3/2 .
d
f (x) = x0,3 , f (x) = 0,3 x−0,7 .
dx
Las reglas para derivar combinaciones de funciones elementales se resumen en la
Tabla 4.3. En esas reglas, x es la variable independiente, y, u y v son funciones de x, y a
es una constante.

Combinaciones lineales de funciones


Una combinación lineal de las funciones de x: u, v y w, tiene la forma

y = au(x) + bv(x) + cw(x) (4.12)

donde a, b y c son constantes. Esta función puede derivarse término a término: usando
las Reglas 1 y 2 de la Tabla 4.2,

dy du dv dw
=a +b +c . (4.13)
dx dx dx dx
Por ejemplo,

y = 2x3 + 3ex − 12 ln x ,
dy d d 1d 1 1
= 2 x3 + 3 ex − ln x = 2 × 3x2 + 3 × ex − ×
dx dx dx 2 dx 2 x
1
= 6x + 3e −
2 x
.
2x
Para el ejemplo del gas ideal presentado en el Apartado 4.1,
   
nRT dV d 1 1 −nRT
V= , = nRT = nRT − 2 = ,
p dp dp p p p2

puesto que, a T y n constantes, nRT es constante. Señalamos que mientras que V es


inversamente proporcional a p, es directamente proporcional a 1/p. Esto es, V es una
función lineal de 1/p, y la gráfica de V frente a 1/p es una lı́nea recta con pendiente
dV/d(1/p) = nRT.
86 Capı́tulo 4. Derivación

Regla del producto


La función

y = (2x + 3x2 )(5 + 7x3 )

puede derivarse considerándola como el producto y = uv con u = (2x + 3x2 ) y v =


(5 + 7x3 ). Entonces, por la Regla 3 de la Tabla 4.3,

dy dv du
= u +v
dx dx dx
d d
= (2x + 3x2 ) (5 + 7x3 ) + (5 + 7x3 ) (2x + 3x2 )
dx dx
= (2x + 3x )(21x ) + (5 + 7x )(2 + 6x)
2 2 3

que ahora se puede simplificar. En este ejemplo es igual de sencillo multiplicar primero
el producto original y derivar término a término, pero en muchos casos usar la fuerza
bruta es más complicado que usar la regla del producto. Por ejemplo, la función

y = (2x + 3x2 ) sen x

se deriva fácilmente sólo si se utiliza la regla del producto. Tomando y = uv con u =


(2x + 3x2 ) y v = sen x,

dy dv du
= u +v
dx dx dx
d d
= (2x + 3x2 ) sen x + sen x (2x + 3x2 )
dx dx
= (2x + 3x2 ) cos x + (2 + 6x) sen x .

Regla del cociente


Para la función
2x + 3x2
y=
5 + 7x3

tomamos y = u/v, siendo u = (2x + 3x2 ) y v = (5 + 7x3 ). Entonces, por la Regla 4 de la


Tabla 4.3,

dy  du dv  2
= v −u v
dx dx dx
(5 + 7x3 )(2 + 6x) − (2x + 3x2 )(21x2 )
= .
(5 + 7x3 )2
4.6. Derivación a partir de reglas 87

Regla de la cadena (función de una función)


El polinomio

y = f (x) = (2x2 − 1)3

puede derivarse desarrollando primero el cubo y luego derivando término a término:

y = (2x2 − 1)3 = 8x6 − 12x4 + 6x2 − 1 ,


dy
= 48x5 − 48x3 + 12x = 12x(2x2 − 1)2 .
dx
Una forma más sencilla es utilizando la regla de la cadena. Definimos u = 2x2 − 1 y
reescribimos y como función de u:

y = g(u) = u3 .

Entonces por la Regla 5 de la Tabla 4.3,

dy dy du
= · = (3u2 )(4x)
dx du dx
y, sustituyendo el valor de u,

dy
= 12x(2x2 − 1)2 .
dx
En este ejemplo hemos considerado y de dos maneras:

(i) como una función de x, f (x) = (2x2 − 1)3 ;


(ii) como una función de u, g(u) = u3 siendo u la función u = 2x2 − 1. La sustitución
u = 2x2 − 1 pone de manifiesto la estructura de la función, un cubo, y hace que la
regla de la cadena sea el método natural para derivar.

EJEMPLOS 4.9 Regla de la cadena

1. y = (2x2 − 1)5/2 = u5/2 , siendo u = 2x2 − 1 :


dy dy du
= · = ( 25 u3/2 )(4x) = 10x(2x2 − 1)3/2 .
dx du dx
2. y = sen (2x2 − 1) = sen u, siendo u = 2x2 − 1 :
dy dy du
= · = ( cos u)(4x) = 4x cos (2x2 − 1) .
dx du dx
2
−1
3. y = e2x = eu , siendo u = 2x2 − 1 :
dy dy du 2
= · = (eu )(4x) = 4xe2x −1 .
dx du dx
4. y = ln (2x2 − 1) = ln u, siendo u = 2x2 − 1 :
88 Capı́tulo 4. Derivación
 
dy dy du 1 4x
= · = (4x) = 2 .
dx du dx u 2x − 1
5. y = ln ( sen x) = ln u, siendo u = sen x :
 
dy dy du 1 cos x
= · = ( cos x) = = cotg x .
dx du dx u sen x

Estos ejemplos ilustran la generalización de la Tabla 4.2 a la derivación de funciones


elementales de una función. En la Tabla 4.4, u es una función de x.

Tabla 4.4 Regla de la cadena

Tipo Función Derivada

du
potencia de u ua aua−1
dx
du
trigonométrico sen u cos u
dx
du
cos u − sen u
dx
2 du
tg u u
dx
du
exponencial eu eu
dx
1 du
logarı́tmico ln u
u dx

du
Un caso especial importante es u = ax, para el cual = a. Por ejemplo,
dx
d d ax
sen (ax) = a cos (ax) , e = a eax .
dx dx
Vemos sin embargo que, como ln (ax) = ln a + ln x y ln a es constante,

d d d 1
ln (ax) = ( ln a + ln x) = ln x = .
dx dx dx x

Funciones inversas
Si y = f (x), la función inversa de f se define como x = f −1 (y). Por la Regla 5 de la
Tabla 4.3, las derivadas de la función y de la función inversa están relacionadas por

dy dx d d
· = f (x) · f −1 (y) = 1 .
dx dy dx dy
4.6. Derivación a partir de reglas 89

La regla de la inversa

dx 1
=  (4.14)
dy dy
dx
se utiliza cuando es más difı́cil derivar la función que su inversa. Por ejemplo, si y se
define implı́citamente como

x = y5 − 2y

dy dx
(véase el Ejemplo 2.12), puede hallarse entonces como la inversa de :
dx dy

dx dy 1
= 5y4 − 2, = 4 .
dy dx 5y − 2

En la Tabla 4.5 se dan ejemplos particularmente importantes de la derivación de fun-


ciones inversas, donde se toman los valores principales de las funciones trigonométricas
inversas.

Tabla 4.5

d  x 1
arcsen =√ 2
dx a a − x2
d  x −1
arccos =√ 2
dx a a − x2
d  x a
arctg = 2
dx a a + x2

x
Por ejemplo, si y = arcsen , entonces x = a sen y y tenemos
a
dx dy 1
= a cos y, = .
dy dx a cos y
π π
Si tomamos el valor principal, y está entre −y , y cos y es positivo. Entonces
2 2



a cos y = a 1 − sen2 y = a2 − a2 sen2 y = a2 − x2

dy 1
=√ 2 .
dx a − x2
90 Capı́tulo 4. Derivación

Las derivadas de las funciones hiperbólicas inversas (Apartado 3.8) aparecen en la Tabla
4.6.

Tabla 4.6

d  x 1
arccosh =√ 2
dx a x − a2
d  x  1
arcsenh =√ 2
dx a x + a2
d  x a
arctgh = 2
dx a a − x2

x
Por ejemplo, si y = arcsenh , entonces x = a senh y y tenemos
a
dx dy 1
= a cosh y, = .
dy dx a cosh y


Como cosh y > 0 (véase la Figura 3.20), a cosh y = a 1 + senh2 y = a2 + x 2 , y

dy 1
=√ 2 .
dx a + x2

4.7. Funciones implı́citas


Toda relación funcional entre dos variables x e y puede expresarse en forma implı́cita
(véase el Apartado 2.4) como

f (x, y) = 0 . (4.15)

En todos los ejemplos de aplicaciones de las reglas de derivación presentados en el Apar-


tado 4.6 ha sido posible expresar por lo menos una de las variables como función explı́ci-
ta de la otra. En algunos casos, sin embargo, ninguna de las variables puede expresarse
ası́, y las reglas han de ser aplicadas a la propia función implı́cita. Supongamos que la
ecuación (4.15) define y como función de x. Entonces la variación en y que acompaña a
una variación de x es tal que la ecuación (4.15) se cumple siempre. De esto se deduce que
la tasa de variación de la función implı́cita f (x, y) es cero para toda variación admisible:

d
f (x, y) = 0 . (4.16)
dx
Por ejemplo, si

f (x, y) = y5 − 2y − x = 0
4.8. Derivada logarı́tmica 91

entonces
df d 5 d d
= (y ) − 2 (y) − (x)
dx dx dx dx
dy dy
= 5y4 − 2 − 1
dx dx
dy
= (5y − 2) − 1
4

dx
= 0.
dy
Despejando se obtiene
dx
dy 1
= 4 .
dx 5y − 2

Este es el resultado obtenido en el Apartado 4.6 derivando la función inversa.

4.8. Derivada logarı́tmica


Para algunas funciones es más fácil derivar el logaritmo natural que la propia función.
Por ejemplo, si

y = ua vb wc . . . (4.17)

donde u, v, w, . . . son funciones de x y a, b, c, . . . son constantes, entonces

ln y = a ln u + b ln v + c ln w + . . . (4.18)

d d d d
ln y = a ln u + b ln v + c ln w + . . .
dx dx dx dx
Por lo tanto,

1 dy a du b dv c dw
= + + + ... (4.19)
y dx u dx v dx w dx

Este método de derivación se denomina derivación logarı́tmica. Cuando y = uv el


método reproduce la regla del producto; cuando y = u/v, reproduce la regla del cociente.

EJEMPLOS 4.10 Derivada logarı́tmica


 1/2
1+x
(i) y = , ln y = [ln (1 + x) − ln (1 − x)].
1−x
92 Capı́tulo 4. Derivación

Entonces  
d 1 dy 1 1 1 1
ln y = = + =
dx y dx 2 1+x 1−x 1 − x2
y, multiplicando ambos miembros por y,
 1/2
dy 1 1+x 1
= = .
dx 1 − x2 1−x (1 + x)1/2 (1 − x)3/2

(ii) y = ax , ln y = x ln a.
Entonces
d 1 dy dy
ln y = = ln a y, por lo tanto, = ax ln a .
dx y dx dx
(iii) y = xx , ln y = x ln x.
Aplicando la regla del producto,
d d d
ln y = x ln x + ln x x = 1 + ln x
dx dx dx
y, por lo tanto,
1 dy dy
= 1 + ln x y = xx (1 + ln x) .
y dx dx

EJEMPLO 4.11 Representación logarı́tmica


Para un sistema que experimenta un decrecimiento exponencial (cinética de primer orden), el tamaño del
sistema viene dado por (véase el Ejemplo 3.20)

x(t) = x0 e−kt

y, tomando logaritmos en ambos miembros,

ln x = ln x0 − kt .

Una representación gráfica de ln x frente a t es una lı́nea recta con pendiente d( ln x)/dt = −k que corta el
eje t = 0 con valor ln x0 . Este ejemplo es importante porque ilustra el procedimiento estándar para calcular
la constante de proporcionalidad k a partir de la representación lineal de valores experimentales de x y t.

4.9. Derivadas sucesivas


La derivada de una función puede a su vez derivarse si cumple las condiciones de
continuidad y regularidad mencionadas en los Apartados 4.3 a 4.5. Por ejemplo, la fun-
ción cúbica

y = x 3 + x2 + x + 1

tiene como derivada (primera)

dy
= 3x2 + 2x + 1
dx
4.9. Derivadas sucesivas 93

y podemos derivar esto para obtener la derivada segunda, o segundo coeficiente dife-
rencial,

d  dy  d2 y
= 2 = 6x + 2 .
dx dx dx
Derivaciones sucesivas dan las tercera y cuarta derivadas

d3 y d4 y
= 6, = 0,
dx3 dx4
y en este caso todas las derivadas de orden superior son cero. Una notación alternativa es
(véase el Apartado 4.2) f  (x), f  (x), f  (x) . . . para las derivadas de f (x), ó Df , D2 f , D3 f ,
d
. . . , siendo D el operador diferencial .
dx
Un polinomio de grado n tiene únicamente sus n primeras derivadas no nulas, pe-
ro otras funciones sencillas pueden derivarse indefinidamente. En particular, la función
exponencial ex tiene todas sus derivadas iguales a ex .

EJEMPLO 4.12 Derivadas de sen ax


f (x) = sen ax
f  (x) = a cos ax
f  (x) = −a2 sen ax = −a2 f (x)
...
En general, para la derivada n-ésima,

f (n) (x) = (– 1)n/2 an sen ax si n es par.

Por ejemplo, para n = 4,


f (4) (x) = (– 1)2 a4 sen ax = a4 sen ax .
Similarmente,
f (n) (x) = (– 1)(n−1)/2 an cos ax si n es impar.
Por ejemplo, para n = 3,
f (3) (x) = −a3 cos ax .

La derivada primera f  (x) de una función f (x) da la tasa de variación de la función, o la


pendiente de su gráfica en el punto x. La derivada segunda f  (x) es la tasa de variación
de la pendiente, y está relacionada con la curvatura en x.

4.10. Puntos estacionarios


Sea la función cúbica (Figura 4.8)

y = x(x − 3)2 .
94 Capı́tulo 4. Derivación

La función tiende a ±∞ cuando x → ±∞, pero la


gráfica muestra que la función tiene un máximo local
en el punto A en x = 1 donde su valor es mayor que en
todos los puntos vecinos. La función tiene también un
mı́nimo (local) en el punto B en x = 3 donde su valor
es menor que en todos los puntos vecinos. Llamamos
puntos extremos a los de valores máximos o mı́nimos.
La determinación de los valores máximos y mı́nimos
de una función tiene importancia en las ciencias fı́sicas
porque, por ejemplo, (i) las ecuaciones de movimien-
to se formulan a menudo como ‘principios variaciona-
les’, donde las soluciones se obtienen como máximos o Figura 4.8
mı́nimos de alguna función variacional (véase el Ejem-
plo 4.15), (ii) el ajuste de una curva teórica a un conjunto de puntos experimentales puede
expresarse como un principio de ‘desviación mı́nima’, como en el método de mı́nimos
cuadrados presentado en el Capı́tulo 21.
Consideremos la curva en un entorno del máximo en el punto A de la Figura 4.8. A
la izquierda de A el gradiente es positivo y el valor de la función crece. A la derecha de
A el gradiente es negativo y la función decrece. En el propio punto A la función tiene
gradiente nulo (la tangente a la curva es horizontal), y la tasa de variación de y con
respecto a x es cero. El punto se llama un punto estacionario, y el valor de la función en
el punto se llama un valor estacionario. Consideraciones similares se aplican al mı́nimo
en B, y la condición general para un punto estacionario es que la derivada primera de la
función sea cero:
dy
=0 en un punto estacionario. (4.20)
dx
Para distinguir entre valores máximos y mı́nimos es necesario considerar la derivada
segunda. Al pasar por el máximo en A desde la izquierda hacia la derecha, el gradien-
te decrece desde valores positivos, pasando por cero en A, hasta valores negativos. Se
deduce que la tasa de variación del gradiente es negativa en A, y esto es una condición
suficiente para que la función tenga un valor máximo en ese punto:

dy d2 y
para un máximo: =0 y < 0. (4.21)
dx dx2
Consideraciones similares aplicadas al mı́nimo en B muestran que

dy d2 y
para un mı́nimo: =0 y > 0. (4.22)
dx dx2
Para la función cúbica de la Figura 4.8,

y = x(x − 3)2 = x3 − 6x2 + 9x ,


4.10. Puntos estacionarios 95

dy
= 3x2 − 12x + 9 = 3(x − 1)(x − 3) = 0 si x = 1 ó x = 3.
dx

dy2 < 0 si x = 1, un máximo,
= 6x − 12 > 0 si x = 3, un mı́nimo,
dx2 = 0 si x = 2, un punto de inflexión.

El punto C, en x = 2 en la Figura 4.8, es un ejemplo de un punto de inflexión, en el cual


dy2
el gradiente es un máximo o un mı́nimo, con 2 = 0. La pendiente de la curva decrece
dx
entre A y C y crece entre C y B, con valor mı́nimo en C. Este es un ejemplo de un punto
de inflexión sencillo con
dy dy2
= 0 y = 0.
dx dx2
dy dy2
Cuando en un punto = 0 y a la vez 2 = 0, la naturaleza del punto se determina
dx dx
mediante la primera derivada de orden superior no nula. Dos ejemplos son

dy d2 y d3 y
(i) = 0, = 0, = 0
dx dx2 dx3
(4.23)
(el sı́mbolo = significa ‘distinto de’). Esto es un punto de inflexión que es además un
punto estacionario (pero no un extremo), y es el caso comentado en el Ejemplo 4.13.

dy d2 y d3 y d4 y
(ii) = 0, = 0, = 0, = 0 .
dx dx2 dx3 dx4
(4.24)
Esto es un máximo o un mı́nimo, dependiendo del signo de la derivada cuarta. Por ejem-
plo, la función y = (x − 1)4 cumple (4.24), con un mı́nimo en x = 1.

EJEMPLO 4.13 Halle los puntos estacionarios de la función cuártica y = 3x4 − 4x3 + 1.
Para los puntos estacionarios,
dy
= 12x3 − 12x2 = 12x2 (x − 1)
dx
= 0 si x = 0 ó x = 1.

Para determinar el tipo de los puntos estacionarios,



d2 y = 0 si x = 0,
= 36x 2
− 24x
dx2 > 0 si x = 1, un mı́nimo.
Figura 4.9
Para determinar el tipo del punto estacionario en x = 0,

d3 y
= 72x − 24 = 0 si x = 0, un punto de inflexión.
dx3
96 Capı́tulo 4. Derivación

La función tiene por lo tanto un único extremo, un mı́nimo, en x = 1, cuando y = 0, y un punto de inflexión
en x = 0, cuando y = 1. De hecho, la función puede factorizarse

y = (x − 1)2 (3x2 + 2x + 1)

y tiene una raı́z doble, x = 1, y dos raı́ces complejas.

EJEMPLO 4.14 En la teorı́a de orbitales moleculares de Hückel, los valores posibles de las energı́as
orbitales de los electrones π del eteno (C2 H4 ) vienen dados por los valores estacionarios de la cantidad

 = α + 2c(1 − c2 )1/2 β
donde α y β son ‘parámetros de Hückel’ constantes, y c es una variable. Para los valores estacionarios de ,

d
= 2(1 − c2 )1/2 β − 2c2 (1 − c2 )−1/2 β = 0 .
dc

Dividiendo por 2β y multiplicando por (1 − c2 )1/2 tenemos

1
(1 − c2 ) − c2 = 0 , ó c = ±√ .
2

Por lo tanto
=α±β.

EJEMPLO 4.15 Ley de refracción de Snell4 en óptica geométrica

Figura 4.10

Un rayo de luz viaja entre los puntos P y Q cruzando una frontera entre dos fases en O. En la región superior,
la velocidad de la luz es v1 = c/η1 , siendo c la velocidad de la luz en el vacı́o y η1 el ı́ndice de refracción
de la fase. En la región inferior la velocidad de la luz es v2 = c/η2 . La ley de refracción de Snell es

04. Willebrord van Roijen Snell (1591-1626), matemático y fı́sico holandés, formuló la ley de refrac-
ción en 1621.
4.11. Movimientos lineal y angular 97

sen θ1 v1 η2
= = .
sen θ2 v2 η1

La ley puede deducirse de un ‘principio de tiempo mı́nimo’, de manera que el camino seguido es el de
menor tiempo.5 El tiempo total recorrido es (distancia/velocidad en cada fase),
r1 r2
t= + ,
v1 v2

donde
 1/2  1/2  1/2
r1 = x1 2 + y1 2 , r2 = x2 2 + y2 2 = (X − x1 )2 + y2 2 ,

Entonces
dt 1 dr1 1 dr2 1 x1 1 x2 sen θ1 sen θ2
= + = − = −
dx1 v1 dx1 v2 dx2 v1 r1 v2 r2 v1 v2
= 0 dando un mı́nimo.

De ahı́ la ley de Snell.

4.11. Movimientos lineal y angular


La descripción del movimiento de los cuerpos en el espacio es una aplicación impor-
tante del cálculo diferencial. Consideramos únicamente los dos tipos de movimiento más
sencillos: movimiento en lı́nea recta y movimiento en un cı́rculo. Otros tipos generales
de movimiento se tratan en el Capı́tulo 16.

Movimiento lineal

Figura 4.11

Sea un cuerpo que se mueve en una lı́nea recta, pongamos que en la dirección x. Sea O
un punto fijo y sea P la posición del cuerpo a tiempo t. La distancia OP = x es entonces
una función del tiempo: x = f (t).
Si el cuerpo se mueve del punto x al punto x + ∆x en el intervalo de tiempo ∆t,
entonces la tasa promedio de variación de x en el intervalo es

∆x
= velocidad media en el intervalo ∆t .
∆t

05. Este uso del principio de tiempo mı́nimo, propuesto por Fermat, fue uno de los ejemplos utilizados
por Leibniz en su comunicación de 1684 para ilustrar su método para hallar máximos y mı́nimos.
98 Capı́tulo 4. Derivación

El lı́mite de esto cuando ∆t → 0 es la tasa instantánea de variación de x con respecto a


t, y es la velocidad lineal o sencillamente la velocidad, en el instante t:

dx
velocidad = v = . (4.25)
dt
Cuando v es positivo, x crece y el cuerpo se mueve hacia la derecha. Cuando v es nega-
tivo, x decrece y el cuerpo se mueve hacia la izquierda. La velocidad es de hecho una
cantidad vectorial, con magnitud y dirección simultáneamente. Tratamos los vectores
en el Capı́tulo 16. La magnitud de la velocidad se llama, también, velocidad, o a veces
rapidez. La derivada de la velocidad es la aceleración,

dv d2 x
aceleración = = 2 . (4.26)
dt dt
Las derivadas con respecto al tiempo se escriben a menudo en ‘notación con puntos’:6

dx d2 x
v = ẋ = , v̇ = ẍ = . (4.27)
dt dt2

Movimiento angular
Sea un cuerpo que se mueve sobre el borde de un cı́rculo
de radio r. Sea O un punto fijo sobre el cı́rculo y suponga-
mos que la posición del cuerpo en el instante t viene dada
por el ángulo θ (Figura 4.12). La tasa de variación de θ con
respecto al tiempo se llama velocidad angular:

∆θ dθ
velocidad angular = ω = lim = = θ̇ . (4.28)
∆t→0 ∆t dt
Además, por estar la longitud de arco s relacionada con el Figura 4.12
ángulo subtendido por s = rθ, tenemos ṡ = rθ̇, o
v = rω , (4.29)

para la relación entre las velocidades lineal y angular en el movimiento circular (véase
el Capı́tulo 16 para un tratamiento más general de la velocidad por medio de vectores).
La aceleración angular es ω̇ = θ̈.

06. En su artı́culo de 1671 sobre el cálculo, Methodus fluxionum et serierum infinitorum, Newton
consideró que las variables, como x e y, eran cantidades que fluı́an, o fluentes, y escribió ẋ e ẏ para sus tasas
de variación, o fluxiones. Las fluxiones con puntos seguı́an usándose por los matemáticos ingleses cuando
George Peacock (1791-1858), John Herschel (1792-1871) y Charles Babbage (1792-1871), entonces estu-
diantes de Cambridge, fundaron la Analytical Society en 1813. Uno de los objetivos de la asociación era
promover ‘los principios del d-ismo puro frente a la Era del punto de la universidad’ (en inglés: dot-age,
pero también dotage, es decir, chocheo).
4.12. El diferencial 99

4.12. El diferencial
La derivada primera de una función y = f (x) se define por la ecuación (4.8) como
   
dy ∆y f (x + ∆x) − f (x)
= f  (x) = lim = lim (4,8)
dx ∆x→0 ∆x ∆x→0 ∆x

dy
y, como hemos recalcado antes, el sı́mbolo no significa la cantidad dy dividida por
dx
dx, sino que representa el valor del lı́mite. En ese sentido f  (x), o y , es una notación más
adecuada para la derivada. Resulta, sin embargo, tentador escribir

dy = f  (x) dx

y, si se interpreta correctamente, ésta es una manera útil de describir las variaciones.


Consideremos la función cúbica
dy
y = f (x) = x3 , = f  (x) = 3x2 .
dx
Sea ∆y la variación en y que acompaña la variación ∆x en x:

∆y = f (x + ∆x) − f (x)
= (x + ∆x)3 − x3
= 3x2 ∆x + 3x(∆x)2 + (∆x)3 .

dy
La derivada se obtiene dividiendo esta expresión por ∆x y tomando ∆x → 0. Otra
dx
manera de ver el lı́mite es considerar ∆x como una variación ‘muy pequeña’. Si ∆x
es suficientemente pequeño, entonces el término en (∆x)3 se hace mucho menor que el
término en (∆x)2 que, a su vez, es mucho menor que el término en ∆x,

(∆x)3  (∆x)2  ∆x .

Por ejemplo, ∆x = 10−3 , (∆x)2 = 10−6 y (∆x)3 = 10−9 . Una expresión aproximada
para el cambio en y es entonces

∆y ≈ 3x2 ∆x = f  (x)∆x

y ésta es a menudo una manera útil de aproximar pequeñas variaciones. La cantidad


f  (x)∆x serı́a la variación en y si ∆x fuese suficientemente pequeño. Resulta útil con-
siderar tales variaciones: una ‘variación infinitesimal’ (una variación arbitrariamente
pequeña) dx tal que los términos en (dx)2 y superiores pueden ser tomados como cero.
La correspondiente variación en y
100 Capı́tulo 4. Derivación

dy = f  (x) dx (4.30)

se denomina el diferencial de y.7


La utilización del diferencial se aclarará en capı́tulos posteriores. Resulta importante
en las ciencias fı́sicas porque los teoremas fundamentales se expresan algunas veces en
forma diferencial. En particular las leyes de la termodinámica casi siempre se expresan
mediante diferenciales.
EJEMPLO 4.16 Diferencial de área de un cı́rculo
El área de un cı́rculo como función del radio es

A(r) = πr2 .

Si el radio crece una cantidad ∆r, el correspondiente cambio en el área


es
∆A = π(r + ∆r)2 − πr2 = 2πr∆r + π(∆r)2
y este es el área de una corona circular de radio r y espesor ∆r. Cuando
∆r es suficientemente pequeño,

dA Figura 4.13
∆A ≈ 2πr∆r = ∆r .
dr
El ‘diferencial de área’ correspondiente es
dA = 2πr dr = circunferencia × ancho.

EJEMPLO 4.17 Forma diferencial de la Regla del Producto


Si y = uv, entonces la variación de y que acompaña variaciones en u y v es
∆y = (u + ∆u)(v + ∆v) − uv = u∆v + v∆u + (∆u)(∆v)
y la forma diferencial es:
dy = u dv + v du .
Si y, u y v son funciones de x, esta expresión es equivalente a la forma normal de la regla del producto.
‘Dividiendo por dx’ tenemos
dy dv du
=u +v .
dx dx dx

Una aplicación importante del diferencial es un procedimiento formal para cambiar la


variable independiente. Consideremos y = f (x) y su diferencial

dy = f  (x) dx . (4.31)

Supongamos que x es función de alguna otra variable, t, tal que x = g(t) con diferencial

dx = g (t) dt . (4.32)

07. Leibniz formuló el cálculo mediante diferenciales. Su artı́culo de 1684 contiene las fórmulas
dxn = nxn−1 dx, para la variación infinitesimal o diferencial de xn , y dxy = xdy + ydx para la regla del
producto (véase el Ejemplo 4.17).
4.13. Ejercicios 101

Sustituyendo esto en (4.31) obtenemos

dy = f  (x) dx = f  (x)g (t) dt

o bien
 
dy dx
dy = · dt . (4.33)
dx dt

Esto es el diferencial de y con respecto a la variable t. Dividir por dt nos da entonces la


Regla de la Cadena:

dy dy dx
= · . (4.34)
dt dx dt
Aunque hay dificultades conceptuales con este tipo de manipulaciones con diferencia-
les (infinitesimales o ‘variaciones infinitamente pequeñas’), se puede demostrar que las
operaciones con diferenciales son el duplicado de métodos más rigurosos que requieren
variaciones finitas (∆ en vez de d) y lı́mites.

4.13. Ejercicios
Apartado 4.3
Halle las discontinuidades de las siguientes funciones e indique cuáles son discontinuidades esenciales y
cuáles evitables. Esboce las curvas.
1 x2 (x2 − 9) 2x
1. 2. 3. 4.
x−1 x (x + 3) x2 − 3x
ex sen x cos x
5. 6. 7.
x x x
Apartado 4.4
Halle los lı́mites:
x+1 x+1 x−1
8. lim 9. lim 10. lim
x→0 x + 3 x→∞ x+3 x→1 x2 − 1
x−1 x2 − 1 x2 + 4
11. lim 12. lim 13. lim
x→∞ x2 − 1 x→∞ x + 1 x→−2 x + 2
   
14. lim ln x − ln 2x 15. lim ln (x − 4) − ln (3x + 2)
x→0 x→∞
 2x 
e −1

16. lim 17. lim |x| ln |x| 18. lim x3 e−x/2


x→0 x x→0 x→∞

Apartado 4.5
Derive a partir de primeros principios:
19. x3 20. 1 21. 8x + 3
22. 2x2 + 3x + 4 23. 2/x2
102 Capı́tulo 4. Derivación

Apartado 4.6
Derive usando la regla:

24. 2x3 − 4x2 25. 2x3/2 26. 3x1/3 27. 4x−1/2 28. 3/ x3
Regla de la cadena
√ 1
29. (1 + x)5 30. 2 + x2 31.
(3 − x2 )
3 2
32. 33. e−2x 34. e2x −3x+1
(2x2 − 3x − 1)1/2

35. ln (2x2 − 3x + 1) 36. sen 4x 37. tg 2x


38. cos (2x2 − 3x + 1) 39. esen x 40. ln (cos x)
 
− cos (3x2 +2) 2+x
41. e 42. ln 43. ln (sen 2x + sen2 x)
3−x
Productos y cocientes
44. 3x2 (2 + x)1/2 45. sen x cos 2x 46. tg 4x cos2 2x
2
+3 1 − x3 3x2
47. x2 e2x 48. 49.
2x + 5 (2 + x2 )1/2
Funciones inversas  
1−x
50. arcsen 2x 51. arctg x2 52. arccos
1+x
dy
53. Si x = 2y2 − 3y + 1, halle .
dx
dV
Halle para las siguientes ecuaciones de estado. Suponga que T y n son constantes.
dp
 
nB
54. pV = nRT 1 + 55. p(V − nb) − nRT = 0
V
 
n2 a
56. p + 2 (V − nb) = nRT
V

Apartado 4.7
dy
Halle :
dx
57. x 2 + y2 = 4 58. y3 + 3x + x2 − 1 = 0 59. x = y ln xy
2
60. y2 + − x2 y2 + 3x + 2 = 0
y

Apartado 4.8
Derive: 1/3
3−x (1 + x2 )(x − 1)1/2
61. 62.
4+x (2x + 1)(3x2 + 2x − 1)1/3
63. sen1/2 x cos3 (x2 + 1) tg1/3 2x
64. Demuestre que las ecuaciones d ln p ∆Hvap dp p∆Hvap
= y =
dT RT 2 dT RT 2
son expresiones equivalentes a la ecuación de Clausius-Clapeyron.
4.13. Ejercicios 103

Apartado 4.9
65. Halle todas las derivadas no nulas de la función y = 3x5 + 4x4 − 3x3 − x2 − 2x + 1.
dy d2 y d3 y d4 y
66. Halle , , , para la función y = ln x.
dx dx2 dx3 dx4
67. Halle la fórmula general para la derivada n-ésima de cos 2x.

Apartado 4.10
Halle los valores máximos y mı́nimos y los puntos de inflexión para las siguientes funciones. En cada caso
esboce la curva y muestre la posición de esos puntos.
68. y = x2 − 3x + 1 69. y = x3 − 7x2 + 15x − 9
70. y = 4x3 + 6x2 + 3 71. y = 2x5 − 5x4 + 3
72. El potencial de Lennard-Jones para la interacción de dos moléculas separadas una distancia R es
A B
U(R) = − 6
R12 r
donde A y B son constantes. La separación de equilibrio Re es aquel valor de R en el cual U(R) es mı́nimo
y la energı́a de enlace es De = −U(Re ).
Exprese (a) A y B en función de Re y De , y (b) U(R) en función de R, Re y De .
73. La probabilidad de que una molécula de masa m en un gas a temperatura T tenga velocidad v viene
dada por la distribución de Maxwell-Boltzmann
 m 3/2 2
f (v) = 4π v2 e−mv /2kT
2πkT
donde k es la constante de Boltzmann.
Halle la velocidad más probable (para la cual f (v) es máxima).
k k
74. La concentración de la especie B en el proceso cinético A −→ 1
B −→ 2
C, consistente en dos reacciones
irreversibles de primer orden, viene dado por (cuando k1 = k2 )
[A]0 k1  −k1 t 
[B] = e − e−k2 t
k2 − k1
(a) Halle el tiempo t, en función de las constantes cinéticas k1 y k2 , en el cual B tiene concentración máxima,
y (b) muestre que la concentración máxima es
 k2 /(k2 −k1 )
k2
[B]max = [A]0 .
k1

Apartado 4.11
75. Una partı́cula que se mueve sobre una lı́nea recta recorre la distancia s = 2t2 − 3t en el tiempo t.
Halle la velocidad y la aceleración en el tiempo t. Describa el movimiento.
76. Una partı́cula que se mueve sobre la circunferencia de un cı́rculo de radio r = 2 recorre la distancia
s = 2t3 − 3t2 − 2t en el tiempo t. Halle la velocidad y la aceleración angulares alrededor del centro del
cı́rculo. Describa el movimiento.

Apartado 4.12
Halle el diferencial dy:
77. y = 2x 78. y = 3x2 + 2x + 1 79. y = sen x
80. El volumen de una esfera de radio r es V = 4πr /3. Deduzca el diferencial dV a partir de primeros
3

principios. Dé una interpretación del resultado.


Integración

5.1. Conceptos

Consideremos un cuerpo que se mueve a lo largo de una curva, desde el punto A en


el instante de tiempo t = tA hasta el punto B en el instante t = tB . Sea s(t) la distancia
en un instante de tiempo intermedio t sobre la curva desde A, como se representa en la
Figura 5.1.

Figura 5.1

Si v(t) es la velocidad sobre la curva en el instante t entonces, siguiendo lo expuesto


en el Apartado 4.11, v(t) = ds/dt; esto es, la velocidad es el gradiente de la gráfica de
la función s(t). Por lo tanto, si s(t) es una función conocida, obtenemos v(t) mediante
derivación. Recı́procamente, si v(t) es una función conocida, entonces s(t) es aquella
función cuya derivada es v(t); esto es, para hallar s(t) necesitamos invertir la derivación
ds/dt = v.
La distancia recorrida entre dos puntos es igual a la velocidad media multiplicada por
el tiempo empleado; para el movimiento representado en la Figura 5.1, la distancia AB
sobre la curva es por lo tanto

d = v̄ × (tB − tA ) , (5.1)

siendo v̄ el valor promedio (o medio) de v(t) entre A y B. Por ejemplo, si el cuerpo sufre
una aceleración constante desde v = vA en A hasta v = vB en B, como se muestra en la
106 Capı́tulo 5. Integración

Figura 5.2,1 la velocidad media es v̄ = (vB + vA )/2 y la distancia total recorrida es

1
d = (vB + vA ) × (tB − tA ) .
2

Figura 5.2

Se verifica inmediatamente que esta distancia es igual al área, representada en gris en la


figura, limitada por la recta v(t) y el eje ‘t’ entre tA y tB . Veremos que este último resultado
es válido para cualquier función velocidad v(t). Veremos también que la solución de
un problema fı́sico es a menudo equivalente a hallar el área encerrada por una curva
apropiada.
Este ejemplo ilustra los dos problemas centrales de las matemáticas europeas del
siglo XVII: el ‘problema de las tangentes’ y el ‘problema de la cuadratura’. El primero
de ellos, hallar las lı́neas tangentes a una curva arbitraria, condujo a la invención del
cálculo diferencial, tema del Capı́tulo 4. El segundo, hallar el área encerrada por una
curva dada, condujo a la invención del cálculo integral.2 La demostración por Leibniz y

01. Esta gráfica de la velocidad como una función del tiempo para un cuerpo que se mueve con
aceleración uniforme apareció en Quaestiones super geometriam Euclides por Nicole Oresme (hacia 1323-
1382), deán de la Catedral de Rouen y Obispo de Lisieux. Fue posiblemente la primera gráfica de una
cantidad fı́sica variable. Oresme también consideró la extensión de su ‘latitud de formas’ para representar
la ‘cualidad’ de una superficie por un cuerpo en tres dimensiones y ‘la cualidad de un cuerpo sin duda se
representará por algo que tiene cuatro dimensiones en otro tipo de cantidad’.
02. La integración tiene sus orı́genes en el ‘método de exhaustación’ griego para hallar áreas y
volúmenes. Arquı́medes, en su Cuadratura de la parábola atribuye el método a Eudoxio de Cnido (ha-
cia 408-355 a.C.). En el Método, descubierto en Constantinopla en 1906 después de haber estado ‘perdido’
durante más de mil años, Arquı́medes describe cómo un área plana puede ser considerada como la suma
de segmentos rectilı́neos. En 1586, Stevin describe cómo el baricentro de un triángulo puede obtenerse
considerando el área como constituida por un número alto de paralelogramos. Johan Kepler (1571-1630),
más conocido por su Astronomı́a nova de 1609, calculó áreas y volúmenes considerándolos compuestos por
infinitos elementos infinitesimales. Su trabajo sobre volúmenes apareció en 1615 en la Nova stereometria
doliorum vinariorum (Nueva geometrı́a sólida de barricas de vino). Galileo Galilei (1564-1642) utilizó lo
infinitamente pequeño en su trabajo sobre dinámica. Bonaventura Cavalieri (1598-1647), un discı́pulo de
Galileo, describió en su influyente Geometria indivisibilibus continuorum, 1635, cómo un área puede ser
entendida como constituida por lı́neas o ‘indivisibles’ y un volumen por áreas, y desarrolló un método
geométrico para hallar la integral de xn para enteros positivos n. Por la misma época, Fermat resolvió el
mismo problema para enteros positivos y negativos (excepto n = −1) y para fracciones dividiendo sus
áreas en bandas rectangulares adecuadas. El caso n = −1 fue tratado por Gregoire de Saint Vincent (1584-
1667). Roberval integró la función seno en 1635, y Torricelli la función log en 1646. Otras contribuciones
se deben a Pascal, de cuyo Traité des sinus du quart de cercle de 1658 dijo Leibniz que le inspiró su des-
5.2. La integral indefinida 107

por Newton de que la derivación y la integración son esencialmente operaciones inversas


es uno de los hitos de la historia de las matemáticas. El concepto de integración como
operación inversa de la derivación conduce a la definición de la integral indefinida. El
concepto de la integral como un área conduce a la definición de la integral definida.

5.2. La integral indefinida


dy
Sea y = F(x) una función cuya derivada con respecto a x es F  (x) = . La integral
dx
indefinida de F  (x) con respecto a x se define como

F  (x) dx = F(x) + C , (5.2)

dy
donde C es una constante arbitraria. Por ejemplo, si y = x2 entonces = 2x, y la
dx
integral indefinida de la función 2x es

d 2
2x dx = x2 + C porque (x + C) = 2x .
dx

El sı́mbolo se llama signo de integración; es una ‘S’ (por suma) estirada y tiene su
origen en la formulación de Leibniz del cálculo integral. Su significado se hará patente
en el Apartado 5.4 cuando discutamos la integral como el lı́mite de una suma. La función
por integrar, F  (x) en (5.2), se llama el integrando, x es la variable de integración y
dx se denomina el elemento de x. C es una constante arbitraria llamada constante de
integración. Se incluye como parte de la integral indefinida porque, dada y = F(x) con
derivada F  (x), la función y + C también tiene por derivada F  (x)

d dy dC dy
(y + C) = + = . (5.3)
dx dx dx dx
La Tabla 5.1 es una corta lista de ‘integrales estándar’ que incumben a algunas de las
más importantes funciones elementales (compárese con la Tabla 4.2). Cada entrada en
la lista puede ser comprobada por derivación del segundo miembro de la ecuación. Por
ejemplo,

d a 1 1
[ ln (ax + b) + C] = y por lo tanto dx = ln (ax + b) + C .
dx ax + b ax + b a

cubrimiento del Teorema Fundamental; a John Wallis (1616-1703), cuyo trabajo sobre procesos infinitos
influyó en Newton y a quien debemos el sı́mbolo ∞; al escocés James Gregory (1638-1675), cuyo traba-
jo sobre series infinitas y el cálculo anticipó el de Newton; y a Barrow, cuyas clases Newton siguió y de
quien Leibniz compró una copia de sus Lectiones durante una visita a Londres en 1673. El paso final en
la sı́ntesis del cálculo diferencial e integral fue dado por Newton (nota al pie 3, capı́tulo 4) y por Leibniz,
quien publicó la primera memoria de su cálculo integral, Analisi indivisibilium atque infinitorum (Análisis
de indivisibles e infinitos), en 1686.
108 Capı́tulo 5. Integración

En el Capı́tulo 6 se discuten los métodos generales de integración y otras integrales


estándar. Una lista más completa de integrales estándar figura en el Apéndice.

Tabla 5.1 Integrales elementales


xa+1
xa dx = + C, para a = −1
a+1

1 1
dx = ln (ax + b) + C
ax + b a

1 ax
eax dx = e +C
a

1
sen ax dx = − cos ax + C
a

1
cos ax dx = sen ax + C
a

EJEMPLOS 5.1 Integrales indefinidas

 
dx x−1 1
1. = x−2 dx = +C =− +C
x2 −1 x
 
dx x1/2 √
2. √ = x−1/2 dx = + C = 2x1/2 + C = 2 x + C
x 1/2
 
3. dx = 1 dx = x + C

1
4. cos 2x dx = sen 2x + C
2

1 2x
5. e2x dx = e +C
2

1
6. dx = ln (x + 3) + C
x+3

1
Señalamos que si tomamos C = ln b en (vi), entonces dx = ln (x + 3) + ln b = ln b(x + 3).
x+3


En cada caso, el efecto de la operación . . . dx es invertir el efecto de la derivación; la
integral de la derivada de una función recobra la función. Además, derivando ambos
miembros en la ecuación (5.2) tenemos

d d  
F  (x) dx = F(x) + C = F  (x) (5.4)
dx dx

de manera que la derivada de la integral de una función recobra la función.


5.2. La integral indefinida 109

Una manera alternativa de describir la operación inversa de la derivación sin recurrir al simbolismo de
d
Leibniz, es utilizar el operador diferencial D = introducido en el apartado 4.2, con la propiedad
dx
DF(x) = F  (x) .
El efecto de D sobre F(x) es transformarlo en su derivada F  (x), y el operador inverso correspondiente D−1
se define con el efecto inverso al de D. Por lo tanto
D−1 F  (x) = F(x) + C
es la expresión con operadores de la ecuación (5.2). Los operadores D y D−1 tienen la propiedad
DD−1 = D−1 D = 1

que es cierta para cada par de operadores inversos.

Valor de la constante de integración


En un problema real el valor de la constante de integración C en (5.2) se determina
por alguna condición auxiliar. Consideremos, por ejemplo, una curva cuyo gradiente en
cada punto viene dado por la función 2x. La ecuación de tal curva es

y = 2x dx = x2 + C . (5.5)

Esta ecuación representa una familia de curvas, con una curva para cada valor de C
(Figura 5.3).

Figura 5.3

Si se precisa que la curva pase por un punto concreto, el punto (1, 2) por ejemplo, la
condición auxiliar sobre (5.5) es que y = 2 cuando x = 1; esto es, 2 = 1 + C, de manera
que C = 1. Entonces, y = x2 + 1 es la ecuación de la curva particular cuyo gradiente
viene dado por dy/dx = 2x y que pasa por el punto (1, 2).
En capı́tulos posteriores veremos cómo, en un problema fı́sico, el valor de la cons-
tante de integración se determina por la naturaleza y el estado del sistema.
110 Capı́tulo 5. Integración

Dos reglas
1 Para un múltiplo de una función:
 
a u(x) dx = a u(x) dx . (5.6)

2 Para una suma de funciones:


    
u(x) + v(x) dx = u(x) dx + v(x) dx . (5.7)

De estas reglas se deduce que la integral de una combinación lineal de funciones,

f (x) = a u(x) + b v(x) + c w(x) + · · · (5.8)

puede escribirse como la suma de integrales


   
f (x) dx = a u(x) dx + b v(x) dx + c w(x) dx + · · · (5.9)

EJEMPLO 5.2 Integral de una combinación lineal de funciones


     
3x3 + 2 sen 3x − e−x dx = 3 x3 dx + 2 sen 3x dx − e−x dx
   
x4 1 3 2
=3× + 2 × − cos 3x − −e−x + C = x4 − cos 3x + e−x + C .
4 3 4 3

5.3. La integral definida


El cálculo integral fue inventado para resolver el problema de hallar el área encerrada
por una curva dada. En este apartado introducimos, sin prueba, la integral definida como
una medida del área, y mostramos cuál es su relación con la integral indefinida. Para
muchos problemas en las ciencias fı́sicas, esta breve introducción es suficiente. Sin em-
bargo, otros problemas requieren un conocimiento más minucioso del cálculo integral,
y volveremos a él en el Apartado 5.4.
Sea y = f (x) una función de x, continua en el intervalo a ≤ x ≤ b. El área sombreada
de la Figura 5.4 se conoce como área bajo la curva; es el área encerrada por la gráfica
de y = f (x), el eje x, y las verticales en x = a y x = b. En general, esta área es igual al
ancho, (b − a), multiplicado por el promedio ȳ de la altura de la curva por encima del eje
(el promedio del valor de la función entre a y b),

A = (b − a)ȳ . (5.10)
5.3. La integral definida 111

Figura 5.4

En el caso especial de una función lineal, como en la Figura 5.5, la altura promedio es

1 
ȳ = f (a) + f (b)
2
y el área bajo la curva (lı́nea recta) es la de un rectángulo de ancho (b − a) y altura ȳ.

Figura 5.5

En el caso general, cuando y = f (x) no es necesariamente una función lineal, el cálculo


integral (véase el Apartado 5.4) nos dice que el área viene dada por la integral definida
 b

A= f (x) dx = F(b) − F(a) , (5.11)


a

donde F(x) es la función cuya derivada es f (x) = F  (x), y los números F(a) y F(b) son
los valores de F(x) en los lı́mites de la integración a y b; a se denomina lı́mite inferior,
b lı́mite superior, y el intervalo de a a b se llama intervalo de integración.   b
La diferencia F(b) − F(a) en la ecuación (5.11) se representa a menudo por F(x) ,
a
de manera que
 b  b
f (x) dx = F(x) = F(b) − F(a) . (5.12)
a a

De aquı́ se deduce que para calcular el valor de la integral definida, normalmente es


necesario evaluar primero la correspondiente integral indefinida. Por ejemplo, sea y =
112 Capı́tulo 5. Integración

f (x) = 2x + 3. La integral indefinida es


 
f (x) dx = (2x + 3) dx = x2 + 3x = F(x) .

Vemos que la constante arbitraria ha sido omitida de F(x) porque se cancela para el valor
de la integral definida. La integral indefinida de f (x) en el intervalo desde x = a hasta
x = b (‘la integral de a hasta b’) es entonces
 b  b
(2x + 3) dx = x2 + 3x = (b2 + 3b) − (a2 + 3a) .
a a

Si, por ejemplo, a = 1 y b = 4,


 4  4
(2x + 3) dx = x2 + 3x = (42 + 3 × 4) − (12 + 3 × 1) = 28 − 4 = 24 .
1 1

Esto es un ejemplo del caso especial de una función lineal, como en la Figura 5.5, de
manera que el valor de la integral puede obtenerse directamente como el área A =
= (b − a)ȳ con b − a = 4 − 1 = 3 y

1 1
ȳ = [f (1) + f (4)] = (5 + 11) = 8 .
2 2
Por lo tanto A = 3 × 8 = 24, como hemos visto.

EJEMPLOS 5.3 Integrales definidas

 3
3
x3 33 23 19
1. x2 dx = = − =
2 3 2 2 3 3

4    
4
dx −1 1 1 1 1 1
2. = = − − − =− + =
2 x2 x 2 4 2 4 2 4
 b  b
3. dx = x = b − a
a a
  π/2 
π/2
π  
4. sen θ dθ = – cos θ = – cos − – cos 0 = (0) − (– 1) = 1
0 0 2
 +1
+1    
−1 −2x −1 −2 −1 2 1 2 
5. e−2x dx = e = e − e = e − e−2
−1 2 −1 2 2 2
 3  3
dx 3
6. = ln x = ln 3 − ln 2 = ln
2 x 2 2
5.3. La integral definida 113

Valor medio de una función


Puesto que la integral definida se identifica como el área bajo la curva, se deduce de
(5.10) que el valor medio de la función y = f (x) en el intervalo a ≤ x ≤ b es
b
A f (x) dx
ȳ = = a
b . (5.13)
b−a dx
a

Por ejemplo, la integral (iv) de los Ejemplos 5.3 muestra que el valor medio de sen θ en
el intervalo 0 ≤ θ ≤ π/2 es
 π/2
1 2
sen θ = sen θ dθ = .
π/2 0 π

Tres propiedades de la integral definida


Sea f (x) = F  (x) de manera que, por la ecuación (5.11),
 b

f (x) dx = F(b) − F(a) .


a

1. El valor de la integral no depende del sı́mbolo utilizado para la variable de integración:


 b  b  b

f (x) dx = f (t) dt = f (u) du = · · · (5.14)


a a a

En cada caso el valor de la integral es F(b) − F(a).

2. Si c es otro lı́mite de integración, no necesariamente entre a y b:


 b  c  b

f (x) dx = f (x) dx + f (x) dx . (5.15)


a a c

Esto es cierto porque el valor de la integral puede escribirse como


   
F(b) − F(a) = F(c) − F(a) + F(b) − F(c) .

Si c está entre a y b entonces el área representada por la integral del primer miembro
de la ecuación (5.15) es igual a la suma de las áreas representadas por las integrales del
segundo miembro.

3. Cuando los lı́mites se intercambian, el valor de la integral cambia de signo:


 b  a

f (x) dx = − f (x) dx . (5.16)


a b
114 Capı́tulo 5. Integración
 
Esto se deduce porque F(a) − F(b) = − F(b) − F(a) .

Áreas negativas
Consideremos la integral
 2π  2π
sen x dx = – cos x = (– cos 2π) − (– cos 0) = (– 1) − (– 1) = 0 .
0 0

La Figura 5.6 muestra que el integrando, sen x, toma va-


lores positivos cuando 0 < x < π y negativos cuando
π < x < 2π. El ‘área bajo la curva’ total es la suma
de las dos áreas denotadas por A1 y A2 en la figura, y la
integral puede escribirse como
 2π

sen x dx = A1 + A2 ,
0

donde Figura 5.6


 π  2π

A1 = sen x dx = +2 y A2 = sen x dx = −2 .
0 π

Este ejemplo muestra que las áreas correspondientes a valores negativos de la integral
dan contribuciones negativas al total. En este caso las contribuciones positivas y negati-
vas se cancelan y el valor medio de sen a en el intervalo es cero.

Integración de funciones discontinuas


La función

2x si x<2
f (x) = 2x + 1 si x≥2

es discontinua en x = 2, pero la Figura 5.7 muestra que la función puede ser integrada
sobre la discontinuidad si el intervalo de integración es dividido en el punto de disconti-
nuidad. Por ejemplo,
8
 3  2  3
6
f (x) dx = f (x) dx + f (x) dx
1 1 2 4
 2  3 2
= 2x dx + (2x + 1) dx
1 2

= 3 + 6 = 9.
Figura 5.7
5.3. La integral definida 115

Esto siempre puede hacerse cuando el integrando tiene únicamente un número finito de
discontinuidades dentro del intervalo de integración.

Integrales impropias

Una integral definida se dice impropia cuando el integrando tiene una discontinuidad
infinita en un punto dentro del intervalo de integración. Si la discontinuidad es en el
punto x = c, siendo a ≤ c ≤ b, entonces la integral se define como el lı́mite
 b
 c−  b

f (x) dx = lim f (x) dx + f (x) dx . (5.17)
→0
a a c+

Como se muestra en la Figura 5.8, el punto c se excluye porque el integrando no está de-
finido allı́. Cuando el lı́mite en (5.17) es finito y único, el valor de la integral es el ‘área
bajo la curva’.

Figura 5.8

Si la discontinuidad queda en uno de los extremos del intervalo de integración, por ejem-
plo en x = a, la integral se define como
 b  b

f (x) dx = lim f (x) dx . (5.18)


→0
a a+


Por ejemplo, la función 1/ x no está definida en x = 0. La integral definida entre los
lı́mites x = 0 y x = 1 se define como
 1  1
dx dx
√ = lim √
0 x →0  x

y tenemos  
1
dx 1
1
√ = x−1/2 dx = 2x1/2  = 2 − 21/2 .
 x 

Por lo tanto, tomando  → 0,  1


dx
√ = 2.
0 x
116 Capı́tulo 5. Integración

Sin embargo, el lı́mite en (5.17) o en (5.18) no tiene por qué existir necesariamente.
Por ejemplo,
 1  1
dx
= lim ln x = lim(– ln )
0 x →0  →0

y el lı́mite no existe porque ln  → −∞ cuando  → 0. En el caso más general, al


integrar la inversa de una potencia,
 1
 
1    
dx 1 1 1 1
= lim = lim 1 − .
0 xa →0 1−a xa−1 
1−a →0 a−1

Si a < 1 el lı́mite tiene por valor 1/(1 − a), pero si a > 1 el lı́mite es infinito y la integral
no está definida.

Integrales infinitas
A menudo ocurre en aplicaciones en las ciencias fı́sicas que uno o ambos lı́mites de
integración son infinitos. Las integrales con intervalos de integración infinitos se denomi-
nan integrales infinitas. Si el lı́mite superior es infinito, la integral definida se considera
como
 ∞  b
f (x) dx = lim f (x) dx . (5.19)
b→∞
a a

Por ejemplo,
 ∞  b  b
e−r dr = lim e−r dr = lim −e−r
b→∞ b→∞ 0
0 0
 
= lim −e−b + 1 = 1 ,
b→∞

utilizando la propiedad de la exponencial que e−b → 0 cuando b → ∞. En la práctica


las integrales infinitas se tratan exactamente igual que las integrales ordinarias, pero
teniendo cuidado al asignar el valor infinito a la variable.

EJEMPLO 5.4 Halle el valor de la integral infinita


 ∞
dx
I= .
4 (x − 1)(x − 2)
El integrando puede escribirse mediante fracciones simples (véase el Apartado 2.6) como
1 1 1
= − .
(x − 1)(x − 2) (x − 2) (x − 1)
Entonces
 b  
b
1 1
I = lim − dx = lim ln (x − 2) − ln (x − 1)
b→∞ 4 (x − 2) (x − 1) b→∞
4
5.3. La integral definida 117

 
b  
x−2 b−2 2 3
= lim ln = lim ln − ln = ln ,
b→∞ x − 1 4 b→∞ b−1 3 2
porque (b − 2)/(b − 1) → 1 cuando b → ∞ y ln 1 = 0.

Cuando el lı́mite de la definición (5.19) es finito y único, se dice que la integral es con-
vergente. Una integral es divergente cuando el lı́mite es indeterminado. Por ejemplo,
 ∞  b
dx
= lim ln x = lim ln b
1 x b→∞ 1 b→∞

es divergente porque ln b → ∞ cuando b → ∞.

Un ejemplo más sutil es


 ∞  b
cos x dx = lim sen x = lim sen b .
b→∞ 0 b→∞
0

En este caso el valor de sen b oscila entre +1 y −1 al crecer b y no se puede asignar un


único valor a la integral tal y como está definida aquı́. Por otra parte, en el Ejemplo 6.13
se muestra que
 ∞
a
e−ax cos x dx = .
0 1 + a2

Este resultado es válido para todo valor positivo del parámetro a, por pequeño que sea,
y se deduce que
 ∞
lim e−ax cos x dx = 0
a→0
0

Hay que señalar que el lı́mite debe tomarse después de la integración; tomar el lı́mite
antes de la integración conduce a una integral diferente, y divergente.

Funciones pares e impares


Cuando una función tiene la propiedad

f (– x) = f (x) (5.20)

se dice que es una función par de x, tiene paridad par (o paridad +1) y es simétrica con
respecto al eje x = 0 (el eje y). Son funciones pares, por ejemplo, x2 , cos x (representada
en la Figura 5.9a), y exp −x2 . En cada caso el valor de la función no cambia al sustituir
x por −x. Por otra parte, de una función con la propiedad

f (– x) = −f (x) (5.21)
118 Capı́tulo 5. Integración

se dice que es una función impar, tiene paridad impar (o paridad −1) y es antisimétri-
ca con respecto al eje x = 0. Son funciones impares, por ejemplo, x3 , sen x (representada
en la Figura 5.9b), y x cos x. En cada caso el valor de la función cambia de signo al
sustituir x por −x.

Figura 5.9

El producto de dos funciones pares o de dos funciones impares es par. El producto de


una función par y una función impar es impar. Por lo tanto x cos x es una función impar,
con x impar y cos x par.
En general, una función arbitraria no es ni par ni impar, f (– x) = ±f (x). Sin embargo
siempre es posible representar una función como la suma de una componente par y de
otra impar. Podemos escribir

1  1 
f (x) = f (x) + f (– x) + f (x) − f (– x)
2 2 (5.22)
= f+ (x) + f− (x) ,

donde f+ (x) es la componente par de f (x) y f− (x) la componente impar. Por ejemplo, un
polinomio arbitrario

f (x) = a0 + a1 x + a2 x2 + · · · + an xn

puede escribirse como


   
f (x) = a0 + a2 x2 + a4 x4 + · · · + a1 x + a3 x3 + a5 x5 + · · ·

y, puesto que cada potencia par de x es una función par mientras que cada potencia impar
de x es una función impar, el primer conjunto de términos conforma la componente par
y el segundo conjunto conforma la componente impar. Las propiedades de integrales de
funciones con simetrı́a bien definida son de gran importancia en las ciencias fı́sicas. El
área representada por la integral
 +a

A= f (x) dx (5.23)
−a
5.4. El cálculo integral 119

es la suma de las áreas a la izquierda y a la derecha del eje x = 0:


 0  +a

A= f (x) dx + f (x) dx = A< + A> . (5.24)


−a 0

Si f (x) es una función par de x, las dos áreas A< y A> son iguales en magnitud y signo,
y el área total es dos veces cada una de ellas:
 +a  +a

A= f (x) dx = 2 f (x) dx , si f (x) par. (5.25)


−a 0

Por otra parte, si f (x) es una función impar de x, entonces A< y A> son iguales en mag-
nitud pero tiene signos opuestos, A> = −A< , y el valor de la integral es cero:
 +a

A= f (x) dx = 0 si f (x) impar. (5.26)


−a

En el caso general, cuando f (x) no tiene ninguna simetrı́a en particular, la integral es


igual a la integral de la componente par:
 +a  +a  +a  +a

f (x) dx = f+ (x) dx + f− (x) dx = 2 f+ (x) dx (5.27)


−a −a −a −a

El concepto de paridad o simetrı́a de las funciones es ampliamente utilizado en las cien-


cias fı́sicas. La correspondiente rama de las matemáticas se denomina teorı́a de grupos.
En quı́mica molecular, los grupos puntuales se utilizan para describir, por ejemplo, las
propiedades de simetrı́a de las funciones de onda moleculares y de los modos normales
de vibración de las moléculas, y se usan para explicar y predecir las transiciones permi-
tidas entre niveles de energı́a observadas en los espectros moleculares. En quı́mica del
estado sólido, los grupos espaciales describen las propiedades de simetrı́a de las redes y
la estructura del espectro de difracción de rayos X observado.

5.4. El cálculo integral


Sea y = f (x) una función de x continua en el intervalo a ≤ x ≤ b, como se representa
en la Figura 5.4. En el Apartado 5.3 postulamos que el ‘área bajo la curva’, la región
sombreada en la Figura 5.4, viene dada por el valor de la integral definida de f (x) desde
a hasta b. Ahora veremos cómo se establece este resultado.
Para obtener una estimación del área, dividimos el intervalo a hasta b en n subinter-
valos escogiendo n − 1 puntos arbitrarios en el eje x, con

a = x0 < x1 < x2 < · · · < xn−1 < b = xn (5.28)

y dividimos el área en n bandas mediante lı́neas verticales en esos puntos, como se


muestra en la Figura 5.10
120 Capı́tulo 5. Integración

Figura 5.10

Obtenemos una estimación del área al sustituir cada banda por un rectángulo. El ancho
de la banda r-ésima es ∆xr = xr − xr−1 y podemos escoger la altura yr del rectángulo
entre todos los valores de la función en esa banda. Entonces

n

A≈ yr ∆xr . (5.29)
r=1

En la Figura 5.10 se muestran dos maneras de escoger las alturas de los rectángulos. En
la Figura (a) la altura de cada rectángulo se escoge como el mayor valor de y = f (x) en
el subintervalo. A esta cantidad la llamamos yr (max) para la r-ésima banda. En la Figura
(b) la altura se escoge como el menor valor. A esta cantidad la llamamos yr (min) para la
r-ésima banda. Claramente, la primera elección da un valor que sobrestima el área bajo
la curva, mientras que la segunda elección da un valor que subestima dicha área:


n

n

yr ( min ) ∆xr < A < yr ( max ) ∆xr . (5.30)


r=1 r=1

Si disminuimos el ancho de cada banda incrementando el número de subdivisiones, los


valores yr (min) e yr (max) en cada banda se acercan entre sı́ (si la función es continua,
como se ha supuesto) y las dos sumas en (5.30) convergen al mismo lı́mite cuando el
número de bandas crece indefinidamente. Cuando n → ∞, cada suma converge al lı́mite
A, el área bajo la curva. Por lo tanto, independientemente de la elección de las alturas que
se tome en cada rectángulo y de cómo se hacen las divisiones de los intervalo, tenemos


n

A = lim yr ∆xr (5.31)


n→∞
r=1

o bien, puesto que podemos escoger yr = f (xr ),


n

A = lim f (xr ) ∆xr (todos los ∆xr → 0) . (5.32)


n→∞
r=1
5.4. El cálculo integral 121

Siguiendo la notación de Leibniz, este lı́mite se escribe como


 b 
n

f (x) dx = lim f (xr ) ∆xr (5.33)


n→∞
a r=1

y se llama integral definida de la función f (x) desde x = a hasta x = b.


Tomar el lı́mite de la suma de pequeñas cantidades es lo que caracteriza el cálculo
integral, igual que tomar el lı́mite del cociente de dos pequeñas cantidades es carac-
terı́stico del cálculo diferencial. El descubrimiento esencial, hecho independientemente
por Leibniz y por Newton, es que si F(x) es una función cuya derivada es f (x) = F  (x),
entonces
 b  b
f (x) dx = F  (x) dx = F(b) − F(a) . (5.34)
a a

Esta sı́ntesis de los cálculos diferencial e integral se llama teorema fundamental del
cálculo. La integral definida, como la hemos definido en este Apartado, se denomina
integral de Riemann.3 Al calcular el área encerrada por una curva no es ni esencial
ni siempre conveniente dividir el área en bandas lineales como hemos descrito antes.
Ilustramos este punto en el Ejemplo 5.5 con dos maneras de calcular el área de un cı́rculo.

EJEMPLO 5.5 Área de un cı́rculo


La ecuación del cı́rculo de radio a y centro en el origen de coordenadas es x2 + y2 = a2 .
Método 1. Sea A el área del cuarto de cı́rculo que está en el primer cuadrante, en el que x e y son ambas
positivas (Figura 5.11). Entonces

y = a2 − x2 para 0 ≤ x ≤ a.

Se divide el área en n bandas verticales como se describe en la deducción de la ecuación (5.33) más arriba.

Figura 5.11

03. Georg Friedrich Bernhard Riemann (1826-1866), profesor de matemáticas en Göttingen, contri-
buyó a la teorı́a de números, funciones de variable compleja y ecuaciones diferenciales. En su disertación de
1854 Über die Hypothesen welche der Geometrie zu Grunde liegen (Sobre las hipótesis en las que se basa
la geometrı́a), Riemann desarrolló un sistema de geometrı́a no euclı́dea e inició el estudio de los espacios
métricos curvos que acabarı́a conformando la base de las matemáticas de la teorı́a de la relatividad general.
122 Capı́tulo 5. Integración


Un valor aproximado del área de la banda entre x y x + ∆x es ∆A ≈ a2 − x2 ∆x y, por la ecuación (5.33),
el área total es  a
A= a2 − x2 dx .
0

La integral se evalúa en el Ejemplo 6.10. Su valor es πa2 /4, y el área del cı́rculo es cuatro veces esto.
Método 2. Se divide el área del cı́rculo en bandas circulares concéntricas como en la Figura 5.12. Dado que
la circunferencia de un cı́rculo de radio r es 2πr (véase el Ejemplo 5.6), el área de la banda entre r y r + ∆r
queda entre 2πr∆r y 2π(r + ∆r)∆r:

2πr∆r < ∆A < 2π(r + ∆r)∆r (5.35)


y, si ∆r es suficientemente pequeño, ∆A ≈ 2πr∆r. El área total es entonces
 a
A= 2πr dr = πa2 .
0

Figura 5.12

Señalamos que la integral indefinida puede entenderse como un caso especial de la inte-
gral definida (ecuación (5.34)) en el que el lı́mite superior de integración, b, se sustituye
por la variable x, y el lı́mite inferior a, y por lo tanto F(a), es una constante arbitraria:
  x
f (x) dx = f (x) dx = F(x) − F(a) = F(x) + C . (5.36)
a

Uso de diferenciales
Otra perspectiva conveniente, si bien menos rigurosa, de ver la integral definida como
un área, es utilizando el concepto de diferencial introducido en el Apartado 4.12. Este
enfoque se usa a menudo en textos elementales de cálculo, y se utiliza ampliamente en
la aplicación del cálculo a la formulación de los problemas fı́sicos.
Consideremos la expresión (5.35) presentada en el Ejemplo 5.5. Dividiendo por ∆r se
obtiene
∆A
2πr < < 2π(r + ∆r)
∆r
y, en el lı́mite ∆r → 0,

∆A dA
→ = 2πr .
∆r dr
5.4. El cálculo integral 123

La cantidad dA/dr es el coeficiente de variación del área A(r) del cı́rculo con respecto al
radio r. El diferencial correspondiente dA = 2πr dr es, en el lenguaje de diferenciales,
el área de una banda circular de radio r y ancho ‘infinitesimal’ dr; es un elemento de
área o diferencial de área. La ‘suma’ de estos elementos es la integral
 A  a

A= dA = 2πr dr .
0 0

La integral como longitud


Sea y = f (x) continua en el intervalo a ≤ x ≤ b, y sea s la longitud de su gráfica
desde el punto A, cuando x = a, hasta el punto B, cuando x = b (Figura 5.13).

Figura 5.13

Para calcular esta longitud dividimos el arco AB en segmentos de longitud ∆s. Entonces,
por el teorema de Pitágoras, un valor aproximado de la longitud del segmento entre x y
x + ∆x es
 1/2   ∆y 2 1/2
∆s ≈ (∆x)2 + (∆y)2 = 1+ ∆x .
∆x
El correspondiente elemento de longitud es
  dy 2 1/2
ds = 1 + dx (5.37)
dx
y la longitud total del arco AB es
 s  b  dy 2 1/2
s= ds = 1+ dx . (5.38)
0 a dx

EJEMPLO 5.6 Circunferencia de un cı́rculo


La ecuación de un cı́rculo de radio a y centro en el origen es x2 + y2 = a2 de manera que y = ±(a2 − x2 )1/2
y dy/dx = ∓x/(a2 − x2 )1/2 . Por lo tanto,
 2
dy x2 a2
1+ =1+ 2 = 2
dx a −x 2 a − x2
124 Capı́tulo 5. Integración

y la circunferencia del cı́rculo es


 a  dy 2 1/2  a
dx
s=4 1+ dx = 4a √
0 dx 0 a2− x2
(cuatro veces la longitud del cuarto en el primer cuadrante, véase el Ejemplo 5.5). Esta integral es una de
las integrales estándar presentes en la Tabla 6.3:
  x a  
s = 4a arcsen = 4a arcsen 1 − arcsen 0 .
a 0
Los valores principales del arco seno para 1 y para 0 son π/2 y 0, respectivamente. Por lo tanto s = 2πa.

5.5. Usos del cálculo integral


La presentación del Apartado 5.4 trataba del uso del cálculo integral para determinar
propiedades geométricas. En particular, el área de una figura plana y la longitud de una
curva en un plano. En los Capı́tulos 9 y 10 tratamos la generalización a curvas en tres
dimensiones, superficies curvas y volúmenes.
Vimos en el Apartado 5.3, ecuación (5.13), que la integral definida proporciona el
valor medio de una función. Si la función representa, por ejemplo, la distribución de
masa en un cuerpo fı́sico, el cálculo integral puede utilizarse para determinar propie-
dades estáticas del cuerpo, como la masa total, el centro de masas y los momentos de
inercia, mediante integrales definidas de la densidad de masa. Lo mismo ocurre para
una distribución de carga o para cualquier otra propiedad fı́sica de un sistema que se
halle distribuida en el espacio. En el Apartado 5.6 introducimos este uso del cálculo in-
tegral para determinar propiedades estáticas distribuidas a lo largo de una recta (el caso
unidimensional). El caso tridimensional se trata en el Capı́tulo 10. Estos mismos méto-
dos se emplean en el Capı́tulo 21 para el análisis de distribuciones de probabilidad en
estadı́stica.
En el Apartado 5.1 introdujimos el concepto de integral considerando el movimiento
de un cuerpo a lo largo de una recta. Por la primera ley del movimiento de Newton,
un cuerpo que se desplaza con una velocidad dada sigue moviéndose a lo largo de una
lı́nea recta con la misma velocidad si sobre el cuerpo no actúan fuerza exteriores: v =
constante mientras F = 0. Por otra parte, por la segunda ley de Newton, la aceleración,
o tasa de variación de la velocidad a = dv/dt, que experimenta un cuerpo de masa
m en presencia de una fuerza exterior F viene dada por F = ma. En el Apartado 5.7
presentamos el uso del cálculo integral para describir la dinámica de sistemas fı́sicos
con movimientos a lo largo de una lı́nea recta. El caso más general del movimiento en
dos y tres dimensiones se trata en el Capı́tulo 16. En el Apartado 5.8 comentamos la
aplicación al trabajo presión-volumen en termodinámica.
El uso más extendido del cálculo integral es para resolver (integrar) ecuaciones dife-
renciales, en particular las ecuaciones de la cinética quı́mica y de otros procesos cinéti-
cos, las ecuaciones del movimiento en mecánica clásica (deducidas de la segunda ley
de Newton, por ejemplo), y las ecuaciones del movimiento en mecánica cuántica (co-
mo la ecuación de Schrödinger). Esta utilización del cálculo integral la veremos en los
Capı́tulos 11 al 14.
5.6. Propiedades estáticas de la materia 125

5.6. Propiedades estáticas de la materia


Sea un conjunto de N masas discretas m1 , m2 , . . ., mN distribuidas sobre una lı́nea
recta (horizontal), con la masa mi situada en la posición xi con respecto a un punto fijo O
como en la Figura 5.14.

Figura 5.14

Este sistema de masas tiene las siguientes propiedades


N

(i) masa total: M= mi


i=1


N

(ii) primer momento de la masa con respecto a O: mi xi


i=1


N

(iii) segundo momento de la masa con respecto a O: mi xi2 (5.39)


i=1

y definiciones similares para todos los momentos superiores.


El primer momento de la masa, (ii), define el centro de masas. Si una posición X es
tal que


N

mi xi = MX, (5.40)
i=1

entonces X es la posición del centro de masas. El primer momento del sistema de masas
es por lo tanto igual al momento de la masa total concentrada en el centro de masas.

Figura 5.15

En presencia de gravedad, cada masa experimenta una fuerza Fi = mi g dirigida hacia


abajo (Figura 5.15). La constante fı́sica g = 9,8067 m s−2 se denomina ‘aceleración
estándar de la gravedad’, y la fuerza Fi = mi g que actúa sobre un cuerpo de masa mi es
lo que comúnmente llamamos el peso del cuerpo.
126 Capı́tulo 5. Integración

Multiplicando la ecuación (5.40) por g tenemos


N

T= Fi xi = MgX = FX , (5.41)
i=1


donde F = Fi es la fuerza total que actúa sobre el sistema de masas. Entonces la
posición
 X del centro de masas se llama, además, centro de gravedad, y la cantidad
T = Fi xi se llama momento de la fuerza o par de torsión del sistema de fuerzas con
respecto al punto O. Si las masas están sujetas a una barra rı́gida y uniforme (de masa
despreciable), el par de torsión es una medida de la tendencia de las fuerzas a hacer
girar el sistema en torno a O, y, por la ecuación (5.41), es igual al par producido por la
fuerza total F concentrada en el centro de masas. Si el punto O está en el centro de masas
(gravedad), entonces X = 0 y


N

T= Fi xi = 0 (5.42)
i=1

de manera que el par total con respecto al centro de masas es nulo.


El segundo momento de la masa, (iii), se denomina momento de inercia del sistema
de masas con respecto al punto O. Esta propiedad de la distribución de masa es la que
resulta importante para describir la dinámica de cuerpos en rotación.

EJEMPLO 5.7 Sistema de dos masas


La Figura 5.16 muestra dos cuerpos, de masas m1 y m2 , unidos por una barra rı́gida (de masa despreciable).

Figura 5.16

Las fuerzas F1 y F2 son los pesos de los cuerpos, y F es una fuerza de reacción que actúa sobre el pivote O.
Si el pivote está en el centro de masas, entonces (x1 = −r1 y x2 = r2 en la ecuación (5.42))

F1 r1 = F2 r2 (ley de la palanca)

y el conjunto está en equilibrio con respecto a giros en torno al pivote O. La fuerza vertical total que actúa
sobre el conjunto es F1 +F2 −F, de manera que el sistema está en equilibrio con respecto a desplazamientos
verticales si F = F1 + F2 .
El momento de inercia de las dos masas es I = m1 r12 + m2 r22 . Cuando O está en el centro de masas,
entonces X = 0 en (5.40) de manera que m1 r1 = m2 r2 y las distancias r1 y r2 pueden escribirse como
m2 r m1 r
r1 = , r2 = ,
m1 + m2 m1 + m2
siendo r = r1 + r2 la distancia entre las masas. El momento de inercia es entonces
m1 m 2 2
I = m1 r12 + m2 r22 = r = µr2 ,
m1 + m2
5.6. Propiedades estáticas de la materia 127

donde la cantidad µ = m1 m2 /(m1 + m2 ) se llama masa reducida del sistema de las dos masas. El momento
de inercia con respecto al centro de masas de un sistema de dos masas es por lo tanto el mismo que el
momento de inercia de una única masa µ situada a una distancia r del centro de masas.

El caso continuo
Sea una distribución de masa continua como una barra rectilı́nea de materia de lon-
gitud l (Figura 5.17).

Figura 5.17

Sea ∆m la masa del segmento desde x hasta x + ∆x, de manera que ∆m/∆x es la masa
por unidad de longitud en el segmento. Si la masa está distribuida por igual sobre la
longitud, entonces ∆m/∆x es independiente del segmento escogido y se llama densidad
(o, más correctamente, densidad lineal de masa) ρ del cuerpo y es una constante a lo
largo de toda la longitud. La masa total es entonces M = ρl. Si la masa de la barra no
está repartida por igual sobre su longitud entonces ∆m/∆x es la densidad promedio en
el segmento x a x + ∆x y su valor depende de la posición del segmento y de su longitud.
Cuando esa longitud se hace tender a cero, la proporción se acerca al lı́mite
 ∆m  dm
ρ(x) = lim = . (5.43)
∆x→0 ∆x dx
El valor de la función ρ(x) en un punto cualquiera es la densidad en ese punto, y la
cantidad diferencial dm = ρ(x)dx es la masa de un segmento dx en x. La masa total del
cuerpo es entonces
 M  l

M= dm = ρ(x) dx . (5.44)
0 0

Por lo tanto, cuando sustituimos una distribución discreta de masas por una distribu-
ción continua, las sumas del caso discreto se sustituyen por integrales. Ası́, la densidad
promedio es
l
M ρ(x) dx
ρ= = 0
l . (5.45)
l dx
0

La posición del centro de masas viene dada por (véase la ecuación 5.40)
 l
l
ρ(x)x dx
MX = ρ(x)x dx, o bien X = 0 l , (5.46)
0
0
ρ(x) dx
128 Capı́tulo 5. Integración

y el momento de inercia con respecto a un punto arbitrario x0 en la recta es


 l

I= ρ(x)(x − x0 )2 dx . (5.47)
0

Vemos que, por ejemplo, la masa total puede ser interpretada como el ‘área bajo la curva’
de la gráfica de la función de densidad ρ(x).

EJEMPLO 5.8 Halle la masa total, el centro de masas y el momento de inercia de una distribución lineal
de masa de longitud a y densidad ρ(x) = b(a − x), 0 ≤ x ≤ a.
La masa total es igual al área a2 b/2 del triángulo sombreado en la Figura
5.18. Por lo tanto
 a  a
a2 b
M= ρ(x) dx = b(a − x) dx = .
0 0 2
La posición del centro de masas es
 a  a
1 2 a
X= ρ(x)x dx = 2 (a − x)x dx = .
M 0 a 0 3

Figura 5.18

El momento de inerciamomento de inercia con respecto a un punto arbitrario x0 sobre la recta es


 l  a
ba2  2 
I= ρ(x)(x − x0 ) dx = b
2
(a − x)(x − x0 )2 dx = a − 4ax0 + 6x02 .
0 0 12
El valor de x0 par el cual I alcanza su valor mı́nimo viene dado por
dI ba2
=0= (−4a + 12x0 )
dx0 12
de manera que x0 = a/3. El momento de inercia por lo tanto tiene su valor mı́nimo cuando se calcula con
respecto al centro de masas. Este es un resultado general.

5.7. Dinámica
Velocidad y distancia
Consideremos, como en el Apartado 5.1, un cuerpo que se mueve sobre una curva
desde el punto A en el instante t = ta hasta el punto B en el instante t = tB , y sea
s(t) la distancia sobre la curva desde A en algún instante intermedio t. Siguiendo el
razonamiento del Apartado 4.11, la cantidad v(t) = ds/dt es la velocidad del cuerpo en
el instante t. La longitud diferencial ds = vdt es la distancia recorrida en el intervalo de
tiempo infinitesimal dt, y la distancia total recorrida es entonces
 s  tB

s= ds = v(t) dt . (5.48)
0 tA
5.7. Dinámica 129

EJEMPLO 5.9 Caı́da de un cuerpo bajo la acción de la gravedad


Un cuerpo de masa m que cae libremente bajo la acción de la gravedad experimenta una aceleración cons-
tante dv/dt = g (despreciando la resistencia del aire y otras fricciones). Entonces v(t) = gt + v(0), donde
v(0) es la velocidad en el instante t = 0. Si el cuerpo cae desde el reposo en t = 0, entonces v(t) = gt. La
distancia recorrida en el intervalo de tiempo desde tA hasta tB es entonces
 tB  tB
1  
s= v(t) dt = gt dt = g tb2 − tA2 .
tA tA 2

Por lo tanto, dado que g ≈ 9,8 m s−2 , la distancia recorrida en el primer segundo de caı́da es 4,9 m y en el
siguiente segundo es 4,9 (22 − 12 ) m = 14,7 m.

Fuerza y trabajo
Sea un cuerpo que se mueve en la dirección x entre los puntos A y B con velocidad v =
dx/dt. Si sobre el cuerpo actúa una fuerza F, entonces, por la segunda ley de Newton, la
aceleración a que experimenta el cuerpo viene dada por

d2 x
F = ma = m (5.49)
dt2
donde m es la masa del cuerpo. La aplicación de una fuerza sobre el cuerpo supone
un trabajo, y, si la fuerza es constante, entonces el trabajo efectuado es W = F(A−B)
(trabajo = fuerza × distancia).
Si la fuerza no es constante entre A y B, sino que es una función de la posición,
F = F(x), entonces el trabajo efectuado se obtiene mediante cálculo integral. El trabajo
efectuado sobre el cuerpo entre las posiciones x y x + ∆x es ∆W ≈ F(x)∆x. En el lı́mite
∆x → 0, el elemento de trabajo correspondiente es dW = F(x)dx y el trabajo total
efectuado es la integral
 W  B

W= dW = F(x) dx . (5.50)
0 A

EJEMPLO 5.10 Caı́da de un cuerpo bajo la acción de la gravedad


Un cuerpo de masa m que cae libremente bajo la acción de la gravedad experimenta una fuerza constante
F = mg dirigida hacia abajo. Ésta es la fuerza total que actúa sobre el cuerpo en ausencia de resistencia del
aire y de otras fuerzas de fricción. El trabajo efectuado por la gravedad sobre el cuerpo mientras cae una
altura h es por lo tanto
 h  h
W= F(x) dx = mg dx = mgh .
0 0
Este es también el trabajo que hay que efectuar contra la fuerza de la gravedad para elevar el cuerpo una
distancia h.
130 Capı́tulo 5. Integración

EJEMPLO 5.11 Trabajo electrostático


La fuerza que actúa entre dos cargas eléctricas q1 y q2 separadas una distancia x en el vacı́o viene dada por
la ley de Coulomb de la inversa del cuadrado
q1 q2
F(x) = ,
4π0 x2
donde  es la permitividad del vacı́o.* Cargas semejantes (cargas con el mismo signo, como dos núcleos
0
o dos electrones) se repelen, de manera que, en la figura 5.19

Figura 5.19

la fuerza que actúa sobre q2 debido a la presencia de q1 lo hace en la dirección positiva de x, alejándose
de q1 . Cargas opuestas (de signo opuesto, como las del protón y el electrón en el átomo de hidrógeno) se
atraen, y la fuerza sobre q2 está dirigida hacia q1 (en la Figura 5.19 F es negativa).
Sean dos cargas semejantes infinitamente separadas inicialmente. Puesto que las cargas se repelen, para
llevar q2 a una distancia x de q1 hay que efectuar trabajo sobre el sistema. Hay que aplicar una fuerza −F
para vencer la repulsión y el trabajo efectuado es
 x 
q1 q2 x dx q1 q2  1 x q1 q2
W=− F(x) dx = − 2
=− − = .
∞ 4π 0 ∞ x 4π 0 x ∞ 4π 0x

Este trabajo es positivo para cargas semejantes. La misma fórmula se aplica al caso de cargas opuestas, pero
entonces el trabajo es negativo.

Trabajo y energı́a
Si se efectúa un trabajo en un sistema mediante una fuerza externa, la energı́a del
sistema aumenta en una cantidad igual al valor del trabajo efectuado. Y al revés: si un
sistema efectúa trabajo contra una fuerza externa, la energı́a del sistema disminuye en
una cantidad igual al valor del trabajo efectuado. La energı́a de un sistema se expresa
generalmente como la suma de dos partes. Para un sistema sencillo, sin estructura in-
terna, esas partes son (i) la energı́a cinética, o energı́a de traslación, que proviene del
movimiento del sistema en el espacio, y (ii) la energı́a potencial, que proviene de la
posición del sistema en el espacio y de las fuerzas que actúan sobre el sistema en esa
posición. En el caso de un sistema con estructura interna, la energı́a cinética es la suma
de las energı́as cinéticas de las partes constitutivas, y la energı́a potencial es la suma de
las energı́as potenciales de las partes.

(i) Energı́a cinética El trabajo efectuado sobre un cuerpo por una fuerza externa F(x)
cuando el cuerpo se mueve del punto A al punto B es
 B  B
dv
Wab = F(x) dx = m dx . (5.51)
A A dt

0* La presencia del factor 4π0 asegura que la fuerza que actúa entre dos cargas de un culombio
separadas entre sı́ un metro es un newton: N = C2 /4π0 m2 en unidades del SI.
5.7. Dinámica 131

Como v = dx/dt, el elemento de longitud dx puede sustituirse por el diferencial v dt, de


manera que
 B  B
dv 1 d 2
Wab = m v dt = m (v ) dt , (5.52)
A dt 2 A dt

donde hemos usado que d(v2 )/dt = 2v dv/dt, y los lı́mites de integración se refieren a
los tiempos en A y en B. Deducimos que el trabajo hecho entre A y B es

1
Wab = m (v2B − v2A ) , (5.53)
2
siendo vA y vB las velocidades del cuerpo en A y en B, respectivamente. La cantidad
1
2
mv2 se llama energı́a cinética del cuerpo y se representa habitualmente por el sı́mbolo
T. El trabajo efectuado sobre el cuerpo es, por lo tanto, igual a la variación de la energı́a
cinética:

Wab = TB − TA . (5.54)

Vemos que la energı́a cinética de un cuerpo en reposo se define como igual a cero.

(ii) Energı́a potencial y energı́a total Sea una fuerza que actúa sobre un cuerpo y que
sólo depende de la posición de éste, de manera que F = F(x). Esta condición excluye
fuerzas que dependen del tiempo y, más importante, fuerzas disipativas como las debidas
a la fricción. Entonces, por el teorema fundamental del cálculo (ecuación (5.34)), existe
una función f (x) tal que F(x) = f  (x) y
 B

Wab = F(x) dx = f (A) − f (B) . (5.55)


A

El trabajo efectuado entre A y B puede por lo tanto expresarse como la variación de una
cantidad que depende únicamente de los puntos extremos A y B, y no del camino desde
A hasta B . Esta cantidad se representa normalmente por −V, y V se denomina energı́a
potencial del cuerpo. El trabajo de A hasta B es por lo tanto
 B

Wab = F(x) dx = VA − VB , (5.56)


A

donde VA y VB son los valores de la energı́a potencial en A y B. Cuando el trabajo efec-


tuado por una fuerza es independiente del camino, se dice que la fuerza es una fuerza
conservativa y es (–) la derivada de la (función) energı́a potencial:

dV
F(x) = − , V(x) = − F(x) dx + C . (5.57)
dx
132 Capı́tulo 5. Integración

Tres tipos sencillos pero importantes de fuerzas conservativas, y sus respectivas energı́as
potenciales, son

(a) F = constante, V(x) = −Fx + C , (5.58)


1
(b) F = −kx , V(x) = kx2 + C , (5.59)
2
1
(c) F = − 12 , V(x) = − + C , (5.60)
x x
siendo C una constante arbitraria. Las gráficas de V(x), para C = 0, aparecen dibujadas
en la Figura 5.20.

Figura 5.20

En cada caso, el gradiente de la gráfica es dV/dx = −F, de manera que la fuerza actúa
en la dirección de energı́a potencial decreciente.
Vemos que, mientras que la energı́a cinética tiene un valor absoluto bien definido,
eso no ocurre con la energı́a potencial, para la cual las ecuaciones (5.56) y (5.57) sólo
definen valores relativos. Los ejemplos 5.12 y 5.13 más abajo, muestran cómo se escoge
el cero de la energı́a potencial en dos situaciones fı́sicas diferentes.
Un sistema en el cual todas las fuerzas son conservativas se llama sistema conserva-
tivo. En un sistema ası́, el trabajo efectuado al mover un cuerpo alrededor de un bucle
cerrado A→B→A es cero:

Waba = Wab Wba = (VA − Vb ) − (VB − VA ) = 0 . (5.61)

Las fuerzas disipativas, como las debidas a la fricción, no son fuerzas conservativas
porque el trabajo efectuado contra la fricción siempre es positivo.
Combinando las expresiones (5.54) y (5.56) obtenemos el resultado

TA + VA = TB + VB (5.62)

y se deduce que, en un sistema conservativo, la cantidad T +V es constante. Esta cantidad


se llama energı́a total del sistema, E = T + V, y (5.62) es una expresión del principio
de conservación de la energı́a.
5.8. Trabajo presión-volumen 133

EJEMPLO 5.12 Movimiento de un cuerpo bajo la acción de la gravedad


Sea un cuerpo de masa m situado a una altura h por encima de una superficie horizontal, como en
la Figura 5.21. La fuerza de la gravedad que actúa sobre el cuerpo es
F = −mg (negativa porque la fuerza se ejerce en la dirección negativa
de x) y el trabajo efectuado sobre el cuerpo a medida que cae libremente
desde la altura h hasta la superficie en x = 0 es
 0  0
W= F dx = −mg dx = mgh .
h h

Este trabajo es el cambio en la energı́a potencial

W = mgh = V(h) − V(0) ,


Figura 5.21

donde V(x) es la energı́a potencial del cuerpo en la altura x. La elección natural del cero de la energı́a
potencial en este ejemplo es V(0) = 0, cero en la superficie. Entonces, V(x) = mgx es la energı́a potencial
del cuerpo en la altura x, y la fuerza está relacionada con ella por F = −dV/dx = −mg.
Supongamos que el cuerpo parte en reposo desde x = h y sea T(x) la energı́a cinética en la altura x.
Entonces T(h) = 0 y, por la ecuación (5.54), la energı́a cinética del cuerpo cuando alcanza la superficie es
T(0) = mgh. Además, al ser la fuerza (una constante) conservativa, la energı́a total del cuerpo se conserva y
es igual a E = mgh, que es la energı́a potencial en x = h (donde la energı́a cinética es nula) y es la energı́a
cinética en x = 0 (donde la energı́a potencial es nula). En una altura intermedia, E = mgh = T(x) + V(x) y
la energı́a cinética es
1
T(x) = mv2 = mg(h − x) . (5.63)
2
Si tanto el cuerpo como la superficie son totalmente elásticos, la velocidad del cuerpo se invierte en contacto
con la superficie, y el cuerpo retorna a su altura original en x = h invirtiendo exactamente el movimiento
de caı́da. Ası́, despejando la velocidad de la ecuación (5.63), tenemos

v = ± 2g(h − x) .

La velocidad del cuerpo es negativa cuando cae y positiva cuando sube. En ausencia de fuerzas disipativas
el movimiento de rebote se repite indefinidamente.

EJEMPLO 5.13 Energı́a potencial electrostática


Según el Ejemplo 5.11, el trabajo que debe efectuarse contra la fuerza interna para traer dos cargas desde
una separación infinita a una separación x es W = q1 q2 /4π0 x. Esto es lo mismo que el trabajo efectuado
por la fuerza interna al separar las cargas:
 ∞
q1 q2
W= F(x) dx = .
x 4π0 x
La fuerza depende sólo de las posiciones relativas de las cargas y es conservativa, de manera que existe
una función energı́a potencial V(x) tal que F(x) = −dV/dx y W = V(x) − V(∞). Es convencional, y
conveniente, tomar el cero de energı́a potencial de las partı́culas en interacción de manera que sea cero para
una separación infinita: V(∞) = 0. Entonces
q1 q2
V(x) =
4π0 x
es la energı́a potencial electrostática del sistema de dos cargas.
134 Capı́tulo 5. Integración

5.8. Trabajo presión-volumen


Consideremos un fluido (un gas o un lı́quido) encerrado en un recipiente cilı́ndrico
uniforme, cerrado en un extremo y provisto de un pistón como se muestra en la Figura
5.22. Sea A el área de la sección transversal interna del cilindro.

Figura 5.22

Un fluido con presión interna p ejerce una fuerza de magnitud |F| = pA sobre la super-
ficie del pistón, y el pistón se mueve hacia adentro o afuera según sea la presión externa
pext mayor o menor que p. Si pext > p el fluido se comprime y el trabajo efectuado por la
fuerza externa Fext al mover el pistón desde a hasta b es
 b

Wab = Fext dx . (5.64)


a

En este caso la fuerza externa tiene magnitud |Fext | = pext A y una longitud del cilindro
|dx| contiene un volumen |dV| = A|dx|. El trabajo puede por lo tanto expresarse en
forma ‘presión-volumen’ como
 b

Wab = − pext dV , (5.65)


a

donde los lı́mites de integración se refieren ahora al volumen, y el signo negativo se in-
cluye para hacer que el trabajo de compresión sea positivo. Puede demostrarse que esta
expresión del trabajo mecánico efectuado sobre un sistema termodinámico es indepen-
diente de la forma del recipiente.
Para comprimir el fluido es necesario que la presión externa sea mayor que la presión
interna del fluido. Sea pext = (p + ∆p), siendo ∆p una sobrepresión positiva que, por
sencillez, suponemos que es constante durante toda la compresión. Entonces, siendo
Va > Vb ,
 b  b  b

Wab = − p dV − ∆p dV = − p dV − ∆p (Va − Vb )
a b a a
(5.66)
>− p dV .
a
5.9. Ejercicios 135

Y al revés: para permitir al fluido expandirse desde Vb hasta Va , es necesario que la


presión externa sea menor que la presión interna. Si pext = (p − ∆p), entonces
 a
Wba = − p dV + ∆p (Va − Vb )
 a
b
(5.67)
>− p dV .
b

El trabajo total efectuado sobre el fluido en el ciclo a → b → a es por lo tanto

Waba = Wab + Wba = 2∆p (Va − Vb ) > 0 (5.68)

y se dice que el proceso es irreversible. Esto es análogo al caso en dinámica ordinaria


cuando hay presentes fuerzas disipativas no conservativas. El proceso puede hacerse
reversible únicamente haciendo que el exceso de presión, ∆p en nuestro ejemplo, tienda
a cero. En ese lı́mite (ideal) el trabajo es reversible y
 b

Wab = −Wba = − p dV . (5.69)


a

Expansión de un gas

La ecuación de estado de un gas es una relación de la forma f (p, V, T) = 0 entre las


tres cantidades termodinámicas p, V y T (para una cantidad de gas dada). Por ejemplo,
la ecuación de estado de los gases perfectos puede escribirse como pV − nRT = 0. Hay
por lo tanto cierta libertad en la elección de las condiciones en las cuales puede darse la
expansión de un gas.

expansión isobárica La expansión de un gas puede ocurrir a presión constante. Por


ejemplo, el gas puede calentarse para que se expanda contra una presión externa cons-
tante, como la presión atmosférica. El trabajo reversible efectuado por el gas contra la
presión externa es entonces
 b  b

W= p dV = p dV = p (Vb − Va ) . (5.70)
a a

expansión isoterma La expansión de un gas puede ocurrir a temperatura constante. Por


ejemplo, si la expansión se realiza con el recipiente inmerso en un baño térmico a una
temperatura dada. Para calcular el trabajo es necesario conocer la ecuación de estado.
Para un gas perfecto, p = nRT/V, y el trabajo (reversible) es
 b  b
dV Vb
W= p dV = nRT = nRT ln . (5.71)
a a V Va
136 Capı́tulo 5. Integración

5.9. Ejercicios
Apartado 5.2
Evalúe las integrales indefinidas:
 
3x2 + 2x + 1
1. 2 dx 2. (2x3 + 2x + 3) dx 3. dx
   x2 
4. x2/3 dx 5. x−1/3 dx 6. e3x dx 7. 3e−2x dx
  
dx dx
8. sen 4x dx 9. 10.
x−1 3−x

11. Halle y = (x2 + 3) dx tal que y = 0 cuando x = 3.

Apartado 5.3
Evalúe las integrales definidas:
 5  2  3  5  π
du dv
12. dx 13. 14. 15. e−3t dt 16. cos 3θ dθ
3 1 u
3
2 v+2 1 1
 0  +3
x2 + 2 si x < 1
17. sen 2x dx 18. f (x) dx donde f (x) =
−π/4 −1 x2 si x ≥ 1
 1  ∞  1  1
dx dx dx
19. √ 20. e−3t dt 21. 22.
0
3
x 0 0 x(x − 1) 0 (x − 2)(2x − 3)
23. La ecuación de Clausius-Clapeyron para el equilibrio lı́quido-vapor es
d ln p ∆Hvap 2
= T .
dT R
Si la entalpı́a de vaporización ∆Hvap es constante en el intervalo de temperaturas desde T1 a T2 , demuestre,
integrando ambos miembros de la ecuación, que
   
p1 ∆Hvap 1 1
ln =− − .
p2 R T1 T2
RTZ
24. El coeficiente de fugacidad γ de un gas cuya ecuación de estado es p = , donde Vm es el volumen
Vm
molar y Z es el factor de compresión, viene dada por
 p 
Z−1
ln γ = dp .
0 p

Para la ecuación de estado p(Vm − b) = RT,


bp
(i) demuestre que Z = 1 + , (ii) halle γ como función de p y de T.
RT
25. Halle el valor promedio de la función y = x2 en el intervalo 0 ≤ x ≤ 2.
26. Para cada una de las siguientes funciones, estudie si es una función par de x, impar o ninguna de las
dos cosas. En ese último caso, halle las componentes par e impar.
(i) sen 2x (ii) cos 3x (iii) sen2 2x (iv) sen x cos x (v) x
−x x2
(vi) x 4
(vii) 3x + 2x + 1
2
(viii) e (ix) e
5.9. Ejercicios 137

Apartado 5.6
27. Para un sistema de N masas discretas mi situadas en las posiciones xi , i = 1, 2, . . . , N, sobre una lı́nea
recta, halle la expresión del momento de inercia con respecto a un punto x0 arbitrario de la recta. Demuestre
que el momento de inercia toma el valor más pequeño posible cuando x0 está en el centro de masas.
28. Tres masas m1 , m2 y m3 , están situadas en una recta con m1 en x1 = −4, m2 en x2 = −1 y m3 en
x3 = 4, con respecto a un punto O de la recta.
Calcule (i) la posición del centro de masas, (ii) el momento de inercia con respecto a O, y (iii) el
momento de inercia con respecto al centro de masas.

29. La distribución de masa en una barra recta de longitud l viene dada por la función de densidad
ρ(x) = x2 , 0 ≤ x ≤ l. Halle: (i) la masa total, (ii) la densidad media, (iii) el centro de masas, y (iv) el
momento de inercia con respecto al centro de masas.

Apartado 5.7
30. Un cuerpo se mueve en lı́nea recta con velocidad v = 3t2 en el instante t. Calcule la distancia recorrida
en el intervalo de tiempo desde t = 1 hasta t = 2.
31. Un cuerpo de masa m se mueve en lı́nea recta (en la dirección x) bajo la acción de una fuerza F = kx,
donde k es positiva. Si el cuerpo parte inicialmente del reposo en la posición x = 1, halle las siguientes
cantidades en función de x: (i) el trabajo efectuado sobre el cuerpo, (ii) la energı́a cinética del cuerpo, (iii)
la velocidad, (iv) la variación de la energı́a potencial, y (v) la variación de la energı́a total.
Dibuje la gráfica de la función energı́a potencial. (vi) ¿Cuál serı́a el movimiento del cuerpo si estuviera
inicialmente en reposo en x = 0?

Apartado 5.8
32. Un gas ligeramente imperfecto obedece la ecuación de estado de van der Waals
 
n2 a
p + 2 (V − nb) = nRT .
V

Halle las expresiones para el trabajo efectuado por el gas al expandirse reversiblemente desde un volumen
V1 hasta un volumen V2 (i) a presión constante, y (ii) a temperatura constante.
Métodos de integración

6.1. Conceptos
Para calcular el valor de una integral definida es necesario normalmente evaluar la
correspondiente integral indefinida. Esto es, dada

f (x) dx = F(x) + C

necesitamos hallar la función F(x) cuya derivada es f (x) = F  (x). Vimos en el Apartado
4.6 que toda función continua puede ser derivada aplicando unas pocas reglas. Cada
una de esas reglas, invirtiéndola, proporciona en principio una regla de integración. En
particular, la regla de la cadena y la regla del producto proporcionan, al invertirlas, los
dos métodos principales para calcular integrales: el método de sustitución (Apartado
6.3) y la integración por partes (Apartado 6.4).
El objeto de esos métodos generales de integración, y de otros particulares presenta-
dos en los apartados que siguen, es reducir una integral dada a forma estándar. Esto es,
transformarla en una integral cuyo valor aparece en una tabla de integrales estándar.
Una integral estándar es sencillamente una integral cuyo valor se conoce y cuya forma
puede usarse para evaluar otras integrales ‘no estándar’. Las integrales estándar más ele-
mentales se dan en la Tabla 5.1, y una lista más amplia se da en el Apéndice. Se han
publicado extensas listas de integrales estándar, y nuestro propósito en este capı́tulo es
mostrar cómo se obtienen (algunas de) esas integrales estándar y, lo más importante,
cómo reducir otras a forma estándar. Hay que recordar, sin embargo, que hay muchas
funciones cuyas integrales no pueden expresarse mediante un número finito de funcio-
nes elementales. En esos casos, los métodos numéricos dan valores aproximados. Con la
evolución de las máquinas de cálculo, los métodos numéricos de integración (cuadratu-
ras numéricas) se han hecho rutinarios y precisos, y algunos de los métodos numéricos
más sencillos se presentan en el Capı́tulo 20.
Consideramos primero el uso de relaciones trigonométricas (Apartado 3.2) para la
integración de algunas funciones trigonométricas.
140 Capı́tulo 6. Métodos de integración

6.2. El uso de relaciones trigonométricas


Tabla 6.1

1 
1. cos2 ax dx = ax + sen ax cos ax + C
2a

1 
2. sen2 ax dx = ax − sen ax cos ax + C
2a

1
3. sen ax cos ax dx = sen2 ax + C
2a

Para a = b:
  
1 sen (a − b)x sen (a + b)x
4. sen ax sen bx dx = − +C
2a a−b a+b
  
1 sen (a − b)x sen (a + b)x
5. cos ax cos bx dx = + +C
2a a−b a+b
  
1 cos (a − b)x cos (a + b)x
6. sen ax cos bx dx = + +C
2a a−b a+b

La Tabla 6.1 contiene un número de integrales que pueden evaluarse haciendo uso de
las relaciones trigonométricas (3.17) a (3.22) presentadas en el Apartado 3.2. Las formas
útiles de esas relaciones son
1 
cos2 x = 1 + cos 2x , (6.1)
2
1  
sen2 x = 1 − cos 2x , (6.2)
2
1
sen x cos x = sen 2x , (6.3)
2
1 
sen x sen y = cos (x − y) − cos (x + y) , (6.4)
2
1  
cos x cos y = cos (x − y) + cos (x + y) , (6.5)
2
1 
sen x cos y = sen (x − y) + sen (x + y) . (6.6)
2
Más generalmente, las relaciones pueden usarse para expresar una función senm x cosn x,
con m y n enteros positivos, mediante senos y cosenos sencillos, pero si m o n son
mayores que 2, otros métodos alternativos son a menudo más sencillos.

EJEMPLOS 6.1 Las integrales de la Tabla 3.1



Integral 1: cos2 2x dx.
6.3. El método de sustitución 141

1
Por la ecuación (6.1), cos2 2x = (1 + cos 4x). Por lo tanto
2
 
1 1 1 1
cos2 2x dx = (1 + cos 4x)dx = [x + sen 4x] + C = [2x + sen 2x cos 2x] + C .
2 2 4 4

Integral 3: sen 2x cos 2x dx.
1
Por la ecuación (6.3), sen 2x cos 2x = sen 4x. Por lo tanto
2
 
1 1
sen 2x cos 2x dx = sen 4x dx = − cos 4x + C
2 8
1 1 1 1
= − (1 − 2 sen 2x) + C = sen2 2x + C − = sen2 2x + C ,
2
8 4 8 4
siendo C una nueva constante arbitraria. La mayorı́a de las tablas de integrales indefinidas omiten la cons-
tante arbitraria, y este ejemplo muestra por qué diferentes tablas dan a veces resultados aparentemente
diferentes para integrales indefinidas.

Integral 4: sen 2x sen 4x dx.
1  1 
Por la ecuación (6.4), sen 2x sen 4x = cos (– 2x) − cos 6x = cos 2x − cos 6x . Por lo tanto
2 2
     
1 1 sen 2x sen 6x
sen 2x sen 4x dx = cos 2x − cos 6x dx = − +C.
2 2 2 6

6.3. El método de sustitución


El polinomio

f (x) = (2x − 1)3

puede integrarse desarrollando primero el cubo y luego integrando término a término


(véase la parte correspondiente a la regla de la cadena en el Apartado 4.6):

f (x) = (2x − 1)3 = 8x3 − 12x2 + 6x − 1


    
(2x − 1)3 dx = 8 x3 dx − 12 x2 dx + 6 x dx − dx

= 2x4 − 4x3 + 3x2 − x + C


1
= (2x − 1)4 + C
8
(C = C − 1/8 es una constante arbitraria).
Una manera más sencilla de integrar la función es hacer la sustitución

du
u = 2x − 1 , du = dx = 2 dx ,
dx
142 Capı́tulo 6. Métodos de integración

donde du es el diferencial de u(x). Entonces, dx = 12 du y


 
1 1 1
(2x − 1) dx =
3
u3 du = u4 + C = (2x − 1)4 + C .
2 8 8

Hemos transformado la integral en una ‘integral estándar’ cambiando la variable de inte-


gración de x a u. El método de sustitución también se denomina integración mediante
cambio de variable.
En el caso general, dada la integral de una función f (x) cuya forma no es estándar, el
método de sustitución busca una nueva variable tal que
 
f (x) dx = g(u) du (6.7)

donde la integral a la derecha es una integral estándar, esto es, g(u) es más fácil de inte-
grar que f (x). Derivando ambos lados de (6.7) con respecto a x tenemos:

a la izquierda, por la definición de la integral indefinida,


 
d
f (x) dx = f (x) ,
dx

a la derecha, aplicando la regla de la cadena,


   
d d du du
g(u) du = g(u) du × = g(u) .
dx du dx dx

Por lo tanto
du
f (x) = g(u) (6.8)
dx
y, sustituyendo en (6.7),
  
du
f (x) dx = g(u) dx = g(u) du . (6.9)
dx

La habilidad fundamental para poder aplicar el método de sustitución es la capacidad de


reconocer cuándo un integrando puede escribirse en la forma (6.8). La transformación
de la integral se hace entonces con el cambio

du
u = u(x), du = dx , (6.10)
dx
dx
o, como alternativa, x = x(u), dx = du.
du
6.3. El método de sustitución 143

 
EJEMPLO 6.2 Halle la integral f (x) dx = (x + x2 )−1/2 (1 + 2x)dx.

d
Como (1 + 2x) = (x + x2 ), hacemos el cambio u = x + x2 , du = (1 + 2x)dx.
dx
Entonces
du
f (x) = (x + x2 )−1/2 (1 + 2x) = u−1/2
dx
y  
(x + x2 )−1/2 (1 + 2x)dx = u−1/2 du = 2u1/2 + C = 2(x + x2 )1/2 + C .
El resultado se confirma derivando:
d  
2(x + x2 )1/2 + C = (x + x2 )−1/2 (1 + 2x) .
dx

2
EJEMPLO 6.3 Halle la integral I = (4x + 3)e−(2x +3x+1)
dx.

Sea u = 2x2 + 3x + 1, du = (4x + 3)dx. Entonces



2
I = e−u du = −e−u + C = −e−(2x +3x+1) + C .


1
EJEMPLO 6.4 Demuestre que (ax + b)n dx = (ax + b)n+1 + C
a(n + 1)
donde los números a, b y n son arbitrarios, salvo que n = −1.
Sea u = ax + b, du = a dx. Entonces
 
1 1 un+1
(ax + b)n dx = un du = +C
a an+1
y u se sustituye por ax + b.

No hay una regla que abarque todos los casos y permita hallar el cambio de variable
adecuado que transforme una integral a forma estándar. Dominar el arte de la integración
es el resultado de mucha práctica. Algunos de los tipos más sencillos de sustitución se
recogen en la Tabla 6.2

Tabla 6.2

Tipo Cambio Resultado

 
1. f (x)f  (x) dx u = f (x), du = f  (x) dx u du = 12 u2 + C
 
f (x) du
2. dx u = f (x), du = f  (x) dx = ln u + C
f  (x) u
 
3. f ( sen x) cos x dx u = sen x, du = cos x dx f (u) du
 
4. f ( cos x) sen x dx u = cos x, du = − sen x dx − f (u) du
144 Capı́tulo 6. Métodos de integración


EJEMPLOS 6.5 Integrales de tipo 1: f (x)f  (x) dx.

(i) I= sen ax cos ax dx.
En este caso, cos ax es proporcional a la derivada de sen ax (y viceversa):

f (x) = sen ax, f  (x) = a cos ax .

Por lo tanto, tomando u = sen ax, du = a cos ax dx,



1 1 2 1
I= u du = u +C = sen2 ax + C .
a 2a 2a

Vemos que esta integral es idéntica al caso 3 de la Tabla 6.1, y este ejemplo ilustra cómo hay a menudo
varias maneras de evaluar una integral en particular.

ln x
(ii) I = dx.
x
1 d 1
Como = ln x, tomamos u = ln u y du = dx. Entonces
x dx x

1 1
I = u du = u2 + C = (ln x)2 + C .
2 2


f  (x)
EJEMPLOS 6.6 Integrales de tipo 2: dx.
f (x)

x
(i) I= dx.
2x2 + 3
En este caso, x es proporcional a la derivada de 2x2 + 3: f (x) = 2x2 + 3, f  (x) = 4x.
Por lo tanto, tomando u = 2x2 + 3, du = 4x dx,

1 du 1 1
I= = ln u + C = ln (2x2 + 3) + C .
4 u 4 4
 
cos x
(ii) I= cotg x dx = dx.
sen x
Sea u = sen x. Entonces du = cos x dx, y

du
I= = ln u + C = ln (sen x) + C .
u

1
(iii) I= dx.
x ln x
1
Sea u = ln x. Entonces du = dx y
x

du
I= = ln u + C = ln (ln x) + C .
u
6.3. El método de sustitución 145

EJEMPLOS 6.7 Integrales de tipo 3: f (sen x) cos x dx.

(i) I= sena x cos x dx, siendo a un número arbitrario (pero a = −1).

Sea u = sen x, du = cos x dx, y



1 1
I = ua du = ua+1 + C = sena+1 x + C .
a+1 a+1

(ii) I= esen x cos x dx.

Sea u = sen x. Entonces du = cos x dx, y



I = eu du = eu + C = esen x + C .

Sustituciones trigonométricas e hiperbólicas


Las integrales estándar presentadas en la Tabla 6.3 puede ser evaluadas sustituyendo
x apropiadamente por funciones trigonométricas e hiperbólicas

Tabla 6.3

 x
dx
1. √ = arcsen +C, |x| < |a| .
a2 − x2 a
 x 

dx
2. √ = arccosh + C = ln x + x2 − a2 + C , |x| > |a| .
x2 − a2 a
 
dx x 

3. √ = arcsenh + C = ln x + x2 + a2 + C .
x2 + a2 a
 
dx 1 x
4. = arctg +C.
a2 + x2 a a
 x
dx 1 1 a + x
5. = arctgh + C = ln +C.
a2 − x2 a a 2a a − x

La√integral 1 de√la tabla se evalúa usando


√ el cambio x = a sen θ. Entonces dx = a cos θ dθ
y a2 − x2 = a2 − a2 sen2 θ = a 1 − sen2 θ = a cos θ. Por lo tanto
   x
dx a cos θ dθ
√ = = dθ = θ + C = arcsen +C.
a2 − x 2 a cos θ a

De la misma manera, la integral 2 se evalúa mediante el cambio x = cosh u.


Estas sustituciones son útiles cuando el integrando tiene la raı́z cuadrada de una fun-
ción cuadrática.
146 Capı́tulo 6. Métodos de integración

EJEMPLO 6.8 Halle el valor de a2 − x2 dx.


Sea x = a sen θ. Entonces dx = a cos θ dθ, a2 − x2 = a cos θ y




a2 − x2 dx = a2 cos2 θ dθ .

Ésta es la integral 1 de la Tabla 6.1, por lo tanto




a2 a2
a2 − x2 dx = (1 + cos 2θ) dθ = (θ + sen θ cos θ) + C .
2 2

Ahora bien, sen θ = x/a, cos θ = a2 − x2 /a, y θ = arcsen (x/a). Por lo tanto,

x 1

1
a2 − x2 dx = a2 arcsen + x a2 − x2 + C .
2 a 2

La integral 4 de la Tabla 6.3, que se evalúa con el cambio x = a tg θ, se usa en el Apartado


6.6 para integrar funciones racionales.
La integral 5 puede ser evaluada ya sea mediante el cambio x = a tgh u o expresando
el integrando en fracciones simples para dar la forma logarı́tmica (véase el Apartado 6.6).
De manera alternativa, todas las integrales de la tabla se obtienen fácilmente integrando
las derivadas que aparecen en las Tablas 4.5 y 4.6.

Integrales definidas
Cuando se cambia la variable de integración en una integral definida con el método
de sustitución, por ejemplo de x a u(x), los lı́mites de integración tienen también que
cambiarse. Si el intervalo de integración en x es desde a hasta b, entonces el intervalo en
u(x) es desde u(a) hasta u(b):
 b  u(b)

f (x) dx = g(u) du . (6.11)


a u(a)

 π
EJEMPLO 6.9 Halle la integral I= cos2 x sen x dx.
0

Sustituimos u = cos x y du = − sen x dx. Cuando x = 0, u = cos 0 = +1. Cuando x = π, u = cos π = −1.
Por lo tanto   −1 +1
I=− u2 du = + u2 du
+1 −1
puesto que al intercambiar los lı́mites el signo de la integral cambia. Tenemos entonces
 π  +1  +1
u3 2
cos2 x sen x dx = u2 du = = .
0 −1 3 −1 3
6.4. Integración por partes 147

EJEMPLO 6.10 Halle el área del cı́rculo de ecuación x2 + y2 = a2 .


Como en el Ejemplo 5.5, sea A el área del cuarto de √
cı́rculo que está en el primer cuadrante, en el que tanto
x como y son positivos (Figura 5.11). Entonces y = a2 − x2 y
 a

A= a2 − x2 dx .
0

Al igual que en el Ejemplo 6.8, la integral se evalúa con el cambio x = a sen θ, y los nuevos lı́mites de
integración son θ = 0 cuando x = 0 y θ = π/2 cuando x = a. Por lo tanto,
 π/2
a2  π/2 πa2
A = a2 cos2 θ dθ = θ + sen θ cos θ = .
0 2 0 4

El área del cı́rculo es cuatro veces esto.

6.4. Integración por partes


En la integral

y= x cos x dx

el integrando es el producto de dos funciones de tipo muy distinto: el polinomio x y la


función trigonométrica cos x.
El valor de la integral es

y = x sen x + cos x + C

como puede comprobarse derivando:

dy d  d 
= x sen x + cos x
dx dx dx
 
= sen x + x cos x + − sen x = x cos x .

Hemos usado la regla del producto para derivar el producto x sen x, y el método de
integración por partes se usa para integrar productos de este tipo. En general, sea y = uv,
donde u y v son funciones de x. Entonces

dy dv du
=u +v (6.12)
dx dx dx
e, integrando ambos miembros con respecto a x,
  
dy dv du
dx = u dx + v dx . (6.13)
dx dx dx
148 Capı́tulo 6. Métodos de integración

El primer miembro es igual a y = uv por definición, y la ecuación puede reescribirse


como
 
dv du
u dx = uv − v dx . (6.14)
dx dx

Esta ecuación, que es la inversa de la regla del producto, es la regla de integración por
partes. Dado un integrando como x cos x, uno de los factores se identifica con u en (6.14),
el otro con dv/dx. Por ejemplo, sea

dv
u = x, = cos x .
dx
Entonces
du
= 1, v = sen x ,
dx
y (6.14) se transforma en
 
d d
x (sen x) dx = x sen x − sen x (x) dx
dx dx

= x sen x − sen x dx

= x sen x + cos x + C .

El arte de la integración por partes es la capacidad de elegir correctamente u y v. Ası́, en


nuestro ejemplo anterior la elección u = cos x y dv/dx = x da
   
1 2 1 2
x cos x dx = x cos x − x × – sen x dx
2 2

1 2 1
= x cos x + x2 sen x dx
2 2

y el problema se ha hecho más complicado. Este ejemplo ilustra la regla de que si uno de
los factores es un polinomio, entonces, salvo una única excepción importante, se debe
escoger el polinomio como la función u de la ecuación (6.14).

EJEMPLO 6.11 Integre por partes x2 cos x dx.

dv du
Sea u = x2 y = cos x. Entonces = 2x y v = sen x, y
dx dx
 
x2 cos x dx = x2 sen x − 2 x sen x dx .

El grado del polinomio bajo el signo de integración ha disminuido una unidad: x2 ha sido sustituido por x.
6.4. Integración por partes 149

dv
Integrando por partes la nueva integral, con u = x y = sen x, tenemos
dx
 
x sen x dx = −x cos x + cos x dx = −x cos x + sen x .

Por lo tanto
  
x2 cos x dx = x2 sen x − 2 −x cos x + sen x + C

= x2 sen x + 2x cos x − 2 sen x + C .


Los resultados se pueden comprobar derivando.

En general, un polinomio de grado n puede ser eliminado con n sucesivas integraciones


por partes. La excepción a la regla es cuando el otro factor es una función logarı́tmica.

EJEMPLO 6.12 Integre por partes xn ln x dx, (n = −1).

En este caso, tomar u = xn conduce a una integral más complicada. La elección correcta es u = ln x y
dv du 1
= xn . Entonces = y v = xn+1 /(n + 1), y
dx dx x
 
1 n+1 1 1
xn ln x dx = x ln x − xn+1 × dx
n+1 n+1 x

1 n+1 1
= x ln x − n
x dx
n+1 n+1
1 n+1 1
= x ln x − xn+1 + C
n+1 (n + 1)2
1  
= x n+1
(n + 1) ln x − 1 +C.
(n + 1)2
Un caso particular de esta integral es, para n = 0,

xn ln x dx = x ln x − x .

dv
En este caso la sustitución es u = ln x, = 1.
dx

La integración por partes es únicamente inmediata si uno de los factores es un polinomio.


 ∞
EJEMPLO 6.13 Integre e−ax cos x dx, (a > 0).
0
dv
En este caso cualquier factor puede elegirse como u en (6.14). Por ejemplo, si u = e−ax y = cos x,
dx
entonces, para la integral indefinida,
 
I = e−ax cos x dx = e−ax sen x + a e−ax sen x dx
  
= e−ax sen x + a −e−ax cos x − a e−ax cos x dx

= e−ax sen x − ae−ax cos x − a2 e−ax cos x dx

= e−ax sen x − ae−ax cos x − a2 I .


150 Capı́tulo 6. Métodos de integración

Entonces, despejando I,

1
I= e−ax cos x dx = e−ax (sen x − a cos x) + C
1 + a2

y
 ∞
a
e−ax cos x dx = .
0 1 + a2

6.5. Fórmulas de reducción


El método de integración por partes puede usarse para obtener fórmulas para familias
de integrales relacionadas. Sea la integral

In = xn eax dx ,

dv
donde n es un entero positivo. Tomando u = xn y = eax en la fórmula (6.14),
dx

1 n
In = xn eax − xn−1 eax dx
a a

o bien
1 n ax n
In = x e − In−1 . (6.15)
a a
Este resultado se denomina una fórmula de reducción para In , o una relación de re-
currencia entre In e In−1 . Por ejemplo

1 3 ax 3 1 2 ax 2 1 ax 1
I3 = x e − I2 , I2 = x e − I1 , I1 = xe − I0 ,
a a a a a a


1 ax
I0 = eax dx = e +C.
a

Entonces
 
1 ax 3 3 2 6 6
I3 = e x − x + 2 x − 3 .
a a a a

Más importante aún, la relación de recurrencia es perfecta para calcular uno o más miem-
bros de una familia de integrales.
6.5. Fórmulas de reducción 151

Hay fórmulas especialmente sencillas para algunas integrales definidas que son im-
portantes en las ciencias fı́sicas. Por ejemplo, la integral
 ∞
In = e−ar rn dr (a > 0) , (6.16)
0

donde n es un entero positivo o nulo, aparece en la descripción mecánico-cuántica de las


propiedades del átomo de hidrógeno. Integrando por partes
 ∞
1 n
In = − e−ar rn + In−1 .
a 0
a

Si n = 0, la cantidad e−ar rn es cero en ambos lı́mites de integración, r = 0 y r → ∞. Por


lo tanto
n
In = In−1 , n ≥ 1,
a
y se deduce que
 ∞
n!
In = e−ar rn dr = , (6.17)
0 an+1

donde n! = n(n − 1)(n − 2) · · · 1 es el factorial de n.

EJEMPLO 6.14 Determine una fórmula de reducción para



In = cosn x dx ,

siendo n un entero positivo.


dv
Escribimos el integrando como cosn−1 x cos x, y tomamos u = cosn−1 x y = cos x. Entonces
dx

In = cosn−1 x sen x + (n − 1) cosn−2 x sen2 x dx

y, como sen2 x = 1 − cos2 x,


 
In = cosn−1 x sen x + (n − 1) cosn−2 x dx − (n − 1) cosn x dx

= cosn−1 x sen x + (n − 1)In−2 − (n − 1)In .

Despejando In obtenemos
1 n−1
In = cosn−1 x sen x + In−2 .
n n
152 Capı́tulo 6. Métodos de integración

EJEMPLO 6.15 Determine una fórmula de reducción para la integral definida


 π/2
In = cosn x dx .
0

Del resultado del Ejemplo 6.14,


 π/2
1 n−1
In = cosn−1 x sen x + In−2 .
n 0 n

Como sen 0 = 0 y cosn−1 π/2 = 0 si n > 1, se deduce que

n−1
In = In−2 , n ≥ 2,
n
con  
π/2 π/2
π
I1 = cos x dx = 1, I0 = dx = .
0 0 2
Por ejemplo,
3 3 1 3π 4 4 2 8
I4 = I2 = × I0 = , I5 = I3 = × I1 = .
4 4 2 16 5 5 3 15

EJEMPLO 6.16 Determine una fórmula de reducción para


 ∞
2
In = e−ar rn dr .
0

d 2 2 1 2

Como e−ar = −2ar e−ar , el integrando se escribe como − −2ar e−ar rn−1 . Entonces, por partes,
dr 2a
 ∞  ∞ 
2 1 2 (n − 1) ∞ −ar2 n−2
e−ar rn dr = − e−ar rn−1 + e r dr .
0 2a 0 2a 0

2
Ahora bien, e−ar → 0 cuando r → ∞ y, si n > 1, rn−1 = 0 cuando r = 0. Entonces, para n ≥ 2,
 ∞  ∞
2 (n − 1) 2 (n − 1)
e−ar rn dr = e−ar rn−2 dr, In = In−2 .
0 2a 0 2a

Para n = 1,  ∞
 ∞ 2 1 2 1
I1 = e−ar r dr = − e−ar = .
0 2a 0 2a
Para n = 0,
 ∞
−ar2 1 π
I0 = e dr = . (6.18)
0 2 a
Esta última integral es una integral estándar que no puede calcularse con los métodos descritos en este
capı́tulo (véase el Apartado 9.11).
Las integrales In son importantes, por ejemplo, en quı́mica molecular cuántica. En los métodos actuales
de cálculo para hallar funciones de onda moleculares, los orbitales moleculares se expresan en función de
2
‘funciones de base gaussianas’. Tales funciones son esencialmente la exponencial e−ar multiplicada por un
polinomio, y la utilización de esas funciones lleva a integrales del tipo presentado en este ejemplo.
6.6. Integrandos racionales. El método de fracciones simples 153

6.6. Integrandos racionales. El método de fracciones simples


Una función algebraica racional es en general de la forma P(x)/Q(x), donde P(x) y
Q(x) son polinomios. Vimos en el Apartado 2.6 que todas esas funciones pueden expre-
sarse como la suma de un polinomio y una o más fracciones simples de los tipos (si se
excluyen números complejos)

1 ax + b
(i) , (ii) , (6.19)
(x + a)n (x + px + q)n
2

donde n es un entero positivo y la función cuadrática x2 + px + q no tiene raı́ces reales,


es decir, su discriminante p2 − 4q es negativo.

Integrales de tipo (i)


Éstas son las integrales que aparecen en la teorı́a de procesos cinéticos elementales:


dx ⎨ ln (x + a) + C si n = 1,
= −1 (6.20)
(x + a)n ⎩ + C si n > 1.
(n − 1)(x + a)n−1


dx
EJEMPLO 6.17 Integre .
(2 − x)(4 − x)
El integrando puede expresarse en fracciones simples como
 
1 1 1 1
= − .
(2 − x)(4 − x) 2 2−x 4−x
Por lo tanto
   
dx 1 1 1
= − dx
(2 − x)(4 − x) 2 2−x 4−x
 
1 1 4−x
= – ln (2 − x) + ln (4 − x) + C = ln +C.
2 2 2−x

5x + 1
EJEMPLO 6.18 Integre dx.
x3 − 3x + 2
La función cúbica del denominador puede factorizarse como x3 − 3x + 2 = (x − 1)2 (x + 2) de manera que
el integrando puede expresarse en fracciones simples como
5x + 1 1 2 1
= + − .
x3 − 3x + 2 x−1 (x − 1)2 x+2
Entonces
   
5x + 1 dx dx dx
dx = +2 −
x3 − 3x + 2 x−1 (x − 1)2 x+2
 
2 x−1 2
= ln (x − 1) − − ln (x + 2) + C = ln − +C.
x−1 x+2 x−1
154 Capı́tulo 6. Métodos de integración

Integrales de tipo (ii)


Consideramos primero dos formas especiales.

El numerador es la derivada de la función cuadrática

En este caso, la integral es o bien del tipo 2 de la Tabla 6.2 o bien una generalización
sencilla del mismo:
  
2x + p f (x)
dx = n dx . (6.21)
(x2 + px + q)n [f (x)]

Si u = f (x) = x2 + px + q, entonces du = f  (x) dx = (2x + p)dx, y



  ln u + C si n = 1,
2x + p du ⎨
dx = = −1 (6.22)
(x + px + q)n
2
un ⎩ + C si n > 1.
(n − 1)un−1

Por lo tanto

 ⎨ ln (x + px + q) + C si n = 1,
2
2x + p
dx = −1 (6.23)
(x2 + px + q)n ⎩ + C si n > 1.
(n − 1)(x + px + q)n−1
2


dx
El numerador es la unidad:
(x2 + px + q)n
La integral se evalúa transformando primero el denominador en una expresión de la
forma u2 + a2 . Podemos escribir
  2 
p 2 p − 4q
x + px + q = x +
2
− (6.24)
2 4

donde p2 − 4q es el discriminante de la expresión cuadrática. Como hemos supuesto que


la expresión cuadrática no tiene raı́ces reales, el discriminante es negativo y
  
p 2 4q − p2
x + px + q = x +
2
+ = u2 + a2 , (6.25)
2 4

siendo u = x + p/2 y a2 = (4q − p2 )/4 > 0.


Entonces, puesto que dx = du,
 
dx du
= .
(x2 + px + q)n (u2 + a2 )n

Usamos ahora la sustitución trigonométrica u = a tg θ. Entonces du = a2 θ dθ = (a/ cos2 θ)dθ,


6.6. Integrandos racionales. El método de fracciones simples 155

y u2 + a2 = a2 ( tg2 θ + 1) = a2 / cos2 θ. Por lo tanto


 
du 1
= 2n−1 cos2n−2 θ dθ . (6.26)
(u2 + a2 )n a

Para n = 1,
  u
du 1 θ 1
= dθ = + C = arctg +C, (6.27)
u +a
2 2
a a a a

que es una de las integrales estándar de la Tabla 6.3. Para n > 1, la integral (6.26) puede
evaluarse, por ejemplo, mediante reducción como en el Ejemplo 6.14.


dx
EJEMPLO 6.19 Integre .
x2 + 2x + 5

La función cuadrática x2 + 2x + 5 puede escribirse como (x + 1)2 + 22 . Entonces, por la ecuación (6.27),
con a = 2 y u = x + 1,
   
dx dx 1 x+1
= = arctg +C.
x2 + 2x + 5 (x + 1)2 + 22 2 2


dx
EJEMPLO 6.20 Integre .
(x2 + 2x + 5)3
Por la ecuación (6.26), con n = 3, a = 2 y u = x + 1,
 
dx 1
= cos4 θ dθ
(x2 + 2x + 5)3 32

donde tg θ = u/a = (x + 1)/2. Entonces, por reducción como en el Ejemplo (6.14),


 
1 3
cos4 θ dθ = sen θ cos3 θ + cos2 θ dθ
4 4
1 3 3
= sen θ cos3 θ + sen θ cos θ + θ + C .
4 8 8

Tenemos que deshacer el cambio de la variable θ a u (y luego a x). Si tg θ = u/a entonces θ = arctg (u/a)
y se comprueba fácilmente que
u a
sen θ = √ , cos θ = √ .
u2 + a2 u2 + a2

Entonces 
1 ua3 3 ua 3 u
cos4 θ dθ = + + arctg +C
4 (u2 + a2 )2 8 u2 + a2 8 a
y
   
dx 1 2(x + 1) 3(x + 1) 3 x+1
= + + arctg +C.
(x2 + 2x + 5)3 32 (x2 + 2x + 5)2 4(x2 + 2x + 5) 8 2
156 Capı́tulo 6. Métodos de integración


ax + b
Forma general: dx
(x2 + px + q)n
El numerador puede escribirse como
  
a ap
ax + b = 2x + p + b − (6.28)
2 2

de manera que la integral se expresa en función de los casos especiales tratados anterior-
mente:
   
ax + b a 2x + p ap dx
dx = dx + b − . (6.29)
(x2 + px + q)n 2 (x2 + px + q)n 2 (x2 + px + q)n

Integrandos trigonométricos racionales


Por trigonometrı́a
θ θ 2 sen θ2 cos θ2
sen θ = 2 sen cos = ,
2 2 cos2 θ2 + sen2 θ2
(6.30)
θ θ cos2 θ2 − sen2 θ

cos θ = cos2 − sen2 = 2


.
2 2 cos2 θ2 + sen2 θ
2

Entonces, dividiendo los numeradores y los denominadores por cos2 θ/2 y tomando t =
tg θ/2, obtenemos

2t 1 − t2 θ
sen θ = , cos θ = , t = tg . (6.31)
1 + t2 1 + t2 2

Las funciones trigonométricas sen θ y cos θ son funciones racionales de t. Una función
trigonométrica de θ que se convierte en una función (algebraica) racional de t cuando
se hace el cambio t = tg θ/2 se denomina función trigonométrica racional de θ. Cada
una de esas funciones puede ser integrada con los métodos descritos previamente en
este apartado. Ası́, si el integrando de la integral f (θ) dθ es una función trigonométrica
racional de θ, el cambio

θ 2
t = tg , dθ = dt , (6.32)
2 1 + t2
da
 
2f (θ)
f (θ) dθ = dt , (6.33)
1 + t2

donde f (θ), expresada en t, es una función racional de t.


6.7. Derivación paramétrica de integrales 157

EJEMPLO 6.21 Ejemplos del cambio t = tg θ/2.


     
dθ 2 2t 1
(i) = dt = dt = ln t + C = ln tg θ/2 + C .
sen θ 1 + t2 1 + t2 t

    
dθ 2 1 − t2
(ii) = 3+5 dt
3 + 5 cos θ 1 + t2 1 + t2
 
2 2
= dt = dt
3(1 + t2 ) + 5(1 − t2 ) 8 − 2t2

dt 1 2 + t
= = ln +C
4 − t2 4 2 − t

1 2 + tg θ/2
= ln +C,
4 2 − tg θ/2

utilizando la integral estándar 5 de la Tabla 6.3.

Este método puede aplicarse en todos los casos pero no es siempre el más sencillo en la
práctica. Por ejemplo, aplicar el método a la integración de las funciones trigonométri-
cas elementales sen θ y cos θ es considerablemente más complicado que usar integrales
estándar.

6.7. Derivación paramétrica de integrales


Sea la integral indefinida

1
e−αx dx = − e−αx + C, (α = 0) .
α

La integral puede considerarse como una función del parámetro α. Derivando se obtiene
    
d d 1 −αx 1 x
e dx =
−αx
− e +C = + e−αx .
dα dα α α2 α

Por añadidura, integrando por partes,


     
d −αx 1 x
e dx = − xe dx =
−αx
+ e−αx .
dα α2 α

Se deduce que
   
d d −αx
e−αx
dx = e dx
dα dα
158 Capı́tulo 6. Métodos de integración

de manera que en este caso se pueden intercambiar el orden de la integración con res-
pecto a x y la derivación con respecto a α. Este resultado es cierto en el caso general

f (x, α) dx = F(x, α) + C , (6.34)

d
si f (x, α) y f (x, α) son funciones continuas de x y α:

   
d d d
f (x, α) dx = f (x, α) dx = F(x, α) . (6.35)
dα dα dα

Para la correspondiente integral definida, si los lı́mites son independientes del parámetro
α,
 b  b 
d d d d
f (x, α) dx = f (x, α) dx = F(b, α) − F(a, α) . (6.36)
dα a a dα dα dα

Cuando uno o ambos lı́mites de integración son infinitos, es necesario asegurarse de que
la integral de la función y la de su derivada son ambas convergentes.

 ∞
EJEMPLO 6.22 Integre e−ax xn dx.
0

En el Apartado 6.5 evaluamos la integral a partir de una fórmula de reducción obtenida mediante sucesivas
iteraciones por partes. Un método alternativo es derivar la sencilla integral estándar
 ∞
1
e−ax dx = , (a = 0) .
0 a

La derivada n-ésima de e−ax con respecto a a es (– 1)n xn e−ax de manera que


 ∞ n  ∞ n
 
n −ax n d −ax n d 1 n!
x e dx = (– 1) n
e dx = (– 1) n
= n+1 .
0 da 0 da a a

 ∞
sen x
EJEMPLO 6.23 Integre dx.
0 x
La integral no puede ser evaluada con los métodos estándar presentados en este capı́tulo y el método de
integración por partes no funciona. Consideramos en su lugar la integral relacionada
 ∞ −αx
e sen x
I(α) = dx .
0 x

Entonces  ∞
d
I(α) = − e−αx sen x dx
dα 0
y la nueva integral puede integrarse por partes como en el Ejemplo 6.13. Entonces

d 1
I(α) = − 2 (6.37)
dα α
6.8. Ejercicios 159

e, integrando con respecto a α,




I(α) = − = − arctg α + C .
1 + α2
Para obtener el valor de la constante de integración, constatamos que I(α) → ∞ cuando α → ∞, de
manera que
π
C = lim arctg α = .
α→∞ 2
Para recuperar la integral original tomamos ahora α = 0:
 ∞
sen x π π
I(0) = dx = − arctg 0 + = . (6.38)
0 x 2 2

Cuando los lı́mites de integración también dependen del parámetro, el resultado de de-
rivar la integral viene dado por el teorema de Leibniz: si a(α) y b(α) son funciones
continuas de α,
 b(α)  b(α)  
d d db da
f (x, α) dx = f (x, α) dx = f (b, α) − f (a, α) . (6.39)
dα a(α) a(α) dα dα dα

6.8. Ejercicios
Apartado 6.2
Evalúe las integrales indefinidas:  
1. sen2 3x dx 2. sen 3x cos 3x dx 3. sen 3x cos 2x dx
  
4. sen x cos 3x dx 5. sen 3x sen x dx 6. cos 5x cos 2x dx

Evalúe las integrales definidas:


 π/2  π/2  π
7. cos2 3x dx 8. sen 2x cos 2x dx 9. sen x cos 2x dx
0 0 0

10. Las funciones de onda para una partı́cula en una caja de longitud l son
 nπx
2
ψn (x) = sen , n = 1, 2, 3, . . .
l l
Demuestre que las funciones satisfacen la condición de ortonormalidad
 l 
1 si m = n,
ψn ψm dx =
0
0 si m = n.

Apartado 6.3
Evalúelas integrales indefinidas (utilice el cambiodado entre paréntesis):
11. (3x + 1)5 dx (u = 3x + 1) 12. sen (4x − 1) dx (u = 4x − 1)
160 Capı́tulo 6. Métodos de integración

13. (3x2 + 2x + 5)3 (3x + 1) dx (u = 3x2 + 2x + 5)

3
14. (3x2 + 2)e−(x +2x)
dx (u = x3 + 2x)
 
2x + 1
15. dx (u = x2 + x + 2) 16. sen3 x cos x dx (u = sen x)
x2 + x + 2
 
17. tg x dx (u = cos x) 18. ex (1 + ex )1/2 dx (u = 1 + ex )
 

dx
19. (u = ln x) 20. x 4 − x2 dx (u = 4 − x2 )
x ln x

x dx
21. √ (x = 2 sen θ)
4 − x2

Evalúelas integrales indefinidas: 


22. (2x − 1)1/2 dx 23. (2x3 + 3x − 1)1/3 (2x2 + 1) dx
  
cos x dx
24. x cos (3x2 − 1) dx 25. 26. cos x e2 sen x dx
1 − sen x
   √
dx x2 dx x dx
27. 28. √ 29.
4 + x2 1 − x2 1+x

Evalúe las integrales definidas:


 2  π2 √  π/2 √
x dx sen ( x + π)
30. 31. √ dx 32. sen θ cos θ dθ
1 3x − 2
2 x
0 0
 1  ∞
dx 2
33. √ 34. xe−x dx
0 2 − x2 0

35. La forma de las lı́neas en espectroscopia de resonancia


 ∞ magnética se describen a menudo con la
1 T
función de Lorentz g(ω) = . Halle g(ω) dω.
π 1 + T 2 (ω − ω0 )2 ω0

Apartado 6.4
Evalúelas integrales indefinidas:  
36. x sen x dx 37. x3 sen x dx 38. (x + 1)2 cos 2x dx
  
ln x
39. x ln x dx 40. dx 41. x2 e2x dx
x2
 
42. e−x sen 2x dx 43. eax cos bx dx

Evalúe las integrales definidas:


 1  ∞  1
44. xex dx 45. x2 e−2x dx 46. x2 ln x dx
0 0 0
 π/2
47. e−2x cos 3x dx
0
6.8. Ejercicios 161

48. Una expresión aproximada para la función de partición rotacional de un rotor lineal es
 ∞
qr = (2J + 1)e−J(J+1)Θr /T dJ ,
0

donde Θr =  /2Ik es la temperatura rotacional, I es el momento de inercia y k es la constante de Boltz-


2

mann. Evalúe la integral.

49. La probabilidad de que una molécula de masa m en un gas a temperatura T tenga velocidad v viene
dada por la distribución de Maxwell-Boltzmann
 m 3/2 2
f (v) = 4π v2 e−mv /2kT ,
2πkT
 ∞
donde k es la constante de Boltzmann. Halle la velocidad media v̄ = v f (v) dv,
0
(véase el Ejercicio 73 del Capı́tulo 4).

Apartado 6.5

50. Determine una fórmula de reducción para senn x dx, siendo n un entero positivo.

51. Demuestre que, para los enteros m ≥ 0 y n ≥ 1,


 
senm+1 θ cosn−1 θ n−1
senm θ cosn θ dθ = + senm θ cosn−2 θ dθ .
m+n m+n

52. Utilice los resultados de los ejercicios 50 y 51 para evaluar sen5 x cos4 x dx.

53. Demuestre que, para los enteros m ≥ 0 y n ≥ 1,


 π/2 
n − 1 π/2
senm θ cosn θ dθ = senm θ cosn−2 θ dθ
0 m+n 0
 π/2
54. Evalúe sen5 x cos5 x dx.
0

55. En espectroscopia, la forma de las lı́neas se analiza algunas veces usando segundos momentos. El
segundo momento de una señal centrada en la frecuencia angular ω0 es
 ∞
(ω − ω0 )2 g(ω) dω
ω0

donde g(ω) es una función para la forma de la señal. Evalúe la integral para la curva gaussiana
 
2 1
g(ω) = T exp − T 2 (ω − ω0 )2 .
π 2
56. Para la distribuciónde Maxwell-Boltzmann del ejercicio 49, halle la raı́z de la velocidad cuadrática


media v2 , siendo v2 = v2 f (v) dv.
0

Apartado 6.6
Evalúelas integrales indefinidas:  
dx (x + 2) dx dx
57. 58. 59.
(2x − 1)(x + 3) (x + 3)(x + 4) 3x2 − 5x − 2
162 Capı́tulo 6. Métodos de integración
 
x2 dx (x2 − 3x + 3) dx
60. 61.
(x − 1)(x − 2) (x + 1)(x + 2)(x + 3)
  
x dx dx dx
62. 63. 64.
(x2 + 3)(x2 + 4) x2 + 4x + 2 x2 + 4x + 5
  
x dx x2 dx dx
65. 66. 67.
x2 + 4x + 5 x + 4x + 5
2 (x2 + 4x + 5)2

Evalúeutilizando el cambio t = tg θ/2:  


dθ dθ dθ
68. 69. 70.
cos θ 5 − 3 cos θ 1 + sen θ + cos θ

Apartado 6.7
71. Derivando la integral 

−ax2 1 π
e dx =
0 2 a
con respecto a a, demuestre que
 ∞

2n −ax2 1 · 3 · 5 · · · (2n − 1) π
x e dx = .
0 2n+1 an a
Sucesiones y series

7.1. Conceptos

Una serie es un conjunto de términos que han de ser sumados. Los términos pue-
den ser números, variables, funciones, o cantidades más complejas. Una serie puede ser
finita, con un número finito de términos,

u 1 + u2 + u 3 + · · · + un

o puede ser infinita,

u1 + u 2 + u3 + u 4 + · · ·

donde los puntos suspensivos indican que la suma ha de extenderse indefinidamente (ad
infinitum). Los términos por sı́ mismos forman una sucesión. Tratamos las sucesiones en
el Apartado 7.2, las series finitas en 7.3, las series infinitas y los criterios de convergencia
en 7.4 y 7.5. En el Apartado 7.6 tratamos de cómo las series de MacLaurin y de Taylor
pueden utilizarse para representar ciertos tipos de funciones en series de potencias (‘po-
linomios infinitos’), y en 7.7 cómo pueden usarse para obtener valores aproximados de
funciones. Algunas propiedades de las series de potencias se describen en el Apartado
7.8.
Las series aparecen en todas las ramas de las ciencias fı́sicas, y la representación
de funciones como series es una herramienta esencial para la resolución de muchos
problemas fı́sicos. Algunas funciones, como la función exponencial y otras funciones
trascendentes, se definen mediante series, lo mismo que importantes cantidades fı́sicas,
como por ejemplo la función de partición en termodinámica estadı́stica. Veremos en los
Capı́tulos 12-14 que las ecuaciones diferenciales relevantes en las ciencias fı́sicas a me-
nudo tienen soluciones que pueden representarse únicamente como series. A menudo
los métodos de resolución aproximados o numéricos se basan en series. Por ejemplo,
las soluciones de la ecuación de Schrödinger se representan a menudo como series, bien
sea en la teorı́a formal o en los métodos aproximados, como el método de ‘combinación
lineal de orbitales atómicos’ en la teorı́a de orbitales moleculares (OM CLOA). Una
aplicación importante de las series es el análisis de formas de onda mediante series de
Fourier y transformadas de Fourier. El análisis de Fourier lo tratamos en el Capı́tulo 15.
164 Capı́tulo 7. Sucesiones y series

7.2. Sucesiones
Una sucesión es un conjunto ordenado de términos

u1 , u2 , u3 , . . .

con una regla que especifica cada término. Por ejemplo, los números

1, 3, 5, 7, . . .

forman una serie definida por el término general

ur = 1 + 2(r − 1), r = 1, 2, 3, . . .

De manera alternativa, la regla puede expresarse como una relación de recurrencia más
un término inicial:

ur = ur−1 + 2 , u1 = 1 ,

de manera que, por ejemplo, u5 = u4 + 2 = 7 + 2 = 9. Esta sucesión es un ejemplo de


una progresión aritmética

a , a + d, a + 2d, a + 3d, . . . (7.1)

con la regla

ur = a + d(r − 1), r = 1, 2, 3, . . . (7.2)

Otra sucesión sencilla, pero importante, es la progresión geométrica

a, ax, ax2 , ax3 , . . . (7.3)

con la regla

ur = axr−1 , r = 1, 2, 3, . . . (7.4)

Una sucesión de términos ur se denota por {ur }.

EJEMPLOS 7.1 Sucesiones


1. Progresión aritmética:

0, 5, 10, 15, . . . ur = ur−1 + 5, u1 = 0 .


7.2. Sucesiones 165

2. Progresión geométrica:1

1, 7, 49, 343, . . . ur = 7ur−1 , u1 = 1 .


1 1 1 1
1, , , , ... ur = , r = 0, 1, 2, 3, . . .
2 4 8 2r
1 1 1 1
1, − , , − , . . . ur = − ur−1 , u1 = 1 .
3 9 27 3
3. Sucesión armónica:
1 1 1 1
1, , , , ... ur = , r = 0, 1, 2, 3, . . .
2 3 4 r
4. Sucesión (‘serie’) de Fibonacci:2

1, 1, 2, 3, 5, 8, 13, . . . ur = rr−1 + ur−2 , u0 = u1 = 1 .

Lı́mites de sucesiones
 
1
Los términos de la sucesión armónica ,
r

1 1 1
1, , , , ...
2 3 4
decrecen en magnitud al crecer r, y tienden hacia el valor cero cuando r tiende a infinito.
La cantidad
 
1
lim =0
r→∞ r

se llama lı́mite de la sucesión, y en este caso el lı́mite es finito y único. De manera


similar ocurre con la sucesión
1 2 3 4
, , , , ...
2 3 4 5
 
r−1 1 r−1
con término general ur = = 1 − , y lı́mite lim = 1.
r r r→∞ r

01. El papiro de Rhind (hacia 1650 a.C.) contiene un problema sobre “7 casas, 49 gatos, 343 ratones,
2401 espigas de grano, 16807 hekats”. La versión del ‘Problema de Saint Ives’ en el Liber abaci de Fibo-
nacci (1202 d.C.) es “7 ancianas van a Roma. Cada una tiene 7 mulas y cada mula lleva 7 sacos. Cada saco
contiene 7 hogazas, en cada hogaza hay 7 cuchillos y cada cuchillo está guardado en 7 fundas”.
02. Esta es la solución al paria coniculorum, o problema de los conejos, dado en el Liber abaci de
Fibonacci: “¿cuántas parejas de conejos se crı́an a partir de una pareja en un año si cada pareja crı́a otra
pareja cada mes y empiezan a criar a partir del segundo mes de haber nacido?”
166 Capı́tulo 7. Sucesiones y series

Ası́,

u10 = 0,9 , u100 = 0,99 , u1000 = 0,999 , ...

y cuando r = 10n , el término ur tiene n nueves detrás de la coma decimal. Si el lı́mite


u de una sucesión es finito y único, se dice que la sucesión converge al lı́mite u. Si el
lı́mite no es finito o no es único, la sucesión es divergente. Por ejemplo, la progresión
aritmética (7.1) es necesariamente divergente para todo valor de a y de d:
 
lim a + d(r − 1) = ±∞ .
r→∞

La progresión geométrica (7.3) es interesante porque es convergente para algunos valores


de x y divergente para otros. Muestra seis posibles tipos de comportamiento, caracterı́sti-
cos de muchas sucesiones, representados en la Figura 7.1.

Figura 7.1

Los ejemplos mostrados son (para a = 1):

(a) x>1 1, 2, 4, 8, . . .

(b) x=1 1, 1, 1, 1, . . .

1 1 1
(c) 0<x<1 1, , , , ...
2 4 8
1 1 1
(d) −1 < x < 0 1, − , , − , . . .
2 4 8
(e) x = −1 1, −1, 1, −1, . . .

(f) x < −1 1, −2, 4, −8, . . .

La sucesión es convergente sólo para x = +1 y |x| < 1, tipos (b), (c) y (d), (y para el
caso trivial x = 0).
El comportamiento de una sucesión en el lı́mite no depende necesariamente del
comportamiento de una parte finita de la sucesión. La sucesión {1/(2,5 − r)2 } con
r = 0, 1, 2, . . ., por ejemplo, aumenta su valor inicialmente, pero se comporta como la
sucesión {1/r2 } cuando r → ∞. Un ejemplo más importante es la sucesión de los térmi-
7.3. Series finitas 167
 
nos de la serie exponencial, xr /r! . Esta sucesión tiene lı́mite cero para todo valor de
x. De esta manera, la razón de dos términos consecutivos es
   r 
xr+1 x x
=
(r + 1)! r! r+1

y los términos aumentan en magnitud cuando r + 1 < |x|, y disminuyen cuando r + 1 >
|x|.

EJEMPLOS 7.2 Halle el lı́mite lim (ur ).


r→∞

r−2
1. ur = .
2r
1 1 1
Tenemos ur = − , ası́ que ur → cuando r → ∞.
2 r 2
2r2 + 2r + 1
2. ur = .
r2 − r + 1
2 + 2/r + 1/r2
Dividiendo arriba y abajo por r2 , ur = → 2 cuando r → ∞.
1 − 1/r + 1/r2
De manera alternativa, como el polinomio (a0 + a1 r + a2 r2 + · · · + an rn ) se comporta como (an rn )
cuando r → ∞,
2r2 + 2r + 1 2r2
→ = 2 cuando r → ∞ .
r2 − r + 1 r2
3. ur = (– 1)r .
Ésta es la sucesión −1, +1, −1, +1, . . . y el lı́mite no está definido.
1
4. ur = sen → sen 0 = 0 cuando r → ∞.
r

7.3. Series finitas


Dada una sucesión u1 , u2 , u3 , . . . , las sumas parciales

S1 = u1
S2 = u 1 + u2
S3 = u 1 + u2 + u 3
...

con término general

Sn = u 1 + u 2 + u 3 + · · · + u n = ur (7.5)
r=1
168 Capı́tulo 7. Sucesiones y series

también forman una sucesión S1 , S2 , S3 , . . . Una sucesión obtenida de esta manera se


llama una serie y, si la sucesión converge, el lı́mite
n

S = lim Sn = lim ur (7.6)


n→∞ n→∞
r=1

se llama suma de la serie.


La palabra serie se usa también comúnmente para las sumas de términos. Una serie
finita de n términos es entonces

u r = u 1 + u 2 + u 3 + · · · + un
r=1

con suma Sn , y la serie infinita es

ur = u 1 + u2 + u 3 + · · ·
r=1

con suma (si existe) dada por (7.6).

Series aritméticas

La suma de los n primeros términos de la progresión aritmética (7.1) es

Sn = [a + d(r − 1)] = a + [a + d] + [a + 2d] + · · · + [a + (n − 1)d] .


r=1

El valor de la serie finita se obtiene considerando la suma ordenada al revés,

Sn = [a + (n − 1)d] + [a + (n − 2)d] + · · · + a .

Entonces, sumando ambas expresiones término a término, se obtiene

2Sn = [2a + (n − 1)d] + [2a + (n − 1)d] + · · · + [2a + (n − 1)d]


= n[2a + (n − 1)d] ,

de manera que n
Sn = [2a + (n − 1)d] . (7.7)
2
En particular, la suma de los n primeros números naturales es (a = d = 1)

1
Sn = 1 + 2 + 3 + · · · + n = n(n + 1) . (7.8)
2
7.3. Series finitas 169

Series geométricas
La suma de los n primeros términos de la progresión geométrica (7.3) es

n−1

Sn = axr = a + ax + ax2 + ax3 + · · · + axn−1 .


r=0

Para obtener el valor de la serie, multiplicamos por x,

xSn = ax + ax2 + ax3 + ax4 · · · + axn

y restamos las dos series término a término:

Sn − xSn = a − axn = a(1 − xn ) .

Por lo tanto3
 
1 − xn
Sn = a , (x = 1) . (7.9)
1−x

Entonces, para a = 1,

1 − xn
= 1 + x + x2 + x3 + · · · + xn−1 . (7.10)
1−x

Esta ecuación puede verse de dos maneras:


1. el valor de la suma (1 + x + x2 + x3 + · · · + xn−1 ) es (1 − xn )/(1 − x),
2. la serie (1 + x + x2 + x3 + · · · + xn−1 ) es el desarrollo de la función (1 − xn )/(1 − x)
en potencias de x.
Este concepto de desarrollar una función utilizando un conjunto de (otras) funciones
proporciona una herramienta importante para representar funciones complicadas (o des-
conocidas) en las ciencias fı́sicas.

El desarrollo del binomio


El desarrollo del binomio es el desarrollo de la función (1 + x)n en potencias de x
cuando n es un entero positivo. Ejemplos de tales desarrollos son

(1 + x)2 = 1 + 2x + x2 ,

03. Una exposición de las series geométricas aparece en el Libro IX de los Stoichia (Elementos) de
Euclides. Euclides fue uno de los primeros en enseñar en el Museo de Alejandrı́a fundado por Tolomeo
I hacia el 300 a.C. tras haber ganado el control de Egipto cuando el imperio de Alejandro se disgregó en
323 a.C.
170 Capı́tulo 7. Sucesiones y series

(1 + x)3 = 1 + 3x + 3x2 + x3 ,
(1 + x)4 = 1 + 4x + 6x2 + 4x3 + x4 .

En el caso general

n(n − 1) 2 n(n − 1)(n − 2) 3


(1 + x)n = 1 + nx + x + x + · · · + xn , (7.11)
2! 3!
con término general

n(n − 1)(n − 2) . . . (n − r + 1) r
x .
r!

EJEMPLO 7.3 Desarrolle (1 + x)6 en potencias de x.


Por la ecuación (7.11), con n = 6,
6×5 2 6×5×4 3 6×5×4×3 4
(1 + x)6 = 1 + 6x + x + x + x
2×1 3×2×1 4×3×2×1

6×5×4×3×2 5 6×5×4×3×2×1 6
+ x + x
5×4×3×2×1 6×5×4×3×2×1

= 1 + 6x + 15x2 + 20x3 + 15x4 + 6x5 + x6 .

El coeficiente de xr en el desarrollo (7.11) es


 
n n(n − 1)(n − 2) . . . (n − r + 1) n!
= = (7.12)
r r! r!(n − r)!

y se llama coeficiente binomial (a veces se lee como ‘n sobre r’). Los coeficientes bino-
miales son importantes en teorı́a de probabilidades,
n donde se los suele denotar como n Cr
n
(o Cr ). Veremos en el Capı́tulo 21 que r es el número de combinaciones de n objetos
tomados de r en r. Usando los coeficientes binomiales, el desarrollo es
n  

n
(1 + x) =n
xr . (7.13)
r=0
r

Una forma más general para el desarrollo del binomio es


n  

n
(x + y) =
n
xr yn−r . (7.14)
r=0
r
7.3. Series finitas 171

 
5
EJEMPLO 7.4 Calcule los coeficientes binomiales , y utilı́celos para desarrollar (i) (1 + x)5 y (ii)
r
(x + 3)5 en potencias de x.
Por la definición de los coeficientes,

5 5 5!
= = , r = 0, 1, 2, . . . , 5 .
r 5−r r! (5 − r)!

Por lo tanto, recordando que 0! = 1,



5 5 5! 5 5 5! 5 5 5!
= = = 1, = = = 5, = = = 10 .
0 5 0! 5! 1 4 1! 4! 2 3 2! 3!

(i) Por la ecuación (7.13),



5 0 5 1 5 2 5 3 5 4 5 5
(1 + x) =
5
x + x + x + x + x + x
0 1 2 3 4 5

= 1 + 5x + 10x2 + 10x3 + 5x4 + x5 .

(ii) Por la ecuación (7.14),



5 0 5 5 1 4 5 2 3 5 3 2 5 4 1 5 5 0
(x + 3) =
5
x3 + x3 + x3 + x3 + x3 + x3
0 1 2 3 4 5

= 243 + 405x + 270x2 + 90x3 + 15x4 + x5 .

Los coeficientes binomiales forman un patrón de números llamado triángulo de Pascal4


1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 ...
Cada fila comienza y termina con el número 1 para los coeficientes de xn y de yn en el
desarrollo de (x + y)n , y cada número interior es la suma de los dos números situados
diagonalmente sobre él.

04. Blaise Pascal (1623-1662). Filósofo y matemático francés que hizo contribuciones a la geometrı́a,
el cálculo y, junto con Fermat, desarrolló la teorı́a matemática de la probabilidad (instigado por el jugador
Antoine Gombard, Chevalier de Méré). El triángulo de Pascal aparece en el Traité du triangle arithmétique,
avec quelques autres petits traités sur la même manière, publicado póstumamente en 1665. El trabajo
contiene una exposición de las propiedades de los coeficientes binomiales, con aplicaciones a juegos de
azar. El triángulo era conocido desde mucho antes. Apareció en un libro del matemático chino Yang Hui en
1261, y las propiedades de los coeficientes binomiales fueron tratadas por el persa Jamshid Al-Kashi en su
Llave de la aritmética (hacia 1425).
172 Capı́tulo 7. Sucesiones y series

El método de diferencias
Muchas series finitas sencillas pueden sumarse si el término general ur puede escri-
birse como la diferencia

ur = vr − vr−1 .

Entonces

ur = vr − vr−1
r=1 r=1 r=1

= (v1 + v2 + · · · + vn−1 + vn ) − (v0 + v1 + · · · + vn−1 )


= vn − v0 .

EJEMPLO 7.5 Halle la suma de la serie


n
1 1 1 1
= + + ··· + .
r=1
r(r + 1) 1·2 2·3 n(n + 1)
El término general puede escribirse como
1 1 1
= −
r(r + 1) r r+1
y, por lo tanto,

n
1
n
1
1
n
= −
r=1
r(r + 1) r=1
r r=1
r+1
   
1 1 1 1 1 1 1 1
= + + + ··· + − + + ··· + +
1 2 3 n 2 3 n n+1
1 n
= 1− = .
n+1 n+1

Algunas series finitas


 m
La serie aritmética (7.8) es el ejemplo más sencillo de las series r , donde m es
un entero positivo, es decir, la suma de potencias de los números naturales.5 Algunas de
esas sumas y otras series finitas aparecen en la Tabla 7.1.

05. El método general para generar estas sumas se debe al matemático suizo Jakob Bernoulli (1654-
1705), profesor de matemáticas en Basilea. Con su hermano Johann (1667-1748), profesor de matemáticas
en Groningen y en Basilea, y en colaboración con Leibniz, contribuyó también al cálculo, la teorı́a de
ecuaciones diferenciales, las series y el cálculo de variaciones. Fue esta colaboración la que condujo al éxito
de la formulación de Leibniz del cálculo. Por el año 1700, la mayor parte del cálculo elemental (descrito en
este libro) habı́a sido desarrollado. El método de Newton de las fluxiones nunca fue bien conocido fuera de
Inglaterra. Fue Jakob Bernoulli quién usó por primera vez el término ‘integral’.
7.4. Series infinitas 173

Tabla 7.1 Algunas series finitas

n
1 2 1 1
r = 1 + 2 + 3 + ··· + n = n + n = n(n + 1)
r=1
2 2 2

n
1 3 1 2 1 1
r2 = 1 + 22 + 32 + · · · + n2 = n + n + n = n(n + 1)(2n + 1)
r=1
3 2 6 6

n
1 4 1 3 1 2 1
r3 = 1 + 23 + 33 + · · · + n3 = n + n + n = n2 (n + 1)2
r=1
4 2 4 4

n
1 5 1 4 1 3 1
r4 = 1 + 24 + 34 + · · · + n4 = n + n + n − n
r=1
5 2 3 30

n
1
r(r + 1) = n(n + 1)(n + 2)
r=1
3

n
1
r(r + 1)(r + 2) = n(n + 1)(n + 2)(n + 3)
r=1
4

n
1 n
=
r=1
r(r + 1) n+1

n
1 1 1
= −
r=1
r(r + 1)(r + 2) 4 2(n + 1)(n + 2)

Las sumas de muchas otras series se pueden deducir a partir de éstas.

EJEMPLO 7.6 Halle la suma de los n primeros términos de la serie

2 · 5 + 3 · 7 + 4 · 9 + ···
El término general es ur = (r + 1)(2r + 3) para r = 1, 2, 3, . . . . Entonces

ur = 2r(r + 1) + 3r + 3

n
ur = 2 r(r + 1) + 3 r+3 1
r=1 r=1 r=1 r=1

1 1
= 2 × n(n + 1)(n + 2) + 3 × n(n + 1) + 3 × n
3 2
1
= n(4n + 21n + 35) .
2
6
174 Capı́tulo 7. Sucesiones y series

7.4. Series infinitas


El lı́mite de la sucesión de las sumas parciales es la (suma de la) serie infinita
n

S = lim u r = u1 + u 2 + u 3 + · · · (7.15)
n→∞
r=1

donde los puntos suspensivos indican que la suma debe extenderse indefinidamente. La
serie tiene suma sólo si el lı́mite es finito y único, esto es, cuando la sucesión de las
sumas parciales converge.

La serie geométrica
La serie geométrica es el lı́mite de la sucesión de sumas parciales

1 − xn
Sn = 1 + x + x2 + x3 + · · · + xn−1 = , x = 1
1−x

(cuando x = 1 la suma es n y la serie diverge). La sucesión de sumas presenta los seis


tipos de comportamiento ilustrados en la Figura 7.1 (el tipo (b) únicamente para el caso
trivial x = 0), y converge sólo cuando |x| < 1. Por lo tanto, para |x| < 1, xn → 0 cuando
n → ∞, y
 
1 − xn 1
lim =
n→∞ 1−x 1−x

1
de manera que la serie geométrica es el desarrollo de la función en potencias de x:
1−x
1
= 1 + x + x 2 + x3 + · · · , |x| < 1 . (7.16)
1−x

La serie diverge para todos los demás valores de x (|x| ≥ 1).

La serie armónica

1 1 1
S=1+ + + + ···
2 3 4
A pesar de las apariencias, la serie diverge. Puede ser escrita como la suma de sumas
parciales
7.5. Criterios de convergencia 175

   
1 1 1 1 1 1 1
S = 1+ + + + + + +
2 3 4 5 6 7 8
 
1 1 1 1 1 1 1 1
+ + + + + + + + + ···
9 10 11 12 13 14 15 16
1
= 1 + + s1 + s2 + s3 + · · ·
2
donde sn tiene 2n términos de los cuales el último, y menor, tiene valor 1/2n+1 . Cada una
de esas sumas es por lo tanto mayor que 2n × (1/2n+1 ) = 1/2. Por ejemplo,

1 1 1 1 1 1 1 1 1 1 1 1
s1 = + > + , s2 = + + + > + + + .
3 4 4 4 5 6 7 8 8 8 8 8
Se deduce que

1 1 1 1
S>1+ + + + + ···
2 2 2 2
y la serie diverge.6

7.5. Criterios de convergencia

El ejemplo de la serie geométrica muestra que es inmediato ver si una serie con-
verge, o lo contrario, si se tiene una expresión para las sumas parciales. La suma de la
serie infinita es el lı́mite de la sucesión de sumas parciales. Por otra parte, el ejemplo
de la serie armónica muestra que cuando no se conoce tal expresión, hay que emplear
procedimientos menos directos.
Dada una serie

ar = a1 + a 2 + a3 + · · ·
r=1

una primera condición necesaria para la convergencia es que el lı́mite de la sucesión {ar }
sea cero:

{ar } → 0 cuando r → ∞.

Si esta condición se satisface, se puede estudiar la convergencia de la serie de varias


maneras.

06. Esta demostración de la divergencia de la serie armónica y el tratamiento de otras series infinitas
aparece en las Quaestiones super geometriam Euclidis de Oresme (hacia 1350).
176 Capı́tulo 7. Sucesiones y series

El criterio de comparación
Sean A = a1 + a 2 + · · · + a r + · · ·
B = b 1 + b2 + · · · + br + · · ·

dos series de términos positivos. Entonces:


1. Si la serie B converge, entonces la serie A converge si ar ≤ br .
2. Si la serie B diverge, entonces la serie A diverge si ar ≥ br .

EJEMPLO 7.7 La serie


1 1 1
S=1+ + p + p + ···
2p 3 4
converge si p > 1 y diverge si p ≤ 1.
1. p = 1: S es la serie armónica y diverge.
2. p < 1: cada término de S (tras el primero) es mayor que el término correspondiente de la serie
armónica y S diverge.
3. p > 1: escribimos la serie como
   
1 1 1 1 1 1
S = 1+ + + + + + + ···
2p 3p 4p 5p 6p 7p

= 1 + s1 + s2 + · · ·
donde sn tiene 2n términos

np
nde los cuales el primero, y mayor, es 1/2 . Cada suma sn es entonces
2n 1
menor que np = y
2 2p−1
   2  3
1 1 1
S<1+ + + + ···
2p−1 2p−1 2p−1
 r
La serie de la derecha es una serie geométrica convergente x con x = 1/2p−1 < 1.
La serie S es por lo tanto convergente para todo p > 1.

Criterio del cociente de d’Alembert7


La serie a1 + a2 + · · · +ar + ar+1 + · · ·
 ar+1 
1. converge si lim   < 1,
r→∞ ar 

07. Jean LeRond d’Alembert (1717-1783). Secretario de la Academia Francesa, es más conocido
por su contribución al desarrollo post-newtoniano de la mecánica con su principio de los trabajos virtuales
(principio de d’Alembert) publicado en su Traité de Dynamique (1743). Contribuyó a la teorı́a de ecuaciones
diferenciales, al cálculo y a las series infinitas. En su Différentiel (1754) en la Encyclopédie des sciences,
des arts et des métiers (1751-1772) dio por primera vez la derivada como el lı́mite de un cociente de
incrementos pero, a causa de las dificultades conceptuales asociadas al lı́mite como proceso consistente en
un número infinito de pasos, la definición no fue aceptada hasta el trabajo de Cauchy (1821). Dio la solución
completa de la precesión de los equinoccios. Aunque el criterio del cociente se le suele atribuir a él, y a
veces también a Cauchy, fue probablemente dado por primera vez en 1776 por el matemático de Cambridge
Edward Waring (1734-1793).
7.5. Criterios de convergencia 177
 
 ar+1 
2. diverge si lim   > 1,
r→∞ ar 
3. puede hacer cualquiera de las dos cosas si el lı́mite es igual a 1, y otras pruebas son
necesarias.

EJEMPLOS 7.8 El criterio del cociente


(i) La serie geométrica 1 + x + x2 + x3 + · · ·
ar+1
El término general es ar = xr , ası́ que ar+1 = xr+1 y = x, independiente de r. Entonces
ar
 
 ar+1 
lim   = |x|
r→∞  ar 

y la serie converge si |x| < 1, diverge si |x| > 1, y el criterio falla para x = ±1. En este caso se demuestra
fácilmente por inspección que la serie diverge cuando x = ±1.

x x2 x3
(ii) La serie exponencial 1 + + + + ···
1! 2! 3!
r
x xr+1 ar+1 x
El término general es ar = , ası́ que ar+1 = y = . Entonces
r! (r + 1)! ar r+1
   
 ar+1   
lim   = lim  x  = 0
r→∞  ar  r→∞  r + 1 

y la serie converge para todo valor de x.

Criterio integral de Cauchy8


Sea a1 + a2 + · · · + ar + · · · una serie de términos positivos decrecientes (ar+1 < ar ).
Sea a(x) una función de la variable continua x tal que a(x) decrece al crecer x y a(r) = ar .

Entonces la serie  ∞
converge si a(x) dx converge (es finita y única),
 ∞1
diverge si a(x) dx diverge.
1

1 1
EJEMPLO 7.9 La serie armónica 1 + + ···
2 3
1 1  ∞  ∞
En este caso, ar = y a(x) = . Entonces 1
r x dx = ln x
1 x 1
y ln x → ∞ cuando x → ∞. Por lo tanto la serie armónica diverge.

08. Augustin-Louis Cauchy (1789-1857). El principal matemático francés de la primera mitad del
siglo XIX, es sobre todo conocido por su trabajo sobre la teorı́a de funciones de variable compleja, con el
teorema integral de Cauchy y el cálculo de residuos. Hizo contribuciones, entre otras, a las ecuaciones en
derivadas parciales, la teorı́a de la elasticidad, las series infinitas y los lı́mites (véase d’Alembert). Inventó el
término determinante para su clase de funciones simétricas alternadas (1812). El criterio integral se asocia
a veces con MacLaurin.
178 Capı́tulo 7. Sucesiones y series

Series alternadas
Si los términos de la serie a1 + a2 + a3 + · · · se van haciendo progresivamente más
pequeños y alternan su signo entonces la serie converge. Por ejemplo, la serie armónica
alternada
1 1 1
1− + − ···
2 3 4
converge. Veremos en el Apartado 7.2 que la suma de esta serie es ln 2.

7.6. Series de MacLaurin y de Taylor


Series de potencias
Una serie de potencias en la variable x tiene la forma de un ‘polinomio infinito’

c0 + c1 x + c2 x2 + c3 x3 + · · ·

donde c0 , c1 , c2 , . . . son constantes. Las propiedades de convergencia de tales series pue-


den estudiarse con los métodos descritos en el apartado anterior. Ası́, aplicando el criterio
del cociente, una serie de potencias converge si
   
 cr+1 xr+1   cr+1 
lim   
= |x| lim  <1
r→∞  cr xr  r→∞ cr 

o, de manera equivalente, si
 
 cr 
|x| < lim   = R, (7.17)
r→∞ cr+1 

donde R se llama radio de convergencia de la serie. La serie es por lo tanto convergente


si |x| < R, o −R < x < R, diverge si |x| > R, y para el caso x = ±R es necesario otro
método.
Las series geométrica y exponencial son ejemplos de series de potencias. La serie
geométrica tiene radio de convergencia R = 1, la serie exponencial tiene R = ∞ (véase
el ejemplo 7.8).

Serie de MacLaurin9
Vimos en el Apartado 7.4 que la serie geométrica puede entenderse como el desarro-
llo de la función 1/(1 − x) en potencias de x. De manera similar, la serie exponencial

09. Colin MacLaurin (1698-1746), profesor de matemáticas en Edimburgo. La serie que lleva su
nombre apareció en su Treatise of fluxions (1742), pero la serie de Taylor, más general, fue publicada en
1715, y era ya conocida por el matemático escocés James Gregory (1638-1675). El Treatise contiene además
el método para decidir la cuestión del máximo/mı́nimo analizando el signo de una derivada superior.
7.6. Series de MacLaurin y de Taylor 179

puede entenderse como el desarrollo de aquella función f (x) = ex cuya derivada es igual
a sı́ misma, f  (x) = f (x). Muchas otras funciones pueden desarrollarse de esta manera.
Sea f (x) una función de x que puede ser representada por una serie de potencias

f (x) = c0 + c1 x + c2 x2 + c3 x3 + c4 x4 + · · · (7.18)

Los coeficientes c0 , c1 , c2 , . . . pueden obtenerse de la siguiente manera. Las derivadas de


la función son
df
f  (x) = = c1 + 2c2 x + 3c3 x2 + 4c4 x3 + · · ·
dx
d2 f
f  (x) = = 2c2 + 6c3 x + 12c4 x2 + · · ·
dx2
d3 f
f  (x) = = 6c3 + 24c4 x + · · ·
dx3
...

Entonces, tomando x = 0,

f (0) = c0 , f  (0) = c1 , f  (0) = 2! c2 , f  (0) = 3! c3 , . . .

y, en general, para la derivada n-ésima,


 n 
d f (x) 1 (n)
f (0) =
(n)
= n! cn , cn = f (0) .
dxn x=0 n!

Sustituyendo en (7.18) tenemos entonces

x  x2 x3
xn ∞

f (x) = f (0) + f (0) + f  (0) + f  (0) + · · · = f (n) (0) . (7.19)


1! 2! 3! n=0
n!

Esta serie de potencias se llama desarrollo en serie de MacLaurin de la función f (x).


La serie de MacLaurin es un desarrollo de la función
f (x) en torno al punto x = 0 (Figura 7.2), esto es, el valor
de la función en el punto x se expresa mediante los valores
de la función y de sus derivadas en el punto x = 0. Para
que esto sea posible la función y sus derivadas tienen que
existir en x = 0 y además en todo el intervalo entre 0 y x.
Aparte de esto, el desarrollo sólo es válido dentro del radio
de convergencia de la serie.

Figura 7.2
180 Capı́tulo 7. Sucesiones y series

Ejemplos de series de MacLaurin


1. La serie binomial10
La serie binomial es el desarrollo de MacLaurin de la función (1 − x)a para valores
arbitrarios de a. Tenemos

f (x) = (1 + x)a
f  (x) = a(1 + x)a−1
f  (x) = a(a − 1)(1 + x)a−2
f  (x) = a(a − 1)(a − 2)(1 + x)a−3
...
f (n) (x) = a(a − 1)(a − 2) . . . (a − n + 1)(1 + x)a−n
...

Para x = 0, el factor (1 + x)a−n se sustituye por 1,

f (0) = 1, f  (0) = a, f  (0) = a(a − 1), f  (0) = a(a − 1)(a − 2), ...

y el desarrollo de MacLaurin es

a(a − 1) 2 a(a − 1)(a − 2) 3


(1 + x)a = 1 + ax + x + x + ··· (7.20)
2! 3!
con término general

a(a − 1)(a − 2) . . . (a − n + 1) n
x .
n!
La serie (7.20) se llama serie binomial, y es la generalización del desarrollo binomial,
ecuación (7.11), a una potencia arbitraria. De hecho, si a = n es un entero positivo,
las derivadas de órdenes n + 1 y superiores son cero, y (7.20) se reduce al desarrollo
binomial. Si a no es un entero positivo, la serie tiene radio de convergencia R = 1. De
esta manera, aplicando el criterio del cociente,
   
 cr   r 
R = lim    = lim  =1
r→∞ cr+1  r→∞ a − r 

y la serie binomial converge para valores −1 < x < +1. Puede converger además para
x = ±1.

010. El teorema (serie) binomial fue descubierto por Newton en 1665 y descrito en 1676 en cartas
dirigidas a Henry Oldenburg, secretario de la Royal Society, para su trasmisión a Leibniz. El teorema fue
publicado por Wallis en su Algebra de 1685.
7.6. Series de MacLaurin y de Taylor 181

La expresión más general, el desarrollo de (x + y)a , se obtiene a partir de (7.20)


factorizando el término xa , si |x| > |y|, o ya si |y| > |x|. De esta manera, si |x| > |y|,
  y a
(x + y)a = xa 1 +
 x 
 y  a(a − 1)  y 2 a(a − 1)(a − 2)  y 3
= x 1+a
a
+ + + · · · (7.21)
x 2! x 3! x

y la serie converge puesto que |y/x| < 1. La ecuación (7.21) puede también escribirse
como
a(a − 1) a−2 2 a(a − 1)(a − 2) a−3 3
(x + y)a = xa + axa−1 y + x y + x y + ··· (7.22)
2! 3!

EJEMPLOS 7.10

1. La serie geométrica:
1 (– 1)(– 2) (– 1)(– 2)(– 3)
= (1 − x)−1 = 1 + (– 1)(– x) + (– x)2 + (– x)3 + · · ·
1−x 2! 3!
= 1 + x + x2 + x3 + · · ·

  1 1 1 1 3
1 −2 2 −2 −2 3
2. (1 + x)1/2 = 1 + x+ 2 x + 2 x + ···
2 2! 3!
x x2 x3 5x4
=1+ − + − + ···
2 8 16 128

       1 1  
3. (8 + x)1/2 = √8 1 + x 1/2 = √8 1 + 1 x
+ 2
−2 x 2
8 2 8
1 1 3  2! 8

−2 −2 x 3
+ 2 + ···
3! 8
 
√ x x2 x3 5x4
= 8 1+ − + − + ··· .
16 512 8192 524288
Por ejemplo, si x = 1, tomando los cinco primeros términos de la serie,
 
√ √ 1 1 1 5 √
9 = 8 1+ − + − + · · · ≈ 8 × 1,06065941 ≈ 2,999998 .
16 512 8192 524288

2. Funciones trigonométricas
Las funciones trigonométricas sen x, cos x y tg x tienen derivada continua en x = 0, y
pueden desarrollarse en serie de MacLaurin. Por ejemplo, para la función seno,

f (x) = sen (x), f  (x) = cos (x), f  (x) = − sen (x), f  (x) = − cos (x), . . .
f (0) = 0, f  (0) = 1, f  (x) = 0, f  (x) = −1, . . .
182 Capı́tulo 7. Sucesiones y series

Entonces
x3 x5 x7
sen x = x − + − + ···
3! 5! 7!
Comparándola con la serie exponencial, se demuestra que la serie del seno converge para
todo x.

3. La función logarı́tmica

La función ln x no puede ser desarrollada en serie de potencias de x porque la fun-


ción y todas sus derivadas son discontinuas en x = 0. Sin embargo, la función ln (1 + x)

se comporta bien en x = 0:

f (x) = ln (1 + x) f (0) = 0
1
f  (x) = f  (0) = 1
1+x
−1
f  (x) = f  (0) = −1
(1 + x)2
2
f  (x) = f  (0) = 2
(1 + x)3
−6
f  (x) = f  (0) = −3!
(1 + x)4
...

La derivada n-ésima en x = 0 es f (n) (0) = (– 1)n−1 (n − 1)!, y

x 2 x3 x4
ln (1 + x) = x − + − + ···
2 3 4
La serie converge para |x| < 1. Ası́, cr /cr+1 = −(r + 1)/r → 1 cuando r → ∞, y por el
criterio del cociente (7.17), el radio de convergencia es R = 1. Además, para x = 1, la
serie es la serie armónica alternada (convergente):

1 1 1
ln 2 = 1 − + − + ···
2 3 4

4. Una lista con algunas series útiles


a(a − 1) 2 a(a − 1)(a − 2) 3
1. (1 + x)a = 1 + ax + x + x + ··· |x| < 1
2! 3!
x 3 x 5 x7
2. sen x = x − + − + · · · para todo x
3! 5! 7!
7.7. Valores aproximados y lı́mites 183

x2 x4 x6
3. cos x = 1 − + − + ··· para todo x
2! 4! 6!
x 3
2x5 17x7 π π
4. tg x = x + + + + ··· − <x<
3 15 315 2 2
x2 x3 x4
5. ln (1 + x) = x − + − + · · · −1 < x ≤ 1
2 3 4
2 3 4
x x x
6. ex = 1 + x + + + + · · · para todo x
2! 3! 4!
x3 x 5 x 7
7. senh x = x + + + + · · · para todo x
3! 5! 7!
x2 x4 x6
8. cosh x = 1 + + + + · · · para todo x.
2! 4! 6!

Series de Taylor11
La serie de MacLaurin, el desarrollo de una función f (x) en torno al punto x = 0, es
un caso especial del desarrollo más general de una función en torno al punto x = a:

x  x2 x3
xn

f (x + a) = f (a) + f (a) + f  (a) + f  (a) + · · · = f (n) (a) . (7.23)


1! 2! 3! n=0
n!

Esta serie de potencias se llama desarrollo en serie de Taylor de la función f (x). Una
expresión alternativa, y equivalente, para la serie es

(x − a)  (x − a)2  (x − a)3 


f (x) = f (a) + f (a) + f (a) + f (a) + · · ·
1! 2! 3!


(x − a)n (n)
= f (a) . (7.24)
n=0
n!

La verificación y las condiciones de existencia de la serie de Taylor son como para la


serie de MacLaurin.

7.7. Valores aproximados y lı́mites


Las series de MacLaurin y de Taylor proporcionan una herramienta sistemática para
aproximar funciones por medio de polinomios (véanse los Ejemplos 1.6, 3.19 y 7.10).
Consideremos por ejemplo la serie logarı́tmica

x 2 x3 x4
ln (1 + x) = x − + − + ··· , −1 < x ≤ 1 .
2 3 4

011. Brook Taylor (1685-1731), secretario de la Royal Society. La serie que lleva su nombre apare-
ció en su Methodus incrementorum (1715), pero ya era conocida por James Gregory.
184 Capı́tulo 7. Sucesiones y series

Si la serie se acaba tras un número finito de términos, el resultado es un polinomio que


aproxima la función. La serie proporciona por lo tanto una sucesión de tales aproxima-
ciones:
x2 x2 x3
u1 = x , u2 = x − , u3 = x − + ,···
2 2 3
Algunos de estos valores se muestran en la Tabla 7.2.

Tabla 7.2 Valores de ln (1 + x)

u1 = x u2 = x − x2 /2 u3 = x − x2 /2 + x3 /3 ln (1 + x) = lim (un )
n→∞

0 0 0 0
0,0001 0,0000 9999 5 0,0000 9999 5000 0,0000 9999 5000
0,001 0,0009 995 0,0009 9950 0333 0,0009 9950 0333
0,01 0,0099 5 0,0099 5033 33 0,0099 5033 08
0,1 0,095 0,0953 333 0,0953 310
0,2 0,18 0,1826 66 0,1823 21
1,0 0,5 0,83 0,69

La Tabla muestra que u1 = x es una buena aproximación de ln (1 + x) cuando x ≤ 0,1 y


que la serie converge rápidamente para esos valores pequeños de x, ya que cada término
proporciona al menos una cifra exacta adicional. La convergencia no es tan buena para
valores de x mayores, y ası́ son necesarios ocho términos para tener una precisión del
10 % cuando x = 1. El fundamento teórico para este uso de la serie es el teorema de
Taylor.

El teorema de Taylor
Sea f (x) una función continua y univaluada de x con derivadas f  (x), f  (x), . . . , f (n) (x)
continuas en el intervalo desde a a x, y suponemos que f (n+1) (x) existe en el intervalo.
Entonces
(x − a)  (x − a)2  (x − a)n (n)
f (x) = f (a) + f (a) + f (a) + · · · + f (a) + Rn (x) (7.25)
1! 2! n!
donde
(x − a)n+1 (n+1)
Rn (x) = f (b) (7.26)
(n + 1)!

y a < b < x es algún punto del intervalo. El término Rn (x) se llama resto y es el error
que comporta aproximar la función por un polinomio de grado n. Los valores menor y
mayor de Rn (x) son las cotas inferior y superior del error. La serie infinita se obtiene en
el lı́mite n → ∞ si Rn (x) → 0 cuando n → ∞.
7.7. Valores aproximados y lı́mites 185

EJEMPLO 7.11 La serie exponencial


Por el teorema de Taylor (para a = 0),

x2 xn
ex = 1 + x + + ··· + + Rn (x)
2! n!
donde
xn+1
Rn (x) = eb
(n + 1)!
para algún punto 0 < b < x. Cuando x > 0, los valores menor y mayor de Rn vienen dados por

xn+1 xn+1
< Rn (x) < ex .
(n + 1)! (n + 1)!
Entonces
x2 xn xn+1 x2 xn xn+1
1+x+ + ··· + + < ex < 1 + x + + ··· + + ex
2! n! (n + 1)! 2! n! (n + 1)!
Por ejemplo, para x = 0,2 y n = 3 (y redondeando todos los números a seis cifras decimales), la aproxima-
ción cúbica tiene por valor

(0,2)2 (0,2)3
e0,2 ≈ 1 + 0,2 + + = 1,221333
2 6
y las cotas del error son
0,000067 < R3 < 0,000067e0,2
de manera que
1,221333 + 0,000067 < e0,2 < 1,221333 + 0,000067e0,2
La cota inferior es 1,221400. Para la cota superior,

e0,2 < 1,221333 + 0,000067e0,2


e0,2 − 0,000067e0,2 = 0,999933e0,2 < 1,221333 .
Por lo tanto
e0,2 < 1,221333/0,999933 = 1,221415
y
1,221400 < e0,2 < 1,221415 .
El valor exacto es 1,221403.

Lı́mites
La serie de MacLaurin muestra el comportamiento de una función cuando la variable
es muy pequeña. Ası́, ln (1 + x) ≈ x cuando x es suficientemente pequeño, de manera
que en las proximidades de x = 0 la función y = ln (1 + x) se puede aproximar por la
recta y = x. De manera similar, cuando x es suficientemente pequeño,

x 3 x5
sen x = x − + − ··· ≈ x,
3! 5!
x2 x4 x2
cos x = 1 − + − ··· ≈ 1 − .
2! 4! 2
186 Capı́tulo 7. Sucesiones y series

Otra manera de expresar los mismos resultados es mediante lı́mites. Ası́ (Figura 7.3)

sen x x2 x4
= 1 − + − ···
x 3! 5!
de manera que en el lı́mite x → 0,
 sen x 
lim = 1. (7.27)
x→0 x
De manera similar,
 
1 − cos x 1
lim = . (7.28)
x→0 x 2
2 Figura 7.3

Más generalmente, el uso de las series de potencias proporciona un modo sistemático de


determinación del cociente de dos funciones,

f (x)
lim ,
x→a g(x)

cuando f (x) → 0 y simultáneamente g(x) → 0 al tender x → a. No es posible en este


caso sustituir x = a porque el resultado serı́a la indeterminación 0/0. Sin embargo, si se
desarrollan ambas funciones en serie de Taylor, tenemos por la ecuación (7.24)

(x − a)2 
f (x) f (a) + (x − a)f  (a) + f (a) + · · ·
= 2!
g(x) (x − a)2 
g(a) + (x − a)g (a) + g (a) + · · ·
2!
Entonces, como f (a) = g(a) = 0,

(x − a) 
f (x) f  (a) + f (a) + · · ·
= 2!
g(x) (x − a) 
g (a) + g (a) + · · ·
2!
y, si g (a) no es cero,

f (x) f  (a) f  (a)


lim =  = lim  (7.29)
x→a g(x) g (a) x→a g (a)

Este método para hallar lı́mites se denomina la regla de l’Hôpital.12 Si g (a) = 0 pero

012. Guillaume François Antoine de l’Hôpital (1661-1704). Noble francés y matemático aficionado,
fue instruido por Johann Bernoulli en el nuevo cálculo. La regla que se le atribuye estaba contenida en una
7.8. Operaciones con series de potencias 187

f  (a) = 0 el lı́mite es infinito. Si f  (a) y g (a) son ambos cero se repite el proceso y se
obtiene
f (x) f  (a)
lim =  (7.30)
x→a g(x) g (a)

y ası́ sucesivamente.

EJEMPLOS 7.12 Halle los lı́mites.


 sen x − x 
1. lim .
x→0 x3

sen x − x (x − x3 /3! + x5 /5! − · · · ) − x


=
x3 x3
−x3 /3! + x5 /5! − · · · −1 x5 1
= = + − ··· → − cuando x → 0.
x3 3! 5! 6
 
x 2 ex
2. lim . El numerador es x2 (1 + x + x2 /2 + · · · ). El denominador es
x→0 (ex − 1)2
 2
(1 + x + x2 /2 + · · · ) − 1 = (x + x2 /2 + · · · )2 = x2 + x3 + · · ·

Por lo tanto,
x 2 ex x2 (1 + x + · · · )
= 2 → 1 cuando x → 0 .
− 1)
(ex 2 x (1 + x + · · · )
Este ejemplo es importante en mecánica estadı́stica de sólidos. Según la teorı́a de Einstein sobre
capacidades calorı́ficas de sólidos atómicos simples, cada átomo del sólido se supone que vibra con
la misma frecuencia ν. La capacidad calorı́fica molar del sólido es entonces

x 2 ex
Cv = 3R
(ex− 1)2
con x = hν/kT, donde h es la constante de Planck, k la constante de Boltzmann, R la constante
de los gases y T la temperatura. Tomar el lı́mite x → 0 corresponde a hacer T → ∞. Por lo tanto
Cv → 3R.

7.8. Operaciones con series de potencias


Sean

A(x) = ar x r
y B(x) = br x r
r=0 r=0

dos series de potencias con radios de convergencia RA y RB , respectivamente.

carta de Bernoulli en 1694 y apareció en el influyente libro de texto de l’Hôpital sobre cálculo, Analyse des
infiniment petits (1696).
188 Capı́tulo 7. Sucesiones y series

(i) Suma y resta.

Las series de potencias pueden ser sumadas o restadas término a término para dar
una serie de potencias

C(x) = A(x) ± B(x) = (ar ± br )xr (7.31)


r=0

cuyo radio de convergencia es al menos tan grande como el menor de RA y RB .

(ii) Multiplicación.

El producto de A(x) y B(x) es la doble suma infinita

C(x) = A(x)B(x) = ar bs xr+s


r=0 s=0

que puede reordenarse como el producto de Cauchy

C(x) = a0 b0 + (a0 b1 + a1 b0 )x + (a0 b2 + a1 b1 + a2 b0 )x2 + · · · = cr xr ,


r=0

donde

cr = ai br−i . (7.32)
i=0

El radio de convergencia es igual al menor de RA y RB .

EJEMPLO 7.13 Multiplicación de series de potencias

  
(3x)2 (– 2x)2
e3x × e−2x = 1 + 3x + + · · · 1 + (– 2x) + + ···
2! 2!
   
(– 2)2 32
= 1 + 1 × (– 2) + 3 × 1 x + 1 × + 3 × (– 2) + × 1 x2 + · · ·
2! 2!
x2
= 1+x+ + · · · = ex .
2!

(iii) Derivación e integración.

Una serie de potencias puede ser derivada o integrada término a término dando lugar a
una serie de potencias cuyo radio de convergencia es el mismo que el de la serie original.
7.9. Ejercicios 189

Ası́, la derivación término a término de

A(x) = ar x r = a0 + a1 x + a 2 x 2 + a3 x 3 + · · ·
r=0

da

dA

= rar xr−1 = a1 + 2a2 x + 3a3 x2 + · · · (7.33)


dx r=0

Igualmente, la integración término a término de la serie A(x) da




∞ 

ar r+1
A(x) dx = ar xr dx = x +c
r+1
r=0 r=0 (7.34)
a1 a2
= c + a0 x + x 2 + x 3 + · · · ,
2 3
siendo c una constante de integración arbitraria. El radio de convergencia tanto de la
serie derivada como de la integrada es R = RA .

EJEMPLO 7.14 Derivación e integración de una serie de potencias


 
d 1 d  
= 1 + x + x2 + x3 + x4 + · · ·
dx 1−x dx
1
= 1 + 2x + 3x2 + 4x3 + · · · = ,
(1 − x)2
     
1
dx = 1 + x + x2 + x3 + x4 + · · · dx
1−x
x2 x3 x4 x5
= c+x+ + + + + · · · = − ln (1 − x) + c ,
2 3 4 5
siendo c una constante arbitraria y |x| < 1.

7.9. Ejercicios
Apartado 7.2
Halle (a) el término general y (b) la relación de recurrencia para las sucesiones:
1 1 1
1. 1, 4, 7, 10, . . . 2. 1, 3, 9, 27, . . . 3. 1, − , ,− , ...
5 25 125
Halle los 4 primeros términos de las sucesiones definidas por:
 i
1 2
4. ur+1 = ur + , u1 = 0 5. vi = , i = 0, 1, 2, . . .
2 3
1 wn
6. ux = , x = 1, 2, 3, . . . 7. wn+1 = , w1 = 1
x(x + 2) n
190 Capı́tulo 7. Sucesiones y series

Halle el lı́mite r → ∞ para:


1 1
8. 9. 2r 10.
3r r+2
r r 3r2 + 3r + 1
11. 12. 13.
r+2 r2 +r+1 5r2 − 6r − 1
1
14. Halle el lı́mite de la sucesión definida por xn+1 = 1 + , x1 = 1.
xn

Apartado 7.3
Halle la suma de las series finitas:

15. 1 + 5 + 9 + . . . + 49 16. 1 + 3 + 9 + 27 + . . . + 729


Halle la suma de los n primeros términos:

17. 3 − 2 − 7 − 12 − . . . 18. 1 + 4 + 16 + 64 + . . .
1 1 1
19. 1+ + + + ... 20. x + 3x + 5x + 7x + . . .
3 9 27
21. x3 + x5 + x7 + . . . 22. 1 + 2x + 4x2 + . . .
n
23. Calcule los coeficientes binomiales , r = 0, 1, . . . n, para
r
(i) n = 3 (ii) n = 4 (iii) n = 6
Desarrolle en potencias de x:

24. (1 − x)3 25. (1 + 3x)4 26. (1 − 4x)5 27. (3 − 2x)4 28. (3 + x)6

10
1
29. Halle .
n=1
n(n + 1)
 
1 1 1 1
30. Compruebe que = − , y pruebe entonces que
r(r + 2) 2 r r+2

n  
1 3 1 1 1
= − − .
r=1
r(r + 2) 4 2 n+1 n+2

1
31. Expresando en fracciones simples , demuestre que
r(r + 1)(r + 2)

n
1 1 1
= − .
r=1
r(r + 1)(r + 2) 4 2(n + 1)(n + 2)

32. Compruebe que (1 + r) − r3 = 3r2 + 3r + 1, y pruebe entonces que


3

n
1
r2 = n(n + 1)(2n + 1) .
r=1
6

33. Desarrolle (1 + r) − r , y use entonces las series de la Tabla 7.1 para demostrar que
6 6

n
1 6 1 5 5 1
r5 = n + n + n4 − n2 .
r=1
6 2 12 12
7.9. Ejercicios 191

Apartado 7.4
34. La función de partición vibracional de un oscilador armónico viene dada por la serie


qv = e−nθv /T ,
n=0

donde θv = hνe /k es la temperatura vibracional. Confirme que la serie es una serie geométrica convergente,
y halle su suma.

Apartado 7.5
Estudie la convergencia de las siguientes series:


1

1


1

sa
35. 36. 37. 38.
r=1
r 2
n=2
ln n k=0
2k + 1 s=0
s!


r+2




ln r


1
39. 40. sen 41. 42.
r=0
(r + 3)2 m=0
2 r=1
r3 n=2
n ln n

Apartado 7.6
Halle el radio de convergencia para cada una de las siguientes series:


xm


43. 44. (– 1)r x2r 45. nxn
m=0
4m r=0 n=1



xn



(– 1)n (x − 1)2n
46. 47. mm x m 48.
n=1
n2 m=1 n=0
3n
Escriba los 5 primeros términos de la serie de MacLaurin de las siguientes funciones:
1 1
49. (1 + x)1/3 50. 51. (1 − x)−1/2 52.
1 + x2 3+x
2
ln (1 − 2x) + 2x ex − 1
53. sen 2x2 54. e−3x 55. 2
56.
x x
Desarrolle cada una de las siguientes funciones en serie de Taylor en torno al punto indicado, y determine
los valores de x para los cuales la serie converge:
1
57. ,1 58. ex , 2 59. sen (x + 1), −1 60. ln x, 2
x
61. Un cuerpo con masa en reposo m0 y velocidad v tiene una energı́a relativista
m0 c2
E = mc2 = 
1 − v2 /c2

y energı́a cinética T = E − m0 c2 . Exprese T en serie de potencias de v y demuestre que la serie se reduce a


la energı́a cinética no relativista en el lı́mite v/c → 0.
62. La ecuación de estado de un gas puede expresarse en función de la serie

∞  n i
pV = nRT Bi (T) ,
i=0
V

donde los Bi se denominan coeficientes del virial. Halle los tres primeros coeficientes para
192 Capı́tulo 7. Sucesiones y series
 
n2 a
(i) la ecuación de van der Waals, p+ (V − nb) = nRT,
V2
(ii) la ecuación de Dieterici, p(V − nb) = nRTe−an/RTV .

Apartado 7.7
63. (i) Halle el desarrollo de MacLaurin de la función (8 + x)1/3 hasta términos en x4 .

(ii) Use ese desarrollo para dar un valor aproximado de 3 9.
(iii)√Use ese valor y el teorema de Taylor para el resto, para acotar superior e inferiormente el valor
de 3 9.
Halle los lı́mites:
ex − 1 tg x − sen x ex + e−x − 2 ln x
64. lim 65. lim 66. lim 67. lim
x→0 x x→0 x3 x→0 cos x − 1 x→1 x2 − 1
68. La densidad de energı́a de la radiación de cuerpo negro a temperatura T viene dada por la fórmula de
Planck
8πhc  hc/λkT −1
ρ(λ) = e −1 ,
λ 5

siendo λ la longitud de onda.


8πkT
Demuestre que la fórmula se reduce a la ley clásica de Rayleigh-Jeans ρ = (i) para longitudes de
λ4
onda largas (λ → ∞), (ii) si la constante de Planck se toma como cero (h → 0).

Apartado 7.8
69. Halle el producto de Cauchy para el desarrollo en serie de potencias de sen x y cos x, y demuestre que
es igual a 12 sen 2x.
70. Derive el desarrollo en serie de potencias de sen x y demuestre que el resultado es cos x.

71. Integre la serie de potencias de sen x y demuestre que el resultado es c − cos x, donde c es una
constante.
Números complejos

8.1. Conceptos

Vimos en el Apartado 1.4 y en el Capı́tulo 2 que las soluciones de ecuaciones al-


gebraicas no son siempre
√ números reales. En particular, las soluciones de la ecuación
x2 = −1 son x = ± −1, y la raı́z cuadrada de un número negativo no es un número
real.1 Tales números se incorporan al sistema de números definiendo la raı́z cuadrada
de −1 como un nuevo número representado normalmente por el sı́mbolo i (o j en las
matemáticas utilizadas en ingenierı́a) con la propiedad

i2 = −1 . (8.1)

Un número que contiene i = −1 se llama número complejo. Algunos ejemplos son
2i, −3i y 2 + 5i. Un número complejo general tiene la forma (normalmente se usa la
letra z para representar un número complejo)

z = x + iy , (8.2)

donde x e y son números reales. El número x se llama la parte real de z e y se llama la


parte imaginaria de z:

x = Re (z) , y = Im (z) . (8.3)

01. Las raı́ces cuadradas de números negativos se mencionan en la Ars Magna de Cardano de 1545
en relación con la solución de ecuaciones cuadráticas y cúbicas. Cardano calificó tal resultado de ‘tan sutil
como inútil’. Rafael Bombelli (1526-1572),
√ ingeniero italiano, llamaba ‘più di meno’ (más de menos) y
‘meno di meno’ (menos de menos) a ± −1, y presentó la aritmética de los números complejos en su Alge-
bra de 1572. La primera consideración seria de los números complejos la hizo Albert Girard (1595-1632),
quien en su L’invention nouvelle en l’algèbre (La nueva invención en álgebra), 1629, publicó la primera
formulación del teorema fundamental del álgebra. Decı́a de las soluciones complejas de las ecuaciones que
eran ‘imposibles’ pero ‘buenas por tres cosas: por la certeza de la regla general (el teorema), por el hecho
de que no hay otras soluciones
√ y por
√ su uso’.√Descartes usó
√ los términos ‘real’ e ‘imaginario’. √ Leibniz
factorizó x4 + a4 = (x + a i)(x − a i)(x + a −i)(x − a −i). Euler propuso el sı́mbolo i para −1 en
1777, y Gauss lo adoptó en su Disquisitiones arithmeticae de 1801.
194 Capı́tulo 8. Números complejos

Si x = 0, se dice que z = iy es imaginario puro. Si y = 0, z = x es real, de forma que


el conjunto de los números complejos incluye a los números reales como subconjunto.

Potencias de i
Cada potencia de i es uno de los números i, −i, 1, −1. Por ejemplo,

1 i i
i3 = i2 × i = −i, i4 = (i2 )2 = 1, i−1 = = 2 = = −i .
i i −1
En general, para los enteros n = 0, ±1, ±2, . . . ,

i4n = +1, i4n+1 = +i , i4n+2 = −1 , i4n+3 = −i . (8.4)

Aparte de su papel en la extensión de los números, los número complejos aparecen en


varias ramas de las matemáticas y son importantes en las ciencias fı́sicas. Por ejemplo,
las soluciones de las ecuaciones diferenciales del movimiento en mecánica tanto clásica
como cuántica a menudo implican números complejos. También aparecen los números
complejos en la formulación de la teorı́a
√ fı́sica: las ecuaciones básicas de la mecánica
cuántica implican obligatoriamente i = −1.

8.2. El álgebra de los números complejos


Los números complejos pueden sumarse, restarse, multiplicarse y dividirse de mane-
ra muy parecida a la de los números reales ordinarios. Sólo es necesario acordarse de
sustituir i2 por −1 cada vez que aparezca. Sean dos números complejos

z1 = x1 + iy1 , z2 = x2 + iy2 . (8.5)

Igualdad
Dos números complejos son iguales si sus partes reales son iguales y si sus partes
imaginarias son iguales:

z1 = z2 si x1 = x2 e y1 = y2 . (8.6)

Suma

z1 + z2 = (x1 + x2 ) + i(y1 + y2 ) . (8.7)

Las partes reales de z1 y de z2 se suman para dar la parte real de la suma, las partes
imaginarias se suman para dar la parte imaginaria de la suma.
8.2. El álgebra de los números complejos 195

Multiplicación

z1 z2 = (x1 + iy1 )(x2 + iy2 )


= x1 (x2 + iy2 ) + iy1 (x2 + iy2 ) = (x1 x2 + ix1 y2 ) + (iy1 x2 + i2 y1 y2 )
= (x1 x2 − y1 y2 ) + i(x1 y2 + y1 x2 ) , (8.8)

usando que i2 = −1.

EJEMPLOS 8.1 Suma y resta


1. (2 + 3i) + (4 − 3i) = (3 + 4) + (2 − 3)i = 7 − i
2. (3 + 2i) − (3 − 2i) = (3 − 3) + (2 + 2)i = 4i
3. (3 + 2i) + (4 − 2i) = 7

EJEMPLOS 8.2 Multiplicación


1. (2 + 3i)(3 + 4i) = 2(3 + 4i) + 3i(3 + 4i) = 6 + 8i + 9i + 12i2 = −6 + 17i
2. i(2 − 3i) = 2i − 3i2 = 3 + 2i

Conjugación
Sea z = x + iy un número complejo arbitrario, el número que se obtiene a partir de él
sustituyendo i por −i es

z∗ = x − iy (8.9)

y se llama el complejo conjugado de z (a veces se usa z̄ en vez de z∗ ). El par de números


complejos conjugados z y z∗ (z es, a su vez, el complejo conjugado de z∗ ) tiene las
siguientes propiedades:

1 1 
(i) (z + z∗ ) = (x + iy) + (x − iy) = x = Re (z) (8.10)
2 2
1 1 
(ii) (z − z∗ ) = (x + iy) − (x − iy) = iy = i Im (z) (8.11)
2 2
(iii) zz∗ = (x + iy)(x − iy) = x2 + y2 (real y positivo) (8.12)

EJEMPLOS 8.3 Pares de números complejos conjugados


1. Para z = 2 + 3i, z∗ = 2 − 3i y
1 1
(z + z∗ ) = 2 , (z − z∗ ) = 3i , zz∗ = 22 + 32 = 13 .
2 2
2. Para z = 1 − i, z∗ = 1 + i y
1 1
(z + z∗ ) = 1 , (z − z∗ ) = −i , zz∗ = 1 + 1 = 2 .
2 2
196 Capı́tulo 8. Números complejos

División

z1 (x1 + iy1 )
z1 ÷ z2 = = .
z2 (x2 + iy2 )

La división puede hacerse usando las reglas de la división entera. Un método más senci-
llo es utilizar la propiedad (8.12) de los pares conjugados para transformar el denomina-
dor en un número real. Ası́, multiplicando arriba y abajo por z∗2 = x2 − iy2 , el complejo
conjugado del denominador z2 , tenemos

z1 z1 z∗2 (x1 + iy1 )(x2 − iy2 ) (x1 + iy1 )(x2 − iy2 )


= = =
z2 z2 z∗2 (x2 + iy2 )(x2 − iy2 ) x22 + y22
   
x1 x2 + y1 y2 y1 x2 − x1 y2
= +i . (8.13)
x2 + y2
2 2
x22 + y22

La división está definida únicamente si z2 = 0, es decir, si x2 = 0 e y2 = 0.

EJEMPLOS 8.4 División

2 + 3i (2 + 3i)(3 − 4i) 18 + i 18 i
1. = = 2 = +
3 + 4i (3 + 4i)(3 − 4i) 3 + 42 25 25
1+i (1 + i)(1 + i) 0 + 2i
2. = = =i
1−i (1 − i)(1 + i) 1+1

8.3. Representación gráfica


El número complejo z = x + iy se representa gráficamente por un punto en un plano
con coordenadas (x, y), como en la Figura 8.1.2 Este plano se denomina plano comple-
jo. Los números reales, con y = 0, se representan por puntos en el eje x o eje real y los
número imaginarios puros, con x = 0, están en el eje y o eje imaginario. La representa-
ción se llama diagrama de Argand.

02. John Wallis (1616-1703) fue el primero en sugerir que los números imaginarios puros podrı́an
representarse en una recta perpendicular al eje de los números reales. Caspar Wessel (1745-1818), agrimen-
sor noruego, trató la representación gráfica de números complejos en Sobre la representación analı́tica de
la dirección de 1797, y Jean Robert Argand (1768-1822), tenedor de libros suizo, lo hizo en su Essai de
1806. Gauss utilizó la misma interpretación de los números complejos en su cuarta y última demostración
del teorema fundamental del álgebra en 1848, pensando que para entonces los matemáticos estarı́an ya su-
ficientemente acostumbrados a los números complejos como para aceptarla. El plano complejo también se
llama plano gaussiano.
8.3. Representación gráfica 197

Figura 8.1

La distancia del punto z al origen, r = x2 + y2 , se llama el módulo de z y se representa
como

r = mod z = |z| . (8.14)

Los números complejos con mismo módulo r = |z| están en el cı́rculo de radio r en el
plano. Si |z| = 1, se dice que el punto está en el cı́rculo unidad.

Representación polar
La posición del punto z = x + iy en el plano puede especificarse utilizando las coor-
denadas r y θ, como en la Figura 8.1. En ese caso

x = r cos θ , y = r sen θ ,

y el número complejo se puede escribir en la forma polar

z = r( cos θ + i sen θ) . (8.15)

El ángulo θ se llama argumento o ángulo de z,

θ = arg z . (8.16)

El ángulo puede tener cualquier valor real pero, como vimos en el Capı́tulo 3, las funcio-
nes trigonométricas de (8.15) son funciones periódicas en θ de manera que el número z
no cambia si se añade a θ un múltiplo de 2π. Al transformar de coordenadas cartesianas
a polares se obtiene a partir de x y de y un único valor si utilizamos el convenio dado en
el Apartado 3.4. Ası́, dado que tg θ = y/x,
y
arg z = arctg , si x > 0,
x
y (8.17)
= arctg + π , si x < 0,
x
donde estamos tomando para el arco tangente su valor principal.
198 Capı́tulo 8. Números complejos

EJEMPLOS 8.5 Exprese z = x + iy en forma polar.


(i) z = 1 + i.
Tenemos x = 1 e y = 1 de manera que
 √ y
r = |z| = x2 + y2 = 2, arctg = arctg (1) .
x
El valor principal de arctg (1) es π/4 y, como el punto está en el primer
cuadrante, con x > 0, arg z = π/4. Por lo tanto
√  π π
z = 2 cos + i sen .
4 4 Figura 8.2

1 3
(ii) z = − − i.
2 2 √
Tenemos x = −1/2 e y = − 3/2 de manera que

 2  √ 2
1 3
r= + = 1,
2 2
y √
arctg = arctg ( 3) .
√ x
El valor principal de arctg ( 3) es π/3 y, como x < 0, se sigue que
√ 4π 4π
arg z = arctg ( 3) + π = 4π/3. Por lo tanto z = cos + i sen . Figura 8.3
3 3

Representación de operaciones aritméticas


Suma y resta
En la Figura 8.4 se representan los números z1 = x1 +iy1 y z2 = x2 +iy2 por los puntos
P y Q, respectivamente. La representación de la suma z1 + z2 se obtiene completando el
paralelogramo OPSQ. El punto S tiene coordenadas (x1 + x2 , y1 + y2 ) como es necesario
para que cumpla

z1 + z2 = (x1 + x2 ) + i(y1 + y2 ) .

De manera similar para la resta: la diferencia z1 − z2 es la suma de z1 y de −z2 .

Figura 8.4
8.3. Representación gráfica 199

Multiplicación y división

Las operaciones de multiplicación y de división se describen más fácilmente cuando


los números se expresan en forma polar. Si

z1 = r1 ( cos θ1 + i sen θ1 ) , z2 = r2 ( cos θ2 + i sen θ2 ) , (8.18)

entonces

z1 z2 = r1 r2 ( cos θ1 + i sen θ1 )( cos θ2 + i sen θ2 )


 
= r1 r2 ( cos θ1 cos θ2 − sen θ1 sen θ2 ) + i( cos θ1 sen θ2 + sen θ1 cos θ2 )
 
= r1 r2 cos (θ1 + θ2 ) + i sen (θ1 + θ2 ) . (8.19)

Se deduce que el producto de dos números complejos tiene módulo igual al producto de
los módulos de los números, y tiene argumento igual a la suma de los argumentos:

|z1 z2 | = |z1 | × |z2 |, arg (z1 z2 ) = arg (z1 ) + arg (z2 ) . (8.20)

Figura 8.5

Si dos números forman un par de complejos conjugados, z = x + iy y z∗ = x − iy,


entonces

|z| = |z∗ | = x2 + y2 , arg z = − arg z∗ ,

zz∗ = |z|2 = x2 + y2 , arg zz∗ = 0 .

En el caso de la división,
 
z1 |z1 | z1
= = arg (z1 ) − arg (z2 ) ,
z2 |z2 | , arg
z2
(8.21)
200 Capı́tulo 8. Números complejos

y
z1 r1  
= cos (θ1 − θ2 ) + i sen (θ1 − θ2 ) . (8.22)
z2 r2

Se deduce de (8.22) que para el inverso de un número complejo

1 1 
= cos (– θ) + i sen (– θ) (8.23)
z r

y, como cos (– θ) = cos (θ) y sen (– θ) = − sen (θ),

1 1 
= cos (θ) − i sen (θ) . (8.24)
z r

EJEMPLOS 8.6 Exprese cada uno de los números z1 z2 , z1 /z2 y z2 /z1 como un único número complejo,
siendo (véanse los Ejemplos 8.5)
√  π π 4π 4π
z1 = 2 cos + i sen , z2 = cos + i sen .
4 4 3 3

Tenemos r1 = 2, r2 = 1, θ1 = π/4 y θ2 = 4π/3. Por lo tanto

1. r1 r2 = 2, θ1 + θ2 = 19π/12 y, por la ecuación (8.19),
 
√ 19π 19π
z1 z2 = r1 r2 (cos (θ1 + θ2 ) + i sen (θ1 + θ2 )) = 2 cos + i sen .
12 12

2. r1 /r2 = 2, θ1 − θ2 = −13π/12 y, por la ecuación (8.22),
z1 r1  
= cos (θ1 − θ2 ) + i sen (θ1 − θ2 )
z2 r2
    
√ 13π 13π
= 2 cos − + i sen −
12 12
 
√ 13π 13π
= 2 cos − i sen .
12 12

3. z2 /z1 = (z1 /z2 )−1 y, por la ecuación (8.24),


 
z2 1 13π 13π
= √ cos + i sen .
z1 2 12 12

Fórmula de De Moivre
Se deduce de las relaciones (8.20) que el producto de tres o más números complejos
tiene módulo igual al producto de los módulos de los números y tiene argumento igual a
la suma de los argumentos. Por ejemplo, para el producto de tres números

|z1 z2 z3 | = |z1 z2 | × |z3 | = |z1 | × |z2 | × |z3 | ,


8.3. Representación gráfica 201

arg (z1 z2 z3 ) = arg (z1 z2 ) + arg (z3 ) = arg (z1 ) + arg (z2 ) + arg (z3 ) .

Por lo tanto
 
z1 z2 z3 = r1 r2 r3 cos (θ1 + θ2 + θ3 ) + i sen (θ1 + θ2 + θ3 )

y, en general,
 
z1 z2 . . . zn = r1 r2 . . . rn cos (θ1 + θ2 + · · · + θn ) + i sen (θ1 + θ2 + · · · + θn ) . (8.25)

En el caso especial en que todos los números son iguales a z = r(cos θ + i sen θ),

zn = rn (cos nθ + i sen nθ) . (8.26)

Para un número en el cı́rculo unidad del plano complejo (r = 1), z = cos θ + i sen θ, y

(cos θ + i sen θ)n = cos nθ + i sen nθ . (8.27)

Ésta es la fórmula de De Moivre para n un entero positivo.3 La fórmula es también


válida para otros valores de n. Por ejemplo, por las ecuaciones (8.27) y (8.23),

1 1
= = cos (– nθ) + i sen (– nθ) ,
(cos θ + i sen θ)n cos nθ + i sen nθ

de manera que

(cos θ + i sen θ)−n = cos (– nθ) + i sen (– nθ) = cos nθ − i sen nθ . (8.28)

La fórmula de De Moivre puede usarse para obtener muchas de las fórmulas de trigono-
metrı́a (véase el Apartado 3.2). Por ejemplo, la ecuación (8.27) es para n = 2

(cos θ + i sen θ)2 = cos 2θ + i sen 2θ .

Desarrollando el primer miembro obtenemos

(cos2 θ − sen2 θ) + i(2 sen θ cos θ) = cos 2θ + i sen 2θ .

03. Abraham de Moivre (1668-1754) llegó a Inglaterra en 1688 huyendo de la persecución que su-
frı́an los hugonotes franceses. La primera expresión de la fórmula aparece en un artı́culo de 1707 de las
Philosophical Transactions. De Moivre fue amigo de Newton. En sus últimos años, Newton decı́a a quien
viniera a visitarle con preguntas matemáticas: ‘vaya a ver a Mr. De Moivre, él sabe de esas cosas más que
yo’.
202 Capı́tulo 8. Números complejos

Una única ecuación entre dos números complejos es equivalente a dos ecuaciones entre
números reales: dos números complejos son iguales sólo si las partes reales son iguales
y las partes imaginarias son iguales. Por lo tanto,

cos 2θ = cos2 θ − sen2 θ, sen 2θ = (2 sen θ cos θ) .

De esta misma manera se obtienen fórmulas similares para expresar sen nθ y cos nθ en
función de potencias de sen θ y cos θ para cualquier entero positivo n: la expresión del
primer miembro de la ecuación (8.27) se desarrolla por medio de la fórmula binomial,
ecuación (7.14), y sus partes real e imaginaria se igualan con las correspondientes del
segundo miembro de la ecuación.

EJEMPLO 8.7 Exprese cos 5θ y sen 5θ en función de sen θ y cos θ.


Por el desarrollo del binomio (7.14), o usando el triángulo de Pascal,

(a + b)5 = a5 + 5a4 b + 10a3 b2 + 10a2 b3 + 5ab4 + b5 ,


de manera que
 
(cos θ + i sen θ)5 = cos5 θ − 10 cos3 θ sen2 θ + 5 cos θ sen4 θ
 
+i 5 cos4 θ sen θ − 10 cos2 θ sen3 θ + sen5 θ .

Por lo tanto,
cos 5θ = cos5 θ − 10 cos3 θ sen2 θ + 5 cos θ sen4 θ = 16 cos5 θ − 20 cos3 θ + 5 cos θ
sen 5θ = sen5 θ − 10 sen3 θ cos2 θ + 5 sen θ cos4 θ = 16 sen5 θ − 20 sen3 θ + 5 sen θ

y la expresión final se obtiene utilizando la fórmula sen2 θ + cos2 θ = 1.

La generalización y el significado de la fórmula se tratan en el Apartado 8.5.

8.4. Funciones complejas


Sean g(x) y h(x) funciones (reales) de la variable real x. Una función compleja de x
es entonces

f (x) = g(x) + ih(x) , (8.29)



siendo i = −1. Esta función no difiere de manera esencial de una función real de
una variable, salvo porque los valores posibles de la función son números complejos.
El tratamiento de las propiedades de los números complejos se aplica a las funciones
complejas y, por ejemplo, se define la función compleja conjugada f ∗ (x) como

f ∗ (x) = g(x) − ih(x) (8.30)

con la propiedad

f (x)f ∗ (x) = |f (x)|2 = g(x)2 + h(x)2 , (8.31)


8.4. Funciones complejas 203

siendo |f (x)| el módulo de la función. La cantidad ff ∗ juega un papel importante en


teorı́as de ondas, cuando la función de ondas es compleja.
Una aplicación más avanzada de los números complejos es la extensión de los con-
ceptos de variable y de función para incluir variables complejas y funciones de variables
complejas.4 De esta manera, si x e y son dos variables reales, entonces z = x + iy es
una variable compleja y f (z) es una función de la variable compleja z. Por ejemplo, la
función

f (z) = z2 + 2z + 1

puede expresarse como

f (z) = (x + iy)2 + 2(x + iy) + 1 = (x2 − y2 + 2x + 1) + i(2xy + 2y)


= g(x, y) + ih(x, y) ,

donde g(x, y) y h(x, y), las partes real e imaginaria de f (z), son funciones reales de x e y.
Las propiedades de f (z) como función de la variable compleja z son más generales que
las propiedades de las funciones reales. Para la mayorı́a de las consideraciones en las
ciencias fı́sicas, sólo una función de este tipo es importante, y la tratamos en el siguiente
apartado.

8.5. Fórmula de Euler

De la teorı́a de funciones de variable compleja se sabe que la función exponencial


z
e , donde z es un número complejo, puede desarrollarse en la serie infinita que nos es
familiar
z2 z3
ez = 1 + z + + + ··· (8.32)
2! 3!
Si z es el número imaginario iθ entonces

(iθ)2 (iθ)3
eiθ = 1 + (iθ) + + + ···
 2! 3!   
θ2 θ4 θ6 θ3 θ5 θ7
= 1 − + − + ··· + i θ − + − + ··· .
2! 4! 6! 3! 5! 7!

04. El primer comentario sobre funciones complejas lo hizo Gauss en una carta a Bessel en 1811,
junto con una descripción de la interpretación geométrica de los números complejos. La teorı́a fue desarro-
llada de manera independiente por Cauchy desde aproximadamente 1814. Cauchy fue el matemático más
prolı́fico del siglo XIX. Apabulló el boletı́n semanal de la Academia de Ciencias de Parı́s, Comptes Rendus,
forzándolo a introducir una regla, todavı́a en uso, que limita las contribuciones a cuatro páginas.
204 Capı́tulo 8. Números complejos

Las partes real e imaginaria de esta función son los desarrollos en serie de las funciones
trigonométricas cos θ y sen θ, respectivamente (véase el Apartado 7.6), de manera que

eiθ = cos θ + i sen θ . (8.33)

Esta relación entre la función exponencial y las funciones trigonométricas se llama


fórmula de Euler.5 Es la base de la teorı́a unificada de las funciones elementales, y
es una de las relaciones más importantes en matemáticas.
La función z = eiθ tiene módulo |z| = 1 y argumento
arg z = θ. Para cada valor de θ el número está en el cı́rculo
unidad del plano complejo, y al variar θ de 0 a 2π, la fun-
ción describe el cı́rculo unidad (Figura 8.6). El complejo
conjugado de z = eiθ es

e−iθ = cos θ − i sen θ (8.34)

y esto es también el inverso z−1 = z∗ = e−iθ . Entonces

zz∗ = zz−1 = eiθ e−iθ = e0 = 1 . Figura 8.6

La pareja de ecuaciones (8.33) y (8.34) puede invertirse para dar la expresión de las
funciones trigonométricas mediante exponenciales:

1 iθ
cos θ = (e + e−iθ ) , (8.35)
2

1 iθ
sen θ = (e − e−iθ ) . (8.36)
2i
De la forma polar de un número complejo, ecuación (8.15), se deduce que todo número
complejo puede escribirse como

z = x + iy = reiθ , (8.37)

donde r = |z| y θ = arg z. La función compleja conjugada y la función inversa de z son

1 1
z∗ = x − iy = re−iθ , z−1 = = e−iθ . (8.38)
x + iy r

05. La fórmula, y otras para las funciones logarı́tmica y trigonométricas de z, apareció en la Introduc-
tio de 1748 de Euler.
8.4. Funciones complejas 205

EJEMPLO 8.8 El número z = 1 + i.

Vimos en el Ejemplo 8.5 que


√  π π
z=1+i= 2 cos + i sen .
4 4
El número puede por lo tanto escribirse como

z= 2 eiπ/4

con complejo conjugado e inverso


√ √  π π
z∗ = 2 e−iπ/4 = 2 cos − i sen ,
4 4

1 1  π π
z−1 = √ e−iπ/4 = √ cos − i sen .
2 2 4 4
Además,
π 1  iπ/4  π 1  iπ/4 
cos = e + e−iπ/4 , sen = e − e−iπ/4 .
4 2 4 2i

EJEMPLO 8.9 El número eiπ .

Por la fórmula de Euler,


eiπ = cos π + i sen π .
Puesto que cos π = −1 y sen π = 0 se deduce que

eiπ = −1 . (8.39)

Esta expresión, que incluye los números trascendentes e y π, la unidad negativa −1 y la unidad imaginaria
i, es probablemente la relación más notable en matemáticas.

Fórmula de De Moivre
Si se sustituye en la fórmula de Euler (8.33) θ por nθ, siendo n un número arbitrario,
el resultado es

einθ = cos nθ + i sen nθ .

Pero, puesto que einθ = (eiθ )n , se deduce que


 n
(eiθ )n = cos θ + i sen θ = cos nθ + i sen nθ . (8.40)

Ésta es la fórmula de De Moivre (8.27) generalizada a cualquier número arbitrario n (que


puede ser a su vez complejo).
206 Capı́tulo 8. Números complejos

Operadores de rotación

Si se multiplica un número complejo z = reiα por eiθ , el producto es un número con


el mismo módulo que z pero con argumento aumentado en θ:

eiθ reiα = rei(θ+α) .

Como se muestra en la Figura 8.7, la multiplicación corresponde gráficamente a girar


el punto de representación un ángulo θ en torno al origen en el plano complejo. En
representación cartesiana,

z = x + iy = r(cos α + i sen α) ,
eiθ z = z = x + iy = r(cos (θ + α) + i sen (θ + α)) ,

de manera que las coordenadas del punto girado son

x = r cos (θ + α) = r(cos θ cos α − sen θ sen α) ,


y = r sen (θ + α) = r(sen θ cos α + cos θ sen α) ,

o bien
x = x cos θ − y sen θ ,
(8.41) Figura 8.7
y = x sen θ + y cos θ .

La función eiθ puede considerarse como la representación del operador de rotación Rθ


que transforma las coordenadas (x, y) de un punto z en las coordenadas (x , y ) del punto
girado z :

Rθ (x, y) = (x , y ) . (8.42)

Las ecuaciones (8.41) juegan un papel importante en la formulación matemática de las


rotaciones en el espacio (véase el Capı́tulo 18).

8.6. Periodicidad

La funciones trigonométricas cos θ y sen θ son funciones periódicas de θ con perio-


do 2π (véase el Apartado 3.1). Se deduce que la función exponencial eiθ es también
periódica con periodo 2π. Ası́, si θ se incrementa en 2π,
 
ei(θ+2π) = eiθ × e2πi = eiθ cos 2π + i sen 2π .

Por lo tanto, puesto que cos 2π = 1 y sen 2π = 0, tenemos que e2πi = 1 y

ei(θ+2π) = eiθ .
8.6. Periodicidad 207

Más generalmente, la función no cambia cuando se suma a θ un múltiplo de 2π:

ei(θ+2πn) = eiθ , n = 0, ±1, ±2, . . . (8.43)

Gráficamente, cambiar el argumento θ en 2πn corresponde a mover el punto de repre-


sentación n giros completos en el cı́rculo unidad dejándolo en su posición original (n
giros antihorarios si n es positivo, |n| giros horarios si n es negativo).
La función eiθ aparece en las ciencias fı́sicas siempre que se describe un movimiento
periódico o cuando un sistema tiene una estructura periódica. Consideramos aquı́ tres
clases representativas importantes de situaciones fı́sicas que presentan un comporta-
miento periódico.

Periodicidad en un cı́rculo. Las n raı́ces n-ésimas de 1


La figura 8.8 muestra tres puntos equidistantes en el cı́rculo unidad, en los vértices
de un triángulo equilátero. Los puntos corresponden a los números complejos

zk = e(2πk/3)i , k = 0, 1, 2,

con módulos unidad y argumentos 2πk/3. Estos números tienen la propiedad



3
(zk )3 = e(2πk/3)i = e2πki = 1 ,

de manera que cada uno de ellos es una raı́z cúbica del número 1:

z0 = e0 = 1 ,

2π 2π 1 3
z1 = e 2πi/3
= cos + i sen =− + i,
3 3 2 √2
4π 4π 1 3
z2 = e4πi/3 = cos + i sen =− − i.
3 3 2 2

Figura 8.8
208 Capı́tulo 8. Números complejos

Vemos que z1 y z2 forman un par de complejos conjugados: e−4πi/3 = e2πi/3 . Dada la


periodicidad de la exponencial, las tres raı́ces pueden especificarse mediante tres valores
consecutivos de k cualesquiera; de manera conveniente podemos tomar

zk = e2πki/3 , k = 0, ±1,

siendo entonces z0 = 1, z±1 = e±2πi/3 .


En general, las n raı́ces n-ésimas del número 1 son6

0, ±1, ±2, . . . , ±(n − 1)/2, si n es impar,
zk = e2πki/n con k= (8.44)
0, ±1, ±2, . . . , ±(n/2 − 1), n/2, si n es par.

Ası́, si n es impar, la única raı́z real es +1 y el resto se presenta en pares de complejos


conjugados. Si n es par, dos de las raı́ces son reales, ±1. Los n puntos de representación
se sitúan en los vértices de un polı́gono regular de n lados.

EJEMPLO 8.10 Las seis raı́ces sextas de 1.


Las seis raı́ces son

zk = e2πki/6 , k = 0, ±1, ±2, 3,

o bien

z0 = e0 = 1 ,

±πi/3 π π 1 3
z±1 = e = cos ± i sen = ± i,
3 3 2 2

2π 2π 1 3
z±2 = e±2πi/3 = cos ± i sen =− ± i,
3 3 2 2
πi Figura 8.9
z3 = e = cos π + i sen π = −1 .

Una función que tiene la misma periodicidad circular que la figura con n puntos equidis-
tantes sobre un cı́rculo es

f (θ) = einθ . (8.45)

Esta función es periódica en θ con periodo 2π/n. En efecto,

f (θ + 2π/n) = ein(θ+2π/n) = einθ × e2πi = f (θ) .

Tales funciones son importantes en la descripción de sistemas con periodicidad circular.


Por ejemplo, las funciones presentadas en el Ejemplo 8.10 se usan tomando n = 6 para
la descripción de las propiedades de la molécula de benceno.

06. Las n raı́ces de un número complejo fueron tratadas por De Moivre en un artı́culo en la revista
Philosophical Transactions de 1739.
8.6. Periodicidad 209

Periodicidad en una recta

Figura 8.10

La Figura 8.10 muestra una cadena lineal simple de puntos equidistantes representando,
por ejemplo, una red lineal. Una función de x con la misma periodicidad que la red tiene
que satisfacer la condición de periodicidad

f (x + a) = f (x) . (8.46)

La función más sencilla que lo cumple es

f (x) = e2πxi/a . (8.47)

En efecto,

f (x + a) = e2π(x+a)i/a = e2πxi/a × e2πi = f (x)e2πi = f (x) .

Las funciones como (8.47) son importantes para describir las propiedades de sistemas
periódicos como los cristales. Las funciones se generalizan fácilmente a sistemas pe-
riódicos tridimensionales: la función

f (x) = e2πxi/a e2πyi/b e2πzi/c (8.48)

tiene periodo a en la dirección x, b en la dirección y y c en la dirección z.

Rotaciones en mecánica cuántica

La Figura 8.11 muestra un sistema de dos masas, m1 y m2 ,


unidas por una barra rı́gida (de masa despreciable) que gira
en torno al centro de masas en O. Como vimos en el Aparta-
do 5.6 (Ejemplo 5.7) el sistema tiene un momento de inercia
I = µr2 , donde µ = m1 m2 /(m1 + m2 ) es la masa reduci-
da y r = r1 + r2 es la distancia entre masas. Este sistema
se denomina un ‘rotor rı́gido’ y la ecuación de movimiento
en mecánica cuántica (la ecuación de Schrödinger) para un
rotor rı́gido en el plano es Figura 8.11

2 d2 ψ
− = Eψ , (8.49)
2I dθ2

donde la función de ondas ψ = ψ(θ) es una función de la variable de orientación θ y E es


la energı́a cinética (positiva) de rotación. El rotor rı́gido se usa en quı́mica para modelar
el movimiento rotacional de una molécula.
210 Capı́tulo 8. Números complejos

La ecuación (8.49) puede escribirse como

d2 ψ
= −a2 ψ , (8.50)
dθ2
siendo a2 = 2IE/2 > 0, y se comprueba fácilmente que una solución de esta ecuación
es

ψ(θ) = Ceiaθ , (8.51)

donde C es una constante arbitraria (véase el Apartado 12.7 para un tratamiento más
completo). Tenemos

dψ d2 ψ
= iaCeiaθ , = (ia)2 Ceiaθ = −a2 Ceiaθ = −a2 ψ .
dθ dθ2
Para que la solución (8.51) tenga significado fı́sico, y represente la rotación, es necesario
que la función de ondas sea invariante si se sustituye θ por θ + 2π: tiene que satisfacer
la condición de periodicidad

ψ(θ + 2π) = ψ(θ) . (8.52)

En el caso de la función (8.51),

ψ(θ + 2π) = Ceia(θ+2π) = Ceiaθ × e2πai = ψ(θ) × e2πai ,

con lo que la condición de periodicidad se satisface si 2πa es un múltiplo de 2π, esto es,
si a = n con n = 0, ±1, ±2, . . . Las soluciones con significado fı́sico de la ecuación de
Schrödinger son por lo tanto

ψn (θ) = Ceinθ , n = 0, ±1, ±2, . . . , (8.53)

donde se usa el ‘número cuántico’ n para etiquetar las soluciones. Los valores corres-
pondientes de la energı́a E = 2 a2 /2I son

2 n2
E= . (8.54)
2I
Vemos que la cuantización de la energı́a del sistema surge como consecuencia de aplicar
la condición de periodicidad (condición de contorno periódica) a las soluciones. Vemos
además que el conjunto de funciones de onda incluye todas las funciones (8.45) para las
posibles periodicidades en torno a un cı́rculo.
8.7. Cálculo de integrales 211

8.7. Cálculo de integrales


La integración con respecto a una variable compleja es una parte importante de la
teorı́a de funciones de variable compleja, pero se usa sólo en aplicaciones avanzadas
en ciencias fı́sicas. La integración corriente de funciones complejas obedece las mismas
reglas que la integración de funciones reales. Además, las funciones complejas pueden
usarse para simplificar el cálculo de ciertos tipos de integrales. Por ejemplo, vimos en el
Ejemplo 6.13 cómo la integral

e−ax cos x dx

puede evaluarse mediante el método de integración por partes. Un método alternativo,


más elegante, es expresar la función trigonométrica usando la función exponencial (com-
pleja). Consideramos la forma general

I= eax cos bx dx .

Por ser cos bx la parte real de eibx , se deduce que la integral I es la parte real de la integral
que se obtiene a partir de I sustituyendo cos bx por eibx :

I = Re e e dx = Re
ax ibx
e(a+ib)x dx .

La integral compleja se evalúa por medio de la regla para integrar una función exponen-
cial. Ası́ (ignorando la constante de integración),

e(a+ib)x eibx
e(a+ib)x dx = = eax
a + ib a + ib
y podemos separar esto en sus partes real e imaginaria:
 
cos bx + i sen bx
e(a+ib)x
dx = e ax

a + ib
eax  
= 2 (a cos bx + b sen bx) + i(a sen bx − b cos bx) .
a + b2


eax (a cos bx + b sen bx)
eax cos bx dx = . (8.55)
a2 + b 2
La parte imaginaria es un regalo:

eax (a sen bx − b cos bx)
eax sen bx dx = . (8.56)
a2 + b 2
212 Capı́tulo 8. Números complejos

8.8. Ejercicios
Apartado 8.2
Escriba como un único número complejo:

1. (2 + 3i) + (4 − 5i) 2. (2 + 3i) + (2 − 3i) 3. (2 + 3i) − (2 − 3i)


4. (5 + 3i)(3 − i) 5. (1 − 3i) 2
6. (1 + 2i)5
1−i 1
7. (1 − 3i)(1 + 3i) 8. 9.
1+i 5 + 3i
3 + 2i 1 3 − 4i
10. 11. −
3 − 2i 5 3 + 4i
12. Para z = 3 − 2i, halle (i) z∗ (ii) iz (iii) 1/z.
∗ ∗
13. Halle z tal que zz + 4(z − z ) = 5 + 16i.

Halle las raı́ces de las ecuaciones:

14. x2 − 2x + 4 = 0 15. x2 + 8 = 0 16. x3 − 6x − 9 = 0

Apartado 8.3
Represente como un punto en el plano complejo. Halle entonces el módulo y el argumento:
√ √
17. 1 − i 18. −2 + i 19. 1 − i 3 20. −1 − i/ 2

21. 3−i 22. 3 23. 3i 24. 1/i
Exprese en forma polar r( cos θ + i sen θ):

25. 2i 26. −3 27. 1−i 28. 3+i

29. −6 + 6i 30. −2 − 12i
Exprese cada uno de (i) z1 z2 , (ii) z1 /z2 (iii) z2 /z1 como un único número complejo:
 π π  π π
31. z1 = 2 cos + i sen , z2 = 3 cos + i sen ,
2 2 3 3
 
3π 3π 2π 2π
32. z1 = 5 cos + i sen , z2 = cos + i sen .
4 4 3 3
 π π
33. Para z = 3 cos + i sen halle (i) z4 , (ii) z−4 .
8 8
34. Use la fórmula de De Moivre para demostrar que
 
cos 4θ = cos4 θ − 6 cos2 θ sen2 θ + sen4 θ , sen 4θ = 4 sen θ cos θ cos2 θ − sen2 θ .

35. Use la fórmula de De Moivre para desarrollar cos 8x como un polinomio en cos x.

Apartado 8.5
Exprese en forma cartesiana x + iy:

36. 3eiπ/4 37. e−iπ/3 38. e3πi 39. 2e3πi/2

Dados z1 = e2πi/3 y z2 = e−3πi/4 halle el argumento de:


8.8. Ejercicios 213

40. z1 2 z2 41. z2 3 /z1 2 42. z1 3 /z2 2

Dados z1 = 3e−iπ/3 y z2 = 2e2πi/3 halle:

43. z1 2 z2 4 44. z1 3 /z2 2 45. z2 2 /z1 3


46. Halle el número que se obtiene a partir de z = 3 + 2i mediante
(i) un giro antihorario de 30◦ , (ii) un giro horario de 30◦ , en torno al origen del plano complejo.
47. Use la fórmula de Euler para cos x y sen x para demostrar que
(i) cos ix = cosh x, (ii) sen ix = i senh x, (iii) tg ix = i tgh x.
48. Exprese cos (a + ib) en la forma x + iy.
49. Demuestre que ln z = ln |z| + i arg z.
50. Una ecuación diferencial importante en varias ramas de las ciencias fı́sicas es

d2 y
+ ω2 y = 0
dx2
donde ω es real.
(i) Demuestre por sustitución que la solución de la ecuación puede escribirse como

y = Aeiωx + Be−iωx ,

siendo A y B constantes arbitrarias.


(ii) Una forma alternativa de la solución es

y = C cos ωx + D sen ωx .

Halle C y D en función de A y B.

Apartado 8.6
Halle todas las raı́ces y represéntelas en el plano complejo:
√ √ √
51. 4
1 52. i 53. (2 + 2i)1/3 54. 6
−1

Apartado 8.7
Use números complejos para integrar:
∞ ∞
55. e−x cos 2x dx 56. e−2x sen3 x dx
0 0
Funciones de varias variables

9.1. Conceptos
Cuando se escribe la ecuación de estado de los gases ideales en la forma
nRT
V = f (p, T, n) =
p
queda implı́cito que, para cualquier estado del sistema, el valor del volumen V (la varia-
ble dependiente) queda determinado por los valores de la presión p, la temperatura T y
la cantidad de materia n (las variables independientes); es decir, V es una función de las
tres variable p, T y n. Las funciones de varias variables se dan a menudo en las ciencias
fı́sicas. Las funciones termodinámicas de estado, como la que acabamos de mencionar,
son un ejemplo de ello y también toda propiedad fı́sica de un sistema cuyos valores de-
pendan de la posición. En el Capı́tulo 5 vimos, por ejemplo, la densidad de masa y la
energı́a potencial como funciones de una única variable, la posición en la recta. Más
generalmente, las funciones de la posición son funciones de las tres coordenadas de un
punto en el espacio ordinario de tres dimensiones.
Sea la variable z una función de dos variables x e y. Por ejemplo, la ecuación
z = x2 − 2xy − 3y2
nos da z como una función particular de x e y. La expresión en el segundo miembro de
la ecuación define la función
f (x, y) = x2 − 2xy − 3y2 (9.1)
cuyo valor para una pareja de valores de x e y se asocia a la variable z. Se dice que las
variables x e y son variables independientes si no hay ninguna relación entre ellas que
haga que el valor de una dependa del valor de la otra.

EJEMPLO 9.1 Los valores de la función (9.1) para (x, y) = (2, 1), (x, y) = (1, 0) y (x, y) = (0, 1) son

f (2, 1) = 22 − 2 × 2 × 1 − 3 × 12 = −3 ,
f (1, 0) = 12 − 2 × 1 × 0 − 3 × 02 = 1 ,
f (0, 1) = 02 − 2 × 0 × 1 − 3 × 12 = −3 .
216 Capı́tulo 9. Funciones de varias variables

9.2. Representación gráfica


Vimos en el Apartado 2.2 que una función (real) de una variable define una curva en
el plano. En la Figura 2.1 se muestra, por ejemplo, la gráfica de y = x2 − 2x − 3. Una
función de dos variables independientes, z = f (x, y), define una superficie en el espacio
tridimensional.1

Figura 9.1

En la Figura 9.1, Ox, Oy y Oz son tres ejes perpendiculares. La pareja de valores (x, y) es-
pecifica un punto en el plano (horizontal) xy, y el valor de la función se representa por el
punto P con altura z sobre el plano (en el Capı́tulo 10 se tratan los sistemas coordenados
en tres dimensiones). Al moverse el punto (x, y) en el plano xy, el lugar geométrico de los
puntos P corresponde a una superficie. Es decir, el punto P se mueve sobre la superficie,
y la superficie es la representación de la función.
Es posible dibujar bonitas representaciones de funciones de dos variables utilizando
las modernas gráficas por ordenador, pero para funciones de tres o más variables no es
posible hacer tales representaciones fı́sicas completas. En el caso general, una función
de varias variables se visualiza, al menos en parte, fijando el valor de todas las variables
salvo una, y dibujando la correspondiente función de la única variable que queda. Las
Figuras 4.1 y 4.2 son ejemplos de ese tipo de gráficas para el volumen de un gas perfecto,
V = f (p, T, n) = nRT/p. La Figura 4.1 es la gráfica de V como función de T manteniendo
p y n constantes, mientras que la Figura 4.2 es la gráfica de V como función de P a T
y n constantes. A menudo estas sencillas gráficas son la representación más útil de una
función. La Figura 9.2 muestra gráficas de la función (9.1) como función de x para varios
valores de y.
Cada una de esas gráficas es un ‘corte’ de la superficie tridimensional por un plano.
En el caso general, una función de n variables define una ‘superficie’ en un espacio
de (n + 1) dimensiones, y su gráfica como función de una de las variables se obtiene
tomando un corte de esa superficie (n + 1)-dimensional por un ‘plano’.

01. La representación de superficies mediante funciones de dos variables y el concepto de derivadas


parciales fue tratado por primera vez por Leibniz en los años 1690.
9.3. Derivadas parciales 217

Figura 9.2

9.3. Derivadas parciales


Vimos en el Capı́tulo 4 que la derivada primera de una función de una variable se
interpreta gráficamente como la pendiente de la recta tangente a la gráfica y dinámi-
camente como la tasa de variación de la función con respecto a la variable. Para una
función de dos o más variables existen tantas derivadas primeras independientes como
variables independientes haya. Por ejemplo, la función

z = f (x, y) = x2 − 2xy − 3y2

puede derivarse con respecto a la variable x, considerando y como una constante, y se


obtiene la derivada parcial de la función2 con respecto a x

∂z
= 2x − 2y ,
∂x
y se puede derivar con respecto a y, a x constante, y se obtiene la derivada parcial con
respecto a y

∂z
= −2x − 6y .
∂y

La existencia de las derivadas parciales y la validez de la operación de la derivación


parcial están sujetas a las mismas condiciones de continuidad y regularidad que para la
derivada ordinaria (total). Si esas condiciones son satisfechas, las derivadas parciales de
una función de dos variables se definen mediante los lı́mites (compárese con la ecuación
(4.8))
 
∂z f (x + ∆x, y) − f (x, y)
= lim , (9.2)
∂x ∆x→0 ∆x
 
∂z f (x, y + ∆y) − f (x, y)
= lim . (9.3)
∂y ∆y→0 ∆y

∂z
02. La notación ∂x fue utilizada por primera vez por Legendre en 1788, pero sólo empezó a ser
aceptada después de que Jacobi la usase en su teorı́a de los determinantes en 1841.
218 Capı́tulo 9. Funciones de varias variables

La interpretación geométrica de estas cantidades se da en la Figura 9.3

Figura 9.3

El plano ABC es paralelo al plano xz, de manera que y = constante en el plano y los
valores de ∂z/∂x para ese valor de y son las pendientes de las rectas tangentes a la curva
APB . De la misma manera, el plano DEF es paralelo al plano z, y los valores de ∂z/∂y
son las pendientes de las rectas tangentes a la curva DPE. Las dos rectas tangentes en
el punto P de la Figura 9.3 representan por lo tanto las tasas de variación de la función
z = f (x, y), con ∂z/∂x para la tasa de variación en la dirección x y ∂z/∂y para la tasa de
variación en la dirección y.
Las dos rectas tangentes en P en la Figura 9.3 definen el plano tangente en P, es decir,
el plano que toca la superficie que representa a la función en el punto P únicamente.
Cualquier otra recta que pasa por P en el plano tangente es entonces una recta tangente
y su pendiente es la derivada de la función en alguna dirección. Esa derivada se puede
expresar mediante las derivadas ‘estándar’ ∂z/∂x y ∂z/∂y.

Figura 9.4

En la Figura 9.4, la distancia s en la dirección con ángulo θ con respecto a la dirección x


viene dada por la pareja de ‘ecuaciones paramétricas’

x = s cos θ , y = s sen θ , (9.4)


9.3. Derivadas parciales 219

y la derivada de la función z = f (x, y) en esa dirección s es

∂z ∂z ∂z
= cos θ + sen θ (9.5)
∂s ∂x ∂y

(véase el Ejemplo 9.17).


EJEMPLOS 9.2 Derivadas parciales
(i) f (x, y, z) = x2 + 2y2 + 3z2 + 4xy + 5xz + 6yz
∂f ∂f ∂f
= 2x + 4y + 5z , = 4y + 4x + 6z , = 6z + 5x + 6y .
∂x ∂y ∂z
(ii) f (x, y) = (x2 + 2y2 )1/2
Sea f = u1/2 , siendo u = x2 + 2y2 . Entonces, por la regla de la cadena,
∂f df ∂u 1
= × = u−1/2 × 2x = x(x2 + 2y2 )−1/2 ,
∂x du ∂x 2
∂f df ∂u 1
= × = u−1/2 × 2y = y(x2 + 2y2 )−1/2 .
∂y du ∂y 2
(iii) f (x, y) = y sen (x2 + y2 )
∂f
Por la regla de la cadena = 2xy cos (x2 + y2 ).
∂x
Sea f = u × v, siendo u = y, v = sen (x2 + y2 ). Entonces, por la regla del producto
∂f ∂v ∂u
= u× +v× = y × 2y cos (x2 + y2 ) + sen (x2 + y2 ) × 1
∂y ∂y ∂y

= 2y2 cos (x2 + y2 ) + sen (x2 + y2 ) .

Derivadas de orden superior


Como para la derivada de una función de una variables (Apartado 4.9), la derivada
parcial de una función de más de una variable puede a su vez ser derivada si satisface las
condiciones necesarias de continuidad y regularidad. Por ejemplo, la función cúbica de
dos variables

z = x3 + 2x2 y + 3xy2 + 4y3

tiene derivadas parciales primeras

∂z ∂z
= 3x2 + 4xy + 3y2 , = 2x2 + 6xy + 12y2 .
∂x ∂y

Ambas pueden derivarse con respecto a cada una de las variables y se obtienen cuatro
derivadas segundas. Derivar ∂z/∂x nos da
   
∂ ∂z ∂2z ∂ ∂z ∂2z
= 2 = 6x + 4y , = = 4x + 6y ,
∂x ∂x ∂x ∂y ∂x ∂y∂x
220 Capı́tulo 9. Funciones de varias variables

y derivar ∂z/∂y nos da


   
∂ ∂z ∂2z ∂ ∂z ∂2z
= 2 = 6x + 24y , = = 4x + 6y .
∂y ∂y ∂y ∂x ∂y ∂x∂y

Hay 8 derivadas terceras posibles, 16 cuartas, etcétera; en general hay 2n derivadas de


orden n posibles. Con la notación de la Figura 9.3, la derivada primera ∂z/∂x es la
pendiente en un punto, digamos p, de la curva APB, y ∂ 2 z/∂x2 es la tasa de variación de
esa pendiente al moverse P sobre la curva. Por otra parte, la derivada segunda ‘cruzada’
∂ 2 z/∂y∂x = ∂(∂z/∂x)/∂y es la tasa de variación de la pendiente ∂z/∂x (en la dirección
x) al moverse el punto P sobre la curva DPE (en la dirección y).
Vemos que para la función cúbica las dos derivadas segundas cruzadas son idénticas.
Esto se cumple para funciones con derivadas primeras continuas y, por lo tanto, es (casi)
siempre cierto en la práctica:

∂2z ∂2z
= . (9.6)
∂x∂y ∂y∂x

Resultados similares se obtienen para las derivadas de órdenes superiores.

Otras notaciones
notación La notación anterior se hace inmanejable para derivadas de orden superior,
y se suele utilizar la siguiente representación más compacta:

∂f ∂2f ∂2f ∂3f


fx = , fxx = , fxy = , fxyz = , ... (9.7)
∂x ∂x2 ∂x∂y ∂x∂y∂z

Con esta notación, la ecuación (9.6) se convierte en fxy = fyx y, por ejemplo, fxxy = fxyx =
fyxx (siempre que se cumplan las pertinentes condiciones de continuidad).
En algunas aplicaciones, en particular en termodinámica, es necesario especificar ex-
plı́citamente qué variable (o combinación de variables) se mantienen constantes. Esto se
hace añadiendo las variables constantes como subı́ndices de la expresión para la derivada
parcial. Por ejemplo, para una función de tres variables f (x, y, z), la expresión
 
∂f
(9.8)
∂x y, z

representa la derivada de f con respecto a x, a y y z constantes.

EJEMPLOS 9.3 Más ejemplos de derivadas parciales


(i) Para un gas ideal, V = nRT/p y
     
∂V nRT ∂V nR ∂V RT
=− 2 , = , = .
∂p T, n p ∂T p, n p ∂n p, T p
9.4. Puntos estacionarios 221

(ii) Las derivadas no nulas de u = x + y2 + 2y3 son

∂u ∂u ∂2u ∂3u
= 1, = 2y + 6y2 , = 2 + 12y , = 12 .
∂x ∂y ∂y2 ∂y3

(iii) Las derivadas parciales primeras y segundas de u = sen x cos x + x/y son

∂u 1 ∂u x
= cos x cos y + , = − sen x sen y − 2 ,
∂x y ∂y y

∂2u ∂2u 2x
= − sen x cos y , = − sen x cos y + 3 ,
∂x2 ∂y2 y

∂2u ∂2u 1
= = − cos x sen y − 2 .
∂x∂y ∂y∂x y

9.4. Puntos estacionarios


Vimos en el Apartado 4.10 que una función f (x) de una variable tiene un valor esta-
cionario en el punto x = a si su derivada en ese punto es cero, es decir, si f  (a) = 0.
Geométricamente, la gráfica de la función tiene pendiente nula en el punto estacionario:
su recta tangente es ‘horizontal’. La condición correspondiente para una función de dos
variables es que su plano tangente sea horizontal. Una función f (x, y) tiene por lo tanto
un punto estacionario en (x, y) = (a, b) si sus dos primeras derivadas parciales son cero

∂f ∂f
= =0 en (a, b) , (9.9)
∂x ∂y

o bien fx (a, b) = fy (a, b) = 0. A la vista de la ecuación (9.5), esto es suficiente para que
todas las derivadas primeras de una función continua sean cero en un punto.

EJEMPLO 9.4 Halle los puntos estacionarios de la función

f (x, y) = x3 + 6xy2 − 2y3 − 12x .


Tenemos
∂f ∂f
= 3x2 + 6y2 − 12 , = 12xy − 6y2 ,
∂x ∂y
que se anulan si
x2 + 2y2 = 4 , y(2x − y) = 0 .
La segunda ecuación se cumple para y = 0 o y = 2x, y sustituyendo esos valores en la primera ecuación
tenemos los cuatro puntos estacionarios

(2, 0), (– 2, 0) , (2/3, 4/3) , (– 2/3, −4/3) .


222 Capı́tulo 9. Funciones de varias variables

Para una función de una variable, un punto estacionario en x = a es un máximo local si


la derivada segunda es negativa, f  (a) < 0, un mı́nimo local si f  (a) > 0, y puede ser un
punto de inflexión si f  (a) = 0. Las condiciones correspondientes para una función de
dos variables son

fxx < 0 y fyy < 0 para un máximo, (9.10a)

fxx > 0 y fyy > 0 para un mı́nimo, (9.10b)

y además

fxx fyy − fxy2 > 0 para ambos: máximo y mı́nimo. (9.10c)

Si la cantidad ∆ = fxx fyy − fxy2 es negativa el punto es un punto silla: un máximo en una
dirección y un mı́nimo en la otra. Si ∆ = 0 se necesitan más pruebas para determinar
la naturaleza del punto. Para funciones de más de dos variables, las correspondientes
condiciones son más complicadas.

EJEMPLO 9.5 Naturaleza de los puntos estacionarios del Ejemplo 9.4


Los puntos estacionarios de la función f (x, y) = x3 + 6xy2 − 2y3 − 12x son

(2, 0) , (– 2, 0) , (2/3, 4/3) , (– 2/3, −4/3) .

La determinación de la naturaleza de esos puntos se resume en la siguiente tabla.

Tabla 9.1

x y fxx fyy fxy fxx fyy − fxy2 naturaleza

2 0 12 24 0 >0 mı́nimo

−2 0 −12 −24 0 >0 máximo

2 4
4 −8 16 <0 punto silla
3 3
2 4
− − −4 8 −16 <0 punto silla
3 3

Optimización condicionada
Se denomina optimización al proceso de hallar los máximos y mı́nimos (los valores
extremos) de una función. En el Ejemplo 9.4 las variables x e y son variables indepen-
dientes, sin restricciones en sus valores. En muchas aplicaciones en las ciencias fı́sicas,
sin embargo, la optimización puede estar sujeta a una o más condiciones o ligaduras: se
trata de la optimización condicionada. Dicho condicionamiento normalmente toma la
forma de una o más relaciones entre las variables.
9.4. Puntos estacionarios 223

EJEMPLO 9.6 Halle el valor extremo de la función


f (x, y) = 3x2 − 2y2

con la ligadura x + y = 2.
En ausencia de la ligadura, la función tiene un punto silla en x = y = 0, y no tiene ni máximos ni mı́nimos.
La ligadura es una relación entre las variables x e y que reduce el número de variables independientes a 1.
De esta forma, sustituyendo y = 2 − x en la función se obtiene

f (x, y) = F(x) = 3x2 − 2(2 − x)2 = x2 + 8x − 8 .

Para un valor estacionario tenemos entonces que

F  (x) = 2x + 8 = 0 , F  (x) = 2 ,

de manera que la función tiene un valor mı́nimo para x = −4. El punto extremo de f (x, y) es por lo tanto un
mı́nimo situado en (x, y) = (– 4, 6), y el valor extremo de la función es f (– 4, 6) = −24.

El problema de optimización se ha simplificado en este ejemplo utilizando la ligadura


para eliminar una de las variables. En general, sin embargo, tal simplificación suele ser
difı́cil o imposible, en particular para funciones con más de dos variables o cuando hay
varias ligaduras. Un procedimiento general para resolver muchos de los problemas de
optimización condicionada en las ciencias fı́sicas es el método de los multiplicadores
de Lagrange.3
Sea una función de tres variables, f (x, y, z), y la ligadura g(x, y, z) = constante. Por el
método de los multiplicadores de Lagrange, existe un número λ tal que

∂f ∂g ∂f ∂g ∂f ∂g
−λ = 0, −λ = 0, −λ = 0, (9.11)
∂x ∂x ∂y ∂y ∂z ∂z

en los puntos estacionarios. Estas tres ecuaciones, junto con la ligadura, son suficientes
para determinar los valores de los puntos estacionarios y de los correspondientes valores
del multiplicador de Lagrange λ.

EJEMPLO 9.7 Use el método de los multiplicadores de Lagrange para hallar el valor extremo de la
función f (x, y) = 3x2 − 2y2 sujeta a la ligadura x + y = 2 (Ejemplo 9.6).
Tenemos g = x + y y f − λg = 3x2 − 2y2 − λ(x + y), de manera que las tres ecuaciones por resolver son

∂ ∂
(f − λg) = 6x − λ = 0 , (f − λg) = −4y − λ = 0 , g = x + y = 2.
∂x ∂y
La solución es x = −4, y = 6, λ = −24, y f (– 4, 6) = −24 como en el Ejemplo 9.6.

03. Joseph-Louis Lagrange (1736-1813), nacido en Turı́n, hizo importantes contribuciones a muchas
ramas de las matemáticas, y ha sido llamado el más grande de los matemáticos del siglo XVIII (‘Lagrange
es la encumbrada pirámide de las ciencias matemáticas’, Napoleón Bonaparte). Su mayor logro fue el
desarrollo del cálculo variacional, y en su Mécanique analytique de 1788 extendió la mecánica de Newton y
Euler. Señaló que los problemas en mecánica pueden ser generalmente resueltos reduciéndolos a ecuaciones
diferenciales. Lagrange inventó el término ‘función derivada’ y la notación f  (x) para la derivada de f (x).
224 Capı́tulo 9. Funciones de varias variables

En el caso general, se trata de optimizar una función de n variables,

f (x1 , x2 , x3 , . . . , xn ), (9.12a)

sujeta a m (< n) ligaduras

gk (x1 , x2 , x3 , . . . , xn ) = ak , k = 1, 2, 3, . . . , m, (9.12b)

siendo a1 , a2 , . . . , am constantes. El procedimiento es construir la función auxiliar


m

φ = f − λ 1 g1 − λ 2 g2 − λ 3 g3 − · · · − λ m gm = f − λk gk (9.13)
k=1

y resolver las n + m ecuaciones

∂φ ∂f  ∂gk m

= − λk = 0, i = 1, 2, 3, . . . , n,
∂xi ∂xi k=1
∂xi (9.14)
g k = ak , k = 1, 2, 3, . . . , m,

para la n variables xi y los m multiplicadores λk .


Los siguientes ejemplos ilustran una aplicación del método de los multiplicadores
de Lagrange en geometrı́a (o empaquetado) y una importante aplicación en quı́mica.
En el Capı́tulo 21 tratamos una tercera aplicación: la deducción de la distribución de
Boltzmann.

EJEMPLO 9.8 Halle las dimensiones de la caja rectangular de mayor volumen para una superficie dada.
El volumen de una caja de lados x, y y z es V = xyz y el área de su superficie es A = 2(xy + yz + zx). El
problema es por lo tanto hallar el valor máximo de V sujeto a la ligadura A = constante. Por el método de
los multiplicadores de Lagrange, construimos la función auxiliar φ = V − λA, y resolvemos el conjunto de
ecuaciones
∂φ ∂φ ∂φ
= yz − 2λ(y + z) = 0 , = xz − 2λ(x + z) = 0 , = xy − 2λ(x + y) = 0 .
∂x ∂y ∂z

Multiplicando la primera ecuación por x, la segunda por y, y la tercera por z tenemos

xyz − 2λ(xy + xz) = xyz − 2λ(xy + yz) = xyz − 2λ(xz + yz) = 0 .



Se deduce que x = y = z, y la caja es un cubo de lado A/6.

EJEMPLO 9.9 Ecuaciones seculares


Los principios variacionales de las ciencias fı́sicas llevan a menudo al problema de hallar los valores esta-
cionarios de una ‘forma cuadrática’ de n variables x1 , x2 , . . . , xn ,


n 
n
f (x1 , x2 , . . . , xn ) = Cij xi xj
i=1 j=1
9.5. El diferencial total 225

sujeta a la ligadura

n
g(x1 , x2 , . . . , xn ) = xi2 = 1 ,
i=1

donde las Cij son constantes (con Cij = Cji ). Por ejemplo, para n = 3,

f (x1 , x2 , x3 ) = C11 x12 + 2C12 x1 x2 + 2C13 x1 x3 + C22 x22 + 2C23 x2 x3 + C33 x32

con ligadura g = x12 + x22 + x32 = 1.


Por el método de los multiplicadores de Lagrange, los valores estacionarios de la función se obtienen
construyendo la función auxiliar φ = f − λg y resolviendo las ecuaciones (9.14).
Para el caso n = 3, tenemos

φ = (C11 − λ)x12 + 2C12 x1 x2 + 2C13 x1 x3 + (C22 − λ)x22 + 2C23 x2 x3 + (C33 − λ)x32 .

Derivando con respecto a x1 , x2 y xn , e igualando cada derivada a cero, obtenemos el sistema de ecuaciones

(C11 − λ)x1 + C12 x2 + C13 x3 = 0,

C21 x1 + (C22 − λ)x2 + C23 x3 = 0,

C31 x1 + C32 x2 + (C33 − λ)x3 = 0 .

Las ecuaciones de este tipo se llaman a menudo ecuaciones seculares. Se dan, por ejemplo, en el método de
‘combinaciones lineales’ en quı́mica cuántica, cuando la forma cuadrática representa la energı́a del sistema
(o una energı́a orbital en la teorı́a de orbitales moleculares). En los Capı́tulos 17 y 19 tratamos el significado
y la resolución de estos sistemas de ecuaciones.

9.5. El diferencial total


Sea z = f (x, y) una función de las variables x e y, y supongamos que los valores
de las variables varı́an continuamente desde (x, y), en el punto p de la Figura 9.5, hasta
(x + ∆x, y + ∆y) en el punto q. La correspondiente variación de la función es

∆z = zq − zp = f (x + ∆x, y + ∆y) − f (x, y)

y se representa en la figura como el desplazamiento de P a Q sobre la superficie que


representa la función; ∆z es la variación de ‘altura’ sobre la superficie.
Por ejemplo, para la función cuadrática ax2 + bxy + cy2 ,

zp = f (x, y) = ax2 + bxy + cy2 ,


zq = f (x + ∆x, y + ∆y) = a(x + ∆x)2 + b(x + ∆x)(y + ∆y) + c(y + ∆y)2 ,

∆z = zq − zp = (2ax + by)∆x + (bx + 2cy)∆y + a(∆x)2 + b(∆x)(∆y) + c(∆y)2 .


226 Capı́tulo 9. Funciones de varias variables

Figura 9.5

Ahora bien, como

∂z ∂z
= 2ax + by , = bx + 2cy ,
∂x ∂y

1 ∂2z ∂2z 1 ∂2z


= a, = b, = c,
2 ∂x2 ∂x∂y 2 ∂y2

la variación en la función puede escribirse como


   
∂z ∂z
∆z = ∆x + ∆y
∂x ∂y
   2   
1 ∂2z ∂z 1 ∂2z
+ (∆x) +
2
(∆x)(∆y) + (∆y)2 . (9.15)
2 ∂x2 ∂x∂y 2 ∂y2

Esta expresión es exacta para el presente caso y para toda función cuyas derivadas ter-
ceras y superiores sean cero. Para una función general, (9.15) representa los primeros
términos de un desarrollo de Taylor de la función en el punto (x + ∆x, y + ∆y), en torno
al punto (x, y) (compárese con la ecuación (7.23) para una función de una variable).
Si ∆x y ∆y son suficientemente pequeños, los términos cuadráticos en ∆ son pe-
queños comparados con los términos lineales, y un valor aproximado de ∆z es
   
∂z ∂z
∆z ≈ ∆x + ∆y . (9.16)
∂x y ∂y x

Este resultado, válido para cualquier función continua de dos variables, muestra que
cuando las variaciones ∆x y ∆y son suficientemente pequeñas, la variación total de z
9.5. El diferencial total 227

es aproximadamente igual a la variación de z debida únicamente a la variación ∆x (el


primer término del segundo miembro de (9.16)) más la variación de z debida únicamente
a la variación ∆x (el segundo término). Además, la precisión de la expresión aumenta
cuando ∆x y ∆y tienden a cero. Como hicimos en el Apartado 4.12, vamos a considerar
variaciones infinitesimales dx y dy, y definimos la cantidad
   
∂z ∂z
dz = dx + dy (9.17)
∂x y ∂y x

como el caso lı́mite de (9.16). Esta cantidad se denomina el diferencial total de z con
respecto a x e y.4
El concepto del diferencial total se generaliza fácilmente a funciones con cualquier
número de variables. Para una función de n variables

z = f (x1 , x2 , . . . , xn )

el diferencial total es
      n  
∂z ∂z ∂z ∂z
dz = dx1 + dx2 + · · · + dxn = dxi , (9.18)
∂x1 y ∂x2 y ∂xn y i=1
∂xi y

donde, por ejemplo, ∂z/∂x1 es la derivada parcial con respecto a la variable x1 , mante-
niendo todas las demás variables x2 , x3 , . . . , xn constantes.

EJEMPLOS 9.10 Halle el diferencial total


x
1. z =
y    
∂z 1 ∂z x ∂z ∂z 1 x
= , =− 2, dz = dx + dy = dx − 2 dy .
∂x y ∂y y ∂x y ∂y x y y

2. u = (x2 + y2 + z2 )1/2

∂u x ∂u y ∂u z
= x(x2 + y2 + z2 )−1/2 = , = , = ,
∂x u ∂y u ∂z u
     
∂u ∂u ∂u 1
du = dx + dy + dz = (x dx + y dy + z dz) .
∂x y, z ∂y z, x ∂z x, y u

3. x = r sen θ cos φ

∂x ∂x ∂x
= sen θ cos φ , = r cos θ cos φ , = −r sen θ sen φ ,
∂r ∂θ ∂φ

04. El diferencial total y la igualdad de las derivadas segundas cruzadas fueron descubiertos en 1719
por Nicolaus (II) Bernoulli (1687-1759). Sobrino de Johann (I) y de Jakob (o Jean y Jacques), no hay que
confundirlo con Nicolaus (I), su padre, ni con Nicolaus (III) hijo de Johann (I) y hermano de Daniel y de
Johan (II). Fue Daniel Bernoulli (1700-1782) quien escribió la Hydrodynamica de 1738 que contiene el
concepto del ‘Teorema de Bernoulli’ y un desarrollo de la teorı́a cinética de los gases.
228 Capı́tulo 9. Funciones de varias variables
     
∂x ∂x ∂x
dx = dr + dθ + dφ
∂r θ, φ ∂θ r, φ ∂φ r, θ

= sen θ cos φ dr + r cos θ cos φ dθ − r sen θ sen φ dφ .

EJEMPLO 9.11 Volumen de un fluido


El volumen de un fluido es una función de la presión p, la temperatura T y la cantidad de materia n:
V(n, p, T). El diferencial de volumen total es
     
∂V ∂V ∂V
dV = dT + dp + dn
∂T p, n ∂p T, n ∂n p, T

= αV dT − κV dp + Vm dn ,

siendo  
1 ∂V
α= la expansividad térmica (coeficiente de expansión térmica,)
V ∂T p, n
 
1 ∂V
κ=− la compresibilidad isotérmica,
V ∂p T, n
 
∂V
Vm = el volumen molar.
∂n p, T

Una de las principales aplicaciones del diferencial total en las ciencias fı́sicas es en la
formulación de las leyes de la termodinámica (véanse los Ejemplo 9.22 y 9.27). En los
apartados que siguen utilizaremos (9.16) y su forma lı́mite (9.17) para deducir una serie
de propiedades diferenciales e integrales de las funciones.

9.6. Algunas propiedades diferenciales


La derivada total
En la función de dos variables, z = f (x, y), suponemos que x e y son funciones de una
tercera variable t:

x = x(t) , y = y(t) . (9.19)

Entonces z = f (x(t), y(t)) es esencialmente una función de una única variable t, y existe
su derivada ordinaria dz/dt. Esta derivada, también llamada la derivada total de f con
respecto a t, puede obtenerse directamente sustituyendo las funciones x(t) e y(t) en las
variables de f (x, y) y derivando la función de t resultante. También puede obtenerse,
indirectamente, dividiendo la expresión (9.16) por ∆t y tomando el lı́mite ∆t → 0. De
esta manera, dividir
   
∂z ∂z
∆z ≈ ∆x + ∆y (9.16)
∂x y ∂y x
9.6. Algunas propiedades diferenciales 229

por ∆t nos da    
∆z ∂z ∆x ∂z ∆y
≈ + (9.20)
∆t ∂x y ∆t ∂y x ∆t

y en el lı́mite ∆t → 0,
   
dz ∂z dx ∂z dy
= + . (9.21)
dt ∂x y dt ∂y x dt

Se obtiene el mismo resultado, de manera alternativa, si se divide el diferencial total


(9.17) por dt (infinitesimal).
La ecuación (9.21) es una generalización de la regla de la cadena (véase el Apartado
4.6). Para una función de n variables, u = f (x1 , x2 , x3 , . . . , xn ), en la cual las variables
son todas funciones de t,
n  
du  ∂u dxi
=
dt i=1
∂xi dt
     
∂u dx1 ∂u dx2 ∂u dxn
= + + ··· + . (9.22)
∂x1 dt ∂x2 dt ∂xn dt

EJEMPLO 9.12 Dada z = x2 + y3 , donde x = et e y = e−t , halle dz/dt.


(i) Por sustitución:
dz
z = e2t + e−3t , = 2e2t − 3e−3t = 2x2 − 3y3 .
dt
(ii) Por la regla de la cadena (9.21):
∂z ∂z dx dy
Tenemos = 2x, = −3y2 , y = et = x, = −e−t = −y,
∂x ∂y dt dt
Por lo tanto,
dz ∂z dx ∂z dy
= + = (2x) × (x) + (3y2 ) × (– y) = 2x2 − 3y3 ,
dt ∂x dt ∂y dt
que es idéntico al resultado obtenido por sustitución.

EJEMPLO 9.13 Desplazamiento en un cı́rculo


La ecuación de un cı́rculo en el plano xy con centro en el origen y radio a es x2 + y2 = a2 . Un desplaza-
miento sobre el cı́rculo se describe muy fácilmente si se expresa la ecuación del cı́rculo en función de las
coordenadas polares r y θ:
x = a cos θ , y = a sen θ ,
que tienen la forma de la pareja de ecuaciones (9.19) con θ en vez de t. En general, las ecuaciones de
este tipo se denominan ecuaciones paramétricas de una curva. Sea z = f (x, y). Entonces, por la ecuación
(9.21), y ya que dx/dθ = −y y dy/dθ = x,
       
dz ∂z dx ∂z dy ∂z ∂z
= + = −y +x .
dθ ∂x y dθ ∂y x dθ ∂x y ∂y x
∂z ∂z dz
Por ejemplo, si z = xy, entonces = y, =xy = x 2 − y2 .
∂x ∂y dθ
230 Capı́tulo 9. Funciones de varias variables

Un caso especial de la derivada total (9.21) se obtiene si se sustituye t por x. Entonces


y = y(x) es una función explı́cita de x y z = f (x, y(x)) puede tratarse como función de
una única variable x. A partir de (9.21), tenemos entonces
   
dz ∂z ∂z dy
= + . (9.23)
dx ∂x y ∂y x dx

Vemos que si x = x(t), esta derivada total con respecto a x se relaciona con la derivada
total con respecto a t (9.21) mediante la regla de la cadena:
   
dz dz dx ∂z dx ∂z dy dx
= = + (9.24)
dt dx dt ∂x y dt ∂y x dx dt

dy dx dy
y = .
dx dt dt

EJEMPLO 9.14 Dada z = x2 + y3 , donde y = 1/x, halle dz/dx. Si x = et , halle entonces dz/dt.

dy 1
1. Por la ecuación (9.23), ya que = − 2 = −y2 ,
dx x
dz ∂z ∂z dy
= + = 2x + (3y2 ) × (– y2 ) = 2x − 3y4 .
dx ∂x ∂y dx

dx
2. Si x = et , entonces = et = x, y
dt
dz dz dx
= = 2x2 − 3xy4 .
dt dx dt
Esto es idéntico al resultado del Ejemplo 9.12, ya que x = 1/y.

Desplazamiento sobre una curva de nivel


Vamos a considerar variaciones de x e y que dejen el valor de la función invariante.
En la Figura 9.6, el plano ABC es paralelo al plano xy, de manera que todos los
puntos de la curva APB sobre la superficie que representa a la función tienen un valor de
z constante. El desplazamiento de P a Q se hace por lo tanto sobre una curva de nivel de
la superficie. Entonces, por (9.16),
   
∂z ∂z
∆z = 0 ≈ ∆x + ∆y (9.25)
∂x y ∂y x

y, dividiendo por ∆x,


   
∂z ∂z ∆y
0≈ + .
∂x y ∂y x ∆x
9.6. Algunas propiedades diferenciales 231

En el lı́mite ∆x → 0, el cociente ∆y/∆x tiende a la derivada de y con respecto a x a z


constante, y
     
∂z ∂z ∂y
0= + . (9.26)
∂x y ∂y x ∂x z

Figura 9.6

El mismo resultado se obtiene directamente a partir del diferencial total (9.17) consi-
derando variaciones infinitesimales dx y dy tales que dz = 0:
   
∂z ∂z
dz = 0 = dx + dy .
∂x y ∂y x

Para obtener (9.26) dividimos (formalmente) por dx y, como el proceso es a z constante,


sustituimos dx/dy por la derivada parcial a z constante.
La ecuación (9.26) puede reescribirse como
     
∂y ∂z ∂z
=− (9.27)
∂x z ∂x y ∂y x

y ésta es la pendiente de la gráfica de la función y(x) para la cual z es constante, esto es,
la pendiente de la curva ab en el plano xy de la Figura 9.6 para la cual AB es una curva
de nivel. Además, como
   
∂z ∂x
=1 (9.28)
∂x y ∂z y
232 Capı́tulo 9. Funciones de varias variables

la ecuación también puede escribirse como


    
∂x ∂y ∂z
−1 = . (9.29)
∂y z ∂z x ∂x y

Esta expresión se llama a veces la ‘regla del −1’.


La presencia del signo menos en las ecuaciones (9.27) y (9.29) a veces provoca in-
comodidad, pero se puede explicar geométricamente. En efecto, para la superficie z en
particular que se muestra en las Figuras 9.3 y 9.6, las pendientes a lo largo de las di-
recciones x e y son ambas negativas en P (las lı́neas de fuerza apuntan ‘hacia abajo’),
de manera que (∂z/∂x)y y (∂z/∂y)x son negativas y su cociente en la ecuación (9.27)
es positivo. Sin embargo, según se ve en la Figura 9.6, para un desplazamiento sobre la
curva de nivel desde P a Q, ∆y es necesariamente positivo pero ∆x negativo (o viceversa
para el movimiento de Q a P) de manera que (∂y/∂x)z es negativa. De ahı́ el signo me-
nos. Consideraciones similares se aplican a los otros tres posibles pares de signos de las
pendientes.
Hay que señalar que la distinción entre variables dependientes e independientes ha
desaparecido de las ecuaciones (9.26) a (9.29): cada variable puede ser considerada co-
mo una función de las otras dos. Vemos además que mientras que (9.26) se generaliza
fácilmente para conjuntos de más de tres variables, las ecuaciones (9.27) y (9.29) son
válidas únicamente para tres variables por vez (manteniendo todas las otras constantes).

EJEMPLOS 9.15  
∂y
(i) Dada z = x2 y3 , halle .
∂x z
   
∂z ∂z
= 2xy3 , = 3x2 y3 ,
∂x y ∂y x
     
∂y ∂z ∂z 2xy3 2y
Por la ecuación (9.27), =− =− 2 2 =− .
∂x z ∂x y ∂y x 3x y 3x
 
∂y
(ii) Para r = (x2 + y2 )1/2 , halle .
∂x r
 
∂r x ∂r y ∂y x
= , = y =− .
∂x r ∂y r ∂x r y

La superficie que representa la función r = (x2 + y2 )1/2 es un cono vertical cuyas curvas de nivel
(r = constante) son cı́rculos de radio r paralelos al plano xy. La cantidad −x/y es la pendiente en
(x, y) sobre el cı́rculo.
(iii) El diferencial de volumen de un fluido es (véase el Ejemplo 9.11)
   
∂V ∂V
dV = dT + dp (para una cantidad fija n).
∂T p ∂p T
     
∂V ∂p ∂T
Por la ecuación (9.29), −1 = ,
∂p T ∂T V ∂V p
     
∂p ∂V ∂V α expansividad
de manera que =− = = .
∂T V ∂T p ∂p T κ compresibilidad
9.6. Algunas propiedades diferenciales 233

Cambio de variable constante


Sea z = f (x, y) una función de las variables x e y, y sea u = g(x, y) alguna otra función
de x e y. Vamos a considerar variaciones de las variables tales que u sea constante. En-
tonces, dividiendo el diferencial total dz por la variación infinitesimal dx, a u constante
tenemos
       
∂z ∂z ∂z ∂y
= + . (9.30)
∂x u ∂x y ∂y x ∂x u

Esta ecuación muestra cómo la derivada parcial con respecto a x a y constante está re-
lacionada con la derivada parcial con respecto a x cuando cierta función (u) de x e y se
mantiene constante.

EJEMPLO 9.16 Sea z = f (x, y) y sea u = x2 + y2 , que es la ecuación de un cı́rculo de radio a cuando
u = a2 = constante. Entonces por la ecuación (9.27),
     
∂y ∂u ∂u x
=− =− ,
∂x u ∂x y ∂y x y
y, por lo tanto, por la ecuación (9.30),
     
∂z ∂z x ∂z
= − .
∂x u ∂x y y ∂y x
 
∂z
Si, por ejemplo, z = xy, entonces = y − x2 /y. Este resultado está relacionado con el del Ejemplo
∂x u
dx
9.13. Cuando x2 + y2 = a2 , x = a cos θ y = −y, de manera que por la regla de la cadena

   
dz ∂z dx ∂z
= = −y = x 2 − y2 .
dθ ∂x u dθ ∂x u

Cambio de variables independientes


Sea z = f (x, y) una función de las variables independientes x e y con diferencial total
de z con respecto a x e y
   
∂z ∂z
dz = dx + dy . (9.17)
∂x y ∂y x

Sean las variables x e y funciones ellas mismas de otras dos variables independientes u
y v:

x = x(u, v) , y = y(u, v) . (9.31)


234 Capı́tulo 9. Funciones de varias variables

Podemos entonces considerar z como una función de u y v, y su diferencial total con


respecto a las nuevas variables es
   
∂z ∂z
dz = du + dv . (9.32)
∂u v ∂v u

La relación entre las derivadas parciales de (9.32) y las de (9.17) puede obtenerse de la
siguiente manera. Dividimos el diferencial total (9.17) por du a v constante para obtener
la ecuación (9.33a), y por dv a u constante para obtener (9.33b):
         
∂z ∂z ∂x ∂z ∂y
= + ,
∂u v ∂x y ∂u v ∂y x ∂u v (9.33a)
         
∂z ∂z ∂x ∂z ∂y
= + .
∂v u ∂x y ∂v u ∂y x ∂v u (9.33b)

Las relaciones inversas se obtienen de la misma manera a partir de (9.32):


         
∂z ∂z ∂u ∂z ∂v
= + ,
∂x y ∂u v ∂x y ∂v u ∂x y (9.34a)
         
∂z ∂z ∂u ∂z ∂v
= + .
∂y x ∂u v ∂y x ∂v u ∂y x (9.34b)

EJEMPLO 9.17 De coordenadas polares a cartesianas


Sea z = f (x, y) una función de las coordenadas cartesianas de un punto en el plano xy. La posición del punto
se puede dar igual de bien utilizando las coordenadas polares r y θ, donde
x = r cos θ , y = r sen θ ,
corresponden a las ecuaciones (9.31) con r sustituyendo a u y θ a v. Entonces
             
∂z ∂z ∂x ∂z ∂y ∂z ∂z
= + = cos θ + sen θ ,
∂r θ ∂x y ∂r θ ∂y x ∂r θ ∂x y ∂y x
              (9.35)
∂z ∂z ∂x ∂z ∂y ∂z ∂z
= + = −y +x .
∂θ r ∂x y ∂θ r ∂y x ∂θ r ∂x y ∂y x

La primera de éstas es idéntica a la ecuación (9.5) y tiene la misma interpretación gráfica. La segunda
es idéntica al resultado obtenido en el Ejemplo 9.13 para el desplazamiento alrededor de un cı́rculo. Las
relaciones inversas son, por las ecuaciones (9.34),
            
∂z ∂z ∂r ∂z ∂θ ∂z sen θ ∂z
= + = cos θ − ,
∂x y ∂r θ ∂x y ∂θ r ∂x y ∂r θ r ∂θ r
             (9.36)
∂z ∂z ∂r ∂z ∂θ ∂z cos θ ∂z
= + = sen θ + .
∂y x ∂r θ ∂y x ∂θ r ∂y x ∂r θ r ∂θ r
9.6. Algunas propiedades diferenciales 235

Vemos que si v = x, la ecuación (9.33b) es idéntica a la ecuación (9.30) para un cambio


de variable constante, de y a u.

Ecuación de Laplace en dos dimensiones


La ecuación de Laplace en dos dimensiones es

∂2f ∂2f
+ = 0, (9.37)
∂x2 ∂y2

donde f = f (x, y) es una función de las coordenadas cartesianas de un punto en un


plano. La ecuación de Laplace aparece en muchas ramas de las ciencias fı́sicas y es la
ecuación fundamental de la ‘teorı́a del potencial’, cuando un sistema fı́sico se describe
mediante una función potencial. Por ejemplo, las funciones potenciales gravitacional y
electrostática en una región libre de materia cumplen la ecuación de Laplace en tres
dimensiones (véase el Capı́tulo 10). La ecuación en dos dimensiones es importante en
teorı́as de flujos: por ejemplo en la teorı́as del flujo de un fluido y de la conducción
térmica.5
La posición de un punto en el plano puede especificarse, como en el Ejemplo 9.17,
mediante las coordenadas polares r y θ, siendo x = r cos θ e y = r sen θ. La función f
puede por lo tanto considerarse como una función de r y θ, f = f (r, θ), y la ecuación
(9.37) puede transformarse de una ecuación en coordenadas cartesianas a una ecuación
en coordenadas polares por el procedimiento descrito en el Ejemplo 9.17. En el Ejemplo
9.18 se muestra como hacer esto, con el resultado

∂ 2f ∂2f ∂2f 1 ∂f 1 ∂2f


+ = + + = 0.
∂x2 ∂y2 ∂r2 r ∂r r2 ∂θ2

El operador diferencial ∂2 ∂2
∇2 = +
∂x2 ∂y2
(9.38)
∂2 1∂ 1 ∂2
= 2+ + 2 2
∂r r ∂r r ∂θ
(que se lee como ‘laplaciano’ o ‘nabla cuadrado’) se denomina operador laplaciano (si
bien tanto el sı́mbolo como el nombre se suelen reservar a la forma tridimensional; véase
el Capı́tulo 10). La ecuación de Laplace es entonces

∇2 f = 0 (9.39)

y las soluciones f de la ecuación se conocen como funciones armónicas.

05. Pierre Simon de Laplace (1749-1827). Su Traité de mécanique céleste (Tratado de mecánica ce-
leste) en 5 volúmenes (1799-1825) marcó la culminación del enfoque newtoniano de la gravitación. Cuenta
la leyenda que mientras estaba en la École Militaire, donde enseñaba matemáticas elementales a los cadetes,
examinó, y aprobó, a Napoleón en 1785.
236 Capı́tulo 9. Funciones de varias variables

EJEMPLO 9.18 La ecuación bidimensional de Laplace en coordenadas polares


Por la primera de las ecuaciones (9.36) del Ejemplo 9.17,
∂f ∂f sen θ ∂f
= cos θ − .
∂x ∂r r ∂θ
Entonces
  
∂2f ∂ sen θ ∂ ∂f sen θ ∂f
= cos θ − cos θ −
∂x2 ∂r r ∂θ ∂r r ∂θ
   
∂ ∂f sen θ ∂f sen θ ∂ ∂f sen θ ∂f
= cos θ cos θ − − cos θ −
∂r ∂r r ∂θ r ∂θ ∂r r ∂θ
 
∂2f sen θ ∂f sen θ ∂ 2 f
= cos θ cos θ 2 + 2 −
∂r r ∂θ r ∂r∂θ
 
sen θ ∂f ∂2f cos θ ∂f sen θ ∂ 2 f
− − sen θ + cos θ − −
r ∂r ∂θ∂r r ∂θ r ∂θ 2
 
∂2f sen2 θ ∂f sen2 θ ∂ 2 f 2 sen θ cos θ 1 ∂f ∂2f
= cos θ 2 +
2
+ + − .
∂r r ∂r r2 ∂θ 2 r r ∂θ ∂r∂θ

De manera similar
 
∂2f ∂2f cos2 θ ∂f cos2 θ ∂ 2 f 2 sen θ cos θ 1 ∂f ∂2f
= sen2 θ 2 + + − − .
∂y 2 ∂r r ∂r r2 ∂θ 2 r r ∂θ ∂r∂θ

Por lo tanto
∂2f ∂2f ∂2f 1 ∂f 1 ∂2f
+ 2 = 2 + + 2 2.
∂x 2 ∂y ∂r r ∂r r ∂θ

EJEMPLO 9.19 Demuestre que la función f = x2 − y2 cumple la ecuación de Laplace.

1. En coordenadas cartesianas,

∂f ∂2f ∂f ∂2f
= 2x , = 2; = −2y , = −2 .
∂x ∂x2 ∂y ∂y2

∂2f ∂2f
Por lo tanto, + 2 = 0.
∂x 2 ∂y
2. En coordenadas polares, f = r2 ( cos2 θ − sen2 θ) = r2 cos 2θ,

∂f 2f ∂2f 2f
= 2r cos 2θ = , = 2 cos 2θ = 2 ,
∂r r ∂r2 r
∂f ∂2f
= −2r2 sen 2θ , = −4r2 cos 2θ = −4f .
∂θ ∂θ 2
∂2f 1 ∂f 1 ∂2f 2f 2f 4f
Por lo tanto, + + 2 = 2 + 2 − 2 = 0.
∂r 2 r ∂r r ∂θ 2 r r r
9.7. Diferenciales exactos 237


EJEMPLO 9.20 Demuestre que la función f = ln r, con r = x2 + y2 , cumple la ecuación de Laplace.
Como la función depende únicamente de r, ∂f /∂θ = 0, y las derivadas con respecto a r son derivadas
totales:
d2 f 1 df
∇2 f (r) = 2 + .
dr r dr
Tenemos df /dr = 1/r y d f /dr = −1/r . Por lo tanto ∇ f
2 2 2 2
= 0.
Este ejemplo es importante porque es posible demostrar que la única solución de la ecuación de Laplace

en dos dimensiones que depende únicamente de r = x2 + y2 tiene la forma general f = a ln r + b. Esta
función aparece en la teorı́a del potencial en dos dimensiones.

9.7. Diferenciales exactos


Una de las ecuaciones fundamentales de la termodinámica, que combina tanto la
primera como la segunda ley, es

dU = T dS − p dV , (9.40)

donde U es la energı́a interna del sistema termodinámico, S su entropı́a, y p, V y T son


la presión, el volumen y la temperatura. La cantidad dU es esencialmente el diferencial
total de U como función de S y V, y puede por lo tanto expresarse como
   
∂U ∂U
dU = dS − dV (9.41)
∂S V ∂V S

de manera que, igualando (9.40) y (9.41),


   
∂U ∂U
T= , −p = . (9.42)
∂S V ∂V S

La expresión del segundo miembro de (9.40) es de la forma

F dx + G dy (9.43)

y, en el caso general, F = F(x, y) y G = G(x, y) son dos funciones arbitrarias de x e y.


Un caso especial se presenta cuando existe una función z = z(x, y) tal que
   
∂z ∂z
F= , G= . (9.44)
∂x y ∂y x

El diferencial (9.43) se llama entonces un diferencial exacto, y puede igualarse al dife-


rencial total de z:
238 Capı́tulo 9. Funciones de varias variables

   
∂z ∂z
F dx + G dy = dz = dx + dy . (9.45)
∂x y ∂y x

La condición para que el diferencial en dos variables sea exacto es que las funciones F
y G satisfagan
   
∂F ∂G
= . (9.46)
∂y x ∂x y

Por las igualdades (9.44), cada una de esas derivadas parciales es igual a la derivada cru-
zada segunda de z, ∂ 2 x/∂x∂y. La condición (9.46) se llama a veces relación de recipro-
cidad de Euler, y se usa en termodinámica para obtener varias relaciones, llamadas las
relaciones de Maxwell, entre las propiedades termodinámicas (véase el Ejemplo 9.22).6
El significado de la exactitud lo analizamos en el siguiente apartado.

EJEMPLO 9.21 Criterio de exactitud

1. F dx + G dy = (x2 − y2 )dx + 2xy dy.


   
∂F ∂G
Tenemos = −2y y = +2y, por lo que el diferencial no es exacto.
∂y x ∂x y
2. F dx + G dy = (2ax + by)dx + (bx + 2cy)dy.
   
∂F ∂G
Tenemos =b= , y el diferencial es exacto.
∂y x ∂x y
Se comprueba fácilmente que es el diferencial total de ax2 + bxy + cy2 + d.

EJEMPLO 9.22 Relaciones de Maxwell


Se deduce de las ecuaciones (9.42) que
   
∂T ∂2U ∂p ∂2U
= , − = ,
∂V S ∂V∂S ∂S V ∂S∂U

de modo que    
∂T ∂p
=− .
∂V S ∂S V
Ésta es una de las cuatro relaciones de Maxwell importantes en termodinámica. Las otras tres se obtienen
de los diferenciales de la entalpı́a H = U + pV, de la función de Helmholtz (energı́a libre) A = U − TS,

06. Clairaut utilizó en 1739 la igualdad entre las derivadas parciales segundas cruzadas para analizar
la exactitud de un diferencial (y también Euler hacia la misma época). Alexis Claude Clairaut (1713-1765)
fue miembro de una familia de 20 hermanos, de los cuales sólo uno sobrevivió al padre. Presentó un trabajo
sobre geometrı́a en la Académie des Sciences con 13 años de edad, y fue admitido como miembro con 18
años (un hermano menor, conocido como ‘le cadet Clairaut’, publicó un libro de cálculo en 1731 con 15
años de edad, y murió de viruela un año después). Sus Recherches sur les courbes à double courbure (In-
vestigaciones sobre curvas de doble curvatura) de 1731 marcaron el principio del desarrollo de la geometrı́a
cartesiana en tres dimensiones.
9.8. Integrales de lı́nea 239

y de la función de Gibbs (energı́a libre) G = H − TS. Para la entalpı́a, por ejemplo (y usando (9.40) para
dU),
dH = dU + pdV + Vdp = TdS + Vdp .
La cantidad dH es el diferencial total de H como función de S y p, de modo que
   
∂H ∂H
T= , V= ,
∂S p ∂p S

y la correspondiente relación de Maxwell es


   
∂T ∂V
= .
∂p S ∂S p

De manera similar,    
∂S ∂p
dA = −SdT − pdV −→ = ,
∂V T ∂T V
   
∂S ∂V
dG = −SdT + Vdp −→ = .
∂p T ∂T p

9.8. Integrales de lı́nea


Sea la función f (x) y la integral
 b

f (x) dx . (9.47)
a

En el Apartado 5.4 interpretamos la integral como el ‘área bajo la curva’ de la gráfica


de f (x) entre x = a y x = b. Una interpretación alternativa se obtiene considerando la
función f (x) como algún tipo de propiedad asociada a los puntos x de una lı́nea. Sea f (x),
por ejemplo, la densidad de masa de una varilla rectilı́nea de material con longitud b − a
(véase el Apartado 5.6). El diferencial
b de masa en el elemento dx es entonces dm =
f (x) dx y la masa total es M = a f (x) dx. De manera similar (véase el Apartado 5.7), si
f (x) es la fuerza que se ejerce sobre un cuerpo a lo largo de una recta, el diferencial de
trabajo es dW = f (x) dx y el trabajo total entre a y b vuelve a ser otra vez la integral
definida.
En estos ejemplo la lı́nea es una lı́nea recta, que se toma como eje x. En vez de
eso, consideremos una curva en el plano xy (Figura 9.7), y sea f (x, y) alguna propiedad
asociada a los puntos de la curva.
Por ejemplo, sea f (x, y) la densidad de masa de una varilla curva de material, AB en
la Figura 9.7. El diferencial de masa en el elemento ds es dm = f (x, y)ds y la masa total
es
 
M = dm = f (x, y) ds , (9.48)
C C
240 Capı́tulo 9. Funciones de varias variables

donde C significa integración a lo largo de la curva C desde A hasta B. Igualmente para
el trabajo realizado a lo largo de la curva. La cantidad

I = f (x, y) ds (9.49)
C

se llama integral de lı́nea o curvilı́nea, e incluye la integral definida ordinaria como


caso particular. La curva C se denomina camino de integración.7

Figura 9.7

Una integral de lı́nea se puede convertir en una integral ordinaria de la siguiente ma-
nera. Vimos en el Apartado 5.4, sobre la integral como una longitud, que para cantidades
infinitesimales

 2 1/2
dy
ds = 1 + dx . (9.50)
dx

Entonces, si expresamos la curva C en forma explı́cita y = y(x),


  b

 2 1/2
dy
I= f (x, y) ds = f (x, y(x)) 1 + dx . (9.51)
C a dx

EJEMPLO 9.23 Integre la función f (x, y) = xy sobre la curva y = x2 /2 desde el punto (x, y) = (0, 0)
hasta el punto (1, 1/2).

07. Maxwell empleó el concepto y la notación de la integral de lı́nea en sus estudios sobre los cam-
pos eléctricos en 1855. James Clerk Maxwell (1831-1879), nacido en Edimburgo, está al mismo nivel que
Newton y Einstein en las teorı́as fı́sicas precuánticas. Basándose en el trabajo de Michael Faraday, Max-
well presentó sus ecuaciones de campo en su Dynamical theory of the electromagnetic field en 1864. La
Dynamical theory of gases de 1859 describe la distribución de Maxwell, con aplicaciones a la teorı́a de la
viscosidad, la conducción del calor y la difusión de los gases.
La notación para la integral de lı́nea apareció en un texto de fı́sica de Charles Delauney (1816-1872) en
1856 para el trabajo realizado a lo largo de una curva, y se adoptó rápidamente en fı́sica.
9.8. Integrales de lı́nea 241

Tenemos que f (x, y(x)) = x3 /2 y dy/dx = x. Por lo tanto


 1  2 
dy 1/2 1 1 3
I= f (x, y) 1 + dx = x (1 + x2 )1/2 dx .
0 dx 2 0

Para integrar, sustituimos u = 1 + x2 , du = 2x dx. Tenemos entonces


 √
1 2
I= (u − 1)u1/2 du = (1 + 2)/15 .
4 1

Una forma general alternativa para la integral de lı́nea en un plano es



I= F(x, y) dx + G(x, y) dy . (9.52)
C

Esto puede convertirse en una integral ordinaria sobre una de las dos variables si se
conoce la ecuación de la curva C. Por ejemplo, para una curva y = f (x) desde x = a
dy
hasta x = b, sustituyendo dy por dx en (9.52) tenemos
dx
 b

dy
I= F(x, y) + G(x, y) dx . (9.53)
a dx

De manera alternativa, si la curva viene dada en forma paramétrica, con x = x(t) e


dx dy
y = y(t) desde t = tA hasta t = tB , entonces dx = dt, dy = dt y (9.52) es
dt dt
 t

dx B
dy
I= F(x, y) + G(x, y) dt . (9.54)
t dtA
dt

EJEMPLO 9.24 Halle el valor de la integral de lı́nea (9.52) si F = −y, G = xy y C es la recta de la Figura
9.8 de A a B (x = 1 a x = 0).
La ecuación de la recta es y = 1 − x. Entonces dy = −dx y por la ecuación
(9.53)
  0
−y dx + xy dy = − (1 − x) − x(1 − x) dx
C 1
 1
2
= (1 − x2 ) dx = .
0 3

Figura 9.8

En general, el valor de una integral de lı́nea depende del camino de integración entre sus
puntos extremos. Esto queda de manifiesto en el siguiente ejemplo.
242 Capı́tulo 9. Funciones de varias variables

EJEMPLO 9.25 Halle el valor de la integral de lı́nea (9.52) cuando F y G son como en el Ejemplo 9.24,
pero C es ahora el arco de cı́rculo que se muestra en la Figura 9.9.

La ecuación del arco de cı́rculo es y = + 1 − x2 . Entonces dy =
−x x
√ dx = − dx y
1 − x2 y
  0  π 1
I= −y dx + xy dy = − 1 − x2 − x2 dx = +
C 1 4 3
 1
(véase el Ejemplo 6.10 para la integral 1 − x2 dx). Este resultado es dis-
0 Figura 9.9
tinto del obtenido en el Ejemplo 9.24.

Las integrales de lı́nea son importantes en varias ramas de las ciencias fı́sicas. Por ejem-
plo, cuando se generalizan a curvas en tres dimensiones, proporcionan un método de
calcular el trabajo efectuado por una fuerza a lo largo de un camino arbitrario en el es-
pacio ordinario. Volveremos a este tema en el Capı́tulo 16. La dependencia de la integral
de lı́nea con el camino puede entenderse, por ejemplo, en función del trabajo efectuado
sobre un cuerpo al moverse desde A a B a lo largo del camino. Del estudio sobre traba-
jo y energı́a potencial del Apartado 5.7, cabe esperar que el trabajo efectuado dependa
del camino si las fuerzas que actúan sobre el cuerpo son fuerzas no conservativas, por
ejemplo cuando el trabajo se hace oponiéndose a la fricción. En particular, se efectúa un
trabajo neto al mover el cuerpo a lo largo de una curva cerrada. Por otra parte, si las
fuerzas son conservativas y se pueden derivar de una función de energı́a potencial, como
en la ecuación (5.57) del Apartado 5.7, entonces el trabajo es independiente del camino,
y no se efectúa trabajo neto en una curva cerrada. En el presente caso general, el valor
de una integral de lı́nea es independiente del camino entre dos puntos fijos si la cantidad
entre corchetes de la ecuación (9.52) es un diferencial exacto.8 Si es ası́, según el estudio
del Apartado 9.7, existe una función z(x, y) tal que
   
∂z ∂z
F(x, y)dx + G(x, y)dy = dz = dx + dy (9.55)
∂x y ∂y x

y la integral de lı́nea (9.52) puede expresarse como


 
   
∂z ∂z
I = dz = dx + dy . (9.56)
C C
∂x y ∂y x

Entonces, como en la Figura 9.10, tenemos que para un camino desde A en (x1 , y1 ) hasta
B en (x2 , y2 )
 B
I = dz = z = z(x2 , y2 ) − z(x1 , y1 ) (9.57)
C A

08. Esta independencia del camino para la integral de lı́nea de un diferencial exacto fue observada
por Riemann en 1857.
9.8. Integrales de lı́nea 243

y esto sólo depende de los valores de z en los extremos (vemos que el valor de la integral
cambia de signo si se cambia el sentido de la integración desde B a A).

Figura 9.10

Interpretado en función de la representación gráfica de z(x, y) del Apartado 9.2, la inte-


gral de lı́nea es el cambio en ‘altura’ sobre el plano xy en la superficie que representa a
z. Esto no puede depender el camino recorrido entre los puntos extremos.

EJEMPLO 9.26 Independencia del camino para un diferencial exacto


Vimos en el Ejemplo 9.21 que el diferencial

(2ax + by) dx + (bx + 2cy) dy

es exacto e igual al diferencial total de z = ax2 + bxy + cy2 + d. Consideremos los dos caminos desde A
hasta B que se muestran en la Figura 9.10: el camino C y el camino C1 + C2 .
(i) El camino C es el segmento con ecuaciones paramétricas

x = x1 + (x2 − x1 )t , y = y1 + (y2 − y1 )t , t = 0 → 1.

Entonces, por la ecuación (9.54),



dx dx
I = F(x, y) + G(x, y) dt
C dt dt
 1
= [(2ax1 + by1 )(x2 − x1 ) + (bx1 + 2cy1 )(y2 − y1 )]
0

+ 2t[a(x2 − x1 )2 + b(x2 − x1 )(y2 − y1 ) + c(y2 − y1 )2 ] dt

= a(x22 − x12 ) + b(x2 y2 − x1 y1 ) + c(y22 − y21 ) .

(ii) Camino C1 + C2 . El camino C1 es con y = y1 constante, y el camino C2 es con x = x2 constante.


Entonces
 
I = F(x, y1 ) dx + G(x2 , y) dy
C1 C2
 x2  y2
= (2ax + by1 ) dx + (bx2 + 2cy) dy
x1 y1

= a(x22 − x12 ) + b(x2 y2 − x1 y1 ) + c(y22 − y21 ) .

La integral de lı́nea es la misma para ambos caminos, y es igual a z(x2 , y2 ) − z(x1 , y1 ).


244 Capı́tulo 9. Funciones de varias variables

EJEMPLO 9.27 Variación de la entropı́a en termodinámica


La variación de la entropı́a cuando un sistema pasa de un estado con presión y temperatura (p1 , T1 ) a un
estado con presión y temperatura (p2 , T2 ) puede obtenerse a partir de medidas calorimétricas de la capacidad
calorı́fica y la expansividad térmica,
   
∂H 1 ∂V
Cp = , α= ,
∂T p V ∂T p

de la siguiente manera. Considerando la entropı́a como una función de p y T, el diferencial total de la


entropı́a es    
∂S ∂S
dS = dT + dp .
∂T p ∂p T
Entonces, por ser la entropı́a una función de estado, el cambio al pasar de un estado a otro es independiente
del camino: 
   
∂S ∂S
∆S1→2 = S(p2 , T2 ) − S(p1 , T1 ) = dT + dp .
C ∂T p ∂p T
Escogiendo el camino mostrado en la Figura 9.11,
∆S1→2 = ∆S1→3 + ∆S3→2 ,
donde ∆S1→3 es con p = p1 constante:

∆S1→3 = S(p1 , T2 ) − S(p1 , T1 )


  T2  
∂S
= dS = dT ,
C1 T1 ∂T p=p1

y ∆S3→2 es con T = T2 constante:

∆S3→2 = S(p2 , T2 ) − S(p1 , T2 )


  p2  
∂S
= dS = dp .
C2 p1 ∂p T=T2
Figura 9.11

Se deduce a partir del diferencial de entalpı́a dH = TdS + Vdp (Ejemplo 9.22) que
   
∂H ∂S
=T = Cp ,
∂T p ∂T p

dividiendo dH por dT a p constante. Por otra parte, la relación de Maxwell que se obtiene del diferencial de
la función de Gibbs es    
∂S ∂V
=− = −αV .
∂p T ∂T p
Por lo tanto,
 T2  p2
Cp
∆S1→3 = dT (en p = p1 ), ∆S3→2 = − αV dp (en T = T2 ).
T1 T p1

Experimentalmente, la capacidad calorı́fica se mide a distintas temperaturas entre T1 y T2 a presión p1 ,


y la expansividad a distintas presiones entre p1 y p2 a temperatura T2 . Las integrales se calculan ya sea
representando Cp /T frente a T y αV frente a p y midiendo el área bajo la curva en cada caso, o bien
utilizando un método de integración numérico (véase el Capı́tulo 20).
9.9. Integrales múltiples 245

Se demuestra fácilmente que para una función continua como la función cuadrática
del ejemplo 9.26, la integral de lı́nea alrededor de una curva cerrada es cero. Hay que
señalar, sin embargo, que este resultado es válido en general únicamente si el diferencial
Fdx + Gdy es exacto en todos los puntos de la curva y del interior de la curva cerrada.
Consideraciones adicionales sobre este punto quedan fuera del propósito de este libro.

9.9. Integrales múltiples


Una función de dos variables independientes, f (x, y), puede integrarse con respecto a
una de ellas manteniendo la otra constante:
 b  d
f (x, y) dx o f (x, y) dy .
a c

EJEMPLO 9.28 Integre f (x, y) = 2xy + 3y2 con respecto a x en el intervalo a ≤ x ≤ b, y con respecto a
y en el intervalo c ≤ y ≤ d.
 b
1. (2xy + 3y2 ) dx = [x2 y + 3y2 x]ba = y(b2 − a2 ) + 3y2 (b − a) .
a
 d
2. (2xy + 3y2 ) dy = [xy2 + y3 ]dc = x(d2 − c2 ) + (d3 − c3 ) .
c

Aparte de estas ‘integraciones parciales’, se define también la integral con respecto a


ambas variables x e y:
 d b  d  b
  b d

f (x, y) dx dy = f (x, y) dx dy = f (x, y) dy dx . (9.58)
c a c a a c

Esto se denomina integral doble y se calcula integrando primero con respecto a una
variable y luego con respecto a la otra. El valor de la integral no depende del orden
en el cual se haga la integración si la función es continua dentro de los intervalos de
integración, pero hay que tener cierto cuidado si hay discontinuidades.

EJEMPLO 9.29 Evalúe la integral (9.58) para f (x, y) = 2xy + 3y2 .


1. Integrando primero con respecto a x, utilizando el resultado del Ejemplo 9.28(i),
 d b  d
(2xy + 3y2 ) dx dy = y(b2 − a2 ) + 3y2 (b − a) dy
c a c
1
= (d2 − c2 )(b2 − a2 ) + (d3 − c3 )(b − a) .
2
2. Integrando primero con respecto a y, utilizando el resultado del Ejemplo 9.28(ii),
 b d  b
(2xy + 3y2 ) dy dx = x(d2 − c2 ) + (d3 − c3 ) dx
a c a
1
= (d2 − c2 )(b2 − a2 ) + (d3 − c3 )(b − a) .
2
246 Capı́tulo 9. Funciones de varias variables

Cuando no se especifica explı́citamente el orden de integración, hay que tener cuidado de


asociar cada pareja de lı́mites de integración con la variable apropiada. Ası́ por ejemplo,
si una integral triple se expresa como
 f d b

I= f (x, y, z) dx dy dz
e c a

el convenio es que la integración ha de hacerse de dentro hacia afuera, siendo (a, b) los
lı́mites para x, (c, d) para y, y (e, f ) para z:
 f  d
 b 
I= f (x, y, z) dx dy dz .
e c a

Los conceptos y métodos de integración presentados en los Capı́tulos 5 y 6 para inte-


grales de una variable se aplican a las integrales múltiples con algunos cambios en la
interpretación. La integral doble se trata con cierto detalle en los apartados que siguen.
En el Capı́tulo 10 se considera el caso particular de la integral triple y su importancia
para describir sistemas fı́sicos en tres dimensiones.

9.10. La integral doble


La integral doble se puede definir como el lı́mite de una suma (doble), de la misma
forma en que definimos la integral de Riemann en el apartado 5.4. Sea f (x, y) una función
continua de x e y en una región rectangular del plano xy dada por a ≤ x ≤ b y c ≤ y ≤ d
(Figura 9.12).

Figura 9.12

Se divide el intervalo x = a → b en m subintervalos de ancho ∆xr = xr − xr−1 y el


intervalo y = c → d en n subintervalos de ancho ∆ys = ys − ys−1 . Esto es, se divide al
rectángulo en pequeños rectángulos de área ∆Ars = ∆xr ∆ys . La integral (9.58) se define
entonces como el lı́mite
9.10. La integral doble 247

 d b 
n

m

f (x, y) dx dy = lim
→∞ m
f (xr , ys )∆xr ∆ys (9.59)
c a n→∞
s=1 r=1

(si existe el lı́mite).


El doble sumatorio (9.59) puede hacerse en cualquier orden: bien sea como
m  n 
  
m

f (xr , ys )∆ys ∆xr = vr ∆xr , (9.60)


r=1 s=1 r=1

donde vr es la suma de los elementos para una franja vertical y luego se suman todas las
franjas verticales, o como
n  m 
  
n

f (xr , ys )∆xr ∆ys = hs ∆ys , (9.61)


s=1 r=1 s=1

donde hs es la suma de los elementos para una franja horizontal y luego se suman todas
las franjas horizontales. Esos dos órdenes de la suma corresponden a los dos órdenes de
integración de (9.58).
Ası́ como la integral de una variable se interpretó en el Apartado 5.4 como el área
bajo la curva, la integral doble puede interpretarse como el ‘volumen bajo la superficie’,
es decir, el volumen entre la superficie que representa a la función f (x, y) y el plano xy.9
De manera alternativa, la integral doble puede ser interpretada como una propiedad de la
región rectangular del plano xy. Por ejemplo, si f (x, y) es la densidad de masa superficial,
el diferencial de masa en el elemento de área dA = dx dy es dm = f (x, y)dA y la masa
total es
  d b
M = f (x, y) dA = f (x, y) dx dy , (9.62)
R c a


donde R representa la integración sobre la región (rectangular). En el caso particular
f (x, y) = 1, la integral es el área del rectángulo:
  d b  b  d

dA = dx dy = dx dy = (b − a)(d − c) .
R c a a c

En general, no es necesario que la región del plano xy sea rectangular. Sea f (x, y) continua
en el interior y en la frontera de una región R del plano xy.
La forma de la integral en la región depende de como se defina la frontera. En la
Figura 9.13a la frontera se compone de dos partes: y = g(x) ‘por debajo’ de los puntos
extremos x = a y x = b, e y = h(x) ‘por encima’ de esos puntos. El interior de R es

09. Clairaut trató la integral


doble como un volumen en sus Recherches de 1731. La notación con el
doble signo de integración ( ) fue empleada por primera vez por Lagrange en 1760.
248 Capı́tulo 9. Funciones de varias variables

entonces

g(x) ≤ y ≤ h(x) para a≤x≤b

y la integral sobre la región es (la suma de las franjas verticales)


  b h(x)

I= f (x, y) dA = f (x, y) dy dx .
R a g(x) (9.63a)

En la Figura 9.13b la frontera se compone de las dos partes: x = p(y) ‘a la izquierda’


de los puntos extremos y = c e y = d, y x = q(y) ‘a la derecha’. El interior de R es
entonces

p(y) ≤ x ≤ q(y) para c≤y≤d

y la integral es (la suma de las franjas horizontales)


  d  q(y)

I= f (x, y) dA = f (x, y) dx dy .
R c p(y) (9.63b)

Figura 9.13

EJEMPLO 9.30 Evalúe


√ la integral de f (x, y) = 1 + 2xy en la región R acotada por la recta y = x y la
curva y = x2 (o x = y), como en la Figura 9.14. Calcule también el área de R.

(i) utilizando la ecuación (9.63a) con g(x) = x2 y h(x) = x,

 
1 x
I = 0
(1 + 2xy) dy dx
x2
1  1
= 0
[y + xy2 ]xx2 dx = 0 [x + x3 − x2 − x5 ] dx
= 1
4
.
Figura 9.14
9.11. Cambio de variables 249


(ii) utilizando la ecuación (9.63b) con p(y) = y y q(y) = y,
 1  √
y 
I = (1 + 2xy) dx dy
0 y
   
1 √
y
1
√ 1
= [x + x2 y]y dy = [ y + y2 − y − y3 ] dy = .
0 0 4

El área de la región R es
 1  x   1
1
A= dy dx = (x − x2 ) dx = .
0 x2 0 6

9.11. Cambio de variables


Vimos en el Apartado 6.3 que uno de los métodos generales principales para evaluar
integrales es el método de sustitución, en el cual, dada una integral definida en la variable
x, se puede introducir una nueva variable de integración tomando

dx
x = x(u) , dx = du ,
du
de manera que
 b  u(b)
dx
f (x) dx = f (x(u)) du .
a u(a) du

Los cambios de variable son incluso más importantes para integrales dobles (y múltiples)
porque tanto la función como la frontera de la región pueden ser fuentes de dificultades si
se expresan en variables inadecuadas. Consideremos por ejemplo la integral de f (x, y) =
/
e−(x +y ) en una región circular (Figura 9.15).
2 2 1 2

Figura 9.15

Por la ecuación (9.63a),


  a
 √
+ a2 −x2

−(x2 +y2 )1/2
I= f (x, y) dA = √
e dy dx . (9.64)
R −a − a2 −x2
250 Capı́tulo 9. Funciones de varias variables

En este ejemplo, tanto la función como la frontera se expresan de manera más sencilla
mediante coordenadas polares (r, θ). En efecto,

f (x, y) = f (r cos θ, r sen θ) = e−r ,

y la ecuación del cı́rculo de radio a es r = a. Es sensato por lo


tanto hacer el cambio a coordenadas polares

x = r cos θ , y = r sen θ .

El correspondiente elemento de área, dA, se puede deducir de


la Figura 9.16. La región sombreada tiene área

1
∆A = r∆r∆θ + (∆r)2 ∆θ
2 Figura 9.16

de manera que, para cantidades infinitesimales, dA = r dr dθ. Tenemos entonces


 
f (x, y) dx dy = f (r cos θ, r sen θ) r dr dθ . (9.65)
R R

La integral (9.64) es por lo tanto


 2π  a  2π  a

I= e r dr dθ =
−r
dθ × e−r r dr = 2π[1 − e−a (a + 1)] .
0 0 0 0

2
EJEMPLO 9.31 Evalúe la integral de f (r, θ) = e−r sen2 θ, (i) en el área de un cı́rculo de radio a y (ii) en
todo el plano.
  2π a
2 2
(i) e−r sen2 θ dA = e−r sen2 θ r dr dθ .
R 0 0
Por ser la integral el producto de una función de r y de una de θ
2 2
e−r sen2 θ r = (e−r r)( sen2 θ) ,

y por ser los lı́mites de integración constantes, la integral doble se puede factorizar:
 a  2π
2
I= e−r r dr × sen2 θ dθ .
0 0

Como sen θ =
2 1
2
(1 − cos 2θ), tenemos
 2π  2π
1 1 1
sen2 θ dθ = (1 − cos 2θ) dθ = [θ − sen 2θ]2π
0 = π,
0 2 0 2 2

y, por otra parte, haciendo el cambio u = r2 , du = 2r dr,


 a  a2
2 1 1 2 1 2
e−r r dr = e−u du = [ − e−u ]a0 = (1 − e−a ) .
0 2 0 2 2
9.11. Cambio de variables 251

π 2
Por lo tanto I = (1 − e−a ) .
2
 2π ∞
2 π
(ii) Tomando a → ∞, e−r sen2 θ r dr dθ = .
0 0 2

Caso general
El paso de coordenadas cartesianas a polares es un caso particular de transformación
de variables (o de coordenadas). Es también el más importante en la práctica, y aquı́ sólo
daremos una escueta presentación del caso general. Sean

x = x(u, v) , y = y(u, v) , (9.66)

funciones continuas y derivables de las variables u y v, de manera que a cada punto (x, y)
de una región R del plano xy le corresponde un único punto (u, v) en la correspondiente
región R∗ del plano uv. Entonces
     
f (x, y) dx dy = f x(u, v), y(u, v) |J| du dv , (9.67)
R R∗

donde |J| es el módulo del jacobiano de la transformación,10

∂(x, y) ∂x ∂y ∂x ∂y
J= = − . (9.68)
∂(u, v) ∂u ∂v ∂v ∂u

Por ejemplo, si x = r cos θ e y = r sen θ, entonces

∂x ∂y ∂x ∂y
J= − = r cos2 θ + r sen2 θ = r
∂r ∂θ ∂θ ∂r
y dA = dxdy → dA = r dr dθ, como obtuvimos por consideraciones geométricas a partir
de la Figura 9.16. El jacobiano se emplea en la formulación avanzada de la termodinámi-
ca para los cambios de variables termodinámicas. El método puede generalizarse a tres
variables o más.
 ∞
e−x dx
2
La integral
0

En el Ejemplo 6.16 del Apartado 6.5 se dijo que esta integral no se podı́a evaluar con
los métodos descritos en los Capı́tulos 5 y 6. Sin embargo, se puede evaluar utilizando un
‘truco’ que implica el paso de una integral doble de coordenadas cartesianas a polares.11

010. Carl Gustav Jacobi (1804-1851), nacido en Berlı́n, trató las cantidades llamadas jacobianos en
su De determinantibus functionalibus (Sobre determinantes funcionales) de 1841. El cambio de variables
en una integral doble fue dado por Euler para el caso general en 1769.
011. De Moivre calculó la integral por vez primera en 1733. Laplace, siguiendo a Euler, utilizó en
1774 el método que describimos aquı́.
252 Capı́tulo 9. Funciones de varias variables

Tenemos que
 ∞  ∞
1
I= −x2
dx = e−x dx
2
e
0 2 −∞

por ser el integrando una función par de x (véase el Apartado 5.3). Además

1 ∞ −y
I=
2
e dy ,
2 −∞

ya que el valor de una integral definida no depende del sı́mbolo que se emplee como
variable de integración. Por lo tanto
  ∞  
1 ∞ −x 1 ∞ ∞ −(x +y )
I = e dy =
−y
2 2 2 2
2
e dx e dx dy
4 −∞ −∞ 4 −∞ −∞

y la integral doble es sobre todo el plano xy. Transformando a coordenadas polares tene-
mos entonces
    ∞
1 2π ∞ −r 1 2π π
I2 = e r dr dθ = e−r r dr = .
2 2

4 0 0 4 0 0 4

Por lo tanto
 ∞ √
π
−x2
e dx = . (9.69)
0 2

9.12. Ejercicios
Apartado 9.2
1. Halle el valor de la función f (x, y) = 2x2 + 3xy − y2 + 2x − 3y + 4 para
(i) (x, y) = (0, 1) (ii) (x, y) = (2, 0) (iii) (x, y) = (3, 2).

2. Halle el valor de f (r, θ, φ) = r2 sen2 θ cos2 φ + 2 cos2 θ − r3 sen 2θ sen φ para


(i) (r, θ, φ) = (1, π/2, 0) (ii) (r, θ, φ) = (2, π/4, π/6) (iii) (r, θ, φ) = (0, π, π/3).

Apartado 9.3
∂z ∂z
Halle y :
∂x ∂y

3. z = 2x2 − y2 4. z = x2 + 2y2 − 3x + 2y + 3 5. z = e2x+3y


2
6. z = sen (x2 − y2 ) 7. z = ex cos (xy)
Halle todas las derivadas primeras y segundas:

8. z = 2x2 y + cos (x + y) 9. z = sen (x + y)ex−y


9.12. Ejercicios 253

Demuestre que fxy = fyx :


xy
10. f = x3 − 3x2 y + y3 11. f = x2 cos (y − x) 12. f =
x 2 + y2
Demuestre que fxyz = fyzx = fzxy :

13. f = cos (x + 2y + 3z) 14. f = xyeyz


∂r ∂r ∂r
15. Si r = (x2 + y2 + z2 )1/2 , halle , , .
∂x ∂y ∂z
∂2φ 1 ∂2φ
16. Si φ = f (x − ct) + g(x + ct), con c una constante, demuestre que = 2 2.
  ∂x 2 c ∂t
∂y
17. Si xyz + x2 + y2 + z2 = 0, halle .
∂x z
   
∂Y ∂V
18. Halle y para la ecuación de van der Waals
∂T p, n ∂p T, n
 
n2 a
p+ (V − nb) − nRT = 0 .
V2

Apartado 9.4
Halle los puntos estacionarios, y su naturaleza, para las siguientes funciones:

19. 2x2 − 4xy + y2 + 4x − 2 20. 3 − x2 − xy − y2 + 2y


21. x + y − 3x − 4y + 2
3 2
22. 4x3 − 3x2 y + y3 − 9y
23. Halle el valor estacionario de la función 2x2 + 3y2 + 6z2 sujeta a la ligadura x + y + z = 1.
24. Halle los valores estacionarios de la función (x − 1)2 + (y − 2)2 + (z − 2)2 sujeta a la ligadura
x2 + y2 + z2 = 1. Confirme que se trata de las distancias más corta y más larga de los puntos de la esfera
x2 + y2 + z2 = 1 al punto (1, 2, 2).
25. Demuestre que el problema de hallar los valores estacionarios de la función

E(x, y, z) = α(x2 + y2 + z2 ) + 2β(xy + yz + zx)

sujeta a la ligadura x2 + y2 + z2 = 1 (siendo α y β constantes) es equivalente a resolver las ecuaciones


seculares
(α − λ)x + βy = 0,
βx + (α − λ)y + βz = 0,
βy + (α − λ)z = 0 .
Estas ecuaciones tienen solución para tres posibles valores de los multiplicadores de Lagrange:
√ √
λ1 = α , λ2 = α + 2β , λ3 = α − 2β .

(i) Halle el punto estacionario que corresponde a cada uno de los valores de λ (suponga que z es positivo).
(ii) Demuestre que los tres valores estacionarios de la función E son iguales a los correspondientes valores
de λ.
(Este es el problema de Hückel para el radical alilo, CH2 CHCH2 . Véase también el Ejemplo 17.9.)
254 Capı́tulo 9. Funciones de varias variables

Apartado 9.5
Halle el diferencial total df :
1
26. f (x, y) = x2 + y2 27. f (x, y, z) = 
x2 + y2 + z2
28. f (r, θ, φ) = r sen θ sen φ

Apartado 9.6
dz
29. Dada z = x2 + 2xy + 3y2 , con x = (1 + t)1/2 e y = (1 − t)1/2 , halle
dt
(i) por sustitución, (ii) por la regla de la cadena (9.21).
du
30. Dada u = ln (x + y + z), con x = a cos t, y = b sen t y z = ct, halle .
dt
df
31. Dada f = sen (u + v), con v = cos u, halle .
  du
∂y
32. Si z = x5 y − sen y, halle .
∂x z
 
∂p
33. Halle para un gas de van der Waals
∂T V, n
   
∂V ∂V
(i) a partir de las expresiones para y obtenidas en el Ejercicio 18,
∂T p, n ∂p T, n
(ii) directamente a partir de la ecuación de van der Waals.
 
∂z
34. Si z = x2 + y2 y u = xy, halle (i) por sustitución (ii) por la ecuación (9.30).
∂y u  
∂z
35. Sean z = x sen y y u = x + 2xy + 3y , halle
2 2
.
∂y u
36. Si U = U(V, T) y p = p(V, T) son funciones of V y T, y si H = U + pV, demuestre que
   
   
∂H ∂U ∂U ∂V
− = +p .
∂T p ∂T V ∂V T ∂T p
   
∂x ∂y
37. Si x = un + vn e y = un − vn , donde n es una constante arbitraria, halle y .
    ∂u v ∂v u
∂u ∂v
Expresando un y vn en función de x e y, halle y , y demuestre que
∂x y ∂y x
       
∂x ∂u 1 ∂y ∂v
= = .
∂u v ∂x y 2 ∂v u ∂y x

∂f ∂f
38. Si x = au + bv e y = bu − av, siendo a y b constantes, y f es una función de x e y, exprese y
∂u ∂v
∂f ∂f
en función de y . Demuestre entonces que
∂x ∂y

∂2f ∂2f    ∂2f ∂2f



∂2f

∂2f ∂2f
   ∂2f
+ = a2
+ b2
+ , = ab − 2 + b2 − a2 .
∂u2 ∂v2 ∂x2 ∂y2 ∂u∂v ∂x 2 ∂y ∂x∂y

Demuestre que las siguientes funciones de la posición en un plano cumplen la ecuación de Laplace:
 
B
39. x5 − 10x3 y2 + 5xy4 40. Ar + eiθ 41. rn cos nθ, n = 1, 2, 3 . . .
r
9.12. Ejercicios 255

Apartado 9.7
Estudie la exactitud:

42. (4x + 3y) dx + (3x + 8y) dy 43. (6x + 5y + 7) dx + (4x + 10y + 8) dy


44. y cos x dx + sen x dy    
∂S ∂V
45. Dado el diferencial total dG = −S dT + Vdp, demuestre que =− .
∂p T ∂T p

Apartado 9.8

46. Evalúe la integral de lı́nea [xy dx + 2y dy] desde x = 0 hasta x = 2
C
(i) sobre la recta y = 2x (ii) sobre la curva y = x2 .
47. Demuestre que Fdx + Gdy, con F = 9x2 + 4y2 + 4xy y G = 8xy + 2x2 + 3y2 , es un diferencial
exacto. Escogiendo un camino adecuado, evalúe la integral [F dx + G dy] desde (x, y) = (0, 0) hasta
C
(1, 2). Demuestre que el resultado es consistente con que el diferencial sea el diferencial total de z(x, y) =
3x3 + 4xy2 + 2x2 y + y3 .

48. Integre f (x, y) = x2 − y2 sobre la recta y = 2x entre x = 0 y x = 1.

Apartados 9.9 y 9.10


 3  2  
49. Evalúe la integral x2 y + xy2 dx dy y demuestre que el resultado es independiente del orden
0 1
de integración.
 π  R
50. Evalúe la integral e−r cos2 θ sen θ dr dθ.
0 0

Evalúe la integral y esboce la región de integración:


 2  2x    a  √a2 −x2
51. x +y
2 2
dy dx 52. xy2 dy dx
0 x 0 0
53. A partir del dibujo de la región de integración, demuestre que
 2  (2−y)/2  1  2−2x  0  (x+4)/2
x3 dx dy = x3 dy dx + x3 dy dx .
0 2y−4 0 0 −4 0

Evalúe la integral.

Apartado 9.11
Transforme a coordenadas polares y evalúe:
 1  √1−x2    ∞  ∞  3
e−2(x )
2 +y2 1/2
54. x2 + 2xy dy dx 55. x 2 + y2 dx dy
0 0 −∞ −∞
 ∞  ∞
e−(x +y2 ) 2
2
56. x dx dy
0 0
 Funciones en tres dimensiones

10.1. Conceptos
Una función de tres variables, f (x, y, z), en la cual las variables son las coordenadas
de un punto en el espacio ordinario tridimensional, se denomina función de posición,
función del punto o campo. Un gran número de cantidades fı́sicas se describen median-
te estas funciones. Por ejemplo, la distribución de masas en un cuerpo se describe por
la densidad de masa (volumétrica), que es una función de posición. La temperatura en
cada punto de un cuerpo define un campo de temperaturas y la velocidad de cada punto
de una masa de fluido en movimiento es una función vectorial de posición, un campo
de velocidades (véase el Capı́tulo 16). Los campos eléctricos y magnéticos son funcio-
nes de posición vectoriales, las funciones de onda atómicas y moleculares son funciones
escalares de posición.
Cuando escribimos una función de posición en la forma f (x, y, z) estamos suponiendo
que se trata de una función de las coordenadas cartesianas de un punto.1 Sin embargo,
el valor de una función en un punto no puede depender del sistema de coordenadas que
se use en concreto para especificar su posición. Vimos en el Capı́tulo 9 para puntos en
un plano que una función y la región donde está definida pueden a veces (de hecho, a
menudo) expresarse de manera mucho más sencilla usando coordenadas distintas de las
cartesianas. Las coordenadas más importantes y más ampliamente utilizadas, aparte de
las cartesianas, son las coordenadas esféricas. Las presentamos en el Apartado 10.2. En

01. La geometrı́a analı́tica en tres dimensiones tiene su origen en las Recherches de Clairaut de 1731,
en las cuales dio x2 + y2 + z2 = a2 como la ecuación de una esfera de radio a, y en el segundo volumen de
la Introductio de Euler de 1748. La teorı́a sistemática fue desarrollada por Monge en artı́culos desde 1771
y en dos influyentes libros que escribió para sus alumnos de la École Polytechnique. Gaspar Monge (1746-
1818), hijo de Jacques Monge, buhonero y afilador que valoraba la educación, desarrolló una ‘geometrı́a
descriptiva’ que constituyó la base del dibujo moderno en ingenierı́a. El método fue considerado secreto
militar durante un tiempo y publicado en 1799 en el libro de texto Géométrie descriptive. Monge fue el pri-
mer Director de la École Polytechnique fundada en 1794 por la convención Nacional de la Revolución para
adiestrar ingenieros y cientı́ficos (que demostrasen ‘un amor constante a la libertad, la igualdad y el odio a
los tiranos’). La École se convirtió en un modelo universitario en toda Europa y Estados Unidos. Algunos de
los profesores de la École fueron Laplace, Lagrange y Sylvestre François Lacroix (1765-1843), cuyo libro
de texto de cálculo fue traducido al inglés en 1816 y contribuyó (junto con otros textos de la École) a intro-
ducir los métodos europeos en Inglaterra y los Estados Unidos. En el libro de texto Application de l’analyse
à la géométrie, 1807, Monge trató la geometrı́a analı́tica en dos y tres dimensiones. Demostró cómo las
coordenadas de un punto se determinan por las perpendiculares a tres planos coordenados.
258 Capı́tulo 10. Funciones en tres dimensiones

el Apartado 10.3 tratamos las funciones de posición y en 10.4 las integrales de volumen.
El operador laplaciano, tan importante en las ciencias fı́sicas, lo tratamos en el Apartado
10.5. En todos estos apartados nos limitamos al uso de sistemas de coordenadas carte-
sianas y esféricas. El sistema de coordenadas general es el tema del Apartado 10.6. En
los Capı́tulos 16, 18 y 19, tratamos el uso de vectores y matrices para describir sistemas
y procesos en tres dimensiones.

10.2. Coordenadas esféricas


La posición de un punto en un espacio tridimensional queda especificada de manera
única por sus tres coordenadas en un sistema de coordenadas dado. En el sistema car-
tesiano de la Figura 10.1 la posición del punto P se especifica por la tripleta ordenada
(x, y, z), las coordenadas cartesianas. La coordenada x es la distancia de P al plano yz, y
es la distancia al plano zx, y z es la distancia al plano xy.

Figura 10.1 Figura 10.2

A partir del sistema cartesiano se definen normalmente otros sistemas coordenados. En la Figura 10.2 se
muestra el sistema de coordenadas esféricas. La distancia r del punto al origen se llama coordenada radial.
Sus valores posibles van desde 0 a +∞. El ángulo θ, la colatitud, es el ángulo entre la recta radial OP y
el eje z. Sus valores posibles van de 0 a π. En este contexto, el eje z se llama eje polar. El ángulo φ, la
longitud, es el ángulo entre el eje x y la recta OQ, proyección de OP sobre el plano xy. Sus valores posibles
van de 0 a 2π. Los cambios en φ describen giros en torno al eje polar. Las coordenadas esféricas y las
cartesianas se relacionan mediante las ecuaciones
x = r sen θ cos φ , y = r sen θ sen φ , z = r cos θ . (10.1)
Al igual que para las coordenadas polares en el plano (Apartado 3.3), convertir las coordenadas esféricas a
cartesianas es inmediato.

EJEMPLO 10.1 Halle las coordenadas cartesianas del punto cuyas coordenadas esféricas son (r, θ, φ) =
(2, π/6, π/4).


x = r sen θ cos φ = 2 sen (π/6) cos (π/4) = 1/ 2 ,

y = r sen θ sen φ = 2 sen (π/6) sen (π/4) = 1/ 2 ,

z = r cos θ = 2 cos (π/6) = 3 .
10.3. Funciones de posición 259

La conversión de coordenadas cartesianas a coordenadas esféricas se hace mediante las siguientes relacio-
nes: ⎧  
z ⎨ arctg xy si x > 0,
r = x + y + z , θ = arccos
2 2 2 2
, φ= y (10.2)
r ⎩ arctg + π si x < 0,
x
donde se toman los valores principales para las funciones inversas (véase el Apartado 3.4).

EJEMPLO 10.2 Halle las coordenadas esféricas del punto (x, y, z) = (– 1, 2, −3).


r2 = x2 + y2 + z2 = 14, 14 , r=

θ = arccos (z/r) = arccos (– 3/ 14) ≈ 143,3◦ ,

φ = arctg (y/x) + π = arctg (– 2) + π ≈ 116,6◦ .

10.3. Funciones de posición


Una función de posición, o campo, es una función de las tres coordenadas en alguna región del espacio
tridimensional. En la Figura 10.3, sea V (por volumen) una región que representa, por ejemplo, un cuerpo
con temperatura no uniforme: la temperatura es una función de posición
T = f (x, y, z) .
Entonces, si las coordenadas cartesianas del punto P son
(xP , yP , zP ), la temperatura en ese punto es

T = f (xP , yP , zP ) .

Por ejemplo, si f (x, y, z) = z2 − x2 − y2 tenemos que

TP = z2P − x2P − y2P .

La temperatura en un punto no puede depender del sistema de


coordenadas que se use en concreto para especificar la posición
del punto. Si las coordenadas esféricas de P son (rP , θP , φP ) en-
tonces, por las ecuaciones (10.1), Figura 10.3

TP = rP cos θP − rP sen θP cos φP − rP sen θP sen φP = rP ( cos2 θP − sen2 θP ) .


2 2 2 2 2 2 2 2 2

El campo de temperaturas se describe por lo tanto igual de bien usando la función g(r, θ, φ) =
= r2 ( cos2 θ − sen2 θ) tal que, en cualquier punto de V,

T = f (x, y, z) = g(r, θ, φ) .

En este ejemplo, el paso de coordenadas cartesianas a coordenadas esféricas ha supuesto dos simplificacio-
nes en la representación del campo. La primera: mientras que T depende de las tres coordenadas cartesianas,
x, y y z, sólo depende de dos coordenadas esféricas, r y θ; esto es, el campo es independiente del valor del
ángulo φ, y tiene por lo tanto simetrı́a cilı́ndrica en torno al eje polar (z). La segunda simplificación es
que las variables de la función g han sido separadas, es decir, la función g(r, θ) ha sido factorizada como
el producto de una función de r y una función de θ. Estas simplificaciones son importantes para evaluar
integrales múltiples y para resolver ecuaciones en derivadas parciales.
260 Capı́tulo 10. Funciones en tres dimensiones

Funciones de densidad
Consideremos la distribución de masa en un cuerpo tridimensional (véase el Apartado 5.6 para una
distribución lineal de masa). Sea P un punto cualquiera del cuerpo, y sea ∆m la masa de un volumen ∆v
alrededor del punto P, como se muestra en la Figura 10.4. El cociente ∆m/∆v es la masa por unidad de
volumen, o densidad de masa promedio, en ∆v. Si la masa no está distribuida de manera uniforme por todo
el cuerpo, el valor de este cociente depende no sólo de la posición del volumen ∆v sino también del tamaño
y forma de ∆v. A medida que las dimensiones del volumen se reducen a cero, ∆v → 0, el cociente se
acerca al lı́mite  ∆m 
ρ = lim , (10.3)
∆v→0 ∆v

Figura 10.4

y el valor de ese lı́mite es la densidad en el punto P. Señalamos que aunque ρ se define


como el lı́mite de un cociente, no es una derivada en el sentido normal. Podemos sin
embargo considerar el diferencial de masa dm = ρ dv en el elemento de volumen dv. La
masa total del cuerpo es entonces la integral sobre el volumen del cuerpo
 
M = dm = ρ dv . (10.4)
V V

En el Apartado 10.4 tratamos estas integrales triples, o integrales de volumen, en las tres
coordenadas del espacio.
La idea de densidad se aplica a cualquier propiedad distribuida en una región. Un
ejemplo importante es la densidad de probabilidad de una distribución en teorı́a de pro-
babilidades y en estadı́stica, que tratamos en el Capı́tulo 21. Las densidades de probabi-
lidad se usan también en mecánica cuántica para interpretar las funciones de onda y para
el cálculo de las propiedades de átomos y moléculas.

EJEMPLO 10.3 Orbitales atómicos y densidad de probabilidad electrónica


La solución de la ecuación de Schrödinger para un átomo, los orbitales atómicos, se expresan casi siempre
en coordenadas esféricas. En la Tabla 10.1 se enumeran algunos de los orbitales para el átomo de hidrógeno
(a0 es el radio de Bohr). Cada orbital es el producto de tres funciones, una por cada coordenada:

ψ(r, θ, φ) = R(r) · Θ(θ) · Φ(φ) (10.5)

La función radial R(r) determina el tamaño del orbital y el movimiento radial (‘de adentro hacia afuera’) del
electrón en el orbital. Las funciones angulares Θ(θ) y Φ(φ) determinan la forma del orbital y el movimiento
angular del electrón (su momento angular). Veremos estas funciones con más detalle en el Capı́tulo 14.
10.4. Integrales de volumen 261

Tabla 10.1 Orbitales atómicos para el átomo de hidrógeno

1
ψ1s = e−r/a0
πa30
1
ψ2s = (2 − r/a0 )e−r/2a0
4 2πa30
1
ψ2px = re−r/2a0 sen θ cos φ
4 2πa50
1
ψ2py = re−r/2a0 sen θ sen φ
4 2πa50
1
ψ2pz = re−r/2a0 cos θ
4 2πa50

La interpretación fı́sica de un orbital se hace usando la densidad de probabilidad electrónica: para un elec-
trón en el orbital ψ, la cantidad
|ψ(r, θ, φ)|2 dv (10.6)
se interpreta como la probabilidad de hallar el electrón en el elemento de volumen dv en la posición (r, θ, φ).
El módulo cuadrado, |ψ|2 = ψψ ∗ , se utiliza porque las funciones de onda son en general funciones com-

plejas. La probabilidad de hallar el electrón en una región V es entonces la integral de volumen V |ψ|2 dv.

10.4. Integrales de volumen


Una integral triple tiene la forma general
  z  y  2 2 x2

f (x, y, z) dv = f (x, y, z) dx dy dz , (10.7)


V z1 y1 x1

donde V es una región en el espacio xyz. Cuando las variables son las coordenadas de
un punto en el espacio ordinario la integral se llama a menudo integral de volumen. Si
los lı́mites de integración de (10.7) son constantes, la región V es una caja rectangular
de lados x2 − x1 , y2 − y1 , z2 − z1 .
EJEMPLO 10.4 Evalúe la integral de la función f (x, y, z) = 1 + xyz en la caja rectangular de lados a, b, c
que se muestra en la Figura 10.5.
La integral (10.7) es
  
f (x, y, z) dv = dv + xyz dv .
V V V

Tenemos entonces
  c b a  a  b  c
(i) dv = dx dy dz = dx dy dz
V 0 0 0 0 0 0

= a×b×c=V.
Figura 10.5
262 Capı́tulo 10. Funciones en tres dimensiones

Este resultado es general: la integral V


dv es el volumen de la región V.

  c b  a  a  b  z
(ii) xyz dv = xyz dx dy dz = x dx y dy z dz .
V 0 0 0 0 0 0

La factorización de la integral tripe es posible porque el integrando es el producto de tres funciones, una en
cada variable, y los lı́mites son constantes (véase el Ejemplo 9.31). Con esto

a2 b2 c2 V2
xyz dv = × × = .
V 2 2 2 8

Coordenadas esféricas
La integral de volumen en coordenadas esféricas es

f (r, θ, φ) dv =
 φ θ r
V
2 2 2

f (r, θ, φ) r2 sen θ dr dθ dφ . (10.8)


φ1 θ1 r1

Utilizando la Figura 10.6, interpretamos la


forma del elemento de volumen

dv = r2 sen θ dr dθ dφ . (10.9)

La región ∆v es una sección de un casque-


te esférico de espesor ∆r entre los radios
r y r + ∆r, los ángulos θ y θ + ∆θ, y φ y
∆φ. Puede demostrarse (véase el Ejemplo
10.5) que el volumen de la región es
Figura 10.6
 1  
∆v = r2 ∆r + r(∆r)2 + (∆r)3 cos θ − cos (θ + ∆θ) ∆φ .
3
Para valores pequeños de los incremen-
tos ∆, este volumen es aproximadamente
igual al volumen de una caja rectangular
de lados ∆r, r∆θ y r sen θ∆φ,

∆v ≈ r2 sen θ ∆r ∆θ ∆φ , (10.10)

y el elemento de volumen (10.9) se obtiene para cantidades infinitesimales.


10.4. Integrales de volumen 263

EJEMPLO 10.5 Halle el volumen ∆v de la Figura 10.6 y demuestre que se reduce a la expresión aproxi-
mada (10.10) para valores pequeños de los ∆.

 φ+∆φ  θ+∆θ  r+∆r


∆v = r2 sen θ dr dθ dφ
φ θ r
 r+∆r  θ+∆θ  φ+∆φ r3 r+∆r θ+∆θ φ+∆φ
= r2 dr sen θ dθ dφ = − cos θ φ
r φ θ 3 r θ φ

1
= [r2 ∆r + r(∆r)2 + (∆r)3 ][ cos θ − cos (θ + ∆θ)]∆φ .
3

Si ∆r es suficientemente pequeño, se pueden despreciar los términos en (∆r)2 y en (∆r)3 . Si ∆θ es pe-


queño,
cos (θ + ∆θ) = cos θ cos ∆θ − sen θ sen ∆θ ≈ cos θ − sen θ∆θ ,
ya que cos ∆θ → 1 y sen ∆θ → ∆θ cuando ∆θ → 0. Por lo tanto, para valores pequeños de los incremen-
tos ∆,
∆v ≈ r2 sen θ ∆r ∆θ ∆φ .

Hay que señalar que esto no supone una demostración de (10.9) puesto que el elemento de volumen se
utiliza para la construcción de la integral de volumen.

EJEMPLO 10.6 Evalúe la integral de la función f (r, θ, φ) = 1 + r2 cos2 θ sen2 φ en la esfera de radio a y
centro en el origen.

La integral puede calcularse separándola en dos partes, como en el Ejemplo 10.4:


  
f dv = dv + r2 cos2 θ sen2 φ dv .
V V V

Los intervalos de integración son r = 0 → a, θ = 0 → π, y φ = 0 → 2π. Entonces


  2π  π  a
(i) dv = r2 sen θ dr dθ dφ
V 0 0 0
 a  π  2π
a3 4
= 2
r dr sen θ dθ dφ = × 2 × 2π = πa3 ,
0 0 0 3 3

que es el volumen de la esfera.


  2π  π  a
(ii) r2 cos2 θ sen2 φ dv = r4 cos2 θ sen θ sen2 φ dr dθ dφ
V 0 0 0
 a  π  2π
= r4 dr cos2 θ sen θ dθ sen2 φ dφ
0 0 0
5
a 2
= × ×π.
5 3
264 Capı́tulo 10. Funciones en tres dimensiones

Integrales en todo el espacio


Cuando la región V es todo el espacio tridimensional la integral de volumen es
  +∞  +∞  +∞

f dv = f (x, y, z) dx dy dz en cartesianas, (10.11)


V −∞ −∞ −∞
 2π  π ∞

= f (r, θ, φ)r2 sen θ dr dθ dφ en esféricas. (10.12)


0 0 0

Estas integrales son importantes, por ejemplo, en quı́mica cuántica para calcular propie-
dades atómicas y moleculares a partir de funciones de onda obtenidas como soluciones
de la ecuación de Schrödinger. Por ejemplo, la integral en todo el espacio de la densidad
de probabilidad electrónica del orbital 1s del átomo de hidrógeno, ψ1s2 = (1/πa30 )e−2r/a 0

(véase la Tabla 10.1), es


  2π  π  ∞
1
ψ dv =
2
e−2r/a r2 sen θ dr dθ dφ 0
1s
πa30 0
 ∞  π  2π
0 0

1
= e−2r/a 2
r dr sen θ dθ dφ .
0

πa30 0 0 0

La integral de la parte angular


 π  2π

sen θ dθ dφ = 4π (10.13)
0 0

es
 ∞el ángulo sólido completo en torno a un punto. Entonces, utilizando la integral estándar
e−ar rn dr = n!/an+1 ,
0


1 2
ψ1s2 dv = × × 4π = 1 .
πa0 (2/a0 )3
3

Este resultado es consistente con la interpretación (véase el comentario de la ecuación


(10.6)) de |ψ|2 dv como la probabilidad de hallar el electrón en el elemento dv. La proba-
bilidad total, la de hallar el electrón en alguna parte, es la integral en todo el espacio, y
tiene que ser la unidad. De hecho, los coeficientes de la Tabla 10.1 se escogen para que
eso sea cierto. Se dice que los orbitales están normalizados (a la unidad).

Valores promedio
Veremos en el Capı́tulo 21 que, si x es una variable continua en el intervalo a ≤ x ≤ b
y si p(x) dx es la probabilidad de que la variable tome valores entre x y x + dx, la cantidad
 b

f̄ = f (x)p(x) dx (10.14)
a
10.5. El operador laplaciano 265

es el valor promedio de la función f (x) en el intervalo. La generalización a funciones


de más de una variable implica la correspondiente integral múltiple. Por ejemplo, sea
f (x, y, z) una función de posición en tres dimensiones, y sea p(x, y, z)dx dy dz la probabi-
lidad de que la coordenada x tome valores entre x y x + dx, de que la coordenada y tome
valores entre y y y + dy, y de que la coordenada z tome valores entre z y z + dz. El valor
promedio de la función es entonces la integral de volumen en todo el espacio
 +∞  +∞  +∞

f̄ = f (x, y, z) p(x, y, z)dx dy dz . (10.15)


−∞ −∞ −∞

La expresión correspondiente en coordenadas esféricas es


 2π  π  ∞

f̄ = f (r, θ, φ) p(r, θ, φ)r2 sen θ dr dθ dφ . (10.16)


0 0 0

En mecánica cuántica, si la densidad de probabilidad es el módulo cuadrado de una


función de onda, p = |ψ|2 , el valor promedio

f̄ = f |ψ|2 dv (10.17)

se suele llamar el valor esperado de f en el estado ψ.

EJEMPLO 10.7 Halle la distancia promedio del electrón al núcleo para (i) el orbital 1s y (ii) para el
orbital 2pz del átomo de hidrógeno (véase la Tabla 10.1 del Ejemplo 10.3).
Para ambos casos, f (r, θ, φ) = r en la ecuación (10.17), y

r̄ = r|ψ|2 dv .

1 −2r/a0
(i) ψ1s
2
= e ,
πa30
 2π  π  ∞
1
r̄1s = e−2r/a0 r3 sen θ dr dθ dφ
πa30 0 0 0

y tras integrar la parte angular (véase la ecuación (10.13)),


 ∞
4 4 3! 3
r̄1s = e−2r/a0 r3 dr = × = a0 .
πa30 0 a30 (2/a0 )4 2

1
(ii) ψ2p
2
= r2 e−r/a0 cos2 θ,
z
32πa50
 ∞  π  2π
1 5 −r/a0
r̄2pz = r e dr cos 2
θ sen θ dθ dφ
32πa50 0 0 0
1 2
= × 5! a60 × × 2π = 5a0 .
32πa50 3
266 Capı́tulo 10. Funciones en tres dimensiones

10.5. El operador laplaciano


En el Apartado 9.6 vimos el operador laplaciano en dos dimensiones. El operador en
tres dimensiones es
en coordenadas cartesianas:
∂2 ∂2 ∂2
∇2 = + 2+ 2, (10.18)
∂x 2
∂y ∂z

en coordenadas esféricas:
1 ∂  2 ∂  1 ∂  ∂  1 ∂2
∇2 = r + sen θ + 2
r ∂r
2
∂r r sen θ ∂θ
2
∂θ r sen θ ∂φ2
2 (10.19a)

∂2 2 ∂ 1 ∂2 cos θ ∂ 1 ∂2
= + + + + .
∂r2 r ∂r r2 ∂θ2 r2 sen θ ∂θ r2 sen2 θ ∂φ2 (10.19b)

La transformación de coordenadas cartesianas a esféricas se consigue de la misma mane-


ra que para el caso bidimensional descrito en el Ejemplo 9.18. En coordenadas esféricas
se suele escribir el operador en la forma más compacta (10.19a), mientras que la forma
desarrollada (10.19b) se obtiene usando la regla de derivación del producto. Por ejem-
plo,

1 ∂  2 ∂f  1  2 ∂2f ∂f  ∂ 2 f 2 ∂f
r = r + 2r = 2+ . (10.20)
r2 ∂r ∂r r2 ∂r2 ∂r ∂r r ∂r
El operador laplaciano aparece en ecuaciones del movimiento relacionadas con la pro-
pagación de ondas y la teorı́a del potencial tanto en mecánica clásica (por ejemplo en las
ecuaciones de Maxwell del electromagnetismo) como en mecánica cuántica (por ejem-
plo en la mecánica ondulatoria de Schrödinger, véase el Capı́tulo 14).

EJEMPLO 10.8 Evalúe ∇2 f para f = e−r (i) en coordenadas esféricas y (ii) en coordenadas cartesianas.

1. Como la función f sólo depende de la coordenada radial, se deduce que


∂f ∂f ∂f df ∂2f d2 f
= 0, = 0, = = −e−r , = = e−r .
∂θ ∂φ ∂r dr ∂r2 dr2
Entonces 
d2 f 2 df 2 2
∇2 f = + = e−r − e−r = 1− e−r .
dr2 r dr r r
2. En coordenadas cartesianas,
∂2f ∂2f ∂2f
∇2 f = + 2 + ,
∂x2 ∂y ∂z2
∂r x ∂r y ∂r z
r = (x2 + y2 + z2 )1/2 , = , = , = .
∂x r ∂y r ∂z r
Entonces, por la regla de la cadena,

∂f df ∂r x df ∂2f ∂ x df 1 df x2 df x2 d 2 f
= = , = = − 3 + 2 2.
∂x dr ∂x r dr ∂x2 ∂x r dr r dr r dr r dr
10.5. El operador laplaciano 267

Las derivadas con respecto a y y a z se obtienen de la misma forma. Entonces


  2  2 
∂2f ∂2f ∂2f 3 x + y2 + z2 df x + y2 + z2 d2 f
∇f = 2 + 2 + 2 =
2
− +
∂x ∂y ∂z r r3 dr r2 dr2

de manera que, puesto que x2 + y2 + z2 = r2 ,



2 df d2 f 2
∇f =
2
+ 2 = − + 1 e−r .
r dr dr r
Vemos que el uso de coordenadas cartesianas en este caso implica de manera natural un cambio a
coordenadas esféricas mediante la regla de la cadena.

EJEMPLO 10.9 Evalúe ∇2 f para f (r, θ, φ) = re−r/2 sen θ cos φ.


Empleando la forma (10.19a),
1 ∂  2 ∂f  1 ∂  ∂f  1 ∂2f
∇2 = r + 2 sen θ + 2 .
r ∂r
2 ∂r r sen θ ∂θ ∂θ r sen θ ∂φ2
2

La función f tiene la forma factorizada

f (r, θ, φ) = (re−r/2 )( sen θ)( cos φ) = R(r) × Θ(θ) × Φ(φ)


de manera que 
∂f dR(r)
= Θ(θ) Φ(φ) ,
∂r dr

∂f dΘ(θ)
= R(r) Φ(φ) ,
∂θ dθ

∂f dΦ(φ)
= R(r) Θ(θ) ,
∂φ dφ
y por lo tanto
     2 
1 d 2 dR 1 d dΘ RΦ d Φ RΘ
∇2 f = r Θ Φ + sen θ + .
r2 dr dr sen θ dθ dθ r2 dφ2 r2 sen2 θ
Como
  
−r/2 1 d 2 dR r 2 −r/2 1 2 2
R = re , r = + −2 e = + 2 − R(r) ,
r2 dr dr 4 r 4 r r

1 d dΘ cos2 θ − sen2 θ cos2 θ − sen2 θ
Θ = sen θ , sen θ = = Θ(θ) ,
sen θ dθ dθ sen θ sen2 θ
d2 Φ
Φ = cos φ , = − cos φ = −Φ(φ) ,
dφ2
y por lo tanto
 
1 2 2 cos2 θ − sen2 θ 1 1 2
∇2 f = + 2 − + − 2 RΘΦ = − f.
4 r r r2 sen2 θ r sen2 θ 4 r
Este resultado puede reescribirse para dar la ecuación

1 1 1
− ∇2 − f =− f
2 r 8
que es esencialmente la ecuación de Schrödinger para el átomo de hidrógeno, siendo f el orbital 2px . El
resultado del Ejemplo 10.8 es la misma ecuación pero para el orbital 1s.
268 Capı́tulo 10. Funciones en tres dimensiones

EJEMPLO 10.10 Demuestre que la función f = 1/r cumple la ecuación de Laplace en tres dimensiones.

La ecuación de Laplace es
∇2 f = 0 .
Como ocurrı́a en el Ejemplo 10.8, la función no depende de los ángulos θ y φ, por lo tanto

d2 f 2 df
∇2 f = + .
dr2 r dr

En este caso df /dr = −1/r2 , d2 f /dr2 = 2/r3 . Por lo tanto

d2 f 2 df 2 2
+ = 3 − 3 =0 (r = 0) .
dr2 r dr r r
Esta demostración no es válida si r = 0, y este punto singular necesita un tratamiento especial en las
aplicaciones fı́sicas.
Este ejemplo muestra que las funciones potenciales gravitacional y de Coulomb cumplen la ecuación
de Laplace (véase el Ejemplo 9.20 para el caso bidimensional).

10.6. Otros sistemas de coordenadas


Además de las coordenadas cartesianas y de las esféricas, hay otros sistemas de coor-
denadas útiles para describir sistemas fı́sicos. Los más importantes de éstos son del tipo
denominado coordenadas curvilı́neas ortogonales.2
En el sistema cartesiano (Figura 10.1), la posición del punto P(x, y, z) se define por
la intersección de tres superficies (planos) perpendiculares dos a dos: x = constante
(paralelo al plano Oyz), y = constante (paralelo al plano Ozx), y z = constante (paralelo
al plano Oxy). Los ejes coordenados que pasan por el punto son las rectas de intersección
de esos planos, y son también perpendiculares dos a dos.
En coordenadas esféricas la posición de p(r, θ, φ) se define también por la intersección
de tres superficies coordenadas: r = constante, θ = constante y φ = constante. La
superficie r = constante es la de una esfera de radio r. La superficie θ = constante
es la del cono circular recto con vértice O y base circular BPB en la Figura 10.7. La
superficie φ = constante es el plano (vertical) apa de la figura. Los correspondientes
‘ejes’ que pasan por el punto P son las curvas que resultan de la intersección de dos de
estas superficies. Como se muestra en la figura, la lı́nea coordenada para r es una recta
radial, la lı́nea (curva) coordenada para θ es el semicı́rculo APA , la lı́nea coordenada para
φ es el cı́rculo BPB ; son perpendiculares, u ortogonales, en su punto de intersección P.
Ésta es la caracterı́stica de las coordenadas curvilı́neas ortogonales.

02. Las coordenadas curvilı́neas ortogonales fueron introducidas por Lamé en su trabajo Sur les coor-
données curvilignes et leurs diverses applications. Gabriel Lamé (1795-1870), ingeniero y profesor en la
École Polytechnique, hizo contribuciones a la teorı́a de la elasticidad de los sólidos y participó en la cons-
trucción de los primeros ferrocarriles en Francia.
10.6. Otros sistemas de coordenadas 269

En el caso general, suponemos que las coordenadas cartesianas x, y, z están relacio-


nadas con tres nuevas cantidades q1 , q2 y q3 , mediante las ecuaciones

x = x(q1 , q2 , q3 ) , y = y(q1 , q2 , q3 ) , z = z(q1 , q2 , q3 ) , (10.21)

siendo las relaciones inversas

q1 = q1 (x, y, z) , q2 = q2 (x, y, z) , q3 = q3 (x, y, z) . (10.22)

La posición se define entonces especificando ya sea x, y, z o q1 , q2 , q3 . Cada una de las


ecuaciones (10.22) representa una superficie, y la intersección de las tres superficies sitúa
al punto. Las superficies q1 = constante, q2 = constante, y q3 = constante son las super-
ficies coordenadas, las curvas de las intersecciones dos a dos son las lı́neas coordenadas.
Las cantidades (q1 , q2 , q3 ) son las coordenadas curvilı́neas del punto P(x, y, z).

Figura 10.7

Las coordenadas curvilı́neas no se cortan necesariamente en ángulo recto: no son en


general ortogonales. Los sistemas de coordenadas curvilı́neas ortogonales son aquellos
cuyas lı́neas (y superficies) coordenadas son perpendiculares (ortogonales) dos a dos
en el punto de intersección. Los sistemas cartesiano y esférico son los ejemplos más
conocidos. Estos sistemas de coordenadas tienen las siguientes propiedades.
(i) La distancia (infinitesimal) entre dos puntos sobre una lı́nea coordenada es

dsi = hi dqi , (10.23)

donde
2 2 2
∂x ∂y ∂z
h =
2
+ + . (10.24)
i
∂qi ∂qi ∂qi
270 Capı́tulo 10. Funciones en tres dimensiones

(ii) El elemento de volumen es

dv = ds1 ds2 ds3 = h1 h2 h3 dq1 dq2 dq3 . (10.25)

(iii) El operador laplaciano es


   
1 ∂ h2 h3 ∂ ∂ h3 h1 ∂ ∂ h 1 h2 ∂
∇ = 2
+ + . (10.26)
h1 h2 h3 ∂q1 h1 ∂q1 ∂q2 h2 ∂q2 ∂q3 h3 ∂q3

Para las coordenadas cartesianas y las esféricas tenemos

cartesianas: hx = hy = hz = 1,
esféricas: hr = 1, hθ = r, hφ = r sen θ.

A continuación presentamos dos de los sistemas coordenados alternativos más utiliza-


dos.

Coordenadas cilı́ndricas
Estas coordenadas son las coordenadas polares en el plano
xy más la coordenada z, son útiles para describir sistemas
con simetrı́a cilı́ndrica.

x = ρ cos φ, y = ρ sen φ, z = z,

ρ = 0 → ∞, φ = 0 → 2π, z = −∞ → +∞,

hρ = 1, hφ = ρ, hz = 1,

dv = ρ dρ dφ dz,

Figura 10.8

1 ∂ ∂ 1 ∂ 2
∂ 2
∇2 = ρ + + 2.
ρ ∂ρ ∂ρ ρ ∂φ
2 2
∂z

Coordenadas elı́pticas confocales


Estas coordenadas (también llamadas coordenadas esferoidales prolatas) son útiles
para problemas de potenciales con dos centros.

x = a ξ 2 − 1 1 − η 2 cos φ, y = a ξ 2 − 1 1 − η 2 sen φ, z = aξη,
10.7. Ejercicios 271

ξ = 1 → ∞, η = −1 → +1, φ = 0 → 2π,

 

ξ2 − η2 ξ2 − η2
hξ = a , hη = a , hφ = a (ξ 2 − 1)(1 − η 2 ),
ξ2 − 1 1 − η2

dv = a3 (ξ 2 − η 2 ) dξ dη dφ,

   
1 ∂ ∂ ∂ ∂ (ξ 2 − η 2 ) ∂2
∇ = 2 2
2
(ξ − 1)
2
+ (1 − η )
2
+ 2 .
a (ξ − η 2 ) ∂ξ ∂ξ ∂η ∂η (ξ − 1)(1 − η 2 ) ∂φ2

Las coordenadas ξ y η se visualizan mejor, como en la Figura 10.9, en función de las


distancias rA y rB a los focos A y B de una elipse (las elipse se define por rA + rB =
constante):
rA + rB rA − ry B
ξ= , η= .
2a 2a
La figura puede representar una molécula diatómica con los núcleos en A y B y un
electrón en P.

Figura 10.9

10.7. Ejercicios
Apartado 10.2
Halle las coordenadas cartesianas (x, y, z) de los puntos cuyas coordenadas esféricas son:

1. (r, θ, φ) = (1, 0, 0) 2. (r, θ, φ) = (2, π/2, π/2) 3. (r, θ, φ) = (2, 2π/3, 3π/4)

Halle las coordenadas esféricas (r, θ, φ) de los puntos:

4. (x, y, z) = (1, 0, 0) 5. (x, y, z) = (0, 1, 0) 6. (x, y, z) = (1, 2, 2)


7. (x, y, z) = (1, −4, −8) 8. (x, y, z) = (– 2, −3, 6) 9. (x, y, z) = (– 3, 4, −12)
272 Capı́tulo 10. Funciones en tres dimensiones

Apartado 10.3
Transforme a coordenadas esféricas:
 1/2 x 2 + y2
10. x2 + y2 + z2 11. x 2 − y2 12. 13. 2z2 − x2 − y2
z2

Apartado 10.4
Halle la masa total de una distribución de masa con densidad ρ en una región V del espacio:
14. ρ = x2 + y2 + z2 , V: el cubo 0 ≤ x ≤ 1, 0 ≤ y ≤ 1, 0 ≤ z ≤ 1.
15. ρ = xy z , 2 3
V: la caja 0 ≤ x ≤ a, 0 ≤ y ≤ b, 0 ≤ z ≤ c.
16. ρ = y2 , V: la región 0 ≤ x ≤ 1, 1 − x ≤ y ≤ 1, 0 ≤ z ≤ 2.
−(x+y+z)
17. ρ=e , V: la región infinita x ≥ 0, y ≥ 0, z ≥ 0.
18. ρ=x +y +z ,
2 2 2
V: la esfera de radio a y centro en el origen.
sen θ cos φ
2 2
19. ρ= , V: la esfera de radio a y centro en el origen.
r
20. ρ = r3 e−r V: todo el espacio.

1
El orbital 2s del átomo de hidrógeno es ψ2s = (2 − r/a0 )e−r/2a0 :
4 2πa30

21. Demuestre que la integral de ψ2s


2
en todo el espacio es uno.
22. Calcule la distancia promedio al núcleo de un electrón en el orbital 2s.

El orbital 3pz del átomo de hidrógeno es ψ3pz = C(6 − r)re−r/3 cos θ (en unidades atómicas) donde C es
una constante:

23. Halle el valor de C que normaliza el orbital 3pz .

24. Calcule el valor promedio de r2 para el orbital 3pz .

Apartado 10.5
Halle ∇2 para las siguientes funciones:
e−r
25. f = x2 y3 z4 26. rn e−ar 27. 28. e−r/3 sen θ sen φ 29. xze−r/2
r
Demuestre que las siguientes funciones cumplen la ecuación de Laplace:
cos 2φ
30. 2x3 − 3x(y2 + z2 ) 31. 32. rn senn θ cos nφ, n = 1, 2, 3 . . .
r2 sen2 θ
2f f
33. Si f = (2 − r)e−r/2 demuestre que ∇2 f + = .
r 4
6f 9f
34. Si f = ze−3r/2 demuestre que ∇2 f + = .
r 4
6f
35. Si f = xye−r demuestre que ∇2 f + = f.
r
ear
36. Demuestre que f (r) = , siendo a un número cualquiera, cumple ∇2 f = a2 f .
r
10.7. Ejercicios 273

37. El operador de d’Alembert es

∂2 ∂2 ∂2 1 ∂2
2
= + 2 + 2 − 2 2,
∂x 2 ∂y ∂z c ∂t
donde x, y, z son coordenadas, t es el tiempo y c es la velocidad de la luz. Demuestre que si la función
f (x, y, z) cumple la ecuación de Laplace, entonces la función g(x, y, z, t) = f (x, y, z)eikct cumple la ecuación
2
g = k2 g.

38. Obtenga el operador laplaciano ∇2 en coordenadas esféricas, ecuaciones (10.19), a partir de ∇2 en


coordenadas cartesianas, ecuación (10.18).

Apartado 10.6
39. Integre la función f = y2 z3 en la región cilı́ndrica de radio a, entre z = 0 y z = 1, simétrica en torno
al eje z.
rA + rB ra − rB
Use coordenadas elı́pticas confocales, ξ = ,η = , φ, para integrar las siguientes funciones
R R
en todo el espacio:

e−(rA +rB )
40. e−(rA +rB ) 41. cos2 φ
ra
Ecuaciones diferenciales de primer
orden

11.1. Conceptos
Una ecuación diferencial es una ecuación que contiene derivadas. Por ejemplo, si y es
una función de x, entonces una ecuación que contiene únicamente y y x es una ecuación
ordinaria, pero una ecuación que también contiene una o más derivadas dy/dx, d 2 y/dx2 , o
derivadas de orden superior es una ecuación diferencial. Algunos ejemplo de ecuaciones
diferenciales que se usan en las ciencias fı́sicas son

dx
1. = kx proceso cinético de primer orden
dt
dx
2. = k(a − x)(b − x) proceso cinético de segundo orden
dt
d2 h
3. = −g cuerpo que cae bajo la acción de la gravedad
dt2
d2 x
4. = −ωx2 oscilador armónico clásico
dt2
−2 d2 ψ 1 2
5. + kx ψ = Eψ ecuación de ondas para el oscilador armónico
2m dx2 2

Los cinco ejemplos describen procesos fı́sicos.1 Las ecuaciones 1 y 2 se usan para des-
cribir algunos procesos cinéticos sencillos en fı́sica y quı́mica, y también en biologı́a,
ingenierı́a, economı́a y ciencias sociales. Las ecuaciones 3, 4 y 5 son ecuaciones del
movimiento. En todas ellas la función incógnita es una función de una única variable, x(t)
en 1, 2 y 4, h(t) en 3, ψ(x) en 5. Las derivadas son derivadas ordinarias y las ecuaciones
son ecuaciones diferenciales ordinarias. En el Capı́tulo 14 tratamos las ecuaciones en
derivadas parciales.

01. Tanto Newton como Leibniz reconocieron que los problemas fı́sicos pueden formularse mediante
ecuaciones diferenciales, y la resolución de problemas fı́sicos proporcionó gran parte de la motivación para
el desarrollo posterior del cálculo en el siglo XVIII.
276 Capı́tulo 11. Ecuaciones diferenciales de primer orden

Hay un sistema de clasificación de los posibles tipos de ecuaciones diferenciales,


pero para lo que nos interesa consideraremos únicamente el orden. El orden de una
ecuación diferencial es el mayor orden de las derivadas de la ecuación. Las ecuaciones 1
y 2 son ecuaciones de primer orden porque contienen únicamente una derivada primera,
las ecuaciones 3 a 5 son ecuaciones de segundo orden. Casi todas las ecuaciones dife-
renciales de importancia en las ciencias fı́sicas son de primer orden (como los procesos
cinéticos elementales) o de segundo orden (ecuaciones del movimiento como la segun-
da ley de Newton, las ecuaciones de Maxwell del electromagnetismo y la ecuación de
Schrödinger).
En este capı́tulo consideramos únicamente ecuaciones diferenciales de primer orden.
En los Capı́tulos 12 a 14 tratamos las ecuaciones de segundo orden. Vamos a empezar
indicando qué se entiende por resolver una ecuación diferencial.

11.2. Solución de una ecuación diferencial


Una ecuación diferencial con una función incógnita y(x) en la variable x tiene la
expresión general
 
dy d2 y
f x, y, , ,... = 0 (11.1)
dx dx2

en la cual alguna combinación (una función) de x, y y las derivadas de y es igual a


cero. Resolver, o integrar, la ecuación diferencial significa hallar la función (o familia
de funciones) y(x) que satisface la ecuación. Por ejemplo, la ecuación de primer orden
(véase también el Apartado 5.2)

dy
= 2x (11.2)
dx
tiene como solución

y = x2 + c , (11.3)

siendo c una constante arbitraria, ya que d(x2 + c)/dx = 2x. La ecuación diferencial
se resuelve haciendo una integración (indefinida). Ası́, integrando ambos miembros de
(11.2) con respecto a x tenemos
 
dy
dx = 2x dx ; y = x2 + c . (11.4)
dx

Expresada en la forma (11.3), con la constante arbitraria, la solución se llama solución


general, o integral completa, de la ecuación diferencial. Vimos en el Apartado 5.2 que
la solución general (11.3) representa una familia de curvas, una para cada valor de c,
y que una curva particular de la familia se obtiene dando a c un valor particular. El
resultado es una solución particular de la ecuación diferencial. En el contexto fı́sico,
11.2. Solución de una ecuación diferencial 277

la solución general representa toda una familia de posibles situaciones fı́sicas, y escoger
una solución particular viene determinado por la naturaleza y el estado del sistema.

EJEMPLO 11.1 La ecuación


dx
= −kx
dt
proporciona un modelo para un proceso cinético de primer orden, como una desintegración radiactiva o
una reacción quı́mica de primer orden, donde x(t) es la cantidad de materia que reacciona a tiempo t. En el
Apartado 11.4 se demuestra que la solución general de la ecuación es

x(t) = ae−kt ,
donde a es la constante arbitraria. En este caso, la constante se determina por la cantidad de materia en un
instante de tiempo cualquiera. Ası́, si x = x0 es la cantidad de materia en el instante t = 0, tenemos
x(0) = x0 = a
y
x(t) = x0 e−kt
es la solución particular para ese valor de x0 . Vemos que la aplicación de una condición inicial especifica el
significado de la constante arbitraria al igual que su valor, y es un paso necesario para resolver un problema
fı́sico.

En el caso de una ecuación de segundo orden, con una derivada segunda, son necesa-
rias dos integraciones para eliminar la derivada segunda, de manera que aparecen dos
constantes arbitrarias (constantes de integración) en la solución general. Por ejemplo, la
ecuación de segundo orden

d2 y
=2 (11.5)
dx2
se integra una primera vez para dar

dy
= 2x + a (11.6)
dx
y una segunda vez para dar

y = x2 + ax + b . (11.7)

Ésta es la solución general y son necesarias dos condiciones para especificar las cons-
tantes. La solución general de una ecuación diferencial de orden n tiene n constantes
arbitrarias.*

0* Algunas ecuaciones diferenciales no tienen solución general, otras tienen únicamente una o más
soluciones particulares, y finalmente otras tienen solución general más algunas soluciones particulares que
no se obtienen a partir de la solución general. Estos caso no se suelen presentar a menudo en las ciencias
fı́sicas.
278 Capı́tulo 11. Ecuaciones diferenciales de primer orden

EJEMPLO 11.2 Cuerpo que cae bajo la acción de la gravedad

Sea h la altura del cuerpo en el instante t. La fuerza (dirigida hacia abajo) que actúa sobre el cuerpo es
F = −mg de manera que, por la segunda ley de Newton, F = md2 h/dt2 ,

d2 h
= −g .
dt2

Según acabamos de ver, la solución general de la ecuación diferencial es

1
h(t) = − gt2 + at + b ,
2

siendo a y b constantes arbitrarias. La solución particular viene dada en este caso por las condiciones
iniciales del sistema, la altura h0 y la velocidad v0 en el instante t = 0. Entonces, h(0) = h0 = b y, como la
velocidad viene dada por
dh
v(t) = = −gt + a ,
dt
la velocidad inicial es v0 = v(0) = a. La solución particular que satisface las condiciones iniciales h(0) = h0
y v(0) = v0 es por lo tanto
1
h(t) = − gt2 + v0 t + h0 .
2

Todas las ecuaciones diferenciales pueden resolverse por los métodos numéricos pre-
sentados en el Capı́tulo 20. Hay sin embargo varios tipos estándar importantes cuyas
soluciones se expresan mediante funciones elementales y que aparecen frecuentemente
en los modelos matemáticos de los sistemas fı́sicos. Son estos tipos estándar los que
tratamos en este capı́tulo y en los siguientes.
La ecuación diferencial general de primer orden tiene la forma

dy
= F(x, y) , (11.8)
dx
donde F(x, y) es una función de x e y, siendo y una función de x. Llamamos problema
de valor inicial a una de estas ecuaciones diferenciales junto con una condición inicial,
y(x0 ) = y0 (y = y0 cuando x = x0 ). Tratamos aquı́ dos tipos especiales importantes
de ecuaciones que pueden resolverse por métodos elementales: ecuaciones separables y
ecuaciones lineales.

11.3. Ecuaciones separables


La ecuación (11.8) puede resolverse directamente por integración si tiene la forma

dy f (x)
= (11.9)
dx g(y)
11.3. Ecuaciones separables 279

o puede reducirse a ella. Esta ecuación puede escribirse en forma diferencial2

g(y) dy = f (x) dx (11.10)

con todos los términos en los que aparece y en un miembro de la ecuación, y todos los
términos en los que aparece x en el otro. De esta ecuación se dice que es una ecuación
diferencial separable y se resuelve por integración (indefinida) de ambos miembros con
respecto a la variable relevante:
 
g(y) dy = f (x) dx + c (11.11)

con la constante arbitraria en uno de los dos miembros. De manera más formal, escri-
biendo (11.9) como

dy
g(y) = f (x) (11.12)
dx
la integración con respecto a x nos da
 
dy
g(y) dx = f (x) dx + c (11.13)
dx

y, aplicando el método de sustitución (Capı́tulo 6) al primer miembro, esto es lo mismo


que (11.11). La solución de la ecuación diferencial se completa evaluando las integrales
de (11.11) por los métodos presentados en los Capı́tulos 5 y 6 (si es posible; si no,
hay que recurrir a métodos numéricos) y aplicando la condición inicial apropiada. Los
siguientes ejemplos ilustran el método. En el apartado 11.4 presentamos aplicaciones de
las ecuaciones diferenciales separables.
EJEMPLOS 11.3 Ecuaciones separables
Cada una de las siguientes ecuaciones tiene la forma (11.9) con solución (11.11). En cada caso se da una
condición inicial.
dy
(i) = axn , y(0) = 0.
dx
Por la ecuación (11.10), dy = axn dx, e integrando tenemos (si n = −1)
 
axn+1
dy = a xn dx , y(x) = + c.
n+1
Ésta es la solución general. La solución particular buscada se obtiene sustituyendo la condición
inicial: y = 0 cuando x = 0. Con esto c = 0 e:
axn+1
y(x) = .
n+1

02. Mucha de la formulación de Leibniz del cálculo implicaba ecuaciones con diferenciales (ecua-
ciones diferenciales). El método de separación de variables y el método de reducción de una ecuación
homogénea a forma separable que tratamos en este apartado, fueron inventados por Leibniz en 1691.
280 Capı́tulo 11. Ecuaciones diferenciales de primer orden

dy
(ii) = ky, y(x0 ) = y0 .
dx
Separando variables e integrando tenemos
 
dy dy
= k dx , =k dx ,
y y

y la solución general de la ecuación, con la constante arbitraria c, es por lo tanto

ln y = kx + c .

Una forma alternativa de presentar la solución general se obtiene tomando la exponencial de cada
miembro:
eln y = ekx+c , y = ec ekx = aekx
(utilizando que eln y = y), y siendo ahora a la constante arbitraria. Por la condición inicial, y = y0
cuando x = x0 , tenemos
y(x0 ) = y0 = aekx0
de manera que a = y0 e−kx0 , y la solución particular es

y(x) = y0 ek(x−x0 ) .

dy 1
(iii) + 3x2 y2 = 0, y(1) = .
dx 2
Separando variables e integrando tenemos
 
dy dy 1
− = 3x2 dx , − =3 x2 dx , = x3 + c ,
y2 y2 y

y la solución general es
1
y(x) = .
x3 + c
1
Por la condición inicial, y = cuando x = 1,
2
1 1
y(1) = =
1+c 2

de manera que c = 1 y la solución particular buscada es

1
y(x) = .
x3 + 1

Reducción a forma separable


Algunas ecuaciones diferenciales de primer orden que no son separables pueden lle-
gar a serlo mediante un cambio de variables adecuado. Uno de tales ejemplos es cuando
la función F(x, y) en el segundo miembro de la expresión general (11.8) tiene la propie-
dad

F(λx, λy) = F(x, y) , (11.14)


11.3. Ecuaciones separables 281

donde λ es un número o una función arbitrarios. Es decir, ‘reescalar’ x e y por el mismo


factor deja la función invariante. Una función de x e y tiene esta propiedad si puede
expresarse como una función de y/x. Por ejemplo,

x2 + y2  y   y y
F(x, y) = = +1 =f .
xy x x x

Entonces
  y
λy
F(λx, λy) = f =f = F(x, y) . (11.15)
λx x

La ecuación diferencial
dy y
= F(x, y) = f (11.16)
dx x
se convierte en separable mediante el cambio v = y/x. Tenemos

dy d(xv) dv
= = v + x = f (v) (11.17)
dx dx dx
de manera que, separando las variables x y v,

dv dx
= (11.18)
f (v) − v x

y la solución de la ecuación es

dv
= ln x + c . (11.19)
f (v) − v

Una ecuación de este tipo se llama a menudo ecuación homogénea porque una función
del tipo (11.14) es una función homogénea. En general, una función de una o más
variables es una función homogénea de grado n si

f (λx, λy, . . . ) = λn f (x, y, . . . ) . (11.20)

La función (11.14) es por lo tanto homogénea de grado cero.


EJEMPLO 11.4 Resuelva la ecuación
dy x 2 + y2
= .
dx xy
El cambio y = xv da
dy d(xv) dv 1
= =v+x =v+
dx dx dx v
dv 1
de manera que x = .
dx v
282 Capı́tulo 11. Ecuaciones diferenciales de primer orden

Entonces, separando variables e integrando,


 
dx v2
v dv = , = ln x + c .
x 2
La solución general de la ecuación, tras el cambio v = y/x, es por lo tanto

y2
= ln x + c .
2x2
El resultado puede verificarse mediante derivación implı́cita:
 2 
d y d y dy y2 1
= ( ln x + c) , − = ,
dx 2x2 dx x2 dx x3 x
y  
dy x2 1 y2 x y x 2 + y2
= + 3 = + = .
dx y x x y x xy

11.4. Ecuaciones separables en cinética quı́mica


Una reacción quı́mica se denota por una ecuación ‘estequiométrica’ de la forma

aA + bB + · · · = pP + qQ + · · · (11.21)

en la cual los sı́mbolos A, B, . . . (en la práctica, fórmulas quı́micas) representan las


especies quı́micas que reaccionan para dar los productos P, Q, . . . La presencia de los
números a, b, . . . y p, q, . . . en la ecuación significa que a moléculas de A reaccionan
con b moléculas de B, . . . para dar p moléculas de P, q moléculas de Q,. . . Por ejemplo,

2H2 + O2 = 2H2 O

significa que dos moléculas de hidrógeno reaccionan con una molécula de oxı́geno para
dar dos moléculas de agua.
En termodinámica y en cinética, una reacción quı́mica se escribe en general como

0= νB B , (11.22)
B

donde el sumatorio es sobre todas las especies presentes, tanto reactivos como produc-
tos, y los νB , llamados coeficientes estequiométricos, son los números a, b, p, q, . . . en
(11.21), pero con un cambio de signo en los reactivos. En esta forma la ecuación (11.21)
es

0 = −aA − bB + pP + qQ + · · ·
= ν A A + νB B + νP P + νQ Q + · · ·

y la ecuación H2 /O2 es 0 = −2H2 − O2 + 2H2 O .


11.4. Ecuaciones separables en cinética quı́mica 283

Velocidad de reacción
Sea nA0 la cantidad inicial de la especie A en el instante t = 0 y sea nA la cantidad en
el instante t. La ‘cantidad’ de reacción que ha tenido lugar en el instante t viene dada por
el grado de avance de la reacción ξ, definido por

nA = nA0 + νA ξ (11.23)

y una medida de la velocidad de una reacción es entonces el grado de variación del


avance de la reacción, o grado de conversión,


r= . (11.24)
dt
Esta velocidad también puede expresarse en función de la tasa de variación de la cantidad
de cada especie que toma parte en la reacción. Derivando (11.23), tenemos

dnA dξ
= νA (11.25)
dt dt
(puesto que nA0 y νA son constantes), de manera que

dξ 1 dnA
r= = . (11.26)
dt νA dt

Para muchos propósitos en quı́mica fı́sica es más conveniente expresar la velocidad en


función de las concentraciones en vez de las cantidades.* La concentración de la especie
A en el volumen V viene dada por [A] = nA /V, y dividiendo la ecuación (11.26) por el
volumen obtenemos la velocidad de reacción (en función de la concentración de A)

r 1 d[A]
v= = . (11.27)
V νA dt

Para la reacción general escrita en la forma (11.21) tenemos

1 d[A] 1 d[B] 1 d[P] 1 d[Q]


v=− =− = = = ··· (11.28)
a dt b dt p dt q dt

y para la reacción H2 /O2 ,

1 d[H2 ] d[O2 ] 1 d[H2 O]


v=− =− = .
2 dt dt 2 dt

0* Por convenio, el sı́mbolo nA es la cantidad de la especie A en unidades (SI) de mol, que es también
la unidad para ξ. Otras cantidades que se usan en vez del número de moles son la concentración [ A], la
presión parcial pA para un gas, y la fracción molar adimensional xA . Seguimos la práctica habitual en libros
de quı́mica fı́sica de utilizar concentraciones para el tratamiento de la cinética, pero omitiendo las unidades.
284 Capı́tulo 11. Ecuaciones diferenciales de primer orden

El mecanismo de una reacción quı́mica es en general complejo, pasando por varias eta-
pas cinéticas elementales, que pueden ser consecutivas, competitivas o ambas, y es tarea
de los quı́micos cinéticos desentrañar el mecanismo y relacionar la velocidad de la re-
acción quı́mica global con las velocidades de las etapas elementales. Se sabe de manera
experimental que la velocidad global puede depender de las cantidades de todas las es-
pecies quı́micas presentes en cualquier instante, tanto reactivos como productos, y de
la temperatura, la presión y la naturaleza del recipiente. Consideramos aquı́ únicamen-
te las reacciones más sencillas, aquellas cuyas velocidades dependen únicamente de las
cantidades de los reactivos. Representamos tales reacciones mediante

aA + bB + · · · → productos. (11.29)

Se sabe de manera experimental que la velocidad de reacción tiene la forma

v = k[A]α [B]β . . . (11.30)

donde k se denomina constante cinética de la reacción, y los números α, β, . . . , definen


el orden de la reacción. El exponente α se denomina orden con respecto al reactante A,
β es el orden con respecto a B, . . . , y la suma α + β + · · · se denomina orden de la
reacción. Los casos considerados son
(1) A → productos primer orden
(2) 2A → productos segundo orden
(3) A + B → productos segundo orden

(1) El proceso de primer orden: A −→ productos


La ecuación cinética es
d[A]
v=− = k[A] (11.31)
dt
o, si representamos la concentración [A] por la variable x,

dx
= −kx . (11.32)
dt

Ésta es la ecuación diferencial tratada en los Ejemplos 3.20 y 11.1, y la solución es la


que hemos dado en el Ejemplo 11.3(ii). Ası́, separando las variables e integrando,

dx
= −k dt , ln x = −kt + c o bien ln [A] = −kt + c . (11.33)
x
Si la concentración inicial de A es [A]0 , en el instante t = 0, entonces c = ln [A]0 y la
solución de la ecuación cinética diferencial es la ecuación cinética integrada
11.4. Ecuaciones separables en cinética quı́mica 285

ln [A] = −kt + ln [A]0 . (11.34)

La gráfica de ln [A] frente a t es una recta (Figura 11.1) cuya pendiente es −k y cuyo
corte con el eje ln [A] es ln [A]0 .
Una expresión más convencional para la ecuación cinética integrada se obtiene de
(11.34) tomando exponenciales en cada miembro,

[A] = [A]0 e−kt , (11.35)

y muestra que los procesos de primer orden


son un ejemplo de decrecimiento exponen-
cial.

Figura 11.1

(2) El proceso de segundo orden: 2A −→ productos


La ecuación cinética es
1 d[A]
v=− = k[A]2 (11.36)
2 dt
o bien
dx
= −2kx2 . (11.37)
dt
Separando variables e integrando, tenemos

dx 1
− = 2k dt , = 2kt + c .
x2 x
Si x0 es la concentración inicial de reactivo, entonces c = 1/x0 y

1 1
− = 2kt (11.38)
x x0

o bien
1 1 [A]0
− = 2kt , [A] = . (11.39)
[A] [A]0 1 + 2kt[A]0
286 Capı́tulo 11. Ecuaciones diferenciales de primer orden

Figura 11.2

La gráfica de 1/[A] frente a t es una recta (Figura 11.2) con pendiente 2k que corta el
eje vertical en 1/[A]0 .

(3) El proceso de segundo orden: A + B −→ productos


La ecuación cinética es
d[A] d[B]
v=− =− = k[A][B] . (11.40)
dt dt
Sean [A]0 = a y [B]0 = b las concentraciones iniciales de A y B, respectivamente, y
sean [A] = a − x y [B] = b − x en el instante t. La ecuación cinética es entonces

d(a − x) dx
− = = k(a − x)(b − x) . (11.41)
dt dt
Tenemos que distinguir dos casos.

(a) Las concentraciones iniciales de A y B son iguales: [A]0 = [B]0 , a = b.


La ecuación cinética (11.41) es

dx
= k(a − x)2 (11.42)
dt
y, separando variables e integrando,

dx 1 1
= k dt , = = kt + c . (11.43)
(a − x)2 a−x [A]

Entonces c = 1/a = 1/[A]0 y la ecuación cinética integrada es

1 1
− = kt . (11.44)
[A] [A]0

Esto es lo mismo que en el caso (2) anterior salvo por el factor 2, que diferencia el caso
A + A del caso A + B.
(b) Las concentraciones iniciales de A y B no son iguales.
11.5. Ecuaciones lineales de primer orden 287

Separando variables en (11.41) e integrando,



dx dx
= k dt , = kt + c .
(a − x)(b − x) (a − x)(b − x)

La integral en la variable x se evalúa expresando el integrando en fracciones simples


(véanse los Apartados 2.6 y 6.6, y los Ejemplos 2.27 y 6.17). Escribimos

1 A B A(b − x) + B(a − x)
= + = .
(a − x)(b − x) a−x b−x (a − x)(b − x)

Para todo valor de x tiene que cumplirse

1 = A(b − x) + B(a − x) .

Tomar x = b nos da B = 1/(a − b); mientras que tomar x = a nos da A = 1/(b − a).
Por lo tanto
1 1  1 1 
= −
(a − x)(b − x) b−a a−x b−x
y
  
dx 1 1 1 
= − dx
(a − x)(b − x) b−a a−x b−x
 
1   1 b−x
= − ln (a − x) + ln (b − x) = ln .
b−a b−a a−x

Por lo tanto
1 b − x
ln = kt + c .
b−a a−x
 
1 b
En el instante t = 0, tenemos x = 0 y c = ln , de manera que
b−a a

1 a(b − x)
ln = kt (11.45)
b − a b(a − x)

y la ecuación cinética integrada es

1 [A]0 [B]
ln = kt . (11.46)
[B]0 − [A]0 [B]0 [A]

La gráfica de ln [B]/[A] frente a t es una recta.


288 Capı́tulo 11. Ecuaciones diferenciales de primer orden

11.5. Ecuaciones lineales de primer orden


Se dice que una ecuación diferencial de primer orden es lineal si puede escribirse en
la forma
dy
+ p(x)y = r(x) . (11.47)
dx
La ecuación es lineal tanto en dy/dx como en y. Cuando el segundo miembro, r(x), es
cero se dice que la ecuación es homogénea, en caso contrario se trata de una ecuación
no homogénea.

La ecuación homogénea

dy
+ p(x)y = 0 . (11.48)
dx
La ecuación es separable:

dy
= −p(x) dx , ln y = − p(x) dx + c ,
y

y, tomando exponenciales de ambos miembros, la solución general es



y = a e− p(x) dx
, (11.49)

donde a es una constante arbitraria (si se toma a nula, y = 0 se llama solución trivial).

La ecuación no homogénea
La ecuación lineal general se transforma en una expresión directamente integrable si
se multiplican ambos miembros de (11.47) por la función

F(x) = e p(x) dx
(11.50)

que cumple la propiedad diferencial3

dF(x)
= F(x)p(x) , (11.51)
dx

03. Este método para resolver la ecuación diferencial general de primer orden fue descubierto por
Leibniz en 1694.
11.6. Un ejemplo de ecuaciones lineales en cinética quı́mica 289

d
dado que p(x) dx = p(x). Ası́, multiplicando (11.47) por F(x),
dx

dy
F(x) + F(x)p(x)y = F(x)r(x) (11.52)
dx
y, según (11.51), el primer miembro es la derivada del producto F(x)y:

dy dy dF(x) d  
F(x) + F(x)p(x)y = F(x) + y= F(x)y .
dx dx dx dx
La ecuación (11.52) puede por lo tanto escribirse como

d  
F(x)y = F(x)r(x)
dx
que se integra para dar

F(x)y = F(x)r(x) dx + c . (11.53)

Ésta es la solución general de la ecuación no homogénea. La función F(x) se llama factor


integrante de la ecuación diferencial.

EJEMPLOS 11.5 Ecuaciones lineales


dy
1. − y = 3e2x
dx 
En este caso, p(x) = −1, p(x) dx = −x, y el factor integrante es

F(x) = e p(x) dx
= e−x
(no hace falta incluir una constante de integración en el exponente porque se canceları́a en (11.53)).
Entonces, por la fórmula (11.53),
 
e−x y = e−x × 3e2x dx + c = 3 ex dx + c

= 3ex + c ,
y = ex (3ex + c) = 3e2x + cex .
dy 2
2. + y = 3x3
dx x
El factor integrante es 
F(x) = e (2/x)dx = e2 ln x = x2 .
Por lo tanto, por la fórmula (11.53),

x6
x2 y = x2 × 3x3 dx + c = + c,
2
x4 c
y = + 2.
2 x
290 Capı́tulo 11. Ecuaciones diferenciales de primer orden

11.6. Un ejemplo de ecuaciones lineales en cinética quı́mica


Vimos en el Apartado 11.4 que muchas reacciones quı́micas (de hecho, la mayorı́a)
atraviesan distintas etapas elementales, y una descripción del proceso cinético global
implica simultáneamente varias ecuaciones diferenciales de primer orden. Estos siste-
mas de ecuaciones pueden resolverse sin recurrir a aproximaciones sólo en los casos
sencillos, si no, hay que utilizar métodos numéricos. Uno de los sistemas resolubles más
sencillos es para dos procesos de primer orden consecutivos
k1 k2
A −→ B −→ C ,

donde A se transforma en C pasando por la especie intermedia B. El proceso se repre-


senta con las dos ecuaciones de primer orden

d[A]
= −k1 [A] , (11.54)
dt
d[B]
= k1 [A] − k2 [B] . (11.55)
dt
Suponemos que las concentraciones iniciales, en el instante t = 0, son [A]0 = a, [B]0 =
0, y [C]0 = 0, y que las concentraciones en el instante t son [A] = a − x y [B] = y, de
manera que [C] = x − y. Entonces

d(a − x)
= −k1 (a − x) , (11.56)
dt
dy
= k1 (a − x) − k2 y . (11.57)
dt
La primera de estas ecuaciones es la ecuación separable (11.32), con solución

a − x = ae−k t . 1
(11.58)

Sustituyendo este resultado en la ecuación (11.57) tenemos

dy
= ak1 e−k t − k2 y1

dt
o bien
dy
+ k2 y = ak1 e−k t 1
(11.59)
dt
y ésta es una ecuación lineal con p(t) = k2 , r(t) = ak1 e−k t y factor integrante
1


F(t) = e p(t) dt
= ek t .
2
11.6. Un ejemplo de ecuaciones lineales en cinética quı́mica 291

La solución de la ecuación (11.59) es por lo tanto



F(t)y = F(t) r(t) dt + c ,

 ⎨ ak1 e(k −k )t + c si k = k ,2 1

dt + c = k2 − k1
1 2
e y = ak1 e
k t2 (k −k )t
2 1


ak1 t + c si k1 = k2 .

Por las condiciones iniciales: y = 0 cuando t = 0. Tenemos entonces


ak
− k −k si k1 = k2 ,
1

c= 2 1

0 si k1 = k2 ,

y la solución particular buscada es



⎨ ak1
(e−k t − e−k t ) si k1 = k2 ,
1 2

y= k2 − k1 (11.60)

ak1 te−k t 1
si k1 = k2 .

La concentración de cada especie presente en el instante t es por lo tanto

[A] = [A]0 e−k t ,1


⎨ [A]0 k1 (e−k t − e−k t ) si k = k ,
1 2

k2 − k1
1 2
[B] = (11.61)

[A]0 k1 te−k t 1
si k1 = k2 ,
[C] = [A]0 − [A] − [B] .

Figura 11.3

La figura 11.3 ilustra los tres tipos de comportamiento que presenta el sistema. En
cada caso [A]0 = 1 y k1 = 1 (en las coordenadas apropiadas). La Figura (a), con k2 /k1 =
292 Capı́tulo 11. Ecuaciones diferenciales de primer orden

10, muestra cómo se comporta el sistema cuando k2 >> k1 . La etapa que limita la
reacción es A → B, y la cantidad de B intermedio se mantiene pequeña a largo de la
reacción porque B se convierte rápidamente en C. La Figura (c), con k1 /k2 = 10, muestra
el comportamiento cuando k1 >> k2 . La etapa limitadora es B → C, y la cantidad de
B se hace grande porque el proceso B → C es lento, y B disminuye sólo cuando el
suministro de A se agota.

11.7. Circuitos eléctricos


Los modelos de circuitos eléctricos son una aplicación importante de las ecuacio-
nes diferenciales. Un circuito sencillo consiste en una fuente de energı́a eléctrica, como
un generador o una pila, que genera una fuerza electromotriz (f.e.m.) E, y uno o más
elementos conectados en serie: resistencias, bobinas de inducción o condensadores. La
f.e.m. de la fuente es igual a la diferencia de potencial eléctrico entre los dos puntos a
los que se une en el circuito. Cuando el circuito se cierra, fluye una corriente I y cada
elemento del circuito provoca una caı́da de voltaje (potencial eléctrico) en el circuito. La
caı́da total de voltaje es igual a la f.e.m. (ley del voltaje de Kirchhoff).
La caı́da de voltaje ER en una resistencia es proporcional a la corriente,

ER = RI (ley de Ohm) , (11.62)

donde la constante de proporcionalidad R es el valor de la resistencia (véanse las Tablas


1.1 y 1.2 para las unidades SI adecuadas). La caı́da de voltaje EL en una bobina es
proporcional a la tasa de variación de la corriente,

dI
EL = L , (11.63)
dt
donde L es la inductancia, y para un condensador es

Q
EC = , (11.64)
C
dQ
donde C es la capacidad. La carga Q se relaciona con la corriente mediante I = .
dt

Figura 11.4
11.8. Ejercicios 293

Consideramos aquı́ un circuito RL, con una resistencia y una bobina, como se repre-
senta en la Figura 11.4. Por la ley de Kirchhoff,

dI
L + RI = E , (11.65)
dt
que es una ecuación diferencial lineal de primer orden. Tenemos p =

R/L (constante)
y r = E/L en la ecuación (11.47). El factor integrante es F(x) = e (R/L) dt = eRt/L y la
solución general es
 
Rt/L E
I(t) = e −Rt/L
e dt + c . (11.66)
L

Si la f.e.m. es constante, E = E0 , y entonces


 
E0 E0
I(t) = e−Rt/L
e dt + c =
Rt/L
+ ce−Rt/L . (11.67)
L R

La solución particular para la condición inicial I(0) = 0 es entonces

E0  
I(t) = 1 − e−Rt/L . (11.68)
R
Cuando se cierra el circuito la corriente crece desde cero al valor estacionario E0 /R en
un tiempo que depende de la constante de tiempo de inducción τL = L/R.

11.8. Ejercicios
Apartado 11.2
Establezca el orden de la ecuación diferencial y compruebe que la función dada es una solución:

dy d2 y
1. − 2y = 2 ; y = e2x − 1 2. + 4y = 0 ; y = A cos 2x + B sen 2x
dx dx2
d3 y dy 3y x3 c
3. = 12 ; y = 2x3 + 3x2 + 4x + 5 4. + = 3x2 ; y= + 3
dx3 dx x 2 x
Halle la solución general de la ecuación diferencial:

dy dy d2 y d3 y
5. = x2 6. = e−3x 7. = cos 2x 8. = 24x
dx dx dx2 dx3
Compruebe que la función dada es una solución de la ecuación diferencial, y determine c para la condición
inicial dada:
dy
9. x = 2y ; y = cx2 ; y = 24 para x = 2
dx
dy 2
10. + 2xy = 0 ; y = ce−x ; y = 2 para x=2
dx
dy
11. + 2y + 2 = 0 ; y = ce−2x − 1 ; y(0) = 4
dx
294 Capı́tulo 11. Ecuaciones diferenciales de primer orden

12. Un cuerpo se mueve en la dirección x bajo la acción de la fuerza F(t) = cos 2πt, siendo t el tiempo. (i)
Escriba la ecuación del movimiento. (ii) Halle la solución que satisface las condiciones iniciales x(0) = 0 y
ẋ(0) = 1.

Apartado 11.3
Halle la solución de la ecuación diferencial:
dy 3x2 dy dy
13. = 14. = 4xy2 15. = 3x2 y
dx y dx dx
dy dy dy y
16. y2 = ex 17. = y(y − 1) 18. =
dx dx dx x
Resuelva los problemas de valor inicial:

dy y+2 dy x2 − 1
19. = ; y(0) = 1 20. = ; y(0) = −1
dx x−3 dx 2y + 1
dy y(y + 1) dy
21. = ; y(2) = 1 22. = ex+y ; y(0) = 0
dx x(x − 1) dx
dy x+y dy
23. = ; y(1) = 2 24. 2xy = −(x2 + y2 ) ; y(1) = 0
dx x dx
dy
25. xy3 = x4 + y4 ; y(2) = 0
dx
dy
26. Demuestre que una ecuación diferencial de la forma = f (ax + by + c) se reduce a forma separable
dx
mediante el cambio u = ax + by.

Utilice el Ejercicio 26 para hallar la solución general:


dy dy x−y
27. = 2x + y + 3 28. =
dx dx x−y+2

Apartado 11.4
29. Resuelva el problema de valor inicial para el proceso cinético de orden n A → productos
dx
= −kxn x(0) = a (n = 1) .
dt
30. La reacción reversible A  B, de primer orden en ambas direcciones, tiene la ecuación cinética
dx
= k1 (a − x) − k−1 x .
dt
Halle x(t) para la condición inicial x(0) = 0.
31. Un proceso de tercer orden A + 2 B → productos tiene la ecuación cinética
dx
= k(a − x)(b − 2x)2 ,
dt
donde a y b son las cantidades iniciales de A y de B respectivamente. Demuestre que la solución que
satisface la condición x(0) = 0 viene dada por
1 a(b − 2x) 2x
kt = ln + .
(2a − b)2 b(a − x) b(2a − b)(b − 2x)
11.8. Ejercicios 295

Apartado 11.5
Halle la solución general:
dy dy dy
32. + 2y = 4 33. − 4xy = x 34. + 3y = e−3x
dx dx dx
dy 2y dy y 4 dy
35. + = 2 cos x 36. − 2 = 2 37. + (2 tg x)y = sen x
dx x dx x x dx
dy dy y
38. + axn y = bxn , (n = −1) 39. + a = xn
dx dx x

Apartado 11.6
k k k
40. El sistema de tres procesos de primer orden consecutivos A −→
1
B −→
2
C −→
3
D está representado
por el conjunto de ecuaciones
d(a − x) dy dz
= −k1 (a − x) , = k1 (a − x) − k2 y , = k2 y − k3 z ,
dt dt dt
donde (a − x), y y z son las cantidades en el instante t de A, B y C respectivamente. Dadas las condiciones
iniciales x(0) = y(0) = z(0) = 0, halle la cantidad de C como función de t. Suponga k1 = k2 , k1 = k3 , k2 =
k3 .
k k
41. El proceso de primer orden A −→
1
B es seguido por los procesos paralelos de primer orden B −→
2
C
k
y B −→
3
D, y el sistema se representa por las ecuaciones
d(a − x) dy dz dw
= −k1 (a − x) , = k1 (a − x) − (k2 + k3 )y , = k2 y , = k3 y ,
dt dt dt dt
donde (a − x), y, z y w son las cantidades en el instante t de A, B, C y D respectivamente. Dadas las condi-
ciones iniciales x = y = z = w = 0 a t = 0, halle la cantidad de C como función del tiempo.

Apartado 11.7
42. Demuestre que la corriente en un circuito RC que contiene una resistencia y un condensador viene
dada por la ecuación
dI I dE
R + = .
dt C dt
Resuelva la ecuación para (i) una f.e.m. constante, E = E0 , (ii) una f.e.m. periódica, E(t) = E0 sen ωt.
 Ecuaciones diferenciales de segundo
orden. Coeficientes constantes

12.1. Conceptos
Las ecuaciones diferenciales de segundo orden que son importantes en las ciencias
fı́sicas son ecuaciones lineales con forma general

d2 y dy
+ p(x) + q(x)y = r(x) . (12.1)
dx 2
dx
Si la función r(x) es cero, se dice que la ecuación

d2 y dy
+ p(x) + q(x)y = 0 (12.2)
dx2 dx
es homogénea. En caso contrario se dice que es no homogénea.1 Las funciones p(x) y
q(x) son los coeficientes de la ecuación. Cuando estos coeficientes son constantes las
soluciones de la ecuación se pueden expresar mediante funciones elementales, y estas
ecuaciones lineales con coeficientes constantes son las que tratamos en este capı́tulo. En
el Capı́tulo 13 tratamos las ecuaciones diferenciales con coeficientes no constantes.

12.2. Ecuaciones lineales homogéneas


La ecuación lineal de segundo orden con coeficientes constantes tiene la forma gene-
ral
d2 y dy
+ a + by = 0 (12.3)
dx2 dx

01. Muchos de los métodos y ejemplos de los libros de texto se remontan a los Institutiones calculi
differentiales (1755) e Institutiones calculi integralis (1768-70, 3 volúmenes) de Euler. Fue Euler quien
introdujo la distinción entre ecuaciones homogéneas y no homogéneas y entre soluciones generales y parti-
culares, el uso de factores integrantes, y la resolución de ecuaciones lineales con coeficientes constantes de
segundo orden y de órdenes superiores.
298 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes

siendo a y b constantes. Siempre es posible encontrar una solución de esta ecuación de


la forma eλx , donde λ es una constante adecuada.

EJEMPLO 12.1 Demuestre que y1 = e2x e y2 = e3x son dos soluciones de la ecuación
d2 y dy
− 5 + 6y = 0 .
dx2 dx
Tenemos
dy1 d 2 y1
y1 = e2x , = 2e2x , = 4e2x .
dx dx2
Por lo tanto
d 2 y1 dy1
−5 + 6y1 = 4e2x − 5 × 2e2x + 6e2x = e2x (4 − 10 + 6) = 0 .
dx2 dx
De manera similar,
dy2 d 2 y2
y2 = e3x , = 3e3x , = 9e3x ,
dx dx2
y
d 2 y2 dy2
−5 + 6y2 = 9e3x − 15e3x + 6e3x = 0 .
dx2 dx

Este ejemplo ilustra el resultado general de que siempre es posible hallar dos soluciones
particulares y1 (x) e y2 (x) para una ecuación lineal homogénea. Si multiplicamos cada
una de esas soluciones por una constante, la nueva función es también una solución. Por
ejemplo, sea y1 (x) una solución de la ecuación general homogénea (12.2),

d2 y1 dy1
+ p(x) + q(x)y1 = 0 ,
dx 2
dx
y sea y3 (x) = cy1 (x), siendo c una constante. Entonces,

dy3 d(cy1 ) dy1 d2 y3 d2 y1


= =c , = c ,
dx dx dx dx2 dx2
y
 2 
d2 y3 dy3 d y1 dy1
+ p(x) + q(x)y3 = c + p(x) + q(x)y1 = 0,
dx2 dx dx2 dx

de manera que y3 = cy1 es también una solución. Sin embargo, las funciones y1 e y3 no se
consideran diferentes, porque cada una es sencillamente un múltiplo de la otra: se dice
que las funciones son linealmente dependientes. En general, dos funciones y1 e y2 son
linealmente dependientes si existe una relación

a1 y1 (x) + a2 y2 (x) = 0 (12.4)

tal que a1 y a2 no son ambos cero. Si (12.4) es únicamente cierta cuando a1 = a2 = 0,


entonces las funciones son linealmente independientes, y ninguna de ellas es múltiplo
de la otra. Las soluciones y1 e y2 del ejemplo 12.1 son linealmente independientes.
12.3. Solución general 299

Demostraremos ahora que si y1 e y2 son dos soluciones de una ecuación lineal ho-
mogénea, entonces cualquier combinación lineal de ellas,

y = c1 y1 + c2 y2 (12.5)

donde c1 y c2 son constantes arbitrarias, es también una solución.


Tenemos
dy dy1 dy2 d2 y d2 y1 d2 y2
= c1 + c2 , = c1 + c2 ,
dx dx dx dx2 dx2 dx2
y sustituyendo en la ecuación general homogénea (12.2),
 2 
d2 y dy d y1 d2 y2
+ p(x) + q(x)y = c1 2 + c2 2
dx2 dx dx dx
   
dy1 dy2
+p(x) c1 + c2 + q(x) c1 y1 + c2 y2
dx dx
 2 
d y1 dy1
= c1 + p(x) + q(x)y1
dx2 dx
 2 
d y2 dy2
+c2 + p(x) + q(x)y2
dx2 dx
= 0.

El resultado es cero ya que ambos términos entre corchetes son cero por ser y1 e y2
soluciones. Esta importante propiedad de las ecuaciones lineales homogéneas se lla-
ma principio de superposición (no se cumple para ecuaciones no homogéneas ni para
ecuaciones no lineales). En particular, cuando y1 e y2 son soluciones linealmente inde-
pendientes, la función (12.5), que tiene dos constantes arbitrarias, es la solución general
de la ecuación homogénea (véase el apartado 11.2).

EJEMPLO 12.2 La solución general de la ecuación del Ejemplo 12.1 es


y(x) = c1 e2x + c2 e3x .
Las soluciones particulares se obtienen asignando valores particulares a c1 y c2 .

12.3. Solución general


Supongamos que una solución de la ecuación (12.3),

d2 y dy
+ a + by = 0 (12,3) ,
dx2 dx
300 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes

es
y = eλx . (12.6)

Entonces
d λx d2 λx
e = λeλx , e = λ2 eλx ,
dx dx2
y sustituyendo en (12.3) tenemos

λ2 eλx + aλeλx + beλx = 0

o bien
eλx (λ2 + aλ + b) = 0 .

La función (12.6) es por lo tanto una solución de la ecuación (12.3) si

λ2 + aλ + b = 0 . (12.7)

Esta ecuación cuadrática se llama ecuación caracterı́stica o ecuación auxiliar de la


ecuación diferencial.2 Los posibles valores de λ son las raı́ces de la ecuación cuadrática:

1 √ 1 √
λ1 = (− a + a2 − 4b ) , λ2 = (− a − a2 − 4b ) , (12.8)
2 2
y las posibles soluciones de tipo (12.6) son

y1 = eλ x ,
1
y2 = eλ x .
2
(12.9)

EJEMPLO 12.3 La ecuación caracterı́stica de la ecuación diferencial


d2 y dy
− 5 + 6y = 0
dx2 dx
es
λ2 − 5λ + 6 = 0
que puede ser factorizada como
λ2 − 5λ + 6 = (λ − 2)(λ − 3)
y sus raı́ces son λ1 = 2 y λ2 = 3. Dos soluciones particulares de la ecuación diferencial son por lo tanto

y1 = eλ1 x = e2x , y2 = eλ2 x = e3x ,


y, como esas funciones son linealmente independientes, la solución general es

y = c1 y1 + c2 y2 = c1 e2x + c2 e3x .

02. En una carta de 1739 a Johann Bernoulli, Euler describió su descubrimiento de la solución de las
ecuaciones lineales con coeficientes constantes por medio de la ecuación caracterı́stica: ‘después de tratar
el problema de muchas maneras, llegué a mi solución de forma totalmente inesperada. Antes de ello no
sospechaba que la solución de ecuaciones algebraicas tuviese tanta importancia en este asunto’.
12.3. Solución general 301

En el Ejemplo 12.3 la ecuación caracterı́stica tiene dos raı́ces reales distintas de manera
que y1 e y2 son linealmente independientes y la solución general es una combinación
lineal de ellas. La naturaleza de las raı́ces depende del discriminante a2 − 4b. Si a y b
son números reales, los tres tipos posibles son

(i) a2 − 4b > 0 dos raı́ces reales distintas


(ii) a2 − 4b = 0 una raı́z real doble
(iii) a2 − 4b < 0 una pareja de raı́ces complejas conjugadas

(i) Dos raı́ces reales distintas

Las raı́ces vienen dadas por (12.8), las soluciones particulares por (12.9) y, al igual
que en el Ejemplo 12.3, la solución general es

y(x) = c1 y1 (x) + c2 y2 (x) = c1 eλ x + c2 eλ x .


1 2
(12.10)

(ii) Una raı́z real doble

Cuando a2 − 4b = 0 las dos raı́ces de (12.8) son iguales, con λ1 = λ2 = −a/2. Por
lo tanto sólo se obtiene una solución particular de la ecuación caracterı́stica:

y1 (x) = eλ x = e−ax/2 .
1
(12.11)

Dada una solución particular de una ecuación homogénea, siempre se puede obtener una
segunda. En este caso una segunda solución, linealmente independiente de la primera,
es

y2 (x) = xy1 (x) = xe−ax/2 . (12.12)

Se demuestra que esto es una solución sustituyéndolo en la ecuación diferencial: tenemos

dy2   d2 y2  
= 1 − ax/2 e−ax/2 , = – a + a 2
x/4 e−ax/2 ,
dx dx2
de manera que
  
d2 y2 dy2 a2 x −ax/2 ax  −ax/2
+ a + by2 = −a + e + a 1 − e + bxe−ax/2
dx2 dx 4 2
 
a2 x a2 x
= −a + +a− + bx e−ax/2
4 2
 2 
ax x
= − + bx e−ax/2 = − (a2 − 4b) e−ax/2
4 4
= 0,
302 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes

ya que a2 − 4b = 0. La solución general es por lo tanto en este caso

y(x) = c1 e−ax/2 + c2 xe−ax/2 = (c1 + c2 x)e−ax/2 . (12.13)

EJEMPLO 12.4 Resuelva la ecuación diferencial


y − 4y + 4y = 0 .
La ecuación caracterı́stica
λ2 − 4λ + 4 = (λ − 2)2 = 0
tiene la raı́z doble λ = 2. Dos soluciones particulares son por lo tanto e2x y xe2x , y la solución general es

y(x) = (c1 + c2 x)e2x .

(iii) Raı́ces complejas


Cuando el discriminante a2 − 4b de la ecuación cuadrática caracterı́stica (12.7) es
negativo, las raı́ces son una pareja de números complejos conjugados.

EJEMPLO 12.5 Resuelva la ecuación diferencial


y − 2y + 2y = 0 .
La ecuación caracterı́stica es
λ2 − 2λ + 2 = 0
1 √
y las raı́ces son λ = (2 ± 4 − 8 ), o
2
λ1 = 1 + i , λ2 = λ∗1 = 1 − i .

Por lo tanto dos soluciones particulares son

y1 (x) = eλ1 x = e(1+i)x , y2 (x) = eλ2 x = e(1−i)x ,

que son linealmente independientes, y la solución general es

y(x) = c1 e(1+i)x + c2 e(1−i)x = ex (c1 eix + c2 e−ix ) .

Ésta es la forma exponencial de la solución. Se puede dar una forma trigonométrica expresando e±ix me-
diante sen x y cos x a través de la fórmula de Euler (ecuaciones (8.33) y (8.34)),

e±ix = cos x ± i sen x .

Entonces

y(x) = ex [c1 ( cos x + i sen x) + c2 ( cos x − i sen x)]

= ex [(c1 + c2 ) cos x + i(c1 − c2 ) sen x]

= ex (d1 cos x + d2 sen x) ,

donde d1 = c1 + c2 y d2 = i(c1 − c2 ) son (nuevas) constantes arbitrarias.


12.4. Soluciones particulares 303

En el caso complejo general, las raı́ces de la ecuación caracterı́stica (12.7) son, a partir
de (12.8),
 
a a 2
λ=− ± − b,
2 2

donde en este caso (a/2)2 − b < 0. Sea (a/2)2 − b = −ω 2 , siendo ω real. Entonces
 
a 2 √ √
− b = −ω 2 = −1 ω = iω
2

y las raı́ces son


a a
λ1 = − + iω , λ2 = − − iω . (12.14)
2 2
Dos soluciones particulares de la ecuación diferencial son por lo tanto

y1 (x) = e(−a/2+iω)x , y2 (x) = e(−a/2−iω)x , (12.15)

y por tratarse de funciones linealmente independientes (si ω = 0), la solución general es

y(x) = c1 y1 (x) + c2 y2 (x) = e−ax/2 (c1 eiωx + c2 e−iωx ) . (12.16)

La forma trigonométrica de la solución general es (véase el Ejemplo 12.5)

y(x) = e−ax/2 (d1 cos ωx + d2 sen ωx) (12.17)

con d1 = c1 + c2 y d2 = i(c1 − c2 ).

12.4. Soluciones particulares


Las dos constantes arbitrarias c1 y c2 de la solución general

y(x) = c1 y1 (x) + c2 y2 (x)

se determinan normalmente en aplicaciones fı́sicas mediante dos condiciones (dos por


ser dos las constantes) de alguna de las dos maneras siguientes.

(a) Condiciones iniciales


Se especifican los valores de la función y(x) y también de su derivada y (x) para algún
valor de x:

y(x0 ) = y0 , y (x0 ) = y1 . (12.18)


304 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes

Una ecuación diferencial de segundo orden con condiciones iniciales se llama un pro-
blema de valor inicial.

EJEMPLO 12.6 Resuelva el problema de valor inicial


y + y − 6y = 0 , y(0) = 0 , y (0) = 5 .
La ecuación caracterı́stica es λ2 + λ − 6 = (λ − 2)(λ + 3) = 0, con raı́ces λ1 = 2 y λ2 = −3. La solución
general es
y(x) = c1 e2x + c2 e−3x
con derivada primera
y (x) = 2c1 e2x − 3c2 e−3x .
Entonces
y(0) = 0 = c1 + c2 , y (0) = 5 = 2c1 − 3c2 ,
cuya solución es c1 = 1, c2 = −1. La solución del problema de valor inicial es por lo tanto

y(x) = e2x − e−3x .

Las condiciones iniciales se asocian normalmente con aplicaciones en dinámica, siendo


x la variable tiempo.

(b) Condiciones de contorno


En muchas aplicaciones en las ciencias fı́sicas la variable x es una coordenada y la
situación fı́sica se determina por condiciones del valor de y(x) en la frontera del sistema.
Las condiciones

y(x1 ) = y1 , y(x2 ) = y2 , (12.19)

se llaman condiciones de contorno, y x1 y x2 son los extremos del intervalo x1 ≤ x ≤


x2 en el cual está definida la ecuación diferencial. Una ecuación diferencial con unas
condiciones de contorno se llama un problema de contorno.

EJEMPLO 12.7 Resuelva el problema de contorno


y − 2y + 2y = 0 , y(0) = 1 , y(π/2) = 2 .
La ecuación diferencial es la que hemos resuelto en el Ejemplo 12.5, con solución general (en forma trigo-
nométrica)
y(x) = ex (d1 cos x + d2 sen x) .
Aplicando las condiciones de contorno

y(0)=1= e0 (d1 cos 0 + d2 sen 0) = d1 , y(π/2)=2= eπ/2 (d1 cos π/2 + d2 sen π/2) = d2 eπ/2 .

Por lo tanto d1 = 1, d2 = 2e−π/2 y la solución del problema de contorno es

y(x) = ex (cos x + 2e−π/2 sen x) .


12.4. Soluciones particulares 305

EJEMPLO 12.8 Resuelva el problema de contorno


y + y − 6y = 0 , y(0) = 1 , y(x) → 0 cuando x → ∞ .
La ecuación diferencial es la del Ejemplo 12.6, con solución general

y(x) = c1 e2x + c2 e−3x .


La primera de las condiciones de contorno nos da
y(0) = 1 = c1 + c2 .
La segunda condición supone que la solución tiende a cero cuando x tiende a infinito. La función e−3x tiene
esa propiedad pero la función e2x tiene que ser eliminada. La condición supone por lo tanto que tomemos
c1 = 0. Entonces c2 = 1 y la solución del problema de contorno es

y(x) = e−3x .

La ecuación y + ω 2 y = 0
En los ejemplos 12.6 a 12.8, las dos condiciones aplicadas a la solución de la ecuación
diferencial son suficientes para especificar una solución particular. En algunos casos, sin
embargo, cuando en la ecuación diferencial hay parámetros por determinar, se necesitan
una o más condiciones adicionales para especificar completamente la solución. Varios
ejemplos de esas ecuaciones se tratan en el Capı́tulo 13. Uno de los ejemplos sencillos
más importantes en las ciencias fı́sicas es la ecuación

d2 y
+ ω2 y = 0 , (12.20)
dx2
donde ω es un número real. La solución general viene dada bien sea por (12.16) con
a = 0,

y(x) = c1 eiωx + c2 e−iωx , (12.21)

o por la forma trigonométrica equivalente (12.17),

y(x) = d1 cos ωx + d2 sen ωx . (12.22)

Si ω es una constante dada, las dos condiciones iniciales o de contorno son suficientes
para especificar una solución particular. Esto se ve, por ejemplo, en el Apartado 12.5
para el oscilador armónico como problema de valor inicial. Sin embargo, si ω es un
parámetro por determinar, es necesaria una condición adicional. Éste es el caso de la
‘partı́cula en un pozo’ en mecánica cuántica, como problema de contorno, que tratamos
en el Apartado 12.6.
Una tercera posibilidad se produce cuando la situación fı́sica necesita que se cumpla
una condición de contorno periódica (cı́clica)(véase el Apartado 8.6)

y(x + λ) = y(x) , (12.23)


306 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes

donde λ es el periodo. En este caso, sustituir x por x + λ en la solución general (12.21)


nos da

y(x + λ) = c1 eiω(x+λ) + c2 e−iω(x+λ) = c1 eiωx eiωλ + c2 e−iωx e−iωλ .

La condición (12.23) se cumple entonces si eiωλ = 1 y e−iωλ = 1, simultáneamente.


Como vimos en el Apartado 8.6, esto ocurre si ωλ es un múltiplo de 2π,

ωλ = 2πn , n = 0, ±1, ±2, ±3, . . . (12.24)

Los valores posibles de ω son entonces ωn = 2πn/λ (utilizando n para etiquetar los
valores), y las correspondientes soluciones son

yn (x) = c1 e(2πnx/λ)i + c2 e−(2πnx/λ)i , n = 0, ±1, ±2, ±3, . . . (12.25)

La forma trigonométrica de estas soluciones es

2πnx 2πnx
yn = d1 cos + d2 sen . (12.26)
λ λ
Las constantes c1 y c2 , o d1 y d2 , no están determinadas. En el Apartado 12.7 tratamos un
ejemplo del caso de condiciones de contorno periódicas con el problema de la ‘partı́cula
en un aro’ en mecánica cuántica.

12.5. El oscilador armónico

Figura 12.1

El oscilador armónico (lineal) simple (Figura 12.1) consiste en un cuerpo que se mueve
en lı́nea recta bajo la acción de una fuerza

F = −kx (12.27)

cuya magnitud es proporcional al desplazamiento x del cuerpo con respecto al punto


fijo O, el punto de equilibrio, y cuya dirección es hacia ese punto. La cantidad k se llama
constante de la fuerza y el signo negativo nos asegura que la fuerza actúa en la dirección
opuesta al desplazamiento.
Por la segunda ley de Newton, la aceleración que sufre el cuerpo viene dada por

d2 x
F=m (12.28)
dt2
12.5. El oscilador armónico 307

y el movimiento armónico simple se describe entonces con la ecuación diferencial

d2 x
m = −kx . (12.29)
dt2
Una gran variedad de sistemas fı́sicos se pueden modelar mediante el movimiento armóni-
co simple: las oscilaciones de una balanza de resorte (la ecuación (12.27) se llama en-
tonces ley de Hooke), el balanceo de un péndulo, las oscilaciones de un trampolı́n y, de
importancia en quı́mica, las vibraciones de los átomos en las moléculas o cristales.

EJEMPLO 12.9 Vibraciones de moléculas diatómicas


Las vibraciones de una molécula diatómica se modelan a menudo mediante el potencial de Morse
 2
V(R) = De 1 − e−a(R−Re ) (12.30)
donde (Figura 12.2) R es la distancia entre los núcleos, Re es la
distancia en el equilibrio (la longitud de enlace de equilibrio),
De es la energı́a de disociación de la molécula y a es una cons-
tante (las vibraciones de la molécula pueden visualizarse como
una bola rodando adelante y atrás en el ‘pozo de potencial’ de
la Figura 12.2). Una molécula estable, en su estado vibracional
fundamental o en uno poco excitado experimenta únicamente
pequeños desplazamientos R − Re en torno al equilibrio. Enton-
ces, desarrollando la energı́a potencial V(R) en serie de poten-
cias de (R − Re ),

V = De [a2 (R − Re )2 − a3 (R − Re )3 + · · · ]

≈ a2 De (R − Re )2 . (12.31)
Figura 12.2

La fuerza que actúa entre los núcleos de la molécula es (véase el Apartado 5.7, ecuación (5.57))
dV
F=− . (12.32)
dR
Por lo tanto, derivando (12.31) tenemos para pequeños desplazamientos

F ≈ −2a2 De (R − Re ) . (12.33)

Si k = 2a2 De y x = (R − Re ), la fuerza es F ≈ −kx, y las vibraciones de la moléculas son (aproximada-


mente) armónicas simples.

La ecuación (12.29) puede escribirse en la forma estándar (12.3) de una ecuación lineal
homogénea con coeficientes constantes,

d2 x k
+ x=0 (12.34)
dt2 m
o, definiendo k/m = ω 2 , en la forma de la ecuación (12.20),

d2 x
+ ω2 x = 0 , (12.35)
dt2
308 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes

con solución general, en forma trigonométrica,

x(t) = d1 cos ωt + d2 sen ωt . (12.36)

El estado del sistema queda determinado por las condiciones iniciales. Por ejemplo, sean
el desplazamiento y la velocidad en el instante t = 0

x(0) = A , x (0) = 0 . (12.37)

Entonces, para el desplazamiento inicial

x(0) = A = d1 cos 0 + d2 sen 0 = d1 ,

y para la velocidad:

x (t) = −d1 ω sen ωt + d2 ω cos ωt


x (0) = −d1 ω sen 0 + d2 ω cos 0 = d2 ω = 0 .

Por lo tanto d1 = A, d2 = 0, y la solución del problema de valor inicial es

x(t) = A cos ωt . (12.38)

La gráfica de la solución se muestra en la Figura 12.3. El desplazamiento máximo del


cuerpo con respecto al equilibrio es la amplitud A. La longitud de onda de la curva es
el periodo τ = 2π/ω, el tiempo necesario para una oscilación completa. El inverso del
periodo, ν = 1/τ = ω/2π, se denomina frecuencia de oscilación, el número de osci-
laciones por unidad de tiempo. La cantidad ω = 2πν se denomina frecuencia angular.
La frecuencia de oscilación está relacionada con la constante de la fuerza k a través de
ω 2 = k/m:
 
k 1 k
ω= , ν= . (12.39)
m 2π m

Figura 12.3
12.5. El oscilador armónico 309

Análisis energético
El oscilador armónico es un sistema conservativo (véase el Apartado 5.7) y la fuerza
F = −kx es la derivada de la función energı́a potencial, F = −dV/dx. La energı́a
potencial es por lo tanto la integral
 
dV 1
V(x) = dx = − F dx = kx2 + c .
dx 2

La energı́a potencial se elige, por convenio, que sea cero en la posición de equilibrio,
cuando x = 0. Entonces
1
V = kx2 . (12.40)
2
La energı́a cinética es T = mv2 /2, donde v es la velocidad, y la energı́a total es E =
T + V. Para el estado del sistema descrito por la solución (12.38),

x = A cos ωt , v = x = −Aω sen ωt ,

de manera que

1 1
V = kx2 = kA2 cos2 ωt ,
y 2 2

1 1 1
T = mv2 = mω 2 A2 sen2 ωt = kA2 sen2 ωt ,
2 2 2
ya que ω 2 = k/m. La energı́a total es por lo tanto la constante

1
E = T + V = kA2 . (12.41)
2

Figura 12.4
310 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes

La relación entre las energı́as potencial y cinética se muestra en la Figura 12.4.


En el desplazamiento máximo con respecto al equilibrio, x = A, la energı́a potencial
alcanza su valor máximo, V = E, y la energı́a cinética es cero. A medida que el cuerpo
se acerca a la posición de equilibrio, la energı́a potencial se convierte en energı́a cinética
y, a x = 0, V = 0 y la energı́a cinética alcanza el máximo, T = E.

12.6. Partı́cula en un pozo unidimensional

La partı́cula en un ‘pozo de potencial unidimensional con paredes infinitas’ es el


nombre dado a un sistema que consiste en un cuerpo que puede moverse libremente
sobre un segmento de recta de longitud finita. En mecánica cuántica éste es uno de los
sistemas más sencillos que ilustran la cuantización de la energı́a.
La ecuación de Schrödinger para una partı́cula de masa m que se mueve en la direc-
ción x es
2 d2 ψ(x)
− + V(x)ψ(x) = Eψ(x) (12.42)
2m dx2
donde V(x) es la energı́a potencial de la partı́cula en la
posición x, E es la energı́a total (constante) y ψ es la
función de onda. Para este sistema la función energı́a
potencial es (Figura 12.5)

V(x) = 0 para 0 < x < l ,


= ∞ para x ≤ 0 y x ≥ l . (12.43)
Figura 12.5

El valor constante de V dentro del pozo asegura que en esa región no se ejerce fuerza
alguna sobre la partı́cula. Tomar V = 0 supone que la energı́a E es la energı́a cinética
(positiva) de la partı́cula. El valor infinito de V en las ‘paredes’ y fuera del pozo asegura
que la partı́cula no puede salir del pozo: en mecánica cuántica eso significa que la función
de onda es cero en las paredes y fuera del pozo.
Para la partı́cula dentro del pozo tenemos por lo tanto el problema de contorno

2 d2 ψ(x)
− = Eψ(x) (12.44)
2m dx2
con las condiciones de contorno

ψ(0) = ψ(l) = 0 . (12.45)

La ecuación (12.44) es idéntica en su forma a la ecuación (12.20), o a la ecuación (12.35)


para el oscilador armónico. En efecto: tomando

2mE
ω2 = (12.46)
2
12.6. Partı́cula en un pozo unidimensional 311

tenemos
d2 ψ
+ ω2 ψ = 0 (12.47)
dx2
con solución general, en forma trigonométrica,

ψ(x) = d1 cos ωx + d2 sen ωx . (12.48)

Aplicamos ahora las condiciones de contorno (12.45). A t = 0,

ψ(0) = d1 cos 0 + d2 sen 0 = d1 = 0

y a x = l (tomando d1 = 0 en (12.48)),

ψ(l) = d2 sen ωl = 0 . (12.49)

Como la función seno sólo se anula si su argumento es un múltiplo de π, se deduce que


ωl = nπ siendo n un entero:

ω= , n = 0, ±1, ±2, . . . (12.50)
l
Las soluciones del problema de contorno son por lo tanto
nπx
ψn (x) = d2 sen , n = 1, 2, 3, . . . (12.51)
l
donde las soluciones posibles aparecen etiquetadas por el número cuántico n. El valor
n = 0 se ha descartado ya que la solución trivial ψ0 (x) = 0 no es una solución fı́sica,
y los valores negativos de n se descartan porque ψ−n (x) = −ψn (x) es sencillamente ψn
cambiada de signo.
Para cada una de las soluciones ψn existe una energı́a

n2 h 2
En = (12.52)
8ml2
(usando que E = 2 ω 2 /2m = h2 ω 2 /8π 2 m). Vemos que la cuantificación de la energı́a
es una consecuencia de restringir el movimiento de la partı́cula a una región finita del
espacio mediante las condiciones de contorno: este es un resultado general en mecánica
cuántica. Señalamos que estos resultados no se limitan al movimiento sobre una lı́nea
recta: también son válidos para cualquier curva de longitud l con la variable x medida
sobre la curva.
Las funciones de onda (12.51) no están completamente determinadas porque el coefi-
ciente d2 no ha sido definido. Para determinar d2 recurrimos a la interpretación mecánico-
cuántica del cuadrado de la función de onda como la densidad de probabilidad (véase
también el ejemplo 10.3):
312 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes

ψ 2 (x) dx = probabilidad de que la partı́cula esté en el elemento dx en la posición x

La probabilidad total de que la partı́cula esté en el pozo es 1 de manera que, integrando


para toda la longitud del pozo,
 l  l
nπx l
1= ψ (x) dx = d2
2 2
sen2 dx = d2 2 .
0 0 l 2

Por lo tanto d2 = 2/l, y las soluciones normalizadas son

2 nπx
ψn (x) = sen . (12.53)
l l

Las gráficas de estas soluciones se representan en la Figura 12.6 para los tres primeros
valores de n.

Figura 12.6

Estas gráficas muestran cómo la función de onda ψn tiene (n−1) ceros, o nodos, entre
los extremos. Esto ilustra una propiedad general de las funciones de onda: el número de
ceros (puntos, curvas o superficies nodales) aumenta a medida que la energı́a del sistema
aumenta.
El caso de la partı́cula en un pozo es importante en las ciencias fı́sicas no sólo como
uno de los problemas más sencillos resolubles que ilustra el fenómeno de la cuantización,
sino también porque el sistema, generalizado a tres dimensiones, se utiliza en termo-
dinámica estadı́stica para obtener las propiedades termodinámicas de los gases ideales.
Empleamos ahora las soluciones (12.53) para hacer ver una propiedad importante de las
soluciones de la ecuación de Schrödinger.

Ortogonalidad
La ecuación de Schrödinger para la partı́cula en un pozo puede escribirse como


2 d2
− ψ = Eψ
2m dx2

o bien Hψ = Eψ , (12.54)
12.6. Partı́cula en un pozo unidimensional 313

donde el operador diferencial

2 d2
H=− (12.55)
2m dx2
se denomina operador hamiltoniano, o sencillamente hamiltoniano, del sistema. El
efecto de operar con H sobre ψ es generar un múltiplo de ψ. La ecuación de Schrödin-
ger (independiente del tiempo) siempre puede escribirse en la forma (12.54) como una
ecuación de autovalores, con el sistema especificado por el operador hamiltoniano y
condiciones de contorno adecuadas. Las funciones de onda permitidas ψ = ψn se deno-
minan autofunciones del hamiltoniano, y las energı́as correspondientes E = En son los
autovalores de H.
Una propiedad importante de las autofunciones es su ortogonalidad. En este caso
concreto, consideramos la integral
 l

I= ψm (x)ψn (x) dx (12.56)


0

donde ψm y ψn son dos autofunciones (12.53) distintas. Entonces


 l
2 mπx nπx
I = sen sen dx
l 0 l l
= 0 si m = n . (12.57)

Demostración. Evaluamos la integral utilizando las propiedades de la suma de funciones trigonométricas


que vimos en el Apartado 6.2. Tenemos
    
mπx nπx 1 (m − n)πx (m + n)πx
sen sen = cos − cos
l l 2 l l

de manera que
     
1 l
(m − n)πx 1 l
(m + n)πx
I= cos dx − cos dx .
2 0 l 2 0 l
Ahora bien,

      l
l
(m ± n)πx l (m ± n)πx
cos dx = sen
0 l (m ± n)π l 0
 
l
= sen (m ± n)π − sen 0
(m ± n)π

= 0,

ya que sen 0 = 0 y que el seno de un múltiplo, m ± n, de π también es cero.


314 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes

Se deduce por lo tanto que


 l

ψm (x)ψn (x) dx = 0 si m = n . (12.58)


0

Las funciones se dice que son ortogonales. Para las funciones de onda normalizadas,
l
que cumplen 0 ψn (x)ψn (x) dx = 1, podemos escribir


l
1 si m = n,
ψm (x)ψn (x) dx = δmn = (12.59)
0 0 si m = n.

La cantidad δmn , que es 1 si m = n y 0 si m = n, se llama delta de Kronecker. Las funcio-


nes que cumplen (12.59) se dice que son ortonormales (ortogonales y normalizadas).

12.7. Partı́cula en un aro


La ecuación de Schrödinger para una partı́cula de masa m que se mueve libremente
en un cı́rculo de radio r es, Figura 12.7,

2 d2 ψ(θ)
H ψ(θ) = − = Eψ(θ) (12.60)
2I dθ2
donde E es la energı́a cinética (positiva) de la partı́cula e I =
mr2 es su momento de inercia con respecto al centro del cı́rculo.
Tomando
2IE
ω2 = (12.61)
2
tenemos
d2 ψ Figura 12.7
+ ω2 ψ = 0 (12.62)
dθ2

cuya solución general, en forma exponencial, es

ψ(θ) = c1 eiωθ + c2 e−iωθ . (12.63)

Para que la función de onda sea continua en el cı́rculo tiene que cumplir la condición de
contorno periódica

ψ(θ + 2π) = ψ(θ) . (12.64)

Las ecuaciones (12.62) y (12.64) son el problema de contorno tratado en el Apartado


12.4, cambiando x por θ y λ por 2π. Los valores de ω permitidos son por lo tanto ωn = n,
12.7. Partı́cula en un aro 315

y las correspondientes soluciones, o autofunciones, son

ψn (θ) = c1 einθ + c2 e−inθ , n = 0, ±1, ±2, . . . (12.65)

con autovalores
2 n2
En = . (12.66)
2I
Señalamos que los estados del sistema con número cuántico n = 0 aparecen en pares
degenerados, ψn y ψ−n ,

H ψn = En ψn , H ψ−n = En ψ−n .

Por el principio de superposición (Apartado 12.2), toda combinación lineal de una pareja
de autofunciones degenerada es a su vez una autofunción con el mismo autovalor,

H (aψn + bψ−n ) = En (aψn + bψ−n )

donde a y b son arbitrarios. Distinguir entre estados degenerados de un sistema mecánico-


cuántico sólo es posible fı́sicamente aplicando una fuerza externa para romper la dege-
neración. En ausencia de tal fuerza, por lo tanto, cualquier elección de los coeficientes
c1 y c2 es igual de buena. Por convenio se toma c2 = 0 en (12.65), con lo cual se obtiene
el conjunto de autofunciones

ψn (θ) = c1 einθ , n = 0, ±1, ±2, . . . (12.67)

y se escoge c1 de manera a normalizar las funciones. La condición de normalización para


funciones complejas es
 2π

ψn∗ (θ)ψn (θ) dθ = 1 (12.68)


0

donde ψ∗n(θ) = c∗1 e−inθ es la función complejo-conjugada de ψn (θ). Entonces


 2π  2π  2π

ψ (θ)ψn (θ) dθ = |c1 |



n
2
e dθ = |c1 |
−inθ inθ
e 2
dθ = 2π|c1 |2
0 0 0


y esto es 1 si c1 = 1/ 2π. Las autofunciones normalizadas son por lo tanto

1
ψn (θ) = √ einθ , n = 0, ±1, ±2, . . . (12.69)

Estas funciones constituyen un conjunto ortonormal en el intervalo 0 ≤ θ ≤ 2π; son


ortogonales y a la vez están normalizadas:
316 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes

 2π

ψ∗n(θ)ψm (θ) dθ = 0 si n = m . (12.70)


0

EJEMPLO 12.10 Demuestre que las funciones ψ1 y ψ2 cumplen la ecuación (12.70).

Tenemos
 2π  2π  2π
1 1
ψ∗1 (θ)ψ2 (θ) dθ = e−iθ e2iθ dθ = eiθ dθ
0 2π 0 2π 0
 2π
1 1 iθ 1 2πi 
= e = e −1
2π i 0 2πi

y esto es cero puesto que e2πi = 1.

Las funciones (12.69) pueden interpretarse como giros de la partı́cula, en sentido horario
si n > 0 y antihorarios si n < 0 (véase el Apartado 8.6, para el rotor rı́gido). Cuando
n = 0 se trata de funciones complejas, pero para algunas aplicaciones es más conveniente
tener soluciones de la ecuación de Schrödinger que sean funciones reales. El convenio
es utilizar funciones trigonométricas obtenidas mediante la fórmula de Euler. Tenemos

1
ψ±n (θ) = √ (cos nθ ± i sen nθ)

y las combinaciones

1 1 1 1
√ (ψn + ψ−n ) = √ cos nθ , √ (ψn − ψ−n ) = √ sen nθ (12.71)
2 2 π i 2 2 π

son un conjunto ortonormal alternativo. Las simetrı́as de estas funciones se ilustran en


la Figura 12.8.

Figura 12.8

Señalamos que estas simetrı́as son también las simetrı́as alrededor del eje molecular
de los orbitales moleculares en una molécula lineal, con n = 0 para orbitales σ, n = ±1
para π, n = ±2 para δ, y ası́ sucesivamente.
12.8. Ecuaciones lineales no homogéneas 317

El caso general
Si se unen los extremos del pozo que vimos en el Apartado 12.6 para formar un
contorno cerrado simple, la ecuación de Schrödinger no varı́a

d2 ψ 2mE
+ ω2 ψ = 0 , ω2 = , (12.72)
dx2 2
si la variable x se mide a lo largo del contorno. Pero las dos condiciones de contorno
(12.45) han de ser sustituidas por una única condición periódica

ψ(x + l) = ψ(x) . (12.73)

Las ecuaciones (12.72) y (12.73) son el problema de contorno que hemos tratado en el
Apartado 12.4 (sustituyendo λ por l). Los valores permitidos de ω son ωn = 2πn/l, y las
soluciones vienen dadas en forma trigonométrica por la ecuación (12.26),

2πnx 2πnx
ψn (x) = d1 cos + d2 sen . (12.74)
l l
Estos resultados son válidos para cualquier contorno cerrado con la forma que sea. Los
resultados para el cı́rculo de radio r se obtienen sustituyendo l por la circunferencia 2πr
y la variable x por rθ.

12.8. Ecuaciones lineales no homogéneas


La ecuación general lineal de segundo orden no homogénea con coeficientes cons-
tantes es
d2 y dy
+ a + by = r(x) , (12.75)
dx2 dx
siendo a y b constantes. Mediante métodos elementales se pueden hallar soluciones par-
ticulares para varios tipos importantes de la inhomogeneidad r(x).

EJEMPLO 12.11 Halle una solución particular de la ecuación


y + 3y + 2y = 2x2 .
La forma de la función en el segundo miembro sugiere una solución del tipo

y = a0 + a1 x + a2 x2 .

Entonces
y = a1 + 2a2 x , y = 2a2 ,
y
y + 3y + 2y = (2a2 + 3a1 + 2a0 ) + (6a2 + 2a1 )x + 2a2 x2 .
Esto es igual a 2x2 si

(2a2 + 3a1 + 2a0 ) = 0 , (6a2 + 2a1 ) = 0 , a2 = 1 ,


318 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes

de manera que a2 = 1, a1 = −3 y a0 = 7/2. Una solución particular es por lo tanto


7
y= − 3x + x2 .
2

El método empleado en este ejemplo es el método de coeficientes indeterminados,


siendo a0 , a1 y a2 los coeficientes por determinar en este caso. Vamos a ver primero
cómo se puede obtener la solución general, conocida una solución particular.
Sea yp (x) una solución particular de la ecuación no homogénea (12.75), de manera
que

d2 yp dyp
+a + byp = r(x) . (12.76)
dx 2
dx
Sea yh la solución general (12.5) de la correspondiente ecuación homogénea (12.3), que
se llama en este contexto la ecuación reducida:

yh (x) = c1 y1 (x) + c2 y2 (x) , (12.77)

d2 yh dyh
+a + byh = 0 . (12.78)
dx2 dx
Se deduce que la suma de esas dos funciones,

y(x) = yh (x) + yp (x) (12.79)

es también una solución de la ecuación no homogénea:


 2   2 
d2 y dy d yh dyh d yp dyp
+ a + by = +a + byh + +a + byp = r(x) ,
dx2 dx dx2 dx dx2 dx

donde hemos usado las ecuaciones (12.76) y (12.78). La función (12.79) tiene dos cons-
tantes arbitrarias y es la solución general de la ecuación no homogénea. La función yh
se llama a menudo función complementaria e yp una integral particular:

solución general = función complementaria + integral particular

EJEMPLO 12.12 Halle la solución general de la ecuación


y + 3y + 2y = 2x2 .
Por el ejemplo 12.11, una integral particular es
7
yp (x) = − 3x + x2 .
2
La ecuación reducida (homogénea) es
y + 3y + 2y = 0
12.8. Ecuaciones lineales no homogéneas 319

y su ecuación caracterı́stica es λ2 + 3λ + 2 = (λ + 1)(λ + 2) = 0, con raı́ces λ1 = −1 y λ2 = −2. La


solución general de la ecuación homogénea, la función complementaria, es por lo tanto

yh (x) = c1 e−x + c2 e−2x


y la solución general de la ecuación no homogénea es
7
y(x) = yh (x) + yp (x) = c1 e−x + c2 e−2x + − 3x + x2 .
2

El método de coeficientes indeterminados


Este método puede usarse para muchas de las funciones elementales r(x) en (12.75),
y lo resumimos en la Tabla 12.1 para varios de los tipos más importantes

Tabla 12.1

Término en r(x) Elección de yp

1. ceαx keαx
2. cx (n = 0, 1, 2, . . . )
n
a0 + a1 x + a2 x2 + · · · + an xn
3. c cos ωx o c sen ωx k cos ωx + l sen ωx
4. ceαx cos ωx o ceαx sen ωx eαx (k cos ωx + l sen ωx)

La tabla nos da la elección inicial de una integral particular yp correspondiente a cada


función r(x). Los coeficientes de yp se determinan sustituyendo yp en la ecuación no ho-
mogénea. El ejemplo 12.11 ilustra el método para el caso 2 de la tabla. Esto es suficiente
salvo si uno de los términos de yp es también una solución de la correspondiente ecuación
homogénea. En ese caso

(a) si la ecuación caracterı́stica de la ecuación homogénea tiene dos raı́ces distintas,


se multiplica yp por x antes de sustituir en (12.75), o
(b) si la ecuación caracterı́stica tiene una raı́z doble, se multiplica yp por x2 antes de
sustituir en (12.75).

Además, si r(x) es suma de dos o más términos, la solución particular total es la corres-
pondiente suma de las yp correspondientes.

EJEMPLO 12.13 Halle la solución general de la ecuación


y + 3y + 2y = 3e−2x .
Por el Ejemplo 12.12, la solución general de la ecuación homogénea es

yh (x) = c1 e−x + c2 e−2x .


Por la Tabla 12.1, caso 1, la elección de una integral particular deberı́a ser yp = ke−2x , pero esto es una
solución de la ecuación homogénea. Por la receta (a) usamos por lo tanto

yp = kxe−2x .
320 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes

Entonces
yp = ke−2x − 2kxe−2x , yp = −4ke−2x + 4kxe−2x ,
de manera que
yp + 3yp + 2yp = −ke−2x
y esto es igual a 3e−2x si k = −3. Entonces yp = −3xe−2x y la solución general es

y(x) = yh (x) + yp (x) = c1 e−x + c2 e−2x − 3xe−2x .

EJEMPLO 12.14 Halle la solución general de la ecuación

y − 4y + 4y = e2x .


Por el Ejemplo 12.4, la ecuación caracterı́stica tiene la raı́z doble λ = 2, y la función complementaria es

yh (x) = (c1 + c2 x)e2x .

En este caso, por la receta (b), la función yp = ke2x se multiplica por x2 . Entonces

yp = kx2 e2x , yp = 2kxe2x + 2kx2 e2x , yp = 2ke2x + 8kxe2x + 4kx2 e2x ,

de manera que
yp − 4yp + 4yp = 2ke2x
y esto es igual a e2x si k = 1/2. La solución general es por lo tanto
 1 
y(x) = yh (x) + yp (x) = c1 + c2 x + x2 e2x .
2

12.9. Oscilaciones forzadas


Una ecuación importante en la teorı́a de oscilaciones forzadas en sistemas mecánicos
o eléctricos es la ecuación diferencial no homogénea

d2 x dx
m + c + kx = F0 cos ωt . (12.80)
dt2 dt
Esta es la ecuación del movimiento de un cuerpo sometido a la acción de la fuerza

d2 x dx
F=m = −kx − c + F0 cos ωt . (12.81)
dt2 dt
El término −kx nos indica que se trata de un oscilador armónico. El término −c dx/dt es
una ‘fuerza disipativa’ proporcional a la velocidad que representa, por ejemplo, la resis-
tencia al avance que encuentra el cuerpo al moverse en un fluido. El término F0 cos ωt es
una fuerza periódica externa que interactúa con el movimiento del oscilador. Por ejem-
plo, una fuerza q en presencia de un campo eléctrico experimenta una fuerza qE en la
dirección del campo. En el caso de un campo alterno, E = E0 cos ωt, la fuerza que actúa
12.9. Oscilaciones forzadas 321

sobre un electrón con carga q = −e, es −eE0 cos ωt. Si el electrón experimenta un mo-
vimiento armónico simple (en ausencia del campo) la fuerza total que actúa sobre él
es3

F = −kx − eE0 cos ωt . (12.82)

Esto es un ejemplo de (12.81) sin disipación, y es el caso que consideramos aquı́. Cuando
c = 0, la ecuación (12.80) tiene la forma

d2 x
+ ω02 x = A cos ωt , (12.83)
dt2

donde ω0 = k/m es la frecuencia angular del oscilador en ausencia de campo externo.
La cantidad ν0 = ω0 /2π se llama frecuencia natural del oscilador.
La solución general de la ecuación homogénea correspondiente a (12.83),

d2 x
+ ω20x = 0 ,
dt2
es (véase el Apartado 12.4)

xh (t) = d1 cos ω0 t + d2 sen ω0 t . (12.84)

Para la inhomogeneidad r(t) = A cos ωt en (12.83) tenemos la integral particular (caso 3


de la Tabla 12.1)

xp (t) = c cos ωt + d sen ωt .

Entonces
dxp d2 xp
= −ωc sen ωt + ωd cos ωt , = −ω 2 (c cos ωt + d sen ωt) ,
dt dt2
y

d 2 xp
+ ω02 xp = (ω02 − ω 2 )(c cos ωt + d sen ωt) .
dt2
Esto es igual a A cos ωt si d = 0 y c = A/(ω02 − ω 2 ). La integral particular es por lo tanto

A cos ωt
xp (t) = (12.85)
ω02 − ω 2

03. Euler expuso su solución al problema del oscilador armónico forzado ante la Academia de Cien-
cias de San Petersburgo el 30 de marzo de 1739.
322 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes

y la solución general de la ecuación (12.83) para el oscilador en el campo externo es

x(t) = xh (t) + xp (t)


A cos ωt (12.86)
= d1 cos ω0 t + d2 sen ω0 t + .
ω02 − ω 2

La solución muestra que el comportamiento del sistema depende fuertemente de los


valores relativos de ω y ω0 . En particular, cuando la frecuencia ω de la fuerza externa
es próxima a la frecuencia natural del oscilador, la amplitud máxima de la oscilación
(el valor máximo de x(t)) es grande y tiende a infinito si ω → ω0 . Este fenómeno de
grandes oscilaciones se denomina resonancia, y es un factor importante en el estudio de
la mecánica tanto clásica como cuántica.
En el caso resonante, cuando ω = ω0 , la función (12.85) no es una integral particular
adecuada porque ella misma es solución de la ecuación homogénea. La función que
corresponde es (por la receta (a) del Apartado 12.8)

xp (t) = t(c cos ω0 t + d sen ω0 t) . (12.87)

Sustituyendo en (12.83) nos da c = 0 y d = A/2πω0 , y la integral particular es en este


caso
A
xp (t) = t sen ω0 t . (12.88)
2ω0

La gráfica de esta función (Figura 12.9) muestra cómo en el caso resonante la ampli-
tud de la oscilación crece indefinidamente con el tiempo. En los sistemas mecánicos la
resonancia se puede evitar aplicando una fuerza disipativa adecuada.

Figura 12.9

12.10. Ejercicios
Apartado 12.2
1. Demuestre que e−2x y e2x/3 son soluciones particulares de la ecuación diferencial
3y + 4y − 4y = 0, y escriba la solución general.

2. Demuestre que e3x y xe3x son soluciones particulares de la ecuación diferencial


y − 6y + 9y = 0, y escriba la solución general.
12.10. Ejercicios 323

3. Demuestre que cos 2x y sen 2x son soluciones particulares de la ecuación diferencial


y + 4y = 0, y escriba la solución general.

Apartado 12.3
Halle la solución general de las ecuaciones diferenciales:
4. y − y − 6y = 0 5. 2y − 8y + 3y = 0 6. y − 8y + 16y = 0
7. 4y + 12y + 9y = 0 8. y + 4y + 5y = 0 9. y + 3y + 5y = 0

Apartado 12.4
Resuelva los problemas de valor inicial:

d2 x dx dx
10. + − 2x = 0 ; x(0) = 1 , (0) = 0
dt2 dt dt
d2 x dx dx
11. + 6 + 9x = 0 ; x(1) = 0 , (1) = 1
dt2 dt dt
d2 x dx
12. + 9x = 0 ; x(π/3) = 0 , (π/3) = −1
dt2 dt
d2 x dx dx
13. − 2 + 2x = 0 ; x(0) = 1 , (0) = 0
dt2 dt dt
Resuelva los problemas de contorno:

d2 y dy
14. + − 2y = 0 ; y(0) = 2 , y → 0 cuando x → ∞
dx2 dx
d2 y
15. + 9y = 0 ; y = 0 para x ≤ 0y x ≥ π
dx2

Apartado 12.5
16. Dado que la solución general de la ecuación de la ecuación del movimiento mẍ = −kx para el
oscilador armónico es x(t) = a cos ωt + b sen ωt, con ω = k/m,
1. demuestre que la solución puede escribirse en la forma x(t) = A cos (ωt − δ) donde A es la amplitud
y δ es el defasaje, y exprese A y δ en función de a y b;
2. halle la amplitud y el defasaje para las condiciones iniciales x(0) = 1 , ẋ(0) = ω.

Apartado 12.6
(i) Resuelva la ecuación de Schrödinger (12.44) para una partı́cula en un pozo con las condiciones
17. de contorno ψ(– l/2) = ψ(l/2) = 0.
(ii) Demuestre que las soluciones ψn son funciones pares de x cuando n es impar y funciones
impares cuando n es par.
(iii) Demuestre que las soluciones son las mismas que las dadas por (12.53) si se sustituye x por
x + l/2, salvo por un posible cambio de signo.

Apartado 12.7
18. Los diagramas de la figura 12.8 son la representación de los signos y nodos de las funciones de onda
reales (12.72). Dibuje los diagramas correspondientes a n = ±3 y n = ±4.
324 Capı́tulo 12. Ecuaciones diferenciales de segundo orden. Coeficientes constantes

19. Compruebe que la ecuación (12.72) y sus soluciones (12.74) se transforman en (12.60) y (12.63)
mediante el cambio de variable θ = x/r.

Apartado 12.8
Halle la solución general de las ecuaciones diferenciales:

20. y − y − 6y = 2 + 3x 21. y − 8y + 16y = 1 − 4x3


22. y − y − 6y = 2e−3x 23. y − y − 2y = 3e−x
 
24. y − 8y + 16y = e 4x
25. y − y − 6y = 2 cos 3x
26. y + 4y = 3 sen 2x 27. y − y − 6y = 2 + 3x + 2e−3x + 2 cos 3x

Apartado 12.9
28. Un circuito RLC consiste en una resistencia (con resistencia R), una bobina de inducción (con induc-
tancia L) y un condensador (con capacidad C) conectados en serie con una fuente de f.e.m. E.
1. Utilice la ley del voltaje de Kirchhoff (Apartado 11.7) para demostrar que la corriente I(t) en el
circuito viene dada por la ecuación no homogénea

d2 I dI I dE
L +R + = .
dt2 dt C dt
2. Halle la solución de la ecuación homogénea (para E = 0), y confirme que decae exponencialmente
cuando t → ∞.
3. Demuestre que una integral particular para la f.e.m. periódica E(t) = E0 sen ωt es

Ip (t) = I0 sen (ωt − δ) ,


E0 S 1 √
donde I0 = √ , tg δ = y S = ωL − . (La cantidad R2 + S2 es la impedancia del
R2 +S 2 R ωC
circuito.)
 Ecuaciones diferenciales de
segundo orden.
Algunas funciones especiales

13.1. Conceptos

Hemos visto en los Apartados 12.5 a 12.7 como tres problemas fı́sicos muy dife-
rentes se modelan mediante la misma ecuación diferencial: la ecuación (12.35) para el
oscilador armónico clásico como problema de valor inicial, la misma ecuación (12.47)
para una partı́cula mecánico-cuántica en un pozo como problema de contorno, y
(12.62) para una partı́cula mecánico-cuántica en un aro como problema de contorno pe-
riódico. Éste es un fenómeno común en el modelado matemático de los sistemas fı́sicos,
y varias ecuaciones son suficientemente importantes como para tener nombre. Algunas
se presentan en la Tabla 13.1

Tabla 13.1

Nombre Ecuación

Legendre (1 − x2 )y − 2xy + l(l + 1)y = 0

Legendre asociada (1 − x2 )y − 2xy + [l(l + 1) − m2 /(1 − x2 )]y = 0

Hermite y − 2xy + 2ny = 0


Laguerre xy + (1 − x)y + ny = 0

Laguerre asociada xy + (m + 1 − x)y + (n − m)y = 0

Bessel x2 y + xy + (x2 − n2 )y = 0

Las ecuaciones de la Tabla 13.1 son todas ecuaciones de segundo orden lineales con
coeficientes variables, y tienen soluciones particulares que juegan un papel importante en
las matemáticas de las ciencias fı́sicas. Estas soluciones se llaman a menudo funciones
especiales.
Los métodos estándar utilizados para resolver las ecuaciones de la Tabla 13.1, y mu-
chas otras ecuaciones diferenciales lineales en ciencias, son el método de series de po-
326 Capı́tulo 13. Ecuaciones diferenciales de segundo orden. Algunas funciones especiales

tencias, que describimos en el Apartado 13.2, y el método más general de Frobenius,


perfilado en el Apartado 13.3. El primero lo usamos en el Apartado 13.4 para obtener
las soluciones particulares de la ecuación de Legendre que tienen sentido fı́sico. Éstas
soluciones se llaman polinomios de Legendre y aparecen siempre que se formula un
problema en tres dimensiones usando coordenadas esféricas. Los demás apartados se
dedican a dar únicamente breves descripciones de las otras funciones especiales que son
soluciones de las ecuaciones presentadas en la Tabla 13.1.

13.2. El método de series de potencias


Muchas ecuaciones lineales de segundo orden importantes

y + p(x)y + q(x)y = r(x) (13.1)

tienen al menos una solución particular que puede expresarse como serie de potencias



y(x) = a0 + a1 x + a2 x + a3 x + · · · =
2 3
am x m . (13.2)
m=0

Se sustituye la serie en la ecuación diferencial para determinar los números a0 , a1 , a2 , . . . ,


y las soluciones particulares se obtienen para un sistema fı́sico aplicando las condiciones
iniciales o de contorno adecuadas.
El método de series de potencias puede usarse cuando p(x), q(x) y r(x) son polinomios
o cuando pueden desarrollarse en series de potencias de x. Puede por lo tanto usarse
para resolver las ecuaciones de Legendre, asociada de Legendre y de Hermite (las dos
primeras se transforman a la forma estándar (13.1) dividiendo por (1 − x2 )).
Mostramos el método de series de potencias en los Ejemplos 13.1 y 13.2 resolvien-
do dos ecuaciones cuya solución ya conocemos: una ecuación de primer orden en el
Ejemplo 13.1 y una ecuación de segundo orden en el Ejemplo 13.2.

EJEMPLO 13.1 Use el método de series de potencias para resolver la ecuación


dy
+y=0
dx
cuya solución es y = ae−x (véase el Ejemplo 11.3(ii) con k = −1).
Por la ecuación (13.2), expresamos la solución como la serie de potencias


y = a0 + a1 x + a2 x2 + a3 x3 + · · · = am xm .
m=0

Entonces
dy ∞
= a1 + 2a2 x + 3a3 x2 + · · · = mam xm−1 ,
dx m=1
y, sustituyéndolo en la ecuación diferencial,
dy
+ y = (a1 + 2a2 x + 3a3 x2 + · · · ) + (a0 + a1 x + a2 x2 + · · · )
dx
= (a1 + a0 ) + (2a2 + a1 )x + (3a3 + a2 )x2 + · · ·
13.2. El método de series de potencias 327

Para que esto se anule para todo valor de x (dentro del radio de convergencia de la serie) los coeficientes de
cada potencia de x deben ser cero:

a1 + a0 = 0 , 2a2 + a1 = 0 , 3a3 + a2 = 0 , . . .

de manera que
a1 a0 a2 a0
a1 = −a0 , a2 = − =+ , a3 = − = − , ...
2 2! 3 3!
(– 1)m a0
y, en general, am = . Por lo tanto,
m!

∞ ∞
a0 (– 1)m xm ∞
(– x)m
y= am xm = = a0 .
m=0 m=0
m! m=0
m!

Reconocemos esta serie infinita como el desarrollo en serie de potencias de la función e−x :

x2 x3  (– x)m

e−x = 1 − x + − + ··· = .
2! 3! m=0
m!

Por lo tanto y = a0 e−x , siendo a0 una constante arbitraria.

EJEMPLO 13.2 Use el método de series de potencias para resolver la ecuación1


d2 y
+y=0
dx2
cuya solución es y = c cos x + d sen x (véase la ecuación (12.22) con ω = 1).
Por la ecuación (13.2), tenemos

∞ 
∞ 

y= am xm , y = mam xm−1 , y = m(m − 1)am xm−2 .
m=0 m=1 m=2

Podemos expresar


y = m(m − 1)am xm−2 = (2 × 1)a2 + (3 × 2)a3 x + (4 × 3)a4 x2 + · · ·
m=2


= (m + 2)(m + 1)am+2 xm .
m=0

Entonces

∞ 

y + y = am xm + (m + 2)(m + 1)am+2 xm
m=0 m=0
∞
= [am + (m + 2)(m + 1)am+2 ]xm
m=0

01. Leibniz descubrió la ecuación diferencial para la función seno en 1693 mediante un argumento
geométrico. Resolvió entonces la ecuación por un método equivalente al presentado en este ejemplo para
obtener la representación en series de potencias de la función. La posibilidad de representar funciones como
series de potencias fue un elemento vital en el desarrollo del cálculo tanto por parte de Leibniz como de
Newton.
328 Capı́tulo 13. Ecuaciones diferenciales de segundo orden. Algunas funciones especiales

y esto es cero si, por su parte, el coeficiente de cada potencia de x es cero:


am + (m + 2)(m + 1)am+2 = 0 .
Para los valores de m pares
a0 a2 a0 a4 a0
a2 = − , a4 = − =+ , a6 = − = − , ...
2×1 4×3 4! 6×5 6!
y para los valores impares de m
a1 a1 a3 a1 a5 a1
a3 = − =− , a5 = − =+ , a7 = − = − , ...
3×2 3! 5×5 5! 7×6 7!
Por lo tanto
y = [a0 + a2 x2 + a4 x4 + · · · ] + [a1 x + a3 x3 + a5 x5 + · · · ]
   
x2 x4 x6 x3 x5 x7
= a0 1 − + − + · · · + a1 x − + − + ··· .
2! 4! 6! 3! 5! 7!
Reconocemos en las dos series entre corchetes los desarrollos en serie de potencias de cos x y sen x. Por lo
tanto y = a0 cos x + a1 sen x, donde a0 y a1 son constantes arbitrarias.

13.3. El método de Frobenius


El método de Frobenius2 es una extensión del método de series de potencias utili-
zado para resolver ecuaciones lineales de segundo orden que pueden ser escritas en la
forma
b(x)  c(x)
y + y + 2 y = 0, (13.3)
x x
donde b(x) = xp(x) y c(x) = x2 q(x) son polinomios o pueden desarrollarse en series de
potencias de x. Incluye como caso particular el método de series de potencias sencillo
que hemos tratado en el apartado anterior y puede usarse para todas las ecuaciones de
la Tabla 13.1, y para muchas de las ecuaciones lineales en ciencias. Sólo damos aquı́ un
breve resumen de este método.
Toda ecuación diferencial de la forma (13.3) tiene al menos una solución que puede
expresarse como



y(x) = xr (a0 + a1 x + a2 x2 + a3 x3 + · · · ) = xr am x m (13.4)


m=0

donde r (que puede ser cero) es un parámetro indicial por determinar y a0 = 0. Vamos
a tratar primero el caso b(x) = b0 , c(x) = c0 , donde b0 y c0 son constantes:

x2 y + b0 xy + c0 y = 0 (ecuación de Euler-Cauchy) (13.5)

02. Georg Frobenius (1849-1917), matemático alemán, también conocido por su trabajo en álgebra
matricial. Organizó en 1878 en una monografı́a la teorı́a de matrices en su forma actual.
13.3. El método de Frobenius 329

(hemos multiplicado la ecuación por x2 , por conveniencia). Tenemos


 
y = x r a0 + a 1 x + · · ·
 
y = xr−1 ra0 + (r + 1)a1 x + · · · (13.6)
 
y = xr−2 r(r − 1)a0 + (r + 1)ra1 x + · · ·

y sustituyendo en (13.5) obtenemos


 
xr r(r − 1)a0 + (r + 1)ra1 x + · · ·
   
+ b0 xr ra0 + (r + 1)a1 x + · · · + c0 xr a0 + a1 x + · · · = 0 . (13.7)

En esta ecuación, el coeficiente de cada potencia de x tiene que ser cero de manera que,
para el coeficiente de xr ,

r(r − 1) + b0 r + c0 = 0 . (13.8)

Esto se denomina ecuación indicial, y sus raı́ces son los valores posibles del parámetro
r en (13.4).

EJEMPLOS 13.3 Ecuaciones indiciales para ecuaciones de Euler-Cauchy

1 1
(i) x2 y − xy + y = 0
2 2
r 1
La ecuación indicial es r(r − 1) − + = 0 con raı́ces r1 = 1 y r2 = 1/2.
2 2
(ii) x2 y − xy + y = 0
La ecuación indicial es r(r − 1) − r + 1 = (r − 1)2 = 0 con raı́z doble r1 = r2 = 1.
(iii) x2 y + xy + y = 0
La ecuación indicial es r(r − 1) + r + 1 = 0 con raı́ces complejas ±i.

Cuando en (13.3) b(x) y c(x) no son constantes, b0 y c0 son, respectivamente, los términos
constantes de sus desarrollos en potencias de x.
Una vez determinados los valores del parámetro indicial, la resolución de la ecuación
diferencial puede seguir como en el método de series de potencias. La solución general
es

y(x) = c1 y1 (x) + c2 y2 (x) (13.9)

donde c1 y c2 son constantes arbitrarias, e y1 (x) e y2 (x) son soluciones particulares inde-
pendientes. Al menos una de las dos, y1 (x) o y2 (x), tiene la forma (13.4) y la otra depende
de las soluciones de la ecuación indicial, r1 y r2 . Tenemos los tres casos siguientes.
330 Capı́tulo 13. Ecuaciones diferenciales de segundo orden. Algunas funciones especiales

1 Raı́ces distintas que no difieren en un entero

Tanto y1 como y2 tienen la forma (13.4),

y1 (x) = xr (a0 + a1 x + a2 x2 + · · · ) ,
1
(13.10a)

y2 (x) = xr (A0 + A1 x + A2 x2 + · · · ) .
2
(13.10b)

2 Raı́z doble

Si r1 = r2 = r, una solución tiene la forma (13.4),

y1 (x) = xr (a0 + a1 x + a2 x2 + · · · ) , (13.11a)

y la otra solución es

y2 (x) = y1 (x) ln x + xr+1 (A0 + A1 x + A2 x2 + · · · ) . (13.11b)

3 Raı́ces que difieren en un entero

Una solución tiene la forma (13.4),

y1 (x) = xr (a0 + a1 x + a2 x2 + · · · ) ,
1
(13.12a)

y la otra solución es

y2 (x) = ky1 (x) ln x + xr (A0 + A1 x + A2 x2 + · · · ) ,


2
(13.12b)

en la cual r1 > r2 y la constante k puede ser cero.

13.4. La ecuación de Legendre


La ecuación de Legendre es

(1 − x2 )y − 2xy + l(l + 1)y = 0 , (13.13)

siendo l un número real. Esta ecuación aparece siempre que se formula un problema
fı́sico en tres dimensiones usando coordenadas esféricas r, θ y φ (véase el Apartado
10.2), en cuyo caso la variable x se sustituye por cos θ. Son de interés en las ciencias
fı́sicas las soluciones finitas en el intervalo −1 ≤ x ≤ +1 (correspondiendo a 0 ≤ θ ≤
π).
La ecuación (13.13) puede resolverse por el método de series de potencias del modo
descrito en el Ejemplo 13.2. Se sustituyen en (13.13) la serie de potencias

y= am x m = a0 + a1 x + a 2 x 2 + · · · (13.14)
m
13.4. La ecuación de Legendre 331

y sus derivadas y e y . Entonces, igualando a cero el coeficiente de cada potencia de x


se obtiene la relación de recurrencia
m(m + 1) − l(l + 1) (l − m)(l + m + 1)
am+2 = am = − am . (13.15)
(m + 1)(m + 2) (m + 1)(m + 2)

Para los valores pares de m

l(l + 1) (l − 2)(l + 3) (l − 2)l(l + 1)(l + 3)


a2 = − a0 , a4 = − a2 = + a0 , . . .
2 3×4 4!
De manera similar, para los valores impares de m

(l − 1)(l + 2) (l − 3)(l − 1)(l + 2)(l + 4)


a3 = − a1 , a5 = + a1 , . . .
3! 5!
Una solución en serie de potencias de la ecuación es por lo tanto

y(x) = a0 y1 (x) + a1 y2 (x) , (13.16)

con a0 y a1 constantes arbitrarias e

l(l + 1) 2 (l − 2)l(l + 1)(l + 3) 4


y1 (x) = 1 − x + x − ··· (13.17)
2! 4!

(l − 1)(l + 2) 3 (l − 3)(l − 1)(l + 2)(l + 4) 5


y2 (x) = x − x + x − ··· (13.18)
3! 5!
La serie y1 tiene únicamente potencias pares de x, la serie y2 únicamente potencias im-
pares.

Convergencia
Consideramos primero el caso de valores de l no enteros. Ambas series tienen radio
de convergencia R = 1 para valores de l arbitrarios. En efecto, por la ecuación (13.15)
la razón de dos términos consecutivos es
am m(m + 1) − l(l + 1)
= → 1 cuando m → ∞
am+2 (m + 1)(m + 2)

de manera que por el criterio del cociente de d’Alembert para series de potencias (7.17),
ambas series convergen si |x| < 1 y divergen si |x| > 1 (salvo que l sea un entero, ver
más abajo). Ambas series también divergen si x = ±1 (x2 = 1). La función (13.16), con
dos constantes arbitrarias, es por lo tanto la solución general de la ecuación de Legendre
en el intervalo −1 < x < 1. Es posible también hallar una solución en potencias inversas
de x que es válida para |x| > 1.
332 Capı́tulo 13. Ecuaciones diferenciales de segundo orden. Algunas funciones especiales

Polinomios de Legendre
La función (13.17) queda reducida a un polinomio de grado l si l es un entero par
o cero. Por ejemplo, si l = 2, la serie se termina después del segundo término para
dar y1 (x) = 1 − 3x2 . Entonces, tomando a1 = 0 en (13.16) se obtiene una solución
particular para valores de l pares que es finita para todo valor de x. Igualmente, la función
(13.18) queda reducida a un polinomio de grado l si l es un entero impar, y tomando
a0 = 0 en (13.16) se obtiene una solución particular que es válida para todo valor de
x. Las mismas ideas se aplican para valores enteros de l negativos, pero el conjunto
de polinomios que resulta es idéntico al obtenido para cero y valores positivos. Estas
soluciones particulares se llaman polinomios de Legendre Pl (x), y son las soluciones
de la ecuación de Legendre de interés en las ciencias fı́sicas.3 Por convenio, la constante
arbitraria no nula de (13.16) se escoge de manera que Pl (1) = 1. Entonces, para l =
0, 1, 2, 3, . . . , tenemos

1 · 3 · 5 · · · (2l − 1)
Pl (x) =
l!
 
l(l − 1) l−2 l(l − 1)(l − 2)(l − 3) l−4
× x − l
x + x − ··· (13.19)
2(2l − 1) 2 · 4(2l − 1)(2l − 3)

y hay que seguir la serie hasta llegar al término constante. Los primeros de estos polino-
mios son
P0 (x) = 1 , P1 (x) = x ,
1 1
P2 (x) = (3x2 − 1) , P3 (x) = (5x3 − 3x) , (13.20)
2 2
1 1
P4 (x) = (35x4 − 30x2 + 3) , P5 (x) = (63x5 − 70x3 + 15x) .
8 8

EJEMPLO 13.4 Demuestre que el polinomio P3 (x) es una solución de la ecuación de Legendre (13.13)
para l = 3.

Tenemos
1 3 3 2
y = P3 (x) = (5x − 3x) , y = (5x − 1) , y = 15x .
2 2

03. Adrien-Marie Legendre (1752-1833) tiene el dudoso merecimiento de la siguiente nota al pie en
el libro Hombres de matemáticas de E. T. Bell: ‘Consideraciones de espacio me impiden dar una visión de
su vida. Sus mejores trabajos fueron en muchos casos superados o evitados por matemáticos más jóvenes’.
Los polinomios aparecieron en las Recherches sur l’attraction des sphéroı̈des homogènes de Legendre en
1785 como los coeficientes del desarrollo de la función potencial (1 − 2h cos θ + h2 )−1/2 en potencias
de h. Su libro de texto Éléments de géométrie de 1794 hizo mucho por la reforma de la enseñanza de la
geometrı́a (hasta entonces basada en Euclides) y una edición americana, ‘el Legendre de Davies’ (1851),
fue influyente en los Estados Unidos.
13.4. La ecuación de Legendre 333

Por lo tanto, para l = 3,

3 1
(1 − x2 )y − 2xy + l(l + 1)y = (1 − x2 ) × 15x − 2x × (5x2 − 1) + 3 × 4 × (5x3 − 3x)
2 2
= (– 15 − 15 + 30)x3 + (15 + 3 − 18)x = 0 .

Los polinomios de Legendre cumplen la relación de recurrencia

(l + 1)Pl+1 (x) − (2l + 1)xPl (x) + lPl−1 (x) = 0 (13.21)

de manera que dados P0 (x) = 1 y P1 (x) = x, se deducen todos los polinomios siguientes.

EJEMPLO 13.5 Use la relación de recurrencia (13.21) para hallar P2 (x) y P3 (x).
Para l = 1 la relación (13.21) es 2P2 − 3xP1 + P0 = 0. Por lo tanto,

1 1
P2 = (3xP1 − P0 ) = (3x2 − 1) .
2 2
Para l = 1 la relación (13.21) es 3P3 − 5xP2 + 2P1 = 0. Por lo tanto,

1 1 1 1
P3 = (5xP2 − 2P1 ) = 5x × (3x2 − 1) − 2x = (5x3 − 3x) .
3 3 2 2

Funciones asociadas de Legendre


La ecuación asociada de Legendre es (véase la Tabla 3.1)
 
m2
(1 − x )y − 2xy + l(l + 1) −
2  
y = 0. (13.22)
(1 − x2 )

Como en la ecuación de Legendre (m = 0), en las aplicaciones fı́sicas la variable x se


identifica con cos θ. En este caso, las soluciones obtenidas por el método de series de
potencias convergen en el intervalo −1 ≤ x ≤ 1 si l y m son ambos enteros, con |m| ≤ l:

l = 0, 1, 2, 3, . . . m = 0, ±1, ±2, . . . , ±l . (13.23)

Las correspondientes soluciones particulares se llaman funciones asociadas de Legen-


dre P|m|
l (x). Están relacionadas con los polinomios de Legendre mediante la fórmula

d|m|
P|m|
l (x) = (1 − x )
2 |m|/2
Pl (x) (13.24)
dx|m|
con P0l = Pl .
334 Capı́tulo 13. Ecuaciones diferenciales de segundo orden. Algunas funciones especiales

EJEMPLO 13.6 Use la fórmula (13.24) para obtener las funciones asociadas de Legendre Pm3 (x) para
m = 1, 2 y 3, y expréselas como funciones θ si x = cos θ y (1 − x2 )1/2 = sen θ.
Tenemos
1 3 3 2
y = P3 (x) = (5x − 3x) , y = (5x − 1) , y = 15x , y = 15 .
2 2
Entonces
3 3
P13 (x) = (1 − x2 )1/2 (5x2 − 1) , P13 ( cos θ) = sen θ(5 cos2 θ − 1) ,
2 2
P23 (x) = 15(1 − x2 )x , P23 ( cos θ) = 15 sen2 θ cos θ ,

P33 (x) = 15(1 − x2 )3/2 , P33 ( cos θ) = 15 sen3 θ .

Ortogonalidad y normalización
Vimos en el Apartado 12.6 que las soluciones de la ecuación de Schrödinger para una
partı́cula en un pozo son funciones ortogonales (ecuación (12.58)). La ortogonalidad es
una propiedad que cumplen las soluciones de un tipo de ecuaciones diferenciales lineales
llamadas ecuaciones de Sturm-Liouville que incluye a la ecuación de Legendre. Los
polinomios de Legendre son ortogonales en el intervalo −1 ≤ x ≤ 1:

+1

Pl (x)Pl (x) dx = 0 si l = l . (13.25)


−1

EJEMPLO 13.7 Demuestre que P1 es ortogonal (a) a P2 y (b) a P3 .


1 2 1
Tenemos P1 (x) = 1, P2 (x) = (3x − 1), P3 (x) = (5x3 − 3x). Entonces
2 2

+1
 +1   
1 +1 3 1 3x4 x2 1 3 1 3 1
(a) P1 (x)P2 (x) dx = (3x − x) dx = − = − − − = 0.
−1 2 −1 2 4 2 −1 2 4 2 4 2

En este caso, P1 (x) es una función impar de x mientras que P2 (x) es una función par. El integrando es impar
y la integral es cero (véase el Apartado 5.3).

+1

1 +1 1 5 +1 1 
(b) P1 (x)P3 (x) dx = (5x4 − 3x2 ) dx = x − x3 = 0 − 0 = 0.
−1 2 −1 2 −1 2

En este caso tanto P1 como P3 son funciones impares de manera que la ortogonalidad de las funciones es
una propiedad nueva y no una consecuencia de la paridad/imparidad.

Para las funciones asociadas de Legendre la propiedad correspondiente es



+1

P|m| |m|
l (x)Pl (x) dx = 0 si l = l . (13.26)
−1
13.5. La ecuación de Hermite 335

Además, si l = l ,

+1 2 2 (l + |m|)!
P|m|
l (x) dx = (13.27)
−1 (2l + 1) (l − |m|)!

y este resultado se usa para construir el conjunto de funciones asociadas de Legendre


normalizadas (o polinomios de Legendre normalizados si m = 0),

(2l + 1) (l − |m|)! |m|
Θl,m (x) = P (x) , (13.28)
2 (l + |m|)! l

con la propiedad


+1
1 si l = l ,
Θl,m (x)Θl ,m (x) dx = δl,l = (13.29)
−1 0 si l = l .

Tomando x = cos θ, estas funciones son parte de la solución de la ecuación de Schrödin-


ger para el átomo de hidrógeno (apartado 14.6).

13.5. La ecuación de Hermite


La ecuación de Hermite es

y − 2xy + 2ny = 0 (13.30)

con n un entero. La ecuación aparece en la resolución de la ecuación de Schrödinger


para el oscilador armónico. Se resuelve por el método de potencias y la solución general
es

y(x) = a0 y1 (x) + a1 y2 (x) ,

en la cual la solución particular y1 tiene únicamente potencias pares de x e y2 únicamente


potencias impares de x. Ambas soluciones particulares convergen para todo valor de x,
2
y si n no es un entero positivo ni cero, se comportan como ex para x grande. Como en el
caso de la ecuación de Legendre, y1 se reduce a un polinomio de grado n si n es un entero
par (positivo), y de forma similar para y2 si n es un entero impar. Estos polinomios se
llaman polinomios de Hermite Hn (x), y son las soluciones de la ecuación de Hermite
de interés en las ciencias fı́sicas:
n(n − 1) n(n − 1)(n − 2)(n − 3)
Hn (x) = (2x)n − (2x)n−2 + (2x)n−4 − · · · (13.31)
1! 2!
con n = 0, 1, 2, 3, . . . Los primeros de estos polinomios son
336 Capı́tulo 13. Ecuaciones diferenciales de segundo orden. Algunas funciones especiales

H0 (x) = 1 , H1 (x) = 2x ,
H2 (x) = 4x2 − 2 , H3 (x) = 8x3 − 12x , (13.32)
H4 (x) = 16x4 − 48x2 + 12 , H5 (x) = 32x5 − 160x3 + 120x .

Los polinomios de Hermite cumplen la relación de recurrencia

Hn+1 (x) − 2xHn (x) + 2nHn−1 (x) = 0 (13.33)

de manera que dados H0 = 1 y H1 = 2x, se deducen todos los polinomios siguientes.

Funciones de Hermite

Una ecuación diferencial relacionada con la ecuación de Hermite es

y + (1 − x2 + 2n)y = 0 . (13.34)

Se resuelve con el cambio

y(x) = e−x /2 v(x)


2
(13.35)

que tiene por derivada segunda

y = e−x /2 [v − 2xv − (1 − x2 )] .


2

Sustituyendo y y su derivada segunda en (13.35) nos da

e−x /2 [v − 2xv + 2nv] = 0 .


2

La expresión entre corchetes es el primer miembro de la ecuación de Hermite (13.30),


de manera que las funciones de Hermite

yn (x) = e−x /2 Hn (x) , n = 0, 1, 2, 3, . . .


2
(13.36)

son soluciones particulares de (13.34). Estas funciones son finitas para todo valor de x y
ortogonales, cumpliendo la propiedad

+∞ +∞

ym (x)yn (x) dx = e−x Hm (x)Hn (x) dx = 2n n! πδm,n .
2
(13.37)
−∞ −∞

Las funciones de Hermite tienen importancia en quı́mica por ser las autofunciones del
problema mecánico-cuántico del oscilador armónico. Las gráficas de las tres primeras
funciones (normalizadas) se muestran en la Figura 13.1.
13.6. La ecuación de Laguerre 337

Figura 13.1

2 √ 
EJEMPLO 13.8 Demuestre que la función de Hermite e−αx /2 Hn ( αx), siendo α = km/2 , es una
solución de la ecuación de Schrödinger para el oscilador armónico
2 d 2 ψ 1
− 2
+ kx2 ψ = Eψ .
√ √ 2m dx 2
Sea z = αx. Entonces para ψ = ψ( αx) = ψ(z),
dψ dψ dz √ dψ √ d2 ψ
= = α = α ψ , = αψ  .
dx dz dx dz dx2
Con esto
2 k 2
− αψ  + z ψ = Eψ .
2m 2α 
Dividiendo ambos miembros por − α/2m y recordando que α = mω/, donde ω = k/m es la fre-
2

cuencia angular del oscilador, obtenemos


1
ψ  + (1 − z2 + 2n)ψ = 0 si E = (n + )ω , n = 0, 1, 2, 3, . . .
2
Esta ecuación diferencial es idéntica a la ecuación (13.34). Las funciones de Hermite son por lo tanto las
autofunciones del problema del oscilador armónico en mecánica cuántica.

13.6. La ecuación de Laguerre


La ecuación de Laguerre4

xy + (1 − x)y + ny = 0 , (13.38)

donde n es un número real, tiene una solución en serie de potencias que, si n es un entero
positivo o cero, es un polinomio de grado n llamado polinomio de Laguerre Ln (x):
 
n2 n−1 n2 (n − 1)2 n−2
Ln (x) = (– 1) x − x +
n n
x − · · · + (– 1) n!
n
(13.39)
1! 2!

04. Edmond Laguerre (1834-1886).


338 Capı́tulo 13. Ecuaciones diferenciales de segundo orden. Algunas funciones especiales

con n = 0, 1, 2, 3, . . . Los primeros son

L0 (x) = 1 , L1 (x) = 1 − x ,
(13.40)
L2 (x) = 2 − 4x + x2 , L3 (x) = 6 − 18x + 9x2 − x3 .

Los polinomios de Laguerre cumplen la relación de recurrencia

Ln+1 (x) − (1 + 2n − x)Ln (x) + n2 Ln−1 (x) = 0 (13.41)

a partir de la cual, dados L0 y L1 , se pueden obtener todos los demás polinomios.

Funciones asociadas de Laguerre


La ecuación asociada de Laguerre es

xy + (m + 1 − x)y + (n − m)y = 0 (13.42)

y tiene soluciones polinómicas cuando n y m son ambos enteros positivos o cero, sien-
do m ≤ n. Esas soluciones son los polinomios asociados de Laguerre Lnm (x). Están
relacionados con los polinomios de Laguerre mediante la expresión diferencial

dm
Lnm (x) = Ln (x) . (13.43)
dxm
Los polinomios asociados de Laguerre aparecen en la resolución de la parte radial de la
ecuación de Schrödinger para el átomo de hidrógeno (Apartado 14.6), y lo hacen bajo la
forma de funciones asociadas de Laguerre

fn,l (x) = e−x/2 xl Ln+l


2l+1
(x) (13.44)

siendo n = 1, 2, 3, . . . , l = 0, 1, 2, . . . , (n − 1). Estas funciones satisfacen la ecuación


diferencial

2 n l(l + 1) 1
f  + f  + − − f =0 (13.45)
x x x2 4

y son ortogonales con respecto a la función peso x2 en el intervalo 0 ≤ x ≤ ∞:





fn,l (x)fn ,l (x) x dx =
2
e−x x2l Ln+l
2l+1
(x)Ln2l+1 2
 ,l (x) x dx
0 0

2n{(n + l)!}
3

= δn,n . (13.46)
(n − l − 1)!
13.7. Funciones de Bessel 339

13.7. Funciones de Bessel


La ecuación de* Bessel es5

x2 y + xy + (x2 − n2 )y = 0 (13.47)

siendo n un número real. Esta ecuación tiene en las ciencias fı́sicas la misma importancia
que la de Legendre, si bien aparece menos frecuentemente en quı́mica que en fı́sica y en
ingenierı́a. Las funciones de Bessel se dan, por ejemplo, en las soluciones de la ecuación
de ondas clásica para las vibraciones de una membrana circular o esférica, y las mismas
soluciones se encuentran para la ecuación de Schrödinger para una partı́cula en un pozo
circular o en un pozo esférico. Las funciones son importantes en la formulación de la
teorı́a de los procesos de difusión.
Una vez dividida por x2 , la ecuación (13.47) es del tipo (13.3) y se resuelve por el
método de Frobenius, es decir, expresando la solución en la forma (13.4)

y(x) = xr (a0 + a1 x + a2 x2 + · · · ) .

Se demuestra que los valores posibles de r son r = ±n, y las dos soluciones particulares
para esos valores de r son

x2 x4
y1 (x) = a0 x 1 −
n
+ − ··· , (13.48)
2(2n + 2) 2 · 4(2n + 2)(2n + 4)

x2 x4
y2 (x) = a0 x −n
1+ + + ··· . (13.49)
2(2n − 2) 2 · 4(2n − 2)(2n − 4)

Los valores importantes del parámetro n son los valores enteros y los semienteros.

Funciones de Bessel Jn (x) para n entero


Si n es un entero positivo o cero, la solución particular (13.48) es
 n 
∞  2m
x (– 1)m x
Jn (x) = , (13.50)
2 m=0 m! (n + m)! 2

0* ‘En esta ocasión


‘Nos las hemos de ver
‘Con una famosa función
‘Debida a Herr Bessel.’
05. Friedrich Wilhelm Bessel (1784-1864), astrónomo alemán. Daniel Bernoulli, Euler y Lagran-
ge trataron ejemplos de funciones de Bessel, pero el primer estudio sistemático apareció en 1824 en un
artı́culo de Bessel sobre perturbaciones de órbitas planetarias. Es sabido que Bessel fue el destinatario de
numerosas cartas de su buen amigo Gauss, quien le escribió en 1810: ‘Este invierno estoy dando clases de
dos asignaturas a tres estudiantes, de los cuales uno está sólo moderadamente preparado, el otro menos que
moderadamente, y el tercero carece por igual de preparación y de aptitud. Tales son las cargas . . . ’
340 Capı́tulo 13. Ecuaciones diferenciales de segundo orden. Algunas funciones especiales

donde hemos asignado a la constante a0 el valor convencional a0 = 1/2n n!. Ésta es


la función de Bessel de primera especie de orden n. La función es finita y converge
para todo valor de x: converge muy rápidamente debido a la pareja de factoriales en el
denominador. Las funciones para n = 0 y n = 1 son

1 x 2 1 x 4 1 x 6
J0 (x) = 1 − + − + ··· (13.51)
(1!)2 2 (2!)2 2 (3!)2 2

x 1 x 3 1 x 5 1 x 7
J1 (x) = − 2+ − + ··· (13.52)
2 1! 2! 2 2! 3! 2 3! 4! 2
y mostramos sus gráficas en la Figura 13.2

Figura 13.2

Tanto los desarrollos como las gráficas muestran que las funciones de Bessel tienen
propiedades similares a las de las funciones trigonométricas. Sin embargo, los ceros de
las funciones, los valores de x para los cuales Jn (x) = 0, no están igualmente espaciados
de manera que las funciones no tienen una longitud de onda determinada. Algunos de
los ceros son (con 3 cifras decimales)

J0 (x) = 0 para x = 2,405; 5,520; 8,654; 11,792; 14,931; . . .


(13.53)
J1 (x) = 0 para x = 0; 3,832; 7,016; 10,173; 13,324; . . .

Además, la amplitud de las ondas decrece al crecer x.


El comportamiento para valores de x grandes es el de una función seno amortiguada,

2 nπ π
Jn (x) ∼ sen x − + , para x grande. (13.54)
πx 2 4

Para valores de n positivos la solución particular (13.49) es J−n (x) y puede demostrarse
que está relacionada con Jn (x) mediante J−n (x) = (– 1)n Jn (x). El método de series de po-
tencias proporciona por lo tanto una única solución particular para valores de n enteros.
13.8. Ejercicios 341

Se puede hallar una segunda solución: es la función de Bessel de segunda especie Yn (x),
de menor importancia en aplicaciones fı́sicas.

Funciones de Bessel Jl+1/2 (x) de orden semientero


Las funciones de Bessel de orden semientero pueden expresarse mediante funciones
elementales. Las funciones para n = ±1/2 son
 
2 2
J1/2 (x) = sen x , J−1/2 (x) = cos x , (13.55)
πx πx

y todas las demás pueden obtenerse por la relación de recurrencia (válida para funciones
de Bessel en general)

2n
Jn+1 (x) − Jn (x) + Jn−1 (x) = 0 . (13.56)
x

EJEMPLO 13.9 Use la relación de recurrencia (13.56) y las fórmulas (13.55) para deducir las funciones
de Bessel J±3/2 (x).

A partir de (13.56), con n = 1/2, tenemos

1
J3/2 (x) − J1/2 (x) + J−1/2 = 0
x

de manera que

1 2 sen x
J3/2 (x) = J1/2 (x) − J−1/2 (x) = − cos x .
x πx x
De manera similar, tomando n = −1/2 en (13.56),

1 2 cos x
J−3/2 (x) = − J−1/2 (x) − J1/2 (x) = − + sen x .
x πx x

Las funciones de órdenes semienteros son las funciones de Bessel que aparecen en el
método de ondas parciales en la teorı́a de procesos de difusión. En ese caso se presentan
en la forma
 
π π
jl (x) = Jl+1/2 (x) , ηl (x) = (– 1) l+1
J−l−1/2 (x) , (13.57)
2x 2x

con l ≥ 0. Las funciones jl se llaman funciones de Bessel esféricas de orden l, las fun-
ciones ηl son las funciones de Neumann esféricas. Estas funciones aparecen a menudo
junto con los polinomios de Legendre cuando se formula un sistema fı́sico en coordena-
das esféricas.
342 Capı́tulo 13. Ecuaciones diferenciales de segundo orden. Algunas funciones especiales

13.8. Ejercicios
Apartado 13.2
Use el método de series de potencias para resolver las ecuaciones:
a
1. (1 − x)y = y. Compruebe que la solución puede expresarse como y = para |x| < 1.
1−x
2. y − 9y = 0. Compruebe que la solución puede expresarse como y = ae3x + be−3x .
3. (1 − x2 )y − 2xy + 2y = 0 (esta
 es la ecuación
 de Legendre para n = 1). Demuestre que la solución

x 1−x
puede escribirse como y = a1 + a0 1 + ln para |x| < 1.
2 1+x
4. y − xy = 0 (ecuación de Airy).

Apartado 13.3
Para cada una de las ecuaciones siguientes, (i) halle la ecuación indicial y resuélvala, y (ii) dé la forma de
la solución general y = c1 y1 + c2 y2 (ecuaciones (13.10), (13.11) o (13.12)):

5. 2x2 y + xy − 3y = 0 6. xy + (1 − 2x)y + (x − 1)y = 0


7. x2 y + 6xy + (6 − x2 )y = 0
8. Halle la solución general de la ecuación del ejercicio 6. (Sugerencia: halle y1 y demuestre entonces
que y1 ln x es una solución.)

Apartado 13.4
9. Confirme que los polinomios P4 (x) y P5 (x) son soluciones de la ecuación de Legendre para l = 4 y
l = 5, respectivamente.
10. Use la relación de recurrencia (13.21) para hallar P6 (x) a partir de P4 (x) y P5 (x).
 −1/2
11. Desarrolle la función 1 − 2xh + h2 en potencias de h hasta términos en h3 , y demuestre que el
coeficiente de h es Pn (x), para n = 0, 1, 2, 3.
n

12. Use la fórmula (13.24) para hallar las funciones asociadas de Legendre Pm4 (x) para m = 1, 2, 3, 4.
Expréselas en función de cos θ = x y sen θ = (1 − x2 )1/2 .

Apartado 13.6
13. Use la relación de recurrencia (13.33) para hallar H6 (x). Esboce la gráfica de la función de Hermite
2
e−x /2 H6 (x).

Apartado 13.7
14. Halle, y resuelva, la ecuación indicial para la ecuación de Bessel (13.47).

15. Confirme que J1/2 (x) y J−1/2 (x), ecuaciones (13.55), son las soluciones de la ecuación de Bessel para
|n| = 1/2.
 Ecuaciones en derivadas parciales

14.1. Conceptos
Una ecuación que contiene derivadas parciales es una ecuación en derivadas par-
ciales. Por ejemplo, si f es función de las variables independientes x e y, toda ecuación
que contenga ∂f /∂x o ∂f /∂y, o derivadas de orden superior, y también f , x o y, es una
ecuación en derivadas parciales. Algunos ejemplos importantes en las ciencias fı́sicas
son

∂2f 1 ∂2f
1. = ecuación de ondas en una dimensión
∂x2 v2 ∂t2
∂f
2
1 ∂f
2. = ecuación de difusión en una dimensión
∂x 2
D ∂t
∂f
2
∂2f ∂2f
3. + + = ∇2 f = 0 ecuación de Laplace en tres dimensiones
∂x2 ∂y2 ∂z2
4. ∇2 f = g(x, y, z) ecuación de Poisson en tres dimensiones
 2
2
5. − ∇ ψ + V(x, y, z)ψ = Eψ ecuación de Schrödinger independiente
2m
del tiempo
2 2 ∂ψ
6. − ∇ ψ + V(x, y, z)ψ = i ecuación de Schrödinger dependiente
2m ∂t
del tiempo

Todas son ecuaciones lineales de segundo orden. La ecuación 4 es no homogénea, las


demás son ecuaciones homogéneas. En las ecuaciones 1 y 2, la función incógnita f es
una función de la coordenada x y del tiempo t: f = f (x, t). En 3, 4 y 5, la función depende
de las tres coordenadas de un punto en el espacio ordinario, y en 6 es además una función
del tiempo.
Al igual que para las ecuaciones diferenciales ordinarias, hay varios tipos estándar de
ecuaciones en derivadas parciales importantes que se dan con frecuencia en los mode-
los matemáticos de los sistemas fı́sicos, y cuyas soluciones pueden expresarse mediante
funciones elementales. En este capı́tulo tratamos la ecuación 5 mencionada más arriba
para una partı́cula en un pozo rectangular (Apartado 14.4) y en un pozo circular (Apar-
tado 14.5), y para el átomo de hidrógeno (Apartado 14.6), y la ecuación 1 aplicada a
344 Capı́tulo 14. Ecuaciones en derivadas parciales

las vibraciones de una cuerda elástica, como una cuerda de guitarra (Apartado 14.7).
Estos ejemplos ilustran varios principios importantes en la resolución de ecuaciones en
derivadas parciales. Muestran cómo condiciones de contorno o iniciales diferentes pue-
den conducir a tipos muy diferentes de soluciones particulares, cómo las propiedades
de simetrı́a del sistema representado pueden conducir al fenómeno de degeneración, y
cómo, en algunos casos, las soluciones se expresan en forma de ‘desarrollos ortogonales’
presentados en el Capı́tulo 15.

14.2. Soluciones generales


Hemos visto que la solución general de una ecuación diferencial ordinaria contiene
un cierto número de constantes arbitrarias, normalmente n para una ecuación de orden n,
y que para un caso concreto, los valores de esas constantes se obtienen imponiendo las
condiciones iniciales o de contorno adecuadas. La solución de una ecuación en derivadas
parciales, por su parte, contiene un cierto número de funciones arbitrarias, a menudo
n funciones para una ecuación de orden n. Por ejemplo, la ecuación de ondas en una
dimensión, ecuación 1 en la lista del Apartado 14.1,

∂ 2f 1 ∂2f
= , (14.1)
∂x2 v2 ∂t2
tiene como solución

f (x, t) = F(x + vt) , (14.2)

siendo F una función arbitraria de la variable u = x + vt. En efecto:

∂f dF ∂u dF ∂2f d2 F
= = , = ,
∂x du ∂x du ∂x2 du2

∂f dF ∂u dF ∂2f 2
2d F
= =v , = v ,
∂t du ∂t du ∂t2 du2
por lo que se cumple la ecuación (14.1). La solución general de la ecuación es

f (x, t) = F(x + vt) + G(x − vt) , (14.3)

donde F y G son ambas funciones arbitrarias.1 Las funciones concretas se determinan


en cada aplicación mediante las condiciones iniciales y de contorno adecuadas y en el
apartado 14.7 veremos un ejemplo importante.

01. Esta forma de la solución general la obtuvo por primera vez d’Alembert en 1747. Los orı́genes
de la ecuación de ondas están en el tratado De motu nervi tensi (Sobre el movimiento de una cuerda tensa)
de Brook Taylor en 1713. En 1727 Johann Bernoulli sugirió a su hijo Daniel que retomase el problema de
14.3. Separación de variables 345

EJEMPLO 14.1 Compruebe que la función


f (x, t) = 3x2 − 2xvt + 3v2 t2
es una solución de la ecuación de ondas (14.1), y tiene la forma general (14.3).
Las derivadas parciales son

∂f ∂2f ∂f ∂2f
= 6x − 2vt , = 6; = −2xv + 6v2 t , = 6v2 .
∂x ∂x2 ∂t ∂t2
Por lo tanto, se cumple
∂2f 1 ∂2f
6= = 2 2 ,
∂x 2 v ∂t
como era necesario. La función puede expresarse en la forma

f (x, t) = (x + vt)2 + 2(x − vt)2 = F(x + vt) + G(x − vt) .

EJEMPLO 14.2 Compruebe que la función


 
f (x, t) = a exp −b(x − vt)2
es una solución de la ecuación de ondas (14.1).
Tenemos que
d2 f    
= 2ab −1 + 2b(x − vt) 2
exp −b(x − vt) 2
,
dx2
d2 f    
2
= 2abv2 −1 + 2b(x − vt)2 exp −b(x − vt)2 .
dt
d2 f 1 d2 f
Por lo tanto, = 2 2.
dx2 v dt

14.3. Separación de variables


Si una ecuación en derivadas parciales, con dos o más variables independientes, pue-
de reducirse a un conjunto de ecuaciones diferenciales ordinarias, una por cada variable,
la ecuación se dice separable. Las soluciones de la ecuación en derivadas parciales son
entonces productos de las soluciones de las ecuaciones ordinarias. Todos los ejemplos
que tratamos en este capı́tulo son de ese tipo.

Taylor: ‘Para una cuerda musical, de longitud y peso dados, tensada por un peso dado, hallar sus vibra-
ciones’. D’Alembert dedujo la ecuación en Recherches sur la courbe que forme une corde tendue mise en
vibration, 1747, considerando la cuerda compuesta por masas infinitesimales y aplicando la ley de Newton
de las fuerzas a cada elemento de masa. Euler publicó su propia solución en Sur la vibration des cordes en
1750, y Daniel Bernoulli exploró la idea de superposición de modos normales en sus Réflexions et éclaircis-
sements en 1755. El debate sobre los tipos de funciones aceptables como soluciones de la ecuación de ondas
continuó durante unos treinta años entre los tres autores, sin que ninguno se dejase convencer por los otros
dos. El problema fue resuelto gracias a los trabajos de Fourier, de Dirichlet, de Riemann y de Weierstrass
en los siguientes cien años, y necesitó que se reconsiderase el significado de función, de continuidad y de
convergencia.
346 Capı́tulo 14. Ecuaciones en derivadas parciales

Ilustramos los principios esenciales del método de separación de variables consi-


derando la ecuación más sencilla de primer orden en dos variables

∂f ∂f
+ = 0. (14.4)
∂x ∂y

Vamos a ver que una solución de esta ecuación puede escribirse como

f (x, y) = X(x) × Y(y) (14.5)

donde la solución, que es una función de las dos variables x e y, se expresa como producto
de una función sólo de x y otra función sólo de y. Tenemos

∂f ∂(XY) dX
= =Y ,
∂x ∂x dx
ya que Y(y) no depende de x. Del mismo modo,

∂f dY
=X ,
∂y dy

ya que X(x) es constante con respecto a y. Sustituyendo f = XY y sus derivadas en la


ecuación diferencial (14.4) se obtiene entonces

dX(x) dY(y)
Y(y) + X(x) = 0, (14.6)
dx dy

y dividiendo ambos miembros por f = XY,


   
1 dX(x) 1 dY(y)
+ = 0. (14.7)
X(x) dx Y(y) dy

El primer término entre corchetes del primer miembro de (14.7) depende sólo de la
variable x, el segundo sólo de y. Puesto que el total es constante (cero en este caso) se
deduce que cada uno de esos términos debe ser una constante por separado, si x e y son
variables independientes. En efecto, una variación en el valor de x no puede conducir a
una variación en el valor del término que sólo depende de y, y viceversa. Por lo tanto, si
el primer término es igual a una constante C, el segundo es igual a −C (para que el total
sea cero):

1 dX 1 dY
= C, = −C , (14.8)
X dx Y dy

donde C se llama constante de separación. Entonces


14.4. Partı́cula en un pozo rectangular 347

dX
= CX (14.9)
dx

dY
= −CY (14.10)
dy

y la ecuación en derivadas parciales (14.4) se ha reducido a dos ecuaciones diferenciales


ordinarias, ambas resolubles. Las ecuaciones, (14.9) en la variable x y (14.10) en la
variable y, son ecuaciones de primer orden separables del tipo estudiado en el Apartado
11.3, y sus soluciones generales son

X(x) = AeCx , Y(y) = Be−Cy . (14.11)

Una solución de la ecuación en dos variables (14.4) es entonces el producto

f (x, y) = X(x) × Y(y) = AeCx × Be−Cy = DeC(x−y) (14.12)

(hemos sustituido A × B por D). A menudo se pueden obtener soluciones particulares,


incluyendo los valores posibles de la constante de separación, imponiendo condiciones
iniciales y de contorno, como se muestra en los importantes problemas tratados en los
Apartados 14.4 a 14.6. En otros casos, como veremos en el Apartado 14.7 para la cuerda
vibrante, puede ser necesario considerar soluciones más generales como combinaciones
lineales de productos.

14.4. Partı́cula en un pozo rectangular

La ecuación de Schrödinger para una partı́cula de masa m que se mueve en el plano


xy es

2 2
− ∇ ψ(x, y) + V(x, y)ψ(x, y) = Eψ(x, y) (14.13)
2m
donde
∂2 ∂2
∇2 = + (14.14)
∂x2 ∂y2

es el operador laplaciano bidimensional (véase el Apartado 9.6). Para este sistema, la


función energı́a potencial es (Figura 14.1)

V(x, y) = 0 para 0 < x < a y 0<y<b


(14.15)
= ∞ en el resto.
348 Capı́tulo 14. Ecuaciones en derivadas parciales

Como en el caso unidimensional, el valor constan-


te de V dentro del pozo supone que no se ejerce
ninguna fuerza sobre la partı́cula en esa región. To-
mar V = 0 supone que E es la energı́a cinética de
la partı́cula. El valor infinito de V en las ‘paredes’
y fuera del pozo supone que la partı́cula no puede
abandonar el pozo: ψ = 0 en las paredes y fuera del
pozo.

Para la partı́cula dentro del pozo, tenemos el proble-


ma de contorno Figura 14.1
 
2 ∂ 2 ψ ∂ 2 ψ
− + = Eψ (14.16)
2m ∂x2 ∂y2

con las condiciones

ψ(0, y) = ψ(a, y) = 0 (ψ = 0 si x = 0 o x = a), (14.17a)

ψ(x, 0) = ψ(x, b) = 0 (ψ = 0 si y = 0 o y = b). (14.17b)

La ecuación en derivadas parciales se reduce a dos ecuaciones diferenciales si escri-


bimos la ecuación de ondas como el producto

ψ(x, y) = X(x) × Y(y) . (14.18)

Entonces, como en el Apartado 14.3, sustituyendo este producto y sus derivadas en


(14.13) y dividiendo por ψ = XY, tenemos

1 d2 X 1 d2 Y 2mE
+ =− 2 . (14.19)
X dx 2
Y dy2 

El término que sólo depende de x tiene que ser constante, y el término que sólo depende
de y tiene que ser también constante. Por lo tanto,

1 d2 X 1 d2 Y
= Cx , = Cy , (14.20)
X dx2 Y dy2

donde Cx y Cy son constantes y Cx + Cy = −2mE/2 .


El problema de contorno bidimensional ha sido reducido a dos problemas de contorno
unidimensionales:
d2 X
= Cx X , X(0) = X(a) = 0 , (14.21a)
dx2
d2 Y
= Cy Y , Y(0) = Y(b) = 0 .
dy2 (14.21b)
14.4. Partı́cula en un pozo rectangular 349

Ambos problemas son el mismo que el de la partı́cula en el pozo unidimensional


que tratamos en el Apartado 12.6. La ecuación (14.21a) describe el movimiento de la
partı́cula a lo largo de la dirección x, y tiene soluciones normalizadas dadas por (12.53),
cambiando apropiadamente la notación:
  pπx
2
Xp (x) = sen , p = 1, 2, 3, . . . (14.22a)
a a

y Cx = −p2 π 2 /a2 . De manera similar, (14.21b) describe el movimiento de la partı́cula a


lo largo de la dirección y, y tiene soluciones normalizadas
  qπy
2
Yq (y) = sen , q = 1, 2, 3, . . . (14.22b)
b b

y Cy = −q2 π 2 /b2 . Las soluciones globales (autofunciones) de la ecuación de Schrödin-


ger bidimensional (14.13) vienen dadas por los productos

ψp,q (x, y) = Xp (x) × Yq (y)


  pπx  2  qπy
2
= sen × sen , p, q = 1, 2, 3, . . . (14.23)
a a b b

y las energı́as totales correspondientes (autovalores) son


 
h2 p 2 q 2
Ep,q = + . (14.24)
8m a2 b2

Señalamos que las cantidades

h2 p 2 h2 q 2
Ep = y Eq = (14.25)
8ma2 8mb2
deben ser interpretadas como las energı́as cinéticas de los movimientos a lo largo de las
direcciones x e y, respectivamente.

El pozo cuadrado. Degeneración


Cuando los lados del pozo no son iguales, ni un múltiplo entero uno del otro, los
autovalores (14.24) son todos distintos: se dice entonces que los estados del sistema son
no degenerados. Sin embargo, para un pozo cuadrado, con a = b,

h2
Ep,q = (p2 + q2 ) (14.26)
8ma2
y los autovalores para p = q se dan por parejas con Ep,q = Eq,p : por ejemplo, E1,2 =
E2,1 = 5h2 /8ma2 . Los estados del sistema con la misma energı́a se denominan estados
degenerados.
350 Capı́tulo 14. Ecuaciones en derivadas parciales

La aparición de la degeneración para el pozo cuadrado es una consecuencia de la


simetrı́a del sistema. Las autofunciones (14.23) son

2  pπx  qπy
ψp,q (x, y) = sen sen (14.27)
a a a
e intercambiando las coordenadas x e y tenemos

2  pπy  qπx
ψp,q (y, x) = sen sen = ψq,p (x, y) (14.28)
a a a
es decir, las autofunciones degeneradas se han intercambiado (si p = q).* En la Figura
14.2 se representan las simetrı́as de algunas de las funciones de onda.

Figura 14.2

Las lı́neas discontinuas son lı́neas nodales, en las cuales la función es cero. Vemos,
por ejemplo, que ψ1,2 y ψ2,1 son idénticas salvo por la orientación.

14.5. Partı́cula en un pozo circular


El movimiento de una partı́cula en un pozo circular de radio a viene descrito por la
ecuación de Schrödinger

2 2
− ∇ ψ(x, y) + V(x, y)ψ(x, y) = Eψ(x, y) (14.29)
2m
como en el Apartado 14.4, pero con una función energı́a potencial


0 para r = x2 + y2 < a
V(x, y) = (14.30)
∞ en el resto

siendo r la distancia al origen en el centro del pozo. La ecuación no es separable en


coordenadas cartesianas por la forma funcional de V en la circunferencia del pozo, pero
sı́ lo es cuando la ecuación se expresa en las coordenadas polares del plano r y θ. En esas

0* Puede ocurrir también una degeneración ‘accidental’ que no es una consecuencia obvia de la
simetrı́a. Por ejemplo, los estados (7, 1) y (1, 7) son degenerados junto con el estado (5, 5).
14.5. Partı́cula en un pozo circular 351

coordenadas, el operador laplaciano en dos dimensiones es (véanse la ecuación (9.38) y


el Ejemplo 9.18)

∂2 1∂ 1 ∂2
∇2 = + + . (14.31)
∂r2 r ∂r r2 ∂θ2
Para la partı́cula en el interior del pozo, con V = 0, la ecuación (14.29) es entonces
 
2 ∂ 2 ψ 1 ∂ψ 1 ∂2ψ
− + + 2 2 = Eψ (14.32)
2m ∂r2 r ∂r r ∂θ

o, multiplicando ambos miembros por −2mr2 /2 , tomando

2mE
α2 = (14.33)
2
y reordenando,

∂2ψ ∂ψ ∂2ψ
r2 + r + α 2 2
r ψ + = 0. (14.34)
∂r2 ∂r ∂θ2
Esta ecuación puede separarse en dos ecuaciones ordinarias expresando la función de
onda como el producto

ψ(r, θ) = R(r) × Θ(θ) . (14.35)

Sustituyendo en (14.34) y dividiendo por ψ = RΘ tenemos


 2 2   
r dR r dR 1 d2 Θ
+ +α r +
2 2
= 0. (14.36)
R dr2 R dr Θ dθ2

Cada uno de los términos entre corchetes debe ser constante de manera que, siendo C la
constante de separación, tenemos

d2 R dR
r2 +r + α2 r2 R = CR (14.37)
dr 2
dr
para el movimiento radial de la partı́cula en el pozo, y

d2 Θ
= −CΘ (14.38)
dθ2
para el movimiento angular de la partı́cula. Empezamos por la ecuación angular.
352 Capı́tulo 14. Ecuaciones en derivadas parciales

Ecuación angular

La función Θ(θ) está definida en el intervalo 0 ≤ θ ≤ 2π y tiene que cumplir la


condición

Θ(2π) = Θ(0) (14.39)

para asegurar la continuidad alrededor del cı́rculo. Se trata por lo tanto del mismo pro-
blema de contorno visto en el Apartado 12.7 para la partı́cula en un aro. Las soluciones
normalizadas son (ecuación (12.69))

1
Θn (θ) = √ einθ , n = 0, ±1, ±2, . . . (14.40)

y sustituyendo en (14.38) obtenemos los valores de la constante de separación C = n2 .

Ecuación radial

Tomando C = n2 , la ecuación radial (14.37) es

d2 R dR
r2 +r + (α2 r2 − n2 )R = 0 . (14.41)
dr 2
dr
La ecuación se transforma en la ecuación de Bessel (Apartado 13.7) mediante el cambio
de variable x = αr. Tenemos que

dR dR dx dR d2 R 2
2 d R
= =α , = α ,
dr dx dr dx dr2 dx2
con lo cual (14.41) se convierte en la ecuación de Bessel (13.47)

d2 R dR
x2 +x + (x2 − n2 )R = 0 .
dx 2
dx
Si n es un entero positivo o cero, la solución de esta ecuación es la función de Bessel
Jn (x) dada por (13.50), de manera que las soluciones de la ecuación radial son

Rn (r) = Jn (αr) , n = 0, 1, 2, 3, . . . (14.42)

Estas soluciones están obligadas a cumplir la condición de que la función de onda se


anule en la frontera del pozo, cuando r = a. Por lo tanto,

Rn (a) = Jn (αa) = 0 (14.43)

y los valores de α posibles vienen determinados por los ceros de la función de Bessel,
algunos de los cuales se dan en (13.53) en el Apartado 13.7. Si denotamos los ceros de
14.6. El átomo de hidrógeno 353

Jn (x) por xn,1 , xn,2 , xn,3 , . . . , los valores permitidos de α son


xn,k
αn,k = , k = 1, 2, 3, . . . (14.44)
a
y las soluciones de la ecuación radial que cumplen la condición de contorno son

Rn,k (r) = Jn (αn,k r) . (14.45)

Por la ecuación (14.33), la energı́a del sistema viene dada por E = α2 2 /2m, de manera
que la energı́a resulta cuantizada, con valores

αn,k
2
2 x 2 h2
En,k = = n,k 2 , n = 0, ±1, ±2, . . . (14.46)
2m 8ma
y las correspondientes funciones de onda globales son

ψn,k (r, θ) = R|n|,k (r)Θn (θ) (14.47)

(las funciones radiales dependen sólo del valor absoluto de n). Las simetrı́as de estas
funciones de onda se representan en la Figura 14.3, utilizando las expresiones reales
(12.71) de las funciones angulares.

Figura 14.3

Señalamos que estos diagramas también representan los modos normales de vibra-
ción, las ondas estacionarias, de una membrana circular (como por ejemplo un tambor).

14.6. El átomo de hidrógeno


Un átomo hidrogenoideo es un sistema de dos cargas, un núcleo con carga +Ze
(Z = 1 para el propio átomo de hidrógeno) y un electrón con carga −e, que interactúan
mediante una fuerza de Coulomb. La energı́a potencial del sistema es (véase el Ejemplo
5.11)
−Ze2
V= (14.48)
4π0 r

siendo r la distancia entre las cargas. Suponemos el núcleo fijo en el origen de un sistema
coordenado, con el electrón en la posición (x, y, z). La ecuación de Schrödinger para el
354 Capı́tulo 14. Ecuaciones en derivadas parciales

movimiento del electrón en torno al núcleo estacionario es entonces


2 2
− ∇ ψ + Vψ = Eψ (14.49)
2me

donde ∇2 es el operador laplaciano tridimensional y la función energı́a potencial es, en


coordenadas cartesianas,

−Ze2
V(x, y, z) = . (14.50)
4π0 (x2 + y2 + z2 )1/2

Empezamos por simplificar la ecuación expresando todas las cantidades fı́sicas en unida-
des atómicas (véase el Apartado 1.7): la ecuación de Schrödinger ‘en unidades atómicas’
es
 
1 ∂2ψ ∂2ψ ∂2ψ Z
− + 2 + 2 − 2 ψ = Eψ . (14.51)
2 ∂x 2
∂y ∂z (x + y + z2 )1/2
2

Separación de variables
El primer paso para la resolución de la ecuación en derivadas parciales en tres va-
riables es separarla, es decir, reducirla a tres ecuaciones ordinarias. Esto no es posible
de hacer en coordenadas cartesianas porque la función potencial V no puede expresarse
como una suma de términos cada uno en una sola variable. Existen varios sistemas de
coordenadas, sin embargo, en los cuales la separación es posible. Uno de ellos es el
sistema de coordenadas esféricas presentado en el Capı́tulo 10. El operador laplaciano
es en esas coordenadas (Apartado 10.5)
   
1 ∂ ∂ 1 ∂ ∂ 1 ∂2
∇2 = 2 r2 + 2 sen θ + 2
r ∂r ∂r r sen θ ∂θ ∂θ r sen θ ∂φ2
2

y la ecuación de Schrödinger queda (tras multiplicar por −2 y reordenar los términos)


   
1 ∂ 2 ∂ψ 1 ∂ ∂ψ 1 ∂ 2 ψ 2Z
r + sen θ + + ψ + 2Eψ = 0 . (14.52)
r2 ∂r ∂r r2 sen θ ∂θ ∂θ r2 sen2 θ ∂φ2 r

Empezamos por separar los términos radiales de los términos angulares expresando la
función de onda como el producto

ψ(r, θ, φ) = R(r) × Y(θ, φ) . (14.53)

Sustituyendo en (14.52), dividiendo ambos miembros por ψ = RY y multiplicando por


r2 tenemos
       
1 d 2 dR 1 1 ∂ ∂Y 1 ∂2Y
r + 2Zr + 2Er +
2
sen θ + = 0 . (14.54)
R dr dr Y sen θ ∂θ ∂θ sen2 θ ∂φ2
14.6. El átomo de hidrógeno 355

Tomamos la constante de separación como l(l+1) por motivos que se verán más adelante.
Con esto la ecuación radial para el átomo de hidrógeno es
 
1 d 2 dR
r + 2Zr + 2Er2 = l(l + 1)
R dr dr

o bien
   
1 d 2 dR l(l + 1) 2Z
r + − + + 2E R = 0 (14.55)
r2 dr dr r2 r

y la ecuación angular es
 
1 ∂ ∂Y 1 ∂2Y
sen θ + + l(l + 1)Y = 0 . (14.56)
sen θ ∂θ ∂θ sen2 θ ∂φ2

Para separar las variables angulares, tomamos ahora

Y(θ, φ) = Θ(θ) × Φ(φ) . (14.57)

Sustituyendo este producto y sus derivadas en la ecuación angular, dividiendo por Y =


ΘΦ y multiplicando por sen2 θ, tenemos
     
sen θ d dΘ 1 d2 Φ
sen θ + l(l + 1) sen θ +
2
=0 (14.58)
Θ dθ dθ Φ dφ2

de manera que, si tomamos la constante de separación como −m2 ,

d2 Φ(φ)
= −m2 Φ(φ) , (14.59)
dφ2

   
1 d dΘ m2
sen θ + l(l + 1) − Θ = 0. (14.60)
sen θ dθ dθ sen2 θ

La separación de variables es completa. Es necesario ahora resolver los tres problemas


de contorno dados por las ecuaciones (14.55), (14.59) y (14.60), con las condiciones de
contorno adecuadas.

Ecuación para Φ

d2 Φ(φ)
= −m2 Φ(φ) . (14.59)
dφ2

La función Φ está definida en el intervalo 0 ≤ φ ≤ 2π y tiene que cumplir la condición


356 Capı́tulo 14. Ecuaciones en derivadas parciales

Φ(2π) = Φ(0) (14.61)

para asegurar la continuidad alrededor del cı́rculo. Se trata por lo tanto del mismo pro-
blema de contorno visto en el Apartado 12.7 para la partı́cula en un aro y en 14.5 para el
movimiento angular de una partı́cula en un pozo circular. Las soluciones normalizadas
son
1
Φm (φ) = √ eimφ , m = 0, ±1, ±2, . . . (14.62)

o en su forma real (ecuaciones (12.71))

1 1 1 1
√ (Φm + Φ−m ) = √ cos mφ , √ (Φm − Φ−m ) = √ sen mφ (14.63)
2 2 π i 2 2 π

con m = 0, 1, 2, . . . Las funciones forman un conjunto ortonormal, con la propiedad


Φ∗m (φ)Φm (φ) dφ = δm,m . (14.64)


0

Ecuación para Θ

   
1 d dΘ m2
sen θ + l(l + 1) − Θ = 0. (14.60)
sen θ dθ dθ sen2 θ

La ecuación se transforma en la ecuación asociada de Lagrange (13.22) mediante el


cambio x = cos θ. Tenemos
dΘ dΘ dx dΘ
= = − sen θ ,
dθ dx dθ dx

d2 Θ dΘ 2 d Θ
2
2 d Θ
2

= − cos θ + sen θ = (1 − x ) −x .
dθ 2
dx dx 2
dx 2
dx
Por lo tanto
 
1 d dΘ d2 Θ cos θ dΘ 2 d Θ
2

sen θ = + = (1 − x ) − 2x
sen θ dθ dθ dθ 2
sen θ dθ dx 2
dx

y la ecuación (14.60) se transforma en


 
d2 Θ dΘ m2
(1 − x ) 2 − 2x
2
+ l(l + 1) − Θ = 0, (14.65)
dx dx (1 − x2 )
14.6. El átomo de hidrógeno 357

que es idéntica a la ecuación asociada de Legendre. Las soluciones finitas en el intervalo


−1 ≤ x ≤ 1 (0 ≤ θ ≤ π) son las funciones asociadas de Legendre (normalizadas,
ecuación (13.28))

(2l + 1) (l − |m|)! |m| l = 0, 1, 2, 3, . . .
Θl,m ( cos θ) = Pl ( cos θ) , (14.66)
2 (l + |m|)! m = 0, ±1, ±2, . . . , ±l .

Estas funciones forman un conjunto ortonormal con la propiedad (ecuación (13.29))


Θl,m ( cos θ)Θl ,m ( cos θ) sen θ dθ = δl,l (14.67)


0

Armónicos esféricos
Los productos de las funciones angulares Θl,m y Φm ,
 
2l + 1 (l − |m|)! |m|
Yl,m (θ, φ) = Θl,m (θ)Φm (φ) = P ( cos θ) eimφ , (14.68)
4π (l + |m|)! l

se llaman armónicos esféricos. Se dan siempre que se formula un problema fı́sico en


tres dimensiones en coordenadas esféricas.* Presentamos algunas de estas funciones en
la Tabla 14.1. Las funciones son complejas si m = 0 y es a veces más conveniente usar
las funciones reales correspondientes (véanse las ecuaciones (14.63))

1 1
√ (Yl,m + Yl,−m ) , √ (Yl,m − Yl,−m ) , m > 0. (14.69)
2 i 2

Los armónicos esféricos multiplicados por el factor rl se llaman armónicos sólidos,


y sus formas reales se dan también en la tabla, junto con sus nombres convencionales en
la teorı́a de la estructura atómica.
Por las relaciones de ortogonalidad (14.64) y (14.67), los armónicos esféricos forman un
conjunto ortonormal para un ángulo sólido completo (θ = 0 → π, φ = 0 → 2π):
2π π

Yl,m (θ, φ) Yl,m(θ, φ) sen θ dθ dφ = δl,l δm,m . (14.70)
0 0

Momento angular
La ecuación angular (14.56) puede escribirse como la ecuación de autovalores (en
unidades apropiadas)

0* Los armónicos esféricos se definen a menudo con un ‘factor de fase’ adicional (– 1)(m+|m|)/2 que
multiplica la función por (– 1) cuando m es impar y positivo.
358 Capı́tulo 14. Ecuaciones en derivadas parciales

Tabla 14.1

armónico esférico armónico sólido (real)

 1/2  1/2
1 1
Y0,0 = s=
4π 4π
 1/2  1/2
3 3
Y1,0 = cos θ pz = z
4π 4π
 1/2  1/2  1/2
3 3 3
Y1,±1 = sen θe±iφ px = x , py = y
8π 4π 4π
 1/2  1/2
5 5
Y2,0 = (3 cos2 θ − 1) dz2 = (3z2 − r2 )
16π 8π
 1/2  1/2  1/2
15 15 15
Y2,±1 = sen θ cos θe±iφ dxz = xz , dyz = yz
8π 4π 4π
 1/2  1/2  1/2
15 15 15
Y2,±2 = sen2 θe±2iφ dx2 −y2 = (x2 − y2 ) , dxy = xy
32π 16π 4π


  
1 ∂ ∂ 1 ∂2
− 2
sen θ + Yl,m = l(l + 1)2 Yl,m (14.71)
sen θ ∂θ ∂θ sen2 θ ∂φ2

o bien

L2 Yl,m = l(l + 1)2 Yl,m (14.72)

donde L2 es el operador cuántico para el cuadrado del momento angular. Los armóni-
cos esféricos son por lo tanto autofunciones de L2 . Describen los estados posibles del
momento angular del sistema, y los autovalores l(l + 1)2 son los valores permitidos del
cuadrado del momento angular. Además, de la ecuación (14.62) se deduce que

dΦm
−i = mΦm

y por lo tanto que

∂Yl,m
−i = mYl,m (14.73)
∂φ

o bien

Lz Yl,m = mYl,m . (14.74)

Lz es el operador cuántico que representa la componente del momento angular en la


dirección z, y los autovalores m de Lz son los valores permitidos de esa componente.
14.6. El átomo de hidrógeno 359

El número l se llama número cuántico azimutal (o del momento angular) y m número


cuántico magnético (o número cuántico de la componente del momento angular).

Ecuación radial

   
1 d 2 dR l(l + 1) 2Z
r + − + + 2E R = 0. (14.55)
r2 dr dr r2 r

Esta ecuación tiene dos conjuntos de soluciones para el átomo de hidrógeno. En los es-
tados ligados del átomo el electrón resulta confinado a las proximidades del núcleo por
aplicarse la condición de contorno R(r) → 0 cuando r → ∞. Las energı́as de esos esta-
dos son negativas (el cero de energı́a corresponde a dos cargas en reposo infinitamente
separadas) y hay que aportar energı́a al sistema para ionizar el átomo. Los estados con
energı́a positiva son estados de colisión (estados del continuo) en los que el electrón se
mueve libremente en presencia del núcleo pero no está ligado a él. Vamos a considerar
aquı́ únicamente los estados ligados, con E < 0. Tomamos

Z
α2 = −2E , λ= , (14.75)
α
y definimos la nueva variable

ρ = 2αr . (14.76)

dR dR d2 R 2
2d R
Entonces = 2α , = 4α , y la ecuación radial se transforma en
dr dρ dr2 dρ2
 
d2 R 2 dR l(l + 1) λ 1
+ + − + − R=0 (14.77)
dρ2 ρ dρ ρ2 ρ 4

que es idéntica a la ecuación (13.45) para las funciones asociadas de Laguerre, con
λ = n un entero positivo. Las soluciones de la ecuación vienen dadas por lo tanto por la
ecuación (13.44)

e−ρ/2 ρl Ln+l
2l+1
(ρ) .

Estas funciones son finitas y continuas para todo valor de ρ positivo, y por lo tanto
de r, y cumplen las condiciones de contorno para los estados ligados. Las funciones
pueden ser normalizadas, utilizando la ecuación (13.46), y las funciones de onda radiales
normalizadas que se obtienen son*

0* Por convenio, las funciones radiales (14.78) se definen con un signo negativo como parte de la
constante de normalización.
360 Capı́tulo 14. Ecuaciones en derivadas parciales

 3 1/2
2Z (n − l − 1)!
Rn,l (r) = − e−ρ/2 ρl Ln+l
2l+1
(ρ) (14.78)
2n{(n + l)!}
3
n

donde, por ser α = Z/n si λ = n,

2Z
ρ= r (14.79)
n
y los valores permitidos de los números cuánticos son

n = 1, 2, 3, . . . l = 0, 1, 2, . . . , (n − 1) . (14.80)

Las funciones radiales forman un conjunto ortonormal con respecto a la función peso r2
en el intervalo 0 ≤ r ≤ ∞ :

Rn,l (r) Rn,l (r) r2 dr = δn,n . (14.81)
0

En la Tabla 14.2 presentamos algunas de las funciones radiales. Se ha incluido la unidad


de longitud atómica cuando procede, de manera que ρ = 2Zr/na0 .

Tabla 14.2 Funciones radiales

n l nombre Rn,l (ρ)


 3/2
Z
1 0 1s 2 e−ρ/2
a0
 3/2
1 Z
2 0 2s √ (2 − ρ) e−ρ/2
2 2 a0
 3/2
1 Z
2 1 2p √ ρ e−ρ/2
2 6 a0
 3/2
1 Z
3 0 3s √ (6 − 6ρ + ρ2 ) e−ρ/2
9 3 a0
 3/2
1 Z
3 1 3p √ (4 − ρ)ρ e−ρ/2
9 6 a0
 3/2
1 Z
3 2 3d √ ρ2 e−ρ/2
9 30 a0

En la Figura 14.4 dibujamos sus gráficas. El número de nodos radiales (superficies esféri-
cas nodales de la función de onda global) es n − l − 1, sin contar el cero en r = 0 si
l > 0.
14.6. El átomo de hidrógeno 361

Figura 14.4

Energı́a
Los valores permitidos de la energı́a se obtienen a partir de (14.75): si λ = n, α =
Z/n y E = −α2 /2. Por lo tanto

Z2
En = − , n = 1, 2, 3, . . . (14.82)
2n2
El número n se llama número cuántico principal.
La función de onda global
Las soluciones globales de la ecuación de Schrödinger para los estados ligados del
átomo hidrogenoideo son

ψn,l,m (r, θ, φ) = Rn,l (r)Θl,m (θ)Φm (φ) (14.83)

y los números n, l y m se denominan número cuántico principal (n), número cuántico


azimutal (l), y número cuántico magnético (m). A partir de las relaciones de ortonorma-
lidad (14.64) para Φm , (14.67) para Θl,m y (14.81) para Rn,l se deduce que las funciones
de onda globales forman un conjunto ortonormal en el espacio tridimensional:
2π π ∞

ψ ∗
n,l,m ψn,l,m dv = ψn,l,m

(r, θ, φ) ψn,l,m(r, θ, φ) r2 sen θ dr dθ dφ
0 0 0

= δn,n δl,l δm,m . (14.84)

En la Figura 14.5 se representan las funciones de onda globales, los orbitales atómicos,
mediante diagramas de curvas de nivel en un plano apropiado que contiene al núcleo.*
Los trazos continuos representan valores positivos de los orbitales, los discontinuos va-
lores negativos y los punteados nodos. Señalamos que las funciones de onda ψn,l,m con

0* Los diagramas de la Figura 14.5 están a escala en cuadrados de 20 (a0 ) de lado. Los valores de las
curvas de nivel son ±0,002 × 2i , i = 0, 1, 2, 3, . . .
362 Capı́tulo 14. Ecuaciones en derivadas parciales

energı́a En tienen un total de (n − 1) superficies nodales. Son estos diagramas los que
han llevado a la representación pictórica convencional de los orbitales atómicos.

Figura 14.5

14.7. La cuerda vibrante

Consideramos una cuerda elástica, como una cuerda de guitarra por ejemplo, de lon-
gitud l y densidad de masa lineal uniforme ρ, estirada y fijada en los extremos con una
tensión T. Si deformamos transversalmente la cuerda
(pulsándola hacia un lado), la soltamos, y le permitimos
vibrar (Figura 14.6), su desplazamiento transversal es en-
tonces una función de la posición x y del tiempo t,

y = y(x, t) , (14.85)

y si las vibraciones son pequeñas, el movimiento de la


Figura 14.6
cuerda viene descrito por la ecuación de ondas

∂2y 1 ∂2y
= (14.86)
∂x2 v2 ∂t2

donde v2 = T/ρ. Las condiciones de frontera e iniciales que se aplican a las soluciones
de la ecuación son

y(0, t) = y(l, t) = 0 (14.87)


14.7. La cuerda vibrante 363

para extremos de la cuerda fijos, e


 
∂y
y(x, 0) = f (x) , = g(x) , (14.88)
∂t t=0

para el perfil y la velocidad (las funciones) iniciales.

Separación de variables
Escribimos la función del desplazamiento (una función de onda) como el producto

y(x, t) = F(x) × G(t) . (14.89)

Sustituyendo en la ecuación de ondas y dividiendo por y = FG se obtiene

1 d2 F 1 d2 G
= . (14.90)
F dx2 Gv2 dt2
Ambos miembros de la ecuación deben ser constantes de manera que, tomando la cons-
tante de separación −λ2 , el problema en dos variables se reduce al problema de contorno

d2 F
+ λ2 F = 0 , F(0) = F(l) = 0 , (14.91)
dx2
y al problema de valor inicial

d2 G
+ λ2 v2 G = 0 (14.92)
dt2
con condiciones iniciales dadas por (14.88), siendo f (x) y g(x) unas funciones dadas.
El problema de contorno es idéntico al visto en el Apartado 12.6 para una partı́cula
en un pozo. Los valores permitidos de la constante de separación vienen dados por

λn = , n = 1, 2, 3, . . . (14.93)
l
y las correspondientes soluciones particulares (no normalizadas) son
nπx
Fn (x) = sen . (14.94)
l
Para cada valor de λn , la ecuación (14.92) es

d2 G
+ ωn2 G = 0 (14.95)
dt2
364 Capı́tulo 14. Ecuaciones en derivadas parciales

donde
nπv
ωn = λn v = (14.96)
l
y su solución es

Gn (t) = An cos ωn t + Bn sen ωn t (14.97)

siendo An y Bn constantes determinadas por las condiciones iniciales. Un conjunto de


soluciones de la ecuación de ondas para la cuerda vibrante es por lo tanto
nπx  
yn (x, t) = sen An cos ωn t + Bn sen ωn t , n = 1, 2, 3, . . . (14.98)
l
Estas soluciones se denominan autofunciones del sistema. Las cantidades ωn = nπv/l
se denominan autovalores. El conjunto de valores {ω1 , ω2 , ω3 . . . } se denomina espectro
de autovalores.

Modos normales de vibración


Cada una de las autofunciones yn (x, t) es una función periódica del tiempo con periodo
2π/ωn : se trata de un movimiento armónico transverso con frecuencia νn = ωn /2π. Este
movimiento se denomina un modo normal de vibración de la cuerda. El primer modo,
con n = 1, se llama fundamental, el segundo, con n = 2, es el primer armónico, etcétera.
En la Figura 14.7 ilustramos los movimientos espaciales de los tres primeros modos
normales (véase también la Figura 12.6).

Figura 14.7

El modo n-ésimo tiene n − 1 nodos entre los extremos, es decir, puntos con desplaza-
miento cero que no se mueven. Las soluciones (14.98) representan ondas estacionarias.

La solución completa
Cada uno de los modos normales contiene dos constantes, An y Bn , que hay que fijar
según las condiciones iniciales (14.88), es decir, según se inicia el movimiento. Es po-
sible elegir las condiciones iniciales de manera que el movimiento sea el de uno de los
14.8. Ejercicios 365

modos normales. Por ejemplo, se obtiene el modo n-ésimo con


nπx
y(x, 0) = f (x) = An sen ,
l
  (14.99)
∂y nπx
= g(x) = Bn ωn sen .
∂t t=0 l

En general, sin embargo, un único modo no cumple las condiciones iniciales: el movi-
miento no es un modo normal puro sino una mezcla o superposición de modos normales.
Para obtener la solución en el caso general, usamos el principio de superposición
presentado en el Apartado 12.2: si y1 , y2 , y3 , . . . son soluciones de una ecuación lineal
homogénea, cualquier combinación lineal de ellas es también una solución. Ası́, para
cada modo normal tenemos
∂ 2 yn 1 ∂ 2 yn
= (14.100)
∂x2 v2 ∂t2
de manera que si

y = c1 y1 + c2 y2 + c3 y3 + . . . (14.101)

entonces
∂2y 1 ∂2y
= . (14.102)
∂x2 v2 ∂t2
La solución general de la ecuación de ondas que cumple las condiciones de contorno es
por lo tanto una superposición de modos normales

 nπx  

y(x, t) = sen An cos ωn t + Bn sen ωn t (14.103)


n=1
l

(las constantes c1 , c2 , . . . de (14.101) han sido incluidas en los correspondientes coefi-


cientes An y Bn ). Esta solución cumple las condiciones iniciales si determinamos los An
y Bn a partir de las ecuaciones



nπx
y(x, 0) = f (x) = An sen ,
n=1
l
  

(14.104)
∂y nπx
= g(x) = Bn ωn sen .
∂t t=0 n=1
l

Las dos series de (14.104) son ejemplos de las series de Fourier que trataremos en el
Capı́tulo 15. Volveremos a este problema en el Apartado 15.5 para determinar los An y
Bn para funciones iniciales tı́picas f (x) y g(x).
366 Capı́tulo 14. Ecuaciones en derivadas parciales

14.8. Ejercicios
Apartado 14.2

1. Demuestre que la función f (x, t) = a sen (bx) cos (vbt) cumple la ecuación de ondas en una dimensión
(14.1), y que es de la forma
f (x, t) = F(x + vt) + G(x − vt) .
2. La ecuación de difusión
∂f ∂2f
=D 2
∂t ∂x
representa, por ejemplo, la transmisión de calor por conducción de una región caliente a una región frı́a
si f es la temperatura, o la transmisión de materia de una región con concentraciones altas a una con
concentraciones bajas si f es la concentración. Halle todas las posibles soluciones de la ecuación que tengan
la forma
f (x, t) = a + bect V(x) .
3. (i) En el Ejemplo 14.2 se demuestra que la función
 
f (x, t) = a exp −b(x − vt)2

es una solución de la ecuación de ondas (14.1). Dibujando las gráficas de f en función de x para los instantes
t = 0, t = 2/v y t = 4/v (tomando, por ejemplo, a = b = 1), demuestre que la función representa una
onda (una onda gaussiana) que viaja hacia la derecha (dirección x positiva) con velocidad v constante.
(ii) La correspondiente función que se mueve hacia la izquierda es
 
g(x, t) = a exp −b(x + vt)2 .

Demuestre que la función f (x, t) + g(x, t) es también una solución de la ecuación de ondas, y dibuje unas
gráficas apropiadas para ver cómo evoluciona con el tiempo.

Apartado 14.3
Halle por el método de separación de variables algunas soluciones f (x, y) para las siguientes ecuaciones:
∂f ∂f ∂f ∂f ∂2f ∂2f ∂2f
4. 2 + =0 5. y −x = 0 6. + = 0 7. +f =0
∂x ∂t ∂x ∂y ∂x2 ∂y2 ∂x∂y
8. Resuelva la ecuación de Laplace
∂2u ∂2u
+ =0
∂x2 ∂y2
con las condiciones de contorno:
u(x, 0) = 0 , u(x, 1) = 0 (0 < x < 1)
u(0, y) = 0 , u(1, y) = sen 3πy (0 < y < 2)
9. Una barra fina o alambre homogéneo de longitud l y sección transversal constante se aı́sla perfecta-
mente en toda su longitud con los extremos mantenidos a temperatura constante T = 0 (en alguna escala
de temperatura). El perfil de temperaturas de la barra es una función T(x, t) de la posición x (0 ≤ x ≤ l) y
del tiempo t, y cumple la ecuación de conducción del calor (difusión)
∂T ∂2T
=D 2
∂t ∂x
siendo D el coeficiente de difusión térmico del material.
Si el perfil de temperaturas a t = 0 es T(x, 0) = 3 sen πx/l, halle la solución de la ecuación que decae
exponencialmente con el tiempo en cada punto x.
14.8. Ejercicios 367

Apartado 14.4
10. Resuelva la ecuación de Schrödinger para una partı́cula en un pozo rectangular tridimensional con
función energı́a potencial
V(x, y, z) = 0 para 0 < x < a , 0 < y < b, 0 < z < c,
= ∞ en el resto .
¿Cuáles son las posibles degeneraciones de los autovalores para un pozo cúbico?

Apartado 14.5
11. Algunos ceros de las funciones de Bessel Jn (x) son:
J0 (x) = 0 para x = 2,4048; 5,5201; 8,6537
J1 (x) = 0 x = 3,8317; 7,0156; 10,1736
J2 (x) = 0 x = 5,1356; 8,4172
J3 (x) = 0 x = 6,3802; 9,7610
J4 (x) = 0 x = 7,5883
1. Halle las energı́as (en unidades de h2 /8ma2 ) de los 10 estados más bajos para una partı́cula en un
pozo circular de radio a, y dibuje el correspondiente diagrama de niveles de energı́a.
2. Los seis diagramas de la Figura 14.3 son representaciones de los signos y nodos de las funciones
de onda (14.47) para los seis estados más bajos, utilizando la forma real de las funciones angulares.
Dibuje los correspondientes diagramas para los 4 siguientes estados más bajos.

Apartado 14.6
12. (i) Use las Tablas 14.1 y 14.2 para dar la función de onda global ψ1,0,0 (r, θ, φ) para el átomo de
hidrógeno.
(ii) Sustituya esta función de ondas en la ecuación de Schrödinger (14.52) y compruebe que se trata
de una solución con E dada por (14.82).
13. Repita el Ejercicio 12 para la función de onda ψ2,1,1 .
14. Demuestre que las funciones radiales R1,0 y R2,0 , dadas en la Tabla 14.2, cumplen la condición de
ortogonalidad (14.81) (recuerde utilizar la expresión de ρ adecuada).

Apartado 14.7
15. Halle la solución general de (14.103) para la cuerda vibrante que cumpla la condición inicial
∂y
(x, 0) = 0.
∂t
∂T ∂2T
16. Halle la solución general de la ecuación de difusión = D 2 que cumple las condiciones de
∂t ∂x
contorno T(0, t) = T(l, t) = 0 para t ≥ 0 (véase el Ejercicio 9), y que decae exponencialmente con el
tiempo.
∂2u ∂2u
17. Halle la solución general de la ecuación de Laplace 2 + 2 = 0 sujeta a las
∂x ∂y
condiciones de contorno

u(x, 0) = 0 , u(x, 1) = 0 ,
u(0, y) = 0 (0 < y < 1) ,
(véase el Ejercicio 8).
 Desarrollos ortogonales.
Análisis de Fourier

15.1. Conceptos
Vimos en el Apartado 7.6 que muchas funciones pueden desarrollarse en serie de
potencias y que, de hecho, algunas se definen mediante esas series. En general, una
función f (x) puede desarrollarse en potencias de x como una serie de MacLaurin si la
función y sus derivadas existen en x = 0 y en todo el intervalo que va de 0 a x. El
desarrollo es válido entonces dentro del radio de convergencia de la serie.
El desarrollo en serie de potencias de una función es un caso particular de un tipo
más general de desarrollo. Sea la función



f (x) = a0 + a1 x + a2 x2 + · · · = al x l . (15.1)
l=0

Podemos considerar cada potencia de x como la función gl (x) = xl , es decir, g0 (x) =


x0 = 1, g1 (x) = x, g2 (x) = x2 , etcétera. El desarrollo es entonces



f (x) = a0 g0 (x) + a1 g1 (x) + a2 g2 (x) + · · · = al gl (x) . (15.2)


l=0

Este formalismo sugiere que puede ser posible encontrar otros conjuntos de funciones
{gl } que usar en vez de simples potencias, y que puede ser posible desarrollar de esa
manera funciones que no pueden desarrollarse en serie de potencias.
Los conjuntos de funciones de particular importancia para desarrollos en serie con-
sisten en funciones con la propiedad de ortogonalidad. En el Apartado 15.2 presentamos
la teorı́a de desarrollos ortogonales. En el apartado 15.3 tratamos dos ejemplo de des-
arrollos en polinomios de Legendre, importantes en la teorı́a del potencial y en la teorı́a
de difusión, con una aplicación a la electrostática. En el Apartado 15.4 consideramos las
series de Fourier y las usamos en el Apartado 15.5 para resolver la ecuación de ondas
para la cuerda vibrante con unas condiciones iniciales dadas. En el apartado 15.6 tra-
tamos la transformada de Fourier, imprescindible para el análisis de los resultados de
experimentos de difracción y para la espectroscopia de análisis de Fourier.
370 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier

15.2. Desarrollos ortogonales

Introducimos el concepto de desarrollo en un conjunto de funciones ortogonales de-


mostrando que la serie de potencias (15.1) puede escribirse como una combinación lineal
de polinomios de Legendre,



f (x) = c0 P0 (x) + c1 P1 (x) + c2 P2 (x) + · · · = cl Pl (x) , (15.3)


l=0

y que, cuando el valor de la variable se limita al intervalo −1 ≤ x ≤ +1, la ortogonalidad


de los polinomios de Legendre permite deducir una fórmula general para los coeficientes
cl de (15.3) en función de los coeficientes al de (15.1). En el Apartado 13.4 tratamos los
polinomios de Legendre, y los primeros son

P0 (x) = 1 , P1 (x) = x ,
1 1 3
P2 (x) = (3x2 − 1) , P3 (x) = (5x − 3x) , (15.4)
2 2
1 1
P4 (x) = (35x4 − 30x2 + 3) , P5 (x) = (63x5 − 70x3 + 15x) .
8 8
La función Pl (x) es un polinomio de grado l en x, y es posible expresar cada potencia xl
como una combinación lineal de polinomios de Legendre hasta grado l. Por ejemplo, a
partir de (15.4) tenemos

x0 = P0 , x1 = P1 ,
1 1
x2 = (2P2 + P0 ) , x3 = (2P3 + 3P1 ) , (15.5)
3 5
1 1
x4 = (8P4 + 20P2 + 7P0 ) , x5 = (8P5 + 28P3 + 27P1 ) .
35 63
Usando únicamente los términos de (15.5), la serie de potencias (15.1) se puede escribir
por lo tanto como
a2 a3 a4
f (x) = a0 P0 + a1 P1 + (2P2 + P0 ) + (2P3 + 3P1 ) + (8P4 + 20P2 + 7P0 )
3 5 35
a5
+ (8P5 + 28P3 + 27P1 ) + · · ·
63
 a2 a4   3a3 3a5   2a 4a4 
= a0 + + + · · · P0 + a1 + + + · · · P1 + + + · · · P2
2

3 5 5 7 3 7
 3a 4a   8a   8a 
+ + + · · · P3 + + · · · P4 + + · · · P5 + · · ·
3 5 4 5
(15.6)
5 9 35 63
y esto tiene la forma pedida (15.3). Los polinomios de Legendre aparecen en las ciencias
fı́sicas en la variable x = cos θ, de manera que estamos interesados únicamente en el
15.2. Desarrollos ortogonales 371

intervalo −1 ≤ x ≤ +1. Los polinomios son ortogonales en ese intervalo (véase la


ecuación (13.25)),

 +1 ⎨0 si k = l
2
Pk (x)Pl (x) dx = δk,l = 2 (15.7)
−1 2l + 1 ⎩ si k = l ,
2l + 1

y podemos usar esto para obtener una fórmula general para los coeficientes cl de (15.3).
Multiplicamos la ecuación (15.3) por Pk (x) e integramos. Tenemos entonces
 +1  +1

∞ 
∞  +1

Pk (x)f (x) dx = Pk (x) cl Pl (x) dx = cl Pk (x)Pl (x) dx


−1 −1 l=0 l=0 −1

y como, por (15.7), cada integral en el segundo miembro es cero salvo para l = k, sólo
ese término contribuye a la suma:
 +1  +1
2
Pk (x)f (x) dx = ck Pk (x)Pk (x) dx = ck .
−1 −1 2k + 1

Por lo tanto
 +1
2k + 1
ck = Pk (x)f (x) dx . (15.8)
2 −1

Este importante resultado nos da los valores de los coeficientes cl del desarrollo de una
función finita y continua de x (|x| ≤ 1) en serie de los polinomios de Legendre.
Aplicamos ahora la fórmula a la serie de potencias (15.1):
  
2k + 1 
+1 ∞ ∞ +1
2k + 1
ck = Pk (x) al x dx =
l
al Pk (x)xl dx . (15.9)
2 −1 l=0
2 l=0 −1

Sustituyendo en las integrales Pk (x) por su expresión en función de x, a partir de tabula-


ciones como (15.4) o de la expresión general (13.19), obtenemos los coeficientes ck en
función de los coeficientes al .

EJEMPLO 15.1 Use la ecuación (15.9) con k = 0 para hallar c0 .


Tenemos P0 = 1, ası́ que la ecuación (15.9) es
 +1
1

c0 = al xl dx ,
2 l=0 −1

donde ⎧
 +1  l+1
+1 ⎨ 2
x si l es par,
xl dx = = l+1
−1 l+1 −1

0 si l es impar.
372 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier

Por lo tanto
a2 a4 a6  a2l ∞
c0 = a0 + + + + ··· =
3 5 7 l=0
2l + 1
que está de acuerdo con el coeficiente de P0 que aparece en (15.6).

El caso general
Sean gn (x), n = 1, 2, 3, . . . un conjunto de funciones, posiblemente complejas, orto-
gonales en el intervalo a ≤ x ≤ b con respecto a la función peso w(x):
 b

g∗m (x)gn (x) w(x) dx = 0 si m = n (15.10)


a

(para funciones reales g∗m = gm ). Sea f (x) una función



arbitraria
definida en el intervalo
a ≤ x ≤ b, que puede desarrollarse en el conjunto gn (x) ,



f (x) = cn gn (x) . (15.11)


n=0

Entonces, multiplicando por g∗m (x) e integrando con respecto a la función peso w(x) entre
a y b, tenemos
 b 
∞  b

g (x)f (x) w(x) dx =



m cn g∗m (x)gn (x) w(x) dx
a n=0 a
 b

= cm g∗m (x)gm (x) w(x) dx ,


a

de manera que (sustituyendo m por n),


 b

g∗n (x)f (x) w(x) dx


cn =  ab . (15.12)

g (x)gn (x) w(x) dx
n
a

El denominador de esta expresión es la integral de normalización para la función gn (x):


es el cuadrado de la norma

b

||gn || = g∗n (x)gn (x) w(x) dx . (15.13)


a

La norma de una función se interpreta a veces como la ‘magnitud’ o la ‘longitud’ de la


función. Los coeficientes del desarrollo (15.11) para f (x) vienen dados por lo tanto por
15.2. Desarrollos ortogonales 373

 b
1
cn = g∗m (x)f (x) w(x) dx . (15.14)
||gn ||2 a

A menudo es más conveniente que las funciones del desarrollo estén normalizadas,
además de ser ortogonales. La normalización se consigue dividiendo cada función por
su norma,

1
gn (x) = gn (x) . (15.15)
||gn ||

El conjunto de funciones que resulta es un conjunto ortonormal,


 b

gm∗ (x) gn (x) w(x) dx = δm,n . (15.16)


a

El desarrollo (15.11) es entonces



f (x) = cn gn (x) (15.17)


n=0

y la ecuación (15.14) para los coeficientes del desarrollo es


 b

cn = gn∗ (x) f (x) w(x) dx . (15.18)


a

El concepto de desarrollos ortogonales se generaliza fácilmente a funciones de más de


una variable.

Completitud de conjuntos ortogonales


En capı́tulos previos hemos visto varios conjuntos de funciones ortogonales, en parti-
cular las distintas ‘funciones especiales’ del Capı́tulo 13 y las soluciones de la ecuación
de Schrödinger (autofunciones del hamiltoniano) de los Capı́tulos 12 y 14. Todos esos
conjuntos comparten la propiedad

de completitud:
Un conjunto ortonormal g(x) definido en el intervalo a ≤ x ≤ b con respec-
to a una función peso w(x) se dice completo si ‘toda’ función f (x) definida en
el intervalo puede representarse por una combinación lineal de las funciones
del conjunto,


∞  b

f (x) = cn gn (x) , cn = g∗n (x) f (x) w(x) dx . (15.19)


n=0 a

Esta definición de la completitud es suficiente para la mayorı́a de los casos. Hay que
tener en cuenta dos precisiones:
374 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier

(1) Por toda función se entiende no sólo las funciones continuas sino la clase más
general de las funciones continuas a trozos que tienen un número finito de dis-
continuidades finitas y un número finito de máximos y mı́nimos en el intervalo.1
(2) Por la representación de la función se entiende que la función puede aproximarse
con precisión arbitraria mediante una serie finita

f (x) ≈ fk (x) = c0 g0 (x) + c1 g1 (x) + · · · + ck gk (x) (15.20)

y el lı́mite de la serie es tal que


 b 2
f (x) − fk (x) w(x) dx → 0 cuando k → ∞. (15.21)
a

Se dice que la serie converge en media a f (x) y en la práctica puede sustituirse la fun-
ción por la serie, aunque (15.21) no supone que la serie converja necesariamente a f (x)
para todo x. Esta convergencia en media permite representar varias funciones disconti-
nuas, aunque hay que tener cuidado a veces si se plantean igualdades entre derivadas o
integrales de la serie y derivadas o integrales de la función que representa.

15.3. Dos desarrollos en polinomios de Legendre


Vimos en el apartado anterior que una serie de potencias de x puede representarse
como una serie en polinomios de Legendre. Dos ejemplos en las ciencias fı́sicas son

−1/2


(1 − 2xt + t2 ) = tl Pl (x) , −1 ≤ x ≤ +1 , (15.22)


l=0

de importancia en la teorı́a del potencial (teorı́as electrostática y gravitatoria), y



e =
itx
(2l + 1)il jl (t)Pl (x) , (15.23)
l=0

de importancia en teorı́a de la difusión, donde las jl (t) son las funciones de Bessel esféri-
cas (ecuación (13.57)). La serie (15.22) converge para |x| < 1 y |t| < 1, y la obtenemos
en el Ejemplo 15.2. La serie (15.23) converge para |x| < 1 y todo valor de t, y en el
Ejemplo 15.3 mostramos cómo hallarla.

01. Dirichlet fue el primero en demostrarlo para las series de Fourier (‘condiciones de Dirichlet’).
Gustav Peter Lejeune-Dirichlet (1805-1859), matemático alemán, fue influido por el trabajo de Fourier
mientras estudiaba en Parı́s en los primeros años de la década de 1820.
15.3. Dos desarrollos en polinomios de Legendre 375

EJEMPLO 15.2 Deduzca el desarrollo (15.22).


Consideramos la función por desarrollar como una función de t, y la desarrollamos en serie de MacLaurin.
Tenemos

f (t) = (1 − 2xt + t2 )−1/2 f (0) = 1


f  (t) = (x − t)(1 − 2xt + t2 )−3/2 f  (0) = x
f  (t) = 3(x − t)2 (1 − 2xt + t2 )−5/2 − (1 − 2xt + t2 )−3/2 f  (0) = 3x2 − 1

y de forma similar f  (0) = 15x3 − 9x, f  (0) = 105x4 − 90x2 + 9, etcétera.
Comparando esto con los polinomios de Legendre que aparecen en (15.4), vemos que para la derivada
l-ésima: f (l) (0) = l! Pl (x). La serie de MacLaurin

t2  t3 t4
f (t) = f (0) + tf  (0) + f (0) + f  (0) + f  (0) + · · ·
2! 3! 4!
es entonces

f (t) = (1 − 2xt + t2 )−1/2 = P0 + tP1 (x) + t2 P2 (x) + t3 P3 (x) + t4 P4 (x) + · · ·

que es la ecuación (15.22).

EJEMPLO 15.3 Deduzca el desarrollo (15.23).


El desarrollo de la función exponencial nos da

∞
(it)n n 

eitx = x = an xn .
n=0
n! n=0


El correspondiente desarrollo en polinomios de Legendre cl Pl (x) se obtiene usando la expresión (15.9)
 +1
2l + 2 

cl = an Pl (x)xn dx .
2 n=0 −1

Del Ejemplo 15.1 tenemos que, por ejemplo, el coeficiente c0 es


a2 a4 a6
c0 = a0 + + + + ··· ,
3 5 7

de manera que, puesto que an = (it)n /n!,



t2 t4 t6 1 t t3 t5 sen t
c0 = 1 − + − + ··· = − + − ··· = .
3! 5! 7! t 1! 3! 5! t

De las ecuaciones (13.55) y (13.57) se deduce para las funciones de Bessel de orden semientero que

π
c0 = J1/2 (t) = j0 (t) .
2t

Puede demostrarse, ya sea de esta manera o de modo más elegante mediante las ecuaciones diferenciales
que cumplen tanto eitx como jl (t), que el coeficiente general es de la forma cl = (2l + 1)il jl (t).
376 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier

Desarrollo del potencial electrostático


Potencial de una única carga
El potencial electrostático en un punto P debido a la presencia de una carga puntual
q es (véase la figura 15.1)
q
V= , (15.24)
4π0 Rq

donde Rq es la distancia del punto P a la carga (si se sitúa en P


una carga q , la energı́a potencial del sistema de las dos cargas es
Vq = qq /4π0 Rq ; véase el Ejemplo 5.11). Aplicando la regla Figura 15.1
del coseno al triángulo OPq, tenemos que
R2q = r2 + R2 − 2rR cos θ, de manera que podemos expresar (15.24) como

q −1/2
V= (R2 − 2rR cos θ + r2 ) . (15.25)
4π0

Vamos a considerar el caso R > r. Escribimos (15.25) como


     −1/2
q r r
V= 1−2 cos θ +
4π0 R R R

y, por la ecuación (15.22) con t = r/R y x = cos θ, podemos desarrollar esto en polino-
mios de Legendre como

q   r l

r
V= Pl (cos θ) , < 1. (15.26)
4π0 R l=0 R R

Si r > R, el desarrollo es el mismo intercambiando r y R.

Potencial de una distribución de cargas


Sea un sistema de N cargas, q1 en (x1 , y1 , z1 ), q2 en
(x2 , y2 , z2 ), . . . , qn en (xn , yn , zn ), como se muestra en
la Figura 15.2 (para dos cargas). Cada carga hace su
contribución individual al potencial electrostático en el
punto P, y el potencial total en P es la suma de esas con-
tribuciones,


N
qi
V= . (15.27)
i=1
4π0 Ri
Figura 15.2
Si el punto P es exterior a la distribución de cargas, de
manera que R > ri para todo i,
15.4. Series de Fourier 377

el potencial puede desarrollarse término a término como en (15.26):


∞  l  N 
 N
qi  ri 1  1  l

V= Pl (cos θi ) = q r Pl (cos θi ) . (15.28)


i=1
4π0 R l=0 R 4π0 l=0 Rl+1 i=1 i i

Este análisis del potencial es importante para describir la interacción electrostática de


distribuciones de cargas, por ejemplo en la teorı́a de fuerzas intermoleculares. Las can-
tidades

Ql = qi ril Pl (cos θi ) (15.29)
i

en (15.28) se denominan momentos multipolares de orden l, o 2l -polos, de la distribu-


ción de cargas (más estrictamente, Ql es la componente en la dirección OP del multipolo).
El desarrollo (15.28) se llama desarrollo multipolar del potencial. Los primeros mo-
mentos son
N

Q0 = qi carga total Q ,
i=1

N

Q1 = qi ri cos θi momento dipolar µ ,


i=1
 N
1
Q2 = qi ri2 (3 cos2 θi − 1) momento cuadrupolar Θ . (15.30)
i=1
2

EJEMPLO 15.4 Campo de un dipolo


Para el sistema mostrado en la Figura 15.3 de dos cargas opuestas +q y −q separadas entre sı́ una distancia
r:
1. Q0 = +q − q = 0, y la carga total es cero.

1 1
2. Q1 = qr cos θ − qr cos (π + θ) = qr cos θ = µ cos θ ,
2 2
donde µ = qr es el momento (escalar) dipolar del par de cargas, y
µ cos θ es la componente del momento dipolar en la dirección OP.
 r 2 1  r 2 1
3. Q2 = q (3 cos2 θ−1)−q (3 cos2 (π +θ)−1) = 0 ,
2 2 2 2
y puesto que Pl (cos θ) es una función par de cos θ, todo momento Figura 15.3
multipolar de orden par es cero.
El potencial en el punto P es entonces
µ cos θ Q3
V= + + ···
4π0 R2 4π0 R4
Si R es suficientemente grande (R >> r), el desarrollo del potencial puede truncarse después del término
principal,
µ cos θ
V≈ .
4π0 R2
Este es el potencial que domina la interacción de una molécula polar neutra a grandes distancias.
378 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier

15.4. Series de Fourier


La representación en serie de Fourier2 de una función f (x) es un desarrollo de la
función mediante el conjunto de funciones trigonométricas

cos nx , n = 0, 1, 2, . . .
(15.31)
sen nx , n = 1, 2, 3, . . .

en el intervalo −π ≤ x ≤ π (más adelante, en este mismo apartado, consideraremos


intervalos de longitud arbitraria). Estas funciones son ortogonales en el intervalo (y en
cualquier intervalo de longitud 2π),
 +π

cos mx cos nx dx = 0 , m = n , (15.32)


−π

 +π

sen mx sen nx dx = 0 , m = n , (15.33)


−π

 +π

cos mx sen nx dx = 0 , para todos m y n , (15.34)


−π

y las correspondientes integrales de normalización son


 

2π, si n = 0,
cos nx cos nx dx = (15.35)
−π π, si n > 0,
 +π

sen nx sen nx dx = π si n > 0. (15.36)


−π

La serie de Fourier (trigonométrica) se suele escribir por lo general en la forma


a0
f (x) = + a1 cos x + a2 cos 2x + a3 cos 3x +· · ·
2
+ b1 sen x + b2 sen 2x + b3 sen 3x +· · ·
a0 

= + (an cos nx + bn sen nx) , (15.37)


2 n=1

02. Jean-Baptiste Joseph Fourier (1768-1830) estudió la serie en relación con su trabajo sobre la di-
fusión del calor. Presentó primero el trabajo en la Academia francesa en 1807, y lo publicó en su forma
definitiva en 1822 en la Théorie analytique de la chaleur (Teorı́a analı́tica del calor). Su trabajo generó nue-
vos desarrollos en la teorı́a matemática de las funciones, y proporcionó una herramienta nueva y potente
para el análisis y la resolución de problemas fı́sicos.
15.4. Series de Fourier 379

y, dada la ortogonalidad de las funciones del desarrollo, los coeficientes de Fourier


vienen dados por
 +π
1
an = f (x) cos nx dx , (15.38)
π −π

 +π
1
bn = f (x) sen nx dx . (15.39)
π −π

EJEMPLO 15.5 Compruebe las relaciones (15.32) y (15.35).

Por las relaciones trigonométricas (3.22), para m = n,

1
cos mx cos nx = [ cos (m + n)x + cos (m − n)x] ,
2

de manera que
 +π  +π
1
cos mx cos nx dx = [ cos (m + n)x + cos (m − n)x] dx
−π 2 −π
 +π
1 sen (m + n)x sen (m − n)x
= + = 0,
2 m+n m−n −π

y se obtiene cero porque el seno de un múltiplo entero de π es cero.


Para m = n = 0, en que cos mx = cos nx = 1,
 +π
dx = [x]+π
−π = 2π .
−π

Para m = n > 0,
    +π
+π +π
1 1 sen 2nx 
cos2 nx dx = (1 + cos 2nx) dx = x+ = π.
−π −π 2 2 2n −π

Periodicidad
Las funciones trigonométricas (15.31) son funciones periódicas de x con periodo 2π
y, por lo tanto, toda combinación lineal de ellas es también periódica. Esto supone que
la función f (x) puede extenderse a valores fuera del intervalo de base −π ≤ x ≤ π
mediante la relación de periodicidad

f (x + 2π) = f (x) . (15.40)


380 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier

Por ejemplo, la función



sen x para 0≤x≤π
f (x) = (15.41) 1
0 para −π ≤x≤0

que se muestra en la Figura 15.4, puede extenderse me-


diante la relación (15.40) para dar la función periódica
de la Figura 15.5. Figura 15.4

3 2 2 3

Figura 15.5

Las funciones periódicas aparecen en la representación matemática de sistemas fı́si-


cos que poseen fenómenos periódicos. Por ejemplo, la función representada en la Figura
15.5, tomando f (x) como la corriente y x como el tiempo, puede representar el resul-
tado de hacer pasar una corriente alterna a través de un rectificador que permite que la
corriente fluya sólo en una dirección (un rectificador de media onda). A pesar de las
discontinuidades (de la pendiente) que presenta la función, ésta pertenece a una clase
importante de funciones que pueden representarse en serie de Fourier. En el Ejemplo
15.5 tratamos otra de esas funciones.
En general, una función que cumple la relación de periodicidad (15.40) puede de-
sarrollarse en serie de Fourier si es univaluada y continua a trozos, esto es, continua
salvo en un número finito de discontinuidades finitas y con sólo un número finito de
máximos y mı́nimos en cualquier intervalo finito (cualquier función de comportamiento
razonablemente bueno).

EJEMPLO 15.6 Serie de Fourier de la función



1, para 0 < x < π
f (x) = (15.42)
0 para − π < x < 0 .

3 2 2 3
Figura 15.6

La gráfica de la función (extendida), Figura 15.6, muestra que la función es discontinua si x es un


múltiplo de π, y la función puede ser representada por la serie de Fourier (15.37),
15.4. Series de Fourier 381

a0 

f (x) = + (an cos nx + bn sen nx) ,
2 n=1

en cualquier valor salvo en esos puntos de discontinuidad.

Una propiedad de las series de Fourier es que el valor de la serie en un punto de discontinuidad es el valor
medio de la función en ese punto. En el presente caso ese valor medio es 1/2.

Coeficiente a0 . Por la ecuación (15.38) con n = 0,

 +π  0  +π
1 1 1
a0 = f (x) dx = f (x) dx + f (x) dx .
π −π π −π π 0

La función f (x) es cero en la primera de las integrales del segundo miembro, y es igual a
uno en la segunda. Por lo tanto
 +π
1
a0 = dx = 1 . (15.43)
π 0

Coeficientes an , n > 0. Por la ecuación (15.38),

 +π  +π
 π
1 1 1 sen nx
an = f (x) cos nx dx = cos nx dx = = 0. (15.44)
π −π π 0 π n 0

Todos los coeficientes de Fourier an son cero salvo a0 = 1.

Coeficientes bn . Por la ecuación (15.39),

 +π  +π
 π
1 1 1 cos nx 1
bn = f (x) sen nx dx = sen nx dx = − = (1 − cos nπ) .
π −π π 0 π n 0

Tenemos cos nπ = +1 si n es un entero par, y cos nπ = −1 si n es impar. Se deduce que


bn es distinto de cero sólo si n es impar:

2
bn = , n impar. (15.45)

382 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier

Por los resultados (15.43)–(15.45), la serie de Fourier de la función (15.43) es por lo


tanto
a0
f (x) = + b1 sen x + b3 sen 3x + b5 sen 5x + · · ·
2
1 2 sen 3x sen 5x 
= + sen x + + + ··· . (15.46)
2 π 3 5
Para visualizar el comportamiento de la serie, consideramos las aproximaciones con n
términos (sumas parciales):

1 1 2
S1 = S2 = + sen x
2 2 π
1 2 sen 3x  1 2 sen 3x sen 5x 
S3 = + sen x + S4 = + sen x + +
2 π 3 2 π 3 5
...

En la Figura 15.7 representamos las gráficas de las cuatro primeras sumas parciales.

1 1

1 1

Figura 15.7

Figura 15.8
15.4. Series de Fourier 383

Este ejemplo muestra cómo se construye una onda arbitraria por interferencia de ondas armónicas, con
interferencia constructiva (aditiva) en unas regiones e interferencia destructiva (sustractiva) en otras. El
término constante S1 es el valor medio de la función en el intervalo. La aproximación con dos términos, S2 ,
incluye la primera corrección a ese valor medio, y S3 , S4 , . . . incluyen sucesivas correcciones más pequeñas.
En la Figura 15.8 representamos la gráfica de la suma parcial S50 , y se ve claramente cómo se comporta la
serie de Fourier, continua en todos los puntos del intervalo, ante las discontinuidades de la función.

Cambio de periodo
Una función periódica f (x) con periodo 2π se transforma en una función periódica
g(z) con periodo 2l si se sustituye la variable x por πz/l en f (x). Ası́, si
 πz 
f (x) = f = g(z) ,
l
tenemos entonces
π 
f (x + 2π) = f (z + 2l) = g(z + 2l) .
l
Por ejemplo, la función sen x = sen (πz/l) es periódica en x con periodo 2π, y es pe-
riódica en z con periodo 2l.
Este sencillo cambio de variable se usa para generalizar el método de Fourier, ecua-
ciones (15.37) a (15.39), para desarrollar funciones con periodos distintos de 2π. De esta
manera, una función f (x) que es periódica en x con periodo 2l,

f (x) = f (x + 2l) , (15.47)

puede desarrollarse en serie de Fourier como

a0   nπx 

nπx
f (x) = + an cos + bn sen (15.48)
2 n=1
l l

con coeficientes de Fourier


 +l
1 nπx
an = f (x) cos dx , (15.49)
l −l l

 +l
1 nπx
bn = f (x) sen dx . (15.50)
l −l l

El siguiente ejemplo ilustra la serie de Fourier para un periodo arbitrario, y además


prepara el camino para completar la resolución de la ecuación de ondas para la cuerda
vibrante que vimos en el Apartado 14.7.
384 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier

EJEMPLO 15.7 Serie de Fourier de la función



⎪ 2A l

⎪ − (l + x) para − l ≤ x ≤ − ,

⎪ l 2



2Ax l l
f (x) = para − ≤ x ≤ + , (15.51)

⎪ l 2 2





⎩ 2A (l − x) para + l ≤ x ≤ +l .
l 2
La Figura 15.9 muestra que la función f (x) es una función impar
de x, con f ( − x) = −f (x). Se deduce de las propiedades de las
funciones pares e impares del Apartado 5.3 que la integral
Figura 15.9
 +l
f (x)g(x) dx
−l

es cero salvo si g(x) es también una función impar de x, o si contiene una componente impar. De las
funciones del desarrollo (15.48), las funciones seno son impares pero las funciones coseno son pares. Todas
las integrales (15.49) para an son por lo tanto cero, y la serie de Fourier se reduce a la serie de Fourier en
senos para el desarrollo de una función impar:



nπx
f (x) = bn sen , (15.52)
n=1
l

con coeficientes dados por (15.50). También se deduce de lo visto en el Apartado 5.3, ecuación (5.25), que
la integral (15.50) en todo el intervalo −l ≤ x ≤ l es igual a dos veces la integral en el medio intervalo
0 ≤ x ≤ l:

2 +l nπx
bn = f (x) sen dx . (15.53)
l 0 l
Para la función (15.51), tenemos entonces
 l/2  l 
2 nπx nπx
bn = f (x) sen dx + f (x) sen dx
l 0 l l/2 l
  l/2  l 
4A nπx nπx
= 2 x sen dx + (l − x) sen dx ,
l 0 l l/2 l

e integrando por partes




⎪ 0 si n



⎨ 8A
+ si n = 1, 5, 9, 13, . . .
bn = n2 π 2 (15.54)





⎩ 8A
− si n = 3, 7, 11, 15, . . .
n2 π 2
Por lo tanto
8A 1 πx 1 3πx 1 5πx 
f (x) = sen − 2 sen + 2 sen − ··· . (15.55)
π 1
2 2 l 3 l 5 l
15.5. La cuerda vibrante 385

15.5. La cuerda vibrante

Vimos en el Apartado 14.7 que la solución de la ecuación de ondas para la cuerda


vibrante de longitud l es (ecuación (14.103))

 nπx 

y(x, t) = sen An cos ωn t + Bn sen ωn t (15.56)


n=1
l

donde los coeficientes An y Bn se determinan mediante las condiciones iniciales (ecua-


ciones (14.104))



nπx
y(x, 0) = f (x) = An sen ,
n=1
l
  

(15.57)
∂y nπx
= g(x) = Bn ωn sen ,
∂t t=0 n=1
l

siendo f (x) y g(x) las funciones que dan los des-


plazamientos y velocidades que describen el sistema en
el instante t = 0.
Supongamos que, a t = 0, tiramos del centro de
la cuerda y soltamos. En la Figura 15.10 mostramos
el perfil inicial de la cuerda, y la función de los des-
plazamientos es por lo tanto idéntica a la función del
Figura 15.10
Ejercicio 15.6, salvo por estar únicamente definida en
medio intervalo: 0 ≤ x ≤ l. La representación de Fourier de la función viene dada por la
ecuación (15.55):
 
8A 1 πx 1 3πx 1 5πx
y(x, 0) = f (x) = 2 sen − 2 sen + 2 sen − ··· , (15.58)
π 12 l 3 l 5 l

y los coeficientes An de (15.56) son idénticos a los coeficientes de Fourier bn dados por
(15.54). Además, la velocidad inicial de la cuerda es cero en todos sus puntos, de manera
que  
∂y
= g(x) = 0 (15.59)
∂t t=0

y todos los coeficientes Bn de (15.56) son cero. Deducimos entonces que, para las con-
diciones iniciales dadas, el movimiento de la cuerda viene dado por la función de onda

8A πx 1 3πx 1 5πx
y(x, t) = 2 sen cos ω1 t − sen cos ω3 t + sen cos ω5 t − · · · (15.60)
π l 9 l 25 l

donde, por la ecuación (14.96), ωn = nπv/l con v constante. La función (15.60) es


periódica en t con periodo τ = 2π/ω1 = 2l/v. En la Figura 15.11 mostramos el com-
386 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier

portamiento de la función en el primer cuarto del periodo. Hemos obtenido las gráficas
usando la aproximación con 25 términos de la función de onda (términos hasta n = 49).

Figura 15.11

Este comportamiento sorprendente se entiende si consideramos las fuerzas que se


ejercen en cada punto de la cuerda. Como la tensión es uniforme en todas partes, no se
ejerce una fuerza neta en las secciones rectilı́neas. Por lo tanto, la forma esencial de la
cuerda se mantiene, siendo el movimiento determinado por la fuerza instantánea que se
ejerce en los dos puntos donde cambia la pendiente (o el único punto en los puntos de
retroceso del movimiento).

15.6. Transformada de Fourier


En el Apartado 15.4 hemos visto cómo utilizar las series de Fourier para representar
funciones periódicas, pero varias aplicaciones importantes del análisis de Fourier en
las ciencias fı́sicas implican funciones que no son periódicas. El análisis de Fourier de
funciones no periódicas se consigue permitiendo que la longitud del intervalo de base se
haga infinitamente grande, y transformando la serie de Fourier en una integral infinita,
llamada integral de Fourier o transformada de Fourier.

Intervalo infinito
Podemos escribir la serie de Fourier (15.48) para un intervalo arbitrario 2l,
∞  
a0  nπx nπx
f (x) = + an cos + bn sen , (15.61)
2 n=1
l l

como


f (x) = cn (15.62)
n=0

donde
a0 nπx nπx
c0 = , cn = an cos + bn sen , n > 0.
2 l l
15.6. Transformada de Fourier 387

Figura 15.12

Una suma como (15.62) puede considerarse como la suma de las áreas de los rectángulos
de ancho ∆n = 1 y altura cn , como se muestra en la Figura 15.12,



f (x) = cn ∆n . (15.63)
n=0

Hacemos ahora el cambio


π π
yn = n, ∆yn = ∆n . (15.64)
l l
La ecuación (15.61) es entonces
 
a0  

l
f (x) = + an cos xyn + bn sen xyn ∆yn ,
π 2 n=1

que podemos escribir como


 
u(y0 ) 

f (x) = + u(yn ) cos xyn + v(yn ) sen xyn ∆yn (15.65)


2 n=1

con los coeficientes de Fourier dados por (15.49) y (15.50)


 +l
lan 1
u(yn ) = = f (x) cos xyn dx , (15.66)
π π −l

 +l
lbn 1
v(yn ) = = f (x) sen xyn dx . (15.67)
π π −l

Ahora ya podemos tomar l → ∞, y ∆yn → 0. La ecuación (15.65) tiene la forma



f (x) = F(yn ) ∆yn (15.68)


n=0
388 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier

de manera que, según vimos en el Apartado 5.4 para la integral de Riemann como lı́mite
de una suma,


∞  ∞

f (x) = lim F(yn ) ∆yn = F(y) dy


l→∞
0
 ∞
n=0

= u(y) cos xy + v(y) sen xy dy , (15.69)
0

siendo
 +∞
1
u(y) = f (x) cos xy dx (15.70)
π −∞

 +∞
1
v(y) = f (x) sen xy dx (15.71)
π −∞

tras tomar el lı́mite en (15.66) y en (15.67). Llamamos integral de Fourier a la repre-


sentación de f (x) en la forma (15.69) (se reserva la expresión transformada de Fourier
normalmente para una forma ligeramente distinta, como veremos más adelante). *

EJEMPLO 15.8 Onda cuadrada



A para − k < x < +k
f (x) = (15.72)
0 en el resto
en el intervalo −l ≤ x ≤ +l, con k ≤ l.
La Figura 15.13 muestra que la función es una función par de x, y
puede por lo tanto ser representada en el intervalo −l ≤ x ≤ +l por
la serie de Fourier en cosenos
l k k l
a0 

nπx
f (x) = + an cos
2 n=1
l Figura 15.13

donde  
l k
2 nπx 2A nπx 2Ak sen (nπk/l)
an = f (x) cos dx cos dx = ,
l 0 l l 0 l l (nπk/l)
2Ak
para n > 0, y tomando el lı́mite n → 0, a0 = . La representación en serie de Fourier de la función en
l
el intervalo finito es por lo tanto

2Ak 1  sen (nπk/l)

nπx
f (x) = + cos .
l 2 n=1 (nπk/l) l

0* La ‘deducción’ que damos aquı́ de (15.69) es sólo esquemática, aunque suficiente para la mayorı́a
de los casos. Hemos pasado por alto todo lo relacionado con las posibles discontinuidades de la función y
con la existencia del lı́mite.
15.6. Transformada de Fourier 389

Para hallar el valor de esta expresión en el lı́mite l → ∞, hacemos el cambio


yn = nπ/l , ∆yn = π/l .
Tenemos entonces 
2Ak 1  sen (kyn )

f (x) = + cos xyn ∆yn (15.73)
π 2 n=1 (kyn )
y, en el lı́mite l → ∞, 
2Ak ∞ sen (ky)
f (x) = cos xy dy (15.74)
π 0 (ky)
(el término constante, correspondiente a n = 0, no contribuye).
Esta representación de la función por una integral de Fourier en coseno puede ponerse en la forma
(15.69) como  ∞
f (x) = u(y) cos xy dy (15.75)
0
con u(y) dado por (15.70). En efecto:
 
1 +∞ 2 ∞
u(y) = f (x) cos xy dx = f (x) cos xy dx
π −∞ π 0

2A k 2Ak sen (ky)
= cos xy dx = , (15.76)
π 0 π (ky)
como es necesario por (15.74).

Forma exponencial
Podemos poner en forma exponencial la representación de una función por medio de
la integral de Fourier, ecuaciones (15.69) a (15.71), usando las relaciones de Euler

1  ixy  1  ixy 
cos xy = e + e−ixy , sen xy = e − e−ixy . (15.77)
2 2i
Definimos la función
1
w(y) = [u(y) − iv(y)] . (15.78)
2
Hemos visto en el Ejemplo 15.8 que la ecuación (15.69) puede escribirse entonces como
 +∞

f (x) = w(y)eixy dy (15.79)


−∞

con
 +∞
1
w(y) = f (x)e−ixy dx (15.80)
2π −∞

en vez de las ecuaciones (15.70) y (15.71).


390 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier

EJEMPLOS 15.9 Obtención de la forma exponencial


Sustituyendo las relaciones de Euler (15.77) en (15.69) tenemos
     
1 ∞
f (x) = u(y) eixy + e−ixy − iv(y) eixy − e−ixy dy
2 0
 ∞  ∞
1 1
= [u(y) − iv(y)]eixy dy + [u(y) + iv(y)]e−ixy dy
2 0 2 0
o, cambiando y por −y en la segunda integral del segundo miembro,
 
1 ∞ 1 0
f (x) = [u(y) − iv(y)]eixy dy + [u( − y) + iv( − y)]eixy dy .
2 0 2 −∞

De las ecuaciones (15.70) y (15.71) tenemos que

u( − y) = u(y), v( − y) = −v(y),

y por lo tanto  
∞ +∞
1
f (x) = [u(y) − iv(y)] eixy dy = w(y)eixy dy
2 −∞ −∞
siendo  +∞
1 1
w(y) = [u(y) − iv(y)] = f (x)e−ixy dy .
2 2π −∞

Pares de transformadas de Fourier


Las ecuaciones (15.79) y√(15.80) se escriben normalmente en forma más simétrica
mediante el cambio g(y) = 2πw(y), siendo entonces
 +∞
1
f (x) = √ g(y)eixy dy , (15.81)
2π −∞

 +∞
1
g(y) = √ f (x)e−ixy dx . (15.82)
2π −∞

Dos funciones relacionadas por las ecuaciones (15.81) y (15.82) forman un par de trans-
formadas de Fourier. Se dice que la función g es la transformada de Fourier de la fun-
ción f , y f se dice que es la transformada (inversa) de g. En general, la transformada
de Fourier de una función f (x) existe si la función es continua a trozos y es integrable
absolutamente, es decir, si
 +∞
|f (x)| dx
−∞

existe. En las Figuras 15.14 presentamos tres pares de transformadas de Fourier elemen-
tales.
15.6. Transformada de Fourier 391

Figura 15.14. Pares de transformadas de Fourier

EJEMPLO 15.10 Halle la transformada de Fourier de la función exponencial (Figura 15.14c)


f (x) = e−ax con x > 0 y a > 0.
Por la ecuación (15.82)
 +∞  ∞  +∞
1 1 1
g(y) = √ f (x)e−ixy dx = √ e−ax e−ixy dx = √ e−(a+iy)x dx .
2π −∞ 2π 0 2π 0

La presencia de un exponente complejo no altera la regla habitual para integrar la exponencial, por lo tanto
 −(a+iy)x ∞  
1 −e 1 1
g(y) = √ = √
2π a + iy 0 2π a + iy

ya que e−(a+iy)x = e−ax e−iyx → 0 cuando x → ∞. La transformada de Fourier es compleja y para hallar su
parte real escribimos
   
1 a − iy 1 a − iy
g(y) = √ = √ .
2π (a + iy)(a − iy) 2π a2 + y2
392 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier

Con esto  
1 a
Re g(y) = √ . (15.83)
2π a2 + y2
Esta función se denomina Lorentziana, y da la forma de las lı́neas espectrales en espectroscopia de trans-
formada de Fourier.

En aplicaciones en las ciencias fı́sicas, las variables x e y son generalmente un par de


variables conjugadas. Los más importantes son el par posición-momento, como por
ejemplo la coordenada x y su momento conjugado, el momento lineal px , y el par tiempo-
frecuencia (o tiempo-energı́a). La transformada de Fourier es entonces una transforma-
ción de la descripción de un sistema fı́sico desde el espacio (o dominio) de una de las
variables de un par conjugado al espacio de la otra variable. La transformación de mo-
mentos a posiciones mediante la transformada de Fourier es una herramienta básica para
analizar los resultados de los experimentos de difracción: las estructuras de difracción
que se observan son la representación de la estructura del sistema en el espacio de mo-
mentos y la transformada de Fourier da la estructura en el espacio ordinario (de posi-
ciones). De mayor importancia en quı́mica es la transformación de tiempo a frecuencia
porque es la base de la espectroscopia de resonancia magnética de transformada de Fou-
rier. En esos experimentos, las moléculas de una muestra (u otras especies con grados
de libertad excitables) se excitan mediante un corto pulso de radiación, y se observa el
sistema mientras se relaja hacia su estado termodinámico estable.
La relajación es básicamente un proceso cinético de primer orden y en su caso más
sencillo, cuando las moléculas sólo pueden experimentar transiciones en una frecuencia,
digamos que ω0 , la intensidad de la señal de salida muestra un decrecimiento exponencial
en función del tiempo:

I(t) = e−t/T , (15.84)

siendo T el tiempo de relajación. Este es un ejemplo del caso (c) de la Figura 15.14, con
x como el tiempo t e y como la frecuencia ω. La transformada de Fourier de la curva de
decrecimiento es por lo tanto una curva lorentziana (véase el ejemplo 15.9)
 ∞  
1 1 T
F(ω) = Re √ I(t)e dt = √
−iωt
. (15.85)
2π 0 2π 1 + ω 2 T 2

El ancho de esta ‘lı́nea espectral’ es inversamente proporcional al tiempo de relajación


T. Su posición (en ω0 ) se determina en la práctica por la estructura fina de la señal de
salida, como se explica en el Ejemplo 15.10.

EJEMPLO 15.11 Halle la parte real de la transformada de Fourier de la onda armónica amortiguada
exponencialmente, Figura 15.15,

f (x) = e−ax cos bx , con x > 0 y a > 0.


15.7. Ejercicios 393

Por la ecuación (15.82),


 +∞
1
g(y) = √ f (x)e−ixy dx
2π −∞
 ∞
1
= √ e−ax cos bxe−ixy dx ,
2π 0

o, puesto que cos bx = (eibx + e−ibx )/2, Figura 15.15


o, puesto que cos bx = (eibx + e−ibx )/2,
 ∞   
1 1 1 1
g(y) = √ e−(a+ib−iy)x + e−(a−ib−iy)x dx = √ + .
2 2π 0 2 2π a + ib − iy a − ib − iy
La parte real de esto es (véase el Ejemplo 15.9)
 
1 a a
Re g(y) = √ + 2 . (15.86)
2 2π a2 + (b − y)2 a + (b + y)2
Si sustituimos (x, y, a, b) por (t, ω, 1/T, ω0 ) en (15.86), obtenemos el par de transformadas de Fourier
 
−t/T 1 T T
f (t) = e cos ω0 t , g(ω) = √ + .
2 2π 1 + (ω − ω0 )2 T 2 1 + (ω + ω0 )2 T 2
El segundo término de g(ω) es en la práctica pequeño, comparado con el primero, y la función se reduce
entonces a una lorentziana centrada en ω = ω0 .

15.7. Ejercicios
Apartado 15.2

1. Dada la serie de potencias


f (x) = a0 + a1 x + a2 x2 + · · ·
use la ecuación (15.9) para hallar el coeficiente c1 de P1 (x) del desarrollo (15.3) de f (x) mediante polinomios
de Legendre (véase el Ejemplo 15.1 para c0 ).
2. (i) Halle los tres primeros términos del desarrollo de la función

0, si − 1 < x < 0
f (x) =
x, si 0<x<1
mediante polinomios de Legendre.
(ii) Dibuje las gráficas de f (x), y de las aproximaciones con uno, dos y tres términos en polinomios
de Legendre.

Apartado 15.3

3. Use la ecuación (15.9) para demostrar que el coeficiente de P1 (x) en el desarrollo de




eitx = cl Pl (x)
l=0

1  sen t 
es c1 = 3ij1 (t) siendo j1 (t) = − cos t (véase el Ejemplo 15.3 para c0 ).
t t
394 Capı́tulo 15. Desarrollos ortogonales. Análisis de Fourier

4. Halle el primer término no nulo del desarrollo en potencias de


1/R para el potencial en el punto P del sistema de tres cargas que se
muestra en la figura.

Apartado 15.4
5. Se define una función con periodo 2π como
 π
1, si − 2
< x < π2 ,
f (x) = π
0, si 2
< |x| < π.

(i) Dibuje la gráfica de la función en el intervalo −3π < x < 3π.


(ii) Halle la serie de Fourier de la función [sugerencia: f (x) es una función par de x].
(iii) Use la serie para demostrar que
π 1 1 1
= 1 − + − + ···
4 3 5 7
[sugerencia: sustituya en la serie x por un valor adecuado].

6. Se define una función con periodo 2π como

f (x) = x, −π < x < π.

(i) Dibuje la gráfica de la función en el intervalo −3π < x < 3π.


(ii) Halle la serie de Fourier de la función [sugerencia: f (x) es una función impar de x].
(iii) Dibuje las gráficas de las tres primeras sumas parciales de la serie.

7. Se define una función con periodo 2π como

f (x) = x2 , −π < x < π.

(i) Dibuje la gráfica de la función en el intervalo −3π < x < 3π.


(ii) Halle la serie de Fourier de la función.
(iii) Use la serie para demostrar que

π2  1 ∞
1 1 1
= 2
=1+ + + + ···
6 n=1
n 4 9 16

π2  (– 1)n+1

1 1 1
= 2
=1− + − + ···
12 n=1
n 4 9 16

8. (i) Demuestre que la serie de Fourier de



sen x, si 0≤x≤π
f (x) =
0, si −π ≤x≤0

(Figura 15.4) es 
4 1 cos 2x cos 4x cos 6x
− − − − ···
π 2 1·3 3·5 5·7
(ii) Use la serie para demostrar que
π 1 1 1 1
= + − + − ···
4 2 1·3 3·5 5·7
15.7. Ejercicios 395

9. Halle la serie de Fourier de la función


f (x) = x(l − x)
en el intervalo 0 ≤ x ≤ l que tiene únicamente senos (la serie de Fourier en
senos).
[Sugerencia: extienda la función como una función impar de x como se muestra
en la figura.]

Apartado 15.5
10. Halle la solución de la ecuación de difusión
∂T ∂2T
=D 2
∂t ∂x
en el intervalo 0 ≤ x ≤ l que cumple las condiciones de contorno e inicial

T(0, t) = T(l, t) = 0 (t ≥ 0), T(x, 0) = x(l − x) ,

y que decrece exponencialmente con el tiempo. (Véase el Ejercicio 16 del Capı́tulo 14 y el ejercicio 9 ante-
rior.)

Apartado 15.6
Halle la transformada
 de Fourier para:
1, para a < x < b,
11. f (x) = 12. e−a|x| (a > 0).
0, en el resto.
2
13. Demuestre que la transformada de Fourier de e−ax (a > 0) es
1 2
√ e−y /4a (Figura 15.14b)
2a
 
√ iy ∞ 2 π 
Sugerencia: cambie a la variable t = ax + √ y use e−αt dt = .
2 a −∞ α
 Vectores

16.1. Conceptos
Cantidades fı́sicas como la masa, la temperatura o la distancia tienen valores que se
especifican por un único número real en las unidades apropiadas: por ejemplo, 3 kg, 273
K o 12 m. Tales cantidades, que tienen sólo magnitud, se denominan cantidades escala-
res y siguen las reglas del álgebra de los números reales. Otras cantidades fı́sicas, llama-
das vectores, requieren una magnitud y también una dirección para ser especificadas.
Por ejemplo, la velocidad mide la rapidez de movimiento en una dirección dada. Otros
ejemplos son la fuerza, el campo eléctrico, el campo magnético o el desplazamiento.
Para ser vectores, esas cantidades tienen que cumplir las reglas del álgebra vectorial.1
La notación vectorial y el álgebra vectorial son importantes para la formulación y re-
solución de problemas fı́sicos en tres dimensiones: en mecánica, dinámica de fluidos,
teorı́a electromagnética y dibujo técnico. Tratamos algunas de esas aplicaciones de los
vectores, de importancia en dinámica molecular, espectroscopia y quı́mica teórica, en
diversos ejemplos a lo largo de este capı́tulo.
Un vector se representa gráficamente como un segmento de recta orientado, esto es,
un segmento de recta cuya longitud es la magnitud del vector, en las correspondientes
unidades, y cuya orientación en el espacio, junto con una flecha que indica el sentido, da
la dirección.

Figura 16.1

La figura 16.1 muestra dos representaciones gráficas del mismo vector, y dos nota-
ciones. En (a), el vector a se representa por una flecha; en (b), A es el origen y B el

01. El álgebra vectorial tiene su origen en el álgebra de cuaterniones descubierta por Hamilton en
1843 y en la teorı́a sobre espacios vectoriales de dimensión n de Grassmann de 1844. Debemos a Gibbs la
notación moderna de vectores en tres dimensiones.
William Rowan Hamilton (1805-1865), nacido en Dublı́n, tuvo fama de haber dominado el latı́n, el grie-
go, las lenguas europeas modernas, el hebreo, el persa, el árabe, el sánscrito y otras lenguas con diez años.
Ingresó en el Trinity College de Dublı́n en 1823 y en 1827, sin haberse graduado aún, fue nombrado As-
trónomo Real de Irlanda y Catedrático de Astronomı́a. Es sobre todo conocido por su reformulación y
generalización de la mecánica de Newton, Euler y Lagrange que se hizo importante en la formulación de
las mecánicas estadı́stica y cuántica.
398 Capı́tulo 16. Vectores



extremo del vector, y la notación AB es particularmente útil cuando el vector es un des-
plazamiento en el espacio. La longitud, magnitud o módulo de a se escribe como |a| o
sencillamente a (un escalar). Un vector de longitud cero se llama vector nulo, 0, y en
ese caso no se asigna ninguna dirección.
Las Figuras 16.2(a) y (b) ilustran varios tipos de vectores asociados con el movimien-
to de un cuerpo sobre una curva PQ en el espacio, bajo la acción de fuerzas exteriores.


En la Figura (a), la posición del punto A de la curva viene dada por a = OA, cuyo origen
es el origen de coordenadas y cuyo extremo está en A. El vector a se llama vector de
posición y su valor (tanto en magnitud como en dirección) cambia a medida que el cuer-
po recorre la curva. Cuando el cuerpo se ha movido de A a B el vector de posición ha


variado de a a b, y el desplazamiento desde A hasta B viene dado por el vector c = AB.
Veremos que el álgebra vectorial nos da c = b − a, esto es, que el desplazamiento desde
A hasta B es igual a la variación del vector de posición. Vemos que un vector de posición
es un tipo de vector de desplazamiento, pero con su origen situado siempre en un punto
fijo que es el origen de un sistema de coordenadas.

Figura 16.2

En cada punto de la curva PQ, el cuerpo tiene velocidad v en la dirección de movi-


miento en ese punto. Es decir, la dirección de v en cada punto de la curva es tangente a la
curva. La Figura (b) muestra las velocidades en los puntos A y B, y también las fuerzas
que actúan sobre el cuerpo en esos puntos.

16.2. Álgebra vectorial

Igualdad

Dos vectores a y b son iguales,

a = b, (16.1)

si tienen misma longitud y misma dirección. Los orı́genes de vectores iguales sólo tienen
que coincidir si se trata de vectores ligados, como por ejemplo vectores de posición. De
esa manera dos cuerpos separados que se mueven con la misma velocidad en la misma
dirección tienen vectores velocidad iguales.
16.2. Álgebra vectorial 399

Suma de vectores
La suma, o resultante, a + b de los vectores a y b se define geométricamente en la
Figura 16.3. En (a) los vectores se sitúan de manera que el origen de b coincida con el
extremo de a. La suma a + b es entonces igual al vector trazado desde el origen de a al
extremo de b. La Figura (b) muestra que la suma es conmutativa, con

a + b = b + a. (16.2)

Figura 16.3

En este caso a y b definen los pares de lados paralelos de un paralelogramo, y se dice


que la suma de vectores cumple la ley del paralelogramo. Si a y b son los desplaza-
mientos de un cuerpo, su suma a + b es el desplazamiento total. Si a y b son dos fuerzas
que actúan sobre un cuerpo, a + b es la fuerza total. La ley del paralelogramo se llama
entonces ‘paralelogramo de fuerzas’.2

Resta
Si a + b = 0, siendo 0 el vector nulo, entonces b = −a
es un vector con la misma longitud que a, |b| = |a|, pero
que apunta en la dirección contraria. La resta de vectores
se define entonces como (Figura 16.4)

a + (– b) = a − b . (16.3)
Figura 16.4

Multiplicación por un escalar


El vector a + a = 2a tiene dos veces la longitud de a y tiene la misma dirección. En
general, el producto de un escalar (un número) c y un vector a se representa por ca. Tiene
c veces la longitud de a, tiene la misma dirección que a si c es positivo, y la dirección
opuesta si c es negativo (Figura 16.5)

02. Herón de Alejandrı́a (siglo I de nuestra era) describió el paralelogramo de velocidades en su


Mecánica, pero también aparece en un trabajo atribuido a Aristóteles (384-322 a.C.).
400 Capı́tulo 16. Vectores

Figura 16.5

Si c = 0 entonces ca = 0, y la dirección no está definida. Un vector a dividido por


su longitud |a| es el vector unitario â que tiene la misma dirección que a:
a
â = (16.4)
|a|

Los vectores unitarios se utilizan a menudo para definir direcciones.

EJEMPLO 16.1 Demuestre que las diagonales de un paralelogramo se cortan en su centro.


En la figura 16.6, C es el centro de la diagonal OD, y C es el centro de AB. Entonces

− 1−→ 1 −
→ − →
 1
OC = OD = OA + AD = (a + b) .
2 2 2
Por otra parte
→
− → −
− → 1
OC = OA + AC  = a + AB .
2


Pero se cumple AB = b − a. Por lo tanto
→
− 1 1 →

OC = a + (b − a) = (a + b) = OC Figura 16.6
2 2

y por lo tanto los dos centros C y c coinciden.

EJEMPLO 16.2 Demuestre que el promedio de los vectores de posición de los vértices de un triángulo
es el vector de posición del baricentro del triángulo.
En la figura 16.7, los vértices A y B tienen posiciones (vectores de posición) a y b con respecto al vértice O
(con vector de posición nulo 0). El promedio de los vectores de posición de los vértices es por lo tanto

− 1 −→ − → − →
 1 1
OX = OO + OA + OB = (0 + a + b) = (a + b) .
3 3 3


Hemos visto en el Ejemplo 16.1 que si C es el centro de AB entonces OC = (a + b)/2. Por lo tanto

− 2 −

OX = OC
3
y el promedio está en la recta que une el vértice O con el centro del lado opuesto. Algo similar ocurre con
la posición respecto a los otros dos vértices, de manera que X está en la intersección de esas tres rectas, y
eso corresponde al baricentro del triángulo.

Figura 16.7
16.3. Componentes de los vectores 401

16.3. Componentes de los vectores


La componente de un vector en una dirección dada
es la longitud de su proyección sobre esa dirección.
En la Figura 16.8, la componente de a a lo largo de
la dirección OP es la longitud

ON = |a| cos θ . (16.5)


Figura 16.8

El concepto de componente es esencial en el uso práctico de los vectores para resolver


problemas fı́sicos en tres dimensiones.
Empezamos considerando el caso más sencillo de vectores en un plano, con un siste-
ma de coordenadas cartesiano.

Figura 16.9 Figura 16.10

Sean (x1 , y1 ) y (x2 , y2 ) respectivamente, el origen y el extremo de a en el plano xy,


como se muestra en la Figura 16.9. La componente (cartesiana) del vector en la dirección
x es ax = x2 −x1 , y la componente en la dirección y es ay = y2 −y1 . Esas dos componentes
bastan para especificar el vector de manera única. En efecto, la longitud del vector es
|a| = a2x + a2y , y la dirección viene dada por la pendiente ay /ax . Escribimos el vector
mediante sus componentes cartesianas como

a = (ax , ay ) . (16.6)

Además, si designamos las direcciones x e y por los vectores unitarios i y j, como en la




Figura 16.10, tenemos que a = OP puede expresarse como la suma de los dos vectores

→ →

OQ = ax i en la dirección x (ax veces el vector unitario i en la dirección x) y QP = ay j en
la dirección y:

a = a x i + ay j . (16.7)

Más generalmente, un vector en tres dimensiones (Figura 16.11) puede especificarse por
sus componentes, ax , ay y az , en las tres direcciones cartesianas i, j y k (k es el vector
unitario en la dirección z). Escribimos

a = (ax , ay , az ) = ax i + ay j + az k . (16.8)
402 Capı́tulo 16. Vectores

Figura 16.11

Las reglas del álgebra vectorial pueden entonces formularse mediante las componen-
tes de los vectores, y es ésta la forma en que los vectores se usan para resolver problemas
fı́sicos.3 Sean los vectores

a = (ax , ay , az ) , b = (bx , by , bz ) .

Figura 16.12

(i) Igualdad. Los vectores son iguales si lo son las correspondientes componentes:

a=b si a x = b x , ay = by y az = b z . (16.9)

(ii) Suma. La suma a + b se obtiene sumando las correspondientes componentes:

a + b = (ax + bx , ay + by , az + bz ) . (16.10)

Representamos esto en la Figura 16.12 para vectores en el plano.

03. Hamilton descubrió los cuaterniones en su búsqueda de un álgebra de números complejos tri-
dimensionales. Tienen la forma a + bi + cj + dk, con las reglas de combinación i2 = j2 = k2 = −1,
ij = k = −ji, jk = i = −kj, ki = j = −ik. Hamilton llamó parte escalar a a y parte vectorial a bi + cj + dk.
Descubrió las reglas mientras paseaba con su mujer a lo largo del Canal Real el 16 de octubre de 1843, un
lunes, y las grabó sobre una piedra del puente de Brougham.
16.3. Componentes de los vectores 403

(iii) Multiplicación por un escalar. El producto ca del escalar c y el vector a se


obtiene multiplicando cada componente de a por c:

ca = (cax , cay , caz ) . (16.11)

EJEMPLO 16.3 Dados a = (2, 3, 1), b = (1, −2, 0) y c = (5, 2, −1), halle: (a) d = 2a + 3b − c y (b) |d|.

(a) Si d = (dx , dy , dz ), entonces

dx = 2ax + 3bx − cx = (2 × 2 + 3 × 1 − 5) = 2,

dy = 2ay + 3by − cy = (2 × 3 + 3 × (– 2) − 2) = −2,


dz = 2az + 3bz − cz = (2 × 1 + 3 × 0 − (– 1)) = 3,
y d = (2, −2, 3).
  √
(b) |d| = dx2 + dy2 + dz2 = 22 + (– 2)2 + 32 = 17 .

La ecuación (16.9) para la igualdad entre vectores y el ejemplo 16.3 muestran que, para
vectores en tres dimensiones, una ecuación vectorial es equivalente a un sistema de tres
ecuaciones escalares, una por cada componente. Inversamente, las tres ecuaciones esca-
lares se representan por una única ecuación vectorial. El álgebra vectorial proporciona
un método potente para formular y resolver problemas fı́sicos que implican cantidades
vectoriales. A menudo sólo es necesario recurrir a ecuaciones en componentes cuando
la resolución del problema necesita ser completada con los valores numéricos de las
componentes.

EJEMPLO 16.4 El centro de masas de un sistema de N masas, m1 con vector de posición r1 (‘en la
posición r1 ’), m2 en r2 , . . . , mN en rN (Figura 16.13) es

1 
N
1
R= (m1 r1 + m2 r2 + · · · + mN rN ) = mi ri ,
M M i=1
(16.12)

N
siendo M = mi la masa total.
i=1

Las componentes cartesianas del vector de posición r de un pun-


to son las coordenadas cartesianas del punto: r = (x, y, z). La
ecuación vectorial (16.12) corresponde por lo tanto a tres ecua-
ciones (escalares) ordinarias, una para cada coordenada de R:
Figura 16.13

1  1  1 
N N N
X= mi x i Y= mi y i Z= mi zi (16.13)
M i=1 M i=1 M i=1

(véase la ecuación (5.40) para el caso unidimensional).


404 Capı́tulo 16. Vectores

EJEMPLO 16.5 Momentos dipolares


El sistema de dos cargas de la Figura 16.14, con −q en r1 y q en r2 , define un dipolo eléctrico con vector
momento dipolar
µ = −qr1 + qr2 = q(r2 − r1 ) = qr . (16.14)
Más generalmente, un sistema de N cargas, q1 en r1 , q2 en r2 . . . , qN en
rN , tiene un momento dipolar con respecto al origen O, como punto de
referencia,


N
µ = (q1 r1 + q2 r2 + · · · + qN rN ) = qi ri . (16.15)
i=1
Figura 16.14

Esta cantidad depende de la posición del punto de referencia si la carga total Q = qi no es cero. En
efecto, la posición de la carga qi con respecto al punto R es ri − R, y el momento dipolar del sistema de
cargas con respecto a R es


N 
N 
N
µ (R) = qi (ri − R) = qi ri − qi R = µ (0) − QR , (16.16)
i=1 i=1 i=1

con µ (R) = µ (0) sólo si Q = 0.


Un sistema de dipolos eléctricos con momentos µ1 , µ2 , . . . , µN , tiene un momento dipolar total


N
µ = µ1 + µ2 + · · · + µN = µi . (16.17)
i=1

Por ejemplo, el momento dipolar total de una molécula se interpreta a veces como la suma (vectorial) de
‘momentos de enlace’: se asocia un momento dipolar con cada enlace. En algunos casos de gran simetrı́a el
momento dipolar total puede anularse: los momentos de los enlaces se cancelan unos con otros. Por ejemplo,
la molécula de metano en su estado estable tiene sus cuatro hidrógenos en los vértices de un tetraedro
regular, con el carbono en el centro. Si uno de los vértices se sitúa en la ‘posición 111’, con r1 = (a, a, a),
las posiciones de los otros vértices son r2 =
√ (a, −a, −a), r3 = (– a, a, −a) y r4 = (– a, −a, a). La longitud
de cada uno de esos vectores de enlace es 3a, la distancia de enlace de CH. El momento dipolar de cada
enlace está en la dirección del propio enlace, y es por lo tanto proporcional al vector de enlace, µ i = kri
(i = 1, 2, 3, 4), y el momento dipolar total es

µ = µ1 + µ2 + µ3 + µ4
= k (r1 + r2 + r3 + r4 )
= k(a + a − a − a, a − a + a − a, a − a − a + a)
= k(0, 0, 0)
= 0.

Vectores de la base
Los vectores unitarios cartesianos i, j y k, en las direcciones x, y y z, tienen las com-
ponentes

i = (1, 0, 0), j = (0, 1, 0), k = (0, 0, 1) . (16.18)


16.4. Derivada escalar de un vector 405

Las reglas (16.10) y (16.11) confirman que todo vector del espacio tridimensional se
puede expresar como combinación lineal de estos tres vectores de la base:

a = a x i + ay j + az k
= ax (1, 0, 0) + ay (0, 1, 0) + az (0, 0, 1)
(16.19)
= (ax , 0, 0) + (0, ay , 0) + (0, 0, az )
= (ax , ay , az ) .

EJEMPLO 16.6 Dados a = 2i + 3j + k y b = i − 2j, halle d = 2a + 3b.

Tenemos: d = 2a + 3b = 2(2i + 3j + k) + 3(i − 2j) = (4i + 6j + 2k) + (3i − 6j)


= 7i + 2k .

Si bien los vectores unitarios cartesianos proporcionan la representación más empleada


para vectores en tres dimensiones, otras representaciones pueden ser más útiles en al-
gunos casos. De hecho, tres vectores cualesquiera no coplanares pueden ser utilizados
como base: si a, b y c son esos tres vectores, no necesariamente unitarios ni perpendicu-
lares, entonces cualquier otro vector del espacio puede escribirse como

v = va a + vb b + vc c . (16.20)

Los números va , vb y vc son las componentes de v en


las direcciones de los vectores de la base. Un ejem-
plo del uso de bases no cartesianas lo encontramos
en cristalografı́a, en la descripción de las propieda-
des de una red regular. En ese caso a, b y c definen
los ejes del cristal y la celda unidad, y todo punto de
la red tiene un vector de posición (16.20) con com-
ponentes enteras. En la Figura 16.15 ilustramos esto
para una red plana.
Figura 16.15

16.4. Derivada escalar de un vector


Un vector a = a(t) es una función de la variable es-
calar t si su magnitud, o su dirección, o ambas, de-


penden del valor de t. En la Figura 16.16, OA = a(t)


y OB = a(t + ∆t) son los vectores para los valores t
y t + ∆t de la variable. La variación del vector en el
intervalo ∆t es

∆a = a(t + ∆t) − a(t)

y la derivada del vector con respecto a t se define de


la manera habitual por el lı́mite (si el lı́mite existe) Figura 16.16
406 Capı́tulo 16. Vectores

  
da ∆a a(t + ∆t) − a(t)
= lim = lim . (16.21)
dt ∆t→0 ∆t ∆t→0 ∆t
Tomar el lı́mite corresponde a hacer que el punto B se acerque al punto A sobre la curva definida por a(t).


La dirección AB = ∆a se acerca a la de la tangente a la curva en A, y ésta es la dirección de la derivada en
A.
Utilizando las componentes del vector, si tomamos a = ax i + ay j + az k, siendo i, j y k vectores cons-
tantes, la dependencia de a con t es la de sus componentes:
a(t) = ax (t)i + ay (t)j + az (t)k , (16.22)
y      
da dax day daz
= i+ j+ k. (16.23)
dt dt dt dt

Representación paramétrica de una curva


Si r = r(t) es el vector de posición de un punto para cada valor
de t en algún intervalo, entonces, dado un sistema de coordena-
das cartesianas,

r(t) = x(t)i + y(t)j + z(t)k (16.24)

es una representación paramétrica de una curva C en el es-


pacio tridimensional, y t es el parámetro de la representación
(Figura 16.17). El sentido positivo en C se define como el que
corresponde a valores de t crecientes, y define una orientación
dr Figura 16.17
de la curva. La tangente a la curva tiene dirección .
dt

EJEMPLO 16.7 La elipse


La función vectorial
r(t) = (a cos t , b sen t , 0) = (a cos t)i + (b sen t)j
representa una elipse en el plano xy, con centro en el origen y ejes principales en las direcciones x e y. La
ecuación vectorial corresponde a las ecuaciones paramétricas escalares
x(t) = a cos t , y(t) = b sen t , z(t) = 0 ,

(véase el Ejemplo 9.13 para la circunferencia, cuando a = b).

EJEMPLO 16.8 Velocidad, momento y aceleración


Si r = r(t) es el vector de posición de un cuerpo en el espacio, y el parámetro t es la variable tiempo,
dr
entonces = ṙ es la velocidad del cuerpo,
dt
     
dr dx dy dz
v= = i+ j+ k
dt dt dt dt (16.25)
= vx i + v y j + v z k
siendo vx , vy y vz las componentes de la velocidad en las tres direcciones cartesianas. Por lo tanto la veloci-
dad es la tasa de variación de la posición. La magnitud de la velocidad es entonces

v = |v| = v2x + v2y + v2z (16.26)


16.5. Producto escalar 407

y la energı́a cinética del cuerpo es


1 2 1  
T= mv = m v2x + v2y + v2z . (16.27)
2 2
La aceleración del cuerpo es la tasa de variación de la velocidad,

dv d2 r
a = = 2
dt dt
     
dvx dvy dvz
= i+ j+ k (16.28)
dt dt dt
 2   2   2 
d x d y d z
= i + j + k.
dt2 dt2 dt2

La forma vectorial de la segunda ley de Newton es entonces F = ma, equivalente a tres ecuaciones escala-
res, una por cada componente.

Momento lineal
En mecánica, el momento p de un cuerpo de masa m que se mueve con velocidad v se define como p = mv.
La dirección de p es la dirección según la lı́nea de movimiento y a menudo se lo llama momento lineal (o
también cantidad de movimiento). Podemos escribir entonces la segunda ley de Newton como
dp
F= . (16.29)
dt
La ecuación (16.29) indica que si no actúan fuerzas exteriores sobre un sistema con momento p, entonces
dp
= 0, y p es un vector constante. Ésta es la primera ley del movimiento de Newton: el principio de
dt
conservación del momento lineal.

16.5. Producto escalar


La aplicación de los vectores a problemas fı́sicos ha conducido a la definición de dos
maneras de multiplicar un vector por otro: una de esas maneras da como producto un
escalar, la otra da un producto vectorial (Apartado 16.6).4

04. Clerk Maxwell utilizó los cuaterniones de Hamilton en su Treatise on Electricity and Magnetism
(Tratado sobre electricidad y magnetismo) de 1873, pero Heaviside y Gibbs, de manera independiente,
hicieron ver que no era necesario emplear el álgebra completa de los cuaterniones para representar las
cantidades fı́sicas.
Oliver Heaviside (1850-1925), ingeniero eléctrico inglés, destaca por su desarrollo de las técnicas de la
transformada de Laplace. Josiah Willard Gibbs (1839-1903), ingeniero estadounidense, quı́mico y ‘entre
los fı́sicos teóricos más célebres de todos los tiempos’ (Max Planck), nació, vivió y murió en New Haven,
Connecticut. Gibbs es conocido sobre todo por sus trabajos en termodinámica y en mecánica estadı́stica.
Introdujo el concepto de potencial quı́mico en On the equilibrium of heterogeneous substances (Sobre el
equilibro de sustancias heterogéneas) en 1876-78, sentando las bases de la termodinámica quı́mica moderna.
Desarrolló la notación moderna y los conceptos de productos escalar y vectorial al principio de los años
1880 para simplificar el tratamiento matemático del Treatise de Maxwell. Su obra circuló sin publicar, en
forma de apuntes, y fue divulgada por Edwin B. Wilson en su Vector analysis, founded upon the lectures of
J. Willard Gibbs (Análisis vectorial, basado en las lecciones de J. Willard Gibbs) de 1901.
408 Capı́tulo 16. Vectores

El producto escalar de a y b se define como

a · b = ab cos θ (16.30)

(se lee a veces como ‘a escalar b’), donde a = |a| y b = |b|


son las longitudes de los vectores y θ (0 ≤ θ ≤ π) es el
ángulo que forman sus direcciones. Utilizando componen-
tes, si a = (ax , ay , az ) y b = (bx , by , bz ), tenemos
Figura 16.18
a · b = a x bx + a y by + az bz . (16.31)
Demostración
Para demostrar la equivalencia de las definiciones (16.30) y (16.31), aplicamos la regla del coseno al triángu-
lo de la Figura 16.18:

(AB)2 = (OA)2 + (OB)2 − 2(OA)(OB) cos θ = a2 + b2 − 2ab cos θ .




El vector AB es b − a, y su longitud viene dada por

(AB)2 = (bx − ax )2 + (by − ay )2 + (bz − az )2


   
= a2x + a2y + a2z + b2x + b2y + b2z − 2 (ax bx + ay by + az bz )

= a2 + b2 − 2 (ax bx + ay by + az bz ) .

Por lo tanto ab cos θ = ax bx + ay by + az bz .

EJEMPLO 16.9 Dados a = (3, 1, −1) y b = (1, 2, −3), halle a · b, b · a y el ángulo entre los vectores.
Por la ecuación (16.31),
a · b = 3 × 1 + 1 × 2 + (– 1) × (– 3) = 8 , b · a = 1 × 3 + 2 × 1 + (– 3) × (– 1) = 8 .
Este ejemplo nos hace ver que el producto escalar es conmutativo:
a · b = b · a. (16.32)
a·b √
Por la ecuación (16.30), cos θ = , y las longitudes de los vectores son a = |a| = 11 y b = |b| =
√ ab
14. Por lo tanto
 
8 8
cos θ = √ , θ = arccos √ ≈ 0,8702 ≈ 49,86◦ .
154 154

El signo del producto escalar es el signo del coseno, de manera que el producto escalar
puede ser positivo, cero o negativo:

Figura 16.19
16.5. Producto escalar 409

Para vectores a y b no nulos, el producto escalar es cero cuando los vectores son
perpendiculares:

a · b = 0. (16.33)

Se dice que los vectores son ortogonales, siendo a ortogonal a b, y b ortogonal a a.*
Señalamos que la ecuación (16.33) indica que en una ecuación vectorial no es posible
simplificar los vectores igual que se hace con los escalares. Ası́, la ecuación

a·b=a·c

tiene tres posibles soluciones: (i) a = 0, (ii) b = c, (iii) a es ortogonal a (b − c).

EJEMPLO 16.10 Halle el valor de λ para el cual u = (2, λ, 1) y v = (4, −2, −2) son ortogonales.

Para que sean ortogonales, u · v = 0 = 2 × 4 + λ × (– 2) + 1 × (– 2) = 6 − 2λ.


Por lo tanto λ = 3.

Cuando a y b son el mismo vector, (16.31) nos da

a · a = a2x + a2y + a2z = |a|2 .

La longitud de un vector viene dada en función del producto escalar por



|a| = a · a. (16.34)

Uso de vectores de la base cartesianos


Los vectores de la base i, j y k son ortogonales y unitarios, de manera que por las
ecuaciones (16.33) y (16.34)

i · j = 0, j · k = 0, k·i=0 (ortogonalidad),
(16.35)
i · i = 1, j · j = 1, k·k=1 (unitarios).

La expresión (16.31) para el producto escalar se deduce de estas propiedades de los


vectores de la base. Ası́ por ejemplo, expresando a y b en función de los vectores de la
base:

a · b = (ax i + ay j + az k) · (bx i + by j + bz k)
= ax bx i · i + a x by i · j + a x bz i · k + a y bx j · i + a y by j · j + · · · + a z bz k · k
= a x bx + ay by + a z bz

0* Para vectores en el espacio ordinario, ortogonal significa perpendicular, pero la definición de la


ortogonalidad se aplica generalmente a vectores en ‘espacios vectoriales’ de dimensión arbitraria.
410 Capı́tulo 16. Vectores

Los siguientes ejemplos presentan dos aplicaciones de productos escalares en las cien-
cias fı́sicas.
EJEMPLO 16.11 Fuerza y trabajo
Sea un cuerpo que se desplaza de la posición r1 = (x1 , y1 , z1 ) a la posición r2 = (x2 , y2 , z2 ) sometido a una
fuerza constante F. El desplazamiento del cuerpo es
d = r2 − r1 = (x2 − x1 , y2 − y1 , z2 − z1 )
y el trabajo efectuado por la fuerza es

W = F · d = Fd cos θ . (16.36)

La cantidad F cos θ es la componente de la fuerza en la dirección de


d, y es la única componente de la fuerza que contribuye al trabajo.
De esta manera, como en la Figura 16.20, podemos escribir la fuerza
Figura 16.20
como
F = Fd + F⊥ ,
donde Fd actúa en la dirección de d y F⊥ en la dirección perpendicular a d. Esta última no puede provocar
un desplazamiento en la dirección de d.
Utilizando las componentes cartesianas, el trabajo (16.36) es
W = Fx dx + Fy dy + Fz dz = Wx + Wy + Wz (16.37)
donde, por ejemplo, Fx es la componente de F en la dirección x y Wx = Fx dx es el trabajo efectuado al
mover el cuerpo la distancia dx = x2 − x1 en esa dirección (‘trabajo en la dirección x’). Señalamos que el
trabajo efectuado por el cuerpo en contra de la fuerza es −W = −F · d.
Por ejemplo, si la fuerza es F = (2, 1, 0) y el desplazamiento d = (2, −3, 1), en las unidades correspon-
dientes, el trabajo efectuado es
W = F · d = 2 × 2 + 1 × (– 3) + 0 × 1 = 1 .
Además, la componente de F en la dirección de d puede expresarse usando el producto escalar como
F·d
Fd = F cos θ = = F · d̂ ,
d

= d/d es un vector unitario en la dirección de d. En este caso tenemos d =
donde d̂ √ 14 de manera que
Fd = 1/ 14.

Caso general
Si la fuerza no es constante en el recorrido entre r1 y r2 , el trabajo se expresa mediante una integral de lı́nea
(Apartado 9.8). Sea un cuerpo que se mueve desde el punto A en r1 hasta el punto B en r2 sobre la curva C,
sometido a una fuerza F cuyo valor varı́a de un punto de C a otro (Figura 16.21). Sea F(r) la fuerza en el
punto r de la curva. El trabajo efectuado sobre el cuerpo entre las posiciones r y r + ∆r es ∆W ≈ F(r) · ∆r
y, en el lı́mite |∆r| → 0 sobre la curva, el elemento de trabajo
es dW = F · dr. El trabajo total efectuado desde A a B sobre C
es entonces
WAB = F(r) · dr (16.38)
C
y la integral es una integral de lı́nea. Expresado en compo-
nentes, F = (Fx , Fy , Fz ) y dr = (dx, dy, dz), de manera que
F · dr = Fx dx + Fy dy + Fz dz, y

WAB = Fx dx + Fy dy + Fz dz . (16.39)
C Figura 16.21
16.6. Producto vectorial 411

Esto es una generalización de la ecuación (9.52) para una curva en tres dimensiones, y el tratamiento del
Apartado 9.8 se aplica con únicamente algunas pequeñas modificaciones. En particular, si la fuerza es
conservativa, generalizando el tratamiento de las fuerzas conservativas del Apartado 5.7, las componentes
de la fuerza pueden expresarse como las derivadas (parciales) de una función energı́a potencial V (véase la
ecuación (5.57)),
∂V ∂V ∂V
Fx = − , Fy = − , Fz = − . (16.40)
∂x ∂y ∂z
Entonces  
∂V ∂V ∂V
Fx dx + Fy dy + Fz dz = − dx + dy + dz = −dV (16.41)
∂x ∂y ∂z
y dV es el diferencial total de la función energı́a potencial V(r) = V(x, y, z). Se deduce que, para una fuerza
conservativa, la integral de lı́nea (16.38) es independiente del camino y es igual a la diferencia de energı́a
potencial entre A y B: B

WAB = − dV = VA − VB . (16.42)
A

EJEMPLO 16.12 Cargas en un campo eléctrico


La fuerza experimentada por una carga q en presencia de un campo eléctrico E es F = qE. Si el campo es
un campo electrostático (constante en el tiempo), la fuerza es conservativa de manera que, por la ecuación
(16.40), las componentes del campo E = F/q son (menos) las derivadas de una función φ = V/q:
∂φ ∂φ ∂φ
Ex = − , Ey = − , Ez = − . (16.43)
∂x ∂y ∂z
La función φ es la función potencial electrostático (energı́a potencial por unidad de carga) del campo.
Si el campo E es un campo uniforme, constante en el espacio, integrando las ecuaciones tenemos (véase
(5.58) para una fuerza constante)

φ(r) = − (xEx + yEy + zEz ) + C = −r · E + C (16.44)

donde φ(r) es el potencial electrostático en la posición r = (x, y, z) y C es una constante arbitraria. La


energı́a potencial de la carga q situada en r en el campo es entonces

V = qφ(r) = −qr · E + qC . (16.45)

La energı́a potencial de un sistema de cargas, q1 en r1 , q2 en r2 , . . . , qN en rN , es la suma de las energı́as de


las cargas individuales,


N
V = q1 φ(r1 ) + q2 φ(r2 ) + · · · + qN φ(rN ) = qi φ(ri ) .
i=1

Para el potencial (16.44), tenemos por lo tanto


 N   N 
 N  
V = (– qi ri · E + qi C) = − qi ri · E + qi C
i=1 i=1 i=1

µ · E + QC ,
= −µ (16.46) Figura 16.22

donde µ es el momento dipolar del sistema de cargas y Q es la carga total. El término QC es cero para un
campo eléctricamente neutro o si se escoge que el potencial φ sea cero en el origen (la elección habitual).
Entonces
V = −µµ · E = −µE cos θ .
412 Capı́tulo 16. Vectores

16.6. Producto vectorial

Todo par de vectores no paralelos, a y b, define un paralelogramo, Figura 16.23, con


área ab sen θ (base × altura).

Figura 16.23

Además, las Figuras 16.24 muestran que si ponemos un vector detrás del otro, defini-
mos un sentido de giro: antihorario en (a), o ‘hacia arriba’, con a seguido de b, y sentido
horario en (b), o ‘hacia abajo’, con b seguido de a.

Figura 16.24

Estas propiedades de los dos vectores definen un nuevo vector, el producto vectorial
de a y b,

v=a×b (16.47)

(leı́do a veces como ‘a vectorial b’) cuya longitud es

|v| = ab sen θ (16.48)

y cuya dirección es perpendicular tanto a a como a b (perpendicular al paralelogramo),


y tal que los tres vectores (a, b, v), en este orden, forman un triedro directo (como en
la Figura 16.24 (a)). La Figura (b) muestra que la dirección se invierte si se invierte el
orden de a y b en (16.47), de manera que

b × a = −a × b . (16.49)

Por lo tanto, a diferencia del producto escalar, el producto vectorial no es conmutativo:


es anticonmutativo.
16.6. Producto vectorial 413

Se deduce de (16.48) que el producto vectorial es cero si θ = 0 o θ = π, es decir, si


a y b son en la misma dirección o en direcciones opuestas. En particular

a × a = 0. (16.50)

En función de vectores de la base cartesianos


Los vectores unitarios i, j y k forman un triedro directo y tienen las propiedades

i × j = k, j × k = i, k × i = j,
(16.51)
i × i = 0, j × j = 0, k × k = 0.

El producto vectorial a × b puede entonces expresarse mediante componentes cartesia-


nas:

a × b = (ax i + ay j + az k) × (bx i + by j + bz k)
= a x bx i × i + a x by i × j + a x bz i × k + a y bx j × i + a y by j × j + a y bz j × k
+az bx k × i + az by k × j + az bz k × k
= ax by k + ax bz (– j) + ay bx (– k) + ay bz i + az bx j + az by (– i)

(teniendo en cuenta, por ejemplo, que j × i = −i × j). Por lo tanto

a × b = (ay bz − az by ) i + (az bx − ax bz ) j + (ax by − ay bx ) k . (16.52)

Esta expresión del producto vectorial se puede escribir, y es más fácil de recordar, en
forma de determinante (Capı́tulo 17):
 
 i j k
 
a × b =  ax ay az  . (16.53)
b b b 
x y z

EJEMPLO 16.13 Dados a = (3, 1, −1) y b = (1, 2, −3) halle a × b, b × a, y el área |a × b| del
paralelogramo definido por a y b.

Por la ecuación (16.52)

a × b = [1 × (– 3) − (– 1) × 2]i + [(– 1) × 1 − 3 × (– 3)] j + [3 × 2 − 1 × 1]k

= −i + 8 j + 5k = (– 1, 8, 5) .

Además:  √
b × a = −a × b = (1, −8, −5) , |a × b| = 12 + 82 + 52 = 90 .
414 Capı́tulo 16. Vectores

El producto vectorial se usa en geometrı́a para describir superficies y en cálculo vectorial


integral para evaluar integrales de superficie. En mecánica se usa el producto vectorial
para describir propiedades asociadas con el momento de las fuerzas y los movimientos
angulares.

EJEMPLO 16.14 Momento de una fuerza


En mecánica, la magnitud del momento N de una fuerza F con respecto
a un punto O se define como el producto N = |F| d, siendo d la distan-
cia de O a la lı́nea de acción de la fuerza, medida perpendicularmente
(Figura 16.25).
Si r es el vector que va desde O al punto A sobre la lı́nea, tenemos
d = |r| sen θ y
N = |r| |F| sen θ = |r × F| .
El correspondiente vector

N=r×F (16.54) Figura 16.25

es perpendicular a r y a F, y su dirección es la del eje que pasa por O en torno al cual la fuerza tiende a
producir un giro.

EJEMPLO 16.15 Dipolo eléctrico en un campo eléctrico


Un dipolo eléctrico µ = qr (véase el Ejemplo 16.5) en un campo eléctri-
co E experimenta un momento

N=µ×E (16.55)

que tiende a alinear el dipolo en la dirección del campo. De esta forma,


según la Figura 16.26, el momento total de la fuerza con respecto a O es

N = r1 × F1 + r2 × F2
= q(r1 − r2 ) × E = qr × E = µ × E .

Figura 16.26

EJEMPLO 16.16 Velocidad angular y momento angular


Velocidad angular
Una partı́cula que se mueve en un cı́rculo de radio r con velocidad v
tiene una velocidad angular ω , con respecto a un eje que pasa por el
centro, con magnitud dada por

v = ωr (16.56)
Figura 16.27
y dirección perpendicular al plano del movimiento (perpendicular a la
página para el movimiento representado en la Figura 16.27).
Más generalmente, sea una partı́cula (que puede formar parte de un cuerpo en rotación) que gira
alrededor del eje OA en torno al punto fijo O, como se muestra en la Figura 16.28. En ese caso la ecuación
(16.56) se sustituye por
v = ωr sen θ (16.57)
16.7. Campos escalares y vectoriales 415

que es justamente la magnitud del producto vectorial

v=ω ×r (16.58)

que también define correctamente la dirección de cada uno de los tres


vectores con respecto a los otros. Para un sólido rı́gido que gira con
velocidad angular ω , la ecuación (16.58) nos da la velocidad en cada
punto r del sólido.

Momento angular
El momento angular l de una masa m con respecto a un punto se define
como el momento con respecto a ese punto de su momento lineal p =
mv,
l = r × p. (16.59)
Su magnitud con respecto al punto O de la Figura 16.29 es l = pd =
pr sen θ, y su dirección es perpendicular al plano definido por r y p. Esa
dirección no es en general la de la velocidad angular ω , como puede ver-
Figura 16.28
se en la Figura 16.28 (sustituyendo v por p). Puede demostrarse (véase
el Ejercicio 49) que
l = mr2ω − m(r · ω )r (16.60)
de manera que l y ω llevan la misma dirección sólo si r y ω son vectores
perpendiculares, es decir, cuando r · ω = 0. Esto ocurre para el movi-
miento en un cı́rculo tomando el punto de referencia O en el centro de
cı́rculo. Entonces
l = mr2ω = Iωω, (16.61)
siendo I = mr2 el momento de inercia con respecto al eje de giro. La
relación entre l y ω para un movimiento arbitrario de una partı́cula o
para la rotación de un sólido rı́gido es menos sencilla que (16.61). La
relación general es
l = Iω , (16.62)
donde I es una cantidad con nueve componentes denominada tensor (o Figura 16.29
matriz) de inercia, y lo tratamos brevemente en el Ejemplo 19.15.

Conservación del momento angular


Como hemos visto en el Ejemplo 16.8, la segunda ley del movimiento de Newton puede escribirse como
dp
F= . Tomando el producto vectorial de r con ambos miembros de esta ecuación obtenemos
dt
dp
r×F=r× .
dt
El primer miembro es el momento de la fuerza que actúa sobre el sistema (Ejemplo 16.14). Utilizando la
regla de derivación de un producto (válida tanto para el producto escalar como para el vectorial), el segundo
miembro es
dp d dr
r× = (r × p) − × p.
dt dt dt
dr
Pero = v es paralelo a p, y su producto vectorial es cero. Por lo tanto, como r × p = l,
dt
dl
N= . (16.63)
dt
Esta expresión de la segunda ley de Newton, donde la tasa de variación del momento angular de un sistema
es igual al momento de la fuerza aplicada, pone de manifiesto que el momento angular de un sistema es
constante en ausencia de momentos de fuerzas exteriores.
416 Capı́tulo 16. Vectores

16.7. Campos escalares y vectoriales


Una función de las coordenadas de un punto en el espacio se llama función de posi-
ción o campo. Una función escalar de posición, un campo escalar,

f = f (r) = f (x, y, z) , (16.64)

toma un valor en cada punto r = (x, y, z); es decir, se le asocia un escalar (un número) en
cada punto. En el Capı́tulo 10 hemos tratado ejemplos de campos escalares. Una función
vectorial de posición, un campo vectorial,

v = v(r) = v(x, y, z) , (16.65)

define un vector asociado a cada punto r. Un ejemplo de campo vectorial es el campo


de velocidades utilizado para describir el flujo de un fluido en hidrodinámica: a cada
punto se le asocia una velocidad. Los campos eléctricos y magnéticos son campos vec-
toriales.
La teorı́a de campos vectoriales es una herramienta esencial en hidrodinámica y en
electromagnetismo. Una caraterı́stica básica de la teorı́a de campos vectoriales es el uso
de operadores diferenciales vectoriales para describir cómo varı́an los campos de un pun-
to a otro en el espacio. En el siguiente apartado tratamos el concepto de gradiente de un
campo escalar, con algunas aplicaciones. En el Apartado 16.9 introducimos la divergen-
cia y el rotacional de un campo vectorial. Estas cantidades se usan en aplicaciones más
avanzadas del cálculo vectorial en la teorı́a de campos y sólo damos aquı́ una muy breve
descripción.

16.8. Gradiente de un campo escalar


El gradiente de una función de posición f = f (x, y, z) se define como el vector

∂f ∂f ∂f
grad f = i+ j + k. (16.66)
∂x ∂y ∂z

Se puede interpretar esta cantidad como el resultado de operar sobre la función f con el
operador diferencial vectorial

∂ ∂ ∂
∇= i+ j+ k (16.67)
∂x ∂y ∂z

(llamado a veces ‘nabla’), de manera que

 
∂ ∂ ∂
grad f = ∇f = i+ j+ k f =
∂x ∂y ∂z
16.8. Gradiente de un campo escalar 417

∂f ∂f ∂f
= i+ j+ k (16.68)
∂x ∂y ∂z

(suponiendo los vectores i, j y k constantes).5

EJEMPLO 16.17 Halle grad V siendo V = x + 2yz + 3z2 .


∂V ∂V ∂V
Tenemos = 1, = 2z y = 2y + 6z. Por lo tanto ∇V = i + 2z j + (2y + 6z)k .
∂x ∂y ∂z

EJEMPLO 16.18 Fuerza y energı́a potencial


Generalizando a tres dimensiones lo expuesto para fuerzas conservativas en el Apartado 5.7 (véase también
el Ejemplo 16.11), las componentes de una fuerza conservativa son las derivadas de una función energı́a
potencial V,
∂V ∂V ∂V
Fx = − , Fy = − , Fz = − .
∂x ∂y ∂z
La fuerza es por lo tanto (menos) el gradiente de V:
 
∂V ∂V ∂V
F = −∇V = − i+ j+ k . (16.69)
∂x ∂y ∂z

EJEMPLO 16.19 Fuerzas de Coulomb


q1 q2
La energı́a potencial de interacción de dos cargas q1 y q2 separadas una distancia r es V = (véase el
4π0 r
Ejemplo 5.13). Si r es la posición de q2 relativa a q1 , la fuerza que actúa sobre q2 debida a la presencia de
q1 es
       
q1 q2 ∂ 1 ∂ 1 ∂ 1
F = −∇V = − i+ j+ k
4π0 ∂x r ∂y r ∂z r
q1 q2  x y z  q1 q2
= i + j + k = (xi + y j + zk)
4π0 r3 r3 r3 4π0 r3
q1 q2 r
= .
4π0 r3
r Figura 16.30
El vector unitario de q1 a q2 es r̂ = . Por lo tanto
r
q1 q2 r q1 q2
F= = r̂ . (16.70)
4π0 r3 4π0 r2
q1 q2
La fuerza tiene una intensidad y actúa en la dirección de q1 a q2 para cargas de mismo signo y de q2
4π0 r2
a q1 para cargas de signo opuesto (véase también el Ejemplo 5.11). Además, la fuerza por unidad de carga
que se ejerce en el punto r debida a la presencia de la carga q1 es E = F/q2 . Entonces
q1
E= r̂ = −∇φ (16.71)
4π0 r2
q1
es el campo electróstatico de la carga q1 , y φ = V/q2 = es el correspondiente potencial (escalar)
4π0 r
electrostático.

05. Hamilton introdujo la notación ∇, y (posiblemente) lo llamó nabla por el nombre de un instru-
mento musical parecido al arpa utilizado en Palestina en tiempos bı́blicos.
418 Capı́tulo 16. Vectores

El significado del gradiente de una función de posición f (r) se entiende mejor con-
siderando cómo varı́a el valor de la función de un punto a otro del espacio. Sea un
desplazamiento (infinitesimal) r → r + dr, o en componentes cartesianas, (x, y, z) →
(x + dx, y + dy, z + dz):

dr = (dx, dy, dz) = i dx + j dy + k dz . (16.72)

La correspondiente variación de la función, df = f (r + dr) − f (r), es el diferencial total

∂f ∂f ∂f
df = dx + dy + dz . (16.73)
∂x ∂y ∂z

Podemos escribir esto como el producto escalar del gradiente ∇f y el desplazamiento dr


(ecuaciones (16.68) y (16.72)),
 
∂f ∂f ∂f ∂f ∂f ∂f
i+ j + k · (i dx + j dy + k dz) = dx + dy + dz
∂x ∂y ∂z ∂x ∂y ∂z

de manera que

df = ∇f · dr . (16.74)

df
La cantidad ∇f es por lo tanto la generalización de la derivada ordinaria a tres di-
dx
d
mensiones. El operador vectorial ∇ es la generalización del operador y a veces se
dx
d
denota por .
dr

16.9. Divergencia y rotacional de un campo vectorial


Divergencia
La divergencia de un campo vectorial v(r) se define como la cantidad escalar

∂vx ∂vy ∂vz


div v = ∇ · v = + + . (16.75)
∂x ∂y ∂z

En hidrodinámica, el campo vectorial es el campo de velocidades de un fluido y la di-


vergencia es una densidad de flujo: el valor de div v(r) dV en un punto r es una medida
del flujo neto, o tasa de flujo, de fluido a través de un elemento de volumen dV situado
en ese punto.
Consideramos aquı́ únicamente el caso particular de un campo vectorial que es el
gradiente de un campo escalar, v = ∇f . Entonces
16.10. Espacios vectoriales 419

   
∂ ∂ ∂ ∂f ∂f ∂f
div v = ∇ · ∇f = i+ j+ k · i+ j+ k
∂x ∂y ∂z ∂x ∂y ∂z
∂2f ∂2f ∂2f
= + + 2. (16.76)
∂x2 ∂y2 ∂z

Se deduce que ∇ · ∇ = ∇2 es el operador laplaciano. Si un campo escalar f (r) cumple


la ecuación de Laplace ∇2 f = 0 en un punto, el campo vectorial que se deriva ∇f tiene
divergencia cero en ese punto, y no hay flujo neto a través del elemento de volumen
en ese punto. Eso es lo que ocurre para un fluido incompresible en una región que no
contiene fuentes (de fluido) ni sumideros y para un campo electrostático en una región
libre de cargas.

Rotacional
El rotacional (rot v) de un campo vectorial v(r) se define como el vector
     
∂vz ∂vy ∂vx ∂vz ∂vy ∂vx
rot v = ∇ × v = − i+ − j+ − k
∂y ∂z ∂z ∂x ∂x ∂y
 
 i j k 
 
 ∂ ∂ ∂ 
=  . (16.77)
 ∂x ∂y ∂z 
 v vy vz 
x

En hidrodinámica, el rotacional del campo de velocidades en un punto es una medida de


la circulación de fluido alrededor del punto.
Un campo vectorial que es el gradiente de un campo escalar tiene rotacional nulo:

rot v = 0 si v = grad f . (16.78)

La ecuación (16.78) es una propiedad del campo electrostático, gradiente de un potencial


electrostático: E = −∇φ, y por lo tanto ∇ × E = 0. Por otra parte, un campo vectorial
que es a su vez el rotacional de un campo vectorial tiene divergencia nula:

div v = 0 si v = rot w . (16.79)

La ecuación (16.79) es una propiedad del campo magnético. Este campo siempre puede
escribirse como el rotacional de una función vectorial, B = ∇ × A, donde A es el
potencial magnético, y ∇ · B = 0.

16.10. Espacios vectoriales


Los vectores que hemos visto en este capı́tulo son vectores tridimensionales, o vec-
tores de un espacio vectorial tridimensional. El concepto de vector puede extenderse a
420 Capı́tulo 16. Vectores

cualquier número de dimensiones definiendo los vectores de n dimensiones como can-


tidades con n componentes que obedecen las leyes del álgebra vectorial descritas en los
Apartados 16.2 y 16.3. En particular, un espacio vectorial de dimensión n puede definirse
mediante n vectores ortogonales,

e1 = (1, 0, 0, . . . , 0) , e2 = (0, 1, 0, . . . , 0) , ... , en = (0, 0, 0, . . . , 1) . (16.80)

Todo vector del espacio vectorial puede entonces expresarse como una combinación
lineal de estos vectores,

a = (a1 , a2 , a3 , . . . , an ) = a1 e1 + a2 e2 + a3 e3 + · · · + an en . (16.81)

Estas cantidades cumplen las leyes del álgebra vectorial.6


En un espacio vectorial definido de esta manera se asocia un producto interno (esca-
lar) a cada par de vectores,

a · b = a 1 b1 + a 2 b2 + a3 b3 + · · · + an bn = b · a . (16.82)

El producto interno se denota a menudo por (a, b). Dos vectores son ortogonales (‘per-
pendiculares’) si su producto interno es cero, y la longitud o norma de un vector es
√ 
|a| = a·a= a 1 2 + a 2 2 + a 3 2 + · · · + an 2 . (16.83)

Un espacio vectorial con estas propiedades se denomina espacio vectorial euclı́deo. En


concreto, el espacio que hemos descrito en este apartado es el espacio euclı́deo IRn de
dimensión n.

16.11. Ejercicios

Apartado 16.2

1. Sean a, b, c y d los vectores de posición de los puntos A, B, C y D. Exprese las siguientes cantidades
en función de a, b, c y d:
→ −
− →
(i) AB y BA , (ii) la posición del baricentro de los puntos,


(iii) la posición del centro de BC ,


(iv) la posición de un punto arbitrario de la recta BC (ecuación de la recta).

06. Hermann Günther Grassmann (1809-1877), metemático alemán, dio un tratamiento detallado de
los espacio vectoriales de dimensión n en su Die lineale Ausdehnungslere, ein neuer Zweig der Mathematik
(La teorı́a de extensiones lineales, una nueva rama de la matemática) de 1862. El trabajo incluı́a las álgebras
de los cuaterniones de Hamilton y de los vectores de Gibbs como casos particulares, pero fue muy poco
conocido durante su vida.
16.11. Ejercicios 421

Apartado 16.3
Halle: (a) el vector v = (v1 , v2 , v3 ) con origen P(x1 , y1 , z1 ) y extremo Q(x2 , y2 , z2 ) y (b) la longitud de v:
2. P (1, 0, 0), Q (3, 2, 0) 3. P (– 3, 2, 1), Q (– 1, −3, 2)

4. P (0, 0, 0), Q (2, 3, 1) 5. P (1, 0, −3), Q (0, 0, 0)

6. P (– 2, 3, −1), Q (– 2, 3, −1)

Siendo a = (1, 2, 3), b = (– 2, 3, −4), c = (0, 4, −1), halle


7. a + b, b + a 8. 3a, −a, a/3 9. 3a + 2b − 3c
10. 3a − 3c, 3(a − c) 11. |a + b|, |a| + |b|

− →
− →

12. Dos lados del triángulo ABC son AB = (2, 1, −1) y AC = (3, 2, 0). Halle BC .

13. Halle la resultante de las fuerzas f1 = 2i − 3 j + k y f2 = 2 j − k.

14. Se dice que unas fuerzas están en equilibrio si la fuerza total es nula. Halle f tal que f, f1 = 2i−3 j+k
y f2 = 2 j − k estén en equilibrio.

15. Para los vectores u = 2i − j + 3k, v = 2 j − 2k, w = −k, halle


(i) x = 2u + v + 4w, (ii) un vector perpendicular a w y a x,
(iii) un vector perpendicular a v y a w.

16. Tres masas m1 = 2, m2 = 3, m3 = 1, tienen vectores de posición r1 = (3, −2, 1), r2 = (2, −1, 0),
r3 = (0, 1, −2), respectivamente. Halle
(i) el vector de posición del centro de masas,
(ii) los vectores de posición de las masas con respecto al centro de masas.

17. Tres cargas q1 = 3, q2 = −2, q3 = 1, tienen vectores de posición r1 = 2i + 2 j + k, r2 = 2i − 2 j + 3k,


r3 = −4 j − 3k, respectivamente. Halle
(i) el momento dipolar del sistema de cargas con respecto al origen,
(ii) la posición del punto respecto del cual el momento dipolar es nulo.

Apartado 16.4
Derive con respecto a t:
18. 2ti + 3t2 j 19. ( cos 2t, 3 sen t, 2t)

20. Un cuerpo de masa m se mueve sobre la curva r(t) = x(t)i + y(t) j + z(t)k, siendo x = 2 cos 3t,
y = 2 sen 3t, z = 3t, y t el tiempo.
(i) Halle la velocidad y la aceleración en el instante t.
(ii) Halle la dirección de la fuerza que se ejerce sobre el cuerpo.
(iii) Describa el movimiento del cuerpo (considérelo como una combinación de un mo-
vimiento en el plano xy y un movimiento en la dirección z).

Apartado 16.5
Para a = (1, 3, −2), b = (0, 3, 1), c = (1, −1, −3), halle:
422 Capı́tulo 16. Vectores

21. a · b, b·a 22. a·c 23. c·b


24. (a − b) · c , a·c−b·c 25. (a · c)b 26. a·b+b·c+c·a

Para a = i, b = j, c = 2i − 3 j + k, halle:

27. a·b 28. b·c 29. a·c

30. Demuestre que a = (1, 2, 3), b = (0, −3, 2) y c = (– 13, 2, 3) son vectores ortogonales.

31. Halle el valor de λ para el cual a = (λ, 3, 1) y b = (2, 1, −1) son ortogonales.

32. Halle los ángulos entre la dirección de a = i − j + 2k y las direcciones x, y y z.

33. Un cuerpo se halla sometido a la acción de las fuerzas f1 = 4i − 2 j y f2 = i − 3 j. Calcule


(i) la fuerza total f que se ejerce sobre el cuerpo, (ii) la intensidad de esa fuerza,
(iii) el ángulo entre f y el eje x.

34. Un cuerpo experimenta un desplazamiento d bajo la acción de una fuerza f = 3i + 2 j. Calcule el


trabajo efectuado
(i) por la fuerza sobre el cuerpo si d = 2i − j,
(ii) por el cuerpo contra la fuerza si d = i − 3k,
(iii) por el cuerpo contra la fuerza si d = 2k.

35. Calcule la energı́a de interacción entre el sistema constituido por las cargas q1 = 2, q2 = −3 y q3 = 1
situadas en r1 = (3, −2, 1), r2 = (0, 1, 2) y r3 = (0, 2, 1), respectivamente, y el campo eléctrico aplicado
E = −2k.

Apartado 16.6
Para a = (1, 3, −2), b = (0, 3, 1), c = (0, −1, 2), halle :

36. a × b, b×a 37. b × c, |b × c| 38. (a + b) × c , a×c+b×c


39. a×c+c×a 40. (a × c) · b 41. a × (b × c) , (a × b) × c

42. Demuestre que a × b es ortogonal a a y a b.

43. La cantidad a(b × c) se denomina triple producto escalar. Demuestre que


(i) a · (b × c) = c · (a × b) = b · (c × a),
 
 a1 a2 a3 
 
(ii) a · (b × c) =  b1 b2 b3  (determinante).
 c1 c2 c3 

44. La cantidad a × (b × c) se denomina triple producto vectorial.


(i) Desarrollando en componentes, demuestre que a × (b × c) = (a · c)b − (a · b)c.
(ii) Compruebe la fórmula para los vectores a = (1, 3, −2), b = (0, 3, 1), c = (0, −1, 2).

45. Halle el área del paralelogramo cuyos vértices tienen (en el plano xy) las coordenadas (1, 2), (4, 3),
(8, 6), (5, 5).
16.11. Ejercicios 423

46. La fuerza F actúa aplicada en el punto A. Halle el momento de la fuerza con respecto al punto O para
(i) F = (1, −3, 0) , A (2, 1, 0) , O (0, 0, 0),

(ii) F = (0, 1, −1) , A (1, 1, 0) , O (1, 0, 2),

(iii) F = (1, 0, −2) , A (0, 0, 0) , O (1, 0, 3).

47. Calcule el momento de la fuerza experimentado por el sistema de cargas q1 = 2, q2 = −3 y q3 = 1


situadas en r1 = (3, −2, 1), r2 = (0, 1, 2) y r3 = (0, 2, 1), respectivamente, en el campo eléctrico E = −k.

48. Una carga q que se mueve con velocidad v en presencia de un campo eléctrico E y un campo magnéti-
co B, experimenta una fuerza total
F = qE + qv × B
llamada fuerza de Lorentz.
Calcule la fuerza que se ejerce sobre la carga q = 3 que se mueve con velocidad v = (2, 3, 1) en presencia
del campo eléctrico E = 2i y del campo magnético B = 3 j.

49. Utilice la propiedad del triple producto (Ejercicio 44) para obtener la ecuación (16.60) a partir de
(16.58) y (16.59).

50. La posición de una partı́cula de masa m que se mueve en un cı́rculo de radio R en torno al eje z con
velocidad angular ω viene dada por la función vectorial

r(t) = x(t)i + y(t) j + zk

siendo
x(t) = R cos ωt, y(t) = R sen ωt, z = constante
(el origen no está en el centro del cı́rculo).
(i) ¿Cuál es la velocidad angular ω en torno al eje z?
(ii) Exprese la velocidad v en función de ω, x, y y z.
(iii) Exprese el momento angular de la partı́cula en función de ω, x, y y z.
(iv) Compruebe que se cumple la ecuación (16.60) para este caso.

ω si z = 0, siendo I el momento de inercia en


51. Para el sistema del Ejercicio 50, demuestre que l = Iω
torno al eje de rotación.

52. El momento angular total de un sistema de partı́culas es la suma de los momentos angulares de
cada partı́cula. Si se sustituye el sistema del Ejercicio 50 por un sistema de dos partı́culas de masa m con
posiciones
r1 = x(t)i + y(t) j + zk , r2 = −x(t)i − y(t) j + zk ,
ω , siendo I el momento angular total con
halle el momento angular total l = l1 + l2 , y demuestre que l = Iω
respecto al eje de rotación.
ω si el eje de rotación es un eje de simetrı́a del sistema.
Este ejemplo ilustra que l = Iω

Apartado 16.8
Halle el gradiente ∇f para
53. f = 2x2 + 3y2 − z2 54. f = xy + zx + yz 55. f = (x2 + y2 + z2 )−1/2
424 Capı́tulo 16. Vectores

Apartado 16.9
Halle div v y rot v para
56. v = xi + y j + zk 57. v = zi + x j + yk 58. v = yzi + zx j + xyk

59. Demuestre que rot v = 0 si v = grad f .

60. Demuestre que div v = 0 si v = rot w.


 Determinantes

17.1. Conceptos

Muchos problemas en las ciencias fı́sicas, la ingenierı́a y la estadı́stica dan lugar a


sistemas de ecuaciones lineales. Los métodos de álgebra elemental son adecuados si el
número de ecuaciones es pequeño: dos o tres, como vimos en el Apartado 2.7. En al-
gunos casos, sin embargo, el número de ecuaciones puede ser grande y son necesarios
métodos alternativos para la resolución numérica de ‘sistemas lineales’ grandes, y para
la formulación y el análisis teórico de los problemas de los que provienen. En el Capı́tulo
20 tratamos algunos de los métodos prácticos de resolución, los ‘métodos numéricos’.
La rama de las matemáticas relacionada con la teorı́a de sistemas lineales es el álgebra
matricial, que es el tema de los Capı́tulos 18 y 19, pero varios de los resultados más im-
portantes y útiles de la teorı́a de ecuaciones lineales se obtienen, independientemente, de
cantidades llamadas determinantes. En este capı́tulo tratamos la teorı́a de determinantes
como un tema separado, en parte como preparación para el álgebra matricial más general
de los Capı́tulos 18 y 19, y en parte porque los determinantes tienen ciertas propiedades
de simetrı́a que los convierten en una herramienta importante en mecánica cuántica. Se
usan en quı́mica cuántica para construir funciones de onda electrónicas compatibles con
las exigencias del principio de exclusión de Pauli.
El concepto de determinante tiene su origen en la resolución de sistemas de ecuacio-
nes lineales.1 Sea la pareja de ecuaciones

(1) a1 x + b1 y = c1
(17.1)
(2) a2 x + b2 y = c2

donde a1 , b1 , c1 , a2 , b2 y c2 son constantes. Las ecuaciones son lineales en las ‘incógni-


tas’ x e y, y pueden resolverse por métodos de álgebra elemental. Para resolver para x,
multiplicamos la ecuación (1) por b2 y la ecuación (2) por b1 y tenemos

(1 ) a1 b2 x + b1 b2 y = c1 b2
(2 ) b1 a2 x + b1 b2 y = b1 c2

01. Las primeras descripciones del método para resolver conjuntos de ecuaciones lineales mediante
determinantes, conocido como regla de Cramer, las dieron el japonés Seki Kowa (1642-1708) en un ma-
nuscrito de 1683, y Leibniz en una carta a l’Hôpital en 1693 (publicada en 1850) en la cual daba también
la condición para la consistencia de las ecuaciones. La primera mención impresa apareció en el Treatise of
algebra de MacLaurin (póstumamente, en 1748).
426 Capı́tulo 17. Determinantes

de manera que, restando (2 ) a (1 ),

(a1 b2 − b1 a2 ) x = c1 b2 − b1 c2 . (17.2)

De manera similar, para y,

(a1 b2 − b1 a2 ) y = a1 c2 − c1 a2 . (17.3)

Si a1 b2 − b1 a2 no es cero, los (únicos) valores posibles de x e y son

c1 b2 − b1 c2 a1 c2 − c1 a2
x= , y= . (17.4)
a1 b2 − b 1 a2 a1 b2 − b 1 a2

La cantidad que aparece en los denominadores de (17.4) depende de los coeficientes de


las ecuaciones (17.1), y puede escribirse en la forma
 
 a 1 b1 
 
 a2 b2  = a 1 b2 − b 1 a2 . (17.5)

La notación que aparece en el primer miembro se llama determinante;2 la expresión del


segundo miembro define su valor.
La solución (17.4) del sistema de ecuaciones (17.1) puede escribirse entonces como

D1 D2
x= , y= (17.6)
D D
siendo
     
 a 1 b1   c1 b1   a1 c1 

D= , 
D1 =  , 
D2 =  . (17.7)
a2 b2  c2 b2  a2 c2 

EJEMPLO 17.1 Utilice determinantes para resolver las ecuaciones

2x − 3y = 5
x + 5y = 9

02. El término determinante fue acuñado por Cauchy en 1812 en el primero de una larga serie de
artı́culos sobre una clase de funciones simétricas alternadas tales como a1 b2 − b1 a2 . Para el caso general,
dispuso las n2 diferentes cantidades en una tabla cuadrada y empleó la abreviatura (a1,n ) para representar la
tabla que se asocia a un determinante. Cauchy usó los determinantes en problemas de geometrı́a y en fı́sica,
y para la cantidad que llamamos hoy en dı́a jacobiano. Introdujo el concepto de menores y el desarrollo con
respecto a cualquier fila o columna.
17.2. Determinantes de orden 3 427
 
 2 −3 
 
Tenemos D =   = 2 × 5 − (– 3) × 1 = 13,
 1 5 

   
 5 −3   2 5 
   
D1 =   = 5 × 5 − (– 3) × 9 = 52 , D2 =   = 2 × 9 − 5 × 1 = 13 .
 9 5   1 9 

Por lo tanto x = D1 /D = 4 e y = D2 /D = 1.

El determinante (17.5) es un valor que depende de una tabla con 4 = 22 elementos, los
coeficientes de x e y del sistema de ecuaciones (17.1). Se trata de un determinante de
orden 2. En el caso general, un determinante de orden n es una cantidad que depende de
una tabla cuadrada con n2 elementos, y se representa como
 
 a11 a12 a13 ··· a1n 
 
 a21 a22 a23 ··· a2n 
 
 a31 a32 a33 ··· a3n 
  (17.8)
 .. .. .. .. .. 
 . . . . . 
 
 an1 an2 an3 ··· ann 

En esta notación, el elemento aij está situado en la fila i y en la columna j de la tabla.


Por ejemplo, a23 está en la segunda fila, tercera columna. El determinante se representa a
veces con la notación |aij |. Los determinantes de orden n aparecen al considerar sistemas
de n ecuaciones con n incógnitas.

17.2. Determinantes de orden 3

El sistema de tres ecuaciones con tres incógnitas x1 , x2 y x3 ,

(1) a11 x1 + a12 x2 + a13 x3 = b1


(2) a21 x1 + a22 x2 + a23 x3 = b2 (17.9)
(3) a31 x1 + a32 x2 + a33 x3 = b3

puede resolverse para x1 multiplicando la ecuación


 
 a22 a23 
(1) por a22 a33 − a23 a32 =  ,

a32 a33
 
 a12 a13 
(2) por −(a12 a33 − a13 a32 ) = −  ,

a32 a33
 
 a12 a13 
(3) por a12 a23 − a13 a22 =  ,

a22 a23
428 Capı́tulo 17. Determinantes

y sumando los tres resultados. El coeficiente de x1 en la expresión resultante define el


determinante de orden 3:
 
 a11 a12 a13       
   a22 a23   a12 a13   a12 a13 
 
D =  a21 a22 a23  = a11      
a a  − a21  a32 a33  + a31  a22 a23  (17.10)
 a31 a32 a33  32 33

o, desarrollando los determinantes de orden 2,

D = a11 a22 a33 − a11 a23 a32 − a21 a12 a33 + a21 a13 a32 + a31 a12 a23 − a31 a13 a22 . (17.11)

La solución del sistema de tres ecuaciones puede ser expresada, mediante determinantes
de orden 3, como

D1 D2 D3
x1 = , x2 = , x3 = (17.12)
D D D
donde D = 0 es el determinante de los coeficientes (17.10) y
     
 b1 a12 a13   a11 b1 a13   a11 a12 b1 
     
D1 =  b2 a22 a23  , D2 =  a21 b2 a23  , D3 =  a21 a22 b2  . (17.13)
 b3 a32 a33   a31 b3 a33   a31 a32 b3 

EJEMPLO 17.2 Resuelva mediante determinantes las ecuaciones

2x − 3y + 4z = 8
y − 3z = −7
x + 2y + 2z = 11 .
Por la ecuación (17.10), el determinante de los coeficientes es
 
 2 −3 4       
   1 −3   −3 4   

D =  0  
1 −3  = 2     + 1  −3 4 
2 2  − 0 2 2   1 −3 
 1 2 2 

= 2 × 8 − 0 × (– 14) + 1 × 5 = 21 .

Por las ecuaciones (17.13), los determinantes D1 , D2 y D3 son


     
 8 −3 4   2 8 4   2 −3 8 
     
D1 =  −7 1 −3  = 21 , D2 =  0 −7 −3  = 42 , D3 =  0 1 −7  = 63 .
 11 2 2   1 11 2   1 2 11 

Por lo tanto x = D1 /D = 1, y = D2 /D = 2 y z = D3 /D = 3.
17.2. Determinantes de orden 3 429

Menores y cofactores

El menor Mij del elemento aij de un determinante D es el determinante que se obtiene


suprimiendo la fila i y la columna j de D. Por ejemplo, (17.14) muestra el resultado de
suprimir la fila 2 y la columna 3 de un determinante de orden 3.
  
 a11 a12 a13   a a 
 a21 a22 a23   11 12 
 = = M23 . (17.14)
 a a a  a31 a32 
31 32 33

En general, los menores de un determinante de orden n son determinantes de orden n−1.


Son importantes porque se usan para el desarrollo de un determinante en función de sus
elementos. Ası́ por ejemplo, podemos escribir la ecuación (17.10) como
 
 a11 a12 a13 
 
 a21 a22 a23  = a11 M11 − a21 M21 + a31 M31 . (17.15)
 
 a31 a32 a33 

Esto se denomina desarrollo con respecto a la primera columna: cada elemento de la


primera columna se multiplica por su menor, y se suman los productos con unos signos
apropiados. El signo asociado al elemento aij es

+1 si i + j es par,
(– 1) i+j
= (17.16)
−1 si i + j es impar.

Los signos para el determinante de orden tres son


 
+ − +
 
− + −. (17.17)
 
+ − +

Un determinante puede desarrollarse con respecto a cualquier fila o columna.

EJEMPLO 17.3 Desarrolle un determinante de orden 3 con respecto a la segunda fila.

Los elementos de la segunda fila son a21 , a22 y a23 . Por lo tanto, utilizando (17.17) para los signos,
 
 a11 a12 a13 a21 
 
fila 2 −→  a22 a23  = −a21 M21 + a22 M22 − a23 M23 .

 a 
31 a32 a33

El menor M21 es
 
 a11 a12 a13   
   a12 a13 
M21 =  a21 a22 a23 =
  a32 a33
 = a12 a33 − a13 a32 .

a a32 a33 
31
430 Capı́tulo 17. Determinantes

De manera similar,
   
 a11 a13   a11 a12 
M22 =   = a11 a33 − a13 a31 ,
 M23 =   = a11 a32 − a12 a31 .

a31 a33 a31 a32
El desarrollo completo del determinante en función de sus elementos es por lo tanto
−a21 M21 + a22 M22 − a33 M33 = − a21 (a12 a33 − a13 a32 )

+ a22 (a11 a33 − a13 a31 ) − a23 (a11 a32 − a12 a31 )
que es idéntico al resultado (17.11) obtenido mediante el desarrollo con respecto a la primera columna.

EJEMPLO 17.4 Halle el valor del siguiente determinante desarrollándolo (a) con respecto a la primera
fila y (b) con respecto a la tercera columna:
 
 2 1 3 
 
D =  4 −2 0  .
 −1 1 0 
(a) El desarrollo con respecto a la primera fila es
     
 −2 0     
D = 2 ×   − 1 ×  4 0  + 3 ×  4 −2 
1 0   −1 0   −1 1 

= 2 × 0 − 1 × 0 + 3 × 2 = 6.
(b) El desarrollo con respecto a la tercera columna es
 
 4 −2 
D = 3   − 0 + 0 = 3 × 2 = 6.
−1 1 

El cofactor Cij del elemento aij es el menor Mij multiplicado por el correspondiente signo,

Cij = (– 1)i+j Mij . (17.18)

El desarrollo (17.15) con respecto a la primera columna es entonces


 
 a11 a12 a13  
  3
 a21 a22 a23  = a11 C11 + a21 C21 + a31 C31 = ai1 Ci1 .
 
 a31 a32 a33  i=1

Más generalmente, el desarrollo con respecto a la columna j es


 
 a11 a12 a13  
  3
 a21 a22 a23  = a1j C1j + a2j C2j + a3j C3j = aij Cij , (17.19)
 
 a31 a32 a33  i=1

y con respecto a la fila i es


 
 a11 a12 a13  
  3
 a21 a22 a23  = ai1 Ci1 + ai2 Ci2 + ai3 Ci3 = aij Cij . (17.20)
 
 a31 a32 a33  j=1
17.3. Caso general 431

El desarrollo en función de cofactores se denomina desarrollo de Laplace del determi-


nante.

EJEMPLO 17.5 Halle los cofactores de los elementos de la tercera columna de


 
 2 1 3 
 
 4 −2 0 .
 
 −1 1 0 
Tenemos  
 4 −2 
a13 = 3 M13 =  =2 C13 = +M13 = 2 ,
−1 1 
 
 2 1 
a23 = 0 M23 =  =3 C23 = −M23 = −3 ,
−1 1 
 
 2 1 
a33 = 0 M33 =  = −8 C33 = +M33 = −8 .
4 −2 

17.3. Caso general

Un determinante de orden n es una cantidad que depende de una tabla cuadrada con
n2 elementos, representado por
 
 a11 a12 a13 ··· a1n 
 
 a21 a22 a23 ··· a2n 
 
 a31 a32 a33 ··· a3n 
 . (17.21)
 .. .. .. .. .. 
 . . . . . 
 
 an1 an2 an3 ··· ann 

El determinante se define para n = 1 como

D = |a11 | = a11 . (17.22)

Se define para n ≥ 2 por su desarrollo con respecto a una fila cualquiera i (i = 1, 2, . . . , n)


n

D = ai1 Ci1 + ai2 Ci2 + · · · + ain Cin = aij Cij , (17.23)


j=1

o de manera equivalente, por el desarrollo con respecto a una columna cualquiera j (j =


1, 2, . . . , n)

n

D = a1j C1j + a2j C2j + · · · + anj Cnj = aij Cij . (17.24)


i=1
432 Capı́tulo 17. Determinantes

La cantidad

Cij = (– 1)i+j Mij (17.25)

es el cofactor del elemento aij y Mij es el menor de aij , el determinante de orden n − 1


que se obtiene a partir de D suprimiendo la fila i y la columna j.

EJEMPLO 17.6 Halle el valor de


 
 2 1 1 3 

 4 −2 1 
 0
D= .
 −1 1 0 2 
 
 0 3 1 −1 
Desarrollando con respecto a la primera fila tenemos
       
 −2 0 1   4 0 1   4 −2 1   4 −2 0 
       
D = 2   −1   −1  − 3  −1 1 0  .
1 0 2  − 1 0 2  + 1 1 2  
 3 1 −1   0 1 −1   0 3 −1   0 3 1 
Cada uno de los determinantes de orden tres puede calcularse por el método visto en el Apartado 17.2, esto
es, desarrollándolo en menores de orden 2. Entonces, desarrollando cada uno con respecto a su primera fila,
      
 0 2   1 2   1 0 
D = 2 − 2  − 0  + 1  
1 −1   3 −1   3 1 
      
 0 2   −1 2   −1 0 
−1 4   − 0  + 1  
1 −1  0 −1  0 1 
      
 1 2   2   −1 1 
+1 4  − (– 2)  −1 + 1  
3 −1   0 −1   0 3 
      
 1 0     
−3 4   − (– 2)  −1 0  + 0  −1 1 
3 1   0 1   0 3 

= 2 × 5 − 1 × (– 9) + 1 × (– 29) − 3 × 2 = −16 .

EJEMPLO 17.7 Halle el valor de


 
 1 2 3 4 5 
 
 0 6 7 8 9 

 
D= 0 0 10 11 12  .
 
 0 0 0 13 14 

 0 0 0 0 15 
Desarrollando con respecto a la primera columna, tenemos
 
 6 7 8 9   
   10 11 12   
 0 10 11 12     13 14 
 
D = 1  = 1 × 6  0 13 14  = 1 × 6 × 10   = 1 × 6 × 10 × 13 × 15 .

 0 0 13 14   0 0 15  0 15
 
 0 0 0 15 

El valor de un determinante ‘triangular’ es igual al producto de los elementos de la diagonal, D = a11 ×


a22 × a33 × · · · × ann .
17.4. Resolución de ecuaciones lineales 433

NOTA: sobre el cálculo de determinantes y la resolución de ecuaciones lineales


El desarrollo de un determinante en función de sus elementos consiste en n! produc-
tos de n elementos por vez, e implica n! (n − 1) productos (véase (17.11) para n = 3). Se
deduce por lo tanto que estos desarrollos no proporcionan un método práctico (ni preci-
so) para el cálculo de determinantes grandes. Lo mismo ocurre con la utilización de la
regla de Cramer para resolver ecuaciones lineales que tratamos en el siguiente Apartado.
Salvo para valores muy pequeños de n, deben usarse siempre métodos numéricos como
los que describimos en el Apartado 17.6 y en el Capı́tulo 20.

17.4. Resolución de ecuaciones lineales

Hemos visto en los Apartados 17.1 y 17.2 que las soluciones de dos ecuaciones li-
neales, (17.6), o de tres ecuaciones lineales (17.12), pueden escribirse como cocientes
de determinantes si el determinante de los coeficientes de las incógnitas no es cero. En
general, el sistema de n ecuaciones lineales,

a11 x1 + a12 x2 + a13 x3 + · · · + a1n xn = b1


a21 x1 + a22 x2 + a23 x3 + · · · + a2n xn = b2
a31 x1 + a32 x2 + a33 x3 + · · · + a3n xn = b3 (17.26)
.. .. .. .. ..
. . . . .
an1 x1 + an2 x2 + an3 x3 + · · · + ann xn = bn

tiene una solución única si el determinante


 
 a11 a12 a13 ··· a1n 
 
 a21 a22 a23 ··· a2n 
 
 ··· 
D =  a31 a32 a33 a3n  (17.27)
 . .. .. .. .. 
 .. . . . . 
 
a a an3 ··· ann 
n1 n2

no es cero. Esa solución viene dada por la regla de Cramer,3

D1 D2 Dn
x1 = , x2 = , ... , xn = , (17.28)
D D D
donde Dk se obtiene a partir de D sustituyendo la columna k de D por la columna con los
elementos b1 , b2 , . . . , bn . Por ejemplo,

03. El suizo Gabriel Cramer (1704-1752) publicó la regla en su Introduction à l’analyse des lignes
courbes algébriques (Introducción al análisis de las lı́neas curvas algebraicas) en 1750.
434 Capı́tulo 17. Determinantes

 
 a11 b1 a13 ··· a1n 
 
 a21 b2 a23 ··· a2n 
D2 1  a31 b3 a33 ··· a3n


x2 = =  . (17.29)
D D .. .. .. .. .. 
 . . . . . 
 
 an1 bn an3 ··· ann 

Este resultado puede obtenerse generalizando el método empleado en el caso de tres


ecuaciones del Apartado 17.2. Ası́, para x2 , multiplicando cada ecuación de (17.26) por
el cofactor del coeficiente de x2 y sumando después, tenemos Dx2 = D2 . Entonces x2 =
D2 /D si D = 0. Los Ejemplos 17.1 y 17.2 lo son del uso de la regla de Cramer.

Caso D=0

La regla de Cramer no se puede aplicar si el determinante de los coeficientes es cero.


Por ejemplo, el sistema

(1) 2x + 2y + z = 10
(2) x + 2y − 2z = −3 (17.30)
(3) 3x + 2y + 4z = 20

tiene determinante
 
2 2 1       
   2 −2   1 −2   1 2 
D =  1 2 −2  = 2
 2
 − 2 +  = 24 − 20 − 4 = 0 .
3 2  4 3 4 3 2 
4

En el Apartado 17.5 tratamos la condición general de que un determinante sea cero. En


el caso que nos ocupa, no hay soluciones de (17.30) porque las ecuaciones son incom-
patibles. En efecto, sumando las ecuaciones (2) y (3) tenemos

4x + 4y + 2z = 17 ,

mientras que dos veces la ecuación (1) es

4x + 4y + 2z = 20 .

El sistema puede hacerse compatible si, por ejemplo, cambiamos el segundo miembro
de (3) a 23:

(1) 2x + 2y + z = 10
(2) x + 2y − 2z = −3 (17.31)
(3) 3x + 2y + 4z = 23 .
17.4. Resolución de ecuaciones lineales 435

Ahora la suma de (2) y (3) es igual a dos veces (1), pero eso supone que la ecuación (1)
no contiene información que no esté ya contenida en las otras dos ecuaciones.
Se dice que las ecuaciones son linealmente dependientes, y tenemos en la práctica
únicamente dos ecuaciones con tres incógnitas. Por ejemplo, resolviendo (1) y (2), o
cualquier otro par, para x e y en función de z obtenemos

1
x = 13 − 3z , y= (5z − 16) , (17.32)
2
que es una solución del sistema (17.31) para cada valor de z.

Ecuaciones homogéneas

Si al menos una de las cantidades bi de los primeros miembros de las ecuaciones


(17.26) no es cero, las ecuaciones se dicen ecuaciones no homogéneas y homogéneas
si todos los bi son cero:

a11 x1 + a12 x2 + a13 x3 + · · · + a1n xn = 0


a21 x1 + a22 x2 + a23 x3 + · · · + a2n xn = 0
a31 x1 + a32 x2 + a33 x3 + · · · + a3n xn = 0 . (17.33)
.. .. .. .. ..
. . . . .
an1 x1 + an2 x2 + an3 x3 + · · · + ann xn = 0

La solución de un sistema homogéneo viene dada por la regla de Cramer si el deter-


minante de los coeficientes, D, no es cero. Sin embargo, puesto que b1 = b2 = · · · =
bn = 0, se deduce que los determinantes D1 , D2 , . . . , Dn en (17.28) son también cero, de
manera que la única solución de (17.33) es

x1 = x2 = x3 = · · · = xn = 0 si D = 0 . (17.34)

Por otra parte, hay soluciones no nulas si D = 0. Por ejemplo, el sistema

(1) 2x + 2y + z = 0
(2) x + 2y − 2z = 0 (17.35)
(3) 3x + 2y + 4z = 0

tiene D = 0, y una solución es la solución trivial (nula) x = y = z = 0. Las soluciones


no nulas se obtienen resolviendo cualquier par de ecuaciones para x e y en función de z:

5z
x = −3z , y= , (17.36)
2
para cualquier valor de z. Sólo se obtiene una solución única si se conoce una relación
adicional, independiente, entre x, y y z.
436 Capı́tulo 17. Determinantes

Este ejemplo ilustra uno de los teoremas más importantes de los sistemas de ecuacio-
nes lineales:

Un sistema de ecuaciones lineales homogéneo tiene solución no tri-


vial sólo si el determinante de los coeficientes es cero.

En el Capı́tulo 19 trataremos los sistemas de ecuaciones lineales con más detalle como
ecuaciones matriciales.

Ecuaciones seculares

Varios problemas en las ciencias fı́sicas dan lugar a sistemas de ecuaciones de la


forma
a11 x1 + a12 x2 + a13 x3 + · · · + a1n xn = λx1
a21 x1 + a22 x2 + a23 x3 + · · · + a2n xn = λx2
a31 x1 + a32 x2 + a33 x3 + · · · + a3n xn = λx3 (17.37)
.. .. .. .. ..
. . . . .
an1 x1 + an2 x2 + an3 x3 + · · · + ann xn = λxn

siendo λ un parámetro por determinar. Por ejemplo, en la teorı́a de orbitales moleculares,


la ecuación de Schrödinger se sustituye por uno de estos sistemas donde las cantidades
x1 , x2 , . . . , xn representan un orbital y λ la correspondiente energı́a orbital. Las ecuaciones
pueden expresarse como

(a11 − λ)x1 + a12 x2 + a13 x3 + ··· + a1n xn =0


a21 x1 + (a22 − λ)x2 + a23 x3 + ··· + a2n xn =0
a31 x1 + a32 x2 + (a33 − λ)x3 + · · · + a3n xn =0 . (17.38)
.. .. .. .. ..
. . . . .
an1 x1 + an2 x2 + an3 x3 + · · · + (ann − λ)xn = 0

Estas ecuaciones, denominadas ecuaciones seculares, tienen solución no trivial única-


mente si el determinante de los coeficientes es cero:
 
 (a11 − λ) a12 a13 ··· a1n 
 
 a21 (a22 − λ) a23 ··· a2n 
 (a33 − λ) · · · 
 a31 a32 a3n  = 0. (17.39)
 
 .. .. .. .. .. 
 . . . . . 
 an1 an2 an3 · · · (ann − λ) 

El determinante, denominado en este contexto determinante secular, es cero única-


mente para ciertos valores del parámetro λ, y esos valores se obtienen resolviendo la
17.4. Resolución de ecuaciones lineales 437

ecuación (17.39). Como el desarrollo del determinante secular es un polinomio en λ de


grado n, los valores buscados de λ son las n raı́ces del polinomio.

EJEMPLO 17.8 Halle los valores de λ para los cuales el siguiente sistema de ecuaciones tiene solución
no nula:

−2x + y + z = λx
− 11x + 4y + 5z = λy
−x + y = λz .
Las ecuaciones pueden expresarse como

(– 2 − λ)x + y + z =0
− 11x + (4 − λ)y + 5z =0
−x + y + (– λ)z = 0

y tiene solución no nula si


 
 −2 − λ 1 1 
 

D =  −11 4−λ 5  = 0.

 −1 1 −λ 

Por lo tanto
     
 4−λ 5   −11 5   −11 4 − λ 
D = (– 2 − λ)  −
  −1 −λ
+
  −1


1 −λ 1

= (– 2 − λ)[ − λ(4 − λ) − 5] − [11λ + 5] + [ − 11 + (4 − λ)]

= −λ3 + 2λ2 + λ − 2 = −(λ − 1)(λ + 1)(λ − 2) ,

y D = 0 si λ = 1, −1, ó 2.

Para cada una de las n raı́ces del determinante secular existe una solución de las ecua-
ciones (17.38).

EJEMPLO 17.9 Resuelva el problema de orbitales moleculares de Hückel

(1) (α − E)c1 + βc2 =0


(2) βc1 + (α − E)c2 + βc3 =0
(3) βc2 + (α − E)c3 = 0
en función de los parámetros de Hückel α y β. Las ecuaciones tienen solución no nula si el determinante
de los coeficientes c1 , c2 y c3 es cero:
 
 α−E β 0 
 
 β α−E β  = (α − E)[(α − E)2 − 2β 2 ] = 0 .
 
 0 β α−E 
438 Capı́tulo 17. Determinantes
√ √
Las tres raı́ces son E1 = α, E2 = α + 2β y E3 = α = 2β. Las correspondientes soluciones se obtienen
sustituyendo en las ecuaciones E por cada una de las raı́ces. Resolvemos para c1 y c2 en función de c3
(arbitrario):

E = E1 = α : (1) βc2 = 0 −→ c2 = 0 ,
(2) βc1 + βc3 = 0 −→ c1 = −c3 .

√ √ √
E = E2 = α + 2β : (3) βc2 − 2βc3 = 0 −→ c2 = 2c3 ,
√ √
(1) − 2βc1 + βc2 = 0 −→ c 1 = c2 / 2 = c3 .

√ √ √
E = E3 = α − 2β : (3) βc2 + 2βc3 = 0 −→ c2 = − 2c3 ,
√ √
(1) 2βc1 + βc2 = 0 −→ c1 = −c2 / 2 = c3 .
Las tres soluciones del problema secular son, tomando c3 = 1 por comodidad,
E c1 c2 c3
α −1 0 1
√ √
α + 2β 1 2 1
√ √
α − 2β 1 − 2 1

17.5. Propiedades de los determinantes

Las propiedades más importantes de los determinantes son las siguientes.

1. Transposición

Como el valor de un determinante es el mismo desarrollándolo por cualquier fila o


columna,
el valor de un determinante no varı́a si se intercambian sus filas y sus
columnas:

   
 a1 b1 c1   a1 a2 a3 
   
 a2 b2 c2  =  b1 b2 b3  . (17.40)
   
 a3 b3 c3   c1 c2 c3 

2. Multiplicación por una constante

Si todos los elemento de alguna fila (o columna) se multiplican por el


mismo factor λ, el valor del nuevo determinante es λ veces el valor
del determinante original:
17.5. Propiedades de los determinantes 439

   
 λa1 λb1 λc1   a1 b1 c1 
   
 a2 b2 c2  = λ  a2 b2 c2  . (17.41)
   
 a3 b3 c3   a3 b3 c3 

EJEMPLO 17.10 Ejemplos de la Propiedad 2.

     
 2 4 6   1 2 3   1 1 3 
     
 1 8 9  = 2 1 8 9  = 2 × 2 1 4 9 
     
 3 12 27   3 12 27   3 6 27 
   
 1 1 1   1 1 1 
   
= 2 × 2 × 3  1 4 3  = 2 × 2 × 3 × 3  1 4 3  = 144 .

 3 6 9   1 2 3 

3. Fila o columna nula


Si todos los elementos de una fila (o columna) son cero, el valor del
determinante es cero:
 
 0 0 0
 
 a2 b2 c2  = 0 . (17.42)
 
 a3 b3 c2 

Esto se deduce de la Propiedad 2 con λ = 0, o desarrollando con respecto a la fila (o


columna) de ceros.

4. Regla de la suma

Si todos los elementos de alguna fila (o columna) se escriben como


la suma de dos términos, el determinante se puede escribir como la
suma de dos determinantes:
     
 a1 + d1 b1 c1   a1 b1 c1   d1 b1 c1 
     
 a2 + d2 b2 c2  =  a2 b2 c2  +  d2 b2 c2  . (17.43)
     
 a3 + d3 b3 c3   a3 b3 c3   d3 b3 c3 

Esto se obtiene del desarrollo de los tres determinantes con respecto a la fila o columna
pertinente; en (17.43) es la columna 1. Ası́,
440 Capı́tulo 17. Determinantes

 
 a1 + d1 b1 c1       
       
 a2 + d2 b2 c2  = (a1 + d1 )  b2 c2  − (a2 + d2 )  b1 c1  + (a3 + d3 )  b1 c1 
   b3 c3   b3 c3   b2 c2 
 a3 + d3 b3 c3 
     
 b2 c2   b1 c1   b1 c1 
= a1   
− a2   
+ a3  
b3 c3  b3 c3  b2 c2 
     
 b2 c2   b1 c1   b1 c1 

+ d1   − d2   
+ d3  
b3 c3  b3 c3  b2 c2 
   
 a1 b1 c1   d1 b1 c1 
   
=  a2 b2 c2  +  d2 b2 c2  .
 a3 b3 c3   d3 b3 c3 

5. Intercambio de filas (o columnas). Antisimetrı́a

Si se intercambian dos filas (o dos columnas) de un determinante, el


valor del determinante se multiplica por (– 1):
   
 a1 b1 c1   a2 b2 c2 
   
 a2 b2 c2  = −  a1 b1 c1  (intercambio de las filas 1 y 2) . (17.44)
   
 a3 b3 c3   a3 b3 c3 

   
 a1 b1 c1   a1 c1 b1 
   
 a2 b2 c2  = −  a2 c2 b2  (intercambio de las columnas 2 y 3) . (17.45)
   
 a3 b3 c3   a3 c3 b3 

Se dice que el determinante es antisimétrico con respecto al intercambio de filas o de


columnas. Es esta propiedad de los determinantes la que los hace tan útiles para construir
funciones de onda electrónicas.

EJEMPLO 17.11 Determinantes de orden 2.

Intercambio de columnas:
   
 a1 b1   
  = a1 b2 − b1 a2 = −(b1 a2 − a1 b2 ) = −  b1 a1  .
 a2 b2   b2 a2 

Intercambio de filas:
   
 1 2   3 4 

D1 =   = 1 × 4 − 2 × 3 = −2 , D2 =   = 3 × 2 − 4 × 1 = +2 = −D1 .
3 4  1 2 
17.5. Propiedades de los determinantes 441

EJEMPLO 17.12 Determinante de orden 3.

Por el Ejemplo 17.2,


 
 2 −3 4 
 
D =  0 1 −3  = 21 .
 1 2 2 
Intercambiando las filas 1 y 3 tenemos
 
 1 2 2       
   1 −3     
D =  0 1 −3  =   − 2  0 −3  + 2  0 1 
−3 4   2 4   2 −3 
 2 −3 4 

= −5 − 12 − 4 = −21 = −D .

6. Dos filas o columnas iguales


Si dos filas (o dos columnas) son iguales, el valor del determinante
es cero:
 
 a1 b1 c1 
 
 a1 b1 c1  = 0 . (17.46)
 
 a3 b3 c3 

Esto se deduce de la propiedad de antisimetrı́a de los determinantes. Por la Propiedad


5 el signo del determinante cambia si intercambiamos dos filas (o dos columnas). Si
las filas (o las columnas) son idénticas, intercambiarlas tiene que dejar el determinante
inalterado. Por lo tanto −D = D y esto sólo es posible si D = 0.

EJEMPLO 17.13 Ejemplo de la Propiedad 6. Las filas 1 y 2 son iguales.


 
 1 1 1       
   1 1   1 1   1 1 
 1 1 1 = − +  = 1 − 2 + 1 = 0.
   3 4   2 4   2 3 
 2 3 4 

7. Filas o columnas proporcionales


Si una fila (o columna) es un múltiplo de otra fila (o columna), el de-
terminante es cero:
   
 λa2 λb2 λc2   a2 b2 c2 
   
 a2 b2 c2  = λ  a2 b2 c2  = 0 . (17.47)
   
 a3 b3 c3   a3 b3 c3 
442 Capı́tulo 17. Determinantes

Esto se deduce de la Propiedad 2 del múltiplo de un determinante, y de la Propiedad 6


para dos filas iguales.

EJEMPLO 17.14 Ejemplo de la Propiedad 7. Una fila es un múltiplo de otra fila.


   
 4 2 6   2 1 3 
   
 2 1 3  = 2 2 1 3  = 0.
   
 3 4 5   3 4 5 

8. Suma de filas o columnas


El valor de un determinante no cambia si se suma un múltiplo de
alguna fila (o columna) a cualquier otra fila (o columna):

       
 a1 + λb1 b1 c1   a1 b1 c1   λb1 b1 c1   a1 b1 c1 
       
 a2 + λb2 b2 c2  =  a2 b2 c2  +  λb2 b2 c2  =  a2 b2 c2  . (17.48)
       
 a3 + λb3 b3 c3   a3 b3 c3   λb3 b3 c3   a3 b3 c3 

Esto se deduce de la Propiedad 4 para la suma de determinantes y de la Propiedad 7 para


el caso de una columna igual a un múltiplo de otra.

EJEMPLO 17.15 Ejemplo de la Propiedad 8. Se ha sumado a la columna 1 tres veces la columna 2.


         
 4 1 1   (1 + 3 × 1) 1 1   1 1 1   1 1 1   1 1 1 
         
 8 3 4  =  (2 + 3 × 3) 3 4  =  2 3 4  + 3 3 3 4 = 2 3 4 .
         
 15 5 6   (0 + 3 × 5) 5 6   0 5 6   5 5 6   0 5 6 

9. Derivada de un determinante

Si los elementos de un determinante D son funciones derivables, la


derivada de D, D , puede expresarse como

D = D1 + D 2 + D 3 + · · · + Dn , (17.49)

donde Di se obtiene derivando los elementos de la fila i de D.

EJEMPLO 17.16 Derivada de un determinante de orden tres.

Si los elementos son funciones de x,


     
   da1 da2 da3   a   a1 
 a1 a2 a3   dx  
 
1 a2 a3   a2 a3 
d    dx dx   db1 db2 db3   b1 
 b1 b2 b3  =  b1 b2 b3 + +
 
b2 b3 .

dx     dx
c1 c2 c3     dc1 
dx dx dc2 dc3
    
c1 c2 c3  c1 c2 c3 dx dx dx
17.7. Funciones alternadas 443

17.6. Reducción a forma triangular

Hemos visto en el Ejemplo 17.6 que el valor de un determinante ‘triangular’ es igual


al producto de los elementos de su diagonal,
 
 a11 a12 a13 a14 · · · a1n 
 
 0 a22 a23 a24 · · · a2n 
 
 0 0 a33 a34 · · · a3n 
 
 0 0 0 a · · · a  = a11 × a22 × a33 × · · · × ann . (17.50)
 44 4n 
 . 
 . .. .. .. . . . 
 . . . . . .. 
 
 0 0 0 0 · · · ann 

Todo determinante se puede reducir a forma triangular mediante la aplicación sistemáti-


ca de la Propiedad 8 del Apartado 17.5. El método es un ejemplo de los métodos de
eliminación que tratamos en el Capı́tulo 20, y lo ilustramos en el Ejemplo 17.7 para un
determinante de orden tres.

EJEMPLO 17.17 Ejemplo de reducción a forma triangular.


 
 1 2 3 
 
 3 2 5  restando (3 × fila 1) a la fila 2
 
 2 3 6 
 
 1 2 3 
 
=  0 −4 −4 
 restando (2 × fila 1) a la fila 3
 2 3 6 
 
 1 2 3 
 
=  0 −4 −4 
 restando ( 41 × fila 2) a la fila 3
 0 −1 0 
 
 1 2 3 
 
=  0 −4 −4 

 0 0 1 
= 1 × (– 4) × 1 = −4 .

17.7. Funciones alternadas

Una función f (x1 , x2 , x3 , . . . , xn ) de n variables se llama función alternada o total-


mente antisimétrica, si intercambiar dos variables cualesquiera supone multiplicar el
valor de la función por (– 1). Si se intercambian x1 y x2 :

f (x2 , x1 , x3 , . . . , xn ) = −f (x1 , x2 , x3 , . . . , xn ) . (17.51)


444 Capı́tulo 17. Determinantes

Si dos variables son iguales, la función es cero:

f (x1 , x1 , x3 , . . . , xn ) = 0 . (17.52)

Un determinante es una función alternada de sus filas (o de sus columnas). Más impor-
tante, un determinante que es una función alternada de n variables, x1 , x2 , x3 , . . . , xn , tiene
la forma
 
 f1 (x1 ) f1 (x2 ) f1 (x3 ) . . . f1 (xn ) 
 
 f (x ) f (x ) f (x ) . . . f (x ) 
 2 1 2 2 2 2 2 n 
 
 f3 (x1 ) f3 (x2 ) f3 (x3 ) . . . f3 (xn ) 
 , (17.53)
 . .. 
 .. .. .. ..
 . . . . 
 
 f (x ) f (x ) f (x ) . . . f (x ) 
n 1 n 2 n 2 n n

donde f1 , f2 , . . . , fn son funciones arbitrarias. Intercambiar cualquier par de variables


supone intercambiar dos columnas y, por lo tanto, cambiar el signo. Para n = 2,
 
 f1 (x1 ) f1 (x2 ) 
  = f1 (x1 )f2 (x2 ) − f1 (x2 )f2 (x1 ) . (17.54)
 f (x ) f (x ) 
2 1 2 2

Para n = 3,
 
 f1 (x1 ) f1 (x2 ) f1 (x3 ) 
 
 
 f2 (x1 ) f2 (x2 ) f2 (x3 ) = f1 (x1 )f2 (x2 )f3 (x3 ) − f1 (x1 )f2 (x3 )f3 (x2 )
 
 f3 (x1 ) f3 (x2 ) f3 (x3 )  + f1 (x2 )f2 (x3 )f3 (x1 ) − f1 (x2 )f2 (x1 )f3 (x3 )

+ f1 (x3 )f2 (x1 )f3 (x2 ) − f1 (x3 )f2 (x2 )f3 (x1 ) . (17.55)

El desarrollo del determinante tiene n! productos de las funciones f1 , f2 , . . . , fn , cada uno


con las n variables ordenadas de manera diferente, correspondiendo a las n! permuta-
ciones posibles de n objetos. Ası́, en (17.55), las 3! = 6 permutaciones de x1 , x2 y x3
son

x1 x2 x3 , x1 x3 x2 , x2 x3 x1 , x2 x1 x3 , x3 x1 x2 , x3 x2 x1 . (17.56)

Cada término contribuye a la suma con un signo + si la permutación se obtiene a partir


de x1 x2 x3 mediante un número par de transposiciones, y con un signo − si es mediante
un número impar de transposiciones.
Las funciones alternadas en forma de un único determinante o de sumas de determi-
nantes son importantes en mecánica cuántica para construir funciones de onda electróni-
cas. El electrón es miembro de la clase de partı́culas llamadas fermiones, partı́culas con
espı́n semientero (una partı́cula con espı́n nulo o entero se llama bosón). La función de
onda de un sistema de fermiones idénticos es totalmente antisimétrica con respecto al
17.8. Ejercicios 445

intercambio de las coordenadas (incluyendo el espı́n) de los fermiones. Es decir, inter-


cambiar las coordenadas de cualquier par de fermiones supone un cambio de signo en la
función de onda. * Ésta es precisamente la propiedad de una función alternada. De esta
manera, si las funciones f1 , f2 , . . . , fn del determinante (17.53) representan los estados
ocupados de los n electrones de un sistema, y si x1 , x2 , . . . , xn representan las n coordena-
das (incluyendo el espı́n) de los electrones, entonces las funciones se llaman orbitales
de espı́n y el determinante (17.53) se llama determinante de Slater. Por ser el determi-
nante de Slater antisimétrico, intercambiar (las coordenadas y el espı́n de) cualquier par
de electrones supone un cambio de signo en el determinante. Si dos de las funciones (or-
bitales de espı́n) son iguales, dos filas del determinante son iguales y el determinante es
cero. Esto representa el principio de exclusión de Pauli: dos electrones no pueden estar
en el mismo estado (orbital de espı́n).

17.8. Ejercicios

Apartados 17.1 a 17.3


Evalúe:
       
 4 1   2 0   0 1   cos nθ − sen nθ 
1.   2.   3.   4.  
 3 2   0 3   −2 3   sen nθ cos nθ 

5. (i) Halle todos los menores y cofactores de


 
 1 2 3 

 2 0 −1  .

 1 −1 1 

(ii) Evalúe el determinante desarrollándolo con respecto a la primera fila.


(iii) Compruebe que se obtiene el mismo valor desarrollando con respecto a la segunda
columna.

Evalúe:
       
 2 3 5   1 1 1   1 3 −2   0 3 2 
      
6.  0 1 2  7.  1 −1 0  8.  0 −1 2  9.  2 0 1 
      
 3 4 1   1 1 −2   0 0 4   2 6 0 

     
 3 4 0 0   −2 6 17 −5   1 1 0 0 
     
 1 2 0 0   0 3 22 −17   3 2 2 −3 
10.   11.  0 0 4 12 
12.  1 −1 
 0 0 3 1    2 2 
 0 0 4 2   0 0 0 −6   5 3 1 −1 

0* La función de onda de un sistema de bosones es totalmente simétrica, e intercambiar las coorde-


nadas de cualquier par de bosones idénticos deja la función sin cambios.
446 Capı́tulo 17. Determinantes

Apartado 17.4
Use la regla de Cramer para resolver los sistemas de ecuaciones:

w + 2x + 3y + z = 5
x + y + z= 6 3x − 2y − 2z = 0
2w + x + y + z= 3
13. x + 2y + 3z = 14 14. x + y − z = 0 15.
w + 2x + y = 4
x + 4y + 9z = 36 2x + 2y + z = 0
x + y + 2z = 0
16. Demuestre que las siguientes ecuaciones no tienen solución salvo si k = 3.
2x − y + z = 2
3x + y − 2z = 1
x − 3y + 4z = k
Resuelva las ecuaciones para ese valor de k.
17. Halle k para que las siguientes ecuaciones tengan solución no trivial.
kx + 5y + 3z = 0
5x + y − z = 0
kx + 2y + z = 0
Resuelva las ecuaciones para ese valor de k.

Halle los valores de λ para los que los siguientes sistemas de ecuaciones tengan soluciones no triviales.
Halle las soluciones para esos valores de λ.

3x + y = λx x + 2y − 3z = λx
2x + y = λx
18. 19. x + 2y + 3z = λy 20. 2x + 4y − 6z = λy
x + 2y = λy
4y + 9z = λz − x − 2y + 3z = λz

Apartados 17.5 a 17.7


Evalúe los siguientes determinantes reduciéndolos a forma triangular:
     
 3 2 −2   1 0 1 1   2 4 6 3 
     
 0 1 1 0   8 15 14 13 
21.  6 1 5  22.   23.  
 −9 3 4   1 0 0 1   7 9 13 9 
 1 1 1 0   1 2 5 5 

Use las propiedades de los determinantes para demostrar que:


   
 3 6 −3   2 2 −1     
     a b   
24.  2 1 5  = 0 25.  3 2 2  = 0 26.   = 1  a−b a+b 
 c d  2  c−d c+d 
 1 2 −1   −1 0 −3 

 
 a1 a2 a3 a4 
 
 b1 b2 b3 b4 
27. 16  
 c1 c2 c3 c4 
 d1 d2 d3 d4 

 
 a1 + b1 + c1 + d1 a2 + b2 + c2 + d2 a3 + b3 + c3 + d3 a4 + b4 + c4 + d4 
 
 a1 + b1 − c1 − d1 a2 + b2 − c2 − d2 a3 + b3 − c3 − d3 a4 + b4 − c4 − d4 
= 
 a1 − b1 + c1 − d1 a2 − b2 + c2 − d2 a3 − b3 + c3 − d3 a4 − b4 + c4 − d4 
 a1 − b1 − c1 + d1 a2 − b2 − c2 + d2 a3 − b3 − c3 + d3 a4 − b4 − c4 + d4 
17.8. Ejercicios 447

28. Desarrolle el determinante


 
 ψ1 (x1 ) ψ1 (x2 ) ψ1 (x3 ) ψ1 (x4 ) 
 
 ψ2 (x1 ) ψ2 (x2 ) ψ2 (x3 ) ψ2 (x4 ) 
 
 ψ3 (x1 ) ψ3 (x2 ) ψ3 (x3 ) ψ3 (x4 ) 
 ψ4 (x1 ) ψ4 (x2 ) ψ4 (x3 ) ψ4 (x4 ) 
 Matrices y transformaciones lineales

18.1. Conceptos

El álgebra matricial es la rama de las matemáticas que trata la teorı́a de los sistemas de
ecuaciones lineales, y es la herramienta básica para la formulación, el análisis teórico y
la resolución de problemas en las ciencias fı́sicas, ingenierı́a y estadı́stica, que dan lugar
a esos sistemas de ecuaciones. Una de las aplicaciones importantes en quı́mica usa el
concepto de transformaciones lineales para la representación matricial de operaciones de
simetrı́a en la descripción de las propiedades de simetrı́a de las moléculas, las funciones
de onda moleculares y los modos normales de vibración. En este capı́tulo presentamos
los elementos del álgebra matricial en los Apartados 18.2 a 18.4, y en los Apartados 18.5
y 18.6 la teorı́a matricial de las transformaciones lineales. En el Apartado 18.7 tratamos
las operaciones de simetrı́a, con una breve introducción a los grupos de simetrı́a.
Una matriz consiste en m × n cantidades, o elementos, dispuestos en una tabla rec-
tangular de m filas y n columnas situada entre paréntesis.1 Algunos ejemplos son
⎛ ⎞
    x1

1 0 0
2 −1 a b c ⎜ x2 ⎟
0 3 , d e f , ⎝x ⎠, 0 1 0 , (18.1)
3
0 0 1
x4

y la notación general para una matriz m × n, con mn elementos, es (véase el Apartado


17.1 para determinantes)
⎛ ⎞
a11 a12 a13 · · · a1n
⎜ · · · a2n ⎟
⎜ a21 a22 a23 ⎟
⎜ ⎟
⎜ a31 a32 a33 · · · a3n ⎟
A= ⎜ ⎟. (18.2)
⎜ ⎟
⎜ .. .. .. .. .. ⎟
⎝ . . . . . ⎠
am1 am2 am3 · · · amn

01. Sylvester acuñó el término matriz en 1850 para representar una ‘disposición oblonga de térmi-
nos que consiste, supongamos, en m lı́neas y n columnas’ porque a partir de ella ‘podemos formar varios
sistemas de determinantes’. James Joseph Sylvester (1814-1897) estudió matemáticas en Cambridge pero
no tenı́a derecho a obtener un tı́tulo de Cambridge por motivos religiosos (era judı́o). Recibió su tı́tulo del
Trinity College de Dublı́n. Sus cargos incluyeron la cátedra de matemáticas de la entonces recién fundada
Johns Hopkins University de Baltimore (1876-1883). Fue editor fundador del American Journal of Mathe-
matics (1878). Es conocido sobre todo por su colaboración con su amigo Cayley en la teorı́a de matrices y
formas.
450 Capı́tulo 18. Matrices y transformaciones lineales

En esta notación, el elemento aij está situado en la fila i y en la columna j. Aunque


en este texto empleamos paréntesis, las matrices se representan a veces entre corchetes,
y también se usan notaciones como (aij ) y [aij ]. Para ser matrices, las tablas tienen que
cumplir las leyes del álgebra matricial (Apartado 18.3).
El álgebra matricial tiene sus orı́genes en la descripción de transformaciones de coor-
denadas.2 Supongamos que el par de ecuaciones

x  = a1 x + b 1 y
(18.3)
y = a2 x + b2 y

representan un cambio de coordenadas en el plano xy de (x, y) a (x , y ). Esta transfor-


mación de coordenadas queda completamente caracterizada por los cuatro coeficientes
a1 , b1 , a2 , b2 , es decir por la tabla
 
a1 b1
. (18.4)
a2 b2

En álgebra matricial, las ecuaciones (18.3) se escriben como la ecuación matricial


     
x a1 b 1 x
= (18.5)
y a2 b2 y

o, asignando sı́mbolos a las distintas tablas,

r = Ar , (18.6)

siendo
     
x x a1 b1
r= , r = , A= . (18.7)
y y a2 b2

Las cantidades r y r son matrices columna (o vectores columna) cuyos elementos son
las coordenadas antes y después de la transformación de coordenadas, y A es la matriz
cuadrada de los coeficientes que representa y determina la transformación. Las transfor-

02. El álgebra de transformaciones de coordenadas fue tratado en 1801 por Gauss, y desarrollado
en 1858 en un álgebra por Cayley en su Memoir on the theory of matrices (Memoria sobre la teorı́a de
matrices), en la cual introdujo la notación con una única letra para una matriz y dedujo las reglas de la suma
y el producto.
Arthur Cayley (1821-1895) se graduó por el Trinity College de Cambridge en 1842, fue Becario durante
siete años y después ejerció la abogacı́a durante 14 años en los cuales publicó varios centenares de artı́culos.
Su producción sólo tiene rival en las de Euler o de Cauchy, con 967 artı́culos en sus Obras Completas. Es
conocido sobre todo por su trabajo sobre matrices y formas, también desarrolló la geometrı́a analı́tica de
espacios de n dimensiones en 1843, dio la primera definición de un grupo abstracto en 1854, y contribuyó a
la teorı́a de grafos, con una aplicación al estudio de isómeros quı́micos en 1874. Era muy solicitado como
referee por su conocimiento enciclopédico de las matemáticas.
18.2. Algunas matrices especiales 451

maciones de coordenadas son ejemplos de las transformaciones lineales que trataremos


en el Apartado 18.5.

EJEMPLO 18.1 La rotación como una transformación de coordenadas

Sea un punto P del plano xy, con coordenadas (x, y) con respecto al sistema de coordenadas Oxy. Como
vimos en el Apartado 8.5, un giro en sentido antihorario de ángulo θ en torno al eje Oz mueve el punto a la
posición P de coordenadas (x , y ), como en la Figura 18.1, de manera que (ecuaciones (8.41))

x = x cos θ − y sen θ
(18.8)
y = x sen θ + y cos θ .

Una interpretación alternativa de estas ecuaciones (‘pasiva’ en vez de ‘activa’) es el cambio de coordenadas
del punto fijo P si el propio sistema de coordenadas experimenta un giro en sentido horario de ángulo θ,
desde Oxy a Ox y como en la Figura 18.2.

Figura 18.1 Figura 18.2

Las coordenadas de P en el sistema girado son entonces (x , y ). La correspondiente ecuación matricial
es
    
x cos θ − sen θ x
= , (18.9)
y sen θ cos θ y

y la matriz
 
cos θ − sen θ
(18.10)
sen θ cos θ

caracteriza por completo la transformación de coordenadas (el giro de los ejes).


452 Capı́tulo 18. Matrices y transformaciones lineales

18.2. Algunas matrices especiales

Matrices cuadradas

Si el número de filas es igual al número de columnas, m = n, se dice que la matriz es


una matriz cuadrada de orden n. Por ejemplo, una matriz cuadrada de orden 3 es
⎛ ⎞
a11 a12 a13
⎝ a21 a22 a23 ⎠ (matriz cuadrada). (18.11)
a31 a32 a33

En tales matrices, la diagonal que contiene los elementos a11 , a22 , . . . , ann se llama diago-
nal principal (la palabra ‘principal’ se suele omitir), y los elementos aii de esa diagonal
se llaman elementos diagonales de la matriz. Los elementos aij con i = j, que no están
situados en la diagonal se dicen fuera de la diagonal: los elementos de la matriz (18.11)
situados fuera de la diagonal son a12 , a13 , a23 , a21 , a31 y a32 . Una matriz cuyos elementos
situados fuera de la diagonal son todos cero se llama matriz diagonal, por ejemplo:
⎛ ⎞
a11 0 0
⎝ 0 a22 0 ⎠ (matriz diagonal). (18.12)
0 0 a33

La matriz diagonal de orden n cuyos elementos diagonales son todos la unidad se llama
matriz identidad de orden n I (o In ). Para orden 3

1 0 0
I= 0 1 0 (matriz identidad). (18.13)
0 0 1

Dos cantidades escalares importantes asociadas a un matriz cuadrada A son el determi-


nante de la matriz, denotado por |A| o det A,

a11 a12 a13 · · · a1n

a21 a22 a23 · · · a2n
a a a ··· a
|A| = det A = 31 32 33 3n , (18.14)
... .. .. . . ..
. . . .
an1 an2 an3 · · · ann

y la suma de los elementos diagonales de la matriz, llamada la traza de la matriz,

tr A = a11 + a22 + a33 + · · · + ann = aii . (18.15)


i=1
18.2. Algunas matrices especiales 453

EJEMPLO 18.2 Halle el determinante y la traza de la matriz


⎛ ⎞
2 1 1 3
⎜ 4 –2 0 1 ⎟
A=⎝ .
–1 1 0 2 ⎠
0 3 1 –1
Por el Ejemplo 17.6, el determinante de A es

2 1 1 3

4 –2 0 1
det A = = −16 .
– 1 1 0 2
0 3 1 –1

La traza de A es
tr A = 2 + (– 2) + 0 + (– 1) = −1 .

Vectores

Una matriz que tiene una única columna se llama matriz columna o vector columna.
Una matriz con una única fila es una matriz fila o vector fila. Los elementos de un
vector se llaman componentes. Aunque las matrices se suelen representar por letras
mayúsculas, los vectores se representan con minúsculas:
⎛ ⎞
b1
⎜ b2 ⎟
⎜ ⎟
⎜b ⎟
a = (a1 2 3
a a · · · a n) , b=⎜ ⎜ 3 ⎟ (18.16)

⎜ .. ⎟
⎝ . ⎠
bn

(sólo es necesario un subı́ndice para las componentes de un vector). El álgebra matricial


incluye el álgebra vectorial como caso particular.

Matriz transpuesta

de una matriz A m×n es la matriz n×m que se obtiene a partir


La transpuesta AT (o A)
de A intercambiando sus filas y sus columnas: la primera columna de AT es la primera
fila de A, la segunda columna de AT es la segunda fila de A, etcétera. Por ejemplo,
⎛ ⎞
a 1 b1  
a1 a 2 a 3
si A = ⎝ a2 b2 ⎠ , entonces A =
T
. (18.17)
b1 b2 b3
a3 b3
454 Capı́tulo 18. Matrices y transformaciones lineales

EJEMPLO 18.3 Matrices transpuestas


⎛ ⎞
  1 −1
1 2 0
(i) si A= , entonces A =⎝ 2
T
4 ⎠.
−1 4 2
0 2
   
1 2 1 −3
(ii) si A= , entonces AT = .
−3 4 2 4
⎛ ⎞
3  
(iii) si a = ⎝ 2 ⎠, entonces aT = 3 2 −1 .
−1
⎛ ⎞
1 3 0
(iv) si A=⎝ 3 2 −1 ⎠ , entonces AT = A .
0 −1 0

El caso (iv) es un ejemplo de matriz simétrica, cuya transpuesta es igual a la matriz:

AT = A . (18.18)

Determinante

El valor del determinante de una matriz cuadrada no varı́a si se transpone la matriz,

det AT = det A . (18.19)

18.3. Álgebra matricial

Igualdad de matrices

Dos matrices, A = (aij ) y B = (bij ), son iguales si tienen las mismas dimensio-
nes (mismo número de filas y mismo número de columnas), y si los correspondientes
elementos son iguales:

(aij ) = (bij ) si aij = bij para todo i, j . (18.20)

EJEMPLO 18.4 Igualdad de matrices

Si    
a11 a12 a13 1 2 0
A= y B=
a21 a22 a23 −3 4 2
entonces A = B si a11 = 1, a12 = 2, a13 = 0, a21 = −3, a22 = 4 y a23 = 2.
18.3. Álgebra matricial 455

Suma de matrices

La suma de dos matrices se define únicamente si las matrices tienen las mismas di-
mensiones. Si A = (aij ) y B = (bij ) son ambas matrices m × n, su suma es una matriz
m × n que se obtiene sumando los correspondientes elementos de A y B:

A + B = (aij + bij ) . (18.21)

EJEMPLOS 18.5 Suma de matrices


     
1 2 3 1 −2 0 2 0 3
+ = ,
4 5 6 3 0 −1 7 5 5
     
1 −2 3 + −3 1 2 = −2 −1 5 ,
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
a1 b1 a1 + b1
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎝ a2 ⎠ + ⎝ b2 ⎠ = ⎝ a2 + b2 ⎠ .
a3 b3 a3 + b3

Multiplicación de una matriz por un escalar

El producto de una matriz A = (aij ), m × n, y un escalar (número) c es la matriz m × n


cuyos elementos se obtienen multiplicando cada elemento de A por c:

cA = (caij ) . (18.22)

EJEMPLOS 18.6 Multiplicación de una matriz por un escalar

Si ⎛ ⎞
1 2
A = ⎝−3 0 ⎠
5 −1
entonces ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
−1 −2 3 6 0 0
−A = ⎝ 3 0 ⎠, 3A = ⎝−9 0 ⎠, 0A = ⎝ 0 0 ⎠ .
−5 1 15 −3 0 0

Se deduce de las reglas de la suma y de la multiplicación por un escalar que una combina-
ción lineal de matrices m×n es una matriz m×n cuyos elementos son las combinaciones
lineales de los correspondientes elementos. Si A = (aij ), B = (bij ) y C = (cij ), entonces

αA + βB + γC = (αaij + βbij + γcij ) (18.23)

siendo α, β y γ escalares.
456 Capı́tulo 18. Matrices y transformaciones lineales

EJEMPLOS 18.7 Combinaciones lineales de matrices


     
1 2 3 1 −2 0 −1 10 6
2 −3 = ,
4 5 6 3 0 −1 −1 10 15
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 −1 −2 2 0 0
2⎝ 2 0 ⎠ + ⎝−4 0 ⎠=⎝ 0 0 ⎠.
−2 3 4 −6 0 0

La matriz m × n cuyos elementos son todos cero se llama matriz nula, m × n, 0. Se


deduce de lo anterior que
 
β
si αA + βB = 0 entonces A=− B. (18.24)
α

Multiplicación de matrices

El producto matricial C = AB (en este orden, con A a la izquierda de B) se define


únicamente si

el número de columnas de A = el número de filas de B . (18.25)

Entonces, si A es una matriz m × n con elementos aij , y B es una matriz n × p con


elementos bij , el producto C = AB es una matriz m × p cuyos elementos son

cij = ai1 b1j + ai2 b2j + ai3 b3j + · · · + ain bnj = aik bkj . (18.26)
k=1

En el caso más sencillo, si a es un vector fila (matriz) de n componentes ai y b es un


vector columna (matriz) de n componentes bi , el producto ab es
⎛ ⎞
b1
⎜ b2 ⎟
⎜ ⎟
⎜ b3 ⎟
ab = (a1 a2 a3 · · · an ) ⎜ ⎟
⎜ .. ⎟
⎝ . ⎠
bn

n

= a 1 b1 + a2 b2 + a3 b3 + · · · + an bn = ak bk . (18.27)
k=1

El producto es un número, una matriz 1×1. En este caso el producto matricial es equiva-
lente al producto escalar de dos vectores (de n dimensiones; véanse los Apartados 16.5
y 16.19).
18.3. Álgebra matricial 457

En el caso general, la receta (18.26) para el elemento ij es el ‘producto escalar’ de la


fila i de A y la columna j de B. De esta manera, destacando en negrita la fila y la columna
implicadas,
⎛ ⎞
a11 a12 a13 · · · a1n ⎛ ⎞
⎜ a21 a22 a23 · · · a2n⎟ b11 b12 · · · b1j ··· b1p
⎜ ⎟⎜ ⎟
⎜ .. .. .. . . ..⎟⎜ b21 b22 · · · b2j ··· b2p ⎟
⎜ ⎟⎜ ⎟
⎜ . . . . .⎟⎜ b31 b32 · · · b3j ··· b3p ⎟
C = AB = ⎜ ⎟ ⎟
⎜ ai1 ai2 ai3 · · · ain ⎟ ⎜ ⎟
⎜ ⎟⎜ .. .. .. .. ..

⎜ .. .. .. . . .. ⎟ ⎝ . . . . .
⎝ . . . . . ⎠ bn1 bn2 · · · bnj ··· bnp
am1 am2 am3 · · · amn

⎛ ⎞
c11 c12 · · · c1j · · · c1p
⎜ c21 c22 · · · c2j · · · c2p ⎟
⎜ ⎟
⎜ .. .. .. . ⎟
⎜ ..
. .. ⎟
⎜ . . . ⎟
=⎜ ⎟. (18.28)
⎜ ci1 ci2 · · · cij · · · cip ⎟
⎜ ⎟
⎜ .. .. .. . .. ⎟
⎝ . . . .. . ⎠
cm1 cm2 · · · cmj · · · cmp

EJEMPLO 18.8 Dos matrices cuadradas




c1 d1 a1 b1 c1 a1 + d1 a2 c1 b1 + d1 b2
= .
c2 d2 a2 b2 c2 a1 + d2 a2 c2 b1 + d2 b2

EJEMPLO 18.9 Dos matrices rectangulares


⎛ ⎞
  2 3 4 1  
2 0 −3 ⎝ 1 4 9 2 2
2 2 0 ⎠ = ,
1 1 −2 3 7 2 1
0 −1 2 0
dimensiones: (2 × 3) (3 × 4) (2 × 4) .

EJEMPLO 18.10 Vector fila × vector columna


⎛ ⎞
  2
1 2 3 ⎝ −2 ⎠ = (1) = 1 .
1

EJEMPLO 18.11 Vector columna × vector fila


⎛ ⎞ ⎛ ⎞
2   2 4 6
⎝−2 ⎠ 1 2 3 = ⎝−2 −4 −6 ⎠ .
1 1 2 3
458 Capı́tulo 18. Matrices y transformaciones lineales

EJEMPLO 18.12 Matriz × vector columna


⎛ ⎞
  1  
2 0 −3 ⎝ 2 ⎠ = −7 .
1 1 −2 −3
3

EJEMPLO 18.13 Vector fila × matriz


⎛ ⎞
  2 0 −3  
1 2 3 ⎝ 1 1 −2 ⎠ = 1 8 −7 .
−1 2 0

Propiedades de la multiplicación de matrices

Ley asociativa

A(BC) = (AB)C = ABC . (18.29)

El producto de matrices es asociativo y se pueden eliminar los paréntesis.

Ley distributiva

A(B + C) = AB + AC . (18.30)

Ley conmutativa

El producto de matrices no es conmutativo en general (aunque en algunos casos sı́),3

AB = BA . (18.31)

Si A es una matriz m × n y B es una matriz n × p, entonces AB es una matriz m × p, pero


BA no está definido salvo si p = n, en cuyo caso BA es una matriz cuadrada de orden n.
Los Ejemplos 18.10 y 18.11 ilustran la no conmutación del producto de una matriz fila
y una matriz columna. En ese caso AB y BA tienen dimensiones distintas.
Dos matrices no tienen por qué conmutar aunque sean ambas cuadradas y de mismo
orden. Ası́, si

03. El álgebra de los cuaterniones de Hamilton y el álgebra matricial de Cayley fueron los primeros
ejemplos de álgebras sin la limitación de la ley conmutativa para el producto. Llevaron al desarrollo de
álgebras generales que continúa hoy en dı́a.
18.3. Álgebra matricial 459

   
1 0 1 1
A= 0 0 , B= 1 0 ,

tenemos
    
1 0 1 1 1 1
AB = 0 0 1 0 = 0 0 ,

pero
    
1 1 1 0 1 0
BA = 1 0 0 0 = 1 0 ,

de manera que AB = BA. Un ejemplo de matrices que sı́ conmutan es


   
0 1 2 1
A= 1 0 , B= 1 2 ,

y
       
0 1 2 1 1 2 2 1 0 1
AB = 1 0 1 2 = 2 1 = 1 2 1 0 = BA .

Dada la posibilidad de la no conmutación, es fundamental preservar el orden correcto


de los factores en un producto. En el producto AB, la matriz B está premultiplicada, o
multiplicada por la izquierda, por A. La matriz A está postmultiplicada, o multipli-
cada por la derecha, por B.
Una cantidad que juega un papel importante en mecánica cuántica es el conmutador
de las matrices A y B,

[A, B] = AB − BA . (18.32)

EJEMPLO 18.14 Matrices de espı́n de Pauli

En mecánica cuántica, el espı́n del electrón se representa a veces por las tres matrices de espı́n de Pauli, una
por cada componente cartesiana del momento angular de espı́n,
     
1 0 1 1 0 −i 1 1 0
Sx =  , Sy =  , Sz =  , (18.33)
2 1 0 2 i 0 2 0 −1

donde i = −1 y  = h/2π, siendo h la constante de Planck. Estas matrices cumplen las siguientes
propiedades de conmutación:
460 Capı́tulo 18. Matrices y transformaciones lineales

[Sx , Sy ] = Sx Sy − Sy Sx
     
1 0 1 0 −i 0 −i 0 1
= 2 −
4 1 0 i 0 i 0 1 0
   
1 i 0 −i 0
= 2 −
4 0 −i 0 i
 
1 1 0
= i2 = iSz
2 0 −1

y de manera similar para los otros emparejamientos. Por lo tanto

[Sx , Sy ] = iSz , [Sy , Sz ] = iSx , [Sz , Sx ] = iSy . (18.34)

Además,     
1 2 0 1 0 1 1 2 1 0 1 2
S2x = Sx Sx =  =  =  I
4 1 0 1 0 4 0 1 4
y de manera similar para S2y y S2z . Por lo tanto,

3 2
S2x + S2y + S2z =  I (18.35)
4
representa el cuadrado del momento angular de espı́n. La cantidad 34 2 es el cuadrado de la magnitud del
momento angular de espı́n de un electrón, cuyo número cuántico de espı́n (total) es s = 12 ,

3 2 1
s(s + 1)2 =  , con s= . (18.36)
4 2

Multiplicación por una matriz identidad

Si A es una matriz m × n y si Im e In son las matrices identidad de órdenes m y n,


respectivamente, entonces

Im A = A = AIn . (18.37)

EJEMPLO 18.15 Multiplicación por una matriz identidad


⎛ ⎞⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 0 0 2 3 2 3 2 3  
⎝ 0 1 0 ⎠⎝ 1 ⎠ ⎝ ⎠ ⎝ ⎠ 1 0
2 = 1 2 = 1 2 .
0 1
0 0 1 0 −1 0 −1 0 −1

Producto igual a una matriz nula

Si AB = 0, eso no implica necesariamente que A = 0 o B = 0, o que BA = 0


(aunque exista).
18.3. Álgebra matricial 461

EJEMPLO 18.16 Producto igual a una matriz nula


         
1 0 0 0 0 0 0 0 1 0 0 0
= pero = .
1 0 1 1 0 0 1 1 1 0 2 0

Determinante y traza de un producto matricial

Sean A y B dos matrices cuadradas de mismo orden, entonces el determinante del


producto AB, y el de BA, es igual al producto de los determinantes de A y de B:

det AB = det A × det B = det BA . (18.38)

Si C = AB, por la receta (18.26), un elemento diagonal del producto es

cii = aik bki .


k=1

Por lo tanto la traza del producto es


n

n

tr C = tr AB = aik bki . (18.39)


i=1 k=1

Esto es igual a la traza del producto en orden inverso: en efecto, si D = BA, entonces un
elemento diagonal de D es

dkk = bki aik


i=1

y la traza es


n

n

tr D = tr BA = bki aik (18.40)


k=1 i=1

que es lo mismo que la suma en (18.39).

Transpuesta de un producto matricial

La transpuesta del producto de dos o más matrices es igual al producto de las matrices
transpuestas tomado en orden inverso:

(AB) = BT AT .
T
(18.41)
462 Capı́tulo 18. Matrices y transformaciones lineales

EJEMPLO 18.17 Transpuesta de un producto

Sean ⎛ ⎞
  2 3 4 1
2 0 −3
A= , B=⎝ 1 2 2 0 ⎠.
1 1 −2
0 −1 2 0
Entonces ⎛ ⎞
  2 3 4 1  
2 0 −3 ⎝ 1 ⎠ 4 9 2 2
AB = 2 2 0 =
1 1 −2 3 7 2 1
0 −1 2 0
y
⎛ ⎞⎛ ⎞ ⎛ 4 3 ⎞
2 1 0
2 1
⎜ 3 2 −1 ⎟ ⎝ ⎜ 9 7 ⎟
BT AT = ⎝ 1 ⎠=⎝ = (AB)T .
2 ⎠ 2 2 ⎠
0
4 2
−3 −2
1 0 0 2 1

18.4. Matriz inversa

Sean A y B dos matrices cuadradas de orden n, entonces B es la matriz inversa de


A (y viceversa) si

BA = AB = I ,

siendo I la matriz identidad de orden n. La matriz inversa de A se representa por A−1 :

A−1 A = AA−1 = I . (18.42)

Para matrices de orden 2, el par de matrices inversas es


   
a b −1 1 d −b
A= c d , A = a . (18.43)
ad − bc −c

EJEMPLO 18.18 Matriz inversa de orden 2


   
1 2 1 4 −2
Demuestre que si A = entonces A−1 = − .
3 4 2 −3 1
Tenemos       
1 4 −2 1 2 1 −2 0 1 0
A−1 A = − =− =
2 −3 1 3 4 2 0 −2 0 1

y de manera similar para AA−1 .


18.4. Matriz inversa 463

El denominador de la expresión (18.43) para A−1 es el determinante de la matriz A,



a b
det A = c d = ad − bc .
(18.44)

Se deduce que la inversa de la matriz A sólo existe si el determinante de A es distinto


de cero. Este es un resultado general. Una matriz cuadrada con determinante no nulo se
dice no singular. Una matriz cuyo de terminante es cero se dice singular, y la inversa
de una matriz singular no está definida. La inversa de una matriz no singular se puede
obtener mediante la siguiente receta.
1. Sustituya cada elemento aij por su cofactor Cij del determinante de A (véase el
Apartado 17.2):
⎛ ⎞ ⎛ ⎞
a11 a12 · · · a1n C11 C12 · · · C1n
⎜ a21 a22 · · · a2n ⎟ ⎜ C21 C22 · · · C2n ⎟
⎜ ⎟ ⎜ ⎟
A=⎜ .. .. .. .. ⎟ −→ ⎜ .. .. .. .. ⎟ .
⎝ . . . . ⎠ ⎝ . . . . ⎠
an1 an2 · · · ann Cn1 Cn2 · · · Cnn

2. Transponga la matriz de los cofactores:


⎛ ⎞
C11 C21 · · · Cn1

⎜ C12 C22 · · · Cn2 ⎟
⎟ 
−→ ⎜ .. .. .. .. ⎟ = A.
⎝ . . . . ⎠
C1n C2n · · · Cnn

 se llama adjunta de A.
La matriz A
3. Divida la matriz adjunta por el determinante de A:

A
A−1 = . (18.45)
det A

EJEMPLO 18.19 Inversa de orden 2

La matriz

a11 a12
A=
a21 a22
tiene por determinante det A = a11 a22 − a12 a21 , y los cofactores de sus elementos son C11 = a22 , C12 =
−a21 , C21 = −a12 , C22 = a11 . Entonces

= C11 C21 a22 −a12


A =
C12 C22 −a21 a11
464 Capı́tulo 18. Matrices y transformaciones lineales

de manera que

−1 1 a22 −a12
A = .
a11 a22 − a12 a21 −a21 a11
Esto es lo mismo que la fórmula (18.43).



2 1 3
EJEMPLO 18.20 Halle la inversa de A = ⎝ 4 −2 0 ⎠.
−1 1 0

El determinante de esta matriz se ha calculado en el Ejemplo 17.4 y vale det A = 6, y los cofactores de
varios de sus elementos se han calculado en el Ejemplo 17.5. La matriz de los cofactores es
⎛ ⎞
0 0 2
⎝ 3 3 −3 ⎠ ,
6 12 −8

y la inversa es la transpuesta de esto dividida por el valor del determinante,


⎛ ⎞
1⎝ 0 3 6
−1
A = 0 3 12 ⎠ .
6 2 −3 −8

Comprobación:
⎛ ⎞⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 0 3 6 2 1 3 1 6 0 0 1 0 0
A−1 A = ⎝ 0 3 12 ⎠ ⎝ 4 −2 0 ⎠ = ⎝ 0 6 0 ⎠ = ⎝ 0 1 0 ⎠ .
6 2 −3 −8 −1 1 0 6 0 0 6 0 0 1

Señalamos que el método anterior para hallar la inversa de una matriz implica evaluar el
determinante y n2 cofactores. Como mencionamos en la nota del Apartado 17.3, éste no
es un método práctico salvo para matrices muy pequeñas (véase el Capı́tulo 20).

Inversa de un producto matricial

La inversa del producto de dos o más matrices es igual al producto de las matrices
inversas tomado en orden inverso,
−1
(AB) = B−1 A−1 . (18.46)

18.5. Transformaciones lineales

La transformación de coordenadas que vimos en el Apartado 18.1, ecuaciones (18.3)


a (18.7), es un caso particular de transformación lineal. Más generalmente, una transfor-
18.5. Transformaciones lineales 465

mación lineal es un sistema de ecuaciones lineales *


x1 = a11 x1 + a12 x2 + a13 x3 + ··· + a1n xn
x2 = a21 x1 + a22 x2 + a23 x3 + ··· + a2n xn
x3 = a31 x1 + a32 x2 + a33 x3 + ··· + a3n xn (18.47)
.. .. .. .. .. ..
. . . . . .
xn = an1 x1 + an2 x2 + an3 x3 + ··· + ann xn

que representa la transformación del vector de componentes (x1 , x2 , . . . , xn ) en el nuevo


vector (x1 , x2 , . . . , xn ). En notación matricial,

x = Ax , (18.48)

donde
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
x1 a11 a12 a13 ··· a1n x1
⎜ x2 ⎟ ⎜ ··· ⎟ ⎜ ⎟
⎜ ⎟ ⎜ a21 a22 a23 a2n ⎟ ⎜ x2 ⎟
⎜ x3 ⎟ ⎜ ··· ⎟ ⎜ ⎟
x =⎜


⎟,
⎟ A=⎜

a31 a32 a33 a3n ⎟,
⎟ x=⎜

x3 ⎟.

⎜ .. ⎟ ⎜ .. .. .. .. .. ⎟ ⎜ .. ⎟
⎝ . ⎠ ⎝ . . . . . ⎠ ⎝ . ⎠
xn an1 an2 an3 ··· ann xn

Los vectores de n dimensiones se representan por las matrices columna x y x , y A se


llama matriz de la transformación que transforma x en x .

EJEMPLO 18.21 Transformaciones lineales en dos dimensiones

Sean (x, y) las coordenadas cartesianas de un punto en el plano xy, y supongamos que las matrices
       
cos θ − sen θ 0 1 1 0 1 0
A= , B= , C= , D= ,
sen θ cos θ 1 0 0 −1 0 a

representan transformaciones en el plano. Entonces, como se ilustra en la Figura 18.3,

Figura 18.3

0* La forma más general es una transformación de un vector con n componentes en un vector de m


componentes. La matriz de la transformación es en ese caso rectangular con dimensiones m × n.
466 Capı́tulo 18. Matrices y transformaciones lineales

(a) A es la rotación de ángulo θ en torno al origen tratada en el Ejemplo 18.1.

(b) Las coordenadas x e y se intercambian,


    
0 1 x y
=
1 0 y x

y B representa la reflexión (o rotación de 180◦ ) con respecto a la recta x = y.

(c) C cambia el signo de la coordenada y,


    
1 0 x x
=
0 −1 y −y

y representa la reflexión con respecto al eje x.

(d) Se multiplica por el factor a la coordenada y,


    
1 0 x x
=
0 a y ay

y D representa una dilatación en la dirección y si a > 1 y una contracción si 0 < a < 1.

Supongamos que a la transformación A dada por (18.47) y (18.48) le sigue una segunda
transformación B,

x = Bx (18.49)

que transforma x en x . Sustituyendo (18.48) en (18.49) nos da entonces

x = BAx = Cx (18.50)

de manera que A seguida de B es equivalente a una única transformación cuya matriz es


el producto matricial C = BA.

EJEMPLO 18.22 Transformaciones consecutivas en dos dimensiones

Sean (x, y) las coordenadas de un punto en el plano xy, y sean las matrices
⎛ √ ⎞
1 3    
⎜ 2 − 2 ⎟ 0 1 −1 0
A=⎜ ⎝ √

⎠ , B = , C = ,
3 1 1 0 0 −1
2 2
transformaciones en el espacio. La matriz A representa una rotación en sentido antihorario de π/3 en torno
al origen, B es la reflexión con respecto a la recta x = y, y C es la inversión con respecto al origen. En la
Figura 18.4 ilustramos la secuencia A seguida de B seguida de C, que es equivalente a la transformación
⎛ √ ⎞ ⎛ √ ⎞
   1 3 3 1
− − −
−1 0 0 1 ⎜ ⎜ 2 2 ⎟ ⎟=⎜ 2
⎜ 2 ⎟.
D = CBA =
0 −1 1 0 ⎝ √3 ⎠ ⎝ √ ⎟ ⎠
1 1 3

2 2 2 2
18.5. Transformaciones lineales 467

Figura 18.4

 √ √ 
3 1 1 3
La posición final del punto es (x , y ) = – x − y, − x + y .
2 2 2 2

Se puede aplicar una transformación a más de un punto simultáneamente si se sustituye


la matriz columna de los coeficientes para un punto por la matriz rectangular cuyas
columnas son las coordenadas de los distintos puntos. Ası́, si x1 , x2 , x3 , . . . , xn son los
vectores columna de n puntos en un espacio tridimensional, construimos la matriz
⎛ ⎞
x1 x2 x3 · · · xn
X = (x1 x2 x3 · · · xn ) = ⎝ y1 y2 y3 · · · yn ⎠ . (18.51)
z1 z2 z3 · · · zn

Entonces, si Axi = xi ,

AX = A (x1 x2 x3 · · · xn )
= (Ax1 Ax2 Ax3 · · · Axn )
(18.52)
= (x1 x2 x3 · · · xn )
= X ,

y las columnas de X’ son las coordenadas de los puntos transformados.

EJEMPLO 18.23 Gire π/4 en torno al origen el cuadrado con esquinas situadas en las posiciones del
plano (x, y)
(x, y) = (2, 1), (3, 1), (3, 2), (2, 2) .


Por ser cos π/4 = sen π/4 = 1/ 2, la matriz de la transformación es

 
1 1 −1
√ .
2 1 1
468 Capı́tulo 18. Matrices y transformaciones lineales

Las coordenadas de las esquinas después de la rotación vienen dadas por lo


tanto por
    
1 1 −1 2 3 3 2 1 1 2 1 0
√ = √
2 1 1 1 1 2 2 2 3 4 5 4

⎛ ⎞
1 2 1
⎜ √2 √ √ 0 ⎟
= ⎜ 2 2 ⎟.
⎝ 3 4 5 4 ⎠
√ √ √ √
2 2 2 2

Figura 18.5

Transformaciones inversas

Si A es una matriz cuadrada no singular, tiene una inversa única A−1 tal que

A−1 Ax = AA−1 x = I x = x . (18.53)

Una transformación A seguida por su transformación inversa A−1 (o A−1 seguida de A)


es por lo tanto equivalente a la transformación identidad I, esto es, la ‘transformación’
que deja todo vector invariante. Por lo tanto

si x = Ax y x = A−1 x entonces x = A−1 Ax = x . (18.54)

EJEMPLO 18.24 La matriz


 
cos θ − sen θ
A=
sen θ cos θ
no es singular, con determinante det A = cos2 θ + sen2 θ = 1, y representa una rotación de ángulo θ. La
correspondiente transformación inversa es la rotación de ángulo −θ, con matriz
   
cos (– θ) − sen (– θ) cos θ sen θ
B= =
sen (– θ) cos (– θ) − sen θ cos θ

y B = A−1 es la matriz inversa de A. En efecto,


    
cos θ sen θ cos θ − sen θ 1 0
BA = = = I.
− sen θ cos θ sen θ cos θ 0 1

En este caso concreto, la inversa es también igual a la transpuesta, A−1 = AT .


18.6. Matrices ortogonales y transformaciones ortogonales 469

18.6. Matrices ortogonales y transformaciones ortogonales

Una matriz cuadrada no singular se dice ortogonal si su inversa es igual a su trans-


puesta

A−1 = AT (matriz ortogonal). (18.55)

Por ejemplo, la matriz que hemos visto en el Ejemplo 18.24 es ortogonal:


   
cos θ − sen θ cos θ sen θ
A = sen θ cos θ , A = − sen θ cos θ = A−1 .
T
(18.56)

La propiedad caracterı́stica de una matriz ortogonal es que sus columnas (y sus filas)
forman un sistema de vectores ortogonales unitarios (vectores ortonormales). Para orden
3, sea
⎛ ⎞
a1 b1 c1
A = ⎝ a2 b2 c2 ⎠ = (a b c) , (18.57)
a3 b3 c3

donde
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
a1 b1 c1
a = ⎝ a2 ⎠ , b = ⎝ b2 ⎠ , c = ⎝ c2 ⎠ . (18.58)
a3 b3 c3

La transpuesta de A es
⎛ ⎞ ⎛ T ⎞
a 1 a2 a3 a
AT = ⎝ b1 b2 b3 ⎠ = ⎝ bT ⎠ , (18.59)
c1 c2 c3 cT

siendo, por ejemplo, el vector fila aT = ( a1 a2 a3 ) el transpuesto del vector columna a.


El producto AT A, de A con su transpuesta, puede entonces escribirse como
⎛ ⎞ ⎛ T ⎞
aT a a aT b aT c
AT A = ⎝ bT ⎠ (a b c) = ⎝ bT a bT b bT c ⎠ , (18.60)
cT cT a cT b cT c

donde, por ejemplo,


⎛ ⎞
a1
aT a = (a1 a2 a3 ) ⎝ a2 ⎠ = a21 + a22 + a23 , (18.61)
a3
470 Capı́tulo 18. Matrices y transformaciones lineales
⎛ ⎞
b1
aT b = (a1 a2 a3 ) ⎝ b2 ⎠ = a1 b1 + a2 b2 + a3 b3 . (18.62)
b3

Reconocemos en aT b el producto escalar a · b de los vectores a = (a1 , a2 , a3 ) y b =


= (b1 , b2 , b3 ) (véase el Apartado 16.5), y esos vectores son ortogonales si aT b = a·b = 0.
Además, la cantidad aT a es el cuadrado de la longitud del vector a, y el vector tiene
longitud 1 si aT a = |a|2 = 1. Se deduce que si las columnas de A forman un sistema de
vectores ortonormales, el producto AT A es la matriz identidad:
⎛ ⎞ ⎛ ⎞
aT a aT b aT c 1 0 0
AT A = ⎝ bT a bT b bT c ⎠ = ⎝ 0 1 0 ⎠ = I (18.63)
cT a cT b cT c 0 0 1

y, por lo tanto, AT = A−1 . Se deduce también que el determinante de una matriz ortogonal
tiene por valor ±1. En efecto, por ser det AT = det A y det I = 1, tenemos

det (AT A) = det AT × det A = (det A) = 1 .


2
(18.64)

EJEMPLO 18.25 La matriz


⎛ ⎞
2 1 2
⎜ − ⎟
⎜ 3 3 3 ⎟
⎜ 2 2 1 ⎟
A=⎜
⎜ − ⎟

⎜ 3 3 3 ⎟
⎝ 1 2 2 ⎠
3 3 3
es ortogonal, con propiedades:

(i) ⎛ ⎞⎛ ⎞
2 2 1 2 1 2
⎜ 3 ⎟⎜ − ⎟ ⎛ 1 0 0 ⎞
⎜ 3 3 ⎟⎜ 3 3 3 ⎟
⎜ 1 ⎟⎜ ⎟ ⎜
AT A = ⎜ −
2 2 ⎟⎜ 2

2 1 ⎟=⎝ 0 1 0 ⎟

⎜ 3 ⎟⎜ ⎟
⎜ 3 3 ⎟⎜ 3 3 3 ⎟
⎝ 2 1 2 ⎠⎝ 1 2 2 ⎠ 0 0 1

3 3 3 3 3 3
 T
y AAT = AT A = I.
(ii) Las columnas de A forman los vectores
     
2 2 1 1 2 2 2 1 2
a= , , , b= ,− , , c= – , , ,
3 3 3 3 3 3 3 3 3

con propiedades:
   2  2
2
1 2 2
a·a=b·b=c·c= + + =1
3 3 3
18.7. Operaciones de simetrı́a 471

2 4 2 2 2 4 4 2 2
a·b= − + = 0, b · c = − − + = 0, c · a = − + + = 0.
9 9 9 9 9 9 9 9 9
De manera similar para las filas de A (las columnas de AT ).
(iii) El determinante de A es

2 1 −2
1
det A = 3 2 −2 1 = −1 .
3
1 2 2

Transformaciones ortogonales

Una transformación ortogonal es una transformación lineal

x = Ax (18.65)

cuya matriz de la transformación A es ortogonal. Las transformaciones ortogonales son


importantes porque conservan los productos escalares de vectores. Es decir, las longitu-
des de los vectores y los ángulos entre ellos no varı́an con una transformación ortogonal.
Todas las transformaciones de los Ejemplos 18.21 (salvo D), 18.22 y 18.23 son orto-
gonales. La conservación de las longitudes y de los ángulos se ilustra en la Figura 18.5
del ejemplo 18.23: ni el tamaño ni la forma de la figura (cuadrado) varı́an con la trans-
formación ortogonal (rotación). Todas las transformaciones ortogonales en un plano o
en un espacio tridimensional son o bien rotaciones o bien reflexiones, o combinaciones
de éstas, y tales transformaciones son importantes en la descripción matemática de las
propiedades de simetrı́a de las moléculas.

18.7. Operaciones de simetrı́a

La simetrı́a de un sistema fı́sico se caracteriza por un conjunto de elementos de sime-


trı́a, cada uno de ellos asociado a una o más transformaciones denominadas operaciones
de simetrı́a: transformaciones que dejan la descripción del sistema invariante. En quı́mi-
ca molecular resultan de gran importancia las transformaciones espaciales que producen
el intercambio de núcleos idénticos. Los posibles elementos de simetrı́a son entonces los
ejes de simetrı́a, planos de simetrı́a y centros de inversión.

EJEMPLO 18.26 Simetrı́a de la molécula de agua

La molécula de agua en su estado fundamental tiene la geometrı́a nuclear de equilibrio no lineal represen-
tada en la Figura 18.6, con ángulo de enlace 105◦ . El sistema tiene tres elementos de simetrı́a cada uno con
su operación asociada:
472 Capı́tulo 18. Matrices y transformaciones lineales

(i) Un eje de simetrı́a de orden 2 (Oz en la figura). Un giro de 180◦


en torno al eje supone el intercambio de los núcleos de hidróge-
no.
(ii) Un plano de simetrı́a (Oyz) que biseca el ángulo de enlace. Una
reflexión con respecto al plano supone también el intercambio de
los hidrógenos.
(iii) Un plano de simetrı́a (Oxz) que contiene los tres núcleos (el plano
molecular). Una reflexión con respecto a este plano deja quietos
los tres núcleos.

Figura 18.6
Las tres operaciones de simetrı́a tiene efectos distintos sobre la distribución electrónica de la molécula, y
son operaciones de simetrı́a distintas.

La teorı́a matemática de la simetrı́a es la teorı́a de grupos. 4 Damos aquı́ sólo una breve
introducción al concepto de grupos de simetrı́a y a la representación matricial de los
grupos.

Grupos de simetrı́a

Consideremos la figura plana simétrica formada por tres puntos en los vértices de un
triángulo equilátero (Figura 18.7), con la figura en el plano xy de un sistema de coorde-
nadas fijo con origen O en el baricentro del triángulo.

Figura 18.7

04. La teorı́a de grupos tiene sus orı́genes en los estudios de las ecuaciones algebraicas realizados por
Lagrange, Gauss, Abel y Cauchy. La relación entre ecuaciones algebraicas y el grupo de permutaciones fue
descrita por Évariste Galois (1811-1832), cuya corta vida incluyó dos intentos fallidos de entrar en la École
Polytéchnique (en el segundo intento le tiró un borrador a uno de los examinadores), la expulsión de la
École Normale y dos arrestos, uno por amenazar la vida del rey y otro por llevar el uniforme de la disuelta
Guardia Nacional. Murió en un duelo por un ‘asunto de honor’. Sus manuscritos matemáticos quedaron
sin leer hasta que Liouville los publicó en 1846. En un artı́culo sobre formas cuadráticas de 1882, Heinrich
Weber (1842-1913) dio una descripción axiomática completa de un grupo finito abstracto, definió los grupos
abelianos, y en 1893 extendió el trabajo a los grupos infinitos.
18.7. Operaciones de simetrı́a 473

La simetrı́a de la figura puede describirse mediante el siguiente conjunto de seis ope-


raciones de simetrı́a:
E la operación identidad que deja todos los puntos quietos
A la rotación de 120◦ en sentido antihorario en torno al eje Oz
B la rotación de 240◦ en sentido antihorario (o de 120◦ en sentido horario) en torno
al eje Oz
C la rotación de 180◦ en torno al eje Oc
D la rotación de 180◦ en torno al eje Od
F la rotación de 180◦ en torno al eje Of
Otras operaciones de simetrı́a (reflexiones) son posibles, pero son equivalentes a las
seis operaciones anteriores para una figura plana. Las operaciones también se pueden
interpretar como las permutaciones de las etiquetas (1, 2, 3) de los tres puntos.
La aplicación sucesiva de dos operaciones de simetrı́a cualesquiera es equivalente
a la aplicación de una única operación. Los dos ejemplos de la Figura 18.8 muestran
que aplicar la operación A seguida de C es equivalente a aplicar la operación D, y que
C seguida de A es equivalente a F. Tales combinaciones de operaciones de simetrı́a se
representan con las ecuaciones simbólicas

CA = D , AC = F . (18.66)

Figura 18.8

Los resultados de las posibles combinaciones de pares de operaciones se recogen en


la tabla de multiplicación del grupo 18.1.
Las seis operaciones forman un conjunto cerrado llamado grupo. Nos referimos a este
grupo como G = {E, A, B, C, D, F}. Un grupo de simetrı́a constituido por rotaciones,
reflexiones e inversión se llama grupo puntual porque al menos un punto queda quieto
474 Capı́tulo 18. Matrices y transformaciones lineales

en cada operación de simetrı́a. En nuestro ejemplo sólo hay un punto que lo cumpla, el
baricentro del triángulo.

Tabla 18.1 Tabla de multiplicación de un grupo

E A B C D F (se aplica primero)

E E A B C D F
A A B E F C D
B B E A D F C
C C D F E A B
D D F C B E A
F F C D A B E

Axiomas de la teorı́a de grupos

Un conjunto de elementos {E, P, Q, R, . . . } forma un grupo si se cumplen las siguien-


tes condiciones.
(i) La combinación de cualquier par de elementos del grupo pertenece también al
grupo.
La ley de combinación depende de la naturaleza de los elementos: por ejemplo, suma o
multiplicación si los elementos son números, multiplicación de matrices si son matrices,
aplicación consecutiva de operaciones de simetrı́a o de otro tipo. La combinación de dos
elementos, P y Q, se llama producto de P y Q y se escribe PQ, con algún convenio sobre
el orden de los elementos. La ley asociativa se tiene que cumplir para la combinación de
todos los elementos del grupo: P(QR) = (PQ)R = PQR. La ley conmutativa no tiene
por qué cumplirse: en general PQ = QP. Por ejemplo, para el grupo G, AC = CA. Si
PQ = QP para todos los elementos del grupo, se dice que el grupo es un grupo abeliano.
(ii) Uno de los elementos del grupo, representado por E, tiene las propiedades de un
elemento unidad (o identidad). Para cualquier elemento P,

PE = EP = P .

(iii) Cada elemento tiene un inverso que también pertenece al grupo: si P pertenece al
grupo entonces su inverso P−1 se define por

PP−1 = P−1 P = E .

Para el grupo G = {E, A, B, C, D, F} los elementos inversos son

E−1 = E , A−1 = B , B−1 = A , C−1 = C , D−1 = D , F −1 = F .


18.7. Operaciones de simetrı́a 475

Representación matricial de los grupos

Un conjunto de matrices que se multiplican de acuerdo con la tabla de multiplicación


de un grupo se llama una representación matricial Γ del grupo. En la Tabla 18.2 se
muestran tres representaciones del grupo G = {E, A, B, C, D, F}.

Tabla 18.2 Representaciones matriciales del grupo G

G E A B C D F

Γ1 1 1 1 1 1 1

Γ2 1 1 1 −1 −1 −1
  √

  √

1 0 − 12 − 23 − 12 3
−1 0 1 3 1
− 3
Γ2 √ √
2

2 2

2 2
0 1 3
− 21 − 3
− 12 0 1 3
− 12 − 23 − 12
2 2 2

Las representaciones Γ1 y Γ2 se llaman representaciones unidimensionales (las matrices


son los números ±1). La representación Γ1 , en la cual todas las operaciones de simetrı́a
se representan por el número +1, cumple claramente la tabla de multiplicación del gru-
po, Tabla 18.1, y se llama la representación trivial o totalmente simétrica del grupo.
Todo grupo tiene esa representación. La Tabla 18.3, obtenida a partir de la tabla de mul-
tiplicación 18.1 sustituyendo cada operación por su representante ±1 en γ2 , muestra que
γ2 es efectivamente una representación del grupo.

Tabla 18.3 Tabla de multiplicación de Γ2

+1 +1 +1 −1 −1 −1

+1 +1 +1 +1 −1 −1 −1
+1 +1 +1 +1 −1 −1 −1
+1 +1 +1 +1 −1 −1 −1
−1 −1 −1 −1 +1 +1 +1
−1 −1 −1 −1 +1 +1 +1
−1 −1 −1 −1 +1 +1 +1

De la misma manera, sustituyendo cada operación de la Tabla 18.1 por su representante


matricial de la representación bidimensional Γ3 , se comprueba que esas matrices cum-
plen la tabla de multiplicación.
Las matrices de la representación bidimensional Γ3 pueden obtenerse considerando
el resultado de aplicar cada operación de simetrı́a a las coordenadas de un punto en el
plano. Ası́ por ejemplo, la operación A es la rotación en sentido antihorario de ángulo
476 Capı́tulo 18. Matrices y transformaciones lineales

θ = 120◦ en torno al origen, y su matriz representativa es


⎛ √ ⎞
  1 3
cos 120◦ − sen 120◦ ⎜− 2 − 2 ⎟
A= =⎜
⎝ √3
⎟. (18.67)
sen 120◦ cos 120◦ 1 ⎠

2 2
La rotación B es la inversa de A, ya que AB = BA = E, y su matriz representativa B
es la matriz transpuesta de A (todas las matrices son ortogonales, con la inversa igual
a la transpuesta). De manera similar, la operación C, rotación de 180◦ en torno al eje
O c (el eje y), transforma un vector r = (x, y) en el vector r = (– x, y). Su representante
matricial es por lo tanto
 
−1 0
C= 0 1 , (18.68)

ya que
    
−1 0 x −x
0 1 y = y . (18.69)

Para todo grupo, es posible construir todas las representaciones que se quiera de todas
las dimensiones posibles, pero se puede demostrar que sólo cierto número de ellas (las
‘representaciones irreducibles’) son distintas e independientes. En el caso que nos ocu-
pa, todas las representaciones posibles del grupo G o bien son equivalentes a las tres
representaciones de la Tabla 18.2, o bien se pueden reducir a ellas.

18.8. Ejercicios

Apartado 18.2
Para las siguientes matrices,

⎛⎞ ⎛ ⎞
    −5 3 3 0 0
1 −2 3 0 1 −4
A = , B= , C = ⎝ 4 −1 ⎠ , D = ⎝ 0 2 0 ⎠,
0 3 4 2 −3 0
2 −1 0 0 −1
⎛ ⎞
    0
1 −2 3 0  
P = , Q= , a = ⎝−3 ⎠ , b = 2 5 −2 ,
0 4 0 1
1

halle, si es posible:
1. AT 2. CT 3. DT 4. PT
5. aT 6. bT 7. det A 8. det D
9. det P 10. tr B 11. tr D 12. tr Q
18.8. Ejercicios 477

Apartado 18.3
Para las matrices de más arriba, halle si es posible:
13. A+B 14. A−B 15. B−A 16. C+D
17. 3P 18. 2A + 3B 19. a+b T
20. aT + b
21. AB 22. BC 23. CB 24. CP
25. PC 26. D2 27. PQ 28. QP
T T
29. ab 30. ba 31. ab 32. bT aT
33. Ca 34. aT C
⎛ ⎞
1 1 1
35. Demuestre que (CP)T = PT CT .36. Si A = ⎝ 2 1 2 ⎠, demuestre que
−2 1 −1

A3 − A2 − 3A + I = 0.

  
a b 2 1
Siendo A = yB= , halle A tal que:
c d 3 2
   
−1 0 3 2
37. A+B= 38. AB =
5 1 1 4

Halle el conmutador de los siguientes pares de matrices:


       
1 0 0 1 2 −1 −1 3
39. , 40. ,
1 0 −1 0 −1 1 3 2

41. Las matrices de espı́n para un núcleo con número cuántico de espı́n 1 son
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
 ⎝ 0 1 0 ⎠  ⎝ 0 −i 0 ⎠ 1 0 0
Ix = √ 1 0 1 , Iy = √ i 0 −i , Iz =  ⎝ 0 0 0 ⎠.
2 0 1 0 2 0 i 0 0 0 −1

(i) Halle los conmutadores [Ix , Iy ], [Iy , Iz ], [Iz , Ix ].

(ii) Halle I2x + I2y + I2z .

 
a b
Halle la matriz general para la cual:
c d
    
1 2 a b 0 0
42. =
2 4 c d 0 0
       
1 2 a b a b 1 2 0 0
43. = =
2 4 c d c d 2 4 0 0
478 Capı́tulo 18. Matrices y transformaciones lineales

Apartado 18.4
Halle la matriz inversa, si es posible: ⎛ ⎞ ⎛ ⎞
  1 2 3 2 −1 1
2 −3 ⎝−2
44. 45. 1 2 ⎠ 46. ⎝−1 1 −2 ⎠
4 1
3 −1 −1 −3 1 0
⎛ 1 1 ⎞
√ 0 −√ ⎛ ⎞
⎜ 2 2 ⎟ 3 4 0 0
⎜ ⎟ ⎜ 1 2 0 0 ⎟
47. ⎜ 0 ⎟ ⎝ 0 1 ⎠
⎜ 0 1 ⎟ 48.
⎝ 1 0 3
1 ⎠ 0 0 4 2
√ 0 √
2 2

49. Para la matriz A del Ejercicio 45, compruebe que AA−1 = A−1 A = I.

Apartados 18.5 y 18.6


50. La transformación lineal r = Ar, donde
⎛  ⎞ ⎛ ⎞ ⎛ ⎞
x x cos θ − sen θ 0
r =⎝ y ⎠,
 
r=⎝ y ⎠, A = ⎝ sen θ cos θ 0 ⎠ ,
z z 0 0 1

representa una rotación en sentido antihorario de ángulo θ en torno al eje z.

(i) Escriba las correspondientes ecuaciones lineales.


(ii) Halle A para una rotación en sentido antihorario de ángulo π/4 en torno al eje z.
(iii) Demuestre que ⎛ ⎞
cos 2θ − sen 2θ 0
A = ⎝ sen 2θ
2
cos 2θ 0 ⎠
0 0 1
y dé su interpretación geométrica.
(iv) Dé la interpretación geométrica de la ecuación A3 = I.

51. Para transformaciones en tres dimensiones, escriba las matrices que representan

(i) una rotación en torno al eje x,


(ii) una rotación en torno al eje y,
(iii) una reflexión con respecto al plano xy,
(iv) una reflexión con respecto al plano yz,
(v) una reflexión con respecto al plano zx,
(vi) una inversión con respecto al origen.

52. Demuestre que las matrices del Ejercicio 51 son ortogonales y halle sus inversas.

53. (i) Halle una única matriz A que represente la secuencia de transformaciones conse-cutivas:
(a) rotación en sentido antihorario de ángulo θ en torno al eje x, seguida de
(b) reflexión con respecto al plano xy, seguida de
(c) rotación en sentido antihorario de ángulo φ en torno al eje z.
18.8. Ejercicios 479

(ii) Halle A para θ = π/3 y φ = −π/6.


⎛ ⎞
2
(iii) Halle r = Ar con esa A y r = ⎝ 0 ⎠.


−1

Las coordenadas de cuatro puntos en el plano xy vienen dadas por las columnas de la matriz
 
2 3 3 2
X=
1 1 2 2

(véase el Ejemplo 18.23).

Halle X = AX para cada una de las siguientes matrices A, y dibuje unos diagramas adecuados para
ilustrar las transformaciones:
       
0,8 −0,6 0 −1 2 0 3 1
54. 55. 56. 57.
0,6 0,8 1 0 0 1 −1 2

Apartado 18.7

58. Para el grupo G = {E, A, B, C, D, F} del Apartado 18.7:

(i) Construya una representación matricial tridimensional aplicando por turno cada operación de sime-
trı́a a las coordenadas (x, y, z).
(ii) Cada matriz de esta representación tiene la forma ‘diagonal por bloques’
⎛ ⎞
a11 a12 0
⎝ a21 a22 0 ⎠ .
0 0 a33

Compruebe que las matrices


 
a11 a12
a21 a22

forman la representación Γ3 de la Tabla 18.2, y que los números a33 forman la representación Γ2 .

59. Las propiedades de simetrı́a de la figura plana formada por los


cuatro puntos en los vértices de un rectángulo (no cuadrado) pueden
describirse mediante cuatro operaciones de simetrı́a, la operación
identidad y tres rotaciones.
(i) Describa esas operaciones de simetrı́a.
(ii) Construya la tabla de multiplicación del grupo.
(iii) Construya una representación matricial bidimensional del
grupo aplicando por turno cada operación de simetrı́a a las
coordenadas (x, y) de un punto en el plano de la figura.
 El problema de autovalores matriciales

La determinación de los autovalores y autovectores de una matriz cuadrada se de-


nomina el problema de autovalores, y es importante en muchas ramas de las ciencias
fı́sicas y la ingenierı́a. Por ejemplo, en quı́mica cuántica, la aplicación del principio va-
riacional a la ecuación de Schrödinger da lugar a sustituir la ecuación diferencial de
autovalores por una ecuación matricial equivalente que puede resolverse por métodos
numéricos. En este capı́tulo empezamos resumiendo, Apartado 19.1, la formulación ma-
tricial de la resolución de sistemas de ecuaciones lineales no homogéneos que ya vimos
en el Capı́tulo 17 mediante determinantes. En el Apartado 19.2 tratamos el problema de
autovalores y las propiedades de los autovalores y autovectores. En los Apartados 19.3 y
19.4 tratamos los problemas relacionados de diagonalización de matrices y de reducción
de formas cuadráticas a forma canónica. El Apartado 19.5 contiene un resumen de las
matrices complejas que son importantes en la teorı́a de grupos avanzada y en mecánica
cuántica.

19.1. Sistemas de ecuaciones lineales

Un sistema de n ecuaciones lineales con n incógnitas, x1 , x2 , x3 , . . . , xn ,

a11 x1 + a12 x2 + a13 x3 + ··· + a1n xn = y1


a21 x1 + a22 x2 + a23 x3 + ··· + a2n xn = y2
a31 x1 + a32 x2 + a33 x3 + ··· + a3n xn = y3 (19.1)
.. .. .. .. .. ..
. . . . . .
an1 x1 + an2 x2 + an3 x3 + ··· + ann xn = yn

puede escribirse como una única ecuación matricial


⎛ ⎞⎛ ⎞ ⎛ ⎞
a11 a12 a13 · · · a1n x1 y1
⎜ a a a ··· a ⎟⎜ x ⎟ ⎜ ⎟
⎜ 21 22 23 2n ⎟ ⎜ 2 ⎟ ⎜ y2 ⎟
⎜ a a a ··· a ⎟⎜ x ⎟ ⎜ ⎟
⎜ 31 32 33 3n ⎟ ⎜ 3 ⎟=⎜ y3 ⎟, (19.2)
⎜ ⎟⎜ ⎟ ⎜ ⎟
⎜ .. .. .. . . .. ⎟ ⎜ .. ⎟ ⎜ .. ⎟
⎝ . . . . . ⎠⎝ . ⎠ ⎝ . ⎠
an1 an2 an3 · · · ann xn yn

Ax = y . (19.3)
482 Capı́tulo 19. El problema de autovalores matriciales

Vimos en el Apartado 17.4 que las ecuaciones tienen solución única si det A = 0, y
pueden resolverse formalmente por medio de determinantes con la regla de Cramer.
También vimos cómo obtener las soluciones en ciertas condiciones cuando A es singular,
con det A = 0.
Los problemas fı́sicos que conducen a sistemas de ecuaciones lineales se formulan
normalmente mediante matrices. Ası́ como el álgebra ordinaria es la herramienta básica
para manipular y resolver una ecuación (o unas pocas ecuaciones), se emplea el álgebra
matricial para manipular sistemas de ecuaciones, y para contruir métodos numéricos de
resolución. La concisión y la sencillez del formalismo matricial también hacen de él la
herramienta ideal para el análisis teórico de las propiedades y de la estructura de los
sistemas de ecuaciones, y de los problemas fı́sicos en los que surgen. Vamos a ver ahora
el tratamiento del Apartado 17.4 formulado mediante matrices.
Si A no es singular, con det A = 0, entonces existe A−1 y premultiplicando el primer
miembro de (19.3) tenemos
 
A−1 (Ax) = A−1 A x = Ix = x .

Por lo tanto, premultiplicando ambos lados de (19.3) por A−1 tenemos la solución única

x = A−1 y . (19.4)

Esto es equivalente a usar la regla de Cramer.

EJEMPLO 19.1 Resuelva las ecuaciones

2x − 3y + 4z = 8
y − 3z = −7
x + 2y + 2z = 11 .

La matriz de los coeficientes y su inversa son


⎛ ⎞ ⎛ ⎞
2 −3 4 1 ⎝ 8 14 5 ⎠
A=⎝ 0 1 −3 ⎠ , A −1
= −3 0 6 .
1 2 2 21 −1 −7 2

Por lo tanto, por la ecuación (19.4),


⎛ ⎞ ⎛ ⎞⎛ ⎞ ⎛ ⎞ ⎛ ⎞
x 1 8 14 5 8 1 21 1
⎝ y ⎠= ⎝−3 0 6 ⎠ ⎝−7 ⎠ = ⎝ 42 ⎠ = ⎝ 2 ⎠ .
z 21 −1 −7 2 11 21 63 3

Éste es el resultado que obtuvimos en el Ejemplo 17.2 con la regla de Cramer.

La ecuación matricial (19.3) representa el caso de ecuaciones no homogéneas, con y =


0. Para el caso homogéneo tenemos
19.2. El problema de autovalores matriciales 483

Ax = 0 (19.5)

y la solución es x = 0 si A es no singular. Si A es singular, x = 0 es la solución


trivial, pero como vimos en el Apartado 17.4, puede haber otras soluciones. En el si-
guiente apartado consideraremos esas otras soluciones para el caso más importante de
los sistemas homogéneos: el problema de autovalores matriciales.

19.2. El problema de autovalores matriciales

Una ecuación matricial del tipo

Ax = λx , (19.6)

donde A es una matriz cuadrada, x un vector columna y λ un número, es una transforma-


ción lineal en la que la matriz A transforma el vector x en un múltiplo de x. La ecuación
puede escribirse como

(A − λI)x = 0 (19.7)

(ya que I x = x), y representa por lo tanto el sistema de ecuaciones lineales homogéneas
(las ecuaciones seculares del Apartado 17.4)

(a11 − λ)x1 + a12 x2 + a13 x3 + ··· + a1n xn =0


a21 x1 + (a22 − λ)x2 + a23 x3 + ··· + a2n xn =0
a31 x1 + a32 x2 + (a33 − λ)x3 + · · · + a3n xn =0 . (19.8)
.. .. .. .. ..
. . . . .
an1 x1 + an2 x2 + an3 x3 + ··· + (ann − λ)xn = 0

Las ecuaciones tienen la solución trivial x = 0 para todo valor de λ. Las ecuaciones
también tienen solución no nula si el valor de λ puede escogerse de manera que la matriz
(A − λI) sea singular; es decir, si se escoge λ de manera que el determinante de (A − λI)
sea cero:

det (A − λI) = 0 , (19.9)

o bien

(a11 − λ) a12 a13 ··· a1n

(a22 − λ) ···
a21 a23 a2n

a31 a32 (a33 − λ) ··· a3n = 0. (19.10)

.. .. .. ..
. . . .

an1 an2 an3 · · · (ann − λ)
484 Capı́tulo 19. El problema de autovalores matriciales

El primer miembro de esta ecuación se llama determinante caracterı́stico (o determi-


nante secular) de la matriz A. Se trata de un polinomio de grado n en λ y sus raı́ces
son los valores de λ para los cuales se cumple (19.9), es decir, los valores de λ para los
cuales la ecuación matricial (19.6) tiene soluciones no nulas. La ecuación (19.9) se llama
ecuación caracterı́stica de la matriz A.
Los valores de λ para los cuales la ecuación de autovalores (19.6) tiene soluciones
no nulas se llaman autovalores o valores propios de la matriz A (también se los llama
valores caraterı́sticos o raı́ces latentes). Una matriz de orden n tiene n autovalores λ1 ,
λ2 , . . . , λn , que forman el espectro de autovalores de A.

EJEMPLO 19.2 Resuelva la ecuación caracterı́stica de la matriz


⎛ ⎞
−2 1 1
A = ⎝−11 4 5 ⎠
−1 1 0
La ecuación caracterı́stica de A es

−2 − λ 1 1

det (A − λI) = D = −11 4−λ 5 = 0.

−1 1 −λ

En el Ejemplo 17.8 hemos resuelto esta ecuación:


D = −(λ − 1)(λ + 1)(λ − 2) = 0

y D = 0 para λ = 1, −1 o 2.

Los autovalores del Ejemplo 19.2 son números reales distintos pero, en general, dos o
más autovalores pueden ser iguales (autovalores múltiples o degenerados), o pueden
ser números complejos.

EJEMPLO 19.3 Autovalores múltiples

La ecuación caracterı́stica de la matriz


⎛ ⎞
4 0 2 4−λ 0 2

⎝−6 1 −4 ⎠ es −6 1 − λ −4 = λ(1 − λ)2 = 0

−6 0 −3 −6 0 −3 − λ

y los autovalores son λ1 = 0, λ2 = λ3 = 1.

EJEMPLO 19.4 Autovalores complejos

La ecuación caracterı́stica de la matriz




1 2 1−λ 2
es = λ2 − 2λ + 5 = 0
−2 1 −2 1 − λ

y los autovalores son λ1 = 1 + 2i, λ2 = 1 − 2i.


19.2. El problema de autovalores matriciales 485

Los dos tipos de matrices cuyos autovalores son de mayor interés en las ciencias fı́sicas
son las matrices reales simétricas (matrices simétricas cuyos elementos son reales), y
las matrices complejas hermı́ticas descritas en el Apartado 19.5. Estas matrices tienen
autovalores reales.1
Correspondiendo a cada autovalor λ = λk existe una solución x = xk de la ecuación de
autovalores, tal que

Axk = λk xk k = 1, 2, 3, . . . , n. (19.11)

Estas soluciones se llaman autovectores o vectores propios de A (también se llaman


vectores latentes, vectores caracterı́sticos o polos). Estos vectores se obtienen resolvien-
do el sistema de ecuaciones homogéneas (19.8) para cada uno de los valores de λ (como
en el Ejemplo 17.9). El problema de hallar los autovalores y los autovectores se denomi-
na problema de autovalores matriciales (o problema de autovalores algebraicos).
Si los autovalores λk (k = 1, 2, . . . , n) son distintos (no habiendo dos con el mismo
valor), entonces existen n autovectores distintos (linealmente independientes). Si dos o
más autovalores son iguales puede haber menos de n autovectores distintos, pero las ma-
trices simétricas y las hermı́ticas siempre tienen la totalidad de n autovectores distintos.

EJEMPLO 19.5 Teorı́a de Hückel del ciclobutadieno

En la teorı́a de orbitales moleculares de sistemas de electrones π, los estados de los electrones π son des-
critos por una ecuación de autovalores matriciales

HC = EC

donde la matriz H representa el ‘hamiltoniano efectivo’ para un electrón π del sistema, los autovalores E
de H son las energı́as orbitales de los electrones π, y los autovectores C representan los correspondientes
orbitales moleculares (las componentes de C son los coeficientes de una descripción mediante ‘combinación
lineal de orbitales atómicos’ (CLOA) de un orbital molecular). En la teorı́a de Hückel del ciclobutadieno
(C4 H4 ), H es la matriz simétrica real
⎛ ⎞
α β 0 β
⎜ β α β 0 ⎟
H=⎝
0 β α β ⎠
β 0 β α

(los parámetros de Hückel α y β son escalares reales negativos con dimensiones de energı́a) con ecuación
caracterı́stica

01. D’Alembert consideró los primeros problemas de autovalores entre 1743 y 1758 en relación con
la resolución de sistemas de ecuaciones lineales con coeficientes constantes que aparecen en el movimiento
de una cuerda cargada. Cauchy estudió los autovalores en relación con las formas que describen superficies
cuadráticas. En 1829 demostró que una forma cuadrática puede reducirse a forma diagonal (Apartado 19.4)
mediante el método de optimización con ligaduras que involucra multiplicadores de Lagrange descritos en
el Ejemplo 9.9. Los multiplicadores son los autovalores de la matriz asociada.
486 Capı́tulo 19. El problema de autovalores matriciales


α−E β 0 β

β α−E β 0
det (H − EI) =
0 β α−E β
β 0 β α−E

= (α − E)2 (α − E + 2β)(α − E − 2β) = 0 .

Los autovalores (energı́as orbitales) son por lo tanto

E1 = α + 2β , E 2 = E3 = α , E4 = α − 2β ,

y el espectro de autovalores se muestra en la Figura 19.1.


Las ecuaciones seculares del problema son

(1) (α − E)c1 + βc2 + βc4 =0 Figura 19.1


(2) βc1 + (α − E)c2 + βc3 =0
(3) βc2 + (α − E)c3 + βc4 =0
(4) βc1 + βc3 + (α − E)c4 = 0

y los autovectores se obtienen resolviendo este sistema de ecuaciones homogéneas para cada uno de los
autovalores E.

Para E = E1 = α + 2β,

(1) − 2βc1 + βc2 + βc4 =0


(2) βc1 − 2βc2 + βc3 =0
(3) βc2 − 2βc3 + βc4 =0
(4) βc1 + βc3 − 2βc4 = 0.

Sólo tres de las cuatro ecuaciones son independientes. Por ejemplo, (1) + (2) + (3) = −(4). Resolviendo
para c2 , c3 y c4 en función de c1 tenemos

c2 = c1 , c3 = c1 , c4 = c1 .

De forma similar, el autovector correspondiente al autovalor E4 = α − 2β tiene componentes

c2 = −c1 , c3 = c1 , c4 = −c1 .

Los autovectores correspondientes a los autovalores E1 y E4 son por lo tanto


⎛ ⎞ ⎛ ⎞
1 1
⎜ ⎟
1 ⎜ −1 ⎟
C1 = c 1 ⎝ ⎠ , C4 = c 1 ⎝
1 ⎠
,
1
1 −1

con c1 arbitrario.

Para E2 = E3 = α,

(1) = (3) βc2 + βc4 = 0


(2) = (4) βc1 + βc3 = 0 .

Sólo dos de las cuatro ecuaciones son independientes con solución

c1 = −c3 , c4 = −c2 .
19.2. El problema de autovalores matriciales 487

Dos autovectores correspondientes al autovalor doblemente degenerado E = α son por lo tanto


⎛ ⎞ ⎛ ⎞
0 1
⎜ 1 ⎟ ⎜ 0 ⎟
C2 = c2 ⎝ C 3 = c3 ⎝
0 ⎠ −1 ⎠
, ,
−1 0

con c2 y c3 arbitrarios.

Propiedades de los autovectores

Propiedad 1. Si x es un autovector correspondiente al autovalor λ, entonces kx es


también un autovector correspondiente al mismo autovalor, para todo valor no nulo del
número k:

si Ax = λx entonces A(kx) = k(Ax) = k(λx) = λ(kx) . (19.12)

Los autovectores que difieren sólo en un factor constante no se consideran distintos. El


factor k se escoge, por conveniencia y por convenio, de manera que el autovector sea
unitario, es decir, que normalice el vector.

EJEMPLO 19.6 Normalización de autovectores

Los autovectores C del Ejemplo 19.5 están normalizados (tienen longitud unidad) si

CT C = c21 + c22 + c23 + c24 = 1 .

Por ejemplo
1
C1T C1 = c21 12 + 12 + 12 + 12 = 1 si c1 = ,
2
y el conjunto de los cuatro autovectores normalizados es
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 0 1 1
1⎜ 1 ⎟ 1 ⎜ 1 ⎟ 1 ⎜ 0 ⎟ 1 ⎜−1 ⎟
C1 = ⎝ ⎠ , C2 = √ ⎝ , C3 = √ ⎝ C4 = ⎝ .
2 1 2 0 ⎠ 2 −1
⎠,
2 1 ⎠
1 −1 0 −1

Propiedad 2. Si A es una matriz simétrica (real), los autovectores correspondientes a


autovalores distintos son ortogonales.

Sean xk y xl autovectores de A correspondientes a los autovalores λk y λl , respectivamen-


te. Entonces

Axk = λk xk (19.13)

y premultiplicando ambos miembros por xlT tenemos

xlT Axk = λk xlT xk . (19.14)


488 Capı́tulo 19. El problema de autovalores matriciales

Además

Axl = λl xl (19.15)

y premultiplicando ambos miembros por xkT tenemos

xkT Axl = λl xkT xl . (19.16)

Ahora bien, el transpuesto de un producto de matrices es el producto de las matrices


transpuestas en orden inverso (ecuación (18.41)). Por lo tanto, transponiendo ambos
miembros de (19.16), y recordando que para una matriz simétrica AT = A y que los
autovalores de una matriz simétrica son reales,

xlT Axk = λl xlT xk . (19.17)

Restando (19.17) de (19.14) tenemos entonces

0 = (λk − λl ) xlT xk (19.18)

de manera que, si λk = λl ,

xlT xk = 0 (19.19)

y los vectores son ortogonales.

EJEMPLO 19.7 Ortogonalidad de autovectores

Para los autovectores del Ejemplo 19.5,


⎛ ⎞
0
 ⎜ 1 ⎟
C1T C2 = c1 c2 1 1 1 1 ⎝ ⎠ = c1 c2 (0 + 1 + 0 − 1) = 0 ,
0
−1
⎛ ⎞
1
  ⎜−1 ⎟
C1T C4 = c21 1 1 1 1 ⎝ ⎠ = c1 (1 − 1 + 1 − 1) = 0 ,
2
1
−1

y de manera similar para C1T C3 , C2T C4 C2T C3 y C3T C4 .

Propiedad 3. Para una matriz simétrica, los autovectores correspondientes al mismo


autovalor o bien son ortogonales o pueden convertirse en tales.
19.2. El problema de autovalores matriciales 489

EJEMPLO 19.8 Ortogonalidad de autovectores

Los autovectores C2 y C3 del Ejemplo 19.5 corresponden al mismo autovalor, E = α. Ya son ortogonales:
⎛ ⎞
1
 ⎜ 0 ⎟
C2T C3 = c2 c3 0 1 0 −1 ⎝ = c2 c3 (0 + 0 + 0 + 0) = 0 .
−1 ⎠
0

Si xk y xl corresponden al mismo autovalor λk = λl = λ, entonces

Axk = λxk y Axl = λxl , (19.20)

de manera que toda combinación lineal de xk y xl es también un autovector de A con el


mismo autovalor. En efecto, si

x = axk + bxl , (19.21)

entonces

Ax = A (axk + bxl ) = a (Axk ) + b (Axl )


= a (λxk ) + b (λxl ) = λ (axk + bxl ) = λx . (19.22)

Si xk y xl son dos vectores independientes, siempre es posible encontrar dos combina-


ciones lineales suyas que sean ortogonales.

EJEMPLO 19.9 Ortogonalización de vectores

Sean a y b dos vectores no ortogonales, con aT b = 0. Dos combinaciones lineales de a y b ortogonales son
el propio a y
b = b − ca
donde c se toma tal que aT b = 0. De esta manera
aT b
aT b = aT b − caT a = 0 , c= ,
aT a
y

aT b
b = b − a.
aT a
⎛ ⎞ ⎛ ⎞
1 3
Por ejemplo, si a = ⎝ 1 ⎠ y b = ⎝ 0 ⎠, entonces aT a = 3, aT b = 6, y
1 3
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
3
1 1
6
b =⎝ 0 ⎠−
 ⎝ 1 ⎠ = ⎝−2 ⎠ .
3 3 1 1

Esto es un ejemplo del ampliamente utilizado método de ortogonalización de Schmidt.


490 Capı́tulo 19. El problema de autovalores matriciales

De las Propiedades 1 a 3 se deduce el siguiente importante teorema para los autovectores


de matrices simétricas:

Los n autovectores de una matriz real simétrica de orden n forman (o


pueden escogerse de manera que formen) un sistema de n vectores
ortogonales unitarios (ortonormales):


1 si k = l,
xkT xl = δkl = (19.23)
0 si k = l.

19.3. Diagonalización de matrices

Sea una matriz cuadrada A con autovectores x1 , x2 , x3 , . . . , xn asociados a los autova-


lores λ1 , λ2 , λ3 , . . . , λn ,

Axk = λk xk , k = 1, 2, 3, . . . , n , (19.24)

y sea X la matriz cuyas columnas son los vectores de A normalizados:


⎛ ⎞
x11 x12 x13 · · · x1n
⎜ x x x ··· x ⎟
⎜ 21 22 23 2n ⎟
⎜ ⎟
⎜ x x
X = (x1 x2 x3 · · · xn ) = ⎜ 31 32 33x · · · x 3n ⎟ . (19.25)

⎜ .. .. .. . . .. ⎟
⎝ . . . . . ⎠
xn1 xn2 xn3 · · · xnn

Entonces

AX = (Ax1 Ax2 Ax3 · · · Axn )


= (λ1 x1 λ2 x2 λ3 x3 · · · λn xn )
= XD , (19.26)

donde D es la matriz diagonal cuyos elementos diagonales son los autovalores de A,


⎛ ⎞
λ1 0 0 · · · 0
⎜ 0 λ 0 ··· 0 ⎟
⎜ 2 ⎟
⎜ ⎟
D=⎜ ⎜ 0 0 λ · · · 0 ⎟. (19.27)

3

⎜ .. .. .. . . .. ⎟
⎝ . . . . . ⎠
0 0 0 · · · λn
19.3. Diagonalización de matrices 491

EJEMPLO 19.10 Los autovectores de la matriz (Ejemplo 19.2)


⎛ ⎞
−2 1 1
A = ⎝−11 4 5 ⎠
−1 1 0
son ⎛ ⎞ ⎛⎞ ⎛⎞
1 0 1
x1 = ⎝ 2 ⎠ , x2 = ⎝ 1 ⎠ , x3 = ⎝ 3 ⎠
1 −1 1
asociados a los autovalores λ1 = 1, λ2 = −1, λ3 = 2. Entonces
⎛ ⎞
  1 0 1
X = x1 x2 x3 = ⎝ 2 1 3 ⎠
1 −1 1
y
⎛ ⎞⎛ ⎞ ⎛ ⎞
−2 1 1 1 0 1 1 0 2
AX = ⎝−11 4 5 ⎠⎝ 2 1 3 ⎠ = ⎝ 2 −1 6 ⎠
−1 1 0 1 −1 1 1 1 2
⎛ ⎞⎛ ⎞
1 0 1 1 0 0
= ⎝ 2 1 3 ⎠⎝ 0 −1 0 ⎠
1 −1 1 0 0 2
⎛ ⎞⎛ ⎞
1 0 1 λ1 0 0
= ⎝ 2 1 3 ⎠⎝ 0 λ2 0 ⎠ = XD ,
1 −1 1 0 0 λ3

siendo D la matriz diagonal de los autovalores.

Si la matriz X de los autovectores de A es no singular, premultiplicando ambos miembros


de la ecuación (19.26) por la matriz inversa X−1 tenemos

D = X−1 AX , (19.28)

y hemos reducido A a la forma diagonal D.

EJEMPLO 19.11 Diagonalización

La inversa de la matriz X de los autovectores de A del Ejemplo 19.10 es


⎛ ⎞
4 −1 −1
X−1 = ⎝ 1 0 −1 ⎠
−3 1 1

de manera que
⎛ ⎞⎛ ⎞⎛ ⎞ ⎛ ⎞
4 −1 −1 −2 1 1 1 0 1 1 0 0
X−1 AX = ⎝ 1 0 −1 ⎠ ⎝−11 4 5 ⎠ ⎝ 2 1 3 ⎠ = ⎝ 0 −1 0 ⎠ = D .
−3 1 1 −1 1 0 1 −1 1 0 0 2
492 Capı́tulo 19. El problema de autovalores matriciales

Transformaciones de semejanza

Dos matrices cuadradas A y B se dicen matrices semejantes si están relacionadas


por la transformación de semejanza2

B = C−1 AC , (19.29)

siendo C una matriz no singular. La ecuación (19.28) es por lo tanto una transformación
de semejanza que reduce A a forma diagonal. Si A es simétrica, los autovectores de A
son ortonormales, por el teorema (19.23), y X en (19.28) es una matriz ortogonal, con
X−1 = XT . Por lo tanto, una matriz simétrica se reduce a forma diagonal mediante la
transformación ortogonal

D = XT AX . (19.30)

De las ecuaciones (18.38) a (18.40) se deducen dos importantes propiedades de invarian-


cia de las transformaciones de semejanza para el determinante y la traza de un producto
matricial: si B = C−1 AC, entonces

det B = det A invariancia del determinante, (19.31)


tr B = tr A invariancia de la traza. (19.32)

Por ejemplo,
   
det B = det C−1 AC = det ACC−1 = det (AI) = det A .

Se deduce de estas propiedades de invariancia que para una matriz cuadrada A,

1. La traza de A es igual a la suma de los autovalores de A:



n

λk = tr A . (19.33)
k=1

2. El determinante de A es igual al producto de los autovalores de A:



n

λk = det A (19.34)
k=1

(el determinante de una matriz diagonal es el producto de los elementos diagonales).

02. En su monografı́a sobre la teorı́a de matrices de 1878, Frobenius definió las matrices semejantes,
estudió las propiedades de las matrices y de las transformaciones ortogonales, y demostró la relación entre
las álgebras de matrices y de cuaterniones al determinar cuatro matrices 2 × 2 cuya álgebra es la de los
cuaterniones 1, i, j, k.
19.4. Formas cuadráticas 493

EJEMPLO 19.12 Para las matrices A y D del Ejemplo 19.11,

Traza: tr A = −2 + 4 + 0 = 2 , tr D = 1 − 1 + 2 = 2 .

4 5 −11 5 −11 4
Determinante: det A = −2 − + = 10 − 5 − 7 = −2 ,
1 0 −1 0 −1 1
det D = 1 × (– 1) × 2 = −2 .

19.4. Formas cuadráticas

Una forma cuadrática es un polinomio de segundo grado en un conjunto de variables.


Algunos ejemplos son

x2 + y2 , 3x2 − 4xy + 2y2 , x12 + 2x1 x2 + 3x2 x3 − x22 + 3x32 .

La expresión general de una forma cuadrática (real) en dos variables es

Q(x, y) = ax2 + 2bxy + cy2 (19.35)

donde los coeficientes a, b y c son números reales. Esto puede escribirse en forma ma-
tricial como



a b x
Q(x) = (x y) b c y = x Ax ,
T
(19.36)

siendo A la matriz real y simétrica de los coeficientes, y x el vector cuyos elementos son
las variables x e y.

EJEMPLO 19.13 Compruebe que





  3 1 x
Q = 3x2 + 2xy + y2 = x y .
1 1 y




3 1 x 3x + y
Tenemos = y
1 1 y x+y


  3x + y
Q= x y = x(3x + y) + y(x + y) = 3x2 + 2xy + y2 .
x+y

La expresión general de una forma cuadrática en n variables es


n

n

Q(x1 , x2 , x3 , . . . , xn ) = aij xi xj
i=1 j=1
494 Capı́tulo 19. El problema de autovalores matriciales

= a11 x12 + a12 x1 x2 + a13 x1 x3 + · · · + a1n x1 xn


+ a21 x2 x1 + a22 x22 + a23 x2 x3 + · · · + a2n x2 xn
+ ···
+ an1 xn x1 + an2 xn x2 + an3 xn x3 + · · · + ann xn2 (19.37)

donde los coeficientes aij son reales y aji = aij . En forma matricial

Q(x) = xT Ax , (19.38)

siendo
⎛ ⎞ ⎛ ⎞
x1 a11 a12 a13 · · · a1n
⎜ ⎟ ⎜ · · · a2n ⎟
⎜ x2 ⎟ ⎜ a21 a22 a23 ⎟
⎜ ⎟ ⎜ · · · a3n ⎟
x=⎜

x3 ⎟,
⎟ A=⎜

a31 a32 a33 ⎟,
⎟ (19.39)
⎜ .. ⎟ ⎜ .. .. .. .. . ⎟
⎝ . ⎠ ⎝ . . . . .. ⎠
xn an1 an2 an3 · · · ann

y A real y simétrica.

Forma canónica

Hemos visto (ecuación (19.30)) que una matriz simétrica A se reduce a forma dia-
gonal mediante la transformación de semejanza XT AX, donde X es la matriz ortogonal
cuyas columnas son los autovectores ortonormales de A. Dado que XXT = I (para una
matriz ortogonal X), podemos escribir (19.38) como

Q = xT (XXT ) A (XXT ) x
= (xT X) (XT AX) (XT x)
= yT Dy , (19.40)

donde D = XT AX es la matriz diagonal de los autovalores de A, y donde

y = XT x (19.41)

es el vector que se obtiene a partir de x con la transformación ortogonal XT .


La forma cuadrática Q en las n variables x1 , x2 , x3 , . . . , xn se transforma en una forma
equivalente en las n variables y1 , y2 , y3 , . . . , yn que sólo tiene términos cuadráticos puros:


n

Q(y) = λk y2k = λ1 y21 + λ2 y22 + λ3 y23 + · · · + λn y2n . (19.42)


k=1
19.4. Formas cuadráticas 495

Ésta es la forma canónica de Q, y las variables yk son las variables canónicas.3

EJEMPLO 19.14 Transforme la siguiente forma cuadrática a forma canónica:

Q = 5x12 + 8x1 x2 + 5x22 .

Tenemos que


  5 4 x1
Q= x 1 x2 = xT Ax
4 5 x2
y que los autovectores ortonormales de la matriz simétrica A son



1 1 1 1
√ y √ ,
2 −1 2 1

asociados a los autovalores λ1 = 1 y λ2 = 9. Si




1 1 1
X= √ ,
2 −1 1

entonces ⎛ ⎞


1
(x  
1 − x2 )
1 0 ⎜ 2 ⎟ y1
D = XT AX = ⎜
y=Xx=⎝ ⎟
⎠=
T
, ,
0 9 1 y2
√ (x1 + x2 )
2
y
Q = yT Dy = y21 + 9y22 .

La transformación de una forma cuadrática a forma canónica se llama también transfor-


mación a ejes principales, y tiene múltiples aplicaciones en geometrı́a y en las ciencias
fı́sicas. Por ejemplo, la forma cuadrática del Ejemplo 19.14,

Q = 5x12 + 8x1 x2 + 5x22 ,

representa una familia de elipses en el plano x1 x2 para valores de Q positivos. En la


Figura 19.2(a) se representa la elipse para Q = 9.
Los ejes principales de la elipse están situados a 45◦ de los ejes x1 y x2 , y la transfor-
mación a la forma canónica

Q = y21 + 9y22

03. Cayley y Sylvester desarrollaron la teorı́a de las formas entre 1854 y 1878. Sylvester afirmaba
haber descubierto y desarrollado la reducción de una forma cuadrática a forma canónica en una sesión ‘con
una frasca de vino de Oporto para confortar los ánimos de una naturaleza desfallecida’. Camille Jordan
(1838-1922) hizo el estudio general de las formas canónicas en su Traité des substitutions et des équations
algébriques (Tratado sobre las sustituciones y las ecuaciones algebraicas) de 1871, en el cual presentaba
muchos de los conceptos modernos de la teorı́a de grupos en el contexto de los grupos de permutaciones
(sustituciones).
496 Capı́tulo 19. El problema de autovalores matriciales

corresponde por lo tanto a una rotación del sistema de coordenadas, desde (x1 , x2 ) a
(y1 , y2 ), que hace coincidir los ejes coordenados con los ejes principales de la elipse,
como se muestra en la Figura 19.2(b) para Q = 9.

45

Figura 19.2

EJEMPLO 19.15 Tensor de inercia

Un cuerpo que gira con velocidad ω = (ωx , ωy , ωz ) en torno a un eje que pasa por su centro de masas tiene
una energı́a cinética de rotación dada por la forma cuadrática
⎛ ⎞⎛ ⎞
Ixx Ixy Ixz ωx
1 T 1 ⎜ ⎟⎜ ⎟
T = ω Iω = ωx ωy ωz ⎝ Iyx Iyy Iyz ⎠ ⎝ ωy ⎠ , (19.43)
2 2
Izx Izy Izz ωz
donde la matriz simétrica I (a no confundir con la matriz identidad) se llama tensor del momento de
inercia o, sencillamente, tensor de inercia. Por ejemplo, una masa m situada en la posición (x, y, z) tiene
un tensor del momento de inercia con componentes (véase el Ejercicio 20)
     
Ixx = m y2 + z2 , Iyy = m z2 + x2 , Izz = m x2 + y2 ,
Ixy = −mxy , Iyz = −myz , Izx = −mzx. (19.44)
Una transformación a los ejes principales es una transformación de (x, y, z) a (x , y , z ) que hace coincidir
los ejes coordenados con los ejes principales de inercia del cuerpo. El tensor de inercia es diagonal en el
nuevo sistema de coordenadas, y la energı́a cinética de rotación es
⎛ ⎞⎛ ⎞
Ix x 0 0 ωx
1   ⎜ ⎟⎜ ⎟
T = ωx ωy ωz ⎝ 0 Iy y 0 ⎠ ⎝ ωy ⎠
2
0 0 Iz z ωz 
1 1 1
= Ix x ω2x + Iy y ω2y + Iz z ω2z (19.45)
2 2 2
y es la suma de las contribuciones de las rotaciones en torno a los ejes x , y y z .

Momento angular

El momento angular de un cuerpo que gira está en relación con la velocidad angular a través de (véase
el Ejemplo 16.16)
l = Iω (19.46)
19.5. Matrices complejas 497

o, en componentes,
lx = Ixx ωx + Ixy ωy + Ixz ωz ,
ly = Iyx ωx + Iyy ωy + Iyz ωz , (19.47)
lz = Izx ωx + Izy ωy + Izz ωz .
Si los ejes coordenados coinciden con los ejes principales de inercia, I es diagonal y las ecuaciones (19.47)
se reducen a
lx = Ixx ωx , ly = Iyy ωy , lz = Izz ωz . (19.48)
La energı́a cinética de rotación tiene entonces el aspecto familiar
l2x l2y l2
T= + + z (19.49)
2Ixx 2Iyy 2Izz
que se utiliza en consideraciones teóricas en espectroscopia de microondas en moléculas poliatómicas.

19.5. Matrices complejas

Mucho de lo que hemos tratado antes se aplica tanto a las matrices complejas como
a las matrices reales y en este apartado resumimos las propiedades más importantes de
las matrices complejas y sus diferencias con las de las matrices reales.
Una matriz A cuyos elementos son números complejos se llama matriz compleja, y
puede escribirse en la forma

A = B + iC (19.50)

donde i = −1, y B y C son matrices reales.

Matriz compleja conjugada A∗

La matriz compleja conjugada A∗ se obtiene a partir de A sustituyendo cada elemento


de A por su complejo conjugado:
   
si A = aij , entonces A∗ = a∗ij , (19.51)

A∗ = B − iC . (19.52)

En el caso de una matriz real, A∗ = A y C = 0.

Matriz conjugada hermı́tica A†

La matriz conjugada hermı́tica de A es la transpuesta de la compleja conjugada,

A† = (A∗ ) = (AT )∗ .
T
(19.53)
498 Capı́tulo 19. El problema de autovalores matriciales

Ası́, para orden 3,


⎛ ⎞ ⎛ ⎞
a11 a12 a13 a∗11 a∗21 a∗31
si A = ⎝ a21 a22 a23 ⎠ , entonces A† = ⎝ a∗12 a∗22 a∗32 ⎠ .
a31 a32 a33 a∗13 a∗23 a∗33

La conjugada hermı́tica se llama también matriz transpuesta conjugada, matriz aso-


ciada y (en mecánica cuántica) matriz adjunta (a no confundir con la matriz de mismo
nombre que vimos en el apartado 18.4).

EJEMPLO 19.16 Halle la conjugada hermı́tica de la matriz




3 + i 2 + 3i −1
A= .
1 − 2i 2 2i

La compleja conjugada A∗ y la conjugada hermı́tica A† son


⎛ ⎞

3 − i 1 + 2i
3 − i 2 − 3i −1

A = , A = ⎝ 2 − 3i

2 ⎠.
1 + 2i 2 −2i
−1 −2i

La conjugada hermı́tica juega para las matrices complejas el mismo papel que juega la
transpuesta para las matrices reales. Por ejemplo, el producto interno (escalar) de dos
vectores complejos a = (a1 , a2 , a3 ) y b = (b1 , b2 , b3 ) se define como (compárese con la
ecuación (18.62))
 
b1
a · b = a b = (a a a )
† ∗
1

2

3 b2 = a∗1 b1 + a∗2 b2 + a∗3 b3 . (19.54)
b3

El producto interno es en general complejo, siendo b† a = (a† b)∗ = a† b. Sin embargo la


cantidad
 
a1
a · a = a† a = (a∗1 a∗2 a∗3 ) a2 = a∗1 a1 + a∗2 a2 + a∗3 a3
a3
= |a1 |2 + |a2 |2 + |a3 |2 (19.55)

es un número real positivo, y define la longitud o norma del vector, |a| = a† a.

EJEMPLO 19.17 Para los vectores a = (1 + i, 3, 2i) y b = (2 − i, 4i, −1),


⎞ ⎛
 1+i


a a= 1−i 3 −2i ⎝ 3 ⎠ = (1 − i)(1 + i) + 32 + (– 2i)(2i) = 2 + 9 + 4 = 15 ,
2i
19.5. Matrices complejas 499
⎞ ⎛
 2−i
b b = 2 + i −4i −1 ⎝ 4i ⎠ = (2 + i)(2 − i) + (– 4i)(4i) + 1 = 5 + 16 + 1 = 22 ,

−1
⎛ ⎞
  2−i

a b= 1−i 3 −2i ⎝ 4i ⎠ = (1 − i)(2 − i) + 3(4i) + (– 2i)(– 1) = 1 + 11i .
−1

Dos vectores son ortogonales si su producto interno es cero: a† b = 0.

Matrices hermı́ticas

Una matriz cuadrada compleja que es igual a su conjugada hermı́tica se llama matriz
hermı́tica,

A† = A (matriz hermı́tica). (19.56)

Una matriz hermı́tica real es una matriz simétrica.

EJEMPLO 19.18 Demuestre que la siguiente matriz es hermı́tica:




3 2 + 3i
A= .
2 − 3i 1

Tenemos que



3 2 − 3i 3 2 + 3i
A∗ = A† = (A∗ ) = = A.
T
,
2 + 3i 1 2 − 3i 1

Matrices unitarias

Una matriz cuadrada compleja U se dice unitaria si su conjugada hermı́tica es igual


a su inversa,

U† = U−1 . (19.57)

La propiedad caracterı́stica de una matriz unitaria es que sus columnas (y sus filas) for-
man un sistema de vectores ortonormales (compárese con lo visto para las matrices or-
togonales en el Apartado 18.6). Sea, para orden 3,
⎛ ⎞
a1 b1 c1
U = (a b c) = ⎝ a2 b2 c2 ⎠ (19.58)
a3 b3 c3

con a† a = b† b = c† c = 1 y a† b = b† c = c† a = 0. La conjugada hermı́tica de U es


500 Capı́tulo 19. El problema de autovalores matriciales

⎛ ⎞ ⎛ ∗ ∗ ∗ ⎞
a† a 1 a2 a3
U† = ⎝ b† ⎠ = ⎝ b∗1 b∗2 b∗3 ⎠ (19.59)
c† c∗1 c∗2 c∗3

y
⎛ ⎞ ⎛ † ⎞ ⎛ ⎞
a† a a a† b a† c 1 0 0
U† U = ⎝ b† ⎠ (a b c) = ⎝ b† a b† b b† c ⎠ = ⎝ 0 1 0 ⎠ = I . (19.60)
c† c† a c† b c† c 0 0 1

Una matriz unitaria real es una matriz ortogonal. Las matrices hermı́ticas y las unitarias
juegan para las matrices complejas los mismos papeles que tienen las matrices ortogona-
les y las simétricas para las matrices reales, y tienen las mismas propiedades importantes:

(i) Los autovalores de una matriz hermı́tica son reales.


(ii) Los autovectores de una matriz hermı́tica de orden n forman (o pueden escogerse
de manera que formen) un sistema de n vectores ortogonales.
(iii) Una matriz hermı́tica A se reduce a forma diagonal por medio de la transformación
(unitaria) de semejanza

D = U† AU , (19.61)

siendo U la matriz unitaria cuyas columnas son los autovectores de A, y D la matriz


diagonal real cuyos elementos diagonales son los autovalores de A.

19.6. Ejercicios

Apartado 19.1
Halle la inversa de la matriz de los coeficientes y úsela para resolver las ecuaciones:

1. 2x − 3y = 8 2. x + y + z= 6 3. w + x + z= 2
4x + y = 2 x + 2y + 3z = 14 x + y + z= 6
x + 4y + 9z = 36 w + y + z= 3
w + x + y = 4

Apartado 19.2
Halle los autovalores y los autovectores normalizados para las siguientes matrices:





3 1 2 2 2 0 2 −1
4. 5. 6. 7.
1 3 1 3 0 −3 0 3
19.6. Ejercicios 501
⎛ ⎞ ⎛ ⎞

1 2 0 0 2 0
2 1 ⎝ 2 1 0 ⎠ ⎝ 2 0 2 ⎠
8. 9. 10.
−1 4
0 2 1 0 2 0

11. Demuestre que los conjuntos de autovectores de las matrices simétricas del Ejercicio 4 y del ejercicio
10 son conjuntos de vectores ortogonales.

12. La matriz de Hückel para el butadieno es


⎛ ⎞
α β 0 0
⎜ β α β 0 ⎟
⎝ 0 .
β α β ⎠
0 0 β α

Halle los autovalores (en función de α y β) y los autovectores normalizados. Demuestre que los autovectores
son ortogonales.

13. (i) Demuestre que los autovalores de la matriz de Hückel


⎛ ⎞
α β β
⎝ β α β ⎠
β β α

para el ciclopropeno son λ1 = α + 2β, λ2 = λ3 = α − β.

(ii) Halle el autovector normalizado asociado a λ1 .

(iii) Demuestre que un autovector asociado al autovalor α − β tiene componentes x1 , x2 , x3 que cumplen
x1 + x2 + x3 = 0.

(iv) Halle dos autovectores ortonormales asociados al autovalor α − β.

14. (i) Demuestre que una matriz A y su transpuesta AT tienen el mismo conjunto de autovalores, y halle
los autovalores de

3 2
A= .
0 2
(ii) Demuestre que las dos ecuaciones siguientes son equivalentes:

AT y = λy , yT A = λyT .

Los autovectores de AT son en general diferentes de los de A, salvo si A es una matriz simétrica. El vector
yT se llama a veces autovector por la izquierda de A, y un autovector ‘ordinario’ de A se llama entonces
autovector por la derecha.

(iii) Halle los autovectores normalizados por la derecha y por la izquierda de




3 2
A= .
0 2

Apartados 19.3 y 19.4




3 1
15. (i) Construya la matriz X que reduce la matriz A = del Ejercicio 4 a forma diagonal me-
1 3
−1
diante la transformación de semejanza D = X AX.
502 Capı́tulo 19. El problema de autovalores matriciales

(ii) Compruebe que D es diagonal y que los elementos diagonales de D son los auto-valores de A.

(iii) Compruebe que det D = det A y que tr D = tr A.

Repita el Ejercicio 15 para: ⎛ ⎞



1 2 0
2 2
16. A = del Ejercicio 5 17. A = ⎝ 2 1 0 ⎠ del Ejercicio 9
1 3
0 2 1
⎛ ⎞
0 2 0
18. A = ⎝ 2 0 2 ⎠ del Ejercicio 10
0 2 0

19. Transforme la forma cuadrática



Q = 7x12 + 6 3x1 x2 + 13x22

a forma canónica. Interprete el resultado geométricamente.

20. Deduzca las ecuaciones (19.44) para las componentes del tensor de inercia.
[Sugerencia: desarrolle la ecuación (16.60), l = mr2ω − m(r · ω )r, para el momento angular en función de
sus componentes.]

Apartado 19.5
Halle la compleja conjugada y la conjugada hermı́tica de las siguientes matrices. Indique cuáles son hermı́ti-
cas: ⎛ ⎞


0 −i 0
1+i 2−i 2 i
21. 22. 23. ⎝ i 0 −i ⎠
3 + i −i −i 1
0 i 0
⎛ ⎞ ⎛ ⎞
i 2i
24. Si a = ⎝ 1 ⎠ y b = ⎝ 0 ⎠, halle (i) a† a (ii) b† b (iii) a† b (iv) b† a
−i 3


1 1 i
25. (i) Demuestre que A = √ es a la vez hermı́tica y unitaria.
2 −i −1

(ii) Halle los autovalores y los autovectores de A.

(iii) Compruebe que los autovectores son ortogonales.


 Métodos numéricos

20.1. Conceptos

Un método numérico es un método para obtener la solución de un problema mate-


mático en forma de números. En muchos casos el problema puede resolverse de manera
‘exacta’ mediante funciones conocidas por medio de los métodos analı́ticos presentados
en los capı́tulos anteriores de este libro. Los métodos numéricos son entonces necesarios
si se precisa una solución en forma numérica. Muchos otros problemas, por otra parte, no
pueden resolverse analı́ticamente y los métodos numéricos son necesarios para el propio
proceso de resolución. Como los métodos numéricos se implementan normalmente en
un ordenador, a veces se los define como ‘métodos para resolver problemas con ordena-
dor’. El desarrollo de los ordenadores en los últimos treinta años ha ido acompañado del
desarrollo de sofisticados procedimientos numéricos para resolver una amplia variedad
de problemas en las ciencias fı́sicas, en ingenierı́a y en estadı́stica. Esos procedimiento
se han agrupado en ‘bibliotecas matemáticas’ o ‘paquetes numéricos’, accesibles en la
mayorı́a de los ordenadores estándar. En este capı́tulo presentamos los principios gene-
rales que subyacen en algunos de los métodos numéricos más importantes y tratamos
con detalle únicamente los más sencillos de todos.
Casi todas las operaciones numéricas están acompañadas invevitablemente de errores
y el análisis de esos errores es una parte integral de todo método numérico.

20.2. Errores

En los cálculos numéricos los errores surgen principalmente de tres maneras.

1. Equivocaciones. Se incluyen aquı́ los errores de cálculo al operar o los errores de


código en un programa de ordenador. Estos errores se pueden eliminar, en princi-
pio, revisando. En las ciencias experimentales aparecen también errores evitables
por la utilización de aparatos defectuosos o mal calibrados. En análisis numérico
las equivocaciones no se consideran errores.
2. Errores matemáticos de truncación. Se deben al uso de representaciones apro-
ximadas de funciones. Por ejemplo, como vimos en el Apartado 7.7, cuando un
desarrollo en serie de Taylor se trunca tras un número de términos dado. El teore-
ma de Taylor proporciona entonces un método para determinar las cotas de error
del resultado.
504 Capı́tulo 20. Métodos numéricos

Muchos métodos numéricos tienen su origen en desarrollos de Taylor y vienen


acompañados inevitablemente de errores de truncación; los métodos numéricos
son métodos aproximados.
3. Errores de redondeo. Como vimos en el Apartado 1.3, los números casi siempre
se aproximan en la práctica por redondeo, ya sea a un cierto número de cifras deci-
males en representación de coma fija, o a un cierto número de cifras significativas
en representación de coma flotante. En este apartado consideramos las consecuen-
cias de este tipo de error.

Por las reglas del redondeo (Apartado 1.3) un número como a = 1,234 obtenido al
redondear a tres cifras decimales, representa todos los números entre 1,2335 y 1,2345.
Se dice que el número a tiene un error absoluto máximo o cota (superior) de error a =
0,0005, y la cota puede indicarse escribiendo

a ± a = 1,2340 ± 0,0005 .

En aritmética de punto fijo todos los números se redondean al mismo número de cifras
decimales, y por lo tanto tienen la misma cota de error, digamos que . La suma o la resta
de dos números tiene entonces una cota de error 2. En general, la suma o la resta de los
números a y b, con cotas de error a y b , tiene como cota de error a + b .

EJEMPLO 20.1 Propagación de errores en la suma y la resta


Los números a = 1,234 y b = 3,468 han sido redondeados a 4 cifras significativas. Determine la cota de
error para a − b.

La cota de error para los dos números a y b es  = 0,0005. Los mayores y menores valores posibles de
a − b son por lo tanto

(a + ) − (b − ) = (a − b) + 2 o bien 1,2345 − 3,4675 = −2,2330 = −2,234 + 0,001 ,

(a − ) − (b + ) = (a − b) − 2 o bien 1,2335 − 3,4685 = −2,2350 = −2,234 − 0,001 ,


y la cota de error de la resta es 2 = 0,001.

La propagación del error para la multiplicación y la división se describe mejor usando el


error relativo. Un número cuyo valor viene dado por a y cuyo valor exacto es ae tiene
un error relativo
 
 a − ae 

ra =   = a . (20.1)
ae  |ae |

Si el error es suficientemente pequeño, se puede sustituir en el denominador ae por a y


(20.1) por ra = a /|a|. El error relativo del producto o del cociente de a y b, con errores
relativos ra y rb , es entonces ra + rb . Ası́, para la multiplicación, los mayores y menores
valores posibles de p = a × b son

(a + a ) (b + b ) = ab + ab + ba + a b ,
20.2. Errores 505

(a − a ) (b − b ) = ab − ab − ba + a b .

La cantidad a b puede despreciarse para errores suficientemente pequeños, y la cota de


error del producto es p = ab + ba . Dividiendo por p = ab tenemos entonces
p a b
rp = = + = ra + rb . (20.2)
p a b

De manera similar para la división.

EJEMPLO 20.2 Si a = 12,35 y b = 2,345 han sido redondeados a 4 cifras, determine las cotas de error
de q = a/b.

Tenemos que 12,35/2,345 = 5,26652 (con seis cifras). Las cotas de error para a son a = 0,005 y ra =
a /a ≈ 0,0004, y para b b = 0,0005 y rb = b /b ≈ 0,0002. Suponemos entonces que el cociente tiene
rq ≈ 0,0006. Por lo tanto, los mayores y menores valores del cociente son (dando los resultados con 6 cifras)
12,355 12,345
= 5,26978 = 5,26652 + 0,00326 , = 5,26327 = 5,26652 − 0,00325 .
2,3445 2,3455
Tenemos entonces rq ≈ 0,0033/5,26652 ≈ 0,0006, como era de esperar de la ecuación (20.2). Esto es el
error relativo para el producto sin redondear.

El resultado puede escribirse como 5,2665 ± 0,0033.

Las cotas calculadas de la manera anterior son ejemplos de errores extremos. En la


práctica, en particular cuando se usa aritmética en coma flotante, suele haber casi siem-
pre una compensación entre los errores y se supone que los resultados de varias opera-
ciones aritméticas seguidas tienen errores reales menores. Los errores de redondeo son
un ejemplo de ‘errores aleatorios’, que trataremos en el Capı́tulo 21 y que están sujetos
al análisis estadı́stico.

Errores al restar

Los errores más graves, con diferencia, que surgen del uso de números redondeados
aparecen al restar dos números casi iguales. Ası́ por ejemplo, para a = 1,234 y b = 1,233
tenemos, redondeando a 4 cifras, a − b = 0,001 con una cota de error 0,001 (a − b =
= 0,001 ± 0,001). A menudo, sin embargo, los errores al restar se pueden minimizar
utilizando un procedimiento numérico (algoritmo) adecuado.

EJEMPLO 20.3 Halle las soluciones de la ecuación cuadrática


x2 − 36x + 2 = 0
empleando aritmética con 4 cifras.

Las soluciones de la ecuación cuadrática general ax2 + bx + c = 0 son


   
b b
2 c b b
2 c
x1 = − + − , x2 = − − − ,
2a 2a a 2a 2a a
506 Capı́tulo 20. Métodos numéricos

de manera que en el presente caso



x1 = 18 + 322 = 18,00 + 17,94 = 35,94 ,

x2 = 18 − 322 = 18,00 − 17,94 = 0,06 ,
y x2 sólo tiene una cifra significativa.
Sin embargo, como las raı́ces de una ecuación cuadrática cumplen la propiedad x1 x2 = c/a, tenemos que
una fórmula alternativa para la segunda raı́z es x2 = c/x1 a,
2,000
x2 = = 0,05565 ,
35,94
con un error de 1 en la última cifra significativa.

Este ejemplo muestra que el procedimiento correcto para resolver una ecuación cuadráti-
ca es, independientemente de las cifras significativas usadas,
 2
b b c c
si b < 0, entonces x1 = − + − , x2 = ,
2a 2a a x1 a
 2 (20.3)
b b c c
si b > 0, entonces x1 = − − − , x2 = .
2a 2a a x1 a

De esta manera se minimizan los errores al restar.


En la Tabla 20.1 se muestran algunos resultados obtenidos para la función

1 − cos x
f (x) = (20.4)
x2
con una calculadora normal de 10 dı́gitos.
Un procedimiento alternativo, y correcto, para eliminar los errores de la diferencia es
utilizar el desarrollo de la función en serie de MacLaurin truncada,

1 − cos x 1 x2 x4
≈ − + para |x| ≤ 0,1 (20.5)
x2 2! 4! 6!
que tiene, por el teorema de Taylor, una cota de error de 2,5 × 10−11 para |x| ≤ 0,1.

Tabla 20.1 Valores de (20.4) con


una calculadora de 10 dı́gitos

x f (x) calculada f (x) exacta

0,1 0,4995 8346 3 0,4995 8347 22


0,01 0,4999 95 0,4999 9583 33
0,001 0,4999 0,4999 9995 83
0,0001 0,49 0,4999 9999 96
0,00001 0 0,5000 0000 00
20.3. Resolución de ecuaciones ordinarias 507

20.3. Resolución de ecuaciones ordinarias

Una ecuación ordinaria (una ecuación que no implica derivadas ni integrales) en una
variable puede ponerse en la forma
f (x) = 0 , (20.6)

donde f (x) es una función de x. Las soluciones de la ecuación son aquellos valores de x
para los cuales se cumple (20.6): los ceros de la función f (x). Por ejemplo, una ecuación
cuadrática es un caso particular de una ecuación algebraica (polinómica)

f (x) = a0 + a1 x + a2 x2 + · · · + an xn = 0 (20.7)

cuyas soluciones son las raı́ces del polinomio. En el Capı́tulo 2 vimos la expresión ge-
neral de las raı́ces de las funciones cuadráticas pero, aunque existen expresiones exactas
para las raı́ces de ecuaciones cúbicas y cuárticas, una ecuación algebraica general tiene
que ser resuelta numéricamente. Igualmente, las soluciones de ecuaciones trascendentes
(las que incluyen funciones trascendentes) como por ejemplo

e−x = tg x o f (x) = e−x − tg x = 0 (20.8)

no pueden normalmente escribirse mediante un número finito de funciones conocidas y


la ecuación tiene que ser resuelta numéricamente.
Todos los métodos numéricos de resolución de ecuaciones avanzan por iteración de
manera que, dada una solución aproximada inicial, llamémosla x0 , existe un algoritmo
que a partir de x0 da una nueva solución x1 , que confiamos sea más precisa. El mismo
algoritmo se aplica entonces a x1 para obtener x2 , etcétera:

algoritmo
xn −−−−−−−→ xn+1 , n = 0, 1, 2, 3 . . . (20.9)
numérico

El proceso iterativo termina si se consigue una precisión dada, por ejemplo si la variación
|xn+1 − xn | es menor que un valor fijado de antemano. El éxito de un método numérico
depende a menudo de una buena elección de la aproximación inicial, pero esto se puede
conseguir normalmente a partir de la gráfica o de los valores tabulados de la función.
Vamos a considerar aquı́ dos métodos sencillos muy usados, y que además sirven de
base para métodos más sofisticados. Señalamos que los métodos para ecuaciones en una
variable se pueden generalizar a varias variables y, a veces, a sistemas de ecuaciones
simultáneas.

Método de bisección

El punto de partida de este antiguo método son dos valores de x en los cuales se sabe
que la función está en lados opuestos de cero. Supongamos que f (x1 ) < 0 y f (x2 ) > 0,
508 Capı́tulo 20. Métodos numéricos

Figura 20.1

como en la Figura 20.1, y supongamos que la función es continua en el intervalo de x1 a


x2 . Evaluamos la función en el centro del intervalo,

1
x3 = (x1 + x2 ) . (20.10)
2
Entonces, si f (x3 ) > 0, el cero está entre x1 y x3 como en la figura, y se repite el proceso
para el intervalo de x1 a x3 , y ası́ sucesivamente.


EJEMPLO 20.4 Método de bisección para 5

Para hallar 5, planteamos f (x) = x2 − 5 = 0.
La raı́z está entre x< = 2 y x> = 3, siendo f (x< ) = −1 y f (x> ) = 4. Con esto x3 = (x< + x> )/2 = 2,5.
En la Tabla 20.2 se muestran los cálculos con 4 cifras significativas hechos con una calculadora estándar.

Tabla 20.2 Raı́z cuadrada de 5 con 4 cifras


n 0 1 2 3 4 5

x< 2 2 2 2,125 2,1875 2,21875


x> 3 2,5 2,25 2,25 2,25 2,25
1
(x + x> )
2 <
2,5 2,25 2,125 2,1875 2,21875 2,23438
n 6 7 8 9 10 11

x< 2,23438 2,23438 2,23438 2,23438 2,23535 2,23584


x> 2,25 2,24219 2,23828 2,23633 2,23633 2,23633
1
(x + x> )
2 <
2,24219 2,23828 2,23633 2,23535 2,23584

Tras 10 iteraciones los valores de x< y x> redondeados a cuatro cifras son ambos 2,236, y este es el valor
pedido (2,2362 = 4,999696).

El método de bisección es un ejemplo de un método de encajonado, donde se sabe que


el cero está en un intervalo de longitud decreciente. En este caso, la longitud del intervalo
20.3. Resolución de ecuaciones ordinarias 509

se reduce a la mitad con cada iteración. La convergencia es lenta, pero el método no


puede fallar. Es el último método al que recurrir cuando todo el resto falla.

Método de Newton–Raphson

El método de Newton–Raphson, también llamado sencillamente método de Newton,


es el método más famoso para hallar los ceros de una función.1 A diferencia del método
de bisección, necesita que se evalue la derivada f  (x) además de la propia función f (x).
Ilustramos el método en la Figura 20.2.
Dada una solución aproximada de f (x) = 0, x0 , se prolonga la tangente a la curva
en x0 hasta que corte el eje x, en un punto x1 . La
pendiente de la tangente es
f (x0 )
f  (x0 ) = (20.11)
x0 − x1
de manera que
f (x0 )
x1 = x0 − . (20.12)
f  (x0 )

Se toma entonces x1 como la nueva estimación del


cero. Se repite el proceso sustituyendo x0 por x1 y
se obtiene x2 , y ası́ sucesivamente: Figura 20.2

f (xn )
xn+1 = xn − , n = 0, 1, 2, 3, . . . (20.13)
f  (xn )


EJEMPLO 20.5 Método de Newton–Raphson para 5

Para hallar 5, planteamos f (x) = x2 − 5 = 0. Tenemos entonces que f  (x) = 2x, de manera que la
expresión de Newton–Raphson (20.13) es
xn2 − 5
xn+1 = xn − .
2xn

01. Los métodos de resolución de ecuaciones tienen sus orı́genes en la determinación de raı́ces cua-
dradas y cúbicas por los babilonios y los chinos. El capı́tulo 4 del Jiuzhang suanshu (Nueve capı́tulos sobre
el arte matemático) de comienzos de la dinastı́a Han, hacia 200 a.C., describe un método para hallar raı́ces
cuadradas que es similar al método de Newton. Jia Xian generalizó el método a la resolución de ecuaciones
polinómicas en el siglo XI (también describió cómo construir el triángulo de Pascal y sus aplicaciones), y la
primera reseña detallada apareció en el Shuchu jiuzhang (Tratado matemático en nueve apartados) de 1247
por Qin Jiushao (hacia 1202–1261). El método de Newton, descrito en el Methodus fluxionum de 1671 pero
no publicado hasta 1736, es básicamente el método chino para polinomios. Joseph Raphson (1648–1715),
que “era una de las pocas personas a las que Newton permitı́a ver sus trabajos matemáticos”, publicó el
método en 1690.
510 Capı́tulo 20. Métodos numéricos

En la Tabla 20.3 se muestran los cálculos en una caluladora estándar de 10 dı́gitos usando todas las
cifras, empezando con x0 = 3.

Tabla 20.3 Raı́z cuadrada de 5

n xn f (xn )/f  (xn ) xn+1

0 3 0,66666 6666 2,33333 3333


1 2,33333 3333 0,09523 8095 2,23809 5238
2 2,23809 5238 0,00202 6343 2,23606 8896
3 2,23606 8896 0,00000 0918 2,23606 7978
4 2,23606 7978 0

La precisión de la calculadora se agota tras 4 iteraciones, y el resultado tiene un error de sólo una unidad en
la décima cifra significativa.

Newton–Raphson se deduce formalmente del desarrollo en serie de Taylor de una fun-


ción continua alrededor de un punto. Sea x el valor exacto del cero de f (x), y xn un valor
aproximado tal que x = xn + n . Tenemos entonces
2n 
f (x) = f (xn + n ) = f (xn ) + n f  (xn ) + f (xn ) + · · · (20.14)
2
Los términos en 2n y de orden superior se pueden despreciar si n es suficientemente
pequeño. Dado que f (x) = 0, tenemos entonces
f (xn )
n = − (20.15)
f  (xn )

y una nueva estimación es xn+1 = xn + n , como en (20.13).


Puede demostrarse también a partir de la serie de Taylor que si los errores n de xn y n+1
de xn+1 son suficientemente pequeños

f  (xn )
n+1 = −2n . (20.16)
2f  (xn )

Esto explica la rápida convergencia de Newton–Raphson. El error decre cuadráticamente


y el número de cifras significativas se dobla aproximadamente con cada iteración. El
método se denomina un método iterativo de segundo orden, a diferencia del método
de bisección que, con n+1 ≈ 12 n , es un proceso de primer orden.
El método de Newton–Raphson no es un método de encajonado y, como muestran
las ecuaciones (20.15) y (20.16), puede fallar si por ejemplo |f  (xn )| es pequeño (o cero).
La mayorı́a de los problemas se evitan con una elección adecuada del punto inicial x0 o
combinando Newton–Raphson con bisección. Ası́, se hace una iteración con bisección
cuando Newton–Raphson se hace demasiado grande o no converge.
20.4. Interpolación 511

20.4. Interpolación

La interpolación es el proceso de hallar una función cuya gráfica pase por un número
de puntos dados. En la Figura 20.3 los puntos representan los (n + 1) pares de números

(x0 , y0 ) , (x1 , y1 ) , (x2 , y2 ) , ... (xn , yn ) , (20.17)

y la curva en trazo discontinuo representa una función continua y = f (x) tal que yi = f (xi )
para los pares de números (20.17).

Figura 20.3

En cuanto a los números, pueden ser por ejemplo los resultados de medidas de la
concentración y el tiempo en un experimento cinético, o la presión y la temperatura en
el estudio de las propiedades termodinámicas de un fluido. De manera alternativa, pue-
den ser los valores tabulados de una función que no puede expresarse en forma funcional
sencilla. El objetivo de la interpolación es hallar una función ‘sencilla’ que pueda usarse
para hallar puntos intermedios en el intervalo de (x0 , y0 ) a (xn , yn ) (fuera de ese intervalo
el proceso es de extrapolación). La interpolación tiene aplicaciones importantes en inte-
gración numérica (Apartado 20.5), en la cual una función que no puede integrarse con
los métodos descritos en los Capı́tulos 5 y 6 se aproxima por una función más senci-
lla que sı́ puede ser integrada, y en la resolución numérica de ecuaciones diferenciales
(Apartado 20.9).

Interpolación polinómica

Dados (n + 1) puntos, es posible hallar un único polinomio de grado n,

pn (x) = a0 + a1 x + a2 x2 + · · · + an xn (20.18)

que pasa por todos los puntos. Por ejemplo, por dos puntos cualesquiera pasa una única
recta (n = 1), y por tres puntos cualesquiera pasa una única curva cuadrática (n = 2).2

02. La base teórica para la interpolación polinómica, y uno de los teoremas importantes del análisis
moderno, es el teorema de Weierstrass: ‘Si f (x) es una función arbitraria continua definida en el intervalo
a ≤ x ≤ b, siempre es posible aproximar f (x) en todo el intervalo de manera tan precisa como se quiera
512 Capı́tulo 20. Métodos numéricos

Interpolación lineal
La recta y = p1 (x) = a0 + a1 x que pasa por los dos puntos (x0 , y0 ) y (x1 , y1 ), como en la
Figura 20.4, cumple las dos ecuaciones lineales

y0 = a0 + a1 x0 , y1 = a0 + a1 x1 ,

con solución
y0 x1 − y1 x0 y1 − y0
a0 = , a1 = .
x1 − x0 x1 − x0

Tenemos entonces
   
y0 x1 − y1 x0 y1 − y0
y= + x,
x1 − x0 x1 − x0
Figura 20.4

que puede reordenarse como

 
y1 − y0
y = y0 + (x − x0 ) . (20.19)
x1 − x0

La fórmula de la interpolación lineal se usa para hallar un valor aproximado de una


función en un punto x del intervalo de x0 a x1 . El método se ilustra en el siguiente ejemplo
para la función (conocida) ex .

EJEMPLO 20.6 Interpolación lineal

Dos puntos de la gráfica de f (x) = ex (con 4 decimales) son (x0 , y0 ) = (0,80 , 2,2255) y (x1 , y1 ) =
(0,84 , 2,3164). La fórmula de la interpolación lineal (20.19) es por lo tanto
 
2,3164 − 2,2255
ex ≈ y = 2,2255 + (x − 0,80) .
0,84 − 0,80
Para x = 0,832 tenemos entonces

e0,832 ≈ 2,2255 + 0,0727 = 2,2982 .

El valor exacto es 2,2979 (con 4 decimales).

Si se usa la interpolación lineal para cada par de puntos consecutivos se obtiene una
interpolación lineal a trozos, como se representa en la Figura 20.5 para los puntos de
la Tabla 20.4 (compárese con las Figuras 20.6 a 20.8).

mediante un polinomio de grado suficientemente alto’. La condición fundamental es la continuidad; la


función puede tener infinitos maximos o mı́nimos y no es necesario que sea derivable en los puntos del
intervalo.
20.4. Interpolación 513

Tabla 20.4

x y

0,0 1,0000
0,4 1,8902
0,8 1,0517
1,2 0,9577
1,6 0,5207
2,0 1,0000
2,4 2,1184
2,8 1,3809
3,2 1,5690

Figura 20.5

Interpolación cuadrática

La función cuadrática que pasa por tres puntos sucesivos, o nodos, (x0 , y0 ), (x1 , y1 ) y
(x2 , y2 ) puede escribirse como

p2 (x) = L0 (x)y0 + L1 (x)y1 + L2 (x)y2 , (20.20)

donde
(x − x1 ) (x − x2 ) (x − x0 ) (x − x2 )
L0 (x) = , L1 (x) = ,
(x0 − x1 ) (x0 − x2 ) (x1 − x0 ) (x1 − x2 )

(x − x0 ) (x − x1 )
L2 (x) = .
(x2 − x0 ) (x2 − x1 )

Ésta es la fórmula de Lagrange para la interpolación cuadrática, y se usa para hallar un


valor aproximado de una función en el intervalo de x0 a x2 .3

EJEMPLO 20.7 Interpolación cuadrática

Tres puntos de la gráfica de f (x) = ex (con 6 decimales) son (x0 , y0 ) = (0,80 , 2,225541), (x1 , y1 ) =
(0,84 , 2,316367) y (x2 , y2 ) = (0,88 , 2,410900). La interpolación cuadrática en x = 0,832 da entonces
(compárese con el Ejemplo 20.6)

e0,832 = 0,12y0 + 0,96y1 − 0,08y2 = 2,297905 ,

comparado con el valor exacto 2,297910 (con 6 decimales).

03. La fórmula general de interpolación de Lagrange (1795) fue anticipada por Euler en el Institu-
tiones calculi differentialis de 1755 y dada explı́citamente por Edward Waring (1734–1793), profesor en
Cambridge, en un artı́culo en Philosophical Transactions en 1779.
514 Capı́tulo 20. Métodos numéricos

Si se usa la interpolación cuadrática para cada tres puntos consecutivos, tenemos una
interpolación cuadrática a trozos, como se ilustra en la Figura 20.6 para los puntos de la
Tabla 20.4 (compárese con las Figuras 20.5, 20.7 y 20.8).

Figura 20.6

Método de diferencias divididas de Newton

El polinomio interpolador pn (x) que pasa por (n+1) puntos dados puede expresarse de
manera sencilla mediante diferencias divididas. Las dos primeras diferencias divididas
son
y1 − y0 f [x1 , x2 ] − f [x0 , x1 ]
f [x0 , x1 ] = , f [x0 , x1 , x2 ] = ,
x1 − x0 x2 − x0

y en general

f [x1 , x2 , . . . , xk ] − f [x0 , x1 , . . . , xk−1 ]


f [x0 , x1 , . . . , xk ] = . (20.21)
xk − x0

La ecuación (20.19) para p1 (x) es entonces

p1 (x) = y0 + (x − x0 ) f [x0 , x1 ] (20.22)

y para p2 (x) puede reescribirse (20.20) en la forma

p2 (x) = y0 + (x − x0 ) f [x0 , x1 ]
+ (x − x0 ) (x − x1 ) f [x0 , x1 , x2 ] . (20.23)

En general

pk+1 (x) = y0 + (x − x0 ) f [x0 , x1 ]


+ (x − x0 ) (x − x1 ) f [x0 , x1 , x2 ]
20.4. Interpolación 515

+ (x − x0 ) (x − x1 ) (x − x2 ) f [x0 , x1 , x2 , x3 ]
···
+ (x − x0 ) (x − x1 ) · · · (x − xk ) f [x0 , x1 , . . . , xk+1 ] . (20.24)

La relación entre las diferencias divididas se muestra en la Tabla 20.5 para 5 puntos.
La columna D1 contiene las primeras diferencias divididas, la columna D2 las segundas
diferencias divididas, etcétera. Cada diferencia dividida es la diferencia de sus ‘progeni-
tores’ de la columna situada a su izquierda, dividida por la diferencia entre los valores
extremos de x.

Tabla 20.5 Tabla de interpolación por diferencias divididas


x y D1 D2 D3 D4
x0 y0
f [x0 , x1 ]
x1 y1 f [x0 , x1 , x2 ]
f [x1 , x2 ] f [x0 , x1 , x2 , x3 ]
x2 y2 f [x1 , x2 , x3 ] f [x0 , x1 , x2 , x3 , x4 ]
f [x2 , x3 ] f [x1 , x2 , x3 , x4 ]
x3 y3 f [x2 , x3 , x4 ]
f [x3 , x4 ]
x4 y4

EJEMPLO 20.8 Método de diferencias divididas de Newton para exp(x)

En las dos primeras columnas de la Tabla 20.6 se dan cinco puntos de la gráfica de ex . Las diferencias
divididas han sido calculadas con una calculadora estándar de 10 dı́gitos, y se dan con 8 decimales.

Tabla 20.6 Tabla de diferencias divididas para ex


x y D1 D2 D3 D4
0,80 2,22554093
2,27065125
0,84 2,31636698 1,15833750
2,36331825 0,39393233
0,88 2,41089971 1,20560938 0,10058544
2,45976700 0,41002600
0,92 2,50929039 1,25481250
2,56015200
0,96 2,61169647
516 Capı́tulo 20. Métodos numéricos

Usando los números que aparecen en negrita en la tabla,

p1 (x) = 2,22554093 + 2,27065125(x − 0,8) para 0,80 < x < 0,84 ,


p2 (x) = p1 (x) + 1,15833750(x − 0,8)(x − 0,84) 0,80 < x < 0,88 ,
p3 (x) = p2 (x) + 0,39393233(x − 0,8)(x − 0,84)(x − 0,88) 0,80 < x < 0,92 ,
p4 (x) = p3 (x) + 0,10058544(x − 0,8)(x − 0,84)(x − 0,88)(x − 0,92) 0,80 < x < 0,96 .

Para x = 0,832 las sucesivas aproximaciones para e0,832 son

p1 (x) = 2,29820177 , p2 (x) = 2,29790524 , p3 (x) = 2,29791008 , p4 (x) = 2,29790997 ,

y todas las cifras que se dan de p4 (x) son exactas (véanse los Ejemplos 20.6 y 20.7).

Si bien en este ejemplo las xi están espaciadas regularmente, la fórmula de Newton


(20.24) es válida para puntos espaciados irregularmente. Las implementaciones actuales
en ordenadores son básicamente adaptaciones del método de Newton que siguen el me-
jor camino dentro de una tabla de interpolación, como la Tabla 20.5, a fin de obtener la
mayor exactitud posible.

Interpolación con trazadores

Los Ejemplos 20.6 a 20.8 muestran que aumentar el grado de los polinomios inter-
poladores conduce a una mayor exactitud para ex , pero eso no es necesariamente cierto
si los nodos presentan máximos y mı́nimos como en la Figura 10.5. En la Figura 20.7 se
presenta el resultado de ajustar el polinomio de grado (máximo) 8 para que pase por los 9
puntos de la Tabla 20.4. Esto muestra que aumentar el grado n de los polinomios interpo-
ladores puede producir oscilaciones espurias entre los nodos, y esas oscilaciones pueden
aumentar de amplitud indefinidamente al aumentar n. La interpolación debe restringirse
por lo tanto en general a polinomios de grado bajo (no mayor de 4 o 5), pero la Figura
20.6 muestra que, en los casos desfavorables, esas interpolaciones pueden adolecer de
fuertes discontinuidades de la derivada en los nodos.

Figura 20.7 Figura 20.8


20.4. Interpolación 517

Ambos inconvenientes se evitan con el método de los trazadores4 (splines). Se trata


de una interpolación polinómica a trozos, pero escogiendo el polinomio en el intervalo
entre cada par de nodos para que la función de interpolación global sea regular en los
nodos; es decir, con derivadas primera, segunda (y quizá de órdenes superiores) conti-
nuas en los nodos. En el procedimiento más sencillo y más usado, la interpolación con
trazadores cúbicos, la función entre cada par de nodos se aproxima por una función
cúbica. Para el intervalo j-ésimo, entre (xj , yj ) y (xj+1 , yj+1 ), la función cúbica fj (x) puede
expresarse como

fj (x) = aj + bj (x − xj ) + cj (x − xj ) + dj (x − xj ) .
2 3
(20.25)

Por otra parte en los nodos tenemos

fj (xj ) = yj , fj (xj+1 ) = yj+1 . (20.26)

Para que las derivadas primeras sean continuas en los nodos, la derivada fj (x) tiene que
relacionarse con las derivadas de las funciones cúbicas en los intervalos adyacentes me-
diante

fj (xj ) = fj−1



(xj ) , fj (xj+1 ) = fj+1

(xj+1 ) . (20.27)

Lo mismo ocurre para las derivadas segundas,

fj (xj ) = fj−1



(xj ) , fj (xj+1 ) = fj+1

(xj+1 ) . (20.28)

Vamos a considerar el caso particular de nodos espaciados regularmente, con xj+1 −xj = h
(para todo j = 0 hasta n con (n+1) nodos). Entonces, si denotamos por kj la derivada en el
nodo j, los tres conjuntos de condiciones (20.26) a (20.28) dan las siguientes expresiones
para los coeficientes de la función cúbica de (20.25):

aj = yj , bj = kj ,
3 1
cj = 2 (yj+1 − yj ) − (kj+1 + 2kj ) , (20.29)
h h
2 1
dj = 3 (yj − yj+1 ) + 2 (kj+1 + kj ) ,
h h
y la relación de recurrencia para las derivadas,

3
kj−1 + 4kj + kj+1 = (yj+1 − yj−1 ) . (20.30)
h

04. Los trazadores, ‘splines’ en inglés, son varillas de madera flexibles usadas durante mucho tiempo
por delineantes, ingenieros y carpinteros de ribera para dibujar curvas regulares pasando por unos puntos
dados. El método numérico fue descrito por I. J. Schoenberg en 1946.
518 Capı́tulo 20. Métodos numéricos

Estas relaciones son suficientes para determinar las funciones de interpolación cúbicas
para todos los intervalos interiores (j = 1 a n). Para los intervalos extremos es necesario
especificar además las pendientes k0 y kn . Si se escogen mediante las condiciones en los
extremos

f0 (x0 ) = fn (xn ) = 0 (20.31)

los trazadores cúbicos se llaman trazadores naturales, y dan un comportamiento apro-


ximadamente lineal en los extremos. Este comportamiento se puede cambiar haciendo
otra elección.
En todos los lenguajes comunes de programación de ordenadores hay programas para
interpolar con trazadores cúbicos, y se usan ampliamente para representar datos experi-
mentales y resultados de estudios numéricos en las ciencias fı́sicas y en ingenierı́a. En la
Figura 20.8 se presenta el resultado de interpolar con trazadores naturales los puntos de
la Tabla 20.4. Esto muestra que el ajuste de una curva con trazadores da como resultado
una curva continua que sigue de cerca los segmentos de recta de la interpolación lineal
a trozos. Esto no garantiza sin embargo que la curva calculada sea una representación
fidedigna de la función que nos proporciona los nodos. Ası́ por ejemplo, en este caso los
puntos de la Tabla 20.4 se han calculado con la función f (x) = 1 − (x − 1)2 (x − 3) sen πx,
que tiene muchos máximos y mı́nimos locales. El ajuste ‘poco realista’ realizado con el
polinomio de grado 8 que se muestra en la Figura 20.7 es de hecho una representación
bastante buena de la función, mientras que el ajuste que se obtiene con los trazadores es
tan bueno como lo permite el pobre muestreo de puntos tomado. *

20.5. Integración numérica

La integración (o cuadratura) numérica consiste en evaluar numéricamente la integral


 b

I= f (x) dx (20.32)
a

cuando el integrando f (x) viene dado por una tabla de números o cuando la integral no se
puede evaluar con los métodos descritos en los Capı́tulos 5 y 6 mediante un número finito
de funciones estándar. El problema, geométricamente, consiste en estimar el área bajo
la curva. El método estándar es sustituir la función f (x) por una función diferente que
se pueda integrar, y una manera es usar las fórmulas de interpolación que hemos tratado
en el apartado anterior. Esto da lugar a la familia de métodos de integración numérica
llamados cuadraturas de Newton–Cotes, de las cuales la regla del trapecio y la regla
de Simpson son los ejemplos más sencillos.5

0* Garbage in. Garbage out ! (Anónimo), es decir: “se empieza con basura ¡se acaba con basura!”
05. Las fórmulas de Newton–Cotes aparecieron por primera vez en la carta de Newton a Leibniz del
24 de octubre de 1676 y en los Principia, aunque algunos ejemplos particulares eran conocidos desde mucho
antes. Fueron incluidos en la recopilación de las obras de Cotes, la Harmonia mensurarum, publicada
20.5. Integración numérica 519

La regla del trapecio. Interpolación lineal

La estimación más sencilla de la integral (el área) I se obtiene dividiendo el intervalo


a ≤ x ≤ b en n subintervalos iguales cada uno de longitud h = (b−a)/n, y aproximando
el integrando por interpolación lineal a trozos; esto es, uniendo los correspondientes
puntos adyacentes de la gráfica mediante rectas como se muestra en la Figura 20.9.

Figura 20.9

El área del trapecio entre xj y xj+1 es (fj + fj+1 ) h/2, y el área total es
 b

1 1
f (x) dx ≈ T(h) = h f0 + f1 + f2 + · · · + fn−1 + fn . (20.33)
a 2 2

Para un integrando continuo y derivable en el intervalo a ≤ x ≤ b, puede demostrarse


que el error de esta expresión es
 b
b − a 2 
f (x) dx − T(h) =  = − h f (c) , (20.34)
a 12

donde f  (c) es la derivada segunda de la función en algún punto x = c del intervalo.


De manera alternativa, si h es suficientemente pequeño, el error puede aproximarse por
(véase la fórmula de Euler–MacLaurin (20.37) más abajo)

1 2 
≈− h [fn − f0 ] , (20.35)
12
donde f0 y fn son las derivadas de f (x) en los puntos extremos. Se deduce que dividir
h por la mitad (o doblar el número de subintervalos n) disminuye el error en un factor
cuatro.

póstumamente en 1722. Roger Cotes (1682–1716), matemático de Cambridge, dedicó gran parte de los
años entre 1709 y 1713 a preparar la segunda edición de los Principia. Sus trabajos incluyen una de las
primeras exposiciones del cálculo de logaritmos y de funciones trigonométricas, con tablas de integrales.
520 Capı́tulo 20. Métodos numéricos


1,2 2
EJEMPLO 20.9 Estime la integral I = 0
xe−x dx usando la regla del trapecio (20.33) y la fórmula de
error (20.35) para n = 3,6 y 12.

Los valores pedidos se presentan en la siguiente tabla


2
Tabla 20.7 Valores de f (x) = xe−x
x 0,0 0,1 0,2 0,3 0,4 0,5 0,6
f (x) 0,000000 0,099005 0,192158 0,274179 0,340858 0,389400 0,418606
x 0,7 0,8 0,9 1,0 1,1 1,2
f (x) 0,428838 0,421834 0,400372 0,367879 0,328017 0,284313

Por ejemplo, para n = 3 tenemos entonces


h = 0,4 , f0 = 0 , f1 = 0,340858 , f2 = 0,421834 , f3 = 0,284313 ,
y
1
T(h) = 0,4[0 + 0,340858 + 0,421834 + × 0,284313] = 0,361939 .
2
2
La derivada del integrando es f  (x) = e−x 1 − 2x2 , de manera que f0 = f  (0) = 1 y fn = f  (1,2) =
−0,445424. Con esto  = 0,120452h . En la Tabla 20.8 se recogen los resultados.
2


1,2 2
Tabla 20.8 Valores de I = 0 xe−x dx
n 3 6 12
T(h) 0,361939 0,376698 0,380330
 0,019272 0,004818 0,001205
T(h) +  0,381211 0,381516 0,381535


El valor exacto de la integral es 1
2
1 − e−1,44 = 0,381536.

Regla de Simpson. Interpolación cuártica

La regla de Simpson es uno de los métodos de integración sencillos más aceptados


desde hace más de dos siglos.6 Se obtiene dividiendo el intervalo a ≤ x ≤ b en un

06. Thomas Simpson (1710–1761), profesor de matemáticas en la Royal Military Academy de Wool-
wich, era un matemático autodidacta. Fue educado como tejedor y en 1735 se unió a la Mathematical
Society de Spitalfields, una comunidad de tejedores en la cual era obligación de cada miembro ‘si le fuese
preguntada cualquier cuestión matemática o filosófica por otro miembro, instruirle en la manera más senci-
lla y directa de la que sea capaz’. La regla que lleva su nombre apareció en sus Mathematical dissertations
on a variety of physical and analytical subjects (Disertaciones matemáticas sobre una variedad de temas
fı́sicos y analı́ticos) de 1743, pero ya habı́a aparecido antes en los trabajos de Cavalieri (1639) y Gregory
(1668).
20.5. Integración numérica 521

número par de subintervalos, 2n, cada uno de longitud h = (b − a)/2n, y aproximando


el integrando por interpolación cuadrática a trozos. Entonces
 b
h
f (x) dx ≈ [f0 + 4f1 + 2f2 + 4f3 + 2f4 + · · · + 4f2n−1 + f2n ] (20.36)
a 3

o bien
 b
h    
f (x) dx ≈ (extremos) + 4 (puntos impares) + 2 (puntos pares) .
a 3

El error de la regla de Simpson va como h4 si h es pequeño, de manera que dividir h


por la mitad (o doblar el número de subintervalos n) disminuye el error en un factor
dieciséis. La regla de Simpson converge por lo tanto habitualmente mucho más rápido
que la regla del trapecio (sin corregir).


1,2 2
EJEMPLO 20.10 Estime la integral I = 0
xe−x dx usando la regla de Simpson (20.36) para n = 2, 4, 6
y 12.

Utilizamos los valores del integrando de la Tabla 20.7 y construimos la Tabla 20.9.

1,2 2
Tabla 20.9 Regla de Simpson para I = 0
xe−x dx

j xj f (xj ) 2n = 2 2n = 4 2n = 6 2n = 12

0 0,0 0,000000 ×1 ×1 ×1 ×1
1 0,1 0,099005 ×4
2 0,2 0,192158 ×4 ×2
3 0,3 0,274179 ×4 ×4
4 0,4 0,340858 ×2 ×2
5 0,5 0,389400 ×4
6 0,6 0,418606 ×4 ×2 ×4 ×2
7 0,7 0,428838 ×4
8 0,8 0,421834 ×2 ×2
9 0,9 0,400372 ×4 ×4
10 1,0 0,367879 ×4 ×2
11 1,1 0,328017 ×4
12 1,2 0,284313 ×1 ×1 ×1 ×1

Totales 1,958737 3,819729 5,724269 11,446227


h
× =I 0,391747 0,381973 0,381618 0,381541
3

El valor exacto es 0,381536 , y la regla de Simpson es suficientemente exacta para muchas aplicaciones,
incluso sin corrección.
522 Capı́tulo 20. Métodos numéricos

Fórmula de Euler–MacLaurin

Si el integrando f (x) puede desarrollarse en serie de Taylor en el intervalo a ≤ x ≤ b,


la expresión aproximada de la regla del trapecio (20.33) puede ser sustituida por la
fórmula de Euler–MacLaurin
 b 
1 1
f (x) dx = h f0 + f1 + f2 + · · · + fn−1 + fn
a 2 2
2 4
h h h6
−B2 (fn − f0 ) − B4 (fn − f0 ) − B6 (fnv − f0v ) − · · · , (20.37)
2! 4! 6!
donde f0 , fn , f0 , fn , . . . son las derivadas de f (x) de orden impar evaluadas en los extre-
mos, y los números B2 = 16 , B4 = − 301 , B6 = 421 , . . . se llaman números de Bernoulli.
Si f (x) es un polinomio de grado n, el desarrollo en h2 se acaba tras un número finito de
términos ya que todas las derivadas de orden mayor que n son cero. La fórmula (20.37)
es entonces exacta. En otros casos, el desarrollo no suele ser una serie convergente para
todo valor de h porque los números de Bernoulli Bn , exceptuando los primeros, aumentan
rápidamente de magnitud al crecer n. Se trata en ese caso de un tipo especial de desarro-
llo llamado desarrollo asintótico y tiene la propiedad de que si se trunca en cualquier
punto el error es menor que la magnitud del último término incluido.
Aparte de su aplicación al análisis del error en integración numérica, la fórmula de
Euler–MacLaurin tiene algunas aplicaciones directas en las ciencias fı́sicas. La usamos
en los siguientes ejemplos para deducir dos resultados importantes en termodinámica
estadı́stica.

EJEMPLO 20.11 La función de partición rotacional del rotor rı́gido lineal

Los niveles de energı́a del rotor rı́gido lineal son


J(J + 1)h2
EJ = , J = 0, 1, 2, 3, . . .
8π 2 I
con degeneraciones gJ = 2J + 1, siendo J el número cuántico rotacional e I el momento de inercia. La
función de partición rotacional es entonces

∞ 

q= gJ e−EJ /kT = (2J + 1) e−J(J+1)θ/T ,
J=0 J=0

donde θ = h2 /8π 2 Ik se denomina temperatura rotacional.


Si f (J) = (2J + 1) e−J(J+1)θ/T , la fórmula de Euler–MacLaurin nos da (con a = 0, b → ∞ y h = 1 en
(20.37))
 ∞  ∞
1
q= f (J) = f (J) dJ + [f (0) + f (∞)]
J=0 0 2
1  1 
+ [f (∞) − f  (0)] − [f (∞) − f  (0)] + · · · .
12 720
La integral se evalúa mediante el cambio u = J(J + 1), dando
 ∞  ∞
T
(2J + 1) e−J(J+1)θ/T dJ = e−uθ/T du = .
0 0 θ
20.5. Integración numérica 523

Por otra parte, f (J) y todas sus derivadas tienden a cero cuando J → ∞, y los valores en J = 0 pueden
obtenerse del desarrollo de f (J) en serie de potencias de J,
     
θ 3θ θ2 2θ 2θ 2 θ3
f (J) = 1 + 2 − J+ – + 2 J2 + – + 2 − 3 J3 + · · ·
T T 2T T T 6T

Tenemos que f (0) = 1, f  (0) = 2 − θ/T, f  (0) = −12θ/T + 12θ 2 /T 2 − θ 3 /T 3 , y todas las derivadas en
J = 0 son de orden (θ/T)2 o superior. Con esto
   2
T 1 1 θ θ
q= + + + términos en y superiores. (20.38)
θ 3 15 T T

El valor más grande de θ para una molécula es θ = 87,5 K para H2 pero la mayorı́a de las moléculas tienen
temperaturas rotacionales próximas a 0 K. En esos casos T/θ >> 1, de manera que el primer término del
segundo miembro de (20.38) es con mucho el mayor, y es la función de partición rotacional que se usa
normalmente en quı́mica (después de corregirla para la simetrı́a).

EJEMPLO 20.12 Aproximación de Stirling de ln (n!)

La cantidad ln (n!), siendo n un entero, aparece en la teorı́a de la probabilidad y se usa en termodinámica


estadı́stica con n igual al número de partı́culas en un mol, es decir, con n ≈ 1023 . La aproximación de
Stirling del logaritmo del factorial de un número muy grande, ln (n!) ≈ n ln n − n, se puede deducir de la
fórmula de Euler–MacLaurin. Tomamos f (x) = ln x. Entonces

ln (n!) = ln 1 + ln 2 + · · · + ln n
 n
1 1
= ln x dx + [f (n) + f (1)] + [f  (n) − f  (1)] + · · ·
1 2 12
 
1 1 1
≈ [x ln x − x]n1 + ( ln n + ln 1) + −1
2 12 n
≈ n ln n − n si n >> 1 .

Un tratamiento más completo da


1 1 1 1
ln (n!) ≈ n ln n − n + ln 2πn + − + .
2 12n 360n3 1260n5

Cuadratura gaussiana

Todas las fórmulas de integración numérica son de la forma


 b 
n

f (x) dx ≈ wi f (xi ) (20.39)


a i=1

y suponen evaluar el integrando en n puntos x1 , x2 , . . . , xn , con coeficientes, o pesos


de Gauss, wi determinados por el tipo de fórmula de integración. En las fórmulas de
Newton–Cotes vistas previamente los puntos se toman igualmente espaciados. En las
524 Capı́tulo 20. Métodos numéricos

fórmulas de cuadratura gaussiana los puntos se escogen a fin de obtener la mayor exac-
titud posible para una fórmula de integración dada, y no están igualmente espaciados.7
Existen distintas fórmulas de cuadratura gaussiana apropiadas para diversos tipos
de integrandos. La más sencilla es la fórmula de Gauss–Legendre (o, sencillamente,
gaussiana)
 +1 
n

f (x) dx ≈ wi f (xi ) (20.40)


−1 i=1

donde los puntos xi son los ceros de los polinomios de Legendre Pn (x). Los pesos wi
se escogen para que la fórmula sea exacta si f (x) es un polinomio de grado 2n − 1.
Existen tablas de los pesos y de los puntos con muchas cifras significativas (por lo menos
15) para muchos valores de n (por lo menos hasta 100), y la fórmula puede dar mucha
exactitud para integrales que se puedan escribir en la forma dada por (20.40). Cualquier
integral con intervalo de integración finito desde a hasta b puede transformarse en una
con intervalo desde −1 hasta +1 cambiando la variable a u dada por x = 12 [(b − a)u +
(a + b)].

 1,2 2
EJEMPLO 20.13 Cuadratura de Gauss–Legendre para I = xe−x dx.
0

Cambiando la variable de integración a u, dada por x = 0,6(1 + u), obtenemos


 +1 
n 
2 2
I = 0,36 (1 + u)e−0,36(1+u) du ≈ wi 0,36(1 + ui )e−0,36(1+ui ) .
−1 i=1

Los parámetros de Gauss–Legendre para n = 4 son (con 8 cifras)

u1 = −u4 = −0,86113631 , w1 = w4 = 0,34785485 ,

u2 = −u3 = −0,33998104 , w2 = w3 = 0,65214515 .


Con esto I ≈ 0,381532. El valor exacto es 0,381536, y la integración de Gauss–Legendre con 4 puntos es
más exacta que la regla de Simpson con 12 intervalos.

Existen otras fórmulas de cuadratura gaussiana con expresión más general


 b 
n

f (x)W(x) dx ≈ wi f (xi ) (20.41)


a i=1

07. Gauss presentó su nuevo método en Methodus nova integralium valores per approximationem
inveniendi en 1816.
20.7. Eliminación gaussiana para la resolución de ecuaciones lineales 525

para toda una variedad de funciones peso W(x) en el integrando y también para integrales
infinitas. Las más importantes son
 +1 n
1
Gauss–Chebyshev : f (x) √ dx ≈ wi f (xi ) .
−1 1 − x2
 ∞ i=1
n

Gauss–Laguerre : f (x)e−x dx ≈ wi f (xi ) .


0
 +∞
i=1

n

f (x)e−x dx ≈ wi f (xi ) .
2
Gauss–Hermite :
−∞ i=1

Las fórmulas de cuadratura gaussiana se usan en aplicaciones donde se necesita mucha


exactitud, por ejemplo en quı́mica cuántica.

20.6. Métodos de álgebra lineal

Los problemas del álgebra lineal son los asociados con sistemas de ecuaciones linea-
les, como los descritos en los Capı́tulos 17, 18 y 19:

(a) Resolución de sistemas de ecuaciones lineales simultáneas, o de la ecuación ma-


tricial equivalente Ax = b para el vector incógnita x, siendo A una matriz de
coeficientes dada y b un vector conocido.
(b) Cálculo del determinante de una matriz cuadrada A.
(c) Cálculo de la matriz inversa A−1 de una matriz cuadrada A.
(d) Resolución del problema de autovalores Ax = λx para una matriz cuadrada A.

20.7. Eliminación gaussiana para la resolución de


ecuaciones lineales

El método de eliminación gaussiana es la formalización del método elemental de re-


solución de sistemas de ecuaciones lineales simultáneas. Sean las tres ecuaciones con
tres incógnitas8 (véase también el Ejemplo 2.33)

(1) x + 2y + 3z = 26 ,
(2) 2x + 3y + z = 34 , (20.42)
(3) 3x + 2y + z = 39 .

08. Estas ecuaciones aparecen en particular en un problema sobre medidas de grano en el Capı́tulo 8
del Jiuzhang suanshu, y son resueltas por un método básicamente equivalente a la eliminación gaussiana.
Gauss presentó su método en la Theoria motus corporum celestium (Teorı́a del movimiento de los cuerpos
celestes) de 1809.
526 Capı́tulo 20. Métodos numéricos

El método actúa siguiendo una serie de pasos.


Paso 1. Eliminación de x
La ecuación (1) se llama ecuación pivote y el término en x se llama pivote de este paso.
Se consigue eliminar x de todas las ecuaciones que siguen restando múltiplos adecuados
de (1). Ası́ por ejemplo, restando 2 × (1) a (2) y 3 × (1) a (3) obtenemos el nuevo sistema
de ecuaciones
(1) x + 2y + 3z = 26 ,
(2 ) −y − 5z = −18 , (20.43)
(3 ) −4y − 8z = −39 .

Paso 2. Eliminación de y
La ecuación (2 ) es la nueva ecuación pivote y se elimina y de las ecuaciones que siguen
restando múltiplos adecuados de (2 ). En este caso restando 4 × (2 ) a (3 ) nos da

(1) x + 2y + 3z = 26 ,
(2 ) −y − 5z = −18 , (20.44)
(3 ) 12z = 33 .

Estas ecuaciones están en forma triangular o escalonada y la resolución se completa


con la sustitución hacia arriba.
Paso 3. Sustitución hacia arriba
Las ecuaciones (20.44) se resuelven en orden inverso. La ecuación (3 ) nos da z = 11/4,
sustituyendo esto en (2 ) obtenemos y = 17/4 y sustituyendo y y z en (1) tenemos
x = 37/4. El siguiente ejemplo muestra que la eliminación gaussiana se aplica a cual-
quier sistema de ecuaciones lineales, incluso si no hay una única solución o si no hay
soluciones.

EJEMPLO 20.14 Use la eliminación gaussiana para resolver las ecuaciones (véase el Apartado 17.4)

(1) 2x + 2y + z = 10 ,
(2) x + 2y − 2z = −3 ,
(3) 3x + 2y + 4z = λ ,
siendo λ un número.
Paso 1. Restamos 1
2
× (1) a (2) y 3
2
× (1) a (3):

(1) 2x + 2y + z = 10 ,
5
(2 ) y − z = −8 ,
2
5
(3 ) −y + z = λ − 15 .
2
20.7. Eliminación gaussiana para la resolución de ecuaciones lineales 527

Paso 2. Restamos −(2 ) a (3 ):


(1) 2x + 2y + z = 10 ,
 5
(2 ) y − z = −8 ,
2
(3 ) 0 = λ − 23 .

Si λ = 23, la ecuación (3 ) es redundante, y la sustitución hacia arriba nos da y = 5z/2 − 8 y x = 13 − 3z.
Como z queda arbitrario, tenemos infinitas soluciones, una por cada valor de z posible. Por otra parte no
hay soluciones si λ = 23.

Pivotes

El método de eliminación implica restar repetidas veces un múltiplo de una ecua-


ción a otra y puede conducir a errores graves al restar. Por ejemplo, la solución de las
ecuaciones
(1) 0,0003x1 + 2,513x2 = 7,545
(20.45)
(2) 0,7003x1 − 2,613x2 = 6,167

es x1 = 20, x2 = 3. Para resolverlas por el método de eliminación, escogemos (1) como


ecuación pivote y eliminamos x1 de (2) restando (0,7003/0,0003)×(1) a (2). Si el cálculo
se realiza, por ejemplo, usando aritmética de 4 cifras, entonces 0,7003/0,0003 = 2334
y la segunda ecuación se transforma en

(2 ) − 5868x2 = −17600 .

Se obtiene entonces x2 = 2,999, y la ecuación (1) da x1 = 28,38. Un error pequeño en x2


nos ha conducido a un error grande en x1 porque el coeficiente de x1 en la ecuación (1)
es pequeño comparado con el de (2). Los errores al restar que han aparecido se pueden
evitar si se toma la ecuación (2) como ecuación pivote. En ese caso, multiplicar (2) por
0,0003/0,7003 = 0,0004284 y restárselo a (1) da

(1 ) − 2,514x2 = −7,542

de manera que x2 = 3,000. Sustituyéndolo en (2) obtenemos entonces x1 = 20,00.


La elección de la ecuación (2) como ecuación pivote es un ejemplo de pivote parcial, es
decir, se escoge la ecuación pivote del primer paso como la ecuación con el coeficiente
de x1 de mayor magnitud. Igualmente para x2 en el segundo paso, etcétera.
Sin embargo el pivote parcial, equivalente a reordenar las ecuaciones, no es siempre
suficiente. Por ejemplo, podemos escribir las ecuaciones (20.45) con (1) multiplicado
por algún número grande, digamos que 3000:

(1) 0,9000x1 + 7539x2 = 22640


(20.46)
(2) 0,7003x1 − 2,613x2 = 6,167 .
528 Capı́tulo 20. Métodos numéricos

El coeficiente de x1 en (1) es ahora el mayor, pero elegir (1) como ecuación pivote vuel-
ve a dar un resultado malo (aunque distinto). El procedimiento correcto, llamado pivo-
te parcial escalado, consiste en tomar como ecuación pivote del primer paso aquella
ecuación para la cual la razón del coeficiente de x1 con el mayor de los demás coefi-
cientes es de mayor magnitud. Esa razón es 0,9000/7539 ≈ 0,0001 en la ecuación (1)
y 0,7003/2,613 ≈ 0,3 en la ecuación (2). Hay que elegir por lo tanto la segunda como
ecuación pivote. Igualmente para x2 en el paso 2, y ası́ sucesivamente. Un refinamiento
adicional, llamado pivote total, consiste en buscar el mayor coeficiente relativo de todas
las variables en cada paso, pero no suele ser normalmente necesario.

Método de eliminación para calcular determinantes

Puede reducirse un determinante a forma triangular con la primera parte del méto-
do de eliminación de Gauss. El valor del determinante es entonces el producto de los
elementos diagonales de la forma triangular, como vimos en el Apartado 17.6

20.8. Método de eliminación de Gauss–Jordan para la inversa de


una matriz

La inversa A−1 de una matriz no singular A de orden n cumple la ecuación matricial

AA−1 = I . (20.47)

Podemos escribir

A−1 = ( x1 x2 x3 . . . xn ) , I = ( e1 e2 e3 · · · en ) ,

siendo xk el vector columna formado con los elementos de la columna k de A−1 , y ek


está formado con la columna k de la matriz identidad I. La ecuación matricial (20.47) es
por lo tanto igual a las n ecuaciones

Axk = ek (k = 1, 2, . . . , n) (20.48)

cada una de las cuales representa un sistema de n ecuaciones lineales simultáneas, y


puede ser resuelta por lo tanto por eliminación gaussiana. La manera sistemática de
hacer esto se llama eliminación de Gauss–Jordan, donde la matriz ampliada

( A | I ) se transforma en I | A−1 mediante el proceso en dos etapas ilustrado en el
siguiente ejemplo.9

09. Wilhelm Jordan (1842–1899), geodesta alemán.


20.9. Ecuaciones diferenciales de primer orden 529

EJEMPLO 20.15 Eliminación de Gauss–Jordan para la inversa de


⎛ ⎞
1 2 3
A = ⎝−2 1 2 ⎠.
3 −1 −1

La matriz ampliada del problema es


⎛ ⎞
1 2 3 1 0 0
( A | I ) = ⎝−2 1 2 0 1 0 ⎠.
3 −1 −1 0 0 1

La primera etapa consiste en reducir A a forma triangular superior usando eliminación gaussiana:
⎛ ⎞
 1 2 3 1 0 0
fila 2 + 2 × fila 1 ⎝ 0
fila 3 − 3 × fila 1
−→ 5 8 2 1 0 ⎠
0 −7 −10 −3 0 1
⎛ ⎞
 1 2 3 1 0 0
7 ⎜ 0 2 1 0 ⎟
fila 3 + × fila 2 −→ ⎝ 5 8 ⎠.
5
0 0 6
5
− 15 75 1

La segunda etapa es reducir la mitad izquierda de la matriz ampliada a forma diagonal con pasos adicionales
de eliminación:

⎡ ⎤ ⎛ ⎞
5 1 2 0 3
2
− 72 − 52
× fila 3
fila 1 − ⎜ ⎟
⎢ 2 ⎥ ⎜ 0 10
− 25 − 20 ⎟
⎣ ⎦ −→ ⎝
5 0 3 3 3 ⎠
20
fila 2 − × fila 3
3 0 0 6
5
− 15 7
5
1
⎛ ⎞
 1 0 0 1
6
− 16 1
6
2 ⎜ ⎟
fila 1 − × fila 2 −→ ⎜ 0 5 0 10
− 25 − 20 ⎟
3 ⎠ .
5 ⎝ 3 3

0 0 6
5
− 15 7
5
1

La mitad izquierda se reduce a la matriz identidad dividiendo la fila 2 por 5 y la fila 3 por 65 . Tenemos
entonces
⎛ 1 ⎞
1 0 0 1
− 16
⎟  
6 6

⎜ 0 1 0 2
− 53 − 43 ⎟ = I | A−1
⎝ 3 ⎠
0 0 1 − 16 7
6
5
6

y la mitad derecha de la matriz ampliada es la matriz inversa A−1 :


⎛ ⎞
1 ⎝ 1 −1 1
A−1 = 4 −10 −8 ⎠ , A−1 A = AA−1 = I .
6 −1 7 5
530 Capı́tulo 20. Métodos numéricos

20.9. Ecuaciones diferenciales de primer orden

Vimos en los Capı́tulos 11 a 14 que algunas ecuaciones diferenciales importantes


pueden resolverse por métodos analı́ticos dando soluciones expresadas mediante funcio-
nes conocidas. Sin embargo, muchas ecuaciones diferenciales no pueden ser resueltas
de esta forma, ya sea porque no existe un método adecuado o porque no hay soluciones
analı́ticas. Es necesario entonces utilizar métodos de resolución numéricos.
Una solución analı́tica es siempre mejor que una numérica. Por ejemplo, la solución
analı́tica puede ser evaluada para cualquier valor numérico de las variables independien-
tes, mientras que una solución numérica toma la forma de una tabla de valores para un
conjunto discreto fijo de valores de las variables. Una solución analı́tica contiene, en
general, uno o más parámetros arbitrarios cuyos valores pueden determinarse imponien-
do condiciones iniciales o de contorno. En un método numérico, los valores de esos
parámetros tienen que fijarse al principio, antes de que la solución pueda ser calculada.
Además, el comportamiento funcional de la solución puede revelar nuevos aspectos de
la naturaleza del problema fı́sico del cual la ecuación diferencial es un modelo.
Las ecuaciones diferenciales que vamos a tratar en este apartado tienen la forma
general

dy
y (x) = = f (x, y) . (20.49)
dx
Se demuestra en el Apartado 20.10 que una ecuación ordinaria de orden superior puede
siempre expresarse como un sistema de ecuaciones de primer orden simultáneas, y los
métodos numéricos para una ecuación se pueden aplicar también a esos sistemas.

Representación gráfica

2,0

1,5

1,0

0,5

0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0

y (x) = 2(x − 2y)/(x + y)

Figura 20.10
20.9. Ecuaciones diferenciales de primer orden 531

La ecuación (20.49) es una expresión de las dos variables x e y de forma que se define
un valor de y (x) en cada punto del plano xy. Una representación gráfica de la ecuación
diferencial se obtiene entonces representando el valor de y (x) en cada punto de una
malla en el plano por un segmento con pendiente f (x, y), como se ilustra en la Figura
20.10 para la ecuación y (x) = 2(x − 2y)/(x + y).
Un diagrama de este tipo se llama campo de direcciones. Una solución de la ecua-
ción diferencial tiene entonces una gráfica que es tangente a las lı́neas de dirección en
cada punto de la curva. En la figura se muestran las gráficas de tres soluciones: la su-
perior para la condición y(1) = 2, la del medio para y(0,25) = 0,5 y la inferior para
y(3) = 1.
Un método numérico para resolver una ecuación diferencial es equivalente a empezar
en un punto concreto en el campo de direcciones y seguir las lı́neas de campo. Se dispone
de varios métodos para resolver la mayorı́a de los tipos de ecuaciones diferenciales que
surgen en las ciencias fı́sicas, y la mayorı́a de ellos tienen su origen en desarrollos de
Taylor. Dado el valor y(x0 ) = y0 de la función y(x) en x = x0 , el valor en un punto
próximo x1 = x0 + h es

1
y(x1 ) = y(x0 ) + hy (x0 ) + h2 y (x0 ) + · · · (20.50)
2
o, puesto que por (20.49) y (x0 ) = f (x0 , y0 ),

1
y(x1 ) = y0 + hf (x0 , y0 ) + h2 y (x0 ) + · · ·
2
= y0 + hF0 , (20.51)

donde F0 es la pendiente de la recta que une los puntos 0 y 1 en la gráfica de y(x) (la
pendiente media de la curva). Los distintos métodos numéricos usan distintas maneras
de estimar esa pendiente, dando lugar a una relación de recurrencia

yn+1 = yn + hFn , (20.52)

siendo xn = x0 + nh e yn ≈ y(xn ). Consideramos en primer lugar el método más sencillo


posible, el método de Euler.

Método de Euler

El método de Euler consiste en truncar el desarrollo de Taylor después del segundo


término

y(x1 ) ≈ y(x0 ) + hy (x0 ) ,

de manera que se aproxima F0 por la pendiente en el punto inicial (x0 , y0 ). Un valor


aproximado de y(x1 ) es entonces
532 Capı́tulo 20. Métodos numéricos

y1 = y0 + hf (x0 , y0 ) (20.53)

y esto nos proporciona un procedimiento paso a paso


sencillo con el que se obtiene una solución aproximada
de la ecuación aplicando repetidas veces la recurrencia

yn+1 = yn + hf (xn , yn ) , n = 0, 1, 2, . . . , (20.54)

donde xn = x0 + nh e yn ≈ y(xn ). En cada paso la pen-


diente de la recta desde el punto n al punto (n + 1) es la
de la dirección del campo de direcciones en el punto n. Figura 20.11
El procedimiento se representa en la Figura 20.11.
Se dice que el método de Euler es de primer orden porque sólo nos hemos quedado
con la primera potencia de h en el desarrollo de Taylor. El error de truncación en cada
paso es por lo tanto de orden h2 , de manera que dividir el tamaño del paso h a la mitad
reduce el error en un factor 4. Sin embargo, el error acumulado (global) para una serie
de pasos es de orden h.

EJEMPLO 20.16 Dado el problema de valor inicial


y (x) = y + 1 , y(0) = 1 ,
use el método de Euler para obtener un valor aproximado de y(1) usando pasos con tamaños h = 0,2 y
h = 0,1.

En la Tabla 20.10 resumimos los resultados de aplicar la recurrencia


yn+1 = yn + h(yn + 1)
y los comparamos con los valores exactos obtenidos de la solución y(x) = 2ex − 1.

Tabla 20.10 Ejemplo del método de Euler


h n xn yn exacto error h n xn yn exacto error
0,2 0 0,0 1,0000 1,0000 0,0000 0,1 0 0,0 1,0000 1,0000 0,0000
1 0,1 1,2000 1,2103 0,0103
1 0,2 1,4000 1,4428 0,0428 2 0,2 1,4200 1,4428 0,0228
3 0,3 1,6620 1,6997 0,0377
2 0,4 1,8800 1,9836 0,1036 4 0,4 1,9282 1,9836 0,0554
5 0,5 2,2210 2,2974 0,0764
3 0,6 2,4560 2,6442 0,1882 6 0,6 2,5431 2,6442 0,1011
7 0,7 2,8974 3,0275 0,1301
4 0,8 3,1472 3,4511 0,3039 8 0,8 3,2872 3,4511 0,1639
9 0,9 3,7159 3,9192 0,2033
5 1,0 3,9766 4,4366 0,4599 10 1,0 4,1875 4,4366 0,2491

Los valores calculados de y(1) son 3,9766 con el paso h = 0,2 y 4,1875 con h = 0,1, comparados con
el valor exacto 4,4366. La tabla muestra que el error se reduce aproximadamente a la mitad, como es de
esperar en un método de primer orden.
20.9. Ecuaciones diferenciales de primer orden 533

La exactitud aumenta al disminuir el tamaño del paso, pero el mayor número de pasos
necesarios conduce a errores de redondeo mayores. En la práctica, los métodos usados
para resolver ecuaciones diferenciales son procedimientos que simulan el desarrollo de
Taylor hasta un orden alto en h, y los más sofisticados suponen el uso de pasos de tamaño
variable para controlar la acumulación de errores de redondeo y optimizar la convergen-
cia. La deducción y la justificación de esos métodos queda fuera del ámbito de este
libro y únicamente damos aquı́ una breve descripción de una familia de métodos muy
utilizada.

Métodos de Runge–Kutta

Los métodos de Runge–Kutta forman una familia de métodos de orden creciente,


con el método de primer orden de Euler como primer miembro.10 El método de Runge–
Kutta de segundo orden se obtiene sustityendo Fn en (20.52) por una estimación de la
pendiente a mitad de camino entre los puntos n y n + 1. Por el método de Euler, un valor
aproximado de y en el punto central es
h h
yn + f (xn , yn ) = yn + k1
2 2 (20.55a)

y una aproximación de la pendiente en el punto central es


 
h h
k2 = f xn + , yn + k1 .
2 2 (20.55b)

El valor estimado de y(xn+1 ) es entonces


yn+1 = yn + hk2 .
(20.55c)

El procedimiento representado por las ecuaciones (20.55) es de segundo orden en el paso h.


Uno de los métodos numéricos más ampliamente utilizados para resolver ecuaciones
diferenciales es el método de Runge–Kutta de cuarto orden, definido por el conjunto de
ecuaciones
 
h h
k1 = f (xn , yn ) , k2 = f xn + , yn + k1 ,
2 2
 
h h
k3 = f xn + , yn + k2 , k4 = f (xn + h, yn + hk3 ) , (20.56)
2 2
h
yn+1 = yn + [k1 + 2k2 + 2k3 + k4 ] .
6

010. Carl David Tolmé Runge (1856–1927) y Wilhelm Kutta (1867–1944), matemáticos alemanes,
publicaron estudios sistemáticos de métodos de ‘sustituciones sucesivas’ en 1895 (Runge) y 1901 (Kut-
ta). Ese trabajo ha sido seguido de muchas elaboraciones y extensiones para dar algunos de los métodos
modernos más ampliamente usados.
534 Capı́tulo 20. Métodos numéricos

EJEMPLO 20.17 Aplique los métodos de Runge–Kutta de órdenes 2 y 4 al problema de valor inicial del
Ejemplo 20.16, con paso h = 0,2.

En la Tabla 20.11 presentamos el resultado de aplicar las relaciones de recurrencia (20.55) para orden 2 y
(20.55) para orden 4.
Tabla 20.11 Ejemplo de métodos de Runge–Kutta
orden n xn yn exacto error orden n xn yn error
2 0 0,0 1,000000 1,000000 0,000000 4 0 0,0 1,000000 0,000000
1 0,2 1,440000 1,442806 0,002805 1 0,2 1,442800 0,000005
2 0,4 1,976800 1,983649 0,006849 2 0,4 1,983636 0,000013
3 0,6 2,631696 2,644238 0,012542 3 0,6 2,644213 0,000025
4 0,8 3,430669 3,451082 0,020413 4 0,8 3,451042 0,000040
5 1,0 4,405416 4,436563 0,031147 5 1,0 4,436502 0,000061

La tabla muestra que el método de segundo orden con paso h = 0,2 es ya considerablemente más exacto
que el método de Euler de primer orden con h = 0,1.

20.10. Sistemas de ecuaciones diferenciales

Un problema que implica ecuaciones de segundo orden o superior puede siempre


reducirse a otro que implique un sistema de ecuaciones de primer orden simultáneas.
Por ejemplo, la ecuación lineal general de segundo orden

d2 y dy
+ p(x) + q(x)y = r(x) (20.57)
dx 2
dx
puede escribirse como dos ecuaciones de primer orden

dy
=z
dx (20.58)
dz
= r(x) − p(x)z − q(x)y
dx
para las funciones de x, y(x) y z(x). Si (20.57) es la ecuación diferencial de un problema
de valor inicial con condiciones iniciales y(x0 ) = y0 e y (x0 ) = z(x0 ) = y1 , las ecuaciones
(20.58) son dos problemas de valor inicial (acoplados) de primer orden. El problema
general consiste en N problemas de valor inicial de primer orden para N funciones,
y1 (x), y2 (x), . . . , yN (x):

dyi
yi (x) = = fi (x, y1 , y2 , . . . , yN ) , i = 1, 2, . . . , N (20.59)
dx
con condiciones iniciales y1 (x0 ) = y0,1 , y2 (x0 ) = y0,2 , . . .
20.10. Sistemas de ecuaciones diferenciales 535

Estos sistemas de problemas de valor inicial de primer orden surgen en la cinética


quı́mica de reacciones con varias etapas, y son por lo tanto de interés considerable para
los quı́micos (los problemas de contorno son en general mucho más difı́ciles). Se resuel-
ven numéricamente mediante alguno de los métodos descritos en el Apartado 20.9 apli-
cado a las ecuaciones, una tras otra, en cada paso. Por ejemplo, para las dos ecuaciones

y (x) = f1 (x, y, z) , z (x) = f2 (x, y, z) , (20.60)

con condiciones iniciales y(x0 ) = y0 y z(x0 ) = z0 , el método de Euler conduce a la


secuencia recurrente de pasos

(1) y1 = y0 + hf1 (x0 , y0 , z0 ) , z1 = z0 + hf2 (x0 , y0 , z0 ) ,


(2) y2 = y1 + hf1 (x1 , y1 , z1 ) , z2 = z1 + hf2 (x1 , y1 , z1 ) ,
(3) y3 = y2 + hf1 (x2 , y2 , z2 ) , etcétera .

El procedimiento es básicamente el mismo que para una sola ecuación.

Ecuaciones rı́gidas

Una ecuación diferencial rı́gida es aquella cuya solución tiene términos que dependen
en la variable independiente de forma muy distinta. Por ejemplo, el problema de valor
inicial de segundo orden

d2 y
= 100y , y(0) = 1, y (0) = −10 , (20.61)
dx2
tiene solución general y = ae−10x + be+10x , siendo la solución particular y = e−10x . La
resolución numérica de la ecuación por alguno de los métodos presentados hasta ahora
da una solución que se comporta correctamente para valores de x próximos a x = 0
pero que ‘explota’ como e+10x a medida que x crece porque los errores de redondeo y de
truncación conducen inevitablemente a una pequeña mezcla con el término no deseado.
Es decir, la solución numérica es de la forma

y ≈ e−10x + e+10x (20.62)

con  no nulo.
Los problemas con ecuaciones rı́gidas aparecen en cinética si varios procesos ele-
mentales tiene constantes cinéticas muy distintas. Ası́ por ejemplo, el problema (20.61)
es equivalente a los dos problemas de primer orden

dy dz
= z, = 100y , (20.63)
dx dx
que pueden interpretarse como dos procesos cinéticos de primer orden con constantes
536 Capı́tulo 20. Métodos numéricos

cinéticas 1 y 100. Los problemas rı́gidos pueden a veces resolverse con un cambio de
variable, sin embargo existen métodos numéricos especiales para tratar estos problemas.

20.11. Ejercicios

Apartado 20.2

1. Exprese los siguientes números redondeados a (a) 3 cifras decimales, (b) 4 cifras significativas:
(i) 1,21271 (ii) 72,0304 (iii) 0,129914 (iv) 0,0024988

2. Halle la cota de error absoluto para cada respuesta del Ejercicio 1.

3. Halle la cota de error relativo para cada respuesta del Ejercicio 1.

4. Calcule los valores de las siguientes expresiones aritméticas. Suponiendo que todos los números de las
expresiones han sido redondeados correctamente, halle las cotas de error absoluto de sus respuestas:
(i) 2,137 + 3,152 + 4,672 (ii) 12,36 + 14,13 − 16,38 (iii) 22,7 × 2,59
(iv) 22,7/2,59 (v) (17,43 − 12,34)/14,38
√ √
5. (i) Calcule f (x) = x x + 1 − x con una calculadora de 10 dı́gitos (o similar) para x = 1, 102 , 104 ,
106 , 108 .
x
(ii) Demuestre que la función puede escribirse como f (x) = √ √ .
x+1+ x
Úselo para volver a calcular la función.

ex − e−x
6. (i) Calcule − 1 con una calculadora de 10 dı́gitos (o similar) para x = 1,10−2 , 10−4 , 10−6 .
2x
(ii) Use series de Taylor para hallar una expresión para la función que sea precisa para valores pequeños de
x. Vuelva a calcular con x = 10−2 , 10−4 , 10−6 .

Apartado 20.3
Halle una solución con 4 cifras significativas para las siguientes ecuaciones usando
(i) el método de bisección con los valores iniciales de x que se dan,
(ii) el método de Newton–Raphson empezando en cada caso con x0 = 1:
7. x2 − ln x = 2; 1,5, 1,6 8. e−x = tg x; 0,5, 0,6 9. x3 − 3x2 + 6x = 5; 1, 1,5

10. Para un polinomio de grado n, conocida una raı́z x1 , una segunda raı́z se puede obtener dividiendo
primero el polinomio por el factor (x − x1 ) para obtener un polinomio de grado n − 1. Demuestre que la raı́z
calculada para la ecuación cúbica del Ejercicio 9 es la única real.

Apartado 20.4
Seis puntos de la gráfica de una función y = f (x) vienen dados por los pares (x, y)
(0,0, 0,00000) (0,2, 0,19867) (0,4, 0,38942)
(0,6, 0,56464) (0,8, 0,71736) (1,0, 0,84147)

(la función es sen x).


20.11. Ejercicios 537

11. Use interpolación lineal para calcular f (0,04), f (0,26), f (0,5), f (0,81).

12. Use interpolación cuadrática para calcular f (0,04), f (0,26), f (0,81).

13. Construya la tabla de interpolación por diferencias divididas, y úsela para calcular f (0,26).

Apartado 20.5
 2,6
dx
14. Halle estimaciones de la integral usando la regla del trapecio (20.33) y la fórmula de error
x 1,0
(20.35), empezando con una banda (n = 1) y doblando el número de bandas (n = 2, 4, 8, . . .) hasta conse-
guir una precisión de 4 cifras.

15. Sabiendo que el error en la regla del trapecio T(h) es


 b
f (x) dx − T(h) = Ah2
a

si h es suficientemente pequeño, siendo A una constante, demuestre que


 b
1
f (x) dx ≈ [4T(h/2) − T(h)] .
a 3
Use esto para hallar un valor de la integral del Ejercicio 14 que tenga 5 cifras decimales correctas.

16. Use la regla de Simpson (20.36) con 2n = 2, 4, 8, . . . para hallar un valor de la integral del Ejercicio
14 con 4 cifras decimales.

17. El error de la regla de Simpson es Ah4 si h es suficientemente pequeño, siendo A una constante. Si
S(2n) es la fórmula de Simpson con 2n intervalos, demuestre que
 b
1
f (x) dx ≈ [16S(2n) − S(n)]
a 15
(extrapolación de Richardson). Use esto y el resultado del Ejercicio 16 con n = 8 para estimar un valor más
exacto de la integral. Compruebe su precisión comparándolo con el valor exacto (ln 2,6).

Use la regla de Simpson con 2n = 2, 4, 8, . . . para hallar valores con 5 cifras decimales de las siguientes
integrales:
 1  z
sen x sen x
18. dx Is(z) = dx es la integral de seno.
0 x 0 x
 2  z
2 2 2
19. e−x dx fer(z) = √ e−x dx es la función error.
0 π 0

Apartado 20.7
Resuelva los siguientes sistemas de ecuaciones por el método de eliminación gaussiana:
20. x1 − 4x2 = −2 21. 2x1 + x2 − x3 = 6
3x1 + x2 = 7 4x1 − x3 = 6
−8x1 + 2x2 + 2x3 = −8

22. x+ y+ z= 2 23. w + 2x + 3y + z = 5
−x + 2y − 3z = 32 2w + x + y + z = 3
3x − 4z = 17 w + 2x + y =4
x + y + 2z = 0
538 Capı́tulo 20. Métodos numéricos

24. Use eliminación gaussiana para hallar el valor de λ para el cual las siguientes ecuaciones tienen
solución. Resuelva las ecuaciones para ese valor de λ:
x+ y+ z= 2
−x + 2y − 3z = 32
3x + 5z = λ

25. Use eliminación gaussiana para resolver el siguiente sistema de ecuaciones


6,23x1 + 2,11x2 + 1,97x3 = −2,12
1,92x1 + 0,65x2 + 0,34x3 = 0,98
2,01x1 + 3,92x2 − 1,89x3 = 0,02

26. Repita el Ejercicio 25 usando aritmética de 4 cifras, redondeando a cuatro cifras significativas los
resultados de cada operación aritmética:
(i) sin pivote, (ii) con pivote parcial, (iii) con pivote parcial escalado.

Apartado 20.8
Halle la inversa de las matrices siguientes usando eliminación de Gauss–Jordan:
⎛ ⎞ ⎛ ⎞
−23 11 1 −1 1 2
27. ⎝ 11 −3 −2 ⎠ 28. ⎝ 3 −1 1 ⎠
1 −2 1 −1 3 4

29. Dado el sistema de ecuaciones


−x + y + 2z = b1
3x − y + z = b2
−x + 3y + 4z = b3
use el resultado del Ejercicio 28 para expresar x, y, y z en función de los números arbitrarios b1 , b2 y b3 .

Apartado 20.9
Nota: los siguientes ejercicios se pueden hacer usando una calculadora de bolsillo. Sin embargo los cálcu-
los son tediosos y se le aconseja escribir sus propios programas de ordenador para realizar el trabajo.

30. Aplique el método de Euler al problema de valor inicial


y (x) = −y(x), y(0) = 1,
con pasos (i) h = 0,2, (ii) h = 0,1, (iii) h = 0,05 para calcular valores aproximados de y(x) para x = 0,2 ,
0,4 , 0,6 , 0,8 , 1,0. Compárelos con los valores obtenidos con la solución exacta y = e−x .

31. Aplique el método de Runge–Kutta de segundo orden al problema de valor inicial del Ejercicio 30
con pasos (i) h = 0,2 y (ii) h = 0,1.

32. Aplique el método de Runge–Kutta de cuarto orden al problema de valor inicial del Ejercicio 30 con
pasos (i) h = 0,2 y (ii) h = 0,1.

Aplique el método de Euler con paso h = 0,1 a cada uno de los siguientes problemas de valor inicial para
calcular un valor aproximado de y(1). Compruebe la solución exacta que se da y calcule el error:
20.11. Ejercicios 539

33. y = 2 − 2y, y(0) = 0; y = 1 − e−2x

y2 1
34. y = , y(0) = 1; y=
x+1 1 − ln (x + 1)

y + x2 − 2
35. y = , y(0) = 2; y = x2 + 2x + 2 − 2(x + 1) ln (x + 1)
x+1

Aplique el método de Runge–Kutta de cuarto orden con paso h = 0,1 a los problemas de valor inicial de
los Ejercicios 33, 34 y 35 para calcular y(1) y el error:

36. Como en el Ejercicio 33 37. Como en el Ejercicio 34

38. Como en el Ejercicio 35


 Probabilidad y estadı́stica

La práctica de la estadı́stica, la recopilación y el análisis estadı́stico de datos, se ha


convertido en una actividad ubicua en la vida cotidiana, y el tema de una amplia litera-
tura. Podemos distinguir tres grandes áreas en la actividad estadı́stica:
(i) los problemas prácticos del diseño de experimentos y de la elección y recopilación
de muestras de datos adecuadas (‘buena práctica experimental’);
(ii) la descripción y presentación de los datos y su análisis en función de modelos
teóricos apropiados;
(iii) la utilización del análisis para extraer consecuencias sobre la naturaleza del sistema
investigado, la calidad del experimento y el método de obtención de datos.

Nuestra principal preocupación en este capı́tulo es dar una introducción a la teorı́a de


probabilidades, la teorı́a matemática de la estadı́stica.1 La teorı́a de probabilidades pro-
porciona los modelos teóricos y las herramientas analı́ticas para organizar, interpretar y
analizar datos estadı́sticos. La teorı́a de probabilidades tiene una importancia adicional
en quı́mica, por ejemplo, en la descripción del comportamiento colectivo de conjuntos
de muchas de partı́culas en mecánica estadı́stica, las descripciones mecánico-cuánticas
de cambios de estado y de procesos cinéticos, la interpretación fı́sica de las funciones de
onda, y la enumeración de las maneras de ensamblar las unidades quı́micas básicas para
formar moléculas largas, como en la construcción de polipéptidos a partir de residuos
de aminoácidos. La estadı́stica convencional (‘práctica’) está representada por breves
presentaciones de la estadı́stica descriptiva en el Apartado 20.1 y del método de mı́ni-
mos cuadrados en el Apartado 21.9. Existen varios textos especializados sobre el uso
de métodos estadı́sticos en las ciencias fı́sicas, y el lector puede consultar cualquiera de

01. La teorı́a de probabilidades tiene sus orı́genes en la adivinación y en los juegos de azar de tiempos
remotos y ha seguido siendo utilizada para esos propósitos hasta el dı́a de hoy. Oresme utilizó un argumento
probabilı́stico para concluir que la astrologı́a debı́a ser falsa. La teorı́a moderna surgió de la corresponden-
cia entre Pascal y Fermat en 1654 al hilo de las preguntas que sobre los resultados de lanzar dados le hizo a
Pascal el jugador de Méré. Pascal incluyó sus ideas en el Tratado del triángulo aritmético. Cardano habı́a
tratado anteriormente el lanzamiento de dados en su Liber de ludo aleae (Libro sobre los juegos de azar) de
1526, pero el primer estudio sistemático lo hizo Huygens en su De ratiociniis in aleae ludo (Cálculos en jue-
gos de azar) de 1657. El primer tratamiento sustancial de la teorı́a matemática de probabilidades fue el Ars
conjectandi (Arte de la conjetura) de Jakob Bernoulli publicado en 1713, en el cual se proponı́a también la
aplicación de las probabilidades a las ciencias sociales. De Moivre estudió la ley de errores y la distribución
normal en la segunda edición de Doctrine of chances (1718, 1738, 1756). Euler y d’Alembert escribieron
sobre problemas de esperanza de vida, seguros, loterı́as y otros temas. A la publicación en 1812 del trabajo
definitivo de Laplace Théorie analytique des probabilités (‘en el fondo, la teorı́a de probabilidades es sólo
sentido común en números’) siguió la aplicación extensa de los métodos estadı́sticos, especialmente en las
ciencias sociales.
542 Capı́tulo 21. Probabilidad y estadı́stica

ellos para un tratamiento en profundidad, y para apreciar en su justo valor la potencia y


la amplia variedad de aplicaciones de la estadı́stica en las ciencias, y en muchos otros
campos de estudio.

21.1. Estadı́stica descriptiva

La tabla 21.1 muestra un conjunto de 50 números que representan los resultados de


un experimento que consiste en contar sucesos.

Tabla 21.1 50 valores experimentales


4 6 7 3 6 3 5 7 6 6
3 4 4 5 8 6 5 2 6 5
7 7 4 4 3 0 8 5 4 4
6 2 8 2 7 6 5 5 5 4
9 5 2 2 9 3 6 5 7 4

Hemos obtenido estos valores simulando con un ordenador el experimento de lanzar


una moneda. Cada entrada es el número de caras obtenidas con 10 lanzamientos, pero
podrı́a ser igualmente el número de fallos por dı́a en un proceso industrial o el número
de partı́culas α emitidas cada segundo por una fuente radiactiva.
El primer paso en el análisis de los datos es determinar su estructura: gráficamen-
te mediante unas representaciones adecuadas y numéricamente calculando un número
pequeño de ‘estadı́sticos’, como el valor medio y la desviación tı́pica, que resumen las
propiedades básicas de los datos. En nuestro ejemplo, los resultados posibles del experi-
mento son los 11 enteros de 0 a 10, y el número de veces que se da cada uno de ellos se
denomina su frecuencia. La agrupación de esas frecuencias es la distribución de fre-
cuencias del experimento, y puede representarse tabulada como en la Tabla 21.2 o en un
diagrama de barras como en la Figura 21.1.

Tabla 21.2 10
9
Resultado Frecuencia
8
0 1 7
1 0 6
2 5 5
3 5
4 9 4
5 10 3
6 9 2
7 6 1
8 3
9 2 0 1 2 3 4 5 6 7 8 9 10
10 0

Figura 21.1
21.1. Estadı́stica descriptiva 543

La distribución anterior es una distribución de frecuencias discreta porque los resultados


posibles del experimento toman valores discretos. Sin embargo, muchos experimentos
implican medidas en lugar de recuentos. Los resultados pueden tomar entonces cual-
quier valor dentro de un rango continuo, dando lugar a una distribución de frecuencias
continua. En la Tabla 21.3 mostramos un conjunto de 50 resultados de un experimento
de ese tipo, que pueden representar, por ejemplo, la estatura (en unidades adecuadas)
de una muestra de la población, los pesos de una muestra de productos manufacturados
o los resultados de medidas de una cantidad fı́sica, como una constante cinética o una
constante de equilibrio.

Tabla 21.3 50 valores experimentales


40,6 44,9 47,1 39,5 45,3 38,9 42,9 47,0 45,0 44,2
39,3 40,7 48,4 43,1 48,9 44,9 43,2 37,1 45,3 42,7
47,5 46,5 40,9 40,5 38,9 33,3 49,1 43,7 41,3 41,3
45,3 36,9 49,3 37,3 47,2 44,3 42,9 43,4 43,1 41,1
51,1 43,3 37,9 36,9 53,2 39,3 45,7 42,7 47,1 46,8

Este tipo de información se simplifica dividiendo el rango que contiene todos los valores
de la muestra en un número adecuado de intervalos, llamados intervalos de clase o
grupos, y asignando los valores de la muestra a las clases correspondientes. El número
de valores en cada clase se llama frecuencia de clase. En nuestro ejemplo el menor
valor y el mayor son respectivamente 33,3 y 53,2 , de manera que todos los valores están
entre 32,0 y 54,0 por ejemplo, y esto se divide de manera conveniente en 11 intervalos
de clase, cada uno con ancho 2,0 . Un valor que cae en la frontera de la clase se asigna
a la clase superior. La distribución de frecuencias que resulta se representa en la Figura
21.2 por un histograma de frecuencias y en la Figura 21.3 por un gráfico de frecuencia
acumulada. En este último, cada punto de la gráfica es la frecuencia de todos los valores
hasta el valor en ese punto, incluidos los anteriores.

Figura 21.2 Histograma de frecuencia Figura 21.3 Gráfico acumulado


544 Capı́tulo 21. Probabilidad y estadı́stica

Tanto el diagrama de barras de la Figura 21.1 como el histograma de la Figura 21.2 mues-
tran distribuciones de frecuencias que son aproximadamente simétricas con respecto al
valor central: las frecuencias decrecen al alejarse del centro. Éste es el resultado que se
puede esperar en muchos tipos distintos de experimentos. Por ejemplo, las estaturas de
los miembros de una población (humana o de otro tipo) se espera que se distribuyan
por igual alrededor de un valor promedio, con estaturas muy pequeñas y muy grandes
menos probables que estaturas cercanas al promedio. De igual manera, medidas ‘igual
de buenas’ de una cantidad fı́sica tienen errores aleatorios, con errores positivos y ne-
gativos igual de probables y con errores grandes menos probables que errores pequeños.
La forma en ‘S’ del gráfico acumulado es tı́pico de esas distribuciones simétricas.
Las representaciones gráficas o los diagramas de los datos proporcionan una infor-
mación cualitativa sobre el centro de una distribución, su anchura y su forma. Esas pro-
piedades se cuantifican fácilmente mediante un pequeño número de estadı́sticos de la
distribución que se pueden calcular, como la media, la desviación tı́pica y la asimetrı́a.
Consideremos un experimento en el que los posibles resultados de las medidas de
una cantidad representada por la variable discreta x forman un conjunto de k valores
{x1 , x2 , . . . , xk } (la población o espacio muestral). Si los resultados posibles son valores
de un rango continuo, el conjunto representa k intervalos de clase. Para un experimento
concreto, supongamos que los resultados de N medidas de x (una muestra de la pobla-
ción) consisten en n1 valores de x1 , n2 de x2 , etcétera. El número total de medidas (el
tamaño de la muestra) es entonces


k

ni = N . (21.1)
i=1

En general, muestras distintas de la misma población (objetivo) tienen distribuciones de


frecuencia distintas, es decir, tienen conjuntos de frecuencias {n1 , n2 , . . . , nk } distintos.
Cada distribución muestral es una aproximación de la ‘verdadera’ distribución objetivo.
Las muestras pequeñas difieren más que las grandes, y un principio fundamental básico
en estadı́stica es que se espera que las diferencias entre distribuciones muestrales se
hagan pequeñas cuando los tamaños de las muestras son suficientemente grandes, y que
las distribuciones muestrales tienden a la distribución de la población objetivo cuando
N → ∞. Esto se llama a veces la ley de los grandes números.
Trataremos los problemas asociados con tamaños de muestra finitos en el Aparta-
do 21.10. Suponemos mientras tanto que N es suficientemente grande para que estos
problemas carezcan de importancia.

Media, moda y mediana

La medida más útil, en general, del valor promedio de x es la media aritmética,

1
N

x= xi , (21.2)
N i=1
21.1. Estadı́stica descriptiva 545

donde la suma se hace para los valores de todos los N datos, o

1
k
1
x = (n1 x1 + n2 x2 + · · · + nk xk ) = ni xi , (21.3)
N N i=1

donde la suma se hace para los k diferentes valores (o clases). Otras medidas del prome-
dio, rara vez utilizadas en ciencias, son:
Moda: el valor de la variable que tiene mayor frecuencia (el valor más frecuente). Si este
valor es único, la distribución se llama unimodal, pero algunas distribuciones pueden
tener dos o más valores máximos (distribuciones bimodales o multimodales).
Mediana: el valor de la variable que divide la distribución en dos mitades iguales. Si los
valores están ordenados y N es impar, la mediana es el valor central, y es el promedio de
los dos valores centrales si N es par. Esta cantidad se usa cuando el orden o la disposición
es más importante que el valor numérico.
Las tres medidas del promedio son iguales para una distribución simétrica unimodal.

EJEMPLOS 21.1 Media, moda y mediana

(i) El valor medio de los datos de la Tabla 21.2 es

1
(1 × 0 + 0 × 1 + 5 × 2 + 5 × 3 + 9 × 4 + 10 × 5
50
+ 9 × 6 + 6 × 7 + 3 × 8 + 2 × 9 + 0 × 10) = 4,98 .

Esto es próximo al ‘valor esperado’ del experimento, 5. Se obtiene la misma media sumando todos los
valores de la Tabla 21.1 y dividiendo por 50. La moda es 5, con frecuencia 10, y la mediana es 5 también.

(ii) La media de los datos sin procesar de la Tabla 21.3 es 43,34 . La media que se obtiene del histograma
de la Figura 21.2, usando los valores de los centros de las clases, es

1
(1 × 33 + 0 × 35 + 5 × 37 + 5 × 39 + 7 × 41 + 10 × 43
50
9 × 45 + 7 × 47 + 4 × 49 + 51 + 53) = 43,28 .

Que ambos valores de la media sean casi iguales supone que nuestra asignación de los datos en clases no
ha distorsionado esta medida de la distribución. El intervalo modal es 42–44. La mediana de los datos sin
procesar es 43,1 , y el intervalo mediano es 42–44, como se muestra con las lı́neas discontinuas en la Figura
21.3.

Varianza y desviación tı́pica

La media x de un conjunto de datos da la posición del centro de la distribución pero


no da información sobre la forma o dispersión de los datos alrededor de la media: dos
distribuciones distintas pueden tener la misma media pero dispersiones muy diferentes.
546 Capı́tulo 21. Probabilidad y estadı́stica

Las medidas cualitativas de la dispersión son el rango, la diferencia entre los valores
extremos de los datos, y el rango intercuartı́lico, que contiene el 50 % de los valores
centrales, con los rangos del primer cuartil y del último cuartil a cada lado con 25 % cada
uno. Estas medidas se usan poco en aplicaciones fı́sicas. Las medidas cuantitativas de la
dispersión se obtienen de considerar las desviaciones xi − x de los datos con respecto a
la media. La desviación media (sumando para todos los datos) es

1 1 1
N N N

(xi − x) = xi − x 1 = x − x = 0,
N i=1 N i=1 N i=1

es decir, las desviaciones positivas y negativas de la media se cancelan entre sı́. La dis-
persión de una distribución se mide casi siempre en cambio en función de los cuadrados
de las desviaciones,

1
N

V(x) = (xi − x)2 (21.4)


N i=1

o, en función de los k valores distintos (o clases),

1
k

V(x) = ni (xi − x)2 . (21.5)


N i=1

La cantidad V(x) se llama varianza de la distribución. La raı́z cuadrada de la varianza


se llama desviación tı́pica, V = s2 , y
  1

 1
N 2

s= V(x) = (xi − x)2 (21.6)


N i=1

(pero véase el Apartado 21.10 para correcciones de V y de s cuando N no es grande). La


desviación tı́pica tiene las mismas unidades que los datos.
Señalamos que si interpretamos las ni de (21.3) y (21.5) como masas situadas en
posiciones xi sobre una recta, entonces x es la posición del centro de masas, NV(x) es el
momento de inercia con respecto al centro de masas y s es el radio de giro.

EJEMPLOS 21.2 Desviación tı́pica

(i) La media de los datos de la Tabla 21.2 es 4,98 y la varianza es

1 
11
V= ni (xi − 4,98)2 = 3,80 .
50 i=1

La desviación tı́pica es por lo tanto s = V = 1,95, y el 70 % de los datos está a menos de s de la media.
21.1. Estadı́stica descriptiva 547

(ii) Para los datos sin procesar de la Tabla 21.3, x = 43,3 , V = 16,5 y s = 4,06. Para los datos agrupados
de la Figura 21.2, x = 43,3 , V = 16,8 y s = 4,10 . En este caso el 78 % de los datos está a menos de s de
la media.

La varianza (21.5) puede escribirse de manera más sencilla como ‘la media de los cua-
drados menos el cuadrado de la media’:

1
N

V(x) = (xi − x)2


N i=1
1 2 1 2 1 
N N N N
2 1
= (x − 2xxi + x ) =
2
x − 2x xi − x 1
N i=1 i N i=1 i N i=1 N i=1
1 2
N

= x − 2x x + x2 .
N i=1 i

1 2
N

Escribiendo x2 = x para la media de los cuadrados, tenemos por lo tanto


N i=1 i

V(x) = x2 − x2 . (21.7)

Desviación absoluta media

Una medida alternativa de la dispersión de una distribución es la media de las des-


viaciones absolutas |xi − x|,

1
N

|xi − x| . (21.8)
N i=1

Si bien esto no suele usarse, puede ser útil para distribuciones muy anchas con un número
significativo de puntos muy alejados del centro.

Asimetrı́a y curtosis

La asimetrı́a de un conjunto de datos se mide por medio de la desviación cúbica


media, con coeficiente de asimetrı́a definido por
N  3
1  xi − x 1 
γ= = 3 x3 − 3xx2 + 2x3 . (21.9)
N i=1 s s

Esta cantidad es cero para una distribución simétrica, positiva si una cola se extiende
más hacia la derecha que hacia la izquierda, y negativa si una cola se extiende más hacia
548 Capı́tulo 21. Probabilidad y estadı́stica

la izquierda que hacia la derecha. Es un estadı́stico importante para distribuciones, pero


escasamente utilizado en las ciencias fı́sicas. De menor uso aún es la curtosis, definida
mediante la media de la cuarta potencia de la desviación.

21.2. Frecuencia y probabilidad

El experimento estadı́stico más sencillo no trivial es uno en que hay sólo dos resulta-
dos posibles: verdadero o falso, encendido o apagado, éxito o fracaso. En la Tabla 21.4
mostramos algunos resultados de lanzar una moneda (una moneda no trucada). N es el
número de lanzamientos, n(C) es el número, o frecuencia, de caras y f (C) = n(C)/N es
la fracción, o frecuencia relativa, de caras.
Los resultados no son sorprendentes porque esperamos que las caras (o las curces) salgan
más o menos la mitad de las veces. Se dice que los dos resultados son ‘equiprobables’.
Este experimento es un ejemplo de experimento aleatorio en el que los resultados de-
penden por completo del ‘azar’ (el problema del significado de las palabras ‘aleatorio’,
‘azar’ y ‘probabilidad’ ha generado una extensa literatura propia). La experiencia mues-
tra que los experimentos aleatorios presentan regularidad estadı́stica, es decir, la frecuen-
cia relativa de un resultado concreto en una sucesión larga de pruebas se mantiene más
o menos igual si se realizan varias de esas sucesiones. En nuestro ejemplo f (C) ≈ 12 y,
para las cruces, f (X) = 1 − f (C) ≈ 12 . El valor teórico de la frecuencia relativa de un
resultado, el valor esperado, es la probabilidad del resultado: P(C) = P(X) = 12 .

Distribuciones de probabilidad

Un conjunto de resultados posibles (o sucesos) {x1 , x2 , . . . , xk } con probabilidades


P(x1 ), P(x2 ), . . . , P(xk ) se denomina una distribución de probabilidad. Las distribucio-
nes de probabilidad son los modelos teóricos (poblacionales) con los que se comparan
las distribuciones de frecuencias (muestrales) para analizar los datos experimentales. La
probabilidad total, la probabilidad de que ocurra algún suceso, es uno (suceso seguro),
de manera que
k

P(xi ) = 1 . (21.10)
i=1

Las dos propiedades más importantes de una distribución de probabilidad son su media
y su varianza (o su desviación tı́pica).
Tabla 21.4
N n(C) f (C)
256 118 0,461
4040 2068 0,512
12000 6062 0,505
24000 11942 0,498
21.3. Probabilidades combinadas 549

La media o valor esperado de x es


k

µ= xi P(xi ) . (21.11)
i=1

Esto es el sumatorio de (21.3) sustituyendo las frecuencias relativas ni /N por las proba-
bilidades. La notación µ se usa más a menudo para la media poblacional, y se reserva x
para una muestra de la población. Otras notaciones que ponen de manifiesto que µ es el
valor esperado son E(x) y x. Si f (x) es una función de x, se define el promedio o valor
esperado de f como


k

E(f ) = f  = f (xi )P(xi ) . (21.12)


i=1

La varianza V y la desviación tı́pica σ de la distribución de probabilidad (poblacional)


vienen dadas por *


k

V(x) = (xi − µ)2 P(xi ) = σ 2 = x2  − x2 (21.13)


i=1

(véanse las ecuaciones (21.5) a (21.7) para las cantidades correspondientes para una
distribución de frecuencias).

21.3. Probabilidades combinadas

Sucesos mutuamente excluyentes

Los dos resultados posibles del lanzamiento de una moneda son sucesos mutuamen-
te excluyentes: si se da uno el otro no puede darse. De esta forma, la probabilidad de
que el resultado sea C y a la vez X en cualquier lanzamiento es cero (suceso imposible),
pero la probabilidad de que el resultado sea C o bien X es uno (suceso seguro):

P(C ó X) = P(C) + P(X) = 1 . (21.14)

En general, si A y B son sucesos mutuamente excluyentes con probabilidades P(A) y


P(B), la probabilidad de que el resultado sea el suceso A o el suceso B es

P(A ó B) = P(A) + P(B) (sucesos mutuamente excluyentes). (21.15)

0* La notación σ se usa siempre para la desviación tı́pica poblacional, aunque a veces también se usa
en vez de s para una muestra. Véase el Aparatado 21.10.
550 Capı́tulo 21. Probabilidad y estadı́stica

EJEMPLO 21.3 Sucesos mutuamente excluyentes

Los posibles resultados de lanzar un dado son los números {1, 2, 3, 4, 5, 6}, cada uno con probabilidad 1
6
(para un dado honrado).

(i) La probabilidad de que el resultado de lanzar el dado sea mayor que 4 (sea 5 ó 6) es
1 1
P( > 4) = P(5 ó 6) = P(5) + P(6) = 2 × = .
6 3
(ii) La probabilidad de que el resultado sea par es
1 1
P(par) = P(2 ó 4 ó 6) = P(2) + P(4) + P(6) = 3 × = .
6 2

Sucesos independientes

Los posibles resultados de lanzar una moneda dos veces son {CC, CX, XC, XX},
cada uno con probabidad 14 . El resultado del segundo lanzamiento (suceso B) es inde-
pendiente del resultado del primero (suceso A), y la probabilidad del suceso A y B es
entonces el producto de las probabilidades de A y de B por separado:

P(A y B) = P(A) × P(B) (sucesos independientes). (21.16)

EJEMPLO 21.4 Halle la probabilidad de sacar 10 con dos lanzamientos de un dado.

De los 36 resultados posibles, los que son iguales a 10 son (5, 5), (4, 6) y (6, 4). La segunda tirada es
independiente de la primera (o si es una única tirada de dos dados, el resultado de cada uno es independiente
del otro). Cada resultado tiene probabilidad 16 × 16 = 361
y por ser mutuamente excluyentes
1 1
P(10) = P(5 y 5) + P(4 y 6) + P(6 y 4) = 3 × = .
36 12

EJEMPLO 21.5 Sistemas independientes

En termodinámica estadı́stica, la probabilidad P(E) de que un sistema esté en un estado con energı́a E es
una función únicamente de E. Dos sistemas sin interacción (independientes) con energı́as E1 y E2 tienen
una energı́a combinada E1 + E2 y una probabilidad combinada
P(E1 + E2 ) = P(E1 ) × P(E2 ) . (21.17)
βE
Una función que cumple esta ecuación es P(E) = e , siendo β una constante; tenemos que

P(E1 ) × P(E2 ) = eβE1 eβE2 = eβ(E1 +E2 ) = P(E1 + E2 ) .

Puede demostrarse que esta función (multiplicada por una constante) es la única que cumple (21.17). En
termodinámica estadı́stica el parámetro β es inversamente proporcional a la temperatura, β = −1/kT,
siendo k la constante de Boltzmann, y la función de probabilidad exponencial describe la distribución de
Boltzmann.
21.4. Distribución binomial 551

21.4. Distribución binomial

La distribución binomial es la distribución teórica que describe los resultados de un


número dado de realizaciones independientes de un experimento con sólo dos resultado
posibles (véase el Apartado 21.2). Vamos a considerar 4 lanzamientos de una moneda (o
cuatro observaciones del espı́n de un electrón). Cada lanzamiento (cada ‘prueba’) tiene
dos resultados posibles con probabilidades iguales: P(C) = P(X) = 12 . Los 4 resultados
posibles de dos lanzamientos son CC, CX, XC y XX, cada uno con probabilidad ( 12 )2 =
1
4
. Estos resultados son de tres tipos: 2 caras con probabilidad 14 , 1 cara y 1 cruz con pro-
babilidad 14 + 14 = 12 y 2 cruces con probabilidad 14 . De la misma manera, los 16 resultados
equiprobables posibles de 4 lanzamientos son de 5 tipos con las probabilidades siguientes:

4 caras
 4
1 1
P(4C) = P(CCCC) = = .
2 16

3 caras y 1 cruz
 4
1
P(3C + 1X) = P(CCCX) + P(CCXC) + P(CXCC) + P(XCCC) = 4 × .
2

2 caras y 2 cruces
P(2C + 2X) = P(CCXX) + P(CXCX) + P(CXXC)
 4
1
+ P(XXCC) + P(XCXC) + P(XCCX) = 6 × .
2

1 cara y 3 cruces
 4
1
P(1C + 3X) = P(XXXC) + P(XXCX) + P(XCXX) + P(CXXX) = 4 × .
2

4 cruces
 4
1
P(4X) = P(XXXX) = .
2
 4
Vemos que los coeficientes del factor 12 de las probabilidades son los números {1,
4, 6, 4, 1} que
 constituyen la quinta fila del triángulo de Pascal. Son los coeficientes
binomiales m4 , para m caras y 4 − m cruces. En el caso de n pruebas, el número total de
resultados posibles es 2n (2 por cada prueba) y la probabilidad de m caras y n − m cruces
es

   n
n 1
P mC + (n − m)X = Pm = × . (21.18)
m 2
552 Capı́tulo 21. Probabilidad y estadı́stica

Esta colección de probabilidades se llama distribución binomial (o distribución de Ber-


noulli).
Más en general, la distribución binomial se aplica a cualquier experimento cuyos
resultados puedan tratarse como dos sucesos mutuamente incompatibles. A menudo se
denominan ‘éxito’, con probabilidad p, y ‘fracaso’ con probabilidad q = 1 − p. La
probabilidad de obtener m éxitos en n pruebas es entonces
 
n m n−m n!
Pm = p q = pm (1 − p)n−m . (21.19)
m m!(n − m)!

La media, la varianza y la desviación tı́pica son



µ = m = np, V(n) = np(1 − p), σ= np(1 − p) . (21.20)

EJEMPLO 21.6 La probabilidad de que el resultado de lanzar 10 veces una moneda consista en m caras
(y 10 − m cruces) es
 
10
10 1
Pm = ×
m 2
con µ = 5, V = 2,5 y σ = 1,58. En la Tabla 21.5 comparamos la correspondiente distribución binomial
con las frecuencias relativas fm obtenidas de la Tabla 21.2.

Tabla 21.5

m 0 1 2 3 4 5 6 7 8 9 10

Pm 0,001 0,01 0,04 0,12 0,21 0,25 0,21 0,12 0,04 0,01 0,001
fm 0,02 0,00 0,10 0,10 0,18 0,20 0,18 0,12 0,09 0,04 0,00

La media, la varianza y la desviación tı́pica de la distribución de frecuencias son n = 4,98 , V(n) = 3,8 y
s = 1,95 . Las diferencias entre la teorı́a y el experimento se deben al pequeño tamaño de la muestra (50
conjuntos de 10 lanzamientos).

EJEMPLO 21.7 Halle la probabilidad de conseguir al menos 2 ‘seises’ en cuatro tiradas de un dado no
trucado.

La probabilidad de éxito en una tirada es p = 16 , de forma que q = 56 . La probabilidad total de al menos


dos éxitos (2, 3 ó 4) es entonces

P = P2 + P3 + P4
         
2 2 3 4
4 1 5 4 1 5 4 1
= + +
2 6 6 3 6 6 4 6
 4
1 171
= (150 + 20 + 1) = = 0,132 .
6 1294
21.5. Permutaciones y combinaciones 553

21.5. Permutaciones y combinaciones

Los resultados posibles de lanzar una moneda o de tirar un dado son sucesos mu-
tuamente incompatibles con misma probabilidad: cada uno de los k posibles resultados
tiene probabilidad 1/k. El recuento de resultados equiprobables es importante en cien-
cias en varias aplicaciones de la teorı́a de probabilidades y a menudo implica contar las
permutaciones y las combinaciones de conjuntos de objetos o de sucesos. Los teoremas
que siguen son algunos de los resultados importantes de la teorı́a combinatoria.2

Permutaciones

Un conjunto de n objetos distintos (distinguibles) (objetos reales, números, sucesos,


etcétera) puede colocarse en una fila de maneras diferentes, y cada una de ellas se lla-
ma una permutación de los n objetos. Por ejemplo, las tres letras A, B y C pueden
disponerse de 6 maneras diferentes

ABC, ACB, BAC, BCA, CAB, CBA.

Hay 3! = 6 permutaciones de 4 objetos distintos. En general:

1. El número de permutaciones de n objetos distintos es n!.


El primer objeto puede ponerse en n posiciones distintas, dejando n − 1 posiciones para
el segundo objeto (piénsese en n cajas alineadas y n bolas de distintos colores). Los dos
primeros objetos pueden colocarse por lo tanto de n(n − 1) maneras diferentes. El tercer
objeto puede ocupar n − 2 posiciones, con lo que el número de maneras diferentes de
colocar 3 objetos distintos es n(n − 1)(n − 2). En general:
2. El número de permutaciones de n objetos distintos tomados de r en r es

n!
n
Pr = n(n − 1)(n − 2) · · · (n − r + 1) = . (21.21)
(n − r)!

El número total de permutaciones de n objetos (tomados de n en n) es por lo tanto


n
Pn = n! .

02. Un tratamiento temprano de las permutaciones y combinaciones se encuentra en la obra mı́stica


judı́a Sefer Yetsirah (Libro de la creación), posiblemente del siglo II d.C., donde el autor (desconocido)
calcula las maneras de colocar las 22 letras del alfabeto hebreo y el número de combinaciones tomando 2
por vez. El matemático, astrónomo y comentarista bı́blico francés Levi Ben Gerson (1288–1344) dio una
deducción de las reglas combinatorias en su Maasei Hoshev (Arte del calculador) de 1321. También fue
el inventor de la ballestilla, utilizada por los marinos durante siglos para medir la separación angular de
cuerpos celestes.
554 Capı́tulo 21. Probabilidad y estadı́stica

Combinaciones

En una permutación, el orden de los objetos seleccionados es importante. Una com-


binación, por su parte, es una selección de objetos sin considerar su orden.
3. El número de combinaciones de n objetos distintos tomados de r en r es
 
n! n
n
Cr = = . (21.22)
r!(n − r)! r

EJEMPLO 21.8 El número de combinaciones de 5 objetos tomados de 3 en 3 es

5! 5·4·3·2·1
5
C3 = = = 10 .
3!2! (3 · 2 · 1)(2 · 1)
Ası́ por ejemplo, para A, B, C, D, E:

ABC, ABD, ABE, ACD, ACE, ADE, BCD, BCE, BDE, CDE.

Hay 3! permutaciones posibles de cada combinación, de manera que 3! × n C3 = nP3 . En general, como
puede verse a partir de (21.21) y (21.22), nPr = r! × n Cr .

El número de combinaciones de n objetos tomados de r en r es lo mismo que el número


de maneras de dividir los n objetos en 2 grupos de r y n − r (2 cajas, una con r objetos,
la otra con n − r). Más en general:
4. El número de maneras de dividir n objetos distintos en k grupos, con n1
objetos en el grupo 1, n2 en el grupo 2, . . . , nk en el grupo k, es

n!
. (21.23)
n1 !n2 !n3 ! . . . nk !

Este resultado es importante en termodinámica estadı́stica cuando se consideran las ma-


neras de distribuir moléculas entre los niveles de energı́a disponibles. Esto da lugar a la
estadı́stica clásica o de Boltzmann que describe el comportamiento de muchos siste-
mas termodinámicos.

Objetos distinguibles e indistinguibles

Hemos considerado los teoremas anteriores para conjuntos de objetos distintos o dis-
tinguibles, y han de ser modificados o reinterpretados si algunos de los objetos o todos
son indistinguibles. Se dice que dos objetos son indistinguibles si no se
aprecia una variación al intercambiarlos, y por lo tanto no da lugar a una permutación
o combinación nueva o diferente. Por ejemplo, el teorema 4 puede reinterpretarse para
el número de permutaciones diferentes de n objetos distribuidos en k grupos, siendo los
21.5. Permutaciones y combinaciones 555

objetos de cada grupo indistinguibles entre sı́, pero distintos de los objetos de los demás
grupos.
5. El número de permutaciones de n objetos indistinguibles es 1.
6. El número de maneras de distribuir k objetos indistinguibles (por ejemplo,
electrones) entre n (≥ k ) cajas (estados cuánticos)
con no más de un objeto por
n
caja (el principio de exclusión de Pauli) es n Ck = .
k

Las n cajas o bien están ocupadas por un elemento o bien están vacı́as, de manera que
el teorema 3 se puede aplicar a las cajas. Este resultado es importante en mecánica es-
tadı́stica para sistemas de partı́culas que cumplen el principio de exclusión de Pauli. Da
lugar a la estadı́stica cuántica llamada estadı́stica de Fermi–Dirac que es importante
en la descripción de algunos sistemas termodinámicos a muy baja temperatura y, por
ejemplo, para describir las propiedades de los electrones de conducción en sólidos.

Grandes números

EJEMPLO 21.9 El número de permutaciones de 52 objetos (una baraja de cartas) es 52! ≈ 8,1 × 1067 .

El número de objetos considerados en algunas aplicaciones de la teorı́a combinatoria en


ciencias puede ser muy grande. Por ejemplo, en termodinámica estadı́stica nos ocupamos
de la disposición de partı́culas en un mol de materia entre los estados de energı́a dispo-
nibles, de manera que n ≈ 1023 , y n! es del orden de 1010 . El cálculo y la manipulación
25

de estos números se simplifica con la aproximación de Stirling3


√ n
n
n! ∼ 2πn , (21.24)
e
donde el sı́mbolo ∼ se lee como ‘es asintóticamente igual a’ y quiere decir que el co-
ciente de ambos miembros de (21.24) tiende a uno cuando n → ∞. En muchos casos lo
que interesa es ln n! en vez del propio n! , y tenemos

1
ln n! ∼ n ln n − n + ln 2πn . (21.25)
2
1
El uso de esta expresión asintótica supone errores de aproximadamente 12n para ln n! si
n es grande (véase el Ejemplo 20.12). Si n es suficientemente grande, podemos tomar

03. James Stirling (1692–1770), matemático escocés y, como Cotes y De Moivre, amigo de Newton.
La fórmula que lleva su nombre apareció en su Methodus differentialis de 1730 y en la Miscellanea analytica
de De Moivre, también de 1730.
556 Capı́tulo 21. Probabilidad y estadı́stica

ln n! ≈ n ln n − n . (21.26)

En la Tabla 21.6 damos algunos valores.

Tabla 21.6 Aproximación de Stirling


n ln n! ec.(21.25) n ln n − n ln n! − (n ln n − n)

10 15,104 15,096 13,026 2,078


52 156,361 156,359 153,465 2,896
1010 2,2 × 1011 2,2 × 1011 12,7
1023 5,2 × 1024 5,2 × 1024 27,4

La ecuación (21.25) es ya una muy buena aproximación para n = 52, y puede suponerse
exacta para los valores mayores de n que aparecen en la tabla. La diferencia entre (21.25)
y la ‘aproximación peor’ (21.26) es 12 ln 2πn, que sólo crece muy despacio con n. El error
absoluto 27,4 para n = 1023 corresponde al error relativo 5 × 10−24 para ln n! .
En el Ejemplo 21.10 que sigue damos una aplicación importante de la fórmula de
Stirling. Vamos a considerar antes cómo se comporta una distribución, como la distribu-
ción binomial, si los números que aparecen son grandes. En la Figura 21.4 mostramos la
distribución binomial (21.18) para n = 10 y n = 100. Las gráficas son de Pm /Pn/2 frente
a m/n, con valor máximo 1 para m/n = 1/2.

Figura 21.4

Muestran que si n es grande las propiedades de la distribución están dominadas por el


valor en y cerca del máximo. Una medida de este estrechamiento relativo √ de la curva de
la distribución viene dada por la desviación tı́pica relativa σ/n = 1/(2 n).
21.6. Distribuciones continuas 557

EJEMPLO 21.10 Distribución de Boltzmann

En termodinámica estadı́stica, la distribución de Boltzmann para un sistema de n partı́culas con energı́a total
E se deduce a menudo considerando las maneras en que las partı́culas pueden distribuirse entre los estados
de partı́culas. Supongamos que hay k estados disponibles con energı́as 1 , 2 , . . . , k , supongamos que n1
partı́culas tienen energı́a 1 , n2 tienen energı́a 2 , y ası́ sucesivamente. El número de maneras de distribuir
las n partı́culas de esta forma (suponiendo partı́culas distinguibles) viene dado entonces por el teorema 4:
n!
W= . (21.27)
n1 ! n2 ! · · · nk !
Si n es grande, como ocurre en un sistema termodinámico, las propiedades del sistema vienen dominadas
por la distribución para la cual W alcanza su valor máximo. Esta distribución más probable se obtiene
optimizando W con respecto a los números de ocupación (considerados variables continuas) sujeto a las
ligaduras de que el número total de partı́culas n sea constante y de que la energı́a total E sea constante:

k 
k
n= ni = constante, E= ni i = constante. (21.28)
i=1 i=1

Empezamos tomando el logaritmo de W y usamos la aproximación de Stirling (21.26) (considerándola


exacta en este caso) para simplificar la expresión:

k 
k
ln W = ln n! − ln ni ! = (n ln n − n) − (ni ln ni − ni ) . (21.29)
i=1 i=1

El valor máximo de W sujeto a las ligaduras se obtiene entonces por el método de los multiplicadores de
Lagrange, esto es, hallamos el máximo de la función auxiliar

k 
k
φ = ln W − α ni − β ni i (21.30)
i=1 i=1

siendo α y β los multiplicadores (véase el Apartado 9.4). Para obtener un valor estacionario (máximo) con
respecto a ni , tiene que cumplirse
∂φ ∂
= ln W − α − βi = 0 .
∂ni ∂ni

Puesto que ln W = ln ni , tenemos por lo tanto que ln ni = α + βi , de manera que la distribución más
∂ni
probable de partı́culas viene dada para los números de ocupación

ni = eα+βi . (21.31)
Este conjunto de números, interpretando adecuadamente las cantidades α y β, se denomina distribución de
Boltzmann. Ası́, por ejemplo, β = −1/kT, de manera que ni = eα e−i /kT y

k 
k
ni = n = eα e−i /kT .
i=1 i=1

La fracción de partı́culas en el estado i es, por lo tanto,


ni 1
= e−i /kT ,
n q

k
donde q = e−i /kT se denomina función de partición.
i=1
558 Capı́tulo 21. Probabilidad y estadı́stica

21.6. Distribuciones continuas

Las distribuciones que hemos considerado hasta ahora son discretas, implicando una
variable discreta x (o una variable que se considera discreta a efectos prácticos). Cada
valor de esa variable tiene una frecuencia relativa observada y su correspondiente pro-
babilidad teórica. Tales distribuciones describen procesos que implican contar sucesos
discretos, y un ejemplo es la distribución binomial descrita en el Apartado 21.4.
Los procesos que implican medir una variable continua se describen mediante dis-
tribuciones continuas, en las cuales la variable x puede tomar cualquier valor dentro de
un rango continuo, digamos que a ≤ x ≤ b. El número de resultados posibles es enton-
ces infinito, y la probabilidad de un resultado concreto no está definida (la probabilidad
efectiva es cero). En cambio, definimos la probabilidad de que el valor de x esté en un
intervalo especı́fico x1 ≤ x ≤ x2 como:
x 2

P(x1 ≤ x ≤ x2 ) = ρ(x) dx , (21.32)


x1

donde ρ(x) se denomina distribución de densidad de probabilidad (o función de den-


sidad de probabilidad, o densidad de probabilidad a secas). Si el intervalo es suficiente-
mente pequeño, la probabilidad en el intervalo de x a x + ∆x es

P(x → x + ∆x) ≈ ρ(x)∆x (21.33)

alcanzándose la igualdad para un intervalo infinitesimal dx.


La probabilidad total (la normalización de ρ(x)) es
b

P(a ≤ x ≤ b) = ρ(x) dx = 1 . (21.34)


a

La Figura 21.5 ilustra la interpretación gráfica. El área total bajo la curva entre a y b
es igual a 1 y representa la probabilidad total (ecuación (21.34)). La región sombreada
tiene área igual a la probabilidad dada por (21.32).

Figura 21.5
21.6. Distribuciones continuas 559

Las propiedades de una distribución continua se obtienen sustituyendo las sumas para
una distribución discreta por integrales en el rango de valores posibles, con lo que los
valores esperados son entonces (véanse las ecuaciones (21.12) y (21.11) para el caso
discreto)
b

f  = f (x)ρ(x) dx , (21.35)
a

con media
b

µ = x = xρ(x) dx . (21.36)


a

Un ejemplo de distribución continua, y probablemente la más importante en estadı́stica,


es la distribución gaussiana (distribución normal) que tratamos en el Apartado 21.7.

EJEMPLO 21.11 Distribución uniforme

La distribución continua más sencilla tiene probabilidad



⎨ 1 si a < x < b,
ρ(x) = b−a

0 en el resto.

La densidad de probabilidad es constante en toda la región, y la


probabilidad de que la variable x esté en el intervalo x1 < x < x2 es
proporcional a la longitud del intervalo: Figura 21.6
x2
x 2 − x1
P(x1 < x < x2 ) = ρ(x) dx = .
x1 b−a

EJEMPLO 21.12 Funciones de distribución radiales

Una distribución continua en tres variables tiene una función de densidad de probabilidad ρ(x, y, z) tal que
z2 y2 x2
P(x1 < x < x2 ; y1 < y < y2 ; z1 < z < z2 ) = ρ(x, y, z) dx dy dz
z1 y1 x1

es la probabilidad de que las variables estén en los intervalos dados; es decir, (x, y, z) es un punto de la caja
rectangular cuyos lados son x2 − x1 , y2 − y1 , z2 − z1 . La función de densidad es una función de posición en
el espacio de las variables y ρ(r)dv es la probabilidad de que el punto esté en el volumen dv con posición r.
Algunas distribuciones tridimensionales de importancia en quı́mica son las distribuciones de probabilidad
electrónicas que se obtienen de las soluciones de la ecuación de Schrödinger.
Si transformamos las variables a coordenadas esféricas en el espacio, tenemos que
φ2 θ 2 r 2
P(r1 < r < r2 ; θ1 < θ < θ2 ; φ1 < φ < φ2 ) = ρ(r, θ, φ) r2 sen θ dr dθ dφ
φ1 θ1 r1

es la probabilidad de que el punto esté en la sección del casquete esférico entre los radios r1 y r2 , los
ángulos θ1 y θ2 , y los ángulos φ1 y φ2 (véase la explicación de la Figura 10.6). La probabilidad de que el
punto esté en cualquier parte del casquete entre r1 y r2 es entonces
560 Capı́tulo 21. Probabilidad y estadı́stica

P(r1 < r < r2 ) = P(r1 < r < r2 ; 0 < θ < π; 0 < φ < 2π)
r2  2π π 
= ρ(r, θ, φ) r2 sen θ dθ dφ dr .
r1 0 0

La cantidad entre corchetes,


2π π
p(r) = ρ(r, θ, φ) r2 sen θ dθ dφ ,
0 0

se denomina función de densidad radial, y p(r)dr es la probabilidad de que la variable r = x2 + y2 + z2
tome valor en el intervalo (infinitesimal) de r a r + dr; es decir, que (x, y, z) esté en un casquete esférico de
radio r y espesor dr.
Por ejemplo, el módulo cuadrado de la función de onda de un electrón, ρ(r, θ, φ) = |ψ(r, θ, φ)|2 es una
función de densidad de probabilidad electrónica. Para un electrón en el átomo de hidrógeno, la función de
onda es de la forma (véase la ecuación 14.83)

ψn,l,m (r, θ, φ) = Rn,l (r)Θl,m (θ)Φm (φ)

y la función de densidad radial correspondiente es

p(r) = r2 R2n,l (r) .

21.7. Distribución gaussiana

La distribución gaussiana, también llamada distribución normal, es la distribución


continua con media µ y desviación tı́pica σ cuya función de densidad de probabilidad es

1
ρ(x) = √ e−(x−µ) /2σ
2 2
(21.37)
σ 2π

para todos los valores de x. En la Figura 21.7 mostramos las gráficas para tres valores de
σ.

Figura 21.7
21.7. Distribución gaussiana 561

La función es simétrica con respecto a x = µ. Es ancha si σ es grande y estrecha si σ


es pequeña, y cae hasta aproximadamente 0,6 veces su valor máximo para x = ±σ, los
puntos de inflexión de la función.

Errores

La distribución gaussiana es importante en ciencias porque describe la distribución


del error de una sucesión de experimentos aleatorios.4 Las medidas, por muy precisas
que sean, siempre están acompañadas de errores. Los hay de dos tipos: determinados y
aleatorios. Los errores determinados pueden ser sencillamente equivocaciones o pueden
ser errores sistemáticos debidos a aparatos defectuosos o mal calibrados. Normalmente
es posible descubrir las causas de esos errores y eliminarlos o hacer correcciones que
los tengan en cuenta. Los errores aleatorios, por otra parte, son indeterminados. Pueden
ser debidos a que ‘tiemble el pulso’, a la resolución imperfecta de un instrumento, a las
fluctuaciones impredecibles de la temperatura o del voltaje.
Los errores se deben en general a varias o muchas causas. El teorema del lı́mite cen-
tral de la teorı́a de probabilidades nos dice que una variable producida por el efecto acu-
mulado de varias variables independientes es aproximadamente gaussiana o ‘normal’.
Muchas cantidades observadas son de este tipo: las medidas anatómicas, como la esta-
tura o la longitud de la nariz por ejemplo, se deben a los efectos combinados de muchos
factores genéticos y ambientales, y sus distribuciones son gaussianas. Además, muchas
distribuciones teóricas se comportan como distribuciones gaussianas si los números
√ son
grandes. La distribución binomial tiende a una gaussiana con µ = np y σ = np(1 − p)
cuando n → ∞. Los números aleatorios tienen una distribución uniforme si se los con-
sidera individualmente. Sin embargo, si se toman n por vez, tienen una distribución que
se hace gaussiana cuando n se hace grande.

Función de distribución

La función de distribución de probabilidad F(x) de la distribución gaussiana se define


como
x x
1
F(x) = ρ(x) dx = √ e(x−µ) /2σ dx ,
2 2
(21.38)
−∞ σ 2π −∞

04. La primera descripción de la ley normal del error la dio De Moivre en 1738. Gauss la dedujo en
su Teorı́a del movimiento de los cuerpos celestes de 1809 a partir de un principio de probabilidad máxima:
‘si una cantidad ha sido determinada a partir de varias observaciones, hechas en las mismas circunstancias y
con igual cuidado, la media aritmética de los valores observados proporciona el valor más probable’. Gauss
consideraba que la función (21.37) era la función de error ‘correcta’ porque habı́a sido capaz de deducirla
del principio de mı́nimos cuadrados. Laplace dio una deducción alternativa de la ley normal en 1810, y la
incluyó en su Teorı́a analı́tica de la probabilidad de 1812.
562 Capı́tulo 21. Probabilidad y estadı́stica

de manera que F(a) es la probabilidad de que la variable tome un valor x < a, y



F(x → ∞) = ρ(x) dx = 1 (21.39)
−∞

para que la probabilidad esté normalizada a la unidad. La probabilidad de que la variable


tenga un valor en el intervalo a < x < b es por lo tanto
b
1
P(a < x < b) = F(b) − F(a) = √ e(x−µ) /2σ dx ,
2 2
(21.40)
σ 2π a

que es igual al área bajo la curva entre x = a y x = b.


La integral que aparece en (21.38) no puede ser evaluada por los métodos del cálculo
descritos en los Capı́tulos 5 y 6, pero se pueden encontrar detalladas tablas de valores en
la mayorı́a de los textos de estadı́stica. Esas tabulaciones son de la función auxiliar
z
1
Φ(z) = √ e−z /2 dz
2
(21.41)
2π −∞

que se obtiene a partir de (21.38) mediante el cambio z = (x − µ)/σ. Con esto, F(x) =
Φ((x − µ)/σ)), y
   
b−µ a−µ
P(a < x < b) = Φ −Φ . (21.42)
σ σ

De esas tabulaciones se obtiene que las probabilidades de que x esté a menos de σ, 2σ y


3σ de la media son

P(µ − σ < x < µ + σ) = 0,6827 ,


P(µ − 2σ < x < µ + 2σ) = 0,9545 , (21.43)
P(µ − 3σ < x < µ + 3σ) = 0,9973 .

Por lo tanto, es de esperar que cerca del 68 % de los valores observados esté a menos
de una desviación tı́pica de la media (Figura 21.8), 95 % a menos de dos desviaciones
tı́picas, y casi todos a menos de tres desviaciones tı́picas.

Figura 21.8
21.8. Más de una variable 563

21.8. Más de una variable

En muchos experimentos en las ciencias fı́sicas, los resultados consisten en valores


de más de una cantidad por vez. Por ejemplo, un experimento cinético implica medir
pares (c, t) de concentración y tiempo, en termodinámica podemos tener pares (p, T), en
dinámica podemos estar siguiendo el vuelo de un cuerpo midiendo (x, y, z, t) para obtener
la posición y el tiempo. O también, esos cuatro valores pueden ser la estatura, el cociente
intelectual, la nota en un examen de matemáticas y la mejor marca personal en los 100
metros braza para cada estudiante de una clase de quı́mica.

Covarianza y correlación

Sea un experimento en el cual cada resultado consiste en los valores de un par de


variables, (x, y): (x1 , y1 ), (x2 , y2 ), . . . , (xN , yN ), para una muestra de N pares. Podemos cal-
cular las medias x e y, las varianzas V(x) y V(y), y las desviaciones tı́picas σx y σy , para
cada variable por separado. También podemos considerar las dos variables conjuntamen-
te y determinar si depende una de la otra. Una medida de la dependencia de dos variables
es la covarianza, definida por

1
cov(x, y) = (xi − x)(yi − y) = xy − x y , (21.44)
N i

donde xy = N1 xi yi . Si las variables son independientes, xy = x y (cada valor de x puede
darse con cada valor de y) y la covarianza es cero. Si los valores de x por encima de la
media tienden a darse con valores de y por encima de la media, la covarianza es positiva
porque los términos (xi − x)(yi − y) resultan positivos. Si los valores de x grandes se dan
con valores de y pequeños, la covarianza es negativa.
Una medida alternativa de la dependencia es el coeficiente de correlación

cov(x, y) xy − x y
ρx,y = = . (21.45)
σx σy σx σy

Se trata de una cantidad adimensional con valores −1 ≤ ρx,y ≤ +1. Las variables x
e y son independientes si ρx,y = 0, tienen correlación positiva si ρx,y es positiva y
correlación negativa si ρx,y es negativa. Si ρx,y = ±1, x e y están totalmente (100 %)
correlacionadas, y puede existir una relación funcional entre las variables. Las nubes de
puntos de la Figura 21.9 muestran algunos ejemplos de correlación.
Las tres primeras representan resultados de los estudiantes de una clase de primer
curso de quı́mica. La Figura (a) muestra la nota global en quı́mica (vertical) frente a la
inicial del nombre del estudiante (horizontal). No se espera que haya correlación y no
se observa ninguna, siendo ρx,y = 0,03. Hay cierta correlación entre la nota global en
quı́mica y la nota de matemáticas, con ρx,y = 0,52, y una mayor correlación (ρx,y = 0,76)
entre las notas de quı́mica inorgánica y quı́mica orgánica. La Figura (d) es tı́pica de los
564 Capı́tulo 21. Probabilidad y estadı́stica

resultados que se obtienen si se espera que exista una relación funcional lineal entre las
variables (también puede obtenerse un coeficiente de correlación alto sin que exista una
relación funcional).

Figura 21.9

21.9. Mı́nimos cuadrados

Muchos experimentos en ciencias se realizan para medir pares de cantidades fı́sicas


de las que se sabe, o se sospecha, que tienen una relación funcional, es decir, que existe
alguna función y = f (x). Un objetivo del experimento es por lo tanto confirmar, o deter-
minar, esa relación. Tales experimentos se diseñan a menudo de tal manera que una de
las cantidades, por ejemplo x, puede medirse con exactitud (con error despreciable), que-
dando los errores para y. Por ejemplo, x puede ser el tiempo en un experimento cinético
e y una concentración.
Sea una muestra de datos con N puntos (xi , yi ), i = 1, 2, . . . , N, donde los valores de x
se consideran exactos y donde a cada valor de y se le asocia una medida de la precisión,
σi para yi , por ejemplo. Si los errores de y son aleatorios, σi es la desviación tı́pica (o
una estimación de la desviación tı́pica) de la distribución normal a la cual pertenece
yi ; es decir, yi ± σi supone que alrededor del 68 % de las medidas de y para x = xi
distan menos de σi de la media. En la Figura 21.10 se muestra una gráfica tı́pica de esos
conjuntos de datos.

Figura 21.10
21.9. Mı́nimos cuadrados 565

Cada punto se representa con la barra de error correspondiente y la curva discontinua


indica que los puntos pueden ajustarse a una recta,

y = y(x; m, c) = mx + c , (21.46)

donde m y c son parámetros que determinan la pendiente y el corte de la recta con el eje.
De manera más general, el problema es ajustar los puntos a una función (sencilla) que
sirva de modelo,

y = y(x; a1 , a2 , . . . , ak ) = y(x; a) , (21.47)

con k parámetros variables a = (a1 , a2 , . . . , ak ) que se determinan mediante algún criterio


de ‘mejor ajuste’.

Ajuste por mı́nimos cuadrados sencillo

El método más sencillo y el más utilizado para ajustar un conjunto de puntos a una
función modelo (21.47) consiste en minimizar la cantidad


N

N

D= [ yi − y(xi ; a) ] = 2i
2
(21.48)
i=1 i=1

con respecto a los parámetros a1 , a2 , . . . , ak :

∂D ∂D ∂D
= 0, = 0, . . . , = 0. (21.49)
∂a1 ∂a2 ∂ak

Como se muestra en la Figura 21.11, cada término de la


suma es el cuadrado de la diferencia

i = yi − y(xi ; a)

entre el valor real de y y el predicho, para cada valor de


x = xi .
Este método de mı́nimos cuadrados puede considerarse
como un procedimiento empı́rico para ajustar curvas que
se justifica porque da a menudo resultados razonables, o
puede ser deducido de la teorı́a de errores aleatorios para el
caso particular en que los valores σi son todos iguales; es
decir, cuando todos los yi tienen la misma precisión. Tam- Figura 21.11
bién es el método que debe usarse cuando no hay informa-
ción disponible sobre la precisión.5

05. El método de mı́nimos cuadrados (la méthode des moindres quarrés) fue desarrollado por Le-
gendre en 1805 en relación con la determinación de las órbitas de cometas, y se convirtió rápidamente
566 Capı́tulo 21. Probabilidad y estadı́stica

Ajuste a una recta

La cantidad que hay que minimizar en el caso del ajuste a una recta y = mx + c es


N

D= [yi − (mxi + c) ] .
2
(21.50)
i=1

Tenemos entonces

∂D  N

N

N

N

= −2 xi (yi − mxi − c) = 0 , ó xi yi − m x −c
2
xi = 0 ,
∂m i=1 i=1 i=1
i
i=1

∂D  N

N

N

N

= −2 (yi − mxi − c) = 0 , yi − m xi − c 1 = 0.
∂c i=1 i=1 i=1 i=1


N

Dividiendo por N = 1, obtenemos entonces las dos ecuaciones normales


i=1

xy − mx2 − cx = 0
(21.51)
y − mx − c = 0

cuya solución es

xy − x y
m= , c = y − mx . (21.52)
x2 − x 2
La recta resultante pasa por el baricentro (x, y) de los datos.
Si todos los valores yi tienen la misma precisión σ, los parámetros estimados m y c tienen
desviaciones tı́picas dadas por

σ2 σ 2 x2
σm2 =  , σc2 =  , (21.53)
N x2 − x2 N x2 − x 2

y el ajuste por mı́nimos cuadrados lineal con los errores estimados es y = mx + c con

xy − x y
m= ± σm , c = y − mx ± σc . (21.54)
x2 − x 2

en un método estándar para resolver problemas en astronomı́a y geodesia. El método apareció también en
1809 en la Teorı́a del movimiento de los cuerpos celestes de Gauss. Gauss no citaba a Legendre y afirmaba
que habı́a estado usando el método desde 1795. Legendre argumentó que la primicia en descubrimientos
cientı́ficos puede establecerse únicamente por las publicaciones, y seguı́a acusando a Gauss en 1827 de
haberse apropiado de los descubrimientos de otros.
21.9. Mı́nimos cuadrados 567

EJEMPLO 21.13 Halle el ajuste por mı́nimos cuadrados lineal para los siguientes puntos:

Tabla 21.7
x 0 3 6 9 12 15 18

y 3,3 2,5 2,3 1,7 1,4 0,5 0,2

Tenemos que N = 7, x = 9, y = 1,7, x2 = 117, xy = 64,5/7 = 9,21429, x2 − x2 = 36 y xy − x y =


−42,6/7 = −6,08571. Por lo tanto

√ 117
σm = σ/ 252 = 0, 0630σ , σc = σ = 0,6814σ ,
252
de manera que
−42,6 σ
m= ±√ = −0,1691 ± 0,0630σ ,
252 252

42,6 × 9 117
c = 1,7 + ±σ = 3,2214 ± 0,6814σ .
252 252
Este es el ejemplo representado en la Figura 21.10. Las barras de error corresponden a σ = 0,25 de manera
que el ajuste por mı́nimos cuadrados lineal es para este caso
y = mx + c, con m = −0,1691 ± 0,0158 , c = 3,2214 ± 0,1704 .

Ajuste ji-cuadrado

Si los errores (conocidos) de los valores de y no son todos iguales, con σi para yi ,
hay que sustituir el método de mı́nimos cuadrados sencillo por el método más general
de mı́nimos cuadrados ponderado:
N  2
 yi − f (xi ; a)
χ =
2
= mı́nimo. (21.55)
i=1
σi

Cada contribución a la suma está ponderada por el factor 1/σi2 , y tiene por efecto dar
mayor peso a los valores de y más precisos (con valores de σi más pequeños). Esta
situación se produce por ejemplo cuando la precisión con la cual se puede medir varı́a
en el rango de los valores de y, o cuando los datos provienen de medidas hechas en
varios instrumentos distintos. Este método de ajuste se reduce al de mı́nimos cuadrados
sencillo si todos los σi son iguales.
Minimizar χ2 para un ajuste a una recta da las mismas ecuaciones que antes, (21.52) para
m y c y (21.53) para σm y σc , si los promedios se sustituyan por promedios ponderados.
Por ejemplo,
N N
1
N
 yi   1
y= yi se sustituye por y= , (21.56)
N i=1 i=1
σi2 i=1
σi2
568 Capı́tulo 21. Probabilidad y estadı́stica

y en las ecuaciones (21.53)


 
N

σ2 1
se sustituye por 1 . (21.57)
N i=1
σi2

Los ajustes a otros tipos de funciones se obtienen de la misma forma, pero conducen
a expresiones más complicadas. El método puede generalizarse también a más de dos
variables.
El uso de la ecuación (21.55) se justifica considerando la distribución normal (21.37)
para errores aleatorios. Si los errores en yi son aleatorios y si f (xi ) es el valor exacto (no
conocido) de y para x = xi , entonces

1
ρ(i ) = √ e− /2σ
2 2
i i
(21.58)
σi 2π

es la densidad de probabilidad para el error i = yi − f (xi ). Si los errores son indepen-


dientes, la densidad de probabilidad total para los N valores 1 , 2 , . . . , N es el producto
−1 
N  2 
√ 
N
1  i
ρ(1 )ρ(2 ) · · · ρ(N ) = 2π σi exp −
i=1
2 i=1 σi
−1  
√  N
1 2
= 2π σi exp − χ . (21.59)
i=1
2

Si se sustituye la función exacta f (x) por una función aproximada, la expresión (21.59)
es una medida de la bondad del ajuste, y la bondad es máxima cuando χ2 es mı́nimo.

Regresión

El ajuste de datos a funciones se llama a menudo regresión en estadı́stica. Las curvas


en torno a las cuales se agrupan los puntos se llaman ‘curvas de regresión’, y sus ecua-
ciones son las ‘ecuaciones de regresión’. La regresión a una recta se denomina lineal.
El nombre tiene su origen en los estudios de Galton6 sobre herencia en los cuales en-
contró que los padres cuya estatura se desviaba de la estatura media de todos los padres
tenı́an, en promedio, hijos cuyas estaturas se desviaban de la estatura media de todos los
hijos en una cuantı́a menor. Llamó a esto una ‘regresión a la mediocridad’, y el término
se usa ampliamente, especialmente en las ciencias sociales. El tipo de datos que intere-
san en las ciencias fı́sicas y el propósito de su análisis estadı́stico son de una naturaleza

06. Francis Galton (1822–1911), nacido en Birmingham. Descubrió la importancia de los anticiclones
en meteorologı́a e influyó en la creación del Meteorological Office y del National Physical Laboratory. Se
le conoce sobre todo por su trabajo sobre herencia. Acuñó el término ‘eugenesia’ y abogó por aplicar la
selección cientı́fica a las poblaciones humanas.
21.11. Ejercicios 569

bastante distinta. El término regresión es totalmente inadecuado como descripción de los


usos de la estadı́stica en quı́mica.

21.10. Estadı́stica muestral

En todo experimento concreto, el número de medidas, el tamaño de la muestra, es ne-


cesariamente finito de manera que a partir de los estadı́sticos de la muestra se obtienen
únicamente estimaciones sobre la población o la distribución objetivo. Ası́ por ejem-
plo, la media muestral definida por la ecuación (21.2) es una estimación de la media
poblacional

1
N

µ≈x= xi , (21.60)
N i=1

y la varianza y la desviación tı́pica definidas por las ecuaciones (21.5) y (21.6) son esti-
maciones de la varianza y de la desviación tı́pica poblacionales

1
N

σ 2 ≈ s2 = (xi − x) .
2
(21.61)
N i=1

Las consideraciones sobre la ‘mejor estimación’ en teorı́a muestral nos indican que,
si bien (21.60) es la mejor estimación de µ que se puede obtener de la muestra, (21.61)
subestima la mejor estimación de la varianza en un factor (N−1)/N, y ha de ser sustituida
por la estimación corregida

1 
N

σ 2 ≈ s2 = (xi − x) .
2
(21.62)
N − 1 i=1

Ambas estimaciones de σ dadas por (21.61) y (21.62) se distinguen a menudo de-


notándolas respectivamente por sN y sN−1 (o por σN y σN−1 , como en muchos de los
modelos más usados de calculadoras de bolsillo). Se recomienda al lector que comprue-
be siempre qué versión especı́fica de la desviación tı́pica se usa en cualquier trabajo o
aplicación estadı́sticos. La corrección afecta poco a la estimación de σ si N es gran-
de, pero puede ser significativa para muestras pequeñas, digamos que para N < 10, y
siempre es más seguro utilizar (21.62).

EJEMPLO 21.14 Una muestra muy pequeña

Para la muestra de tres valores x1 = a − b, x2 = a y x3 = a + b, la media es x = a y las dos versiones de


s2 dan
1 2  2 1 2 
s2N = b + 0 + b2 = b2 , s2N−1 = b + 0 + b2 = b2 .
3 3 2
570 Capı́tulo 21. Probabilidad y estadı́stica

21.11. Ejercicios

Apartado 21.1

1. Los siguientes datos consisten en el número de caras obtenidas al lanzar 10 veces una moneda:
5, 5, 4, 4, 7, 4, 3, 7, 6, 4, 2, 5, 6, 4, 5, 3, 5, 4, 2, 6, 7, 2, 4, 5, 6,
5, 6, 4, 3, 4, 4, 5, 5, 6, 7, 5, 3, 6, 5, 5, 6, 7, 9, 4, 7, 9, 8, 8, 5, 10.
(i) Construya una tabla de frecuencias y un diagrama de barras para las frecuencias.
(ii) Calcule la media, la moda y la mediana.
(iii) Calcule la varianza y la desviación tı́pica.

2. Los siguientes datos consisten en las notas sobre 100 obtenidas por 60 estudiantes en un examen:
66, 68, 70, 48, 56, 54, 48, 47, 45, 53, 73, 60, 68, 75, 61, 62, 61, 61, 52, 59,
58, 56, 58, 69, 48, 62, 72, 71, 49, 69, 59, 48, 64, 59, 53, 62, 66, 55, 41, 66,
60, 38, 54, 69, 60, 53, 60, 64, 57, 54, 73, 46, 73, 58, 50, 66, 37, 60, 47, 70
(i) Construya un histograma de frecuencias con clases de ancho 4.

(ii) Calcule la media, la moda y la mediana (a) para los datos sin agrupar, (b) para los datos agrupados.

3. Calcule x, x2 , x3 y s para los datos del Ejercicio 1. Calcule a partir de ellos el coeficiente de asimetrı́a.

Apartados 21.2 y 21.3


4. Un conjunto de 10 bolas consiste en 6 bolas rojas, 3 azules y 1 amarilla. Si se saca una bola al azar,
halle la probabilidad de que (i) sea roja, (ii) sea amarilla, (iii) no sea azul.

5. Halle las probabilidades para los siguientes resultados totales de 3 lanzamientos de un dado: (i) 8, (ii)
8 ó 12, (iii) más de 15.

6. Una partı́cula puede estar en tres estados con energı́as 0 , 1 y 2 (0 < 1 < 2 ), y con distribución de
probabilidades Pi = e−i /kT /q a temperatura T.
(i) Exprese la función de partición q en función de T y de las energı́as.

(ii) Halle la distribución de probabilidades (a) en el lı́mite T → 0, (b) en el lı́mite T → ∞.

(iii) Halle la distribución de probabilidades (combinadas) para un sistema de tres partı́culas independientes.

Apartado 21.4

7. Halle la probabilidad de obtener al menos 3 caras al lanzar (i) una moneda neutral, (ii) una moneda
con probabilidad 0,6 de que salga cruz.

8. Un sistema que puede hallarse en distintos estados con energı́as E0 < E1 < E2 < · · · tiene proba-
bilidad 0,1 de estar en un estado excitado (con E > E0 ). Halle la probabilidad de que en 10 observaciones
independientes, el sistema se encuentre en el estado fundamental (con E = E0 ) (i) todas las veces, (ii) sólo
5 veces, (iii) por lo menos 8 veces.
21.11. Ejercicios 571

Apartado 21.5

9. Indique todas las permutaciones de 5 objetos distintos tomados de 2 en 2.

10. Indique todas las combinaciones de 5 objetos distintos tomados de 2 en 2.

11. Indique todas las permutaciones diferentes de los 5 objetos A, A, A, B y B.

12. ¿Cuál es el número de permutaciones diferentes de 8 objetos compuestos de 4 de tipo A, 3 de B y 1


de C?

13. Suponiendo un suministro inagotable de los objetos A, B y C, ¿cuál es el número de permutaciones


diferentes de ellos tomándolos de 8 en 8?

14. Sean 3 partı́culas distinguibles, cada una de ellas pudiendo estar en un nivel de energı́a cualquiera
de 4 posibles con energı́as (diferentes) E1 , E2 , E3 y E4 . (i) ¿De cuántas maneras se pueden distribuir las
partı́culas entre los estados? (ii) ¿cuántos estados del sistema tienen energı́a total igual a E1 + E2 + E4 ?

15. Repita el Ejercicio 14 con 3 electrones.

Apartado 21.6
16. La variable x puede tomar cualquier valor en el rango continuo 0 ≤ x ≤ 1 con función de densidad de
probabilidad ρ(x) = 6x(1 − x). (i) Deduzca una expresión para la probabilidad P(x ≤ a), de que el valor de
x no sea mayor que a. (ii) Compruebe que P(0 ≤ x ≤ 1) = 1. (iii) Halle el valor medio x y la desviación
tı́pica σ. (iv) Halle la probabilidad de que x − σ ≤ x ≤ x + σ.

17. La variable r puede tomar cualquier valor en el rango r = 0 → ∞ con función de densidad de
probabilidad ρ(r) = 4r2 e−2r . Deduzca una expresión para la probabilidad P(0 ≤ r ≤ R) de que el valor de
la variable no sea mayor que R.

18. Compruebe que ρ(r) del Ejercicio 17 es la función de densidad radial (en unidades atómicas) del or-
bital 1s del átomo de hidrógeno. Halle (i) el valor medio r, (ii) la desviación tı́pica σ, (iii) el valor de r
más probable.

Apartado 21.9
19. Halle el ajuste a una recta para los puntos siguientes:

x 1 2 3 4 5 6 7 8 9 10 11 12

y 4,4 4,9 6,4 7,3 8,8 10,3 11,7 13,2 14,8 15,3 16,5 17,2

20. Los resultados de las medidas de la constante cinética de la descomposición de un compuesto orgánico
en un rango de temperaturas son:

T/K 282,3 291,4 304,1 313,6 320,2 331,3 343,8 354,9 363,8 371,7

k/10−3 M−1 s−1 0,0249 0,0691 0,319 0,921 1,95 5,98 19,4 57,8 114, 212,
572 Capı́tulo 21. Probabilidad y estadı́stica

La dependencia de la constante cinética con la temperatura viene dada por la ecuación de Arrhenius
k = Ae−Ea /RT , ó ln k = −Ea /RT + ln A, donde la energı́a de activación Ea y el factor de proporcionalidad
A pueden suponerse constantes para todo el rango experimental de temperaturas. Una representación gráfica
de ln k frente a 1/T deberı́a ser por lo tanto una lı́nea recta.

(i) Construya la tabla de los valores de 1/T y ln k, determine el ajuste lineal por mı́nimos cuadrados de los
datos suponiendo que sólo hay error en k y calcule los valores más adecuados de Ea y de A.

(ii) Suponiendo que los errores en ln k son todos iguales a σ = 0,1, use las ecuaciones (21.53) para hallar
estimaciones de los errores de Ea y de A.
Æ  
   

Integrales indefinidas

Por sencillez se ha omitido de la tabla la constante de integración.

 
xn+1
xn dx = (n = −1) cotg x dx = ln sen x
n+1 ⎧
 x
(ax + b) n+1
 ⎪

(ax + b)n dx = (n = −1) ⎨ ln tg 2
a(n + 1) cosec x dx =
 ⎪
⎪ 1 1 − cos x
dx ⎩ ln
dx = ln x 2 1 + cos x
x π

⎪ x
  ⎪ ln tg +
dx 1 ⎨ 4 2
= ln (ax + b) sec x dx =
ax + b a ⎪
 ⎩ 1 ln 1 + sen x

ln x 1 2 1 − sen x
dx = (ln x)2 
x 2
  eax sen bx dx

xn+1 1
xn ln x dx = ln x −  
n+1 n+1 a sen bx − b cos bx
= eax
 a2 + b2
(n = −1)
 eax cos bx dx
e dx = e
x x
 
 a cos bx + b sen bx
= eax
eax+b dx =
1 ax+b
e  a2 + b2
a 1
sen x dx = (x − sen x cos x)
2
 2
sen x dx = − cos x 
1
cos2 x dx = (x + sen x cos x)
 2
1 
sen (ax + b) dx = − cos (ax + b)
a tg2 x dx = tg x − x

cos x dx = sen x 
cotg2 x dx = − cotg x − x

cos (ax + b) dx =
1
sen (ax + b) 
a sec2 x dx = tg x


tg x dx = − ln cos x
cosec2 dx = − cotg x
574 Apéndice. Integrales estándar
  x
dx
sen ax sen bx dx √ = arccosh
 x − a
2 2 a
 
1 sen (a − b)x sen (a + b)x
= − x2 − a2 dx
2 a−b a+b
(a = b) x x
 a2
=− arccosh + x2 − a2
cos ax cos bx dx  2 a 2
dx  x
√ = arcsenh
  a +x
2 2 a
1 sen (a − b)x sen (a + b)x
= + 
2 a−b a+b
a2 + x2 dx
(a = b)

a2 x x
sen ax cos bx dx = arcsenh + a2 + x2
 2 a 2
 
1 cos (a − b)x cos (a + b)x arcsen x dx = x arcsen x + 1 − x2
=− +
2 a−b a+b

(a = b) arccos x dx = x arccos x − 1 − x2

dx x
= tg 
1 + cos x 2
arctg x dx

dx x
= − cotg
1 − cos x 2 1 
= x arctg x − ln 1 + x2
  2
senh x dx = cosh x arccotg x dx

cosh x dx = senh x 1 
= x arccotg x + ln 1 + x2
 2
 dx

tgh x dx = ln cosh x a + bx + x2

  
b
cotgh x dx = ln senh x = ln x + + a + bx + x 2
2
  
 x dx 2x − b
dx 1 √ = arcsen √
= arctg a + bx − x2 b2 + 4a
+x
a2 2 a a



dx
dx 1
a + x

= ln

ax2 + bx + c
a2 − x2 2a
a − x

 x ⎧

dx ⎪ 1
p + q

√ = arcsen ⎪
⎪ ln

si b2 > 4ac
a2 − x2 a ⎨ 2aq
p − q

=  
 ⎪



1
arctg
p
si b2 < 4ac
a2 − x2 dx aq q

2

x x b
b − 4ac

a2 donde p = x + , q2 =

= arcsen + a2 − x2 2a 4a2

2 a 2
Fórmulas de reducción 575

Integrales definidas

 ∞  a
n! 1 2
xn e−ax dx = a2 − x2 dx = πa
0 an+1 0 4
  ∞

−ax2 1 π sen ax π
e dx = dx = , (a > 0)
0 2 a 0 x 2

  ∞

1 · 3 · · · (2n − 1) π cos ax − cos bx b
x e 2n −ax2
dx = dx = ln
2n+1 an a 0 x a
0

  ∞
∞ b
x2n+1 e−ax dx =
2 n! e−ax sen bx dx =
2an+1 0 a2 + b2
0

  ∞
a
π a

dx
= e−ax cos bx dx =
a2 − x2 2 0 a2 + b2
0

 π  π
π
sen2 nx dx = cos2 nx dx = (n = 0, n entero)
0 0 2
 π
sen mx sen nx dx = 0 (m = n, m y n enteros)
0
 π
cos mx cos nx dx = 0 (m = n, m y n enteros)
0
 π
sen mx cos nx dx = 0 (para todos m y n enteros)
0

Fórmulas de reducción

 
xn eax n
x e dx =
n ax
− xn−1 eax dx
a a
 
sen x cosn−1 x n−1
cosn x dx = + cosn−2 x dx
n n
 
cos x senn−1 x n−1
senn x dx = − + senn−2 x dx
n n
⎧ 
⎪ senm+1 x cosn−1 x n−1
 ⎪
⎨ + senm x cosn−2 x dx
m+n m+n
sen x cos x x dx =
m n

⎪ senm−1 x cosn+1 x
⎪ m−1
⎩− + senm−2 x cosn x dx
m+n m+n
   
 

Capı́tulo 1 48. trabajo, J = kg m2 s−2


49. presión, Pa = kg m−1 s−2
Apartado 1.2 50. carga, A s = C
1. 3/8 2. 1/2 3. 1/28 4. −11/18 51. potencial eléctrico, kg m2 A−1 s−3
5. 5/8 6. −1/8 7. −1/2 8. −3/8 52. densidad de flujo magnético,
9. 1/8 10. 3/8 11. 3/2 12. 5/9 T = kg A−1 s−2
13. −3/8 14. −3/8 15. 3/8 16. 15/16 53. 103 m−3 54. 104 m s−2
17. 2/5 18. 1/6 19. −15/16 20. −15/16 55. kg m−3 56. 10−6 kg m s−2
21. 15/16 57. 1017 kg m−1 s−2
58. 10−1 kg m s−3 A−1
Apartado 1.3 59. 102 kg m2 s−2 60. mol m−3

22. 0,01, 0,002, 0,000005, 302,0003


23. 0,22 . . . , 0,166 . . . , 4,33 . . . , Capı́tulo 2
0,047619047619 . . .
24. 0,1428572 > 1/7 > 0,1428571, Apartado 2.1
0,2222223 > 2/9 > 0,2222222,
1. (i) 2 (ii) −4 (iii) 11
0,09090910 > 1/11 > 0,09090909,
2. (i) −1 (ii) 4 (iii) −2
3,141593 > π > 3,141592,
3. (i) 6 (ii) −4 (iii) 6
2,718282 > e > 2,718281
4. 1/2 5. a2 + 3a − 4 6. 6x + 1
25. 120, 720, 5040, 40320, 362880,
7. (i) −7 (ii) −1 (iii) −13
3628800
26. 3, 120, 10 Apartado 2.3
Apartado 1.6 8. 2x + 4 9. x2 − 3x

27. a5 28. 1 29. a−1 30. a 31. a9 10. 2x2 − x − 6 11. 2x3 − 11x2 − x + 30
32. a12 33. a−6 34. a8 35. a5/6 36. a3 12. x(2x + 3) 13. (x + 2)(x − 2)
37. a2 b4 38. (a2 + b2 )1/2 39. ±3 40. 4 14. (2x + 3)(2x − 3) 15. (x + 5)(x + 1)
41. 8 42. 3−4 = 1/81 1 x+2
16. 17.
3x + 2 x+4
18. x + 2 19. x + 1
Apartado 1.7 x2 + 3x + 2 2x − 1
20. 2 21.
x +x+2 x−2
43. densidad, kg m−3
44. concentración, mol m−3
Apartado 2.4
45. aceleración, m s−2
46. momento, kg m s−1 22. x = y + 2

47. fuerza, N = kg m s−2 23. x = ± y2 − 1, y ≥ 1
578 Soluciones de los ejercicios

√ 10 2 1
24. x = ± y − 1, y ≥ 1 52. + −
y 9(x − 1) 3(x − 1)2 9(x + 2)
25.
1+y
3 + 2y 1+y
26. 27.
3y − 2 1 − 2y Apartado 2.7
 
pVm
28. B = Vm −1 54. (x, y) = (2, 1) ; se cortan
RT
 0 2 55. (x, y) = (7/13, 4/13) ; se cortan
Λm − Λm
29. c = 56. inconsistente ; rectas paralelas
K 1 2
57. (x, y) = (1 ± √ , ± √ ); la recta y la
θ 3 3
30. p =
K(1 − θ) curva se cortan dos veces
58. (x, y) = (1, 0) doble ; la recta y la
curva se tocan
Apartado 2.5 59. compleja ; la recta y la curva no se
tocan
32. 1 + 2x + 3x2 33. 1 + 2x + 3x2
2 6 12 60. las 3 rectas se cortan en (x, y, z) =
34. + 2 + 3 35. 1 + x + 2x4 + 6x9
x x x
√ (2, −2, −1)
36. Dibuje la recta de Λm frente a c.
Entonces −K es la pendiente y Λ0m el
corte con el eje. Capı́tulo 3
r − 1
37. Dibuje la recta de frente a
ρ(r + 2) Apartado 3.1
1
. Se obtiene µ2 de la pendiente y α 1. c = 13,
T
del corte con el eje. 12 5
sen A = , cos A = ,
38. 1, 2 39. 1/2, −2 13 13
12 13
40. −1/2 (doble) 41. 1/2, −2 tg A = , cosec A = ,
 5 12
1 7 1 i 13 5
42. ± 43. ± √ secA = , cotgA =
2 12 2 12 5 12
   5 12
1 y+1 sen B = , cos B = ,
44. −1± 1+8 13 13
4 y−1 5 13
  tg B = , cosec B = ,
Ka 4c 12 5
45. α = 1+ −1 13 12
2c Ka secB = , cotgB =
12 5
π 87π 2π 13π
2. , , ,
Apartado 2.6 36 180 3 9
3. 18◦ , 67,5◦ , 157,5◦ , 20,25◦
7 1 1
46. 2 − 6. (i) √ , − √ , −1
x+3 2 2
26 1 1
47. 3x2 − 8x + 15 − 6. (ii) − √ , − √ , +1
x+2 2 2
48. (ii) x = 1, −2/3 1 1
6. (iii) − √ , √ , −1
47. (iii) (x − 1)2 (3x + 2) 2 2
49.
1

1 7. (i) π (ii) 2π/3 (iii) 2π
3(x − 1) 3(x + 2)
2 1
50. +
3x 3(x + 3) Apartado 3.2
4 3 √
51. −
x+2 x+1 8. c = 5,
Soluciones de los ejercicios 579
 1
A = arcsen √ ≈ 26,57◦ , 10. (iii) ln 32 (iv) ln 2
5
π 25. (i) ln x 2
(ii) ln (2x − 3)
B=π− − A ≈ 108,43◦
4 10. (iii) 0 (iv) x (v) x2
9. (i) 2 sen 2θ cos 2θ  
RT p
26. h = − ln
9. (ii) cos2 2θ − sen2 2θ Mg p0
 − 
10. (i) cos 2θ cos 3θ − sen 2θ sen 3θ p◦
27. p = exp [(µ − µ−

)/RT]
10. (ii) cos 2θ cos 3θ + sen 2θ sen 3θ γ

11. 1 − 8 sen2 x + 8 sen4 x


1
12. (i) ( sen 8x − sen 2x)
2 Capı́tulo 4
1
10. (ii) ( cos 2x − cos 8x)
2 Apartado 4.3
13. 0,9396
nπ 1. x = 1, esencial
14. , n = ±1, ±3, ±5, . . .
6 2. x = 0, evitable
3. x = −3, evitable
Apartado 3.3 4. x = 3, esencial; x = 0, evitable
 3 3√3  3 3√3 5. x = 0, esencial
16. (i) , (ii) − , 6. x = 0, evitable
2 2  2 2 2

17. (i) 13, arctg − ≈ −33,7◦ 7. x = 0, esencial
√  2 3
10. (ii) 13, arctg + π ≈ 213,7◦
3 Apartado 4.4

Apartado 3.4 8. 1/3 9. 1 10. 1/2 11. 0


12. ∞ 13. ∞ 14. − ln 2
π π π
19. , , , π 15. − ln 3 16. 2 17. 0 18. 0
6 2 3
1
20. arcsen ≈ 14,48◦ ,
4
 
1 Apartado 4.5
arcsen = 30◦ ,
2
  19. 3x2 20. 0 21. 8
3
arcsen ≈ 48,59◦ , 22. 4x + 3 23. −4/x3
4
arcsen (1) = 90◦
Apartado 4.6
Apartado 3.5 24. 6x2 − 8x 25. 3x1/2
26. x−2/3 27. −2x−3/2
x x2 x3 x4 √
22. (i) 1 − + − + 28. −9/2 x5 29. 5(1 + x)4
3 18 162 1944
x5 x 2x
− (ii) 0,71653 30. √ 31.
29160 2+x 2 (3 − x 2 )2
23. (i) ni /nj = e (i −j )/kT
(ii) 1 −3(4x − 3)
32.
2(2x2 − 3x − 1)3/2
2
33. −2e−2x 34. (4x − 3)e2x −3x+1
Apartado 3.6 4x − 3
35. 36. 4 cos 4x
2 2x2 − 3x + 1
24. (i) ln 6 (ii) ln
3
580 Soluciones de los ejercicios

37. 2sec2 2x Apartado 4.9


38. −(4x − 3) sen (2x − 3x + 1)
2
65. y = 15x4 + 16x3 − 9x2 + 2x − 2
39. cos x e sen x
40. − tg x
2 y = 60x3 + 48x2 − 18x + 2
41. 6x sen (3x2 + 2)e− cos (3x +2)
1 1 y = 180x2 + 96x − 18
42. + y = 360x + 96, y = 360
2+x 3−x
2 cos 2x + 2 sen x cos x 1 1 2 6
43. 66. , − 2 , , − 4
sen 2x + sen2 x x x x3 x

3x2 (– 1)n/2 2n cos 2x (n par)
44. 6x(2 + x)1/2 + 67. y(n) =
2(2 + x)1/2 (n+1)/2 n
(– 1) 2 sen 2x (n impar)
45. cos x cos 2x − 2 sen x sen 2x
46. 4sec2 4x cos2 2x − 4 tg 4x sen 2x cos 2x
2
47. (2x + 4x3 )e2x +3 Apartado 4.10
4x3 + 15x2 + 2 68. (x, y) = (3/2, −5/4) mı́n
48. −
(2x + 5)2
69. (3, 0) mı́n; (5/3, 32/27) máx;
12x + 3x3 2
49. 50. √ (7/3, 16/27) inflexión
(2 + x2 )3/2 1 − 4x2 70. (0, 3) mı́n; (– 1, 5) máx;
2x 1
51. 52. √ (– 1/2, 4) inflexión
1 + x4 x(1 + x)
  71. (0, 3) máx; (2, −13) mı́n;
1 −V 3 (1/2, 11/4) inflexión
53. 54.
4y − 3 nRT(V + 2nB) 72. (a) A = De Re12 , B = 2De Re6
(V − nb)2  12  6
55. − Re Re
nRT (b) U(R) = De −2

−1 R R
nRT 2n2 a   
56. − + 2kT 1 k2
(V − nb)2 V3 73.
m
74. (a)
k2 − k1
ln
k1

Apartado 4.7 Apartado 4.11


x 3 + 2x 1 − y/x 75. v = ṡ = 4t − 3; a = s̈ = 4
57. − 58. − 59.
y 3y2 1 + ln xy
2xy − 3
2 76. θ̇ = 3t2 − 3t − 1; θ̈ = 6t − 3
60.
2y − 2/y2 − 2x2 y
Apartado 4.12
Apartado 4.8 77. dy = 2dx 78. dy = (6x + 2)dx
−7  3 − x 1/3
61. 79. dy = cos xdx 80. dV = 4πr2 dr
3(3 − x)(4 + x) 4 + x
 2x 1 2
62. + −
1 + x2 2(x − 1) 2x + 1
6x + 2 Capı́tulo 5

3(3x + 2x − 1)
2
Apartado 5.2
(1 + x2 )(x − 1)1/2
× x4
(2x + 1)(3x2 + 2x − 1)1/3 1. 2x + C 2. + x2 + 3x + C
1 2
2sec2 2x 1 3
63. cotg x − 6x tg (x2 + 1) + 3. 3x + 2 ln x − + C 4. x5/3 + C
2 3 tg 2x x 5
3 2/3 1 3x
× sen1/2 x cos3 (x2 + 1) tg1/3 2x 5. x + C 6. e + C
2 3
Soluciones de los ejercicios 581

3 1 Capı́tulo 6
7. − e−2x + C 8. − cos 4x + C
2 4 
9. ln C(x − 1) 10. ln
C Apartado 6.2
3−x 1
x3 1. (6x − sen 6x) + C
11. + 3x − 18 12
3 1
2. − cos 6x + C
12
1
Apartado 5.3 3. − ( cos 5x + 5 cos x) + C
10
3 5 1
12. 2 13. 14. ln 4. (2 cos 2x − cos 4x) + C
8 4 8
1  −3
1
15. e − e−15 16. 0 5. (2 sen 2x − sen 4x) + C
3 8
1 40 3 1
17. − 18. 19. 20. 6.
1
(3 sen 7x + 7 sen 3x) + C
2 3 2 3 42
3
21. ln 2 22. ln π 2
2 7. 8. 0 9. −
4 4 3
24. γ = exp (bp2 /2RT) 25.
3
26. (i) impar (ii) par (iii) par
Apartado 6.3
26. (iv) impar (v) impar (vi) par
1
26. (vii) ninguna de las dos cosas; 11. (3x + 1)6 + C
18
26. par: 3x2 + 1; impar: 2x
1
26. (viii) ninguna de las dos cosas; 12. − cos (4x − 1) + C
4
1  −x 
26. par: e + e+x ; 1 2 4
2 13. 3x + 2x + 5 + C
1  −x  8
26. impar: e − e+x (ix) par 3
2 14. −e−(x +2x)
+C
15. ln (x2 + x + 2) + C
Apartado 5.6 1
16. sen4 x + C
4
28. (i) +1 (ii) 66 (iii) 60
17. − ln ( cos x) + C
l3 l2 3l l5
29. (i) (ii) (iii) (iv) 2
3 3 4 80 18. (1 + ex )3/2 + C
3
19. ln ( ln x) + C
Apartado 5.7 1
20. − (4 − x2 )3/2 + C
3
30. 7 
k k 21. − 4 − x2 + C
31. (i) (x2 − 1) (ii) (x2 − 1)
2 2 1
k 2 k 22. (2x − 1)3/2 + C
31. (iii) (x − 1) (iv) − (x2 − 1) 3
m 2 1
23. (2x3 + 3x − 1)4/3 + C
31. (v) 0 (vi) estacionario 4
1
24. sen (3x2 − 1) + C
6
Apartado 5.8 25. − ln (1 − sen x) + C
1
32. (i) p(V2 − V1 ) 26. e2 sen x + C
  2
V2 − nb 1 x
31. (ii) nRT ln 27. arctg +C
V1 − nb 2 2
   
1 1 1
− na2 − 28. arcsen x − x 1 − x2 + C
V1 V2 2
582 Soluciones de los ejercicios

√ √ 
29. 2 x − arctg x +C (x + 4)2
58. ln +C
1 2 (x + 3)
30. ln 10 31. −4 32. 1 (x − 2)
6 3 59. ln +C
π 1 1 7 (3x + 1)
33. 34. 35.
4 2 2 (x − 2)4
60. x + ln +C
(x − 1)
1
Apartado 6.4 61. (7 ln (x + 1) − 26 ln (x + 2)
2
36. −x cos x + sen x + C +21 ln (x + 3)) + C
 2 
37. 3(x2 − 2) sen x − x(x2 − 6) cos x + C 1 x +3
62. ln +C
1 1 2 x2 + 4
38. (x + 1)2 sen 2x + (x + 1) cos 2x  √ 
2 2 1 x+2− 2
1 63. √ ln √ +C
− sen 2x + C 2 2 x+2+ 2
4
64. arctg (x + 2) + C
x2
39. (2 ln x − 1) + C 1
4 65. ln (x2 + 4x + 5)
( ln x + 1) 2
40. − +C −2 arctg (x + 2) + C
x
1 2
41. (2x − 2x + 1)e2x + C 66. x − 2 ln (x2 + 4x + 5)
4
1
42. − e−x ( sen 2x + 2 cos 2x) + C +3 arctg (x + 2) + C
5 ax  
e
(a cos bx + b sen bx) + C 1 x+2
43. 67. arctg (x + 2) + 2 +C
(a2 + b2 ) 2 x + 4x + 5
44. 1 45.
1
46. −
1  
1 + tg θ/2
4 9 68. ln +C
1   1 − tg θ/2
47. 2 − 3e−π
13  1/2 1
T 8kT 69. arctg (2 tg θ/2) + C
48. 49. 2
Θr πm
70. ln (1 + tg θ/2) + C

Apartado 6.5

1
50. senn x dx = − senn−1 x cos x
n
Capı́tulo 7

n−1
+ senn−2
x dx Apartado 7.2
n
sen6 x cos3 x sen6 x cos x 1. ur = 1 + 3(r − 1) = ur−1 + 3
52. +
9 21 2. ur = 3r = 3ur−1
sen4 x cos x 4 sen2 x cos x  r
− − 1 ur−1
105 315 3. ur = − =−
5 5
8 cos x
− +C 1 3 2 4 8
315 4. 0, , 1, 5. 1, , ,
 1/2 2 2 3 9 27
1 1 3kT
54. 55. 2 56. 1 1 1 1 1 1 1
60 T m 6. , , , 7. 1, , ,
3 8 15 24 2 6 24
8. 0 9. ∞ 10. 0 11. 1
Apartado 6.6 √
3 1+ 5
1 (2x − 1) 12. 0 13. 14.
57. ln +C 5 2
7 (x + 3)
Soluciones de los ejercicios 583

Apartado 7.3 9x2 9x3 27x4


54. 1 − 3x + − +
2 2 8
15. 325 16. 1093 8x 32x 3
32x4
n 1 55. −2 − − 4x2 − −
17. (11 − 5n) 18. (4n − 1) 3 5 3
2 3
  n  x3 x5 x7 x9
3 1 56. x + + + +
19. 1− 20. n2 x 2 6 24 120
2  3 ∞
x3 1 − x2n 1 − (2x)n 57. (1 − x) , 0 < x < 2
n
21. 22.
1 − x2 1 − 2x n=0


(x − 2)n
23. (i) 1, 3, 3, 1 (ii) 1, 4, 6, 4, 1 58. e 2
, para todo x
n=0
n!
23. (iii) 1, 6, 15, 20, 15, 6, 1
(x + 1)3 (x + 1)5
24. 1 − 3x + 3x − x2 3
59. (x + 1) − + − ··· ,
3! 5!
25. 1 + 12x + 54x2 + 108x3 + 81x4 para todo x
 ∞  n
1 2−x
26. 1 − 20x + 160x2 − 640x3 60. ln 2 − , 0<x≤4
n=1
n 2
+1280x4 − 1024x5

1  v 2 3  v 4
27. 81 − 216x + 216x2 − 96x3 + 16x4 61. E = m0 c2 1 + +
2 c 8 c

28. 729 + 1458x + 1215x2 + 540x3 5 v 6
+ + ···
10 16 c
+135x4 + 18x5 + x6 29.
11 1
lim (E − m0 c2 ) = m0 v2
v/c→0 2
Apartado 7.4 a
62. (i) 1, b − , b2
 −1 RT
34. 1 − e−θv /T a ab a2
23. (ii) 1, b − , b2 − + 2 2
RT RT 2R T

Apartado 7.5
Apartado 7.7
35. converge 36. diverge
x x2 5x3 5x4
37. converge 38. converge, para todo a 63. (i) 2 + − + −
12 288 20736 248832
39. diverge 40. diverge 23. (ii) 2,0800821

41. converge 42. diverge 23. (iii) 2,0800832 < 3 9 < 2,0800840
2 1
64. 1 65. 66. −2 67.
3 2
Apartado 7.6
43. 4 44. 1 45. 1

46. 1 47. 0 48. 1 + 3 Capı́tulo 8
x x2 5x3 10x4
49. 1 + − + − Apartado 8.2
3 9 81 243
50. 1 − x2 + x4 − x6 + x8 1. 6 − 2i 2. 4 3. 6i
x 3x 2
5x 3
35x 4 4. 18 + 4i 5. −8 − 6i 6. 41 − 38i
51. 1 + + + +
2 8 16 128 5 3
7. 10 8. −i 9. − i
1 x x2 x3 x4 34 34
52. − + − + 5 12 12 24
3 9 27 81 243 10. + i 11. + i
4x6 4x10 8x14 4x18 13 13 25 25
53. 2x −
2
+ − + 12. (i) 3 + 2i (ii) 2 + 3i
3 15 315 2835
584 Soluciones de los ejercicios

1 7
(iii) (3 + 2i) 38. −1 39. −2i 40. π
13 12

13. ±1 + 2i 14. 1 ± i 3 5 3
41. π 42. π 43. 144
√ 1 √ 12 2
15. −2, 1 ± i 3 16. 3, −3 ± i 3 27 −iπ/3 4 iπ/3
2 44. e 45. e
4 27
 √   
Apartado 8.3 3 3 3 √
46. (i) − 1 +i + 3
√ 2 2
π  √   
17. 2, − 3 3 3 √
4   23. (ii) +1 +i − + 3
√ 1 2 2
18. 5, π + arctg −
2 48. cos a cosh b − i sen a senh b
π
19. 2, − 50. (ii) C = A + B, D = i(A − B)
 3  
3 1
20. , π + arctg √
2 2
π π
Apartado 8.6
21. 2, − 22. 3, 0 23. 3, 1
6

2 51. ±1, ±i 52. ± √ (1 + i)
π π π 2
24. 1, −
2
25. 2 cos + i sen
2 2 √  π π
53. −1 + i, 2 cos + i sen ,
26. 3( cos π + i sen π)  12  12
√   π  π √ 7π 7π
27. 2 cos − + i sen − 2 cos − i sen
4 4 12 12
 π
28.
π
2 cos + i sen 1 √ 1 √
6 6 54. ±i, ± 3+i , ± 3−i
  2 2
3π 3π
29. 6 cos + i sen
4 4
  Apartado 8.7
4π 4π
30. 4 cos + i sen 55.
1
56.
6
3 3 5 65
 
5π 5π
31. (i) 6 cos + i sen
6 6
2  π π
23. (ii) cos + i sen Capı́tulo 9
3 6 6
3  π π
23. (iii) cos − i sen Apartado 9.1
2 6 6
 
17π 17π 1. (i) 0 (ii) 16 (iii) 36
32. (i) 5 cos + i sen
12 12 3
 (ii) −
π
2. (i) 1 (iii) 2
π 2
23. (ii) 5 cos + i sen
12 12
1 π π Apartado 9.3
23. (iii) cos − i sen
5 12 12
1 3. 4x, −2y 4. 2x − 3, 4y + 2
33. (i) 81i (ii) − i 5. 2e 2x+3y
, 3e 2x+3y
81
35. 128 cos8 θ − 256 cos6 θ 6. 2x cos (x2 − y2 ), −2y cos (x2 − y2 )
2
+160 cos4 θ − 32 cos2 θ + 1 7. [2x cos (xy) − y sen (xy)]ex ,
2
−xex sen (xy)
Apartado 8.5 ∂z
8. = 4xy − sen (x + y)
√ ∂x
3 3 1 3 ∂z
36. √ + √ i 37. − i = 2x2 − sen (x + y)
2 2 2 2 ∂y
Soluciones de los ejercicios 585

∂2z 27. −
1
(x dx + y dy + z dz)
= 4y − cos (x + y) r3
∂x2
∂ z
2 28. sen θ sen φ dr + r cos θ sen φ dθ
= − cos (x + y)
∂y2 +r sen θ cos φ dφ
∂ z2
∂ z2
= 4x − cos (x + y) =
∂x∂y ∂y∂x
Apartado 9.6
∂z
9. = [ sen (x + y) + cos (x + y)]ex−y y x b2 x − a2 y + abc
∂x 29. −2 + − 30.
∂z x y ab(x + y + z)
= [ − sen (x+y) + cos (x+y)]ex−y
∂y 31. (1 − sen u) cos (u + v)
∂ z
2 5x4 y nR
= 2 cos (x + y)ex−y 32. − 5 33.
∂x2 x − cos y V − nb
 
∂2z 2 y2 − x2
= −2 cos (x + y)ex−y 34.
∂y2 y
 
∂2z ∂2z x + 3y
= −2 sen (x + y)ex−y = 35. x cos y − sen y
∂x∂y ∂y∂x x+y
x y z 2x + yz
15. , , 17. −
r r r 2y + xz Apartado 9.7
 2

na 2n3 ab
18. nR p− 2 + , 42. exacto 43. no exacto 44. exacto
V V3
 
n2 a 2n3 ab
−(V − nb) p− 2 +
V V3 Apartado 9.8
64 √
46. (i) , (ii) 20 47. 31 48. − 5
Apartado 9.4 3

19. (1, 2) punto silla


  Apartados 9.9 y 9.10
2 4
20. − , máximo 2
3 3 49. 24 50. 1 − e−R
3
21. (1, 2) mı́nimo
40 a5 51
(– 1, 2) punto silla 51. 52. 53. −
3 15 2
22. (1, 2) mı́nimo
(– 1, −2) máximo Apartado 9.11
√ 1 π 315π π
(0, ± 3) puntos silla 54. +1 55. 56.
    4 4 8 8
1 2 2 1 2 2
23. , , , − ,− ,−
3 3 3 3 3 3
 
1 1 1
24. , ,
2 3 6 Capı́tulo 10
 
1 1
25. λ = α : √ , 0, − √ , Apartado 10.2
2 2
 
√ 1 1 1 1. 0, 0, 1 2. 0, 2, 0
λ = α ± 2β : ,±√ ,  
2 2 2 3 3 π
3. − , , −1 4. 1, , 0
2 2 2
π π
5. 1, ,
Apartado 9.5 2 2  
2
26. 2x dx + 2y dy 6. 3, arccos , arctg (2)
3
586 Soluciones de los ejercicios
 
8 1
7. 9, arccos − , arctg (– 4) 7. − cos 2x + ax + b
9 4
    8. x4 + ax2 + bx + c 9. 6 10. 2e4
6 3
8. 7, arccos , π + arctg 1 − cos 2πt
7 2 11. 5 12. x(t) = +t
    4π 2 m
12 4
9. 13, arccos − , π + arctg −
13 3
Apartado 11.3
−1
Apartado 10.3 13. y2 = 2x3 + c 14. y =
2x2 + c
3
10. r 11. r2 sen2 θ cos 2φ 15. y = cex 16. y3 = 3ex + c
 
12. tg2 θ 13. r2 3 cos2 θ − 1 1
17. y = 18. y = cx
1 + cex
x3
19. y = −x + 1 20. y2 + y = −x
Apartado 10.4 3
21. y = x − 1 22. y = − ln (2 − ex )
a2 b3 c4 1
14. 1 15. 16. 17. 1
24 2 23. y = x( ln x + 2)
 
4πa5 2πa2 1 1
18. 19. 20. 480π 24. y2 = − x2
5 3 3 x
√ x
2 25. y = 4x4 ln
4
22. 6 a0 23. √ 24. 180 2
81 π
27. y = cex − 2x − 5
28. (x − y)2 − 4y = c
Apartado 10.5
25. 2y3 z4 + 6x2 yz4 + 12x2 y3 z2 Apartado 11.4
 
n(n + 1) 2a(n + 1)
26. − + a rn e−ar
2
29.
1 1
− n−1 = (n − 1)kt
r2 r xn−1 a
e−r k1 a 
27. 30. x(t) = 1 − e−(k1 +k−1 )t
r  k1 + k−1
1 2 2
28. − − 2 e−r/3 sen θ sen φ
9 3r r Apartado 11.5
 
1 3
29. xze−r/2 − 1
2

4 r 32. y = 2 + ce−2x 33. y = ce2x −


4
34. y = e−3x (x + c)
Apartado 10.6 2
35. y = 2 (x2 sen x + 2x cos x
  x
πa4 R2
39. 40. πe−R +R+1 −2 sen x + c) 36. y = ce−1/x − 4
16 3
1 37. y = cos x + c cos2 x
41. πe−R (1 + R) b n+1
2 38. y = + ce−ax /(n+1)
a
xn+1
39. y = + cx−a
a+n+1
Capı́tulo 11
Apartado 11.2 Apartado 11.6

x3 e−3x ak1 k2 e−k1 t − e−k3 t


+c 6. − +c 40. [C] =
5.
3 3 k2 − k1 k3 − k 1
Soluciones de los ejercicios 587
√ π
e−k2 t − e−k3 t (ii) A = 2, δ =
− 4
k3 − k2


ak1 k2 1
41. [C] = 1 − e−k1 t Apartado 12.6
k2 + k 3 − k1 k1

1  2 nπx
− 1 − e−(k2 +k3 )t 17. (i) ψn (x) = cos si n impar,
k2 + k3 l l

2 nπx
ψn (x) = sen si n par
Apartado 11.7 l l

42. (i) I(t) = ce−t/RC


E0 ωC Apartado 12.8
31. (ii) I(t) = ce−t/RC +
1 + (ωRC)2 1 x
20. y = ae3x + be−2x − −
× (cos ωt + ωRC sen ωt) 4 2
21. y = e4x (a + bx)
1
− (1 + 9x + 12x2 + 8x3 )
32
Capı́tulo 12 1
22. y = ae3x + be−2x + e−3x
3
Apartado 12.2 23. y = ae2x + (b − x)e−x
 
x2
1. y = ae−2x + be2x/3 24. y = e4x a + bx +
2
2. y = e3x (a + bx)
25. y = ae3x + be−2x
3. y = a cos 2x + b sen 2x 1
− (5 cos 3x + sen 3x)
39 
Apartado 12.3 3x
26. y = a − cos 2x + b sen 2x
4
4. y = ae3x + be−2x 1 x 1
√ √ 27. y = ae3x + be−2x − − + e−3x
5. y = e2x (ae2 5x
+ be−2 5x
) 4 2 3
1
6. y = e4x (a + bx) − (5 cos 3x + sen 3x)
39
7. y = e−3x/2 (a + bx)
8. y = e−2x (a cos x + b sen x)
√ √
9. y = e−3x/2 (aei 11x/2
+ be−i 11x/2
) Capı́tulo 13
Apartado 13.2
Apartado 12.4
2 1 1. y = a0 (1 + x + x2 + x3 + · · · )
10. x = et + e−2t  
3 3 (3x)2 (3x)4
2. y = a0 1 + + + ···
1 2! 4!
11. x=e−3(t−1) (t − 1) 12. x= sen 3t  
3 a1 (3x) (3x)3 (3x)5
13. x = et ( cos t − sen t) 14. 2e−2x + + + + ···
 3 1! 3! 5!
b sen 3x (0 < x < π) = ae3x + be−3x
15. y =
0 (0 ≤ x, x ≥ π) con a0 = a + b, a1 = 3(a − b)
 x4
Apartado 12.5 3. y = a1 x + a0 1 − x2 −
3
  
b x6 x8
16. (i) A = a2 + b2 , δ = arctg − − − ···
a 5 7
588 Soluciones de los ejercicios

 x3 1 · 4x6
4. y = a0 1 + + Apartado 13.6
3! 6!
1 · 4 · 7x9 13. H6 (x) = 64x6 −480x4 +720x2 −120
+ + ···
9!
 2x4 2 · 5x7
+a1 x + + Apartado 13.7
4! 7!
2 · 5 · 8x10
14. r2 − n2 = 0, r = ±n
+ + ···
10!

Apartado 13.3
Capı́tulo 14
5. (i) r1 = −1, r2 = 3/2
 Apartado 14.2
23. (ii) y1 = x−1 a0 + a1 x + a2 x2 + · · ·
 a
23. y2 = x3/2 A0 +A1 x+A2 x2 + · · · 1. f = [ sen (bx + vbt) + sen (bx − vbt)]
2
6. (i) r1 = r2 = 0 2. V = A + Bx (c/D = 0)

23. (ii) y1 = a0 + a1 x + a2 x2 + · · · V = Aeαx + Be−αx α2 = c/D > 0
y2 = y1 ln x+A0 x+A1 x2 +A2 x3 + · · · V = A cos αx + B sen αx

7. (i) r1 = −2, r2 = −3 α2 = −c/D > 0

23. (ii) y1 = x−2 a0 + a1 x + a2 x2 + · · · 4. f = aeb(x−2t)
y2 = ky1 ln x  
 5. f = a exp [b x2 + y2 ]
+x−3 A0 + A1 x + A2 x2 + · · ·  
6. f = aeαx + be−αx
x2 x3 × (c cos αy + d sen αy) para (α = 0)
8. y1 = 1 + x + + + · · · = ex
2! 3!
y2 = ex ln x ó f = (a + bx)(c + dy)
senh 3πx
7. f = aebx−y/b 8. sen 3πy
senh 3π
πx
Apartado 13.4 9. T = 3 sen exp [ − Dπ 2 t/l2 ]
l
1
10. P6 (x)= 231x6 −315x4 +105x2 −5
16 Apartado 14.4
11. (1 − 2xh + h2 )−1/2   
8 lπx
1 10. ψlmn = sen
= 1 + xh + (3x2 − 1)h2 abc a
2  mπy  nπz
1 3 × sen sen
+ (5x − 3x)h3 + · · · b c
2  2 
h2 l m2 n2
= P0 (x) + P1 (x)h + P2 (x)h2 Elmn = + 2 + 2
8m a2 b c
+P3 (x)h3 + · · · para l, m, n = 1, 2, 3, 4, . . .
1
12. P14 = 35 cos3 θ − 15 cos θ sen θ Degeneración 1 si a, b, c son iguales,
2
15  3 si 2 iguales, 6 si todos distintos
P4 =
2
7 cos2 θ − 1 sen2 θ
2
P34 = 105 cos θ sen3 θ
Apartado 14.5
P44 = 105 sen4 θ
11. (i) E0,1 = 5,7831, E±1,1 = 14,6819,
Soluciones de los ejercicios 589

E±2,1 = 26,3744, E0,2 = 30,4715, Apartado 15.5


E±3,1 = 40,7070, E±1,2 = 49,2186 8l2  1  nπx
10. T(x, t) = sen
π n impar n
3 3 l
 
Apartado 14.7 × exp −Dn2 π 2 t/l2


nπx nπvt
15. y(x, t) = An sen cos
n=1
l l
∞ Apartado 15.6
nπx
16. T(x, t) = An sen e−iay − e−iby
n=1
l 11. g(y) = √
ix 2π
× exp [ − Dn2 π 2 t/l2 ]   
2 a


  12. g(y) =
17. u(x, y) = An enπx − e−nπx π a2 + y2
n=1
× sen nπy

Capı́tulo 16
Apartado 16.2
Capı́tulo 15 1
1. (i) b − a, a − b (ii) (a + b + c + d)
Apartado 15.2 4
aa3 a5 26. (iii)
1
(b + c)
1
1. c1 = 3 + + + ··· 2
3 5 7 26. (iv) b + λ(c − b), λ arbitrario
1 1 5
2. (i) P0 + P1 + P2
4 2 16

Apartado 16.3
Apartado 15.3 √ √
2. (2, 2, 0), 8 3. (2, −5, 1), 30
Q2 √ √
4. V = , Q2 = qr2 (3 cos2 θ − 1) 4. (2, 3, 1), 14 5. (– 1, 0, 3), 10
4π0 R3
6. 0, 0 7. Ambos (– 1, 5, −1)
 
1 2
Apartado 15.4 8. (3, 6, 9), (– 1, −2, −3), , ,1
3 3
1 2  cos x cos 3x cos 5x
5. (ii) + − + 9. (– 1, 0, 4) 10. Ambos (3, −6, 12)
2 π 1 3 5 √ √ √


cos 7x
+ ··· 11. 27, 14 + 29 12. (1, 1, 1)
7
 sen x 13. 2i − j 14. −2i + j
sen 2x sen 3x
6. (ii) 2 − +
1 2 3 15. (i) 4i (ii) λj
sen 4x
− + ··· 26. (iii) λi (λ arbitrario)
4
π2  cos x cos 2x 16. (i) (2, −1, 0) (ii) (1, −1, 1),
7. (ii) −4 −
3 12 22 (0, 0, 0), (– 2, 2, −2)
cos 3x
+ 2 − ··· 17. (i) 2i + 6j − 6k, (ii) i + 3j − 3k
3
 
8l2   πx 1 3πx 18. 2i + 6t j 19. ( − 2 sen 2t, 3 cos t, 2)
9. 3 sen + 3 sen
π l 3 l 20. (i) v = −3yi + 3xj + 3k,
  
1 5πx a = −9(xi + yj)
+ 3 sen + ···
5 l
590 Soluciones de los ejercicios

1 Capı́tulo 17
26. (ii) − √ (xi + yj); en el plano xy,
2
26. hacia el eje z.
Apartados 17.1 a 17.3
26. (iii) Circular en el plano xy con vel.
26. angular ω = 3, y en la dirección z con 1. 5 2. 6 3. 2 4. 1
26. vel. 3k; esto es, movimiento en una 5. (i) elemento menor cofactor
26. hélice a derechas en torno al eje z. (1, 1) −1 −1
(1, 2) 3 −3
(1, 3) −2 −2
Apartado 16.5 (2, 1) 5 −5
(2, 2) −2 −2
21. Ambos 7 22. 4 23. −6 (2, 3) −3 3
24. Ambos 10 25. (0, 12, 4) 26. 5 (3, 1) −2 −2
(3, 2) −7 7
27. 0 28. −3 29. 2
(3, 3) −4 −4
31. −1 32. π/3, 2π/3, π/4 26. (ii) −13 (iii) −13

33. (i) 5i − 5j (ii) 5 2 (iii) π/4 6. −11 7. 6 8. −4
34. (i) 4 (ii) −3 (iii) 0 35. −6 9. 30 10. 4 11. 144 12. 0

Apartado 16.6
Apartado 17.4
36. 9i − j + 3k, −9i + j − 3k
13. x = 1, y = 2, z = 3
37. 7i, 7 38. Ambos 11i − 2j − k
14. x = y = z = 0
39. 0 40. −7
15. w = x = y = 1, z = −1
41. −14j − 21k, i − 18j − 9k
16. x = (z + 3)/5, y = (7z − 4)/5,
45. 5 46. (i) (0, 0, −7) z arbitrario
26. (ii) (1, 0, 0) (iii) (0, −5, 0) 17. k = 1, x = z/3, y = −2z/3,
47. 5i + 6j 48. −3i + 18k z arbitrario
50. (i) ω = ωk (ii) v = −ωyi + ωxj 18. λ = 1, y = −x; λ = 3, y = x
 
26. (iii) l = mω[ x2 + y2 k − xzi − yzj] 19. λ = 3, y = 0, x = −z;
  √ √
52. l = 2m x2 + y2 ωk = Iω ω λ = 3 − 2, x = z, y = − 2z;
√ √
λ = 3 + 2, x = z, y = 2z
20. λ = 0 (doble);
Apartado 16.8
x = 3z − 2y, y, z arbitrarios;
53. 4xi + 6yj − 2zk λ = 8, x = −z, y = −2z, z arbitrario
54. (y + z)i + (x + z)j + (x + y)k
 −3/2
55. – x2 + y2 + z2 (xi + yj + zk)
Apartados 17.5 a 17.7
 
Apartado 16.9  3 2 −2 
 
21.  0 −3 7  = −225
56. 3, 0 57. 0, i + j + k 58. 0, 0  0 0 25 
Soluciones de los ejercicios 591
 
1 0 1 1  Capı́tulo 18

0 1 1 0 
22.  =1
0 0 −1 0  Apartado 18.2
0 0 0 −1  ⎛ ⎞
1 0  
  −5 4 2
2 4 6 3 1. ⎝−2 3 ⎠ 2.
  3 −1 −1
  3 4
0 −1 −10 1
23.   = −320 ⎛ ⎞
 3 0 0  
0 0 42 − 13
2  1 0

0
 3. ⎝ 0 2 0 ⎠ 4.
0 0 80  21 0 0 −1
−2 4

24. fila 1 = 3 × fila 3 ⎛ ⎞


  2
25. fila 1 = fila 2 + fila 3 5. 0 −3 1 6. ⎝ 5 ⎠
−2
28. ψ1 (x1 )ψ2 (x2 )ψ3 (x3 )ψ4 (x4 )
−ψ1 (x1 )ψ2 (x2 )ψ3 (x4 )ψ4 (x3 ) 7. imposible 8. −6 9. 4
10. imposible 11. 4 12. 4
+ψ1 (x1 )ψ2 (x3 )ψ3 (x4 )ψ4 (x2 )
−ψ1 (x1 )ψ2 (x3 )ψ3 (x2 )ψ4 (x4 )
+ψ1 (x1 )ψ2 (x4 )ψ3 (x2 )ψ4 (x3 ) Apartado 18.3
−ψ1 (x1 )ψ2 (x4 )ψ3 (x3 )ψ4 (x2 )  
1 −1 −1
13.
+ψ1 (x2 )ψ2 (x1 )ψ3 (x4 )ψ4 (x3 ) 2 0 4
 
−ψ1 (x2 )ψ2 (x1 )ψ3 (x3 )ψ4 (x4 ) 1 −3 7
14.
−2 6 4
+ψ1 (x2 )ψ2 (x3 )ψ3 (x1 )ψ4 (x4 )  
−1 3 −7
−ψ1 (x2 )ψ2 (x3 )ψ3 (x4 )ψ4 (x1 ) 15.
2 −6 −4
16. imposible
+ψ1 (x2 )ψ2 (x4 )ψ3 (x3 )ψ4 (x1 )    
3 −6 2 −1 −6
17. 18.
−ψ1 (x2 )ψ2 (x4 )ψ3 (x1 )ψ4 (x3 ) 0 12 6 −3 8
⎛ ⎞
+ψ1 (x3 )ψ2 (x1 )ψ3 (x2 )ψ4 (x4 ) 2  
19. ⎝ 2 ⎠ 20. 2 2 −1
−ψ1 (x3 )ψ2 (x1 )ψ3 (x4 )ψ4 (x2 )
−1
+ψ1 (x3 )ψ2 (x2 )ψ3 (x4 )ψ4 (x1 )  
−4 3
21. imposible 22.
−ψ1 (x3 )ψ2 (x2 )ψ3 (x1 )ψ4 (x4 ) −22 9
⎛ ⎞
+ψ1 (x3 )ψ2 (x4 )ψ3 (x1 )ψ4 (x2 ) 6 −14 20
23. ⎝−2 7 −16 ⎠
−ψ1 (x3 )ψ2 (x4 )ψ3 (x2 )ψ4 (x1 )
−2 5 −8
+ψ1 (x4 )ψ2 (x1 )ψ3 (x3 )ψ4 (x2 ) ⎛ ⎞
−5 22
−ψ1 (x4 )ψ2 (x1 )ψ3 (x2 )ψ4 (x3 ) 24. ⎝ 4 −12 ⎠
2 −8
+ψ1 (x4 )ψ2 (x2 )ψ3 (x1 )ψ4 (x3 )
⎛ ⎞
−ψ1 (x4 )ψ2 (x2 )ψ3 (x3 )ψ4 (x1 ) 9 0 0
25. imposible 26. ⎝ 0 4 0 ⎠
+ψ1 (x4 )ψ2 (x3 )ψ3 (x2 )ψ4 (x1 ) 0 0 1
−ψ1 (x4 )ψ2 (x3 )ψ3 (x1 )ψ4 (x2 )    
3 −2 3 −6
27. 28.
0 4 0 4
592 Soluciones de los ejercicios
⎛ ⎞ ⎛ ⎞
0 0 0 1 0 0
29. ⎝−6 −15 6 ⎠ 30. −17 51. (i) ⎝ 0 cos θ − sen θ ⎠
2 5 −2 0 sen θ cos θ
⎛ ⎞
0 −6 2 ⎛ ⎞
31. −17 32. ⎝ 0 −15 5 ⎠ cos θ 0 sen θ
0 6 −2 26. (ii) ⎝ 0 1 0 ⎠
  − sen θ 0 cos θ
33. imposible 34. −10 2
    ⎛ ⎞
−3 −1 0 1 1 0 0
37.
2 −1
38.
−10 7 26. (iii) ⎝ 0 1 0 ⎠
    0 0 −1
−1 1 0 0
39.
1 1
40.
0 0 ⎛ ⎞
−1 0 0
41. (i) [Ix , Iy ] = iIz (ii) 22 1 26. (iv) ⎝ 0 1 0 ⎠
0 0 1
[Iy , Iz ] = iIx
[Iz , Ix ] = iIy ⎛ ⎞
    1 0 0
−2c −2d 4 −2 26. (v) ⎝ 0 −1 0 ⎠
42. 43. d
c d −2 1 0 0 1
⎛ ⎞
−1 0 0
26. (vi) ⎝ 0 −1 0 ⎠
Apartado 18.4 0 0 −1
 
44.
1 1 3 ⎛ ⎞
14 −4 2 1 0 0
⎛ ⎞ 52. (i) ⎝ 0 cos θ sen θ ⎠
1 ⎝ 1 −1 1 0 − sen θ cos θ
45. 4 −10 −8 ⎠
6 −1 7 5 ⎛ ⎞
cos θ 0 − sen θ
⎛ 1 1 ⎞ 26. (ii) ⎝ 0 1 0 ⎠
√ 0 √ sen θ 0 cos θ
⎜ 2 2 ⎟
⎜ ⎟
46. singular 47. ⎜
⎜ 0 1 0 ⎟

⎝ −1 1 ⎠ 26. (iii) hasta (vi) A−1 = A
√ 0 √ ⎛ ⎞
2 2 cos φ − cos θ sen φ sen θ sen φ
⎛ ⎞
2 −4 0 0 53. (i) ⎝ sen φ cos θ cos φ − sen θ cos φ ⎠
1 ⎜−1 3 0 0 ⎟ 0 − sen θ − cos θ
48. ⎝
2 0 0 2 −1 ⎠
0 0 −4 3 ⎛ √3 √ ⎞
2
1
4
− 4
3
⎜ √ ⎟
26. (ii) ⎜
⎝− 2
1
4
3
− 43 ⎟


Apartados 18.5 y 18.6 0 − 23 − 21
⎛ √ ⎞
50. (i) x = x cos θ − y sen θ
1 5 3
y = x sen θ + y cos θ 26. (iii) ⎝ −1 ⎠
4
z = z 2
⎛ 1 1 ⎞  
√ √ 0 1 1,8 1,2 0,4
⎜ 2 2 ⎟ 54.
⎜ ⎟ 2 2,6 3,4 2,8

26. (ii) ⎜ −1 1 ⎟
√ √ 0 ⎟
⎝ 2 2 ⎠
 
0 0 1 −1 −1 −2 −2
55.
2 3 3 2
Soluciones de los ejercicios 593
     
4 6 6 4 1 0 −1 0
56. (iii) E A
1 1 2 2 0 1 0 −1
     
7 10 11 8 1 0 −1 0
(iii) B C
57.
0 −1 1 2 0 −1 0 1
⎛ ⎞
1 0 0
58. E = ⎝ 0 1 0 ⎠
0 0 1

Capı́tulo 19
⎛ ⎞
1 3

⎜ 2 − 0 ⎟ Apartado 19.1
⎜√ 2 ⎟    
A=⎜ ⎜ 3 1 ⎟ 1 1 3 1
⎝ 2 − 0 ⎟
⎠ 1. ,
2 14 −4 2 −2
0 0 1 ⎛ ⎞ ⎛ ⎞
1⎝ 6 −5 1 1
⎛ √ ⎞
1 3 2. −6 8 −2 ⎠ , ⎝ 2 ⎠
− 0 2 2 −3 1 3
⎜ ⎟
⎜ √2 2 ⎟ ⎛ ⎞ ⎛ ⎞
B=⎜ ⎜ − 3 1 ⎟ −2 −1
⎝ 2 − 0 ⎟

1 1 1
2 1⎜ 1 1 −2 1 ⎟ ⎜ 2 ⎟
3. ⎝
1 ⎠ ⎝ 3 ⎠
,
0 0 1 3 −2 1 1
⎛ ⎞ 1 1 1 −2 1
−1 0 0
C=⎝ 0 1 0 ⎠
0 0 −1 Apartado 19.2
⎛ √ ⎞    
1 3 1 1 1 1
⎜ 2 0 ⎟ 4. 2, √ ; 4, √
2 −1 1
⎜√ ⎟ 2 2
D=⎜ 3 1 ⎟    
⎜ − 0 ⎟ 1 2 1 1
⎝ 2 2 ⎠ 5. 1, √ ; 4, √
5 −1 2 1
0 0 −1    
⎛ √ ⎞ 6. 2,
1
; −3,
0
1 3 0 1
⎜ − 0 ⎟
2 2    
⎜ √ ⎟ 1 1 1
F=⎜ ⎜− 3 1 ⎟
⎟ 7. 2, ; 3, √
⎝ 2 − 0 ⎠ 0 2 −1
2
 
0 0 −1 1 1
8. 3 (doble), √ (sólo un vector)
2 1
59. (i) E = identidad ⎛ ⎞ ⎛ ⎞
A = 180◦ en torno al eje Oz 1 ⎝ 1 ⎠ 0
9. −1, √ −1 ; 1, ⎝ 0 ⎠ ;
B = 180◦ en torno al eje Ox 3 1 1
C = 180◦ en torno al eje Oy ⎛ ⎞
1 1
3, √ ⎝1 ⎠
 3 1
se aplica
26. (ii) E A B C primero ⎛ ⎞ ⎛ ⎞
1 ⎝ 1 ⎠ √ 1 √1
E E A B C 10. 0, √ 0 ; 2 2, ⎝ 2 ⎠ ;
2 −1 2 1
A A E C B
⎛ ⎞
B B C E A √ 1 √1
−2 2, ⎝− 2 ⎠
2 1
C C B A E
594 Soluciones de los ejercicios

 √ 1/2  √ √ 
12. Si x =
3+ 5
y X−1 = √5 −√5
1
3
2 2 2 2
 −1/2  
c = 2(1 + x2 ) 1 0
, entonces 26. (ii) D =
0 4
⎛ ⎞
1
⎜ x ⎟ 26. (iii) det D = 4 = det A,
λ1 = α + xβ, x1 = c ⎝ ⎠;
x 26. (iii)tr D⎛= 5 = tr A ⎞
1 1 0 1
⎛ ⎞
x 17. (i) X = ⎝−1 0 1 ⎠ ,
⎜ 1 ⎟ 1 1 1
λ2 = α + (x − 1)β, x2 = c ⎝ ⎠;
−1 ⎛ ⎞
⎛ −x ⎞ −1 1 ⎝ 1 −1 0 ⎠
x X = −2 0 2
⎜−1 ⎟ 2 1 1 0
λ3 = α − (x − 1)β, x3 = c ⎝ ⎠;
−1 ⎛ ⎞
x −1 0 0
⎛ ⎞ 26. (ii) D = ⎝ 0 1 0 ⎠
1
0 0 3
⎜ −x ⎟
λ4 = α − xβ, x4 = c ⎝
x ⎠ 26. (iii) det D = −3 = det A,
−1
⎛ ⎞ 26. (iii)tr D = 3 = tr A
1
13. (ii)
1
√ ⎝ 1 ⎠ ⎛ ⎞
1 1 1
3 √
1 ⎜ 2 2 2 ⎟
⎜ ⎟
26. (iv) por ejemplo, ⎜ 1 −1 ⎟
⎛ ⎞ ⎛ ⎞ 18. (i) X = ⎜
⎜ 0 √ √ ⎟,

⎜ 2 2 ⎟
1 ⎝ 1 ⎠ 1 ⎝ 1 ⎠ ⎝ −1 1 1 ⎠
26. √ −1 , √ 1 √
2 0 6 −2 2 2 2

14. (i) λ1 = 2, λ2 = 3 ⎛ ⎞
1 −1
√ 0 √
26. (iii) derecha:
    ⎜ 2 2 ⎟
⎜ ⎟
1 −2 1 ⎜ 1 1 1 ⎟
26. x1 = √
1
, x2 =
0 26. X −1
=⎜
⎜ √ ⎟

5 ⎜ 2 2 2 ⎟
26. (iii)izquierda: ⎝ 1 −1 1 ⎠
    √
0 1 1 2 2 2
26. y1 = , y2 = √
1 5 −2 ⎛ ⎞
0 √0 0
26. (ii) D = ⎝ 0 2 2 √0

Apartados 19.3 y 19.4 0 0 −2 2
 
1 1 1 26. (iii) det D = 0 = det A,
15. (i) X = √ ,
2 −1 1
  26. (iii)tr D = 0 = tr A
1 1 −1
26. X−1 = √
2 1 1 19. Q = 4y21 + 16y22 ,
 
2 0    √3  
26. (ii) D = y1 2
− 12 x1
0 4 = √
y2 1 3 x2
26. (iii) det D = 8 = det A, 2 2

26. (iii)tr D = 6 = tr A
Apartado 19.5
 2 1     
√ √
5 2 1−i 2+i 1−i 3−i
16. (i) X = −1 1
, 21.
3−i i
,
2+i i
√ √
5 2
Soluciones de los ejercicios 595
   
2 −i 2 i 23. (ii)1,666666668 × 10−9 ;
22. , , hermı́tica
i 1 −i 1
⎛ ⎞ ⎛ ⎞ 23. (ii)1,6666666667 × 10−13
0 i 0 0 −i 0
23. ⎝−i 0 i ⎠ , ⎝ i 0 −i ⎠,
Apartado 20.3
0 −i 0 0 i 0
hermı́tica 7. 1,564 8. 0,5314 9. 1,322

24. (i) 3 (ii) 13 (iii) 2 + 3i (iv) 2 − 3i


   
√−1 √ −i Apartado 20.4
25. (ii) 1, ; −1,
i( 2−1) 2+1
11. 0,03973; 0,25590; 0,47703; 0,72357
12. 0,04037 (usando x0 , x1 , x2 );
0,25673 (usando x0 , x1 , x2 );
Capı́tulo 20 0,72424 (usando x3 , x4 , x5 )
Apartado 20.2 13. 0,25708 (usando de x0 a x5 )
1. (i) 1,213; 1,213
23. (ii) 72,030; 72,03
Apartado 20.5
23. (iii) 0,130; 0,1299
23. (iv) 0,002; 0,002499 14. n = 8 : 0,95834, 0,95550;
n = 16 : 0,95622,0,95551
2. (i) 0,0005; 0,0005
15. Usando n = 8 y n = 16 : 0,95551
23. (ii) 0,0005; 0,005
23. (iii) 0,0005; 0,00005 16. Usando 2n = 8 : 0,955559;
23. (iv) 0,0005; 0,0000005 2n = 16 : 0,955515
17. 0,955512 18. 0,94608 19. 0,88208
3. (i) 0,0004; 0,0004
23. (ii) 0,000007; 0,00007
23. (iii) 0,004; 0,0004 Apartado 20.7
23. (iv) 0,3; 0,0002
20. x1 = 2, x2 = 1
4. (i) 9,961 ± 0,0015
23. (ii) 10,11 ± 0,015 21. x1 = 1, x2 = 2, x3 = −2
23. (iii) 58,793 ± 0,243 22. x = −1, y = 8, z = −5
23. (iv) 8,7645 ± 0,0362 23. w = x = y = 1, z = −1
23. (v) 0,3540 ± 0,0008 24. λ = −28; x = −(28 + 5z)/3,
5. (i) 0,414213562; 4,9875621; y = (34 + 2z)/3; z arbitrario
23. (i)49,9987; 500; 4900 25. x1 = 3,132, x2 = −4,546,
23. (ii) 0,414213562; 4,98756211; x3 = −6,110
23. (ii)49,9987501; 499,999875; 26. (i) x1 = 2,719, x2 = −3,333,
23. (ii)4999,99999 x3 = −6,106
6. (i) 0,175201194; 1,66585 × 10−5 ; 26. (ii) x1 = 3,136, x2 = −4,554,
−8
23. (ii)5 × 10 ; 0 x3 = −6,116
  26. (iii) x1 = 3,133, x2 = −4,551,
x2 x2 x4
23. (ii) 1+ + x3 = −6,112
6 20 840
23. (ii)1,666675000 × 10−5 ;
596 Soluciones de los ejercicios

Apartado 20.8 2. (ii) (a) 58,68, 60, 59,5


⎛ ⎞
7 13 19 (b) 58,67, (56 − 60), (56 − 60)
27. ⎝ 13 24 35 ⎠ 3. 5,22, 30,42, 194,58, 1,78, 0,474
19 35 52
⎛ ⎞
−0,7 0,2 0,3
28. ⎝ −1,3 −0,2 0,7 ⎠ Apartados 21.2 y 21.3
0,8 0,2 −0,2
4. (i) 0,6 (ii) 0,1 (iii) 0,7
29 x = −0,7b1 + 0,2b2 + 0,3b3
5. (i) 21/216 (ii) 46/216
y = −1,3b1 − 0,2b2 + 0,7b3
z = 0,8b1 + 0,2b2 − 0,2b3 (iii) 10/216
6. (i) q = e−0 /kt + e−1 /kt + e−2 /kt
Apartado 20.9
(ii) (a) P0 = 1, P1 = P2 = 0
30. (i) 0,800000; 0,640000; 1
(b) P0 = P1 = P2 =
0,512000; 0,409600; 0,327680 3

(ii) 0,810000; 0,656100; (iii) Pi,j,k = e−(i +j +k )/kt /q3
0,531441; 0,430467; 0,348678
(iii) 0,814506; 0,663420; Apartado 21.4
0,540360; 0,440127; 0,358486 7. (i) 0,3125 (ii) 0,2304
31. (i) 0,820000; 0,672400; 8. (i) 0,3487 (ii) 0,001488
0,551368; 0,452122; 0,370740 (iii) 0,9298
(ii) 0,819025; 0,670802;
0,549404; 0,449975; 0,368541 Apartado 21.5
32. (i) 0,818733; 0,670324;
9. AB AC AD AE
0,548817; 0,449335; 0,367885
BA BC BD BE
(ii) 0,818731; 0,670320;
CA CB CD CE
0,548812; 0,449329; 0,367880;
DA DB DC DE
 < 10−7
EA EB EC ED
33. 0,892626; 0,027961
10. AB AC AD AE BC BD BE
34. 2,845387; −0,413504
CD CE DE
35. 2,191160; −0,036251
11. AAABB AABAB AABBA
36. 0,864660; −0,000005
ABAAB ABABA ABBAA
37. 3,258822; −0,000070
BAAAB BAABA BABAA
38. 2,227412; < 10−7
BBAAA
8!
12. = 280 13. 38 = 6561
Capı́tulo 21 4!3!1!
43 =
14. (i)   64 (ii) 6
Apartado 21.1 4
15. (i) = 4 (ii) 1
1. (ii) 5,22, 5, 5 (iii) 3,172, 1,78 3
Soluciones de los ejercicios 597

Apartado 21.6 E a = 89,5 kJ mol−1


1 1 y se obtiene
16. (i) 3a2 − 2a3 (iii) , √
2 20  
7 ln A / M−1 s−1 = 27,38,
(iv) √ ≈ 0,6261
5 5 A = 7,8 × 1011 M−1 s−1
 
17. 1 − e−2R 1 + 2R + 2R2 (ii) σm = 1148,7 σ, σc = 3,5472 σ

3 3 Tenemos entonces
18. (i) (ii) (iii) 1
2 2 Ea
= 1,076 × 104 ± 115,
R
Apartado 21.9 E a = 89,5 ± 1,0 kJ mol−1
19. y = 1,257x + 2,727 y se obtiene
20.  
 ln A / M−1 s−1 = 27,38 ± 0,35,
(i) ln k / M−1 s−1
5,5 × 1011 < A / M−1 s−1 < 11,1 × 1011
−1,076 × 10 4
= + 27,38
T
Tenemos entonces
Ea
= 1,076 × 104 ,
R
Hola
  
 

Abel, 39, 472 autovalor degenerado, 484


abscisa, 27 autovalores, 364, 484
aceleración, 407 espectro de, 364, 484
Airy, ecuación de, 342 problema de, 481-502 (capı́tulo)
ajuste χ2 , 567 autovectores, 485
álgebra, 12 normalizados, 487
de números reales, 12-15 ortogonales, 487
teorema fundamental del, 37 por la derecha, 501
álgebra matricial, 425, 450, 454-462 por la izquierda, 501
álgebra vectorial, 398 propiedades de los, 487
algebraica
ecuación, 5
función, 23-48 Babbage, 98
Al-Kashi, 7, 171 babilonios, 34
Al-Khwarizmi, 7, 34 Barrow, 78, 107
ambigüedades, resolución de, 25 base, 7, 13
amplitud, 308 Bell, 332
análisis de Fourier, 386 Bernoulli
angular distribución de, 552
frecuencia, 57 números de, 522
momento, 260 Bernoulli, Daniel, 339, 344
movimiento, 260 Bernoulli, Jakob, 172, 541
ángulo, unidad de, 51 Bernoulli, Johann, 172, 186, 300, 344
ángulos compuestos, identidades de, 58 Bessel, 203, 339
anticonmutativo, 412 ceros de la función de, 352
antisimetrı́a,de determinantes, 440 ecuación de, 325, 339, 352
aproximación de Stirling, 523 función de, 352
área bajo la curva, 110 función esférica de, 374
área negativa, 114 binomio, desarrollo del, 169
Argand, 196 bisección, método de, 507
diagrama de, 196 bivaluada, función, 29
Aristóteles, 399 Boltzmann
aritmética, 12 distribución de, 73, 550, 557
expresión, 25 estadı́stica de, 554
armónico Bombelli, 193
esférico, 357 bosón, 444
oscilador, 36, 57, 73 butadieno, 501
sólido, 357
Arquı́medes, 9, 106 cadena, regla de la, 229
arquimediano, número π, 6, 8 cálculo, teorema fundamental del, 121
asimetrı́a, 547 cálculo integral, 119-124
ası́ntota, 40 cambio de coordenadas, 267
asociatividad del producto de matrices, 458 cartesianas a polares, 234, 250, 251
autofunción, 364 polares a cartesianas, 234
600 Índice alfabético

cambio de variable constante, 2, 11


constante, 233 de la fuerza, 306
independiente, 233 de proporcionalidad, 65
para integrales múltiples, 249-251 de separación, 346
camino de integración, 240 continuidad, 79-81
campo de direcciones, 531 continuo de números, 6
campo escalar, 416 contorno
campo vectorial, 416 condición periódica de, 210
capacidad, 292 problema de, 363
Cardano, 39, 193, 541 convergencia en media, 374
Cauchy, 176, 177, 203, 426, 450, 472, 485 convergencia de una serie, 175-178
Cavalieri, 106, 520 criterios de, 175-178
Cayley, 449, 450, 495 coordenada radial, 258
centro de gravedad, 126 coordenadas, cambio de, 267
centro de inversión, 471 coordenadas cartesianas, 26, 257
centro de masas, 124, 126, 127, 403 coordenadas cilı́ndricas, 270
cero, aritmética del, 13 coordenadas curvilı́neas, 268
ceros, de las funciones de Bessel, 340 coordenadas elı́pticas, 270
ciclobutadieno, 485 coordenadas esféricas, 258-259, 262, 354
ciclopropeno, 501 coordenadas ortogonales, 268
cifra decimal, 10 coordenadas polares, 61, 258, 270
cifras significativas, 10 correlación, 563
cinética, 92 cosecante, 50
ecuación separable en, 282-287 coseno, 49
cı́rculo unidad, 197 regla del, 57
circuito eléctrico, 292 cota de error, 504
Clairaut, 238, 247, 257 cotangente, 50
le cadet, 238 Cotes, 519, 555
Clausius-Clapeyron, ecuación de, 102, 136 Coulomb
coeficiente de Fourier, 379 fuerza de, 353, 417
coeficiente de correlación, 563 ley de, 130
coeficiente diferencial, 93 covarianza, 563
coeficientes constantes, 297 Cramer, 433
cofactor, 430, 463 regla de, 425, 433
colatitud, 258 criterio
coma fija, 10 de comparación, 176
coma flotante, 10 de convergencia de una serie, 175-178
combinación, 553 de exactitud, 238
combinación lineal de soluciones, 299 del cociente de d’Alembert, 176
complejo conjugado, 195 integral de Cauchy, 177
completitud, 373 cuadrante, 53
componentes de un vector, 401-406 cuadrática
condición de contorno, 304, 353 ecuación, 5
cı́clica, 305 función, 33
periódica, 210, 305 cuadratura
condición de periodicidad, 209 de Gauss-Chebyshev, 525
inicial, 277, 303 de Gauss-Hermite, 525
conjunto ortonormal, 315 de Gauss-Laguerre, 525
conmutador, 459 de Gauss-Legendre, 524
conmutatividad de Newton-Cotes, 518
de la suma de vectores, 399 gaussiana, 524, 525
del producto de matrices, 458 cuántico, número, 210
del producto escalar, 408 cuaterniones, 397, 402, 407, 420, 492
conservación cúbica, ecuación, 5, 31
de la energı́a, 132 cuerda vibrante, 362-364, 385, 386
del momento angular, 415 curtosis, 548
del momento lineal, 407 cúspide, 82
Índice alfabético 601

D’Alembert, 344, 485, 541 determinante


operador, 273 cofactores de un, 430
De Moivre, 201, 251, 541, 555, 561 de un producto matricial, 461
fórmula de, 200, 205 de una matriz, 452, 454
decimal derivada de un, 442
cifra, 10 desarrollo de un, 429
fracción, 7 elementos de un, 427
degeneración, 350 menor de un, 429
Delauney, 240 multiplicación por una constante de un, 438
denominador común, 4 orden de un, 427
densidad, 260 reducción a forma triangular, 443
de probabilidad, 260, 261, 265 transposición de un, 438
en un punto, 260 determinante caracterı́stico, 484
densidad promedio, 127 determinante de Slater, 445
derivable, 82 determinante secular, 436, 484
derivación, 75-103, 75 (capı́tulo) determinantes, 425-447 (capı́tulo)
a partir de primeros principios, 82-83 antisimetrı́a de los, 440
a partir de reglas, 83-92 propiedades de los, 438-443
de serie de potencias, 188 regla de la suma para, 439
mediante regla de la cadena, 84, 87-88 diagonal principal, 452
mediante regla de la inversa, 84, 89 diagonalización de matrices, 490-493
mediante regla del cociente, 84, 86 diagrama de Argand, 196
mediante regla del producto, 84, 86 Dieterici, ecuación de, 192
paramétrica de una integral, 157-159 diferencial, 99-101, 122, 123
derivada, 79, 92 coeficiente, 79
de funciones hiperbólicas, 84 de área, 123
de funciones hiperbólicas inversas, 90 operador, 79
de funciones trigonométricas, 84 diferencial exacto, 237, 242
de funciones trigonométricas inversas, 89 diferencial total, 225-228
de función exponencial, 84 diferencias divididas, método de, 514
de función implı́cita, 90 dimensiones, 16
de función logarı́tmica, 84 Dirichlet, 345, 374
de la suma de funciones, 84 condiciones de, 374
de un determinante, 442 discontinuidad, 80
del múltiplo de una función, 84 esencial, 80
derivada escalar de un vector, 405 evitable, 80
derivada logarı́tmica, 91 discriminante, 34
derivada parcial, 217-221 distinguibles (objetos), 553, 554
notación de la, 217, 220 distribución
derivada total, 228 asimetrı́a de una, 547
derivadas sucesivas, 92 curtosis de una, 548
desarrollo asintótico, 522 desviación absoluta media de una, 547
desarrollo de Laplace, 431 desviación tı́pica de una, 546, 549
desarrollo de MacLaurin, 375 estadı́sticos de una, 544
desarrollo del binomio, 169 media de una, 544, 549
desarrollo del potencial electrostático, 376-378 mediana de una, 545
desarrollo en serie moda de una, 545
de funciones hiperbólicas, 183 rango de una, 546
de funciones trigonométricas, 181 valor esperado de una, 549
de función logarı́tmica, 182 varianza de una, 546, 549
desarrollo en polinomios de Legendre, 369-376 distribución binomial, 551, 556, 561
desarrollo multipolar, 377 distribución continua, 543, 558
desarrollo ortogonal, 369-395 (capı́tulo) distribución de Bernoulli, 552
Descartes, 26, 193 distribución de Boltzmann, 73, 550, 557
desviación absoluta media, 547 distribución de frecuencias, 542, 543
desviación tı́pica, 546, 549 continua, 543
poblacional, 569 discreta, 543
602 Índice alfabético

distribución de Maxwell-Boltzmann, 103, 161 de segundo orden, 297-324 (capı́tulo)


distribución de probabilidad, 548 funciones especiales, 325-342 (capı́tulo)
distribución discreta, 543 factor integrante para, 289
distribución gaussiana (normal), 66, 560-561 homogéneas, 281, 297-317
distribución normal (gaussiana), 66, 560-561 lineales en cinética quı́mica, 290-292
distribución uniforme, 559, 561 lineales homogéneas, 288
distribución unimodal, 545 lineales no homogéneas, 288
distributividad del producto de matrices, 458 método de series de potencias, 326-328
divergencia de un campo vectorial, 418 métodos numéricos, 530-536
división de números complejos, 196 de Euler, 531
división entera, 40 de Runge-Kutta, 533-534
no homogéneas, 317-322
separables, 279-288
ecuación algebraica, 5 solución general de, 299-303, 318
ecuación asociada de Laguerre, 325, 338 solución particular de, 303-305
ecuación asociada de Legendre, 325, 326, 333-335 ecuaciones homogéneas, 435, 483
ecuación auxiliar, 300 ecuaciones incompatibles, 434
ecuación caracterı́stica, 300, 484 ecuaciones lineales, resolución por eliminación
ecuación cinética integrada, 284 gaussiana, 525-528
ecuación cuadrática, 5, 33, 505 ecuaciones linealmente dependientes, 435
ecuación cúbica, 5, 31, 39 ecuaciones no homogéneas, 435, 481, 482
ecuación de Airy, 342 ecuaciones normales, 566
ecuación de autovalores, 484 ecuaciones ordinarias, resolución de, 507-510
ecuación de Bessel, 325, 339, 352 ecuaciones seculares, 436
ecuación de Clausius-Clapeyron, 102, 136 ecuaciones simultáneas, 425
ecuación de Debye, 47 eje de simetrı́a, 471
ecuación de Dieterici, 192 eje imaginario, 196
ecuación de difusión, 343, 366, 395 eje polar, 258
ecuación de Euler-Cauchy, 328, 329 eje principal, 495
ecuación de Hermite, 325, 326, 335 eje real, 196
ecuación de Laguerre, 325, 337 ejes coordenados, 27
ecuación de Laplace, 235, 254, 268, 343, 366, 367, elemento de simetrı́a, 471
419 elemento de volumen, 262
ecuación de Legendre, 325, 326, 330, 342 elemento diagonal, 452
ecuación de ondas, 343, 366 eliminación de Gauss-Jordan, 528-529
ecuación de Poisson, 343 eliminación gaussiana, 525-529
ecuación de Schrödinger, 9, 310, 312, 314, 316, 317, energı́a, 309
343, 347, 349, 350, 353, 367, 436, 559 conservación de la, 132
ecuación de Sturm-Liouville, 334 energı́a cinética, 309, 497
ecuación de van der Waals, 31, 47, 137, 192 253, energı́a electrostática, 133
254 energı́a potencial, 131, 309, 411, 417
ecuación en derivadas parciales, 343-367 (capı́tulo) energı́a potencial electrostática, 133, 376-377, 411
ecuación indicial, 329 energı́a relativista, 191
ecuación lineal, 5 entropı́a, 237, 244
ecuación paramétrica, 229 equivocación, 503
ecuación pivote, 526, 527 error, 503, 561
ecuación polinómica, 33 error absoluto, 504
ecuación rı́gida, 535 error al restar, 505
ecuación secular, 225, 253 error aleatorio, 544, 561
ecuación separable, 345 error de redondeo, 504
en cinética, 282-287 error de truncación, 504
ecuaciones, sistemas de, 43 error relativo, 504
ecuaciones de Maxwell, 266 escalar, 398
ecuaciones diferenciales espacio euclı́deo, 420
de primer orden, 275-295 (capı́tulo) espacio muestral, 544
lineales, 288-290 espacio vectorial, 419
métodos numéricos para, 530-536 espectro de autovalores, 364, 484
Índice alfabético 603

estadı́stica, 541-572 (capı́tulo) frecuencia angular, 57, 308


estadı́stica de Boltzmann, 554 frecuencia de clase, 543
estadı́stica de Fermi-Dirac, 555 frecuencia de oscilación, 57, 308
estadı́stica descriptiva, 542 frecuencia natural, 321
estadı́stica muestral, 569 frecuencia relativa, 548
Euclides, 50, 169, 332 Frobenius, 328, 492
Eudoxio, 106 fuerza, 129, 417
Euler, 6, 8, 64, 193, 203, 223, 251, 257, 297, 300, momento de una, 126, 414
321, 339, 345, 397, 450, 513, 541 fuerza conservativa, 131, 411, 417
fórmula de, 203, 316 fuerza de Coulomb, 353, 417
método de, 531 fuerza de Lorentz, 423
número e de, 6, 9 función, 23
Euler-Cauchy, ecuación de, 328, 329 representación gráfica, 25
Euler-MacLaurin, fórmula de, 519, 522, 523 valor medio, 113
expansión de un gas, 135 función algebraica, 39
experimento aleatorio, 548, 561 función alternada, 426, 443, 444
exponente, 13 función antisimétrica, 443
exponente fraccionario, 14 función asociada de Laguerre, 338
extrapolación de Richardson, 537 función asociada de Legendre, 333-335, 357
extremo, 222 función auxiliar, 224
función bivaluada, 29
función compleja, 202
factor integrante, 289 función complementaria, 318
factor común, 27 función continua a trozos, 374, 380
factorial, 9 función cuadrática, 33
factorización, 27, 41 función de Bessel, 352
Faraday, 240 ceros de la, 352
Fermat, 26, 78, 97, 106, 171, 541 de orden semientero, 341
Fermi-Dirac, estadı́stica de, 555 de primera especie, 340
fermión, 444 esférica, 341, 374
Ferrari, 39 función de densidad, 260
Fibonacci, 6, 165 función de densidad radial, 560
sucesión (‘serie’) de, 165 función de distribución radial, 559
forma canónica, 494 función de Gibbs, 239, 244
forma cuadrática, 485, 493-496 función de Hermite, 336
forma diagonal, 491 función de partición rotacional, 161, 522
forma escalonada, 526 función de partición vibracional, 191
forma triangular, 443, 526 función de posición, 215, 257, 259, 265
fórmula función de varias variables, 215-255 (capı́tulo)
de De Moivre, 200, 205 punto estacionario de una, 221
de Euler, 203 representación gráfica de una, 216
de Euler-MacLaurin, 519, 522, 523 función discontinua, integración de una, 114
de Planck, 192 función especial, 325
de reducción (integración), 150 función explı́cita, 30
Fourier, 345, 378 función exponencial, 63-66
coeficiente de, 379 derivada, 84
serie de, 378-388 función hiperbólica, 70-72
transformada de, 386-393 derivada, 84
fracción algebraica, 28 función hiperbólica inversa, 71
fracción decimal, 7 derivada de, 90
fracciones, 4 función homogénea, 281
división de, 5 función implı́cita, 30
multiplicación de, 5 derivada de, 90
suma de, 4 función inversa, 29-30
fracciones simples, 41, 116 función lineal, 32
frecuencia, histograma de, 543 función logarı́tmica, 66-69
frecuencia acumulada, gráfico de, 543 derivada, 84
604 Índice alfabético

función periódica, 56, 379 hipotenusa, 50


función racional, 39-42 histograma, 543
función racional impropia, 40 Hückel, 253, 437
función racional propia, 40 matriz de, 501
función trascendente, 39, 49-73 (capı́tulo) teorı́a de, 96, 485
función trigonométrica, 49-63 Huygens, 78, 541
derivada, 84
función trigonométrica inversa, 62
derivada de, 89 igualdad de matrices, 454
función univaluada, 29, 380 igualdad de números complejos, 194
función vectorial de posición, 416 igualdad de vectores, 398, 402
función algebraica, 23-48 indistinguibles (objetos), 554
funciones en tres dimensiones, 257-273 (capı́tulo) inductancia, 292
funciones ortogonales, 373 infinito, 13
inflexión, 95
integración, 105-162 (capı́tulo)
Galileo, 106 camino de, 240
Galois, 472 constante de, 107, 109
Galton, 568 de serie de potencias, 188
Gauss, 37, 38, 193, 196, 203, 339, 450, 472, 523, de una función discontinua, 114
525, 561, 566 de una función impar, 119
gaussiana, distribución, 66, 560-561 de una función par, 119
Gibbs, 397, 407, 420 de una función racional, 153-157
función de, 239, 244 intervalo de, 111
Girard, 193 lı́mite de, 111
gradiente, 76 mediante cambio de variable, 142-147
de un campo escalar, 416 por el método de sustitución, 141-147
grado de avance de una reacción, 283 por fórmula de reducción, 150
grado de conversión, 283 por método de fracciones simples, 153-157
grado de un polinomio, 31 por partes, 147-149
gráfica, 25 por sustitución hiperbólica, 145
representación de funciones, 25 por sustitución trigonométrica, 145
Grassmann, 397, 420 signo de, 107
Gregoire de Saint Vincent, 106 usando números complejos, 211
Gregory, James, 107, 178, 183, 520 usando relaciones trigonométricas, 139-141
grupo, tabla de multiplicación de un, 473 variable de, 107
grupo abeliano, 474 integración numérica, 518-525
grupo de simetrı́a, 472 integración parcial, 245
grupo puntual, 473 integral
grupos, teorı́a de, 119 como longitud, 123
derivada paramétrica de una, 157-159
independiente del camino, 242
Hamilton, 397, 402, 407, 417, 420 integral convergente, 117
hamiltoniano, 485 integral de Fourier, 386, 388
operador, 37 integral de lı́nea, 239-245, 410, 411
Heaviside, 407 integral de Riemann, 121
Hermite, 8, 9, 39 integral de volumen, 261-265
ecuación de, 9, 325, 326, 335 integral definida, 107-110
funciones de, 336 en el método de sustitución, 146
polinomios de, 9, 335 integral divergente, 117
Herschel, 98 integral doble, 245-251
Herón, 399 integral en todo el espacio, 264
hidrógeno, átomo de, 260, 353-361, 367, 560, 571 integral estándar, 107
Hiparco de Nicea, 49 integral impropia, 115
hiperbólica integral indefinida, 107-110
función, 70-72 integral infinita, 116
función inversa, 71 integral múltiple, 245
Índice alfabético 605

integral particular, 318 ecuación de, 325, 326, 330, 342


integral trigonométrica racional, 156-157 función asociada de, 333-335, 357
integral triple, 261 polinomios de, 332
integrando, 107 Leibniz, 23, 78, 83, 97, 100, 106, 107, 109, 121, 180,
racional, 153-157 193, 216, 275, 279, 288, 327, 518
interpolación, 511-518 Leonardo de Pisa (Fibonacci), 6
a trozos, 514 Levi Ben Gerson, 553
con trazadores, 516-518 ley asociativa
cuadrática, 513 de la multiplicación, 12
de Lagrange, 513 de la suma, 12
lineal, 512 ley conmutativa
lineal a trozos, 512 de la multiplicación, 12
polinómica, 511 de la suma, 12
inversa ley de Coulomb, 130
de función hiperbólica, derivada, 90 ley de Kirchhoff, 292, 324
de función trigonométrica, derivada, 89 ley de la inversa del cuadrado, 130
de un producto matricial, 464 ley de los exponentes, 13-15
del seno, 62 ley de los grandes números, 544
función hiperbólica, 71 ley de Newton, segunda, 345
función trigonométrica, 62 ley de Ohm, 292
regla de derivación de la, 84, 89 ley de Rayleigh-Jeans, 192
ley del movimiento de Newton, segunda (fuerza), 57
ley del paralelogramo, 399
Jacobi, 217, 251 ley distributiva, 12
jacobiano, 251, 426 l’Hôpital, 186, 425
Jia Xian, 509 ligadura, 222
Jones, 6 Lindemann, 8
Jordan Camille, 495 lineal
Jordan, Wilhelm, 528 ecuación, 5
función, 32
logaritmo, 66
Kepler, 106 logaritmo natural, 66
Kirchhoff ley de, 292, 324 longitud, 258
Kohlrausch, ley de, 47 Lorentz, fuerza de, 423
Kutta, 533 lorentziana, 392, 393
lı́mite, 80-82, 185-187
lı́mite de una sucesión, 165
Lacroix, 257 lı́nea nodal, 350
Lagrange, 223, 247, 257, 339, 397, 472, 513
multiplicadores de, 557
Laguerre, 337 MacLaurin, 178, 425
ecuación asociada de, 325, 338 desarrollo de, 375
ecuación de, 325, 337 serie de, 178-187
función asociada de, 338 magnitud, 16
polinomio de, 337 masa reducida, 127
Lambert, 8 matemática notación, 6
Lamé, 268 matrices, 481, 449-502(capı́tulo)
Langmuir álgebra matricial, 454-462
isoterma de, 47 asociatividad del producto de, 458
Laplace, 235, 251, 257, 541, 561 diagonalización de, 490-493
desarrollo de, 431 conmutatividad del producto de, 458
ecuación de, 254, 268, 343, 366, 367, 419 distributividad del producto de, 458
laplaciano, operador, 235, 266, 270, 273, 347, 351, igualdad de, 454
354 multiplicación de, 456-462
Legendre, 217, 332, 566 multiplicación por un escalar de, 455
desarrollo en polinomios de, 369-376 problema de autovalores, 481-502 (capı́tulo)
ecuación asociada de, 325, 326, 333-335 producto de, 461
606 Índice alfabético

representación de los grupos, 475 mı́nimo, 94, 222


suma de, 455 mı́nimos cuadrados, 564-569
matrices complejas, 497-500 ajuste lineal, 566
matrices de espı́n, 459, 477 moda de una distribución, 545
matrices semejantes, 492 modos normales, 364
matriz adjunta, 463, 498 superposición de, 365
matriz ampliada, 528 módulo de un número complejo, 197
matriz asociada, 498 momento
matriz columna, 450, 453 angular, 260, 358, 415, 496
matriz compleja conjugada, 497 cuadrupolar, 377
matriz conjugada hermı́tica, 497, 499 de inercia, 126-128, 415
matriz cuadrada, 450, 452 tensor del, 496
matriz de Hückel, 501 de una fuerza, 126, 414
matriz de una transformación, 465 dipolar, 377, 404, 411, 414
matriz determinante de una, 452 lineal, 407, 415
matriz diagonal, 452 multipolar, 377
matriz fila, 453 Monge, 257
matriz hermı́tica, 499 Morse, potencial de, 307
matriz identidad, 452 Müller (Regiomontanus), 49
matriz inversa, 462-464, 528 multiplicación
matriz no singular, 463 de matrices, 456-462
matriz nula, 456 de números complejos, 195
matriz ortogonal, 469 de un vector por otro, 407
matriz simétrica, 454 de un vector por un escalar, 399, 403
matriz singular, 463 multiplicador de Lagrange, 223, 253, 485
matriz transpuesta, 453
matriz transpuesta conjugada, 498
matriz traza de una, 452 nabla, 416
matriz unitaria, 499 Napier, 7, 66
máximo, 94, 222 Napoleón, 223, 235
Maxwell, 240, 407 Newton, 61, 78, 84, 107, 121, 172, 180, 223, 240,
ecuaciones de, 266 275, 327, 397, 518, 555
relaciones de, 238 diferencias divididas, 514
relación de, 244 primera ley del movimiento, 407
Maxwell-Boltzmann, distribución de, 103, 161 segunda ley de, 345
media aritmética, 544 segunda ley del movimiento, 407, 415
media de una distribución, 544, 549 Newton-Cotes, 518
media muestral, 569 Newton-Raphson, método de, 509-510
media poblacional, 569 nodo, 513
mediana de una distribución, 545 norma, 372, 373
menor de un determinante, 429 normalización, 334
método normalizado, 264
de bisección, 507 notación
de coeficientes indeterminados, 319 de la derivada parcial, 217, 220
de diferencias divididas, 514 con puntos, 98
de encajonado, 508 notación matemática, 6
de Euler, 531 numerales indo-arábigos, 7
de fracciones simples, 153-157 número cuántico, 210
de Frobenius, 328 número e de Euler, 6, 9
de Newton-Raphson, 509-510 número imaginario puro, 194
de segundo orden, 510 números, continuo de, 6
de series de potencias para una ecuación números complejos, 11, 193-213 (capı́tulo)
diferencial, 326-328 argumento de, 197
de sustitución, 141-147, 249 módulo de, 197
método numérico, 503-539 parte imaginaria de, 193
métodos de eliminación, 525-529 parte real de, 193
métodos de Runge-Kutta, 533-534 representación polar de, 197
Índice alfabético 607

números algebraicos, 6 periodicidad


número arquimediano π, 6, 8 condición de, 209
números de Bernoulli, 522 de números complejos, 206-210
números enteros, 3 periodo, 56
números imaginarios, 11 de oscilación, 308
números irracionales, 5 periódica función, 56
números naturales, 3 permutación, 553
números reales, 6, 12 Pitágoras, 50
números trascendentes, 6 pivote, 526
pivote parcial, 527
pivote parcial escalado, 528
pivote total, 528
Ohm, ley de, 292 plano complejo, 196
Oldenburg, 180 plano de simetrı́a, 471
onda armónica, 56, 60 plano gaussiano (complejo), 196
onda estacionaria, 60, 364 plano tangente, 218
operación de simetrı́a, 471-476 población, 544
operación aritmética, 12 Poisson, ecuación de, 343
operador, momento angular, 358 polar, eje, 258
operador de d’Alembert, 273 polares, coordenadas, 61, 258, 270
operador de rotación, 206 polinomio, 31-39
operador diferencial, 79, 416 grado de un, 31
operador hamiltoniano, 37, 313 raı́z de un, 33
operador laplaciano, 235, 266, 270, 273, 347, 351, polinomio de Hermite, 335
354, 419 polinomio de Laguerre, 337
operador vectorial, 418 polinomios de Legendre, 332
operador operador aritmético, 12 polinómica, ecuación, 33
optimización, 222 potencial, teorı́a del, 235
condicionada, 222 potencial de Lennard-Jones, 103
orbital atómico, 260 potencial de Morse, 307
orden de magnitud, 17 potencial electrostático, 411, 417
orden de una ecuación diferencial, 276 desarrollo del, 376-378
ordenada, 27 presión-volumen, trabajo, 134
Oresme, 106, 175, 541 principio de exclusión de Pauli, 445, 555
ortogonal, 409 principio de superposición, 299
desarrollo, 369-395 (capı́tulo) probabilidad
ortogonalización de Schmidt, 489 densidad de, 260, 261, 265, 558
ortonormal, conjunto, 315, 373 distribución de, 548
oscilación forzada, 320-322 probabilidad y estadı́stica, 541-572 (capı́tulo)
oscilador armónico, 36, 57, 73, 306-310 probabilidades combinadas, 549
en mecánica cuántica, 37 problema de contorno, 304, 363
oscilador armónico cuántico, 335 problema de valor inicial, 278, 304
proceso de primer orden, 284
proceso de segundo orden, 286
par de torsión, 126 proceso irreversible, 135
partı́cula proceso reversible, 135
en un aro, 352 producto de Cauchy, 188
en un pozo circular, 350-353 producto escalar, 407-412
en un pozo rectangular, 347-350 triple, 422
en un pozo unidimensional, 310-317 producto interno, 420
Pascal, 106, 171, 541 producto vectorial, 412-416
triángulo de, 509, 551 anticonmutativo, 412
Pauli triple, 422, 423
matrices de espı́n de, 459 progresión aritmética, 164
principio de exclusión de, 445 progresión geométrica, 165
Peacock, 98 promedio, de una función, 265
pendiente, 32, 75 punto estacionario, 94
608 Índice alfabético

de una función de varias variables, 221 resultado, 544


punto extremo, 94 reversible, proceso, 135
punto silla, 222 Rheticus, 49
punto singular, 40 Richardson, extrapolación de, 537
Riemann, 121, 242, 345
Robert de Chester, 7
Qin Jiushao, 509 Roberval, 56, 106
rotacional de un campo vectorial, 419
rotación, operador de, 206
racional, función, 39-42 rotor rı́gido, 209, 316, 522
radial, coordenada, 258 Runge, 533
radio de convergencia, 178 Runge-Kutta, métodos de, 533-534
radián, 51
rango intercuartı́lico, 546
Raphson, 509 Schmidt, ortogonalización de, 489
Rayleigh-Jeans, ley de, 192 Schoenberg, 517
raı́ces de números complejos, 207 Schrödinger, ecuación de, 9, 343, 347, 349, 350,
raı́z de un polinomio, 33 353, 367, 436, 559
raı́z de una función cuadrática, 33 secante, 50
reacción secular, ecuación, 225, 253
grado de avance de, 283 segmento de recta orientado, 397
grado de conversión de, 283 Seki Kowa, 425
velocidad de, 283 seno, 49
real regla del, 57
número, 6, 12 separación de variables, 346, 354-355, 363
variable, 11 serie, 163-192 (capı́tulo)
reciprocidad radio de convergencia de una, 178
relación de, 238 serie alternada, 178
Recorde, 2 serie aritmética, 168
redondeo, 10 serie armónica, 175
Regiomontanus, 49 serie binomial, 180
regla serie de Fourier, 378-388
de Cramer, 425, 433, 482 en cosenos, 388
de l’Hôpital, 186 en senos, 384
de la cadena, 84, 87-88, 229 serie de MacLaurin, 178-187
de la inversa, 84, 89 serie de potencias, 178-189
de la suma para determinantes, 439 serie de Taylor, 178-187
de Simpson, 520 serie finita, 163, 167-173
del cociente, 84, 86 serie geométrica, 169, 174
del menos uno, 232 serie infinita, 163, 174-189
del producto, 84, 86 SI, unidades, 16
del trapecio, 518, 519 simetrı́a
regresión, 569 eje de, 471
relaciones de Maxwell, 238, 244 elemento de, 471
relación de recurrencia (integración), 150 operación de, 471-476
representación paramétrica de una curva, 406 plano de, 471
representación gráfica Simpson, 520
de un número complejo, 196 regla de, 520
de una función de varias variables, 216 sistema de ecuaciones lineales, 425, 433-438, 465,
de una ecuación diferencial, 531 481
representación logarı́tmica, 92 sistema conservativo, 132
resistencia, 292 sistema de referencia, 27
resolución de ecuaciones ordinarias, 507-510 sistema decimal, 7
resolución numérica, de ecuaciones diferenciales, sistema posicional, 6
530-536 sistemas de ecuaciones, 43
resonancia, 322 Slater, determinante de, 445
resto (desarrollo de Taylor), 184 Snell, 96
Índice alfabético 609

sólido rı́gido, 415 transformación lineal, 464-469


solución de una ecuación en derivadas parciales, 344 transformación ortogonal, 492
solución general de una ecuación diferencial, 276, transformada de Fourier, 386-393
299-303, 318 transpuesta de un producto matricial, 461
solución no trivial, 436 trascendente
solución particular de una ecuación diferencial, 276, función, 39, 49-73 (capı́tulo)
303-305 número, 6
solución trivial, 435 traza de un producto matricial, 461
solución general, 299 traza de una matriz, 452
sordo, 5 trazadores, 516, 517
splines, 517 cúbicos, 517
Stevin, 7, 106 naturales, 518
Stirling, 555 tres dimensiones, funciones en, 257-273 (capı́tulo)
aproximación de, 523, 555, 557 triángulo de Pascal, 171, 509, 551
Sturm-Liouville, ecuación de, 334 trigonometrı́a, 49
sucesión armónica, 165 trigonométrica
sucesos excluyentes, 549 función, 49-63
sucesos independientes, 550 función inversa, 62
suma triple producto
de matrices, 455 escalar, 422
de números complejos, 194 vectorial, 422, 423
de una serie, 168 truncación, 10
de vectores, 399, 402
parcial, 167
superposición, principio de, 299 unidad, 2, 16-19
sustitución hiperbólica, 145 de ángulo, 51
sustitución trigonométrica, 145 unidad SI, 16
Sylvester, 449, 495 unidades atómicas, 18
univaluada, función, 29

tangente (función), 49 valor absoluto, 13


Tartaglia, 39 valor caraterı́stico, 484
tasa de variación, 75, 77 valor esperado, 265
Taylor, 183, 345 de una distribución, 549
serie de, 178-187 valor principal, 63
tensor valor promedio, 264
de inercia, 496 van der Waals, ecuación de, 31, 137, 192, 253, 254
del momento de inercia, 496 variable, 2, 11
teorema de Taylor, 184 variable constante, cambio de, 233
teorema de Weierstrass, 511 variable continua, 11
teorema del lı́mite central, 561 variable dependiente, 2
teorema fundamental del cálculo, 121 variable discreta, 11
teorema fundamental del álgebra, 37, 38 variable entera, 4, 11
teorı́a de grupos, 119, 472 variable independiente, 2, 215
axiomas de la, 474 cambio de, 233
teorı́a del potencial, 235, 266, 374 variable real, 11
Tolomeo, 49 variación, 75
Torricelli, 68, 106 infinitesimal, 99
totalmente antisimétrica, 443 tasa de, 75
trabajo, 129 varianza, 546, 549
presión-volumen, 134 poblacional, 569
transformación vector columna, 450
transformación a ejes principales, 495 vector columna (matriz), 453
transformación de coordenadas, 450, 464 vector de desplazamiento, 398
transformación de semejanza, 492 vector de posición, 398
transformación identidad, 468 vector fila (matriz), 453
transformación inversa, 468 vector nulo, 398
610 Índice alfabético

vector propio, 485 velocidad lineal, 98


vector unitario, 400 Viète, 34, 49
vector unitario cartesiano, 401, 404, 409 virial, coeficientes del, 191
vectores, 397-424 (capı́tulo) volumen, elemento de, 262
componentes de, 401-406
de una base, 404, 409, 413
derivada escalar de, 405 Wallis, 107, 180, 196
igualdad de, 398, 402 Waring, 176, 513
multiplicación por un escalar, 399, 403
Weber, 472
suma de, 399, 402
Weierstrass, 345, 511
vectores ortogonales, 409
Wessel, 196
vectores unitarios i, j, k, 401, 404, 409, 413
velocidad, 97, 98, 128, 406
velocidad angular, 98, 414, 496
velocidad de reacción, 283 Yang Hui, 171

También podría gustarte