Cal Vectc7

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 160

Calculo Vectorial

La geometrı́a del espacio

Para aplicar el cálculo a muchas situaciones reales y a las matemáticas avanzadas, nece-
sitamos una descripción matemática del espacio tridimensional.

Coordenadas rectangulares

Un punto en el espacio se determina dando su localización relativa a tres ejes coordenados


perpendiculares entre ellos, que pasan por el origen O. Usualmente se dibujan los ejes x, y, z

Este es el Sistema de coordenadas de la mano derecha el cual se caracteriza por la siguiente


propiedad: si doblamos los dedos de la mano derecha con un giro de 90◦ a partir del eje positivo
de las x y hacia el eje y positivo, entonces el pulgar apuntará en la dirección del eje positivo
de las z.
Las coordenadas cartesianas (a, b, c) de un punto P en el espacio son los números reales
correspondientes a las intersecciones de los ejes con los planos que pasan por P y son per-
pendiculares a los ejes. Las coordenadas cartesianas del espacio también se conocen como
coordenadas rectangulares, pues los ejes que las definen se cortan en ángulo recto.
Un conjunto importante de vectores unitarios, denotados por i, j y k, son aquellos que
tienen las direcciones de los ejes x, y y z, respectivamente, de un sistema de coordenadas
rectangulares de tres dimensiones.

Cualquier vector a = (a1 , a2 , a3 ) en el espacio tridimensional se puede expresar como una


combinación lineal de los vectores unitarios
i = (1, 0, 0) j = (0, 1, 0) k = (0, 0, 1), a = a1 i + a2 j + a3 k
es decir, a es la suma de los vectores componentes a1 i, a2 j y a3 k los cuales yacen a lo largo
de los ejes de coordenadas y tienen el origen como un punto inicial común, y los escalares a1 ,

1
a2 y a3 se denominan componentes de a en las direcciones x, y y z, respectivamente.
Considere un punto P(x, y, z) en el espacio. El vector r que parte del origen O hacia el
punto P se llama vector de posición (o radio vector). Entonces, podemos escribir
p
r = xi + yj + zk, |r| = x2 + y 2 + z 2

Ejemplo 1. Interpretación geométrica de ecuaciones y desigualdades.

Ejemplo 2. Interpretación geométrica de ecuaciones y desigualdades.

1. x2 + y 2 + z 2 < 4

2. x2 + y 2 + z 2 ≤ 4

3. x2 + y 2 + z 2 = 4, z ≤ 0

4. x2 + y 2 + z 2 + 3x − 4z + 1 = 0

Rectas y planos en el espacio En el plano R2 , una recta queda determinada por un


punto P0 y la pendiente m. En el espacio Rn , una recta queda determinada por un punto
P0 y un vector director que indica la dirección de la recta.
Suponga que L es una recta en el espacio que pasa por un punto P0 (x, y, z) y que es paralela
a un vector v = v1 i + v2 j + v3 k. Entonces
 
L = X : P0 X es paralelo a v} = X : P0 X = tv}

El valor de t depende de la posición del punto X a lo largo de la recta, y el dominio de t es


(−∞, ∞). Observe que

P0 X = tv ⇒ (x − x0 )i + (y − y0 )j + (z − z0 )k = t(v1 i + v2 j + v3 k)
¿Cuales son las ecuaciones paramétricas de una recta L?

¿Cuales son las ecuaciones simétricas de una recta L?

¿Cuando dos rectas L1 y L2 son paralelas? Ortogonales?

2
Planos Sea un punto P ∈ Rn y dos vectores c, ∂ ∈ Rn diferentes de cero y no paralelos.
Diremos que el conjunto de puntos X que determinan vectores P X que son combinación
lineal de los vectores c y ∂, es el plano P que pasa por el punto P y tiene como vectores
directores a c y ∂.

Observe que P X = tc + s∂ con t, s ∈ R. Ahora si x = OX y p = OP , entonces para


t, s ∈ R
x − p = tc + s∂ x = p + tc + s∂
Esta es la ecuación vectorial del plano.
¿Cuales son las ecuaciones paramétricas del plano?

EJEM. Dadas las ecuaciones paramétricas del plano P x1 = 2 + t + s, x2 = 2t, x3 = 1 + 5s


y x4 = −2.

1. Encontremos dos vectores c y d que sean vectores directores del plano P


   
2 6
   
2
 N =  4  se encuentran en el plano P?.
 
2. ¿Los puntos M = 
1 −9
   
−2 −2

 
−2
EJEM. Encontremos una ecuación vectorial del plano que contiene los puntos P =  5 ,
 

3
   
0 2
Q = −2 y R =  0 
   

1 −3
¿Cuando dos planos son paralelos?, ¿Cuando dos planos son iguales? ¿Cuando una recta L
con vector director ∂ ∈ Rn es paralella a un plano P con vectores directores c1 , ∂1 ∈ Rn ?.
¿Cuando una recta L con vector director ∂ ∈ Rn y un plano P con vectores directores
c1 , ∂1 ∈ Rn son ortogonales.

3
Coordenadas Cilindricas
Las coordenadas cilı́ndricas (r, θ, z) de un punto P en el espacio son un hı́brido natural de sus
coordenadas polares y rectangulares. Se usan las coordenadas polares (r, θ) de un punto en el
plano con coordenadas rectangulares (x, y) y se usa la misma coordenada z como en las coordenadas
rectangulares.
De manera que las relaciones entre las coordenadas rectangulares (x, y, z) y las coordenadas polares
(r, θ, z) de un punto P en el espacio están dadas por

x = r cos θ, y = r sin θ, z=z


y
r 2 = x2 + y 2 , tan θ =
z=z
x
La palabra cilindricas surge del hecho de que un punto P en el espacio está determinado por
la intersección de los planos z = constante, θ = constante y con un cilindro r = constante.

Obsérvese que la ecuación r = r0 (r0 > O) es, en el sistema cilı́ndrico (r0 , θ, z), la ecuación
de un cilindro (circular recto) cuyo eje es el eje z. La proyección en el plano xy siempre dista
del origen una cantidad constante igual a r0 .

4
Ejemplo 3. Convertir el punto r = 4, 5π

6 , 3 a coordenadas rectangulares.

SOL: Usando las ecuaciones de conversión de cilı́ndricas a rectangulares se obtiene

√ 
Ejemplo 4. Convertir el punto (x, y, z)r = 1, 3, 2 a coordenadas cilı́ndricas

SOL: Usar las ecuaciones de conversión de rectangulares a cilı́ndricas.


√ √ π
r = ± 1 + 3 = ±2, tan θ = 3 ⇒θ= + nπ, z=2
3
Hay dos posibilidades para r y una cantidad infinita de posibilidades para θ, dos represen-
taciones adecuadas del punto son
π 4π
(2, , 2), r > 0, I cuadrante, (−2, , 2), r > 0, III cuadrante
3 3

Las coordenadas cilı́ndricas son especialmente adecuadas para representar superficies


cilı́ndricas y superficies de revolución en las que el eje z sea el eje de simetrı́a, como se
muestra en la figura

Los planos verticales que contienen el eje z y los planos horizontales también tienen
ecuaciones simples de coordenadas cilı́ndricas, como se muestra en la figura

5
Ejemplo 5. Hallar una ecuación en coordenadas cilı́ndricas para la superficie representada por
cada ecuación rectangular, a) x2 + y 2 = 4z 2 , y b) y 2 = x

SOL: a) la gráfica de la superficie x2 + y 2 = 4z 2 es un cono de dos hojas, con su eje a lo largo del
eje z, como se muestra en la figura. Luego,

x2 + y 2 = 4z 2 Ecuacion rectangular r2 = 4z 2 Ecuacion cilindrica

SOL b) La gráfica de la superficie es un cilindro parabólico con rectas generatrices paralelas al eje
z. Observe que,

Hay que observar que esta ecuación comprende un punto en el que por lo cual nada se pierde al
dividir cada lado entre el factor r
Ejemplo 6. Hallar una ecuación en coordenadas rectangulares de la superficie representada por
la ecuación cilı́ndrica, r2 cos 2θ + z 2 + 1 = 0

SOL:

Es un hiperboloide de dos hojas cuyo eje se encuentra a lo largo del eje y.

6
Coordenadas Esfericas

En el sistema de coordenadas esféricas, cada punto se representa por una terna ordenada:
la primera coordenada es una distancia, la segunda y la tercera coordenadas son ángulos.
Un punto P en el espacio se representa por medio de una terna ordenada (ρ, φ, θ).

1. ρ es la distancia entre P y el origen, ρ ≥ 0.

2. θ es el mismo ángulo utilizado en coordenadas cilı́ndricas para r ≥ 0.

3. φ es el ángulo entre el eje z positivo y el segmento de recta OP , 0 ≤ φ ≤ π

El nombre coordenadas esféricas se utiliza porque la ecuación ρ = const es una esfera con
más precisión, una superficie esférica de radio c centrada en el origen. La ecuación φ = Const
describe (una parte de) un cono si 0 < c < π2 o si π2 < c < π. La ecuación esférica del plano
xy es φ = π2 .
Por tanto un punto P en el espacio está determinado por la intersección de un cono φ =
const, un plano θ = const y una esfera ρ = const; de ahı́ surge el nombre de coordenadas
esféricas. La relación entre coordenadas rectangulares y esféricas es dada por:
Esféricas a rectangulares:

x = ρ sin φ cos θ, y = ρ sin φ sin θ, z = ρ cos φ

Rectangulares a esféricas:
y  z 
ρ2 = x2 + y 2 + z 2 , tan θ = , arc cos p
x x2 + y 2 + z 2

Para cambiar entre los sistemas de coordenadas cilı́ndricas y esféricas, usar lo siguiente.
Esféricas a rectangulares r ≥ 0:

r2 = ρ2 sin2 , θ = θ, z = ρ cos φ

Cilindricas a esféricas (r ≥ 0)
p  z 
ρ = r2 + z 2 , θ = θ, arc cos √
r2 + z 2

Ejemplo 7. Hallar una ecuación en coordenadas esféricas para la superficie representada por cada
una de las ecuaciones rectangulares a) Cono x2 + y 2 = z 2 b) Esfera x2 + y 2 + z 2 − 4z = 0

SOLa) Haciendo las sustituciones apropiadas de x, y y z


x2 + y 2 = z2
ρ2 sin2 φ cos2 θ + ρ2 sin2 φ sin θ = ρ2 cos2 φ
ρ2 sin2 φ = ρ2 cos2 φ ρ≥0
2
tan φ = 1 φ = π/4, o φ = 3π/4
La ecuación φ = π/4 representa el semicono superior, y la ecuación φ = 3π/4 representa el semicono
inferior.
b) Como ρ2 = x2 + y 2 + z 2 y z = ρ cos φ entonces tenemos que

ρ2 − 4ρ cos φ = 0, ⇒ ρ(ρ − 4 cos φ) = 0

Descartando por el momento la posibilidad de que ρ = 0, se obtiene la ecuación esférica

ρ = 4 cos φ

Hay que observar que el conjunto solución de esta ecuación comprende un punto en el cual ρ = 0
de manera que no se pierde nada al eliminar el factor ρ.

7
EJERCICIO I: Convierta las coordenadas esféricas (6, π/4, π/3)√en coordenadas:
√ √ (a)
Coordenadas rectangulares. (b) Coordenadas cilindricas. SOL : (a) ( 23 2, 32 6, 3 2) (b)
√ √
(3 2, π/3, 3 2)
EJERCICIO II: a) Encuentre las coordenadas rectangulares del punto P que tiene coor-
denadas esféricas (8, 5π/6, π/3)
b) Encuentre las coordenadas esféricas aproximadas del punto Q con coordenadas rectan-
gulares (−3, −4, −12).
c) Encuentre la ecuación en coordenadas esféricas del paraboloide con ecuación en coor-
denadas rectangulares z = x2 + y 2 .
d) Determine la gráfica de la ecuación en coordenadas esféricas ρ = 2 cos φ.
e) Determine la gráfica de la ecuación en coordenadas esféricas ρ = sin φ sen θ.

1.1. Superficies en el espacio


La gráfica de una ecuación f (x, y) = 0 es por lo general una curva en el plano xy, la gráfica
de una ecuación F (x, y, z) = 0 es generalmente una superficie en el espacio. De manera que,
una función F de tres variables asocia un número real F (x, y, z) con cada tercia ordenada
(x, y, z) de números reales. La gráfica (dibujo) de la ecuación

F (x, y, z) = 0

es el conjunto de todos los puntos cuyas coordenadas (x, y, z) satisfacen esta ecuación y recibe
el nombre de superficie. Por ejemplo,

Esf eras : (x − x0 )2 + (y − y0 )2 + (z − z0 )2 = r2
P lanos : ax + by + cz + d = 0

Un tercer tipo de superficies que estudiaremos en el espacio son las llamadas superficies
cilı́ndricas, superficies cuadradicas y superficies de revolución.

Planos y trazas

Al graficar manualmente una superficie es útil analizar las curvas que se forman al cortar
la superficie con planos paralelos a los planos coordenados. Estas curvas se conocen como
trazas.
Para bosquejar una superficie S, en ocasiones es útil examinar sus intersecciones con varios
planos. La traza de la superficie S en el plano P es la intersección de P y S. Por ejemplo, si
S es una esfera, se puede ver que la traza de S con un plano P es una circunferencia.

8
Cuando queremos visualizar una superficie especı́fica en el espacio, suele ser suficiente
analizar sus trazas en los planos coordenados y posiblemente unos cuantos planos paralelos
a ellos

Ejemplo 8. Bosqueje el plano con ecuación 3x + 2y + 2z = 6.

SOL: Para hallar la traza en el eje xy hacemos z = 0. La ecuación se reduce a la ecuación 3x+2y = 6
de una recta en el plano xy. De manera similar, con y = 0 obtenemos la recta 3x + 2z = 6 como
la traza del plano dado en el plano xz. Para encontrar la traza en el plano yz, hacemos x = 0 y
obtenemos la recta y + z = 3. La figura muestra las porciones de estas tres trazas que se encuentran
en el primer octante. Todas juntas dan una buena idea de cómo está situado el plano 3x+2y+2z = 6
en el espacio.

Superfices Cilindricas

En el espacio bidimensional la gráfica de la ecuación x2 + y 2 = 1 es una circunferencia


centrada en el origen del plano xy. Sin embargo, en el espacio tridimensional es posible
interpretar la gráfica del conjunto

{(x, y, z) : x2 + y 2 = 1, z arbitraria}

como una superficie que es el cilindro circular recto ver grafica

De modo similar, la gráfica de una ecuación tal como y + 2z = 2 es una recta en el espacio
bidimensional (el plano yz), pero en el espacio tridimensional la gráfica del conjunto

{(x, y, z) : y + 2z = 2, x arbitraria}

es el plano perpendicular al plano yz.

Las superficies de este tipo reciben un nombre especial cilindros. Usamos el término cilin-
dro en un sentido más general que el de un cilindro circular recto. Especı́ficamente, si C es
una curva en un plano y L es una recta no paralela al plano, entonces el conjunto de todos
los puntos (x, y, z) generado al mover una lı́nea que recorra a C paralela a L se denomina
cilindro. En palabras más coloniales, un cilindro se genera al deslizar la curva C en la misma
direccı́on de la recta L, donde la recta L es representada por la variable que falta en su
ecuación. La curva C recibe el nombre de generatriz del cilindro.

9
Como sugiere las gráficas anteriores, cualquier curva

f (x, y) = c1 , plano xy, g(x, z) = c2 , plano xz, h(y, z) = c3 , plano yz

definen un cilindro paralelo al eje z, eje y y eje x, respectivamente cuya ecuación también
es f (x, y) = c1 , g(x, z) = c2 y h(y, z) = c3 . Por tanto, conluimos que una curva en un plano,
cuando se consideran tres dimensiones, es un cilindro perpendicular a ese plano.

Ejemplo 9. Cilindros

Superficies Cuádricas

La ecuación de la esfera (x − x0 )2 + (y − y0 )2 + (z − z0 )2 = r2 sólo un caso particular de


la ecuación general de segundo grado en tres variables

Ax2 + By 2 Cz 2 + Dxy + Eyz + F xz + Gx + Hy + Iz + J = 0, (1.1)

donde A, B, C, . . . , J son constantes. La gráfica de una ecuación de segundo grado de la


forma 1.1 que describe un conjunto real de puntos se dice que es una superficie cuádrica. Por
ejemplo, tanto el cilindro elı́ptico x2 /4 + y 2 /9 = 1 como el cilindro parabólico z = y 2 son
superficies cuádricas.

10
Hay seis tipos básicos de superficies cuádricas: elipsoide, hiperboloide de una hoja, hiper-
boloide de dos hojas, cono elı́ptico, paraboloide elı́ptico y paraboloide hiperbólico.
Elipsoide: La gráfica de cualquier ecuación de la forma

x2 y2 z2
2
+ 2 + 2 = 1,
a b c
corta a los ejes coordenados en (±a, 0, 0), (0, ±b, 0) y (0, 0, ±c) los números reales positivos
a, b y c se llaman semiejes del elipsoide. La superficie es simétrica con respecto a cada uno
de los planos coordenados, ya que en la ecuación que la define, cada variable está elevada al
cuadrado.

Cono elı́ptico: La gráfica de una ecuación de la forma

x2 y2 z2
+ = ,
a2 b2 c2
recibe el nombre de cono elı́ptico (o circular si el cono a = b)

Paraboloide elı́ptico: La gráfica de una ecuación de la forma

x2 y2 z
+ = ,
a2 b2 c
es simétrico con respecto a los planos x = 0 y y = 0. La única intersección con los ejes es
el origen. Excepto por este punto, la superficie está completamente por arriba (si c > 0) o
completamente debajo (si c < 0 ) del plano xy, según el signo de c.

11
Hiperboloide de una hoja La gráfica de una ecuación de la forma

x2 y2 z2
+ − = 1,
a2 b2 c2
se llama hiperboloide de una hoja. En este caso, un plano paralelo al plano xy, corta la
superficie en secciones transversales elı́pticas (o circulares si a = b) y es simétrico con respecto
a cada uno de los tres planos coordenados.

Hiperboloide de dos hojas La gráfica de una ecuación de la forma

z2 x2 y2
− − = 1,
c2 a2 b2
se llama apropiadamente hiperboloide de dos hojas. Es simétrico con respecto a los tres planos
coordenados. El plano z = 0 no corta a la superficie; de hecho, para que un plano horizontal
corte a la superficie, debemos |z| ≥ c. tener

Paraboloide hiperbólico: La gráfica de una ecuación de la forma

z y2 x2
= 2 − 2,
c b a

12
se conoce como paraboloide hiperbólico y tiene forma de una silla de montar.Su traza en el
plano horizontal z = z0 es una hipérbola (o dos rectas que se cruzan si z0 = 0).

Para clasificar una superficie cuádrica, se empieza por escribir la superficie en la forma
canónica o estándar. Después, se determinan varias trazas en los planos coordenados o en
planos paralelos a los planos coordenados.

Ejemplo 10. Clasificar y dibujar la superficie dada por 4x2 − 3y 2 + 12z 2 + 12 = 0

SOL: Se empieza por escribir la ecuación en forma canónica

4x2 − 3y 2 + 12z 2 + 12 = 0
y2 x2 z2
− − =1
4 3 1
se puede concluir que la superficie es un hiperboloide de dos hojas con el eje y como su eje.
Para esbozar la gráfica de esta superficie, conviene hallar las trazas en los planos coordenados.

y2 x2
T raza xy (z = 0) − =1 Hiperbola
4 3
x2 z2
T raza xz (y = 0) + = −1 N o hay traza
3 1
y2 z2
T raza yz (x = 0) − =1 Hiperbola
4 1

Ejemplo 11. Clasificar y dibujar la superficie dada por x − y 2 − 4z 2 = 0

SOL: Como x está elevada sólo a la primera potencia, la superficie . El


eje del es el eje x. En la forma canónica es x = y 2 + 4z 2 . Estudiemos
algunas trazas,

La superficie es un .

13
Ejemplo 12. Clasificar y dibujar la superficie dada por z = 4 − x2 − y 2 .

SOL: Al escribir la ecuación como reconocemos la ecuación de un


.

EJERCICIO:
Clasificar y dibujar las superficies dadas por
a) x2 + 2y 2 + z 2 − 4x + 4y − 2z + 3 = 0.
b) 2x2 − 4y 2 + z 2 = 0
c) −2x2 + 4y 2 + z 2 = −36

SOL:

14
Superficies de Revolución:
En Calculo integral vimos que una superficie S podrı́a generarse rotando una curva plana C
alrededor de un eje. En la discusión que sigue se encontrarán ecuaciones de superficies de revolución
cuando C es una curva en un plano de coordenadas y el eje de revolución es un eje de coordenadas
Ahora veamos un procedimiento para hallar su ecuación. Consideremos la gráfica de la función
radio
y = r(z), Curva generadora o directriz.
en el plano yz. Si esta gráfica se gira sobre el eje z, forma una superficie de revolución, como se
muestra en la figura. La traza de la superficie en el plano z = z0 es un cı́rculo cuyo radio es r(z0 )
y cuya ecuación es
x2 + y 2 = [r(z0 )]2
Sustituyendo z0 por z se obtiene una ecuación que es válida para todos los valores de z. De
manera similar, se pueden obtener ecuaciones de superficies de revolución para los otros dos ejes,
y los resultados se resumen como sigue.

Superficie de Revolución: Si la gráfica de una función radio r se gira sobre uno de los
ejes coordenados, la ecuación de la superficie de revolución resultante tiene una de las formas
siguientes.
1.) Girada sobre el eje x: y 2 + z 2 = [r(x)]2
2.) Girada sobre el eje y: x2 + z 2 = [r(y)]2
3.) Girada sobre el eje z: x2 + y 2 = [r(z)]2
Ejemplo 13. Hallar una ecuación para la superficie de revolución generada al girar la gráfica
1
de y = en torno al eje z.
z
SOL: Como el giro es en el eje z entonces la ecuaciòn de la superficie es de la forma
r(z) = x2 + y 2 y como la funcion radio es r(z) = z1 . entonces la ecuacion de la superficie es:
 1 2
x2 + y 2 =
z
Ejemplo 14. Hallar una ecuación para la superficie de revolución generada al girar la gráfica
de 9x2 = y 3 en torno al eje y.

SOL: Como el giro es en el eje y entonces la ecuación de la superficie es de la forma


r(y) = x2 + z 2 y como la funcion radio es r(y) = 31 y 3/2 . Entonces la ecuacion de la superficie
es:
1
x2 + z 2 = y 3
9
OBS La curva generadora o directriz de una superficie de revolución NO es única. Por
ejemplo, la superficie
x2 + z 2 = e−2y
puede generarse al girar la gráfica de x = e−y en torno al eje y o la gráfica de z = e−y sobre el

eje y.

15
Ejemplo 15. Hallar una curva generadora y el eje de revolución de la superficie de revolución
Hallar una directriz y el eje de revolución de la superficie dada por x2 + 3y 2 + z 2 = 9

SOL: Sabemos que una superficie de revolucion tiene una de las siguientes ecuaciones

x2 + y 2 = [r(z)]2 girada en torno al eje z


2 2 2
y + z = [r(x)] girada en torno al eje x
2 2 2
x + z = [r(y)] girada en torno al eje y

Como los coeficientes de x2 y z 2 son iguales, se debe elegir la tercera forma y escribir x2 +z 2 =
9 − 3y 2 . Entonces el eje y es el eje de revolución. Se puede elegir una directriz de las trazas
siguientes

x2 = 9 − 3y 2 , traza en el plano xy, z 2 = 9 − 3y 2 ,


traza en el plano yz
p
usando la primer traza, la directriz es la semielipse dada por x = 9 − 3y 2
NOTA IMPORTANTE: En aras de la discusión más general, se va a suponer que f (y, z) = 0 es
una ecuación de una curva C en el plano yz y que C se rota en torno al eje z de modo que se
genera una superficie S. Si (x, y, z) denota un punto general sobre S que resulta de rotar el punto
(0, y0 , z) en C, entonces
p
d[(0, 0, z), (x, y, z)] = d[(0, 0, z), (0, y0 , z)], por tanto y0 = x2 + y 2

Pero como f (y0 , z) = 0 llegamos a una ecuación para S dada por


p
f ( x2 + y 2 , z) = 0

De manera que una ecuación de una superficie generada al rotar una curva en un plano de coor-
denadas alrededor de

EJERCICIOS
1) Escriba una ecuación del elipsoide de revolución que se obtiene al girar la elipse 4y 2 +z 2 = 4
alrededor del eje z
2) Determine la gráfica de la ecuación z 2 = x2 + y 2 .
3) La gráfica 4x2 + y 2 = 16 de se rota en torno al eje x. Encuentre una ecuación de la
superficie de revolución. 4) La gráfica z = y, y ≥ 0 de se rota en torno al eje z. Encuentre
una ecuación de la superficie de revolución.

16
1.2. Funciones de varias variables
Hasta ahora en este texto, sólo se han visto funciones de una sola variable (independiente).
Sin embargo, muchos problemas comunes son funciones de dos o más variables. Por ejemplo,

1. Área de un rectángulo A = xy

2. Volumen de un cilindro circular V = πr2 h

3. Volumen de un cono circular V = 13 πr2 h

4. Perı́metro de un rectángulo P = 2x + 2y

5. La función f (x, y) = x2 + y 2 calcula la altura del paraboloide z = x2 + y 2 .

6. La temperatura T de un punto sobre la superficie terrestre depende de su latitud x y


su longitud y, lo que se expresa escribiendo T = f (x, y).

7. El volumen V y el área de la superficie S de una caja rectangular son funciones poli-


nomiales de tres variables:

V = xyz, S = 2xy + 2xz + 2yz

Nota: Puesto que se requieren cuatro dimensiones, no es posible graficar una función
de tres variables.

Definition 1. Una función de dos variables, definida en el dominio D en el plano,


es una regla f que asocia a cada punto (x, y) en D un número real único, denotado
por f (x, y). Una función de tres variables, definida en el dominio D en el espacio,
es una regla f que asocia a cada punto (x, y, z) en D un número real único f (x, y, z).

OBS:

1. En la función dada por z = f (x, y), x y y son las variables independientes y z es la


variable dependiente.

2. En caso de que el dominio D de f no se especifique en forma explı́cita, se toma como


aquel que consiste en todos los puntos para los que la fórmula dada es significativa.

3. Una función de dos variables suele escribirse z = f (x, y) y se lee “f de x, y.”

4. Una ecuación de un plano ax + by + cz = d, c 6= 0, describe una función cuando se


escribe como
d a b d a b
z = − x − y, f (x, y) = − x − y
c c c c c c
Puesto que z es un polinomio en x y y, el dominio de la función consiste en el plano xy
completo.

Dominios e imágenes

Para definir una función de más de una variable, seguimos la práctica usual de excluir las
entradas que conducen a números complejos o a la división entre cero.

17
Ejemplo 16.
p
1. Dado que f (x, y) = 4 + x2 − y 2 ) encuentre f (1, 0), f (5, 3) y f (4, −2).

2. Dibuje el dominio de la función.

SOL: (a)

f (1, 0) =
f (5, 3) =
f (4, −2) =

SOL: (b) Las coordenadas (x, y) debe cumplir x2 − y 2 ≥ 0, el dominio consiste en la región
sombreada de la figura.
Ejemplo 17. Calcule el dominio para las siguientes funiciones y si es posible indique su
grafica
p x
1. f (x, y) = 9 − x2 − y 2 4. g(x, y, z) = √
9−x2 −y 2 −z 2
2. f (x, y) = ln xy
√ 2 2
3. f (x, y) =
x +y −9 5. g(x, y, z) = √ x+y+z
x 2x +y +z 2
2

SOL: (1) Dominio: Las coordenadas (x, y) deben satisfacer . Es decir,


el dominio de f consiste en la

SOL: (2) Dominio: las coordenadas (x, y) deben satisfacer . Es decir, el dominio de f
es

SOL: (3) Dominio: las coordenadas (x, y) de esta función deben satisfa-
cer . Es decir, el dominio de f son los puntos que están
. OJO con el eje y

SOL: (4) Dominio: las coordenadas (x, y, z) de esta función de-


ben satisfacer . Es decir, el dominio se encuentran

SOL: (5) Dominio: las coordenadas (x, y, z) de esta función deben satisfacer
. Es decir, el dominio

Ejemplo 18. Encuentre el dominio de definición de la función cuya fórmula es f (x, y) =


√ y 2 y encuentre los puntos (x, y) en los que f (x, y) = ±1.
x−y

SOL: Para que f (x, y) esté definida, x−y 2 > 0 es decir, y 2 < x. Este dominio está sombreado
en la figura. Observe que la parábola en aparece en lı́nea punteada para indicar que NO
está incluida en el dominio de f .
Por otra parte f (x, y) = ±1 implica que √ y 2 = ±1, es decir, x = 2y 2 . Por lo tanto
x−y
f (x, y) = ±1 se obtiene en cada punto de la parábola x = 2y 2 [OJO (x, y) 6= (0, 0)].

18
Graficas

Como en el caso de las funciones de una sola variable, se puede saber mucho acerca del
comportamiento de una función de dos variables dibujando su gráfica. La gráfica de una
función f de dos variables es el conjunto de todos los puntos (x, y, z) para los que z = f (x, y)
y (x, y) está en el dominio de f .

1. La gráfica puede interpretarse geométricamente como una superficie en el espacio.

2. la gráfica de z = f (x, y) es una superficie cuya proyección sobre el plano xy es D, el


dominio de f .

3. A cada punto (x, y) en D corresponde un punto (x, y, z) de la superficie y, viceversa,


a cada punto (x, y, z) de la superficie le corresponde un punto (x, y) en D.

p
Ejemplo 19. ¿Cuál es el rango de f (x, y) = 16 − 4x2 − y 2 . Describir la gráfica de f .

SOL: Para que f (x, y) esté definida, . Por tanto, el dominio D es el


conjunto de todos los puntos que

El rango de f está formado por todos los valores z = f (x, y) tales que .
Un punto (x, y, z) está en la gráfica de f si y sólo si
Por lo tanto, la gráfica de f es .

Ejemplo 20. Dibuje la gráfica de la función f (x, y) = 2 − 12 x − 31 y.

SOL: No es difı́cil ver que la gráfica z = 2− 12 x− 31 y es , y para visualizarlo


usamos las trazas.

Curvas de nivel
En general, si una función de dos variables está dada por z = f (x, y) entonces el conjunto
de puntos (x, y) en el dominio de f donde f (x, y) = c tiene un valor constante es una curva
de nivel de f . El conjunto de todos los puntos (x, y, f (x, y)) en el espacio, para (x, y) en
el dominio de f , se llama la gráfica de f o también se les llama superficie z = f (x, y).

NOTA: La curva en el espacio donde el plano z = c corta a una superficie z = f (x, y)


está formada por los puntos que representan el valor de la función f (x, y) = c. A ésta se le

19
llama curva de contorno para distinguirla de la curva de nivel f (x, y) = c en el dominio
de f . Sin embargo, no todo mundo hace esta distinción; por ejemplo en la mayorı́a de los
mapas, a las curvas que representan una elevación (altura sobre el nivel del mar) se les llama
contornos, no curvas de nivel.

Ejemplo 21. Grafique f (x, y) = 100 − x2 − y 2 y trace las curvas de nivel f (x, y) = 0,
f (x, y) = 51 y f (x, y) = 75 en el dominio de f en el plano.

SOL: El dominio de f es , y el rango de f es el conjunto de números


reales . La gráfica es . La curva de nivel f (x, y) = 0
es claramente , ya que,

las curvas f (x, y) = 51 y f (x, y) = 75 son . Pues,

Ejemplo 22. Halle las curvas de nivel de una función polinomial f (x, y) = y 2 − x2

SOL: las curvas de nivel son dadas por . Observe


que si c 6= 0 las curvas son , pero si c = 0 las curvas son .

Ejemplo 23. Estudie las curvas de nivel del paraboloide z = 25 − x2 − y 2

SOL: las curvas de nivel son dadas por . Por tanto las curvas
de nivel son .

20
Superficies de nivel

Para una función de tres variables, w = f (x, y, z) las superficies definidas por f (x, y, z) = c
donde c es una constante, se llaman superficies de nivel de la función f . Aquı́ NO graficamos
la función pues los puntos (x, y, z, f (x, y, z)) que están en R4 ; Sin embargo, podemos ver
cómo se comporta la función, estudiando sus superficies de nivel en su dominio, ya que ellas
muestran en qué forma cambian los valores de la función al movernos por el dominio.

Ejemplo 24.

1. Las superficies de nivel del polinomio f (x, y, z) = x−2y+3z son

2. Las superficies de nivel del polinomio f (x, y, z) = x2 +y 2 +z 2 son


x2 − y 2
3. Las superficies de nivel de una función racional f (x, y, z) = están dadas por
z
.

Ejemplo 25. Estudie las superficies de nivel de la función f (x, y) = x2 + y 2 − z 2

SOL: La superficies de nivel están dadas por . De manera que, si c > 0


entonces obtenemos un , mientras que si c < 0, entonces es
. El cono x2 + y 2 − z 2 = 0 se encuentra entre estos dos tipos de hi-
perboloides.

21
1.3. Lı́mites y continuidad
Para poder abordar adecuadamente el estudio de la diferenciabilidad de funciones de varias
variables es necesario tener algunos conceptos sobre limites y continuidad de estas funciones.
Aunque en estas notas de clase no voy hacer un acercamiento riguroso y exhaustivo sobre
limites y continuidad, debido a que a que se requiere un trabajo previo con la topologı́a del
espacio Rn (en el curso de análisis, exijan esta rigurosidad)
En el estudio de los lı́mites de las funciones de varias variables, se ponen al descubierto las
grandes dificultades de pasar del cálculo de una variable al de varias variables: para funciones
de una variable sus dominios son “pedazos de la recta”, muchas veces intervalos. Para una
función de n variables, su dominio es un “pedazo de Rn ”, y... aquı́ empiezan los problemas.
¿Cómo son los subconjuntos de Rn .equivalentes.a los subconjuntos de R? La respuesta la en-
contramos en la matemática llamada “topologı́a”. Nosotros solamente estudiaremos aquellos
conceptos ”topológicos”que nos hagan la vida más eficiente para comprender los conceptos
de lı́mite y continuidad para una función f : U ⊂ Rn → R.
En el caso de funciones de una variable, en muchos casos es factible hacer un juicio acerca
de la existencia de lı́m f (x) a partir de la gráfica de y = f (x). También se aprovecha que
x→a
lı́m f (x) existe si y sólo si lı́m− f (x) y lı́m+ f (x) existe y son iguales al mismo número L,
x→a x→a x→a
en cuyo caso lı́m f (x) = L. En esta sección veremos que la situación es más DIFÍCIL en la
x→a
consideración de lı́mites de funciones de dos variables.
El estudio del lı́mite de una función de dos variables inicia definiendo el análogo bidi-
mensional de un intervalo en la recta real. Utilizando la fórmula para la distancia entre dos
puntos (x, y) y (x0 , y0 ) en el plano, se puede definir el entorno de (x0 , y0 ) como el disco con
radio δ > 0 centrado en (x0 , y0 )
n p o
D = (x, y) : (x − x0 )2 + (y − y0 )2 < δ

Cuando esta fórmula contiene el signo de desigualdad menor que, <, al disco se le llama
abierto, y cuando contiene el signo de desigualdad menor o igual que, ≤ al disco se le llama
cerrado.
Definition 2. Un conjunto V ⊂ Rn se dice que es abierto si para cada x ∈ V
existe r > 0 tal que B(x, r) ⊂ V . Un conjunto F ⊂ Rn se dice que es cerrado si su
complemento F c = Rn − F es un conjunto abierto.

1. Un punto (x0 , y0 ) en una región R del plano es un punto interior de R si existe un


entorno δ de (x0 , y0 ) que esté contenido completamente R.
2. Si todo punto de R es un punto interior, entonces es una región abierta.

3. Un punto (x0 , y0 ) es un punto frontera de R si todo disco abierto centrado (x0 , y0 )


en contiene puntos dentro de R y puntos fuera de R

4. Si una región contiene todos sus puntos frontera, la región es cerrada.

5. Una región que contiene algunos pero no todos sus puntos frontera no es ni abierta ni
cerrada.

6. La región R está acotada si puede estar contenida en un rectángulo o disco suficiente-


mente grande en el plano.

22
Las definiciones de interior, frontera, abierta, cerrada, acotada y no acotada para las
regiones en el espacio, son similares a las de las regiones en el plano. Para considerar la
dimensión extra, ahora usamos esferas sólidas de radio positivo en lugar de discos.

1. Un punto (x0 , y0 , z0 ) en una región R del espacio es un punto interior de R, si es el


centro de una bola sólida que está completamente dentro de R

2. Un punto (x0 , y0 , z0 ) es un punto frontera de R si toda esfera con centro en (x0 , y0 , z0 )


contiene puntos que están fuera de R y puntos que están en R

3. El interior de R es el conjunto de puntos interiores de R.

4. La frontera de R es el conjunto de puntos frontera de R.

5. Una región es abierta si consta sólo de puntos interiores.

6. Una región es cerrada si contiene a toda su frontera.

1.4. Lı́mites de funciones de dos variables

Analizar un lı́mite dibujando la gráfica de z = f (x, y) no es conveniente ni es una rutina


posible para la mayor parte de las funciones de dos variables. Por intuición sabemos que f
tiene un lı́mite en un punto (a, b) si

lı́m f (x, y) = L
(x,y)→(a,b)

Para tener un poco más de precisión, los puntos en el espacio (x, y, f (x, y)) pueden hacerse
arbitrariamente cercanos a (a, b, L) siempre que (x, y) sea suficientemente cercano a (a, b)
La noción de (x, y) “aproximándose” a un punto (a, b) no es tan simple como para funciones
de una variable donde x → a significa que x puede acercarse a a sólo desde la izquierda y
desde la derecha.

23
En el plano xy hay un número infinito de maneras de aproximarse al punto (a, b) para
que lı́m f (x, y) exista, requerimos ahora que f se aproxime al mismo número L a lo
(x,y)→(a,b)
largo de cualquier trayectoria o curva posible que pase por (a, b).
OBS:

1. Si f (x, y) no se aproxima al mismo número L por dos trayectorias diferentes a (a, b),
entonces lı́m f (x, y) no existe.
(x,y)→(a,b)

2. En la discusión de lı́m f (x, y) que sigue se supondrá que la función f está definida
(x,y)→(a,b)
en todo punto (x, y) en un disco abierto centrado en (a, b) pero no necesariamente en
el propio (a, b).
x2 − 3y 2
Ejemplo 26. Demuestre que lı́m no existe.
(x,y)→(0,0) x2 + 2y 2

SOL: El dominio de f es R2 \(0, 0). Aproximemos a (0, 0) por el eje x (y = 0) y el eje y


(x = 0).
x2 − 3y 2 x2
lı́m 2 2
= lı́m =1
(x,y)→(0,0) x + 2y (x,0)→(0,0) x2
y=0

x2 − 3y 2 3y 2 3
lı́m = lı́m =−
(x,y)→(0,0) x2 + 2y 2 (0,y)→(0,0) 2y 2 2
x=0

Por tanto, el lı́mite no existe.


xy
Ejemplo 27. Demuestre que lı́m no existe.
(x,y)→(0,0) x2 + y2

SOL: El dominio de f es R2 \(0, 0). Aproximemos a (0, 0) por el eje x y el eje y.


xy 0
lı́m = lı́m =0
(x,y)→(0,0) x2 + y 2 (x,0)→(0,0) x2
y=0

xy 0
lı́m = lı́m =0
(x,y)→(0,0) x2 + y 2 (0,y)→(0,0) y 2
x=0
xy
Sin embargo, esto NOOOOO significa que lı́m
exista, ya que no se ha exa-
+ y2 (x,y)→(0,0) x2
minado toda trayectoria a (0, 0). Ahora, usemos todas las rectas que pasan por el origen
y = mx.
xy mx2 m
lı́m = lı́m =
(x,y)→(0,0) x2 + y 2 2 2
(x,mx)→(0,0) x + m x 2 1 + m2
y=mx

24
Ahora el limite depende de la pendiente m de la recta, concluimos que el lı́mite no existe.
Por ejemplo, tomando las rectas y = x y en y = 2x tenemos,

xy x2 1
lı́m = lı́m =
(x,y)→(0,0) x2 + y 2 (x,x)→(0,0) x2 + x2 2
y=x

xy 2x2 2
lı́m = lı́m =
(x,y)→(0,0) x2 + y 2 (x,2x)→(0,0) x2 + 4x2 5
y=2x

x3 y
Ejemplo 28. Demuestre que lı́m no existe.
(x,y)→(0,0) x6 + y 2

SOL: El dominio de f es . Aproximemos a (0, 0) por el eje x, el eje y


y por rectas y = mx

x3 y
lı́m =
(x,y)→(0,0) x6 + y 2
y=0

x3 y
lı́m =
(x,y)→(0,0) x6 + y2
x=0

x3 y
lı́m =
(x,y)→(0,0)
y=mx
x6 + y2

Si bien esto constituye verdaderamente un número infinito de trayectorias al origen, el


lı́mite sigue sin existir, ya que tomando la trayectoria dada por y = x3

x3 y
lı́m =
(x,y)→(0,0) x6 + y 2
y=x 3

Por tanto, concluimos que el lı́mite no existe.


 x 2 − y 2 2
Ejemplo 29. Demuestre que lı́m no existe.
(x,y)→(0,0) x2 + y 2

SOL: El dominio de f es . Aproximemos a (0, 0) por el eje x, el eje y y


por rectas y = x
 x 2 − y 2 2
lı́m =
(x,y)→(0,0) x2 + y 2
y=0

 x 2 − y 2 2
lı́m =
(x,y)→(0,0) x2 + y 2
x=0

 x 2 − y 2 2
lı́m = =
(x,y)→(0,0)
y=x
x2 + y 2

Por tanto, NO tiene lı́mite en (0, 0).


10xy 2
Ejemplo 30 (Uso de coordenadas polares). Evalue lı́m .
(x,y)→(0,0) x2 + y 2

25
SOL: Usando las coordenadas polares x = r cos θ y y = r sen θ tenemos
10xy 2 10r3 cos θ sen2 θ
= = 10r cos θ sin2 θ
x2 + y 2 r2
Por tanto,
10xy 2
lı́m = lı́m 10r cos θ sin2 θ = 0
(x,y)→(0,0) x2 + y 2 r→0

Observe, que el limite es independiente del valor de θ. De ahi que el limite exista.

Definición formal de un lı́mite

Definition 3. Suponga que una función f de dos variables se define en cualquier


punto en un disco abierto centrado en (a, b) salvo posiblemente en (a, b). Entonces

lı́m f (x, y) = L
(x,y)→(a,b)

significa que para toda ǫ > 0, existe un número δ > 0 tal que
p
|f (x, y) − L| < ǫ, siempre que 0 < (x − a)2 + (y − b)2 < δ

10xy 2
Ejemplo 31. Demuestre que lı́m = 0.
(x,y)→(0,0) x2 + y 2

SOL: Sea ǫ > 0 fijo, deseamos encontrar un δǫ > 0 tal que


10xy 2 p
f (x, y) − 0 = 2 − 0 < ǫ, siempre que |(x, y) − (0, 0)| = x2 + y 2 < δǫ

x +y 2

Observe que
10xy 2 y2
− 0 = 10|x|

2
x + y2 x2 + y 2

y2 √ p
≤ 10|x| 2 = 10|x| = 10 x2 ≤ 10 x2 + y 2
y
< 10δǫ .
2

ǫ
De modo que si se elige δǫ = 10 , logramos tener x10xy
2 +y 2 − 0 < 10δǫ = ǫ. Esto demuestra que

10xy 2
lı́m =0
(x,y)→(0,0) x2 + y 2

5x2 y
Ejemplo 32. Demuestre que lı́m = 0.
(x,y)→(0,0) x2 + y2
p
SOL: Dado ǫ > 0 fijo, debemos encontar un δǫ > 0 tal que, si |(x, y)−(0, 0)| = x2 + y 2 <
δǫ entonces |f (x, y) − 0| < ǫ Observe que
5x2 y x2
|f (x, y) − f (0, 0)| = | | = 5|y|
x2 + y 2 x2 + y 2
2
x p p
≤ 5|y| 2 = 5|y| = 5 y 2 ≤ 5 x2 + y 2
x
= 5δǫ .

26
Por tanto, se puede elegir δǫ = 5ǫ y concluir que si |(x, y)−(0, 0)| < ǫ
5 entonces |f (x, y)−0| < ǫ
5x2 y
es decir, lı́m = 0.
(x,y)→(0,0) x2 + y 2

Ejemplo 33. Demuestre usando la definición) que lı́m 3x2 + y = 5 .


(x,y)→(1,2)

SOL: Debemos
p demostrar que para cualquier ǫ > 0 existe un δ > 0 tal que si k(x, y) −
(1, 2)k = (x − 1)2 + (y − 2)2 < δ entonces |(3x2 + y) − 5| < ǫ
Primero observe que
|(3x2 + y) − 5| = |3x2 − 3 + y − 2| ≤ 3|x2 − 1| + |y − 2| = 3|x − 1||x + 1| + |y − 2|
Ahora el objetivo es usar δ para controlar los terminos |x − 1|, |x + 1| y |y − 2|. No es dificil
ver que
p p
|x − 1| = (x − 1)2 ≤ (x − 1)2 + (y − 2)2 < δ
p p
|y − 2| = (y − 1)2 ≤ (x − 1)2 + (y − 2)2 < δ
Para controlar el termino |x+1| debemos imponer una restriccion sobre el δ. Dicha restricción
consiste en elegir un valor para δ por ejemplo δ = 1. De manera que el δ que estamos buscando
debera cumplir dos condiciones
p
(x − 1)2 + (y − 2)2 < δ, y δ≤1
Usando la segunda condición podemos decir que el termino
|x − 1| < δ = 1, ⇒ −1 < x − 1 < 1, ⇒ 1 < x + 1 < 3, ⇒ |x + 1| < 3
Por tanto
|(3x2 + y) − 5| ≤ 3|x − 1||x + 1| + |y − 2| < (3δ)(3) + δ = 10δ
Como nuestro objetivo final es que |(3x2 +y)−5| < ǫ entonces el δ que buscamos debe cumplir,
1
10δ < ǫ, es decir δ ≤ 10 ǫ. Esto significa que hemos impuesto dos restricciones sobre el δ;
1 1
δ ≤ 1 y δ ≤ 10 ǫ. Para que ambas restricciones sean validas debemos tomar δ = mı́n{1, 10 ǫ}
1
con es δ tenemos demostrado que para cualquier ǫ > 0 elegimos a δ = mı́n{1, 10 ǫ} y entonces
si p
(x − 1)2 + (y − 2)2 < δ entonces |(3x2 + y) − 5| < 10δ = ǫ.
Esto demuestra que lı́m 3x2 + y = 5.
(x,y)→(1,2)

sen(x2 + y 2 )
Ejemplo 34. Demuestre que lı́m = 1.
(x,y)→(0,0) x2 + y 2

SOL: Dado ǫ > 0 debemos encontrar un valor δ > 0 tal que


sen(x2 + y 2 ) p
− 1 < ǫ, siempre que 0 < x2 + y 2 < δ

x2 + y 2

sen h
Observe que si h = x2 + y 2 entonces lı́m = 1, esto implica que dado ǫ > 0 podemos
h→0 h
hallar un δ1 > 0 con 0 < δ1 < 1 tal que
sen(h)
− 1 < ǫ, siempre que 0 < |h − 0| < δ1

h

2
Observe
√ √que, si 0 < |t| < δ1 entonces 0 < 2t < δ21 < δ1 , sacando raiz a √
ambos lados,
0 < t < δ 1 . Deshaciendo el reemplazo h = x + y , y tomando como δ = δ1 logramos
concluir que
p sen(x2 + y 2 )
Si 0 < x2 + y 2 < δ entonces − 1 <ǫ

x2 + y 2

sen(x2 + y 2 )
Esto demuestra que el lı́m = 1.
(x,y)→(0,0) x2 + y 2

27
1.4.1. Continuidad

Definition 4. Una función z = f (x, y) es continua en (a, b) si

lı́m f (x, y) = f (a, b)


(x,y)→(a,b)

Si f no es continua en (a, b) se afirma que es discontinua.

1. La gráfica de una función continua es una superficie sin quiebres.

2. Una función z = f (x, y) es continua sobre un región R del plano xy si f es continua


en cualquier punto en R.

3. La suma y el producto de dos funciones continuas también son continuas.

4. El cociente de dos funciones continuas es continuo, excepto en el punto donde el


denominador es cero.

5. Si g es una función de dos variables continuas en (a, b) y F es una función de una


variable continua en g(a, b) entonces la composición f (x, y) = F ◦ g(x, y) es continua
en (a, b).

x4 − y 4
Ejemplo 35. Demuestre que la función f (x, y) = es discontinua en (0, 0), pero
x2 + y 2

4 4
 x −y

(x, y) 6= (0, 0)
F (x, y) = x2 + y 2
0 (x, y) = (0, 0)

es continua en (0, 0).

SOL: Claramente la funición f (x, y) es discontinua en (0, 0), ya que f (0, 0) no esta definida.
Por otra parte, F (0, 0) = 0 y

x4 − y 4 (x2 − y 2 )(x2 + y 2 )
lı́m = lı́m =0
(x,y)→(0,0) x2 + y 2 (x,y)→(0,0) x2 + y 2

Por consiguiente, advertimos que lı́m F (x, y) = F (0, 0)


(x,y)→(0,0)

 x2 + y 2 x2 + y 2 ≤ 1
Ejemplo 36. Sea f una funcion definida por f (x, y) = Determi-
 0 x2 + y 2 > 1
nar la continuidad de f . ¿Cual es la región de continuidad?

SOL Claramente la función f (x, y) es continua en todos puntos (x, y) que verifican x2 +
y 6= 1. En efecto, considere los puntos (x0 , y0 ) que verifican x20 + y02 6= 1
2

lı́m f (x, y) = lı́m x2 + y 2 = x20 + y02 = f (x0 , y0 )


(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )
x20 +y02 <1

lı́m f (x, y) = lı́m 0 = 0 = f (x0 , y0 )


(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )
x20 +y02 >1

28
Ahora estudiemos el caso en que (x0 , y0 ) que verifican x20 +y02 = 1 y veamos si lı́m f (x, y)
(x,y)→(x0 ,y0 )
existe Sea S1 = (x, y) : x2 + y 2 ≤ 1 y S2 = (x, y) : x2 + y 2 > 1
 

lı́m f (x, y) = lı́m x2 + y 2 = x20 + y02 = 1


(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )
P ∈S1

lı́m f (x, y) = lı́m 0=0


(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )
P ∈S2

Como los limites no coinciden entonces f es discontinua en todos los puntos (x, y) que verifican
x2 +y 2 = 1. De manera que la region de continuidad es todo R2 menos la circuferencia unitaria
x2 + y 2 = 1.

APENDICE: Conjuntos abiertos y cerrados


n o
Ejemplo 37. Demuestre que el conjunto (a, b) = x ∈ (a, b) : a < x < b es abierto.


SOL: Sea x ∈ (a, b) y consideremos la distancia L = mı́n x − a, b − x > 0 entonces

B(x, L) = (x − L, x + L) ⊂ (a, b)

esto es x es un punto interior de (a, b) y como x es arbitrario, entonces todo punto de (a, b)
es interior. Por tanto (a, b) es un conjunto abierto de R

Ejemplo 38. La bola abierta con centro en x0 y radio R > 0, es el conjunto abierto:
n o
B(x0 , R) = x ∈ Rn : kx − x0 k < R

SOL: Sea x ∈ B(x0 , R), luego por definición kx − x0 k < R. De aquı́ podemos decir que
r := R − kx − x0 k > 0 y ası́ considerar la bola B(x, r).
Nuestro objetivo es demostrar que B(x, r) ⊂ B(x0 , R), para ello tomemos un y ∈ B(x, r)
el cual verifica, (ky − xk < r) Ahora observe que

ky − x0 k = ky − x + x − x0 k ≤ ky − xk + kx − x0 k ≤ r + kx − x0 k = R

Es decir, ky − x0 k < R por lo tanto y ∈ B(x0 , R)


n o
Ejemplo 39. Probar que A = (x, y) ∈ R2 : x > 0

SOL: Sea (x, y) ∈ A, entonces x > 0. Por tanto, si tomaremos como radio r = x. Si
(x1 , y1 ) ∈ B((x, y), r) tenemos
p p
|x1 − x| = (x1 − x)2 = (x1 − x)2 + (y1 − y)2 < r = x

y ası́ x1 − x < x, es decir x1 > 0 por tanto (x1 , y1 ) ∈ A. entonces B((x, y), r) ⊂ A, y por
tanto A es abierto.

Ejemplo 40. Si A1 y A2 son conjuntos abiertos de R entonces el rectángulo


n o
A1 × A2 = (a1 , a2 ) : a1 ∈ R, y a2 ∈ R , es abierto

SOL: Sea (a1 , a2 ) ∈ A1 × A2 tenemos que demostrar que existe un 2-bola B(a1 , a2 ; r) ⊂
A1 × A2 . Puesto que A1 , y A2 son abiertos en R existe una 1-bola B(a1 , r) en A1 , y una

29
1-bola B(a2 , r2 ) en A2 . Sea r = mı́n{r1 , r2 }. Podemos fácilmente demostrar que la 2-bola
(B(a1 , a2 ; r) ⊂ A1 ×A2 . En efecto, si (x1 , x2 ) es un punto cualquiera de B((a1 , a2 ), r) entonces

k(x1 , y1 ) − (a1 , a2 )k < r, ası́ que |x1 − a1 | < r1 , y |x2 − a2 | < r2 .

Luego x1 ∈, B(a1 , r) y x2 ∈ B(a2 , r2 ). Por consiguiente x1 ∈ A1 , y x2 ∈ A2 ası́ que (x1 , x2 ) ∈


A1 × A2 . Esto demuestra que todo punto de B((a1 , a2 ), r) está en A1 × A2 . Por lo tanto todo
A1 × A2 es abierto.
Ejemplo 41. La bola cerrada con centro x0 y radio r ≥ 0 es el conjunto cerrado dado por:
n o
B(x0 , r) = x ∈ Rn : kx − x0 k ≤ r

SOL: : Sea x0 ∈ Rn y r ≥ 0. Probaremos que la bola cerrada B(x0 , r) es un conjunto


cerrado, es decir, que su complemento Rn − B(x0 , r) es un conjunto abierto.
Sea pues x ∈ Rn − B(x0 , r). Mostraremos que existe una bola abierta B(x, R) ⊂ Rn −
B(x0 , r). Como x no está en la bola cerrada B(x0 , r), se tiene entonces que kx − x0 k > r.
Definamos R = kx − x0 k − r > 0, esto equivale a r = kx − x0 k − R. Veamos que
B(x, R) ⊂ Rn − B(x0 , r). En efecto, sea y ∈ B(x, R) se tiene entonces ky − xk < R. Por lo
tanto,
kx − x0 k = kx − y + y − x0 k = kx − yk + ky − x0 k ≤ R + ky − x0 k
Luego, kx − x0 k < R + ky − x0 k. Por tanto, kx − x0 k − R < ky − x0 k, es decir r < ky − x0 k.
/ B(x0 , r), es decir, y ∈ Rn − B(x0 , r)
Esto significa que y ∈
Proposition 5. Si f : X → Y es continua entonces para todo conjunto abierto V en
Y , la preimagen de V en X,
n
f −1 (V ) = x ∈ X : f (x) ∈ V ,

es un conjunto abierto en X.

DEM: Para demostrar que f −1 (V ) es abierto, sea x ∈ f −1 (V ). Entonces f (x) ∈ V .


Como V es abierto, existe ǫ > 0 tal que B(f (x), ǫ) ⊂ V . Ahora como f es continua en todo
X, es continua en x, ası́ que existe δ > 0 tal que B(x, δ) es una bola centrada en x y

f B(x, δ) ⊂ B(f (x), ǫ) ⊂ V ,

esto es
B(x, δ) ⊂ f −1 B(f (x), ǫ) ⊂ f −1 (V )


lo cual muestra que f −1 (V ) es abierto

Ejemplo 42 (APLICACIONES DE LA PROPOSICIÓN).


Demuestre si los siguientes conjuntos son abiertos, cerrados, acotados, compactos
1. A = (x, y) ∈ R2 : x2 + y 2 ≤ 2 6. D = (x, y) ∈ R2 : |x| + |y| < 1
 

2. A = (x, y) ∈ R2 : xy ≤ 2

7. E = (x, y) ∈ R2 : y < x2 , y < x1 , x > 0


3. A = (x, y) ∈ R2 : 0 < k(x, y) − (1, 3)k < 2




8. F = (x, y) ∈ R2 : xy ≤ y + 1

2 3

4. A = (x, y) ∈ R : y ≤ x
5. C = (x, y) ∈ R2 : |x| < 1, |y| ≤ 2 9. G = (x, y) ∈ R2 : (x − 1)2 + y 2 ≤ 1, x ≤ 1
 

SOL (1) El conjunto representa al disco de centro C = (0, 0) y radio menor o igual a 2.
Si consideramos la función f : R2 → R definida por f (x, y) = x2 + y 2 es continua y positiva,

30
el conjunto A se puede escribir como

A = (x, y) ∈ R2 : x2 + y 2 ≤ 2 = (x, y) ∈ R2 : 0 ≤ f (x, y) ≤ 2


 

= (x, y) ∈ R2 : f (x, y) ∈ [0, 2]




= f −1 [0, 2]


Como el intervalo [0, 2] ⊂ R es cerrado, y f es continua entonces A = f −1 [0, 2]) es cerrado.




Como también está acotado, el conjunto A es compacto.


SOL (2) Para este conjunto podemos definir la función g : R2 → R dada por g(x, y) = xy
claramente es continua, el conjunto A se puede escribir como

A = (x, y) ∈ R2 : xy ≤ 2 = (x, y) ∈ R2 : g(x, y) ≤ 2


 

= (x, y) ∈ R2 : g(x, y) ∈ (−∞, 2]




= g −1 (−∞, 2]


Como el intervalo (∞, 2] ⊂ R es cerrado, y g es continua entonces A = g −1 (∞, 2]) es




cerrado. Pero A no es acotado, por lo tanto A no es compacto.


SOL (3) Para reescribir este conjunto consideremos la función f : R2 → R definida por
p
f (x, y) = k(x, y) − (1, 3)k = (x − 1)2 + (y − 3)2

Claramente f es continua y el conjunto A se puede escribir como

A = (x, y) ∈ R2 : 0 < k(x, y) − (1, 3)k < 2 = (x, y) ∈ R2 : 0 < f (x, y) < 2
 

= (x, y) ∈ R2 : f (x, y) ∈ (0, 2)




= f −1 (0, 2)


Como el intervalo (0, 2) ⊂ R es abierto, el conjunto A es abierto. Es acotado, ya que


está contenido en el disco {(x, y) ∈ R2 : k(x, y) − (1, 3)k < 2}.
SOL (4) Para reescribir este conjunto consideremos la función f : R2 → R definida por

f (x, y) = x3 − y ≥ 0

es continua y el conjunto A se puede escribir como

A = (x, y) ∈ R2 : y ≤ x3 = (x, y) ∈ R2 : f (x, y) ≥ 0


 

= (x, y) ∈ R2 : f (x, y) ∈ [0, ∞)




= f −1 [0, ∞)


Como el intervalo [0, ∞) ⊂ R es cerrado, el conjunto A es cerrado.

Sol (5): La representación gráfica del conjunto A se puede ver el la figura. Los puntos P y
Q están en la frontera de C. Como P ∈ / C, vemos que C no es cerrado y como Q ∈ C,
vemos que C no es abierto. Vemos que ∂(C) ∩ C 6= ∅, por lo que el conjunto no es abierto.
Además, C 6= C por lo que el conjunto no es cerrado.

31
SOL (6) Para reescribir este conjunto D consideremos las funciones definidas de R2 en R

f1 (x, y) = y − x − 1 f2 (x, y) = y − 1 + x f3 (x, y) = y + x + 1 f4 (x, y) = y − x + 1

Claramente cada fi es continuas y el conjunto D se puede escribir como

D = (x, y) ∈ R2 : f1 (x, y) < 0, f2 (x, y) < 0, f3 (x, y) > 0, f (x, y) > 0




= (x, y) ∈ R2 : f1 (x, y) < 0 ∩ (x, y) ∈ R2 : f2 (x, y) < 0,


 

∩ (x, y) ∈ R2 : f3 (x, y) > 0 ∩ (x, y) ∈ R2 : f4 (x, y) > 0


 

= f1−1 − ∞, 0) ∩ f2−1 − ∞, 0) ∩ f3−1 0, ∞) ∩ f4−1 0, ∞)


   

Como los intervalos (−∞, 0), (0, ∞) ⊂ R son abiertos y cada fi es continua entonces afirma-
mos que, el conjunto A es abierto. Observe que D es acotado porque está contenido en la
bola de centro (0, 0) y radio 1, y como ∂D ∩ D = ∅, el conjunto es abierto.
SOL (7) Para reescribir este conjunto E consideremos las funciones definidas de R2 en R
1
f1 (x, y) = y − x2 f2 (x, y) = y − f3 (x, y) = x
x
Claramente cada fi es continuas y el conjunto E se puede escribir como
1
E = (x, y) ∈ R2 : y < x2 , y < , x > 0

x
= (x, y) ∈ R2 : f1 (x, y) < 0, f2 (x, y) < 0, f3 (x, y) > 0,


= (x, y) ∈ R2 : f1 (x, y) < 0 ∩ (x, y) ∈ R2 : f2 (x, y) < 0, ∩ (x, y) ∈ R2 : f3 (x, y) > 0


  

= f1−1 − ∞, 0) ∩ f2−1 − ∞, 0) ∩ f3−1 0, ∞)


  

Como los intervalos (−∞, 0), (0, ∞) ⊂ R son abiertos y cada fi es continua entonces afir-
mamos que, el conjunto E es abierto. Observe que E no es acotado y como ∂E ∩ E = ∅, el
conjunto es abierto.

Sol (8) Para este conjunto podemos definir la función g : R2 → R dada por g(x, y) = xy − y
claramente es continua, el conjunto F se puede escribir como

F = (x, y) ∈ R2 : xy ≤ y + 1 = (x, y) ∈ R2 : g(x, y) ≤ 1


 

= (x, y) ∈ R2 : g(x, y) ∈ (−∞, 1]




= g −1 (−∞, 1]


Como el intervalo (∞, 1] ⊂ R es cerrado, y g es continua entonces F = g −1 (∞, 1]) es




cerrado. Pero F no es acotado, por lo tanto F no es compacto. Como ∂(F ) ⊂ F , el conjunto


F es cerrado.

32
SOL (9) Para reescribir este conjunto G consideremos las funciones definidas de R2 en R

f1 (x, y) = (x − 1)2 + y 2 f2 (x, y) = x

Claramente cada fi es continuas y el conjunto F se puede escribir como

G = (x, y) ∈ R2 : (x − 1)2 + y 2 ≤ 1, x ≤ 1


= (x, y) ∈ R2 : f1 (x, y) ≤ 1, f2 (x, y) ≤ 1




= (x, y) ∈ R2 : f1 (x, y) ≤ 1 ∩ (x, y) ∈ R2 : f2 (x, y) ≤ 1,


 

= f1−1 − ∞, 1] ∩ f2−1 − ∞, 1]
 

Como el intervalo (−∞, 1] ⊂ R son cerrados y cada fi es continua entonces afirmamos que,
el conjunto G es cerrado. Observe que G es acotado porque está contenido en el disco de
centro (1, 0) y radio 1, y como ∂G ⊂ G, el conjunto G cerrado.

33
Calculo Vectorial

Diferenciación Vectorial

Recordemos que para una función de una variable f : I ⊂ R → R definida en el intervalo


abierto I de R, se define la derivada de f en x0 ∈ I, denotada por f ′ (x0 ), como el valor del
lı́mite
f (x0 + h) − f (x0 )
f ′ (x0 ) = lı́m
h→0 h
cuando éste existe (en cuyo caso decimos que f es diferencı́able en x0 ).

1. Si f ′ (x0 ) existe, su valor nos da la pendiente de la recta tangente a la gráfica de la


función y = f (x) en el punto (x0 , f (x0 )).

2. Las funciones importantes a estudiar, bajo la óptica del cálculo, son las funciones dife-
renciables.

3. Cuando se tiene una función diferenciable, lo importante es obtener información de la


función a partir de su derivada (la información que se obtiene de f a partir del valor
de f ′ (x0 ) es local, alrededor de x0 ).

4. El simple hecho de la existencia de f ′ (x0 ) nos habla del comportamiento suave de la


gráfica de la función en los alrededores del punto (x0 , f (x0 ));

5. El signo de f ′ (x0 ) nos habla del crecimiento y/o decrecimiento de la función alrededor
del punto, etc. Este es,

6. En realidad, uno de los objetivos principales del cálculo: obtener información de una
función diferenciable a partir de su derivada.

Resulta deseable, por tanto, disponer de un concepto de “diferenciabilidad”para funciones


de varias variables semejante a aquél que conocemos para funciones de una variable.

Definition 6. Sea f : U ⊂ R2 → R una función definida en el abierto U de R2 .


entonces la derivada parcial con respecto a x en un punto (x, y) es

∂f f (x + h, y) − f (x, y)
(x, y) = lı́m
∂x h→0 h
y la derivada parcial con respecto a y es

∂f f (x, y + h) − f (x, y)
(x, y) = lı́m
∂y h→0 h
siempre que exista el lı́mite.

∂f
Observe que el la definición (x, y) la variable y no cambia en el proceso del lı́mite,
∂y
en otras palabras, y se mantiene fija.
∂f
Obverse que el la definición de (x, y) la variable x no cambia en el proceso del lı́mite,
∂y
en otras palabras, y se mantiene fija.

34
En un nivel práctico
∂f
• Para calcular , hay que tomar a y como constante y derivar respecto a x.
∂x
∂f
• Para calcular , hay que tomar a x como constante y derivar respecto a y.
∂y
Las derivadas parciales son conceptos “puntuales”, es decir, se habla de la derivada
parcial de una función en un punto dado (de su dominio).
∂f ∂f
En general, se debe hacer explı́cito el punto (x0 , y0 ) donde están evaluados y
∂x ∂y
∂f ∂f
escribiendo (x0 , y0 ) y (x0 , y0 ).
∂x ∂y
Muchas veces calculamos las derivadas parciales “en un punto cualquiera (x, y) de
∂f ∂f
su dominio”. En tal caso, basta escribir y (fx y fy , o D1 f y D2 f , respectiva-
∂x ∂y
mente).
Ejemplo 43. Sea f : U ⊂ R2 → R, f (x, y) = x2 y 3 . Entonces
∂f f (x + h, y) − f (x, y)
= lı́m
∂x h→0 h
=

∂f f (x, y + h) − f (x, y)
= lı́m
∂y h→0 h
=

En este ejemplo se observa que, como era de esperarse, las derivadas parciales de una
función z = f (x, y) se obtienen “derivando parcialmenteccada una de las variables, y conser-
vando la otra como constante (es decir, pensando en la función f como dependiente sólo de
x o de y)
Ejemplo 44. Calcular las derivadas parciales, de las siguientes funciones

1. f (x, y) = x2 + 2xy 2 − y 3 .
2. z = (x2 + y 2 )exy .
3. z = 4x3 y − 24x2 + y 6 + 1,

∂ ∂
NOTA Sı́mbolos como ∂x y ∂y se denominan operadores de diferenciación parcial
y denotan la operación de tomar una derivada parcial, en este caso con respecto a x y y. Por
ejemplo,
∂ 3 2 ∂ 3 2 ∂
(x y − sin y) = (x y ) − (sin y)
∂x ∂x ∂x
∂ x4 y 5 ∂ x4 y 5 ∂
(e − sin xy) = (e )− (sin xy)
∂y ∂x ∂y
Ejemplo 45. Encuentre fx y fy (o zx y zy ) de las siguientes funciones

1. f (x, y) = x4 y 6 cos(x3 y 2 − y 3 ).
2. z = (ln(x2 y) + tan(xy 2 )

35
p
3. z = sin( 4x3 y − 24x2 y 6 + 1),

Retomando el interés de llegar a establecer una noción de diferenciabilidad equivalente a


la de (simplı́sima) para funciones de una variable (en cuyo caso diferenciabilidad equivale a
existencia de la derivada), nos podrı́amos preguntar

¿La sola existencia de las derivadas parciales de una función f :


U ⊂ Rn → R en un punto x0 ∈ U nos puede dar un concepto de
diferenciabilidad?.

Es decir, si establecemos la definición:

“la función f : U ⊂ Rn → R definida en el conjunto abierto U de


Rn es diferenciable en el punto x0 ∈ U si las derivadas parciales
∂y
∂xi (x0 ), i = 1, 2, . . . , n existen”,

No podemos negar que esta “definición”de diferenciabilidad para funciones de varias va-
riables goza de una gran simplicidad. Serı́a bueno que esta fuera en verdad la definición
que buscamos. Sin embargo, este anhelo pronto se viene abajo pues es fácil convencerse
que la existencia de las derivadas parciales de una función, (siendo una condición necesaria)
está muy lejos de ser una condición suficiente para que la función sea diferenciable en el
sentido buscado.
 xy

2 + y2
(x, y) 6= (0, 0)
2
Ejemplo 46. Considere la función f : R → R definida por f (x, y) = x
 0 (x, y) = (0, 0)
∂f ∂f
Calculemos ∂x (0, 0) y ∂y (0, 0). Según la definición de derivadas parciales, tenemos

∂f
(0, 0) =
∂x
∂f
(0, 0) =
∂y
de modo que la función tiene ambas derivadas parciales iguales a en el origen. Sin
embargo, no es difı́cil demostrar que esta función NOOOOO es continua en (0, 0). (Ver
Ejemplo 27)

Como conclusión tenemos que para funciones de varias variables la diferenciabilidad


NOOOO implica la continuidad.

2 2
 xy(x − y ) (x, y) 6= (0, 0)

Ejemplo 47. Dada f (x, y) = x2 + y 2 Muestre que
0 (x, y) = (0, 0)

(a) fx (0, y) = −y para toda y (b) fy (x, 0) = x para toda x

SOL: Para y 6= 0, se tiene


∂f
fx (0, y) = (0, y) =
∂x
=

Luego, para y = 0 resulta fx (0, 0) = 0

36
SOL: Para x 6= 0, se tiene
∂f
fy (x, 0) = (x, 0) =
∂y

Luego, para x = 0 resulta fy (0, 0) = 0


Interpretación geométrica de las derivadas parciales Las derivadas parciales fx y
fy de una función de dos variables, tienen una interpretación geométrica útil, pues fx y fy
son las pendientes de las lı́neas tangentes a ciertas curvas de la superficie z = f (x, y).
Si y = b entonces z = f (x, b) representan la curva intersección de la superficie z = f (x, y)
con el plano y = b (esto es, la coordenada x varı́a pero la coordenada y es constante, como
se muestra en la figura 1.

Fig 1 Fig 2 Fig 3

Nótese que tanto la curva como la recta tangente se encuentran en el plano y = b.

Una curva de intersección de z = f (x, y) con un plano vertical y = b se denomina


curva x sobre la superficie.

Podemos “ignorar”la presencia de y = b y considerar a z = f (x, b) una función de la


variable única x.

La pendiente de la recta tangente a la curva x original que pasa por P Figura 2, es


igual a la pendiente de la recta tangente de la figura 3, pero de acuerdo con el cálculo
con una variable, esta pendiente está dada por la expresión

∂f f (x + h, b) − f (x, b)
(x, b) = lı́m
∂x h→0 h

Ası́, el significado geométrico de fx es el siguiente:

Interpretación geométrica de fx = ∂f
dx = zx . . .
El valor fx (x, b) es la pendiente de la recta tangente en P (a, b, c) de la curva x que
se encuentra sobre la superficie z = f (x, y).

Analogamente, La figura 4 ilustra la intersección con la superficie z = f (x, y) de un plano


vertical x = a. Ahora, la curva de intersección es una curva y sobre la que varı́a y pero x = a
es constante. En la figura 5 se muestra esta curva y, z = f (a, y), y su recta tangente en P .
La proyección de la tangente en el plano yz en la figura 6) tiene pendiente ∂f ∂y = fy (a, b).

37
Fig 4 Fig 5 Fig 6
Ası́, se observa que el significado geométrico de fy es el siguiente:

Interpretación geométrica de fy = ∂f
dy = zy . . .
El valor fy (x, b) es la pendiente de la recta tangente en P (a, b, c) de la curva y que
se encuentra sobre la superficie z = f (x, y).

Observe que ahora tenemos dos rectas tangentes asociadas a la superficie z = f (x, y) en
el punto P (x0 , y0 , f (x0 , y0 )) (figura 7). ¿El plano determinado por éstas rectas tangentes es
tangente a la superficie en P?

Fig 7
Veremos que sı́, pero tenemos que aprender más sobre las derivadas parciales antes de
saber por qué.

38
Ejemplo 48. Considere un plano x = 1 el cual corta al paraboloide z = x2 + y 2 en una
parábola. Determine la pendiente de la tangente a la parábola en (1, 2, 5)
∂z
SOL: La pendiente es el valor de la derivada parcial en (1, 2):
∂y

∂z
=
∂y

(1,2)

Ejemplo 49. Hallar las pendientes en las direcciones de x y de y de la superficie dada por
2
f (x, y) = − x2 − y 2 + 25 1
8 en el punto ( 2 , 1, 2).

SOL: Las derivadas parciales de f con respecto a x y a y en ( 12 , 1, 2):



∂f
=
∂x 1

( 2 ,1)


∂f
=
∂y

( 12 ,1)

Ejemplo 50. Hallar las pendientes de la superficie dada por f (x, y) = 1 − (x − 1)2 − (y − 2)2
en el punto (1, 2, 1), en las direcciones de x y de y.

SOL: Las derivadas parciales de f con respecto a x y a y en (1, 2, 1):



∂f
=
∂x

(1,2)


∂f
=
∂y

(1,2)

Sin importar cuántas variables haya, las derivadas parciales se pueden interpretar como
tasas, velocidades o razones de cambio.

Ejemplo 51. El área de un paralelogramo con lados adyacentes a y b entre los que se forma
un ángulo θ está dada por A = ab sen θ,

1. Hallar la tasa o la razón de cambio de A respecto de a si a = 10, b = 20 y θ = π/6

2. Hallar la tasa o la razón de cambio de A respecto de θ si a = 10, b = 20 y θ = π/6

39
SOL (1): Para hallar la tasa o la razón de cambio del área respecto de a, se mantienen b
y θ constantes y se deriva respecto de a para obtener:

∂A
=
∂a

π
(10,20, 6 )

SOL (2): Para hallar la tasa o la razón de cambio del área respecto de θ, se mantienen a y b
constantes y se deriva respecto de a para obtener:

∂A
=
∂θ

π
(10,20, 6 )

Ejemplo 52. Halle la ecuación


p vectorial de la recta tangente a la curva de intersección de
la superficie z = f (x, y) = 64 − 5x2 − 7y 2 y el plano x = −2, en el punto P (−2, 2, 4).

SOL: No es dificil ver que la intersección de estas


p superficies es la traza de la superficie
con el plano x = 2 y su ecuación es dada por z = 44 − 7y 2 ahora si parametrizamos esta
traza C con y = t entonces sus coordenadas estan dadas por
p
x(t) = 2, y(t) = t, z(t) = 44 − 7t2
de manera que C ′ (t) es un vector tangente a esta traza, observe que c′ (t) = (0, 1, z ′ (t)), luego
la recta tangente en P (−2, 2, 4) es
l(s) = (−2, 2, 4) + sC ′ (2) =
Derivadas parciales de una función de tres o más variables:
El concepto de derivada parcial puede extenderse de manera natural a funciones de tres
o más variables. Por ejemplo, una función w = f (x, y, z) tiene tres derivadas parciales, que
se definen como

∂f f (x + h, y, z) − f (x, y, z)
= lı́m aquı́ y, z son constantes
∂x h→0 h
∂f f (x, y + h, z) − f (x, y, z)
= lı́m aquı́ x, z son constantes
∂y h→0 h
∂f f (x, y, z + h) − f (x, y, z)
= lı́m aquı́ x, y son constantes
∂z h→0 h
Las derivadas parciales de las funciones con aún más variables se definen de manera análoga.
Una función f (x1 , x2 , . . . , xn ) de n variables tiene n derivadas parciales, una respecto a cada
una de sus variables independientes. Por ejemplo,
∂f f (x1 , . . . , xi−1 , xi + h, xi+1 , . . . , xn ) − f (x1 , . . . , xn )
= lı́m aquı́ xi son constantes
∂xi h→0 h
 
∂f f (x1 , . . . , xi , . . . , xn ) + (0, . . . , h, . . . , 0) − f (x1 , . . . , xn )
= lı́m
∂xi h→0 h
 
∂f f (x 1 , . . . , x n ) + h(0, . . . , 1, . . . , 0) − f (x1 , . . . , xn )
= lı́m
∂xi h→0 h
 
∂f f x + hei − f (x)
= lı́m donde x = (x1 . . . , xn )
∂xi h→0 h

40
Esta ultima ecuacion es conocida como la Derivada Direccional de la funcion f en la dirección
del vector ei .
Ejemplo 53. Si f (x, y, t) = e−3πt cos(4x) sen(6y), entonces las derivadas parciales con res-
pecto a x, y y t son:,

SOL:
∂f
=
∂x
∂f
=
∂y
∂f
=
∂t
Ejemplo 54. Si g(x, y, u, v) = eux cos(vy), entonces las derivadas parciales con respecto a
x, y, u y v son:,

SOL:
∂f
=
∂x
∂f
=
∂y
∂f
=
∂u
∂f
=
∂v

Derivadas parciales de orden superior Las derivadas parciales de primer orden, fx


y fy , son en sı́ mismas funciones de x y y, por lo que se pueden derivar respecto de x o de
y. Las derivadas parciales de fx (x, y) y fy (x, y) se denominan derivadas parciales de segundo
orden de f . Existen cuatro de ellas porque hay cuatro posibilidades en el orden de derivación:
∂fx ∂  ∂f  ∂ 2 f
(fx )x = fxx = = =
∂x ∂x ∂x ∂x2
∂fx ∂  ∂f  ∂2f
(fx )y = fxy = = =
∂y ∂y ∂x ∂y∂x
∂fy ∂  ∂f  ∂2f
(fy )x = fyx = = =
∂x ∂x ∂y ∂x∂y
∂fy ∂  ∂f  ∂ 2 f
(fy )y = fyy = = =
∂y ∂y ∂y ∂y 2

Si se escribe z = f (x, y), entonces se puede reemplazar cada ocurrencia del sı́mbolo f por z.

1. La función fxy es la derivada parcial de segundo orden de f respecto a x primero y


después respecto a y;
2. fyx es el resultado de derivar respecto a y primero y posteriormente respecto a x.
3. Aunque fxy y fyx no son necesariamente iguales, en el cálculo avanzado se demuestra
que estas dos derivadas parciales “mixtas”de segundo orden son iguales si ambas son
continuas.

41
4. El orden de los sı́mbolos en los subı́ndices de las parciales mixtas es justamente lo
opuesto al orden de los sı́mbolos cuando se usa la notación de operador de diferenciación
parcial:
∂fx ∂  ∂f  ∂2f
(fx )y = fxy = = =
∂y ∂y ∂x ∂y∂x
∂fy ∂  ∂f  ∂2f
(fy )x = fyx = = =
∂x ∂x ∂y ∂x∂y
Ejemplo 55. Hallar las derivadas parciales de segundo orden de f (x, y) = 2xy 2 − 3x + 3x2 y 2
y determinar el valor de fxy (1, −2)

Ejemplo 56. Si f (x, y) = x sin y + yex determine fxx , fx y, fyy y fyx .

Aunque no se demostrará, el siguiente teorema enuncia que bajo ciertas condiciones es


irrelevante el orden en el cual se efectúa una derivada parcial de segundo orden mixta; esto
es, las derivadas parciales mixtas fxy y fyx son iguales.

Teorema 7. Sea f una función de dos variables. Si las derivadas parciales fx , fy ,


fxy y son continuas en algún disco abierto, entonces

fxy = fyx

en cada punto sobre el disco.

∂2w ∂2w ey
Ejemplo 57. Encuentre y si w = xy+ 2 . Que opinas de estos dos calculos?
∂x∂y ∂y∂x y +1
SOL:

Aunque trabajaremos principalmente con derivadas parciales de primer y segundo orden,


pues éstas aparecen con mayor frecuencia en las aplicaciones, no hay lı́mite teórico para el

42
número de veces que se pueda derivar una función, siempre que las derivadas implicadas
existan. Ası́, podemos obtener derivadas de tercer y cuarto orden, denotadas por sı́mbolos
como
∂3w ∂4w
= f yyx , = fyyxx
∂x∂y 2 ∂x2 ∂y 2
etcétera. Como con las derivadas de segundo orden, el orden de derivación no importa, mien-
tras todas las derivadas hasta el orden en cuestión sean continuas.
p
Ejemplo 58. Si f (x, y, z) = x2 + y 4 + z 6 determine fyzz

SOL:

Ejemplo 59. Mostrar que fxz = fzx y fxzz = fzxz = fzzx para la función dada por
f (x, y, z) = yex + x ln z

SOL:

43
Diferenciabilidad de z = f (x, y)
En el caso de una función de una sola variable se asumió que y = f (x) era diferenciable en x0 , esto
es,

f (x + ∆x) − f (x)
f ′ (x0 ) = lı́m (2.1)
∆x→0 ∆x
existe. Recuerde también que si f es diferenciable en x0 , también es continua en ese número.
Al repetir la suposición en (2.1), deseamos que una función de dos variables z = f (x, y) sea
diferenciable en un punto (x0 , y0 ). Aunque hemos considerado lo que significa que z = f (x, y)
posea derivadas parciales en un punto, aún no formulamos una definición de diferenciabilidad
de una función de dos variables f en un punto.

La definición de diferenciabilidad de una función de cualquier número de variables independientes


NO depende de la noción de un cociente de diferencia como en (2.1), sino más bien de la noción
de un incremento de la variable dependiente z.

Incrementos en una función z = f (x, y)


Recuerde que para una función de una variable y = f (x) el incremento en la variable y está dado
por
∆y = f (x + ∆x) − f (x)
Ahora para una función de dos variables z = f (x, y), el incremento en la variable z que resulta
cuando sus dos variables independientes x, y cambian en forma simultánea, y se define como

∆z = f (x + ∆x, y + ∆y) − f (x, y) (2.2)


Ejemplo 60. Encuentre ∆z para la función polinomial z = x2 − xy ¿Cuál es el cambio en
la función de (1, 1) a (1.2, 0.7)

Solución.
∆z = f (x + ∆x, y + ∆y) − f (x, y)
= (x + ∆x)2 − (x + ∆x)(y + ∆y) − (x2 − xy)
= (2x − y)∆x − x∆y + (∆x)2 − (∆x)(∆y) (2.3)
Con x = 1, y = 1, ∆x = 0.2 y ∆y = −0.3,
∆z = 1(0.2) − 1(−0.3) + (0.2)2 − (0.2)(−0.3) = 0.6

Una breve reinspección del incremento ∆z en (2.3) muestra que en los primeros dos
términos los coeficientes de ∆x y ∆y son fx (x, y) y fy (x, y) respectivamente. El importante
teorema que sigue muestra que esto no es un accidente.
Teorema 8. Considere que z = f (x, y) tiene derivadas parciales continuas fx (x, y) y
fy (x, y) en una región rectangular abierta que está definida por a < x < b, c < y < d.
Si (x, y) es cualquier punto en esta región, entonces existe una función r(∆x, ∆y), tal que

∆z = fx (x, y)∆x + fy (x, y)∆y + r(∆x, ∆y) (2.4)

donde
lı́m r(∆x, ∆y) = 0
(∆x,∆y)→(0,0)

Demostración.

44
Una simple maniputación de ∆z encontramos

∆z = [f (x + ∆x, y + ∆y) − f (x, y + ∆y)] + [f (x, y + ∆y) − f (x, y)]. (2.5)

Al aplicar el teorema del valor medio a cada conjunto de corchetes, se llega a

∆z = fx (x0 , y + ∆y)∆x + fy (x, y0 )∆y, donde x0 ∈ (x, x + ∆x), y y0 ∈ (y, y + ∆y)


   
= fx (x, y)∆x + fy (x, y)∆y + fx (x0 , y + ∆y) − fx (x, y) ∆x + fy (x, y0 ) − fy (x, y) ∆y,
= fx (x, y)∆x + fy (x, y)∆y + r(∆x, ∆y)

donde,
   
r(∆x, ∆y) = fx (x0 , y + ∆y) − fx (x, y) ∆x + fy (x, y0 ) − fy (x, y) ∆y,
Observe que,

lı́m fx (x0 , y + ∆y) − fx (x, y) = fx (x, y) − fx (x, y) = 0


(∆x,∆y)→(0,0)

lı́m fy (x, y0 ) − fy (x, y) = fy (x, y) − fy (x, y) = 0


(∆x,∆y)→(0,0)

Por tanto lı́m r(∆x, ∆y) = 0. Esto demuestra el teorema. 


(∆x,∆y)→(0,0)

Ahora ya podemos definir la diferenciabilidad de una función z = f (x, y) en un punto.

Definition 9 (Función Diferenciable).


Se dice que la función f : U ⊂ R2 → R definida en el conjunto abierto U de R2 , es
diferenciable en el punto (x0 , y0 ) ∈ U , si EXISTEN las derivadas parciales de f en (x0 , y0 ),
fx (x0 , y0 ) y fy (x0 , y0 ) y el incremento ∆z puede escribirse como

∆z = fx (x, y)∆x + fy (x, y)∆y + r(∆x, ∆y)

donde
r(∆x, ∆y)
lı́m =0
(∆x,∆y)→(0,0) k∆x, ∆yk

El siguiente teorema es una implicación directa del Teorema 8 el cual proporciona una
condición suficiente bajo la cual la existencia de las derivadas parciales implica diferenciabi-
lidad.
Teorema 10 (Condición suficiente para la diferenciabilidad).
Si las primeras derivadas parciales fx y fy son continuas en un punto en una región abierta
R, entonces z = f (x, y) es diferenciable sobre R.

Veamos ahora que esta definición SIIII garantiza la continuidad de la función en el punto
(x0 , y0 ) en donde es diferenciable (como acontece con funciones de una variable).

Teorema 11 (Diferenciabilidad implica continuidad). Si z = f (x, y) es diferenciable en el


punto (x0 , y0 ), entonces f es continua en (x0 , y0 ).

Demostración. Como f es diferenciable en un punto (x0 , y0 ) entonces por definición

∆z = fx (x0 , y0 )∆x + fy (x0 , y0 )∆y + r(∆x, ∆y)


f (x0 + ∆x, y0 + ∆y) − f (x0 , y0 ) = fx (x0 , y0 )∆x + fy (x0 , y0 )∆y + r(∆x, ∆y) (2.6)

Tornando el lı́mite aquı́ cuando (∆x, ∆y) → (0, 0), y observando que de la condición estable-

45
cida en la definición para el residuo r(∆x, ∆y), se deduce que
r(∆x, ∆y)
lı́m =0 ⇒ lı́m r(∆x, ∆y) = 0
(∆x,∆y)→(0,0) k(∆x, ∆y)k (∆x,∆y)→(0,0)

Por tanto,
lı́m [f (x0 +∆x, y0 +∆y) = lı́m f (x0 , y0 )+fx (x0 , y0 )∆x+fy (x0 , y0 )∆y+r(∆x, ∆y) = f (x0 , y0 )
(∆x,∆y)→(0,0) (∆x,∆y)→(0,0)

Si se considera x = x0 + ∆x, y = y0 + ∆y, entonces el último resultado es equivalente a


lı́m f (x, y) = f (x0 , y0 )
(x,y)→(x0 ,y0 )

Por tanto f es continua en (x0 , y0 ). 


xy 
2 + y2
 (x, y) 6= (0, 0)
2
Ejemplo 61. Considere la función f : R → R definida por f (x, y) = x
 0 (x, y) = (0, 0)
no puede ser diferenciable en el origen.

SOL: Del Ejemplo 46 sabemos que f no es continua en (0, 0) por tanto NOOOOO es
diferenciable en (0, 0). Otra forma de ver la no diferenciabilidad (0, 0) es usando la propia
definición de ser diferenciable, primero que todo las derivadas parciales SI existen fx (0, 0) =
fy (0, 0) = 0 (Ejemplo 46). Ahora veamos incremento en ∆z en puntos cercanos de (0, 0)

∆z = fx (0, 0)∆x + fy (0, 0)∆y + r(∆x, ∆y)


 
f (0, 0) + (∆x, ∆y) − f (0, 0) = (0)∆x + (0)∆y + r(∆x, ∆y)

de donde
∆x∆y
r(∆x, ∆y) =
(∆x)2 + (∆y)2
y
r(∆x, ∆y) ∆x∆y
lı́m = lı́m
(∆x,∆y)→(0,0) k(∆x, ∆y)k (∆x,∆y)→(0,0) (∆x)2 + (∆y)2 3/2


(∆x)2
= lı́m =∞ (NO EXISTE)
(∆x,∆y)→(0,0) 23/2 |∆x|3
∆x=∆y

Ejemplo 62. Verifiquemos que la función f (x, y) = xy 2 es diferenciable en punto (0, 0).

SOL: No es difı́cil ver que existen. Ahora veamos el in-


cremento cerca del (0, 0)
∆z = fx (0, 0)∆x + fy (0, 0)∆y + r(∆x, ∆y)
=
de donde
r(∆x, ∆y) =
y
r(∆x, ∆y)
lı́m = =
(∆x,∆y)→(0,0) k(∆x, ∆y)k

Por tanto es diferenciable en (0, 0)

46
OBSERVACIONES

1. A medida que (∆x, ∆y) tiende a cero, r(∆x, ∆y) también tiende a cero (r será llamado
error o residuo, pensando en que es “lo que le falta al plano tangente para describir a
la superficie z = f (x, y) en los alrededores de (x0 , y0 )”).

2. OJO la condición de
lı́m r(∆x, ∆y) = 0,
(∆x,∆y)→(0,0)

NO es el punto importante en la definición de diferenciabilidad, pues este hecho lo


ÚNICO que nos dice es que la función es continua en (x0 , y0 ) (véase demostracion de
Teorema (11).
3. Lo importante, cuando se estudia la diferenciabilidad de funciones, es que el residuo
r(∆x, ∆y) tiende a cero más rápido de lo que k(∆x, ∆y)k lo hace. Esta condición
está expresada en la parte de la definición que dice que

r(∆x, ∆y)
lı́m =0
(∆x,∆y)→(0,0) k∆x, ∆yk

Intuitivamente, podemos pensar que la única manera como se puede dar esta condición
del residuo, es cuando el plano tangente se “embarra” con la superficie en los alrededores
de (x0 , y0 ). En otras palabras, la superficie tiene que ser “suave.en (x0 , y0 ), para que
“se pueda ver localmente como un plano tangente”.

4. Esta es en realidad la idea geométrica tras el concepto de diferenciabilidad de una


función en un punto p: el buen comportamiento de la función en torno al punto (x0 , y0 )
para que en se pueda aproximar por un comportamiento lineal (pano tangente).

5. Si z = f (x, y) la función es diferenciable en cada punto en una región R del plano xy,
entonces se dice que f es diferenciable en R.
6. Si f es diferenciable sobre plano xy completo, entonces f es diferenciable.

7. Es interesante notar que las derivadas parciales fx y fy quizás existan en un punto


(x0 , y0 ) e incluso f NO sea diferenciable en ese punto.

8. Si fx y fy no existen en un punto (x0 , y0 ) entonces f no es diferenciable en ese punto.

Ejemplo 63. Mostrar que la función dada por f (x, y) = x2 + 3y es diferenciable en todo
punto del plano.

Solución. Haciendo z = f (x, y) el incremento de z en un punto arbitrario (x, y) en el plano


es

∆z = f (x + ∆x, y + ∆y) − f (x, y)


= (x2 + 2x∆x + ∆x2 ) + 3(y + ∆y) − (x2 + 3y)
= 2x(∆x) + 3(∆y) + ∆x(∆x) + 0(∆y)
= fx (x, y)∆x + fy (x, y)∆ + r(∆x, ∆y)

r(∆x, ∆y)
donde r(∆x, ∆y) = ∆x(∆x) + 0(∆y). Obviamente, lı́m = 0. Por tanto
(∆x,∆y)→(0,0) k∆x, ∆yk
f es diferenciable en todo punto en el plano.

47
Linealización de una funcion z = f (x, y)
Empezamos el análisis de la derivada con el problema de encontrar la recta tangente a la
gráfica de una función y = f (x) en un punto (a, f (a)). Intuitivamente, es de esperar que una
recta tangente esté muy próxima a la gráfica de f siempre que x esté cerca del número a. En
otras palabras, cuando x está en una pequeña vecindad de a, los valores de la función f (x)
están muy próximos al valor de las coordenadas y de la recta tangente. Ası́, al encontrar
una ecuación de la recta tangente en (a, f (a)) podemos usarla para aproximar a f (x).
Sabemos que la ecuación de la recta tangente está dada por

y − f (a) = f ′ (a)(x − a), o bien, y = f (a) + f ′ (a)(x − a).

Esta última ecuación se escribirá como L(x) = f (a) + f ′ (a)(x − a). Esta función lineal recibe
un nombre especial.
Definition 12 (Linealización de y = f (x)).
Si una función y = f (x) es diferenciable en un punto a entonces decimos que la función

L(x) = f (a) + f ′ (a)(x − a) (2.7)

es la linealización local de f en a. Para un x próximo a a, la aproximación,

f (x) ≈ L(x)

se denomina aproximación lineal local de f en a.

1. No es necesario memorizar esta ecuacion (2.7); es simplemente la forma punto-pendiente


de una recta tangente en (a, f (a)).

Ejemplo 64. Encuentre la aproximación lineal a la función f (x) = 1 + x cerca del punto
a = 0.
1
Solución. Observe que f (0) = 1 y que f ′ (x) = √ de manera que f ′ (0) = 21 . Ası́, la
2 1+x
ecuación (2.7) con a = 0 lleva a
1
f (x) ≈ f ′ (0) + f ′ (0)(x − 0) = 1 + x = L(x)
2

De esta forma, la aproximación lineal buscada es 1 + x ≈ 1 + 12 x ∆
NOTA: Es evidente en la figura que el valor de la aproximación lineal L(x) = 1 + 12 x es

más cercana al valor real de la función f (x) = 1 + x cuando x está cerca de a = 0.
Ahora estudiemos la linealizacion de un función de dos variabes z = f (x, y). Para ello,
supongamos que la función z = f (x, y) es diferenciable en el punto (x0 , y0 ) entonces por
definición 9 sabemos que

∆z = fx (x, y)∆x + fy (x, y)∆y + r(∆x, ∆y)

ahora si (x, y) es un punto muy cercano a (x0 , y0 ), luego ∆x = x − x0 y ∆y = y − y0 son


ambas cercanas a cero, e igualmente lo son r(∆x, ∆y). Esto significa que

f (x0 + ∆x, y0 + ∆y) − f (x0 , y0 ) ≈ fx (x0 , y0 )∆x + fy (x0 , y0 )∆y

Empleando x = x0 + ∆x y y = y0 + ∆y obtenemos

f (x, y) ≈ f (x0 , y0 ) + fx (x0 , y0 )∆x + fy (x0 , y0 )∆y

Esto nos lleva a definir la linealización de f en (x0 , y0 ) de la siguiente manera.

48
Definition 13 (Linealización de z = f (x, y)).
Si una función z = f (x, y) es diferenciable en un punto (x0 , y0 ) entonces la función

L(x, y) = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) (2.8)

se dice que es una linealización de f en (x0 , y0 ). Para un punto (x, y) cercano a (x0 , y0 )
la aproximación
f (x, y) ≈ L(x, y)
se denomina una aproximación lineal local de f en (x0 , y0 ).

OBSERVACIONES:

Suponga que se deja z = L(x, y) y se reescribe (2.8) como

fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) − (z − f (x0 , y0 )) = 0

Esto demuestra que la fórmula de linealización z = L(x, y) es una ecuación del plano
tangente a la gráfica de z = f (x, y) en el punto (x0 , y0 , f (x0 , y0 )) y tiene como vector
normal a fx (x0 , y0 ), fy (x0 , y0 ), −1

Cuando fx y fy son continuas y cuando (∆x, ∆y) → (0, 0), entonces dz es una apro-
ximación de ∆z esto es, dz = ∆z.
p
Ejemplo 65. Encuentre una linealización de f (x, y) = x2 + y 2 en (4, 3)

Solución. Las primeras derivadas parciales de f son


x y
fx (x, y) = p y fy (x, y) = p
x2 + y2 x2 + y2

Utilizando los valores f (4, 3) = 5 y fx (4, 3) = 54 y fy (4, 3) = 53 . Luego una linealización de f


en (4, 3) es
4 3
L(x, y) = 5 + (x − 4) + (y − 3).
5 5

Diferencial de una función z = f (x, y)

Suponga que y = f (x) es una función diferenciable en el punto a, suponemos que x cambia
de su valor original al nuevo valor a + ∆x. El cambio en el valor de y es el incremento ∆y,
calculado restando el nuevo valor de y menos su valor anterior, esto es,

∆y = f (a + ∆x) − f (a) (2.9)

Los incrementos ∆x y ∆y se representan geométricamente. Observe que el cociente de los


incrementos en x y y nos lleva a

∆y f (a + ∆x) − f (a)
=
∆x ∆x

49
Pero para valores ∆x de que están próximos a 0, (esto es, x cerca de a), este cociente es una
aproximación del valor de la derivada de f en a:
∆y
≈ f ′ (a) o bien ∆y ≈ f ′ (a)∆x
∆x
Las cantidades ∆x y f ′ (a)∆x se denominan diferenciales y se denotan por los sı́mbolos dx
y dy, respectivamente. Es decir,

∆x = dx dy = f ′ (a)dx

Como se muestra en la figura, para un cambio dx en x la cantidad dy = f ′ (a)dx representa


el cambio en la altura de un punto que se mueve por la recta tangente en el punto (a, f (a))
en lugar de por la curva y = f (x). Como a está fijo la diferencial dy = f ′ (a)∆x es una
función lineal en ∆x. Por esto, dy se llama aproximación lineal del incremento ∆y. Y
cuando dx ≈ 0, el cambio en la función ∆y es aproximadamente el mismo que el cambio en
dy, ∆y = dy.
De esta definición se deduce de inmediato que

dy f ′ (a)dx
= = f ′ (a)
dx dx
y coincide totalmente con la notación que se ha usado. De hecho, Leibniz originó la notación
diferencial al visualizar incrementos “infinitesimales”dx y dy, donde su razón dy/dx es la
pendiente de la recta tangente. La clave del descubrimiento independiente de Leibniz del
cálculo diferencial en la década de 1670 fue su entendimiento de que si dx y dy son suficien-
temente pequeños, entonces el segmento de la curva y = f (x) y el segmento de recta que
une (x, y) con (x + dx, y + dy) son virtualmente indistinguibles.
Esta concepto se ilustra con las amplificaciones sucesivas en las siguiente grafica de la
curva y = x2 cerca del punto (1, 1).

Observe que la diferencial dy se puede ver también como el cambio en la linealización


L(x) = f (a) + f ′ (a)(x − a) que aproxima la función y = f (x) en el punto a, en otras
palabras,

∆L = L(a + ∆x) − L(a)


= [f (a) + f ′ (a)(a + ∆x − a)] + [f (a) + f ′ (a)(a − a)]
= f ′ (a)dx
= dy

En el caso de una función f de dos variables tenemos naturalmente tres diferenciales. Los
cambios en las variables independientes x y y son dx y dy; los cambios en la linealización

50
L(x, y) se denotan por medio de dz. En el punto (x0 , y0 ) el cambio en la linealización es

∆L = L(x0 + ∆x0 , y0 + ∆y) − L(x0 , y0 )


= [f (x0 , y0 ) + fx (x0 , y0 )(x0 + ∆x − x0 ) + fy (x0 , y0 )(y0 + ∆y − y0 )]
− f (x0 , y0 ) + fx (x0 , y0 )(x0 − x0 ) + fy (x0 , y0 )(y0 − y0 )]
= fx (x0 , y0 )∆x + fy (x0 , y0 )∆y

Empleando este resultado definimos a continuación la diferencial dz de una función f en


un punto arbitrario en el plano xy. Si (x, y) denota el punto, entonces un punto cercano es
(x, ∆x, y + ∆y) o (x + dx , y + dy ). La diferencial dz se llama comúnmente diferencial total de
la función.
Definition 14 (Diferencial de z = f (x, y)).
Sea z = f (x, y) una función para la cual las primeras derivadas parciales fx y fy existen.
Entonces las diferenciales de x y y son dx = ∆x y dy = ∆y. La diferencial de z,
∂f ∂f
dz = fx (x, y)dx + fy (x, y)dy = dx + dy (2.10)
∂x ∂y
también se denomina diferencial total de z.

Ejemplo 66. Encuentre la diferencial dz de la función z = f (x, y) = x2 + 3xy − 2y 2 . Poste-


riormente, compare dz y el incremento real ∆z cuando (x, y) cambia de P (3, 5) a Q(3.2, 4.9).

Solución. La diferencial de z, como se da en la ecuación (??), es


∂f ∂f
dz = ∆x + ∆y = (2x + 3y)∆x + (3x − 4y)∆y
∂x ∂y
En el punto P (3, 5), esta diferencial es dz = 21∆x − 11∆y. Con ∆x = 0.2 y ∆y = −0.1,
correspondiente al cambio de P (3, 5) a Q(3.2, 4.9), se obtiene

dz = 21(0.2) − 11(−0.1) = 5.3

El cambio real en el valor de z de P a Q es el incremento

∆z = f (3.2, 4.9) − f (3, 5) = 5.26

por lo que en este ejemplo la diferencial parece ser una buena aproximación al incremento.

Diferenciabilidad en varias variables

Las definiciones, ası́ como los teoremas visto para funciones de una variable y = f (x), y dos
variables z = f (x, y) se generalizan de la manera esperada a funciones de tres o más variables.
A continuación mencionare algunos puntos importantes para una funcón w = f (x, y, z).

1. El incremento ∆w está dado por

∆w = f (x + ∆x, y + ∆y, z + ∆z) − f (x, y, z).

2. Si f es diferenciable en un punto (x0 , y0 , z0 ) entonces ∆w puede escribirse como

∆w = fx ∆x + fy ∆y + fz ∆z + r(∆x, ∆y, ∆z)

donde
r(∆x, ∆y, ∆z)
lı́m = 0.
∆x,∆y,∆z)→(0,0,0) k(∆x, ∆y, ∆z)k

51
3. Si f es diferenciable en (x0 , y0 , z0 ) entonces la linealización de f se define como

L(x, y, z) = f (x0 , y0 , z0 )+fx (x0 , y0 , z0 )(x−x0 )+fy (x0 , y0 , z0 )(y−y0 )+fz (x0 , y0 , z0 )(z−z0 )

4. La diferencial total de f es
∂f ∂f ∂f
dw = dx + + dz
∂x ∂y ∂z

Por último, expreso la definición de diferenciabilidad de una funcion f : Rn → R.


Definition 15 (Diferenciabilidad en n variables).
Sea f : Rn → R una función de n variables evaluada en los reales. Si f es diferenciable en
x = (x1 , . . . , xn ) entonces existe una función r(h) tal que el incremento en su altura esta
dado por
df df
f (x + h) − f (x) = (∆x1 ) + . . . + · · · + (∆xn ) + r(h)
dx dxn
f (x + h) = f (x) + ∇f (x) · h + r(h)

donde
r(h)
lı́m =0
h→0 khk

∂f ∂f
(aquı́ h := (∆x1 , . . . , ∆xn ), ∇f := ( ∂x 1
, . . . ∂x n
)).

1. Se dice que la función f de n variables es derivable continuamente en un punto


∂f
a = (x1 , . . . , xn ), si se demuestra que sus derivadas parciales de primer orden ∂x i
(a)
no sólo existen sino que son continuas en ese punto.

2. la función f es derivable continuamente en el entorno especificado del punto a.

Regla de la cadena, funiones compuestas


Comencemos pues por estudiar cómo se hace la composición de funciones de varias
variables. Componer funciones significa “sustituir una función en otra”. Por ejemplo, si
tenemos la función y = f (x), y la función x = g(u), entonces y = f (g(u)). Esto es, la función
manda u a y y esto se le llama composición de f con g y se denota por f ◦ g.
Pasemos al caso de funciones de dos variables z = f (x, y). Siguiendo con la misma idea,
para “componer.esta función tendremos que sustituir las dos variables x y y por dos funciones,
Supongamos entonces que

x = g1 (u, v) y = g2 (u, v)

luego tenemos la función compuesta z = f (g1 (u, v), g2 (u, v))

Ejemplo 67. Considere la función f (x.y) = x2 y + sen(xy). Si x = u2 + v 2 , y y = uv 3

SOL: La función compuesta f con x y y está dada por

52
Ejemplo 68. Considere la función f (x, y, z) = 2x3 y 2 z + cos2 (x + y + z) y sean x = et ,
v = cos t, y z = t2

SOL: La función compuesta f con x, y z está dada por

En general, los conjuntos de n funciones reales, cada una de ellas dependiendo de m


variables, digamos
x1 =g1 (u1 , u2 , . . . , um )
x2 =g2 (u1 , u2 , . . . , um )
..
.
xn =gn (u1 , u2 , . . . , um )

se puede ver como una función g : Rm → Rn que toma al punto (u1 , u2 , . . . , um ) ∈ Rm


y le asocia el punto (x1 , x2 , . . . , xn ) ∈ Rn , a las funciones gi reciben el nombre funciones
coordenadas de g ya que g = (g1 , g2 , . . . , gn ).
Ejemplo 69. La función g : R2 → R3 , dada por g(u, v) = (u2 − v 2 , u + v, u − v) tiene por
funciones coordenadas a g1 , g2 , g3 : R2 → R dadas por
g1 (u, v) = u2 − v 2 , g2 (u, v) = u + v, g3 (u, v) = u − v.

Los conceptos de continuidad y diferenciabilidad para funciones g : U ⊂ Rn → Rm , m > 1,


se establecen en términos de las funciones coordenadas de la función g. De modo más preciso,
se dirá que la función g = (g1 , g2 , . . . , gm ) es continua (respectivamente, diferenciable) en el
punto x0 ∈ U , si y sólo si todas y cada una de las funciones coordenadas fi : U ⊂ Rn → R,
i = 1, 2, . . . , m, lo son.
Ejemplo 70. La función f : R2 → R2 , dada por
f (x, y) = (x, |y|)
es continua en todo su dominio, pues las funciones coordenadas f1 , f2 : R2 → R, f1 (x, y) = x,
f2 (x, y) = |y| lo son. Esta función no es diferenciable en el origen, pues la función f2 (x, y) =
|y| no lo es.
Ejemplo 71. La función f : R3 → R4 , dada por
f (x, y, z) = (x + y + z, sen x + cos y, ex+z , arctan(xz 2 ))
es diferenciable en todo su dominio, pues las funciones coordenadas f1 , f2 , f3 , f4 : R3 → R,
f1 (x, y, z) = x + y + z, f2 (x, y, z) = sen x + cos y, f3 (x, y, z) = ex+z , f4 (x, y, z) = arctan(xz 2 )
lo son.

Ahora estudiaremos la relación entre la diferenciabilidad y las derivadas parciales de


una función compuesta, con la diferenciabilidad y las derivadas parciales de sus funciones
componentes
Recordemos que la regla de la cadena para funciones de una sola variable indica que si
y = f (x) es una función diferenciable de x, y x = g(t) es una función diferenciable de t,
entonces la derivada de la función compuesta es
∂y ∂y ∂x
=
∂t ∂x ∂t

53
Ahora vamos a extender la regla de la cadena a funciones de varias variables. Si z = f (x, y) y
x y y son funciones de una sola variable t, entonces el siguiente teorema indica cómo calcular
dz
la derivada ordinaria.
dt

Definition 16 (Regla de la cadena).


Suponga que z = f (x, y) es diferenciable en (x, y) y x = g(t) y que y = h(t) son funciones
diferenciables en t. Entonces z = f (g(t), h(y)) es una función diferenciable de t y

dz ∂z dx ∂z dy
= +
dt ∂x dt ∂y dt

dz
Ejemplo 72. Si z = x3 y − y 4 y x = 2t2 , y = 5t2 − 6t calcule en en t = 1.
dt
Solución. No es difı́cil ver que
dz ∂z dx ∂z dy
= + = (3x2 y)(4t) + (x3 − 4y 3 )(10t − 6)
dt ∂x dt ∂y dt
dz
En este caso, en t = 1, x(1) = 2 y y(1) = −1, por lo que = 0.
dt t=1

NOTA: Aunque NO HAY necesidad de hacerlo de esa manera, también podemos encontrar
la derivada dz 2 2 3 4
dt al sustituir las funciones x = 2t , y = 5t − 6t en z = x y − y y después
6 2 2 4
derivar la función resultante de una sola variable z = 8t (5t − 6t) − (5t − 6t) con respecto
a t. ∆
Ejemplo 73. Sea f : U ⊂ R2 → R la función dada por f (x, y) = x2 + 3y 2 , y sea g : U ⊂
R → R2 la función g(t) = (et , cos t). Calcule sus derivadas parciales de f ◦ g

Solución.


Regla de la cadena para derivadas parciales Para una función compuesta de dos
variables z = f (x, y) donde x= g(u, v) y y = h(u, v) se esperarı́an naturalmente dos fórmulas,
∂z ∂z
ya que z = f g(u, v), h(u, v) y por ello pueden calcularse tanto ∂u como ∂v . La regla de la
cadena para funciones de dos variables se resume en el siguiente teorema.

Definition 17 (Regla de la cadena).


Suponga que z = f (x, y) es diferenciable y x = g(u, v) y que y = h(u, v) tienen primeras
derivadas parciales continuas, entonces
∂z ∂z ∂x ∂z ∂y ∂z ∂z ∂x ∂z ∂y
= + , = + (2.11)
∂u ∂x ∂u ∂y ∂u ∂v ∂x ∂v ∂y ∂v

Demostración. Probamos el segundo de los resultados en (2.11). Aquı́ u es constante por


ende, ∆u = 0 entonces
   
∆z = f g(u, v + ∆v), h(u, v + ∆v) − f g(u, v), h(u, v)

54
Ahora bien, si
∆x = g(u, v + ∆v) − g(u, v) y ∆y = h(u, v + ∆v) − h(u, v),
entonces como x = g(u, v) y y = h(u, v) tenemos que g(u, v + ∆v) = x + ∆x y h(u, v + ∆v) =
y + ∆y al reemplazar en ∆z obtenemos que
∆z = f (x + ∆x, y + ∆y) − f (x, y)
Puesto que f es diferenciable, entonces su incremento ∆z puede escribirse como
∂z ∂z
∆z = ∆x + ∆y + ǫ1 ∆x + ǫ2 ∆y
∂x ∂y
donde ǫ1 , ǫ2 , son funciones de ∆x y ∆y con la propiedad de que ǫ1 , ǫ2 → 0 cuando (∆u, ∆v) →
(0, 0). Por tanto,
∆z ∂z ∆x ∂z ∆y ∆x ∆y
= + + ǫ1 + ǫ2
∆v ∂x ∆v ∂y ∆v ∆v ∆v
Ahora, tomando el lı́mite de la última lı́nea cuando ∆v → 0 obtenemos
∂z ∂z ∂x ∂z ∂y ∂x ∂y ∂z ∂x ∂z ∂y
= + +0 +0 = +
∂v ∂x ∂v ∂y ∂v ∂v ∂v ∂x ∂v ∂y ∂v
puesto que ∆x y ∆y se aproximan a cero cuando ∆v → 0. 
2 3 2u−3v 2 2 ∂z ∂z
Ejemplo 74. Si z = x − y y x = e , y = sen(u − v ), determine ∂u y ∂v

Solución.
∂z ∂x
1. = 4. =
∂x ∂v
∂z ∂y
2. = 5. =
∂y ∂u
∂x ∂y
3. = 6. =
∂u ∂v
Por tanto,

∂z
=
∂x
∂z
=
∂y


2 2 2 2 2 3 3
Ejemplo 75. Sea u = 3x y z +6 sen(xyz), donde x = 4vw y = 5v +10w z = v . Calcule
∂u ∂u
∂v , ∂w

Solución. ∆

55
∂z ∂z
Ejemplo 76. Consideremos la función z = f (x2 + y 3 , 2x2 − y 2 ) y hallemos ∂x y ∂y

Solución. Obsérvese que ésta función f ya se presenta como la composición de de funiones,


para ello considere z = f (u, v) con las funciones u = x2 + y 3 , v = 2x2 − y 2 . Por tanto

∂z ∂f ∂u ∂f ∂v
= + =
∂x ∂u ∂x ∂v ∂x

∂z ∂z ∂u ∂f ∂v
= + =
∂y ∂u ∂y ∂v ∂y

Ejemplo 77. Consideremos la función z = f ( xy ) y hallemos ∂z
∂x y ∂z
∂y

Solución.


Generalizaciones regla de la cadena: Si z = f (x1 , x2 . . . , xn ) es diferenciable en
(x1 , x2 , . . . , xn ) y si xi , i = 1, . . . , n son funciones diferenciables de una sola variable t, enton-
ces
dz ∂z dx1 ∂z dx2 ∂z dxn
= + + ··· +
dt ∂x1 dt ∂x2 dt ∂xn dt
De manera similar, si z = f (x1 , x2 . . . , xn ) y si cada xi , i = 1, . . . , n en una funcion de k
variables u1 , u2 , . . . , uk entonces
dz ∂z dx1 ∂z dx2 ∂z dxn
= + + ··· +
dui ∂x1 dui ∂x2 dui ∂xn dui
donde i = 1, 2, . . . , k

56
∂r
Ejemplo 78. Si r = x2 + y 5 z 3 y x = uve2s , y = u2 − v 2 s z = sen(uvs2 ), encuentre y
∂u
∂r
∂s
Solución. En este caso r es una función de tres variables x, y y z, y cada una es en sı́ misma
una función de tres variables u, y y s.
∂r
=
∂u

∂r
=
∂s


dz
Ejemplo 79. Si z = u2 v 3 w4 y u = t2 , v = 5t − 8 y w = t3 + t, determine .
zt
Solución. Siguiendo el diagrama de arbol tenemos
∂z
=
∂t

Diferenciación implı́cita

En el cálculo de funciones de una variable, se consideraron expresiones del tipo F (x, y) = 0,


preguntándonos si podı́amos despejar a y en términos de x, y dejar establecida una función
del tipo y = f (x) (por ejemplo si F (x, y) = x2 + y 2 − 1 = 0 NO se puede obtener de ella una
función y = f (x); y de F (x, y) = x2 − y = 0 SI se puede obtener la función y = f (x) = x2 )
Cuando de F (x, y) = 0 podemos despejar la variable y, y escribir y = f (x), decimos que ésta
última función está dada implı́citamente en F (x, y) = 0
Dada la gráfica de la función y = f (x), se puede ver como una curva de nivel, cones-
pondiente al nivel cero, de una función z = F (x, y) = y − f (x), de modo que su nivel cero
está constituido por los puntos (x, y) tales que F (x, y) = y − f (x) = 0, o sea, de modo que

57
y = f (x). Esta misma observación la habı́amos hecho con superficies z = f (x, y), las cuales
pueden ser vistas como el nivel cero de la función w = F (x, y, z) = z − f (x, y).
El punto que llama nuestro interés ante estas consideraciones es el planteamiento recı́proco
de ellas: por ejemplo, dada la función z = F (x, y), ¿es su nivel cero una curva que se pueda
ver como la gráfica de una función y = f (x)?, o de otra manera, de la expresión F (x, y) = 0
(que da el nivel cero de F ) ¿podemos despejar a y en términos de x y dejar ası́ establecida
la función y = f (x)? Ahora nuestra pregunta es, de hecho, más especı́fica: se quiere saber si
el nivel cero de z = F (x.y) es la gráfica de una función y = f (x) Al pensar en la simple
función F (x, y) = x2 + y 2 − 1, vemos que la respuesta a la pregunta anterior es NO. De la
expresión x2 +l−1 = 0 no podemos establecer una función y = f (x) despejando y en√términos
de x. Es bien sabido
√ que x2 + y 2 = 1 define dos funciones, a saber, y1 = f1 (x) = 1 − x2 y
y = f2 (x) = − 1 − x2 .
Si la ecuación F (x, y) = 0 define a una función y = f (x) de manera implı́cita, F (x, f (x)) =
0 entonces para toda x en el dominio de f . El siguiente teorema demuestra que la derivada
dy
dx también puede determinarse de la regla de la cadena.

Teorema 18 (Diferenciación implı́cita).

i) Si w = F (x, y) es diferenciable y y = f (x) es una función diferenciable de x definida


implı́citamente por F (x, y) = 0 entonces

dy Fx (x, y)
=− , donde Fy (x, y) 6= 0
dx Fy (x, y)

ii) Si w = F (x, y, z) es diferenciable y z = f (x, y) es una función diferenciable de x y y


definida implı́citamente por F (x, y, z) = 0 entonces

∂z Fx (x, y, z) ∂z Fy (x, y, z)
=− =−
∂x Fz (x, y, z) ∂y Fz (x, y, z)

donde Fz (x, y, z) 6= 0

Demostración. (i) Si w = F (x, y) y y = f (x) son funciones diferenciables, entonces no es


dificil ver que
dw ∂w dx ∂w dy dx dy
= + = Fx (x, y) + Fy (x, y)
dx ∂x dx ∂y dx dx dx
dx
Puesto que w = F (x, y) = 0 y dx = 1 implica
dy dy Fx (x, y)
0 = Fx (x, y) + Fy (x, y) , o bien =−
dx dx Fy (x, y)
siempre que Fy (x, y) 6= 0.
(ii) Si w = F (x, y, z) es una función diferenciable y z = f (x, y) es diferenciable en x y y,
entonces no es dificil ver que
dw ∂w dx ∂w dy ∂w dz
= + +
dx ∂x dx ∂y dx ∂z dx
dx dy dz
= Fx (x, y) + Fy (x, y) + Fz (x, y)
dx dx dx
∂x ∂y
Puesto que w = F (x, y, z) = 0, ∂x =1y ∂x = 0 implica
dz dz Fx (x, y, z)
0 = Fx (x, y) + Fz (x, y) , o bien =−
dx dx Fz (x, y, z)
∂z
siempre que Fz (x, y, z) 6= 0. La derivada parcial ∂y puede obtenerse de manera similar 
Ejemplo 80.

58
dy ∂z
a) Encuentre si x2 − 4xy − 3y 2 = 10 b) Encuentre si x2 y − 5xy 2 = 2yz − 4z 3 .
dx ∂y

Solución. (a) Consideremos la función F (x, y) = x2 − 4xy − 3y 2 − 10. Entonces definimos y


como una función de x por medio F (x, y) = 0. Es decir F depende solo de una variable x.
Luego derivamos respecto a x. De la regla de la cadena tenenos
dF dx dF dy
+ =0
dx dx dy dx

dy Fx (x, y) 2x − 4y x − 2y
De aqui deducimos que =− = =
dx Fy (x, y) −4x − 6y 2x + 3y
(b) Consideremos la función G(x, y, z) = x2 y − 5xy 2 − 2yz + 4z 3 . Entonces definimos z
como una función de x y y mediante el uso de F (x, y, z) = 0. Es decir F depende solo de
las variables x, y. Luego podemos derivar respecto a x o y. En nuestro caso vamos a derivar
respecto a y. Usando la regla de la cadena encontramos que
dF dy dF dx dF dz
+ + =0
dy dy dx dy dz dy

∂y ∂x ∂z Fy (x, y, z) x2 − 10xy − 2z
Como ∂y = 1, ∂y = 0 entonces =− =− ∆
∂y Fz (x, y, z) −2y + 12z 2
Ejemplo 81.
Suponga que la ecuación z 2 = x2 + xyz 2 define a z implı́citamente como una función de x y
∂z ∂z
y. Encuentre ∂x y ∂x .

SOL:

59
Derivada Direccional

Suponer que se está en la colina de la figura y se quiere determinar la inclinación de la colina


respecto al eje z. Si la colina está representada por z = f (x, y) se sabe cómo determinar
la pendiente en dos direcciones diferentes: la pendiente en la dirección de y está dada por
la derivada parcial fx (x, y) y la pendiente en la dirección de x está dada por la derivada
parcial fy (x, y). En esta sección se verá que estas dos derivadas parciales pueden usarse
para calcular la pendiente en cualquier dirección.
∂z ∂z
Recordemos que las derivadas parciales y de la función z = f (x, y) están definidas
∂x ∂y
como

∂z f (x + h, y) − f (x, y) ∂z f (x, y + h) − f (x, y)


= lı́m , = lı́m
∂x h→0 h  ∂y h→0 h 
f (x, y) + (h, 0) − f (x, y) f (x, y) + (0, h) − f (x, y)
= lı́m = lı́m
h→0 h h→0 h
f (x + he1 ) − f (x) f (x + he2 ) − f (x)
= lı́m = lı́m
h→0 h h→0 h

en todo lugar en que existan estos lı́mites. Aquı́ x = (x, y), e1 = (1, 0) y e2 = (0, 1), como
es habitual. Ası́, fx y fy representan tasas de cambio de z respecto a la distancia en las
direcciones de los vectores unitarios e1 y e2 . No hay razón para restringir nuestra atención
sólo a dos direcciones; podemos encontrar la tasa de cambio de una función diferencial en
cualquier dirección.

Suponga que ∆x y ∆y denotan incrementos en x y y, respec-


tivamente, y que u es un vector unitario en el plano xy que
es paralelo al vectorpv de (x, y, 0) a (x + ∆x, y + ∆y, 0). Luego,
v = hu. (Aquı́ h = ∆x2 + ∆y 2 ) Ahora nuestra inquietud es:

¿Cuál es la pendiente de la recta tangente a C en el punto P con


coordenadas (x, y, f (x, y)) en la dirección dada por v?

por lo que la pendiente de la recta secante indicada que pasa por


los puntos P y R sobre C es

f (x + ∆x, y + ∆y) − f (x, y) f ((x, y) + (∆x, ∆y)) − f (x, y)


=
h h
f (x + v) − f (x) f (x + hu) − f (x)
= = ,
h h
donde x = (x, y), v = (∆x, ∆y). Por tanto, es natural que se
considere al lı́mite y ası́ encontar la pendiente de f en P en la
dirección especificada por el vector unitario u.

Esto nos lleva a la siguiente definición.


Definition 19 (Derivada Direccional).
La derivada direccional de la función f en el punto x en dirección del vector unitario u
es
f (x + hu) − f (x)
Du f (x) = lı́m (2.12)
h→0 h
si se prueba que este lı́mite existe.

60
La derivada direccional de f en el punto (x0 , y0 ) ∈ D en la dirección del vector unitario
u = (u1 , u2 ), esto es, Du f (x0 , y0 ) mide la razón (o velocidad) de cambio instantáneo
del valor de la variable dependiente z = f (x, y) con respecto a la distancia en el plano
XY , medida en la dirección del vector unitario u.
La función f en la ecuación (2.12) puede ser una función de dos, tres o más variables.
las derivadas parciales de una función de dos variables x y y se escriben como

fx (x, y) = De1 f (x, y) = Di f (x, y) fy (x, y) = De2 f (x, y) = Dı f (x, y)

El lı́mite en la ecuación (2.12) tendrı́a sentido si u no fuera un vector unitario.


El significado de las derivadas direccionales es más fácil de entender cuando u es un
vector unitario, y éste es el porqué definimos Du f (x) sólo cuando |u| = 1.
Podemos escribir en general el vector unitario u ∈ R2 como

u = (cos θ, sin θ), 0 ≤ θ ≤ 2π

de modo que la derivada direccional de f en el punto x = (x, y) en la dirección de u y se


verı́a como

f (x + hu) − f (x) f (x, y) + h(cos θ, sin θ) − f (x, y)
Du f (x) = lı́m = lı́m
h→0 h h→0 h
f (x + h cos θ, y + h sin θ) − f (x, y)
= lı́m
h→0 h
∂f
Observamos que si θ = 0, o bien si u = i = (1, 0), entonces Du f (x, y) = ∂x . Mientras si
θ = π/2, o bien, si u = j = (0, 1), entonces Du f (x, y) = ∂f
∂y
Hay una cantidad infinita de derivadas direccionales en un punto dado de una superficie
z = f (x, y), una para cada dirección especificada por u, (ver figura). Dos de éstas son las
derivadas parciales fx y fy .

Definition 20 (Cálculo de las derivadas direccionales).


Sea f : Rn → R una función derivable en x, y u es un vector unitario, entonces la derivada
direccional Du f (x) existe y está dada por

Du f (x) = ∇f (x) · u = k∇f k cos θ (2.13)

donde θ es el ángulo formado por el vector ∇f y u

Demostración. Recordemos que de (??) tenemos que si f (x1 , x2 , . . . , xn ) es derivable en


x = (x1 , x2 , . . . , xn ), entonces sus derivadas parciales existen ahı́; además,

f (x + h) − f (x) − ∇f (x) · h
lı́m =0
h→0 |h|

donde ∇f (x) = (D1 f (x), D2 f (x), . . . , Dn f (x) es el vector gradiente de f en x. Si se sustituye


h = hu, donde u es un vector unitario y h > 0 (de modo que |h| = h), entonces encontramos
que
f (x + h) − f (x) − ∇f (x) · hu f (x + h) − f (x)
0 = lı́m = lı́m − ∇f (x) · u
h→0 |h| h→0 h
= Du f (x) − ∇f (x) · u

En decir,
Du f (x) = ∇f (x) · u = k∇f kkuk cos θ = k∇f k cos θ

61

Propiedades de la Derivada Direccional:

La función f crece más rápidamente cuando cos θ = 1, es decir, cuando u está en


la misma dirección del ∇f . Es decir, en cada punto P de su dominio, f crece más
rápidamente en la dirección del vector gradiente ∇f en P . La derivada en esta dirección
es
Du f = ∇f · u = k∇f k cos(0) = k∇f k

De manera similar, f decrece más rápidamente en la dirección de −∇f , (θ = −π). la


derivada en esta dirección es Du f = k∇f k cos(π) = −k∇f k

Cualquier dirección u ortogonal a un gradiente ∇f 6= 0 es una dirección de cambio


nulo en f , pues en ese caso θ = π/2 y Du f = k∇f k cos(π/2) = 0
Anteriormente mencionamos de manera informal el vector gradiente como herramienta de
notación para simplificar la expresión de ciertas fórmulas con varias variables. Ahora vamos
a analizar el significado e interpretación geométrica de los vectores gradiente, sobre todo en
dos y tres dimensiones. Comencemos con la definición formal.

Definition 21 (Vector Gradiente).


El gradiente de la función derivable, f : Rn → R es la función de variable vectorial
∇f : Rn → Rn definida por
 ∂f ∂f ∂f 
∇f (x) = , ,...,
∂x1 ∂x2 ∂xn

∇f se lee como “nabla”. Otra notación para el gradiente es gradf (x, y). OOJOO para cada
(x, y) el gradiente ∇f (x, y) es un vector en el plano (no un vector en el espacio).

d
Nota: El sı́mbolo ∇ no tiene ningún valor. Es un operador de la misma manera que dx es
un operador. Cuando ∇ opera sobre f (x, y) produce el vector ∇f (x, y)

Ejemplo 82. Sea f (x, y) = exy − y 2 . Halle la derivada direceional de f en cualquier punto
(x, y) ∈ Df , en la dirección del vector unitario u = ( √12 , − √12 )

Solución. Primero debemos calcular el gradiente de f , ∇f = (fx , fy ) no es dificil ver que

∇f (x, y) =

Por tanto, la derivada direccional de f en el punto (x, y) en la dirección u está dada por

Du f (x, y) = ∇f (x, y) · u =

Ejemplo 83. Calcule la derivada direccional de la función f (x, y, z) = ln(x2 + y 2 + z 2 ) en


el punto P0 (2, 2, −4) en la dirección que va de P1 (2, 2, −4) a Q1 (3, 1, −5)

Solución. Primero hallemos el vector en la dirección indicada

P1 Q 1
u=
kP1 Q1 k

Ahora hallemos el gradiente de f , ∇f = (fx , fy , fz ) no es dificil ver que

62
∇f (x, y, z) =

∇f (2, 2, −4) =

Por tanto, la derivada direccional de f en (2, 2, −4) en la dirección u está dada por

Du f (2, 2, −4) = ∇f (2, 2, −4) · u =


Ejemplo 84. Determine las direcciones en que f (x, y) = (x2 /2) + (y 2 /2), crece más rápida-
mente, decrece más rápidamente en el punto (1, 1) y ¿Cuáles son las direcciones de cambio
nulo de f en (1, 1)?

Solución. Como sabemos cualquier función f (x, y) crece mas rapidamente en la dirección de
∇f (x, y)
su ∇f , es decir u = en nuestro caso, ∇f (x, y) = y por tanto,
|∇f (x, y)|
∇f (1, 1)
∇f (1, 1) = u= =
|∇f (1, 1)|
Adicionalmente la función decrece más rápidamente en la dirección de en −∇f en (1, 1), es
decir −u =
Por otra parte, las direcciones de cambio nulo en (1, 1) son las direcciones ortogonales a ∇f .
es son:
n= −n =

Ejemplo
p 85. ¿Cuál es el valor del ángulo θ para el cual la derivada direccional de f (x, y) =
25 − x − y 2 en el punto (1, 2) es mı́nimo y cuál es este valor mı́nimo?
2

Solución. Aquı́ tenemos que usar usar el vector unitario u = (cos θ, sen θ), y el gradiente de
f esta dado por

∇f (x, y) = ∇f (1, 2) =

Observe que la derivada Du f (1, 2) dependerá necesariamente de θ. Luego

g(θ) = Du f (1, 2) · u =

Ahora hallemos el angulo minimo usando calculo 1,

g ′ (θ) =

g ′′ (θ) =

Al hacer g ′ (θ) = 0, el punto crı́tico de g es θ =

g ′′ ( )=

Ası́, θ = corresponde a un valor mı́nimo de g. Por tanto, el valor mı́nimo de la


derivada direccional de f es

63
Du f (1, 2) =

Interpretación geométrica del gradiente

Teorema 22.
Si f (x, y) = c es la curva de nivel de una función diferenciable de dos variables z = f (x, y)
que pasa por un punto especificado (x0 , y0 ) entonces ∇f (x0 , y0 ) es normal (ortogonal) a la
curva de nivel que pasa por (x0 , y0 ).

Demostración. Suponga que la curva de nivel α(t) se parametriza mediante las funciones
diferenciables

x = g(t), y = h(t) tal que (x0 , y0 ) = (g(t0 ), h(t0 )),

entonces por la regla de la cadena, la derivada de f (α(t)) = f (g(t), h(t)) = c con respecto a
t está dada por
∂f dg ∂f dh ∂f ∂f  dg dh 
+ =0 ⇔ , · , = 0, ⇔ ∇f · α′ (t) = 0
∂x dt ∂y dt ∂x ∂y dt dt

∇f es normal al vector tangente α′ (t), de modo que es normal a la curva de nivel α. 


NOTA La ecuaciónes de las rectas tangentes de la curva de nivel de una función f , esta
dada por
fx (x, y)(x − x0 ) + fy (x, y)(y − x0 ) = 0

Hasta ahora las superficies en el espacio se han representado principalmente por medio
de ecuaciones de la forma
z = f (x, y), Ecuación de una superficie S
Sin embargo, en el desarrollo que sigue, es conveniente utilizar la representación más general
F (x, y, z) Una superficie S dada por z = f (x, y) se puede convertir a la forma general
definiendo F como
F (x, y, z) = f (x, y) − z
Puesto que f (x, y) − z = 0, se puede considerar S como la superficie de nivel de F dada por
F (x, y, z) = 0 Ecuación alternativa de la superficie S
Teorema 23.
Si F (x, y, z) = c es la superficie de nivel de una función diferenciable de tres variables
w = F (x, y, z) que pasa por un punto especificado (x0 , y0 , z0 ) entonces ∇F (x0 , y0 , z0 ) es
normal (ortogonal) a la superficie de nivel que pasa por (x0 , y0 , z0 ).

Demostración. Consideremos una curva C(t) derivable en esta superficie, con ecuaciones
paramétricas x = x(t), y = y(t), y z = z(t) para las cuales C(t0 ) = (x0 , y0 , z0 ) y C ′ (t) 6= 0,
entonces por la regla de la cadena, la derivada de F (C(t)) = F (x(t), y(t), z(t)) = c con
respecto a t está dada por
∂F dx ∂F dy ∂F dz ∂F ∂F ∂F  dx dy dz 
+ + =0 ⇔ , , · , , = 0,
∂x dt ∂y dt ∂z dt ∂x ∂y ∂z dt dt dt
En particular, en t = t0 ,
∇F (x0 , y0 , z0 ) · C ′ (t0 ) = 0.
Puesto que este argumento se cumple para cualquier curva C diferenciable que pasa por
(x0 , y0 , z0 ) sobre la superficie, concluimos que: ∇f es normal a la superficie de nivel en
(x0 , y0 , z0 ). 

64
NOTA: Todas las rectas tangentes en S se encuentran en un plano que es normal a
∇F (x0 , y0 , z0 ) y contiene a como se muestra en la figura

Definition 24. Plano tangente y recta normal


Sea F diferenciable en un punto P (x0 , y0 , z0 ) de la superficie S dada por F (x, y, z) = 0 tal
que ∇F (x0 , y0 , z0 ) 6= 0

1. Al plano que pasa por P y es normal a ∇F (x0 , y0 , z0 ) se le llama plano tangente a


S en P .

2. A la recta que pasa por P y tiene la dirección ∇F (x0 , y0 , z0 ) de se le llama recta


normal a S en P .

Teorema 25. Ecuación del plano tangente


Sea P (x0 , y0 , z0 ) un punto sobre la gráfica F (x, y, z) = c donde ∇F (x0 , y0 , z0 ) 6= 0 Entonces
una ecuación del plano tangente a P es

Fx (x0 , y0 , z0 )(x − x0 ) + Fy (x0 , y0 , z0 )(y − y0 ) + Fx (x0 , y0 , z0 )(z − z0 )

Demostración.
Sea Q(x, y, z) un punto arbitrario en el plano tangente. Entonces el vector P Q = (x −
x0 , y − y0 , z − z0 ) se encuentra en el plano tangente. Como ∇f (x0 , y0 , z0 ) es normal al plano
tangente en (x0 , y0 , z0 ) debe ser ortogonal a todo vector en el plano tangente. En particular

∇f (x0 , y0 , z0 ) · (x − x0 , y − y0 , z − z0 ) = 0

En otra palabras

Fx (x0 , y0 , z0 )(x − x0 ) + Fy (x0 , y0 , z0 )(y − y0 ) + Fz (x0 , y0 , z0 )(z − z0 )


Ejemplo 86. Dibujar la curva de nivel que corresponde a c = 0 para la función dada por
f (x, y) = y − sen x y hallar un vector normal a varios puntos de la curva.

Solución. La curva de nivel para está dada por y el gradiente es

1. ∇f (−π, 0) = 3. ∇f (0, 0) =

2. ∇f (−π/2, −1) = 4. ∇f (π/2, 1) =

65
Ejemplo 87. Un rastreador térmico se encuentra en el punto (2, −3) sobre una placa metáli-
ca cuya temperatura en (x, y) es T (x, y) = 20 − 4x2 − y 2 . Hallar la trayectoria del rastreador,
si éste se mueve continuamente en dirección de máximo incremento de temperatura.

Solución. Denotamos por r(t) = (x(t), y(t)) la posición del rastreador. Como el rastreador
busca el máximo incremento de temperatura, este se encuentra en la dirección del ∇f (x, y).
Por tanto, las direcciones de r′ (t) = y ∇f (x, y) =
son iguales en todo punto de la trayectoria.

La solución de esta ecuación diferencial es

Por tanto, la trayectoria del rastreador del calor es x = ∆


x2
Ejemplo 88. Determine una ecuación para la tangente a la elipse + y 2 = 2 en el punto
4
(−2, −1)

2
Solución. La elipse es una curva de nivel de la función f (x, y) = x4 + y 2 (para c = 2) Luego
el gradiente ∇f (x, y) = es un vector normal a la recta tangente, luego la
ecuación de la recta tangente en elpunto (−2 − 1) (dada como hiperplano o ecuacion general)
es:


2 2 2
Ejemplo 89. Encuentre la superficie de nivel de F (x, y, z) = x +y +z y una ecuación del
plano tangente que pasa por (1, 1, 1). Grafique el gradiente y el plano tangente en el punto.
Solución. Puesto que F (1, 1, 1) = 3 la superficie de nivel que pasa por (1, 1, 1) es la esfera
x2 + y 2 + z 2 = 3. El gradiente de la función es ∇f = y por ello

∇F (1, 1, 1) =

66
Ejemplo 90. Encuentre una ecuación de un plano tangente a la gráfica del paraboloide
z = 12 x2 + 12 y 2 + 4 en (1, −1, 5). Adicionalmente encuentre las ecuaciones paramétricas para
la recta normal a la superficie en este mismo punto.

Solución. Definimos F (x, y, z) = 12 x2 + 21 y 2 − z + 4 de manera que la superficie de nivel de


F que pasa por el punto dado es F (x, y, z) = F (1, −1, 5) = 0. No es dificil ver que

∇F (x, y, z) = (x, y, −1) ∇F (1, −1, 5) = (1, −1, −1)

Por consiguiente, la ecuación deseada es

(x − 1) − (y + 1) − (z − 5) = 0 −x+y+z =3


Ejemplo 91. Hallar una ecuación del plano tangente al hiperboloide z 2 − 2x2 − 2y 2 = 12 en
el punto (1, −1, 4)

Solución. Se comienza por expresar la ecuación de la superficie como z 2 − 2x2 − 2y 2 − 12 = 0


Después, considerando F (x, y, z) = z 2 − 2x2 − 2y 2 − 12 tenemos que el gradiente

∇F (x, y, z) = ∇F (1, −1, 4) =

Por tanto, una ecuación del plano tangente en (1, −1, 4) es

Ejemplo 92. Hallar un conjunto de ecuaciones simétricas para la recta normal a la superficie
dada por xyz = 12 en el punto (2, −2, −3)

Solución. Se comienza por expresar la ecuación de la superficie como xyz − 12 y despues


consideramos F (x, y, z) = xyz − 12. Entonces el gradiente

67
Recta tangente en intersección de superficies
Si F y G son funciones de tres variables derivables continuamente, entonces la intersección
de las superficies

F (x, y, z) = 0 G(x, y, z) = 0 (2.14)

por lo general será alguna clase de curva C en el espacio, pues las ecuaciones en (2.14)
pueden “resolverse de manera implicita para dos de las variables en términos de la tercera”.
(2 ecuaciones 3 incognitas). En cualquier caso, C es una curva suave que pasa por P . Como
esta curva se localiza en ambas superficies, su vector tangente en P es perpendicular a ambos
vectores normales ∇F (P ) y ∇G(P ). Si estos vectores NOOOO son colineales, entonces el
vector
T = ∇F (P ) × ∇G(P )
es tangente a P en la curva C de la intersección de las dos superficies F (x, y, z) = 0 y
G(x, y, z) = 0
Ejemplo 93. Describir la recta tangente a la curva de intersección de las superficies x2 +
2y 2 + 2z 2 = 20 y x2 + y 2 + z = 4 en el punto (0, 1, 3)

Solución.
Los gradientes de ambas superficies en el punto (0, 1, 3).

El producto vectorial de estos dos gradientes es un vector tangente a ambas superficies


en el punto (0, 1, 3).
i j k


∇F (0, 1, 3) × ∇G(0, 1, 3) =


Por tanto, la recta tangente a la curva de intersección de las dos superficies en el punto
(0, 1, 3) es

Ejemplo 94. El punto P (1, −1, 2) queda tanto en el paraboloide x2 + y 2 = z como en el


elipsoide 2x2 + 3y 2 + z 2 = 9 Escriba una ecuación del plano que pasa por P y que es normal
a la curva de la intersección de estas dos superficies

Solución. Los gradientes de ambas superficies en el punto (1, −1, 2).

Elipsoide Paraboloide

∇F (x, y, z) = ∇G(x, y, z) =

∇F (1, −1, 2) = ∇G(1, −1, 2) =

68
El producto vectorial de estos dos gradientes es un vector tangente a ambas superficies en
el punto (1, −1, 2).

i j k


∇F (1, −1, 2) × ∇G(1, −1, 2) =


Por tanto, la recta tangente a la curva de intersección de las dos superficies en el punto
(1, −1, 2) es

Perspectiva general

Hasta este momento no se ha definido el concepto de derivada de una función f : U ⊂


Rn → R. Hemos definido a qué se refieren los términos “derivadas parciales”, “derivadas
direccionales”, “gradiente” y “diferenciales”para funciones de varias variables, PERO
NUNCA hemos dicho qué es “la derivada”para este tipo de funciones y...éste es un buen
momento para hacerlo
Trabajaremos con funciones f : U ⊂ Rn → Rm definidas en el conjunto abierto U de
Rn y tomando valores en Rm . Entonces f = (f1 , f2 , . . . , fm ) donde fi : U ⊂ Rn → R,
i = 1, 2, . . . , m, son las funciones coordenadas de f .
Para definir la derivada de esta función en un punto x0 ∈ U , recordemos que se habı́a
dicho que f es diferenciable en x0 (lo cual querrá decir que “la derivada”de la función existe
en x0 ) si y sólo si todas y cada una de sus funciones componentes fi , lo eran. En este momento
tendremos que establecer esta misma idea de una manera diferente, un poco más sofisticada,
pero de mayor utilidad para nuestras intenciones
Definition 26. . Considere la función f : U ⊂ Rn → Rm definida en el conjunto abierto
U de Rn y sea x0 ∈ U . Se dice que esta función es diferenciable en x0 si existe una
transformación lineal
Df (x0 ) : Rn → Rm ,
llamada derivada de f en x0 , tal que

r(h)
f (x0 + h) = f (x0 ) + Df (x0 )(h) + r(h), donde lı́m =0
h→0 khk

(para h ∈ Rn tal que x0 + h ∈ U )

NOTA: Siendo r una función que toma valores en Rm , la interpretación del lı́mite anterior
serı́a de que todas sus funciones componentes tenderán a cero cuando, al dividirlas por khk,
h tiende a cero.
En esta definición aparece ya el término “transformación lineal de Rn en Rm , que
se estudia en los cursos de Álgebra Lineal. Sabemos que las transformaciones lineales tienen
representaciones concretas por medio de matrices. De hecho, la transformación lineal T :
Rn → Rm tiene asociada una matriz de orden m × n que la representa, la cual está construida
de la forma siguiente:
h i
AT = [T (e1 )]B m [T (e )]
2 B Rm · · · [T (e )]
n B Rm
R

aquı́ {e1 , e2 , . . . , en } es la base canónica de Rn y BRm es la base canónica de Rm .

69
Sea f : U ⊂ Rn → Rm una función diferenciable en x0 ∈ U (Aqui, f = (f1 , f2 , . . . , fm ).
Luego existe una transformación lineal Df (x0 ) : Rn → Rm , tal que

r(h)
f (x0 + h) = f (x0 ) + Df (x0 )(h) + r(h), donde lı́m =0
h→0 khk

(para h ∈ Rn tal que x0 + h ∈ U ) No es dificil ver que

Df (x0 )(h) = f (x0 + h) − f (x0 ) − r(h), esto es un vector en Rm

Nuestro objetivo aquı́ es caracterizar la matriz ADf (x0 ) asociada a la transformación
 Df (x0 ),
es decir, vamos a calcular la columna j-ésima de ADf (x0 ) (esto es, Df (x0 )(ej ) B m ).
R

Consideremos el vector h = tej , t ∈ R, con t suficientemente pequeño podemos tener


x0 + h ∈ U . Observe que khk = t. Por tanto,

Df (x0 )(tej ) = f (x0 + tej ) − f (x0 ) − r(tej )


f (x0 + tej ) − f (x0 ) r(tej )
lı́m Df (x0 )(ej ) = lı́m −
t→0 t→0 t khk
f (x0 + tej ) − f (x0 )
Df (x0 )(ej ) = lı́m
t→0 t
f1 (x0 + tej ) − f1 (x0 ) f2 (x0 + tej ) − f2 (x0 ) fm (x0 + tej ) − fm (x0 )
= lı́m , lı́m , · · · , lı́m
t→0 t t→0 t t→0 t
 ∂f ∂f ∂f 
1 2 m
= (x0 ), (x0 ), . . . , (x0 )
∂xj ∂xj ∂xj

Por tanto
∂f1
 
(x0 )
 ∂xj 
∂f2
 
(x0 )
 
 

Df (x0 )(ej )

=
 ∂xj 
B Rm ..

 

 . 

 ∂fm 
, (x0 )
∂xj

De aquı́ deducimos que la matriz que representa a la transformación Df (x0 ) : Rn → Rm


es
!
     
ADf (x0 ) = Df (x0 )(e1 ) BRm
Df (x0 )(e2 ) B Rm
··· Df (x0 )(en ) B Rm

∂f1 ∂f1 ∂f1


 
(x ) (x0 ) ··· , (x0 )
 ∂x1 0 ∂x2 ∂xn 
 
 
 ∂f2 ∂f2 ∂f2 
 ∂x (x0 )
 (x0 ) ··· , (x0 ) 
 1 ∂x2 ∂xn 

=  = Jf (x0 )
.. .. ..
 
 

 . . ··· . 

 
 
 ∂f ∂fm ∂fm 
m
(x0 ) (x0 ) ··· , (x0 )
∂x1 ∂x2 ∂xn
A esta matriz m × n, se le llama matriz Jacobianade la función f en x0 y se denota Jf (x0 ).
Esta es entonces la Derivada de la función diferenciable f en x0 (identificando, como siempre,
a la transformación lineal Df (x0 ) : Rn → Rm con la matriz que la representa Jf (x0 )).
Veamos, por ejemplo,

70
!
n n ∂f ∂f ∂f
m = 1. f :U ⊂R →R Df (x0 ) : R → R Jf (x0 ) = (x0 ), (x0 ), · · · , (x0 ) := ∇f (x0 )
∂x1 ∂x2 ∂xn

∂f1 ∂f1 ∂f1


 
 ∂x1 (x0 ) (x0 ) ··· , (x0 )
∂x2 ∂xn
m = 2. f : U ⊂ Rn → R2 Df (x0 ) : Rn → R2 Jf (x0 ) = 
 

 ∂f2 ∂f2 ∂f2 
(x0 ) (x0 ) ··· , (x0 )
∂x1 ∂x2 ∂xn
Ejemplo 95. Calcule la matriz Jacobiana de la función f : R2 → R2 dada por f (x, y) =
(x2 + 3y 2 , 5x3 + 2y 6 )

Solución.


Ejemplo 96. Calcule la matriz Jacobiana en el punto (0, 0) de la función f : R2 → R3 dada
por f (x, y) = (sin(x + y), xex+y , x + y)

Solución.

Regla de la cadena, más general

Supongamos que la función g : Rm → Rn es diferenciable en x0 y la función f : Rn → Rp


es diferenciable en g(x0 ). Lo que dice la regla de la cadena es que la función compuesta
f ◦ g : Rm → Rp será diferenciable en x0 y que

D(f ◦ g)(x0 ) = Df (g(x0 )(Dg(x0 ))

71
o bien, en términos matriciales

J(f ◦ g)(x0 ) = Jf g(x0 ) Jg(x0 )

el lado derecho de esta última expresión es una multiplicación de matrices. Obsérvese que
Jg(x0 ) es una matriz n × mn y Jf (g(x0 )) una matriz p × n, de modo que el producto
Jf g(x0 ) Jg(x0 ) está bien determinado y da por resultado una matriz p × m, como debe ser
la derivada de J(f ◦ g)(x0 )

Ejemplo 97. Consideremos las funciones diferenciables g : R2 → R3 y f : R3 → R2 , dadas


por
g(x, y) = (xy, 5x, y 3 ) f (x, y, z) = (3x2 + y 2 + z 2 , 5xyz)
Halle explicitamente
 (f ◦ g)(x, y), Jf (x, y, z) y Jg(x, y), luego verifique que J(f ◦ g)(x, y) =
Jf g(x, y) Jg(x, y)

Solución.

Ejemplo 98. Sea f : R3 → R2 y g : R3 → R3 las funciones f (x, y, z) = (x2 + 2, x + y 2 + z 3 ),


g(x, y, z) = (x + y + z, xyz, x2 + y 3 ). Calcule la derivada de f ◦ g : R3 → R2 en (1, 1, 1).

Solución. No es difı́cil ver que J(f ◦g)(1, 1, 1) = Jf g(1, 1, 1) Jg(1, 1, 1) = Jf (3, 1, 2)Jg(1, 1, 1).
Entonces

72
Máximos y mı́nimos de z = f (x, y)
Primero consideraremos una función z = f (x, y) continua de dos variables. Suponga que
nos interesan los valores más grande y más pequeño que alcanza f (x, y) sobre una región
plana, acotada y cerrada R. Recuérdese que una región en el plano es cerrada si contiene
todos sus puntos frontera. Mientras que una región en el plano se le llama acotada si es
una subregión de un disco cerrado en el plano.

Empezamos entonces con la definición de máximos y mı́nimos relativos o locales para


funciones de dos variables x y y.

Definition 27. Sea z = f (x, y) una función definida en una región plana R

1. La función f tiene un mı́nimo local en (x0 , y0 ) si existe, una bola abierta Bǫ (x0 , y0 ) ⊂
R, (ǫ > 0), tal que

f (x0 , y0 ) ≤ f (x, y), ∀(x, y) ∈ Bǫ (x0 , y0 )

2. La función f tiene un máximo local en (x0 , y0 ) si existe, una bola abierta Bǫ (x0 , y0 ) ⊂
R, (ǫ > 0), tal que

f (x, y) ≤ f (x0 , y0 ) ∀(x, y) ∈ Bǫ (x0 , y0 )

1. Decir que f tiene un máximo relativo en (x0 , y0 ) significa que el punto (x0 , y0 , f (x0 , y0 ))
es por lo menos tan alto como todos los puntos cercanos en la gráfica de z = f (x, y).

2. f tiene un mı́nimo relativo en (x0 , y0 ) si el punto (x0 , y0 , f (x0 , y0 )) es por lo menos


tan bajo como todos los puntos cercanos en la gráfica z = f (x, y).

3. Los máximos locales corresponden a picos de montaña en la superficie z = f (x, y)

4. Los mı́nimos locales corresponden a fondos de valle

5. En tales puntos, los planos tangentes (cuando existen) son horizontales.

6. El punto (x0 , y0 ) es llamado punto extremo (local), si (x0 , y0 ) corresponde a un maximo


o mı́nimo (relativo), ası́ que f (x0 , y0 ) se denomino VALOR extremo (local) de f

7. No toda función f tiene máximo o mı́nimo global (absoluto).

Como hallar extremos locales

Como en el caso de las funciones de una sola variable, la clave para identificar los extremos
locales es un criterio de la primera derivada. Recordemos que para determinar los valores
extremos locales de una función f (x) de una variable, buscamos los puntos donde la gráfica
y = f (x) tiene una recta tangente horizontal . En tales puntos, buscamos los máximos
locales, los mı́nimos locales y los puntos de inflexión.
Para una función f (x, y) de dos variables, buscamos los puntos donde la superficie z =
f (x, y) tiene un plano tangente horizontal . En tales puntos, buscamos los máximos locales,
los mı́nimos locales y los puntos silla (de estos últimos daremos más detalles en breve).

Teorema 28 (Extremos locales). Si una función z = f (x, y) tiene un extremo local en el


punto (a, b) y si las primeras derivadas parciales existen en este punto, entonces

fx (a, b) = 0 fy (a, b) = 0

73
Demostración. Si f tiene un extremo local en (a, b), entonces la función g(x) = f (x, b)
tiene un extremo local en x = a . Por tanto, g ′ (a) = 0. Ahora, g ′ (a) = fx (a, b) de modo que
fx (a, b) = 0 Un argumento similar con la función h(y) = f (a, y) muestra que fy (a, b) = 0. 

OBSERVACIÓN: Si f tiene un máximo o mı́nimo relativo en un punto (a, b) y si fx y fy


existen en (a, b), entonces una ecuación del plano tangente en (a, b, f (a, b)) está dada por

fx (a, b)(x − a) + fy (a, b)(y − b) − (z − f (a, b)) = 0

pero como fx (a, b) = 0 y fy (a, b) = 0. Entonces esta ecuación se reduce,

z = f (a, b) = constante.

Por tanto, el teorema anterior nos dice que la superficie tiene un plano tangente horizontal
en un extremo local, si dicho plano existe.

Puntos crı́ticos

Recuerde que en calculo I definimos un valor crı́tico c de una función f de una sola
variable x como un número en su dominio para el cual f ′ (c) = 0 o f ′ (c) no existe. En la
definición que sigue definimos un punto crı́tico de una función f de dos variables x y y.
Definition 29 (Puntos Crı́ticos).
Un punto crı́tico de una función z = f (x, y) es un punto (a, b) en el dominio de f para el
cual fx (a, b) = 0 y fy (a, b) = 0, o si una de sus derivadas parciales no existe en el punto.

1. Los puntos crı́ticos corresponden a puntos donde f podrı́a posiblemente tener un ex-
tremo relativo.

2. En algunos libros los puntos crı́ticos también reciben el nombre de puntos estacio-
narios.

3. En el caso en que las primeras derivadas parciales EXISTAN, notamos que un punto
crı́tico se encuentra al resolver simultáneamente las ecuaciones

fx (x, y) = 0 fy (x, y) = 0

4. El Teorema 28 dice que los únicos puntos donde una función f (x, y) puede asumir
valores extremos son los puntos crı́ticos y los puntos frontera.

5. Al igual que en las funciones diferenciables de una sola variable, no todo punto crı́tico
da lugar a un extremo local.

6. Una función diferenciable de una variable podrı́a tener un punto de inflexión. Una
función diferenciable de dos variables puede tener un punto silla.

74
Definition 30 (Punto Silla). 
Un punto crı́tico (a, b) de una función z = f (x, y) es un punto silla si para toda bola B (a, b)
existen puntos (x, y) ∈ B tal que f (x, y) > f (a, b) y puntos (x, y) ∈ B tal que f (x, y) <
f (a, b).

Ejemplo 99. Hallar los extremos locales de f (x, y) = 2x2 + y 2 + 8x − 6y + 20

Solución. El dominio de f es todo el plano R2 (no hay puntos frontera). Ahora hallemos los
puntos crı́ticos de f estudiando fx y fy ,

fx (x, y) = fy (x, y) =

están definidas en todo R2 . Por tanto, los puntos extremos locales pueden ocurrir solamente
cuando , es decir,

Luego el punto crı́tico es , y su valor crı́tico es . Ahora observe


que,
f (x, y) = 2x2 + y 2 + 8x − 6y + 20 >3=
Por tanto, f tiene un mı́nimo local en . ∆

Ejemplo 100. Hallar los extremos locales de f (x, y) = 1 − (x2 + y 2 )1/3

Solución. El dominio de f es todo el plano R2 (no hay puntos frontera). Ahora hallemos los
puntos crı́ticos de f estudiando las fx y fy

fx (x, y) = fy (x, y)

están definidas en todo R2 salvo en (0, 0). Observe que aquı́ las derivadas fx = fy = 0 no
pueden ser ambas 0. Ası́ que, buscamos el punto crı́tico en los (x, y) donde fx o fy NO
existan. Es por esto que (0, 0) es el único punto crı́tico de f . No es dificil ver que f (0, 0) = 1
y que
f (x, y) = 1 − (x2 + y 2 )1/3 < 1 = f (0, 0)
Por tanto, f tiene un máximo relativo en (0, 0) ∆
Nota: Recuérdese que una de las derivadas parciales debe no existir o las dos deben ser 0
para tener un punto crı́tico.

75
Ejemplo 101. Hallar los extremos locales (si existen) de f (x, y) = y 2 − x2

Solución. El dominio de f es todo el plano R2 (no hay puntos frontera). Ahora hallemos los
puntos crı́ticos de f estudiando las fx y fy ,

fx (x, y) = fy (x, y) =

claramente existen en todas partes. Por tanto, los puntos extremos locales pueden ocurrir
solamente cuando , es decir, solo cuando x = yy=
Luego el punto crı́tico es . y su valor crı́tico es . Ahora observe
que,
f (x, 0) = −x2 < 0, f (0, y) = y 2 > 0
Es decir, f (x, y) es positiva y es negativa en puntos cercanos de , por eso
concluimos que f tiene un punto silla en . Observe que f la función NO tiene
valores extremos locales. ∆

Ejemplo 102. Hallar los puntos crı́ticos de f (x, y) = xy(3 − x − y) definida en el conjunto
D = (x, y) ∈ R2 : x > 0, y > 0, x + y < 3


Solución. El dominio de f es la región de la figura, (no hay puntos frontera). Ahora hallemos
los puntos crı́ticos de f estudiando fx y fy ,

fx (x, y) = fy (x, y) =

están definidas en todo R2 . Por tanto, los puntos extremos locales pueden ocurrir solamente
cuando , es decir,

Luego, el punto crı́tico es . y su valor crı́tico es . ∆

En las funciones de los ejemplos anteriores, fue relativamente fácil determinar los extremos
locales, porque cada una de las funciones estaba dada, o se podı́a expresar, en forma de
cuadrado perfecto. Con funciones más complicadas, los argumentos algebraicos son menos
adecuados y es mejor emplear los medios analı́ticos presentados en el siguiente criterio de las
segundas derivadas parciales. Es el análogo, para funciones de dos variables, del criterio
de las segundas derivadas para las funciones de una variable.
Pero antes, definamos la matriz hessiana de una función de varias variables.
Definition 31 (Matriz Hessiana).
Sea f : D ⊂ Rn → R una función de n variables con dominio el conjunto abierto D tal que
fxi (p) y fxi xj (p) existen ∀i, i = 1, 2, . . . , n y ∀p ∈ D Se denomina matriz hessiana de la
función f en el punto p ∈ D, a la matriz dada por
 
fx1 x1 (p) fx1 x2 (p) ··· fx1 xn (p)
 
 fx2 x1 (p) fx2 x2 (p) ··· fx2 xn (p) 
Hess(f (p)) = 
 
.. .. .. .. 

 . . . . 

fxn x1 (p) fxn x2 (p) ··· fxn xn (p)

Ejemplo 103. Halle la matriz hessiana de las siguientes funciones: a) f (x, y) = x3 + y 3 −


9xy + 4 y b) g(x, y, z) = x2 + y 2 + z 2 − xy + 2z

Solución. a) Las derivadas parciales de primer orden y de segundo orden de f son

76
fx (x, y) = fxx (x, y) = fxy (x, y) =

fy (x, y) = fyx (x, y) = fyy (x, y) =

Luego, la matriz hessiana de f es


   
fxx (x, y) fxy (x, y)
Hess(f (p)) =  = 
fyx (x, y) fyy (x, y)

b) Las derivadas parciales de primer orden y de segundo orden de g son


gx = gxx = gyy = gzx =

gy = gxy = gyx = gzy =

gz = gxz = gyz = gzz =


Luego, la matriz hessiana de f es

 
 
Hess(g(x, y, z)) = 



OBS: Las menores principales de la matriz hessiana Hess(f (p)) son los determinantes
dados por

f
x1 x1 (p) fx1 x2 (p) fx1 x3 (p)

fx1 x1 (p) fx1 x2 (p)


H1 (f (p)) = fx1 x1 (p) H2 (f (p)) =

,
H3 (f (p)) = fx2 x1 (p) fx2 x2 (p) fx2 x3 (p)
fx2 x1 (p) fx2 x2 (p)
fx3 x1 (p) fx3 x2 (p) fx3 x3 (p)


fx x (p)
1 1 fx1 x2 (p) ··· fx1 xn (p)

fx2 x1 (p) fx2 x2 (p) ··· fx2 xn (p)
Hess(f (p)) =

.. .. .. ..

. . . .


fx x (p)
n 1
fxn x2 (p) ··· fx x (p)
n n

77
Teorema 32. Sea f : D ⊂ Rn → R una función de n variables con dominio el conjunto
abierto D ⊂ Rn , tal que fxi (p) y fxi xj (p) existen ∀i, j = 1, 2, . . . , n y ∀p ∈ D. Sea x0 ∈ D
un punto crı́tico de la gráfica de f , entonces se tiene:

1. Si la matriz hessiana Hess(f (x0 )) es definida positiva, esto es, las menores

H1 (f (x0 )) > 0, H2 (f (x0 )) > 0, H3 (f (x0 )) > 0, ... Hn (f (x0 )) > 0

entonces f (p) es un valor mı́nimo local de f .


2. Si la matriz hessiana Hess(f (x0 )) es definida negativa, esto es, las menores

H1 (f (x0 )) < 0, H2 (f (x0 )) > 0, H3 (f (x0 )) < 0, H4 (f (x0 )) > 0 . . .

(es decir, los menores principales de orden impar son negativas y los de orden par
positivos), entonces f (x0 ) es un valor máximo local de f .

3. Si no se cumple ninguna de las dos primeras condiciones y Hn (f (x0 )) 6= 0, entonces


x0 corresponde a un punto de silla de la gráfica de f .

4. Si no se cumple ninguna de las dos primeras condiciones y Hn (f (x0 )) = 0 , enton-


ces nada se puede concluir con respecto al punto crı́tico x0 ; puede corresponder a un
extremo relativo, a un punto de silla o ninguna de estas caracterı́sticas.

Ejemplo 104. Determine los extremos relativos de f (x, y) = x3 +y 3 +9x2 −3y 2 +15x−9y+20

Solución. Las derivadas parciales de primer orden de f son

fx (x, y) = 3x2 + 18x + 15 = 3(x + 1)(x + 5)

fy (x, y) = 3y 2 − 67 − 9 = 3(y + 1)(y − 3)

Al igualar a cero estas derivadas parciales, se obtiene los puntos crı́ticos

(−1, −1) (−1, 3), (−5, −1), (−5, 3)

La matriz hessiana de f en un punto genérico (x, y) es


   
fxx (x, y) fxy (x, y) 6x + 18 0
Hess(f (p)) =  = 
fyx (x, y) fyy (x, y) 0 6y − 6

Para el punto (−1, −1), se tiene


  
12 0  H (f (−1, −1)) = 12 > 0
1
Hess(f (−1, −1)) =  , y como ,
0 −12  H2 (f (−1, −1)) = −144 < 0

entonces (−1, −1) corresponde a un punto de silla. El punto de silla de la gráfica de f es


(−1, −1, f (−1, −1)) = (−1, −1, 18).
Para el punto (−1, 3), se tiene
  
12 0  H (f (−1, 3)) = 12 > 0
1
Hess(f (−1, 3)) =  , y como ,
0 −12  H2 (f (−1, 3)) = 144 > 0

entonces (−1, 3) corresponde a un mı́nimo local. El valor mı́nimo local es f (−1, 3)) = −14

78
Para el punto (−5, −1), se tiene
  
−12 0  H (f (−5, −1)) = −12 < 0
1
Hess(f (−5, −1)) =  , y como ,
0 −12  H2 (f (−5, −1)) = 144 > 0

entonces (−5, −1) corresponde a un máximo local. El valor máximo local es f (−5, −1)) = 50
Para el punto (−5, 3), se tiene
  
−12 0  H (f (−5, 3)) = −12 < 0
1
Hess(f (−5, 3)) =  , y como ,
0 12  H2 (f (−1, 3)) = −144 < 0

entonces (−5, 3) corresponde a un punto de silla. El punto de silla d ela grafica de f es


(−5, 3, f (−1, 3)) = (−5, 3, 18) ∆

OBSERVACION:

1. Con el criterio de las segundas derivadas parciales pueden no hallarse los extremos
locales si alguna de las primeras derivadas parciales no existe, no se puede aplicar el
criterio.

2. Cuado el metodo no funciona se pueden tratar de hallar los extremos mediante la gráfica
o mediante algún otro método.

Ejemplo 105. Determine los extremos relativos de f (x, y) = x2 y 2

Solución. Las derivadas parciales de primer orden de f son

Por tanto, es un punto crı́tico. La matriz hessiana


de f en un punto genérico (x, y) es
   
fxx (x, y) fxy (x, y)
Hess(f (x, y)) =  = 
fyx (x, y) fyy (x, y)

Para el punto , se tiene


  
 H ( )=
1
Hess( )= , y como
 H2 ( )=

entonces en el criterio NO decide. Sin embargo, como f (x, y) = 0 para todo


punto en y f (x, y) = x2 y 2 > 0 en todos los otros
puntos, se puede concluir que cada uno de estos puntos crı́ticos son un mı́nimo global, ∆

Ejemplo 106. Determine los extremos relativos de f (x, y, z) = x3 + y 3 + z 3 − 3xy − 3z 2 + 2

Solución. Las derivadas parciales de primer orden de f son

79
Al igualar a cero estas derivadas parciales, se obtiene los puntos crı́ticos

La matriz hessiana de f en un punto genérico (x, y, z) es


   
fxx (x, y, z) fxy (x, y, z) fxz (x, y, z)
   
Hess(f (x, y, z)) = 
fyx (x, y, z) fyy (x, y, z) =
fyz (x, y, z)  

fzx (x, y, x) fzy (x, y, z) fzz (x, y, z)

Para el punto , se tiene


  
 H1 ( )=


 
Hess( )=

,
 y como H2 ( )= ,


H3 ( )=

entonces corresponde a un punto de silla.


Para el punto , se tiene
  
 H1 ( )=


 
Hess(f )=

,
 y como H2 ( )= ,


H3 ( )=

entonces corresponde a un punto de silla.


Para el punto , se tiene
  
 H1 ( )=


 
Hess(f )=

,
 y como H2 ( )= ,


H3 ( )=

entonces corresponde a un punto de silla.


Para el punto , se tiene
  
 H1 ( )=


 
Hess(f )=

,
 y como H2 (( )) = ,


H3 ( )) =

entonces corresponde a un mı́nimo local. El valor mı́nimo local es .


Ejemplo 107. Supóngase que x e y representan las cantidades (en kilos) de los complementos
diferentes mezclados en un alimento balanceado para pollos. Los pesos resultantes (en kilos)
para vender los gallos y las gallinas se estiman por p = 6x − 3y y q = 3y − 9 respectivamente.
La utilidad (en miles pesos) obtenido de un lote de pollos se modela por la función

U (p, q) = 10 − 2(p − 15)2 − (q − 12)2

(se supone que el número de gallos y gallinas en cada lote no varı́a). Determine las cantidades
x e y de cada complemento alimentario que maximiza la utilidad.

80
Solución. Al aplicar la regla de la cadena, las derivadas parciales de la función utilidad con
respecto a x e y son
∂U
=
∂x
∂U
=
∂y
Al igualar a cero estas derivadas parciales, se obtiene un único punto crı́tico La
matriz hessiana de f en un punto genérico (x, y) es
   
fxx (x, y) fxy (x, y)
Hess(f (p)) =  = 
fyx (x, y) fyy (x, y)

Para el punto , se tiene


  
 H ( )=
1
Hess( )= , y como ,
 H2 ( )=

entonces corresponde a un . Por consiguiente, las can-


tidades de x = kilos e y = kilos maximizan la utilidad. ∆
Ejemplo 108. Una caja rectangular descansa sobre el plano xy con un vértice en el origen
coordenado. Halle el volumen máximo de la caja si el vértice opuesto está situado en el plano
Q : 2x + 2y + z = 12.

Solución.
Sean a, b y c las longitudes de las aristas de la caja, tal que P (a, b, c) es el vértice (opuesto al
origen) de la caja situado en el plano Q (ver figura). Como P (a, b, c) ∈ Q, entonces Luego,

el volumen de la caja en función de a y b es

V = abc

Las derivadas parciales de primer orden de la función volumen son

Va (a, b) =

Vb (a, b) =
Al igualar a cero estas derivadas parciales, se obtiene un único punto crı́tico
La matriz hessiana de f en un punto genérico (x, y) es
   
Vaa (a, b) Vab (a, b)
Hess(V (p)) =  = 
Vba (a, b) Vbb (a, b)

Para el punto ( , ), se tiene


  
 H (V ( , )) = <0
1
Hess(V ( , )= , y como ,
 H2 (V ( , )) = >0

entonces corresponde a un máximo local. Por tanto, el volumen máximo de la


caja es . ∆

81
Extremos en conjuntos acotados cerrados

Recuerde que si una función f de una variable x es continua en un intervalo cerrado [a, b]
entonces f posee siempre un máximo global o absoluto y un mı́nimo global o absoluto en el
intervalo [a, b]. También vimos que estos extremos globales sobre [a, b] ocurren en un punto
frontera x = a o x = b del o en un número crı́tico c ∈ (a, b).
A continuación se presenta el teorema del valor extremo para una función f de dos
variables x y y que es continua sobre un conjunto R cerrado y acotado en el plano xy.
Teorema 33. Una función f de dos variables x y y que es continua sobre un conjunto R
cerrado y acotado tiene siempre un máximo absoluto y un mı́nimo absoluto sobre R.

OBS: Los valores máximo o mı́nimo globales o absolutos de f (x, y) sobre un conjunto
R cerrado y acotado se encuentran como sigue:

1. Encuentre los puntos crı́ticos interiores.

2. Encuentre los posibles valores extremos de f sobre la frontera de R.

3. Compare los valores de f en los puntos hallados en los pasos 1 y 2 .

Ejemplo 109. Determine los valores máximos y mı́nimos globales o absolutos de f (x, y) =
2 + 2x + 2y − x2 − y 2 en la región triangular del primer cuadrante acotada por las rectas x = 0
y y = 0, y = 9 − x

Solución. Como f es diferenciable, los únicos lugares donde f puede asumir estos valores son
los puntos interiores del triángulo donde fx = fy = 0 y los puntos en la frontera.

(i) Puntos interiores: Las derivadas parciales de primer orden de f son

fx (x, y) = 2 − 2x fy (x, y) = 2 − 2y

Al igualar a cero estas derivadas parciales, se obtiene un único punto crı́tico (1, 1) y el
valor de f ahı́ es f (1, 1) = 4.

(ii) Puntos frontera: Consideramos un lado del triángulo a la vez.


a) Sobre el segmento OA, y = 0. La función

f (x, y) = 2 + 2x − x2 := g(x)

y=0

donde g(x) es un funcı́on diferenciable definida en 0 ≤ x ≤ 9. Ahora hallemos los valores


extremos de g
interiores de g. Como g es diferencialbe en estos puntos, entonces hacemos g ′ (x) = 2−2x =
0 y obtenemos un único punto critico x = 1 y el valor de f ahi es

f (1, 0) = g(1) = 3.

frontera de g: los únicos valores frontera de g son



 x=0 donde f (0, 0) = g(0) = 2
 x = 9 donde f (9, 0) = g(9) = −61

82
b) Sobre el segmento OB, x = 0. La función

f (x, y) = 2 + 2y − y 2 := h(y)

x=0

donde h(y) es un funcı́on diferenciable definida en 0 ≤ y ≤ 9. Por el análisis


anterior sabemos que los candidatos a valores extremos en este segmento son

f (0, 0) = h(0) = 2, f (0, 9) = h(9) = −61, f (0, 1) = h(1) = 3

c) Sobre el segmento AB, y = 9 − x. La función



f (x, y) = −61 + 18x − 2x2 = m(x)

y=9−x

donde m(x) es un funcı́on diferenciable definida en 0 ≤ x ≤ 9. Ahora hallemos los


valores extremos de m
Puntos interiores de g. Como m es diferencialbe en estos puntos, entonces
hacemos m′ (x) = 18 − 4x = 0 y obtenemos un único punto critico x = 29 y el valor
de f ahi es
9 9 9 41
f ( , ) = m( ) = − .
2 2 2 2
Puntos frontera de g: los únicos valores frontera de m son

 x = 0 donde f (0, 9) = m(0) = −61
 x = 9 donde f (9, 0) = m(9) = −61

En resumen, los valores extremos encontrados son: 4, 2, −61, 3, −41/2. El máximo es 4,


y f lo asume en (1, 1). El mı́nimo es −61 y f lo asume en (0, 9) y (9, 0).


Ejemplo 110. Determine los valores máximos y mı́nimos globales o absolutos de f (x, y) =
6x2 − 8x + 2y 2 − 5 en la región cerrada R definido por x2 + y 2 ≤ 1,

Solución. Como f es diferenciable, los únicos lugares donde f puede asumir estos valores son
los puntos interiores del circulo x2 + y 2 < 1 donde fx = fy = 0 y los puntos en la frontera
x2 + y 2 = 1.

(a) Puntos interiores: Las derivadas parciales de primer orden de f son

fx (x, y) = 12x − 8 fy (x, y) = 4y

Al igualar a cero estas derivadas parciales, se obtiene un único punto crı́tico ( 32 , 0). Como
 2
2
3 + 02 < 1, el punto esta en el interior de R y el valor de f ahı́ es f ( 23 , 0) = − 23 3 .

(b) Puntos frontera: La frontera es un circunferencia x2 + y 2 = 1. Usando las ecuaciones


paramétricas dadas por x = cos t y y = sen t. La función

f (x, y) = f (cos t, sen t) = 6 cos2 t − 8 cos t + 2 sen2 t − 5 := g(t)

donde g(t) es un función diferenciable definida en 0 ≤ t ≤ 2π. Ahora hallemos los


valores extremos de g
interiores de g. Como g es diferenciable en 0 < t < 2π, entonces hacemos g ′ (t) =
8 sin t(− cos t + 1) y obtenemos un único punto critico en 0 < t < 2π es t = π. Por tanto
el punto correspondiente es (−1, 0) y el valor de f ahi es

f (−1, 0) = g(π) = 9.

83
frontera de g: los únicos valores frontera de g son

 t=0 donde = g(0) = f (1, 0) = −7 En
 t = 2π donde = g(2π) = f (1, 0) = −7

resumen tenemos los valores extremos de la función f : f ( 32 , 0) = − 23


3 , f (−1, 0) = 9 y
f (1, 0) = −7. Por tanto, el máximo global de f es f (−1, 0) = 9 y el mı́nimo global es
f ( 23 , 0) = − 23
3 .

Multiplicadores de Lagrange
En ocasiones es necesario determinar los valores extremos de una función cuyo dominio
está restringido a cierto subconjunto particular del plano (por ejemplo, un disco, una región
triangular cerrada, o a lo largo de una curva). Tales restricciones tienden a complicar los
problemas de optimización porque la solución óptima puede presentarse en un punto frontera
del dominio. En esta sección exploraremos un poderoso método para determinar los valores
extremos de funciones restringidas: el método de multiplicadores de Lagrange.
Teorema 34 (Teorema de Lagrange).
Sean f y g funciones con primeras derivadas parciales continuas, y tales que f tiene un
extremo en un punto (x0 , y0 ) sobre la curva suave de restricción g(x, y) = 0 Si ∇g(x0 , y0 ) 6= 0
entonces existe un número real λ tal que

∇f (x0 , y0 ) = λ∇g(x0 , y0 ).

Demostración. La restricción g(x, y) = 0 es un curva de nivel cero de la función g(x, y). y


por teorema sabemos que ∇g es un vector normal a esta curva de nivel. llamenos C a la
curva de nivel cero de g, claramente esta curva C pertenence al dominio de f . Esta curva la
podemos parametrizar por C(t) = (x(t), y(t)), Definamos por h(t) = f (C(t)) = f (x(t), y(t)).
Como (x0 , y0 ) es un valor extremo de f entonces

h(t0 ) = f (x(t0 ), y(t0 )) = f (x0 , y0 )

es un valor extremo de h. Esto implica que h′ (t0 ) = 0 y, por la regla de la cadena,

dh ∂f dx ∂f dy
= + = ∇f (x0 , y0 ) · C ′ (t0 ) = 0
dt ∂x dt ∂y dt

Ası́, ∇f (x0 , y0 ) es ortogonal a C ′ (t0 ). Pero sabemos también que ∇g, también es ortogonal
C ′ (t). Por consiguiente, los gradientes ∇f (x0 , y0 ) y ∇g(x0 , y0 ) y son paralelos y debe existir
un escalar λ tal que
∇f (x0 , y0 ) = λ∇g(x0 , y0 ).


OBSERVACIÓN:

1. Una interpretación geométrica interesante del teorema 35. En las figuras se observa la

84
curva de restricción g(x, y) = 0 junto con curvas de nivel comunes de la función f (x, y).
Como los vectores gradiente ∇f y ∇g son normales a las curvas de nivel de las funciones
f y g, respectivamente, se sigue que las curvas f (x, y) = c y g(x, y) = 0 son tangentes
una con otra en puntos donde los dos vectores gradiente son colineales y f toma su
valor máximo (o mı́nimo), c.
2. El criterio de los multiplicadores de Lagrange sirve para seleccionar, de entre las curvas
de nivel de f , aquella que es tangente a la curva de restricción.
3. El método de los multiplicadores de Lagrange NO tiene un indicador integrado que
señale MAX o MIN cuando se encuentra un extremo.
4. El número real λ para el cual ∇f = λ∇g recibe el nombre de multiplicador de
Lagrange.
5. Al aplicar el método de los multiplicadores de Lagrange, en realidad no estamos intere-
sados en determinar los valores de λ que satisfacen el sistema ∇f = λ∇g.
6. La ecuación ∇f = λ∇g es equivalente a
fx (x, y) = λgx (x, y) fy (x, y) = λgy (x, y)

Método para determinar los extremos con restricciones

Para encontrar los extremos de z = f (x, y) sujetos a la restricción g(x, y) = 0 resuelva


el sistema de ecuaciones
fx (x0 , y0 ) =λgx (x0 , y0 ) fy (x0 , y0 ) =λgy (x0 , y0 ) g(x0 , y0 ) =0 (2.15)

Entre las soluciones (x, y, λ) del sistema (2.15) estarán los puntos donde f tiene un
extremo. Cuando f tiene un máximo (mı́nimo), éste será el número más grande (o más
pequeño) en la lista de los valores de la función f (xi , yi ).
Ejemplo 111. Encuentre los puntos de la hipérbola rectangular xy = 1 que sean los más
cercanos al origen (0, 0).
p
Solución. Se necesita minimizar la distancia d = x2 + y 2 que hay del origen a un punto
P (x, y) sobre la curva xy = 1. Pero el álgebra es más sencilla si en lugar de eso se minimiza
el cuadrado de esta distancia, es decir,
f (x, y) = x2 + y 2 sujeta a la restricción g(x, y) = xy − 1

Luego, ∇f (x, y) = (2x, 2y) y ∇g(x, y) = (y, x). Por tanto, la ecuación ∇f = λ∇g nos lleva
a

(i) 2x = λx ⇒ 2x2 = λxy


(ii) 2y = λy ⇒ 2y 2 = λxy
(iii) xy − 1 = 0

Pero como xy = 1 > 0 implica que x y y tienen el mismo signo. Entonces, el hecho de que
x2 = y 2 implica que x = y. Al sustituir xy = 1 se obtiene x2 = 1, por lo que se sigue
finalmente que x = y = 1 o x = y = −1. Los dos resultados posibles (1, 1) y (−1, −1) están
indicados en la figura.
Fig. 1

En la figura 1 se observa que la circunferencia x2 + y 2 = 2 y la hipérbola xy = 1 son,
en realidad, tangentes a los dos puntos (1, 1) y (−1, −1) donde la distancia al cuadrado
f (x, y) = x2 + y 2 es mı́nima y está sujeta a la restricción g(x, y) = xy − 1

85
Ejemplo 112. Determine los extremos f (x, y) = y 2 − 4x sujetos a x2 + y 2 = 9

Aquı́ la restricción esta dada por g(x, y) = x2 + y 2 − 9 = 0. Luego, ∇f (x, y) = (−4, 2y) y
∇g(x, y) = (2x, 2y). Por tanto, la ecuación ∇f = λ∇g nos lleva a
(i) − 4 = 2xλ
(ii) 2y = 2yλ ⇒ y(1 − λ) = 0
2 2
(iii) x +y −9=0
Si y = 0, de (iii) tenemos x2 = 9 o x = ±3. Por consiguiente, (−3, 0) y (3, 0) son soluciones
del sistema.
2
Si λ =√1, entonces de (i) tenemos x = −2. Al sustituir este valor en √
(iii) obtenemos
√ y =5
o y = ± 5. luego tenemos dos o soluciones más del sistema (−2, − 5) y (−2, 5). De la
lista de valores de la función
√ √
f (−3, 0) = 12 f (3, 0) = −12, f (−2, − 5) = 13, f (−2, 5) = 13
De manera
√ que f tiene un mı́nimo con restricciones en (3, 0) y un máximo con restricciones
en (−2, 5)
Los cuatro puntos que encontramos yacen en el plano xy sobre el cı́rculo de √ radio 3; los
tres extremos con restricciones corresponden a los puntos (3, 0, −12), (−2, − 5, 13) en el
espacio tridimensional sobre la curva de intersección de la superficie del cilindro circular.

Aquı́ la grafica muestra tres curvas de nivel de y 2 − 4x = c. Dos de las curvas de nivel son
tangentes al cı́rculo x2 + y 2 = 9.
Ejemplo 113. Determine los extremos f (x, y, z) = x2 + y 2 + z 2 sujetos a 2x + 2y − z = 5

Solución. Aquı́ la restricción está dada por . Luego, ∇f (x, y, z) =


y ∇g(x, y) = . Por tanto, la ecuación ∇f = λ∇g nos lleva a

De tal manera, un extremo con restricciones es f ( 10 10 5


9 , 9 , −9) ∆
Ejemplo 114. Considera el tronco elı́ptico de la figura, con semiejes de longitudes a = 2
y b = 1. ¿Cuál es el área máxima de sección transversal de una viga rectangular, como se
indica, a partir de este tronco elı́ptico?

86
Solución. El tronco está limitado por la elipse (x/2)2 +y 2 = 1 es decir, x2 +4y 2 = 4. Queremos
maximizar el área de la sección transversal
A = f (x, y) =
de la viga sujeta a la restricción . Luego, ∇f (x, y) =
y ∇g(x, y) = . Por tanto, la ecuación ∇f = λ∇g nos lleva a

Está claro que ni x 6= 0 ni y 6= 0 dan el área máxima, por lo que podemos resuelver estas
dos ecuaciones de la siguiente manera

Ası́, el máximo deseado es x2 = 4y 2 . Ahora como, x2 + 4y 2 = 4, se sigue que x2 = 4y 2 = 2.


Como √ se busca√un punto (x, y) en el primer cuadrante que sea solución, se concluye que
x = 2 y = 1/ 2 proporcionan el área máxima posible de la sección transversal,
√ √
Amax = 4( 2)(1/ 2) = 4

de una viga rectangular cortada del tronco elı́ptico.



Ejemplo 115. Determine los puntos más cercanos al origen sobre el cilindro hiperbólico
x2 − z 2 − 1 = 0

Solución. La función f para la cual deseamos encontrar un mı́nimo es simplemente la dis-


tancia desde los puntos del cilindro al origen, esto es, sujeta a las
restricciones
g(x, y, z) = (2.16)
Luego,
∇f (x, y) = ∇g(x, y, z) =
Por tanto, la ecuación ∇f = λ∇g nos lleva a

De (2.16) tenemos necesariamente que x 6= 0, luego de la ecuación (a) obtenemos λ = 1,


esto implica en (c), que z = 0. Al reemplazr esto en (2.16) encontramos que x = ±1
Por tanto, los puntos sobre el cilindro más cercanos al origen son los puntos (1, 0, 0) y
(−1, 0, 0).

87
Multiplicadores de Lagrange con dos restricciones

Muchos problemas nos piden determinar los valores extremos de una función diferenciable
f (x, y, z) cuyas variables están sujetas a dos restricciones. Si las restricciones son

g1 (x, y, z) = 0 g2 (x, y, z) = 0

g1 y g2 son diferenciables, con ∇g1 no paralelo a ∇g2 encontramos los máximos y mı́nimos
locales con una restricción de f , introduciendo dos multiplicadores de Lagrange λ1 y λ2 .
Teorema 35 (Teorema de Lagrange dos restriciones).
Sean f , g1 y g2 funciones con primeras derivadas parciales continuas, y tales que f tiene un
extremo en un punto (x0 , y0 , z0 ) sobre la curva intersección de las dos superficies

g1 (x, y, z) = 0 g2 (x, y, z) = 0

Si ∇g1 (x0 , y0 , z0 ), ∇g2 (x0 , y0 , z0 ) 6= 0 y no-paralelos entonces existen λi ∈ R tal que

∇f (x0 , y0 , z0 ) = λ1 ∇g1 (x0 , y0 , z0 ) + λ2 ∇g2 (x0 , y0 , z0 ).

Las siguientes ecuaciones

∇f = λ1 ∇g1 + λ2 ∇g2 , g1 (x, y, z) = 0, g2 (x, y, z) = 0 (2.17)

tienen una agradable interpretación geométrica. Las superficies g1 = 0 y g2 = 0 se


cortan (por lo general) en una curva regular, digamos C. A lo largo de esta curva,
buscamos los puntos donde f tiene valores máximos y mı́nimos locales con respecto a sus
otros valores sobre la curva. Estos son los puntos donde ∇f es normal a C. Pero ∇g1 y
∇g2 también son normales a C en estos puntos, pues C está en las superficies g1 = 0 y g2 = 0.

Por tanto, ∇f está en el plano determinado por ∇g1 y ∇g2 , lo que significa que

∇f = λ1 ∇g1 + λ2 ∇g2 , para algunas λ1 y λ2 .

Como los puntos que buscamos están en ambas superficies, sus coordenadas también deben
satisfacer las ecuaciones g1 (x, y, z) = 0 y g(x, y, z) = 0 que son los requisitos restantes de las
ecuaciones (2.17).
Ejemplo 116. El plano x + y + z = 1 corta al cilindro x2 + y 2 = 1 en una elipse. Determine
los puntos, sobre la elipse, más cercanos y más lejanos del origen.

Solución. Encontramos los valores extremos de f (x, y, z) = x2 + y 2 + z 2 (el cuadrado de la


distancia de (x, y, z) al origen) sujeta a las restricciones

g1 (x, y, z) = x2 + y 2 − 1 = 0 g2 (x, y, z) = x + y + z − 1 = 0 (2.18)

88
Luego,

∇f (x, y) = (2x, 2y, 2z), ∇g1 (x, y, z) = (2x, 2y, 1), ∇g2 (x, y, z) = (1, 1, 0).

Por tanto, la ecuación ∇f = λ1 ∇g1 + λ2 ∇g2 nos lleva a

2x = 2λ1 x + λ2 , 2y = 2λ1 y + λ2 , 2z = λ2

No es dificil ver que

2x = 2λ1 x + 2z ⇒ (1 − λ1 )x = z
2y = 2λ1 y + 2z ⇒ (1 − λ1 )y = z

Ahora, si λ1 = 1 entonces z = 0, al reemplazar esto en (2.18) encontramos dos puntos


z
6 1 entonces x = y = 1−λ
(1, 0, 0) y (0, 1, 0). Por otra parte si λ1 = = 0, usando esto esto en
(2.18) encontramos que

x2 + x2 − 1 = 0 x+x+z−1=0

2 √
x=± z =1∓ 2
2
√ √ √ √ √
Luego los puntos correspondientes sobre la elipse son P1 ( 22 , 22 , 1− 2) y P2 (− 22 , − 22 , 1+

2). Sin embargo, debemos tener CUIDADO. Aunque P1 y P2 dan máximos locales de f
sobre la elipse, P2 está más alejado del origen que P1 .
Los puntos sobre la elipse más cercanos al origen son (1, 0, 0) y (0, 1, 0). El punto sobre la
elipse más lejano del origen es P2 .

Ejemplo 117. Encuentre el punto sobre la curva C de intersección de la esfera x2 +y 2 +z 2 =


9 y el plano x − y + 3z = 6 que está más alejada del plano xy. Luego determine el punto
sobre C que está más cercano al plano xy.

Solución. Basándonos en las gráfica, sugiere que existen dos de tales puntos P1 y P2 con
coordenadas z no negativas. La función f para la cual deseamos encontrar un máximo y un
mı́nimo es simplemente la distancia desde cada uno de estos puntos al plano xy, esto es,
f (x, y, z) = z. (distancia del plano xy a la curva interseción) sujeta a las restricciones

g1 (x, y, z) = x2 + y 2 + z 2 − 9 = 0 g2 (x, y, z) = x − y + 3z − 6 = 0 (2.19)

89
Luego,

∇f (x, y) = (0, 0, 1), ∇g1 (x, y, z) = (2x, 2y, 2z), ∇g2 (x, y, z) = (1, −1, 3).

Por tanto, la ecuación ∇f = λ1 ∇g1 + λ2 ∇g2 nos lleva a

a) 0 = 2λ1 x+λ2 , b) 0 = 2λ1 y−λ2 , c) 1 = 2λ1 z+3λ2

Sumamndo (a) + (b) obtenemos 2λ1 (y + z) = 0. Ahora, si λ1 = 0, entonces (a) nos lleva a
λ2 = 0 usando esto en (c) encontramos que 0 = 1. Ahora bien, y = −x y reemplazando esto
en (2.19) encontramos que

x2 + x2 + z 2 − 9 = 0 x + x + 3z − 6 = 0
2 2
2x + z = 9 2x + 3z = 6 (2.20)

Al resolver el sistema (2.20), obtenemos


6 9√ 18 3√
x= ± 14 z= ∓ 14
11 22 11 11
Entonces, los puntos en C que están más alejado y más cercano al plano xy son, respectiva-
mente P1 (−0.99, 0.99, 2.66) y P2 (2.08, −2.08, 0.62)

90
Calculo Vectorial

Integrales Multiples

En este capı́tulo estudiaremos el cálculo integral de las funciones de varias variables. El


objetivo del capı́tulo es estudiar las integrales de funciones del tipo f : U ⊆ Rn → R sobre
algunos subconjuntos D de U , ası́ como algunas de las aplicaciones de estas integrales en
problemas de geometrı́a (cálculo de áreas y volúmenes de cuerpos en el plano y en el espacio)
y de mecánica (cálculo de centros de masa de cuerpos en el plano y en el espacio).
A manera de introducción, recordemos que una de las ideas que acompañaron al cálculo
integral de funciones de una sola variable f : I ⊆ R → R fue la del “área bajo la curva”.
En efecto, en el primer curso de cálculo se vió que “en determinadas circunstancias”, la
integral de la función y = f (x) sobre el intervalo [a, b] se podı́a interpretar como el cálculo
del área de la figura en el plano, limitada por las rectas x = a (por la izquierda), x = b
(por la derecha), y = 0 (por abajo) y la gráfica de la función y = f (x) (por arriba). Nos
referı́amos entonces a esta área como “el área bajo la curva de y = f (x) entre a y b”. Las
“circunstancias” anteriormente mencionadas eran que la función tenı́a que ser positiva (su
gráfica debı́a quedar por encima del eje x) y continua.

En la generalización que haremos de este concepto para integrales de funciones de dos


variables z = f (x, y), integrales que se harán ahora no sobre “partes de la recta”(como el
intervalo [a, b]) como se hacı́a para funciones de una sola variable, sino sobre “partes del
plano”(una parte del dominio de la función z = f (x, y), la idea análoga que surgirá será la
de “volumen bajo la superficie”. Más en concreto, si tenemos una función z = f (x, y)
(supongámosla por el momento definida en todo R2 ) continua y positiva (que la superficie
que representa su gráfica esté por encima del plano xy), entonces la integral que definiremos
de esta función sobre un subconjunto D ⊆ R2 será el volumen del “cilindro”limitado por el
plano xy (por abajo), la gráfica de la función z = f (x, y) (por arriba), y la frontera de D
marcando la parte lateral del cuerpo resultante. A esta integral la representaremos como
¨
f (x, y)dxdy
D

Recuerde que la definición de la integral definida de una función


de una sola variable está dada por el lı́mite de una suma:
ˆ b X
f (x)dx = lı́m f (x∗k )∆xk
a kP k→0
k=1

Los pasos preliminares análogos que conducen al concepto de integral definida bidimensio-
nal, conocidos simplemente como integral doble de una función f de dos variables, se dan a
continuación.
Sea z = f (x, y) una función definida en una región cerrada y acotada R del plano xy.
Considere los siguientes cuatro pasos:

91
Por medio de una retı́cula de lı́neas verticales y horizontales paralelas a los ejes de
coordenadas, forme una partición P de R en n subregiones rectangulares Rk de áreas
∆Ak que estén por completo sobre R. Son los rectángulos que se muestran en rojo claro
en la figura.
Sea kP k la norma de la partición o la longitud de la diagonal más grande de las n
subregiones rectangulares Rk .
Elija un punto muestra (x∗k , yk∗ ) en cada subregión Rk
n
X
Forme la suma f (x∗k , yk∗ )∆Ak
k=1

Ası́, tenemos la siguiente definición.


Definition 36. Sea f una función de dos variables definida sobre una región cerrada R del
plano xy. Entonces la integral doble de f sobre R, se define como
¨ n
X
f (x, y)dA = lı́m f (x∗k , yk∗ )∆Ak (3.1)
R kP k→0
k=1

Cuando f es continua sobre R, el lı́mite en (3.1) existe, esto es, f es necesariamente


integrable sobre R.
Si el lı́mite en (3.1) existe, afirmamos que f es integrable sobre R y que R es la
región de integración.
Para una partición P de R en subregiones Rk con (x∗k , yk∗ ) en Rk , una suma de la forma
n
X
Sn = f (x∗k , yk∗ )∆Ak
k=1

se denomina suma de Riemann.


1. Dependiendo de la elección de (x∗k , yk∗ ) en el k-ésimo pequeño rectángulo Rk , po-
demos obtener distintos valores de Sn
2. Nos interesa saber qué ocurre con las sumas de Riemann cuando las anchuras y
las alturas de todos los rectángulos pequeños de la partición de R tienden a cero.

92
3. Cuando kP k → 0 los rectángulos se vuelven más angostos y más cortos, y su
número n aumenta, de modo que también podemos escribir
n
X n
X
lı́m f (x∗k , yk∗ )∆Ak = lı́m f (x∗k , yk∗ )∆Ak
kP k→0 n→∞
k=1 k=1

sin perder de vista que ∆Ak → 0 cuando n → ∞ y kP k → 0.


4. En cada uno de los pequeños rectángulos resultantes se elige un punto arbitrario
(xk , yk ) donde se evalúa f . Estas elecciones determinan una sola suma de Riemann.
5. Para formar un lı́mite, repetimos todo el proceso una y otra vez, eligiendo parti-
ciones tales que los anchos y las alturas de los rectángulos tiendan a cero, y cuyo
número tienda a infinito.
6. Cuando existe el lı́mite de las sumas Sn es porque se obtiene el mismo valor lı́mite
sin importar las elecciones establecidas, y entonces la función f es integrable.

La partición de R, donde las Rk yacen por completo en R, recibe el nombre de partición


interior de R.

3.0.2. Áreas y Volumenes

Área: Cuando f (x, y) = 1 sobre R, entonces


¨ n
X
dA = lı́m ∆Ak = Area(R)
R kP k→0
k=1

Volumen: Si f (x, y) ≥ 0 sobre R, entonces


¨
f (x, y)dA = V olumen
R

Volumen ¨neto No toda integral doble produce volumen. Para la superficie que se muestra
en la figura, f (x, y)dA es un número real pero no es el volumen puesto que f es no negativa
R
sobre R. Podemos interpretar la integral doble como la suma del volumen acotado entre la
gráfica de f y la región R siempre que f (x, y) ≥ 0 y el negativo ¨
del volumen entre la gráfica
de f y la región R siempre que f (x, y) ≤ 0. En otras palabras, f (x, y)dA representa un
R
volumen neto entre la gráfica de f y el plano xy sobre la región R.

93
Teorema 37 (Propiedades). Sean f y g funciones de dos variables que son integrables sobre
una región cerrada R del plano xy. Entonces
¨ ¨
1. kf (x, y)dA = k f (x, y)dA
R R
¨ ¨ ¨
2. [f (x, y) ± g(x, y)]dA = f (x, y)dA ± g(x, y)dA
R R R
¨ ¨ ¨
3. f (x, y) = f (x, y)dA + f (x, y)dA donde R1 y R2 son subregiones que no
R R1 R2
se traslapan y R = R1 ∪ R2
¨ ¨
4. Si f (x, y) ≥ g(x, y) sobre R entonces f (x, y)dA ≥ g(x, y)dA
R R

Ejemplo 118. Considere la región de integración R en el primer ¨ cuadrante acotado por las
gráficas de x + y = 2, y = 0 y x = 0. Aproxime la integral doble (5 − x − 2y)dA utilizando
R
una suma de Riemann, las Rk que se muestran en la Figura y los puntos muestra (x∗k , yk∗ )
en el centro geométrico de cada Rk .

Solución. De la figura vemos que ∆Ak = 21 12 = 41 , k = 1, 2, . . . , 6 y las (x∗k , yk∗ ) en las Rk


para k = 1, 2, . . . , 6 son a su vez, ( 14 , 41 ), ( 34 , 41 ), ( 54 , 41 ), ( 34 , 43 ), ( 14 , 43 ), ( 14 , 45 ). Por consiguiente,
la suma de Riemman es
n
X 1 1 1 3 1 1 5 1 1 3 3 1 1 3 1 1 5 1
f (x∗k , yk∗ ) = f ( , ) + f ( , ) + f ( , ) + f ( , ) + f ( , ) + f ( , )
4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
k=1
17 15 13 11 13 9
= + + + + + = 4.875
16 16 16 16 16 16

3.0.3. Integrales Iteradas

De manera similar al proceso de la diferenciación parcial podemos definir la integración


parcial. El concepto de la integración parcial es la clave para un método práctico de evalua-
ción de una integral doble. Por ejemplo, dada la derivada parcial fx (x, y) = 2xy entonces,
considerando y constante, se puede integrar con respecto a x para obtener
ˆ ˆ ˆ
f (x, y) = fx (x, y)dx = 2xydx = 2y xdx = yx2 + C(y)

La “constante”de integración, C(y), es una función de y. En otras palabras, al integrar con


respecto a x, se puede recobrar f (x, y) sólo parcialmente.
Definition 38. Integración parcial indefinida:
Si F (x, y) es una función con derivada parcial con respecto a y, igual a Fy (x, y) = f (x, y)
entonces la integral parcial de f con respecto a y es
ˆ ˆ
f (x, y)dy = Fy (x, y)dy = F (x, y) + C1 (x) (3.2)

donde la función C1 (x) desempeña la parte de la “constante de integración”. De manera


similar, Si F (x, y) es una función con derivada parcial respecto a x igual a Fy (x, y) = f (x, y)
entonces la integral parcial de f con respecto a x es
ˆ ˆ
f (x, y)dx = Fx (x, y)dx = F (x, y) + C1 (y) (3.3)

94
ˆ
En otras palabras, para evaluar la integral parcial f (x, y)dy mantenemos x fija (como
ˆ
si fuera una constante), en tanto que en f (x, y)dx mantenemos y fija.

Al evaluar una integral definida podemos prescindir de las funciones C1 (x) y C(y) en (3.2)
y (3.3).
Definition 39. Integración parcial definida:
Si F (x, y) es una función tal que Fy = f (x, y) entonces la integral parcial definida con
respecto a y se define como
ˆ g2 (x) ˆ g2 (x) g2 (x)
f (x, y)dy = Fy (x, y)dy = F (x, y) = F (x, g1 (x) − F (x, g2 (x))) (3.4)

g1 (x) g1 (x) g1 (x)

Si F (x, y) es una función tal que Fy = f (x, y) entonces la integral parcial definida con
respecto a x se define como
ˆ h2 (y) ˆ h2 (y) h2 (x)
f (x, y)dx = Fx (x, y)dx = F (x, y) = F (h1 (y), y) − F (h2 (y), y)) (3.5)

h1 (y) h1 (y) h1 (x)

Las funciones g1 (x) y g2 (x) en (3.4) y las funciones h1 (y) y h2 (y) en (3.5) se denominan
los lı́mites de integración. Desde luego los resultados en (3.4) y (3.5) se cumplen
cuando los lı́mites de integración son constantes.

Nótese que la variable de integración no puede aparecer en´ x ninguno de los lı́mites de
integración. Por ejemplo, no tiene ningún sentido escribir 0 ydx.

Regiones de tipo I o II La región dada por,

R:a≤x≤b g1 (x) ≤ y ≤ g2 (x)

donde las funciones frontera g1 y g2 son continuas, se denomina región tipo I . Mientras que
la región
R:c≤y≤d h1 (y) ≤ x ≤ h2 (y)
donde h1 y h2 son continuas, se denomina región tipo II

Puesto que la integral parcial definida


ˆ g2 (x)
f (x, y)dy
g1 (x)

es una función de x únicamente, podrı́amos, como alternativa, integrar la función resultante


con respecto a x.

95
Definition 40. Integral iterada:
Si f es continua sobre una región R de tipo I, definimos una integral iterada de f sobre
la región mediante
ˆ ˆ b g2 (x) ˆ "ˆ #
b g2 (x)
f (x, y)dydx = f (x, y)dy dx (3.6)
a g1 (x) a g1 (x)

Si f es continua sobre una región R de tipo II, definimos una integral iterada de f sobre
la región mediante
ˆ ˆ d h2 (y) ˆ "ˆ #
d h2 (y)
f (x, y)dxdy = f (x, y)dx dy = (3.7)
c h1 (y) c h1 (y)

ˆ b ˆ g2 (x)
1. Sobre una región de tipo I la integral iterada f (x, y)dydx es primero una
a g1 (x)
sumatoria en la dirección de y.

2. El rectángulo tı́pico en la flecha tiene un área dydx.

3. El dy situado antes del dx significa que los “volúmenes”f (x, y)dydx de los paralelepı́pe-
dos construidos sobre los rectángulos se suman verticalmente con respecto a y desde la
curva frontera inferior y = g1 (x) hasta la curva frontera superior y = g2 (x).

4. El dx que sigue al dy significa que el resultado de cada sumatoria vertical se suma


después horizontalmente con respecto a x de izquierda x = a a derecha x = b.

Ejemplo 119. Evalúe la integral iterada de f (x, y) = 2xy sobre la región cerrada por y =
x2 + 1, y = x x = −1 y x = 2.

Solución. La región es de tipo la integral iterada es mas fácil si usamos


ˆ ˆ
2xydA =


y
Ejemplo 120. Evalúe la integral iterada de f (x, y) = 8x + e sobre la región cerrada por
x = 2y, y = x x = 0 y x = 4.

96
Solución. La región es de tipo la integral iterada es más fácil si usamos
ˆ ˆ
8x + ey dA =


¨
Ejemplo 121. Evalúe la integral doble ex+3y sobre la región acotada por las gráficas de
R
y = 1, y = 2 y = x y y = −x + 5.

Solución. Al dibujar la región dada concluimos que la región es de tipo II la integral iterada
es más fácil si usamos dxdy
ˆ ˆ
ex+3y dA =


Ejemplo 122. Emplee la integral doble para determinar el área de la región acotada por las
gráficas de y = x2 y y = 8 − x2

Solución. Primero que todo f (x, y) = 1. Ahora al dibujar la región dada concluimos que la
región es de tipo I, luego la doble integral usaremos
ˆ ˆ
A= dA =

NOTA: Usted debe reconocer


ˆ b b   b g2 (x)
g2 (x)
ˆ ˆ ˆ ¨
 
A= g2 (x) − g1 (x) dx = y dx = dydx = dA
a a g1 (x) a g1 (x) R

Ejemplo 123. Emplee la integral doble para determinar el volumen V del sólido en el primer
octante que es que está acotado por los planos de coordenadas y las gráficas del plano z =
3 − x − y y el cilindro x2 + y 2 = 1.

97
¨
Solución. De las figuras vemos que el volumen está dado por V = zdA y la región de
R
integración R es tipo I, luego,

ˆ ˆ ˆ 1 ˆ 1−x2
V = zdA = (3 − x − y)
0 0


¨
Ejemplo 124. Evalúe (x + y)dA sobre la región acotada por las gráficas de x = y 2 y
R
y = 12 x − 3
2

S
Solución. Al dibujar la región vemos que puede escribirse como la unión R = R1 R2 de
las dos regiones tipo I. o interpretarla de tipo II, calculemos la doble integral usando la
region tipo I y tipo II
¨ ¨ ¨
I. (x + y)dA = (x + y)dA + (x + y)dA
R R1 R2

¨
II. (x + y)dA =
R


Pregunta: ¿Porque la respuesta en este ejemplo 4 NOOOO representa el volumen del
sólido sobre R y debajo del plano z = x + y?
¨
2
Ejemplo 125. Evalúe xey dA sobre la región R en el primer cuadrante acotado por las
R
gráficas de y = x2 , x = 0, y = 4.

98
Solución: Al dibujar la región vemos que puede considerarse de tipo I o II
¨
I. (x + y)dA =
R

¨
II. (x + y)dA =
R

Ejemplo 126. Hallar el volumen de la región sólida R acotada superiormente por el para-
boloide z = 1 − x2 − y 2 e inferiormente por el plano z = 1 − y ver figura

Solución. Lo primero es saber la region de integración es decir la región “base”que tiene en


común las dos superficies. No es dı́ficil ver que la intersección en un cilindro circular recto
dado por x2 = y − y 2

El Volumen
¨ es la diferencia entre el volumen bajo el parabolide y el volumen bajo el plano,
V = zsup − zinf dA =
R

Ejemplo 127. Encuentre el volumen V del sólido T limitado por los planos z = 6 y z = 2y,
y por los cilindros parabólicos y = x2 y y = 2 − x2 . Este sólido se ilustra en la figura

Solución. T La región R plana xy está limitada por las parábolas y = x2 y y = 2 − x2 . las

99
cuales se intersecan en los puntos (−1, 1) y (1, 1).
¨
V = zsup − zinf dAdA =
R

Sustitución en integrales Multiples


Una de las técnicas poderosas que conocemos de nuestro primer curso de cálculo para
calcular integrales, es la técnica del cambio de variables simple, el objetivo de la sustitución
es reemplazar las integrales complicadas por otras más fáciles de evaluar. Las sustituciones
logran esto simplificando el integrando, los lı́mites de integración o ambos.
El objetivo de esta sección es estudiar una sustitución para integrales dobles de funciones
f (x, y) sobre regiones R del plano R2
La problemática en este caso será más complicada que en el caso de funciones de una sola
variable, pues, por ejemplo, ahora se trata de cambiar las variables x, y en la función f (x, y)
por dos nuevas variables, digamos u, v.
Suponga que queremos evaluar la integral doble
¨
f (x, y)dxdy
R

Un cambio de variables para esta integral está determinado por una transformación T deri-
vable continuamente, del plano uv al plano xy -es decir, una función T que asocia al punto
(u, v) un punto (x, y) = T (u, v) dado por ecuaciones de la forma

x = g(u, v) y = h(u, v) (3.8)

El punto (x, y) se denomina la imagen del punto (u, v) con la transformación T . Se dice
que una transformación T es uno a uno si cada punto en R es la imagen bajo T del punto
único en S. Dicho de otro modo, ningún par de puntos en S tiene la misma imagen en R.
En este caso T tiene una transformación inversa T −1 tal que

T −1 (x0 , y0 ) = (u0 , v0 )

Esto es, (u0 , v0 ) es la imagen bajo T −1 (x0 , y0 )


Con frecuencia resulta conveniente visualizar la transformación T geométricamente en
términos de sus

curvas u=T(rectas horizontales) y curvas v=T(rectas verticales).

100
T convierte al
rectángulo S en la
figura curvilı́nea R

Observe que T (S) = R donde S es un rectangulo limitado por rectas horizontales y


verticales en el plano uv y R es una figura curvilı́nea acotada por curvas u y curvas v en el
plano xy (ver figura).
Ahora debemos describir el cambio de variables en una integral doble que corresponde a
la transformación T especificada por las ecuaciones en (3.8). Sea la región R en el plano xy
la imagen bajo T de la región S en el plano uv.

−→−→−→−→
T (u, v) = (x, y)

x = g(u, v)
y = h(u, v)

Sea f (x, y) continua sobre R y sea {S1 , S2 , . . . , Sn } una partición interior de S en rectángu-
los cada uno de los cuales tiene dimensiones ∆u por ∆v. Cada rectángulo Si es transformado
por T en una figura curvilı́nea Ri en el plano xy. De manera que {R1 , R2 , . . . , Rn } constitu-
yen entonces una partición interna de la región R (aunque en figuras curvilı́neas en lugar de
rectángulos).
Sea (u∗i , vi∗ ) el punto en la esquina inferior izquierda de Si , y sea
 
(x∗i , yi∗ ) = T (u∗i , vi∗ ) = g(u∗i , vi∗ ), h(u∗i , vi∗ )

Consideremos la curva u : [u∗i , u∗i + ∆u] → R2 : dada por

u(t) = T (t, vi∗ ) = (g(t, vi∗ ), h(t, vi∗ ))

Considere también la curva v : [vi∗ , vi∗ + ∆v] → R2 : dada por

u(t) = T (t, vi∗ ) = (g(u∗i , t), h(u∗i , t))

101
Los vectores velocidad de estas curvas son
   
u′ (t) = Tu (t, vi∗ ) = gu (t, vi∗ ), hu (t, vi∗ ) v′ (t) = Tu (u∗i , t) = gv (u∗i , t), hv (u∗i , t)

Podemos aproximar la imagen de la región R = T (S) por medio del paralelogramo formado
por los vectores secante,

a = T (u∗i + ∆u, vi∗ ) − T (u∗i , vi∗ ) ≈ Tu (u∗i , vi∗ )∆u


b = T (u∗i , vi∗ + ∆v) − T (u∗i , vi∗ ) ≈ Tv (u∗i , vi∗ )∆v

El área del paralelogramo curvilı́neo Ri es entonces aproximadamente igual al área del para-
lelogramo Pi generado por los vectores a y b, es decir , ∆Ai ≈ area(Pi ). Esta aproximación
será tanto mejor en cuanto ∆u y ∆v sean pequeños. Entonces

∆Ai ≈ area(Pi ) = |a × b| = |Tu ∆u × Tv ∆v| = |Tu × Tv |∆u∆v

pero,
i j k
gu hu g gv

k = u

Tu × Tv = gu hv 0 = k
gv hv hu hv


gv hv 0
El determinante de 2 × 2 en el lado derecho de la última ecuación se denomina Jacobiano de
2
la transformación T : Ruv → R2xy , en honor del matemático alemán Carl Jacobi (1804-1851),
quien fue el primero que investigó los cambios generales de variables en las integrales dobles.
2
Definition 41. El Jacobiano de la transformación derivable continuamente T : Ruv → R2xy
2
es la función (de variable real) JT : Ruv → R definida por

xu (u, v) xv (u, v)

J(u, v) = := ∂(x, y)
yu (u, v) yv (u, v)
∂(u, v)

Recuerde que comenzamos con una partición interior {S1 , S2 , . . . , Sn } de la región S


en el plano uv, con las imágenes de estos rectángulos que forman una partición curvilı́nea
{R1 , R2 , . . . , Rn } de la región R = T (S) en el plano xy. Ahora, sabemos que el área ∆Ai de
Ri está dada aproximadamente por

∆Ai ≈ |JT (u∗i , vi∗ )|∆u∆v

Por tanto, cuando planteamos sumas de Riemann para aproximar integrales dobles, encon-
tramos
¨ n
X
f (x, y)dxdy ≈ f (x∗i , yi∗ )∆Ai
R i=1
n
X  
≈ f g(u∗i , vi∗ ), h(u∗i , vi∗ ) |JT (u∗i , vi∗ )|∆u∆v
i=1
¨ 
≈ f g(u, v), h(u, v)|JT (u, v)|dudv.
S

102
Este análisis es, en realidad, un bosquejo de una demostración del siguiente teorema
general del cambio de variables. Para asegurar la existencia de las integrales dobles
indicadas, aceptamos que las fronteras de ambas regiones R y S consisten en un número
finito de elementos curvos suaves.

2
Teorema 42. Suponga que la transformación derivable continuamente T : Ruv → R2xy toma
la región limitada S en el plano uv en la región limitada R en el plano xy, y es uno a uno
del interior de S al interior de R. Si F (x, y) es continua sobre R, entonces
¨ ¨  
f (x, y)dxdy = f T (u, v) |JT (u, v)|dudv
R S

ˆ
OBSERVACIÓN: Dada una integral doble particular f (x, y)dxdy, ¿cómo encontra-
R
mos un cambio provechoso de variables? . Un enfoque estándar consiste en escoger una
transformación T tal que la frontera de R consiste en curvas u y curvas v. En caso de que sea
más conveniente expresar u y v en términos de x y y, primero se calcula en forma explı́cita
J(u, v) y después se encuentra el Jacobiano necesario J(x, y) con la fórmula
J(u, v)J(x, y) = 1
Esta ecuación es una consecuencia de aplicar la regla de la cadena a T (T −1 (x, y)) = (x, y).
¨
Ejemplo 128. Halle (x2 +y 2 )dxdy donde R es la región plana limitada por las hipérbolas
R
xy = 1, xy = 3, x2 − y 2 , x2 − y 2 = 4.

Solución. Las hipérbolas que limitan a R son curvas u y v si u = xy y v = x2 − y 2 , observe


que de aquı́ NOOOO es fácil despejar x y y en términos de u y v.

−→−→−→−→
T (u, v) = (x(u, v), y(u, v))

T −1 (x, y) = (u(x, y), v(x, y))

u = xy
v = x2 + y 2

Sin embargo podemos calcular sin problema el Jacobiano J(u, v) para lograr una buena
sustitución,
∂(u, v)
J(u, v) = =
∂(x, y)
∂(x, y)
J(x, y) = =.
∂(u, v)
Observe que,
(x2 + y 2 )2 = (x4 + 2x2 y 2 + y 4 ) = 4x2 y 2 + (x2 − y 2 )2 = 4u2 + v 2 .
Ahora estamos listos para aplicar el teorema del cambio de variables, con las regiones S y R
¨ ˆ 4ˆ 3
(x2 + y 2 )dxdy =
R 1 1

103
¨
Ejemplo 129. Halle 3xydA donde R es la región plana limitada por las x − 2y = 0,
R
x − 2y = −4, x + y = 4, x + y = 1.

Solución. Las rectas que limitan a R son curvas u y v si u = x + y y v = x − 2y , Observe


que aquı́ si es fácil despejar x, y
1 1
x= (2u + v) y y= (u − v)
3 3
Por tanto, el Jacobiano J(u, u) está dado por,

∂(x, y)
J(u, v) = =
∂(u, v)

Ahora estamos listos para aplicar el teorema del cambio de variables,


¨
3xydA =
R

4 y/2+1
2x − y
ˆ ˆ
Ejemplo 130. Halle dxdy.
0 y/2 2

Solución. Trazamos la región de integración R en el plano xy para ello observe que los limites
de x son x = y2 y x = y2 + 1 y los lı́mites de y son y = 0 y y = 4. Luego las rectas que
limitan a R son curvas u = x − y2 y v = y (aquı́ podemos tomar tambien v = y2 ), Observe
que aquı́ es fácil despejar x, y

x=u+v y y = 2v

Por tanto, el Jacobiano J(u, u) está dado por,

∂(x, y)
J(u, v) = =
∂(u, v)

Ahora estamos listos para aplicar el teorema del cambio de variables,


4 y/2+1
2x − y
ˆ ˆ
dxdy =
0 y/2 2


1 1−x

ˆ ˆ
Ejemplo 131. Halle x + y(y − 2x)2 dydx.
0 0

104
Solución. Trazamos la región de integración R en el plano xy para ello observe que los limites
de x son x = 0 y x = 1 y los lı́mites de y son y = 0 y y = 1 − x esto implica que la frontera
esta limitada por las rectas x = 0, y = 0 y x + y = 0. El integrando sugiere la transformación
u = x + y y v = y − 2x. Observe que aquı́ es fácil despejar x, y
u v 2u v
x= − y y= + (3.9)
3 3 3 3
Por tanto, el Jacobiano J(u, u) está dado por,

∂(x, y)
J(u, v) = =
∂(u, v)

Ahora hallemos la NUEVA región donde vamos a integrar, para ello usaremos la frontera
original x = 0, y = 0 y x + y = 0 y las ecuaciones (3.9), si x = 0 entonces v = u, si y = 0
entonces v = −2u y si x + y = 1 entonces u = 1. Una vez dibujada nos damos cuenta que la
Nueva región es tipo I.
Ahora estamos listos para aplicar el teorema del cambio de variables,
ˆ 1 ˆ 1−x

x + y(y − 2x)2 dydx =
0 0



ˆ 1 ˆ 1−x2
Ejemplo 132. Halle (x2 + y 2 )dydx.
0 0

Solución. Si intragamos directamente obtenemos


ˆ 1 p
(1 − x2 )3/2 
x2 1 − x2 + dx
0 3

y ahora a . Esto nos motiva a buscar una buena sustitución para mejorar el
integrando, nos es difı́cil que es una excelente opción,

x= y=

Por tanto, el Jacobiano J(u, u) está dado por,

∂(x, y)
J(u, v) = =
∂(u, v)

π
La NUEVA región está descrita mediante desigualdades sencillas 0 ≤ r ≤ 1 y 0 ≤ θ ≤ 2.
Ahora estamos listos para aplicar el teorema del cambio de variables,

ˆ 1 ˆ 1−x2
(x2 + y 2 )dydx =
0 0


NOTA: La transformación a coordenadas polares es muy eficaz en este caso pues x2 + y 2
se se simplifica como r2 y otra razón es que los lı́mites de integración se vuelven cosntantes.
¨
2 2
Ejemplo 133. Halle ex +y dydx donde R es la región semicircular acotada por el eje x
R

105

y la curva y = 1 − x2 .

Solución. Dado que la integrando tiene el factor x2 + y 2 , entonces usaremos las coordenadas
polares
x = r cos θ y = r sin θ
Por tanto, el Jacobiano J(u, u) está dado por,

∂(x, y)
J(u, v) = =
∂(u, v)

La NUEVA región está descrita mediante desigualdades sencillas 0 ≤ r ≤ 1 y 0 ≤ θ ≤ π.


Ahora estamos listos para aplicar el teorema del cambio de variables,
¨
2 2
ex +y dydx =
R


Ejemplo
p 134. Halle el volumen de la región sólida limitada superiormente por el hemisferio
z = 16 − x2 − y 2 e inferiormente por la región circular R dada por x2 + y 2 ≤ 4.
¨
Solución. No es difı́cil ver que el volumen del solido esta dado por zdA donde R esta
R
2 2 2 2
dado por x + y ≤ 4. Dado que la base contiene el factor x + y , entonces usaremos las
coordenadas polares
x = r cos θ y = r sin θ
Por tanto, el Jacobiano J(u, u) está dado por,

∂(x, y)
J(u, v) = =
∂(u, v)

La NUEVA región está descrita mediante desigualdades sencillas 0 ≤ r ≤ 2 y 0 ≤ θ ≤ 2π.


Ahora estamos listos para aplicar el teorema del cambio de variables,
¨
zdA =
R


EJER:
¨
y−x
1. Calcule e y+x dxdy, donde D es el triángulo limitado por la recta x + y = 2 y los
D
ejes coordenados.

2. Halle el área de la región limitada por las curvas xy = 1, xy = 3, x−xy = 1, x−xy = 3.

106
Integrales en Coordenadas polares

Como hemos visto algunas integrales dobles son mucho más fáciles de evaluar en forma polar
que en forma rectangular. Esto es ası́ especialmente cuando se trata de regiones circula-
res, cardioides y pétalos de una curva rosa, y de integrandos que contienen el termino x2 +y 2 .

Recordemos que un sectores circulares o un rectángulo polar es una región descrita en


coordenadas polares por las desigualdades

R = (r, θ) : r1 ≤ r ≤ r2 , θ1 ≤ θ ≤ θ2

Suponga que se desea calcular el valor de la integral doble


¨
f (x, y)dA
R

donde R es el rectángulo polar. Es decir, se quiere obtener el volumen del sólido cuya base es
R y que se encuentra debajo de la superficie z = f (x, y). Anteriormente se definió la integral
doble como el lı́mite de sumas de Riemann con particiones que consisten en rectángulos
ordinarios. También es posible definir la integral doble en términos de particiones polares,
formadas por rectángulos polares.

Para definir una integral doble de una función continua en coordenadas polares,

1. Sea R una región limitada o acotada por las gráficas de r = g1 (θ) y r = g2 (θ) y las rectas
θ = α y θ = β.
2. En lugar de hacer una partición de R en rectángulos pequeños, se utiliza una partición en
sectores polares pequeños.
3. A R se le superpone una red o cuadrı́cula polar formada por rayos y arcos circulares, como
se muestra en la figura.
4. Los sectores polares Ri que se encuentran completamente dentro de R forman una partición
polar interna cuya norma es la longitud de la diagonal más larga en los n sectores polares.
5. Considerar un sector polar especı́fico Ri . Se puede mostrar que el área de Ri es ∆Ai =
ri ∆ri ∆θi donde ∆ri = r2 − r1 y ∆θi = θ2 − θ1 .

6. El volumen del sólido de altura f (ri cos θ, ri sin θ) “Edificio”sobre Ri es aproximada-


mente f (ri cos θ, ri sin θ)ri ∆ri ∆θi y se tiene
¨ n
X ¨
f (x, y)dA ≈ f (ri cos θi , ri sin θi )ri ∆ri ∆θi ≈ f (r cos θ, r sin θ)rdr∂θ
R i=1 R

En coordenadas rectángulas (x, y) tenı́amos regiones de tipo I o II, en coordenadas polares


(r, θ) vamos a tener dos tipos básicos de regiones, las regiones r-simples y las regiones θ-
simples

107
Ejemplo 135. Utilizar una integral doble para hallar el área encerrada por la gráfica de
r = 3 cos(3θ)

Solución. No es difı́cil ver que la región es r-simple y los lı́mites de un pétalo de la curva son
π π
6 ≤ θ ≤ 6 y 0 ≤ r ≤ 3 cos(3θ). Por tanto, el área de un pétalo es

1
¨
A= dA =
3 R

π
Ejemplo 136. Hallar el área de la región acotada superiormente por la espiral r = 3θ e
inferiormente por el eje polar, entre r = 1 y r = 2
π
Solución. No es difı́cil ver que la región es θ-simple y los lı́mites polares son 0 ≤ θ ≤ 3r y
1 ≤ r ≤ 2. Por tanto, el área de la región es
¨
A= dA =
R

Ejemplo 137. Halle la región R limitada en su interior por la circunferencia r = 1 y en el


exterior por la curva conocida como “caracol de Pascal”r = 2 + cos θ.

Solución. No es difı́cil ver que la región es r-simple y los lı́mites polares son 0 ≤ θ ≤ 2π y
0 ≤ r ≤ 1. Por tanto, el área de la región es
¨
A= dA =
R

108
Ejemplo 138. Encuentre el volumen de la región sólida que es interior tanto a la esfera
x2 + y 2 + z 2 = 4 de radio 2, como al cilindro (x − 1)2 + y 2 = 1. Halle la región R limitada en
su interior por la circunferencia r = 1 y en el exterior por la curva conocida como “caracol
de Pascal”r = 2 + cos θ.

Solución. No es difı́cil ver que el volumen del solido esta dado por
¨ ¨ ¨ p
V = (zsup − zinf )dA = 2 zsup = 4 − x2 − y 2 dA.
R R R

donde R esta dado por (x − 1)2 + y 2 ≤ 1. Pero esta integral serı́a muy difı́cil de evaluar en
coordenadas rectangulares, por lo que la cambiamos a coordenadas polares. x = r cos θ y
y = r sin θ
En este caso polar la región es r-simple y los lı́mites polares son 0 ≤ r ≤ 2 cos θ con
−π/2 ≤ θ ≤ π/2. Por tanto, el volumen de la región es
¨ p
V =2 4 − x2 − y 2 dA =
R

Aplicaciones de Integrales dobles

Masa
Si la lámina que corresponde a la región R, que se muestra en la figura, tiene una densidad
constante ρ entonces la masa de la lámina está dada por
¨ ¨
Masa = ρA = ρ dA = ρdA Densidad Constante
R R

Si no se especifica otra cosa, se supone que una lámina tiene densidad constante. Las inte-
grales dobles pueden usarse para calcular la masa de una lámina de densidad variable, donde
la densidad en (x, y) está dada por la función de densidad ρ

Definition 43. Si ρ es una función de densidad continua sobre la lámina que corresponde
a una región plana R, entonces la masa m de la lámina está dada por
¨
m= ρ(x, y)dA Densidad Variable
R

NOTA: La densidad se expresa normalmente como masa por unidad de volumen. Sin embar-
go, en una lámina plana la densidad es masa por unidad de área de superficie.
Ejemplo 139. Hallar la masa de la lámina triangular con vértices (0, 0), (0, 3) y (2, 3), dado
que la densidad en (x, y) es ρ(x, y) = 2x + y

Solución. No es difı́cil ver que la región es de tipo . Luego la masa de la lámina es

¨
m= ρdA =
R

109

Ejemplo 140. Hallar la masa de la lámina correspondiente a la porción en el primer
cuadrante del cı́rculo x2 + y 2 = 4 donde la densidad en el punto (x, y) es proporcional a
la distancia entre el punto y el origen.
p
Solución. En todo punto (x, y), la densidad de la lámina es ρ = k (x − 0)2 + (y − 0)2 .
Ademas, la región es de tipo . Luego la masa de la lámina es
¨
m= ρdA =
R


NOTA: Nótese que la lámina plana está sombreada; el sombreado más oscuro corresponde
a la parte más densa.
Momento y centro de masa
En láminas de densidad variable, los momentos de masa (M omento = (masa)(distancia)) se
definen de manera similar a la empleada en el caso de densidad uniforme. Dada una partición
P de una lámina, correspondiente a una región plana R, considerar el rectángulo i-ésimo
Ri de área ∆Ai como se muestra en la figura. Suponer que la masa de Ri se concentra en
uno de sus puntos interiores (xi , yi ). El momento de masa de Ri respecto al eje x puede
aproximarse por medio de

M om(Ri )x = (masa)yi ≈ [ρ(xi , yi )∆Ai ](yi )

De manera similar, el momento de masa con respecto al eje y puede aproximarse por medio
de
M om(Ri )y = (masa)xi ≈ [ρ(xi , yi )∆Ai ](xi )
Formando la suma de Riemann de todos estos M omentos(Ri ) y tomando lı́mites cuando
kP k → 0, se obtienen las definiciones de momentos de masa con respecto a los ejes x y y.
Definition 44. Sea ρ una función de densidad continua sobre la lámina plana R. Los
momentos de masa con respecto a los ejes x y y son
¨ ¨
Mx = yρ(x, y)dA y My = xρ(x, y)dA
R R

Si m es la masa de la lámina, entonces el centro de masa es


M My 
x
(x, y) = ,
m m
Si R representa una región plana simple en lugar de una lámina, el punto (x, y) se llama el
centroide de la región.

110
Ejemplo 141. Hallar el centro de masa de la lámina que corresponde a la región parabólica
0 ≤ y ≤ 4 − x2 donde la densidad en el punto (x, y) es proporcional a la distancia entre
(x, y) y el eje x,

Solución. En todo punto (x, y), la densidad de la lámina es ρ(x, y) = ky. Ademas, la región
es de tipo . Como la lámina es simétrica con respecto al eje y, x = 0. Para hallar y
primero debemos calcular la masa de la lámina.
¨
m= ρdA =
R

Ahora, el momento con respecto al eje x.


¨
Mx = yρdA =
R

Mx
Ası́ y = m = . y el centro de masa es (0, ). ∆
Ejemplo 142. Una lámina ocupa la región acotada por la recta y = x + 2 y la parábola
y = x2 . La densidad de la lámina en el punto P (x, y) es proporcional al cuadrado de la
distancia de P a partir del eje y. Encuentre la masa y centroide de la lámina.

Solución. En todo punto (x, y), la densidad de la lámina es ρ(x, y) = ky. Ademas, la región
es de tipo , donde sus limites están dados por

¨
m= ρ(x, y)dA =
R

Ahora, el momento con respecto al eje x.


¨
Mx = yρ(x, y)dA =
R

111
¨
My = xρ(x, y)dA =
R

63k
Ası́, la lámina tiene una masa de 20 , y su centroide se localiza en el punto ( 87 , 118
49 )

Ejemplo 143. Una lámina tiene la forma de la región R acotada por la gráfica de la elipse
x2 y2
4 + 16 = 1, 0 ≤ y ≤ 4 y y = 0. Encuentre su centro de masa si la densidad es ρ(x, y) = |x|y.

Solución. vemos que la región es simétrica con respecto al eje y, Además, puesto que
ρ(−x, y) = ρ(x, y), la densidad ρ es simétrica alrededor del eje y. Por tanto x = 0. Pa-
ra hallar y primero hallemos la masa integrando en la región tipo II
¨
m= ρ(x, y)dA =
R

Ahora, el momento con respecto al eje x.


¨
Mx = yρ(x, y)dA =
R

Ası́, la lámina tiene una masa de 16, y su centroide se localiza en el punto (0, 32
15 ) ∆
Observación: Para que el centro de masa este sobre un eje de simetrı́a de una lámina, no
región debe ser simetrica y la función de densidad también debe ser simétrica con respecto a
ese eje.
Ejemplo 144. Encuentre el centro de masa de la lámina que corresponde a la región acotada
por la curva llamada pétalo de rosa r = 2 sin(2θ) en el primer cuadrante si la densidad en el
punto P en la lámina es directamente proporcional a la distancia desde el origen polar.

Solución. La distancia desde el origen polar es d(0, P ) = |r|. Por tanto, la densidad de la
lámina es ρ(r, θ) = k|r|.
Ahora hallemos, la masa de la lamina
¨ ¨
m= ρ(x, y)dA = kkr|dA =
R R

112
Ahora, el momento con respecto al eje y.
¨
My = xρ(r, θ)dA =
R

De manera similar, el momento con respecto al eje x.


¨
Mx = yρ(r, θ)dA =
R

16
Ası́, la lámina tiene una masa de 9 k, y su centroide se localiza en el punto ( 32 32
35 , 35 ) ∆

Momentos de inercia

Los momentos Mx y My utilizados en la determinación del centro de masa de una lámina


se suelen llamar primeros momentos con respecto a los ejes x y y. En cada uno de los
casos, el momento es el producto de una masa por una distancia.

Ahora se introducirá otro tipo de momento, el segundo momento o momento de


inercia de una lámina respecto de una recta. Del mismo modo que la masa es una medida
de la tendencia de la materia a resistirse a cambios en el movimiento rectilı́neo, el momento
de inercia respecto de una recta es una medida de la tendencia de la materia a resistirse a
cambios en el movimiento de rotación. Por ejemplo, si una partı́cula de masa m está a una
distancia d de una recta fija, su momento de inercia respecto de la recta se define como

I = md2 = (masa)(distancia)2

113
Igual que ocurre con los momentos de masa, se puede generalizar este concepto para obtener
los momentos de inercia de una lámina de densidad variable respecto de los ejes x y y. Estos
segundos momentos se denotan por Ix e Iy y en cada caso el momento es el producto de
una masa por el cuadrado de una distancia.

A la suma de los momentos Ix e Iy se le llama el momento polar de inercia y se denota


por I0 .
Ejemplo 145. Hallar el momento de Inercia respecto del eje x de la lámina que corresponde
a la región parabólica 0 ≤ y ≤ 4 − x2 donde la densidad en el punto (x, y) es proporcional a
la distancia entre (x, y) y el eje x,

Solución. En todo punto (x, y), la densidad de la lámina es ρ(x, y) = ky, la región es de tipo
I, y de acuerdo con la definición de momento de inercia, se tiene

¨
Ix = (y 2 )ρdA =
R


Ejemplo 146. Calcule Ix para una lámina de densidad constante ρ = 1 que ocupa la región
limitada por las curvas x = ±y 4 , −1 ≤ y ≤ 1. Adicionalmente halle el área de la región

Solución. En todo punto (x, y), la densidad de la lámina es ρ(x, y) = 1, la región es de tipo
, y de acuerdo con la definición de momento de inercia, se tiene

¨
Ix = (y 2 )ρ(x, y)dA =
R


Resistencia de columna: Se sabe que la rigidez, de una columna horizontal es proporcional
al momento de inercia de su sección transversal respecto a un eje horizontal a través del
centroide de la sección transversal de la columna.

114
Supongamos que la región del ejemplo anterior es una sección trasversal de una columna y
comparemos su resistencia con otra columna rectangular con igual altura, 2, y área similar
4
5 . Al hallar el momento de inercia de su sección transversal

1 1/5
4
ˆ ˆ
Ix = (y 2 )dxdy =
−1 −1/5 15

Como la razón de 47 / 15
4
= 15
7 , se observa que la columna del ejemplo es más del doble de
fuerte que una columna rectangular con la misma superficie de sección transversal. A esta
resistencia se debe que sea común que las columnas del ejemplo se usen en la construcción.
Ejemplo 147. Encuentre el momento polar de inercia de una lámina circular R de radio a
y densidad ρ constante concentrada en el origen.

Solución. En todo punto (x, y), la densidad de la lámina es ρ(x, y) = 1, la región de la lámina
R ocupa la región plana x2 + y 2 ≤ a2 y de acuerdo con la definición de momento de inercia,
se tiene

¨
I0 = (x2 + y 2 )ρ(x, y)dA =
R

Área de superficie

En esta sección se verá cómo hallar el área de la superficie superior del sólido. Para
empezar, considerar una superficie S dada por z = f (x, y) definida sobre una región R.
Suponer que R es cerrada y acotada y que f tiene primeras derivadas parciales continuas.
Para hallar el área de la superficie,

1. Se construye una partición interna de R que consiste en n rectángulos donde el área


del rectángulo i-ésimo Ri es ∆Ak = ∆xk ∆yk .
2. En cada Ri sea (xk , yk ) el punto más próximo al origen.
3. En el punto (xk , yk , zk ) = (xk , yk , f (xk , yk )) de la superficie S, se construye un plano
tangente Tk .
4. El área de la porción del plano tangente que se encuentra directamente sobre Ri es
aproximadamente igual al área de la superficie que se encuentra directamente sobre Ri .
Es decir, ∆Ti = ∆Si .

115
5. El área de la superficie de S está dada por
n
X n
X
A(S) = ∆Si ≈ ∆Ti
i=1 i=1

6. El área del paralelogramo esta dado por ∆Tk = |u × v| donde


u = (∆xk , 0, fx (xk , yk )∆xk ) v = (0, ∆yk , fy (xk , yk )∆yk )

i j k

 
u × v = ∆xk
0 fx (xk , yk )∆xk = − fx (xk , yk )i − fy (xk , yk )j + k ∆xk ∆yk

0 ∆yk fy (xk , yk )∆yk
p
Por tanto, ∆Tk = [fx (xk , yk )]2 + [fy (xk , yk )]2 + 1∆xk ∆yk .
7. El área de la superficie es aproximadamente
Xn q
A(S) ≈ [fx (xk , yk )]2 + [fy (xk , yk )]2 + 1∆xk ∆yk
k=1

8. Al tomar el lı́mite de la suma anterior cuando kP k → 0 se llega a la siguiente definición.

Definition 45. Sea f una función para la cual las primeras derivadas parciales fx y fy son
continuas sobre una región cerrada R. Entonces el área de la superficie z = f (x, y) sobre
R está dada por
¨ s
∂z ∂z
¨ q
A(S) = 1 + [fx (x, y)]2 + [fy (x, y)]2 dA = 1 + [ ]2 + [ ]2 dA
R R ∂x ∂y

1. Si fuera más cómodo proyectar la superficie S sobre el plano xz, es decir, y = f (x, z)
se usa la fórmula ¨ p
A(S) = 1 + [fx ]2 + [fz ]2 dA
R
donde R es la región cerrada en el plano xz.
2. Si la proyección de la superficie S está sobre el plano yz, es decir, x = f (y, z) se usa la
fórmula ¨ q
A(S) = 1 + [fy ]2 + [fz ]2 dA
R
donde R es la región cerrada en el plano yz

Ejemplo 148. Determine el área de la superficie de la porción de la esfera x2 +y 2 +z 2 = a2


que está sobre el plano xy y dentro del cilindro x2 + y 2 = b2 , 0 < b < a.
p
Solución. Si se define z = f (x, y) por f (x, y) = a2 − x2 − y 2 entonces ∆

116
Ejemplo 149. Determine el área de la superficie de la porción de la esfera x2 + y 2 + z 2 = 4
que están dentro del cilindro (x − 1)2 + y 2 = 1.

Solución. El área de superficie en cuestión consiste en


p las dos regiones sombreadas y oscuras
de la superficie de la figura. Observe que f (x, y) = 4 − x2 − y 2 luego


Ejemplo 150. Hallar el área de la superficie de la porción del plano z = 2 − x − y que se
encuentra sobre el cı́rculo x2 + y 2 ≤ 1 en el primer cuadrante.

Solución. Observe que f (x, y) = 2 − x − y luego fx = y fy = . Por tanto, el área de


la superficie está dada por
¨ q
A(S) = 1 + [fx (x, y)]2 + [fy (x, y)]2 dA =
R

Ejemplo 151. Hallar el área de la porción de la superficie f (x, y) = 1 − x2 + y que se


encuentra sobre la región triangular cuyos vértices son (1, 0, 0) (0, −1, 0) y (0, 1, 0).

Solución. Aquı́ fx (x, y) = y fy = . Ahora al dibujar la región de integración vemos


que que la región es de tipo . El área de la superficie está dada por

117
¨ q
A(S) = 1 + [fx (x, y)]2 + [fy (x, y)]2 dA =
R


Ejemplo 152. Hallar el área de la superficie del paraboloide z = 1+x2 +y 2 que se encuentra
sobre el cı́rculo unidad.

Solución. Aquı́ fx (x, y) = y fy = . Ahora al dibujar la región de integración vemos


que que la región es de tipo . El área de la superficie está dada por
¨ q
A(S) = 1 + [fx (x, y)]2 + [fy (x, y)]2 dA =
R

Integrales triples
Los pasos que conducen a la definición de la integral triple, son bastante similares a los
de la integral doble.

118
1. Sea w = f (x, y, z) definida sobre una región cerrada y acotada D del espacio tridimen-
sional.

2. Por medio de una retı́cula tridimensional de planos verticales y horizontales paralelos


a los planos de coordenadas, forme una partición interior de D en n subregiones
(cajas) Dk de volúmenes ∆Vk que se encuentre por completo dentro de D.

3. Considere que kP k es la norma de la partición o longitud de la diagonal más larga de


la caja Dk .

4. Elija un punto muestra (x∗k , yk∗ , zk∗ ) en cada subregión Dk .


5. Forme la suma
n
X
f (x∗k , yk∗ , zk∗ )∆Vk
k=1

n
X
6. La suma f (x∗k , yk∗ , zk∗ )∆Vk donde (x∗k , yk∗ , zk∗ ) es un punto arbitrario dentro de cada
k=1
Dk y ∆Vk denota el volumen de cada Dk recibe el nombre de suma de Riemann.
Definition 46. Sea f una función de tres variables definida sobre una región cerrada D del
espacio tridimensional. Entonces la integral triple de f sobre D, se define como
˚ n
X
= lı́m f (x∗k , yk∗ , zk∗ )∆Vk
R kP k→0
k=1

Limites de integrales triples Si la región D está acotada por arriba por la gráfica de
z = g2 (x, y) y acotada por abajo por la gráfica de z = g1 (x, y) entonces
˚ ¨ hˆ g2 (x,y) i
f (x, y, z)dV = f (x, y, z) dA
D R g1 (x,y)

donde R es la proyección ortogonal de D sobre el plano xy.

R TIPO I: Si R es una región de tipo I entonces R : a ≤ x ≤ b, h1 (x) ≤


y ≤ h2 (x) y la integral triple se expresa como
˚ ˆ b ˆ h2 (x) hˆ g2 (x,y) i
f (x, y, z)dV = f (x, y, z) dzdydx
D a h1 (x) g1 (x,y)

R TIPO II: Si R es una región de tipo II entonces R : c ≤ y ≤ d, h1 (y) ≤


x ≤ h2 (y) y la integral triple se expresa como
˚ ˆ d ˆ h2 (y) hˆ g2 (x,y) i
f (x, y, z)dV = f (x, y, z) dzdxdy
D c h1 (y) g1 (x,y)

En una integral doble hay sólo dos posibles órdenes de integración: dydx y dxdy. Las
integrales triples tiene seis posible formas órdenes de integración:
Las dos últimas diferenciales nos indican el plano de coordenadas en el cual se localiza la
región R.

119
˚ ˆ b ˆ h2 (x) hˆ g2 (x,y) i
dzdydx Rxy tipo I f (x, y, z)dV = f (x, y, z) dzdydx
D a h1 (x) g1 (x,y)
˚ ˆ d ˆ h2 (y) hˆ g2 (x,y) i
dzdxdy Rxy tipo II f (x, y, z)dV = f (x, y, z) dzdxdy
D c h1 (y) g1 (x,y)
˚ ˆ b ˆ h2 (x) hˆ g2 (x,z) i
dydxdz Rxz tipo I f (x, y, z)dV = f (x, y, z) dydzdx
D a h1 (x) g1 (x,z)
˚ ˆ k ˆ h2 (z) hˆ g2 (x,z) i
dydzdx Rxz tipo II f (x, y, z)dV = f (x, y, z) dydxdz
D e h1 (z) g1 (x,z)
˚ ˆ d ˆ h2 (y) hˆ g2 (y,z) i
dxdydz Ryz tipo I f (x, y, z)dV = f (x, y, z) dxdzdy
D c h1 (y) g1 (y,z)
˚ ˆ k ˆ h2 (z) hˆ g2 (y,z) i
dxdzdy Ryz tipo II f (x, y, z)dV = f (x, y, z) dxdydz
D e h1 (z) g1 (y,z)

APLICACIONES
VOLUMEN: Si f (x, y, z) = 1 entonces el volumen del sólido D es
˚
V = dV
D

MASA: Si ρ(x, y, z) es la densidad, entonces la masa del sólido D está dada por
˚
m= ρ(x, y, z)dV
D

PRIMEROS MOMENTOS Los primeros momentos del sólido alrededor de los


planos de coordenadas indicados por los subı́ndices están dados por
˚ ˚ ˚
Mxy = zρ(x, y, z)dV, Mxz = yρ(x, y, z)dV, Myz = xρ(x, y, z)dV
D D D

CENTRO DE MASA Las coordenadas del centro de masa de D están dadas por
Myz Mxz Mxy
x= , y= , z=
m m m
SEGUNDOS MOMENTOS: Los segundos momentos, o momentos de inercia,
de D alrededor de los ejes de coordenadas indicados por los subı́ndices están dados por
˚ ˚ ˚
Ix = (y 2 +z 2 )ρ(x, y, z)dV, Iy = (x2 +z 2 )ρ(x, y, z)dV, Iz = (x2 +y 2 )ρ(x, y, z)dV,
D D D

Ejemplo 153. Encuentre el volumen del sólido en el primer octante acotado por las gráficas
de z = 1 − y 2 , y = 2x y x = 3.
Solución. No es difı́cil ver que la proyección del solido sobre el plano xy es una región tipo
II. Luego, usaremos el orden dzdxdy para calcular el volumen de D
˚
V = dV =
D

120
Ejemplo 154. Un sólido tiene la forma determinada por las gráficas del cilindro |x|+|y| = 1
y los planos z = 2 y z = 4.

1. Encuentre su centro de masa si la densidad está dada por ρ(x, y, z) = kz, con k una
constante.

2. Determine el momento de inercia del sólido alrededor del eje z.

Solución. (a) No es difı́cil ver que el dominio del solido esta contenido en el plano xy.
Observese que la proyección del solido sobre el plano xy es la región dada por |x| + |y| = 1.
Esta región es equivalente a 4 rectas,

x + y = 1, x > 0, y > 0, −x + y = 1, x < 0, y > 0

x − y = 1, x > 0, y < 0, −x − y = 1, x < 0, y < 0,


Puesto que la función de densidad ρ(x, y, z) = kz es simétrica sobre R, concluimos que el
centro de masa yace sobre el eje z; esto es, necesitamos calcular sólo m y Mx y. Tomando R
como región es tipo I
˚ ˆ ˆ ˆ
m= ρ(x, y, z)dzdydx = 4 kzdzdydz
D

˚ ˆ 1 ˆ 1−x ˆ 4
Mxy = zρ(x, y, z)dzdydx = 4 kz 2 dzdydz
D 0 0 2

Mxy 28
Por consiguiente, z = m = 9 . Las coordenadas del centro de masa son entonces
(0, 0, 28
9 )


(b) Sabemos que el momento de inercia
˚ ˆ 1 ˆ 1−x ˆ 4
Iz = z(x2 + y 2 )ρ(x, y, z)dzdydx = 4k (x2 + y 2 )zdzdydz
D 0 0 2

121
Ejemplo 155. Cambie el orden de integración en
ˆ 6 ˆ 4−2x/3 ˆ 3−x/2−3y/4
f (x, y, z)dzdydx
0 0 0

a dydxdz

Solución. Debemos hallar los limites de la región de integración

˚
f (x, y, z)dzdydx =
D


Ejemplo 156. Evaluar
ˆ √π/2 ˆ √π/2 ˆ 3
sin(y 2 )dzdydx
0 x 1
¨
Solución. Una integración directa nos lleva a 2 sin(y 2 )dydx la cual no es elemental. Ası́ que
debemos
p cambiar el orden
p de integración. La región esta acotada por las rectas x = 0,
x = π/2, y = x, y = π/2, z = 1 y z = 3
ˆ √ ˆ √
π/2 ˆ π/2 3
sin(y 2 )dzdydx =
0 x 1

Integrales triples en otros sistemas de coordenadas

A partir de la geometrı́a de una región en el espacio tridimensional, la evaluación de una


integral triple sobre la región puede a menudo facilitarse al utilizar un nuevo sistema de
coordenadas.
Coordenadas Cilı́ndricas

122
Las coordenadas rectangulares de un punto se obtienen de las coordenadas cilı́ndricas
mediante las ecuaciones.

x = r cos θ, y = r sin θ, z=z

Recordemos que el área de un “rectángulo polar” es ∆A = r∗ ∆r∆θ donde r∗ es el radio


promedio. De la Figura vemos que el volumen de una “cuña cilı́ndrica” es simplemente

∆V = (área de la base) · (altura) = r∗ ∆r∆θ∆z

Entonces, si f (r, θ, z) es una función continua sobre la región D, la integral triple de f sobre
D está dada por
˚ ¨ " ˆ h2 (r,θ) # ˆ β ˆ g2 (θ) ˆ h2 (r,θ)
f (r, θ, z)dV = f (r, θ, z)dz dA = f (r, θ, z)rdzdrdθ
S R h1 (r,θ) α g1 (θ) h1 (r,θ)

Ejemplo 157. Un sólido en p el primer octante tiene la forma determinada por la gráfica del
cono de un solo manto z = x2 + y 2 y los planos z = 1, x = 0 y Determine el centro de
masa si la densidad está dada por ρ(r, θ, z) = r.

Solución. No es difı́cil ver que el cono tiene como ecuación z = r. (Coordenadas cilı́ndricas).
Por tanto, la masa esta dada por
˚
m= ρdV =
D

123
˚
Mxy = zρdV =
D

˚
Mxz = yρdV =
D

˚
Myz = xρdV =
D

M Mxy
De manera que x = myz = 0.38 y = Mmxz = 0.38 z = m = 0.8. El centro de masa tiene las
coordenadas aproximadas (0.38, 0.38, 0.8).
Ejemplo 158. Calcule la integral triple quepproduce el volumen del sólido que tiene la forma
determinada por el cono de un manto x = y 2 + z 2 y el paraboloide x = 6 − y 2 − z 2 .

Solución. Primero debemos hallar la intersección de las dos superficies para luego proyectarla
a un plano coordenado Observe que al sustituir y 2 + z 2 = x2 en y 2 + z 2 = 6 − x encontramos
que x2 = 6 − x o (x + 3)(x − 2) = 0. Ası́, las dos superficies se intersecan en el plano x = 2.
La proyección del solido sobre el plano yz de la curva de intersección es y 2 + z 2 = 4. Luego
esta regı́on es tipo I o II
˚ ˆ ˆ √ 2ˆ
2 4−y2 2
6−y −z
V = dxdzdy = 4 √ dxdzdy
D 0 0 y 2 +z 2

Usando coordenadas polares en el plano yz mediante y = r cos θ, z = r sen θ, encontramos


que la NUEVA REGION es tipo θ ó r, y las coordenadas cilı́ndricas aquı́ son (r, θ, x)
˚ ˆ ˆ ˆ
V = dxdzdy = 4 rdxdrdθ
D

Ejemplo 159. Use coordenadas cilı́ndricas para hallar el volumen de la región sólida Q que
corta en la esfera x2 + y 2 + z 2 = 4 el cilindro r = 2 sen θ.

Solución. Como x2 +y 2 +z 2 = r2 +z 2 = 4 los lı́mites z son z = ± 4 − r2 Sea R la proyección
circular del sólido sobre el plano rθ. Los lı́mites de R son 0 ≤ r ≤ 2 sin θ y 0 ≤ θ ≤ π. Por
lo tanto,
˚ ˆ ˆ ˆ
V = dV = rdzdrdθ
Q

124
Coordenadas Esfericas

coordenadas rectangulares de un punto se obtienen de las coordenadas esféricas mediante las


ecuaciones.
x = ρ sin φ cos θ, y = ρ sin φ sin θ, z = ρ cos φ
Las cuales verifican
y  z 
ρ2 = x2 + y 2 + z 2 , tan θ = , φ = arc cos p
x x2 + y 2 + z 2

De la Figura vemos que el volumen de una “cuña esferica” está dado por la aproximación

∆V ≈ ρ2 sin φ ∆ρ∆φ∆θ

De tal modo, en una integral triple de una función continua en coordenadas esféricas f (ρ, θ, φ)
la diferencial de volumen dV es

∆V = ρ2 sin φ dρdφdθ
Por consiguiente, una integral triple común en coordenadas esféricas tiene la forma
˚ ¨ " ˆ h2 (ρ,θ) # ˆ β ˆ g2 (θ) ˆ h2 (ρ,θ)
f (ρ, φ, θ)dV = f (ρ, φ, θ)dρ dA = f (ρ, φ, θ)dρdφdθ
S R h1 (ρ,θ) α g1 (θ) h1 (ρ,θ)

Ejemplo 160. Un sólido enpel primer octante tiene la forma determinada por la gráfica del
cono de un solo manto z = x2 + y 2 y los planos z = 1, x = 0. Determine en coordenadas
esféricas para determinar el volumen del sólido.

Solución. Usando las ecuaciones. x = ρ sin φ cos θ, y = ρ sin φ sin θ, z = ρ cos φ. Encontramos
que

z=1 implica que ρ cos φ = 1 ⇔ ρ = sec φ


p
2 2
π
z = x +y implica que ρ cos φ = ρ sin φ ⇔ φ=
4
Ahora hallemos el Volumen
˚
V = dV =
D

125
Ejemplo 161. Hallar el volumen del elipsoide dado por 4x2 + 4y 2 + z 2 = 16

Solución. Como en la ecuación x, y y z juegan papeles similares, el orden de integración


puede pser cualquiera. Usaremos el orden dzdydx. Por tanto la altura de D esta dada por
z = ± 16 − 4x2 − 4y 2 y la base de D esta dada por la región R tipo . Por tanto el
Volumen
˚
V = dV =
D


Ejemplo 162. Determine el momento de inercia en torno al eje z del sólido homogéneo
acotado entre las esferas x2 + y 2 + z 2 = a2 y x2 + y 2 + z 2 = b2 , a < b.

Solución. Como el solido es homogeneo entonces la densidad δ(ρ, ψ, θ) = k, teneiendo en


mente la grafica vemos que
˚
Iz = (x2 + y 2 )dV =
D


Ejemplo 163. Hallar el volumen en coordenadas esféricas de la región sólida D limitada
inferiormente por la hoja superior del cono z 2 = x2 + y 2 y superiormente por la esfera
x2 + y 2 + z 2 = 9.

Solución. En coordenadas esféricas, la ecuación de la esfera es ρ = 9. La esfera y el cono se


cortan cuando x2 + y 2 + z 2 = z 2 + z 2 = 9 entonces z = √32 y como z = ρ cos φ entonces
φ = π/4. Por consiguiente,
˚
V = dV =
D

Sustitución en integrales triples

Para cambiar variables en una integral triple, consideremos

x = x(u, v, w), y = y(u, v, w), z = z(u, v, w)

126
como una transformación T uno a uno de la región E en el espacio uvw a la región D en el
espacio xyz. Adicionalmente, el Jacobiano de T esta dado por

x
u xv xw

∂(x, y, v)
JT (u, v, w) = = yu yv yw
∂(u, v, w)
zu zv zw

Teorema 47. Si x = x(u, v, w), y = y(u, v, w), z = z(u, v, w) es una transformación que
mapea una región E en el espacio uvw hacia una región D en el espacio xyz y f es una
función continua sobre E, entonces
˚ ˚  
f (x, y, z)dV = f x(u, v, w), y(u, v, w), z(u, v, w) |J(u, v, w)|dV ′
D E

127
Cuatro

Calculo Vectorial

Hasta este punto en nuestro estudio del cálculo, hemos encontrado tres tipos de integrales:
la integral definida, la integral doble y la integral triple. En este capı́tulo se presentan dos
nuevos tipos de integrales: las integrales de lı́nea y las integrales de superficie.
Suponga que C es una curva parametrizada por x = x(y), y = y(t) a ≤ t ≤ b, y que
A = (x(a), y(a)) y B(x(a), y(a)) son los puntos inicial y terminal,respectivamente. Afirmamos
que:

1. C es una curva suave si x′ (t) y y ′ (t) son continuas sobre el intervalo cerrado [a, b] y
no son simultáneamente cero sobre el intervalo abierto (a, b)
2. C es una curva suave por partes si consiste en un número finito de curvas suaves
c1 , C2 , . . . , Cn unidas extremo por extremo; esto es, C = C1 ∪ C2 ∪ · · · ∪ Cn .
3. C es una curva cerrada si A = B.
4. C es una curva simple si no se cruza a sı́ misma entre A y B.
5. C es una curva cerrada simple si A = B y la curva no se cruza a sı́ misma.
6. Si C no es una curva cerrada, entonces la orientación impuesta sobre C es la dirección
que corresponde a los valores crecientes de t.
7. Esta misma terminologı́a lleva de manera natural a las curvas en espacio tridimensional
C(t) = (x(y), y(t), z(t))

Integrales de Linea en el Plano: Sea z = f (x, y) una función definida en alguna


 región
bidimensional que contiene a la curva suave C definida por C(t) = x(t), y(t) , a ≤ t ≤ b.
Los siguientes pasos conducen a las definiciones de tres integrales de lı́nea en el plano.
1. Sea
a = t 0 < t1 < t2 < · · · < tn = b
una partición del intervalo [a, b]
2. Considere que los puntos correspondientes sobre la curva C, o puntos de partición, son

A = P0 , P1 , P2 , . . . , Pn = B

3. Los puntos de partición Pk = (x(tk ), y(tk )) k = 0, 1, 2, . . . , n dividen a C en n subarcos de


longitudes ∆sk .
4. Considere que la proyección de cada subarco sobre los ejes x y y tienen longitudes ∆xk
y ∆yk respectivamente.

128
5. Sea kP k la longitud del subarco más largo.

6. Escoja un punto muestra (x∗k , yk∗ ) sobre cada subarco ∆sk como se ilustra en la FIG.

7. Observe que existe t∗k ∈ [tk−1 , tk ] tal que C(t∗k ) = (x∗k , yk∗ ).

8. Forme las sumas


n
X n
X n
X
f (x∗k , yk∗ )∆xk f (x∗k , yk∗ )∆yk , f (x∗k , yk∗ )∆sk
k=1 k=1 k=1

9. Tomamos el lı́mite de estas tres sumas cuando kP k → 0. Las integrales que resultan se
resumen a continuación.

Definition 48. Sea f una función de dos variables x y y definida en una región del plano
que contiene una curva suave C.

La integral de lı́nea de f con respecto a x a lo largo de C de A a B es


ˆ n
X
f (x, y)dx = lı́m f (x∗k , yk∗ )∆xk
C kP k→0
k=1

La integral de lı́nea de f con respecto a y a lo largo de C de A a B es


ˆ n
X
f (x, y)dy = lı́m f (x∗k , yk∗ )∆yk
C kP k→0
k=1

La integral de lı́nea de f con respecto a la longitud de arco s lo largo de C de


A a B es ˆ n
X
f (x, y)ds = lı́m f (x∗k , yk∗ )∆sk
C kP k→0
k=1

Interpretación Geométrica

1. El producto f (x∗k , yk∗ )∆sk es el área de un rectángulo vertical de altura f (x∗k , yk∗ ) y
ancho ∆sk .
ˆ
2. La integral f (x, y)ds representa entonces el área de un lado de una “cortina” que
C
se extiende a partir de la curva C en el plano xy hacia arriba de la gráfica de f (x, y)
y que corresponde a los puntos (x, y) sobre C.

Como Evaluar integrales de linea La idea básica es convertir la integral de lı́nea en una
integral definida de una sola variable. Para ello nos enfocaremos en como esta definida la
curva C (paramétricamente o ecuacion explı́cita).

Integrales de lı́nea en el plano

Si C es una curva suave parametrizada por C(t) = (x(t), y(t)), a ≤ t ≤ b entonces


dx = x′ (t)dt y dy = y ′ (t)dt, y por ello tenemos,
ˆ ˆ b ˆ ˆ b
f (x, y)dx = f (x(t), y(t))x′ (t)dt, f (x, y)dy = f (x(t), y(t))y ′ (t)dt
C a C a

129
p
Además, recordando el hecho de que ds = dx2 + dy 2 y que C está parametrizada, encon-
tramos que p p
ds = (x′ (t)dt)2 + (y ′ (t)dt)2 = x′ (t)2 + y ′ (t)2 dt
Por consiguiente, podemos concluir que
ˆ ˆ b p ˆ b
f (x, y)ds = f (x(t), y(t)) x′ (t)2 + y ′ (t)2 dt = f (C(t))kC ′ (t)kdt,
C a a

OBS: Si Si f (x1 , . . . , xn ) = 1, la integral de lı́nea proporciona la longitud de arco de la curva


C. Esto es,
ˆ ˆ b ˆ bq
L(C) := 1ds = kC ′ (t)kdt = x′1 (t)2 + · · · + x′n (t)2 dt
C a a

Curva “Ingeniero” Si la curva C está definida por una función explı́cita y = g(x),
a ≤ x ≤ b (ó x = h(y), c ≤ y ≤ d) es posible utilizar x ó (y) como un parámetro. Luego las
integrales de lı́nea son mas fáciles
ˆ ˆ ˆ
f (x, y)dx = , f (x, y)dy = , f (x, y)ds =
Cx Cx Cx
ˆ ˆ ˆ
f (x, y)dx = , f (x, y)dy = , f (x, y)ds =
Cy Cy Cy

Una integral de lı́nea a lo largo de una curva C suave por partes se define como la suma
de las integrales sobre las distintas curvas suaves cuya unión compone a C.
ˆ ˆ ˆ
f (x, y)ds = f (x, y)ds + f (x, y)ds
C C1 C2

Integrales de lı́nea en el espacio Suponga que C es una curva suave en espacio


tridimensional definida por las ecuaciones paramétricas C(t) = (x(t), y(t), z(t)), a ≤ t ≤ b.
Si f es una función de tres variables definida en alguna región del espacio tridimensional que
contiene a C, podemos definir cuatro integrales de lı́nea a lo largo de la curva:
ˆ ˆ b ˆ ˆ b

f (x, y, z)dx = f (x(t), y(t), z(t))x (t)dt, f (x, y, z)dy = f (x(t), y(t), z(t))y ′ (t)dt
C a C a
ˆ ˆ b ˆ ˆ b p
f (x, y, z)dx = f (x(t), y(t), z(t))z ′ (t)dt, f (x, y, z)ds = f (x(t), y(t), z(t)) x′ (t)2 + y ′ (t)2 + z ′ (t)2 dt
C a C a
En el espacio tridimensional a menudo estamos interesados en integrales de lı́nea de la forma
de una suma: ˆ ˆ ˆ
P (x, y, z)dx + Q(x, y, z)dy + R(x, y, z)dz
C C C

NOTA:

1. Es importante advertir que una integral de lı́nea es independiente de la parametrización


de la curva C siempre que a C se le dé la misma orientación por medio de todos los
conjuntos de ecuaciones paramétricas que definen la curva.
2. Recuerde que la dirección positiva de una curva parametrizada C corresponde a valores
crecientes del parámetro t.

3. El sı́mbolo −C denota la curva que tiene los mismos puntos pero la orientación opuesta
de C.
ˆ ˆ
P dx + Qdy = − P dx + Qdy
−C C

130
Ejemplo 164. Sea C una curva que da vuelta alrededor ˆ de la circunferencia x2 + y 2 = 1 en
sentido contrario a las manecillas del reloj. Calcule 1 + xds
C

Solución. La parametrización del cı́rculo unitario C: x2 + y 2 = 1 está dada por

Entonces, C(t) = y C ′ (t) = .


ˆ
(1 + x)ds =
C


ˆ
Ejemplo 165. Calcule xy 2 zds donde C es la curva intersección de las superficies x2 +
C
y 2 + z 2 = 16 y x2 + y 2 = 4 en el primer octante.

Solución. La intersección de las superficies en el primer octante, es la curva



C: y z=2 3

Entonces, C(t) = y C ′ (t) = y kC ′ (t)k = . Por


tanto,

ˆ
xy 2 zds =
C

4.0.4. Campos vectoriales

Un campo vectorial sobre una región T en el espacio es una función de variable vectorial
F que asocia con cada punto (x, y, z) de T un vector

F(x, y, z) = P (x, y, z)i + Q(x, y, z)j + R(x, y, z)k := (P, Q, R)

Observe que las componentes P , Q y R de una función vectorial son funciones escalares
(de variable real). Un campo vectorial en el plano es similar, excepto que no se involucran
componentes z ni coordenadas z. Ası́, un campo vectorial en la región plana R es una función
F de variable vectorial que asocia un vector a cada punto (x, y) de R

F(x, y) = P (x, y)i + Q(x, y)j := (P, Q).

Es útil visualizar un campo vectorial F dado. Una forma común de hacerlo es dibujando
un conjunto de vectores comunes F (x, y), cada uno de los cuales está representado por una
flecha de longitud kF (x, y)k y se localiza con (x, y) como su punto inicial.

131
Ejemplo 166. Describa el campo vectorial F(x, y) = xi + yj.

Solución. Para cada punto (x, y) en el plano coordenado, F(x, y) = (x, y) es decir, es sim-
plemente su vector de posición r. Apunta directamente hacia afuera del origen y tiene una
longitud de p
kF (x, y)k = kxi + yjk = x2 + y 2 = r,
igual a la distancia desde el origen (x, y). ∆

OBSERVACIÓN: Entre los campos vectoriales más importantes debido a sus aplicaciones,
se hallan los campos vectoriales de velocidad. Imagine el flujo estable de un fluido, como el
agua de un rı́o o el viento solar. Por flujo estable queremos decir que el vector de velocidad
v(x, y, z) del fluido que pasa a través de cada punto (x, y, z) es independiente del tiempo
(aunque no necesariamente independiente de x, y y z), por lo que el patrón del flujo permanece
constante. Por lo tanto, v(x, y, z) es el campo vectorial de la velocidad del movimiento del
fluido.
Ejemplo 167. Suponga que el plano horizontal xy está cubierto por una lámina delgada
de agua en movimiento giratorio (como en un remolino) alrededor del origen con velocidad
angular constante de ω radianes por segundo en dirección contraria a la del movimiento de
las manecillas del reloj. Describa el campo vectorial de la velocidad asociado.

Solución. En este caso se tiene un campo vectorial de dos dimensiones v(x, y). El agua se
mueve en cadap punto (x, y) con velocidad v = rω y en forma tangencial a la circunferencia
de radio r = x2 + y 2 . El campo vectorial

v(x, y) = ω(−yi + xj)

tiene longitud rω y apunta de manera general en dirección contra el movimiento de las


manecillas del reloj, y
v · r = ω(−yi + xj) · (xi + yj) = 0
por lo que v es tangente a la circunferencia mencionada. ∆
OBSERVACIÓN: En las aplicaciones fı́sicas tienen igual importancia los campos de fuerza.
Suponga que ciertas circunstancias (quizá de carácter gravitacional o eléctrico) ocasionan que
una fuerza F(x, y, z) actúe sobre una partı́cula cuando está situada en el punto (x, y, z). Ası́,
se tiene un campo de fuerzas F .

Ejemplo 168. Suponga que una masa M está fija en el origen en el espacio. Cuando una
partı́cula de masa unitaria se coloca en el punto (x, y, z) distinto del origen, está sujeta a
una fuerza F(x, y, z) de atracción gravitacional dirigida hacia la masa M en el origen. De
2
acuerdo con pla ley de Newton del inverso del cuadrado, la magnitud de F es F = M G/r ,
donde r = x2 + y 2 + z 2 es la longitud del vector de posición r = xi + yı + zk. Se sigue, de
inmediato, que
kr
F(x, y, z) = − 3
r
donde k = M G. Observe que F(x, y, z) no está definido en el origen y que |F | → +∞ cuando
r → 0+ .

132
El campo vectorial gradiente

El vector gradiente de la función derivable de variable real f (x, y, z). El vector ∇f se


define como sigue:
∂f ∂f ∂f
∇f = i+ j+ k := grad f
∂x ∂y ∂z

recordemos que el vector ∇f (x, y, z) apunta en la dirección en la que se obtiene la máxima


derivada direccional de f en (x, y, z). Por ejemplo, si f (x, y, z) es la temperatura en el punto
(x, y, z) en el espacio, entonces hay que moverse en la dirección ∇f (x, y, z) a fin de calentarse
lo más rápido.
En el caso de una función de dos variables, f (x, y), se suprime la tercera componente de la
ecuación, por lo que ∇f = (fx , fy ) = fx i + fy j define un campo vectorial plano.

Ejemplo 169. Con f (x, y) = x2 − y 2 , el campo vectorial gradiente ∇f = 2x


i − 2yj, recuerde las curvas de nivel, cerca de un punto silla

Ejemplo 170. Dadas las funciones derivables f (x, y, z) y g(x, y, z), demuestre que

∇(f g) = f ∇g + g∇f

Solución. Aplicamos la definición del gradiente y la regla del producto para la derivación
parcial. encontramos que,

∇(f g) =

Integrales de lı́nea y campos vectoriales

Ahora suponga que F = P i+Qj+Rk es un campo de fuerza definido sobre una región que
contiene a la curva C del punto A al B. También suponga que C tiene una parametrización

r(t) = x(t)i + y(t)j + z(t)k, t ∈ [a, b]


con un vector de velocidad diferente de cero

v = C ′ (t) = x′ (t)i + y ′ (t)j + z ′ (t)k,

La velocidad asociada con este vector de velocidad es


p
v = kvk = (x′ )2 + (y ′ )2 + (z ′ )2

recuerde que el vector unitario tangente a la curva C es


v 1 ′ 
T= = x (t)i + y ′ (t)j + z ′ (t)k
kvk v

Queremos aproximar el trabajo W realizado por el campo de fuerzas F cuando una partı́cula
se mueve a lo largo de la curva C, de A a B.

133
1. Subdivida C.

2. Piense que F mueve la partı́cula de Pi−1 a Pi , dos puntos consecutivos de la división


de C.

3. El trabajo ∆Wi realizado por F sobre el subarco i-ésimo es aproximadamente


 
∆Wi ≈ kFkkT k cos θ ∆si (4.1)
= F(x(t∗ ), y(t∗ ), z(t∗ )) · T(x(t∗ ), y(t∗ ), z(t∗ ))∆si (4.2)

4. Por lo que el trabajo total,


n
X
W ≈ F(x(t∗ ), y(t∗ ), z(t∗ )) · T(x(t∗ ), y(t∗ ), z(t∗ ))∆si
i=1

5. Esta aproximación sugiere que definamos el trabajo W como


ˆ
W = F · T ds
C

6. Ası́, el trabajo es la integral respecto a la longitud de arco de la componente


tangencial de la fuerza.
OBSERVACIÓN: De manera intuitiva se considera dW = F · T ds como el elemento
infinitesimal de trabajo hecho por la componente tangencial F · T de la fuerza al mover
la partı́cula
ˆ a lo largo del elemento de longitud de arco ds. Entonces la integral de lı́nea
W = F · T ds es, entonces, la “suma”de todos estos elementos infinitesimales de trabajo.
C
Se acostumbra escribir

r = xi + yj + zk y dr = dxi + dyj + dzk


v v
De esta manera, T = = y ds = vdt (porque v = ds/dt). De ahı́ que
kvk v

v  dx dy dz 
Tds = · vdt = vdt = , , dt = dxi + dyj + dzk = dr
v dt dt dt
Por lo que,
Tds = dr
Con esta notación, tenemos que
ˆ ˆ
W = F · T ds = F · dr
C C

que es común en los textos de ingenierı́a y fı́sica.


ˆ ˆ
OBSERVACIÓN Para evaluar la integral de lı́nea F · T ds = F · dr, se expresa su
C C
integrando y lı́mites de integración en términos del parámetro t, como es habitual. Ası́,
ˆ
W = F · T ds
C
b
1  dx dy dz 
ˆ
= (P i + Qj + Rk) · i+ j + k vdt
a v dt dt dt
b
dx dy dz
ˆ
= (P +Q + R )dt
a dt dt dt

134
Por lo tanto ˆ
W = P dx + Qdy + Rdz
C
Este cálculo revela una relación importante entre los dos tipos de integrales de lı́nea que se
han definido aquı́.
Teorema 49. Suponga que el campo vectorial F = P i+Qj+Rk tiene funciones componentes
continuas y que T es el vector unitario tangente a la curva suave C. Por lo cual
ˆ ˆ ˆ
W = F · Tds = P dx + Qdy + Rdz = F · dr (4.3)
C C C

OBSERVACIÓN Si la orientación de la curva ´ C se invierte,


´ el signo de la integral
del lado derecho de la ecuación (4.3) cambia pues −C = − C , mientras que el signo de la
integral del lado izquierdo cambia porque T es reemplazada por −T.
Ejemplo 171. El trabajo efectuado por el campo de fuerzas F = yi + zj + xk al mover una
partı́cula de (0, 0, 0) a (1, 1, 1) a lo largo del cubo deformado x = t, y = t2 , z = t3 ,

Solución. No es difı́cil ver que dx = dt, dy = 2tdt, y dz = 3t2 dt, la sustitución en términos
de t produce
ˆ ˆ ˆ ˆ 1
W = F · dr =F · Tds = ydx + zdy + xdz = ∆
C C C 0
ˆ
Ejemplo 172. Evalúe xydx + x2 dy, donde C está dada por y = x3 . −1 ≤ x ≤ 2.
C

Solución. Como la curva C es una curva función en x entonces usaremos a x como el paráme-
tro. Luego
ˆ
xydx + x2 dy =
C


ˆ
Ejemplo 173. Evalúe y 2 dx − x2 dy, sobre la curva cerrada C que se muestra en la fig 1.
C
´ ´ ´ ´
Solución. Como la curva C es suave por partes, simbólicamente, escribimos C = C1 + C2 + C3
donde C1 , C2 y C3 son las curvas, y = 0, x = 2 y y = x2 respectivamente.

En C1 , usamos x como parámetro, luego


ˆ
y 2 dx − x2 dy =
C
En C2 , usamos y como parámetro, luego
ˆ
y 2 dx − x2 dy =
C
En C3 , usamos x como parámetro, luego
ˆ
y 2 dx − x2 dy =
C

135

ˆ
Ejemplo 174. Evalúe ydx + xdy + zdz, donde C es la hélice x = 2 cos t, y = 2 sen t, z = t
C
0 ≤ t ≤ 2π.

Solución. No es difı́cil ver dx = −2 sen tdt, dy = 2 cos tdt y dz = dt. Luego,


ˆ
ydx + xdy + zdz =
C

ˆ
Ejemplo 175. Evalúe F · dr donde F(x, y) = xyi + y 2 j y C está definida por la función
C
vectorial r(t) = e−t ı + et j, −1 ≤ t ≤ 1.
ˆ ˆ
Solución. Recordemos que F · dr = F(r(t)) · r′ (t)dt, Ahora observemos que
C C

F(r(t) = r′ (t)dt =

ˆ ˆ
Luego, F · dr = F(r(t)) · r′ (t)dt =
C C

Rotacional y Divergencia

Hemos visto que si un campo vectorial de fuerza F es conservativo, entonces puede escri-
birse como el gradiente de una función potencial φ:
∂φ ∂φ ∂φ
F = ∇φ = i+ j+ k.
∂x ∂y ∂x
El operador diferencial vectorial, u operador nabla
∂ ∂ ∂
∇=i +j +k
∂x ∂x ∂x
combinarse con un campo vectorial

F(x, y, z) = P (x, y, z)i + Q(x, y, z)j + R(x, y, z)k

de dos modos diferentes: en un caso produciendo otro campo vectorial llamado Rotacional
de F y en el otro caso produciendo una función escalar llamada la Divergencia de F.
Definition 50 (Rotacional de un campo vectorial).
El rotacional de un campo vectorial F = P i + Qj + Rk es el campo vectorial
 ∂R ∂Q   ∂P ∂R   ∂Q ∂P 
rot F = − i+ − j+ − k
∂y ∂z ∂z ∂x ∂x ∂y

OBSERVACIÓN: NOOO es necesario memorizar los complicados componentes del campo ro-
tacional de F, basta con interpretar el rotacional F como el producto cruz de ∇ y el vector

136
F: Es decir,
i j k

∂ ∂ ∂
rot F = ∇ × F =

∂x ∂y ∂z



P Q R

Ejemplo 176. Si F = (x2 y 3 − z 4 )i + 4x5 y 2 zj − y 4 z 6 k encuentre el rotacional F,

Solución.

Teorema 51 (Conceptos Equivalentes).


Suponga que F = P i+Qj+Rk es un campo vectorial donde P , Q y R son continuas y tienen
primeras derivadas parciales continuas en alguna región abierta del espacio tridimensional.
El campo vectorial F es conservativo si y sólo si rot F = 0.

La palabra rotacional se entiende con facilidad en conexión con el flujo de fluidos.


Por ejemplo, si consideremos un dispositivo de palas, (ver figura) en el cual se inserta en
un fluido que fluye, entonces el rotacional del campo de velocidades F es una medida de la
tendencia del fluido a girar el dispositivo en torno a su eje vertical w.
Si rot F = 0, entonces el flujo del fluido se dice que será irrotacional , lo cual significa
que no tiene vórtices o remolinos que podrı́an causar el giro de la pala, el eje w de la pala
apunta directamente hacia fuera de la página.

Divergencia Si F(x, y, z) = P (x, y, z)i + Q(x, y, z)j + R(x, y, z)k representa el campo de
velocidades de un fluido, entonces sabemos que el flujo F a través del área ∆S, es aproxima-
damente

(compn F)∆S = (F · n)∆S,

donde n es un vector normal unitario a la superficie.

137
Calculemos el flujo total de F a través de sus seis lados de un paralelepı́pedo rectangular
en la dirección hacia fuera,
Calculamos primero el flujo total hacia el exterior de dos caras paralelas.
El área de la cara F1 es ∆x∆z, y la normal unitaria hacia fuera es −j, luego el flujo de F a
través de F1 es
(F · (−j))∆x∆z = −Q(x, y, z)∆x∆z
El flujo hacia fuera de la cara F2 , cuya normal hacia fuera es j, está dado por

(F · (j))∆x∆z = Q(x, y + ∆y, z)∆x∆z

El flujo total hacia fuera de estas caras paralelas es

Q(x, y + ∆y, z)∆x∆z + (−Q(x, y, z)∆x∆z) = [Q(x, y + ∆y, z) − Q(x, y, z)]∆x∆z.


[Q(x, y + ∆y, z) − Q(x, y, z)]∆x∆y∆z
=
∆y
∂Q
≈ ∆x∆y∆z
∂y

De manera análoga, vemos que las contribuciones al flujo total hacia fuera del para-
lelepı́pedo desde las dos caras paralelas al plano yz, y desde las dos caras paralelas al
plano xy, originan
∂P ∂R
∆x∆y∆z ∆x∆y∆z
∂x ∂z

Al sumar estos resultados, vemos que el flujo total de F hacia fuera del paralelepı́pedo
es aproximadamente
 ∂P ∂Q ∂R 
+ + ∆x∆y∆z
∂x ∂y ∂z
Dividiendo la última expresión entre ∆x∆y∆z obtenemos el flujo hacia fuera de F por
unidad de volumen:
∂P ∂Q ∂R
+ +
∂x ∂y ∂z
Esta combinación de derivadas parciales es una función escalar y recibe el nombre
especial de divergencia de F.

Definition 52 (Divergencia).
La divergencia de un campo vectorial F = P i + Qj + Rk es la función escalar
∂P ∂Q ∂R
divF = + +
∂x ∂y ∂z

OBS: La función escalar divF también puede escribirse en términos del operador ∇ como
un producto punto:
∂ ∂ ∂
divF = ∇ · F = P (x, y, z) + Q(x, y, z) + R(x, y, z)
∂x ∂y ∂z

138
la divergencia de un campo de velocidades F cerca de un punto P (x, y, z) es el flujo por
unidad de volumen.
Si divF > 0 se dice que P es una fuente para F, ya que hay un flujo neto hacia fuera del
fluido cerca de P .
Si divF > 0, se afirma entonces que P es un sumidero para F, puesto que hay un flujo
neto hacia dentro del fluido cerca de P .
Si divF = 0 no hay fuentes o sumideros cerca de P .
El producto punto de ∇ consigo mismo obtenemos un importante operador diferencial escalar
de segundo orden llamado Laplaciano:

∂2 ∂2 ∂2
∇2 = ∇ · ∇ = + +
∂x2 ∂y 2 ∂z 2

Cuando este operador actua sobre una función escalar f (x, y, z) el resultado se denomina
laplaciano tridimensional,
∂2f ∂2f ∂2f
∇2 f = + +
∂x2 ∂y 2 ∂z 2
y aparece en matemáticas aplicadas en muchas ecuaciones diferenciales parciales. Una
de las ecuaciones diferenciales parciales más famosas,
∂2f ∂2f ∂2f
+ + =0
∂x2 ∂y 2 ∂z 2
recibe el nombre de ecuación de Laplace en tres dimensiones.

Ejemplo 177. Si F = xz 2 i + 2xy 2 zj − 5yzk encuentre div F.

Solución.

div F = ∇ · F =
=

APENDICE

Funciones Vectoriales
Definition 53. Una función f : I ⊂ R → Rn cuya regla de correspondencia es
 
f (t) = f1 (t), f2 (t), . . . , fn (t)

se denomina función vectorial de una variable real t.

1. El nombre de función vectorial viene dado porque, f asigna a cada t ∈ I un vector en


el espacio Rn .
2. Las n funciones reales fi , (i = 1, 2, . . . , n) se llaman funciones componentes de la función
vectorial f .
3. El dominio de la función vectorial f es el conjunto

Dom(f ) = Dom( f1 ) ∩ Dom(f2 ) ∩ . . . ∩ Dom(fn )

139
4. Si esta regla de correspondencia la escribimos en la forma
x1 = f1 (t), x2 = f2 (t), ··· xn = fn (t), t ∈ I. (4.4)
Los puntos (x1 , . . . , xn ) = (f1 (t), . . . , fn (t)), t ∈ I forman la curva C paramétrizada en
el espacio Rn , y describen normalmente la trayectoria de una particula,
5. A las ecuaciones xi = fi (t) se llaman ecuaciones paramétricas de una curva C. Si en las
ecuaciones paramétricas xi = f (t) de la curva C se elimina el parámetro t, logramos
encontrar las ecuaciones cartesianas de la curva (similar a las ecuación simétricas
de una recta)
6. Si f : I → Rn es una función vectorial tal que f (t) = (f1 (t), . . . , fn (t)) entonces f (t) es
el vector de posición del punto P (f1 (t); f2 (t), . . . , fn (t)) en la curva C. El extremo del
vector de posición f (t) traza la trayectoria de la curva C e indica su orientación.

Ejemplo 178. Trace la imagen de las siguientes funciones h(t) = (t, t, t2 )

Solución. Las ecuaciones paramétricas de la curva descrita por la función vectorial h es


x = t, y=t z = t2
Al eliminar el parámetro t en las ecuaciones paramétricas, se obtiene que los puntos de la
curva h están situados en la intersección de las supeficies
y = x, z = x2

Una curva C en el espacio tridimensional R3 , se paramétriza mediante tres ecuaciones

x = f (t) y = g(t) z = h(t)

como también puede representarse en forma vectorial, es decir, El vector

r(t) = f (t)i + g(t)j + h(t)k = (f (t), g(t), h(t))

representa la posición de la partı́cula en el instante t. De ahı́ que recibe el nombre de vector


posición de la partı́cula.

Las funciones f , g y h son las funciones componentes del vector de posición r. Consideremos
la trayectoria de la partı́cula como la curva descrita por r durante el intervalo de tiempo I.
la curva.

140
Una función de la forma
r(t) = f (t)i + g(t)j
representa un curva el plano. Mientras que un funcion vectorial de la forma

r(t) = f (t)i + g(t)j + h(t)k

representa una curva en el espacio, donde las funciones componentes f , g y h son funciones
del parámetro t. Vease figura
Ejemplo 179. Grafique la función vectorial r(t) = cos ti + sin tj + tk

SOL: No es difı́cil ver que las ecuaciones de las coordenadas son

x = cos t, y = sen t, z=t

Como x2 + y 2 = 1 entonces afirmamos que la curva esta sobre un cilindro circular, pero la
curva “sube” cuando el componente en k, z = k aumenta. Adicionalmente, Cada vez que t
aumenta en 2π, la curva completa una vuelta, “solo” en en el plano xy. De manera que la
trayectoria de esta curva es una Hélice

La curva en el ejemplo anterior es una de tipos de curvas espaciales conocidas como curvas
helicoidales. En general, una función vectorial de la forma

r(t) = a cos(kt)i + a sen(kt)j + ctk

describe una hélice circular . El número 2πc/k recibe el nombre de “horquilla” de una
hélice, (es la separación vertical de los lazos de la hélice). Una hélice circular es sólo un caso
especial de la función vectorial

r(t) = a cos(kt)i + b sen(kt)j + ctk

que describe una hélice elı́ptica cuando a 6= b. La curva definida por

r(t) = at cos(kt)i + bt sen(kt)j + ctk

141
se denomina hélice cónica. Por último, una curva dada por
r(t) = a sin(kt) cos(t)i + a sin(kt) sin(t)j + a cos(kt)k
se llama hélice esférica.En estas ecuaciones se supone que a, b, c y k son constantes posi-
tivas.
Ejemplo 180. Encuentre una función vectorial para el segmento de recta del punto P0 (3, 2, 1)
al punto P1 (1, 4, 5).

SOL: No es dificil ver que los vectores de posición correspondientes a los puntos dados
son r0 = (3, 2 − 1) y r1 = (1, 4, 5). Entonces, una función vectorial para el segmento de recta
es:

Ejemplo 181. Grafique la curva trazada por la función vectorial r(t) = 2 cos ti+ 2 sen tj + 3k

SOL: Las ecuaciones paramétricas de la curva son las componentes de la función vectorial
son
x = 2 cos t, y = 2 sen t, z=3
.

Ejemplo 182. Determine la función vectorial que describe la curva C de intersección del
plano y = 2x y el paraboloide z = 9 − x2 − y 2

SOL: Primero parametrizamos la curva C de intersección haciendo, x = t, de donde se


deduce que y = 2t y z = 9 − t2 − (2t)2 = 9 − 5t2 . Por tanto las ecuaciones paramétricas son

x = t, y = 2t, z = 9 − 5t2 ,

y por tanto una función vectorial que describe el trazo del paraboloide en el plano y = 2x
está dada por
r(t) = ti + 2tj + (9 − 5t2 )k.

Ejemplo 183. Encuentre la función vectorial que describe la curva C de intersección de los
cilindros y = x2 y z = x3

SOL: En R2 , y = x2 es una parábola en el plano xy y por tanto en R3 es un cilindro


parabólico cuya generatriz es paralela al eje z. Por otro lado, z = x3 es un cilindro cúbico
cuya generatriz es paralelo al eje y.
Ahora, la opción más natural para parametrizar es usar a x = t entonces y = t2 y z = t3 .
Por tanto, una función vectorial que describe a la curva C generada por intersección de los
dos cilindros es entonces
r(r) = ti + t2 j + t3 k

142
x2
Ejemplo 184. Dibujar la gráfica C representada por la intersección del semielipsoide 12 +
y2 z2 2
24 + = 1, z ≥ 0 y el cilindro parabólico y = x . Después, hallar una función vectorial
4
que represente la gráfica.

SOL: Una opción natural para el parámetro es: x = t, luego y = t2 . Entonces

z2 t2 t4 (6 + t2 )(4 − t2 )
=1− + = ,
4 12 24 24
Como la curva se encuentra sobre el plano xy, hay que elegir para z la raı́z cuadrada positiva.
Por tanto, la función vectorial resultante es:
r
2 (6 + t2 )(4 − t2 )
r(t) = ti + t j + k, −2 ≤ t ≤ 2
6
Muchas de las técnicas y definiciones utilizadas en el cálculo de funciones reales se pueden
aplicar a funciones vectoriales. Por ejemplo, las funciones vectoriales se pueden sumar y
restar, multiplicar por un escalar, tomar su lı́mite, derivarlas, integrarlas y ası́ sucesivamente.
La estrategia básica consiste en aprovechar la linealidad de las operaciones vectoriales y
extender las definiciones, componente por componente.

(f + g)(t) = f (t) + g(t), t ∈ Df ∩ Dg


(f − g)(t) = f (t) − g(t), t ∈ Df ∩ Dg
(φf )(t) = φ(t)f (t) = φ(t)(f1 (t), . . . , fn (t)), φ : R → R, t ∈ Dφ ∩ Df
Pn
(f · g)(t) = f (t) · g(t) = i=1 fi (t)gi (t), t ∈ Df ∩ Dg
3
(f × g)(t) = f (t) × g(t), f,g : R → R , t ∈ Dφ ∩ Df

Esta extensión, componente por componente, de las operaciones con funciones reales a
funciones vectoriales se ilustra más ampliamente en la definición siguiente del lı́mite de una
función vectorial.

143
Si r(t) tiende al vector L cuando t → a, la longitud del vector r(t) − L tiende a 0. Es
decir,
kr(t) − Lk → 0 Cuando t→a

Ejemplo 185. Calcule lı́m f (t) (en caso exista) de las siguientes funciones vectoriales
t→t0

√ !
1− t+1 t
1. f (t) = , , 2 , para t0 = 0 R/ (0, 0, 2)
t+2 t+1

!
et − e ln t sen(t − 1)
2. f (t) = , , , para t0 = 1 R/ (e, −1, 1)
t−1 1−t t−1

!
1 − cos(sen t) cos t − cos(sen t) 1
3. f (t) = , , , para t0 = 0 R/ ( 12 , 0, π1 )
sen2 t t2 t−π

√ √ !
tan( π sen( 5 t − 1) t−1
4. f (t) = (2 − t) 2 t) , √ , , para t0 = 1 R/ (e2/π , 1, 12 )
tan( 5 t − 1) t − 1

La definición siguiente extiende la noción de continuidad a funciones vectoriales.


Definition 54. una función vectorial f es continua en el numero a si

f (a) esta definido lı́m f (t) existe lı́m f (t) = f (a)


t→a t→a

De acuerdo con esta definición, una función vectorial


 
f (t) = f1 (t), f2 (t)), . . . , fn (t)

es continua en t = a si y sólo si las funciones componentes fi , son continuas en t = a.


!
t2 − 1 sen(πt) ln t + 1
Ejemplo 186. 1. Dada la función vectorial f (t) = , , Determi-
t + 1 cos(πt) t + 2
ne si la función vectorial es continua en t = 1. R/: SI

144
!
sen t ln(1 + t) cos t − 1
2. Dada la función vectorial f (t) = , , Determine si la función
t 1−t t
vectorial es continua en t = 0. R/: NO

La definición de la derivada de una función vectorial es paralela a la dada para funciones


reales.
Definition 55. La derivada de una función vectorial f es

f (t + h) − f (t)
f ′ (t) = lı́m
t→a h
para todo t para el cual existe el lı́mite.

Si f ′ (t) existe, entonces f es derivable en t.


Si f ′ (t) existe para toda t en un intervalo abierto I, entonces f es derivable en I.
La derivabilidad de funciones vectoriales puede extenderse a intervalos cerrados consi-
derando lı́mites unilaterales.

NOTA: Además de la notación f ′ (t) otras notaciones para la derivada de una función
vectorial son
d df
Dt [f (t)], [f (t)],
dt dt
Velocidad y aceleracı́on
Si una partı́cula se mueve a lo largo de una curva C en el espacio Rn , de modo que su
vector posición en el tiempo t es f (t) = (f1 (t), f2 (t), . . . , fn (t)) entonces, el vector velocidad
v(t) y el vector aceleración a(t) de la partı́cula en el instante t son dadas por
 
v(t) = f ′ (t) = f1′ (t), f2′ (t), . . . , fn′ (t)
 
a(t) = v′ (t) = f ′′ (t) = f1′′ (t), f2′′ (t), . . . , fn′′ (t)

El vector velocidad v(t) tiene la dirección del vector tangente a la curva C en el punto f (t)
y el vector aceleración a(t) apunta hacia el lado cóncavo de la curva C (lado hacia donde se
doble la curva).

145
Reglas de Derivación de funciones vectoriales: Sean f , g : I → Rn funciones
vectoriales derivables de t, c una constante real y α : I → R una función real derivable
de t. Entonces se tiene:

1. [f ± g]′ (t) = f ′ (t) ± g′ (t)

2. [cf (t)]′ = cf ′ (t)

3. [α(t)f (t)] = α′ (t)f (t) + α(t)f ′ (t)

4. [f (t) · g(t)]′ = f ′ (t) · g(t) + f (t) · g′ (t)

5. [f (t) × g(t)]′ = f ′ (t) × g(t) + f (t) × g′ (t), (válido solo en R3 )


f (t) · f ′ (t)
6. kf (t)k′ = si f (t) 6= 0)
kf (t)k

El módulo del vector velocidad v(t), esto es,


q
kv(t)k = kf ′ (t)k = [f1′ (t)]2 + [f2′ (t)]2 + · · · + [fn′ (t)]2 (4.5)

es la rapidez de la partı́cula en el instante t. Si una partı́cula se mueve con una rapidez


constante c, entonces su vector de aceleración es perpendicular al vector de velocidad v. En
efecto,
kvk = c, ⇒ kvk2 = c2 ⇒ v · v = c2
Diferenciamos ambos lados con respecto a t,

d dv
0= (v · v) = 2v · = 2v · a Entonces, v(t) · a(t) = 0 para todo t.
dt dt
Ejemplo 187. Si f (t) = (t, t2 ; 3 + t), g(t) = (cos t, sen t, ln(t + 1)) y α(t) = e−4t , calcule

(αf )′ (0) (f + g)′ (0) (f · g)′ (0) (f × g)′ (0)

146
Ejemplo 188. Considere la curva C dada por r(t) = cos(2t)i + sin(t)j, −π/2 ≤ t ≤ π/2.
Encuentre la derivada r′ (t) y grafique los vectores r′ (0) y r′ (π/6)

SOL: La curva C es suave Porque? R/:

r′ (t) = −2 sen(2t)i + cos tj

en concecuencia
√ 1√
r′ (0) = j, r′ (π/6) = − 3i + 3j
2
Como gráficamos la curva? R/:
Ejemplo 189. Encuentre las ecuaciones paramétricas de la recta tangente a la curva C
cuyas ecuaciones paramétricas son x = t2 , y = t2 − t, z = −7t en el punto correspondiente
a t = 3.

SOL: La función vectorial posición es r(t) = , y por tanto punto en


cuestion e r(3) = . Luego los vectores tangentes a C están dados por
r′ (0) = y r′ (3) =

De manera que las ecuaciones paramétricas de la recta tangente son

Integrales de funciones Vectoriales

Definition 56.
Si f : [a, b] → Rn es una función vectorial continua en el intervalo [a, b] tal que
f (t) = (f1 (t), f2 (t), . . . , fn (t)) entonces la integral indefinida de f es
ˆ ˆ ˆ ˆ !
f (t)dt = f1 (t)dt, f2 (t)dt, . . . , fn (t)dt

y la integral definida de f es
!
ˆ b ˆ b ˆ b ˆ b
f (t)dt = f1 (t)dt, f2 (t)dt, . . . , fn (t)dt
a a a a

 1 
Ejemplo 190. 1. Halle la integral indefinida de la función vectorial f (t) = cos t, , tet
1+t
1
1
ˆ
2. Calcule la integral f (t)dt, donde f (t) = (2t, , tet )
0 1+t

147
Teorema 57 (Teorema Fund. del Calculo). Sea f : [a, b] → Rn es una función
vectorial continua en [a, b] entonces
ˆ t
La función F definida por F(t) = f (u)du, a ≤ t ≤ b es derivable y F′ (t) =
a
f (t), ∀t ∈ [a, b]
ˆ b
f (u)du = F(b) − F(a),
a

ˆ π/4
Ejemplo 191. Calcule f (t)dt × h(0) , donde
0
r !
√ 4 3 21 3 2 t
f (t) = tan t sec t, sen (2t) cos t − sen (2t) sen t,
π π
y !
1 1 1
5 5 10
ˆ ˆ ˆ
t2 −1 2 3
h(t) = e dt, (t − t)dt, t dt , R:( ,− ,− )
−1 0 0 288 2 63

Curvas regulares

Definition 58.
Se dice que una curva C ⊂ Rn es una curva parametrizada, si existe una fun-
ción vectorial
 α : [a, b] → Rn tal que a α([a, b]) = C A la función vectorial
α(t) = α1 (t), α2 (t), . . . , αn (t) se llama parametrización de la curva C.

Ejemplo 192. la curva C : x2 + y 2 = 1 tiene como parametrización a la función vectorial


α : [0, 2π] → R2 definida por α(t) = (cos(t), sen(t))

 x x≤0
Ejemplo 193. Halle una parametrización para la curva C : y = f (x) =
 x2 x>0

Solución. : No es difı́cil ver la función vectorial α : R → R2 definida por



 (t, t) t≤0
α(t) =
2
 (t, t ) t>0

es una parametrización para la curva C. ∆


PROPIEDADES

148
1. Se dice que C es una curva con puntos dobles si α(t1 ) = α(t2 ), con t1 6= t2
2. Se dice que C es una curva simple si no tiene puntos dobles.
3. Se dice que C es una curva cerrada si α(a) = α(b)
4. Se dice que C es una curva regular, si la función vectorial α(t) tiene derivada continua
y a α′ (t) 6= 0 , ∀t ∈ [a, b]

Definition 59 (Reparametrización de una curva regular). Sea C ⊂ Rn una curva


regular, es decir, existe una función vectorial α : [a, b] → Rn tal que α([a, b]) = C
y α′ (t) 6= 0, ∀t ∈ [a, b]. Una reparametrización de α(t) es una función vectorial
γ = α ◦ ϕ : [c, d] → Rn tal que

γ(u) = (α ◦ ϕ)(u) = α(ϕ(u)), u ∈ [c, d]

donde ϕ : [c; d] → [a, b] es una función real derivable y sobreyectiva tal que ϕ′ (u) 6= 0,
∀u ∈ [c, d].

1. Si ϕ′ (t) > 0 se conserva la misma orientación en la curva reparametrizada.


2. Si ϕ′ (t) < 0 se invierte la orientación en la curva reparametrizada.
Ejemplo 194. Sea α : [0, 2π] → R2 una función vectorial dada por α(t) = (cos t, sen t)

1. Consideremos la función ϕ : [0, 1] → [0, 2π] definida por ϕ(u) = 2πu, entonces

γ(u) = (α ◦ ϕ(u)) = α(ϕ(u)) = (cos(2πu), sen(2πu))

es una reparametrización de la curva α(t). Com ϕ′ (u) = 2π > 0, entonces la curva γ(u)
mantiene la misma orientación de la curva α(t).
2. Consideremos la función φ : [0, 2π] → [0, 2π] definida por φ(u) = 2π − u entonces

γ(u) = (α ◦ φ(u)) = α(φ(u)) = (cos(2π − u), sen(2π − u))

149
es una reparametrización de α(t). Como φ′ (u) = −1 < 0, entonces la curva γ(u) invierte
la orientación de la curva α(t).

Definition 60 (Longitud de arco de una función regular). Sea α : [a, b] → Rn una


curva regular en [a, b], tal que

C : α(t) = (α1 (t), α2 (t), . . . , αn (t))

La longitud de arco de la curva medida desde t = a hasta t = b es


ˆ b ˆ b q

L(C) = kα (t)kdt = [α1′ (t)]2 , . . . , [αn′ (t)]2 dt
a a

La función longitud de arco de la curva α(t) es dada por


ˆ t
s(t) = l(t) = kα′ (u)kdu, t ∈ [a, b] (4.6)
a

Ejemplo 195. Halle la longitud de arco de las siguientes curvas



1. α(t) = (a cos t, a sen t, bt), desde t = 0 hasta t = 2π. R/ 2π a2 + b2

1 1
2. α(t) = (t, 1, t3 + ), desde t = 1 hasta t = 3. R/ 14
3
6 2t

150
Vectores unitarios: Tangente, Normal principal y Binormal

Definition 61 (Vector Tangente). Sea α : [a, b] → Rn una curva regular. El vector


tangente unitario denotado por T(t) en la dirección de α′ (t)está dado por

α′ (t)
T(t) =
kα′ (t)k

OBS: Como kTk = 1 entonces T(t) · T(t) = 1, luego al derivar esta expresión, se tiene

2T(t) · T′ (t) = 0 ⇔ T(t) · T′ (t) = 0

Ası́, T′ (t) es un vector perpendicular al vector tangente T(t), ∀t ∈ [a, b].

Definition 62 (Vector Normal Principal). Sea α : [a, b] → Rn una curva regular.


El vector unitario que tiene la misma dirección que T′ (t) (si T′ (t) 6= 0 se denomina
normal principal a la curva α : [a, b] → Rn en el punto α(t) y se denota por

T′ (t)
N(t) = siempre que kT′ (t)k 6= 0
kT′ (t)k

Como α : [a, b] → Rn es una curva regular, entonces la función longitud de arco de la


curva α(t) es
ˆ t
l(t) = kα′ (u)kdu La derivada de esta función real es l′ (t) = kα′ (t)k
a

α′ (t)
Luego, de la expresión del vector tangente unitario T(t) = kα′ (t)k , se tiene

α′ (t) = l′ (t)T(t) (4.7)

Esta ecuación indica que la dirección del vector velocidad α′ (t) es igual a la del vector
tangente unitario T(t) y la velocidad escalar o rapidez es dada por

l′ (t) = kα′ (t)k

Por tanto, si un objeto se mueve a lo largo de una curva C, el vector tangente unitario
T(t) apunta en la dirección del movimiento, mientras que el vector normal principal N(t)
es ortogonal a T(t) y señala la dirección hacia donde gira el objeto (lado cóncavo de la curva
C). Además kN (t)k = 1, ∀t ∈ [a, b].

OBS: Sea α : [a, b] → Rn una curva regular, tal que C = α([a, b]). Si α′ (t) es derivable en
[a, b], entonces al derivar la expresión (??) resulta

α′′ (t) = l′′ (t)T(t) + l′ (t)T′ (t) = l′′ (t)T(t) + l′ (t)kT′ (t)kN(t)

Luego, el vector aceleración a α′′ (t) es combinación lineal de los vectores tangente unitario
T(t) y normal principal N(t).

Definition 63 (Vector Binormal). Sea α : [a, b] → Rn una curva regular tal que
α′′ (t) 6= 0, ∀t ∈ [a, b]. El vector unitario dado por B(t) = T(t) × N(t) se denomina
vector binormal a la curva α : [a, b] → Rn en el punto α(t)

151
Los tres vectores unitarios T, N y B forman un conjunto de mano derecha de vectores
mutuamente ortogonales denominado triedro móvil.

El plano de T y N se denomina plano osculante. La ecuación cartesiana del plano


osculador es
PO : ((x, y, z) − (x0 , y0 , z0 )) · B(t0 ) = 0

El plano de N y B se dice que es el plano normal. La ecuación cartesiana del plano


normal prinicpla es

PN : ((x, y, z) − (x0 , y0 , z0 )) · T(t0 ) = 0

El plano de T y B es el plano de rectificación. La ecuación cartesiana del plano


osculador es
PR : ((x, y, z) − (x0 , y0 , z0 )) · N(t0 ) = 0

Los tres vectores unitarios mutuamente ortogonales T, N, B pueden considerarse como


un sistema de coordenadas de mano derecha móvil, ya que

B(t) = T(t) × N(t), N(t) = B(t) × T(t), T (t) = N(t) × B(t)

Este sistema de coordenadas móvil se conoce como marco TNB.

OBSERVACIÓN CASO R3 : Sea α : I → R3 una función vectorial cuyas funciones


coordenadas tienen derivadas continuas hasta el segundo orden. Las expresiones de T(t),
N(t) y B(t) en términos de la función α(t) y sus derivadas son

α′ α′ × α′′ [α′ × α′′ (t)] × α′


T= , B= , N=
kα′ k kα′ × α′′ k [α′ × α′′ (t)] × α′

Si B(t) = b (b vector constante) ∀t ∈ I, entonces la curva es plana. Ası́, la curva esta en el


plano osculador.
Ejemplo 196. Halle los vectores tangente unitario, normal principal y binormal de la espiral
cónica α(t) = et (cos t, sent, 1) en un punto arbitrario.

Ejemplo 197. Sea C la curva intersección entre las superficies

y = (x − 2)2 z = (x − 2)2

Halle la ecuación cartesiana del plano osculador a la curva C en los puntos (2, 0, 0), (3, 1, 1)
y (x0 , y0 , z0 ) R/: PO : y − z = 0, B(t) es const

152
Curvatura y torsión de una curva
Reparametrización por Longitud de arco
Teorema 64. Sea α : [a, b] → Rn una curva regular tal que α([a, b]) = C y la longitud
ˆ b
de arco de la curva desde t = a hasta t = b es L = kα′ (t)kdt Entonces, la función
a
longitud de arco l : [a, b] → [0, L] dada por
ˆ t
s = l(t) = kα′ (t)kdt
a

es continua y monótona creciente en el intervalo [a, b].

Definition 65. Una curva regular γ : [0, L] → Rn es parametrizada por la longitud


de arco s, si y solo si kγ ′ (s)k = 1 , ∀s ∈ [0, L]

Ejemplo 198. Sea α : [0, +∞) → R3 una curva regular definida por α(t) = (cos t, sen t, t).
Halle:

1. s = l(t) 2. ϕ(s) = l−1 (s) 3. γ(s) = α(ϕ(s)) 4. d) T(s)

Solución. Dado que α′ (t) = (− sen t, cos t, 1) entonces


ˆ t

ˆ tp √
1. s = l(t) = kα (u)kdu = sen2 u + cos2 u + 1 du = 2t. t≥0
0 0

2. Como s = l(t) = 2t, entonces la inversa de esta función es
s
ϕ(s) = l−1 (s) = √ , s≥0
2

3. La reparametrización de la curva regular α en función de la longitud de arco s es


!
s s s s
γ(s) = α(ϕ(s)) = α( √ ) = cos( √ ), sen( √ ), √
2 2 2 2
!
′ 1 s 1 s 1
4. Dado que γ (s) = − √ sen( √ ), √ cos( √ ), √ y kγ ′ (s)k = 1 Por consiguiente,
2 2 2 2 2
el vector tangente unitario T(s) es
!
γ ′ (s) 1 s 1 s 1
T(s) = ′ = γ ′ (s) = − √ sen( √ ), √ cos( √ ), √
kγ (s)k 2 2 2 2 2

153

 
Ejemplo 199. Dada la curva C : α(t) = t, ln(sec t), ln(sec t + tan t) , t ∈ [0, π4 ] Halle la
√ √
longitud de arco de C y reparametrice
! C en términos de longitud de arco. R: a) 2 ln( 2+1),
2s −1

e 2
parte del b) ϕ(s) = arc sen 2s +1

e 2

Definition 66 (Vector Curvatura).


Sea C una curva regular en el espacio R3 parametrizada por la longitud de arco, esto
es, existe γ : [0, L] → R3 tal que y γ([0, L]) = C. Sea T(s) = γ ′ (s) el vector tangente
dT
unitario a la curva en el punto γ(s). se denomina vector curvatura de la curva
ds
en el punto γ(s) y es dado por

dT(t) dT dt 1 T ′ (t)  kT ′ (t)k 


K(t) = = = T ′ (t) · ds = ′
= N(t) (4.8)
ds dt ds dt
kα (t)k kα′ (t)k

Luego, el vector curvatura K(t) tiene la misma dirección que el vector unitario normal
principal N(t) y es ortogonal al vector tangente unitario.

154
Definition 67 (Curvatura).
La función escalar que multiplica a N(t) en (??) se denomina curvatura de la curva
C en el punto α(t) y se denota por

kT ′ (t)k
k(t) =
kα′ (t)k

La curvatura k(t) es un número real que nos indica que tanto se tuerce (o se dobla)
la curvatura C en el punto α(t).

Ejemplo 200. Encuentre la curvatura de un cı́rculo de radio a.

Solución. Función vectorial de un circulo es α(t) = a cos ti + a sen tj.


luego α′ (t) = y kα′ (t)k = y

T(t) = T′ (t) =

Por consiguiente, la curvatura es

kT′ (t)k
k(t) = =
kr′ (t)k


Ejemplo 201. En el espacio tridimensional la posición de una partı́cula en movimiento
está dada por la función vectorial r(t) = 2 cos tı + 2sentj + 3tk. Encuentre los vectores T(t),
N(t) y B(t). Determine la curvatura κ(t).

Solución. Puesto que r′ (t) = , kr′ (t)k = . Luego encon-


tramos que
r′ (t)
T(t) =
kr′ (t)k
para hallar N necesitamos hallar

T′ (t) = kT′ (t)k = N(t) =

Ahora el binormal es

B(t) = T(t) × N(t) =

T′ (t)k
Por último encontramos la curvatura k(t) = = ∆
kr′ (t)k
OBSERVACIONES:

1. La curvatura de una recta es igual a cero.


1
2. La curvatura de una circunferencia de radio a es k(t) =
a
3. La curvatura de una curva plana en su punto de inflexión es igual a cero.

155
4. Si C : α : I → R3 es una curva regular, entonces la curvatura de la curva C en punto
α(t) en términos de sus derivadas es dado por
kα′ (t) × α′′ (t)k
k(t) = , solo en R3
kα′ (t)k3
Ejemplo 202. Sea C la curva de intersección del cilindro x2 + y 2 + 2(y − x) − 2 = 0 con el
plano x − y − 2z − 2 = 0 Determine la curvatura de C en el punto (3, −1, 1).

Solución. No es difı́cil ver que x2 + y 2 + 2(y − x) − 2 = 0, es igual a (x − 1)2 + (y + 1)2 = 4.


Luego, al parametrizar la curva se obtiene

C : α(t) = (1 + 2 cos t, 2 sen t − 1, cos t − sen t), α(0) = (3, −1, 1)

De donde resulta

α′ (t) = (−2 sen t, 2 cos t, − sen t − cos t), α′ (0) = (0, 2, −1)
α′′ (t) = (−2 cos t, −2 sen t, − cos t + sen t), α′′ (0) = (−2, 0, −1)
α (0) × α′′ (0) = (−2, 2, 4)

Por tanto, la curvatura de la curva C en el punto α(0) = (3, −1, 1) es



kα′ (0) × α′′ (0)k 2 6
k(0) = = √
kα′ (0)k3 5 5

 t2 √ 2
t 2 
Ejemplo 203. Sea la curva C : α(t) = + t, − t, ln t Halle la curvatura de la
2 2 2 √
curva 0 en el punto donde la curva corta al plano xy. R: k(1) = 2 9 2

Definition 68 (Radio de Curvatura).


Sea α : l → R3 una curva regular, y sea k(t) la curvatura de la curva C en el punto
α(t) donde k(t) 6= 0, ∀t ∈ I. El radio de curvatura de la curva C en el punto α(t) es
dado por
1
R(t) =
k(t)

1. A la circunferencia que tiene como radio R(t) se denomina circunferencia de cur-


vatura o cı́rculo de curvatura en el punto α(t0 ) de la curva C con k(t) 6= 0.
2. El centro de la circunferencia de curvatura se encuentra sobre la recta normal a la curva
C en el punto α(t0 ).

156
3. Como los vectores T y N están en el plano osculador, entonces la circunferencia de
curvatura se encuentra también sobre el plano osculador.
4. La circunferencia de curvatura (C1 ) está en el lado cóncavo o interior de la curva C y
tiene la mism a curvatura que C en α(t0 ).
5. El centro de curvatura de la curva C en el punto α(t0 ) es ei centro de ia circunferencia
de curvatura (C1 ) y es dado por

C0 (t0 ) = α(t0 ) + R(t0 )N(t0 )


 1 − 2t ˆ t 
Ejemplo 204. Dada la curva C : α(t) = , esen u du, t . Halle la ecuación de la
2 2π
circunferencia de curvatura de la curva C en el punto donde C corta al plano x + y + z = 12 .

Solución. Como la curva interseca al plano dado, entonces las componentes de la función
vectorial α(t) satisface la ecuación del plano, esto es,
ˆ t ˆ t
1 − 2t sen u 1
+ e du + t = , ⇔ esen u du = 0, ⇔ t = 2π
2 2π 2 2π

Luego, la curva C corta al plano dado en el punto α(2π) = P0 1−4π 2 , 0, 2π) Por otro lado, se
tiene

α′ (t) = (−1, esen t , 1), α′ (2π) = (−1, 1, 1)


α′′ (t) = (0, esen t cos t, 0), α′′ (2π) = (0, 1, 0)
α′ (2π) × α′′ (2π) = (−1, 0, −1)
h i
α′ (2π) × α′′ (2π) × α′ (2π) = (1, 2, −1)
h i
α′ (2π) × α′′ (2π) × α′ (2π) 1
N(2π) = h i = √ (1, 2, −1)
k α′ (2π) × α′′ (2π) × α′ (2π)k 6

kα′ (2π)k3 3 6
R(2π) = ′ ′′
=
kα (2π) × α (2π)k 2

Ası́, el centro de curvatura de la curva C en el punto α(2π) es

C0 (2π) = α(2π) + R(2π)N(2π)


 1 − 4π √
3 6h 1 i  4π − 3 
= , 0, 2π) + √ (1, 2, −1) = 2 − 2π, 3,
2 2 6 2

La ecuación del plano osculador de la curva C que pasa por el punto α(2π) es
" #
 1 − 4π 1
P0 : (x, y, z) − , 0, 2π) · (−1, 0, −1) = 0, ⇔ P0 : x + z =
2 2

Como las coordenadas del centro de curvatura satisfacen la ecuación del plano osculador,
entonces la circunferencia de curvatura se encuentra sobre el plano osculador. ∆
Definition 69 (Torsión).
Sea α : [a, b] → R3 una curva regular parametrizada por longitud de arco. Existe una
función real τ (t) que satisface
dB
= τ (t)N(t)
ds
Al número real τ (t) se llama torsión de la curva C en el punto α(t).

157
Supongamos que
ˆ t
α(t) = (α1 (t), α2 (t), α3 (t)) y s = l(t) = kα′ (u)kdu, t ∈ [a, b]
0

dB
determina el grado de torsión de la curva C en el punto α(t). Para los vectores unitarios,
ds
se tiene

B(t) = T(t) × N(t), B′ (t) = T(t) × N ′ (t)


h i
N(t) × B′ (t) = N(t) × T(t) × N′ (t)
h i h i
= N(t) · N′ (t) T(t)] − N(t) · T(t) N′ (t)] = 0

Luego, los vectores N(t) y B′ (t) son paralelos. Al derivar el vector binormal con respecto al
parám etro longitud de arco, se obtiene
dB dB(t) dt 1 dB(t) 1
= = ′
= ′
B′ (t)
ds dt ds kα (t)k dt kα (t)k

Como los vectores N(t) y B′ (t) son paralelos, entonces se tiene


dB
= τ (t)N(t)
ds

OBSERVACIONES:

1. τ (t) = 0 , ∀t ∈ I si y solo si C es una curva plana.


2. La torsión τ (t) mide como se está torciendo la curva C con relación al plano osculador.
3. Si α : [a, b] → R3 es una curva regular parametrizada, tal que α′ (t), α′′ (t) y α′′′ (t)
existen en [a, b], entonces se tiene
h i
α′ (t) × α′′ (t) · α′′′ (t)
τ=
kα′ (t) × α′′ (t)k2
 
t2
Ejemplo 205. Sea una curva dada por α(t) = 2t+1 ,
t−1 t−1 , t + 2

1. Halle la torsión de la curva C para todo t 6= 1. R: τ = 0


2. Halle la ecuación del plano osculador en la que se encuentra la curva dada ∀t 6= 1. R:
P0 : x − 3y + 3z − 5 = 0

158
  
Ejemplo 206. Dada la curva C : α(t) = t − sen t, 1 − cos t, 4 sen 2t , halle la curvatura y
la torsión de la curva C en el punto donde el plano normal principal a la curva es paralelo
al plano z = 1. R: α(0) = (0, 0, 0), k(0) = 14 , τ (0) = − 21

Componentes NORMAL (aN ) y TANGENCIAL (aT ) de la acelaración.


Sea C una curva regular en R3 , esto es, existe una función vectorial α : [a, b] → R3 tal
que α([a, b]) = C Sea α(t) = (α1 (t), α2 (t), α3 (t)) el vector posición de una partı́cula P que
se mueve en el espacio, donde t es el tiempo. Entonces C representa la trayectoria de la
partı́cula.
Luego, el vector velocidad de la partı́cula en cualquier punto α(t) = Q ∈ C es dado por

v(t) = α′ (t) = l′ (t)T(t) = kα′ (t)kT(t)

donde T es el vector tangente unitario y l es la función longitud de arco. Por otra parte
sabemos que, el vector aceleración es dado por

a(t) = v′ (t) = l′′ (t)T(t) + l′ (t)T′ (t) = α′′ (t)


kT ′ (t)k kT ′ (t)k
= l′′ (t)T(t) + l′ (t)kT′ (t)kN(t), k(t) = =
kα′ (t)k l′ (t)
= l′′ (t)T(t) + k(t)[l′ (t)]2 N(t)

Definition 70 (Componentes aT y aN ).
La aceleracion de un particula esta dada por

a(t) = l′′ (t)T(t) + k(t)[l′ (t)]2 N(t)

El coeficiente de T(t) se llama componente tangencial de la aceleración y se denota


por
aT (t) = l′′ (t)
El coeficiente de N(t) se llama componente normal del vector aceleración y se
denota por
aN (t) = k(t)[l′ (t)]2
La rapidez de la partı́cula en un instante t es

kv(t)k = l′ (t)

1. La componente tangencial de la aceleración es la razón de cambio del módulo de la


velocidad de la partı́cula.

159
2. La componente normal de la aceleración es siempre positiva.

3. Si el módulo de la velocidad es constante, entonces la componente normal aumenta al


aumentar la curvatura.

4. Esto explica por qué un automóvil que toma una curva cerrada a velocidad moderada o a
una curva suave a gran velocidad exige, en ambos casos, una fuerza normal (rozamiento
de los neumáticos) de gran magnitud para que el vehı́culo no se salga de la carretera.

Ejemplo 207. Una partı́cula se mueve según la ley

α(t) = (t, ln(sec t + tan t), ln(sec t))

Halle sus vectores velocidad y aceleración, su velocidad escalar, los vectores unitarios T y N.
y los componentes normal y tangencial del vector aceleración, todo para t = π/3.

Solución.
π √
v(t) = α′ (t) = (1, sec t, tan t), v( ) = (1, 2, 3)
3
′′ 2 π √
a(t) = α (t) = (0, sec t tan t, sec t), a( ) = (0, 2 3, 4)
3
′ ′
√ ′ π

l (t) = kα (t)k = 2 sec t, l( )=2 2
3
′′
√ ′′ π

l (t) = 2 sec t tan t, l ( )=2 6
3
La velocidad escalar, el vector tangente unitario y la curvatura en t = π/3 son
π π √
v = kα( )k = l′ ( ) = 2 2
3 3
π α′ ( π3 ) 1 √
T( ) = ′ π = √ (1, 2, 3)
3 kα ( 3 )k 2 2
′ π ′′ π
π α (3) × α (3) 1
k( ) = =
3 kα′ ( π3 )k3 4
2 √
Como a = l′′ ( π3 )T + k l′ ( π3 ) N entonces N = (− 23 , 0, 12 ) y


π π √ π  π 2
aT ( ) = l′′ ( ) = 2 6, aN ( ) = k l ′ ( ) = 2
3 3 3 3

160

También podría gustarte