Cap 2 11 Gradiente e Hessiana
Cap 2 11 Gradiente e Hessiana
Cap 2 11 Gradiente e Hessiana
11 - Gradiente e hessiana 1
Vimos nos últimos dois capı́tulos como calcular derivadas de primeira e de segunda ordens (de ordens
superiores, também) de funções de duas ou mais variáveis reais. Veremos agora como organizar essas derivadas,
em termos do vetor gradiente e da matriz hessiana, de um modo que será útil na maximização ou minimização
dessas funções. Veremos também o significado do vetor gradiente.
∂f ∂f
fx = e fy = .
∂x ∂y
Note que a notação utiliza um x como subscrito (letra menor, colocada um pouco abaixo da base da letra f )
para designar a derivada parcial com relação a x e um y subscrito para designar a derivada com relação a y.
p
Exemplo 1: calcule as derivadas parciais da função f (x, y) = x3 − y 2 .
Solução: escrevendo f (x, y) = (x3 − y 2 )1/2 , calculamos
1 3 3x2 1 3 −y
fx = (x − y 2 )−1/2 · 3x2 = p e fy = (x − y 2 )−1/2 · (−2y) = p .
2 2 x3 − y 2 2 x3 − y 2
Essa notação também é facilmente generalizada para o caso de funções com mais de duas variáveis, como
no exemplo a seguir.
A notação para as derivadas parciais de funções de mais de duas variáveis, ou a notação de derivadas parciais
de ordens superiores a dois, pode ser facilmente deduzida a partir daı́.
e a hessiana é a matriz
fxx fxy
H(f ) = .
fyx fyy
Esses dois conceitos podem ser generalizados para funções de n variáveis reais, como veremos a seguir para
n = 3.
fx fxx fxy fxz
~ (x, y, z) = fy ,
∇f H(f ) = fyx fyy fyz .
fz fzx fzy fzz
O gradiente e a hessiana podem ser calculados em pontos especı́ficos, como mostra o exemplo a seguir.
Cálculo 2 - Capı́tulo 2.11 - Gradiente e hessiana 3
Podemos nos perguntar, com toda a razão, quais são os significados do gradiente e da hessiana. A resposta
para o gradiente é dada a seguir. Para a hessiana, teremos que esperar mais um pouco.
Exemplo 1: calcule o gradiente de f (x, y) = x2 + y 2 em (x, y) = (1, 0), (x, y) = (0, 1), (x, y) = (1, 1) e
(x, y) = (0, 0) e desenhe esses vetores sobre as curvas de nı́vel da função.
Solução: o gradiente de f (x, y) = x2 + y 2 fica
~ (x, y) = fx 2x
∇f = .
fy 2y
Note que cada gradiente é um vetor, onde a primeira linha é a sua primeira componente e a segunda linha é a
sua segunda componente. Por exemplo, ∇f ~ (1, 0) é um vetor que, a partir do ponto (1, 0), se desloca duas unidades
~
à direita; o vetor ∇f (0, 1) se desloca duas unidades para cima a partir do ponto (0, 1). A seguir, representamos
cada um desses vetores sobre as curvas de nı́vel da função. A função em três dimensões (um parabolóide), com os
vetores gradientes, é mostrada na última figura a seguir.
y y y
3 3 3
2 2 2
1 1 b 1 b
−3 −2 −1 0
b b
1 2 3
x −3 −2 −1 0
b
1 2 3
x −3 −2 −1 0
b
1 2 3
x
−1 −1 −1
−2 −2 −2
−3 −3 −3
y z
3
4.0
2
3.0
1
-4. 2.0
bb
x 0 -3
-4
.0
−1 0 1 2 3 .0 -
-3
−3 −2
1.
.0
2.0
-1. 0
-2
.0
−1
0
-1
.0
b
−2 1.0
1.
2.0
0
b
2.
3.0
0
3.
−3
0
x y
b
Cálculo 2 - Capı́tulo 2.11 - Gradiente e hessiana 4
Note que os vetores gradiente sempre idicam a direção onde a função aumenta mais rapidamente e que, no
ponto onde a função é mı́nima, o vetor gradiente se anula. Vamos verificar esse comportamento em uma outra
função.
Exemplo 2: calcule o gradiente de f (x, y) = 4 − x2 − y 2 + 2x + y + xy em (x, y) = (1, 0), (x, y) = (0, 1),
(x, y) = (1, 1) e (x, y) = (0, 0) e desenhe esses vetores sobre as curvas de nı́vel da função.
Solução: o gradiente de f (x, y) = 4 − x2 − y 2 + 2x + y + xy fica
~ fx −2x + 2 + y
∇f (x, y) = = .
fy −2y + 1 + x
A seguir, representamos cada um desses vetores sobre as curvas de nı́vel da função. A função em três dimensões
(um parabolóide elı́ptico), com os vetores gradientes é mostrada na última figura a seguir.
y y y
5 5 5
4 4 4
3 3 3
2 2 2
b b b
b b
1 1 1
−2 −1 0
b
1 2 3 4 5
x −2 −1 0 1 2 3 4 5
x −2 −1 0 1 2 3 4 5
x
−1 −1 −1
−2 −2 −2
6.0
y b
5.0
5
4.0
4
3.0
3
2 -4. 2.0
0-3
-4
.0
b .0-2
-
.0-1 1.0
.3 0
1
-2
.
.0
-0 1
.0
−2 −1 0
b
1 2 3 4 5
x 1.0
1.
2.0
0
b
2.
3.0
0
−1
3.
y
0
−2 x
Como no exemplo 1, os vetores gradiente seguem sempre a direção para onde a função cresce mais rapida-
mente a partir do ponto dado. Outra caracterı́stica é que o vetor gradiente em um determinado ponto sempre
segue uma reta perpendicular à curva de nı́vel naquele ponto.
Um exemplo pode facilitar a compreensão da utilidade do gradiente: consideremos um aplpinista mı́ope que
quer subri uma montanha. Ele só enxerga claramente até dois metros de distância e não tem como enxergar
mais longe que isso. Como ele fará para subir a montanha?
Uma resposta é que ele pode, dentro de seu campo de visão, identificar para onde o terreno tem um
maior aclive (sobe mais rapidamente) e subir um pouco naquela direção e sentido. Depois, ele pára e verifica
novamente o terreno em torno de onde ele está. Segue novamente a direção para onde o terreno for mai ı́ngreme
e repete o processo até que o terreno não tenha mais para onde subir.
Essa tática pode ou não funcionar, pois o alpinista, caso não se defronte com algum abismo pelo caminho,
pode acabar chegando a um pico (máximo) local, achando que já chegou ao poco da montanha, quando ainda
Cálculo 2 - Capı́tulo 2.11 - Gradiente e hessiana 5
está bem longe dela. A figura a seguir ilustra dois caminhos obtidos usando o gradiente como guia: no primeiro
caminho (em vermelho), chega-se ao topo do maior dos dois picos; no segundo (azul), chega-se apenas a um
máximo local.
Concluindo esta seção, o gradiente é um vetor que dá a direção de maior crescimento da função a partir
de um determinado ponto. Isto será muito útil na maximização ou minimização de uma função (a Leitura
Complementar 1.5.1 traz um método numérico utilizando o gradiente para determinar máximos e mı́nimos de
funções de diversas variáveis). A hessiana servirá mais tarde para verificar se um determinado ponto crı́tico é
um máximo, um mı́nimo ou um ponto de inflexão (ponto se sela). A demonstração disto necessita do conceito
de derivada direcional e será feita em uma leitura complementar do Módulo 2 deste curso.
df
(γ(t)) = ∇f (γ(t)) , γ ′ (t) ,
dt
isto porque h∇f (γ(t)) , γ ′ (t)i, o produto interno do gradiente pela derivada da função vetorial γ(t), é dado por
′
∂f ∂f dx dy ∂f dx ∂f dy
∇f (γ(t)) , γ (t) = (x, y), (x, y) , (t), (t) = (x, y) (t) + (x, y) (t) .
∂x ∂y dt dt ∂x dt ∂y dt
Consideremos agora uma curva de nı́vel da função f (x, y), que pode ser dada pela equação f (x, y) =
f (γ(t)) = c, onde c é uma constante. Se derivarmos ambos os lados dessa expressão com relação a t, obtemos
df
f (γ(t)) = c ⇔ (γ(t)) = 0 .
dt
Substituindo agora a derivada da esquerda pela expressão compacta da regra da cadeia, ficamos com
∇f (γ(t)) , γ ′ (t) = 0 ,
Cálculo 2 - Capı́tulo 2.11 - Gradiente e hessiana 6
Exemplo 1: um industrial tem que decidir onde investir R$ 100.000 e estima que a produção de sua empresa
possa ser modelada pela função P (K, L) = 1, 1K 0,25 L0,75 , onde o capital investido K e o trabalho L são
medidos em milhões de reais. No momento, o capital investido é de 7 milhões de reais e o gasto em trabalho
é de 6 milhões de reais. Determine o quanto do dinheiro tem que ser usado em cada uma dessas áreas de
modo a maximizar a produção da empresa.
Solução: o vetor gradiente, calculado a partir do ponto (7, 6), correspondente ao nı́vel atual de investimento (7
milhões em capital e 6 milhões em trabalho) determina a “direção” de maior crescimento da produção. Portanto,
podemos começar calculando o gradiente da função nesse ponto:
~ 0, 275K −0,75L0,75 ~ 0, 275 · 7−0,75 · 60,75 0, 245
∇P (K, L) = ⇒ ∇P (7, 6) = ≈ .
0, 825K 0,25L−0,25 0, 825 · 70,25 · 6−0,25 0, 857
0, 245
Portanto, de modo a aumentar a produção ao máximo, deve-se usar uma proporção de entre o capital e
0, 857
o trabalho. Escrevendo o dinheiro disponı́vel em termos de milhões de reais, isto significa que deve-se investir
0, 245 0, 857
IK = · 0, 1 ≈ 0, 022 , IL = · 0, 1 ≈ 0, 078 ,
0, 245 + 0, 857 0, 245 + 0, 857
isto é, deve-se investir R$ 22.000 em capital e deve-se gastar R$ 78.000 em trabalho.
Cálculo 2 - Capı́tulo 2.11 - Gradiente e hessiana 7
Exemplo 2: considere que o industrial do exemplo anterior tenha investido R$ 22.000 em capital e tenha
gasto R$ 78.000 em trabalho. Agora ele tem mais R$ 100.000 para investir. Onde esse dinheiro deve ser
investido?
Solução: no momento, temos K = 7 + 0, 22 = 7, 22 e L = 6 + 0, 78 = 6, 78, medidos em milhões de reais. O vetor
gradiente já foi calculado no exemplo anterior, de modo que só temos que calculá-lo para K = 7, 22 e L = 6, 78:
~ 0, 275K −0,75L0,75 ~ 0, 275 · 7, 22−0,75 · 6, 780,75 0, 262
∇P (K, L) = ⇒ ∇P (7, 22 , 6, 78) = ≈ .
0, 825K 0,25L−0,25 0, 825 · 7, 220,25 · 6, 78−0,25 0, 838
0, 262
Para aumentar a produção ao máximo, deve-se usar uma proporção de entre o capital e o trabalho. Isto
0, 838
significa que deve-se investir
0, 262 0, 838
IK = · 0, 1 ≈ 0, 024 , IL = · 0, 1 ≈ 0, 076 ,
0, 262 + 0, 838 0, 262 + 0, 838
isto é, deve-se investir R$ 24.000 em capital e deve-se gastar R$ 76.000 em trabalho.
Note que as proproções de quanto deve ser investido em capital ou trabalho mudam de acordo com o
nı́vel prévio de investimento. No segundo exemplo, o investimento em trabalho não foi tão grande quanto no
primeiro. Isto porque, de acordo com a função de produção escolhida, investimentos em capital e trabalho
trazem resultados cada vez menores em termos de produção conforme estes aumentam a patamares cada vez
maiores.
Terminamos esta exposição por aqui. Mais algumas aplicações do gradiente podem ser vistas na leitura
complementar deste capı́tulo e nos exercı́cios. Aplicações para a matriz hessian serão vistas mais tarde.
Resumo
• Gradiente: o gradiente de uma função f (x, y) é o vetor
~ (x, y) = fx
∇f
fy
O vetor gradiente, quando calculado em um ponto, dá a direção de maior variação da função naquele
ponto e é perpendicular à curva de nı́vel no mesmo ponto.
• Hessiana: a hessiana de uma função f (x, y) é a matriz
fxx fxy
H(f ) = .
fyx fyy
• Significado do gradiente: o gradiente dá, a cada ponto do domı́nio de uma função, a direção de
maior crescimento da função a partir daquele ponto. Além disso, ele é sempre perpendicular à curva
de nı́vel no ponto onde é calculado.
Todas as definições podem ser generalizadas para funções de n variáveis reais.
Cálculo 2 - Capı́tulo 2.11 - Gradiente e hessiana 8
Como já vimos antes, o gradiente dá as derivadas de uma função f com relação a suas variáveis. Mais
especificamente para uma f (x, y), ele fornece as derivadas parciais dessa função com relação às variáveis x e y.
Como as derivadas parciais representam uma aproximação das taxas de variação da função com relação a suas
variáveis, podemos escrever
~ fx ∆f /∆x [f (x + ∆x, y) − f (x, y)] /∆x
∇f (x, y) = ≈ = .
fy ∆f /∆y [f (x, y + ∆y) − f (x, y)] /∆y
Isto significa que o gradiente dá, aproximadamente, a variação da função f (x, y) em duas direções diferentes:
uma com relação ao eixo x e a outra com relação ao eixo y.
Mas e se quisermos saber como a função varia com relação a alguma outra direção? Como podemos medir
tal variação?
Voltemos, agora, ao exemplo prático de uma função de produção de Cobb-Douglas: P (K, L) = AK α L1−α .
Podemos calcular, usando derivadas parciais, boas aproximações para a produtividade marginal do capital,
dada pela taxa de variação de P com relação a K, e para a produtividade marginal do trabalho, dada pela
taxa de variação de P com relação a L, respectivamente dadas por
O problema de como aproximar essa variação por meio de derivadas parciais é semelhante ao problema de
determinar a variação de uma função em uma determinada direção. A solução para isso é definir uma derivada
direcional.
a) A derivada direcional
A definição de uma derivada direcional é dada a seguir.
Definição 1 - Dadauma
função f (x1 , · · · , xn ), a sua derivada direcional com relação a uma direção
u1
dada pelo vetor u = é definida como
u2
Uma forma mais simples de se calcular uma derivada direcional é dada pelo teorema a seguir.
u1
Teorema 5 - Dada uma função f (x, y) diferenciável em x e em y e um vetor u = , então
u2
dg dx̄ dȳ
g ′ (h) = = fx̄ (x̄, ȳ) + fȳ (x̄, ȳ) = fx̄ u1 + fȳ u2 .
dh dh dh
Para h = 0, teremos x̄ = x, ȳ = y e
g ′ (0) = fx (x, y)u1 + fy (x, y)u2 .
Comparando agora as duas expressões para g ′ (0), concluı́mos que
−1
Exemplo 3: calcule a derivada direcional de f (x, y) = ln(x3 − y) na direção u = .
2
Solução: pelo teorema 1, temos
1 1 −3x2 2 −3x2 − 2
Df (x, y) = fx u1 + fy u2 = · 3x2 · (−1) + 3 · (−1) · 2 = 3 − 3 = .
x3 −y x −y x −y x −y x3 − y
O exemplo a seguir mostra os cálculos das derivadas direcionais de uma função a partir de um ponto ao
longo de três vetores distintos.
Cálculo 2 - Capı́tulo 2.11 - Gradiente e hessiana 10
Exemplo 4: calcule 2 2
a derivada
direcional
def (x, y) = x + y − 4x + 2y + 2xy no ponto (3, 1) ao longo dos
1 1 1
vetores u = ,v= ew= .
2 1 0
Solução: primeiro, calculamos fx e fy : fx = 2x − 4 + 2y e fy = 2y + 2 + 2x.
Calculadas no ponto (3, 1), temos fx (3, 1) = 2·3−4+2·1 = 6−4+2 = 4 e fy (3, 1) = 2·1+2+2·3 = 2+2+6 = 10.
Agora, fica fácil calcular as derivadas direcionais pedidas:
No entanto, a demonstração envolve o conceito de produto escalar entre vetores, que é aprendido em cursos de
álgebra vetorial e será visto aqui de modo pragmático.
Podemos definir o produto escalar entre dois vetores u e v, escrito u · v, de duas formas distintas:
u · v = tr (v t u) ,
onde v t é a transposta do vetor v e v é o traço (soma dos elementos da diagonal principal de uma matriz), ou
u · v = |u||v| cos θ ,
onde |u| e |v| são os módulos dos vetores u e v, respectivamente, e θ é o ângulo entre esses dois vetores.
Cada uma dessas definições é útil, dependendo da forma como os dados do problema são fornecidos, como
mostram os dois exemplos a seguir.
−1 2
Exemplo 1: calcule u · v, onde u = ev= .
4 1
−1
Solução: u · v = tr (v t u) = tr
2 1 = tr (2) = 2 .
4
De acordo com a primeira definição de produto escalar, podemos escrever a definição da derivada direcional
como
fx
Du f = u1 u2 = tr ∇f ~ ·u ,
fy
~ = fx u1
onde ∇f eu= . Alternativamente, poderı́amos escrever essa mesma definição do seguinte
fy u2
modo:
~ ||u| cos θ ,
Du f = |∇f
onde θ é o ângulo entre o vetor gradiente e o vetor u.
Da segunda definição, podemos ver que a derivada direcional é maior quando cos θ é maior. O valor máximo
que cos θ pode ter é 1, o que ocorre quando θ = 0o . Portanto, o vetor gradiente e o vetor u devem ter a mesma
direção e sentido se quisermos maximizar a derivada direcional Du f . Daı́, conclui-se que a direção e o sentido
Cálculo 2 - Capı́tulo 2.11 - Gradiente e hessiana 11
de maior valor da derivada direcional Du f , que é a direção e o sentido de maior crescimento da função f , é ao
longo do gradiente.
u1
Teorema 6 - Dada uma função f (x, y) diferenciável em x e em y e um vetor u = , então
u2
~ (x, y).
Du f (x, y) é máxima se u = ∇f
Exemplo 3: determine a direção de maior crescimento da função f (x, y) = 3x ln y no ponto (2, 1).
Solução: a direção de maior cresciment é dada pelo vetor gradiente nesse ponto, isto é,
~ fx 3 ln y ~ 3 · ln 1 0
∇f (x, y) = = , de modo que ∇f (2, 1) = = .
fy 3x/y 3 · 2/1 6
Cálculo 2 - Capı́tulo 2.11 - Gradiente e hessiana 12
Veremos agora um método bastante eficiente para encontrar máximos e mı́nimos de funções envolvendo
mais de uma variável real. Esse método é baseado no fato do gradiente sempre apontar a direção e o sentido
de maior crescimento de uma função a cada ponto do domı́nio desta. Faremos esse estudo por meio de alguns
exemplos. A teoria será exposta conforme a necessidade de cada exemplo.
onde o vetor gradiente dá a direção de maior variação da função e λ é um parâmetro que indica o sentido a ser
seguido e o módulo da variação a ser feita.
• Determina-se o valor de λ que maximiza ou minimiza a função objetivo, dependendo do problema ser um de
maximização ou de minimização.
• Calcula-se ~x1 usando o valor de λ determinado anteriormente. Se |~x1 − ~x0 | < ǫ, onde ǫ é um parâmetro dado
pelo problema que indica qual o grau de precisão desejado, então o problema termina por aı́. Senão, repete-se
todo o processo.
Apliquemos esse procedimento ao problema em questão. Primeiro, calculamos o gradiente da função f (x, y):
∂f
∂x
~ (x, y) = 2x
∇f = .
2y
∂f
∂y
1
O ponto inicial já foi escolhido pelo problema: ~x0 = . Calculando o gradiente, temos
1
~ (~x0 ) = 2·1 2
∇f = .
2·1 2
Note que a função só depende agora do parâmetro λ, de modo que podemos escrevê-la como
f (λ) = 2 + 8λ + 8λ2 .
Cálculo 2 - Capı́tulo 2.11 - Gradiente e hessiana 13
f ′′ (x) = 16 .
Como esse valor é positivo, a concavidade da função é sempre para cima e λ = − 21 é um ponto de mı́nimo.
Substituindo o valor de λ encontrado, temos
1 + 2 · − 21
0
~x1 = = .
0
1 + 2 · − 12
A função agora só dependedo parâmetro λ, de modo que podemos escrevê-la como
−16 λ+4)2
f (λ) = 12 e−(−96 e .
Solução:
a) O problema consiste em determinar onde deve ser construı́do um armazém que sirva às três cidades indicadas
de modo a minimizar a distância deste às cidades. Podemos localizar as cidades em um eixo cartesiano
de coordenadas estabelecendo Besourinhos na origem (0, 0), a cidade formigas no ponto (20, 0) e a cidade de
Cupinzal em (10, 10). No gráfico indicamos coordenadas arbitrárias para a localização do armazém que deverão
ser determinadas pelo problema.
y
10 b
C
b
(x, y)
B F
b b
x
0 10 20
b) Para resolver o problema por meio de busca por gradiente, precisamos calcular as derivadas parciais dx e dy
da função-objetivo:
∂d 1 1 −1/2
dx = = (x2 + y 2 )−1/2 · 2x + (x − 20)2 + y 2 · 2(x − 20) +
∂x 2 2
1 −1/2
+ (x − 10)2 + (y − 10)2 · 2(x − 10) =
2
−1/2 −1/2
= x(x2 + y 2 )−1/2 + (x − 20) (x − 20)2 + y 2 + (x − 10) (x − 10)2 + (y − 10)2
,
∂d 1 1 −1/2 1 −1/2
dy = = (x2 + y 2 )−1/2 · 2y + (x − 20)2 + y 2 · 2y + (x − 10)2 + (y − 10)2 · 2(y − 10) =
∂y 2 2 2
−1/2 −1/2
= y(x2 + y 2 )−1/2 + y (x − 20)2 + y 2 + (y − 10) (x − 10)2 + (y − 10)2
.
O gradiente fica
~ dx
∇d(x, y) = ,
dy
onde dx e dy são dados pelas equações anteriores.
Para iniciarmos a busca, escolheremos um ponto inicial apropriado. Quanto mais próximo do ponto ótimo
estiver esse ponto inicial, melhores serão as chances da busca terminar logo. Observando o gráfico que mostra
as posições das cidades,
vemosque elas são simétricas com relação a x = 10. Portanto, podemos partir, por
10
exemplo, do ponto ~x0 = . Calculando o gradiente, temos
0
~ 0
∇d(~x0 ) = .
−1
Cálculo 2 - Capı́tulo 2.11 - Gradiente e hessiana 16
A presença do módulo mostra que, à direita ou à esquerda do ponto λ + 10 = 0 ⇔ λ = −10, podemos escrever
essa função como √
2√100 + λ2 − λ − 10 , λ < −10 ;
d(λ) =
2 100 + λ2 + λ + 10 , λ ≥ −10 .
Para λ < −10 a derivada dessa função fica
1
d′ (λ) = 2 · (100 + λ2 )−1/2 · 2λ − 1 = 2λ(100 + λ2 )−1/2 − 1 .
2
Para λ > −10, temos
1
d′ (λ) = 2 · (100 + λ2 )−1/2 · 2λ + 1 = 2λ(100 + λ2 )−1/2 + 1 .
2
Note que a derivada não é definida em λ = −10.
Essa função tem pontos crı́ticos quando d′ (λ) = 0 ou quando d′ (λ) não existe. Portanto, ela tem um ponto
crı́tico em λ = −10, que é onde ela não é definida. Para λ < −10, temos
10
λ = −10 e λ = − √ .
3
Para determinamos se algum desses pontos crı́ticos são um mı́nimo da função, calculamos a segunda derivada
desta. Para λ > −10, que é o único caso (fora λ = −10) onde ocorrem pontos crı́ticos, temos
2 −1/2 1
′′
d (λ) = 2(100 + λ ) +2 − (100 + λ2 )−3/2 · 2λ = 2(100 + λ2 )−1/2 − 2λ(100 + λ2 )−3/2 .
2
10
Substituindo λ = − √ 3
, temos
′′ 10
d −√ ≈ 0, 104 .
3
10
Portanto, λ = − √ 3
é um ponto de mı́nimo.
Resta ainda analisar o ponto λ = −10, que não pode ser analisado usando derivadas. Tomando valores
próximos a ele, vemos que d(−10, 1) ≈ 28, 526 e d(−9, 9) ≈ 28, 243. Já que d(−10) = 28, 284, este não é um
Cálculo 2 - Capı́tulo 2.11 - Gradiente e hessiana 17
10
ponto de mı́nimo nem de máximo da função, mas apenas uma cúspide. Concluı́mos, então, que λ = − √ 3
é o
único ponto de mı́nimo da função d(λ). Para que visualizemos melhor a situação, segue um gráfico da função
d(λ).
d(λ)
45
40
35
30
25
20
15
10
0
λ
−15 −10 −5 5
O valor mı́nimo da função-objetivo é d ≈ 27, 320. A seguir, fazemos uma descrição gráfica dos passos feitos
pelo problema:
y
10 b
C
B F
b b b
x
0 10 20
c) O problema agora consiste em determinar onde deve ser construı́do um armazém que sirva às três cidades
indicadas de forma proporcional às suas populações. Podemos fazer isto dando um peso a cada distância
Cálculo 2 - Capı́tulo 2.11 - Gradiente e hessiana 18
da função-objetivo que seja proprocional à população de cada cidade. Usando como variáveis de decisão do
problema (x, y) =coordenadas do armazém, temos, então,
p p p
min d(x, y) = 400 x2 + y 2 + 250 (x − 20)2 + y 2 + 140 (x − 10)2 + (y − 10)2 .
Para
iniciarmos
a busca, escolheremos um ponto inicial apropriado. Partiremos novamente do ponto inicial
10
~x0 = . Calculando o gradiente, temos
0
~ x0 ) = 150
∇d(~ .
−140
Teremos que usar um método numérico (método de Newton) para encontrar as raı́zes dessa derivada. Para
isso, precisamos calcular sua derivada segunda:
d′′ (λ) = 16840000(100 + 3000λ + 42100λ2 )−1/2 − 62, 5(−3000 + 84200λ)2 (100 − 3000λ + 42100λ2 )−3/2 +
+10525000(100 − 3000λ + 42100λ2 )−1/2 − 62, 5(−3000 + 84200λ)2 (100 − 3000λ + 42100λ2 )−3/2 +
+5894000(100 + 2800λ + 42100λ2 )−1/2 − 35(2800 + 84200λ)2 (100 + 2800λ + 42100λ2 )−3/2
Cálculo 2 - Capı́tulo 2.11 - Gradiente e hessiana 19
8000
7500
7000
0
λ
−0, 03 −0, 02 −0, 01 0, 01
Usando um método numérico, descobrimos que esta função tem um mı́nimo em λ = −0, 012. Portanto,
3, 632
~x3 = .
1, 362
A tabela a seguir mostra todos passos do método, que vão até que a precisão de três casas decimais seja
alcançada.
i xi yi i xi yi
0 10 0 16 0, 197 0, 027
1 7 2, 8 17 0, 165 0, 057
2 4, 586 0, 425 18 0, 128 0, 018
3 3, 632 1, 362 19 0, 107 0, 037
4 2, 760 0, 362 20 0, 084 0, 012
5 2, 242 0, 814 21 0, 070 0, 024
6 1, 739 0, 234 22 0, 054 0, 007
7 1, 432 0, 509 23 0, 045 0, 015
8 1, 112 0, 154 24 0, 032 0, 004
9 0, 922 0, 325 25 0, 027 0, 009
10 0, 722 0, 101 26 0, 019 0, 002
11 0, 601 0, 210 27 0, 016 0, 005
12 0, 469 0, 066 28 0, 008 0, 000
13 0, 391 0, 136 29 0, 007 0, 002
14 0, 305 0, 043 30 0, 000314 −0, 000044
15 0, 255 0, 088 31 0, 000301 0, 0000861
Nas últimas duas linhas foram usadas mais casas decimais para evitar singularidades nas derivadas primeira e
segunda da função d(x, y). Pode-se ver que a solução ótima, com precisão de duas casas decimais, é
0
~x = ,
0
10 b
C
B F
b b
x
0 10 20
Note o comportamento em zigue-zague da busca, tı́pica do método de busca por gradiente, que torna a
busca difı́cil e lenta quando nos aproximamos da solução do problema.
Cálculo 2 - Capı́tulo 2.11 - Gradiente e hessiana 21
Nı́vel 1
Gradiente
Exemplo 2: calcule o vetor que dá a direção e sentido de maior crescimento da função f (x, y, z) = x cos(yz)
no ponto (1, 0, 2).
Solução: o gradiente da função, calculado no exemplo 3, é dado por
cos(yz)
~ = −xz sen (yz) .
∇f
−xy sen (yz)
O vetor gradiente calculado no ponto desejado dá a direção e o sentido de maior variação da função. Portanto, em
(1, 0, 2), temos
cos(0 · 2) cos 0 1
~ (1, 0, 2) = −1 · 2 sen (0 · 2) = −2 sen 0 = 0 .
∇f
−1 · 0 sen (0 · 2) −0 0
E2) Calcule os vetores que dão as direções e sentidos de maior crescimento das funções abaixo nos pontos
indicados:
a) f (x, y) = xy 3 , (1, 1); b) f (x, y) = 2x + cos y , (0, π); c) f (x, y, z) = 4xz − 8y 2 , (1, 4, 2);
√
d) f (x, y, z) = 8x y − 2 ez , (2, 1, 0).
Hessiana
Nı́vel 2
E1) As figuras a seguir ilustram algumas curvas de nı́vel das funções f (x, y) = 2x2 + 3y 2 , g(x) = 3x2 − 2y 2 e
h(x, y) = 3x − x3 − 3xy 2 . Desenhe sobre essas curvas de nı́vel os vetores gradiente normalizados dessas funções
nos pontos (0, 0), (1, 0), (0, 1) e (1, 1) com origem nos pontos dados.
y
y y
4
2
3
1
2 1
1
b
x 0
x b b
x
0 1 2 3 −2 −1 0 1 2
−1 1 −3 −2 −1
−1
−2 −1
−1
−3
−2
−4
E2) Considerando os dados a seguir, calcule, aproximadamente, um vetor que dê a direção e o sentido do
gradiente no ponto (0, 0).
x/y −2 −1 0 1 2
−2 −3, 2 −3, 1 −2, 9 −2, 8 −3, 0
−1 −2, 9 −2, 7 −2, 7 −2, 6 −2, 8
0 −1, 6 −1, 4 −1, 2 −1, 4 −1, 6
1 −0, 4 −0, 6 −0, 4 −0, 7 −0, 6
2 0, 6 0, 8 0, 7 0, 8 0, 3
p
E3) O laplaciano de uma função f (x, y) é definido como ∇2 f = fxx + fyy . Dada f (x, y) = x2 + y 2 , prove
que ∇2 f = f1 .
E4) Determine em qual direção e sentido uma função f decresce mais rapidamente.
E5) Determine
todos
os pontos para os quais a direção de maior mudança da função f (x, y) = x2 + y 2 − x − 3y
1
é dada por .
1
E6) Um industrial tem que decidir onde investir R$ 50.000 e estima que a produção de sua empresa possa ser
modelada pela função P (K, L) = 1, 3K 0,45 L0,55 , onde o capital investido K e o trabalho L são medidos em
milhões de reais. No momento, o capital investido é de 5 milhões de reais e o gasto em trabalho é de 4 milhões
de reais. Determine o quanto do dinheiro tem que ser usado em cada uma dessas áreas de modo a maximizar
a produção da empresa (use uma precisão de um milhar de reais na resposta).
Nı́vel 3
x2
E1) Calcule a reta normal e a reta tangente à elipse + y 2 = 2 no ponto (−2, 1) seguindo as seguintes
4
instruções:
Cálculo 2 - Capı́tulo 2.11 - Gradiente e hessiana 23
x2
a) Considere que a elipse é uma curva de nı́vel da função f (x, y) = + y 2 e calcule o gradiente dessa função
4
no ponto (−2, 1).
b) Usando o fato do gradiente ser perpendicular à curva de nı́vel para calcular um ponto da reta normal à
elipse no ponto dado.
c) Utilize o ponto (−2, 1) e o novo ponto dado para calcular a equação da reta normal à elipse naquele ponto.
d) Use o fato da reta tangente ser perpendicular à reta normal calculada para repetir o processo (considerando
agora a reta normal como uma isoquanta de uma função adequada) e calcular a equação da reta tangente.
e) Desenhe em um mesmo gráfico a elipse dada, o ponto (−2, 1) e as retas normal e tangente a essa curva nesse
ponto.
E2) Calcule a reta normal e a reta tangente à curva x3 − 3y = 5 no ponto (2, 1).
E3) Um industrial estima que a produção de sua empresa possa ser modelada pela função de produção de
Cobb-Douglas P (K, L) = 1, 2K 0,6 L0,4 , onde o capital investido K e o trabalho L são medidos em milhões de
reais. No momento, o capital investido é de 5 milhões de reais e o gasto em trabalho é de 4 milhões de reais. Ele
pretende, nos próximos 6 meses, investir R$ 1.000.000 todo mês. Determine uma estratégia de investimentos
para o industrial para os próximos 6 meses de modo a maximizar a sua produção. Assuma nos seus cálculos
que ele sempre invista em unidades de milhares de reais.
E4) Use busca por gradiente com precisão de duas casas decimais para maximizar a função
f (x, y) = 4 − x2 − y 2 + 2x − 3y partindo do ponto x0 = (0, 0).
E5) Use busca por gradiente com precisão de duas casas decimais para maximizar a função
f (x, y) = 4 − x2 − y 2 + 2x − xy partindo do ponto x0 = (0, 0).
Respostas
Nı́vel 1
√
4z 8 y
~ = y3 ~ y2 ~ = −16y , d) ∇f √
~ = 4x/ y .
E1) a) ∇f , b) ∇f = , c) ∇f
3xy 2 − sen y
4x −2 ez
8 8
~ (1, 1) = 1 ~ (0, π) = 2 ~ (1, 4, 2) = −64 , d) ∇f
~ (2, 1, 0) = 8 .
E2) a) ∇f , b) ∇f , c) ∇f
3 0
4 −2
0 0 4
0 3y 2 0 0
E3) a) H(f ) = , b) H(f ) = , c) H(f ) = 0 −16 0 ,
3y 2 6xy 0 − cos y
4 0 0
0 √4 0
x
d) H(f ) = √4x − y2x 3/2 0 .
0 0 −2 ez
Nı́vel 2 y
y
y
E1)
4
2
3
1
2 1 b
1
bb x 0
b x b bb x
0 1 2 3 −2 −1 0 1 2
−1 1 −3 −2 −1
−1
−2 −1
−1
−3
−2
−4
2
Nı́vel 3
b 1
~ (−2, 1) = −1 1
E1) a) ∇f . b) (−3, 3). c) y = −2x − 3. d) y = x + 2. e) x
2 2 −3 −2 −1 0 1 2 3
−1
−2
1
E2) A reta normal é dada por y = −0, 3x + 1, 6. A reta tangente é dada por y = (x + 1).
3 −3
E3) A estratégia de investimentos é dada pela tabela a seguir. Os investimentos são dados em milhares de reais.
Mês K L
1 623 377
2 623 377
3 622 378
4 622 378
5 623 377
6 623 377