Tema 4 ESP
Tema 4 ESP
Tema 4 ESP
1. Introducción
Estudiamos en este tema problemas de optimización con restricciones de desigual-
dad.
(1.1) max f (x) s.a: x ∈ S,
donde S = {x ∈ D : g1 (x) ≤ b1 , . . . , gm (x) ≤ bm } y donde f : D ⊆ Rn −→ R,
g = (g1 , . . . , gm ) : D −→ Rm . En contraste con los problemas de Lagrange, no
existe limitación del número finito de restricciones.
Nota 1.1. Una restricción del tipo gi (x) ≥ bi es equivalente a −gi (x) ≤ −bi . El
problema
min f (x) s.t.: x ∈ S,
tiene las mismas soluciones que
max −f (x) s.a: x ∈ S.
(1) ∇x L(x, λ) = 0,
(2) λ1 (b1 − g1 (x)) = 0, · · · , λm (bm − gm (x)) = 0,
(3) λ1 ≥ 0, . . . , λm ≥ 0,
(4) g1 (x) ≤ b1 , . . . , gm (x) ≤ bm .
Nota 2.6. Una forma de aplicar las condiciones necesarias del Teorema 2.4 es solu-
cionar el sistema de n + m ecuaciones y n + m incoǵnitas
∂L
∂x1 (x, λ) = 0
.. .. ..
. . .
∂L
(x, λ) = 0
∂xn
λ01 (b1 − g1 (x0 )) = 0
.. .. ..
. . .
λ0m (bm − gm (x0 ))
= 0.
De las ecuaciones (x, λ) encontradas, sólo se retienen aquéllas que satisfacen el resto
de las condiciones necesarias: x ∈ S y λi ≥ 0.
max 2x + y
s.a. 3x + y ≤ 5
x≥0
y≥0
max 2x + y
s.a. 5 − 3x − y ≥ 0
x≥0
y≥0
El Lagrangiano asociado es
L(x, y) = 2x + y + λ1 (5 − 3x − y) + λ2 x + λ3 y
4. OPTIMIZACIÓN CON RESTRICCIONES DE DESIGUALDAD: EL MÉTODO DE KUHN-TUCKER
3
4. Restricciones de no negatividad
Muy a menudo los problemas con restricciones incluyen la no negatividad de las
variables. A pesar de que este caso es un caso particular de la teorı́a desarrollada an-
teriormente, en muchos libros de texto se describen las condiciones de Khun-Tucker
para este caso que, a primera vista, pueden parecer diferentes a las ya descritas.
En realidad, las condiciones son equivalentes, y tienen la siguiente estructura. Sea
el problema de optimización con restricciones de no negatividad siguiente:
(4.1) max f (x) s.a: x ∈ S,
donde S = {x ∈ D : g1 (x) ≤ b1 , . . . , gm (x) ≤ bm , x1 ≥ 0, . . . , xn ≥ 0} y f : D ⊆
Rn −→ R, g = (g1 , . . . , gm ) : D −→ Rm .
Definición 4.1. La función Lagrangiana asociada a (4.1) es
(4.2) L(x, λ) = f (x) + λ · (b − g(x)),
donde λ = (λ1 , . . . , λm ).
Observar que es este caso la Lagrangiana no incorpora las restricciones de no ne-
gatividad. Simplemente asigna multiplicadores al resto de restricciones gi (x) ≤ bi .
Teorema 4.2 (Método de Kuhn-Tucker para problemas con restricciones de no
negatividad). Supongamos que las funciones f : D ⊆ Rn −→ R, g = (g1 , . . . , gm ) :
D −→ Rm son de clase C 1 en D y que x0 es un punto regular de1 (4.1). Si x0 es
una solución del problema 1.1, entonces existe un vector λ0 = (λ01 , . . . , λ0m ) ∈ Rm
tal que
( ∂L
xi ∂x i
(x0 , λ0 ) = 0,
∀i ∈ {1, . . . , n} ∂L
∂xi (x0 , λ0 ) ≤ 0
0
λi (bi − gi (x0 )) = 0,
∀i ∈ {1, . . . , m} λ0i ≥ 0,
gi (x0 ) ≤ bi .
1Para ello, basta que la matriz cuyas columnas son los vectores gradiente
∇g1 (x0 )t , . . . , ∇gm (x0 )t , tenga rango m; no es necesario considerar las restricciones de no
negatividad en esta condición.
4. OPTIMIZACIÓN CON RESTRICCIONES DE DESIGUALDAD: EL MÉTODO DE KUHN-TUCKER
5
y vemos que si tiene un máximo (resp. mı́nimo), entonces éste es único. Tambión
se puede demostrar directamente a partir de la definición, sin necesidad de utilizar
las condiciones de primer orden.
Proposición 5.4. Sea C ⊆ Rn no vacı́ y convexo let f : C → R. Entonces
(1) El conjunto formado por los mı́nimos globales de una función convexa, es
convexo.
(2) El conjunto formado por los máximos globales de una función cóncava, es
convexo.
Proof Probaremos sólo la primera afirmación, pues la segunda es inmediata con-
siderando −f , que es una función cóncava si f es convexa. Sea M el conjunto de
minimizadores de f . Si M = ∅, entones el resultado es trivial.. Sean x1 , x2 ∈ M y
sea λ ∈ [0, 1]. Tenemos m = f (xi ) ≤ f (x), para todol x ∈ M , para i = 1, 2. Dado
que f es convexa, f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 ) = m, por lo que
λx1 + (1 − λ)x2 es un mı́nimo global de f , luego λx1 + (1 − λ)x2 ∈ M y M es
convexo.
Teorema 5.5. Sean C ⊆ Rn un conjunto no vaciı́ y convexo, f : C → R y sea x0
un punto interior de C. Entonces
(1) Si f es convexa y x0 es un máximo global de f en C, entonces f es constante.
(2) Si f es cóncava y x0 is mı́nimo global de f en C, entoncesn f es constante.
Definición 5.6. Sea C ⊆ Rn un conjunto convexo. Un punto x0 ∈ C es un vértice
de C si x0 = λx1 + (1 − λ)x2 para x1 , x2 ∈ C y λ ∈ [0, 1], implica λ = 0 o λ = 1.
Es decir, un punto del conjunto es un vértice, si no puede expresarse como combi-
nación convexa no trivial de otros dos puntos del conjunto. Notar que los vértices
son siempre puntos frontera que pertenecen al conjunto (pero no todo punto fron-
tera es un vértice, ¿por qué?). Por ejemplo, consideremos los conjuntos
C1 = {(x, y) ∈ R2 : x + y < 1},
C2 = {(x, y) ∈ R2 : x + y ≤ 1},
C3 = {(x, y) ∈ R2 : x + y ≤ 1, x ≥ 0, y ≥ 0},
C4 = {(x, y) ∈ R2 : x2 + y 2 ≤ 1}.
Todos son conjuntos convexos. Ni C1 ni C2 tienen vértices. C3 tiene tres vértices,
los puntos (0, 0), (0, 1) y (1, 0). C4 tiene un número infinito de vértices (la circun-
ferencia x2 + y 2 = 1).
Teorema 5.7. Sea C ⊆ Rn un conjunto no vacı́o, convexo y compacto, y sea
f : C → R continua. Entonces C tiene vértices y además:
(1) Si f es convexa, entonces f alcanza máximo global en alguno de los vértices
de C.
(2) Si f es cóncava, entonces f alcanza mı́nimo global en alguno de los vértices
de C.
Ejemplo 5.8. La función f (x, y) = −x2 −y 2 +ln(1+x+y) es (estrictamente) cóncava
en el conjunto compacto y convexo C3 descrito anteriormente. Las derivadas de f
son
1 1
∇f (x, y) = −2x + , −2y +
1+x+y 1+x+y
4. OPTIMIZACIÓN CON RESTRICCIONES DE DESIGUALDAD: EL MÉTODO DE KUHN-TUCKER
7
1 1
−2 − −
(1 + x + y)2 (1 + x + y)2
Hf (x, y) = .
1 1
− 2
−2 − 2
(1 + x + y) (1 + x + y)
1
Los menores principales de la matriz Hessiana de f son: ∆1 = −2 − (1+x+y) 2 < 0,
4
y ∆2 = 4 + (1+x+y)2 > 0 .
Los vértices de C3 fueron determinados como (0, 0), (0, 1) y (1, 0). Por el teorema
anterior, los mı́nimos globales de f en C3 se encuentran entre estos puntos. Dado
que f (0, 0) = 0, f (0, 1) = f (1, 0) = −1 + ln 2 < −1 + ln e = −1 + 1 = 0, los puntos
(0, 1) y (1, 0) son mı́nimos globales de f en C3 .
Notar que el teorema no dice nada sobre los máximos de f . Podrı́an localizarse
sobre el interior o sobre la frontera de C3 . Para hallarlos, habrı́a que resolver el
problema de KT correspondiente. Sin embargo, en este caso, las condiciones de
primer orden de optimalidad
∂f 1
(x, y) = −2x + = 0,
∂x 1+x+y
∂f 1
(x, y) = −2y + = 0,
∂y 1+x+y
√ √
tienen como única solución el punto ( 14 ( 5 − 1), 14 ( 5 − 1)), que pertenece al con-
√
junto C3 , pues sus componentes son no negativas y suman 12 ( 5 − 1) ≤ 1. Por
tanto, dicho punto es el único máximo global de f en C3 (y en todo R2+ ).