Mates 2
Mates 2
ADE/Economía/Marketing
Capítulo 1
Universitat d’Alacant
3. Formas cuadráticas
Introducción
Este capítulo es una continuación del último de la asignatura Matemáticas 1 y en el mismo se
analizarán distintas cuestiones sobre vectores n°dimensionales, planos en el espacio tridimensional
(R3 ) y algunas cuestiones sencillas sobre formas cuadráticas que jugarán un papel muy importante
en el desarrollo de la asignatura.
Suma/resta de vectores:
La suma o resta de vectores se realiza coordenada a coordenada
v + w = (v 1 , v 2 , . . . , v n ) + (w 1 , w 2 , . . . , w n ) = (v 1 + w 1 , v 2 + w 2 , . . . , v n + w n )
v ° w = (v 1 , v 2 , . . . , v n ) ° (w 1 , w 2 , . . . , w n ) = (v 1 ° w 1 , v 2 ° w 2 , . . . , v n ° w n )
Geométricamente, como se observa en la figura 1.1, el vector suma es la diagonal mayor del
paralelogramo que determinan los vectores, mientras que la resta viene determinada por la
diagonal menor (trasladada al origen).
1
CAPÍTULO 1: ÁLGEBRA LINEAL (continuación)
• Si el escalar tiene valor absoluto mayor que 1, la longitud del vector aumentará (se alarga
el vector)
• Si el escalar tiene valor absoluto entre 0 y 1, la longitud del vector disminuirá (se acorta el
vector)
• Si el escalar es positivo, mantendrá su sentido
• Si el escalar es negativo cambiará el sentido del vector
v · w = (v 1 , v 2 , . . . , v n ) · (w 1 , w 2 , . . . , w n ) = v 1 w 1 + v 2 w 2 + . . . + v n w n 2 R
Nota 1 Si los vectores de Rn se consideran como matrices columna n £1, y se representa su trans-
puesta (matriz fila 1 £ n) por v 0 , el producto escalar de dos vectores se escribe, en forma matricial
0 1
w1
B C
B w2 C
v · w = v 0 w = (v 1 , v 2 , . . . , v n ) B
B .. C = v1 w1 + v2 w2 + . . . + vn wn
C
@ . A
wn
Ejemplo 1 Dados los vectores de R3 , v = (1, °1, 2), w = (0, 3, °2) calcula:
• 3v + 5w = 3 (1, °1, 2) + 5 (0, 3, °2) = (3, °3, 6) + (0, 15, °10) = (3, 12, °4)
• v · w = (1, °1, 2) · (0, 3, °2) = 1 · 0 + (°1) · 3 + 2 · (°2) = 0 ° 3 ° 4 = °7
• v · v = (1, °1, 2) · (1, °1, 2) = 12 + (°1)2 + 22 = 1 + 1 + 4 = 6
Nota 2 Hay que señalar que el producto escalar de dos vectores es un número real que puede
ser positivo o negativo, como puede verse en los dos productos calculados en el ejemplo 1. Sin
embargo, cuando se multiplica un vector por sí mismo el resultado será siempre mayor o igual a
cero, ya que será la suma de las coordenadas del vector al cuadrado
n
X
v · v = (v 1 , v 2 , . . . , v n ) · (v 1 , v 2 , . . . , v n ) = v 1 v 1 + v 2 v 2 + . . . + v n v n = (v i )2 ∏ 0
i =1
De hecho, siempre que el vector sea distinto del vector nulo, el producto escalar del vector por sí
mismo dará un número estrictamente positivo. El único vector que cumple v · v = 0 es el vector
nulo, v = (0, 0, . . . , 0) .
Nótese que la raíz cuadrada está bien definida ya que, como se ha remarcado, el producto es-
calar de un vector por sí mismo es un número mayor o igual a cero.
Por otro lado, la norma de un vector es justo lo que mide este vector (en las unidades corres-
pondientes: metros, centímetros, ...). Por ejemplo, para el caso de vectores de R2 , v = (a, b), a
partir del Teorema de Pitágoras se tiene que la longitud del vector (la hipotenusa del triángulo
rectángulo) es igual a la raíz cuadrada de la suma de las coordenadas al cuadrado (los catetos al
cuadrado), es decir, la longitud de dicho vector coincide con su norma:
p
kvk = k(a, b)k = a2 + b2
Normalización de un vector:
El vector u del ejemplo 3 tiene longitud igual a 1. Se llama unitario a un vector de estas ca-
racterísticas, es decir que tiene norma igual a 1. En muchas ocasiones los vectores únicamente
indican una dirección en la que moverse, y su longitud es irrelevante. Es por ello que, en estos
casos, se eligen vectores unitarios.
Dado un vector v 2 Rn , se denomina normalizar este vector, a calcular otro vector que tenga la
misma dirección y sentido, y su longitud sea 1, es decir, sea unitario. Para obtenerlo, basta con
dividir el vector v por su longitud kvk,
v
u=
kvk
donde ' es el ángulo que forman dichos vectores. Hay que recordar que en el plano R2 el án-
gulo que forman dos rectas que se cortan se define como el menor de los dos ángulos que se
originan. De igual manera, para cualquier dimensión, el ángulo entre dos vectores siempre se
considera entre [0, º] (entre 0 y 180 grados).
Si se despeja en la fórmula anterior el coseno, queda
v ·w v1 w1 + v2 w2 + . . . + vn wn
cos(') = = qP qP
kvk kwk n
(v )2 n
(w )2
i =1 i i =1 i
Tienen especial interés los casos en que los vectores son proporcionales (forman un ángulo de 0
grados, cuando cos(') = 1, o de 180 grados, º radianes, cuando cos(') = °1) o perpendiculares
º
(también denominados ortogonales, forman un ángulo de 90 grados, radianes). En este caso,
2
v ·w
como cos(º/2) = 0 = se cumple que:
kvk kwk
Ejemplo 6 Los vectores del ejemplo 1 no son perpendiculares, ya que, según se ha visto, su pro-
ducto escalar vale °7 6= 0. El coseno del ángulo que forman vale
°7 7
cos(') = p p = ° p
6 13 78
que es diferente de 1, °1 y, por tanto, tampoco son proporcionales. Con la ayuda de una calcula-
dora, se puede obtener que ' º 10 43 radianes (º 82o ).
Ejemplo 7 Analiza si los siguientes vectores son perpendiculares o proporcionales y, en este caso,
indica el ángulo que forman (' = 0, ' = º).
Ejercicio 1 Encuentra un vector en el plano R2 que sea perpendicular al vector v = (3, °2).
siendo c un número real, c 2 R. Al vector p = (A, B,C ) se le denomina vector perpendicular (o vector
normal) al plano.1
Dado un punto (x 0 , y 0 , z 0 ) 2 R3 y un vector no nulo p = (A, B,C ) 6= (0, 0, 0), solo hay un plano en R3
que pasa por dicho punto y es perpendicular al vector p, que tiene la ecuación
Ejemplo 8 Calcula la ecuación del plano que pasa por el punto (1, °1, 2) y es perpendicular al vector
p = (°2, 2, °1). Calcula otros dos puntos que estén en el plano.
La ecuación del plano es
Para obtener otros dos puntos, una vez se tiene la ecuación del plano se dan valores a las variables x, y,
calculando el valor de z que cumple la ecuación. Por ejemplo,
Ejemplo 9 Obtén un vector unitario que sea perpendicular al plano 3x ° y + 5z = °21. Encuentra un
punto con las tres coordenadas iguales que esté en el plano.
Un vector perpendicular se obtiene tomando los coeficientes de las variables x, y, z en la ecuación
del plano. Por tanto, en este caso será
µ p = (3, °1, 5). ∂Este vector no tiene norma 1, luego es necesario
p 3 °1 5
normalizarlo: kpk = 35, luego u = p , p , p .
35 35 35
Para que un punto con tres coordenadas iguales (a, a, a) esté en el plano, debe cumplir su ecuación:
Ejemplo 10 Analiza, para cada uno de los diferentes apartados, si los planos son paralelos, o si se
cortan formando un ángulo de 90o .
3x + y = 2, °x + y ° z = 1
Los vectores normales son p = (3, 1, 0), q = (°1, 1, °1). Si se realiza el producto escalar de estos
vectores, p · q = °3 + 1 + 0 = °2 6= 0, luego no forman un ángulo de 90o . También se observa que
estos vectores no son proporcionales, por tanto los planos no son paralelos.
x ° 2y ° 00 5z = 12, °2x + 4y + z = 1
Los vectores normales son p = (1, °2, °00 5), q = (°2, 4, 1). Si se realiza el producto escalar de estos
vectores, p·q = °2°8°00 5 = °100 5 6= 0, luego no forman un ángulo de 90o . En este caso, se observa
que estos vectores son proporcionales, q = °2p, por tanto los planos son paralelos.
x + y + z = 3, °x + 2y ° z = 0
Los vectores normales son p = (1, 1, 1), q = (°1, 2, °1). Si se realiza el producto escalar de estos
vectores, p · q = °1 + 2 ° 1 = 0, luego los planos se cortan formando un ángulo de 90o .
3. Formas cuadráticas
Definición 1 Dada una matriz cuadrada simétrica A n£n , se llama forma cuadrática asociada a dicha
matriz a una función Q : Rn ! R que a cada vector v 2 Rn le asocia el número real
n
X
Q(v) = v 0 Av = ai j v i v j
i , j =1
Nota 3 ¿Por qué se llaman formas cuadráticas? La razón es porque se trata de polinomios (en varias
variables) en los que todos los sumandos tienen grado exactamente dos (cuadrático), sumando los ex-
ponentes de las variables que aparecen en cada sumando. En el caso de una variable, se trataría de
funciones del tipo f (x) = ax 2 , es decir, parábolas.
5. Indefinida en cualquier otro caso; es decir, si existe un vector v no nulo, v 6= 0, tal que Q(v) =
v 0 Av > 0 y existe otro vector w no nulo, w 6= 0, tal que Q(w) = w 0 Aw < 0
Nota 4 Cuando en una forma cuadrática aparecen solo las variables al cuadrado (no aparecen los
productos de dos variables diferentes), como es el caso de los ejemplos anteriores, es fácil saber el signo
que tiene dicha forma cuadrática. Sin embargo, cuando aparecen los productos de distintas variables
x y, xz, . . . (por ejemplo, Q(x, y) = x 2 + 5x y + 4y 2 , o Q(x, y) = x 2 ° 4x y + 4y 2 ) ya no resulta tan evidente,
ni siquiera en el caso de solo dos variables. En los siguientes apartados se verá cómo saber de manera
sencilla el signo de una forma cuadrática.
Definición 3 Dada una matriz A n£n los menores principales superiores izquierda son los determi-
nantes
0 1
µ ∂ a 11 a 12 a 13
a 11 a 12
D 1 = a 11 D 2 = det D 3 = det @ a 21 a 22 a 23 A ... D n = det(A)
a 21 a 22
a 31 a 32 a 33
Si los menores principales superiores izquierda de la matriz simétrica A asociada a una forma
cuadrática Q(v) son todos distintos de cero, D i 6= 0, para i = 1, 2, . . . , n, la forma cuadrática se puede
expresar del siguiente modo
D2 2 D3 2 Dn 2
Q(v) = v 0 Av = D 1 u 12 + u + u ...+ u
D1 2 D2 3 D n°1 n
siendo u 1 , u 2 , ..., u n nuevas variables (obtenidas mediante cambios de variable). Entonces solo apa-
recen las variables al cuadrado, y son los D i (los menores principales superiores izquierda) los que
deciden el signo de la forma cuadrática. Se tiene por tanto que:
Si todos los menores principales superiores izquierda son distintos de cero, y no sigue ninguna de
las reglas anteriores, la forma cuadrática es indefinida. En particular, en cuanto un menor principal
superior izquierda de orden par sea negativo, la forma cuadrática es indefinida, y no es necesario
realizar ya más cálculos de determinantes.
Nota 5 Cuando hay menores principales superiores izquierda nulos, las reglas anteriores no se pueden
aplicar y quedan, por tanto, sin analizar los casos de formas cuadráticas semidefinidas. Para clasifi-
carlas es necesario realizar más cálculos. Un primer caso fácil es el siguiente:
a) Si det(A) = 0, pero el resto de menores principales superiores izquierda son estrictamente positivos,
la forma cuadrática es semidefinida positiva
b) Si det(A) = 0, pero el resto de menores principales superiores izquierda son distintos de cero y van
cambiando de signo empezando por negativo, la forma cuadrática es semidefinida negativa
menores principales de orden 1 a los determinantes que se obtienen eliminando las mismas n°1
filas y columnas de la matriz A; es decir, los elementos
H1 = {a 11 , a 22 , . . . , a nn }
menores principales de orden 2 a los determinantes que se obtienen eliminando las mismas n°2
filas y columnas de la matriz A; es decir, los determinantes cuando se toman todas las submatri-
ces 2 £ 2 formadas con las mismas filas que columnas
Ω µ ∂ µ ∂ µ ∂ æ
a 11 a 12 a 11 a 13 a 22 a 23
H2 = det , det , det , ...
a 21 a 22 a 31 a 33 a 32 a 33
menores principales de orden 3 a los determinantes que se obtienen cuando se toman todas las
submatrices 3 £ 3 formadas con las mismas filas que columnas
8 0 1 0 1 0 1 9
< a 11 a 12 a 13 a 11 a 12 a 14 a 22 a 23 a 24 =
H3 = det @ a 21 a 22 a 23 A , det @ a 21 a 22 a 24 A , det @ a 32 a 33 a 34 A , . . .
: ;
a 31 a 32 a 33 a 41 a 42 a 44 a 42 a 43 a 44
...
Definición 5 Dada una matriz A n£n sea Hk el conjunto de todos2 los menores principales de orden k.
Por tanto, Hk es un conjunto de valores numéricos. Entonces, se dice que:
Usando los menores principales de la matriz simétrica ya se pueden clasificar formas cuadráticas
de cualquier tipo. Se cumple que la forma cuadrática Q(v) = v 0 Av es:
Por tanto la forma cuadrática es semidefinida negativa. Hay que señalar que este ejemplo se resuelve
mucho más fácilmente con los valores propios que son los elementos en la diagonal principal, ya que la
matriz es triangular (diagonal, en realidad). Así, los valores propios son ∏1 = 0, ∏2 = °1, ∏3 = °2,
luego se llega a misma conclusión (semidefinida negativa).
Si la forma cuadrática en todo el espacio tenía un signo definido (definida positiva o definida
negativa), la forma cuadrática restringida tendrá obviamente el mismo signo (si es siempre positiva,
será positiva en un subespacio; y lo mismo con negativa). Pero si la forma cuadrática es semidefinida,
o indefinida, podrá cambiar y tener un signo definido en algún subespacio.
Sin embargo, en el subespacio de vectores de la forma (x, °x) (la segunda coordenada es igual a
la primera con el signo cambiado), queda Q(x, °x) = 0, que es la forma cuadrática nula (a la vez
semidefinida positiva y semidefinida negativa).
es indefinida (solo hay que observar que D 2 < 0). Si se considera el subespacio de vectores en que las tres
coordenadas suman cero, x + y + z = 0, la forma restringida (despejando z = °x ° y) queda
cuya matriz es
µ ∂
°1 °2
B= D 1 = °1 < 0, D2 = 0 ∏ 0
°2 °4
luego la forma cuadrática restringida al subespacio es semidefinida negativa.
es indefinida como se ha visto en el ejemplo 15. Si se considera el subespacio de vectores en que las dos
últimas coordenadas son iguales pero de signo contrario, z = °y, la forma restringida queda
cuya matriz es
µ ∂
1 1
B= D 1 = 1 > 0, D 2 = 13 > 0
1 14
luego la forma cuadrática restringida al subespacio es definida positiva.
4. Continuidad. Propiedades
7. Derivada direccional
15
CAPÍTULO 2: FUNCIONES DE VARIAS VARIABLES
Hay que señalar que este concepto es una generalización de intervalo abierto. Si se aplica a una va-
riable, a 2 R, B (a, r ) = (a ° r, a + r ).
Ejemplo 1 En el plano bidimensional R2 , estos conjuntos se corresponden con círculos abiertos (no
contienen a la circunferencia que delimita el círculo):
q
(x 1 ° a 1 )2 + (x 2 ° a 2 )2 < r () (x 1 ° a 1 )2 + (x 2 ° a 2 )2 < r 2
Por ejemplo, la bola de centro el punto (2, °4) y radio r = 3, sería el círculo de ecuación
Ejemplo 2 En el espacio tridimensional R3 , las bolas abiertas se corresponden con esferas abiertas,
que no contienen a la superficie que las delimita:
q
(x 1 ° a 1 )2 + (x 2 ° a 2 )2 + (x 3 ° a 3 )2 < r () (x 1 ° a 1 )2 + (x 2 ° a 2 )2 + (x 3 ° a 3 )2 < r 2
Interior al conjunto S si existe una bola de centro dicho punto que está completamente contenida
en S; esto es, B (a, r ) Ω S, para algún r > 0 (quizás pequeño).
Exterior al conjunto S si existe una bola de centro dicho punto completamente fuera de S. Los
puntos que no están en S, forman el denominado conjunto complementario de S, que se repre-
senta por Rn ° S. Entonces, ser exterior a S significa que existe una bola tal que B (a, r ) Ω (Rn ° S),
para algún r > 0 (quizás pequeño).
Frontera si no es interior ni exterior. Entonces todas las bolas de centro dicho punto deben tener
puntos de S y puntos de fuera de S:
Nota 1 Claramente un punto interior a un conjunto S debe pertenecer a dicho conjunto. De igual ma-
nera, un punto exterior no puede pertenecer a S. Sin embargo, los puntos frontera pueden estar, o pue-
den no estar, en el conjunto.
© ™
Ejemplo 3 Dado el subconjunto de R2 , S = (x, y) : 0 ∑ x < 1, 0 ∑ y ∑ 2 , analiza si los puntos (1, 1),
(2, 0), (00 5, 1), (00 5, 2) son interiores, exteriores o frontera del conjunto S.
A la vista de la imagen gráfica del conjunto S (ver figura 2.3), es inmediato observar que el punto
(1, 1) es frontera, ya que cualquier bola (círculo) de centro este punto está en parte dentro y en
parte fuera del conjunto S. Hay que señalar que este punto no está en el conjunto S.
° ¢
El punto (2, 0) claramente es exterior: por ejemplo, la bola B (2, 0), 00 1 está totalmente fuera del
conjunto S.
° ¢
El punto (00 5, 1) es interior ya que, por ejemplo, B (00 5, 1), 00 1 Ω S.
Finalmente, el punto (00 5, 2) es también frontera porque toda bola centrada en dicho punto tiene
parte dentro y parte fuera de S. En este caso, el punto sí que pertenece a S.
Ejercicio 1 Indica gráficamente quiénes son el conjunto de puntos interiores, int(S), de puntos exterio-
res, ext(S), y de puntos frontera, Fr(S), en el conjunto S del ejemplo 3.
© ™
Ejemplo 4 Dado el subconjunto de R2 , S = (x, y) : x ° y ∏ 0, x + y ∑ 2, x > 0, y ∏ 0 , analiza si los pun-
tos (1, 1), (0, 3), (0, 0), (1, 00 5) son interiores, exteriores o frontera del conjunto S.
El primer paso es obtener la imagen gráfica del conjunto (figura 2.4). Una vez se tiene el dibujo es
fácil razonar la cuestión planteada:
El punto (1, 1) es frontera, ya que cualquier bola de centro este punto está en parte dentro y en
parte fuera de S. El punto (1, 1) está en el conjunto S.
° ¢
El punto (0, 3) claramente es exterior: por ejemplo, la bola B (0, 3), 00 1 está totalmente fuera del
conjunto S.
El punto (0, 0) es frontera, ya que toda bola centrada en este punto tiene parte dentro y parte
fuera de S. Hay que señalar que este punto no está en el conjunto S.
° ¢
El punto (1, 00 5) es interior ya que, por ejemplo, B (1, 00 5), 00 1 Ω S.
Nota 2 Cuando un conjunto está definido con un número finito de desigualdades (como en los ejem-
plos 3 y 4), un punto será interior cuando cumpla todas las desigualdades estrictamente.
Definición 3 Un conjunto S µ Rn se dice que es abierto si todos sus puntos son interiores a S. Un con-
junto T µ Rn se dice que es cerrado si su complementario, el conjunto S = Rn ° T , es abierto.
Nota 3 Es importante señalar que ser abierto y ser cerrado no son conceptos opuestos, ya que hay con-
juntos que no son ni lo uno ni lo otro. Se puede observar que los conjuntos en los ejemplos 3 y 4 no son
ni abiertos, ni cerrados.
Por otro lado, hay dos conjuntos (únicamente dos) que son, a la vez, abiertos y cerrados. Estos
conjuntos son el vacío (;) y el espacio total ( Rn ):
; es abierto ya que todos sus puntos son interiores (o, mejor expresado, no tiene ningún punto
que no sea interior)
En esta asignatura son de especial importancia los conjuntos cerrados. Una forma alternativa
(equivalente) de definir un conjunto cerrado es la siguiente:
Esta forma puede ser más fácil para estudiar que un conjunto es cerrado que el análisis de que su
complementario es un conjunto abierto.
Ejemplo 5 Analiza si los siguientes conjuntos son abiertos, cerrados, o ni abiertos ni cerrados.
a) Una bola B (a, r ) es claramente un conjunto abierto: cualquier punto x 2 B (a, r ) que se considere es
un punto interior a la bola.
b) Una bola cerrada se define añadiendo la bola abierta los puntos que la delimitan. En R2 se añadiría
la circunferencia. En general, su definición sería
© ™ © ™
B (a, r ) = x 2 Rn : d (x, a) ∑ r = x 2 Rn : kx ° ak ∑ r =
( s ) ( )
n
X n
X
n n 2 2
= x 2R : (x i ° a i )2 ∑r = x 2R : (x i ° a i ) ∑ r
i =1 i =1
c) Una recta, un plano, un hiperplano son conjuntos cerrados. Este tipo de conjuntos se expresan con
igualdades y, por tanto, todos sus puntos son frontera. Al contener a toda su frontera son conjuntos
cerrados. Por ejemplo, los conjuntos definidos por las siguientes igualdades son cerrados:
S = {(x, y) 2 R2 : x ° 6y = 21}
S = {(x, y, z) 2 R3 : 2x ° y + z = 2}
S = {(x 1 , x 2 , . . . , x n ) 2 Rn : x 1 + x 2 + . . . + x n = 1}
d) Los semiespacios son los conjuntos que quedan por encima (o por debajo) de una recta, plano o
hiperplano (incluyendo a estos). Formalmente su expresión es de la forma
( )
Xn
n
S = x 2R : p i xi ∑ A A 2 R, p i 2 R, i = 1, 2, . . . , n
i =1
S = {(x 1 , x 2 , . . . , x n ) 2 Rn : x 1 + x 2 + . . . + x n ∑ 1}
Definición 4 Un conjunto S Ω Rn se dice que es (o que está) acotado si existe una bola (con radio R
arbitrariamente grande) que lo contiene integramente: 9 R > 0 tal que S Ω B (0, R)
Nota 4 Por comodidad, en la anterior definición se consideran bolas con centro el origen 0, pero el
centro de la bola que contiene al conjunto S podría estar en un punto cualquiera.
Los conjuntos de los ejemplos 3 y 4 son acotados: basta tomar, por ejemplo R = 10.
Las rectas, planos, hiperplanos o semiespacios son conjuntos no acotados: no es posible encontrar
una bola que los contenga.
© ™
b) S = (x, y) 2 R2 : 2 ∑ x ∑ 3, 1 ∑ y ∑ 2 (figura 2.6).
Este conjunto es cerrado (contiene a toda su frontera) y acotado (se puede incluir dentro de la bola
B ((0, 0), 10)), luego sí es compacto.
© ™
c) S = (x, y) 2 R2 : y = 3x ° 2 (figura 2.7).
Este conjunto es cerrado (todos sus puntos son frontera), pero no está acotado (se trata de una recta
en el plano que no se puede poner dentro de una bola). Por tanto, no es un conjunto compacto.
© ™
d) S = (x, y) 2 R2 : x + y = 1, x ∏ 0, y ∏ 0 (figura 2.8).
Este conjunto es un trozo de una recta (lo que queda en el cuadrante positivo) y se observa que es
cerrado (contiene toda su frontera) y acotado (está incluido en la bola B ((0, 0), 2)). Por tanto, sí se
trata de un conjunto compacto.
Ejercicio 2 Analiza si los conjuntos que aparecen en los ejemplos 3, 4, 5 y 6 son compactos.
Ejemplo 8 Las siguientes funciones, vinculadas al mundo de la economía y la empresa, son ejemplos
de funciones que dependen de varias variables.
Del mismo modo, si se tienen n mercancías con precios respectivos p i , los ingresos son una fun-
ción de varias variables que se puede expresar en la forma
n
X
I = (p 1 , p 2 , . . . , p n ) · (x 1 , x 2 , . . . , x n ) = p i xi
i =1
La función media aritmética asocia a cada conjunto de valores el promedio de los mismos:
x1 + x2 + . . . + xn
x = f (x 1 , x 2 , . . . , x n ) =
n
≥ ¥° 1
Definición 8 Se llama función CES a toda función del tipo F (K , L) = A ±K °Ω + (1 ° ±)L °Ω
Ω
,
donde A > 0, 0 < ± < 1, °1 < Ω 6= 0, son números reales (constantes) conocidos.
constante.
P I B = C pr + I nv pr +G + (X ° M )
En la mayoría de ejemplos se trabajará con dos variables, por simplicidad en expresiones y cálcu-
los. La extensión a más variables no tiene dificultad.
a) f (x, y) = 2x ° 3y
b) f (x, y) = x 2 + y 2
x+y
c) f (x, y) =
y ° x2
p
d) f (x, y) = 4 ° x 2 ° y 2
e) f (x, y) = ln(x 2 + y 2 ° 1)
Los problemas de dominio vienen dados, como siempre, por los cocientes (denominador distinto
de cero), raíces cuadradas (solo para números no negativos) y los logaritmos (solo para números
estrictamente positivos). El razonamiento del dominio de una función con varias variables se realiza
de forma análoga al caso de una variable.
Salvo las funciones de producción, todas las demás se obtienen mediante suma o resta de va-
riables, por lo que siempre se pueden calcular. Sin embargo, el contexto económico hace que las
variables se deban considerar mayores o iguales a cero, luego su dominio (económico) sería Rn+ .
Respecto a la función Cobb-Douglas, al aparecer raíces cuadradas, cuartas, ... se necesita que
las variables sean no negativas, K ∏ 0, L ∏ 0, para poder calcularse. Finalmente, la función CES
exige, en general, que las variables sean estrictamente positivas, ya que pueden aparecer en un
denominador, K > 0, L > 0.
Las funciones de los casos a) y b) pueden ser calculadas para cualquier valor de (x, y); por tanto,
en ambos casos su dominio es D f = R2
En el caso de funciones de una variable (n = 1), este conjunto está en R2 y dibujar la gráfica resulta
muy útil. Para el caso de dos variables (n = 2) el conjunto G f está en R3 y se trata de superficies en
el espacio tridimensional que pueden imaginarse dibujando proyecciones, pero es bastante compli-
cado. Por ello, en este caso se usarán las curvas de nivel. Para más variables no es posible realizar
representaciones gráficas.
Los mapas topográficos de una determinada zona, como el de la figura2 2.9, se construyen dibu-
jando las lineas que unen los puntos que están a la misma altura (sobre el nivel del mar) o, lo que
es lo mismo, realizando cortes mediante planos horizontales (planos con ecuación z = C ). Si alguien
se desplaza siguiendo una de las líneas, seguirá un camino horizontal (totalmente llano, sin subidas
ni bajadas). Si las líneas están muy juntas significa que hay brusco cambio de altura, mientras que si
están separadas es que la pendiente es leve. Entre dos curvas consecutivas hay el mismo cambio de
altura, aunque en unas zonas están más cerca y en otras más alejadas.
Los mapas del tiempo, como el de la figura3 2.10, muestran unas líneas que unen los puntos que
tienen la misma presión atmosférica (isobaras). Cuando las líneas están muy cerca hay cambios brus-
cos de presión, que da lugar a inestabilidad atmosférica (borrascas). Cuando las líneas están muy
separadas el tiempo es estable (anticiclón).
2 http://biogeotesttoni.blogspot.com.es/2015/04/1-bachillerato-interpretacion-de-mapas.html (fecha de la consulta:
4/12/2015)
3 Agencia Estatal de Meteorología: previsión del tiempo para el 7/12/2015
Figura 2.10: Ejemplo curvas de nivel: líneas isobaras (mapas del tiempo)
En economía se usan de manera habitual las curvas de nivel para denotar distintas combinacio-
nes de las variables que proporcionan el mismo resultado (el prefijo iso, del griego, significa igual).
Así, por ejemplo
Las curvas isocuantas representan distintas combinaciones de los factores productivos que dan
lugar a la misma producción (curvas de nivel de la función de producción).
Las curvas isocostes, o isobeneficios, representan distintas combinaciones de factores que dan
lugar a un mismo coste de producción, o a un mismo beneficio, respectivamente.
Las curvas de indiferencia unen distintas combinaciones de cestas de bienes que proporcionan
la misma utilidad al consumidor (curvas de nivel de la función de utilidad).
Nota 5 Un hecho que hay que resaltar es que dos curvas de nivel distinto, C 1 6= C 2 , no se pueden cortar.
Si un punto (x § , y § ) está en dos curvas de nivel, entonces f (x § , y § ) = C 1 y f (x § , y § ) = C 2 , lo que no puede
cumplirse si dichos valores son diferentes.
Ejemplo 13 La función utilizada en la figura 2.11 es f (x, y) = x 2 + y 2 . La curva depnivel C está definida
por la ecuación x 2 + y 2 = C , que es una circunferencia de centro (0, 0) y radio r = C .
Es habitual realizar un mapa de curvas de nivel; es decir, representar varias curvas de nivel que
muestran cómo es el comportamiento de la función. Las curvas se obtienen para distintos niveles C
que suelen tomarse equidistantes (por ejemplo, C = 0, 1, 2, 3, 4, . . .) y de este modo el que las curvas
de nivel estén muy juntas significará que hay una variación rápida en el valor de la función (mucha
pendiente), mientras que si están muy separadas la variación será muy lenta (poca pendiente).
Ejemplo 14 Calcula y representa las curvas de nivel de la función lineal f (x, y) = 4x ° 2y.
C
f (x, y) = C ) 4x ° 2y = C ) y = 2x °
2
que son rectas paralelas todas con pendiente m = 2.
Ejemplo 15 Calcula y representa las curvas de nivel de la función (silla de montar) f (x, y) = x 2 ° y 2 .
La imagen gráfica (en tres dimensiones) de esta función se puede observar en la figura 2.14.
p
f (x, y) = C ) x2 ° y 2 = C ) y = ± x 2 °C
Ejemplo 16 Las curvas de nivel de las funciones de producción Cobb-Douglas (figura 2.15) son de tipo
hipérbola. Cuando los exponentes de las variables K , L son iguales (simétrica) entonces
1 D
F (K , L) = K Æ L Æ = C ) KL =C Æ =D ) K=
L
que es la ecuación de la hipérbola. Cuando los exponentes son distintos (asimétrica), por ejemplo con
Æ = 1/4, Ø = 1/2, queda
0 0 D
F (K , L) = K 0 25 L 0 5 = C ) K L2 = C 4 = D ) K=
L2
Ejemplo 17 Una función utilizada en modelizaciones económicas es la función mínimo. Con dos va-
riables, esta función se define por f (x, y) = mı́n{x, y}. Sus curvas de nivel son semirrectas formando un
ángulo de 90o con vértice en los puntos de la bisectriz del primer cuadrante (es decir, en los puntos de
la recta y = x).
4. Continuidad. Propiedades
Los conceptos de límite de una función en un punto y continuidad son similares a los analizados
con una variable (el cambio principal consiste en sustituir intervalos abiertos por bolas abiertas).
Definición 11 Dada una función de n variables f : D µ Rn ! R, se dice que el límite de f (x) cuando
x = (x 1 , x 2 , . . . , x n ) tiende al punto a = (a 1 , a 2 , . . . , a n ) 2 D vale L 2 R si
8 " > 0, existe ± > 0 tal que x 2 B (a, ±) ) | f (x) ° L| < "
x2 ° y 2 0
b) lı́m = (indeterminación)
(x, y) ! (0, 0) x°y 0
x 6= y
(x ° y)(x + y) x+y
) lı́m = lı́m =0
(x, y) ! (0, 0) x°y (x, y) ! (0, 0) 1
x 6= y x 6= y
En el estudio de funciones de una variable, se analizan los límites laterales para obtener el posible
valor del límite (si coinciden los límites laterales), o para probar que el límite no existe (si los límites
laterales son distintos). Cuando se trata de funciones de varias variables, como se ha comentado,
existen múltiples modos de aproximarse a un punto (derecha/izquierda, arriba/abajo, ...). Pero la
idea para ver que un límite no existe sigue siendo la misma: si se encuentran dos modos distintos de
aproximarse al punto que dan límites diferentes, el límite de la función no existirá. En caso de que
coincidan, se tendrá una idea del posible límite, aunque no hay garantía de que exista.
Se usarán para aproximarse a un punto direcciones sencillas (rectas, o funciones conocidas), o los
denominados límites iterados. Estos límites lo que hacen es calcular un límite múltiple, primero para
una variable (manteniendo las otras variables constantes), luego para una segunda variable (mante-
niendo el resto constantes), y así sucesivamente. Para el caso de dos variables, si se quiere estudiar
lı́m f (x, y), los límites iterados se definen del siguiente modo:
(x,y)!(a,b)
≥ ¥ µ ∂
L 1 = lı́m lı́m f (x, y) L 2 = lı́m lı́m f (x, y)
y!b x!a x!a y!b
Por ejemplo, para calcular L 1 primero se calcula el límite cuando x ! a, y la variable y se toma
como una constante. Una vez obtenido el resultado de este límite (que, en general, quedará una fun-
ción de y) se calcula el límite cuando y ! b (ruta de color azul en la figura 2.18). Para calcular L 2 se
utiliza un razonamiento análogo cambiando el orden de las variables (ruta de color rojo en la figura
2.18).
x °5
Ejemplo 19 Si se desea calcular el límite de la función f (x, y) = cuando (x, y) tiende a (5, 5), los
x°y
límites iterados son µ ∂
x °5 0
L 1 = lı́m lı́m = lı́m = lı́m 0 = 0
y!5 x!5 x ° y y!5 5 ° y y!5
µ ∂
x °5 x °5
L 2 = lı́m lı́m = lı́m = lı́m 1 = 1
x!5 y!5 x ° y x!5 x ° 5 x!5
x °5
Como L 1 6= L 2 , entonces lı́m no existe.
(x,y)!(5,5) x ° y
Otro método para estudiar límites de funciones con dos variables consiste en sustituir una de las
variables por una dirección que se acerque al punto en el que se está interesado.
Dado un punto (a, b), una dirección (o trayectoria) en este punto viene definida por una
función continua y = ø(x) tal que ø(a) = b. Por ejemplo, en el punto (0, 0) se tienen las
siguientes trayectorias:
p
a) ø(x) = x b) ø(x) = x 2 c) ø(x) = |x| d ) ø(x) = 6x e) . . .
El límite direccional en el punto (a, b) según la trayectoria y = ø(x) en dicho punto se define por
° ¢
Lø = lı́m f (x, y) = lı́m f (x, ø(x))
(x, y) ! (a, b) x!a
y = ø(x)
x °5 x °5
a) L ø = lı́m = lı́m que no existe
(x, y) ! (5, 5) x ° y x!5 x °x
y =x
x °5 x °5 1
b) L ø = lı́m = lı́m =
(x, y) ! (5, 5) x ° y x!5 2x ° 10 2
y = °x + 10
Luego, como se sabía, el límite de la función no existe en el punto (5, 5). La figura 2.20 muestra las
diferentes maneras de acercarse al punto (5, 5) que se han utilizado.
Como los límites iterados son diferentes, no existe el límite de la función en el punto (0, 0)
Como método alternativo para realizar el estudio podrían usarse límites direccionales. Por
ejemplo
x+y 3x
a) ø(x) = 2x ) L ø = lı́m = lı́m = °3
(x, y) ! (0, 0) x ° y x!0 °x
y = 2x
x+y 4x
b) ø(x) = 3x ) Lø = lı́m = lı́m = °2
(x, y) ! (0, 0) x ° y x!0 °2x
y = 3x
Como los límites direccionales son diferentes, no existe el límite de la función en el punto (0, 0)
xy 0
2) lı́m = (indeterminación)
(x,y)!(0,0) x2 + y 2 0
Los límites iterados
µ son: ∂
xy 0
a) L 1 = lı́m lı́m 2 2
= lı́m 2 = lı́m 0 = 0
y!0 x!0 x + y y!0 y y!0
µ ∂
xy 0
b) L 2 = lı́m lı́m 2 = lı́m 2 = lı́m 0 = 0
x!0 y!0 x + y 2 x!0 x x!0
Como los límites iterados son iguales, no se puede afirmar nada sobre la existencia del límite
de la función en el punto (0, 0); en caso de existir, valdría L = 0
Deben usarse entonces límites direccionales. Por ejemplo
xy x2 1
a) ø(x) = x ) Lø = lı́m 2 + y2
= lı́m 2
=
(x, y) ! (0, 0) x x!0 2x 2
y =x
xy °x 2 1
b) ø(x) = °x ) Lø = lı́m 2 + y2
= lı́m 2
=°
(x, y) ! (0, 0) x x!0 2x 2
y = °x
Como los límites direccionales son diferentes, no existe el límite de la función en el punto (0, 0)
1) Existe f (a)
Como en el caso de funciones de una variable, la continuidad se razona usando funciones ele-
mentales conocidas y las propiedades de continuidad:
El cociente de funciones continuas es una función continua en todos aquellos puntos donde el
denominador no se anula
Esta última es la propiedad más importante, ya que permite combinar funciones conocidas de una
variable (exponencial, logaritmo, raíz, ...) para razonar la continuidad de funciones de varias varia-
bles.
A continuación se realiza el cociente. Como el denominador es siempre distinto de cero para cual-
quier (x, y), el cociente siempre existe y es una función continua.
Finalmente, se calcula la raíz, que se sabe que existe y es continua cuando el radicando (lo que
hay dentro de la raíz) es mayor o igual a cero. Como el denominador es siempre estrictamente
positivo, esto ocurrirá cuando el numerador sea no negativo.
Por tanto, por ser composición de funciones continuas, la función f (x, y) es continua en su dominio
© ™
D f = (x, y) 2 R2 : x + y ∏ 0
s µ ∂
xy
Ejercicio 3 Razona que la función f (x, y) = 10 ° sen es continua en todo R2 .
1 + x2 + y 2
f (a + h) ° f (a)
f 0 (a) = lı́m
h!0 h
@f f (a 1 , a 2 , . . . , a k + h, . . . , a n ) ° f (a 1 , a 2 , . . . , a k , . . . , a n )
(a) = lı́m para k = 1, 2, . . . , n
@x k h!0 h
Por tanto, una función de n variables tiene n derivadas parciales, una para cada x k . En el caso
particular de funciones de dos variables f (x, y) las dos derivadas parciales son
Como ocurre con funciones de una variable, las derivadas parciales representan el cambio mar-
ginal en un punto de una función de varias variables con respecto a cada una de ellas. Por ejemplo,
con dos variables:
El cambio marginal de la función con respecto a la primera variable en un punto (a, b) viene
dado por:
@f
f (a + 1, b) ° f (a, b) º (a, b)
@x
El cambio marginal de la función con respecto a la segunda variable en un punto (a, b) viene
dado por:
@f
f (a, b + 1) ° f (a, b) º (a, b)
@y
Ejemplo 24 Calcula, usando la definición, las derivadas parciales de las siguientes funciones en un
punto genérico.
1) f (x, y) = 3x ° y 2
2) f (x, y) = x ln(y)
@f f (x + h, y) ° f (x, y) (x + h) ln(y) ° x ln(y) h ln(y)
(x, y) = lı́m = lı́m = lı́m = ln(y)
@x h!0 h h!0 h h!0 h
@f f (x, y + h) ° f (x, y) x ln(y + h) ° x ln(y) 0
(x, y) = lı́m = lı́m = = (indeterminación5 )
@y h!0 h h!0 h 0
1
x
y +h x
= lı́m =
h!0 1 y
3) f (x, y, z) = x 2 ° y z
@f f (x + h, y, z) ° f (x, y, z) (x + h)2 ° y z ° (x 2 ° y z) 2xh + h 2
(x, y, z) = lı́m = lı́m = lı́m = 2x
@x h!0 h h!0 h h!0 h
@f f (x, y + h, z) ° f (x, y, z) x 2 ° (y + h)z ° (x 2 ° y z) °hz
(x, y, z) = lı́m = lı́m = lı́m = °z
@y h!0 h h!0 h h!0 h
@f f (x, y, z + h) ° f (x, y, z) x 2 ° y(z + h) ° (x 2 ° y z) °yh
(x, y, z) = lı́m = lı́m = lı́m = °y
@z h!0 h h!0 h h!0 h
Como ocurre con una variable, el cálculo de derivadas no se hace habitualmente usando la de-
finición, sino las reglas y propiedades de derivación conocidas (derivada de la suma, derivada del
producto, derivada del cociente, ...). Al calcular derivadas parciales se deriva respecto a la variable
considerada, tratando al resto de variables como constantes.
Ejercicio 4 Calcula, aplicando las reglas de derivación, las derivadas parciales de las funciones del
ejemplo 24. Comprueba que los resultados coinciden con los obtenidos.
@f y 2 1 2
= + 2x ye x y = + 2x ye x y
@x x y x
@f x 2 1 2
= + x 2e x y = + x 2e x y
@y x y y
x y2
2) f (x, y) =
3x + y
@f y 2 (3x + y) ° x y 2 3 y3
= =
@x (3x + y)2 (3x + y)2
2
@f 2x y(3x + y) ° x y 6x 2 y + x y 2
= =
@y (3x + y)2 (3x + y)2
p
3) f (x, y, z) = x y z
p p p
@f yz yz @f xz xz @f xy xy
= p = p = p = p = p = p
@x 2 x y z 2 x @y 2 x y z 2 y @z 2 x y z 2 z
Para calcular las derivadas parciales en un punto particular, simplemente hay que sustituir las
p
componentes del punto. Por ejemplo, las derivadas parciales de la función f (x, y, z) = x y z en el
punto (4, 1, 9) son
@f 3 @f 6 @f 2 1
(4, 1, 9) = (4, 1, 9) = = 3 (4, 1, 9) = =
@x 4 @y 2 @z 6 3
5 Se aplica L’Hôpital. Hay que tener en cuenta que la variable con respecto a la que se está calculando el límite es h.
Por tanto, su gradiente en el punto (°1, 2) será r f (°1, 2) = (4, °3). En el punto (1, 3) el vector
gradiente es r f (1, 3) = (11, 3).
Como se verá (y como se observa gráficamente en la figura 2.21), para puntos (x, y) suficiente-
mente cerca del punto (a, b) (esto es, puntos de una bola B ((a, b), r ), con r > 0 pequeño), el plano
tangente es una buena aproximación a la función:
Observando la ecuación del plano tangente, su vector normal está definido por los coeficientes de
x, y, z, con lo que el vector perpendicular al plano tangente a una superficie definida por una función
de dos variables f (x, y) es
° ¢
p = r f (a, b), °1
Figura 2.21: Plano tangente a la gráfica de una función de dos variables (superficie)
Ejemplo 27 Calcula la ecuación del plano tangente en el punto (°1, 2) a la superficie en R3 definida
por la función f (x, y) = x 2 + 3x y
f (°1, 2) = °5
ecuación plano: 4x ° 3y ° z = °5
Ejemplo 28 Usualmente, la función de producción de una empresa f (K , L) depende del capital K y del
trabajo L. Pero ambas variables pueden ser consideradas como funciones del tiempo t , ya que su valor
no es constante sino que va fluctuando a lo largo de un intervalo temporal:
K = K (t ), L = L(t ) t 2 [t 0 , t 1 ]
df @ f d x1 @ f d x2 @ f d xn X n @f dx
i
f 0 (t ) = = + +...+ =
dt @x 1 d t @x 2 d t @x n d t i =1 @x i d t
7. Derivada direccional
Como se sabe, las derivadas indican cómo cambia una función. En el caso de dos variables, las
dos derivadas parciales indican cómo varía la función cuando cambia cada una de ellas por separa-
do. Pero, en ocasiones, se está interesado en conocer cómo cambia la función cuando las variables se
mueven en una determinada dirección que no es la de las parciales (por ejemplo, si ambas variables
cambian por igual, es decir se mueven en la dirección del vector (1, 1)). También puede ser interesante
determinar las direcciones que hacen crecer (o decrecer) más a la función (dirección de máximo creci-
miento/decrecimiento). Esta información viene proporcionada por las derivadas direccionales de una
función. Bajo ciertas condiciones habituales, estas derivadas direccionales se obtienen utilizando el
vector gradiente de la función. Aquí se definirán de esta manera.
Definición 14 Sea f (x) una función de n variables, x = (x 1 , x 2 , . . . , x n ), que tiene derivadas parciales
continuas en un punto a = (a 1 , a 2 , . . . , a n ) de su dominio. Dado un vector unitario (dirección normali-
zada), v = (v 1 , v 2 , . . . , v n ), kvk = 1, la derivada direccional de f (x) en el punto a, según la dirección de
v es
@f @f @f X n @f
D f (a; v) = r f (a) · v = (a)v 1 + (a)v 2 + . . . + (a)v n = (a)v i
@x 1 @x 2 @x n i =1 @x i
Nota 8 Es importante observar que el vector v debe tener norma 1. En caso de que se esté interesado
en una dirección no unitaria, por ejemplo el vector en el que las dos componentes crecen por igual
w = (1, 1), el primer paso será normalizar el vector
µ ∂
1 1 1 1
v= w ) v = p (1, 1) = p , p
kwk 2 2 2
Obsérvese en la figura 2.22 que el punto (1, 1) está en la curva de nivel C = 0. Si se mueve en la direc-
ción del vector (1, 2) va hacia la curva de nivel C = °5 (luego decrece), mientras que si se mueve en la
dirección de (2, 1) va hacia la curva de nivel C = 5 y la función crece.
A partir de las propiedades vistas en el capítulo anterior, al ser la derivada direccional un producto
escalar de dos vectores se puede expresar del siguiente modo
por ser el vector unitario, donde ' es el ángulo que forman el vector gradiente r f (a) y el vector
que indica la dirección v. Por tanto, los valores de la derivada direccional únicamente dependen del
ángulo '. Como cos(') es un valor entre °1 y +1, y kr f (a)k es un número positivo constante, la
derivada direccional tomará el valor máximo cuando cos(') = 1, es decir cuando el ángulo sea de 0o ,
lo que significa que el vector v y el gradiente tienen la misma dirección y sentido. Se tiene por tanto
el siguiente resultado.
r f (a)
D f (a; v) = kr f (a)k v=
kr f (a)k
Por tanto, si se está interesado en aumentar el valor de una función objetivo f (x), la mejor estra-
tegia es moverse en cada punto en la dirección y sentido que indica el vector gradiente (que irá cam-
biando de un punto a otro). De manera análoga, la dirección de máximo decrecimiento será aquella
en que cos(') = °1, es decir cuando forma un ángulo de 180o (º radianes) con el gradiente, lo que
significa que v tendrá la dirección de °r f (a).
Nótese, por otro lado, que si el vector v es perpendicular al vector gradiente (' = º/2) entonces
cos(') = 0 y la derivada direccional será cero.
Pasar de forma explícita a implícita siempre es posible, sin más que pasar todo a un lado de la
igualdad. Sin embargo, el paso contrario (de forma implícita a explícita) no siempre es posible. Ya se
obtuvo un método para calcular derivadas de funciones definidas en forma implícita, pero el siguien-
te resultado ofrece una expresión más fácil y manejable para obtener estas derivadas.
Teorema 3 (Teorema de la función implícita: dos variables). Sea f (x, y) una función de dos variables
y (a, b) un punto de su dominio de modo que
1. f (a, b) = C
@f
3. (a, b) 6= 0
@y
Entonces, existe un entorno del punto a, (a °r, a +r ), tal que la ecuación f (x, y) = C define una función
y = h(x), de manera que h(a) = b y además
@f
(a, b)
0 0
y (a) = h (a) = ° @x
@f
(a, b)
@y
Ejemplo 33 Analiza para cada función y punto que se indican, si puede aplicarse el teorema de la
función implícita y calcula la derivada en el punto indicado.6
@f @f 1 @f @f
f (0, 1) = 0 + ln(1) = 0; = 1, = (0, 1) = 1, (0, 1) = 1
@x @y y @x @y
Las derivadas parciales son continuas en el punto (0, 1) (una es constante y en la otra hay un cocien-
te cuyo denominador es distinto de cero en un entorno del punto). Además, la segunda parcial es
distinta de cero en el punto. Por tanto, se cumplen todas las condiciones con lo que
@f
(0, 1)
y 0 (0) = ° @x = °1
@f
(0, 1)
@y
6 Como se trata de la derivada de una función de una variable, ésta indica la pendiente de la recta tangente en dicho
@f 2y @f x @f @f
f (1, 1) = ln(1) + 2 ln(1) = 0; = ln(y) + , = + 2 ln(x) (1, 1) = 2, (1, 1) = 1
@x x @y y @x @y
Las derivadas parciales son continuas y la segunda parcial es distinta de cero en el punto (1, 1). Por
tanto, se cumplen todas las condiciones con lo que
@f
(1, 1)
y 0 (1) = ° @x = °2
@f
(1, 1)
@y
@f @f @f @f
f (4, 1) = 4 ° 1 = 3; = 1, = °2y (4, 1) = 1, (4, 1) = °2
@x @y @x @y
Las derivadas parciales son continuas en el punto (4, 1) (una es constante y la otra es un polino-
mio). Además, la segunda parcial es distinta de cero en el punto. Por tanto, se cumplen todas las
condiciones con lo que
@f
(4, 1)
1
y 0 (4) = ° @x =
@f 2
(4, 1)
@y
La ecuación de la recta tangente a la curva de nivel que pasa por el punto (4, 1) es
1
y ° 1 = (x ° 4) ) x ° 2y = 2
2
En el caso general, con funciones de más variables, el teorema de la función implícita establece
condiciones para que una de las variables se pueda expresar como función de las demás, y muestra
la expresión de las derivadas parciales.
Teorema 4 (Teorema de la función implícita: caso general). Dada una función de n + 1 variables
f (x 1 , x 2 , . . . , x n , y) y un punto de su dominio (a 1 , a 2 , . . . , a n , b) tal que
1. f (a 1 , a 2 , . . . , a n , b) = C
@f
3. (a 1 , a 2 , . . . , a n , b) 6= 0
@y
Entonces, existe una bola abierta de centro el punto a = (a 1 , a 2 , . . . , a n ), B (a, r ), tal que la ecuación
f (x 1 , x 2 , . . . , x n , y) = C define una función y = h(x 1 , x 2 , . . . , x n ), de manera que h(a 1 , a 2 , . . . , a n ) = b y
además
@f
(a 1 , a 2 , . . . , a n , b)
@y @h @x i
(a) = (a) = °
@x i @x i @f
(a 1 , a 2 , . . . , a n , b)
@y
f (1, 1, 1) = 1
La función, y las derivadas parciales, son funciones polinómicas, luego son continuas
@f @f @f
=z = 2y =x
@x @y @z
@f
(1, 1, 1) = 1 6= 0
@z
Entonces se cumplen las condiciones del teorema de la función implícita y existe una función h(x, y) de
modo que la ecuación xz ° y 2 = 1 es equivalente a z = h(x, y). Además,
@f @f
(1, 1, 1) (1, 1, 1)
@z @h 1 @z @h @y 2
(1, 1) = (1, 1) = ° @x = ° = °1 (1, 1) = (1, 1) = ° = ° = °2
@x @x @f 1 @y @y @f 1
(1, 1, 1) (1, 1, 1)
@z @z
@ f (a, b)
@ f (a, b) @ f (a, b)
y ° b = ° @x (x ° a) ) (x ° a) + (y ° b) = 0 ) r f (a, b) · (x ° a, y ° b) = 0
@ f (a, b) @x @y
@y
Esto significa que el vector gradiente es perpendicular a la recta tangente de la curva de nivel. Por
tanto, dibujando las curvas de nivel se puede obtener fácilmente (de manera gráfica) la dirección de
máximo crecimiento, que viene dada por el vector gradiente. Para saber el sentido, simplemente hay
que fijarse hacia donde crecen las curvas de nivel (figura 2.23).
Figura 2.23: Gradiente y rectas tangentes a las curvas de nivel de una función
∏x 1 x
f (∏x, ∏y) = = = ∏°2 f (x, y).
(∏x)3 + (∏y)3 ° 2(∏x)(∏y)2 ∏ x + y ° 2x y 2
2 3 3
a) f (x, y) = x 2 + y 2 + x + y + 1
b) f (x, y) = sen(x 2 + y 2 )
Nota 11 El concepto de función homogénea con funciones de producción está vinculado al de rendi-
mientos (constantes, crecientes, decrecientes) a escala:
Si la función de producción es homogénea de grado 1 cumplirá que F (∏K , ∏L) = ∏F (K , L). Por
tanto, duplicar la cantidad de los inputs hace que se duplique la cantidad de output (rendimen-
tos constantes a escala).
Se han definido funciones homogéneas para dos variables (x, y). De manera totalmente análoga
se definen para funciones de tres, cuatro, . . . , n variables. Una función f : S µ Rn ! R se dice que es
homogénea de grado k en su dominio S si para todo (x 1 , x 2 , . . . , x n ) 2 S y para todo número real ∏ 2 R,
∏ > 0, se cumple que:
f (∏x 1 , ∏x 2 , . . . , ∏x n ) = ∏k f (x 1 , x 2 , . . . , x n ).
P
Las funciones lineales con n variables f (x 1 , x 2 , . . . , x n ) = ni=1 a i x i son un ejemplo de funciones lineal-
mente homogéneas. Las formas cuadráticas Q(v) = v 0 Av son un ejemplo de funciones homogéneas
de grado 2.
Ejemplo 38 Estas dos propiedades son útiles para descomponer el estudio de homogeneidad. Por ejem-
plo, en la función
q
x 5 ° 6x 2 y 3
f (x, y) = 3(x 2 + x y) ° 2 y 4 + x 2 y 2 + (x ° 5y)(2x + 3y) °
x y2
Nota 12 Nótese que esta propiedad (que se puede comprobar en cualquiera de las funciones del ejem-
plo 35) indica que, en cierta manera, las funciones homogéneas se comportan como los polinomios de
una variable: si f (x) es un polinomio de grado k, su derivada es un polinomio de grado k ° 1.
Teorema 8 (Teorema de Euler) Una función f (x, y) con derivadas parciales continuas es homogénea
de grado k si, y solamente si, se cumple que para todo (x, y) de su dominio
@f @f
x (x, y) + y (x, y) = k f (x, y).
@x @y
Ejemplo 39 Se puede ver, aplicando el Tª de Euler, que la función del apartado a) del ejemplo 35 es
linealmente homogénea.
Nota 13 Interpretación del Tª de Euler en términos de precios (relativos) de los inputs. Si se tiene
una función de producción F (K , L) linealmente homogénea (grado k = 1, rendimientos constantes a
escala), entonces el Tª de Euler se escribe como
@F @F
K +L = F (K , L).
@K @L
Si el precio del ouput es unitario (o se toman precios relativos), entonces las derivadas parciales repre-
sentarían los precios de los inputs que hacen que haya equilibrio, es decir que coste = ingreso.
Teorema 9 (Teorema de Euler, caso general) Una función f : Rn ! R con derivadas parciales conti-
nuas es homogénea de grado k si, y solamente si, se cumple que para todo x 2 Rn de su dominio
x · r f (x) = k f (x).
Teorema 10 Si f (x, y) es una función homogénea de grado k con derivadas parciales continuas, en-
tonces todas las curvas de nivel f (x, y) = C tienen la misma pendiente en los puntos de cualquier semi-
recta que parte desde el origen.
Nota 14 Entonces solo será necesario observar qué pasa en una de las curvas de nivel. La figura 2.24
muestra esta propiedad.
Figura 2.24: Rectas tangentes a las curvas de nivel de una función Cobb-Douglas
Nota 15 La prueba del teorema 10 se basa en cómo se calcula la pendiente de una curva de nivel (teo-
rema de la función implícita) y en que las derivadas parciales de una función homogénea de grado
k son funciones homogéneas de grado k ° 1. Por tanto, si se toma el punto (a, b) y otro que esté en la
semi-recta desde el origen, que será de la forma (∏a, ∏b), se tiene que:
@f
(a, b)
La pendiente de la curva de nivel en (a, b) es m 1 = ° @@xf
@y (a, b)
@f @f
@x (∏a, ∏b) ∏k°1 @x (a, b)
La pendiente de la curva de nivel en (∏a, ∏b) es m 2 = ° @f
=° @f
= m1
@y (∏a, ∏b) ∏k°1 @y (a, b)
Si Æ = Ø se trata de hipérbolas. Si se obtienen las pendientes en puntos de una misma semi-recta desde
el origen:
@f Æ
@x (a, b) Æb
La pendiente de la curva de nivel en (a, b) es m 1 = ° @f
= ° Øa = °
Øa
@y (a, b) b
@f Æ
(∏a, ∏b) Æb
La pendiente de la curva de nivel en (∏a, ∏b) es m 2 = ° @@xf = ° ∏a =° = m1
Ø Øa
@y (∏a, ∏b) ∏b
Las funciones homotéticas se definen como aquellas para las que la propiedad del teorema 10 se
cumple. Pero esta definición es de poca utilidad, ya que con ella no es fácil ver cuando una función es
homotética, ni construir funciones homotéticas. Por eso se utiliza la siguiente definición equivalente.
Definición 17 Una función f (x, y) se dice que es homotética si es la composición de una función
g (x, y) homogénea, con una función real h(z) creciente, f (x, y) = h(g (x, y)).
Es el caso de la función del ejemplo 40, que es la composición de una función de producción
Cobb-Douglas g (x, y) = x Æ y Ø con la función creciente h(z) = ln(z). Por tanto, se trata de una función
homotética.
Ejemplo 41 Ahora se pueden definir funciones homotéticas sin más que hacer transformaciones (me-
diante funciones crecientes) de las funciones homogéneas. Si f (x, y) es una de las funciones del ejemplo
35 o una Cobb-Douglas, o una C E S, entonces las siguientes funciones son homotéticas (pero no son
homogéneas):
ln( f (x, y))
a f (x, y) + b, a > 0, b 6= 0
Se denomina matriz hessiana a la matriz n £ n formada por todas las derivadas segundas de la
función, escritas de forma ordenada
0 1
@2 f @2 f @2 f
B ... C
B @x 12 @x 2 @x 1 @x n @x 1 C
B 2 2 2 C
B @ f @ f @ f C
B . . . C
B
H f (x 1 , x 2 , . . . , x n ) = B @x 1 @x 2 @x 2 2 @x n @x 2 C
C
B C
B ... ... ... ... C
B C
@ @2 f @2 f @2 f A
... 2
@x 1 @x n @x 2 @x n @x n n£n
Hay que señalar que, bajo las condiciones del teorema de Schwartz (parciales cruzadas iguales), esta
matriz es simétrica. Este hecho es relevante ya que se asociará una forma cuadrática a la matriz hes-
siana. En las funciones que se usarán en lo que sigue se cumplen estas condiciones, con lo que solo
se calculará una de las dos parciales cruzadas.
a) f (x, y) = x y ° 2 ln(x)
@f 2 @f
(x, y) = y ° (x, y) = x
@x x @y
@2 f 2 @2 f @2 f
2
(x, y) = 2 (x, y) = 1 (x, y) = 0
@x x @x@y @y 2
0 1
2
1 A
H f (x, y) = @ x 2
1 0
Si ahora se pide la hessiana en un punto del dominio, solo hay que sustituir el valor del punto que
se considere. Por ejemplo, la hessiana en el punto (1, 1) es
µ ∂
2 1
H f (1, 1) =
1 0
2x 2
b) f (x, y) = 5x y 2 °
y
@f 4x @f 2x 2
(x, y) = 5y 2 ° (x, y) = 10x y + 2
@x y @y y
@2 f 4 @2 f 4x @2 f 4x 2
2
(x, y) = ° (x, y) = 10y + 2 (x, y) = 10x °
@x y @x@y y @y 2 y3
0 1
4 4x
° 10y + 2
B y y C
H f (x, y) = B C
@ 4x 4x 2 A
10y + 2 10x ° 3
y y
La hessiana en el punto (°1, 2) es
µ ∂
°2 19
H f (°1, 2) =
19 °100 5
c) f (x, y, z) = x y + 2z
@f @f @f
(x, y, z) = y (x, y, z) = x (x, y, z) = 2
@x @y @z
@2 f @2 f @2 f
(x, y, z) = 0 (x, y, z) = 1 (x, y, z) = 0
@x 2 @x@y @x@z
@2 f @2 f @2 f
(x, y, z) = 0 (x, y, z) = 0 (x, y, z) = 0
@y 2 @y@z @2 z 2
0 1
0 1 0
@
H f (x, y, z) = 1 0 0 A
0 0 0
Ejemplo 43 Calcula el polinomio de Taylor de orden 2 de la función f (x, y) = x ln(y) en un entorno del
punto (1, 1). Utiliza el resultado para calcular el valor aproximado de f (10 01, 00 999).
f (1, 1) = 0
µ ∂
x
r f (x, y) = ln(y), ) r f (1, 1) = (0, 1)
y
0 1
1
µ ∂
B 0 y C 0 1
H f (x, y) = B
@ 1 x
C
A ) H f (1, 1) =
° 2 1 °1
y y
µ ∂µ ∂
1 0 1 x °1 1
f (x, y) º 0+(0, 1)·(x°1, y°1)+ (x°1, y°1) = (y°1)+(x°1)(y°1)° (y°1)2
2 1 °1 y °1 2
1
f (10 01, 00 999) º °00 001 ° 00 00001 ° 00 000001 = °00 0010105
2
Nota 16 El valor con 13 decimales exactos es f (10 01, 00 999) = °00 0010105053369
6. Teorema de Weierstrass
9. Programas convexos/cóncavos
Introducción
Los conceptos de conjuntos convexos y funciones cóncavas/convexas tienen un papel funda-
mental en el estudio de la existencia de óptimos (máximos/mínimos). Como ya se ha visto, si una
función cóncava de una variable tiene un punto crítico, en dicho punto alcanza un máximo. De igual
manera, una función convexa de una variable alcanza un mínimo en los puntos críticos. Se verá cómo
estas propiedades se siguen cumpliendo para más variables, y se analizarán propiedades adicionales
(teorema local-global, teorema de unicidad).
combinación lineal de estos puntos a todo punto z 2 Rn que se puede expresar como
z = ∏x + µy ∏, µ 2 R cualesquiera
combinación lineal no negativa de estos puntos a todo punto z 2 Rn que se puede expresar como
z = ∏x + µy ∏, µ 2 R ∏ ∏ 0, µ ∏ 0
55
CAPÍTULO 3: CONVEXIDAD. OPTIMIZACIÓN LIBRE
combinación convexa de estos puntos a todo punto z 2 Rn que se puede expresar como
z = ∏x + µy ∏, µ 2 R ∏ ∏ 0, µ ∏ 0 ∏ + µ = 1
Nota 1 Se observa que las combinaciones convexas son un caso particular de las combinaciones no
negativas que, a su vez, son un tipo de combinación lineal. Las combinaciones convexas pueden expre-
sarse, de manera equivalente, de la forma
Gráficamente, como se observa en la figura 3.1, las combinaciones convexas de dos puntos se corres-
ponden con los puntos del segmento que los une
£ § © ™
x, y = z 2 Rn : z = ∏x + (1 ° ∏)y; ∏ 2 [0, 1]
Cuando se hace ∏ = 0 en la expresión anterior, entonces z = y, con lo que se está en un extremo del
segmento; al hacer ∏ = 1 queda z = x con lo que se trata del otro extremo del segmento. Cuando ∏ = 00 5
el punto z es justo el punto medio del segmento.
Ejemplo 1 Las combinaciones convexas de los puntos (2, 2) y (6, 4) (es decir, el segmento que une estos
puntos; véase la figura 3.1) son:
[(2, 2), (6, 4)] = {∏(2, 2) + (1 ° ∏)(6, 4); ∏ 2 [0, 1]} = {(6 ° 4∏, 4 ° 2∏); ∏ 2 [0, 1]}
[(2, 2), (5, 2)] = {∏(2, 2) + (1 ° ∏)(5, 2); ∏ 2 [0, 1]} = {(5 ° 3∏, 2); ∏ 2 [0, 1]}
Nota 2 Para obtener gráficamente las combinaciones no negativas de dos puntos, basta unir estos pun-
tos con el origen mediante rectas y quedarse con la zona determinada por estas semirrectas.
Ejemplo 3 Las combinaciones lineales no negativas de los puntos (2, 2) y (6, 4) son:
© ™ © ™
K [(2, 2), (6, 4)] = ∏(2, 2) + µ(6, 4); ∏ ∏ 0, µ ∏ 0 = (2∏ + 6µ, 2∏ + 4µ); ∏ ∏ 0, µ ∏ 0
Gráficamente, como se observa en la figura 3.2, se corresponde con lo que se denomina el cono deter-
minado por estos puntos.
Estos conceptos se pueden extender de manera inmediata para más de dos puntos.
combinación lineal de estos puntos a todo punto z 2 Rn que se puede expresar como
z = ∏1 x 1 + ∏2 x 2 + . . . + ∏k x k ∏i 2 R cualesquiera 8i
combinación lineal no negativa de estos puntos a todo punto z 2 Rn que se puede expresar como
z = ∏1 x 1 + ∏2 x 2 + . . . + ∏k x k ∏i 2 R ∏i ∏ 0 8i
combinación convexa de estos puntos a todo punto z 2 Rn que se puede expresar como
k
X
z = ∏1 x 1 + ∏2 x 2 + . . . + ∏k x k ∏i 2 R ∏i ∏ 0 8i , ∏i = 1
i =1
Ejemplo 4 La combinación convexa de los puntos (1, 3), (4, 4) y (5, 2) se corresponde con los puntos del
triángulo que aparece en la figura 3.3. En general, las combinaciones convexas de k puntos serán un
politopo (si está en el plano, se tratará de un polígono). La figura 3.4 muestra un poliedro (cubo) en R3
que resulta de la combinación convexa de ocho puntos.
La idea geométrica es que se puede ir en línea recta entre dos puntos cualesquiera del conjunto,
sin salirse de dicho conjunto.
Ejemplo 5 Obsérvese gráficamente si los subconjuntos de R2 en las figuras 3.5 y 3.6 son convexos o no.
© ™
Ejemplo 6 ¿Es convexo el conjunto S = (x, y) 2 R2 : x ° 2y ∑ 1 ? Su imagen gráfica es la que aparece
en la figura 3.7 en la que se observa que efectivamente se trata de un conjunto convexo. Para verlo
formalmente (utilizando la definición) se consideran dos puntos (x, y), (x 0 , y 0 ) en el conjunto S y un
escalar ∏ 2 [0, 1]; esto es,
x ° 2y ∑ 1 x 0 ° 2y 0 ∑ 1 ∏ 2 [0, 1]
Entonces,
° ¢
∏(x, y) + (1 ° ∏)(x 0 , y 0 ) = ∏x + (1 ° ∏)x 0 , ∏y + (1 ° ∏)y 0 = (x 00 , y 00 )
que debe averiguarse si pertenece al conjunto S (es decir, si cumple la condición que define al conjunto)
° ¢ ° ¢ ° ¢
x 00 ° 2y 00 = ∏x + (1 ° ∏)x 0 ° 2 ∏y + (1 ° ∏)y 0 = ∏ x ° 2y + (1 ° ∏) x 0 ° 2y 0 ∑ ∏ · 1 + (1 ° ∏) · 1 = 1
© ™
Figura 3.7: S = (x, y) 2 R2 : x ° 2y ∑ 1 es un conjunto convexo
Propiedades
1. La intersección de conjuntos convexos es un conjunto convexo.
Ejemplo 8 La figura 3.9 muestra distintos casos de puntos extremos en conjuntos convexos.
Figura 3.9: Todos los puntos de la circunferencia son puntos extremos en el círculo. Los puntos ex-
tremos del pentágono son los vértices, denotados por A, B, C, D, E
Ejemplo 9 Si un subconjunto de R2 está definido por intersección de semiplanos, para calcular los
puntos extremos se calculan los puntos de corte de las rectas y se tienen los candidatos que hay que ver
© ™
si están en el conjunto. Por ejemplo, S = (x, y) 2 R2 : x + 2y ∑ 4, 2x + y ∑ 5, x ∏ 0, y ∏ 0 . Tomando
las rectas de dos en dos, se tiene:
Nota 3 a) Las funciones lineales cumplen f (∏x + (1 ° ∏)y) = ∏ f (x) + (1 ° ∏) f (y), luego son cóncavas y
convexas a la vez.
b) En general, como ocurre con las funciones de una variable, las funciones pueden tener zonas en las
que son convexas y otras en las que son cóncavas.
c) Es importante señalar que existen funciones cóncavas y funciones convexas. Pero no ocurre lo mismo
con los conjuntos: no existe el concepto de conjunto cóncavo. Los conjuntos serán convexos, o no
convexos.
estrictamente convexa si 8x, y 2 S, x 6= y 8∏ 2 (0, 1), f (∏x + (1 ° ∏)y) < ∏ f (x) + (1 ° ∏) f (y)
4. Si la función f es cóncava y h(t ) es una función de una variable cóncava y creciente, entonces la
función '(x) = h( f (x)) es cóncava.
5. Si la función f es cóncava y h(t ) es una función de una variable convexa y decreciente, entonces
la función '(x) = h( f (x)) es convexa.
Ejemplo 10 Las últimas propiedades son útiles porque permiten descomponer el estudio en funcio-
p
nes más sencillas. Por ejemplo, la función '(x, y) = x + y, se puede poner como la composición de
p
f (x, y) = x + y que es lineal, por tanto cóncava (y también convexa), y la función h(t ) = t que es una
función real cóncava y creciente en su dominio: se puede ver que h 0 (t ) > 0 (creciente) y que h 00 (t ) < 0
p
(cóncava). Así, aplicando la propiedad 4, la función '(x, y) = x + y es cóncava.
4. Si la función f es convexa y h(t ) es una función de una variable convexa y creciente, entonces la
función '(x) = h( f (x)) es convexa.
5. Si la función f es convexa y h(t ) es una función de una variable cóncava y decreciente, entonces
la función '(x) = h( f (x)) es cóncava.
Ejemplo 11 Como antes, las últimas propiedades son útiles porque permiten descomponer el estudio
en funciones más sencillas. Por ejemplo, la función '(x, y) = e 2x°3y se puede poner como:
La función f (x, y) = 2x ° 3y es lineal y, por tanto, es convexa (también es cóncava). Por otro lado,
Demostración Se verá solo el primer apartado, ya que el otro es totalmente análogo. Para ello, en
primer lugar se supone que la función es cóncava y se quiere demostrar que el conjunto Hip( f ) es un
conjunto convexo. Sean (x, y), (x 0 , y 0 ) 2 Hip( f ) y sea ∏ 2 [0, 1]. Hay que probar que
° ¢
∏(x, y) + (1 ° ∏)(x 0 , y 0 ) = ∏x + (1 ° ∏)x 0 , ∏y + (1 ° ∏y 0 2 Hip( f ),
es decir,
° ¢
f ∏x + (1 ° ∏)x 0 ∏ ∏y + (1 ° ∏)y 0 .
Como la función f es cóncava, y los puntos están en Hip( f ) se cumple que
° ¢
f ∏x + (1 ° ∏)x 0 ∏ ∏ f (x) + (1 ° ∏) f (x 0 ) f (x) ∏ y f (x 0 ) ∏ y 0
Hay que probar ahora que si Hip( f ) es un conjunto convexo, entonces la función es cóncava.
° ¢ ° ¢
Sean x, x 0 2 S, ∏ 2 [0, 1]. Entonces, los puntos x, f (x) , x 0 , f (x 0 ) están en Hip( f ). Al ser convexo,
° ¢ ° 0 ¢
∏ x, f (x) + (1 ° ∏) x , f (x 0 ) 2 Hip( f ), lo que significa
° ¢ ° ¢
∏x + (1 ° ∏)x 0 , ∏ f (x) + (1 ° ∏) f (x 0 ) 2 Hip( f ) ) ∏ f (x) + (1 ° ∏) f (x 0 ) ∑ f ∏x + (1 ° ∏)x 0
Figura 3.14: Hipografo de una función cóncava y Epigrafo de una función convexa
Nota 4 El resultado anterior es muy útil para demostrar la convexidad de conjuntos, siempre que es-
tos se puedan poner como hipografos o epigrafos de funciones cóncavas o convexas, respectivamente (o
como intersección de conjuntos de esta forma, aplicando después la propiedad que dice que la inter-
sección de conjuntos convexos es un conjunto convexo).
© ™
Ejemplo 12 Prueba que el conjunto S = (x, y) 2 R2 : y ∏ x 2 es convexo.
Este conjunto es el epigrafo de la función f (x) = x 2 , que es convexa (es una función de una variable
real cuya segunda derivada es positiva, f 00 (x) = 2 > 0). Por tanto, aplicando el teorema 3 se trata de un
conjunto convexo.
Nota 5 En el capítulo anterior se vio el concepto de conjunto de contorno (superior e inferior) que no
hay que confundir con los conceptos de epigrafo e hipografo de una función. Si la función es de dos
variables, f (x, y), los conjuntos de contorno superior e inferior son subconjuntos de R2 , mientras que
el epigrafo y el hipografo son subconjuntos de R3
© ™ © ™
UC ( f ) = (x, y) 2 R2 : f (x, y) ∏ C ; LC ( f ) = (x, y) 2 R2 : f (x, y) ∑ C
© ™ © ™
Epi( f ) = (x, y, z) 2 R3 : z ∏ f (x, y) ; Hip( f ) = (x, y, z) 2 R3 : z ∑ f (x, y)
La diferencia entre estos conceptos se ve muy clara con funciones de una variable que se pueden repre-
sentar gráficamente. El siguiente ejemplo ilustra este hecho.
Ejemplo 13 Dada la función f (x) = x 3 °x, el conjunto de contorno superior de nivel C = 0 serían todos
los puntos x 2 R de manera que f (x) ∏ 0 y con la desigualdad al contrario para el conjunto de contorno
inferior. Si se observa la gráfica de esta función (figura 3.15), resulta claro que
Mientras que el epigrafo son todos los puntos de R2 que están por encima de la gráfica, y el hipografo
los que están por debajo.
II ) convexa, entonces para todo nivel C , el conjunto de contorno inferior de nivel C , LC ( f ) es un con-
junto convexo.
Demostración Las dos partes son análogas y se verá solo la segunda. Hay que probar que, para todo
© ™
C , el conjunto LC = x 2 Rn : f (x) ∑ C es convexo. Si se consideran dos puntos x, x 0 2 LC y un escalar
∏ 2 [0, 1], debe cumplirse que z = ∏x + (1 ° ∏)x 0 2 LC . Es decir que f (z) ∑ C .
Si la función es convexa, se cumple
° ¢
f ∏x + (1 ° ∏)x 0 ∑ ∏ f (x) + (1 ° ∏) f (x 0 ).
Además, como los puntos están en el conjunto de contorno inferior, f (x) ∑ C y f (x 0 ) ∑ C . Por tanto,
° ¢
f (z) = f ∏x + (1 ° ∏)x 0 ∑ ∏ f (x) + (1 ° ∏) f (x 0 ) ∑ ∏C + (1 ° ∏)C = C .
El siguiente ejemplo muestra que el recíproco de la propiedad anterior no es cierto. Es decir, pue-
de ser que los conjuntos de contorno (superior y/o inferior) sean conjuntos convexos, pero la función
no sea ni cóncava, ni convexa.
Ejemplo 14 Sea la función f (x) = x 3 . Entonces, el conjunto de contorno superior de nivel C serían los
£p3
¢ ° p
3
§
números reales del intervalo C , +1 , mientras que el inferior sería °1, C . Ambos son conjuntos
convexos, pero la función no es ni cóncava, ni convexa en toda la recta real, S = R. Nótese que ni el
epigrafo, ni el hipografo son conjuntos convexos.
Pero como ya se ha visto, el recíproco no es cierto. La función de distribución normal N (µ, æ) (cuya
gráfica se denomina coloquialmente Campana de Gauss, ver figura 3.17), muy utilizada en Estadística
y Probabilidad, es otro ejemplo de función cuasi-cóncava que no es cóncava.
Una definición alternativa que es más útil para comprobar en la práctica la cuasi-concavidad o
cuasi-convexidad de funciones es la siguiente. Esta definición también permite introducir la cuasi-
concavidad/cuasi-convexidad estricta.
Como con las funciones cóncavas y convexas, si las desigualdades son estrictas, entonces la fun-
ción se dice que es estrictamente cuasi-cóncava o estrictamente cuasi-convexa.
La Campana de Gauss (figura 3.17) es la gráfica de una función estrictamente cuasi-cóncava. Las
funciones cuasi-cóncavas/cuasi-convexas tienen propiedades parecidas a las de las funciones cón-
cavas/convexas.
Ejemplo 15 La función f (x) = °2x 2 es cuasi-cóncava (por ser cóncava, ya que su segunda derivada es
siempre negativa, f 00 (x) = °4) y la función h(t ) = e t es creciente. Por tanto, la función compuesta '(x) =
2 2
h( f (x)) = e °2x es cuasi-cóncava. La segunda derivada de esta función, '00 (x) = (°4 + 16x 2 )e °2x , es
° ¢ ° ¢ ° ¢
positiva en el conjunto °1, ° 12 [ 12 , +1 , y negativa en el intervalo ° 12 , 12 , luego no es cóncava en
R. Su gráfica es similar a la campana de Gauss.
Para funciones de dos variables f (x, y), como muestra la figura 3.19, la propiedad es análoga con
respecto al plano tangente a la gráfica de dicha función en un punto cualquiera (a, b, f (a, b)), cuya
ecuación es z = f (a, b) + r f (a, b) · (x ° a, y ° b). Se tiene que:
El siguiente teorema recoge esta propiedad para el caso general de funciones con n variables.
III ) estrictamente cóncava si, y solo si, f (x) < f (a) + r f (a) · (x ° a) 8x, a 2 S, x 6= a.
IV ) estrictamente convexa si, y solo si, f (x) > f (a) + r f (a) · (x ° a) 8x, a 2 S, x 6= a.
Aunque en teoría el resultado anterior puede servir para identificar gráficamente funciones cón-
cavas/convexas, al no poder dibujar funciones de varias variables en la práctica no posee mucha
utilidad. Usando la fórmula de Taylor de orden 2,
1
f (x) = f (a) + r f (a) · (x ° a) + (x ° a)0 H f (z)(x ° a) z 2 B (a, ≤)
2
se deduce que para saber si se cumplen las condiciones del teorema 6 basta con identificar el signo
de (x ° a)0 H f (z)(x ° a), que es una forma cuadrática de matriz H f (z). De este modo se deduce el
siguiente teorema que es el que se utiliza en la práctica para saber si una función de varias variables
es cóncava o convexa.
Teorema 7 Sea S µ Rn un conjunto convexo. Una función f : S ! R, que tiene parciales primeras y
segundas continuas, es:
I) cóncava si, y solo si, para todo x 2 S, H f (x) tiene asociada una forma cuadrática semidefinida
negativa o definida negativa.
II ) convexa si, y solo si, para todo x 2 S, H f (x) tiene asociada una forma cuadrática semidefinida
positiva o definida positiva.
III ) estrictamente cóncava si, y solo si, para todo x 2 S, H f (x) tiene asociada una forma cuadrática
definida negativa.
IV ) estrictamente convexa si, y solo si, para todo x 2 S, H f (x) tiene asociada una forma cuadrática
definida positiva.
Nota 6 Estas condiciones son (básicamente) las mismas que se usan para identificar funciones cónca-
vas/convexas de una variable: cóncava cuando la segunda derivada es menor o igual a cero (definida
negativa); convexa cuando la segunda derivada es mayor o igual a cero (definida positiva).
Ejemplo 16 Analiza la concavidad/convexidad de las siguientes funciones.
a) f (x, y) = 2x 2 + 2x y + 5y 2
@f @f @2 f @2 f @2 f
= 4x + 2y = 2x + 10y 2
=4 2
= 10 =2
@x @y @x @y @x@y
µ ∂
4 2
H f (x, y) =
2 10
La forma cuadrática es definida positiva ya que D 1 = 4 > 0, D 2 = 36 > 0.
Por tanto, la función es estrictamente convexa.
b) f (x, y, z) = °2x 2 + 2x y ° 5y 2 ° xz ° z 2
@f @f @f
= °4x + 2y ° z = 2x ° 10y = °x ° 2z
@x @y @z
@2 f @2 f @2 f @2 f @2 f @2 f
= °4 = °10 = °2 = 2 = °1 =0
@x 2 @y 2 @z 2 @x@y @x@z @y@z
0 1
°4 2 °1
H f (x, y, z) = @ 2 °10 0 A
°1 0 °2
D 1 = °4 < 0, D 2 = 36 > 0, D 3 = °62 < 0, luego la forma cuadrática es definida negativa.
Por tanto, la función es estrictamente cóncava.
c) f (x, y) = x 4 + 2x 2 y 2
@f @f @2 f @2 f @2 f
= 4x 3 + 4x y 2 = 4x 2 y = 12x 2 + 4y 2 = 4x 2 = 8x y
@x @y @x 2 @y 2 @x@y
µ ∂
12x 2 + 4y 2 8x y
H f (x, y) =
8x y 4x 2
D 1 = 12x 2 + 4y 2 ∏ 0, D 2 = 48x 4 ° 48x 2 y 2 = 48x 2 (x 2 ° y 2 ) que a veces es positivo (por ejemplo,
en el punto (2, 1)) y a veces negativo (por ejemplo, en el punto (1, 2)). La forma cuadrática es
entonces indefinida.
Por tanto, la función no es, en general, ni cóncava, ni convexa.
De igual manera que las funciones cóncavas/convexas se pueden identificar fácilmente con la
hessiana de la función, hay también un método similar para las funciones cuasi-cóncavas/cuasi-
convexas.
Teorema 8 Dada una función con dos variables f (x, y) que tiene parciales segundas continuas se con-
sideran los determinantes
0 1
@f @f
B 0
0 1 B @x @y C C
@f B C
B 0 C B C
B @x C B @ f @2
f @ 2
f C
B C
Q 1 = det B
B
C
C Q 2 = det B 2 C
@ @f B @x @x @x@y C
@2 f A B C
B C
@x @x 2 B C
@ @f @2 f @2 f A
@y @x@y @y 2
Entonces:
Nota 7 Estas condiciones son solo suficientes. Si no se cumplen, hay que usar la definición para com-
probar si una función es cuasi-cóncava o cuasi-convexa.
Ejemplo 17 Como aplicación del resultado anterior, se puede ver que una función de producción de ti-
po Cobb-Douglas es siempre cuasi-cóncava (de hecho, con rendimientos constantes o decrecientes a es-
cala es cóncava, mientras que si tiene rendimientos crecientes a escala es simplemente cuasi-cóncava).
Las derivadas parciales primera y segunda de una función Cobb-Douglas f (x, y) = x Æ y Ø , Æ, Ø > 0, son :
@f @f
= Æx Æ°1 y Ø = Øx Æ y Ø°1
@x @y
@2 f @2 f @2 f
= Æ(Æ ° 1)x Æ°2 y Ø = Ø(Ø ° 1)x Æ y Ø°2 = ÆØx Æ°1 y Ø°1
@x 2 @y 2 @x@y
Entonces, la matriz hessiana es
0 1
@2 f @2 f
B C 0 Æ(Æ ° 1)x Æ°2 y Ø ÆØx Æ°1 y Ø°1
1
B @x 2 @x@y C
B C @ A
H f (x, y) = B C=
B C
@ @2 f 2
@ f A ÆØx Æ°1 y Ø°1 Æ Ø°2
Ø(Ø ° 1)x y
@x@y @y 2
En general se usa la palabra óptimo para referirse tanto a máximo como a mínimo. Optimizar
una función es buscar sus máximos y mínimos (locales o globales). Las figuras siguientes 3.20 y 3.21
muestran ejemplos de funciones con múltiples máximos y mínimos (locales y globales), la primera
con una función de una variable, y la segunda con una función de dos variables.
x sen(x)
Figura 3.20: Máximos y mínimos de la función de una variable f (x) =
5
Figura 3.21: Función de dos variables con múltiples máximos y mínimos, f (x, y) = sen(x °y)°2 cos(x)
6. Teorema de Weierstrass
Este teorema (como el de funciones de una variable) da condiciones que garantizan la existencia
de óptimos globales, aunque no da información sobre cómo calcularlos, o de dónde están situados.
La existencia de máximo y mínimo global está garantizada por el teorema de Weierstrass, ya que la
función es polinómica (luego es continua) y el conjunto es compacto: cerrado (contiene a toda su fron-
tera) y acotado (está contenido en la bola B ((0, 0), 10)). El mínimo global se alcanza en el punto (0, 0) y
vale f mı́n = 0. El máximo global se alcanza en los puntos (3, 3), (3, °3), (°3, 3), (°3, °3) y vale f máx = 18.
Ejemplo 19 Calcula los máximos y mínimos globales de la función f (x, y) = x + y en el conjunto com-
© ™
pacto S = (x, y) 2 R2 : x 2 + y 2 ∑ 4 .
p p
Como se observa en la figura 3.23 el pmáximo se alcanza en el punto ( 2, p2) y el
pvalor máximo de la
función en el conjunto S es f máx = 2 2. El mínimo
p se alcanza en el punto (° 2, ° 2) y el valor mínimo
de la función en el conjunto S es f mı́n = °2 2.
El siguiente resultado es de mucha utilidad cuando se utilizan las curvas de nivel para obtener los
óptimos globales.
El razonamiento sería como en funciones de una variable: en un punto en el que la función al-
canza un óptimo local el plano tangente (en general, hiperplano tangente) debe ser horizontal, con lo
que su ecuación es z = C . Como la ecuación general del plano tangente a la gráfica de una función de
dos variables es z = f (a, b) + r f (a, b) · (x ° a, y ° b), entonces el vector r f (a) debe ser nulo.
a) f (x, y) = x 2 + 3x y + y
@f @f
= 2x + 3y = 3x + 1
@x @y
1 2
2x + 3y = 0 3x + 1 = 0 ) x = ° y=
3 9
µ ∂
1 2
Solo hay un punto crítico (x § , y § ) = ° ,
3 9
b) f (x, y, z) = 5x 2 + x y + y + z 2
@f @f @f
= 10x + y = x +1 = 2z
@x @y @z
10x + y = 0 x + 1 = 0 2z = 0 ) x = °1 y = 10 z = 0
Hay un único punto crítico (x § , y § , z § ) = (°1, 10, 0)
c) f (x, y) = x ln(y)
@f @f x
= ln(y) =
@x @y y
x
ln(y) = 0 =0 ) x =0 y =1
y
Solo hay un punto crítico (x § , y § ) = (0, 1)
@f @f
= 2(x ° 1) = 2(y + 2)
@x @y
2(x ° 1) = 0 2(y + 2) = 0 ) x = 1 y = °2
Hay un único punto crítico (x § , y § ) = (1, °2)
e) f (x, y) = °x 2 ° (y ° 3)2
@f @f
= °2x = °2(y ° 3)
@x @y
°2x = 0 ° 2(y ° 3) = 0 ) x = 0 y = 3
Solo hay un punto crítico (x § , y § ) = (0, 3)
f) f (x, y) = x 2 ° y
@f @f
= 2x = °1
@x @y
2x = 0 ° 1 = 0 ) no tiene solución
Por tanto, no hay puntos críticos
g) f (x, y) = x 2 ° y 2
@f @f
= 2x = °2y
@x @y
2x = 0 ° 2y = 0 ) x = 0 y = 0
Solo hay un punto crítico (x § , y § ) = (0, 0)
h) f (x, y) = (x ° y)2
@f @f
= 2(x ° y) = °2(x ° y)
@x @y
2(x ° y) = 0 ° 2(x ° y) = 0 ) x = y y = cualquier valor
En este caso hay infinitos puntos críticos: todos los puntos de la forma
(x § , y § ) = (a, a) a : cualquier valor, a 2 R
Como tanto los máximos como los mínimos locales de una función son puntos críticos, harán
falta condiciones de segundo orden (con las parciales segundas) para discriminar los puntos estacio-
narios. Además, puede haber puntos críticos que no sean ni máximo, ni mínimo. A los puntos críticos
que no son óptimos se les denomina puntos de silla.
La figura 3.24 presenta el ejemplo típico (al que se debe el nombre de punto de silla). Como se
observa en la gráfica, en el punto crítico (0, 0) se maximiza la función cuando la aproximación al
punto es de abajo arriba, y se minimiza cuando la aproximación se hace de izquierda a derecha. En el
apartado g ) de los ejemplos 21 i 22 se discute formalmente esta función.
Teorema 12 (Condición suficiente de óptimo local) Sea f : S ! R una función con parciales segundas
continuas en un conjunto S µ Rn abierto, y sea a 2 S un punto crítico de dicha función. Entonces,
1. Si H f (a) es definida positiva, la función alcanza un mínimo local en a.
2. Si H f (a) es definida negativa, entonces f (x) ° f (a) < 0, es decir f (x) < f (a) y en a se alcanza
un máximo local.
Nota 9 Cuando la forma cuadrática es semidefinida hay un caso de duda. Si es semidefinida positiva,
puede tratarse de un mínimo local o de un punto de silla. Si es semidefinida negativa, puede ser un
máximo local o un punto de silla. En ambos casos para clasificar el punto crítico se debe hacer un
estudio local, comparando el valor de la función en el punto crítico con el valor en otros de su entorno
tomados en distintas direcciones.
Ejemplo 22 Clasifica los puntos críticos o estacionarios de las funciones del ejemplo 21.
a) f (x, y) = x 2 + 3x y + y
µ ∂
2 3
La matriz hessiana es H f (x, y) =
3 0
µ ∂ µ ∂
1 2 2 3
En el punto crítico vale H f ° , =
3 9 3 0
µ ∂
1 2
D 1 = 2 D 2 = °9 ) indefinida, luego en ° , hay un punto de silla
3 9
b) f (x, y, z) = 5x 2 + x y + y + z 2
0 1
10 1 0
La matriz hessiana es H f (x, y, z) = @ 1 0 0 A
0 0 2
0 1
10 1 0
En el punto crítico vale H f (°1, 10, 0) = @ 1 0 0 A
0 0 2
D 1 = 10 D 2 = °1 D 3 = °2 ) indefinida, luego en (°1, 10, 0) hay un punto de silla
c) f (x, y) = x ln(y)
0 1
1
B 0 y C
La matriz hessiana es H f (x, y) = B @ 1 x A
C
° 2
y y
µ ∂
0 1
En el punto crítico vale H f (0, 1) =
1 0
En este caso, como D 1 = 0 se deben calcular todos los menores principales. Los de orden 1 son
H1 = {0, 0} y solo hay uno de orden 2, H2 = {°1}. Por tanto, la forma cuadrática es indefinida,
luego en (0, 1) hay un punto de silla
e) f (x, y) = °x 2 ° (y ° 3)2
µ ∂
°2 0
La matriz hessiana es H f (x, y) =
0 °2
µ ∂
°2 0
En el punto crítico vale H f (0, 3) =
0 °2
D 1 = °2 D 2 = 4 ) definida negativa, luego en (0, 3) se alcanza un máximo local, y el valor
máximo de la función es f máx = f (0, 3) = 0
f) f (x, y) = x 2 ° y
Como en este caso no existen puntos críticos, la función no posee ni máximos ni mínimos
locales
g) f (x, y) = x 2 ° y 2
µ ∂
2 0
La matriz hessiana es H f (x, y) =
0 °2
µ ∂
2 0
En el punto crítico vale H f (0, 0) =
0 °2
D 1 = 2 D 2 = °4 ) indefinida, luego en (0, 0) hay un punto de silla
h) f (x, y) = (x ° y)2
µ ∂
°22
La matriz hessiana es H f (x, y) =
°22
µ ∂
2 °2
En un punto crítico (a, a) vale H f (a, a) =
°2 2
Figura 3.25: Una función con infinitos puntos críticos, todos mínimos, f (x, y) = (x ° y)2
9. Programas convexos/cóncavos
En el caso particular en que la función que se quiere optimizar es convexa (para mínimos) o cón-
cava (para máximos) la discusión es más fácil y, además, se obtienen resultados adicionales. El primer
resultado indica que no es necesario comprobar las condiciones de segundo orden.
Como el gradiente en el punto crítico se anula, se tiene que para todo x, a 2 S, f (x) ∑ f (a), con lo que
en a se alcanza un máximo. ⇤
Este resultado es útil en casos como el apartado h) del ejemplo 22. Como la matriz hessiana
µ ∂
2 °2
H f (x, y) =
°2 2
es semidefinida positiva en cualquier punto (x, y), la función es convexa. Entonces todos los puntos
críticos son mínimos (como se había visto, ver figura 3.25) y no hace falta realizar el estudio local.
@f @f
= °4x + 2y = 0 = °6y + 2x = 0
@x @y
1. Si la función f es estrictamente convexa y tiene mínimo, dicho valor mínimo (global) se alcanza
en un único punto.
2. Si la función f es estrictamente cóncava y tiene máximo, dicho valor máximo (global) se alcanza
en un único punto.
2
°y 2
Figura 3.26: Gráfica de la función f (x, y) = e °x
OPTIMIZACIÓN RESTRINGIDA:
LAGRANGIANA, KARUSH-KUHN-TUCKER
Y PROGRAMACIÓN LINEAL
8. Programación cóncava
Restricciones de igualdad: las variables deben cumplir una o varias ecuaciones (por ejemplo,
se ha de producir una cantidad prefijada de una mercancía)
Restricciones de desigualdad: las variables deben cumplir una o varias inecuaciones (por ejem-
plo, no se puede gastar más de la renta disponible)
Restricciones de no negatividad: las variables han de ser mayores o iguales a cero (por su signi-
ficado económico)
85
CAPÍTULO 4: OPTIMIZACIÓN RESTRINGIDA
Restricciones de programación entera: las variables han de ser números enteros, ya que las uni-
dades son indivisibles (por ejemplo, número de estudiantes por aula, número de automóviles
en un concesionario, . . . )
Ejemplo 1 Problema con restricción de igualdad: Calcula el valor máximo que puede tomar el pro-
ducto de dos números reales cuya suma vale 1000.
el conjunto de oportunidades y las curvas de nivel de la función objetivo aparecen en la figura 4.1.
Gráficamente se observa que el máximo se alcanza en el punto (500, 500) y el valor máximo de la
función objetivo es f máx = 250000.
Como h 00 (500) = °2 < 0 se trata de un máximo, que coincide con la solución obtenida gráficamente.
Pero en general no se podrá resolver el sistema de ecuaciones que define el conjunto de oportu-
nidades, o será muy complicado.1 Por tanto serán necesarias otras técnicas para abordar este tipo de
problemas. La denominada lagrangiana del problema jugará un importante papel en la discusión.
1 Debe recordarse que en muchas ecuaciones, como por ejemplo x y ° ln(x y) = 1, no es posible despejar explícitamente
la función y = f (x).
° ¢ ° ¢
= f (x 1 , x 2 , . . . , x n ) + ∏1 b 1 ° g 1 (x 1 , x 2 , . . . , x n ) + . . . + ∏m b m ° g m (x 1 , x 2 , . . . , x n )
Las nuevas variables que se introducen en esta función (∏1 , ∏2 , . . . , ∏m ) se denominan multiplicadores
de Lagrange y se verá que poseen una importante interpretación económica. Un hecho a resaltar es
que en el problema [P ] solo interesa estudiar qué pasa en los puntos que cumplen las restricciones
g (x) = b, o lo que es lo mismo, b ° g (x) = 0. Por tanto, en dichos puntos la función objetivo y la
lagrangiana coinciden
a)
9
Optimizar f (x, y) = x y =
° ¢
sujeto a L (x, y); ∏ = x y + ∏(1000 ° x ° y)
;
x + y = 1000
b)
9
Optimizar f (x, y) = 3x + 4y =
° ¢
sujeto a L (x, y); ∏ = 3x + 4y + ∏(1 ° x 2 ° y 2 )
;
x2 + y 2 = 1
c)
9
Optimizar f (x, y, z) = °x 2 ° (y ° 1)2 ° xz >
>
>
=
sujeto a
x +y +z =1 >
>
>
;
x °z =0
° ¢
L (x, y, z); (∏, µ) = °x 2 ° (y ° 1)2 ° xz + ∏(1 ° x ° y ° z) + µ(°x + z)
@L(x § ; ∏§ )
=0 8i = 1, 2, . . . , n [N 1]
@x i
@L(x § ; ∏§ )
=0 8 j = 1, 2, . . . , m [N 2]
@∏ j
Nota 1 El teorema de Lagrange indica que los óptimos locales del problema, en caso de existir, se en-
cuentran entre los puntos críticos de la lagrangiana del problema. Por ello, el primer paso para resol-
verlo será calcular dichos puntos críticos que serán los posibles candidatos (tanto a maximizar como a
minimizar la función). Por tanto, el razonamiento es análogo al de optimización sin restricciones, sin
más que cambiar la función objetivo f (x) por la lagrangiana del problema L(x; ∏) = f (x)+∏·(b °g (x)).
Después, también como en el caso sin restricciones, se necesitarán unas condiciones de segundo orden
para analizar si se trata de un máximo, un mínimo, o ninguna de ambas cosas.
Nota 2 Merece la pena mirar con atención las parciales [N 2] de la lagrangiana con respecto a los mul-
tiplicadores
@L(x § ; ∏§ )
=0 8 j = 1, 2, . . . , m
@∏ j
@L(x § ; ∏§ )
= b j ° g j (x § ) = 0 ) g j (x § ) = b j 8 j = 1, 2, . . . , m
@∏ j
es decir, el punto x § cumple todas las restricciones, con lo cual para escribir las condiciones [N 2] no
hace falta calcular las parciales, sino que basta con escribir directamente las restricciones de igualdad
del problema.
Ejemplo 5 Calcula los puntos críticos de las lagrangianas de los problemas del ejemplo 4.
a)
9
Optimizar f (x, y) = x y =
° ¢
sujeto a L (x, y); ∏ = x y + ∏(1000 ° x ° y)
;
x + y = 1000
° ¢ 9
@L (x, y); ∏ >
>
= y °∏ = 0 ) y =∏ >
>
° @x ¢ >
>
@L (x, y); ∏ =
= x °∏ = 0 ) x =∏ ) x = 500 y = 500 ∏ = 500
° @y ¢ >
>
>
>
@L (x, y); ∏ >
>
= 100 ° x ° y = 0 ) x + y = 1000 ;
@∏
b)
9
Optimizar f (x, y) = 3x + 4y =
° ¢
sujeto a L (x, y); ∏ = 3x + 4y + ∏(1 ° x 2 ° y 2 )
;
x2 + y 2 = 1
° ¢ 9
@L (x, y); ∏ 3 >
>
= 3 ° 2∏x = 0 ) x= >
>
° @x ¢ 2∏ >
>
@L (x, y); ∏ = 9 16 5
4
= 4 ° 2∏y = 0 ) y= ) 2
+ 2 =1 ) ∏=±
° @y ¢ 2∏ >
> 4∏ 4∏ 2
>
>
@L (x, y); ∏ >
>
= 1 ° x2 ° y 2 = 0 ) x +y =1 ;
2 2
@∏
Hay que observar que ∏ debe ser distinto de cero para que puedan cumplirse las dos primeras con-
diciones, ya que si ∏ = 0 queda 3 = 0, 4 = 0, que no es posible. En este caso hay dos puntos críticos
3 4 5 3 4 5
x= y= ∏= x =° y =° ∏=°
5 5 2 5 5 2
c)
9
Optimizar f (x, y, z) = °x 2 ° (y ° 1)2 ° xz >
>
>
=
sujeto a
x +y +z =1 >
>
>
;
x °z =0
° ¢
L (x, y, z); (∏, µ) = °x 2 ° (y ° 1)2 ° xz + ∏(1 ° x ° y ° z) + µ(°x + z)
° ¢ 9
@L (x, y, z); (∏, µ) >
>
= °2x ° z ° ∏ ° µ = 0 ) °2x ° z ° ∏ ° µ = 0 >
>
° @x ¢ >
>
>
>
@L (x, y, z); (∏, µ) >
>
= °2(y ° 1) ° ∏ = 0 ) 2y + ∏ = 2 >
>
@y >
>
° ¢ >
=
@L (x, y, z); (∏, µ)
= °x ° ∏ + µ = 0 ) °x ° ∏ + µ = 0 >
° @z ¢ >
>
@L (x, y, z); (∏, µ) >
>
>
>
= 1°x ° y °z = 0 ) x +y +z =1 >
>
° @∏ ¢ >
>
@L (x, y, z); (∏, µ) >
>
>
>
= °x + z = 0 ) x °z =0 ;
@µ
Resolviendo el sistema (por ejemplo por Gauss) la única solución (punto crítico) es
x =0 y =1 z =0 ∏=0 µ=0
Obviamente estos vectores no son proporcionales luego, efectivamente, son linealmente indepen-
dientes y se cumple la condición de regularidad.
como puede observarse en la figura 4.3 el mínimo de este problema se alcanza en el punto (1, 0). Ade-
más, se trata de un mínimo global.
Nota 3 Sobre el subespacio V . Dado un punto x § que sea candidato a óptimo de un problema con
restricciones [P ], en primer lugar dicho punto debe cumplir las restricciones: g (x § ) = b. En segundo
lugar, para que dicho punto sea óptimo del problema, el valor de f (x § ) deberá ser mayor o igual (si
se trata de un máximo), o menor o igual (en caso de mínimo) que en los puntos de su alrededor que
cumplan las restricciones. Es decir (en caso de máximo)
g (x § + v) ° g (x § )
D v g (x § ) = rg (x § ) · v = lı́m =0 ) rg (x § ) · v = 0
kvk!0 kvk
Por tanto, el subespacio V indica las direcciones en las que es posible moverse desde el punto x § cum-
pliendo las restricciones del problema (conjunto de direcciones factibles; es decir, las direcciones que
interesan en el problema). Por eso se estudia la forma cuadrática restringida al subespacio V .
Nota 4 Se debe recordar que si una forma cuadrática es definida (positiva o negativa) sin restringir,
lo sigue siendo bajo cualquier restricción. Entonces, en muchas ocasiones se comienza estudiando la
forma cuadrática sin restringir.
a)
9
Optimizar f (x, y) = x y =
° ¢
sujeto a L (x, y); ∏ = x y + ∏(1000 ° x ° y) ) x = 500 y = 500 ∏ = 500
;
x + y = 1000
es definida negativa. Por tanto, en el punto crítico se alcanza un máximo local del problema de
optimización con restricciones, cuyo valor es f máx = f (500, 500) = 250000.
b)
9
Optimizar f (x, y) = 3x + 4y =
° ¢
sujeto a L (x, y); ∏ = 3x + 4y + ∏(1 ° x 2 ° y 2 )
;
x2 + y 2 = 1
La matriz hessiana y el gradiente de la restricción son:
µ ∂
° ¢ °2∏ 0
Hr L (x, y); ∏ = rg (x, y) = (2x, 2y)
0 °2∏
3 4 5 3 4 5
x= y= ∏= x =° y =° ∏=°
5 5 2 5 5 2
En el primer punto
µµ ∂ ∂ µ ∂
3 4 5 °5 0
Hr L , ; =
5 5 2 0 °5
por lo que la forma cuadrática es siempre definida negativa, y en este punto se alcanza un máximo
local, con valor de la función objetivo f máx = 5.
En el segundo punto
µµ ∂ ∂ µ ∂
3 4 5 5 0
Hr L ° ,° ;° =
5 5 2 0 5
por lo que la forma cuadrática es siempre definida positiva, y en este punto se alcanza un mínimo
local, con valor de la función objetivo f mı́n = °5.
La figura 4.4, muestra cómo se puede resolver el problema gráficamente mediante curvas de nivel.
Además, se observa que los óptimos encontrados son globales.
c)
9
Optimizar f (x, y, z) = °x 2 ° (y ° 1)2 ° xz >
>
>
=
sujeto a
x +y +z =1 >
>
>
;
x °z =0
° ¢
L (x, y, z); (∏, µ) = °x 2 °(y °1)2 °xz +∏(1°x °y °z)+µ(°x +z) ) x = 0 y = 1 z = 0 ∏ = 0 µ = 0
La matriz hessiana en este punto y los gradientes de las restricciones son:
0 1
°2 0 °1
Hr L ((0, 1, 0); (0, 0)) = @ 0 °2 0 A rg 1 (0, 1, 0) = (1, 1, 1) rg 2 (0, 1, 0) = (1, 0, °1)
°1 0 0
es definida negativa. Por tanto, en el punto crítico se alcanza un máximo local del problema de
optimización con restricciones, cuyo valor es f máx = f (0, 1, 0) = 0.
x = °1 y = 1 z = 1 ∏=2
0 0
Ejemplo 9 Se considera una función de producción Cobb-Douglas g (k, `) = k0 5 `0 5 . Si el precio2 del
capital k es s = 1 + r = 10 1 y el coste del trabajo ` es w = 110, el problema de minimización de costes de
la empresa para producir 100 unidades es
0 0
Minimizar 10 1k + 110` sujeto a k0 5 `0 5 = 100 [P ]
2 Si la tasa de interés se denota por r , el precio del dinero es s = 1 + r . En el ejemplo (por facilitar cálculos) se supone una
Las condiciones de primer orden proporcionan un único punto crítico k§ = 1000, `§ = 10, ∏§ = 22. La
hessiana de la lagrangiana (con respecto a (k, `)) es
0 1
1 °3 1 1 1 1
∏k 2 ` 2 ° ∏k° 2 `° 2
B 4 4 C
B C
Hr L = B C
@ 1 1 1 1 1 3
A
° ∏k° 2 `° 2 ∏k 2 `° 2
4 4
que sustituida en el punto crítico
0 1
22 °4 22 °2
10 ° 10
B 4 4 C 22 °4
B C
Hr L(1000, 10) = B C D1 = 10 > 0, D 2 = 0
@ 22 °2 22 A 4
° 10
4 4
Como es semidefinida positiva, debe hacerse el estudio de la forma cuadrática restringida. El gradiente
de la restricción es µ ∂ µ ∂
1 °1 1 1 1 °1 1
rg (k, `) = k ` , k `
2 2 2 2 rg (1000, 10) = ,5
2 2 20
Ω µ ∂ æ
1
El conjunto de direcciones factibles es V = (u, v) 2 R2 : , 5 · (u, v) = 0 , que implica u = °100v.
20
Por tanto queda
0 1
22 °4 22
10 ° 10°2 0 °100v 1
B 4 4 C
B C@ A = 22v 2
(°100v, v) B C
@ 22 22 A
° 10°2 v
4 4
definida positiva, con lo que el punto crítico es solución del problema de minimización de costes de la
empresa. El coste mínimo es f mı́n = 2200.
b) Si la función objetivo f (x) es una función convexa, las funciones que definen las restricciones g j (x)
son funciones lineales y (x § ; ∏§ ) es un punto crítico de la lagrangiana, entonces en x § se alcanza un
mínimo (restringido).
Además, el máximo o mínimo respectivos son globales. Si, adicionalmente, la función objetivo es estric-
tamente cóncava, o estrictamente convexa, el óptimo (máximo o mínimo, respectivamente) se alcanza
en un único punto.
El teorema anterior significa que también en este caso la condición de primer orden (punto crítico
de la lagrangiana) es necesaria y suficiente para que un punto sea solución del programa cóncavo o
convexo y además en estos casos se puede asegurar que el óptimo es global. Un caso frecuente de
programas cóncavos y convexos aparece cuando tanto la función objetivo como las restricciones son
funciones lineales.
como se quiere minimizar una función convexa con una restricción lineal (es una recta), solo será ne-
cesario encontrar los puntos críticos de la lagrangiana que, en caso de existir, serán la solución del
problema. Además, al ser la función objetivo estrictamente convexa, solo puede haber un punto donde
se alcance el óptimo (mínimo).
° ¢
L (x, y); ∏ = x 2 + y 2 + ∏(1 ° x ° y)
Para cada valor de b se tiene un problema distinto [P (b)], que al resolverse proporciona una solución
° § ¢
x (b), y § (b) , ∏§ (b) distinta y un óptimo diferente
° ¢
f § (b) = f x § (b), y § (b) función óptimo
En este caso se trata de una función real de una única variable real b. Si todas las funciones que
intervienen en el problema tienen parciales continuas, se puede calcular la derivada de la función
óptimo con respecto a b (es decir, estudiar cómo cambia el óptimo cuando cambia el valor de la
restricción). La lagrangiana del problema (en función de b) es
°° ¢ ¢ ° ¢ ° ° ¢¢
L x(b), y(b) ; ∏(b) = f x(b), y(b) + ∏(b) b ° g x(b), y(b)
Reordenando
µ ∂ µ ∂
dL @f @g d x(b) @f @g d y(b) d ∏(b) ° ° ¢¢
= ° ∏(b) + ° ∏(b) + b ° g x(b), y(b) + ∏(b)
db @x @x db @y @y db db
Al sustituir en un punto óptimo, como debe cumplir las condiciones de primer orden, todos los tér-
minos entre paréntesis se anulan y se obtiene
° ¢
d L (x § , y § ); ∏§
= ∏§ (b)
db
° ¢
Como f § (b) = L (x § (b), y § (b)); ∏§ (b) , se cumple
° ¢ ° ¢
d f § (b) d f x § , y § d L (x § , y § ); ∏§
= = = ∏§ (b)
db db db
y el valor del multiplicador indica cómo cambia el óptimo de la función objetivo cuando se modifica
el valor b que define la restricción. Por tanto, para un incremento de M b en el valor de b, el óptimo
cambiará aproximadamente M f § º ∏§ M b. Para un incremento unitario, M b = 1, el incremento del
óptimo será, aproximadamente, M f § º ∏§ .
Ejemplo 11 Para el problema de minimización de costes del ejemplo 9 se ha obtenido ∏§ = 22. Esto
indica que el coste óptimo (mínimo) aproximado de producir una unidad adicional es 22. En este
ejemplo la aproximación es exacta, ya que el coste mínimo de producir 101 unidades es f § (101) = 2222.
En economía se denomina a ∏§ el precio sombra.
Ejemplo 13 Un consumidor puede destinar una renta de R = 300 " en consumo de ocio y cultura (x),
y en vestuario y equipamiento personal (y). Su función de utilidad es u(x, y) = 20x + 40y ° x 2 ° y 2 . Si
los precios de las variables son p x = 5 ", p y = 10 ", ¿cuántas unidades de cada tipo consumirá, dada su
renta, para maximizar su utilidad?
El problema de optimización (gastando toda la renta) es
La lagrangiana es
°° ¢ ¢
L x, y ; ∏ = 20x + 40y ° x 2 ° y 2 + ∏(300 ° 5x ° 10y)
Como la función objetivo es estrictamente cóncava y la restricción es lineal, hay un único punto crítico
que es solución del problema: x § = 12, y § = 24, que le proporciona una utilidad u § = u(12, 24) = 480.
Sin embargo, si se permite que el consumidor no gaste toda su renta, puede elegir x = 10, y = 20, con lo
que incurre en un gasto de 250 " y obtiene una utilidad u(10, 20) = 500, que es superior. Un consumi-
dor racional eligiría esta opción antes que el óptimo restringido con igualdad. Por tanto, el problema
adecuado que el consumidor debe plantearse es
En lo que queda se analizarán problemas de optimización cuyas restricciones pueden ser de des-
igualdad. El problema estándar [PE ] que se estudiará es:
9
Maximizar f (x 1 , x 2 , . . . , x n ) >
>
>
>
sujeto a >
>
>
=
g 1 (x 1 , x 2 , . . . , x n ) ∑ b 1
[PE ]
g 2 (x 1 , x 2 , . . . , x n ) ∑ b 2 >
>
>
>
... >
>
>
;
g m (x 1 , x 2 , . . . , x n ) ∑ b m
El primer paso es observar que cualquier problema de optimización se puede escribir en forma es-
tándar sin más que aplicar las siguientes consideraciones:
1. Si se desea minimizar una función objetivo, basta cambiar el signo de dicha función y maximi-
zarla. El punto donde se alcanza el óptimo es el mismo y solo cambia el signo del valor óptimo:
Minimizar f (x 1 , x 2 , . . . , x n ) ¥ ° Maximizar ° f (x 1 , x 2 , . . . , x n )
°g j (x 1 , x 2 , . . . , x n ) ∑ °b j
La lagrangiana del problema estándar [PE ] se construye de forma análoga al caso de problemas de
optimización con restricciones de igualdad
° ¢
L(x; ∏) = f (x) + ∏ · b ° g (x)
pero, a diferencia de lo que ocurre allí, esta función no coincide con la función objetivo en los puntos
que cumplen las restricciones, ya que b ° g (x) no tiene porqué anularse. Este hecho será relevante
cuando se impongan las condiciones que deben cumplir las soluciones del problema.
° Maximizar ° x 2 ° (y ° 1)2 ° z 2
x + z ∑ 0; x + z ∏ 0 ) x + z ∑ 0; °x ° z ∑ 0
Nota 5 Para la construcción de la lagrangiana y para resolver el problema, se ignora el signo menos
que aparece antes de maximización y después, una vez obtenida la solución, se cambiará el signo del
valor óptimo f § de la función objetivo. El punto que optimiza (maximiza) la función, x § , es el que se
ha obtenido. También puede sustituirse el punto x § en la función objetivo que se quería minimizar.
@L(x § ; ∏§ )
=0 8i = 1, 2, . . . , n [K T 1]
@x i
@L(x § ; ∏§ )
∏§j =0 8 j = 1, 2, . . . , m [K T 2]
@∏ j
g j (x § ) ∑ b j 8 j = 1, 2, . . . , m [K T 3]
∏§j ∏ 0 8 j = 1, 2, . . . , m [K T 4]
Como en casos anteriores, las condiciones necesarias indican los puntos candidatos a ser ópti-
mos (máximos en este caso). Para calcular estos puntos se usan las condiciones que son de igualdad,
[K T 1] y [K T 2], y se comprueba si los puntos obtenidos cumplen las condiciones con desigualdad,
[K T 3] que son las restricciones del problema, y [K T 4] que indican la no negatividad de los multi-
plicadores. Estas dos condiciones hacen que ciertos puntos obtenidos con las condiciones [K T 1] y
[K T 2] deban ser descartados.
Por otro lado, la condición [K T 2], que se denomina condición de holgura complementaria, se
puede escribir como
° ¢
∏§j b j ° g j (x § ) = 0 8 j = 1, 2, . . . , m [K T 2]
con lo que en un punto óptimo se cumple
m
X ° ¢
L(x § ; ∏§ ) = f (x § ) + ∏§j b j ° g j (x § ) = f (x § )
j =1
es decir, la lagrangiana coincide con la función objetivo (como en el caso de problemas con restric-
ciones de igualdad). La condición [K T 2] indica además que cuando una restricción no se satura (se
cumple con desigualdad estricta) el multiplicador de Lagrange que le corresponde se anula en el pun-
to óptimo.
Ejemplo 15 Calcula los puntos que cumplen las condiciones de Karush-Kuhn-Tucker del siguiente
problema y analiza gráficamente (mediante curvas de nivel) si son solución del problema.
@L @L
= 1 ° 2∏x = 0 = °1 ° 2∏y = 0 [K T 1]
@x @y
∏(1 ° x 2 ° y 2 ) = 0 [K T 2]
x2 + y 2 ∑ 1 [K T 3]
∏∏0 [K T 4]
1 1
De la condición [K T 1] se obtiene que ∏ 6= 0, x 6= 0, y 6= 0, ∏ = = ° , y = °x. Sustituyendo en [K T 2]
2x 2y
1
se tiene que 2x 2 = 1, de donde x = ± p . Luego se obtienen dos posibles puntos:
2
µµ ∂ ∂ µµ ∂ ∂
1 1 1 1 1 1
p ,°p ; p °p , p ;°p
2 2 2 2 2 2
Como, por [K T 4], el multiplicador ha de ser mayor o igual a cero, el segundo punto se descarta y solo
queda el primero (que cumple todas las condiciones) como candidato a solución del problema.
Gráficamente, utilizando curvas de nivel, se observa que este punto es laµ solución del∂ problema (ver
1 1 2 p
figura 4.5). El valor máximo restringido de la función objetivo es f máx = f p , ° p = p = 2.
2 2 2
Para problemas en los que la representación gráfica no es posible (más de dos variables) o no es
fácil, es necesario aplicar condiciones suficientes para saber si un punto que cumple las condiciones
[K T ] es solución del problema. Aunque estas condiciones se verán con detalle en la sección siguiente,
un caso particular es cuando la función objetivo del problema es cóncava y el conjunto de oportuni-
dades definido por las restricciones es un conjunto convexo. En este caso, las condiciones [K T ] son
también suficientes.
∏(300 ° 5x ° 10y) = 0 [K T 2]
5x + 10y ∑ 300 [K T 3]
∏∏0 [K T 4]
El único punto que cumple las condiciones es x § = 10, y § = 20, ∏§ = 0. Como la función objetivo es
cóncava y el conjunto factible es convexo, este punto es la solución del problema. Obsérvese que el con-
sumidor no agota totalmente su renta ya que 5x § + 10y § = 250 < 300. Al ser la desigualdad estricta en
el óptimo, esto hace que ∏§ = 0, lo que significa que un pequeño aumento/disminución en b = 300 no
afecta al valor del óptimo. La utilidad máxima del consumidor es u máx = 500.
Obviamente, cambiando el sentido de las últimas n restricciones (las de no negatividad) este proble-
ma aparece ya escrito en forma estándar y se pueden aplicar las condiciones [K T ] para encontrar
los posibles óptimos. Pero al haber más restricciones aparecen más multiplicadores de Lagrange y
se complica más la resolución. En el siguiente resultado se obtienen unas condiciones equivalentes,
usando la misma lagrangiana que en el problema [PE ], que aquí se denomina lagrangiana reducida,
en la que las restricciones de no negatividad no se introducen.
@L(x § ; ∏§ )
∑0 8i = 1, 2, . . . , n [K T 1+]
@x i
@L(x § ; ∏§ )
x i§ =0 8i = 1, 2, . . . , n [K T 2+]
@x i
@L(x § ; ∏§ )
∏§j =0 8 j = 1, 2, . . . , m [K T 3+]
@∏ j
g j (x § ) ∑ b j 8 j = 1, 2, . . . , m [K T 4+]
x i§ ∏ 0 8i = 1, 2, . . . , m [K T 5+]
∏§j ∏ 0 8 j = 1, 2, . . . , m [K T 6+]
Como antes, las condiciones que se usan para obtener los candidatos a solución son las de igual-
dad, [K T 2+] y [K T 3+]. Para los puntos obtenidos se comprueban el resto de condiciones, descartan-
do los que no las cumplan. En la resolución de estas condiciones [K T 2+] y [K T 3+] aparecen produc-
tos de dos números igualados a cero
@L(x; ∏) @L(x; ∏)
xi =0 ∏j =0
@x i @∏ j
Un método para resolverlo es ir dividiendo el problema en casos y subcasos: como el producto debe
ser cero, uno de los dos debe ser cero. Así se simplifican los cálculos que hay que realizar. Por ejemplo,
si hay que resolver las dos igualdades anteriores se tendría
caso 1) x i = 0
subcaso 1.1) ∏ j = 0
@L(x; ∏)
subcaso 1.2) =0
@∏ j
@L(x; ∏)
caso 2) =0
@x i
subcaso 2.1) ∏ j = 0
@L(x; ∏)
subcaso 2.2) =0
@∏ j
Se observa que en el subcaso 1.1 ya se sabe el valor de las variables y de los multiplicadores x i = 0,
∏ j = 0 y solo hay que comprobar si cumple el resto de condiciones. En otros subcasos simplemente
lo que se tiene con este método son ecuaciones más fáciles de resolver.
Ejemplo 17 Calcula los puntos que cumplen las condiciones de Karush-Kuhn-Tucker del siguiente
problema y analiza gráficamente (mediante curvas de nivel) si son solución del problema.
Maximizar x ° y sujeto a x 2 + y 2 ∑ 1 x ∏ 0, y ∏ 0 [PE +]
° ¢
La lagrangiana reducida del problema es L (x, y); ∏ = x ° y +∏(1°x 2 ° y 2 ). Las condiciones [K T +] son
@L @L
= 1 ° 2∏x ∑ 0 = °1 ° 2∏y ∑ 0 [K T 1+]
@x @y
@L @L
x = x(1 ° 2∏x) = 0 y = y(°1 ° 2∏y) = 0 [K T 2+]
@x @y
∏(1 ° x 2 ° y 2 ) = 0 [K T 3+]
x2 + y 2 ∑ 1 [K T 4+]
x ∏ 0, y ∏ 0 [K T 5+]
∏∏0 [K T 6+]
De las condiciones [K T 2+] se tienen los siguientes casos:
caso 1) x = 0, y = 0 ) no cumple [K T 1+]
8. Programación cóncava
Una vez obtenidos los puntos que cumplen las condiciones necesarias queda analizar si son solu-
ción del problema. Un modo, utilizado en los ejemplos anteriores, es la discusión gráfica mediante las
curvas de nivel de la función. Pero esto solo es posible con funciones de dos variables para las que sea
relativamente sencillo poder dibujar sus curvas de nivel, y cuando sea también fácil de representar el
conjunto factible (puntos que cumplen todas las restricciones). No existen condiciones suficientes en
un caso general, y se necesita concavidad de la función que se desea maximizar y la convexidad del
conjunto factible. Cuando se dan estas condiciones se habla de problemas de programación cónca-
va.
Teorema 6 Sea (x § ; ∏§ ) un punto que cumple las condiciones [K T ] de un problema en forma estándar
[PE ]. Si la función objetivo f (x) es cóncava, y el conjunto factible (conjunto de puntos que cumplen
todas las restricciones) es convexo, en x § se alcanza una solución global del problema [PE ].
Se prueba que las funciones que definen las restricciones son convexas o cuasi-convexas
Es inmediato ver que la función objetivo es (estrictamente) cóncava, sin más que calcular su
matriz hessiana.
Las funciones que definen las restricciones son lineales, luego son convexas.
Se cumple la condición de regularidad, ya que los gradientes rg 1 = (1, 1), rg 2 = (°1, 1) son li-
nealmente independientes.
Por tanto el punto que cumpla las condiciones [K T +] será solución del problema.
° ¢
La lagrangiana reducida del problema es L (x, y); ∏ = °x 2 ° 2y 2 + x y + ∏(2 ° x ° y) + µ(1 + x ° y). Las
condiciones [K T +] son
@L @L
= °2x + y ° ∏ + µ ∑ 0 = °4y + x ° ∏ ° µ ∑ 0 [K T 1+]
@x @y
@L @L
x = x(°2x + y ° ∏ + µ) = 0 y = y(°4y + x ° ∏ ° µ) = 0 [K T 2+]
@x @y
x+y ∑2 °x + y ∑ 1 [K T 4+]
x ∏ 0, y ∏ 0 [K T 5+]
∏ ∏ 0, µ ∏ 0 [K T 6+]
x = 0, y = 1, µ = 4 no cumple [K T 1+];
5 9 1
x = , y = ,µ= no cumple [K T 4+]
4 4 4
x = 0, y = 2, ∏ = °8 no cumple [K T 6+];
x = 2, y = 0, ∏ = °4 no cumple [K T 6+];
5 4 7
x = , y = ,∏=° no cumple [K T 6+]
4 4 4
1 3 5
caso 4) 2 ° x ° y = 0, 1 + x ° y = 0 ) x = , y = , ∏ = ° , µ = °2 no cumple [K T 6+]
2 2 2
Por tanto, hay un único punto que cumple todas las condiciones del teorema 5, (x § , y § ) = (0, 0). Como
se verifican las condiciones suficientes, dicho punto es solución del problema. El valor óptimo de la
función objetivo es f máx = f (0, 0) = 0. La figura 4.7 muestra la resolución gráfica del problema.
Ejemplo 19 Un fondo de inversión dispone de M millones de euros para invertir en n proyectos in-
dustriales. De cada uno de ellos obtiene un beneficio b i que es función de la cantidad m i invertida en
dicho proyecto, b i = f i (m i ), donde las funciones f i (x) son cóncavas. Plantea el problema de maximiza-
ción del beneficio total, calcula las condiciones necesarias y suficientes del punto óptimo, e interpreta
económicamente el significado del multiplicador de Lagrange.
n
X n
X n
X
Maximizar bi = f i (m i ) sujeto a mi ∑ M m i ∏ 0 8i = 1, 2, . . . , n
i =1 i =1 i =1
√ !
n
X n
X
La lagrangiana de este problema es L ((m 1 , m 2 , . . . , m n ); ∏) = f i (m i ) + ∏ M ° m i y como la fun-
i =1 i =1
ción objetivo es cóncava (por serlo las funciones f i (x)) y la restricción es lineal, las condiciones (necesa-
@L
= f i0 (m i ) ° ∏ ∑ 0 i = 1, 2, . . . , n [K T 1+]
@m i
@L ° ¢
mi = m i f i0 (m i ) ° ∏ = 0 i = 1, 2, . . . , n [K T 2+]
@m i
√ !
n
X
∏ M° mi = 0 [K T 3+]
i =1
n
X
mi ∑ M [K T 4+]
i =1
mi ∏ 0 i = 1, 2, . . . , n [K T 5+]
∏∏0 [K T 6+]
donde
0 1 0 1 0 1 0 1
c1 x1 a 11 a 12 ... a 1n b1
B C B C B C B C
B c2 C B x2 C B a 21 a 22 ... a 2n C B b2 C
c =B
B .. C
C x =B
B .. C
C A=B
B .. .. .. C
C b=B
B .. C
C
@ . A @ . A @ . . . A @ . A
cn xn a m1 a m2 ... a mn bm
Las restricciones que aparezcan como mayor o igual, se multiplican por (°1) y la desigualdad
cambia de sentido (pasa a ser menor o igual).
Si hay alguna restricción de igualdad, se sustituye por dos desigualdades (una mayor o igual, y
la otra menor o igual).
Si alguna variable no está sujeta a restricción de no negatividad, se sustituye por la resta de dos
variables no negativas.
Minimizar x ° 2y sujeto a x + y ∑ 2 x ° 3y = 1 x ∏ 0
° Maximizar ° x + 2y
x+y ∑2 x ° 3y ∑ 1 ° x + 3y ∑ °1
Solo la primera variable tiene restricción de no negatividad. Por tanto hay que hacer un cambio
en la segunda variable y = y 1 ° y 2 y 1 ∏ 0, y 2 ∏ 0
° Maximizar ° x + 2y 1 ° 2y 2
sujeto a x + y 1 ° y 2 ∑ 2; x ° 3y 1 + 3y 2 ∑ 1; °x + 3y 1 ° 3y 2 ∑ °1; x ∏ 0, y 1 ∏ 0, y 2 ∏ 0
@L(x § ; ∏§ )
= c ° ∏§ A ∑ 0 , ∏§ A ∏ c [K T 1+]
@x
@L(x § ; ∏§ )
x§ · = x § · (c ° ∏§ A) = 0 [K T 2+]
@x
@L(x § ; ∏§ )
∏§ · = ∏§ · (b ° Ax § ) = 0 [K T 3+]
@∏
Ax § ∑ b [K T 4+]
x§ ∏ 0 [K T 5+]
∏§ ∏ 0 [K T 6+]
Las condiciones de igualdad, [K T 2+] y [K T 3+] son conocidas como condiciones de holgura com-
plementaria. Si una restricción no se da con igualdad, la variable o multiplicador de Lagrange que
está multiplicando debe valer cero. Y, recíprocamente, si una variable o multiplicador no valen cero,
la correspondiente restricción debe cumplirse con igualdad.
Maximizar 5x + y sujeto a 4x ° y ∑ 2 x + y ∑ 3 x ∏ 0, y ∏ 0
° ¢
La lagrangiana es L (x, y); (∏, µ) = 5x + y +∏(2°4x + y)+µ(3°x ° y) y las condiciones que caracterizan
los óptimos son
æ
§ 4∏ + µ ∏ 5
∏ A∏c ) [K T 1+]
°∏ + µ ∏ 1
æ
§ § x(5 ° 4∏ ° µ) = 0
x · (c ° ∏ A) = 0 ) [K T 2+]
y(1 + ∏ ° µ) = 0
æ
§ § ∏(2 ° 4x + y) = 0
∏ · (b ° Ax ) = 0 ) [K T 3+]
µ(3 ° x ° y) = 0
æ
§ 4x ° y ∑ 2
Ax ∑ b ) [K T 4+]
x+y ∑3
x§ ∏ 0 ) x ∏ 0, y ∏ 0 [K T 5+]
∏§ ∏ 0 ) ∏ ∏ 0, µ ∏ 0 [K T 6+]
Como se observa, a pesar de ser un problema sencillo (dos variables, dos restricciones), la resolución
con cuatro incógnitas y un gran número de ecuaciones e inecuaciones sería laboriosa. Si se representa
el problema gráficamente y se dibujan curvas de nivel (ver figura 4.8) se ve fácilmente que el máximo se
alcanza en el punto (1, 2) con un valor f máx = 7. Se puede comprobar que este punto cumple todas las
condiciones [K T +].
Hay que observar que el conjunto factible es un conjunto compacto y convexo, con vértices en los
puntos (0, 0), (00 5, 0), (1, 2) y (0, 3). La solución se alcanza en uno de los vértices. Este hecho es general y
proporciona un método, en problemas con dos variables, o dos restricciones, para encontrar fácilmente
la solución.
2. Las restricciones vienen definidas por funciones lineales y, por tanto, el conjunto factible es
convexo, con un número finito de vértices definidos por las intersecciones de las restricciones.
3. Cuando el conjunto factible sea acotado (lo que dependerá de las restricciones) y no vacío,
será compacto y, siendo la función continua, se podrá aplicar el teorema de Weierstrass que
garantiza la existencia de solución. Cuando no sea acotado, puede que exista solución o que no
exista (el máximo sería infinito), dependiendo de la función objetivo.
4. Cuando existe solución, ésta será global. Pero, al tratarse de una función lineal, no es estricta-
mente cóncava y el óptimo puede alcanzarse en varios puntos.
5. La solución, en caso de existir, siempre se alcanza al menos en un vértice (punto extremo). Esta
propiedad proporciona un método para encontrar la solución cuando existe: basta calcular el
valor de la función objetivo en los puntos extremos y elegir el (o los) que den el mayor valor en
un problema estándar.
Por tanto, la solución se alcanza en el punto (1, 2) y el máximo de la función objetivo es f máx = 7 (tal
como se había obtenido con curvas de nivel).
El conjunto factible es vacío: no existe ningún punto que cumple todas las restricciones. En
este caso el problema no tiene sentido.
Dibujando curvas de nivel, se observa que todos los puntos en el segmento que une (1, 2) y (3, 1) pro-
porcionan el mismo valor (máximo) de la función objetivo, f máx = 5. Por tanto, todos estos puntos son
solución del problema.
En caso de que la solución se alcance en más de un punto, el hecho de que la función objetivo sea
lineal hace que el mismo valor en todo el segmento que une dichos puntos y, por tanto, el problema
tiene infinitas soluciones, como muestra el siguiente razonamiento:
Si x § , y § son dos soluciones distintas del problema de programación lineal, al ser la so-
lución global se cumple que c · x § = c · y § = f máx , que es el valor máximo de la función
objetivo. Entonces
° ¢
8Æ 2 [0, 1] c · Æx § + (1 ° Æ)y § = Æc · x § + (1 ° Æ)c · y § = Æ f máx + (1 ° Æ) f máx = f máx
9.2. Dualidad
Definición 2 Dado un programa lineal en forma estándar
9
Maximizar c ·x >
>
>
=
sujeto a
[P LE ]
Ax ∑ b >
>
>
x ∏0 ;
Como puede observarse en la definición anterior, a partir del problema en forma estándar el dual
se construye del siguiente modo:
Es un problema de minimizar.
Maximizar 5x + y sujeto a 4x ° y ∑ 2 x + y ∑ 3 ° x + 2y ∏ 2 x ∏ 0, y ∏ 0
3 Obsérvese que es lo mismo escribir y A ∏ c que escribir A 0 y 0 ∏ c 0 . En el primer caso los vectores y, c se consideran
Maximizar 5x + y sujeto a 4x ° y ∑ 2 x + y ∑ 3 x ° 2y ∑ °2 x ∏ 0, y ∏ 0
Minimizar 2u + 3v ° 2w sujeto a 4u + v + w ∏ 5 ° u + v ° 2w ∏ 1 u ∏ 0, v ∏ 0, w ∏ 0
° Maximizar ° 2u ° 3v + 2w sujeto a ° 4u ° v ° w ∑ °5 u ° v + 2w ∑ °1 u ∏ 0, v ∏ 0, w ∏ 0
Teorema de dualidad
Si se analizan conjuntamente un problema y su dual
9 9
Maximizar c ·x > > Minimizar b·y >
>
>
= >
=
sujeto a sujeto a
[P P ] [P D]
Ax ∑ b >> yA ∏c >
>
> >
x ∏0 ; y ∏0 ;
las condiciones necesarias y suficientes [K T +] que debe cumplir una solución son
∏§ · (b ° Ax § ) = 0 [K T 3+] µ§ · (c ° y § A) = 0 [K T 3+]
Ax § ∑ b [K T 4+] y§ A ∏ c [K T 4+]
x§ ∏ 0 [K T 5+] y§ ∏ 0 [K T 5+]
∏§ ∏ 0 [K T 6+] µ§ ∏ 0 [K T 6+]
Se observa que ambas coinciden sin más que cambiar x § ¥ µ§ , ∏§ ¥ y § . Por tanto, ambos problemas
tienen solución o no la tiene ninguno; la solución (valor óptimo de la función objetivo) coincide (esto
sale de las condiciones [K T 2+]); y los puntos donde se alcanza la solución de uno, coinciden con
los multiplicadores del otro. Este resultado es conocido como teorema de dualidad. En resumen, las
relaciones entre un problema y su dual son las siguientes:
El problema dual del dual es el problema primal (por esta razón es indiferente a cual se deno-
mine problema primal y a cual problema dual).
Un problema de programación lineal tiene solución si, y solo si, su problema dual tiene solu-
ción.
sujeto a x 1 ° x 2 ° x 3 ° 3x 4 ∑ 5 ° x 1 ° x 2 ° 3x 3 + 2x 4 ∑ °1 x 1 ∏ 0, x 2 ∏ 0, x 3 ∏ 0, x 4 ∏ 0
Como el problema tiene 4 variables no se puede resolver gráficamente. Pero como solo hay dos restric-
ciones (sin considerar las de no negatividad), su problema dual tendrá dos variables y se puede resolver
gráficamente.
Dibujando el conjunto factible (ver figura 4.12) se observa que los vértices son (0, 0), (0, 3), (2, 5), (5, 4),
(6, 3) y (4, 0). Evaluando la función objetivo en estos puntos se obtiene la solución del problema. El
resultado es u = 0, v = 3. El valor óptimo (mínimo) de la función objetivo es f mı́n = °3.
Entonces el problema inicial también tiene solución y el valor óptimo (máximo) de la función objetivo
es f máx = °3. Para calcular en qué punto se alcanza el óptimo se usan las condiciones de holgura com-
plementaria [K T 2+] y [K T 3+], que indican que el producto de cada variable de los problemas primal
y dual por la restricción correspondiente debe anularse. Esto es,
u(5 ° x 1 + x 2 + x 3 + 3x 4 ) = 0
v(°1 + x 1 + x 2 + 3x 3 ° 2x 4 ) = 0
x 1 (u ° v + 3) = 0
x 2 (°u ° v + 9) = 0
x 3 (°u ° 3v + 17) = 0
x 4 (°3u + 2v + 12) = 0
Ejemplo 26 Una empresa vende café molido que elabora a partir de tres tipos de grano de café: Arábica,
Brasil y Colombia. La empresa produce dos mezclas que denomina café América, que elabora a partes
iguales con granos de café Brasil y Colombia; y café Gourmet que contiene un 60 % de Arábica, un 10 %
de Colombia y el resto en granos de café de Brasil. La empresa obtiene un beneficio de 5 " por cada kilo
de café América, y de 7 " por cada kilo de café Gourmet. El stock de granos de café que tiene la empresa es
de 24000 kilos de granos de Arábica, 20000 kilos de granos de café de Brasil, y 20000 kilos de Colombia.
¿Cuántos kilos de cada tipo de mezcla producirá la empresa para maximizar beneficios?
cantidad (en kilos) por cada kilo Arábica Brasil Colombia beneficio por kilo (en euros)
América 0 00 5 00 5 5
Gourmet 00 6 00 3 00 1 7
stock (kilos) 24000 20000 20000
Hay que determinar cuántos kilos de cada mezcla se elaborarán. Para formalizar el problema, se deno-
mina:
Entonces,
b) La primera restricción viene dada por la disponibilidad de café Arábica. Como la mezcla América
no contiene, y cada kilo de café Gourmet usa 00 6 kilos de Arábica, la restricción es 00 6y ∑ 24000.
c) La segunda restricción la define la cantidad de café Brasil disponible. Como cada kilo de América
contiene 00 5 kilos de Brasil, y cada kilo de Gourmet necesita 00 3 kilos de Brasil, la restricción que se
tiene es 00 5x + 00 3y ∑ 20000.
d) De manera análoga se obtiene la restricción debida a la disponibilidad de café Colombia, que será
00 5x + 00 1y ∑ 20000.
4 No se agota la cantidad disponible y la restricción se cumple con desigualdad estricta.
Añadiendo las restricciones de no negatividad (es obvio que no se pueden producir cantidades negati-
vas), queda el problema
9
Maximizar 5x + 7y >
>
>
>
sujeto a >
>
0
>
=
0 6y ∑ 24000
00 5x + 00 3y ∑ 20000 >
>
>
00 5x + 00 1y ∑ 20000 >
>
>
>
;
x ∏ 0 ∏ 0, y ∏ 0
Gráficamente (ver figura 4.13) se observa que la solución se alcanza en el punto (16000, 40000), es decir
la empresa producirá 16000 kilos de café América y 40000 kilos de café Gourmet. Con esta producción:
Agotará la cantidad de café Brasil disponible (la segunda restricción también se satura).
Solo usa 12000 de los 20000 kilos de café Colombia disponibles (por tanto, la tercera restricción
no se satura).
El problema dual es
9
Minimizar 24000u + 20000v + 20000w > >
>
>
sujeto a >
=
0 0
0 5v + 0 5w ∏ 5
>
>
00 6u + 00 3v + 00 1w ∏ 7 >
>
>
;
u ∏ 0, v ∏ 0, w ∏ 0
Las variables duales, que coinciden con los multiplicadores de Lagrange del problema primal, indi-
can cómo varía el óptimo cuando se modifica el término independiente de la restricción. En el ejemplo,
un aumento en la cantidad de café de Colombia no modifica el valor máximo, ya que no es posible pro-
ducir más kilos de las mezclas América y Gourmet. Sí que hay un aumento en el óptimo si se dispone
de más cantidad de los otros tipos de café: és fácil, usando las condiciones de holgura complementaria,
20
obtener que u = , v = 10, w = 0. Es decir, cada kilo de café Brasil adicional proporciona un beneficio
3
extra (aproximadamente) de 10 euros, mientras que cada kilo de Arábica da un beneficio adicional de
20
aproximadamente euros. Éste es el precio que el productor estaría dispuesto a pagar por adquirir
3
cantidades adicionales de estos productos.