Mates 2

Apuntes de Matemáticas 2
ADE/Economía/Marketing
Capítulo 1
Universitat d’Alacant
Begoña Subiza & Josep E. Peris

Mètodes Quantitatius i Teoria Econòmica
licensed under a Creative Commons
Internacional License
Capítulo 1
ÁLGEBRA LINEAL (continuación)
1. Algunos conceptos sobre vectores
2. Planos en el espacio tridimensional
3. Formas cuadráticas
Introducción
Este capítulo es una continuación del último de la asignatura Matemáticas 1 y en el mismo se
analizarán distintas cuestiones sobre vectores n°dimensionales, planos en el espacio tridimensional
(R3 ) y algunas cuestiones sencillas sobre formas cuadráticas que jugarán un papel muy importante
en el desarrollo de la asignatura.
1. Algunos conceptos sobre vectores

En la asignatura Matemáticas 1 ya se ha utilizado el concepto de vector (vector director de una
recta, vector solución de un sistema de ecuaciones, matriz/vector fila o columna, vectores independien-
tes, ...) aunque sin dedicar un estudio específico a los mismos. Como se sabe, un vector en Rn es
un conjunto de n números reales ordenados, v = (v 1 , v 2 , . . . , v n ). Cada v i se denomina coordenada
(o componente) del vector v. Así, v 1 es la primera coordenada, v 2 la segunda, . . . Esta sección está
dedicada a introducir/recordar algunas nociones básicas sobre vectores.
1.1. Operaciones con vectores

Se consideran dos vectores de Rn , v = (v 1 , v 2 , . . . , v n ), w = (w 1 , w 2 , . . . , w n ) y un número real (un
escalar) Æ 2 R.
Suma/resta de vectores:
La suma o resta de vectores se realiza coordenada a coordenada
v + w = (v 1 , v 2 , . . . , v n ) + (w 1 , w 2 , . . . , w n ) = (v 1 + w 1 , v 2 + w 2 , . . . , v n + w n )
v ° w = (v 1 , v 2 , . . . , v n ) ° (w 1 , w 2 , . . . , w n ) = (v 1 ° w 1 , v 2 ° w 2 , . . . , v n ° w n )
Geométricamente, como se observa en la figura 1.1, el vector suma es la diagonal mayor del
paralelogramo que determinan los vectores, mientras que la resta viene determinada por la
diagonal menor (trasladada al origen).
1
CAPÍTULO 1: ÁLGEBRA LINEAL (continuación)
Figura 1.1: Suma y resta de vectores en R2
Multiplicación de un vector por un escalar:

Para multiplicar un vector por un escalar, se multiplica cada coordenada del vector por dicho
número real
Æv = Æ (v 1 , v 2 , . . . , v n ) = (Æv 1 , Æv 2 , . . . , Æv n )
Cuando se multiplica un vector por un escalar, el resultado que se obtiene es un vector en la
misma dirección, y:
• Si el escalar tiene valor absoluto mayor que 1, la longitud del vector aumentará (se alarga
el vector)
• Si el escalar tiene valor absoluto entre 0 y 1, la longitud del vector disminuirá (se acorta el
vector)
• Si el escalar es positivo, mantendrá su sentido
• Si el escalar es negativo cambiará el sentido del vector
Figura 1.2: Multiplicación de un vector por un escalar
2 Mètodes Quantitatius i Teoria Econòmica

Combinación lineal de (dos) vectores:

Esta operación conjuga las dos operaciones anteriores: suma/resta de vectores y multiplicación
por un escalar. Si Æ, Ø 2 R,
° ¢
Æv + Øw = Æ (v 1 , v 2 , . . . , v n ) + Ø (w 1 , w 2 , . . . , w n ) = Æv 1 + Øw 1 , Æv 2 + Øw 2 , . . . , Æv n + Øw n
Producto escalar de vectores:

El producto escalar de dos vectores da como resultado un número real, que se define del si-
guiente modo:
v · w = (v 1 , v 2 , . . . , v n ) · (w 1 , w 2 , . . . , w n ) = v 1 w 1 + v 2 w 2 + . . . + v n w n 2 R
Nota 1 Si los vectores de Rn se consideran como matrices columna n £1, y se representa su trans-
puesta (matriz fila 1 £ n) por v 0 , el producto escalar de dos vectores se escribe, en forma matricial
0 1
w1
B C
B w2 C
v · w = v 0 w = (v 1 , v 2 , . . . , v n ) B
B .. C = v1 w1 + v2 w2 + . . . + vn wn
C
@ . A
wn
Ejemplo 1 Dados los vectores de R3 , v = (1, °1, 2), w = (0, 3, °2) calcula:
• 3v + 5w = 3 (1, °1, 2) + 5 (0, 3, °2) = (3, °3, 6) + (0, 15, °10) = (3, 12, °4)
• v · w = (1, °1, 2) · (0, 3, °2) = 1 · 0 + (°1) · 3 + 2 · (°2) = 0 ° 3 ° 4 = °7
• v · v = (1, °1, 2) · (1, °1, 2) = 12 + (°1)2 + 22 = 1 + 1 + 4 = 6
Nota 2 Hay que señalar que el producto escalar de dos vectores es un número real que puede
ser positivo o negativo, como puede verse en los dos productos calculados en el ejemplo 1. Sin
embargo, cuando se multiplica un vector por sí mismo el resultado será siempre mayor o igual a
cero, ya que será la suma de las coordenadas del vector al cuadrado
n
X
v · v = (v 1 , v 2 , . . . , v n ) · (v 1 , v 2 , . . . , v n ) = v 1 v 1 + v 2 v 2 + . . . + v n v n = (v i )2 ∏ 0
i =1
De hecho, siempre que el vector sea distinto del vector nulo, el producto escalar del vector por sí
mismo dará un número estrictamente positivo. El único vector que cumple v · v = 0 es el vector
nulo, v = (0, 0, . . . , 0) .
1.2. Norma, distancia y ángulo entre vectores

Norma o longitud de un vector:
Dado un vector v = (v 1 , v 2 , . . . , v n ), se denomina norma (o longitud) de este vector al número
real s
p n
X
kvk = v · v = (v i )2
i =1
Nótese que la raíz cuadrada está bien definida ya que, como se ha remarcado, el producto es-
calar de un vector por sí mismo es un número mayor o igual a cero.
Mètodes Quantitatius i Teoria Econòmica 3

Por otro lado, la norma de un vector es justo lo que mide este vector (en las unidades corres-
pondientes: metros, centímetros, ...). Por ejemplo, para el caso de vectores de R2 , v = (a, b), a
partir del Teorema de Pitágoras se tiene que la longitud del vector (la hipotenusa del triángulo
rectángulo) es igual a la raíz cuadrada de la suma de las coordenadas al cuadrado (los catetos al
cuadrado), es decir, la longitud de dicho vector coincide con su norma:
p
kvk = k(a, b)k = a2 + b2
Figura 1.3: Norma o longitud de un vector en el plano R2
Ejemplo 2 Calcula la norma de los vectores del ejemplo 1.

p
• kvk = k (1, °1, 2) k = 6
p p
• kwk = k (0, 3, °2) k = 0 + 9 + 4 = 13
µ ∂
2 1 1
Ejemplo 3 Calcula la norma de los vectores de R v = (3, °4), u = ° p , p
2 2
p p
• kvk = k (3, °4) k = 9 + 16 = 25 = 5
∞µ ∂∞ r
∞ 1 1 ∞ 1 1 p
• kuk = ∞ ∞
∞ p p ∞= 2 + 2 = 1=1
° ,
2 2
Normalización de un vector:
El vector u del ejemplo 3 tiene longitud igual a 1. Se llama unitario a un vector de estas ca-
racterísticas, es decir que tiene norma igual a 1. En muchas ocasiones los vectores únicamente
indican una dirección en la que moverse, y su longitud es irrelevante. Es por ello que, en estos
casos, se eligen vectores unitarios.
Dado un vector v 2 Rn , se denomina normalizar este vector, a calcular otro vector que tenga la
misma dirección y sentido, y su longitud sea 1, es decir, sea unitario. Para obtenerlo, basta con
dividir el vector v por su longitud kvk,
v
u=
kvk

Ejemplo 4 Normaliza los vectores del ejemplo 1.

µ ∂
p 1 1 1 2
• v = (1, °1, 2) , kvk = 6 ) u = p v = p ,°p , p
6 6 6 6
µ ∂
p 1 3 2
• w = (0, 3, °2) , kwk = 13 ) u = p w = 0, p , ° p
13 13 13
Distancia entre dos vectores:

Se llama distancia entre dos vectores u, v a la norma del vector diferencia (resta) de ambos:
dados v = (v 1 , v 2 , . . . , v n ), w = (w 1 , w 2 , . . . , w n ) 2 Rn ,
q
d (v, w) = kv ° wk = (v 1 ° w 1 )2 + (v 2 ° w 2 )2 + . . . + (v n ° w n )2
Figura 1.4: Distancia entre dos vectores
Ejemplo 5 Calcula la distancia entre los vectores del ejemplo 1.

p p
d (v, w) = kv ° wk = k (1, °1, 2) ° (0, 3, °2) k = 12 + (°4)2 + 42 = 33
Ángulo entre dos vectores:

Dados dos vectores no nulos v = (v 1 , v 2 , . . . , v n ) 2 Rn , v 6= 0, w = (w 1 , w 2 , . . . , w n ) 2 Rn , w 6= 0, su
producto escalar coincide con el valor
v · w = kvk kwk cos(')
donde ' es el ángulo que forman dichos vectores. Hay que recordar que en el plano R2 el án-
gulo que forman dos rectas que se cortan se define como el menor de los dos ángulos que se
originan. De igual manera, para cualquier dimensión, el ángulo entre dos vectores siempre se
considera entre [0, º] (entre 0 y 180 grados).
Si se despeja en la fórmula anterior el coseno, queda
v ·w v1 w1 + v2 w2 + . . . + vn wn
cos(') = = qP qP
kvk kwk n
(v )2 n
(w )2
i =1 i i =1 i

Figura 1.5: Ángulo entre dos vectores
Tienen especial interés los casos en que los vectores son proporcionales (forman un ángulo de 0
grados, cuando cos(') = 1, o de 180 grados, º radianes, cuando cos(') = °1) o perpendiculares
º
(también denominados ortogonales, forman un ángulo de 90 grados, radianes). En este caso,
2
v ·w
como cos(º/2) = 0 = se cumple que:
kvk kwk
Dos vectores v, w son perpendiculares , v · w = 0
Ejemplo 6 Los vectores del ejemplo 1 no son perpendiculares, ya que, según se ha visto, su pro-
ducto escalar vale °7 6= 0. El coseno del ángulo que forman vale
°7 7
cos(') = p p = ° p
6 13 78
que es diferente de 1, °1 y, por tanto, tampoco son proporcionales. Con la ayuda de una calcula-
dora, se puede obtener que ' º 10 43 radianes (º 82o ).
Ejemplo 7 Analiza si los siguientes vectores son perpendiculares o proporcionales y, en este caso,
indica el ángulo que forman (' = 0, ' = º).
• v = (1, °1), w = (°2, 2).

Como v · w = °4, no son perpendiculares. Si se calcula el coseno del ángulo que forman se
tiene
°4 °4 °4
cos(') = p p = p = = °1
2 8 16 4
luego son proporcionales y forman un ángulo de º radianes (180 grados); es decir, tienen
sentido contrario.
• v = (1, °1), w = (1, 1).
En este caso, v · w = 1 ° 1 = 0, luego estos vectores son perpendiculares.
Ejercicio 1 Encuentra un vector en el plano R2 que sea perpendicular al vector v = (3, °2).

2. Planos en el espacio tridimensional

En el espacio tridimensional R3 , dado un vector no nulo p = (A, B,C ) 6= (0, 0, 0), se denomina
plano a un conjunto de puntos de la forma
© ™ © ™
(x, y, z) 2 R3 : (A, B,C ) · (x, y, z) = c ¥ (x, y, z) 2 R3 : Ax + B y +C z = c
siendo c un número real, c 2 R. Al vector p = (A, B,C ) se le denomina vector perpendicular (o vector
normal) al plano.1
Figura 1.6: Plano en R3
Dado un punto (x 0 , y 0 , z 0 ) 2 R3 y un vector no nulo p = (A, B,C ) 6= (0, 0, 0), solo hay un plano en R3
que pasa por dicho punto y es perpendicular al vector p, que tiene la ecuación
(A, B,C ) · (x, y, z) = (A, B,C ) · (x 0 , y 0 , z 0 ) ) Ax + B y +C z = Ax 0 + B y 0 +C z 0
Ejemplo 8 Calcula la ecuación del plano que pasa por el punto (1, °1, 2) y es perpendicular al vector
p = (°2, 2, °1). Calcula otros dos puntos que estén en el plano.
La ecuación del plano es
(°2, 2, °1) · (x, y, z) = (°2, 2, °1) · (1, °1, 2) ) °2x + 2y ° z = °6
Para obtener otros dos puntos, una vez se tiene la ecuación del plano se dan valores a las variables x, y,
calculando el valor de z que cumple la ecuación. Por ejemplo,
x = 0, y = 0 ) °z = °6 ) z =6 ) se tiene el punto (0, 0, 6)
x = 0, y = 1 ) 2 ° z = °6 ) z =8 ) se tiene el punto (0, 1, 8)

1 Este concepto se generaliza a espacios de dimensión superior, y se denominan hiperplanos. Por ejemplo, en R4 un
hiperplano es un conjunto de la forma

n o n o
(x, y, z, t ) 2 R4 : (A, B,C , D) · (x, y, z, t ) = c ¥ (x, y, z, t ) 2 R4 : Ax + B y +C z + D t = c

Ejemplo 9 Obtén un vector unitario que sea perpendicular al plano 3x ° y + 5z = °21. Encuentra un
punto con las tres coordenadas iguales que esté en el plano.
Un vector perpendicular se obtiene tomando los coeficientes de las variables x, y, z en la ecuación
del plano. Por tanto, en este caso será
µ p = (3, °1, 5). ∂Este vector no tiene norma 1, luego es necesario
p 3 °1 5
normalizarlo: kpk = 35, luego u = p , p , p .
35 35 35
Para que un punto con tres coordenadas iguales (a, a, a) esté en el plano, debe cumplir su ecuación:
3a ° a + 5a = °21 ) 7a = °21 ) a = °3 y se tiene el punto (°3, °3, °3)
2.1. Posición de dos planos en el espacio tridimensional

Dos planos en el espacio tridimensional se cortan en una recta, o son paralelos. En caso de ser
paralelos, sus vectores normales serán proporcionales; es decir, formarán un ángulo de 0 o de º radia-
nes (0 o 180 grados). Si los vectores normales a los planos no son proporcionales, entonces se cortarán
en una recta.
Un caso particular de planos que se cortan es cuando lo hacen formando un ángulo de 90o , en
cuyo caso los vectores normales serán perpendiculares uno al otro, es decir su producto escalar será
cero:
Dados dos planos p · (x, y, z) = c, q · (x, y, z) = d , éstos se cortan formando un ángulo de

90o cuando p · q = 0.
Figura 1.7: Planos formando un ángulo de 90o en R3

Ejemplo 10 Analiza, para cada uno de los diferentes apartados, si los planos son paralelos, o si se
cortan formando un ángulo de 90o .
3x + y = 2, °x + y ° z = 1
Los vectores normales son p = (3, 1, 0), q = (°1, 1, °1). Si se realiza el producto escalar de estos
vectores, p · q = °3 + 1 + 0 = °2 6= 0, luego no forman un ángulo de 90o . También se observa que
estos vectores no son proporcionales, por tanto los planos no son paralelos.
x ° 2y ° 00 5z = 12, °2x + 4y + z = 1
Los vectores normales son p = (1, °2, °00 5), q = (°2, 4, 1). Si se realiza el producto escalar de estos
vectores, p·q = °2°8°00 5 = °100 5 6= 0, luego no forman un ángulo de 90o . En este caso, se observa
que estos vectores son proporcionales, q = °2p, por tanto los planos son paralelos.
x + y + z = 3, °x + 2y ° z = 0
Los vectores normales son p = (1, 1, 1), q = (°1, 2, °1). Si se realiza el producto escalar de estos
vectores, p · q = °1 + 2 ° 1 = 0, luego los planos se cortan formando un ángulo de 90o .
3. Formas cuadráticas
Definición 1 Dada una matriz cuadrada simétrica A n£n , se llama forma cuadrática asociada a dicha
matriz a una función Q : Rn ! R que a cada vector v 2 Rn le asocia el número real
n
X
Q(v) = v 0 Av = ai j v i v j
i , j =1
En el caso de una matriz simétrica de orden 2, se tiene

µ ∂µ ∂
a 11 a 12 x
Q(x, y) = (x y) = a 11 x 2 + 2a 12 x y + a 22 y 2
a 12 a 22 y
En el caso de tres variables (matriz simétrica de orden 3),

0 10 1
a 11 a 12 a 13 x
Q(x, y, z) = (x y z) @ a 12 a 22 a 23 A @ y A = a 11 x 2 +2a 12 x y +2a 13 xz +a 22 y 2 +2a 23 y z +a 33 z 2
a 13 a 23 a 33 z
Ejemplo 11 Observa las siguientes formas cuadráticas.

µ ∂
1 3
a) La forma cuadrática asociada a la matriz A = es Q(x, y) = x 2 + 6x y ° y 2
3 °1
0 1
0 °1 3
@
b) La forma cuadrática asociada a la matriz A = °1 2 1 A es
3 1 4
Q(x, y, z) = °2x y + 6xz + 2y 2 + 2y z + 4z 2
c) Dada la forma cuadrática Q(x, y, z) = x 2 + 2x y + 3y 2 ° y z + 2z 2 , su matriz simétrica es

0 1
1 1 0
A=@ 1 3 °00 5 A
0 °00 5 2

Nota 3 ¿Por qué se llaman formas cuadráticas? La razón es porque se trata de polinomios (en varias
variables) en los que todos los sumandos tienen grado exactamente dos (cuadrático), sumando los ex-
ponentes de las variables que aparecen en cada sumando. En el caso de una variable, se trataría de
funciones del tipo f (x) = ax 2 , es decir, parábolas.
3.1. Signo de una forma cuadrática

Definición 2 Una forma cuadrática Q(v) = v 0 Av se dice que es:
1. Definida positiva, si para cualquier vector v no nulo, v 6= 0, Q(v) = v 0 Av > 0
2. Definida negativa, si para cualquier vector v no nulo, v 6= 0, Q(v) = v 0 Av < 0
3. Semidefinida positiva, si para cualquier vector v, Q(v) = v 0 Av ∏ 0 y existe un vector v no nulo,

v 6= 0, tal que Q(v) = v 0 Av = 0
4. Semidefinida negativa, si para cualquier vector v, Q(v) = v 0 Av ∑ 0 y existe un vector v no nulo,

v 6= 0, tal que Q(v) = v 0 Av = 0
5. Indefinida en cualquier otro caso; es decir, si existe un vector v no nulo, v 6= 0, tal que Q(v) =
v 0 Av > 0 y existe otro vector w no nulo, w 6= 0, tal que Q(w) = w 0 Aw < 0
Ejemplo 12 Analiza el signo de las siguientes formas cuadráticas.
a) La forma cuadrática Q(x, y, z) = x 2 + 2y 2 + 4z 2

Esta forma cuadrática es definida positiva, ya que todos los términos que aparecen lo son, y el único
modo de que se anule es hacer x = y = z = 0.
b) La forma cuadrática Q(x, y) = °x 2 ° 2y 2

Esta forma cuadrática es definida negativa, ya que los elementos que aparecen son negativos y solo
se anula para x = y = 0.
c) La forma cuadrática Q(x, y, z) = x 2 ° 2y 2 + 4z 2

Esta forma cuadrática es indefinida, ya que Q(1, 0, 0) = 1 > 0, mientras que Q(0, 1, 0) = °2 < 0.
d) La forma cuadrática Q(x, y, z) = x 2 + 4z 2

Esta forma cuadrática es semidefinida positiva, al ser siempre mayor o igual a cero, pero si se con-
sidera el vector (0, 1, 0) 6= (0, 0, 0) entonces Q(0, 1, 0) = 0.
Nota 4 Cuando en una forma cuadrática aparecen solo las variables al cuadrado (no aparecen los
productos de dos variables diferentes), como es el caso de los ejemplos anteriores, es fácil saber el signo
que tiene dicha forma cuadrática. Sin embargo, cuando aparecen los productos de distintas variables
x y, xz, . . . (por ejemplo, Q(x, y) = x 2 + 5x y + 4y 2 , o Q(x, y) = x 2 ° 4x y + 4y 2 ) ya no resulta tan evidente,
ni siquiera en el caso de solo dos variables. En los siguientes apartados se verá cómo saber de manera
sencilla el signo de una forma cuadrática.
3.2. Clasificación de formas cuadráticas: menores principales

Un modo sencillo para clasificar una forma cuadrática se basa en el cálculo de determinantes.
En primer lugar se verá un método para determinar si una forma cuadrática es definida (positiva o
negativa).

Definición 3 Dada una matriz A n£n los menores principales superiores izquierda son los determi-
nantes
0 1
µ ∂ a 11 a 12 a 13
a 11 a 12
D 1 = a 11 D 2 = det D 3 = det @ a 21 a 22 a 23 A ... D n = det(A)
a 21 a 22
a 31 a 32 a 33
Si los menores principales superiores izquierda de la matriz simétrica A asociada a una forma
cuadrática Q(v) son todos distintos de cero, D i 6= 0, para i = 1, 2, . . . , n, la forma cuadrática se puede
expresar del siguiente modo
D2 2 D3 2 Dn 2
Q(v) = v 0 Av = D 1 u 12 + u + u ...+ u
D1 2 D2 3 D n°1 n
siendo u 1 , u 2 , ..., u n nuevas variables (obtenidas mediante cambios de variable). Entonces solo apa-
recen las variables al cuadrado, y son los D i (los menores principales superiores izquierda) los que
deciden el signo de la forma cuadrática. Se tiene por tanto que:
1. Q es definida positiva, si todos los D i > 0
2. Q es definida negativa, si los D i van cambiando de signo empezando por negativo:

D 1 < 0, D 2 > 0, D 3 < 0, ...
Ejemplo 13 La forma cuadrática asociada a la matriz

0 1
1 1 0
15
A=@ 1 3 ° 12 A es definida positiva, ya que D 1 = 1 > 0, D 2 = 2 > 0, D3 = >0
4
0 ° 12 2

µ ∂
°3 2
A= es definida negativa, ya que D 1 = °3 < 0, D2 = 2 > 0
2 °2
Si todos los menores principales superiores izquierda son distintos de cero, y no sigue ninguna de
las reglas anteriores, la forma cuadrática es indefinida. En particular, en cuanto un menor principal
superior izquierda de orden par sea negativo, la forma cuadrática es indefinida, y no es necesario
realizar ya más cálculos de determinantes.

0 1
1 1 0
@
A= 1 3 °6 A es indefinida, ya que D 1 = 1 > 0, D 2 = 2 > 0, D 3 = °38 < 0
0 °6 °1
Por otro lado, la forma cuadrática asociada a la matriz

0 1
1 2 0
@
A= 2 3 °6 A és indefinida, ja que D 2 = °1 < 0
0 °6 °1
Nota 5 Cuando hay menores principales superiores izquierda nulos, las reglas anteriores no se pueden
aplicar y quedan, por tanto, sin analizar los casos de formas cuadráticas semidefinidas. Para clasifi-
carlas es necesario realizar más cálculos. Un primer caso fácil es el siguiente:

a) Si det(A) = 0, pero el resto de menores principales superiores izquierda son estrictamente positivos,
la forma cuadrática es semidefinida positiva
b) Si det(A) = 0, pero el resto de menores principales superiores izquierda son distintos de cero y van
cambiando de signo empezando por negativo, la forma cuadrática es semidefinida negativa
Definición 4 Dada una matriz A n£n se denomina:
menores principales de orden 1 a los determinantes que se obtienen eliminando las mismas n°1
filas y columnas de la matriz A; es decir, los elementos
H1 = {a 11 , a 22 , . . . , a nn }
menores principales de orden 2 a los determinantes que se obtienen eliminando las mismas n°2
filas y columnas de la matriz A; es decir, los determinantes cuando se toman todas las submatri-
ces 2 £ 2 formadas con las mismas filas que columnas
Ω µ ∂ µ ∂ µ ∂ æ
a 11 a 12 a 11 a 13 a 22 a 23
H2 = det , det , det , ...
a 21 a 22 a 31 a 33 a 32 a 33
menores principales de orden 3 a los determinantes que se obtienen cuando se toman todas las
submatrices 3 £ 3 formadas con las mismas filas que columnas
8 0 1 0 1 0 1 9
< a 11 a 12 a 13 a 11 a 12 a 14 a 22 a 23 a 24 =
H3 = det @ a 21 a 22 a 23 A , det @ a 21 a 22 a 24 A , det @ a 32 a 33 a 34 A , . . .
: ;
a 31 a 32 a 33 a 41 a 42 a 44 a 42 a 43 a 44
...
Definición 5 Dada una matriz A n£n sea Hk el conjunto de todos2 los menores principales de orden k.
Por tanto, Hk es un conjunto de valores numéricos. Entonces, se dice que:
Hk > 0, si todos los valores que hay en Hk son estrictamente positivos.
Hk < 0, si todos los valores que hay en Hk son estrictamente negativos.
Hk ∏ 0, si todos los valores que hay en Hk son mayores o iguales a cero.
Hk ∑ 0, si todos los valores que hay en Hk son menores o iguales a cero.
Usando los menores principales de la matriz simétrica ya se pueden clasificar formas cuadráticas
de cualquier tipo. Se cumple que la forma cuadrática Q(v) = v 0 Av es:
1. Semidefinida positiva, si todos los Hk ∏ 0, y existe algún menor principal nulo
2. Semidefinida negativa, si todos los Hk ∑ 0 cuando k es impar, Hk ∏ 0 si k es par (van cambian-

do de signo empezando por negativo), y existe algún menor principal nulo
Ejemplo 16 Se considera la forma cuadrática asociada a la matriz

0 1
1 1 0 H1 = {1, 1, 2}
A = @ 1 1 0 A . Sus menores principales son H2 = {0, 2, 2}
0 0 2 H3 = {0}
Por tanto la forma cuadrática es semidefinida positiva.

2 Una matriz A de orden n £ n tiene n!
menores principales de orden k.
k!(n ° k)!

Ejemplo 17 Se considera la forma cuadrática asociada a la matriz

0 1
0 0 0 H1 = {0, °1, °2}
@
A= 0 °1 0 A . Sus menores principales son H2 = {0, 0, 2}
0 0 °2 H3 = {0}
Por tanto la forma cuadrática es semidefinida negativa. Hay que señalar que este ejemplo se resuelve
mucho más fácilmente con los valores propios que son los elementos en la diagonal principal, ya que la
matriz es triangular (diagonal, en realidad). Así, los valores propios son ∏1 = 0, ∏2 = °1, ∏3 = °2,
luego se llega a misma conclusión (semidefinida negativa).
3.3. Formas cuadráticas restringidas

En muchas ocasiones, se quiere estudiar el signo de una forma cuadrática no en todo el espacio,
sino para un subconjunto de vectores que cumplen alguna condición particular. En estos casos, un
método operativo que resulta muy útil es sustituir en la forma cuadrática el tipo particular de vectores
que interesa, lo que lleva a la desaparición de variables y a la reducción del orden de la matriz asociada
a la nueva forma cuadrática restringida.
Si la forma cuadrática en todo el espacio tenía un signo definido (definida positiva o definida
negativa), la forma cuadrática restringida tendrá obviamente el mismo signo (si es siempre positiva,
será positiva en un subespacio; y lo mismo con negativa). Pero si la forma cuadrática es semidefinida,
o indefinida, podrá cambiar y tener un signo definido en algún subespacio.
Ejemplo 18 La forma cuadrática Q(x, y) = x 2 + 5x y + 4y 2 es indefinida. Si se consideran solo los vec-

tores en los que la segunda coordenada es doble de la primera, es decir se tiene la restricción y = 2x,
entonces, sustituyendo, queda Q(x, 2x) = x 2 + 5x(2x) + 4(2x)2 = 27x 2 que es siempre positiva (salvo pa-
ra x = 0). Por tanto, la forma cuadrática restringida es definida positiva en el subespacio de vectores
de la forma (x, 2x).
Sin embargo, en el subespacio de vectores de la forma (x, °x) (la segunda coordenada es igual a
la primera con el signo cambiado), queda Q(x, °x) = 0, que es la forma cuadrática nula (a la vez
semidefinida positiva y semidefinida negativa).
Finalmente, en el subespacio de vectores de la forma (°2y, y) (la primera componente es igual al

doble de la segunda con el signo cambiado), queda Q(°2y, y) = °2y 2 que es definida negativa.

0 1
1 1 1
@
A= 1 0 2 A
1 2 0
es indefinida (solo hay que observar que D 2 < 0). Si se considera el subespacio de vectores en que las tres
coordenadas suman cero, x + y + z = 0, la forma restringida (despejando z = °x ° y) queda
Q(x, y, °x ° y) = x 2 + 2x y + 2x(°x ° y) + 4y(°x ° y) = °x 2 ° 4x y ° 4y 2
cuya matriz es
µ ∂
°1 °2
B= D 1 = °1 < 0, D2 = 0 ∏ 0
°2 °4
luego la forma cuadrática restringida al subespacio es semidefinida negativa.


0 1
1 1 0
@
A= 1 3 °6 A
0 °6 °1
es indefinida como se ha visto en el ejemplo 15. Si se considera el subespacio de vectores en que las dos
últimas coordenadas son iguales pero de signo contrario, z = °y, la forma restringida queda
Q(x, y, °y) = x 2 + 2x y + 3y 2 ° 12y(°y) ° (°y)2 = x 2 + 2x y + 14y 2
cuya matriz es
µ ∂
1 1
B= D 1 = 1 > 0, D 2 = 13 > 0
1 14
luego la forma cuadrática restringida al subespacio es definida positiva.

Capítulo 2
FUNCIONES DE VARIAS VARIABLES
1. Algunos conceptos topológicos
2. Funciones de varias variables. Dominio
3. Representaciones geométricas. Curvas de nivel y conjuntos de contorno
4. Continuidad. Propiedades
5. Derivadas parciales de primer orden. Vector gradiente
6. Regla de la cadena (derivada de la función compuesta)
7. Derivada direccional
8. Diferencial. Aproximación lineal
9. Funciones implícitas. Derivada de la función implícita
10. Funciones homogéneas y homotéticas
11. Derivadas parciales de orden superior. Matriz hessiana
12. Desarrollo de Taylor de orden 2
1. Algunos conceptos topológicos

Antes de introducir los conceptos de continuidad y derivabilidad con funciones de varias varia-
bles se verá la generalización del concepto de intervalo de la recta real. Esta generalización es nece-
saria para expresar muchos conceptos y resultados vistos en la asignatura Matemáticas 1, ahora en el
contexto de varias variables.
La topología es la parte de las matemáticas que trata de formalizar los conceptos de proximidad
y continuidad. Por esta razón se empieza analizando la topología en espacios reales. Aunque parte
de la discusión se hará en el plano R2 (por el hecho de poder representar gráficamente), todos los
conceptos se pueden extender con la misma idea a más dimensiones.
Uno de los cambios fundamentales está en la manera de aproximarse a un punto. Si x es un nú-
mero real, solo hay dos maneras de acercarse a x, por la derecha y por la izquierda. Sin embargo,
cuando se considera un punto del plano (x, y), aparecen múltiples maneras de acercarse: por dere-
cha/izquierda, por arriba/abajo, con un ángulo de 45o , ...
15
CAPÍTULO 2: FUNCIONES DE VARIAS VARIABLES
1.1. Bola abierta

Definición 1 Dado un punto a 2 Rn , se denomina bola abierta de centro a y radio r > 0, (r 2 R), al
conjunto de puntos de Rn cuya distancia al punto a es menor que r . Esto es,
© ™ © ™
B (a, r ) = x 2 Rn : d (x, a) < r = x 2 Rn : kx ° ak < r =
( s ) ( )
n
X Xn
n 2 n 2 2
= x 2R : (x i ° a i ) < r = x 2 R : (x i ° a i ) < r
i =1 i =1
Hay que señalar que este concepto es una generalización de intervalo abierto. Si se aplica a una va-
riable, a 2 R, B (a, r ) = (a ° r, a + r ).
Ejemplo 1 En el plano bidimensional R2 , estos conjuntos se corresponden con círculos abiertos (no
contienen a la circunferencia que delimita el círculo):
q
(x 1 ° a 1 )2 + (x 2 ° a 2 )2 < r () (x 1 ° a 1 )2 + (x 2 ° a 2 )2 < r 2
Por ejemplo, la bola de centro el punto (2, °4) y radio r = 3, sería el círculo de ecuación
(x ° 2)2 + (y + 4)2 < 9
mientras que la ecuación de la circunferencia que lo delimita es (x ° 2)2 + (y + 4)2 = 9.
Figura 2.1: Bola abierta en R2
Ejemplo 2 En el espacio tridimensional R3 , las bolas abiertas se corresponden con esferas abiertas,
que no contienen a la superficie que las delimita:
q
(x 1 ° a 1 )2 + (x 2 ° a 2 )2 + (x 3 ° a 3 )2 < r () (x 1 ° a 1 )2 + (x 2 ° a 2 )2 + (x 3 ° a 3 )2 < r 2
Por ejemplo, la bola de centro (1, 1, 1) y radio r = 00 1 es la esfera de ecuación
(x ° 1)2 + (y ° 1)2 + (z ° 1)2 < 00 01

Figura 2.2: Bola abierta en R3
1.2. Puntos interiores, exteriores y frontera

En esta sección se analiza la situación topológica de un punto respecto de un conjunto.
Definición 2 Dado un subconjunto S Ω Rn y un punto a 2 Rn , se dice que dicho punto es:
Interior al conjunto S si existe una bola de centro dicho punto que está completamente contenida
en S; esto es, B (a, r ) Ω S, para algún r > 0 (quizás pequeño).
Exterior al conjunto S si existe una bola de centro dicho punto completamente fuera de S. Los
puntos que no están en S, forman el denominado conjunto complementario de S, que se repre-
senta por Rn ° S. Entonces, ser exterior a S significa que existe una bola tal que B (a, r ) Ω (Rn ° S),
para algún r > 0 (quizás pequeño).
Frontera si no es interior ni exterior. Entonces todas las bolas de centro dicho punto deben tener
puntos de S y puntos de fuera de S:
8r > 0, B (a, r ) \ S 6= ; B (a, r ) \ (Rn ° S) 6= ;
Nota 1 Claramente un punto interior a un conjunto S debe pertenecer a dicho conjunto. De igual ma-
nera, un punto exterior no puede pertenecer a S. Sin embargo, los puntos frontera pueden estar, o pue-
den no estar, en el conjunto.
© ™
Ejemplo 3 Dado el subconjunto de R2 , S = (x, y) : 0 ∑ x < 1, 0 ∑ y ∑ 2 , analiza si los puntos (1, 1),
(2, 0), (00 5, 1), (00 5, 2) son interiores, exteriores o frontera del conjunto S.
A la vista de la imagen gráfica del conjunto S (ver figura 2.3), es inmediato observar que el punto
(1, 1) es frontera, ya que cualquier bola (círculo) de centro este punto está en parte dentro y en
parte fuera del conjunto S. Hay que señalar que este punto no está en el conjunto S.

° ¢
El punto (2, 0) claramente es exterior: por ejemplo, la bola B (2, 0), 00 1 está totalmente fuera del
conjunto S.
° ¢
El punto (00 5, 1) es interior ya que, por ejemplo, B (00 5, 1), 00 1 Ω S.
Finalmente, el punto (00 5, 2) es también frontera porque toda bola centrada en dicho punto tiene
parte dentro y parte fuera de S. En este caso, el punto sí que pertenece a S.
Figura 2.3: Situación de los puntos respecto a S, ejemplo 3
Ejercicio 1 Indica gráficamente quiénes son el conjunto de puntos interiores, int(S), de puntos exterio-
res, ext(S), y de puntos frontera, Fr(S), en el conjunto S del ejemplo 3.
© ™
Ejemplo 4 Dado el subconjunto de R2 , S = (x, y) : x ° y ∏ 0, x + y ∑ 2, x > 0, y ∏ 0 , analiza si los pun-
tos (1, 1), (0, 3), (0, 0), (1, 00 5) son interiores, exteriores o frontera del conjunto S.
El primer paso es obtener la imagen gráfica del conjunto (figura 2.4). Una vez se tiene el dibujo es
fácil razonar la cuestión planteada:
El punto (1, 1) es frontera, ya que cualquier bola de centro este punto está en parte dentro y en
parte fuera de S. El punto (1, 1) está en el conjunto S.
° ¢
El punto (0, 3) claramente es exterior: por ejemplo, la bola B (0, 3), 00 1 está totalmente fuera del
conjunto S.
El punto (0, 0) es frontera, ya que toda bola centrada en este punto tiene parte dentro y parte
fuera de S. Hay que señalar que este punto no está en el conjunto S.
° ¢
El punto (1, 00 5) es interior ya que, por ejemplo, B (1, 00 5), 00 1 Ω S.
Nota 2 Cuando un conjunto está definido con un número finito de desigualdades (como en los ejem-
plos 3 y 4), un punto será interior cuando cumpla todas las desigualdades estrictamente.

Figura 2.4: Situación de los puntos respecto a S, ejemplo 4
1.3. Conjuntos abiertos y cerrados

De igual manera que los intervalos en la recta real eran abiertos o cerrados (o ni abiertos ni cerra-
dos), este concepto también se traslada a subconjuntos de Rn .
Definición 3 Un conjunto S µ Rn se dice que es abierto si todos sus puntos son interiores a S. Un con-
junto T µ Rn se dice que es cerrado si su complementario, el conjunto S = Rn ° T , es abierto.
Nota 3 Es importante señalar que ser abierto y ser cerrado no son conceptos opuestos, ya que hay con-
juntos que no son ni lo uno ni lo otro. Se puede observar que los conjuntos en los ejemplos 3 y 4 no son
ni abiertos, ni cerrados.
Por otro lado, hay dos conjuntos (únicamente dos) que son, a la vez, abiertos y cerrados. Estos
conjuntos son el vacío (;) y el espacio total ( Rn ):
; es abierto ya que todos sus puntos son interiores (o, mejor expresado, no tiene ningún punto
que no sea interior)
Rn es abierto ya que todos sus puntos son obviamente interiores
; es cerrado porque su complementario, que es Rn , es abierto
Rn es cerrado porque su complementario, que es ;, es abierto
En esta asignatura son de especial importancia los conjuntos cerrados. Una forma alternativa
(equivalente) de definir un conjunto cerrado es la siguiente:
Un conjunto S Ω Rn es cerrado si contiene a toda su frontera
Esta forma puede ser más fácil para estudiar que un conjunto es cerrado que el análisis de que su
complementario es un conjunto abierto.

Ejemplo 5 Analiza si los siguientes conjuntos son abiertos, cerrados, o ni abiertos ni cerrados.
a) Una bola B (a, r ) es claramente un conjunto abierto: cualquier punto x 2 B (a, r ) que se considere es
un punto interior a la bola.
b) Una bola cerrada se define añadiendo la bola abierta los puntos que la delimitan. En R2 se añadiría
la circunferencia. En general, su definición sería
© ™ © ™
B (a, r ) = x 2 Rn : d (x, a) ∑ r = x 2 Rn : kx ° ak ∑ r =
( s ) ( )
n
X n
X
n n 2 2
= x 2R : (x i ° a i )2 ∑r = x 2R : (x i ° a i ) ∑ r
i =1 i =1
Es claro que B (a, r ) es un conjunto cerrado.
c) Una recta, un plano, un hiperplano son conjuntos cerrados. Este tipo de conjuntos se expresan con
igualdades y, por tanto, todos sus puntos son frontera. Al contener a toda su frontera son conjuntos
cerrados. Por ejemplo, los conjuntos definidos por las siguientes igualdades son cerrados:
S = {(x, y) 2 R2 : x ° 6y = 21}
S = {(x, y, z) 2 R3 : 2x ° y + z = 2}
S = {(x 1 , x 2 , . . . , x n ) 2 Rn : x 1 + x 2 + . . . + x n = 1}
d) Los semiespacios son los conjuntos que quedan por encima (o por debajo) de una recta, plano o
hiperplano (incluyendo a estos). Formalmente su expresión es de la forma
( )
Xn
n
S = x 2R : p i xi ∑ A A 2 R, p i 2 R, i = 1, 2, . . . , n
i =1
Los semiespacios son conjuntos cerrados. Por ejemplo,
S = {(x, y) 2 R2 : x ° 6y ∑ 21} S = {(x, y, z) 2 R3 : 2x ° y + z ∏ 2}
S = {(x 1 , x 2 , . . . , x n ) 2 Rn : x 1 + x 2 + . . . + x n ∑ 1}
1.4. Conjuntos acotados y conjuntos compactos

La idea intuitiva de conjunto acotado es que no llega a infinito (por ningún lado).
Definición 4 Un conjunto S Ω Rn se dice que es (o que está) acotado si existe una bola (con radio R
arbitrariamente grande) que lo contiene integramente: 9 R > 0 tal que S Ω B (0, R)
Nota 4 Por comodidad, en la anterior definición se consideran bolas con centro el origen 0, pero el
centro de la bola que contiene al conjunto S podría estar en un punto cualquiera.
Ejemplo 6 Estudio sobre conjuntos acotados.
Los conjuntos de los ejemplos 3 y 4 son acotados: basta tomar, por ejemplo R = 10.
Las bolas (abiertas o cerradas), son también ejemplos de conjuntos acotados.
Las rectas, planos, hiperplanos o semiespacios son conjuntos no acotados: no es posible encontrar
una bola que los contenga.

Definición 5 Un conjunto S Ω Rn se dice que es compacto si es cerrado y acotado.
Ejemplo 7 Discute si los siguientes conjuntos son compactos.

© ™
a) S = (x, y) 2 R2 : 2 < x ∑ 3, 1 ∑ y < 2 (figura 2.5).
Este conjunto está acotado, ya que se puede incluir (por ejemplo) dentro de la bola B ((0, 0), 10). Pero
no es cerrado, ya que hay parte de la frontera que no está en el conjunto. Por lo tanto, no es compacto.
Figura 2.5: Análisis de compacidad, ejemplo 7 a)
© ™
b) S = (x, y) 2 R2 : 2 ∑ x ∑ 3, 1 ∑ y ∑ 2 (figura 2.6).
Este conjunto es cerrado (contiene a toda su frontera) y acotado (se puede incluir dentro de la bola
B ((0, 0), 10)), luego sí es compacto.
Figura 2.6: Análisis de compacidad, ejemplo 7 b)

© ™
c) S = (x, y) 2 R2 : y = 3x ° 2 (figura 2.7).
Este conjunto es cerrado (todos sus puntos son frontera), pero no está acotado (se trata de una recta
en el plano que no se puede poner dentro de una bola). Por tanto, no es un conjunto compacto.
Figura 2.7: Análisis de compacidad, ejemplo 7 c)
© ™
d) S = (x, y) 2 R2 : x + y = 1, x ∏ 0, y ∏ 0 (figura 2.8).
Este conjunto es un trozo de una recta (lo que queda en el cuadrante positivo) y se observa que es
cerrado (contiene toda su frontera) y acotado (está incluido en la bola B ((0, 0), 2)). Por tanto, sí se
trata de un conjunto compacto.
Figura 2.8: Análisis de compacidad, ejemplo 7 d )
Ejercicio 2 Analiza si los conjuntos que aparecen en los ejemplos 3, 4, 5 y 6 son compactos.

2. Funciones de varias variables. Dominio

Definición 6 Una función real de n variables, f : Rn ! R, es una regla que a cada punto (x 1 , x 2 , . . . , x n )
de Rn le asocia un número real f (x 1 , x 2 , . . . , x n ) = z 2 R.
Ejemplo 8 Las siguientes funciones, vinculadas al mundo de la economía y la empresa, son ejemplos
de funciones que dependen de varias variables.
La función de ingresos de una mercancía depende del precio unitario de la misma p, y de la

cantidad de unidades vendidas x. De este modo, los ingresos se pueden representar mediante la
función
I = f (p, x) = px
Del mismo modo, si se tienen n mercancías con precios respectivos p i , los ingresos son una fun-
ción de varias variables que se puede expresar en la forma
n
X
I = (p 1 , p 2 , . . . , p n ) · (x 1 , x 2 , . . . , x n ) = p i xi
i =1
La función media aritmética asocia a cada conjunto de valores el promedio de los mismos:
x1 + x2 + . . . + xn
x = f (x 1 , x 2 , . . . , x n ) =
n
Funciones de producción en modelos económicos

En muchos modelos económicos se trabaja con una función de producción F que asocia a cada
vector de inputs (x 1 , x 2 , . . . , x n ) un valor real F (x 1 , x 2 , . . . , x n ) que indica el output que se obtiene
con los inputs utilizados. Un caso especialmente estudiado es el de las llamadas funciones Cobb-
Douglas. También se utilizan las denominadas funciones de elasticidad de sustitución constante
(CES)1 .
Definición 7 Se llama función Cobb-Douglas a toda función del tipo F (K , L) = AK Æ L Ø , donde

A > 0, Æ > 0, Ø > 0, son números reales (constantes) conocidos.
≥ ¥° 1
Definición 8 Se llama función CES a toda función del tipo F (K , L) = A ±K °Ω + (1 ° ±)L °Ω
Ω
,
donde A > 0, 0 < ± < 1, °1 < Ω 6= 0, son números reales (constantes) conocidos.
Las dos variables en estas funciones (K , L) representan, respectivamente, el capital y la cantidad

de trabajo invertidos en la producción de la mercancía. Ejemplos particulares son:
• F (K , L) = K 1/4 L 3/4 , F (K , L) = K 1/4 L 1/2 , F (K , L) = K 1/2 L 3/2 Cobb-Douglas

√p p !2
° ¢2 K L
• F (K , L) = 12 K 1/2 + 12 L 1/2 = + CES con ± = 12 , Ω = ° 12
2 2
µ ∂
° ¢°2 1 1 °2
• F (K , L) = 12 K °1/2 + 12 L °1/2 = p + p CES con ± = 12 , Ω = 12
2 K 2 L
1 Se denomina así por sus siglas en inglés. También es posible encontrarlo escrito como ESC: elasticidad de sustitución
constante.

El PIB de un país depende de cinco variables que se obtienen independientemente:
P I B = C pr + I nv pr +G + (X ° M )
siendo C pr el consumo privado, I nv pr la inversión privada, G el gasto público, X las exportacio-

nes, y M las importaciones.
En la mayoría de ejemplos se trabajará con dos variables, por simplicidad en expresiones y cálcu-
los. La extensión a más variables no tiene dificultad.
Ejemplo 9 Ejemplos numéricos de funciones de dos variables son:
a) f (x, y) = 2x ° 3y
b) f (x, y) = x 2 + y 2
x+y
c) f (x, y) =
y ° x2
p
d) f (x, y) = 4 ° x 2 ° y 2
e) f (x, y) = ln(x 2 + y 2 ° 1)
2.1. Dominio de una función de varias variables

Como en el caso de una variable, el dominio de una función consiste en todos los puntos de Rn
en los que se puede obtener el valor de la función
© ™
D f = (x 1 , x 2 , . . . , x n ) 2 Rn : existe f (x 1 , x 2 , . . . , x n )
Los problemas de dominio vienen dados, como siempre, por los cocientes (denominador distinto
de cero), raíces cuadradas (solo para números no negativos) y los logaritmos (solo para números
estrictamente positivos). El razonamiento del dominio de una función con varias variables se realiza
de forma análoga al caso de una variable.
Ejemplo 10 Razona el dominio de las funciones que aparecen en el ejemplo 8.
Salvo las funciones de producción, todas las demás se obtienen mediante suma o resta de va-
riables, por lo que siempre se pueden calcular. Sin embargo, el contexto económico hace que las
variables se deban considerar mayores o iguales a cero, luego su dominio (económico) sería Rn+ .
Respecto a la función Cobb-Douglas, al aparecer raíces cuadradas, cuartas, ... se necesita que
las variables sean no negativas, K ∏ 0, L ∏ 0, para poder calcularse. Finalmente, la función CES
exige, en general, que las variables sean estrictamente positivas, ya que pueden aparecer en un
denominador, K > 0, L > 0.
Ejemplo 11 Discute el dominio de las funciones del ejemplo 9.
Las funciones de los casos a) y b) pueden ser calculadas para cualquier valor de (x, y); por tanto,
en ambos casos su dominio es D f = R2
La función del caso c) es un cociente, en el que siempre es posible calcular el numerador y el

denominador, por lo que existe cuando su denominador es distinto de cero
© ™
D f = (x, y) 2 R2 : y 6= x 2
es decir, todos los puntos salvo los de la parábola y = x 2 .

En el caso de la raíz, la función se podrá calcular siempre que 4 ° x 2 ° y 2 ∏ 0, esto es x 2 + y 2 ∑ 4,

que se corresponde con la bola cerrada (círculo con la circunferencia) de centro (0, 0) y radio r = 2.
Finalmente, el logaritmo se podrá calcular cuando x 2 + y 2 ° 1 > 0, esto es x 2 + y 2 > 1, que se

corresponde con todo R2 menos la bola cerrada de centro (0, 0) y radio r = 1.
p
1 ° x2 ° y 2 ° z2
Ejemplo 12 Razona cuál es el dominio de la función f (x, y, x) =
x + y +z °1
El denominador siempre puede calcularse, pero el numerador solo existe si 1 ° x 2 ° y 2 ° z 2 ∏ 0, es
decir x 2 + y 2 + z 2 ∑ 1 (bola cerrada de centro (0, 0, 0) y radio r = 1). Pero, para que exista el cociente,
además el denominador deberá ser distinto de cero, con lo que se deben eliminar los puntos del plano
x + y + z = 1. Queda por tanto
© ™
D f = (x, y, z) 2 R3 : x 2 + y 2 + z 2 ∑ 1, x + y + z 6= 1
3. Gráficas. Curvas de nivel y conjuntos de contorno

La gráfica de una función con n variables es un conjunto en Rn+1 definido por
© ™
G f = (x 1 , x 2 , . . . , x n , z) 2 Rn+1 : z = f (x 1 , x 2 , . . . , x n )
En el caso de funciones de una variable (n = 1), este conjunto está en R2 y dibujar la gráfica resulta
muy útil. Para el caso de dos variables (n = 2) el conjunto G f está en R3 y se trata de superficies en
el espacio tridimensional que pueden imaginarse dibujando proyecciones, pero es bastante compli-
cado. Por ello, en este caso se usarán las curvas de nivel. Para más variables no es posible realizar
representaciones gráficas.
3.1. Curvas de nivel

Las curvas de nivel resultan de realizar cortes a la gráfica de la función mediante planos horizon-
tales de la forma z = C , para un cierto nivel C 2 R. Al representar una función de dos variables en R3
el eje vertical, la z, representa el valor de la función, z = f (x, y). De este modo, la curva de nivel C ,
recoge a todos los puntos (x, y) que están a la misma altura. Ejemplos de curvas de nivel en el mundo
real son los mapas topográficos, las líneas de isobaras (en los mapas del tiempo), ...
Los mapas topográficos de una determinada zona, como el de la figura2 2.9, se construyen dibu-
jando las lineas que unen los puntos que están a la misma altura (sobre el nivel del mar) o, lo que
es lo mismo, realizando cortes mediante planos horizontales (planos con ecuación z = C ). Si alguien
se desplaza siguiendo una de las líneas, seguirá un camino horizontal (totalmente llano, sin subidas
ni bajadas). Si las líneas están muy juntas significa que hay brusco cambio de altura, mientras que si
están separadas es que la pendiente es leve. Entre dos curvas consecutivas hay el mismo cambio de
altura, aunque en unas zonas están más cerca y en otras más alejadas.
Los mapas del tiempo, como el de la figura3 2.10, muestran unas líneas que unen los puntos que
tienen la misma presión atmosférica (isobaras). Cuando las líneas están muy cerca hay cambios brus-
cos de presión, que da lugar a inestabilidad atmosférica (borrascas). Cuando las líneas están muy
separadas el tiempo es estable (anticiclón).
2 http://biogeotesttoni.blogspot.com.es/2015/04/1-bachillerato-interpretacion-de-mapas.html (fecha de la consulta:
4/12/2015)
3 Agencia Estatal de Meteorología: previsión del tiempo para el 7/12/2015

Figura 2.9: Mapa topográfico: curvas de nivel
Figura 2.10: Ejemplo curvas de nivel: líneas isobaras (mapas del tiempo)

Definición 9 Dada una función f : R2 ! R, se llama curva de nivel C al conjunto de puntos

© ™
(x, y) 2 R2 : f (x, y) = C
En economía se usan de manera habitual las curvas de nivel para denotar distintas combinacio-
nes de las variables que proporcionan el mismo resultado (el prefijo iso, del griego, significa igual).
Así, por ejemplo
Las curvas isocuantas representan distintas combinaciones de los factores productivos que dan
lugar a la misma producción (curvas de nivel de la función de producción).
Las curvas isocostes, o isobeneficios, representan distintas combinaciones de factores que dan
lugar a un mismo coste de producción, o a un mismo beneficio, respectivamente.
Las curvas de indiferencia unen distintas combinaciones de cestas de bienes que proporcionan
la misma utilidad al consumidor (curvas de nivel de la función de utilidad).
Nota 5 Un hecho que hay que resaltar es que dos curvas de nivel distinto, C 1 6= C 2 , no se pueden cortar.
Si un punto (x § , y § ) está en dos curvas de nivel, entonces f (x § , y § ) = C 1 y f (x § , y § ) = C 2 , lo que no puede
cumplirse si dichos valores son diferentes.
Ejemplo 13 La función utilizada en la figura 2.11 es f (x, y) = x 2 + y 2 . La curva depnivel C está definida
por la ecuación x 2 + y 2 = C , que es una circunferencia de centro (0, 0) y radio r = C .
Figura 2.11: Función con dos variables: gráfica y curvas de nivel
Es habitual realizar un mapa de curvas de nivel; es decir, representar varias curvas de nivel que
muestran cómo es el comportamiento de la función. Las curvas se obtienen para distintos niveles C
que suelen tomarse equidistantes (por ejemplo, C = 0, 1, 2, 3, 4, . . .) y de este modo el que las curvas
de nivel estén muy juntas significará que hay una variación rápida en el valor de la función (mucha
pendiente), mientras que si están muy separadas la variación será muy lenta (poca pendiente).

Ejemplo 14 Calcula y representa las curvas de nivel de la función lineal f (x, y) = 4x ° 2y.
C
f (x, y) = C ) 4x ° 2y = C ) y = 2x °
2
que son rectas paralelas todas con pendiente m = 2.
Figura 2.12: Curvas de nivel de f (x, y) = 4x ° 2y
Ejemplo 15 Calcula y representa las curvas de nivel de la función (silla de montar) f (x, y) = x 2 ° y 2 .
La imagen gráfica (en tres dimensiones) de esta función se puede observar en la figura 2.14.
p
f (x, y) = C ) x2 ° y 2 = C ) y = ± x 2 °C
Figura 2.13: Curvas de nivel de f (x, y) = x 2 ° y 2
Ejemplo 16 Las curvas de nivel de las funciones de producción Cobb-Douglas (figura 2.15) son de tipo
hipérbola. Cuando los exponentes de las variables K , L son iguales (simétrica) entonces
1 D
F (K , L) = K Æ L Æ = C ) KL =C Æ =D ) K=
L
que es la ecuación de la hipérbola. Cuando los exponentes son distintos (asimétrica), por ejemplo con
Æ = 1/4, Ø = 1/2, queda
0 0 D
F (K , L) = K 0 25 L 0 5 = C ) K L2 = C 4 = D ) K=
L2

Figura 2.14: Gráfica de la función f (x, y) = x 2 ° y 2
Figura 2.15: Curvas de nivel de una función Cobb-Douglas simétrica/asimétrica

Ejemplo 17 Una función utilizada en modelizaciones económicas es la función mínimo. Con dos va-
riables, esta función se define por f (x, y) = mı́n{x, y}. Sus curvas de nivel son semirrectas formando un
ángulo de 90o con vértice en los puntos de la bisectriz del primer cuadrante (es decir, en los puntos de
la recta y = x).
Figura 2.16: Curvas de nivel de f (x, y) = mı́n{x, y}
Un sencillo ejemplo para entender estas funciones en el contexto económico es el siguiente:

Una empresa de servicio de radio-taxi realiza 100 servicios diarios con cada automóvil.
Cada conductor tiene asignado un taxi, y cada taxi solo es conducido por un empleado.
Por tanto, si el beneficio medio por servicio es de 5 ", y se denomina por x al número de
trabajadores y por y al número de taxis, la función de beneficios de la empresa es
º(x, y) = 500 mı́n{x, y}
3.2. Conjuntos de contorno

Definición 10 Dada una función f : R2 ! R, se denomina conjunto de contorno superior de nivel C
al conjunto de puntos
© ™
U = (x, y) 2 R2 : f (x, y) ∏ C
Se denomina conjunto de contorno inferior de nivel C al conjunto
© ™
L = (x, y) 2 R2 : f (x, y) ∑ C
Nota 6 La intersección de ambos conjuntos de contorno coincide con la curva de nivel correspondiente:
© ™
U \ L = (x, y) 2 R2 : f (x, y) = C
Nota 7 La siguiente imagen4 muestra cómo los conjuntos de contorno se pueden identificar por los
colores: el conjunto de contorno superior de nivel C = 1000 serían todos los puntos con colores amarillo,
naranja, marrón, ...; el conjunto de contorno inferior de nivel C = 1000 correspondería a los colores
amarillo-claro, verde-claro, verde, verde-oscuro, ... La curva de nivel C = 1000 (los puntos que están a
una altura de 1000 metros) sería la frontera de ambos conjuntos de contorno.
4 https://sites.google.com/site/cienciessocials5/tema-2 (fecha de la consulta: 4/12/2015)

Figura 2.17: Mapa topográfico: curvas de nivel y conjuntos de contorno
4. Continuidad. Propiedades
Los conceptos de límite de una función en un punto y continuidad son similares a los analizados
con una variable (el cambio principal consiste en sustituir intervalos abiertos por bolas abiertas).
Definición 11 Dada una función de n variables f : D µ Rn ! R, se dice que el límite de f (x) cuando
x = (x 1 , x 2 , . . . , x n ) tiende al punto a = (a 1 , a 2 , . . . , a n ) 2 D vale L 2 R si
8 " > 0, existe ± > 0 tal que x 2 B (a, ±) ) | f (x) ° L| < "
Este hecho se expresa, como es habitual, por lı́m f (x) = L.

x!a
Ejemplo 18 Observa los siguientes límites:

x+y 1
a) lı́m =
(x,y)!(1,0) 2 + y 2 2
x2 ° y 2 0
b) lı́m = (indeterminación)
(x, y) ! (0, 0) x°y 0
x 6= y
(x ° y)(x + y) x+y
) lı́m = lı́m =0
(x, y) ! (0, 0) x°y (x, y) ! (0, 0) 1
x 6= y x 6= y
En el estudio de funciones de una variable, se analizan los límites laterales para obtener el posible
valor del límite (si coinciden los límites laterales), o para probar que el límite no existe (si los límites
laterales son distintos). Cuando se trata de funciones de varias variables, como se ha comentado,
existen múltiples modos de aproximarse a un punto (derecha/izquierda, arriba/abajo, ...). Pero la
idea para ver que un límite no existe sigue siendo la misma: si se encuentran dos modos distintos de
aproximarse al punto que dan límites diferentes, el límite de la función no existirá. En caso de que
coincidan, se tendrá una idea del posible límite, aunque no hay garantía de que exista.
Se usarán para aproximarse a un punto direcciones sencillas (rectas, o funciones conocidas), o los
denominados límites iterados. Estos límites lo que hacen es calcular un límite múltiple, primero para

una variable (manteniendo las otras variables constantes), luego para una segunda variable (mante-
niendo el resto constantes), y así sucesivamente. Para el caso de dos variables, si se quiere estudiar
lı́m f (x, y), los límites iterados se definen del siguiente modo:
(x,y)!(a,b)
≥ ¥ µ ∂
L 1 = lı́m lı́m f (x, y) L 2 = lı́m lı́m f (x, y)
y!b x!a x!a y!b
Figura 2.18: Límites iterados en una función de dos variables
Por ejemplo, para calcular L 1 primero se calcula el límite cuando x ! a, y la variable y se toma
como una constante. Una vez obtenido el resultado de este límite (que, en general, quedará una fun-
ción de y) se calcula el límite cuando y ! b (ruta de color azul en la figura 2.18). Para calcular L 2 se
utiliza un razonamiento análogo cambiando el orden de las variables (ruta de color rojo en la figura
2.18).
x °5
Ejemplo 19 Si se desea calcular el límite de la función f (x, y) = cuando (x, y) tiende a (5, 5), los
x°y
límites iterados son µ ∂
x °5 0
L 1 = lı́m lı́m = lı́m = lı́m 0 = 0
y!5 x!5 x ° y y!5 5 ° y y!5
µ ∂
x °5 x °5
L 2 = lı́m lı́m = lı́m = lı́m 1 = 1
x!5 y!5 x ° y x!5 x ° 5 x!5
x °5
Como L 1 6= L 2 , entonces lı́m no existe.
(x,y)!(5,5) x ° y
Otro método para estudiar límites de funciones con dos variables consiste en sustituir una de las
variables por una dirección que se acerque al punto en el que se está interesado.
Dado un punto (a, b), una dirección (o trayectoria) en este punto viene definida por una
función continua y = ø(x) tal que ø(a) = b. Por ejemplo, en el punto (0, 0) se tienen las
siguientes trayectorias:
p
a) ø(x) = x b) ø(x) = x 2 c) ø(x) = |x| d ) ø(x) = 6x e) . . .

El límite direccional en el punto (a, b) según la trayectoria y = ø(x) en dicho punto se define por
° ¢
Lø = lı́m f (x, y) = lı́m f (x, ø(x))
(x, y) ! (a, b) x!a
y = ø(x)
Figura 2.19: Límites direccionales en una función de dos variables
Ejemplo 20 Calcula el límite del ejemplo 19 para las direcciones a) y = x; b) y = °x + 10
x °5 x °5
a) L ø = lı́m = lı́m que no existe
(x, y) ! (5, 5) x ° y x!5 x °x
y =x
x °5 x °5 1
b) L ø = lı́m = lı́m =
(x, y) ! (5, 5) x ° y x!5 2x ° 10 2
y = °x + 10
Luego, como se sabía, el límite de la función no existe en el punto (5, 5). La figura 2.20 muestra las
diferentes maneras de acercarse al punto (5, 5) que se han utilizado.
Ejemplo 21 Estudia la existencia de los siguientes límites:

x+y 0
1) lı́m = (indeterminación)
(x, y) ! (0, 0) x ° y 0
y 6= x
Los límites iterados son:

µ ∂
x+y y
a) L 1 = lı́m lı́m = lı́m = lı́m (°1) = °1
y!0 x!0 x ° y y!0 °y y!0
µ ∂
x+y x
b) L 2 = lı́m lı́m = lı́m = lı́m 1 = 1
x!0 y!0 x ° y x!0 x x!0
Como los límites iterados son diferentes, no existe el límite de la función en el punto (0, 0)

Figura 2.20: Límites iterados y direccionales en la función del ejemplo 20
Como método alternativo para realizar el estudio podrían usarse límites direccionales. Por
ejemplo
x+y 3x
a) ø(x) = 2x ) L ø = lı́m = lı́m = °3
(x, y) ! (0, 0) x ° y x!0 °x
y = 2x
x+y 4x
b) ø(x) = 3x ) Lø = lı́m = lı́m = °2
(x, y) ! (0, 0) x ° y x!0 °2x
y = 3x
Como los límites direccionales son diferentes, no existe el límite de la función en el punto (0, 0)
xy 0
2) lı́m = (indeterminación)
(x,y)!(0,0) x2 + y 2 0
Los límites iterados
µ son: ∂
xy 0
a) L 1 = lı́m lı́m 2 2
= lı́m 2 = lı́m 0 = 0
y!0 x!0 x + y y!0 y y!0
µ ∂
xy 0
b) L 2 = lı́m lı́m 2 = lı́m 2 = lı́m 0 = 0
x!0 y!0 x + y 2 x!0 x x!0
Como los límites iterados son iguales, no se puede afirmar nada sobre la existencia del límite
de la función en el punto (0, 0); en caso de existir, valdría L = 0
Deben usarse entonces límites direccionales. Por ejemplo
xy x2 1
a) ø(x) = x ) Lø = lı́m 2 + y2
= lı́m 2
=
(x, y) ! (0, 0) x x!0 2x 2
y =x
xy °x 2 1
b) ø(x) = °x ) Lø = lı́m 2 + y2
= lı́m 2
=°
(x, y) ! (0, 0) x x!0 2x 2
y = °x
Como los límites direccionales son diferentes, no existe el límite de la función en el punto (0, 0)

4.1. Funciones continuas

Definición 12 Una función de n variables, f (x), x = (x 1 , x 2 , . . . , x n ), es continua en un punto de su
dominio a = (a 1 , a 2 , . . . , a n ) si:
1) Existe f (a)
2) Existe el límite cuando x ! a, L = lı́m f (x)

x!a
3) Ambos valores coinciden, L = lı́m f (x) = f (a)

x!a
Ejemplo 22 Razona la continuidad de las funciones en los puntos que se indican:

x+y 1
a) La función f (x, y) = es continua en el punto (1, 0), ya que f (1, 0) = que coincide con el
2 + y2 2
límite de la función según se ha visto en el ejemplo 18.
xy
b) La función f (x, y) = no es continua en (0, 0) ya que, al margen de que no existe en dicho
x2 + y 2
punto, su límite tampoco existe como se ha visto en el ejemplo 21.
Como en el caso de funciones de una variable, la continuidad se razona usando funciones ele-
mentales conocidas y las propiedades de continuidad:
La suma/resta de funciones continuas es una función continua
El producto de funciones continuas es una función continua
El cociente de funciones continuas es una función continua en todos aquellos puntos donde el
denominador no se anula
La composición de funciones continuas es una función continua
Esta última es la propiedad más importante, ya que permite combinar funciones conocidas de una
variable (exponencial, logaritmo, raíz, ...) para razonar la continuidad de funciones de varias varia-
bles.
Ejemplo 23 Considera la función s

x+y
f (x, y) =
2 + y2
Entonces:
En primer lugar se calculan el numerador (x + y), el denominador (2 + y 2 ), que existen siempre y

son continuas.
A continuación se realiza el cociente. Como el denominador es siempre distinto de cero para cual-
quier (x, y), el cociente siempre existe y es una función continua.
Finalmente, se calcula la raíz, que se sabe que existe y es continua cuando el radicando (lo que
hay dentro de la raíz) es mayor o igual a cero. Como el denominador es siempre estrictamente
positivo, esto ocurrirá cuando el numerador sea no negativo.
Por tanto, por ser composición de funciones continuas, la función f (x, y) es continua en su dominio
© ™
D f = (x, y) 2 R2 : x + y ∏ 0
s µ ∂
xy
Ejercicio 3 Razona que la función f (x, y) = 10 ° sen es continua en todo R2 .
1 + x2 + y 2

5. Derivadas parciales de primer orden. Vector gradiente

En funciones de una variable la derivada, que se define formalmente por
f (a + h) ° f (a)
f 0 (a) = lı́m
h!0 h
indica la tasa de cambio de la función en el punto. Geométricamente, es la pendiente de la recta

tangente a la gráfica de la función en el punto (a, f (a)).
Cuando existen más variables, se puede estudiar el cambio de la función según cambia cada una
de las variables por separado (manteniendo las otras constantes). Aparece de este modo la definición
de derivada parcial.
Definición 13 Dada la función f (x), x = (x 1 , x 2 , . . . , x n ), la derivada parcial con respecto a x k , en un

punto de su dominio a = (a 1 , a 2 , . . . , a n ) es
@f f (a 1 , a 2 , . . . , a k + h, . . . , a n ) ° f (a 1 , a 2 , . . . , a k , . . . , a n )
(a) = lı́m para k = 1, 2, . . . , n
@x k h!0 h
en caso de que este límite exista.
Por tanto, una función de n variables tiene n derivadas parciales, una para cada x k . En el caso
particular de funciones de dos variables f (x, y) las dos derivadas parciales son
@f f (a + h, b) ° f (a, b) @f f (a, b + h) ° f (a, b)

(a, b) = lı́m (a, b) = lı́m
@x h!0 h @y h!0 h
Como ocurre con funciones de una variable, las derivadas parciales representan el cambio mar-
ginal en un punto de una función de varias variables con respecto a cada una de ellas. Por ejemplo,
con dos variables:
El cambio marginal de la función con respecto a la primera variable en un punto (a, b) viene
dado por:
@f
f (a + 1, b) ° f (a, b) º (a, b)
@x
El cambio marginal de la función con respecto a la segunda variable en un punto (a, b) viene
dado por:
@f
f (a, b + 1) ° f (a, b) º (a, b)
@y
Ejemplo 24 Calcula, usando la definición, las derivadas parciales de las siguientes funciones en un
punto genérico.
1) f (x, y) = 3x ° y 2
@f f (x + h, y) ° f (x, y) 3(x + h) ° y 2 ° (3x ° y 2 ) 3h

(x, y) = lı́m = lı́m = lı́m =3
@x h!0 h h!0 h h!0 h
@f f (x, y + h) ° f (x, y) 3x ° (y + h)2 ° (3x ° y 2 ) °2h y ° h 2
(x, y) = lı́m = lı́m = lı́m =
@y h!0 h h!0 h h!0 h
= lı́m (°2y ° h) = °2y

h!0

2) f (x, y) = x ln(y)
@f f (x + h, y) ° f (x, y) (x + h) ln(y) ° x ln(y) h ln(y)
(x, y) = lı́m = lı́m = lı́m = ln(y)
@x h!0 h h!0 h h!0 h
@f f (x, y + h) ° f (x, y) x ln(y + h) ° x ln(y) 0
(x, y) = lı́m = lı́m = = (indeterminación5 )
@y h!0 h h!0 h 0
1
x
y +h x
= lı́m =
h!0 1 y
3) f (x, y, z) = x 2 ° y z
@f f (x + h, y, z) ° f (x, y, z) (x + h)2 ° y z ° (x 2 ° y z) 2xh + h 2
(x, y, z) = lı́m = lı́m = lı́m = 2x
@x h!0 h h!0 h h!0 h
@f f (x, y + h, z) ° f (x, y, z) x 2 ° (y + h)z ° (x 2 ° y z) °hz
(x, y, z) = lı́m = lı́m = lı́m = °z
@y h!0 h h!0 h h!0 h
@f f (x, y, z + h) ° f (x, y, z) x 2 ° y(z + h) ° (x 2 ° y z) °yh
(x, y, z) = lı́m = lı́m = lı́m = °y
@z h!0 h h!0 h h!0 h
Como ocurre con una variable, el cálculo de derivadas no se hace habitualmente usando la de-
finición, sino las reglas y propiedades de derivación conocidas (derivada de la suma, derivada del
producto, derivada del cociente, ...). Al calcular derivadas parciales se deriva respecto a la variable
considerada, tratando al resto de variables como constantes.
Ejercicio 4 Calcula, aplicando las reglas de derivación, las derivadas parciales de las funciones del
ejemplo 24. Comprueba que los resultados coinciden con los obtenidos.
Ejemplo 25 Calcula las derivadas parciales de las siguientes funciones.

2
1) f (x, y) = ln(x y) + e x y
@f y 2 1 2
= + 2x ye x y = + 2x ye x y
@x x y x
@f x 2 1 2
= + x 2e x y = + x 2e x y
@y x y y
x y2
2) f (x, y) =
3x + y
@f y 2 (3x + y) ° x y 2 3 y3
= =
@x (3x + y)2 (3x + y)2
2
@f 2x y(3x + y) ° x y 6x 2 y + x y 2
= =
@y (3x + y)2 (3x + y)2
p
3) f (x, y, z) = x y z
p p p
@f yz yz @f xz xz @f xy xy
= p = p = p = p = p = p
@x 2 x y z 2 x @y 2 x y z 2 y @z 2 x y z 2 z
Para calcular las derivadas parciales en un punto particular, simplemente hay que sustituir las
p
componentes del punto. Por ejemplo, las derivadas parciales de la función f (x, y, z) = x y z en el
punto (4, 1, 9) son
@f 3 @f 6 @f 2 1
(4, 1, 9) = (4, 1, 9) = = 3 (4, 1, 9) = =
@x 4 @y 2 @z 6 3
5 Se aplica L’Hôpital. Hay que tener en cuenta que la variable con respecto a la que se está calculando el límite es h.

5.1. Vector gradiente

El vector gradiente de una función de n variables en un punto a es el vector de Rn formado por
las derivadas parciales calculadas en dicho punto
µ ∂
@f @f @f
r f (a) = (a), (a), . . . , (a)
@x 1 @x 2 @x n
p
Ejemplo 26 Para la función f (x, y, z) = x y z, según se ha obtenido, el vector gradiente en el punto
(4, 1, 9) es µ ∂
3 1
r f (4, 1, 9) = , 3,
4 3
Si se considera la función f (x, y) = x 2 + 3x y, el gradiente en un punto genérico (x, y) es

° ¢
r f (x, y) = 2x + 3y, 3x
Por tanto, su gradiente en el punto (°1, 2) será r f (°1, 2) = (4, °3). En el punto (1, 3) el vector
gradiente es r f (1, 3) = (11, 3).
El vector gradiente de f (x, y, z) = x + y ln(z) en un punto genérico (x, y, z) es

≥ y¥
r f (x, y, z) = 1, ln(z),
z
En el punto (3, 2, 1) el vector gradiente es r f (3, 2, 1) = (1, 0, 2).
5.2. Plano tangente a una superficie

Dada una función de una variable f (x), la ecuación de la recta tangente en un punto (a, f (a)) de
su gráfica es
y ° f (a) = f 0 (a)(x ° a) ) y = f (a) + f 0 (a)(x ° a)
Cuando la función tiene dos variables f (x, y) su gráfica es una superficie en R3 y el plano tangente
a la superficie en un punto (a, b, f (a, b)) se define, de forma muy similar a la recta tangente, por la
ecuación:
@f @f
z ° f (a, b) = (a, b)(x ° a) + (a, b)(y ° b)
@x @y
o, escrito de otra forma
z = f (a, b) + r f (a, b) · (x ° a, y ° b)
Como se verá (y como se observa gráficamente en la figura 2.21), para puntos (x, y) suficiente-
mente cerca del punto (a, b) (esto es, puntos de una bola B ((a, b), r ), con r > 0 pequeño), el plano
tangente es una buena aproximación a la función:
f (x, y) º z = f (a, b) + r f (a, b) · (x ° a, y ° b)
Observando la ecuación del plano tangente, su vector normal está definido por los coeficientes de
x, y, z, con lo que el vector perpendicular al plano tangente a una superficie definida por una función
de dos variables f (x, y) es
° ¢
p = r f (a, b), °1

Figura 2.21: Plano tangente a la gráfica de una función de dos variables (superficie)
Ejemplo 27 Calcula la ecuación del plano tangente en el punto (°1, 2) a la superficie en R3 definida
por la función f (x, y) = x 2 + 3x y
f (°1, 2) = °5
r f (°1, 2) = (4, °3)
z ° (°5) = (4, °3) · (x ° (°1), y ° 2) = 4(x + 1) ° 3(y ° 2) = 4x ° 3y + 10
ecuación plano: 4x ° 3y ° z = °5
vector perpendicular al plano: p = (4, °3, °1)
6. Regla de la cadena (derivada de la función compuesta)

La generalización de la regla de la cadena a funciones de varias variables permite calcular las
parciales cuando las variables del problema son a su vez funciones de otras variables.
Ejemplo 28 Usualmente, la función de producción de una empresa f (K , L) depende del capital K y del
trabajo L. Pero ambas variables pueden ser consideradas como funciones del tiempo t , ya que su valor
no es constante sino que va fluctuando a lo largo de un intervalo temporal:
K = K (t ), L = L(t ) t 2 [t 0 , t 1 ]
En general, si f es una función de n variables (x 1 , x 2 , . . . , x n ) que, a su vez, dependen de una va-

riable t , de modo que x i = x i (t ), entonces ¿cómo cambia la función cuando hay un cambio (muy
pequeño) en la variable t ? En otras palabras, ¿cuánto vale f 0 (t )? La respuesta a esta pregunta se pue-
de obtener sustituyendo cada x i (t ), de modo que al final se obtiene una función que solo depende de
t . Derivando esta función se obtiene el resultado buscado.
Un modo alternativo consiste en aplicar la regla de la cadena que indica que:
df @ f d x1 @ f d x2 @ f d xn X n @f dx
i
f 0 (t ) = = + +...+ =
dt @x 1 d t @x 2 d t @x n d t i =1 @x i d t

En el caso de la función de producción mencionada anteriormente se tiene

@f dK @f dL
f 0 (t ) = +
@K d t @L d t
Ejemplo 29 Dada la función f (x, y) = x 2 °x y, donde x = x(t ) = 5t , y = y(t ) = ln(t ), calcula la derivada
de la función en el punto t = 1.
La primera posibilidad es sustituir las variables x, y por sus valores respecto a t , derivar y obtener
su valor para t = 1
µ ∂
1
f (t ) = (x(t ))2 ° x(t )y(t ) = 25t 2 ° 5t ln(t ) ) f 0 (t ) = 50t ° 5 ln(t ) + 5t = 50t ° 5 ln(t ) ° 5
t
Luego f 0 (1) = 45
Aplicando la regla de la cadena

@f dx @f d y 1
f 0 (t ) = + = (2x ° y)5 + (°x) = 50t ° 5 ln(t ) ° 5 ) f 0 (1) = 45
@x d t @y d t t
que coincide con el resultado obtenido.
En general, los cálculos que deben realizarse serán mucho más sencillos aplicando la regla de la
cadena, ya que por un lado se calculan las derivadas parciales de la función y, por otro, se calcula
la derivada de cada variable con respecto a t . Al dividir el problema en varias etapas, se reduce la
complicación en el cálculo de las derivadas.
El resultado se puede extender cuando las variables de la función dependen a su vez de más de
una variable (en este caso habrá derivadas parciales). En general, dada una función f (x 1 , x 2 , . . . , x n ),
si cada x i es función de s variables (t 1 , t 2 , . . . , t s ), entonces
@f @ f @x 1 @ f @x 2 @ f @x n X n @ f @x
i
= + +...+ = para k = 1, 2, . . . , s
@t k @x 1 @t k @x 2 @t k @x n @t k i =1 @x i @t k
p
Ejemplo 30 Dada la función f (x, y, z) = x y z, donde
x = x(u, v) = u sen(v) y = y(u, v) = u 2 + 2v z = z(u, v) = e 2u°3v ,
calcula las parciales de f con respecto a u y con respecto a v.
p p p
@f yz @f xz @f xy
= p = p = p
@x 2 x @y 2 y @z 2 z
@x @x @y @y @z @z
= sen(v) = u cos(v) = 2u =2 = 2e 2u°3v = °3e 2u°3v
@u @v @u @v @u @v
Entonces
@f @ f @x @ f @y @ f @z
= + + =
@u @x @u @y @u @z @u
p p p
(u 2 + 2v)e 2u°3v u sen(v)e 2u°3v u sen(v)(u 2 + 2v) 2u°3v
= p sen(v) + p 2u + p 2e
2 u sen(v) 2 u 2 + 2v 2 e 2u°3v
@f @ f @x @ f @y @ f @z
= + + =
@v @x @v @y @v @z @v
p p p
(u 2 + 2v)e 2u°3v u sen(v)e 2u°3v u sen(v)(u 2 + 2v) ° ¢
= p u cos(v) + p 2+ p °3e 2u°3v
2 u sen(v) 2 u 2 + 2v 2 e 2u°3v
A pesar de lo complicado del resultado final, debe observarse que todas las derivadas calculadas se han
obtenido de una manera fácil. En caso de haber sustituido previamente las funciones x(u, v), y(u, v),
z(u, v) para obtener la función en las variables (u, v) los cálculos necesarios para obtener las derivadas
parciales hubieran sido sustancialmente más complejos.

7. Derivada direccional
Como se sabe, las derivadas indican cómo cambia una función. En el caso de dos variables, las
dos derivadas parciales indican cómo varía la función cuando cambia cada una de ellas por separa-
do. Pero, en ocasiones, se está interesado en conocer cómo cambia la función cuando las variables se
mueven en una determinada dirección que no es la de las parciales (por ejemplo, si ambas variables
cambian por igual, es decir se mueven en la dirección del vector (1, 1)). También puede ser interesante
determinar las direcciones que hacen crecer (o decrecer) más a la función (dirección de máximo creci-
miento/decrecimiento). Esta información viene proporcionada por las derivadas direccionales de una
función. Bajo ciertas condiciones habituales, estas derivadas direccionales se obtienen utilizando el
vector gradiente de la función. Aquí se definirán de esta manera.
Definición 14 Sea f (x) una función de n variables, x = (x 1 , x 2 , . . . , x n ), que tiene derivadas parciales
continuas en un punto a = (a 1 , a 2 , . . . , a n ) de su dominio. Dado un vector unitario (dirección normali-
zada), v = (v 1 , v 2 , . . . , v n ), kvk = 1, la derivada direccional de f (x) en el punto a, según la dirección de
v es
@f @f @f X n @f
D f (a; v) = r f (a) · v = (a)v 1 + (a)v 2 + . . . + (a)v n = (a)v i
@x 1 @x 2 @x n i =1 @x i
Nota 8 Es importante observar que el vector v debe tener norma 1. En caso de que se esté interesado
en una dirección no unitaria, por ejemplo el vector en el que las dos componentes crecen por igual
w = (1, 1), el primer paso será normalizar el vector
µ ∂
1 1 1 1
v= w ) v = p (1, 1) = p , p
kwk 2 2 2
Ejemplo 31 Calcula la derivada direccional de la función f (x, y) = x 2 ° y 2 en el punto (1, 1) y la direc-

ción de los vectores (1, 2), y (2, 1).
El primer paso es calcular el vector gradiente en el punto a = (1, 1)
r f (x, y) = (2x, °2y) r f (1, 1) = (2, °2)

p p
Ahora debe normalizarse la dirección, ya que k(1, 2)k = 1 2 + 22 = 5. Entonces el vector a con-
µ ∂
1 2
siderar será u = p , p y la derivada direccional vale
5 5
µ ∂
1 2 2
D f ((1, 1); u) = (2, °2) · p , p = ° p
5 5 5
lo que significa que la función decrece en esta dirección.
p p
De nuevo debe normalizarse
µ la∂ dirección, puesto que k(2, 1)k = 22 + 12 = 5. Entonces el vector
2 1
a considerar será v = p , p y la derivada direccional vale
5 5
µ ∂
2 1 2
D f ((1, 1); v) = (2, °2) · p , p = p
5 5 5
lo que significa que la función crece en esta dirección.
Obsérvese en la figura 2.22 que el punto (1, 1) está en la curva de nivel C = 0. Si se mueve en la direc-
ción del vector (1, 2) va hacia la curva de nivel C = °5 (luego decrece), mientras que si se mueve en la
dirección de (2, 1) va hacia la curva de nivel C = 5 y la función crece.

Figura 2.22: Derivadas direccionales de la función f (x, y) = x 2 ° y 2
A partir de las propiedades vistas en el capítulo anterior, al ser la derivada direccional un producto
escalar de dos vectores se puede expresar del siguiente modo
D f (a; v) = r f (a) · v = kr f (a)kkvk cos(') = kr f (a)k cos(')
por ser el vector unitario, donde ' es el ángulo que forman el vector gradiente r f (a) y el vector
que indica la dirección v. Por tanto, los valores de la derivada direccional únicamente dependen del
ángulo '. Como cos(') es un valor entre °1 y +1, y kr f (a)k es un número positivo constante, la
derivada direccional tomará el valor máximo cuando cos(') = 1, es decir cuando el ángulo sea de 0o ,
lo que significa que el vector v y el gradiente tienen la misma dirección y sentido. Se tiene por tanto
el siguiente resultado.
Teorema 1 La dirección de máximo crecimiento de una función en un punto a es la que define su

vector gradiente en dicho punto, r f (a). Además, el valor de la derivada direccional en ese punto vale
r f (a)
D f (a; v) = kr f (a)k v=
kr f (a)k
Por tanto, si se está interesado en aumentar el valor de una función objetivo f (x), la mejor estra-
tegia es moverse en cada punto en la dirección y sentido que indica el vector gradiente (que irá cam-
biando de un punto a otro). De manera análoga, la dirección de máximo decrecimiento será aquella
en que cos(') = °1, es decir cuando forma un ángulo de 180o (º radianes) con el gradiente, lo que
significa que v tendrá la dirección de °r f (a).
Nótese, por otro lado, que si el vector v es perpendicular al vector gradiente (' = º/2) entonces
cos(') = 0 y la derivada direccional será cero.

8. Diferencial. Aproximación lineal

Para funciones de una variable la recta tangente a la gráfica en un punto a proporciona una buena
aproximación al valor de la función en puntos que están próximos al punto a:
f (x) º f (a) + f 0 (a)(x ° a) x 2 (a ° r, a + r ) , r > 0 próximo a 0
o, lo que es lo mismo
f (a + d x) ° f (a) º f 0 (a)d x d x 2 (°r, r ) , r > 0 próximo a 0
Para generalizar esta aproximación al contexto de varias variables hay que tener en cuenta que no
existe una sola derivada, sino que hay tantas derivadas parciales como variables. El modo de recoger
la idea de derivada total es mediante el concepto de diferencial.
Definición 15 Una función con n variables f (x) es diferenciable en un punto a del interior de su do-
minio si existe r > 0 (posiblemente próximo a 0) tal que
f (x) ° f (a) = r f (a) · (x ° a) + E (x; a) para todo x 2 B (a, r )
E (a; x)
donde E (x; a) es una función de error tal que lı́m =0
x!a kx ° ak
Escrito de otra manera, la anterior definición dice que
f (x) ° f (a) º r f (a) · (x ° a) para todo x 2 B (a, r ), r > 0 próximo a 0
Esto significa que, en una bola abierta alrededor del punto a el plano tangente es una buena aproxi-
mación del valor de la función, como ya habíamos visto. Para una función de dos variables, f (x, y), la
definición anterior se expresa en la forma
f (x, y) ° f (a, b) º r f (a, b) · (x ° a, y ° b) para todo (x, y) 2 B ((a, b), r ), r > 0 próximo a 0
que puede escribirse como
@f @f
f (a + d x, b + d y) ° f (a, b) º r f (a, b) · (d x, d y) = (a, b)d x + (a, b)d y (d x, d y) º (0, 0)
@x @y
A la expresión a la derecha de la última igualdad se la denomina diferencial total de la función
@f @f
d f (a, b) = (a, b)d x + (a, b)d y
@x @y
Un modo de saber si una función es diferenciable viene dado en el siguiente resultado.
Teorema 2 Si f (x 1 , x 2 , . . . , x n ) tiene derivadas parciales continuas en una bola abierta de centro el pun-
to a = (a 1 , a 2 , . . . , a n ), entonces esta función es diferenciable en dicho punto.
Ejemplo 32 Dada la función f (x, y) = 5x 2 y ° 3y 2 y el punto (°1, 1) :
a) Calcula la diferencial total en dicho punto
@f @f @f @f
= 10x y = 5x 2 ° 6y ) (°1, 1) = °10 (°1, 1) = °1 )
@x @y @x @y
) d f (°1, 1) = °10d x ° d y
Hay que observar que las derivadas parciales son funciones continuas (son polinomios) y, por tanto,
la función es diferenciable en el punto (°1, 1), aplicando el teorema anterior.
b) Calcula de forma aproximada el valor de f (°10 01, 10 001)

f (°1 + d x, 1 + d y) ° f (°1, 1) º °10d x ° d y ) f (°1 + d x, 1 + d y) º 2 ° 10d x ° d y
Como d x = °00 01, d y = 00 001, se tiene f (°10 01, 10 001) º 2 ° 10(°00 001) ° 00 001 = 20 099
Nota 9 El valor exacto es f (°10 01, 10 001) = 20 0995975.

9. Funciones implícitas. Derivada de la función implícita

Si, por ejemplo, se considera la función de dos variables f (x, y) = x ° y, cada una de sus curvas
de nivel f (x, y) = C , define una función de una variable y = h(x) (una variable menos de las que
tenía la función inicial), que en este ejemplo es y = h(x) = x ° C . Como ya se ha visto, las expresiones
x ° y = C , y = x ° C definen la misma curva, con la diferencia de que en la segunda expresión la
variable y está despejada. Cuando esto ocurre y se tiene la expresión y = h(x), se dice que la función
está en forma explícita, mientras que en el otro caso, cuando se tiene f (x, y) = C , se dice que está en
forma implícita.
Pasar de forma explícita a implícita siempre es posible, sin más que pasar todo a un lado de la
igualdad. Sin embargo, el paso contrario (de forma implícita a explícita) no siempre es posible. Ya se
obtuvo un método para calcular derivadas de funciones definidas en forma implícita, pero el siguien-
te resultado ofrece una expresión más fácil y manejable para obtener estas derivadas.
Teorema 3 (Teorema de la función implícita: dos variables). Sea f (x, y) una función de dos variables
y (a, b) un punto de su dominio de modo que
1. f (a, b) = C
2. f (x, y) y sus derivadas parciales son funciones continuas en el punto (a, b)
@f
3. (a, b) 6= 0
@y
Entonces, existe un entorno del punto a, (a °r, a +r ), tal que la ecuación f (x, y) = C define una función
y = h(x), de manera que h(a) = b y además
@f
(a, b)
0 0
y (a) = h (a) = ° @x
@f
(a, b)
@y
Ejemplo 33 Analiza para cada función y punto que se indican, si puede aplicarse el teorema de la
función implícita y calcula la derivada en el punto indicado.6
a) f (x, y) = x + ln(y) en el punto (0, 1)
@f @f 1 @f @f
f (0, 1) = 0 + ln(1) = 0; = 1, = (0, 1) = 1, (0, 1) = 1
@x @y y @x @y
Las derivadas parciales son continuas en el punto (0, 1) (una es constante y en la otra hay un cocien-
te cuyo denominador es distinto de cero en un entorno del punto). Además, la segunda parcial es
distinta de cero en el punto. Por tanto, se cumplen todas las condiciones con lo que
@f
(0, 1)
y 0 (0) = ° @x = °1
@f
(0, 1)
@y
6 Como se trata de la derivada de una función de una variable, ésta indica la pendiente de la recta tangente en dicho
punto que tendrá, por tanto, la ecuación: y ° b = y 0 (a)(x ° a).

b) f (x, y) = x ln(y) + 2y ln(x) en el punto (1, 1)
@f 2y @f x @f @f
f (1, 1) = ln(1) + 2 ln(1) = 0; = ln(y) + , = + 2 ln(x) (1, 1) = 2, (1, 1) = 1
@x x @y y @x @y
Las derivadas parciales son continuas y la segunda parcial es distinta de cero en el punto (1, 1). Por
tanto, se cumplen todas las condiciones con lo que
@f
(1, 1)
y 0 (1) = ° @x = °2
@f
(1, 1)
@y
c) f (x, y) = x ° y 2 en el punto (4, 1)
@f @f @f @f
f (4, 1) = 4 ° 1 = 3; = 1, = °2y (4, 1) = 1, (4, 1) = °2
@x @y @x @y
Las derivadas parciales son continuas en el punto (4, 1) (una es constante y la otra es un polino-
mio). Además, la segunda parcial es distinta de cero en el punto. Por tanto, se cumplen todas las
condiciones con lo que
@f
(4, 1)
1
y 0 (4) = ° @x =
@f 2
(4, 1)
@y
La ecuación de la recta tangente a la curva de nivel que pasa por el punto (4, 1) es
1
y ° 1 = (x ° 4) ) x ° 2y = 2
2
En el caso general, con funciones de más variables, el teorema de la función implícita establece
condiciones para que una de las variables se pueda expresar como función de las demás, y muestra
la expresión de las derivadas parciales.
Teorema 4 (Teorema de la función implícita: caso general). Dada una función de n + 1 variables
f (x 1 , x 2 , . . . , x n , y) y un punto de su dominio (a 1 , a 2 , . . . , a n , b) tal que
1. f (a 1 , a 2 , . . . , a n , b) = C
2. f (x 1 , x 2 , . . . , x n , y) y sus derivadas parciales son funciones continuas en el punto (a 1 , a 2 , . . . , a n , b)
@f
3. (a 1 , a 2 , . . . , a n , b) 6= 0
@y
Entonces, existe una bola abierta de centro el punto a = (a 1 , a 2 , . . . , a n ), B (a, r ), tal que la ecuación
f (x 1 , x 2 , . . . , x n , y) = C define una función y = h(x 1 , x 2 , . . . , x n ), de manera que h(a 1 , a 2 , . . . , a n ) = b y
además
@f
(a 1 , a 2 , . . . , a n , b)
@y @h @x i
(a) = (a) = °
@x i @x i @f
(a 1 , a 2 , . . . , a n , b)
@y

Ejemplo 34 Dada la función f (x, y, z) = xz + y 2 , analiza si puede aplicarse el teorema de la función

implícita en el punto (1, 1, 1), y calcula las derivadas parciales de z = h(x, y) en el punto indicado.
f (1, 1, 1) = 1
La función, y las derivadas parciales, son funciones polinómicas, luego son continuas
@f @f @f
=z = 2y =x
@x @y @z
@f
(1, 1, 1) = 1 6= 0
@z
Entonces se cumplen las condiciones del teorema de la función implícita y existe una función h(x, y) de
modo que la ecuación xz ° y 2 = 1 es equivalente a z = h(x, y). Además,
@f @f
(1, 1, 1) (1, 1, 1)
@z @h 1 @z @h @y 2
(1, 1) = (1, 1) = ° @x = ° = °1 (1, 1) = (1, 1) = ° = ° = °2
@x @x @f 1 @y @y @f 1
(1, 1, 1) (1, 1, 1)
@z @z
9.1. Gradiente y recta tangente a la curva de nivel

La recta tangente a una curva de nivel de una función de dos variables, f (x, y) = C , tiene la ecua-
ción
y ° b = y 0 (a)(x ° a) (a, b) tal que f (a, b) = C
La derivada y 0 (a) = h 0 (a) se obtiene a partir del teorema de la función implícita, y queda
@ f (a, b)
@ f (a, b) @ f (a, b)
y ° b = ° @x (x ° a) ) (x ° a) + (y ° b) = 0 ) r f (a, b) · (x ° a, y ° b) = 0
@ f (a, b) @x @y
@y
Esto significa que el vector gradiente es perpendicular a la recta tangente de la curva de nivel. Por
tanto, dibujando las curvas de nivel se puede obtener fácilmente (de manera gráfica) la dirección de
máximo crecimiento, que viene dada por el vector gradiente. Para saber el sentido, simplemente hay
que fijarse hacia donde crecen las curvas de nivel (figura 2.23).
10. Funciones homogéneas y homotéticas

10.1. Funciones homogéneas
Un tipo de funciones muy utilizado en modelizaciones económicas por su sencillez y buenas
propiedades es el de funciones homogéneas. Las funciones de producción Cobb-Douglas y CES son
funciones homogéneas como se verá a continuación.
Definición 16 Una función f : S µ R2 ! R se dice que es homogénea de grado k en su dominio S si

para todo (x, y) 2 S y para todo número real ∏ 2 R, ∏ > 0, se cumple que:
f (∏x, ∏y) = ∏k f (x, y).

Figura 2.23: Gradiente y rectas tangentes a las curvas de nivel de una función
Ejemplo 35 Analiza si las siguientes funciones son homogéneas:
a) La siguiente función es homogénea de grado k = 1 en su dominio.
x 2 + y 2 ° 2x y (∏x)2 + (∏y)2 ° 2(∏x)(∏y) ∏2 (x 2 + y 2 ° 2x y)

f (x, y) = ; f (∏x, ∏y) = = = ∏ f (x, y).
y (∏y) ∏y
b) La siguiente función es homogénea de grado k = 0 en su dominio.

µ ∂ µ ∂ µ ∂
x ∏x x
f (x, y) = sen ; f (∏x, ∏y) = sen = sen = f (x, y) = ∏0 f (x, y).
y ∏y y
c) La siguiente función es homogénea de grado k = 00 5 en su dominio.

p q p p 0
f (x, y) = 2x ° 5y; f (∏x, ∏y) = 2(∏x) ° 5(∏y) = ∏ 2x ° 5y = ∏0 5 f (x, y).
d) La siguiente función es homogénea de grado k = °2 en su dominio.

x
f (x, y) = ;
x 3 + y 3 ° 2x y 2
∏x 1 x
f (∏x, ∏y) = = = ∏°2 f (x, y).
(∏x)3 + (∏y)3 ° 2(∏x)(∏y)2 ∏ x + y ° 2x y 2
2 3 3
Nota 10 Las funciones homogéneas de grado k = 1 se denominan linealmente homogéneas. La fun-

ción del apartado a) del ejemplo 35 es linealmente homogénea. Ejemplos típicos con dos variables son
las funciones (lineales) del tipo f (x, y) = ax + b y, donde a, b son constantes reales conocidas.

Ejemplo 36 Es fácil comprobar que las siguientes funciones no son homogéneas:
a) f (x, y) = x 2 + y 2 + x + y + 1
b) f (x, y) = sen(x 2 + y 2 )
c) f (x, y) = ln(x) + ln(y);
Pero sí que lo es f (x, y) = ln(x) ° ln(y) (¿de qué grado?)
Ejemplo 37 La función Cobb-Douglas es homogénea de grado k = Æ + Ø
F (∏K , ∏L) = A(∏K )Æ (∏L)Ø = A∏Æ+Ø K Æ L Ø = ∏Æ+Ø F (K , L).
La función C E S es homogénea de grado k = 1 (linealmente homogénea)

£ §° 1 £ §° 1
F (∏K , ∏L) = A ±(∏K )°Ω + (1 ° ±)(∏L)°Ω Ω = A∏ ±K °Ω + (1 ° ±)L °Ω Ω = ∏F (K , L).
Nota 11 El concepto de función homogénea con funciones de producción está vinculado al de rendi-
mientos (constantes, crecientes, decrecientes) a escala:
Si la función de producción es homogénea de grado 1 cumplirá que F (∏K , ∏L) = ∏F (K , L). Por
tanto, duplicar la cantidad de los inputs hace que se duplique la cantidad de output (rendimen-
tos constantes a escala).
Si la función es homogénea de grado k < 1, por ejemplopk = 00 5, entonces duplicar la cantidad

de los inputs hace que la producción se multiplique por 2 < 2, lo que se corresponde con rendi-
mentos decrecientes a escala.
Si la función es homogénea de grado k > 1, por ejemplo k = 2, entonces duplicar la cantidad de

los inputs hace que la producción se multiplique por 4 > 2, lo que se corresponde con rendimentos
crecientes a escala.
Se han definido funciones homogéneas para dos variables (x, y). De manera totalmente análoga
se definen para funciones de tres, cuatro, . . . , n variables. Una función f : S µ Rn ! R se dice que es
homogénea de grado k en su dominio S si para todo (x 1 , x 2 , . . . , x n ) 2 S y para todo número real ∏ 2 R,
∏ > 0, se cumple que:
f (∏x 1 , ∏x 2 , . . . , ∏x n ) = ∏k f (x 1 , x 2 , . . . , x n ).
P
Las funciones lineales con n variables f (x 1 , x 2 , . . . , x n ) = ni=1 a i x i son un ejemplo de funciones lineal-
mente homogéneas. Las formas cuadráticas Q(v) = v 0 Av son un ejemplo de funciones homogéneas
de grado 2.
10.2. Propiedades y caracterización de funciones homogéneas. El teorema de Euler

Teorema 5 Si las funciones f , g son homogéneas de grado k, entonces h(x) = Æ f (x) + Øg (x) es una
función homogénea del mismo grado, para cualquier Æ, Ø 2 R, Æ 6= 0, Ø 6= 0.
Teorema 6 Si las funciones f , g son homogéneas de grado k 1 , k 2 , respectivamente, entonces su produc-

to h(x) = f (x)g (x) es una función homogénea de grado k = k 1 + k 2 . Si la función g (x) 6= 0, el cociente
f (x)
h(x) = es una función homogénea de grado k = k 1 ° k 2 .
g (x)

Ejemplo 38 Estas dos propiedades son útiles para descomponer el estudio de homogeneidad. Por ejem-
plo, en la función
q
x 5 ° 6x 2 y 3
f (x, y) = 3(x 2 + x y) ° 2 y 4 + x 2 y 2 + (x ° 5y)(2x + 3y) °
x y2
el primer sumando es una función homogénea de grado k = 2 y también lo es el segundo sumando.

El tercero es un producto de dos funciones homogéneas de grado k = 1 y, por tanto, es homogénea de
grado k = 2. Finalmente, el último término es un cociente de dos funciones homogéneas de grado k = 5
(el numerador) y grado k = 3 (el denominador). Por tanto, se trata de una función homogénea de grado
k = 2. Así, la función f (x, y) es suma de funciones homogéneas todas de grado k = 2 y entonces es
homogénea de este grado.
Teorema 7 Si f : Rn ! R es una función homogénea de grado k con derivadas parciales continuas,

entonces cada derivada parcial es una función homogénea de grado k ° 1.
Nota 12 Nótese que esta propiedad (que se puede comprobar en cualquiera de las funciones del ejem-
plo 35) indica que, en cierta manera, las funciones homogéneas se comportan como los polinomios de
una variable: si f (x) es un polinomio de grado k, su derivada es un polinomio de grado k ° 1.
Teorema 8 (Teorema de Euler) Una función f (x, y) con derivadas parciales continuas es homogénea
de grado k si, y solamente si, se cumple que para todo (x, y) de su dominio
@f @f
x (x, y) + y (x, y) = k f (x, y).
@x @y
Ejemplo 39 Se puede ver, aplicando el Tª de Euler, que la función del apartado a) del ejemplo 35 es
linealmente homogénea.
x 2 + y 2 ° 2x y @f (2x ° 2y) @f (2y ° 2x)y ° (x 2 + y 2 ° 2x y)

f (x, y) = ; = ; = ;
y @x y @y y2
@f @f (2x ° 2y) (2y ° 2x)y ° (x 2 + y 2 ° 2x y)

x +y =x +y =
@x @y y y2
2x 2 ° 2x y + 2y 2 ° 2x y ° x 2 ° y 2 + 2x y
= = f (x, y).
y
Nota 13 Interpretación del Tª de Euler en términos de precios (relativos) de los inputs. Si se tiene
una función de producción F (K , L) linealmente homogénea (grado k = 1, rendimientos constantes a
escala), entonces el Tª de Euler se escribe como
@F @F
K +L = F (K , L).
@K @L
Si el precio del ouput es unitario (o se toman precios relativos), entonces las derivadas parciales repre-
sentarían los precios de los inputs que hacen que haya equilibrio, es decir que coste = ingreso.
El teorema de Euler se cumple para funciones con cualquier número de variables.
Teorema 9 (Teorema de Euler, caso general) Una función f : Rn ! R con derivadas parciales conti-
nuas es homogénea de grado k si, y solamente si, se cumple que para todo x 2 Rn de su dominio
x · r f (x) = k f (x).

Teorema 10 Si f (x, y) es una función homogénea de grado k con derivadas parciales continuas, en-
tonces todas las curvas de nivel f (x, y) = C tienen la misma pendiente en los puntos de cualquier semi-
recta que parte desde el origen.
Nota 14 Entonces solo será necesario observar qué pasa en una de las curvas de nivel. La figura 2.24
muestra esta propiedad.
Figura 2.24: Rectas tangentes a las curvas de nivel de una función Cobb-Douglas
Nota 15 La prueba del teorema 10 se basa en cómo se calcula la pendiente de una curva de nivel (teo-
rema de la función implícita) y en que las derivadas parciales de una función homogénea de grado
k son funciones homogéneas de grado k ° 1. Por tanto, si se toma el punto (a, b) y otro que esté en la
semi-recta desde el origen, que será de la forma (∏a, ∏b), se tiene que:
@f
(a, b)
La pendiente de la curva de nivel en (a, b) es m 1 = ° @@xf
@y (a, b)
@f @f
@x (∏a, ∏b) ∏k°1 @x (a, b)
La pendiente de la curva de nivel en (∏a, ∏b) es m 2 = ° @f
=° @f
= m1
@y (∏a, ∏b) ∏k°1 @y (a, b)
10.3. Funciones homotéticas

El siguiente ejemplo muestra que la propiedad del teorema 10 no es exclusiva de las funciones
homogéneas.
° ¢
Ejemplo 40 La función f (x, y) = ln x Æ y Ø = Æ ln(x) + Ø ln(y) no es homogénea, pero también cumple
la propiedad de paralelismo de las tangentes. Las curvas de nivel de esta función son muy similares a
las de la figura 2.24. Si se calculan dichas curvas de nivel, se tiene
≥ ¥ eC
f (x, y) = C ) ln x Æ y Ø = C ) yØ =
xÆ

Si Æ = Ø se trata de hipérbolas. Si se obtienen las pendientes en puntos de una misma semi-recta desde
el origen:
@f Æ
@x (a, b) Æb
La pendiente de la curva de nivel en (a, b) es m 1 = ° @f
= ° Øa = °
Øa
@y (a, b) b
@f Æ
(∏a, ∏b) Æb
La pendiente de la curva de nivel en (∏a, ∏b) es m 2 = ° @@xf = ° ∏a =° = m1
Ø Øa
@y (∏a, ∏b) ∏b
Las funciones homotéticas se definen como aquellas para las que la propiedad del teorema 10 se
cumple. Pero esta definición es de poca utilidad, ya que con ella no es fácil ver cuando una función es
homotética, ni construir funciones homotéticas. Por eso se utiliza la siguiente definición equivalente.
Definición 17 Una función f (x, y) se dice que es homotética si es la composición de una función
g (x, y) homogénea, con una función real h(z) creciente, f (x, y) = h(g (x, y)).
Es el caso de la función del ejemplo 40, que es la composición de una función de producción
Cobb-Douglas g (x, y) = x Æ y Ø con la función creciente h(z) = ln(z). Por tanto, se trata de una función
homotética.
Ejemplo 41 Ahora se pueden definir funciones homotéticas sin más que hacer transformaciones (me-
diante funciones crecientes) de las funciones homogéneas. Si f (x, y) es una de las funciones del ejemplo
35 o una Cobb-Douglas, o una C E S, entonces las siguientes funciones son homotéticas (pero no son
homogéneas):
ln( f (x, y))
exp( f (x, y))
a f (x, y) + b, a > 0, b 6= 0
11. Derivadas parciales de orden superior. Matriz hessiana

@f
Dada una función de n variables, f : Rn ! R, cada derivada parcial es también una función
@x i
en dichas variables que puede ser derivable. Las derivadas de las derivadas parciales se denominan
parciales segundas, o derivadas parciales de segundo orden. Nótese que como la función f (x) tiene
n derivadas parciales (una por cada variable), y cada una de estas tiene a su vez n parciales, en total
hay n 2 parciales segundas. La notación que se utilizará es la siguiente:
µ ∂
@2 f @ @f
(x 1 , x 2 , . . . , x n ) = (x 1 , x 2 , . . . , x n )
@x i @x j @x i @x j
µ ∂
@2 f @ @f
(x 1 , x 2 , . . . , x n ) = (x 1 , x 2 , . . . , x n )
@x i2 @x i @x i
Las derivadas segundas que se hacen respecto a las dos mismas variables, pero en orden inverso
(primero con respecto a x i y luego con respecto a x j ; o primero con respecto a x j y a continuación con
respecto a x i ) se denominan parciales segundas cruzadas. Bajo hipótesis generales (cuando existen
y son continuas7 ) las parciales cruzadas coinciden; esto es,
@2 f @2 f
(x 1 , x 2 , . . . , x n ) = (x 1 , x 2 , . . . , x n )
@x i @x j @x j @x i
7 Este resultado es conocido como teorema de Schwartz.

Se denomina matriz hessiana a la matriz n £ n formada por todas las derivadas segundas de la
función, escritas de forma ordenada
0 1
@2 f @2 f @2 f
B ... C
B @x 12 @x 2 @x 1 @x n @x 1 C
B 2 2 2 C
B @ f @ f @ f C
B . . . C
B
H f (x 1 , x 2 , . . . , x n ) = B @x 1 @x 2 @x 2 2 @x n @x 2 C
C
B C
B ... ... ... ... C
B C
@ @2 f @2 f @2 f A
... 2
@x 1 @x n @x 2 @x n @x n n£n
Hay que señalar que, bajo las condiciones del teorema de Schwartz (parciales cruzadas iguales), esta
matriz es simétrica. Este hecho es relevante ya que se asociará una forma cuadrática a la matriz hes-
siana. En las funciones que se usarán en lo que sigue se cumplen estas condiciones, con lo que solo
se calculará una de las dos parciales cruzadas.
Ejemplo 42 Calcula la matriz hessiana de las siguientes funciones:
a) f (x, y) = x y ° 2 ln(x)
@f 2 @f
(x, y) = y ° (x, y) = x
@x x @y
@2 f 2 @2 f @2 f
2
(x, y) = 2 (x, y) = 1 (x, y) = 0
@x x @x@y @y 2
0 1
2
1 A
H f (x, y) = @ x 2
1 0
Si ahora se pide la hessiana en un punto del dominio, solo hay que sustituir el valor del punto que
se considere. Por ejemplo, la hessiana en el punto (1, 1) es
µ ∂
2 1
H f (1, 1) =
1 0
2x 2
b) f (x, y) = 5x y 2 °
y
@f 4x @f 2x 2
(x, y) = 5y 2 ° (x, y) = 10x y + 2
@x y @y y
@2 f 4 @2 f 4x @2 f 4x 2
2
(x, y) = ° (x, y) = 10y + 2 (x, y) = 10x °
@x y @x@y y @y 2 y3
0 1
4 4x
° 10y + 2
B y y C
H f (x, y) = B C
@ 4x 4x 2 A
10y + 2 10x ° 3
y y
La hessiana en el punto (°1, 2) es
µ ∂
°2 19
H f (°1, 2) =
19 °100 5

c) f (x, y, z) = x y + 2z
@f @f @f
(x, y, z) = y (x, y, z) = x (x, y, z) = 2
@x @y @z
@2 f @2 f @2 f
(x, y, z) = 0 (x, y, z) = 1 (x, y, z) = 0
@x 2 @x@y @x@z
@2 f @2 f @2 f
(x, y, z) = 0 (x, y, z) = 0 (x, y, z) = 0
@y 2 @y@z @2 z 2
0 1
0 1 0
@
H f (x, y, z) = 1 0 0 A
0 0 0
Esta hessiana es constante para cualquier punto (x, y, z).
12. Desarrollo de Taylor de orden 2

Si f (x 1 , x 2 , . . . , x n ) tiene derivadas parciales de primer y segundo orden continuas en una bola
abierta de centro el punto a = (a 1 , a 2 , . . . , a n ), entonces para puntos x próximos al punto a, x º a, se
cumple que
1
f (x) = f (a) + r f (a) · (x ° a) + (x ° a)0 H f (a)(x ° a) + E 2 (x; a)
2
donde E 2 (x; a) es una función de error tal que
E 2 (x; a)
lı́m =0
x!a kx ° ak2
De donde se deduce que existe r > 0 (posiblemente pequeño) tal que para x 2 B (a, r )
1
f (x) º f (a) + r f (a) · (x ° a) + (x ° a)0 H f (a)(x ° a)
2
con lo que se está aproximando la función por un polinomio de grado 2. Este polinomio se denomi-
na desarrollo de Taylor de f (x) de orden 2 (o polinomio de Taylor de orden 2). La aproximación de
segundo orden es, en general, mejor que la aproximación lineal.
Ejemplo 43 Calcula el polinomio de Taylor de orden 2 de la función f (x, y) = x ln(y) en un entorno del
punto (1, 1). Utiliza el resultado para calcular el valor aproximado de f (10 01, 00 999).
f (1, 1) = 0
µ ∂
x
r f (x, y) = ln(y), ) r f (1, 1) = (0, 1)
y
0 1
1
µ ∂
B 0 y C 0 1
H f (x, y) = B
@ 1 x
C
A ) H f (1, 1) =
° 2 1 °1
y y
µ ∂µ ∂
1 0 1 x °1 1
f (x, y) º 0+(0, 1)·(x°1, y°1)+ (x°1, y°1) = (y°1)+(x°1)(y°1)° (y°1)2
2 1 °1 y °1 2
1
f (10 01, 00 999) º °00 001 ° 00 00001 ° 00 000001 = °00 0010105
2
Nota 16 El valor con 13 decimales exactos es f (10 01, 00 999) = °00 0010105053369


Capítulo 3
CONVEXIDAD. OPTIMIZACIÓN LIBRE
1. Combinaciones lineales no negativas y convexas
2. Conjuntos convexos. Propiedades
3. Funciones cóncavas y convexas. Propiedades y generalizaciones
4. Caracterización de funciones cóncavas y convexas diferenciables
5. Máximos y mínimos locales y globales
6. Teorema de Weierstrass
7. Cálculo de óptimos globales mediante curvas de nivel
8. Condiciones necesarias y suficientes de óptimos locales
9. Programas convexos/cóncavos
Introducción
Los conceptos de conjuntos convexos y funciones cóncavas/convexas tienen un papel funda-
mental en el estudio de la existencia de óptimos (máximos/mínimos). Como ya se ha visto, si una
función cóncava de una variable tiene un punto crítico, en dicho punto alcanza un máximo. De igual
manera, una función convexa de una variable alcanza un mínimo en los puntos críticos. Se verá cómo
estas propiedades se siguen cumpliendo para más variables, y se analizarán propiedades adicionales
(teorema local-global, teorema de unicidad).
1. Combinaciones lineales no negativas y convexas

Definición 1 Dados dos puntos x, y 2 Rn se denomina:
combinación lineal de estos puntos a todo punto z 2 Rn que se puede expresar como
z = ∏x + µy ∏, µ 2 R cualesquiera
combinación lineal no negativa de estos puntos a todo punto z 2 Rn que se puede expresar como
z = ∏x + µy ∏, µ 2 R ∏ ∏ 0, µ ∏ 0
55
CAPÍTULO 3: CONVEXIDAD. OPTIMIZACIÓN LIBRE
combinación convexa de estos puntos a todo punto z 2 Rn que se puede expresar como
z = ∏x + µy ∏, µ 2 R ∏ ∏ 0, µ ∏ 0 ∏ + µ = 1
Nota 1 Se observa que las combinaciones convexas son un caso particular de las combinaciones no
negativas que, a su vez, son un tipo de combinación lineal. Las combinaciones convexas pueden expre-
sarse, de manera equivalente, de la forma
z = ∏x + (1 ° ∏)y ∏ 2 R 0 ∑ ∏ ∑ 1 esto es, ∏ 2 [0, 1]
Gráficamente, como se observa en la figura 3.1, las combinaciones convexas de dos puntos se corres-
ponden con los puntos del segmento que los une
£ § © ™
x, y = z 2 Rn : z = ∏x + (1 ° ∏)y; ∏ 2 [0, 1]
Cuando se hace ∏ = 0 en la expresión anterior, entonces z = y, con lo que se está en un extremo del
segmento; al hacer ∏ = 1 queda z = x con lo que se trata del otro extremo del segmento. Cuando ∏ = 00 5
el punto z es justo el punto medio del segmento.
Figura 3.1: Combinación convexa de dos puntos en R2
Ejemplo 1 Las combinaciones convexas de los puntos (2, 2) y (6, 4) (es decir, el segmento que une estos
puntos; véase la figura 3.1) son:
[(2, 2), (6, 4)] = {∏(2, 2) + (1 ° ∏)(6, 4); ∏ 2 [0, 1]} = {(6 ° 4∏, 4 ° 2∏); ∏ 2 [0, 1]}
Ejemplo 2 Las combinaciones convexas de los puntos (2, 2) y (5, 2) son:
[(2, 2), (5, 2)] = {∏(2, 2) + (1 ° ∏)(5, 2); ∏ 2 [0, 1]} = {(5 ° 3∏, 2); ∏ 2 [0, 1]}
Al ser la segunda componente siempre constante, se trata de un segmento horizontal.
Nota 2 Para obtener gráficamente las combinaciones no negativas de dos puntos, basta unir estos pun-
tos con el origen mediante rectas y quedarse con la zona determinada por estas semirrectas.

Figura 3.2: Combinación no negativa de dos puntos en R2
Ejemplo 3 Las combinaciones lineales no negativas de los puntos (2, 2) y (6, 4) son:
© ™ © ™
K [(2, 2), (6, 4)] = ∏(2, 2) + µ(6, 4); ∏ ∏ 0, µ ∏ 0 = (2∏ + 6µ, 2∏ + 4µ); ∏ ∏ 0, µ ∏ 0
Gráficamente, como se observa en la figura 3.2, se corresponde con lo que se denomina el cono deter-
minado por estos puntos.
Estos conceptos se pueden extender de manera inmediata para más de dos puntos.
Definición 2 Dados los puntos x 1 , x 2 , . . . , x k 2 Rn se denomina:
combinación lineal de estos puntos a todo punto z 2 Rn que se puede expresar como
z = ∏1 x 1 + ∏2 x 2 + . . . + ∏k x k ∏i 2 R cualesquiera 8i
combinación lineal no negativa de estos puntos a todo punto z 2 Rn que se puede expresar como
z = ∏1 x 1 + ∏2 x 2 + . . . + ∏k x k ∏i 2 R ∏i ∏ 0 8i
combinación convexa de estos puntos a todo punto z 2 Rn que se puede expresar como
k
X
z = ∏1 x 1 + ∏2 x 2 + . . . + ∏k x k ∏i 2 R ∏i ∏ 0 8i , ∏i = 1
i =1
Ejemplo 4 La combinación convexa de los puntos (1, 3), (4, 4) y (5, 2) se corresponde con los puntos del
triángulo que aparece en la figura 3.3. En general, las combinaciones convexas de k puntos serán un
politopo (si está en el plano, se tratará de un polígono). La figura 3.4 muestra un poliedro (cubo) en R3
que resulta de la combinación convexa de ocho puntos.

Figura 3.3: Combinación convexa de tres puntos en R2
Figura 3.4: Combinación convexa de ocho puntos en R3

2. Conjuntos convexos. Propiedades

Definición 3 Un subconjunto S µ Rn es convexo si para cualquier par de puntos del conjunto el seg-
mento que los une está incluido en el conjunto. Formalmente,
S µ Rn es convexo si 8x, y 2 S, ∏x + (1 ° ∏)y 2 S para cualquier ∏ 2 [0, 1]
La idea geométrica es que se puede ir en línea recta entre dos puntos cualesquiera del conjunto,
sin salirse de dicho conjunto.
Ejemplo 5 Obsérvese gráficamente si los subconjuntos de R2 en las figuras 3.5 y 3.6 son convexos o no.
Figura 3.5: a) Conjunto no convexo b) Conjunto convexo
Figura 3.6: a) Conjunto no convexo b) Conjunto convexo

© ™
Ejemplo 6 ¿Es convexo el conjunto S = (x, y) 2 R2 : x ° 2y ∑ 1 ? Su imagen gráfica es la que aparece
en la figura 3.7 en la que se observa que efectivamente se trata de un conjunto convexo. Para verlo
formalmente (utilizando la definición) se consideran dos puntos (x, y), (x 0 , y 0 ) en el conjunto S y un
escalar ∏ 2 [0, 1]; esto es,
x ° 2y ∑ 1 x 0 ° 2y 0 ∑ 1 ∏ 2 [0, 1]
Entonces,
° ¢
∏(x, y) + (1 ° ∏)(x 0 , y 0 ) = ∏x + (1 ° ∏)x 0 , ∏y + (1 ° ∏)y 0 = (x 00 , y 00 )
que debe averiguarse si pertenece al conjunto S (es decir, si cumple la condición que define al conjunto)
° ¢ ° ¢ ° ¢
x 00 ° 2y 00 = ∏x + (1 ° ∏)x 0 ° 2 ∏y + (1 ° ∏)y 0 = ∏ x ° 2y + (1 ° ∏) x 0 ° 2y 0 ∑ ∏ · 1 + (1 ° ∏) · 1 = 1
Luego cumple la condición y el conjunto es convexo.
© ™
Figura 3.7: S = (x, y) 2 R2 : x ° 2y ∑ 1 es un conjunto convexo
Propiedades
1. La intersección de conjuntos convexos es un conjunto convexo.
2. La unión de conjuntos convexos en general no es un conjunto convexo.

© ™ © ™
Ejemplo 7 Dados los conjuntos S = (x, y) 2 R2 : x ° 2y ∑ 1 y T = (x, y) 2 R2 : x ° y ∏ 0 se observa que
S \ T es un conjunto convexo, mientras que S [ T no lo es (véase la figura 3.8).
Definición 4 De forma intuitiva, un punto de un conjunto convexo es un extremo (o vértice) de dicho

conjunto si no se encuentra en el interior de un segmento que une dos puntos del conjunto. Formal-
mente, dado un conjunto convexo S, un punto v 2 S se dice que es punto extremo o vértice si no existen
x, y 2 S, x 6= y, ∏ 2 (0, 1) de modo que v = ∏x + (1 ° ∏)y.

Figura 3.8: S \ T conjunto convexo; S [ T no convexo
Ejemplo 8 La figura 3.9 muestra distintos casos de puntos extremos en conjuntos convexos.
Figura 3.9: Todos los puntos de la circunferencia son puntos extremos en el círculo. Los puntos ex-
tremos del pentágono son los vértices, denotados por A, B, C, D, E
Ejemplo 9 Si un subconjunto de R2 está definido por intersección de semiplanos, para calcular los
puntos extremos se calculan los puntos de corte de las rectas y se tienen los candidatos que hay que ver
© ™
si están en el conjunto. Por ejemplo, S = (x, y) 2 R2 : x + 2y ∑ 4, 2x + y ∑ 5, x ∏ 0, y ∏ 0 . Tomando
las rectas de dos en dos, se tiene:
x + 2y = 4, 2x + y = 5, que se cortan en el punto A = (2, 1).
x + 2y = 4, x = 0, que se cortan en el punto B = (0, 2).
x + 2y = 4, y = 0, que se cortan en el punto (4, 0) que no está en el conjunto S.

x = 0, y = 0, que se cortan en el punto C = (0, 0).
x = 0, 2x + y = 5, que se cortan en el punto (0, 5) que no está en el conjunto S.
y = 0, 2x + y = 5, que se cortan en el punto D = (20 5, 0).
La figura 3.10 muestra el conjunto y los puntos extremos.
Figura 3.10: Los vértices en el conjunto S del ejemplo 9
3. Funciones cóncavas y convexas. Propiedades y generalizaciones

Definición 5 Sea S µ Rn un conjunto convexo. Una función f : S ! R se dice que es:
convexa si 8x, y 2 S, 8∏ 2 [0, 1] f (∏x + (1 ° ∏)y) ∑ ∏ f (x) + (1 ° ∏) f (y)
cóncava si 8x, y 2 S, 8∏ 2 [0, 1] f (∏x + (1 ° ∏)y) ∏ ∏ f (x) + (1 ° ∏) f (y)
Nota 3 a) Las funciones lineales cumplen f (∏x + (1 ° ∏)y) = ∏ f (x) + (1 ° ∏) f (y), luego son cóncavas y
convexas a la vez.
b) En general, como ocurre con las funciones de una variable, las funciones pueden tener zonas en las
que son convexas y otras en las que son cóncavas.
c) Es importante señalar que existen funciones cóncavas y funciones convexas. Pero no ocurre lo mismo
con los conjuntos: no existe el concepto de conjunto cóncavo. Los conjuntos serán convexos, o no
convexos.
estrictamente convexa si 8x, y 2 S, x 6= y 8∏ 2 (0, 1), f (∏x + (1 ° ∏)y) < ∏ f (x) + (1 ° ∏) f (y)
estrictamente cóncava si 8x, y 2 S, x 6= y 8∏ 2 (0, 1) f (∏x + (1 ° ∏)y) > ∏ f (x) + (1 ° ∏) f (y)
La idea es que la gráfica de la función f no contenga tramos lineales.

Figura 3.11: Función convexa
Figura 3.12: Función cóncava

Propiedades de las funciones cóncavas

Teorema 1 Sea S µ Rn un conjunto convexo y consideremos dos funciones f , g : S ! R. Se cumple que:
1. Si la función f es cóncava, entonces ° f es convexa.
2. Si la función f es cóncava y Æ 2 R, Æ > 0, entonces Æ f es cóncava.
3. Si las funciones f , g son cóncavas, entonces f + g es cóncava.
4. Si la función f es cóncava y h(t ) es una función de una variable cóncava y creciente, entonces la
función '(x) = h( f (x)) es cóncava.
5. Si la función f es cóncava y h(t ) es una función de una variable convexa y decreciente, entonces
la función '(x) = h( f (x)) es convexa.
Ejemplo 10 Las últimas propiedades son útiles porque permiten descomponer el estudio en funcio-
p
nes más sencillas. Por ejemplo, la función '(x, y) = x + y, se puede poner como la composición de
p
f (x, y) = x + y que es lineal, por tanto cóncava (y también convexa), y la función h(t ) = t que es una
función real cóncava y creciente en su dominio: se puede ver que h 0 (t ) > 0 (creciente) y que h 00 (t ) < 0
p
(cóncava). Así, aplicando la propiedad 4, la función '(x, y) = x + y es cóncava.
Propiedades de las funciones convexas

Teorema 2 Sea S µ Rn un conjunto convexo y consideremos dos funciones f , g : S ! R. Se cumple que:
1. Si la función f es convexa, entonces ° f es cóncava.
2. Si la función f es convexa y Æ 2 R, Æ > 0, entonces Æ f es convexa.
3. Si las funciones f , g son convexas, entonces f + g es convexa.
4. Si la función f es convexa y h(t ) es una función de una variable convexa y creciente, entonces la
función '(x) = h( f (x)) es convexa.
5. Si la función f es convexa y h(t ) es una función de una variable cóncava y decreciente, entonces
la función '(x) = h( f (x)) es cóncava.
Ejemplo 11 Como antes, las últimas propiedades son útiles porque permiten descomponer el estudio
en funciones más sencillas. Por ejemplo, la función '(x, y) = e 2x°3y se puede poner como:
'(x, y) = h( f (x, y)) donde h(t ) = e t , f (x, y) = 2x ° 3y
La función f (x, y) = 2x ° 3y es lineal y, por tanto, es convexa (también es cóncava). Por otro lado,
h(t ) = e t ; h 0 (t ) = e t > 0 ) creciente; h 00 (t ) = e t > 0 ) convexa
Luego, aplicando la propiedad 4, '(x, y) = e 2x°3y es una función convexa.

3.1. Hipografo, epigrafo y concavidad/convexidad de funciones

Definición 7 Sea S µ Rn un conjunto convexo. Dada una función f : S ! R se denomina:
hipografo de f al conjunto (parte inferior de la gráfica)

© ™
Hip( f ) = (x, y) 2 S £ R : y ∑ f (x)
epigrafo de f al conjunto (parte superior de la gráfica)

© ™
Epi( f ) = (x, y) 2 S £ R : y ∏ f (x)
Figura 3.13: Hipografo y Epigrafo de una función de una variable
El siguiente resultado relaciona la concavidad/convexidad de una función con la convexidad, res-

pectivamente, del hipografo y el epigrafo de la función.
Teorema 3 Sea S µ Rn un conjunto convexo. Una función f : S ! R es:
I) cóncava si, y solo si, Hip( f ) es un conjunto convexo.
II ) convexa si, y solo si, Epi( f ) es un conjunto convexo.
Demostración Se verá solo el primer apartado, ya que el otro es totalmente análogo. Para ello, en
primer lugar se supone que la función es cóncava y se quiere demostrar que el conjunto Hip( f ) es un
conjunto convexo. Sean (x, y), (x 0 , y 0 ) 2 Hip( f ) y sea ∏ 2 [0, 1]. Hay que probar que
° ¢
∏(x, y) + (1 ° ∏)(x 0 , y 0 ) = ∏x + (1 ° ∏)x 0 , ∏y + (1 ° ∏y 0 2 Hip( f ),
es decir,
° ¢
f ∏x + (1 ° ∏)x 0 ∏ ∏y + (1 ° ∏)y 0 .
Como la función f es cóncava, y los puntos están en Hip( f ) se cumple que
° ¢
f ∏x + (1 ° ∏)x 0 ∏ ∏ f (x) + (1 ° ∏) f (x 0 ) f (x) ∏ y f (x 0 ) ∏ y 0
entonces, al ser ∏ ∏ 0, 1 ° ∏ ∏ 0, se tiene

° ¢
f ∏x + (1 ° ∏)x 0 ∏ ∏ f (x) + (1 ° ∏) f (x 0 ) ∏ ∏y + (1 ° ∏)y 0

Hay que probar ahora que si Hip( f ) es un conjunto convexo, entonces la función es cóncava.
° ¢ ° ¢
Sean x, x 0 2 S, ∏ 2 [0, 1]. Entonces, los puntos x, f (x) , x 0 , f (x 0 ) están en Hip( f ). Al ser convexo,
° ¢ ° 0 ¢
∏ x, f (x) + (1 ° ∏) x , f (x 0 ) 2 Hip( f ), lo que significa
° ¢ ° ¢
∏x + (1 ° ∏)x 0 , ∏ f (x) + (1 ° ∏) f (x 0 ) 2 Hip( f ) ) ∏ f (x) + (1 ° ∏) f (x 0 ) ∑ f ∏x + (1 ° ∏)x 0
luego la función es cóncava. ⇤
Figura 3.14: Hipografo de una función cóncava y Epigrafo de una función convexa
Ejercicio 1 Demuestra el segundo apartado del teorema 3.
Nota 4 El resultado anterior es muy útil para demostrar la convexidad de conjuntos, siempre que es-
tos se puedan poner como hipografos o epigrafos de funciones cóncavas o convexas, respectivamente (o
como intersección de conjuntos de esta forma, aplicando después la propiedad que dice que la inter-
sección de conjuntos convexos es un conjunto convexo).
© ™
Ejemplo 12 Prueba que el conjunto S = (x, y) 2 R2 : y ∏ x 2 es convexo.
Este conjunto es el epigrafo de la función f (x) = x 2 , que es convexa (es una función de una variable
real cuya segunda derivada es positiva, f 00 (x) = 2 > 0). Por tanto, aplicando el teorema 3 se trata de un
conjunto convexo.
Nota 5 En el capítulo anterior se vio el concepto de conjunto de contorno (superior e inferior) que no
hay que confundir con los conceptos de epigrafo e hipografo de una función. Si la función es de dos
variables, f (x, y), los conjuntos de contorno superior e inferior son subconjuntos de R2 , mientras que
el epigrafo y el hipografo son subconjuntos de R3
© ™ © ™
UC ( f ) = (x, y) 2 R2 : f (x, y) ∏ C ; LC ( f ) = (x, y) 2 R2 : f (x, y) ∑ C
© ™ © ™
Epi( f ) = (x, y, z) 2 R3 : z ∏ f (x, y) ; Hip( f ) = (x, y, z) 2 R3 : z ∑ f (x, y)
La diferencia entre estos conceptos se ve muy clara con funciones de una variable que se pueden repre-
sentar gráficamente. El siguiente ejemplo ilustra este hecho.

Ejemplo 13 Dada la función f (x) = x 3 °x, el conjunto de contorno superior de nivel C = 0 serían todos
los puntos x 2 R de manera que f (x) ∏ 0 y con la desigualdad al contrario para el conjunto de contorno
inferior. Si se observa la gráfica de esta función (figura 3.15), resulta claro que
U0 ( f ) = [°1, 0] [ [1, +1) L 0 ( f ) = (°1, °1] [ [0, 1]
Mientras que el epigrafo son todos los puntos de R2 que están por encima de la gráfica, y el hipografo
los que están por debajo.
Figura 3.15: Gráfica de la función f (x) = x 3 ° x
En el siguiente resultado se ve la relación entre concavidad/convexidad de una función y la con-

vexidad de los conjuntos de contorno (superior/inferior, respectivamente).
Teorema 4 Sea S µ Rn un conjunto convexo. Si una función f : S ! R es:
I) cóncava, entonces para todo nivel C , el conjunto de contorno superior de nivel C , UC ( f ) es un

conjunto convexo.
II ) convexa, entonces para todo nivel C , el conjunto de contorno inferior de nivel C , LC ( f ) es un con-
junto convexo.
Demostración Las dos partes son análogas y se verá solo la segunda. Hay que probar que, para todo
© ™
C , el conjunto LC = x 2 Rn : f (x) ∑ C es convexo. Si se consideran dos puntos x, x 0 2 LC y un escalar
∏ 2 [0, 1], debe cumplirse que z = ∏x + (1 ° ∏)x 0 2 LC . Es decir que f (z) ∑ C .
Si la función es convexa, se cumple
° ¢
f ∏x + (1 ° ∏)x 0 ∑ ∏ f (x) + (1 ° ∏) f (x 0 ).
Además, como los puntos están en el conjunto de contorno inferior, f (x) ∑ C y f (x 0 ) ∑ C . Por tanto,
° ¢
f (z) = f ∏x + (1 ° ∏)x 0 ∑ ∏ f (x) + (1 ° ∏) f (x 0 ) ∑ ∏C + (1 ° ∏)C = C .

Ejercicio 2 Demuestra el primer apartado del teorema 4.
El siguiente ejemplo muestra que el recíproco de la propiedad anterior no es cierto. Es decir, pue-
de ser que los conjuntos de contorno (superior y/o inferior) sean conjuntos convexos, pero la función
no sea ni cóncava, ni convexa.
Ejemplo 14 Sea la función f (x) = x 3 . Entonces, el conjunto de contorno superior de nivel C serían los
£p3
¢ ° p
3
§
números reales del intervalo C , +1 , mientras que el inferior sería °1, C . Ambos son conjuntos
convexos, pero la función no es ni cóncava, ni convexa en toda la recta real, S = R. Nótese que ni el
epigrafo, ni el hipografo son conjuntos convexos.
Figura 3.16: Gráfica de la función f (x) = x 3
3.2. Funciones cuasi-cóncavas y cuasi-convexas

Se definen ahora los conceptos de cuasi-convexidad y cuasi-concavidad de funciones en base a
la convexidad de los conjuntos de contorno.

© ™
cuasi-cóncava si para todo C el conjunto UC ( f ) = x 2 Rn : f (x) ∏ C es convexo.
© ™
cuasi-convexa si para todo C el conjunto L C ( f ) = x 2 Rn : f (x) ∑ C es convexo.
Ahora, el teorema 4 se puede enunciar como:
Toda función cóncava es cuasi-cóncava.
Toda función convexa es cuasi-convexa.
Pero como ya se ha visto, el recíproco no es cierto. La función de distribución normal N (µ, æ) (cuya
gráfica se denomina coloquialmente Campana de Gauss, ver figura 3.17), muy utilizada en Estadística
y Probabilidad, es otro ejemplo de función cuasi-cóncava que no es cóncava.
Una definición alternativa que es más útil para comprobar en la práctica la cuasi-concavidad o
cuasi-convexidad de funciones es la siguiente. Esta definición también permite introducir la cuasi-
concavidad/cuasi-convexidad estricta.

Figura 3.17: Campana de Gauss: gráfica de la distribución normal N (0; 4)
cuasi-cóncava si para todo x, x 0 2 S y para todo escalar ∏ 2 [0, 1],

° ¢ © ™
f ∏x + (1 ° ∏)x 0 ∏ mı́n f (x), f (x 0 ) .
cuasi-convexa si para todo x, x 0 2 S y para todo escalar ∏ 2 [0, 1],

° ¢ © ™
f ∏x + (1 ° ∏)x 0 ∑ máx f (x), f (x 0 ) .
Como con las funciones cóncavas y convexas, si las desigualdades son estrictas, entonces la fun-
ción se dice que es estrictamente cuasi-cóncava o estrictamente cuasi-convexa.
estrictamente cuasi-cóncava si para todo x, x 0 2 S, x 6= x 0 , y para todo escalar ∏ 2 (0, 1),

° ¢ © ™
f ∏x + (1 ° ∏)x 0 > mı́n f (x), f (x 0 ) .
estrictamente cuasi-convexa si para todo x, x 0 2 S, x 6= x 0 , y para todo escalar ∏ 2 (0, 1),

° ¢ © ™
f ∏x + (1 ° ∏)x 0 < máx f (x), f (x 0 ) .
La Campana de Gauss (figura 3.17) es la gráfica de una función estrictamente cuasi-cóncava. Las
funciones cuasi-cóncavas/cuasi-convexas tienen propiedades parecidas a las de las funciones cón-
cavas/convexas.
Teorema 5 Sea S µ Rn un conjunto convexo y sea una función f : S ! R. Entonces,
1. Si la función f es cuasi-cóncava y h(t ) es una función de una variable estrictamente creciente,

entonces la función '(x) = h( f (x)) es cuasi-cóncava.
2. Si la función f es cuasi-cóncava y h(t ) es una función de una variable estrictamente decreciente,

entonces la función '(x) = h( f (x)) es cuasi-convexa.

3. Si la función f es cuasi-convexa y h(t ) es una función de una variable estrictamente creciente,

entonces la función '(x) = h( f (x)) es cuasi-convexa.
4. Si la función f es cuasi-convexa y h(t ) es una función de una variable estrictamente decreciente,

entonces la función '(x) = h( f (x)) es cuasi-cóncava.
Ejemplo 15 La función f (x) = °2x 2 es cuasi-cóncava (por ser cóncava, ya que su segunda derivada es
siempre negativa, f 00 (x) = °4) y la función h(t ) = e t es creciente. Por tanto, la función compuesta '(x) =
2 2
h( f (x)) = e °2x es cuasi-cóncava. La segunda derivada de esta función, '00 (x) = (°4 + 16x 2 )e °2x , es
° ¢ ° ¢ ° ¢
positiva en el conjunto °1, ° 12 [ 12 , +1 , y negativa en el intervalo ° 12 , 12 , luego no es cóncava en
R. Su gráfica es similar a la campana de Gauss.
4. Caracterización de funciones cóncavas y convexas diferenciables

Si se observan las gráficas de funciones cóncavas y convexas diferenciables en el caso de una o
dos variables, la recta o plano tangente siempre queda por encima de la gráfica de la función (en caso
de ser cóncava) o siempre queda por debajo (en caso de ser convexa). La figura 3.18 muestra el caso
de una variable. En este caso, la ecuación de la recta tangente a la gráfica de una función en un punto
(a, f (a)) cualquiera es y = f (a) + f 0 (a)(x ° a) con lo que se tiene el siguiente resultado:
si f (x) es convexa, entonces f (x) ∏ f (a) + f 0 (a)(x ° a)
si f (x) es cóncava, entonces f (x) ∑ f (a) + f 0 (a)(x ° a)
Figura 3.18: Recta tangente a) función cóncava b) función convexa
Para funciones de dos variables f (x, y), como muestra la figura 3.19, la propiedad es análoga con
respecto al plano tangente a la gráfica de dicha función en un punto cualquiera (a, b, f (a, b)), cuya
ecuación es z = f (a, b) + r f (a, b) · (x ° a, y ° b). Se tiene que:
si f (x, y) es convexa, entonces f (x, y) ∏ f (a, b) + r f (a, b) · (x ° a, y ° b)
si f (x, y) es cóncava, entonces f (x, y) ∑ f (a, b) + r f (a, b) · (x ° a, y ° b)
El siguiente teorema recoge esta propiedad para el caso general de funciones con n variables.

Figura 3.19: Plano tangente a) función cóncava b) función convexa
Teorema 6 Sea S µ Rn un conjunto convexo. Una función diferenciable f : S ! R es:
I) cóncava si, y solo si, f (x) ∑ f (a) + r f (a) · (x ° a) 8x, a 2 S.
II ) convexa si, y solo si, f (x) ∏ f (a) + r f (a) · (x ° a) 8x, a 2 S.
III ) estrictamente cóncava si, y solo si, f (x) < f (a) + r f (a) · (x ° a) 8x, a 2 S, x 6= a.
IV ) estrictamente convexa si, y solo si, f (x) > f (a) + r f (a) · (x ° a) 8x, a 2 S, x 6= a.
Aunque en teoría el resultado anterior puede servir para identificar gráficamente funciones cón-
cavas/convexas, al no poder dibujar funciones de varias variables en la práctica no posee mucha
utilidad. Usando la fórmula de Taylor de orden 2,
1
f (x) = f (a) + r f (a) · (x ° a) + (x ° a)0 H f (z)(x ° a) z 2 B (a, ≤)
2
se deduce que para saber si se cumplen las condiciones del teorema 6 basta con identificar el signo
de (x ° a)0 H f (z)(x ° a), que es una forma cuadrática de matriz H f (z). De este modo se deduce el
siguiente teorema que es el que se utiliza en la práctica para saber si una función de varias variables
es cóncava o convexa.
Teorema 7 Sea S µ Rn un conjunto convexo. Una función f : S ! R, que tiene parciales primeras y
segundas continuas, es:
I) cóncava si, y solo si, para todo x 2 S, H f (x) tiene asociada una forma cuadrática semidefinida
negativa o definida negativa.
II ) convexa si, y solo si, para todo x 2 S, H f (x) tiene asociada una forma cuadrática semidefinida
positiva o definida positiva.
III ) estrictamente cóncava si, y solo si, para todo x 2 S, H f (x) tiene asociada una forma cuadrática
definida negativa.
IV ) estrictamente convexa si, y solo si, para todo x 2 S, H f (x) tiene asociada una forma cuadrática
definida positiva.

Nota 6 Estas condiciones son (básicamente) las mismas que se usan para identificar funciones cónca-
vas/convexas de una variable: cóncava cuando la segunda derivada es menor o igual a cero (definida
negativa); convexa cuando la segunda derivada es mayor o igual a cero (definida positiva).
Ejemplo 16 Analiza la concavidad/convexidad de las siguientes funciones.
a) f (x, y) = 2x 2 + 2x y + 5y 2
@f @f @2 f @2 f @2 f
= 4x + 2y = 2x + 10y 2
=4 2
= 10 =2
@x @y @x @y @x@y
µ ∂
4 2
H f (x, y) =
2 10
La forma cuadrática es definida positiva ya que D 1 = 4 > 0, D 2 = 36 > 0.
Por tanto, la función es estrictamente convexa.
b) f (x, y, z) = °2x 2 + 2x y ° 5y 2 ° xz ° z 2
@f @f @f
= °4x + 2y ° z = 2x ° 10y = °x ° 2z
@x @y @z
@2 f @2 f @2 f @2 f @2 f @2 f
= °4 = °10 = °2 = 2 = °1 =0
@x 2 @y 2 @z 2 @x@y @x@z @y@z
0 1
°4 2 °1
H f (x, y, z) = @ 2 °10 0 A
°1 0 °2
D 1 = °4 < 0, D 2 = 36 > 0, D 3 = °62 < 0, luego la forma cuadrática es definida negativa.
Por tanto, la función es estrictamente cóncava.
c) f (x, y) = x 4 + 2x 2 y 2
@f @f @2 f @2 f @2 f
= 4x 3 + 4x y 2 = 4x 2 y = 12x 2 + 4y 2 = 4x 2 = 8x y
@x @y @x 2 @y 2 @x@y
µ ∂
12x 2 + 4y 2 8x y
H f (x, y) =
8x y 4x 2
D 1 = 12x 2 + 4y 2 ∏ 0, D 2 = 48x 4 ° 48x 2 y 2 = 48x 2 (x 2 ° y 2 ) que a veces es positivo (por ejemplo,
en el punto (2, 1)) y a veces negativo (por ejemplo, en el punto (1, 2)). La forma cuadrática es
entonces indefinida.
Por tanto, la función no es, en general, ni cóncava, ni convexa.
De igual manera que las funciones cóncavas/convexas se pueden identificar fácilmente con la
hessiana de la función, hay también un método similar para las funciones cuasi-cóncavas/cuasi-
convexas.
Teorema 8 Dada una función con dos variables f (x, y) que tiene parciales segundas continuas se con-
sideran los determinantes
0 1
@f @f
B 0
0 1 B @x @y C C
@f B C
B 0 C B C
B @x C B @ f @2
f @ 2
f C
B C
Q 1 = det B
B
C
C Q 2 = det B 2 C
@ @f B @x @x @x@y C
@2 f A B C
B C
@x @x 2 B C
@ @f @2 f @2 f A
@y @x@y @y 2

Entonces:
1. Si Q 1 < 0, Q 2 > 0, la función es estrictamente cuasi-cóncava (luego es cuasi-cóncava)
2. Si Q 1 < 0, Q 2 < 0, la función es estrictamente cuasi-convexa (luego es cuasi-convexa)
Nota 7 Estas condiciones son solo suficientes. Si no se cumplen, hay que usar la definición para com-
probar si una función es cuasi-cóncava o cuasi-convexa.
Ejemplo 17 Como aplicación del resultado anterior, se puede ver que una función de producción de ti-
po Cobb-Douglas es siempre cuasi-cóncava (de hecho, con rendimientos constantes o decrecientes a es-
cala es cóncava, mientras que si tiene rendimientos crecientes a escala es simplemente cuasi-cóncava).
Las derivadas parciales primera y segunda de una función Cobb-Douglas f (x, y) = x Æ y Ø , Æ, Ø > 0, son :
@f @f
= Æx Æ°1 y Ø = Øx Æ y Ø°1
@x @y
@2 f @2 f @2 f
= Æ(Æ ° 1)x Æ°2 y Ø = Ø(Ø ° 1)x Æ y Ø°2 = ÆØx Æ°1 y Ø°1
@x 2 @y 2 @x@y
Entonces, la matriz hessiana es
0 1
@2 f @2 f
B C 0 Æ(Æ ° 1)x Æ°2 y Ø ÆØx Æ°1 y Ø°1
1
B @x 2 @x@y C
B C @ A
H f (x, y) = B C=
B C
@ @2 f 2
@ f A ÆØx Æ°1 y Ø°1 Æ Ø°2
Ø(Ø ° 1)x y
@x@y @y 2
a) Si hay rendimientos constantes o decrecientes (Æ + Ø ∑ 1),
D 1 = Æ(Æ ° 1)x Æ°2 y Ø < 0 D 2 = ÆØ(1 ° Æ ° Ø)x 2Æ°2 y 2Ø°2 ∏ 0
y la función es cóncava (y, por tanto, cuasi-cóncava).
b) Si hay rendimientos crecientes (Æ + Ø > 1),
Q 1 = °Æ2 x 2Æ°2 y 2Ø < 0; Q 2 = ÆØx 3Æ°2 y 3Ø°2 (Æ + Ø) > 0
y, por tanto, es estrictamente cuasi-cóncava.
5. Máximos y mínimos locales y globales

Definición 11 Dada una función f : S ! R, donde S µ Rn , se dice que f en un punto a 2 S alcanza un:
máximo global si f (a) ∏ f (x) 8x 2 S.
mínimo global si f (a) ∑ f (x) 8x 2 S.
máximo local si f (a) ∏ f (x) 8x 2 B (a, ") µ S.
mínimo local si f (a) ∑ f (x) 8x 2 B (a, ") µ S.
En general se usa la palabra óptimo para referirse tanto a máximo como a mínimo. Optimizar
una función es buscar sus máximos y mínimos (locales o globales). Las figuras siguientes 3.20 y 3.21
muestran ejemplos de funciones con múltiples máximos y mínimos (locales y globales), la primera
con una función de una variable, y la segunda con una función de dos variables.

x sen(x)
Figura 3.20: Máximos y mínimos de la función de una variable f (x) =
5
Figura 3.21: Función de dos variables con múltiples máximos y mínimos, f (x, y) = sen(x °y)°2 cos(x)

6. Teorema de Weierstrass
Este teorema (como el de funciones de una variable) da condiciones que garantizan la existencia
de óptimos globales, aunque no da información sobre cómo calcularlos, o de dónde están situados.
Teorema 9 (Tª de Weierstrass) Sea f : S ! R, donde S µ Rn . Si f es continua en S, y el conjunto S es

compacto (cerrado y acotado), entonces f alcanza máximo global y mínimo global en S.
Nota 8 No se puede decir nada si la función no es continua, o si el conjunto no es compacto: podría

existir óptimo global, o podría no existir.
7. Cálculo de óptimos globales mediante curvas de nivel

Un modo de calcular óptimos con funciones de dos variables consiste en dibujar las curvas de
nivel de la función: la curva de menor nivel (si existe) proporcionará el mínimo global, mientras que
la curva de mayor nivel (si existe) indicará el máximo global de la función.
Ejemplo 18 Calcula los máximos y mínimos globales de la función f (x, y) = x 2 + y 2 en el conjunto

© ™
compacto S = (x, y) 2 R2 : °3 ∑ x ∑ 3, °3 ∑ y ∑ 3 .
Figura 3.22: Curvas de nivel y óptimos en el conjunto compacto del ejemplo 18
La existencia de máximo y mínimo global está garantizada por el teorema de Weierstrass, ya que la
función es polinómica (luego es continua) y el conjunto es compacto: cerrado (contiene a toda su fron-
tera) y acotado (está contenido en la bola B ((0, 0), 10)). El mínimo global se alcanza en el punto (0, 0) y
vale f mı́n = 0. El máximo global se alcanza en los puntos (3, 3), (3, °3), (°3, 3), (°3, °3) y vale f máx = 18.
Ejemplo 19 Calcula los máximos y mínimos globales de la función f (x, y) = x + y en el conjunto com-
© ™
pacto S = (x, y) 2 R2 : x 2 + y 2 ∑ 4 .
p p
Como se observa en la figura 3.23 el pmáximo se alcanza en el punto ( 2, p2) y el
pvalor máximo de la
función en el conjunto S es f máx = 2 2. El mínimo
p se alcanza en el punto (° 2, ° 2) y el valor mínimo
de la función en el conjunto S es f mı́n = °2 2.
El siguiente resultado es de mucha utilidad cuando se utilizan las curvas de nivel para obtener los
óptimos globales.

Figura 3.23: Curvas de nivel y óptimos en el conjunto compacto del ejemplo 19
Teorema 10 Si la función f : S ! R, donde S µ Rn , se puede expresar en la forma f (x) = h(g (x)),

donde h : R ! R es una función de una variable creciente, entonces f (x) y g (x) alcanzan los máximos y
mínimos globales en los mismos puntos (aunque los valores óptimos en general serán distintos).
2 2
Ejemplo 20 Calcula los máximos y mínimos globales de la función f (x, y) = e x +y en el conjunto
© ™
compacto S = (x, y) 2 R2 : °3 ∑ x ∑ 3, °3 ∑ y ∑ 3 .
Es posible escribir f (x, y) como la composición de las funciones h(t ) = e t , g (x, y) = x 2 + y 2 . Siendo
h(t ) creciente, las funciones f (x, y), g (x, y) alcanzan los óptimos en los mismos puntos. A partir del
ejemplo 18 el mínimo global se alcanza en el punto (0, 0) y vale f mı́n = e 0 = 1. El máximo global se
alcanza en los puntos (3, 3), (3, °3), (°3, 3), (°3, °3) y vale f máx = e 18 .
8. Condiciones necesarias y suficientes de óptimos locales

8.1. Condiciones necesarias
Una condición necesaria para que una función (derivable) de una variable alcance en un punto a
un máximo o un mínimo local es que la derivada en dicho punto se anule: f 0 (a) = 0. Este resultado se
sigue cumpliendo para cualquier número de variables, sin más que cambiar derivada por gradiente.
Teorema 11 (Condición necesaria de óptimo local) Sea f : S ! R una función diferenciable en un

conjunto S µ Rn abierto. Si f alcanza un máximo o mínimo local en un punto a 2 S, entonces se cumple
que r f (a) = 0, esto es, todas las derivadas parciales se anulan en dicho punto.
El razonamiento sería como en funciones de una variable: en un punto en el que la función al-
canza un óptimo local el plano tangente (en general, hiperplano tangente) debe ser horizontal, con lo
que su ecuación es z = C . Como la ecuación general del plano tangente a la gráfica de una función de
dos variables es z = f (a, b) + r f (a, b) · (x ° a, y ° b), entonces el vector r f (a) debe ser nulo.
Definición 12 Sea f : S ! R una función diferenciable en un conjunto S µ Rn abierto. Se denomina

punto crítico, o punto estacionario, de f a todos los puntos que anulan su gradiente: esto es, los puntos
a 2 S tales que r f (a) = 0.

Ejemplo 21 Calcula los puntos críticos o estacionarios de las siguientes funciones:
a) f (x, y) = x 2 + 3x y + y
@f @f
= 2x + 3y = 3x + 1
@x @y
1 2
2x + 3y = 0 3x + 1 = 0 ) x = ° y=
3 9
µ ∂
1 2
Solo hay un punto crítico (x § , y § ) = ° ,
3 9
b) f (x, y, z) = 5x 2 + x y + y + z 2
@f @f @f
= 10x + y = x +1 = 2z
@x @y @z
10x + y = 0 x + 1 = 0 2z = 0 ) x = °1 y = 10 z = 0
Hay un único punto crítico (x § , y § , z § ) = (°1, 10, 0)
c) f (x, y) = x ln(y)
@f @f x
= ln(y) =
@x @y y
x
ln(y) = 0 =0 ) x =0 y =1
y
Solo hay un punto crítico (x § , y § ) = (0, 1)
d) f (x, y) = (x ° 1)2 + (y + 2)2
@f @f
= 2(x ° 1) = 2(y + 2)
@x @y
2(x ° 1) = 0 2(y + 2) = 0 ) x = 1 y = °2
Hay un único punto crítico (x § , y § ) = (1, °2)
e) f (x, y) = °x 2 ° (y ° 3)2
@f @f
= °2x = °2(y ° 3)
@x @y
°2x = 0 ° 2(y ° 3) = 0 ) x = 0 y = 3
f) f (x, y) = x 2 ° y
@f @f
= 2x = °1
@x @y
2x = 0 ° 1 = 0 ) no tiene solución
Por tanto, no hay puntos críticos

g) f (x, y) = x 2 ° y 2
@f @f
= 2x = °2y
@x @y
2x = 0 ° 2y = 0 ) x = 0 y = 0
h) f (x, y) = (x ° y)2
@f @f
= 2(x ° y) = °2(x ° y)
@x @y
2(x ° y) = 0 ° 2(x ° y) = 0 ) x = y y = cualquier valor
En este caso hay infinitos puntos críticos: todos los puntos de la forma
(x § , y § ) = (a, a) a : cualquier valor, a 2 R
Como tanto los máximos como los mínimos locales de una función son puntos críticos, harán
falta condiciones de segundo orden (con las parciales segundas) para discriminar los puntos estacio-
narios. Además, puede haber puntos críticos que no sean ni máximo, ni mínimo. A los puntos críticos
que no son óptimos se les denomina puntos de silla.
Figura 3.24: Función con un punto de silla: f (x, y) = x 2 ° y 2
La figura 3.24 presenta el ejemplo típico (al que se debe el nombre de punto de silla). Como se
observa en la gráfica, en el punto crítico (0, 0) se maximiza la función cuando la aproximación al
punto es de abajo arriba, y se minimiza cuando la aproximación se hace de izquierda a derecha. En el
apartado g ) de los ejemplos 21 i 22 se discute formalmente esta función.
8.2. Condiciones suficientes

Para analizar si los puntos críticos obtenidos son máximos, mínimos o puntos de silla se utilizan
las denominadas condiciones de segundo orden (parciales segundas). La clasificación sigue la misma
regla que para funciones de una variable: en un punto crítico x § , si f 00 (x § ) > 0 se alcanza un mínimo;
si f 00 (x § ) < 0 se alcanza un máximo.

Teorema 12 (Condición suficiente de óptimo local) Sea f : S ! R una función con parciales segundas
continuas en un conjunto S µ Rn abierto, y sea a 2 S un punto crítico de dicha función. Entonces,
1. Si H f (a) es definida positiva, la función alcanza un mínimo local en a.
2. Si H f (a) es definida negativa, la función alcanza un máximo local en a.
3. Si H f (a) es indefinida, en a hay un punto de silla.
Demostración La prueba se basa en la fórmula de Taylor de segundo orden:

1
f (x) º f (a) + r f (a) · (x ° a) + (x ° a)0 H f (a)(x ° a)
2
Como a es un punto crítico, el gradiente se anula y queda
1
f (x) ° f (a) º (x ° a)0 H f (a)(x ° a)
2
Por tanto, el signo de la hessiana marca la diferencia entre f (x) y f (a)
1. Si H f (a) es definida positiva, entonces f (x)° f (a) > 0, es decir f (x) > f (a) y en a se alcanza un
mínimo local.
2. Si H f (a) es definida negativa, entonces f (x) ° f (a) < 0, es decir f (x) < f (a) y en a se alcanza
un máximo local.
3. Si H f (a) es indefinida, la diferencia es a veces positiva y a veces negativa, con lo que no se

alcanza ni máximo ni mínimo, y en a hay un punto de silla.
⇤
Nota 9 Cuando la forma cuadrática es semidefinida hay un caso de duda. Si es semidefinida positiva,
puede tratarse de un mínimo local o de un punto de silla. Si es semidefinida negativa, puede ser un
máximo local o un punto de silla. En ambos casos para clasificar el punto crítico se debe hacer un
estudio local, comparando el valor de la función en el punto crítico con el valor en otros de su entorno
tomados en distintas direcciones.
Ejemplo 22 Clasifica los puntos críticos o estacionarios de las funciones del ejemplo 21.
a) f (x, y) = x 2 + 3x y + y
µ ∂
2 3
La matriz hessiana es H f (x, y) =
3 0
µ ∂ µ ∂
1 2 2 3
En el punto crítico vale H f ° , =
3 9 3 0
µ ∂
1 2
D 1 = 2 D 2 = °9 ) indefinida, luego en ° , hay un punto de silla
3 9
b) f (x, y, z) = 5x 2 + x y + y + z 2
0 1
10 1 0
La matriz hessiana es H f (x, y, z) = @ 1 0 0 A
0 0 2
0 1
10 1 0
En el punto crítico vale H f (°1, 10, 0) = @ 1 0 0 A
0 0 2
D 1 = 10 D 2 = °1 D 3 = °2 ) indefinida, luego en (°1, 10, 0) hay un punto de silla

c) f (x, y) = x ln(y)
0 1
1
B 0 y C
La matriz hessiana es H f (x, y) = B @ 1 x A
C
° 2
y y
µ ∂
0 1
En el punto crítico vale H f (0, 1) =
1 0
En este caso, como D 1 = 0 se deben calcular todos los menores principales. Los de orden 1 son
H1 = {0, 0} y solo hay uno de orden 2, H2 = {°1}. Por tanto, la forma cuadrática es indefinida,
luego en (0, 1) hay un punto de silla
d) f (x, y) = (x ° 1)2 + (y + 2)2

µ ∂
2 0
0 2
µ ∂
2 0
En el punto crítico vale H f (1, °2) =
0 2
D 1 = 2 D 2 = 4 ) definida positiva, luego en (1, °2) se alcanza un mínimo local, y el valor
mínimo de la función es f mı́n = f (1, °2) = 0
e) f (x, y) = °x 2 ° (y ° 3)2
µ ∂
°2 0
0 °2
µ ∂
°2 0
0 °2
D 1 = °2 D 2 = 4 ) definida negativa, luego en (0, 3) se alcanza un máximo local, y el valor
máximo de la función es f máx = f (0, 3) = 0
f) f (x, y) = x 2 ° y
Como en este caso no existen puntos críticos, la función no posee ni máximos ni mínimos
locales
g) f (x, y) = x 2 ° y 2
µ ∂
2 0
0 °2
µ ∂
2 0
0 °2
D 1 = 2 D 2 = °4 ) indefinida, luego en (0, 0) hay un punto de silla
h) f (x, y) = (x ° y)2
µ ∂
°22
°22
µ ∂
2 °2
En un punto crítico (a, a) vale H f (a, a) =
°2 2

D 1 = 2 D 2 = 0 ) semidefinida positiva, lo cual da lugar a un caso de duda. Si se observa

el valor de la función en un punto crítico cualquiera, f (a, a) = (a ° a)2 = 0, mientras que en los
demás puntos la función es mayor o igual, f (x, y) = (x ° y)2 ∏ 0
Por tanto, en los puntos de la forma (a, a) se alcanza un mínimo local (que en este caso es
global, ya que la función es siempre mayor o igual a cero), y el valor mínimo de la función es
f mı́n = f (a, a) = 0
La figura 3.25 muestra la gráfica de esta función.
Figura 3.25: Una función con infinitos puntos críticos, todos mínimos, f (x, y) = (x ° y)2
9. Programas convexos/cóncavos
En el caso particular en que la función que se quiere optimizar es convexa (para mínimos) o cón-
cava (para máximos) la discusión es más fácil y, además, se obtienen resultados adicionales. El primer
resultado indica que no es necesario comprobar las condiciones de segundo orden.
Teorema 13 Sea f : S ! R una función diferenciable en un conjunto S µ Rn abierto y convexo. Enton-

ces,
1. Si a 2 S es un punto crítico de f , y la función f es convexa, en a se alcanza un mínimo.
2. Si a 2 S es un punto crítico de f , y la función f es cóncava, en a se alcanza un máximo.
Demostración La prueba de ambos apartados es análoga y se basa en el resultado del teorema 6. En

el caso de función cóncava se sabe que
para todo x, a 2 S, f (x) ∑ f (a) + r f (a) · (x ° a)

Como el gradiente en el punto crítico se anula, se tiene que para todo x, a 2 S, f (x) ∑ f (a), con lo que
en a se alcanza un máximo. ⇤
Este resultado es útil en casos como el apartado h) del ejemplo 22. Como la matriz hessiana
µ ∂
2 °2
H f (x, y) =
°2 2
es semidefinida positiva en cualquier punto (x, y), la función es convexa. Entonces todos los puntos
críticos son mínimos (como se había visto, ver figura 3.25) y no hace falta realizar el estudio local.
Ejemplo 23 La función f (x, y) = °2x 2 ° 3y 2 + 2x y es cóncava, ya que su matriz hessiana

µ ∂
°4 2
H f (x, y) = D 1 = °4 < 0, D 2 = 20 > 0
2 °6
es definida negativa. Entonces todo punto crítico maximiza la función:
@f @f
= °4x + 2y = 0 = °6y + 2x = 0
@x @y
Resolviendo el sistema, el único punto crítico es (0, 0), y f máx = f (0, 0) = 0.
Los siguientes resultados muestran importantes propiedades (respecto a optimización) de las

funciones cóncavas/convexas. El primero (teorema local-global) indica que todos los óptimos (máxi-
mos para cóncavas, mínimos para convexas) son globales. El segundo indica que pidiendo concavi-
dad/convexidad estricta solo hay un punto que maximiza/minimiza, respectivamente. Esta propie-
dad es interesante ya que, una vez obtenido un punto crítico no es necesario seguir buscando otros.
Teorema 14 (Local-Global) Sea f : S ! R una función definida en un conjunto S µ Rn convexo. En-

tonces,
1. Si en a 2 S se alcanza un mínimo local, y la función f es convexa, en a se alcanza un mínimo

global.
2. Si en a 2 S se alcanza un máximo local, y la función f es cóncava, en a se alcanza un máximo

global.
Teorema 15 (Unicidad) Sea f : S ! R una función definida en un conjunto S µ Rn convexo. Entonces,
1. Si la función f es estrictamente convexa y tiene mínimo, dicho valor mínimo (global) se alcanza
en un único punto.
2. Si la función f es estrictamente cóncava y tiene máximo, dicho valor máximo (global) se alcanza
en un único punto.
Finalmente, la siguiente propiedad muestra que las funciones estrictamente cuasi-cóncavas o

cuasi-convexas tienen un comportamiento muy similar a las cóncavas/convexas respecto a la op-
timización. Esto se puede aplicar a las funciones de producción Cobb-Douglas con rendimientos
crecientes.

Teorema 16 Sea f : S ! R una función diferenciable en un conjunto S µ Rn abierto y convexo. Enton-

ces,
1. Si a 2 S es un punto crítico de f , y la función f es estrictamente cuasi-convexa, en a se alcanza

un mínimo global.
2. Si a 2 S es un punto crítico de f , y la función f es estrictamente cuasi-cóncava, en a se alcanza

un máximo global.
2 2
Ejemplo 24 Es fácil observar que la función f (x, y) = e °x °y es estrictamente cuasi-cóncava y que solo
tiene un punto crítico, a = (0, 0). Por tanto, en dicho punto alcanza un máximo global (ver figura 3.26).
2
°y 2
Figura 3.26: Gráfica de la función f (x, y) = e °x


Capítulo 4
OPTIMIZACIÓN RESTRINGIDA:
LAGRANGIANA, KARUSH-KUHN-TUCKER
Y PROGRAMACIÓN LINEAL
1. Problemas de optimización restringida
2. Problemas con restricciones de igualdad
3. Condiciones necesarias y suficientes de óptimo local
4. Programas convexos/cóncavos con restricciones de igualdad
5. Interpretación económica de los multiplicadores
6. El problema básico de programación no lineal
7. Condiciones necesarias de Karush-Kuhn-Tucker
8. Programación cóncava
9. Un caso particular de la Programación Cóncava: Programación Lineal
1. Problemas de optimización restringida

Los problemas de optimización, en muchas ocasiones, tienen asociadas ciertas limitaciones (o
restricciones) en los valores que pueden tomar las variables. Esto se da a veces por el propio signifi-
cado de las variables: si son cantidades a producir, deben ser mayores o iguales a cero; si son bienes
a consumir deben ser también mayores o iguales a cero, y además estar dentro de las posibilidades
del consumidor, es decir, cumplir una restricción presupuestaria; . . . Se dice entonces que se tiene
un problema de optimización restringida. En general pueden aparecer distintos tipos de restricciones
que se pueden clasificar en varios apartados:
Restricciones de igualdad: las variables deben cumplir una o varias ecuaciones (por ejemplo,
se ha de producir una cantidad prefijada de una mercancía)
Restricciones de desigualdad: las variables deben cumplir una o varias inecuaciones (por ejem-
plo, no se puede gastar más de la renta disponible)
Restricciones de no negatividad: las variables han de ser mayores o iguales a cero (por su signi-
ficado económico)
85
CAPÍTULO 4: OPTIMIZACIÓN RESTRINGIDA
Restricciones de programación entera: las variables han de ser números enteros, ya que las uni-
dades son indivisibles (por ejemplo, número de estudiantes por aula, número de automóviles
en un concesionario, . . . )
Ejemplo 1 Problema con restricción de igualdad: Calcula el valor máximo que puede tomar el pro-
ducto de dos números reales cuya suma vale 1000.
Formalmente, si se denominan dichos números por x, y , el problema es:
Maximizar f (x, y) = x y sujeto a x + y = 1000
Ejemplo 2 Problema con restricción de desigualdad y no negatividad:

Un consumidor dispone de una renta de 1000 " y tiene una función de utilidad u(x, y) = x y que
depende de las cantidades respectivas (x, y) que consume de dos bienes con precios unitarios p x = 2 ",
p y = 5 ". Calcula qué cantidad consumirá de cada bien para maximizar su utilidad.
Formalmente, el problema es:
Maximizar u(x, y) = x y sujeto a 2x + 5y ∑ 1000, x ∏ 0, y ∏ 0
En este capítulo se estudiará la resolución de problemas de optimización con restricciones. En

primer lugar restricciones de igualdad, para analizar a continuación problemas de optimización con
restricciones de desigualdad. En el caso particular de Programación Cóncava (la función a maximizar
es cóncava) se obtienen resultados adicionales importantes: por ejemplo, el máximo es global. Final-
mente, se analizará un caso particular (Programación Lineal) que es muy utilizado en la práctica.
2. Problemas con restricciones de igualdad

Un problema de optimización con restricciones de igualdad tiene la forma general:
9
Optimizar f (x 1 , x 2 , . . . , x n ) >
>
>
>
sujeto a >
>
>
=
g 1 (x 1 , x 2 , . . . , x n ) = b 1
[P ]
g 2 (x 1 , x 2 , . . . , x n ) = b 2 >
>
>
>
... >
>
>
;
g m (x 1 , x 2 , . . . , x n ) = b m
La función a optimizar f (x 1 , x 2 , . . . , x n ) se denomina función objetivo y se asumirá que se trata de una

función diferenciable definida en un subconjunto abierto D µ Rn . Las funciones g i (x 1 , x 2 , . . . , x n ) que
definen las restricciones también se considerará que son diferenciables y definidas en el mismo con-
junto D µ Rn . Los términos independientes b 1 , b 2 , . . . , b m son números reales. El conjunto de vectores
que cumplen todas las restricciones
© ™
S = (x 1 , x 2 , . . . , x n ) 2 Rn : g i (x 1 , x 2 , . . . , x n ) = b i 8i = 1, 2, . . . , m
se denomina conjunto de oportunidades, o conjunto factible.
Algunos casos sencillos de problemas de optimización con restricciones de igualdad se pueden

convertir en problemas sin restricciones resolviendo el sistema de ecuaciones que define el conjun-
to de oportunidades S y sustituyendo la solución en la función objetivo, como muestra el siguiente
ejemplo.

Ejemplo 3 Dado el problema
Maximizar f (x, y) = x y sujeto a x + y = 1000
el conjunto de oportunidades y las curvas de nivel de la función objetivo aparecen en la figura 4.1.
Figura 4.1: Conjunto de oportunidades y curvas de nivel en el ejemplo 3
Gráficamente se observa que el máximo se alcanza en el punto (500, 500) y el valor máximo de la
función objetivo es f máx = 250000.
Razonando de otro modo, si en la restricción se resuelve la ecuación para calcular el valor de y,

queda y = 1000 ° x; sustituyendo este dato en la función objetivo, el problema pasa a tener una sola
variable y sin restricciones
Maximizar h(x) = f (x, 1000 ° x) = x(1000 ° x) = 1000x ° x 2
Aplicando las condiciones de primer orden para funciones de una variable
h 0 (x) = 1000 ° 2x = 0 ) x = 500 y = 500
Como h 00 (500) = °2 < 0 se trata de un máximo, que coincide con la solución obtenida gráficamente.
Pero en general no se podrá resolver el sistema de ecuaciones que define el conjunto de oportu-
nidades, o será muy complicado.1 Por tanto serán necesarias otras técnicas para abordar este tipo de
problemas. La denominada lagrangiana del problema jugará un importante papel en la discusión.
1 Debe recordarse que en muchas ecuaciones, como por ejemplo x y ° ln(x y) = 1, no es posible despejar explícitamente
la función y = f (x).

2.1. Lagrangiana de un problema de optimización con restricciones

Definición 1 Dado el problema de optimización
9
Optimizar f (x 1 , x 2 , . . . , x n ) >
>
>
>
sujeto a >
>
>
=
g 1 (x 1 , x 2 , . . . , x n ) = b 1
[P ]
g 2 (x 1 , x 2 , . . . , x n ) = b 2 >
>
>
>
... >
>
>
;
g m (x 1 , x 2 , . . . , x n ) = b m
se denomina lagrangiana del problema a la función L : Rn £ Rm ! R definida por:

m
X ° ¢
L ((x 1 , x 2 , . . . , x n ); (∏1 , ∏2 , . . . , ∏m )) = f (x 1 , x 2 , . . . , x n ) + ∏ j b j ° g j (x 1 , x 2 , . . . , x n ) =
j =1
° ¢ ° ¢
= f (x 1 , x 2 , . . . , x n ) + ∏1 b 1 ° g 1 (x 1 , x 2 , . . . , x n ) + . . . + ∏m b m ° g m (x 1 , x 2 , . . . , x n )
Si se usa notación vectorial:
x = (x 1 , x 2 , . . . , x n ) ∏ = (∏1 , ∏2 , . . . , ∏m ) b = (b 1 , b 2 , . . . , b m ) g (x) = (g 1 (x), g 2 (x), . . . , g m (x))
la lagrangiana del problema puede escribirse de forma abreviada como
L(x; ∏) = f (x) + ∏ · (b ° g (x))
Las nuevas variables que se introducen en esta función (∏1 , ∏2 , . . . , ∏m ) se denominan multiplicadores
de Lagrange y se verá que poseen una importante interpretación económica. Un hecho a resaltar es
que en el problema [P ] solo interesa estudiar qué pasa en los puntos que cumplen las restricciones
g (x) = b, o lo que es lo mismo, b ° g (x) = 0. Por tanto, en dichos puntos la función objetivo y la
lagrangiana coinciden
L(x; ∏) = f (x) + ∏ · (b ° g (x)) = f (x) 8x : g (x) = b
Ejemplo 4 Calcula la lagrangiana de los siguientes problemas:
a)
9
Optimizar f (x, y) = x y =
° ¢
sujeto a L (x, y); ∏ = x y + ∏(1000 ° x ° y)
;
x + y = 1000
b)
9
Optimizar f (x, y) = 3x + 4y =
° ¢
sujeto a L (x, y); ∏ = 3x + 4y + ∏(1 ° x 2 ° y 2 )
;
x2 + y 2 = 1
c)
9
Optimizar f (x, y, z) = °x 2 ° (y ° 1)2 ° xz >
>
>
=
sujeto a
x +y +z =1 >
>
>
;
x °z =0
° ¢
L (x, y, z); (∏, µ) = °x 2 ° (y ° 1)2 ° xz + ∏(1 ° x ° y ° z) + µ(°x + z)

3. Condiciones necesarias y suficientes de óptimo local

3.1. Condiciones necesarias
Teorema 1 (Teorema de Lagrange: condición necesaria de óptimo restringido) Si x § = (x 1§ , x 2§ , . . . , x n§ )

es una solución del problema de optimización con restricciones de igualdad [P ] y se cumple que los
© ™
vectores rg 1 (x § ), rg 2 (x § ), . . . , rg m (x § ) son linealmente independientes (condición de regularidad),
° ¢
entonces existen valores para los multiplicadores de Lagrange ∏§ = ∏§1 , ∏§2 , . . . , ∏§m de manera que
(x § ; ∏§ ) es un punto crítico de la lagrangiana; esto es, rL (x § ; ∏§ ) = 0, que se puede escribir:
@L(x § ; ∏§ )
=0 8i = 1, 2, . . . , n [N 1]
@x i
@L(x § ; ∏§ )
=0 8 j = 1, 2, . . . , m [N 2]
@∏ j
Nota 1 El teorema de Lagrange indica que los óptimos locales del problema, en caso de existir, se en-
cuentran entre los puntos críticos de la lagrangiana del problema. Por ello, el primer paso para resol-
verlo será calcular dichos puntos críticos que serán los posibles candidatos (tanto a maximizar como a
minimizar la función). Por tanto, el razonamiento es análogo al de optimización sin restricciones, sin
más que cambiar la función objetivo f (x) por la lagrangiana del problema L(x; ∏) = f (x)+∏·(b °g (x)).
Después, también como en el caso sin restricciones, se necesitarán unas condiciones de segundo orden
para analizar si se trata de un máximo, un mínimo, o ninguna de ambas cosas.
Nota 2 Merece la pena mirar con atención las parciales [N 2] de la lagrangiana con respecto a los mul-
tiplicadores
@L(x § ; ∏§ )
=0 8 j = 1, 2, . . . , m
@∏ j
Si se calculan estas parciales se tiene
@L(x § ; ∏§ )
= b j ° g j (x § ) = 0 ) g j (x § ) = b j 8 j = 1, 2, . . . , m
@∏ j
es decir, el punto x § cumple todas las restricciones, con lo cual para escribir las condiciones [N 2] no
hace falta calcular las parciales, sino que basta con escribir directamente las restricciones de igualdad
del problema.
Ejemplo 5 Calcula los puntos críticos de las lagrangianas de los problemas del ejemplo 4.
a)
9
° ¢
sujeto a L (x, y); ∏ = x y + ∏(1000 ° x ° y)
;
x + y = 1000
° ¢ 9
@L (x, y); ∏ >
>
= y °∏ = 0 ) y =∏ >
>
° @x ¢ >
>
@L (x, y); ∏ =
= x °∏ = 0 ) x =∏ ) x = 500 y = 500 ∏ = 500
° @y ¢ >
>
>
>
@L (x, y); ∏ >
>
= 100 ° x ° y = 0 ) x + y = 1000 ;
@∏

b)
9
° ¢
sujeto a L (x, y); ∏ = 3x + 4y + ∏(1 ° x 2 ° y 2 )
;
x2 + y 2 = 1
° ¢ 9
@L (x, y); ∏ 3 >
>
= 3 ° 2∏x = 0 ) x= >
>
° @x ¢ 2∏ >
>
@L (x, y); ∏ = 9 16 5
4
= 4 ° 2∏y = 0 ) y= ) 2
+ 2 =1 ) ∏=±
° @y ¢ 2∏ >
> 4∏ 4∏ 2
>
>
@L (x, y); ∏ >
>
= 1 ° x2 ° y 2 = 0 ) x +y =1 ;
2 2
@∏
Hay que observar que ∏ debe ser distinto de cero para que puedan cumplirse las dos primeras con-
diciones, ya que si ∏ = 0 queda 3 = 0, 4 = 0, que no es posible. En este caso hay dos puntos críticos
3 4 5 3 4 5
x= y= ∏= x =° y =° ∏=°
5 5 2 5 5 2
c)
9
>
>
=
sujeto a
x +y +z =1 >
>
>
;
x °z =0
° ¢
L (x, y, z); (∏, µ) = °x 2 ° (y ° 1)2 ° xz + ∏(1 ° x ° y ° z) + µ(°x + z)
° ¢ 9
@L (x, y, z); (∏, µ) >
>
= °2x ° z ° ∏ ° µ = 0 ) °2x ° z ° ∏ ° µ = 0 >
>
° @x ¢ >
>
>
>
@L (x, y, z); (∏, µ) >
>
= °2(y ° 1) ° ∏ = 0 ) 2y + ∏ = 2 >
>
@y >
>
° ¢ >
=
@L (x, y, z); (∏, µ)
= °x ° ∏ + µ = 0 ) °x ° ∏ + µ = 0 >
° @z ¢ >
>
@L (x, y, z); (∏, µ) >
>
>
>
= 1°x ° y °z = 0 ) x +y +z =1 >
>
° @∏ ¢ >
>
@L (x, y, z); (∏, µ) >
>
>
>
= °x + z = 0 ) x °z =0 ;
@µ
Resolviendo el sistema (por ejemplo por Gauss) la única solución (punto crítico) es
x =0 y =1 z =0 ∏=0 µ=0
3.2. Interpretación geométrica del teorema de Lagrange

En el caso de una función objetivo f (x, y) con dos variables y una restricción de igualdad que
siempre puede escribirse en la forma g (x, y) = 0, es posible representar gráficamente el problema de
optimización. En este caso, el teorema de Lagrange indica que dado un punto óptimo (x § , y § ) debe
existir un ∏§ de modo que se cumple
° ¢
rL (x § , y § ); ∏§ = 0 ) r f (x § , y § ) ° ∏§ rg (x § , y § ) = 0 ) r f (x § , y § ) = ∏§ rg (x § , y § )
Es decir, en el óptimo el gradiente de la función objetivo es proporcional al gradiente de la restricción.

Como se sabe, el gradiente de una función es perpendicular a la recta tangente a la curva de nivel en
el punto. Por tanto, en el óptimo, la curva de nivel y la restricción son tangentes. La figura 4.2 ilustra
este hecho. La función objetivo es f (x, y) = (x ° 3)2 + y 2 , siendo la restricción x 2 ° y = 0.

Figura 4.2: Tangencia entre la curva de nivel y la restricción en el punto óptimo
3.3. La importancia de la condición de regularidad

La condición de regularidad es fundamental para que se pueda aplicar el teorema de Lagrange.
En el caso de una sola restricción de igualdad, la condición de regularidad únicamente dice que en el
óptimo rg (x § ) 6= 0. En los ejemplos vistos se cumple la condición de regularidad
a) rg (x, y) = (1, 1) 6= (0, 0)

µ ∂ µ ∂ µ ∂ µ ∂
3 4 6 8 3 4 6 8
b) rg (x, y) = (2x, 2y) rg , = , 6= (0, 0) rg ° , ° = ° , ° 6= (0, 0)
5 5 5 5 5 5 5 5
En el ejemplo c) hay dos restricciones y hay que ver si los dos vectores gradientes son independientes
rg 1 (x, y, z) = (1, 1, 1) rg 2 (x, y, z) = (1, 0, °1)
Obviamente estos vectores no son proporcionales luego, efectivamente, son linealmente indepen-
dientes y se cumple la condición de regularidad.
El siguiente ejemplo muestra un caso en que no se verifica la condición de regularidad y no se

cumple el teorema de Lagrange: hay un óptimo que no es punto crítico de la lagrangiana.

9
Minimizar f (x, y) = x 2 + y 2 =
sujeto a
;
°(x ° 1)3 + y 2 = 0
como puede observarse en la figura 4.3 el mínimo de este problema se alcanza en el punto (1, 0). Ade-
más, se trata de un mínimo global.

Figura 4.3: Un óptimo que no es punto crítico de la lagrangiana del problema
La lagrangiana del problema es

° ¢ ° ¢
L (x, y); ∏ = x 2 + y 2 + ∏ (x ° 1)3 ° y 2
y las condiciones necesarias del teorema de Lagrange son

° ¢ 9
@L (x, y); ∏ >
>
= 2x + 3∏(x ° 1)2 = 0 >
>
° @x ¢ >
>
@L (x, y); ∏ =
= 2y ° 2∏y = 0
° @y ¢ >
>
>
>
@L (x, y); ∏ >
>
= (x ° 1)3 ° y 2 = 0 ;
@∏
Si se sustituye el punto (1, 0) en la primera condición, se tiene
° ¢
@L (x, y); ∏
(1, 0) = 2 + 3∏(1 ° 1)2 = 2 6= 0,
@x
luego el gradiente de la lagrangiana no se anula en el punto óptimo, para ningún valor de ∏. Hay que
observar que no se verifica la condición de regularidad, ya que
° ¢
rg (x, y) = °3(x ° 1)2 , 2y rg (1, 0) = (0, 0)

3.4. Condiciones suficientes

De igual modo que en la optimización libre, las condiciones de segundo orden servirán para cla-
sificar los puntos críticos en mínimos, máximos, o ni una cosa ni la otra.
Teorema 2 (Condiciones suficientes) Sea (x § ; ∏§ ) un punto crítico de la lagrangiana del problema [P ],

en el que las parciales segundas de la función objetivo y las restricciones existen y son continuas en un
entorno. Sea la matriz simétrica (hessiana del problema restringido)
0 1
@2 L (x; ∏) @2 L (x; ∏) @2 L (x; ∏)
B ... C
B @x 2 @x 1 @x 2 @x 1 @x n C
B 2 1 C
B @ L (x; ∏) @2 L (x; ∏) @2 L (x; ∏) C
B ... C
Hr L(x; ∏) = B
B @x 2 @x 1 @x 22 @x 2 @x n C
C
B C
B ... ... ... ... C
B 2 2 2 C
@ @ L (x; ∏) @ L (x; ∏) @ L (x; ∏) A
...
@x n @x 1 @x n @x 2 @x n2
© ™
y sea el subespacio V = v 2 Rn : rg j (x § ) · v = 0 8 j = 1, 2, . . . , m . Entonces:
a) Si la forma cuadrática con matriz Hr L(x § ; ∏§ ) es definida negativa restringida al subespacio V, en

x § se alcanza un máximo local del problema [P ]
b) Si la forma cuadrática con matriz Hr L(x § ; ∏§ ) es definida positiva restringida al subespacio V, en

x § se alcanza un mínimo local del problema [P ]
Nota 3 Sobre el subespacio V . Dado un punto x § que sea candidato a óptimo de un problema con
restricciones [P ], en primer lugar dicho punto debe cumplir las restricciones: g (x § ) = b. En segundo
lugar, para que dicho punto sea óptimo del problema, el valor de f (x § ) deberá ser mayor o igual (si
se trata de un máximo), o menor o igual (en caso de mínimo) que en los puntos de su alrededor que
cumplan las restricciones. Es decir (en caso de máximo)
f (x § ) ∏ f (x § + v) para los v tales que g (x § + v) = b
Calculando la derivada direccional de la función g (x) se obtiene que como g (x § + v) ° g (x § ) = 0
g (x § + v) ° g (x § )
D v g (x § ) = rg (x § ) · v = lı́m =0 ) rg (x § ) · v = 0
kvk!0 kvk
Por tanto, el subespacio V indica las direcciones en las que es posible moverse desde el punto x § cum-
pliendo las restricciones del problema (conjunto de direcciones factibles; es decir, las direcciones que
interesan en el problema). Por eso se estudia la forma cuadrática restringida al subespacio V .
Nota 4 Se debe recordar que si una forma cuadrática es definida (positiva o negativa) sin restringir,
lo sigue siendo bajo cualquier restricción. Entonces, en muchas ocasiones se comienza estudiando la
forma cuadrática sin restringir.
Ejemplo 7 Clasifica los puntos críticos de los problemas del ejemplo 4.
a)
9
° ¢
sujeto a L (x, y); ∏ = x y + ∏(1000 ° x ° y) ) x = 500 y = 500 ∏ = 500
;
x + y = 1000

La matriz hessiana en este punto y el gradiente de la restricción son:

µ ∂
0 1
Hr L ((500, 500); 500) = rg (500, 500) = (1, 1)
1 0
En general la forma cuadrática es indefinida. El conjunto de direcciones factibles es

© ™ © ™
V = (u, v) 2 R2 : (1, 1) · (u, v) = 0 = (u, v) 2 R2 : v = °u
Entonces, la forma cuadrática restringida

µ ∂µ ∂
0 1 u
(u, °u) = °2u 2
1 0 °u
es definida negativa. Por tanto, en el punto crítico se alcanza un máximo local del problema de
optimización con restricciones, cuyo valor es f máx = f (500, 500) = 250000.
b)
9
° ¢
sujeto a L (x, y); ∏ = 3x + 4y + ∏(1 ° x 2 ° y 2 )
;
x2 + y 2 = 1
La matriz hessiana y el gradiente de la restricción son:
µ ∂
° ¢ °2∏ 0
Hr L (x, y); ∏ = rg (x, y) = (2x, 2y)
0 °2∏
En este problema hay dos puntos críticos
3 4 5 3 4 5
x= y= ∏= x =° y =° ∏=°
5 5 2 5 5 2
En el primer punto
µµ ∂ ∂ µ ∂
3 4 5 °5 0
Hr L , ; =
5 5 2 0 °5
por lo que la forma cuadrática es siempre definida negativa, y en este punto se alcanza un máximo
local, con valor de la función objetivo f máx = 5.
En el segundo punto
µµ ∂ ∂ µ ∂
3 4 5 5 0
Hr L ° ,° ;° =
5 5 2 0 5
por lo que la forma cuadrática es siempre definida positiva, y en este punto se alcanza un mínimo
local, con valor de la función objetivo f mı́n = °5.
La figura 4.4, muestra cómo se puede resolver el problema gráficamente mediante curvas de nivel.
Además, se observa que los óptimos encontrados son globales.

Figura 4.4: Curvas de nivel y conjunto factible en el ejemplo 7 b)
c)
9
>
>
=
sujeto a
x +y +z =1 >
>
>
;
x °z =0
° ¢
L (x, y, z); (∏, µ) = °x 2 °(y °1)2 °xz +∏(1°x °y °z)+µ(°x +z) ) x = 0 y = 1 z = 0 ∏ = 0 µ = 0
La matriz hessiana en este punto y los gradientes de las restricciones son:
0 1
°2 0 °1
Hr L ((0, 1, 0); (0, 0)) = @ 0 °2 0 A rg 1 (0, 1, 0) = (1, 1, 1) rg 2 (0, 1, 0) = (1, 0, °1)
°1 0 0

© ™
V = (u, v, w) 2 R3 : (1, 1, 1) · (u, v, w) = 0; (1, 0, °1) · (u, v, w) = 0 =
© ™ © ™
= (u, v, w) 2 R3 : u + v + w = 0; u ° w = 0 = (u, v, w) 2 R3 : v = °2u; w = u
0 10 1
°2 0 °1 u
(u, °2u, u) @ 0 °2 0 A @ °2u A = °12u 2
°1 0 0 u
es definida negativa. Por tanto, en el punto crítico se alcanza un máximo local del problema de
optimización con restricciones, cuyo valor es f máx = f (0, 1, 0) = 0.

Ejemplo 8 Calcula, si existe, la solución del problema

9
Optimizar f (x, y, z) = °x 2 + y 2 + z 2 =
sujeto a
;
x +y +z =1
Como se cumplen las condiciones del teorema de Lagrange, si existe solución deberá alcanzarse en un
punto crítico.
° ¢
L (x, y, z); ∏ = °x 2 + y 2 + z 2 + ∏(1 ° x ° y ° z)
° ¢ 9
@L (x, y, z); ∏ >
= °2x ° ∏ = 0 ) ∏ = °2x >
>
° @x ¢ >
>
>
>
@L (x, y, z); (∏, µ) >
>
= 2y ° ∏ = 0 ) ∏ = 2y >
=
° @y ¢
@L (x, y, z); (∏, µ) >
>
= 2z ° ∏ = 0 ) ∏ = 2z >
>
° @z ¢ >
>
>
>
@L (x, y, z); (∏, µ) >
>
= 1°x ° y °z = 0 ) x +y +z =1 ;
@∏
Resolviendo el sistema la única solución (punto crítico) es
x = °1 y = 1 z = 1 ∏=2
La matriz hessiana en este punto y el gradiente de la restricción son:

0 1
°2 0 0
Hr L ((°1, 1, 1); 2) = @ 0 2 0 A rg (°1, 1, 1) = (1, 1, 1)
0 0 2

© ™ © ™
V = (u, v, w) 2 R3 : (1, 1, 1) · (u, v, w) = 0 = (u, v, w) 2 R3 : w = °u ° v

0 10 1
°2 0 0 u
(u, v, °u ° v) @ 0 2 0 A@ v A = 4v 2 + 4uv
0 0 2 °u ° v
(de dos variables) es indefinida, ya que su matriz es

µ ∂
0 2
2 4
Por tanto, el problema de optimización con restricciones no tiene ni máximo, ni mínimo.
0 0
Ejemplo 9 Se considera una función de producción Cobb-Douglas g (k, `) = k0 5 `0 5 . Si el precio2 del
capital k es s = 1 + r = 10 1 y el coste del trabajo ` es w = 110, el problema de minimización de costes de
la empresa para producir 100 unidades es
0 0
Minimizar 10 1k + 110` sujeto a k0 5 `0 5 = 100 [P ]
2 Si la tasa de interés se denota por r , el precio del dinero es s = 1 + r . En el ejemplo (por facilitar cálculos) se supone una
tasa de interés del 10 %, con lo que r = 00 1, s = 10 1.


≥ 0 0
¥
L ((k, `); ∏) = 10 1k + 110` + ∏ 100 ° k0 5 `0 5
Las condiciones de primer orden proporcionan un único punto crítico k§ = 1000, `§ = 10, ∏§ = 22. La
hessiana de la lagrangiana (con respecto a (k, `)) es
0 1
1 °3 1 1 1 1
∏k 2 ` 2 ° ∏k° 2 `° 2
B 4 4 C
B C
Hr L = B C
@ 1 1 1 1 1 3
A
° ∏k° 2 `° 2 ∏k 2 `° 2
4 4
que sustituida en el punto crítico
0 1
22 °4 22 °2
10 ° 10
B 4 4 C 22 °4
B C
Hr L(1000, 10) = B C D1 = 10 > 0, D 2 = 0
@ 22 °2 22 A 4
° 10
4 4
Como es semidefinida positiva, debe hacerse el estudio de la forma cuadrática restringida. El gradiente
de la restricción es µ ∂ µ ∂
1 °1 1 1 1 °1 1
rg (k, `) = k ` , k `
2 2 2 2 rg (1000, 10) = ,5
2 2 20
Ω µ ∂ æ
1
El conjunto de direcciones factibles es V = (u, v) 2 R2 : , 5 · (u, v) = 0 , que implica u = °100v.
20
Por tanto queda
0 1
22 °4 22
10 ° 10°2 0 °100v 1
B 4 4 C
B C@ A = 22v 2
(°100v, v) B C
@ 22 22 A
° 10°2 v
4 4
definida positiva, con lo que el punto crítico es solución del problema de minimización de costes de la
empresa. El coste mínimo es f mı́n = 2200.
4. Programas convexos/cóncavos con restricciones de igualdad

Como se vio en el capítulo anterior, cuando las funciones a optimizar son cóncavas o convexas el
problema se simplifica y solo hay que comprobar condiciones de primer orden (las funciones cónca-
vas alcanzan máximos en los puntos críticos, y las funciones convexas alcanzan mínimos en dichos
puntos). En esta sección se realizará un estudio similar, en el caso de optimización restringida.
Teorema 3 Dado un problema de optimización con restricciones de igualdad [P ]

a) Si la función objetivo f (x) es una función cóncava, las funciones que definen las restricciones g j (x)
son funciones lineales y (x § ; ∏§ ) es un punto crítico de la lagrangiana, entonces en x § se alcanza un
máximo (restringido).
b) Si la función objetivo f (x) es una función convexa, las funciones que definen las restricciones g j (x)
son funciones lineales y (x § ; ∏§ ) es un punto crítico de la lagrangiana, entonces en x § se alcanza un
mínimo (restringido).
Además, el máximo o mínimo respectivos son globales. Si, adicionalmente, la función objetivo es estric-
tamente cóncava, o estrictamente convexa, el óptimo (máximo o mínimo, respectivamente) se alcanza
en un único punto.

El teorema anterior significa que también en este caso la condición de primer orden (punto crítico
de la lagrangiana) es necesaria y suficiente para que un punto sea solución del programa cóncavo o
convexo y además en estos casos se puede asegurar que el óptimo es global. Un caso frecuente de
programas cóncavos y convexos aparece cuando tanto la función objetivo como las restricciones son
funciones lineales.
Minimizar f (x, y) = x 2 + y 2 sujeto a g (x, y) = x + y = 1 [P ]
como se quiere minimizar una función convexa con una restricción lineal (es una recta), solo será ne-
cesario encontrar los puntos críticos de la lagrangiana que, en caso de existir, serán la solución del
problema. Además, al ser la función objetivo estrictamente convexa, solo puede haber un punto donde
se alcance el óptimo (mínimo).
° ¢
L (x, y); ∏ = x 2 + y 2 + ∏(1 ° x ° y)
Las condiciones de primer orden son

° ¢ 9
@L (x, y); ∏ >
>
= 2x ° ∏ = 0 >
>
° @x ¢ >
>
@L (x, y); ∏ = 1 1
= 2y ° ∏ = 0 ) x= y= ∏=1
° @y ¢ >
> 2 2
>
>
@L (x, y); ∏ >
>
= 1°x ° y = 0 ;
@∏
Por tanto este punto es la solución (global) del programa convexo y el valor mínimo de la función es
f mı́n = f (00 5, 00 5) = 00 5.
5. Interpretación económica de los multiplicadores

Aunque el resultado se cumple para cualquier número de variables y restricciones, a fin de hacer
más sencilla la discusión se analizará un problema con dos variables y una restricción de igualdad
Optimizar f (x, y) sujeto a g (x, y) = b [P ]
Para cada valor de b se tiene un problema distinto [P (b)], que al resolverse proporciona una solución
° § ¢
x (b), y § (b) , ∏§ (b) distinta y un óptimo diferente
° ¢
f § (b) = f x § (b), y § (b) función óptimo
En este caso se trata de una función real de una única variable real b. Si todas las funciones que
intervienen en el problema tienen parciales continuas, se puede calcular la derivada de la función
óptimo con respecto a b (es decir, estudiar cómo cambia el óptimo cuando cambia el valor de la
restricción). La lagrangiana del problema (en función de b) es
°° ¢ ¢ ° ¢ ° ° ¢¢
L x(b), y(b) ; ∏(b) = f x(b), y(b) + ∏(b) b ° g x(b), y(b)
Derivando con respecto a b (y aplicando la regla de la cadena)

µ µ ∂∂
d L @ f d x(b) @ f d y(b) d ∏(b) ° ° ¢¢ @g d x(b) @g d y(b)
= + + b ° g x(b), y(b) + ∏(b) 1 ° +
d b @x d b @y d b db @x d b @y d b

Reordenando
µ ∂ µ ∂
dL @f @g d x(b) @f @g d y(b) d ∏(b) ° ° ¢¢
= ° ∏(b) + ° ∏(b) + b ° g x(b), y(b) + ∏(b)
db @x @x db @y @y db db
Al sustituir en un punto óptimo, como debe cumplir las condiciones de primer orden, todos los tér-
minos entre paréntesis se anulan y se obtiene
° ¢
d L (x § , y § ); ∏§
= ∏§ (b)
db
° ¢
Como f § (b) = L (x § (b), y § (b)); ∏§ (b) , se cumple
° ¢ ° ¢
d f § (b) d f x § , y § d L (x § , y § ); ∏§
= = = ∏§ (b)
db db db
y el valor del multiplicador indica cómo cambia el óptimo de la función objetivo cuando se modifica
el valor b que define la restricción. Por tanto, para un incremento de M b en el valor de b, el óptimo
cambiará aproximadamente M f § º ∏§ M b. Para un incremento unitario, M b = 1, el incremento del
óptimo será, aproximadamente, M f § º ∏§ .
Ejemplo 11 Para el problema de minimización de costes del ejemplo 9 se ha obtenido ∏§ = 22. Esto
indica que el coste óptimo (mínimo) aproximado de producir una unidad adicional es 22. En este
ejemplo la aproximación es exacta, ya que el coste mínimo de producir 101 unidades es f § (101) = 2222.
En economía se denomina a ∏§ el precio sombra.

°° ¢ ¢
Maximizar x y sujeto a x + y = 1000 [P ] L x, y ; ∏ = x y + ∏(1000 ° x ° y)
la solución es x § = 500, y § = 500, ∏§ = 500, f § = 250000. Si ahora se modifica el coeficiente b, pasando

a ser b 0 = 1001, es decir M b = 1, el razonamiento anterior indica que M f § º 500 con lo que el óptimo
(máximo) de la función es aproximadamente f § º 250500. Si se resolviera el nuevo problema,
°° ¢ ¢
Maximizar x y sujeto a x + y = 1001 [P 0 ] L x, y ; ∏ = x y + ∏(1001 ° x ° y)
la solución exacta sería f § = 2505000 5.
6. El problema básico de programación no lineal

El siguiente ejemplo muestra un problema de maximización de la utilidad de un consumidor,
sujeto a que gaste toda su renta disponible y servirá para ilustrar el objetivo de esta sección.
Ejemplo 13 Un consumidor puede destinar una renta de R = 300 " en consumo de ocio y cultura (x),
y en vestuario y equipamiento personal (y). Su función de utilidad es u(x, y) = 20x + 40y ° x 2 ° y 2 . Si
los precios de las variables son p x = 5 ", p y = 10 ", ¿cuántas unidades de cada tipo consumirá, dada su
renta, para maximizar su utilidad?
El problema de optimización (gastando toda la renta) es
Maximizar 20x + 40y ° x 2 ° y 2 sujeto a 5x + 10y = 300 [P ]
La lagrangiana es
°° ¢ ¢
L x, y ; ∏ = 20x + 40y ° x 2 ° y 2 + ∏(300 ° 5x ° 10y)

Como la función objetivo es estrictamente cóncava y la restricción es lineal, hay un único punto crítico
que es solución del problema: x § = 12, y § = 24, que le proporciona una utilidad u § = u(12, 24) = 480.
Sin embargo, si se permite que el consumidor no gaste toda su renta, puede elegir x = 10, y = 20, con lo
que incurre en un gasto de 250 " y obtiene una utilidad u(10, 20) = 500, que es superior. Un consumi-
dor racional eligiría esta opción antes que el óptimo restringido con igualdad. Por tanto, el problema
adecuado que el consumidor debe plantearse es
Maximizar 20x + 40y ° x 2 ° y 2 sujeto a 5x + 10y ∑ 300
es decir, maximizar su utilidad sujeto a que no sobrepase la renta disponible.
En lo que queda se analizarán problemas de optimización cuyas restricciones pueden ser de des-
igualdad. El problema estándar [PE ] que se estudiará es:
9
Maximizar f (x 1 , x 2 , . . . , x n ) >
>
>
>
sujeto a >
>
>
=
g 1 (x 1 , x 2 , . . . , x n ) ∑ b 1
[PE ]
g 2 (x 1 , x 2 , . . . , x n ) ∑ b 2 >
>
>
>
... >
>
>
;
g m (x 1 , x 2 , . . . , x n ) ∑ b m
El primer paso es observar que cualquier problema de optimización se puede escribir en forma es-
tándar sin más que aplicar las siguientes consideraciones:
1. Si se desea minimizar una función objetivo, basta cambiar el signo de dicha función y maximi-
zarla. El punto donde se alcanza el óptimo es el mismo y solo cambia el signo del valor óptimo:
Minimizar f (x 1 , x 2 , . . . , x n ) ¥ ° Maximizar ° f (x 1 , x 2 , . . . , x n )
2. Si en alguna restricción la desigualdad está en sentido contrario, g j (x 1 , x 2 , . . . , x n ) ∏ b j , basta

multiplicar por (°1) ambos lados y la desigualdad cambia de sentido
°g j (x 1 , x 2 , . . . , x n ) ∑ °b j
3. Si alguna restricción es de igualdad, g j (x 1 , x 2 , . . . , x n ) = b j , ésta se descompone en dos desigual-

dades
g j (x 1 , x 2 , . . . , x n ) ∑ b j g j (x 1 , x 2 , . . . , x n ) ∏ b j
y a continuación la segunda se transforma como en el apartado anterior.
La lagrangiana del problema estándar [PE ] se construye de forma análoga al caso de problemas de
optimización con restricciones de igualdad
° ¢
L(x; ∏) = f (x) + ∏ · b ° g (x)
pero, a diferencia de lo que ocurre allí, esta función no coincide con la función objetivo en los puntos
que cumplen las restricciones, ya que b ° g (x) no tiene porqué anularse. Este hecho será relevante
cuando se impongan las condiciones que deben cumplir las soluciones del problema.

Ejemplo 14 Escribe el siguiente problema en forma estándar y calcula la lagrangiana:
Minimizar x 2 + (y ° 1)2 + z 2 sujeto a x ° 1 ∑ y; x + z = 0 [P ]
1. El primer paso es escribir el problema de maximizar
° Maximizar ° x 2 ° (y ° 1)2 ° z 2
2. La primera restricción se transforma en x ° y ∑ 1
3. La segunda restricción es de igualdad, luego hay que escribir dos desigualdades:
x + z ∑ 0; x + z ∏ 0 ) x + z ∑ 0; °x ° z ∑ 0
Ahora, el problema en forma estándar es
° Maximizar ° x 2 ° (y ° 1)2 ° z 2 sujeto a x ° y ∑ 1; x + z ∑ 0; °x ° z ∑ 0 [PE ]

° ¢
L (x, y, z); (∏1 , ∏2 , ∏3 ) = °x 2 ° (y ° 1)2 ° z 2 + ∏1 (1 ° x + y) + ∏2 (°x ° z) + ∏3 (x + z)
Nota 5 Para la construcción de la lagrangiana y para resolver el problema, se ignora el signo menos
que aparece antes de maximización y después, una vez obtenida la solución, se cambiará el signo del
valor óptimo f § de la función objetivo. El punto que optimiza (maximiza) la función, x § , es el que se
ha obtenido. También puede sustituirse el punto x § en la función objetivo que se quería minimizar.
7. Condiciones necesarias de Karush-Kuhn-Tucker

Teorema 4 (Teorema de Karush-Kuhn-Tucker: condiciones necesarias de óptimo con restricciones de
desigualdad) Si x § = (x 1§ , x 2§ , . . . , x n§ ) es un máximo local del problema [PE ] y se cumple que los vecto-
© ™
res gradientes rg 1 (x § ), rg 2 (x § ), . . . , rg m (x § ) son linealmente independientes (condición de regula-
° ¢
ridad), entonces existen valores para los multiplicadores de Lagrange ∏§ = ∏§1 , ∏§2 , . . . , ∏§m de manera
que (x § ; ∏§ ) cumple las siguientes condiciones
@L(x § ; ∏§ )
=0 8i = 1, 2, . . . , n [K T 1]
@x i
@L(x § ; ∏§ )
∏§j =0 8 j = 1, 2, . . . , m [K T 2]
@∏ j
g j (x § ) ∑ b j 8 j = 1, 2, . . . , m [K T 3]
∏§j ∏ 0 8 j = 1, 2, . . . , m [K T 4]
Como en casos anteriores, las condiciones necesarias indican los puntos candidatos a ser ópti-
mos (máximos en este caso). Para calcular estos puntos se usan las condiciones que son de igualdad,
[K T 1] y [K T 2], y se comprueba si los puntos obtenidos cumplen las condiciones con desigualdad,
[K T 3] que son las restricciones del problema, y [K T 4] que indican la no negatividad de los multi-
plicadores. Estas dos condiciones hacen que ciertos puntos obtenidos con las condiciones [K T 1] y
[K T 2] deban ser descartados.

Por otro lado, la condición [K T 2], que se denomina condición de holgura complementaria, se
puede escribir como
° ¢
∏§j b j ° g j (x § ) = 0 8 j = 1, 2, . . . , m [K T 2]
con lo que en un punto óptimo se cumple
m
X ° ¢
L(x § ; ∏§ ) = f (x § ) + ∏§j b j ° g j (x § ) = f (x § )
j =1
es decir, la lagrangiana coincide con la función objetivo (como en el caso de problemas con restric-
ciones de igualdad). La condición [K T 2] indica además que cuando una restricción no se satura (se
cumple con desigualdad estricta) el multiplicador de Lagrange que le corresponde se anula en el pun-
to óptimo.
Ejemplo 15 Calcula los puntos que cumplen las condiciones de Karush-Kuhn-Tucker del siguiente
problema y analiza gráficamente (mediante curvas de nivel) si son solución del problema.
Maximizar x ° y sujeto a x 2 + y 2 ∑ 1 [PE ]

° ¢
La lagrangiana del problema es L (x, y); ∏ = x ° y + ∏(1 ° x 2 ° y 2 ) y las condiciones [K T ] son
@L @L
= 1 ° 2∏x = 0 = °1 ° 2∏y = 0 [K T 1]
@x @y
∏(1 ° x 2 ° y 2 ) = 0 [K T 2]
x2 + y 2 ∑ 1 [K T 3]
∏∏0 [K T 4]
1 1
De la condición [K T 1] se obtiene que ∏ 6= 0, x 6= 0, y 6= 0, ∏ = = ° , y = °x. Sustituyendo en [K T 2]
2x 2y
1
se tiene que 2x 2 = 1, de donde x = ± p . Luego se obtienen dos posibles puntos:
2
µµ ∂ ∂ µµ ∂ ∂
1 1 1 1 1 1
p ,°p ; p °p , p ;°p
2 2 2 2 2 2
Como, por [K T 4], el multiplicador ha de ser mayor o igual a cero, el segundo punto se descarta y solo
queda el primero (que cumple todas las condiciones) como candidato a solución del problema.
Gráficamente, utilizando curvas de nivel, se observa que este punto es laµ solución del∂ problema (ver
1 1 2 p
figura 4.5). El valor máximo restringido de la función objetivo es f máx = f p , ° p = p = 2.
2 2 2

Figura 4.5: Curvas de nivel y conjunto factible en el ejemplo 15
Para problemas en los que la representación gráfica no es posible (más de dos variables) o no es
fácil, es necesario aplicar condiciones suficientes para saber si un punto que cumple las condiciones
[K T ] es solución del problema. Aunque estas condiciones se verán con detalle en la sección siguiente,
un caso particular es cuando la función objetivo del problema es cóncava y el conjunto de oportuni-
dades definido por las restricciones es un conjunto convexo. En este caso, las condiciones [K T ] son
también suficientes.
Ejemplo 16 Resuelve el problema de maximización de utilidad con restricción de desigualdad (ver

ejemplo 13)
Maximizar 20x + 40y ° x 2 ° y 2 sujeto a 5x + 10y ∑ 300
° ¢
La lagrangiana del problema es L (x, y); ∏ = 20x + 40y ° x 2 ° y 2 + ∏(300 ° 5x ° 10y) y las condiciones
[K T ] son
@L @L
= 20 ° 2x ° 5∏ = 0 = 40 ° 2y ° 10∏ = 0 [K T 1]
@x @y
∏(300 ° 5x ° 10y) = 0 [K T 2]
5x + 10y ∑ 300 [K T 3]
∏∏0 [K T 4]
El único punto que cumple las condiciones es x § = 10, y § = 20, ∏§ = 0. Como la función objetivo es
cóncava y el conjunto factible es convexo, este punto es la solución del problema. Obsérvese que el con-
sumidor no agota totalmente su renta ya que 5x § + 10y § = 250 < 300. Al ser la desigualdad estricta en
el óptimo, esto hace que ∏§ = 0, lo que significa que un pequeño aumento/disminución en b = 300 no
afecta al valor del óptimo. La utilidad máxima del consumidor es u máx = 500.

7.1. Restricciones de no negatividad

Aunque en el ejemplo anterior no aparece explícitamente, es obvio que las variables x, y deben
ser mayores o iguales a cero, ya que indican cantidades consumidas de los bienes. Esto ocurre en
muchos problemas de optimización con significado económico, donde las variables son cantidades
de bienes, precios, dimensiones ... Estas restricciones se denominan de no negatividad y así un pro-
blema estándar con restricciones de no negatividad se escribe en la forma:
9
Maximizar f (x 1 , x 2 , . . . , x n ) >
>
>
>
sujeto a >
>
>
>
g 1 (x 1 , x 2 , . . . , x n ) ∑ b 1 >
=
g 2 (x 1 , x 2 , . . . , x n ) ∑ b 2 [PE +]
>
>
... >
>
>
>
g m (x 1 , x 2 , . . . , x n ) ∑ b m >
>
>
;
x 1 ∏ 0, x 2 ∏ 0, . . . , x n ∏ 0
Obviamente, cambiando el sentido de las últimas n restricciones (las de no negatividad) este proble-
ma aparece ya escrito en forma estándar y se pueden aplicar las condiciones [K T ] para encontrar
los posibles óptimos. Pero al haber más restricciones aparecen más multiplicadores de Lagrange y
se complica más la resolución. En el siguiente resultado se obtienen unas condiciones equivalentes,
usando la misma lagrangiana que en el problema [PE ], que aquí se denomina lagrangiana reducida,
en la que las restricciones de no negatividad no se introducen.
Teorema 5 (Teorema de Karush-Kuhn-Tucker con no negatividad) Si x § = (x 1§ , x 2§ , . . . , x n§ ) es un má-

© ™
ximo local del problema [PE +] y se cumple que los vectores gradientes rg 1 (x § ), rg 2 (x § ), . . . , rg m (x § )
son linealmente independientes (condición de regularidad), entonces existen valores para los multi-
° ¢
plicadores de Lagrange ∏§ = ∏§1 , ∏§2 , . . . , ∏§m de manera que (x § ; ∏§ ) cumple las siguientes condiciones,
° ¢
donde la lagrangiana (reducida) es L(x; ∏) = f (x) + ∏ · b ° g (x)
@L(x § ; ∏§ )
∑0 8i = 1, 2, . . . , n [K T 1+]
@x i
@L(x § ; ∏§ )
x i§ =0 8i = 1, 2, . . . , n [K T 2+]
@x i
@L(x § ; ∏§ )
∏§j =0 8 j = 1, 2, . . . , m [K T 3+]
@∏ j
g j (x § ) ∑ b j 8 j = 1, 2, . . . , m [K T 4+]
x i§ ∏ 0 8i = 1, 2, . . . , m [K T 5+]
∏§j ∏ 0 8 j = 1, 2, . . . , m [K T 6+]
Como antes, las condiciones que se usan para obtener los candidatos a solución son las de igual-
dad, [K T 2+] y [K T 3+]. Para los puntos obtenidos se comprueban el resto de condiciones, descartan-
do los que no las cumplan. En la resolución de estas condiciones [K T 2+] y [K T 3+] aparecen produc-
tos de dos números igualados a cero
@L(x; ∏) @L(x; ∏)
xi =0 ∏j =0
@x i @∏ j

Un método para resolverlo es ir dividiendo el problema en casos y subcasos: como el producto debe
ser cero, uno de los dos debe ser cero. Así se simplifican los cálculos que hay que realizar. Por ejemplo,
si hay que resolver las dos igualdades anteriores se tendría
caso 1) x i = 0
subcaso 1.1) ∏ j = 0
@L(x; ∏)
subcaso 1.2) =0
@∏ j
@L(x; ∏)
caso 2) =0
@x i
subcaso 2.1) ∏ j = 0
@L(x; ∏)
subcaso 2.2) =0
@∏ j
Se observa que en el subcaso 1.1 ya se sabe el valor de las variables y de los multiplicadores x i = 0,
∏ j = 0 y solo hay que comprobar si cumple el resto de condiciones. En otros subcasos simplemente
lo que se tiene con este método son ecuaciones más fáciles de resolver.
Ejemplo 17 Calcula los puntos que cumplen las condiciones de Karush-Kuhn-Tucker del siguiente
problema y analiza gráficamente (mediante curvas de nivel) si son solución del problema.
Maximizar x ° y sujeto a x 2 + y 2 ∑ 1 x ∏ 0, y ∏ 0 [PE +]
° ¢
La lagrangiana reducida del problema es L (x, y); ∏ = x ° y +∏(1°x 2 ° y 2 ). Las condiciones [K T +] son
@L @L
= 1 ° 2∏x ∑ 0 = °1 ° 2∏y ∑ 0 [K T 1+]
@x @y
@L @L
x = x(1 ° 2∏x) = 0 y = y(°1 ° 2∏y) = 0 [K T 2+]
@x @y
∏(1 ° x 2 ° y 2 ) = 0 [K T 3+]
x2 + y 2 ∑ 1 [K T 4+]
x ∏ 0, y ∏ 0 [K T 5+]
∏∏0 [K T 6+]
De las condiciones [K T 2+] se tienen los siguientes casos:
caso 1) x = 0, y = 0 ) no cumple [K T 1+]
caso 2) x = 0, °1 ° 2∏y = 0 ) no cumple [K T 1+]

° ¢
caso 3) 1 ° 2∏x = 0, y = 0; sustituyendo en [K T 3+] se tiene que ∏ 1 ° x 2 = 0, de donde
subcaso 3.1) ∏ = 0 ) no cumple [K T 1+]

1 1
subcaso 3.2) 1 ° x 2 = 0 ) x = 1, ∏ = ) posible solución (1, 0), con ∏ =
2 2
caso 4) 1 ° 2∏x = 0, °1 ° 2∏y = 0 ) 2∏y = °1 ) no cumple [K T 5+], [K T 6+]
Por tanto, hay un único candidato a solución que cumple todas las condiciones del teorema 5.
Gráficamente, utilizando curvas de nivel, se observa que este punto es la solución del problema (ver
figura 4.6). El valor máximo restringido de la función objetivo es f máx = f (1, 0) = 1.

8. Programación cóncava
Una vez obtenidos los puntos que cumplen las condiciones necesarias queda analizar si son solu-
ción del problema. Un modo, utilizado en los ejemplos anteriores, es la discusión gráfica mediante las
curvas de nivel de la función. Pero esto solo es posible con funciones de dos variables para las que sea
relativamente sencillo poder dibujar sus curvas de nivel, y cuando sea también fácil de representar el
conjunto factible (puntos que cumplen todas las restricciones). No existen condiciones suficientes en
un caso general, y se necesita concavidad de la función que se desea maximizar y la convexidad del
conjunto factible. Cuando se dan estas condiciones se habla de problemas de programación cónca-
va.
Teorema 6 Sea (x § ; ∏§ ) un punto que cumple las condiciones [K T ] de un problema en forma estándar
[PE ]. Si la función objetivo f (x) es cóncava, y el conjunto factible (conjunto de puntos que cumplen
todas las restricciones) es convexo, en x § se alcanza una solución global del problema [PE ].
La concavidad de la función objetivo puede sustituirse por cuasi-concavidad y el resultado sigue

siendo cierto. Para asegurar que el conjunto factible (también denominado conjunto de oportuni-
dades) es convexo, un modo fácil es analizar si las funciones g i (x) que definen las restricciones son
convexas o cuasi-convexas. Si el problema tiene restricciones de no negatividad, basta sustituir las
condiciones [K T ] por las condiciones [K T +] y se obtiene el resultado correspondiente para este tipo
de problemas.
Así, otro modo de ver que el punto obtenido en el ejemplo 17 es solución del problema consiste
en comprobar si la función objetivo es cóncava (sí que lo es, por ser lineal) y la función que define la
restricción es convexa (ya se ha visto que, efectivamente, g (x, y) = x 2 + y 2 es una función convexa).

En resumen, para resolver un problema de optimización con restricciones de desigualdad:
Se pone el problema en forma estándar
Se comprueba la condición de regularidad
Se prueba que la función objetivo es cóncava o cuasi-cóncava
Se prueba que las funciones que definen las restricciones son convexas o cuasi-convexas
Se calcula la lagrangiana (o lagrangiana reducida) del problema
Se obtienen los candidatos a solución: puntos que cumplen [K T ] (o [K T +])
De este modo, los puntos obtenidos serán solución del problema.
Ejemplo 18 Calcula la solución del problema
Maximizar ° x 2 ° 2y 2 + x y sujeto a x + y ∑ 2 ° x + y ∑ 1 x ∏ 0, y ∏ 0 [PE +]
Es inmediato ver que la función objetivo es (estrictamente) cóncava, sin más que calcular su
matriz hessiana.
Las funciones que definen las restricciones son lineales, luego son convexas.
Se cumple la condición de regularidad, ya que los gradientes rg 1 = (1, 1), rg 2 = (°1, 1) son li-
nealmente independientes.
Por tanto el punto que cumpla las condiciones [K T +] será solución del problema.
° ¢
La lagrangiana reducida del problema es L (x, y); ∏ = °x 2 ° 2y 2 + x y + ∏(2 ° x ° y) + µ(1 + x ° y). Las
condiciones [K T +] son
@L @L
= °2x + y ° ∏ + µ ∑ 0 = °4y + x ° ∏ ° µ ∑ 0 [K T 1+]
@x @y
@L @L
x = x(°2x + y ° ∏ + µ) = 0 y = y(°4y + x ° ∏ ° µ) = 0 [K T 2+]
@x @y
∏(2 ° x ° y) = 0 µ(1 + x ° y) = 0 [K T 3+]
x+y ∑2 °x + y ∑ 1 [K T 4+]
x ∏ 0, y ∏ 0 [K T 5+]
∏ ∏ 0, µ ∏ 0 [K T 6+]
De las condiciones [K T 3+] se tienen los siguientes casos:
caso 1) ∏ = 0, µ = 0 ) posible solución x = 0, y = 0
caso 2) ∏ = 0, 1 + x ° y = 0 ) se obtienen los puntos:
x = 0, y = 1, µ = 4 no cumple [K T 1+];
5 9 1
x = , y = ,µ= no cumple [K T 4+]
4 4 4

caso 3) 2 ° x ° y = 0, µ = 0 ) se obtienen los puntos:
x = 0, y = 2, ∏ = °8 no cumple [K T 6+];
x = 2, y = 0, ∏ = °4 no cumple [K T 6+];
5 4 7
x = , y = ,∏=° no cumple [K T 6+]
4 4 4
1 3 5
caso 4) 2 ° x ° y = 0, 1 + x ° y = 0 ) x = , y = , ∏ = ° , µ = °2 no cumple [K T 6+]
2 2 2
Por tanto, hay un único punto que cumple todas las condiciones del teorema 5, (x § , y § ) = (0, 0). Como
se verifican las condiciones suficientes, dicho punto es solución del problema. El valor óptimo de la
función objetivo es f máx = f (0, 0) = 0. La figura 4.7 muestra la resolución gráfica del problema.
Nota 6 Como la función objetivo f (x, y) = °x 2 ° 2y 2 + x y es estrictamente cóncava y las restricciones

están definidas por funciones lineales, se sabe que el máximo se alcanza en un único punto. Por tanto,
una vez obtenido dicho punto en el caso 1) podría haberse finalizado el problema, sin necesidad de
analizar todos los otros casos.
Ejemplo 19 Un fondo de inversión dispone de M millones de euros para invertir en n proyectos in-
dustriales. De cada uno de ellos obtiene un beneficio b i que es función de la cantidad m i invertida en
dicho proyecto, b i = f i (m i ), donde las funciones f i (x) son cóncavas. Plantea el problema de maximiza-
ción del beneficio total, calcula las condiciones necesarias y suficientes del punto óptimo, e interpreta
económicamente el significado del multiplicador de Lagrange.
El problema puede expresarse del siguiente modo:
n
X n
X n
X
Maximizar bi = f i (m i ) sujeto a mi ∑ M m i ∏ 0 8i = 1, 2, . . . , n
i =1 i =1 i =1
√ !
n
X n
X
La lagrangiana de este problema es L ((m 1 , m 2 , . . . , m n ); ∏) = f i (m i ) + ∏ M ° m i y como la fun-
i =1 i =1
ción objetivo es cóncava (por serlo las funciones f i (x)) y la restricción es lineal, las condiciones (necesa-

rias y suficientes) [K T +] de óptimo son:
@L
= f i0 (m i ) ° ∏ ∑ 0 i = 1, 2, . . . , n [K T 1+]
@m i
@L ° ¢
mi = m i f i0 (m i ) ° ∏ = 0 i = 1, 2, . . . , n [K T 2+]
@m i
√ !
n
X
∏ M° mi = 0 [K T 3+]
i =1
n
X
mi ∑ M [K T 4+]
i =1
mi ∏ 0 i = 1, 2, . . . , n [K T 5+]
∏∏0 [K T 6+]
La primera condición indica

f i0 (m i ) ∑ ∏
con lo que ∏ será una cota superior del beneficio marginal en cada proyecto. La segunda condición
implica que solo se invertirá en aquellos proyectos en los que el beneficio marginal sea máximo, ya
que si f i0 (m i ) < ∏, entonces m i = 0. Si en el óptimo ∏ 6= 0, entonces la tercera condición indica que se
invertirá todo el capital disponible.
9. Un caso particular de la Programación Cóncava: Programación Lineal

Cuando tanto la función objetivo como las funciones que definen las restricciones son funciones
lineales se cumplen las condiciones suficientes de los teoremas y se está por tanto en casos de pro-
gramación cóncava. Este caso particular se denomina programación lineal y es habitual en modelos
económicos, gestión de recursos, finanzas, organización de empresas, ... Algunos ejemplos típicos
son: elaboración de mezclas o dietas óptimas, la gestión de inventarios, composición de carteras de
inversión, gestión de finanzas, asignación de recursos humanos y tecnológicos, planificación de cam-
pañas de publicidad, aprovechamiento óptimo de recursos (hidrográficos, energéticos, ...), problemas
de transporte, etc.
Al ser la programación lineal un caso de programación cóncava, basta aplicar las condiciones
necesarias para calcular la solución. Pero los problemas reales de programación lineal suelen tener
muchas restricciones y variables, lo que hace que sea laboriosa su resolución a mano aplicando las
condiciones de Karush-Kuhn-Tucker. Se han encontrado diversos algoritmos que facilitan la resolu-
ción y, con la ayuda de ordenadores, que se haga de forma rápida. El principal método es el conocido
como algoritmo del simplex.
El problema lineal estándar se expresa en la forma
9
Maximizar c1 x1 + c2 x2 + . . . + cn xn >
>
>
>
sujeto a >
>
>
>
a 11 x 1 + a 12 x 2 + . . . + a 1n x n ∑ b 1 >
=
a 21 x 1 + a 22 x 2 + . . . + a 2n x n ∑ b 2 [P LE ]
>
>
... >
>
>
>
a m1 x 1 + a m2 x 2 + . . . + a mn x n ∑ b m >
>
>
;
x 1 ∏ 0, x 2 ∏ 0, . . . , x n ∏ 0

Escrito en forma matricial quedaría

9
Maximizar c ·x >
>
>
=
sujeto a
[P LE ]
Ax ∑ b >
>
>
x ∏0 ;
donde
0 1 0 1 0 1 0 1
c1 x1 a 11 a 12 ... a 1n b1
B C B C B C B C
B c2 C B x2 C B a 21 a 22 ... a 2n C B b2 C
c =B
B .. C
C x =B
B .. C
C A=B
B .. .. .. C
C b=B
B .. C
C
@ . A @ . A @ . . . A @ . A
cn xn a m1 a m2 ... a mn bm
Como ya se ha comentado en general, cualquier problema de programación lineal se puede expresar

en forma estándar:
Si el problema es de minimizar, se cambia el signo de la función objetivo y se maximiza (el

óptimo del problema original será el de maximización cambiado de signo, y se alcanza en el
mismo punto).
Las restricciones que aparezcan como mayor o igual, se multiplican por (°1) y la desigualdad
cambia de sentido (pasa a ser menor o igual).
Si hay alguna restricción de igualdad, se sustituye por dos desigualdades (una mayor o igual, y
la otra menor o igual).
Si alguna variable no está sujeta a restricción de no negatividad, se sustituye por la resta de dos
variables no negativas.
El siguiente ejemplo muestra todos estos cambios.
Ejemplo 20 Escribe el siguiente problema en forma estándar:
Minimizar x ° 2y sujeto a x + y ∑ 2 x ° 3y = 1 x ∏ 0
En primer lugar se sustituye el objetivo, pasando de minimizar a maximizar:
° Maximizar ° x + 2y
La primera restricción está en la forma adecuada. La segunda restricción es de igualdad, luego el

primer paso es escribir dos restricciones de desigualdad: x °3y ∑ 1, x °3y ∏ 1, y ahora la segunda
se multiplica por (°1), quedando entonces las restricciones
x+y ∑2 x ° 3y ∑ 1 ° x + 3y ∑ °1
Solo la primera variable tiene restricción de no negatividad. Por tanto hay que hacer un cambio
en la segunda variable y = y 1 ° y 2 y 1 ∏ 0, y 2 ∏ 0
Con todo esto, el problema en forma estándar es:
° Maximizar ° x + 2y 1 ° 2y 2
sujeto a x + y 1 ° y 2 ∑ 2; x ° 3y 1 + 3y 2 ∑ 1; °x + 3y 1 ° 3y 2 ∑ °1; x ∏ 0, y 1 ∏ 0, y 2 ∏ 0

Trabajando con el problema estándar

9
Maximizar c ·x >
>
>
=
sujeto a
[P LE ]
Ax ∑ b >
>
>
x ∏0 ;
la lagrangiana es L(x; ∏) = c · x + ∏ · (b ° Ax) x 2 Rn , ∏ 2 Rm . Las condiciones [K T +] son necesarias y

suficientes para que un punto sea solución del problema:
@L(x § ; ∏§ )
= c ° ∏§ A ∑ 0 , ∏§ A ∏ c [K T 1+]
@x
@L(x § ; ∏§ )
x§ · = x § · (c ° ∏§ A) = 0 [K T 2+]
@x
@L(x § ; ∏§ )
∏§ · = ∏§ · (b ° Ax § ) = 0 [K T 3+]
@∏
Ax § ∑ b [K T 4+]
x§ ∏ 0 [K T 5+]
∏§ ∏ 0 [K T 6+]
Las condiciones de igualdad, [K T 2+] y [K T 3+] son conocidas como condiciones de holgura com-
plementaria. Si una restricción no se da con igualdad, la variable o multiplicador de Lagrange que
está multiplicando debe valer cero. Y, recíprocamente, si una variable o multiplicador no valen cero,
la correspondiente restricción debe cumplirse con igualdad.
Ejemplo 21 Resuelve el problema
Maximizar 5x + y sujeto a 4x ° y ∑ 2 x + y ∑ 3 x ∏ 0, y ∏ 0
° ¢
La lagrangiana es L (x, y); (∏, µ) = 5x + y +∏(2°4x + y)+µ(3°x ° y) y las condiciones que caracterizan
los óptimos son
æ
§ 4∏ + µ ∏ 5
∏ A∏c ) [K T 1+]
°∏ + µ ∏ 1
æ
§ § x(5 ° 4∏ ° µ) = 0
x · (c ° ∏ A) = 0 ) [K T 2+]
y(1 + ∏ ° µ) = 0
æ
§ § ∏(2 ° 4x + y) = 0
∏ · (b ° Ax ) = 0 ) [K T 3+]
µ(3 ° x ° y) = 0
æ
§ 4x ° y ∑ 2
Ax ∑ b ) [K T 4+]
x+y ∑3
x§ ∏ 0 ) x ∏ 0, y ∏ 0 [K T 5+]
∏§ ∏ 0 ) ∏ ∏ 0, µ ∏ 0 [K T 6+]

Como se observa, a pesar de ser un problema sencillo (dos variables, dos restricciones), la resolución
con cuatro incógnitas y un gran número de ecuaciones e inecuaciones sería laboriosa. Si se representa
el problema gráficamente y se dibujan curvas de nivel (ver figura 4.8) se ve fácilmente que el máximo se
alcanza en el punto (1, 2) con un valor f máx = 7. Se puede comprobar que este punto cumple todas las
condiciones [K T +].
Figura 4.8: Conjunto factible y curvas de nivel en el ejemplo 21
Hay que observar que el conjunto factible es un conjunto compacto y convexo, con vértices en los
puntos (0, 0), (00 5, 0), (1, 2) y (0, 3). La solución se alcanza en uno de los vértices. Este hecho es general y
proporciona un método, en problemas con dos variables, o dos restricciones, para encontrar fácilmente
la solución.
9.1. Características de los programas lineales. Existencia y unicidad de solución

Las principales características de los problemas de programación lineal son:
1. La función objetivo es lineal (y, por tanto, cóncava, continua y diferenciable).
2. Las restricciones vienen definidas por funciones lineales y, por tanto, el conjunto factible es
convexo, con un número finito de vértices definidos por las intersecciones de las restricciones.
3. Cuando el conjunto factible sea acotado (lo que dependerá de las restricciones) y no vacío,
será compacto y, siendo la función continua, se podrá aplicar el teorema de Weierstrass que
garantiza la existencia de solución. Cuando no sea acotado, puede que exista solución o que no
exista (el máximo sería infinito), dependiendo de la función objetivo.
4. Cuando existe solución, ésta será global. Pero, al tratarse de una función lineal, no es estricta-
mente cóncava y el óptimo puede alcanzarse en varios puntos.
5. La solución, en caso de existir, siempre se alcanza al menos en un vértice (punto extremo). Esta
propiedad proporciona un método para encontrar la solución cuando existe: basta calcular el
valor de la función objetivo en los puntos extremos y elegir el (o los) que den el mayor valor en
un problema estándar.

Ejemplo 22 En el ejemplo 21 la función objetivo es f (x, y) = 5x + y. Calculando su valor en los vértices:
f (0, 0) = 0 f (0, 3) = 3 f (00 5, 0) = 20 5 f (1, 2) = 7
Por tanto, la solución se alcanza en el punto (1, 2) y el máximo de la función objetivo es f máx = 7 (tal
como se había obtenido con curvas de nivel).
Existencia de solución en un programa lineal

Hay dos motivos por los que un problema de programación lineal puede no tener solución:
El conjunto factible es vacío: no existe ningún punto que cumple todas las restricciones. En
este caso el problema no tiene sentido.
El conjunto factible es no acotado y la función objetivo (a maximizar) crece de manera ilimi-

tada. En este caso la función puede tomar valores tan grandes como se quiera y no existe, por
tanto, el máximo.
En el caso de conjuntos factibles no acotados, la existencia o no de máximo depende únicamente de

la función objetivo y en ocasiones existirá máximo y en otras no, como puede verse en las figuras 4.9
y 4.10.
Figura 4.9: Conjunto factible no acotado y función sin máximo
Unicidad de solución en un programa lineal

Como las funciones lineales no son estrictamente cóncavas, en general no se puede garantizar
que cuando existe óptimo éste se alcance en un único punto. La figura 4.10 muestra un ejemplo con
una única solución. La figura 4.11 muestra un caso donde hay infinitos puntos en los que se alcanza
el óptimo (con el mismo valor en todos, ya que el óptimo es global).
Ejemplo 23 Calcula el máximo de la función f (x, y) = x + 2y en el conjunto definido en la figura 4.11.
Dibujando curvas de nivel, se observa que todos los puntos en el segmento que une (1, 2) y (3, 1) pro-
porcionan el mismo valor (máximo) de la función objetivo, f máx = 5. Por tanto, todos estos puntos son
solución del problema.

Figura 4.10: Conjunto factible no acotado y función con máximo
Figura 4.11: Problema con infinitas soluciones

En caso de que la solución se alcance en más de un punto, el hecho de que la función objetivo sea
lineal hace que el mismo valor en todo el segmento que une dichos puntos y, por tanto, el problema
tiene infinitas soluciones, como muestra el siguiente razonamiento:
Si x § , y § son dos soluciones distintas del problema de programación lineal, al ser la so-
lución global se cumple que c · x § = c · y § = f máx , que es el valor máximo de la función
objetivo. Entonces
° ¢
8Æ 2 [0, 1] c · Æx § + (1 ° Æ)y § = Æc · x § + (1 ° Æ)c · y § = Æ f máx + (1 ° Æ) f máx = f máx
lo que significa que z § = Æx § + (1 ° Æ)y § es también solución del problema.
9.2. Dualidad
Definición 2 Dado un programa lineal en forma estándar
9
Maximizar c ·x >
>
>
=
sujeto a
[P LE ]
Ax ∑ b >
>
>
x ∏0 ;
se denomina programa dual al problema

9
Minimizar b·y >
>
>
=
sujeto a
yA ∏c >
>
>
;
y ∏0
Cuando se estudian ambos problemas a la vez, al inicial se le denomina programa primal.
Como puede observarse en la definición anterior, a partir del problema en forma estándar el dual
se construye del siguiente modo:
Es un problema de minimizar.
Tiene tantas variables como restricciones tiene el primal.
El vector de coeficientes de la función objetivo es el de términos independientes del primal.
Tiene tantas restricciones como variables tiene el primal.
El vector de términos independientes es el vector de coeficientes de la función objetivo del

primal.
La matriz de coeficientes es la traspuesta de la matriz del primal.3
Las desigualdades en las restricciones son de mayor o igual (∏).
Ejemplo 24 Calcula el dual del siguiente problema:
Maximizar 5x + y sujeto a 4x ° y ∑ 2 x + y ∑ 3 ° x + 2y ∏ 2 x ∏ 0, y ∏ 0
3 Obsérvese que es lo mismo escribir y A ∏ c que escribir A 0 y 0 ∏ c 0 . En el primer caso los vectores y, c se consideran
vectores fila, mientras en el segundo y 0 , c 0 son vectores columna.

El primer paso es escribir el problema en forma estándar
Maximizar 5x + y sujeto a 4x ° y ∑ 2 x + y ∑ 3 x ° 2y ∑ °2 x ∏ 0, y ∏ 0
Ahora, el problema dual es
Minimizar 2u + 3v ° 2w sujeto a 4u + v + w ∏ 5 ° u + v ° 2w ∏ 1 u ∏ 0, v ∏ 0, w ∏ 0
Si ahora se escribe este problema también en forma estándar queda:
° Maximizar ° 2u ° 3v + 2w sujeto a ° 4u ° v ° w ∑ °5 u ° v + 2w ∑ °1 u ∏ 0, v ∏ 0, w ∏ 0
Teorema de dualidad
Si se analizan conjuntamente un problema y su dual
9 9
Maximizar c ·x > > Minimizar b·y >
>
>
= >
=
sujeto a sujeto a
[P P ] [P D]
Ax ∑ b >> yA ∏c >
>
> >
x ∏0 ; y ∏0 ;
escribiendo el dual en forma estándar queda

9
° Maximizar °b · y >
>
>
=
sujeto a
[P D]
°y A ∑ °c >
>
>
;
y ∏0
las condiciones necesarias y suficientes [K T +] que debe cumplir una solución son
∏§ A ∏ c [K T 1+] Aµ§ ∑ b [K T 1+]
x § · (c ° ∏§ A) = 0 [K T 2+] y § · (b ° Aµ§ ) = 0 [K T 2+]
∏§ · (b ° Ax § ) = 0 [K T 3+] µ§ · (c ° y § A) = 0 [K T 3+]
Ax § ∑ b [K T 4+] y§ A ∏ c [K T 4+]
x§ ∏ 0 [K T 5+] y§ ∏ 0 [K T 5+]
∏§ ∏ 0 [K T 6+] µ§ ∏ 0 [K T 6+]
Se observa que ambas coinciden sin más que cambiar x § ¥ µ§ , ∏§ ¥ y § . Por tanto, ambos problemas
tienen solución o no la tiene ninguno; la solución (valor óptimo de la función objetivo) coincide (esto
sale de las condiciones [K T 2+]); y los puntos donde se alcanza la solución de uno, coinciden con
los multiplicadores del otro. Este resultado es conocido como teorema de dualidad. En resumen, las
relaciones entre un problema y su dual son las siguientes:
El problema dual del dual es el problema primal (por esta razón es indiferente a cual se deno-
mine problema primal y a cual problema dual).
Un problema de programación lineal tiene solución si, y solo si, su problema dual tiene solu-
ción.

El valor óptimo (máximo o mínimo, dependiendo del problema) de la función objetivo es el

mismo para un problema y su dual.
Los multiplicadores de Lagrange de un problema en la solución proporcionan el punto en el

que alcanza la solución el problema dual.
El punto en que un problema alcanza la solución son los multiplicadores de Lagrange de su

problema dual.
Las propiedades anteriores permiten resolver gráficamente problemas con más de dos variables,
siempre que no tengan más de dos restricciones (sin considerar las de no negatividad).
Ejemplo 25 Calcula la solución del problema de programación lineal
Maximizar ° 3x 1 ° 9x 2 ° 17x 3 ° 12x 4
sujeto a x 1 ° x 2 ° x 3 ° 3x 4 ∑ 5 ° x 1 ° x 2 ° 3x 3 + 2x 4 ∑ °1 x 1 ∏ 0, x 2 ∏ 0, x 3 ∏ 0, x 4 ∏ 0
Como el problema tiene 4 variables no se puede resolver gráficamente. Pero como solo hay dos restric-
ciones (sin considerar las de no negatividad), su problema dual tendrá dos variables y se puede resolver
gráficamente.
Minimizar 5u ° v sujeto a u ° v ∏ °3 ° u ° v ∏ °9 ° u ° 3v ∏ °17 ° 3u + 2v ∏ °12 u ∏ 0, v ∏ 0
Dibujando el conjunto factible (ver figura 4.12) se observa que los vértices son (0, 0), (0, 3), (2, 5), (5, 4),
(6, 3) y (4, 0). Evaluando la función objetivo en estos puntos se obtiene la solución del problema. El
resultado es u = 0, v = 3. El valor óptimo (mínimo) de la función objetivo es f mı́n = °3.
Figura 4.12: Conjunto factible y cálculo de la solución en el ejemplo 25
Entonces el problema inicial también tiene solución y el valor óptimo (máximo) de la función objetivo
es f máx = °3. Para calcular en qué punto se alcanza el óptimo se usan las condiciones de holgura com-
plementaria [K T 2+] y [K T 3+], que indican que el producto de cada variable de los problemas primal
y dual por la restricción correspondiente debe anularse. Esto es,

u(5 ° x 1 + x 2 + x 3 + 3x 4 ) = 0
v(°1 + x 1 + x 2 + 3x 3 ° 2x 4 ) = 0
x 1 (u ° v + 3) = 0
x 2 (°u ° v + 9) = 0
x 3 (°u ° 3v + 17) = 0
x 4 (°3u + 2v + 12) = 0
Sustituyendo u = 0, v = 3, en las anteriores ecuaciones se obtiene x 1 = 1, x 2 = 0, x 3 = 0, x 4 = 0, que es el

punto donde se alcanza la solución del problema inicial.
9.3. Interpretación de las condiciones de holgura complementaria

Las condiciones de holgura complementaria indican que cuando una restricción no se satura4 la
variable correspondiente del problema dual debe ser cero. Y, recíprocamente, si una variable del pro-
blema toma un valor distinto de cero en el óptimo, la restricción del problema dual que le correspon-
de se saturará (se cumplirá con igualdad). Estas propiedades pueden interpretarse económicamente,
como muestra el siguiente ejemplo.
Ejemplo 26 Una empresa vende café molido que elabora a partir de tres tipos de grano de café: Arábica,
Brasil y Colombia. La empresa produce dos mezclas que denomina café América, que elabora a partes
iguales con granos de café Brasil y Colombia; y café Gourmet que contiene un 60 % de Arábica, un 10 %
de Colombia y el resto en granos de café de Brasil. La empresa obtiene un beneficio de 5 " por cada kilo
de café América, y de 7 " por cada kilo de café Gourmet. El stock de granos de café que tiene la empresa es
de 24000 kilos de granos de Arábica, 20000 kilos de granos de café de Brasil, y 20000 kilos de Colombia.
¿Cuántos kilos de cada tipo de mezcla producirá la empresa para maximizar beneficios?
Los datos anteriores se resumen en la siguiente tabla:
cantidad (en kilos) por cada kilo Arábica Brasil Colombia beneficio por kilo (en euros)
América 0 00 5 00 5 5
Gourmet 00 6 00 3 00 1 7
stock (kilos) 24000 20000 20000
Hay que determinar cuántos kilos de cada mezcla se elaborarán. Para formalizar el problema, se deno-
mina:
x : kilos de la mezcla café América que se producen
y : kilos de la mezcla café Gourmet que se producen
Entonces,
a) La función objetivo (los beneficios a maximizar) es f (x, y) = 5x + 7y
b) La primera restricción viene dada por la disponibilidad de café Arábica. Como la mezcla América
no contiene, y cada kilo de café Gourmet usa 00 6 kilos de Arábica, la restricción es 00 6y ∑ 24000.
c) La segunda restricción la define la cantidad de café Brasil disponible. Como cada kilo de América
contiene 00 5 kilos de Brasil, y cada kilo de Gourmet necesita 00 3 kilos de Brasil, la restricción que se
tiene es 00 5x + 00 3y ∑ 20000.
d) De manera análoga se obtiene la restricción debida a la disponibilidad de café Colombia, que será
00 5x + 00 1y ∑ 20000.
4 No se agota la cantidad disponible y la restricción se cumple con desigualdad estricta.

Añadiendo las restricciones de no negatividad (es obvio que no se pueden producir cantidades negati-
vas), queda el problema
9
Maximizar 5x + 7y >
>
>
>
sujeto a >
>
0
>
=
0 6y ∑ 24000
00 5x + 00 3y ∑ 20000 >
>
>
00 5x + 00 1y ∑ 20000 >
>
>
>
;
x ∏ 0 ∏ 0, y ∏ 0
Gráficamente (ver figura 4.13) se observa que la solución se alcanza en el punto (16000, 40000), es decir
la empresa producirá 16000 kilos de café América y 40000 kilos de café Gourmet. Con esta producción:
Agotará su disponibilidad de café Arábica (la primera restricción se satura).
Agotará la cantidad de café Brasil disponible (la segunda restricción también se satura).
Solo usa 12000 de los 20000 kilos de café Colombia disponibles (por tanto, la tercera restricción
no se satura).
Figura 4.13: Conjunto de oportunidades en el ejemplo 26
El problema dual es
9
Minimizar 24000u + 20000v + 20000w > >
>
>
sujeto a >
=
0 0
0 5v + 0 5w ∏ 5
>
>
00 6u + 00 3v + 00 1w ∏ 7 >
>
>
;
u ∏ 0, v ∏ 0, w ∏ 0

La interpretación de este problema es la de minimizar el coste de adquirir las materias primas

(café de Arábica, Brasil, Colombia) a unos precios respectivos u, v, w con la restricción de que al menos
debe obtener el beneficio que se obtenía con las mezclas. Las variables del problema dual se conocen
como precios sombra. En el caso del café Colombia, su precio w sería cero, ya que hay excedente de esta
materia prima, y el empresario no tiene ningún interés en adquirir cantidades adicionales de este tipo.
Las variables duales, que coinciden con los multiplicadores de Lagrange del problema primal, indi-
can cómo varía el óptimo cuando se modifica el término independiente de la restricción. En el ejemplo,
un aumento en la cantidad de café de Colombia no modifica el valor máximo, ya que no es posible pro-
ducir más kilos de las mezclas América y Gourmet. Sí que hay un aumento en el óptimo si se dispone
de más cantidad de los otros tipos de café: és fácil, usando las condiciones de holgura complementaria,
20
obtener que u = , v = 10, w = 0. Es decir, cada kilo de café Brasil adicional proporciona un beneficio
3
extra (aproximadamente) de 10 euros, mientras que cada kilo de Arábica da un beneficio adicional de
20
aproximadamente euros. Éste es el precio que el productor estaría dispuesto a pagar por adquirir
3
cantidades adicionales de estos productos.

Mates 2

Cargado por

Mates 2

Cargado por

Apuntes de Matemáticas 2

Begoña Subiza & Josep E. Peris

ÁLGEBRA LINEAL (continuación)

1. Algunos conceptos sobre vectores

2. Planos en el espacio tridimensional

1. Algunos conceptos sobre vectores

1.1. Operaciones con vectores

Figura 1.1: Suma y resta de vectores en R2

Multiplicación de un vector por un escalar:

Figura 1.2: Multiplicación de un vector por un escalar

2 Mètodes Quantitatius i Teoria Econòmica

Combinación lineal de (dos) vectores:

Producto escalar de vectores:

1.2. Norma, distancia y ángulo entre vectores

Mètodes Quantitatius i Teoria Econòmica 3

Figura 1.3: Norma o longitud de un vector en el plano R2

Ejemplo 2 Calcula la norma de los vectores del ejemplo 1.

4 Mètodes Quantitatius i Teoria Econòmica

Ejemplo 4 Normaliza los vectores del ejemplo 1.

Distancia entre dos vectores:

Figura 1.4: Distancia entre dos vectores

Ejemplo 5 Calcula la distancia entre los vectores del ejemplo 1.

Ángulo entre dos vectores:

v · w = kvk kwk cos(')

Mètodes Quantitatius i Teoria Econòmica 5

Figura 1.5: Ángulo entre dos vectores

Dos vectores v, w son perpendiculares , v · w = 0

• v = (1, °1), w = (°2, 2).

6 Mètodes Quantitatius i Teoria Econòmica

2. Planos en el espacio tridimensional

Figura 1.6: Plano en R3

(A, B,C ) · (x, y, z) = (A, B,C ) · (x 0 , y 0 , z 0 ) ) Ax + B y +C z = Ax 0 + B y 0 +C z 0

(°2, 2, °1) · (x, y, z) = (°2, 2, °1) · (1, °1, 2) ) °2x + 2y ° z = °6

x = 0, y = 0 ) °z = °6 ) z =6 ) se tiene el punto (0, 0, 6)

x = 0, y = 1 ) 2 ° z = °6 ) z =8 ) se tiene el punto (0, 1, 8)

hiperplano es un conjunto de la forma

Mètodes Quantitatius i Teoria Econòmica 7

3a ° a + 5a = °21 ) 7a = °21 ) a = °3 y se tiene el punto (°3, °3, °3)

2.1. Posición de dos planos en el espacio tridimensional

Dados dos planos p · (x, y, z) = c, q · (x, y, z) = d , éstos se cortan formando un ángulo de

Figura 1.7: Planos formando un ángulo de 90o en R3

8 Mètodes Quantitatius i Teoria Econòmica

En el caso de una matriz simétrica de orden 2, se tiene

En el caso de tres variables (matriz simétrica de orden 3),

Ejemplo 11 Observa las siguientes formas cuadráticas.

Q(x, y, z) = °2x y + 6xz + 2y 2 + 2y z + 4z 2

c) Dada la forma cuadrática Q(x, y, z) = x 2 + 2x y + 3y 2 ° y z + 2z 2 , su matriz simétrica es

Mètodes Quantitatius i Teoria Econòmica 9

3.1. Signo de una forma cuadrática

1. Definida positiva, si para cualquier vector v no nulo, v 6= 0, Q(v) = v 0 Av > 0

2. Definida negativa, si para cualquier vector v no nulo, v 6= 0, Q(v) = v 0 Av < 0

3. Semidefinida positiva, si para cualquier vector v, Q(v) = v 0 Av ∏ 0 y existe un vector v no nulo,

4. Semidefinida negativa, si para cualquier vector v, Q(v) = v 0 Av ∑ 0 y existe un vector v no nulo,

Ejemplo 12 Analiza el signo de las siguientes formas cuadráticas.

a) La forma cuadrática Q(x, y, z) = x 2 + 2y 2 + 4z 2

b) La forma cuadrática Q(x, y) = °x 2 ° 2y 2

c) La forma cuadrática Q(x, y, z) = x 2 ° 2y 2 + 4z 2

d) La forma cuadrática Q(x, y, z) = x 2 + 4z 2

3.2. Clasificación de formas cuadráticas: menores principales

10 Mètodes Quantitatius i Teoria Econòmica

1. Q es definida positiva, si todos los D i > 0

2. Q es definida negativa, si los D i van cambiando de signo empezando por negativo:

Ejemplo 13 La forma cuadrática asociada a la matriz

Ejemplo 14 La forma cuadrática asociada a la matriz

Ejemplo 15 La forma cuadrática asociada a la matriz

Por otro lado, la forma cuadrática asociada a la matriz

Mètodes Quantitatius i Teoria Econòmica 11

Definición 4 Dada una matriz A n£n se denomina:

Hk > 0, si todos los valores que hay en Hk son estrictamente positivos.

Hk < 0, si todos los valores que hay en Hk son estrictamente negativos.

Hk ∏ 0, si todos los valores que hay en Hk son mayores o iguales a cero.

Hk ∑ 0, si todos los valores que hay en Hk son menores o iguales a cero.

1. Semidefinida positiva, si todos los Hk ∏ 0, y existe algún menor principal nulo

2. Semidefinida negativa, si todos los Hk ∑ 0 cuando k es impar, Hk ∏ 0 si k es par (van cambian-

Ejemplo 16 Se considera la forma cuadrática asociada a la matriz

Por tanto la forma cuadrática es semidefinida positiva.