Variables Multiples
Variables Multiples
Variables Multiples
Licence MASS 2
Année 2013/2014
Second Semestre
Variables multiples
Arnaud Guyader
Table des matières
2 Intégrales multiples 83
2.1 Intégrales doubles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.1.1 Exemple introductif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.1.2 Théorème de Fubini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
2.1.3 Changement de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
2.1.4 Intégrales doubles généralisées . . . . . . . . . . . . . . . . . . . . . . . . . . 92
2.2 Intégrales triples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
2.2.1 Exemple introductif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
2.2.2 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
2.2.3 Changement de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
2.3 Couples aléatoires à densité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
2.3.1 Loi jointe, lois marginales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
i
ii Table des matières
Introduction
On s’intéresse dans ce chapitre aux fonctions de plusieurs variables réelles de la forme
Rn → Rp
f:
x = (x1 , ..., xn ) 7→ y = (y1 , ..., yp )
On veut généraliser pour ce type de fonctions les notions et résultats étudiés pour les fonctions
réelles de la variable réelle vues en première année, à savoir : régularité (continuité, dérivabilité...),
existence d’extrema locaux ou globaux pour les fonctions à valeurs dans R, intégrabilité...
Pour cela, il sera nécessaire de préciser certains outils topologiques déjà plus ou moins abordés pour
l’étude des fonctions de R dans R : norme, distances associée, ouvert, fermé, notion de limite...
Les applications les plus simples sont bien sûr les applications constantes qui à tout x associent la
même image c.
Rn → Rp
f:
x = (x1 , ..., xn ) 7→ c = (c1 , ..., cp )
Applications linéaires
Soit une matrice A à p lignes et n colonnes et à coefficients réels (on note Mp,n (R) l’ensemble de
ces matrices). On peut lui associer l’application dite linéaire, ou endomorphisme, définie dans les
1
2 Chapitre 1. Fonctions de plusieurs variables
Lorsque p = 1, i.e. A est un vecteur ligne, on parle de forme linéaire. Si par exemple n = 2 et
f (x, y) = 2x + y,
le graphe G, défini par l’équation z = 2x + y, est un plan passant par O et dont un vecteur normal
est (2, 1, −1) (Figure 1.2).
z
Formes quadratiques
Soit A ∈ Sn (R) une matrice carrée symétrique. On appelle forme quadratique associée à A la
fonction numérique (c’est-à-dire à valeurs dans R) définie par
R →R
n
f:
x 7→ y = x′ Ax = 1≤i,j≤n ai,j xi xj
P
0
2
1 2
1
0
0
−1
−1
−2 −2
A est diagonalisable, en tant que matrice symétrique réelle, et on classe en général les formes
quadratiques suivant le signe des valeurs propres de A : si elles sont toutes strictement positives
(respectivement négatives), on dit que f est une forme quadratique définie positive (respectivement
négative). On rencontre par exemple ces applications dans l’étude des extrema d’une fonction ou
dans la classification des coniques et des quadriques.
Si n = 2, l’exemple le plus simple est obtenu pour A égale à la matrice identité, d’où :
f (x, y) = x2 + y 2 ,
Coordonnées polaires
Ce changement correspond à celui déjà rencontré au lycée pour les nombres complexes (Figure
1.4) : passage de la décomposition (module/argument) à la décomposition (partie réelle/partie
imaginaire).
Ceci définit exactement une bijection de l’ensemble de départ sur R2 tout entier. Pour le calcul
d’intégrales doubles, on se restreint généralement à des ensembles plus petits mais ouverts sur
lesquels ϕ définit exactement un C 1 -difféomorphisme (cf. chapitre 2).
M
y
→ −
− →
Si M a pour coordonnées (x, y) dans un repère orthonormé (O, i , j ), ρ et θ correspondent respec-
p → −−→
−
tivement à la distance au centre (c’est-à-dire ρ = x2 + y 2 ) et à une mesure de l’angle ( i , OM ).
Notons enfin que ce changement intervient souvent lorsque f (x, y) p ne dépend que de la distance
au centre, c’est-à-dire qu’elle peut s’écrire comme une fonction de x2 + y 2 . On dit dans ce cas
que f est radiale et son expression en polaire ne fera intervenir que la variable ρ. Graphiquement,
si f : R2 → R est radiale, le graphe de f est la surface
et celle-ci est invariante par toute rotation d’axe (Oz) (cf. par exemple le paraboloïde vu précé-
demment).
Coordonnées cylindriques
−
→ − → − →
Soit M = (x, y, z) dans un repère orthonormé (O, i , j , k ) et PM = (x, y, 0) son projeté ortho-
gonal sur le plan de base (Oxy). Les coordonnées cylindriques de M sont définies à partir des
coordonnées polaires de PM dans le plan (Oxy) (Figure 1.5) :
y
θ ρ
x
PM
Coordonnées sphériques
Soit M = (x, y, z) dans un repère orthonormé. Les coordonnées sphériques de M sont définies à
partir de la distance r de M à l’origine O, de l’angle θ comme en cylindriques et de l’angle φ entre
→ −−→
−
les vecteurs k et OM (Figure 1.6) :
M
φ
r
y
θ
x
1.2 Topologie
1.2.1 Rappels sur la norme euclidienne
La distance usuelle entre 2 points de R2 ou R3 vue dans les petites classes est ce qu’on appelle
la distance euclidienne. On définit également ainsi la longueur d’un vecteur u, encore appelée la
norme euclidienne de ce vecteur et notée kuk : si u a pour composantes u1 et u2 dans un repère
−
→ −→
orthonormé (O, i , j ), alors le Théorème de Pythagore donne (Figure 1.7) :
q
kuk = u21 + u22 .
Cette norme est associée au produit scalaire défini pour 2 vecteurs u = [u1 , u2 ]′ et v = [v1 , v2 ]′
par :
u · v = u ′ v = u 1 v1 + u 2 v2 ,
et on a la relation : √
kuk = u · u.
M
u2
O
u1
p
Figure 1.7 – Norme euclidienne kuk = u21 + u22 .
De même, en dimension 3, le produit scalaire et la norme euclidienne sont définis dans un repère
orthonormé par :
′
u·v =u √v = u1p v1 + u2 v2 + u3 v3
kuk = u u = u21 + u22 + u23
′
L’inégalité classique en dimension 2 et 3 entre produit scalaire et produit des normes (à savoir que
le produit scalaire entre deux vecteurs est inférieur ou égal au produit des normes) se généralise
en dimension n :
n n
!1 n
!1
X X 2 X 2
u i vi ≤ u2i × vi2 ,
i=1 i=1 i=1
c’est-à-dire que |u′ v| ≤ kuk × kvk, avec égalité si et seulement si u et v sont colinéaires.
Preuve. Pour tout réel t, le vecteur (tu + v) est de norme positive (comme somme de carrés), et
même strictement positive sauf si toutes ses composantes sont nulles, c’est-à-dire s’il existe t0 tel
que t0 u + v = 0, auquel cas les deux vecteurs sont colinéaires.
Sinon, on a donc pour tout réel t :
0 <Pktu + vk2
0 < Pni=1 (tui + vi )2 P
< ( ni=1 u2i )t2 + 2( ni=1 ui vi )t + ( ni=1 vi2 )
P
0
0 < at2 + 2bt + c
et le trinôme at2 + 2bt + c ne peut être strictement positif pour tout réel t que si son discriminant
est strictement négatif, i.e. si b2 < ac, ce qui est exactement l’inégalité de Cauchy-Schwarz.
Remarque. On retrouve cette inégalité (très utile) sous diverses formes en analyse, en fait dès
qu’on définit une norme à partir d’un produit scalaire. Par exemple, sous des hypothèses implicites :
– Intégrales :
Z Z 1 Z 1
2 2
2 2
f (t)g(t)dt ≤ f (t)dt g (t)dt .
– Séries :
+∞ +∞
! 12 +∞
! 21
X X X
ui vi ≤ u2i vi2 .
i=1 i=1 i=1
On peut remarquer que la norme euclidienne ainsi définie possède trois propriétés caractéristiques :
(i) Positivité et Séparation : la norme d’un vecteur est toujours positive (au sens large) et ne
vaut 0 que pour le vecteur nul.
(ii) Homogénéité : la norme d’un vecteur multiplié par un scalaire est égale à la valeur absolue
du scalaire par la norme de ce vecteur.
(iii) : la norme de la somme de deux vecteurs est inférieure ou égale à la somme des normes des
deux vecteurs.
La dernière découle de l’Inégalité de Cauchy-Schwarz et signifie simplement que la somme des
longueurs de 2 côtés d’un triangle est supérieure à la longueur du troisième (cf. Figure 1.8), ce qui
est encore dire que le plus court chemin d’un point à un autre est la ligne droite.
u+v v
Exemples :
(a) La norme de la somme ou norme 1 : kuk1 = ni=1 |ui | (norme du taxi new-yorkais).
P
(b) La norme du sup ou norme infinie : kuk∞ = supni=1 |ui | (norme du roi aux échecs).
1
(c) Plus généralement, on définit la norme p, pour p ≥ 1, comme suit : kukp = ( ni=1 |ui |p ) p .
P
On retrouve la norme de la somme pour p = 1, la norme infinie quand p → +∞, et la norme
euclidienne pour p = 2.
On a ainsi défini plusieurs façons de “mesurer” un vecteur dans Rn . Néanmoins, ces différentes
mesures ne sont pas en contradiction les unes envers les autres, puisqu’on vérifie aisément que :
De façon générale, on peut montrer que, sur Rn , toutes les normes sont équivalentes. Ceci est dû
au fait que c’est un espace vectoriel de dimension finie sur R. L’exercice intitulé “Normes non
équivalentes sur C([0, 1], R)” montre que ça n’est plus vrai en dimension infinie.
Preuve. Il suffit de montrer que toute norme k.k est équivalente à la norme infinie k.k∞ , c’est-à-dire
prouver qu’il existe deux constantes α et β strictement positives telles que :
L’inégalité de droite est facile : notons (ei )1≤i≤n les vecteurs de la base canonique et β = 1≤i≤n kei k.
P
Alors pour tout u, on a :
X X X
kuk = ui · ei ≤ |ui | · kei k ≤ kei k sup |ui | = βkuk∞ .
1≤i≤n 1≤i≤n 1≤i≤n 1≤i≤n
L’inégalité de gauche est plus subtile, elle utilise en particulier le Théorème de Bolzano-Weierstrass
vu en première année (hum hum...) : de toute suite réelle bornée (xN ) on peut extraire une sous-
suite (xϕ(N ) ) convergente dans R (où ϕ : N → N est une application strictement croissante).
Supposons qu’il n’existe pas de constante α > 0 telle que pour tout vecteur u de Rn , on ait
αkuk∞ ≤ kuk.
Ceci implique en particulier qu’on peut trouver une suite de vecteurs (uN ) telle que :
1
∀N ≥ 0 kuN k∞ = 1 et kuN k ≤ .
N
Considérons les suites composantes de uN = (u1N , . . . , unN ) : elles sont toutes bornées, comprises
entre −1 et 1. En particulier, il existe une sous-suite (u1ϕ1 (N ) ) de (u1N ) qui converge vers l1 . La
suite (u2ϕ1 (N ) ) est elle-même bornée donc admet une sous-suite (u2ϕ1 ◦ϕ2 (N ) ) convergente vers l2 .
De proche en proche on construit une sous-suite (uϕ(N ) ) = (u1ϕ(N ) , . . . , unϕ(N ) ) de la suite initiale,
avec :
ϕ = ϕ1 ◦ ϕ2 ◦ · · · ◦ ϕn ,
uiϕ(N ) −−−−−→ li
N →+∞
1
klk ≤ kuϕ(N ) − lk + kuϕ(N ) k ≤ βkuϕ(N ) − lk∞ + ,
ϕ(N )
et puisque
1
−−−−−→ 0,
ϕ(N ) N →+∞
on a l = (0, . . . , 0). Par ailleurs, pour tout N :
L’implication pratique de ce résultat est la suivante : si une suite de vecteurs (un ) est telle que
kun k → 0 pour une norme donnée k.k, elle tend vers zéro pour toute autre norme k.k′ . On dit alors
que (un ) tend vers le vecteur nul (cf. infra).
On généralise ici le lien entre norme sur un espace vectoriel et distance sur l’espace affine associé.
R2 × R2 → R+
d:
(u, v) 7→ d(u, v) = kv − uk
−→
Rappelons le cas classique vu au collège (Figure 1.9) : soit A(xA , yA ) défini par OA = u et
−−→
B(xB , yB ) défini par OB = v. Alors par définition de la distance associée à la norme euclidienne,
on a :
−−→ −→ −−→ p
d2 (u, v) = kv − uk2 = kOB − OAk2 = kABk2 = (xb − xa )2 + (yb − ya )2 .
On retrouve la distance euclidienne (i.e. usuelle) entre les points A et B.
Remarque. Une distance récupère donc naturellement les propriétés de la norme associée : posi-
tivité/séparation, homogénéité et inégalité triangulaire.
yb B
v
v−u
ya A
O u
xa xb
A A A
r r V
Exemples.
(a) Pour n = 2, on a représenté Figure 1.11 les boules ouvertes de centre O et de rayon 1 pour les
normes de la somme, euclidienne et infinie. Ainsi, en dimension 2, obtient-on respectivement des
carrés remplis, des disques et des carrés remplis pour les boules associées à ces trois normes. En
dimension 3, on obtiendrait respectivement des octaèdres réguliers remplis, des sphères remplies
(ou boules, d’où le nom générique) et des cubes remplis.
(b) L’équivalence mentionnée précédemment entre ces trois normes est traduite par la suite d’in-
clusions des boules Figure 1.12.
Remarques :
– On dira qu’une fonction f : Df ⊆ Rn → R est définie au voisinage d’un point A si Df est
un voisinage de A. De façon générale, on dira qu’une propriété est locale si elle est définie au
voisinage d’un point (extremum local...).
– L’équivalence des normes sur Rn assure que si un ensemble V est un voisinage de A pour une
certaine norme, il le sera pour toute autre norme.
1 1 1
Figure 1.11 – Boules unités pour les normes k.k1 , k.k2 et k.k∞ .
1/2
Figure 1.12 – Equivalence des normes : B̊∞ (0, 21 ) ⊆ B̊1 (0, 1) ⊆ B̊2 (0, 1) ⊆ B̊∞ (0, 1).
On peut donner quelques résultats simples sur les ouverts et les fermés.
Propriétés 1
– Rn et ∅ sont à la fois ouverts et fermés.
– Une boule ouverte est un ouvert, une boule fermée est un fermé.
– Une union quelconque d’ouverts est un ouvert, une intersection finie d’ouverts est un ouvert.
– Une union finie de fermés est un fermé, une intersection quelconque de fermés est un fermé.
Preuve.
– Rn est clairement ouvert par définition d’un ouvert donc ∅ est fermé. D’autre part, ∅ est ouvert
puisqu’on ne peut trouver d’élément x dans ∅ contredisant la définition d’un ensemble ouvert
(et pour cause, il n’y a pas d’élément), donc Rn est fermé.
– Soit M0 ∈ B̊(A, r) et
r − d(A, M0 )
ρ= ,
2
alors on montre que la boule ouverte B̊(M0 , ρ) est contenue B̊(A, r). Soit en effet M ∈ B̊(M0 , ρ),
alors par l’inégalité triangulaire :
d(A, M ) ≤ d(A, M0 ) + d(M0 , M ) = r − 2ρ + d(M0 , M ) < r − 2ρ + ρ = r − ρ < r,
donc M ∈ B̊(A, r). Ainsi B̊(A, r) est voisinage de chacun de ses points, donc ouverte.
Pour B(A, r), on raisonne de façon comparable pour montrer que son complémentaire, c’est-à-
dire l’ensemble Rn \ B(A, r), est ouvert : soit M0 dans ce complémentaire, alors, en notant
d(A, M0 ) − r
ρ= > 0,
2
on montre que B̊(M0 , ρ) est contenue dans ce complémentaire.
– Soit (Ui )i∈I une famille d’ouverts et [
A∈ Ui .
i∈I
Il existe donc i0 ∈ I tel que A ∈ Ui0 . Or Ui0 est ouvert donc il existe r > 0 tel que
[
B̊(A, r) ⊆ Ui0 ⊆ Ui ,
i∈I
Remarque. Un ensemble peut être ni ouvert, ni fermé. Penser par exemple, dans R, à l’intervalle
[0, 1[.
N.B. Considérons par exemple R2 muni de la norme euclidienne : l’intersection infinie des disques
ouverts centrés en O est :
+∞
\ 1
B̊(O, ) = {O} = B(O, 0),
n
k=1
u0
L
u1
uN
Si on se ramène à la définition de la convergence d’une suite réelle vue en première année, ceci
signifie :
∀ε > 0, ∃N0 > 0, ∀N ≥ N0 kuN − Lk < ε.
Via l’équivalence des normes, l’existence et la limite éventuelle d’une suite sont indépendantes de
la norme choisie.
uN = (u1N , ..., unN ) −−−−→ L = (L1 , ..., Ln ) ⇐⇒ ∀i ∈ {1, . . . , n}, uiN −−−−→ Li .
N →∞ N →∞
Preuve. Le premier point est clair en considérant la norme du sup. Pour le second, cette propriété
est connue dans R : puisque le premier point a permis de ramener l’étude d’une suite en dimension
n à l’étude de n suites réelles, elle passe à Rn .
N
Exemple. La suite (uN ) définie par uN = (ln NN+1 , 53N +2
+1
) tend vers (0, 0) puisque ses deux suites
composantes tendent vers 0.
Ces notions sont importantes lorsqu’on veut étudier le comportement d’une fonction “au bord” de
son domaine de définition, pour des problèmes de prolongement, d’étude d’extrema...
Exemple. Dans R2 , soit A le triangle rempli de sommets O, I et J, avec les deux côtés [OI] et
[OJ], mais sans [IJ]. Alors l’intérieur de A est le triangle rempli sans les 3 côtés, l’adhérence de
A est le triangle rempli avec les 3 côtés et la frontière de A correspond aux 3 côtés du triangle (cf.
Figure 1.14).
J J J J
∂A
A Å A
I I I I
Figure 1.14 – L’ensemble A, son ouverture Å, son adhérence A et sa frontière ∂A.
Proposition 1
Soit A un ensemble de Rn et M un point de Rn .
(i) M est dans l’ouverture de A ssi A est un voisinage de M .
(ii) M est adhérent à A ssi il existe une suite (MN ) de points de A qui converge vers M .
(iii) M est dans la frontière de A ssi il existe une suite (MN ) de points de A qui converge vers M
et une suite (MN′ ) de points de Rn − A qui converge vers M .
Preuve.
(i) si M est dans l’ouverture de A, alors Å, ouvert, est un voisinage de M , et a fortiori A qui le
contient.
Réciproquement, si A est un voisinage de M , alors il existe r > 0 tel que B̊(M, r) ⊆ A, i.e. M est
dans un ouvert contenu dans A : Å étant le plus grand d’entre eux, M appartient bien à Å.
(ii) si M est adhérent à A, supposons qu’il n’existe pas de suite (MN ) ⊆ A telle que lim MN = M .
Ceci signifie qu’il existe r > 0 tel que B̊(M, r) ∩ A = ∅. Mais alors A ∩ (Rn \ B̊(M, r)) est un
fermé contenant A et strictement contenu dans A, ce qui contredit la définition de A.
Réciproquement, supposons qu’il existe (MN ) ⊆ A de limite M . Supposons qu’il existe un fermé
F contenant A et ne contenant pas M : alors M ∈ Rn \ F, qui est ouvert, donc il existe r > 0 tel
que B̊(M, r) ⊆ Rn \ F, ce qui contredit lim Mn = M avec (MN ) ⊆ A ⊆ F.
(iii) découle de (i) et (ii).
lim kf (x) − Lk = 0,
x→a
c’est-à-dire si :
∀ε > 0, ∃δ > 0, kx − ak < δ ⇒ kf (x) − Lk < ε.
Il n’y a donc aucune différence par rapport à la situation connue pour une fonction de R dans R,
si ce n’est qu’on a remplacé les valeurs absolues 2 par des normes dans l’espace de départ Rn et
dans l’espace d’arrivée Rp .
Remarques :
– Comme pour l’étude des suites, si f a plusieurs composantes (i.e. p > 1), on peut se ramener à
p études de limites de fonctions à valeurs réelles (mais dépendant de n variables).
– On rappelle que a ∈ A signifie qu’on peut s’approcher du point a en restant dans l’ensemble A
(où f est bien définie). L’existence d’une limite assure que, quelle que soit la façon dont x se
rapproche de a, f (x) se rapproche de L.
On retrouve alors les mêmes propriétés que pour les limites des fonctions réelles de la variable réelle.
C’est encore dire que toutes ses applications composantes sont bornées au voisinage de a.
Preuve. Ce sont exactement les mêmes que dans le cas des fonctions numériques d’une seule
variable en remplaçant les valeurs absolues par des normes.
2. la valeur absolue est la norme naturelle sur R.
Variables multiples Arnaud Guyader - Rennes 2
16 Chapitre 1. Fonctions de plusieurs variables
kL − L′ k
ε= .
2
Il existe δ > 0 et δ′ > 0 tels que :
k(αf )(x) − (α0 L)k ≤ k(α(x) − α0 )f (x)k + kα0 (f (x) − L)k ≤ M |α(x) − α0 | + |α0 | · kf (x) − Lk.
Exercice. En utilisant par exemple un changement en coordonnées polaires, montrer que f (x, y) =
x ln(x2 + y 2 ) admet une limite au point O (voir Figure 3.5).
−1
−2
−3
−4
−5
2
1 2
1
0
0
−1 −1
−2 −2
Remarque. Comme dans le cas d’une seule variable 3 , cette caractérisation de la limite par les
suites sert souvent en pratique à montrer qu’une fonction n’admet pas de limite en un point : il
suffit d’exhiber deux suites tendant vers ce point dont la limite est différente par f . C’est-à-dire
qu’on utilise cette proposition sous sa forme contraposée.
1.3.2 Continuité
Définition 9 (Continuité en un point, continuité sur un ensemble)
Soit f : A ⊆ Rn → Rp et a ∈ A. On dit que f est continue en a si limx→a f (x) = f (a). On dit
que f est continue sur A si f est continue en tout point de A.
Toutes les fonctions usuelles (polynômes, fonctions trigonométriques...) sont continues sur leur
domaine de définition. Puisque la plupart des fonctions que l’on rencontrera seront construites à
partir de ces fonctions usuelles, il suffira d’invoquer les “propriétés opératoires classiques” ci-dessous
pour justifier la continuité de la fonction étudiée.
On définit maintenant une notion propre aux fonctions de plusieurs variables : les applications
partielles. Leur intérêt n’est pas tant dans l’étude de la continuité que dans celui de la dérivabilité
1
3. penser par exemple à x 7→ sin x
qui n’admet pas de limite en 0.
]aj − r, aj + r[ → Rp
f xj :
xj 7→ f (a1 , ..., aj−1 , xj , aj+1 , ..., an )
Proposition 3
Si f est continue en a = (a1 , ..., an ), alors ses n applications partielles sont continues respectivement
en aj .
Quitte à remplacer δ par min(δ, r), et en notant que fxj (aj ) = f (a), on en déduit
N.B. La réciproque est fausse. Pour s’en convaincre, il suffit de reprendre la fonction f (x, y) =
xy
x2 +y 2 du paragraphe précédent en posant f (0, 0) = 0 ; au point O, les applications partielles fx (x)
et fy (y) sont toutes deux identiquement nulles, donc continues, or f ne l’est pas.
Principe calculatoire : En pratique, pour calculer la dérivée partielle de f (x, y) par rapport à
x, on considère y comme une constante et on dérive par rapport à x, et vice versa pour la dérivée
partielle par rapport à y. Il n’y a donc en général aucune difficulté supplémentaire par rapport
au calcul de dérivée classique vu au lycée. Et, comme d’habitude, les seuls cas où l’on devra re-
venir à la définition de la dérivée partielle comme une limite de taux de variation seront ceux où
f n’est pas définie partout par une même formule : cf. l’exercice “Application différentiable non C 1 ”.
Exemple. Soit f définie de R2 dans R par f (x, y) = x3 y 2 . Ses dérivées partielles au point (x, y)
sont ∂f 2 2 ∂f 3
∂x (x, y) = 3x y et ∂y (x, y) = 2x y. Ces dérivées partielles sont donc elles-mêmes des fonc-
tions de deux variables.
N.B. La fonction f peut admettre des dérivées partielles en un point sans être continue en ce point.
Reprendre le sempiternel contre-exemple f (x, y) = x2xy
+y 2
: au point O, on a fx (x) = 0 et fy (y) = 0.
Ces deux applications partielles sont constantes donc dérivables et les dérivées partielles ∂f
∂x (0, 0)
∂f
et ∂y (0, 0) au point O sont égales à 0. Pourtant f n’est pas continue en O. Pour obtenir un lien
entre régularité de f et de ses applications partielles, on a besoin d’une hypothèse supplémentaire.
∂f1 ∂f1
∂x1 (a) ... ∂xn (a)
.. .. ..
Jf (a) = . . .
∂fp ∂fp
∂x1 (a) . . . ∂xn (a)
R+ × [0, 2π[ → R2
∗
ϕ:
(ρ, θ) 7→ (x = ρ cos θ, y = ρ sin θ)
∇f (a) a
f (x, y) = k1
f (x, y) = k
f (x, y) = k0
Tout comme dans le cas des fonctions d’une seule variable de classe C 1 , on est alors assuré de l’exis-
tence d’un développement limité de la fonction au voisinage d’un point (ou formule de Taylor-Young
à l’ordre 1).
Preuve. On montre le résultat pour n = 2. Par continuité de la dérivée partielle par rapport à y
en a, on peut écrire :
∂f ∂f
∀ε > 0, ∃δ > 0, khk < δ ⇒ k (a + h) − (a)k < ε
∂y ∂y
On applique l’Inégalité des Accroissements Finis à la fonction
[0, 1] → Rp
(
ϕ:
t 7→ f (a1 + h1 , a2 + th2 ) − f (a1 + h1 , a2 ) − th2 ∂f
∂y (a1 + h1 , a2 )
d’où il vient :
∂f
kf (a1 + h1 , a2 + h2 ) − f (a1 + h1 , a2 ) − h2 (a1 + h1 , a2 )k ≤ 2εh2 ,
∂y
donc le membre de gauche est un o(|h1 | + |h2 |). D’autre part :
∂f
kf (a1 + h1 , a2 ) − f (a1 , a2 ) − h1 (a)k = o(|h1 |),
∂x
par définition de la dérivée partielle. Enfin :
∂f ∂f
kh2 (a1 + h1 , a2 ) − h2 (a)k = o(|h1 | + |h2 |)
∂y ∂y
En sommant les trois termes, on en déduit que :
∂f ∂f
kf (a + h) − f (a) − h1 (a) − h2 (a)k = o(khk) = khkε(h).
∂x ∂y
Remarques :
– Cette écriture est bien la généralisation du développement limité vu en première année pour
f : R → R de classe C 1 :
f (a + h) = f (a) + f ′ (a)h + hε(h),
avec Jf (a) et khk à la place de f ′ (a) et h.
– Ce développement limité permet de remplacer localement toute fonction suffisamment régulière
par la somme d’une constante et d’une application linéaire, c’est-à-dire par une fonction bien
plus simple à étudier. C’est en fait l’idée force du calcul différentiel.
définissent le plan tangent à la surface (Σ) au point M0 , c’est-à-dire intuitivement le plan le plus
proche de la surface (Σ) au voisinage de M0 . Par exemple, pour
p
f (x, y) = 1 − x2 − y 2 ,
on obtient la demi-sphère unité supérieure, à laquelle appartient le point M0 = (0, 0, 1). Le calcul
de dérivées partielles donne ∂f ∂f ′ ′
∂x (0, 0) = ∂y (0, 0) = 0, donc u0 = [1, 0, 0] et v0 = [0, 1, 0] : le plan
tangent à la demi-sphère en M0 est le plan d’équation z = 1.
donc sa matrice jacobienne en ce point, ou encore son gradient puisque f est à valeurs dans R, est
∂f ∂f
Jf (1, 2) = ∇f (1, 2) = (1, 2), (1, 2) = [2, 0],
∂x ∂y
1.2
0.8
0.6
0.4
0.2
0
1
0.5 1
0.5
0
0
−0.5
−0.5
−1 −1
On obtient par exemple pour (h, k) = (0.02, −0.01) la valeur 1.04, proche de 1.021.99 = 1.04019....
Une autre application courante en sciences expérimentales est le calcul d’erreur sur un résultat
lorsque les données utilisées sont soumises à des incertitudes.
Corollaire 2
Si f : U ⊆ Rn → Rp est de classe C 1 sur U , alors f est continue sur U .
or le membre de droite tend vers zéro quand h tend vers zéro, donc f (a + h) tend vers f (a).
On a ainsi établi que si les dérivées partielles de f sont définies ET continues au voisinage d’un
point, alors la continuité de f est assurée en ce point.
c’est-à-dire matriciellement :
Jg◦f (a) = Jg (f (a)) Jf (a).
Preuve. Notons k(h) = f (a + h) − f (a). Il suffit alors d’écrire les deux développements limités et
de les composer :
La seconde formule montre que le rapport kk(h)k/khk reste borné au voisinage de h = 0. D’où
l’on déduit que o(kk(h)k)/khk tend vers zéro quand h tend vers zéro. Donc le reste du premier
développement est un o(khk). Enfin le terme Jg (f (a))o(khk) est encore un o(khk). On a donc :
ce qui prouve que g ◦ f admet des dérivées partielles en tout point a et admet pour matrice
jacobienne :
Jg◦f (a) = Jg (f (a)) Jf (a).
Dire que f et g sont C 1 est encore dire les coefficients de leurs matrices jacobiennes sont des
fonctions continues, mais alors il en va de même pour la matrice produit et g ◦ f est C 1 .
Remarques :
– Cette formule sur les matrices jacobiennes n’est rien d’autre que la généralisation de celle bien
connue en dimension 1 : (g ◦ f )′ (a) = g′ (f (a)) f ′ (a).
– La dérivation en chaîne s’écrit encore de façon condensée, en notant (xj ), (yl ) et (zi ) les va-
riables/composantes :
m
∂zi X ∂zi ∂yl
= ·
∂xj ∂yl ∂xj
l=1
f ′ (a) est alors appelé nombre dérivé de f en a et l’application h 7→ f ′ (a)h est une application
linéaire, appelée application linéaire tangente en a. On va définir de la même manière la différen-
tiabilité d’une fonction de plusieurs variables.
f (a + h) = f (a) + Jh + khkε(h).
On peut alors établir un lien entre cette matrice J et la matrice jacobienne Jf (a) précédemment
définie.
Théorème 4
Soit f : U ⊆ Rn → Rp et a ∈ U . Si f est différentiable en a, alors f est continue en a. De plus,
elle admet des dérivées partielles en ce point et la différentielle de f en a est donnée par la matrice
jacobienne de f , i.e. J = Jf (a).
Proposition 5
Soit f : U ⊆ Rn → Rp et a ∈ U . Si les dérivées partielles ∂x ∂fi
j
sont définies au voisinage de a
et continues en a, alors f est différentiable en a et la différentielle de f en a est donnée par la
matrice jacobienne de f .
Remarques :
– En particulier, une fonction de classe C 1 sur U est différentiable en tout point de U . De plus, la
différentielle
U → Mp,n (R)
Jf :
a 7→ Jf (a)
est continue. C’est pourquoi on dit aussi d’une fonction de classe C 1 qu’elle est continûment
différentiable.
– En pratique, on vérifiera directement sur les fonctions étudiées que les dérivées partielles sont
définies et continues sur tout leur domaine de définition pour conclure à la continue différentia-
bilité (sans passer par le développement limité).
Remarque. Dans la suite, on supposera souvent les fonctions de classe C 1 même si la différentia-
bilité suffit. L’exercice “Application différentiable non C 1 ” montre que les deux notions ne sont pas
équivalentes.
5. en dimension finie, toute application linéaire est continue, c’est pourquoi cette condition n’apparaît pas dans
la définition vue précédemment.
Ce résultat, appelé Théorème des Accroissements Finis, se montre en général par le Théorème de
Rolle et admet l’interprétation géométrique suivante (voir Figure 1.18) : il existe un point entre
A et B où la tangente à la courbe a même pente que la droite (AB). On va montrer que ce résul-
tat se généralise sans problème aux fonctions numériques de plusieurs variables, i.e. f : Rn → Rp .
f (b)
f (a)
a c b
[0, 1] → R
ϕ:
t 7→ f (a + t(b − a))
ϕ est continue et dérivable sur [0, 1], donc il existe t0 ∈]0, 1[ tel que
∀a, b ∈ U [a, b] ⊆ U .
a a
b
b
Remarques.
– La réciproque est claire : si f est constante, alors f est différentiable, de dérivées partielles nulles
en tout point.
– Au vu de la preuve, ce résultat est encore vrai sous des hypothèses moins restrictives que la
convexité de U , par exemple si l’on suppose simplement que 2 points quelconques de U peuvent
toujours être joints par une ligne brisée (i.e. si U est connexe par arcs).
[0, 1] → R2
ϕ:
t 7→ (cos(2πt), sin(2πt))
∀t ∈ [0, 1] ϕ′ (t) 6= 0.
Néanmoins, l’Inégalité des Accroissements Finis, qui avait été vue comme une conséquence du
Théorème, va elle passer en dimension supérieure. On peut la rappeler brièvement : soit f : [a, b] →
R continue sur [a, b], dérivable sur ]a, b[, telle que ∀c ∈]a, b[, |f ′ (c)| ≤ M , alors :
|f (b) − f (a)| ≤ M (b − a).
Une interprétation très simple : si un automobiliste roule pendant une demi-heure en ne dépassant
jamais la vitesse de 50 km/h, alors au total il ne se sera pas éloigné de plus de 25 kilomètres de son
point de départ. On donne ici une version de ce résultat pour les fonctions de plusieurs variables.
On retrouve naturellement pour les fonctions de classe C 2 les propriétés opératoires classiques :
stabilité par la somme, le produit et la composition.
∂2f ∂f ∂2f
Notation et exemple. On note ∂xi ∂xj la dérivée partielle par rapport à xi de ∂xj , et ∂x2j
la
∂f
dérivée partielle par rapport à xj de ∂x j
. Soit par exemple f (x, y) = x3 y 2 . Ses deux dérivées
partielles d’ordre 1 sont (
∂f
∂x = 3x2 y 2
∂f
∂y = 2x3 y
∂2f ∂2f
On note sur cet exemple que ∂y∂x = ∂x∂y . Ceci est en fait une propriété générale.
∂2f ∂2f
∀(i, j) ∈ {1, ..., n} = .
∂xi ∂xj ∂xj ∂xi
Preuve. On suppose n = 2 et on se place au point O : puisque U est ouvert, il existe r > 0 tel
que B̊∞ (O, r) ⊆ U . On définit alors la fonction φ sur B̊∞ (O, r) par :
1
φ(h, k) = (f (h, k) − f (h, 0) − f (0, k) + f (0, 0)).
hk
On va montrer que φ admet une limite en (0, 0) et que celle-ci peut s’exprimer de deux façons. On
applique le Théorème des Accroissements Finis entre 0 et h ; il existe θ ∈]0, 1[ tel que :
1 ∂f ∂f
φ(h, k) = ( (θh, k) − (θh, 0)).
k ∂x ∂x
On réapplique le Théorème des Accroissements Finis, cette fois entre 0 et k ; il existe θ ′ ∈]0, 1[ tel
que :
∂2f
φ(h, k) = (θh, θ ′ k).
∂y∂x
2
∂ f ∂ f 2
Puisque ∂y∂x est continue, on en déduit que φ admet une limite en (0, 0), égale à ∂y∂x (0, 0).
Si on reprend ce raisonnement en intervertissant l’ordre des variables, on montre de la même façon
que :
∂2f
lim φ(h, k) = (0, 0),
(h,k)→(0,0) ∂x∂y
d’où l’égalité des dérivées secondes croisées.
Remarque. Ceci signifie qu’on n’a pas à se soucier de l’ordre dans lequel on opère pour le calcul
des dérivées partielles secondes croisées. On dit qu’il y a commutativité des opérateurs de dériva-
tion partielle.
Soit f : (x, y) 7→ f (x, y) de classe C 2 . Si les trois dérivées partielles secondes de f sont elles-mêmes
de classe C 1 , on dit que f est de classe C 3 ; il y a alors, par le Théorème de Schwarz, quatre dérivées
partielles d’ordre 3. De proche en proche, on définit ainsi les fonctions de classe C k . Une fonction
sera alors de classe C ∞ si elle est de classe C k pour tout k.
f (1 + h, 2 + k) ≈ 1 + 2h + h2 + hk.
On obtient, à nouveau pour (h, k) = (0.02, −0.01), la valeur 1.0402, très proche de 1.021.99 =
1.04019....
Définition 17
Soit U un ouvert de Rn , f : U → R et a ∈ U . On dit que f admet un minimum local en a s’il
existe r > 0 tel que :
∀x ∈ U , kx − ak < r ⇒ f (a) ≤ f (x).
∀x ∈ U : f (a) ≤ f (x).
f (a + h) − f (a) ∼ f ′ (a)h,
or f ′ (a)h change de signe quand h change de signe : f (a + h) − f (a) ne pourra pas être de signe
constant au voisinage de 0. On en déduit une condition nécessaire pour que f admette un extre-
mum local en a : il faut f ′ (a) = 0. On retrouve une condition équivalente pour le gradient d’une
fonction de plusieurs variables.
Preuve. Soit r > 0 tel que B̊(a, r) ⊆ U . Pour tout h de norme euclidienne égale à r, on définit la
fonction ϕ de classe C 1 sur ] − 1, 1[ par ϕ(t) = f (a + th). Si f admet un extremum en a, alors ϕ
admet un extremum de même nature en 0 et en particulier sa dérivée s’annule en ce point, or :
ϕ′ (t) = ∇f (a + th)h,
donc :
ϕ′ (0) = ∇f (a)h = 0 ∀h ∈ B̊(0, r).
Si on suppose ∇f (a) 6= 0, alors en choisissant :
∇f (a)
h = ±r ,
k∇f (a)k
Remarques.
– Notons que dans tout ce qui précède, on n’est pas obligé de supposer f de classe C 1 pour une
telle définition : la différentiabilité suffit.
– Tout comme la dérivée de f : x 7→ x3 s’annule en 0 sans que f admette un extremum en ce
point, la fonction f : (x, y) 7→ x3 + y 3 admet (0, 0) pour point critique sans que f n’admette
d’extremum local en ce point : il suffit pour s’en convaincre d’étudier le signe de f autour de ce
point suivant les signes de x et y. Ceci montre en particulier que la condition énoncée ci-avant
n’est pas suffisante : comme pour les fonctions de R dans R, il suffit en général de pousser le
développement à l’ordre 2 pour pouvoir conclure.
1.5
0.5
−0.5
−1
−1.5
−2
1
0.5 1
0.5
0
0
−0.5
−0.5
−1 −1
f ′′ (a) 2
f (a + h) = f (a) + f ′ (a)h + h + h2 ε(h).
2
Pour que f admette en a un extremum local, il faut f ′ (a) = 0, ce qui donne :
f ′′ (a) 2
f (a + h) = f (a) + h + h2 ε(h).
2
On voit que, pour h voisin de 0, f (a + h) − f (a) a le signe de f ′′ (a). On en déduit une condition
suffisante d’extrémalité locale : il suffit que f ′′ (a) 6= 0. Plus précisément :
– Si f ′′ (a) > 0, f admet en a un minimum local ;
– Si f ′′ (a) < 0, f admet en a un maximum local ;
– Si f ′′ (a) = 0, on ne peut rien dire a priori.
On montre le même type de résultat pour les fonctions de plusieurs variables ; on se restreint dans
la suite aux fonctions de deux variables.
Preuve. Soit r > 0 tel que B̊(a, r) ⊆ U . on définit sur B̊(0, r) la fonction Q par :
2 0 1
1 −1 0
0 −2 −1
1 1 1
0 0 0
0 0 0
−0.5 −0.5 −0.5
−1 −1 −1 −1 −1 −1
Pour tout vecteur (h, k) de norme r, pour tout t ∈] − 1, 1[, on a le développement limité :
En faisant tendre t vers zéro, on voit que f (a + t(h, k)) − f (a) a le signe de Q(h, k). Il faut donc
étudier le signe de cette forme quadratique : pour k 6= 0, on a :
2 !
h h
Q(h, k) = k2 p + 2q + r .
k k
La parenthèse est un trinôme en hk , cette fraction pouvant prendre toutes les valeurs réelles, dont
le discriminant réduit vaut δ = q 2 − pr. Si ce discriminant est négatif, i.e. si pr − q 2 > 0, alors
Q(h, k) est de signe constant : positif si p > 0, négatif si p < 0. La conclusion subsiste si k = 0
puisqu’alors Q(h, k) = Q(h, 0) = ph2 , du signe de p. Donc si pr − q 2 > 0, f admet un extremum
local en a.
Si le discriminant est positif, alors p( hk )2 + 2qh + rk prend des valeurs positives et négatives en
fonction de hk , donc il en est de même de f (a + t(h, k)) − f (a) pour t voisin de 0 et f n’admet en
a ni maximum ni minimum local, mais un point selle.
Généralisation
Soit U un ouvert de Rn , f : U → R de classe C 2 et a ∈ U un point critique de f , i.e. ∇f (a) = 0.
De façon générale, le développement limité à l’ordre 2 de f en a est :
1
f (a + h) = f (a) + ∇f (a)h + h′ Hf (a)h + khk2 ε(h).
2
où Hf (a) est la matrice Hessienne de f en a : c’est l’équivalent de f ′′ (a) pour une fonction de R
dans R. Elle est de taille (n, n) et de terme générique :
∂2f
Hf (a)(i, j) = (a).
∂xi ∂xj
Puisqu’on est en un point critique, ce développement se simplifie un peu :
1 ′
f (a + h) − f (a) = h Hf (a)h + khk2 ε(h),
2
et au voisinage de O, le signe de f (a + h) − f (a) est en général celui de
Q(h) = h′ Hf (a)h.
−1
1.5
1 1.5
1
0.5
0.5
0
0
−0.5 −0.5
Par le Théorème de Schwarz, cette matrice est symétrique et, comme toute matrice symétrique à
valeurs réelles, elle est diagonalisable en base orthonormée : il existe une matrice orthogonale P
et une matrice diagonale ∆ = diag(λ1 , ..., λn ), telles que Hf (a) = P ′ ∆P . On a donc, en posant
u = Ph :
Xn
Q(h) = h′ P ′ ∆P h = u′ ∆u = λi u2i ,
i=1
Retour à la dimension 2
Si on revient à une fonction f de deux variables en un point critique a, la matrice hessienne s’écrit,
avec les notations de Monge :
p q λ1 0
Hf (a) = = P′ P.
q r 0 λ2
admet deux points critiques (0, 0) et (1, 1). Montrer que le premier correspond à un point selle et
le second à un minimum local pour f . Vérifier que ce minimum local n’est pas un minimum global.
Soit k.k une norme quelconque sur Rn . Rappelons qu’un ensemble K est borné s’il existe M > 0
tel que : ∀x ∈ K, kxk < M . Si k.k = k.k∞ , ceci signifie que les coordonnées de tout point de K
sont comprises entre −M et M .
Remarque. Ceci n’est pas la définition usuelle d’un ensemble compact ; c’est néanmoins la plus
pratique en dimension finie. Dans le cas plus général d’un espace vectoriel normé, on dit qu’un
ensemble est compact si de toute suite de points de cet ensemble, on peut extraire une sous-suite
convergente dans l’ensemble 6 . On montre alors, via le Théorème de Bolzano-Weierstrass (“De toute
suite bornée de réels on peut extraire une sous-suite convergente.”), que les compacts de Rn ainsi
définis sont exactement les fermés bornés.
Preuve. On utilise la caractérisation des compacts par la convergence d’une sous-suite. Soit (yN ) =
(f (xN )) une suite de f (K) : on doit montrer que (yN ) admet une sous-suite convergente dans f (K).
Or (xN ) est une suite de K compact, donc admet une sous-suite (xϕ(N ) ) convergente vers x ∈ K.
f est continue sur K donc en particulier en x donc f (xϕ(N ) ) = yϕ(N ) converge vers f (x) ∈ f (K).
Remarques :
– Ceci est un résultat d’existence : on est assuré qu’il existe un point x0 où f atteint son maximum,
mais on ne sait ni le situer ni s’il est unique 7 . Lorsque le compact K est spécifié par une équation,
par exemple K = {(x, y) ∈ R2 : ϕ(x, y) = 0}, on peut préciser les choses : c’est l’objet de la
section suivante, appelée étude d’extrema liés, ou optimisation sous contraintes.
– De façon plus générale, si f : K ⊆ Rn → Rp avec K compact, alors f (K) est un compact de Rp
(i.e. fermé et borné).
(x, y) ∈ C ⇔ y = ϕ(x),
∂f
Preuve. Sans perte de généralité, on se ramène au point (0, 0) et on suppose ∂y (0, 0) > 0. Alors
∂f
par continuité de ∂y , il existe α > 0 et δ > 0 tels que :
∂f
max(|x|, |y|) ≤ δ ⇒ (x, y) > α.
∂y
En particulier f (0, .) est croissante sur [−δ, δ], donc :
mais on sait aussi que pour |x| ≤ δ, f (x, .) est croissante donc établit une bijection. En notant
δ′ = min(δ, δ′ ), posons I1 =] − δ′ , +δ′ [ et I2 =] − δ, +δ[ : pour tout x ∈ I1 , il existe donc un unique
ϕ(x) ∈ I2 tel que f (x, ϕ(x)) = 0. On a donc :
∀x ∈ I1 , f (x, ϕ(x)) = 0.
Il reste à prouver que ϕ est dérivable sur I1 : le Théorème des Accroissements Finis appliqué à f
entre les points (x, ϕ(x)) et (x + h, ϕ(x + h)) assure l’existence de c entre ces points tel que :
∂f ∂f
f (x + h, ϕ(x + h)) = f (x, ϕ(x)) + (c)h + (c)(ϕ(x + h) − ϕ(x)),
∂x ∂y
c’est-à-dire :
∂f
∂x (c)
ϕ(x + h) − ϕ(x) = −h ∂f .
∂y (c)
Or par continuité de ∂f ∂f
∂x sur le compact I1 × I2 , il existe M > 0 tel que | ∂x (c)| ≤ M . On sait aussi
que sur ce compact ∂f
∂y (c) > α. On en déduit que :
M
ϕ(x + h) − ϕ(x) ≤ h,
α
donc ϕ est continue (et même lipschitzienne), ce qui implique que lorsque h tend vers zéro, le point
c tend vers (x, ϕ(x)), or :
∂f
ϕ(x + h) − ϕ(x) ∂x (c)
= − ∂f ,
h (c) ∂y
∂f
(x, ϕ(x))
ϕ′ (x) = − ∂x
∂f
.
∂y (x, ϕ(x))
f (x, y) = x2 + y 2 − 1 = 0
∂f
∂y
(a) 6= 0
a
∂f
∂y
(1, 0) =0
Remarques :
– Graphiquement, on sait que le vecteur gradient
∂f ∂f
∇f (a) = (a), (a)
∂x ∂y
est orthogonal à la courbe de niveau 0 de f . Dire que ∂f ∂y (a) 6= 0 signifie donc simplement que
la tangente en a à la courbe n’est pas verticale, ce qui semble raisonnable si on veut pouvoir
exprimer y en fonction de x (cf. Figure 1.23).
– La dérivée ϕ′ (x) se retrouve simplement en écrivant que, autour de a1 , la fonction d’une seule
variable f (x, ϕ(x)) est identiquement nulle, donc sa dérivée est nulle, ce qui donne par la règle
de dérivation en chaîne :
∂f ∂f
(x, ϕ(x)) + ϕ′ (x) (x, ϕ(x)) = 0.
∂x ∂y
– La formule donnant ϕ′ (x) montre en particulier que ϕ a la même régularité que f (par exemple,
si f est C ∞ , ϕ l’est aussi).
– Le résultat reste mutatis mutandis le même si l’on veut exprimer x en fonction de y : la condition
sera cette fois ∂f
∂x (a) 6= 0.
– Le Théorème des Fonctions Implicites, dont la version la plus simple a été donnée ici, est d’une
grande importance théorique : il est équivalent au Théorème d’Inversion Locale et on le retrouve
par exemple dans l’étude locale des courbes, des surfaces... L’optimisation sous contraintes en
est une autre application.
Définition 20 (Lagrangien)
On cherche les extrema de la fonction f : R2 → R de classe C 1 sous la contrainte g(x, y) = 0, avec
g : R2 → R de classe C 1 . Le Lagrangien associé au problème est la fonction de 3 variables et de
classe C 1
R3 → R
L:
(x, y, λ) 7→ f (x, y) + λg(x, y)
La variable λ est appelée multiplicateur de Lagrange.
Remarques :
– On voit que pour tout couple (x, y) respectant la contrainte, on a L(x, y, λ) = f (x, y), donc
maximiser f sur cet ensemble est équivalent à maximiser L.
– Dans le cas général, on a à optimiser
Rn → R
f:
(x1 , ..., xn ) 7→ f (x1 , ..., xn )
sous p contraintes :
gi (x1 , ..., xn ) = 0 ∀i ∈ {1, ..., p}.
Il y a alors p multiplicateurs de Lagrange λ1 , ..., λp et le Lagrangien associé est la fonction de
(n + p) variables :
p
X
L(x1 , ..., xn , λ1 , ..., λp ) = f (x1 , ..., xn ) + λi gi (x1 , ..., xn ).
i=1
Dire que f admet un extremum local en (0, 0) sous la contrainte g revient alors à dire que la
fonction d’une seule variable x 7→ f (x, ϕ(x)), définie sur I, admet un extremum local en 0, ce qui
implique en particulier que sa dérivée est nulle en 0, soit via la règle de dérivation en chaîne :
∂f ∂f
(0, 0) + ϕ′ (0) (0, 0) = 0.
∂x ∂y
Soit, en revenant à g :
∂f ∂g ∂g ∂f
(0, 0) (0, 0) − (0, 0) (0, 0) = 0,
∂x ∂y ∂x ∂y
c’est-à-dire que les vecteurs gradient de f et g en (0, 0) sont colinéaires : il existe λ ∈ R tel que
∇f (0, 0) + λ∇g(0, 0) = 0, et puisqu’on a aussi g(0, 0) = 0, c’est encore dire que ∇L(0, 0, λ) = 0.
Remarque. Si on exprime les dérivées partielles du Lagrangien en fonction de celles de f et g, on
doit donc résoudre le système (généralement non-linéaire) de 3 équations à 3 inconnues :
∂f ∂g
∂x (x0 , y0 ) + λ0 ∂x (x0 , y0 ) = 0
∂f ∂g
∂y (x0 , y0 ) + λ0 ∂y (x0 , y0 ) = 0
g(x0 , y0 ) = 0
La dernière équation exprime simplement que le point (x0 , y0 ) doit vérifier la contrainte. Les deux
premières signifient qu’en ce point la courbe de niveau f (x, y) = f (x0 , y0 ) de f et la courbe
g(x, y) = 0 doivent être tangentes. Ceci se comprend bien sur la Figure 1.24 faisant apparaître les
lignes de niveaux de f ainsi que la contrainte g : on suppose k0 < k1 < k2 , les points (xm , ym )
et (xM , yM ) représentent les points où f atteint son minimum et son maximum sous la contrainte
g(x, y) = 0.
(xm , ym ) g(x, y) = 0
(xM , yM )
x
f (x, y) = k2
f (x, y) = k1
f (x, y) = k0
Une fois obtenus les points critiques du Lagrangien, il reste à préciser leur nature. Le problème est
plus délicat que pour l’optimisation sans contrainte. On peut donner une condition suffisante (un
peu technique) d’extrémalité locale de ces points critiques. Cependant, en général, une fois trouvés
les points critiques du Lagrangien, on raisonnera plutôt en fonction du problème (c’est-à-dire au
cas par cas) pour trouver la nature de ces points singuliers.
Si l’on cherche plus précisément les extrema globaux sous contrainte, alors un argument de com-
pacité assure à nouveau leur existence. Puisque l’ensemble sur lequel on cherche les extrema de f
est
D = {(x, y) : g(x, y) = 0} = g −1 ({0}),
on peut préciser les choses. On commence par donner une propriété des fonctions continues connue
pour f : R → R.
Preuve. Soit V un ouvert de Rp et f −1 (V) son image réciproque par f . Ou bien celle-ci est vide,
auquel cas c’est bien un ouvert, ou bien non : soit alors a ∈ f −1 (V). f (a) ∈ V qui est ouvert
donc il existe ε > 0 tel que B̊(f (a), ε) ⊆ V. Or f est continue en a donc il existe δ > 0 tel que
x ∈ B̊(a, δ) ⇒ f (x) ∈ B̊(f (a), ε) donc en particulier x ∈ f −1 (V) : c’est exactement dire que f −1 (V)
est un voisinage de a pour tout a ∈ f −1 (V) donc que f −1 (V) est ouvert. Enfin si F est un fermé
de Rp , Rp − F est un ouvert, donc f −1 (Rp − F ) = Rn − f −1 (F ) aussi, donc F est un fermé.
{0} étant un fermé de R, son image réciproque par g (supposée continue) est un fermé de R2 . Les
compacts de R2 étant exactement les fermés bornés, il suffit de vérifier que cet ensemble est borné
pour pouvoir appliquer un résultat de compacité :
Proposition 8
Si f et g sont continues et si l’ensemble g−1 ({0}) est borné, alors f admet un maximum global et
un minimum global sous la contrainte g(x, y) = 0.
Remarques :
– Dans les applications concrètes (économie, traitement du signal...), on est presque toujours
confronté à des problèmes d’optimisation sous contraintes et non à des problèmes d’optimisation
libre.
– Il existe des algorithmes classiques pour résoudre rapidement ces problèmes dans les cas les plus
simples : algorithme du simplexe (ou programmation linéaire) pour optimiser une forme linéaire
sous une contrainte linéaire, programmation quadratique pour optimiser une forme quadratique
sous une contrainte linéaire... Ce sujet fait l’objet d’un cours à lui tout seul.
– Notons enfin qu’un cas typique pour lequel les problèmes d’optimisation s’étudient bien est celui
où la fonction à optimiser est convexe (ou concave) sur un ensemble convexe.
1.10 Exercices
Exercice 1.1 (Domaine de définition)
Représenter les domaines de définition des fonctions suivantes :
√
x2 y−2
1. f (x, y, z) = z−3 .
2. f (x, y) = ln(cos2 x − y 2 ).
3. f (x, y) = ln xy.
√
4. f (x, y) = xy − 2.
2. Quelle est son équation en coordonnées cylindriques ? En quoi voit-on que c’est une surface
de révolution ?
1. Vérifier que k.k est une norme sur l’espace vectoriel Mp (R) via les trois axiomes vus en cours
(Positivité & Séparation, Homogénéité, Inégalité triangulaire).
2. Soit la matrice
1
2 1
A= 1
0 2
4. Soit la matrice
1/3 1/4
A=
1/5 1/6
Déduire de la question précédente que (An ) tend vers la matrice nulle.
ainsi que :
kf k∞ = sup |f (x)|.
x∈[0,1]
1. Vérifier que k.k1 et k.k∞ sont des normes sur C([0, 1], R).
2. Soit la suite de fonctions (fn ) définies par
[0, 1] → R
fn :
x 7→ xn
1 1
In = ,1 × ,1 .
n n
S+∞
(b) Déterminer C = n=1 In . Nature topologique de C ? Déterminer C.
1. Montrer que pour tout réel α, on a limx→0 f (x, αx) = f (0, 0).
1
2. On considère la suite (xn , yn ), avec xn = n2
et yn = n1 .
(a) Représenter dans R2 les premiers termes de cette suite.
(b) Montrer que f n’est pas continue en (0, 0).
3. Interpréter graphiquement les résultats des questions précédentes.
Corrigé
1. Soit α réel fixé, alors pour tout x non nul on a :
α4 x4 α4 x2
f (x, αx) = = .
x2 + α4 x4 1 + α4 x2
Or, quand x tend 0, le numérateur tend vers 0 et le dénominateur vers 1, donc le rapport
tend vers 0. On a donc bien :
√
2. (a) Les points sont tous sur la courbe d’équation y = x et tendent vers l’origine lorsque n
tend vers l’infini. Les premiers points sont A1 (1, 1), A2 (1/4, 1/2), A3 (1/9, 1/3), A4 (1/16, 1/4),
etc.
(b) Soit (xn , yn ) = ( n12 , n1 ), alors :
1/n4 1
f (xn , yn ) = 4 4
= .
1/n + 1/n 2
Donc (f (xn , yn ))n≥1 est une suite constante ; en particulier sa limite quand n tend vers
l’infini vaut 1/2. Or :
lim (xn , yn ) = (0, 0),
n→+∞
ce qui n’est pas le cas. f n’est donc pas continue en (0, 0).
(c) Ceci signifie que si (x, y) tend vers (0, 0) en restant sur la droite passant par O et de
coefficient directeur α, la limite de f est bien f (0, 0). On vient cependant de montrer
que f n’est pas continue en (0, 0), puisque ce n’est plus le cas si on s’approche de l’ori-
√
gine en restant sur la courbe d’équation y = x.
x3 y 3
f (x, y) =
(x2 + y 2 )2
Montrer qu’on peut prolonger f par continuité en (0, 0).
Corrigé
On veut montrer que f admet une limite en (0, 0), et plus précisément que cette limite vaut 0. On
effectue pour cela le changement de variables en polaires, i.e. on étudie plutôt f (ρ cos θ, ρ sin θ) :
on sait que l’étude de la limite de f (x, y) quand (x, y) tend vers (0, 0) est équivalente à l’étude de
la limite de f (ρ cos θ, ρ sin θ) quand ρ tend vers zéro (en restant non nul), θ étant quelconque. Or
on obtient :
ρ6 cos3 θ sin3 θ
f (ρ cos θ, ρ sin θ) = = ρ2 cos3 θ sin3 θ,
ρ4
d’où l’on déduit que :
|f (ρ cos θ, ρ sin θ)| ≤ ρ2 −−−→ 0.
ρ→0
Il s’ensuit que :
lim f (x, y) = lim f (ρ cos θ, ρ sin θ) = 0,
(x,y)→(0,0) ρ→0
Corrigé
1. Un changement en polaires donne :
ρ3 cos3 θ + ρ3 sin3 θ
f (ρ cos θ, ρ sin θ) = = ρ(cos3 θ + sin3 θ),
ρ2
d’où
|f (ρ cos θ, ρ sin θ)| ≤ 2ρ −−−→ 0.
ρ→0
Ainsi
lim f (x, y) = lim f (ρ cos θ, ρ sin θ) = 0,
(x,y)→(0,0) ρ→0
R2 \ {(0, 0)} → R
(
f (x, y) = 2 2
(x, y) 7→ xx2 −y
+y 2
Corrigé
Il suffit de trouver deux suites (xn , yn ) et (un , vn ) tendant toutes deux vers (0, 0) et telles que
lim f (xn , yn ) 6= lim f (un , vn ). En prenant (xn , yn ) = (1/n, 0) et (un , vn ) = (0, 1/n), on obtient
R →R
2
1
f: (x, y) 7→ xy sin x2 +y 2 si (x, y) 6= (0, 0)
(0, 0) 7→ 0
U = (x, y) ∈ R2 , y 6= 0 .
6. En étudiant par exemple la continuité de la fonction ∂f ∂y au point (1, 0), montrer que f n’est
1
pas de classe C sur R . 2
Corrigé
1. Soit M0 (x0 , y0 ) un point de U , c’est-à-dire tel que y0 6= 0. Considérons par exemple la norme
euclidienne sur R2 . Il est clair que le disque ouvert de centre M0 et de rayon |y0 |/2 est inclus
dans U , ce qui assure que U est ouvert.
2. La fonction f est de classe C 1 sur U par les théorèmes opératoires classiques (composée et
produit de fonctions C 1 ). Ses dérivées partielles en tout point (x, y) de U sont
(
∂f
∂x = y cos(x/y)
∂f
∂y = 2y sin(x/y) − x cos(x/y)
3. Soit M0 (x0 , 0) un point de l’axe des abscisses. On a par définition de la fonction f (x0 , 0) = 0,
et par ailleurs en tout point M (x, y) : |f (x, y)| ≤ y 2 , donc :
lim f (x, y) = 0 = f (x0 , 0),
(x,y)→(x0 ,0)
et f est continue au point M0 (x0 , 0). Puisque x0 est arbitraire, f est continue en tout point
de l’axe des abscisses. D’autre part, étant de classe C 1 sur U , f est a fortiori continue sur U .
Au total, f est continue sur R2 .
4. Fixons à nouveau M0 (x0 , 0) sur l’axe des abscisses. Pour calculer les dérivées partielles de f
en M0 , on se ramène à la définition par les taux de variations, ce qui donne :
(
∂f f (x0 +h,0)−f (x0 ,0)
∂x (x0 , 0) = limh→0 h =0
∂f f (x0 ,h)−f (x0 ,0)
∂y (x0 , 0) = limh→0 h = limh→0 h sin(x0 /h) = 0
∂f ∂f
(x, y) − (x0 , 0) = |y cos(x/y)|,
∂x ∂x
la différence valant tout simplement 0 lorsque y = 0. Ainsi, que y soit nul ou non, on a :
∂f ∂f
(x, y) − (x0 , 0) ≤ |y| −−−−−−−−→ 0,
∂x ∂x (x,y)→(x0 ,0)
de sorte que ∂f
∂x est continue en tout point de l’axe des abscisses. Puisque f est par ailleurs
de classe C sur U , cette première dérivée partielle est continue sur R2 tout entier.
1
∂f
6. La fonction ∂y est aussi continue sur U . Par contre, elle n’est pas continue en (1, 0) par
∂f
exemple. En effet, on a vu que ∂y (1, 0) = 0, mais :
∂f 1 ∂f
(1, ) = −2nπ −−−−−→ −∞ =
6 (1, 0).
∂y 2nπ n→+∞ ∂y
En fait cette seconde dérivée partielle n’est continue en aucun point de l’axe des abscisses,
sauf en l’origine. Au total, f admet des dérivées partielles en tout point de R2 , mais l’une
d’entre elles n’est pas continue sur R2 , donc f n’est pas C 1 sur R2 .
Corrigé
1. la fonction f est clairement C ∞ en dehors de l’axe des abscisses (voir aussi Figure 1.25). Soit
M0 (x0 , 0) un point de cet axe : on a par définition de la fonction f (x0 , 0) = 0 et par ailleurs,
en tout point M (x, y) : |f (x, y)| ≤ |xy|, donc :
Z 0
−1
−2
−3
3 −3
2 −2
1 −1
0 0
−1 1
−2 2
X Y
−3 3
Pour les calculer au point O(0, 0), on se ramène à la définition par les taux de variations :
(
∂f f (x,0)−f (0,0)
∂x (0, 0) = limx→0 x =0
∂f f (0,y)−f (0,0)
∂y (0, 0) = lim y→0 y = 0
∂f ∂f
(xn , yn ) = −1 6= (0, 0) = 0,
∂y ∂y
et :
g(x, y) = (x + y, x − y).
Calculer la matrice jacobienne de la fonction h = f ◦ g en (x, y) ∈ R2 .
Corrigé
On a tout simplement :
donc : " #
∂h1 ∂h1
∂x ∂y 4y cos(4xy) 4x cos(4xy)
Jh (x, y) = ∂h2 ∂h2 (x, y) = .
∂x ∂y
−4y sin(4xy) −4x sin(4xy)
1. Préciser si les fonctions suivantes sont homogènes et, si oui, de quel degré :
(a) f (x, y) = 2x2 + 3xy + y 2 .
x−y
(b) f (x, y) = x2 +y 2
.
(c) f (x, y) = u( xy ) où
u est une fonction de R dans R.
Qn 1
(d) f (x1 , ..., xn ) = ( i=1 xi ) n .
Dans la suite, on se restreint (sans perte de généralité) aux fonctions de 2 variables.
2. Montrer que si f est C 1 et homogène de degré α, alors ses dérivées partielles sont homogènes
de degré (α − 1).
3. Soit f une fonction C 1 de R2 dans R et M0 (x0 , y0 ) fixé. Soit encore
R∗+ → R
g:
t 7→ f (tx0 , ty0 )
(b) Réciproque : avec g définie comme en 3), supposons qu’on ait la relation d’Euler. Mon-
trer que :
∀t > 0 t · g′ (t) = α · g(t).
Intégrer cette équation différentielle, montrer que la constante d’intégration vaut g(1)
et en déduire que f est homogène de degré α. Indication : on rappelle que la solution
générale de l’équation différentielle φ′ (t) = a(t)φ(t) est de la forme φ(t) = c× exp(A(t)),
où c est une constante et A(t) une primitive de a(t).
Corrigé
1. Les fonctions proposées sont toutes homogènes, de degrés respectifs 2, -1, 0 et 1.
2. Dire que f est homogène de degré α est exactement dire qu’on a égalité entre les fonctions
g et h définies par g(x, y) = f (tx, ty) et h(x, y) = tα f (x, y). Puisque f est C 1 , ces deux
fonctions le sont aussi et leur dérivées partielles doivent donc coïncider. Ainsi, pour tout
couple (x, y) et tout t > 0, on a
∂g ∂f ∂h ∂f ∂f ∂f
(x, y) = t (tx, ty) et (x, y) = tα (x, y) ⇒ (tx, ty) = tα−1 (x, y).
∂x ∂x ∂x ∂x ∂x ∂x
Ceci prouve que la première dérivée partielle de f est bien homogène de degré (α − 1). Il en
va clairement de même pour la seconde.
3. La fonction g est C 1 puisque f l’est et la règle de dérivation en chaîne donne
∂f ∂f
g′ (t) = x0 (tx0 , ty0 ) + y0 (tx0 , ty0 ).
∂x ∂y
On a de plus c = g(1) = f (x, y) et on a donc montré que pour tout couple (x, y) et tout
t > 0,
g(t) = tα g(1) ⇔ f (tx, ty) = tα f (x, y),
qui montre que f est homogène de degré α.
R2 →R
3
f: (x, y) 7→ x2xy+y2 si (x, y) 6= (0, 0)
(0, 0) 7→ 0
Corrigé
1. On passe en coordonnées polaires pour obtenir
|f (r cos θ, r sin θ)| = |r 2 cos θ sin3 θ| = r 2 × | cos θ| × | sin3 θ| ≤ r 2 −−−→ 0 = f (0, 0),
r→0
∂f
ce qui prouve que lim(x,y)→(0,0) ∂x (x, y) = 0.
3. Pour x différent de 0,
f (x, 0) − f (0, 0)
= 0 −−−→ 0.
x x→0
Par définition, cette limite est la dérivée partielle de f par rapport à x au point (0, 0). Ainsi
nous venons de montrer que
∂f
(0, 0) = 0.
∂x
∂f
ce qui prouve que lim(x,y)→(0,0) ∂y (x, y) = 0.
5. Pour y différent de 0,
f (0, y) − f (0, 0)
= 0 −−−→ 0.
y y→0
Par définition, cette limite est la dérivée partielle de f par rapport à y au point (0, 0). Ainsi
∂f
(0, 0) = 0.
∂y
6. Comme précisé ci-dessus, la fonction f est de classe C 1 sur l’ouvert U . De plus, les questions
précédentes montrent que non seulement f admet des dérivées partielles en l’origine mais
plus précisément que
∂f ∂f ∂f ∂f
(0, 0) = 0 = lim (x, y) et (0, 0) = 0 = lim (x, y).
∂x (x,y)→(0,0) ∂x ∂y (x,y)→(0,0) ∂y
C’est exactement dire que les dérivées partielles de f sont aussi continues en l’origine, ce qui
assure que f est C 1 sur R2 tout entier.
∂2f
(1/n, 0) = 0 −−−→ 0.
∂x∂y n→∞
Par ailleurs, la suite (xn , yn ) = (0, 1/n) tend elle aussi vers l’origine, mais cette fois
∂2f
(0, 1/n) = 1 −−−→ 1.
∂x∂y n→∞
Ceci prouve que la dérivée seconde croisée n’admet pas de limite en (0, 0).
9. Pour x différent de 0, les questions 4 et 5 donnent
∂f ∂f
(x, 0) − (0, 0)
∂y ∂y
= 0 −−−→ 0.
x x→0
Par définition, cette limite est la dérivée partielle par rapport à x de la dérivée partielle de
f par rapport à y au point (0, 0). Ainsi nous venons de montrer que
∂2f
∂ ∂f
(0, 0) = (0, 0) = 0.
∂x ∂y ∂x∂y
∂f ∂f
(0, y) − (0, 0) y−0
∂x ∂x = = 1 −−−→ 1.
y y y→0
En d’autres termes,
∂2f
∂ ∂f
(0, 0) = (0, 0) = 1.
∂y ∂x ∂y∂x
11. Le théorème de Schwarz dit que si f est C 2 sur un ouvert U (autrement dit si elle admet des
dérivées partielles secondes et que celles-ci sont continues) alors en tout point (x, y) de U ,
les dérivées secondes croisées coïncident, c’est-à-dire
∂2f ∂2f
(x, y) = (x, y).
∂x∂y ∂y∂x
Dans le présent contexte, le problème vient de ce qui se passe en l’origine. La fonction f y
admet bien des dérivées secondes croisées mais celles-ci ne sont pas égales puisque, comme
on vient de le voir,
∂2f ∂2f
(0, 0) = 0 6= 1 = (0, 0).
∂x∂y ∂y∂x
Ceci n’est pas étonnant au vu du résultat de la question 8, qui montrait que la dérivée se-
conde croisée en dehors de l’origine (prise dans n’importe quel ordre de dérivation) n’admet
pas de limite en l’origine.
C →C
exp :
z = x + iy 7→ exp z = ex+iy = ex cos y + iex sin y
On peut aussi la voir comme une fonction de 2 variables
R2 → R2
exp :
(x, y) 7→ (u = ex cos y, v = ex sin y)
1. Calculer les dérivées partielles de u et v par rapport à x et y.
2. Montrer que le jacobien de l’exponentielle ainsi définie ne s’annule jamais. La fonction exp
est-elle pour autant injective ?
3. Vérifier les relations de Cauchy-Riemann dans ce cas particulier :
(
∂u ∂v
∂x = ∂y
∂u ∂v
∂y = − ∂x
∂2f ∂2f
En déduire que u et v sont harmoniques, i.e. ∆u = ∆v = 0, où ∆f = ∂x2
+ ∂y 2
est le
Laplacien de f .
puis de même :
∂2f 2x2 −y 2 −z 2
∂x2 = 5
(x2 +y 2 +z 2 ) 2
∂2f −x2 +2y 2 −z 2
∂y 2 = 5
(x2 +y 2 +z 2 ) 2
∂2f −x2 −y 2 +2z 2
=
∂z 2 5
(x2 +y 2 +z 2 ) 2
∂2f ∂2f
∆f = + ,
∂x2 ∂y 2
est donné en coordonnées polaires par :
∂ 2 ϕ 1 ∂ϕ 1 ∂2ϕ
∆f = + · + · .
∂r 2 r ∂r r 2 ∂θ 2
3. On s’intéresse aux fonctions harmoniques radiales, c’est-à-dire de Laplacien partout nul et
telles que l’image d’un point (x, y) par f ne dépende que de sa distance au centre :
1. Montrer que la fonction f définie par f (x, y) = ex (x cos y − y sin y) est harmonique sur R2 .
2. On suppose que la fonction f est harmonique et de classe C 3 sur R2 . Montrer qu’alors la
fonction g = ∂f
∂x est elle aussi harmonique.
3. De la même façon, on dit que la fonction f : U → R est harmonique sur l’ouvert U de R3
si :
∂2f ∂2f ∂2f
∀(x, y, z) ∈ U (x, y, z) + (x, y, z) + (x, y, z) = 0.
∂x2 ∂y 2 ∂z 2
Montrer que la fonction f : (x, y, z) 7→ arctan xy + arctan yz + arctan xz est harmonique sur
R∗ × R∗ × R∗ .
Corrigé
1. La fonction f admet pour dérivées premières :
(
∂f x
∂x = e (x cos y − y sin y + cos y)
∂f x
∂y = −e (x sin y + y cos y + sin y)
∂ 2 ∂f ∂3f ∂ ∂2f
= = ,
∂y 2 ∂x ∂x∂y 2 ∂x ∂y 2
ce qui donne :
∂2g ∂2g ∂2f ∂2f
∂ ∂
2
+ 2 = 2
+ 2 = (0) = 0,
∂x ∂y ∂x ∂x ∂y ∂x
et la fonction g est bien harmonique.
3. La dérivée partielle de f par rapport à x est :
∂f y z
=− 2 + .
∂x x + y 2 z 2 + x2
Les deux autres s’en déduisent, vue la symétrie des rôles joués par x, y et z. On a alors la
dérivée seconde de f par rapport à x :
Les deux autres s’en déduisent à nouveau et on vérifie alors sans problème que f est harmo-
nique sur (R∗ )3 .
R2 → R2
ϕ:
(x, y) 7→ (ϕ1 (x, y), ϕ2 (x, y)) = (ex cos y, ex sin y)
et on dit que f est harmonique si son Laplacien est nul en tout point (x, y). Montrer que les
fonctions ϕ1 et ϕ2 sont harmoniques.
4. Soit f : R2 → R de classe C 2 et ϕ : (r, θ) 7→ ϕ(r, θ) de R+ × [0, 2π[ dans R la fonction
associée en coordonnées polaires, c’est-à-dire définie pour tout couple (r, θ) tel que (x, y) =
(r cos θ, r sin θ) par ϕ(r, θ) = f (r cos θ, r sin θ). Exprimer ∂ϕ ∂ϕ
∂r (r, θ) et ∂θ (r, θ) en fonction de
∂f ∂f
∂x , ∂y , r et θ.
5. Montrer que le Laplacien de f admet l’expression suivante en coordonnées polaires :
∂ 2 ϕ 1 ∂ϕ 1 ∂2ϕ
∆f = + · + · .
∂r 2 r ∂r r 2 ∂θ 2
Corrigé
∂ϕ2 ∂ϕ2
(x, y) = ex sin y et (x, y) = ex cos y.
∂x ∂y
∂ϕ1 ∂ϕ1
(x, y) (x, y) x
e cos y −ex sin y
∂x ∂y
Jϕ (x, y) = ∂ϕ = .
2 ∂ϕ2 ex sin y ex cos y
(x, y) (x, y)
∂x ∂y
2. On en déduit que det Jϕ (x, y) = e2x > 0. Néanmoins, la fonction ϕ n’est pas injective
puisqu’on voit par exemple que ϕ(0, 0) = ϕ(0, 2π) = (1, 0). Notons que ceci ne pourrait
arriver avec une fonction ϕ : R → R de classe C 1 . En effet, si sa dérivée ne s’annulait pas sur
R, celle-ci serait de signe constant (par continuité) et ϕ serait donc strictement monotone,
donc injective.
3. Des calculs élementaires donnent
∂ 2 ϕ1 ∂ 2 ϕ1
∆ϕ1 (x, y) = (x, y) + (x, y) = ex cos y − ex cos y = 0,
∂x2 ∂y 2
et
∂ 2 ϕ2 ∂ 2 ϕ2
∆ϕ2 (x, y) = (x, y) + (x, y) = ex sin y − ex sin y = 0,
∂x2 ∂y 2
ce qui montre que les fonctions ϕ1 et ϕ2 sont bien harmoniques.
4. Puisque ϕ(r, θ) = f (r cos θ, r sin θ), la règle de dérivation en chaîne donne d’une part
∂ϕ ∂f ∂f
(r, θ) = cos θ (r cos θ, r sin θ) + sin θ (r cos θ, r sin θ),
∂r ∂x ∂y
et d’autre part
∂ϕ ∂f ∂f
(r, θ) = −r sin θ (r cos θ, r sin θ) + r cos θ (r cos θ, r sin θ).
∂θ ∂x ∂y
∂2ϕ
(r, θ)
∂r 2
∂2f ∂2f ∂2f
= cos2 θ 2 (r cos θ, r sin θ) + 2 cos θ sin θ (r cos θ, r sin θ) + sin2 θ 2 (r cos θ, r sin θ)
∂x ∂x∂y ∂y
et, en convenant de noter “() = (r cos θ, r sin θ)” afin d’alléger les écritures,
∂2ϕ
(r, θ)
∂θ 2
∂f ∂f ∂2f ∂2f ∂2f
= −r cos θ () − r sin θ () + r 2 sin2 θ 2 () − 2r 2 cos θ sin θ () + r 2 cos2 θ 2 ().
∂x ∂y ∂x ∂x∂y ∂y
On en déduit que
∂2ϕ 1 ∂ϕ 1 ∂2ϕ
2
(r, θ) + · (r, θ) + 2 · (r, θ)
∂r r ∂r r ∂θ 2
∂2f ∂2f
= (r cos θ, r sin θ) + (r cos θ, r sin θ) = ∆f (r cos θ, r sin θ),
∂x2 ∂y 2
ce qui était le résultat voulu.
Corrigé
1. f est de classe C 2 (et même de classe C ∞ ) par les théorèmes opératoires classiques : on
peut donc appliquer la méthode des dérivées premières et secondes pour l’étude des extrema
locaux. On commence par calculer ses dérivées partielles premières, soit :
(
∂f
∂x (x, y) = 2(x + y)
∂f 2
∂y (x, y) = 2x + 1 − 3y
Avec les notations de Monge, on obtient donc, au point A, pr − q 2 = 8 > 0 avec p = 2 > 0,
donc A correspond à un minimum local pour f .
Au point B, pr − q 2 = −8 < 0 donc B correspond à un point selle (ni minimum local ni
maximum local).
3. La valeur de f au point A est f (1, −1) = −1, or on a par exemple f (0, 2) = −6 < f (1, −1),
donc A n’est pas un minimum global.
Remarque. Notons que, sans même chercher les minima locaux, il était clair dès le début
que f ne pouvait admettre de minimum global sur R2 puisque :
Cette absence de minimum global alors que f est continue vient bien entendu du fait que
R2 n’est pas compact.
(c) En déduire que les extrema trouvés en 1. sur le cercle unité sont des extrema globaux.
Corrigé
1. f est clairement C ∞ . La résolution du système d’équations
∂f ∂f
(x, y) = (x, y) = 0
∂x ∂y
donne cinq points critiques : l’origine du repère O(0, 0) ainsi que 4 points sur le cercle unité
A1 (1, 0), A2 (−1, 0), A3 (0, 1) et A4 (0, −1). Par la méthode classique de Monge, on montre
que O est un point selle, que A3 et A4 sont des minima locaux alors que A1 et A2 sont des
maxima locaux.
2. (a) On a :
2 2
|f (ρ cos θ, ρ sin θ)| = | cos 2θ|ρ2 e−ρ ≤ ρ2 e−ρ .
Via l’étude de ses variations, on vérifie que g est majorée par 1e .La question précédente
implique donc que
1 1
∀(x, y) ∈ R2 − ≤ f (x, y) ≤ .
e e
(c) Puisque
1
f (1, 0) = f (−1, 0) = ,
e
avec 1
e majorant de f sur R2 , et comme
1
f (0, 1) = f (0, −1) = − ,
e
avec − 1e minorant de f sur R2 , on en déduit que A1 et A2 sont les maxima globaux de
f tandis que A3 et A4 sont ses minima globaux.
f (x, y) = x exp(−x − y 4 ).
ϕ(t) = te−t .
Corrigé
f est clairement de classe C ∞ sur R2 .
1. Les points critiques de f s’obtiennent à partir du système
(
∂f −x−y 4 = 0
∂x (x, y) = (1 − x)e
∂f 3 −x−y 4 = 0
∂y (x, y) = −4xy e
qui possède l’unique solution (x, y) = (1, 0). Donc si f admet un extremum, il est forcément
situé en A = (1, 0).
2. Le calcul des dérivées secondes de f donne :
2
∂ f −x−y 4
∂x2 = (x − 2)e
2
∂ f 4
∂x∂y = 4y 3 (x − 1)e−x−y
∂ 2 f2 = 4xy 2 (4y 4 − 3)e−x−y4
∂y
C2 C1
− −
+ +
Corrigé
1. Les courbes C1 et C2 sont deux paraboles de sommet O, C2 étant au-dessus de C1 .
2. Soit M (x, y) ∈ R2 . Il faut distinguer trois cas :
– Si y > 2x2 (d’où y > x2 ), i.e. si M est au-dessus de C2 , alors f (x, y) > 0.
– Si y > x2 et y < 2x2 , i.e. si M est au-dessus de C1 et au-dessous de C2 , alors f (x, y) < 0.
– Si y − x2 < 0 (d’où y < 2x2 ), i.e. si M est au-dessous de C1 , alors f (x, y) > 0.
3. f (x, y) = 2x4 − 3x2 y + y 2 est de classe C ∞ en tant que fonction polynôme et ses dérivées
partielles sont : (
∂f 3
∂x = 8x − 6xy
∂f 2
∂y = −3x + 2y
2x(4x2 − 3y) = 0
3x2 − 2y =0
y = 32 x2
qui n’a pas de solution non nulle. Donc O est le seul point critique.
Puisque f (0, 0) = 0, l’étude du signe de f montre clairement que f ne peut admettre en ce
point ni maximum ni minimum local : tout voisinage de O comporte en effet à la fois des
points d’image positive et des points d’image négative par f . On peut également montrer
que ce n’est pas un point selle pour f via le calcul des dérivées secondes :
∂2f
= 24x2 − 6y
∂x22
p =0
∂ f
∂x∂y = −6x ⇒ q =0
∂2f
r =2
∂y 2 =2
donc, quel que soit α, ϕ′α (0) = 0 et ϕ′′α (0) = 2α2 > 0, ce qui prouve bien que O est un
minimum local. Pourtant, on vient de voir que O n’est pas un minimum pour f .
Corrigé
1. Df =]0, +∞[×R.
2. (a) f est de classe C ∞ sur son domaine et admet pour dérivées partielles
(
∂f 2 2
∂x = (ln x) + 2 ln x + y
∂f
∂y = 2xy
Pour que M (x, y) soit un point critique de f , il faut donc, d’après la deuxième équation
et puisque x > 0, que y = 0. En reportant dans la première équation, ceci implique
(ln x)2 + 2 ln x = 0, i.e. x = 1 ou x = e−2 . On a donc deux points critiques : A(1, 0) et
B(e−2 , 0).
(b) Le calcul des dérivées secondes de f donne
∂2f
∂x22
= 2 · 1+ln
x
x
∂ f
∂x∂y = 2y
∂2f
∂y 2
= 2x
4. En déduire que les extrema locaux obtenus sont des extrema globaux.
Corrigé
La fonction f est clairement de classe C ∞ , ce qui légitime les calculs qui suivent.
1. Calcul des dérivées partielles : (
∂f
∂x = 2x − 2y
∂f
∂y = −2x + y 3
Recherche des points critiques : la première équation équivaut à y = x, ce qui donne par
substitution dans la seconde :
x3 − 2x = 0 ⇔ x(x2 − 2) = 0,
√ √
√ x√= 2 ou x = − 2.√Au total
c’est-à-dire que x = 0 ou √ on a donc trois points critiques :
l’origine O, le point A( 2, 2) et le point B(− 2, − 2).
2. Le calcul des dérivées à l’ordre deux donne :
∂2f
∂x22
=2
∂ f
∂x∂y = −2
∂2f
= 3y 2
∂y 2
4. Par positivité des carrés, on en déduit que pour tout couple (x, y) :
f (x, y) ≥ −1.
√ √ √ √
Or f ( 2, 2) = f (− 2, − 2) = −1 donc A et B correspondent bien à des minima globaux
sur R2 .
1 − x2 +y2
f (x, y) = e 2 .
2π
Cette fonction f correspond à la densité de probabilité d’un vecteur gaussien centré 10 et de matrice
de covariance égale à l’identité.
1. Trouver les points critiques de f et déterminer leur nature.
2. Montrer que le maximum local de f est un maximum global.
3. Représenter la surface définie par f .
(x−1)2 +(y−2)2
1 −
4. Représenter celle définie par g(x, y) = 8π e
8 .
Corrigé
1. La fonction f est de classe C ∞ . Ses dérivées partielles premières sont :
(
∂f 2 2 2 −3/2
∂x = (1 + y + xy − x)(1 + x + y )
∂f 2 2 2 −3/2
∂y = (−1 − x − xy − y)(1 + x + y )
1 + y 2 + xy − x = 0
−1 − x2 − xy − y = 0
y 2 − x2 − x − y = 0 ⇔ (y + x)(y − x) − (y + x) = 0 ⇔ (y + x)(y − x − 1) = 0,
10. i.e. de moyenne nulle.
1 + (x + 1)2 + x(x + 1) − x = 0 ⇔ x2 + x + 1 = 0,
1 + x2 − x2 − x = 0 ⇔ x = 1,
d’où l’on déduit que l’unique point critique est A(1, −1).
2. Pour montrer que c’est un maximum local, on calcule les dérivées partielles secondes :
∂2f
∂x
2 = (y − 1)(1 + x2 + y 2 )−3/2 − 3x(1 + y 2 + xy − x)(1 + x2 + y 2 )−5/2
2
∂ f 2 2 −3/2 − 3y(1 + y 2 + xy − x)(1 + x2 + y 2 )−5/2
∂x∂y = (2y + x)(1 + x + y )
∂2f
∂y 2
= (−x − 1)(1 + x2 + y 2 )−3/2 − 3y(−1 − x2 − xy − y)(1 + x2 + y 2 )−5/2
p = −2 · 3−3/2
q = −3−3/2
r = −2 · 3−3/2
ce qui donne pr − q 2 = 1/9 > 0, avec p < 0, donc f admet bien un maximum local en A.
3. L’inégalité de Cauchy-Schwarz dit que la valeur absolue du produit scalaire est inférieure ou
égale au produit des normes :
q q
|x1 x2 + y1 y2 + z1 z2 | ≤ x21 + y12 + z12 · x22 + y22 + z22 ,
Corrigé
1. f est de classe C 2 (et même de classe C ∞ ) par les théorèmes opératoires classiques : on
peut donc appliquer la méthode des dérivées premières et secondes pour l’étude des extrema
locaux. On commence par calculer ses dérivées partielles premières, soit :
(
∂f 3
∂x (x, y) = 4(x − y)
∂f 3
∂y (x, y) = 4(y − x)
∂f ∂f
(x, y) = (x, y) = 0
∂x ∂y
donne les trois points critiques O(0, 0), A(1, 1) et B(−1, −1).
2. Les dérivées partielles secondes de f sont :
∂2f
∂x22 (x, y) = 12x2
∂ f
∂x∂y (x, y) = −4
∂2f
(x, y) = 12y 2
∂y 2
4. Par positivité des carrés, on en déduit que pour tout couple (x, y) :
f (x, y) ≥ −2.
Or f (1, 1) = f (−1, −1) = −2, donc A et B correspondent bien aux minima globaux sur R2 .
Corrigé
Les coordonnées x, y et z sont supposées positives. On cherche le maximum de la fonction
f (x, y, z) = x + y + z sous la contrainte x2 + y 2 + z 2 = 1.
1. La surface
S = {(x, y, z) : x ≥ 0, y ≥ 0, z ≥ 0, x2 + y 2 + z 2 = 1}
est un huitième de sphère, avec ses bords : c’est clairement un compact, puisque fermé et
borné. La fonction f est continue sur ce domaine, donc bornée et atteint ses bornes, en
particulier son maximum.
2. Le lagrangien associé au problème est la fonction de 4 variables :
Corrigé
1. On étudie la fonction f : (x, y) 7→ (x − y)2 + (x + y)3 .
(a) Calcul des dérivées partielles :
(
∂f 2
∂x = 2(x − y) + 3(x + y)
∂f 2
∂y = −2(x − y) + 3(x + y)
Recherche des points critiques : la somme et la différence des deux équations implique
(x + y) = 0 et (x − y) = 0, c’est-à-dire que x = y = 0 : l’origine O est le seul point
critique.
2. On veut mettre le nombre 1728 sous la forme d’un produit de 3 nombres positifs de sorte
que leur somme soit minimale.
(a) Ceci revient à minimiser :
f (x, y, z) = x + y + z,
sous la contrainte :
g(x, y, z) = xyz − 1728 = 0,
avec x, y et z positifs. Le lagrangien associé au problème s’écrit donc :
(b) L’ensemble
F = {(x, y, z) ∈ R3+ , xyz = 1728}
est fermé comme intersection du fermé R3+ et de l’image réciproque du fermé 1728 par
la fonction continue (x, y, z) 7→ xyz. Par ailleurs, on peut clairement se contenter de
chercher la solution dans le pavé fermé borné P = [0, 2000]3 puisqu’on veut minimiser
la somme des 3 nombres. Au total, on cherche donc à minimiser f sur l’ensemble
K = F ∩ P,
compact puisque fermé et borné. Cette fonction étant continue, il existe au moins un
point où ce minimum est atteint.
Par ailleurs, ce point correspond nécessairement à un point critique du lagrangien, c’est-
à-dire : ∂L
∂x = 1 + λyz =0
∂L
= 1 + λxz =0
∂y
∂L
∂z = 1 + λxy =0
∂L
∂λ = xyz − 1728 = 0
Des trois premières équations on déduit aisément que :
p
x = y = z = −1/λ.
[0, 2π] → R
φ:
t 7→ f (cos t, sin t)
x2 y 2
f (x, y) = + ,
9 4
où les variables x et y sont liées par la contrainte :
x2 + y = 1.
Corrigé
1. Notons g(x, y) = x2 + y − 1 la contrainte. Le Lagrangien du problème s’écrit donc :
x2 y 2
L(x, y, λ) = f (x, y) + λg(x, y) = + + λ(x2 + y − 1).
9 4
Ses dérivées partielles sont
∂L
= 2x
∂x 9 + 2λx
∂L
∂y = y2 + λ
∂L
= x2 + y − 1
∂λ
√
3. On en déduit F ′ (x) = x3 − 79 x et les solutions de l’équation F ′ (x) = 0 sont x = 0, x = 3
7
√ √ √
et x = − 37 ,
d’où les trois points critiques du Lagrangien A1 (0, 1), A2 ( 37 , 29 ) et A3 (−7 2
3 , 9)
obtenus par substitution des valeurs de x dans l’équation de la contrainte. Il √ est clair d’après
√
l’étude de F que le minimum de cette fonction est atteint aux points x = 37 et x = − 37 et
le maximum en x = 0. On voit facilement que A1 est un maximum local pour f , A2 et A3
étant des minimums globaux.
4. Si f admet un maximum global, il est forcément atteint en son unique maximum local A1 ,
or on remarque que :
lim f (x, 1 − x2 ) = lim F (x) = +∞,
x→+∞ x→+∞
xi 1 2 3 4
yi 3 4 3 0
On veut modéliser la dépendance entre x et y par une fonction affine, c’est-à-dire qu’on cherche la
droite ∆a,b : y = ax + b qui modélise “au mieux” les points Mi (xi , yi ) obtenus par l’expérience.
1. Représenter les quatre points Mi (xi , yi ) dans un repère (O,~i, ~j).
2. On note S(a, b) = ((axi + b) − yi )2 , somme des carrés des distances des points Mi aux
P
points Ni de même abscisse et appartenant à la droite ∆a,b . Montrer que S(a, b) peut se
mettre sous la forme
où l’on précisera la valeur de la constante (qui n’est pas la même qu’en question 2). En
déduire que le minimum local est bien global. Interpréter la valeur de la constante sur le
graphique.
Corrigé
1. Les quatre points Mi (xi , yi ) sont représentés Figure 1.27.
2. Par définition, on a
∆a0 ,b0
N1 M2
N2 M3
M1
N3
N4
M4
∂S (a, b) = 20a + 8b − 20
∂b
Rechercher les points critiques revient donc à résoudre le système
60a + 20b − 40 = 0 3a + b = 2 a = −1
⇐⇒ ⇐⇒
20a + 8b − 20 = 0 5a + 2b = 5 b = 5
On obtient donc l’unique point critique (ao , b0 ) = (−1, 5). Sa nature est précisée via la calcul
des dérivées partielles d’ordre 2 :
∂2S
(a, b) = 60
∂a2
2
∂ S
2 2
(a, b) = 20 =⇒ pr − q = 60 × 8 − 20 = 80 > 0.
∂a∂b
2
∂ S
(a, b) = 8
∂b 2
Puisque p = 60 > 0, on obtient bien un minimum local en ce point. La droite ∆ao ,b0 est
représentée Figure 1.27. On l’appelle droite des moindres carrés ou droite de régression.
4. La méthode de réduction de Gauss donne
Une somme de carrés ne pouvant être que positive, on en déduit que S est toujours supérieure
ou égale à 4, le seul cas d’égalité se produisant lorsque les deux carrés sont nuls, i.e. pour
a = −1 et b = 5. Il en découle qu’on a bien un minimum global en (−1, 5). La valeur de la
constante, à savoir 4, est la somme des carrés des écarts verticaux des points Mi à la droite
de régression ∆ao ,b0 : on l’appelle somme des carrés résiduelle.
Remarque. La régression est un thème à part entière des statistiques. Pour en savoir plus,
d’un point de vue théorique comme pratique, on pourra par exemple consulter le livre de
Cornillon et Matzner-Lober [3].
R3+ → R
H:
(x, y, z) 7→ −x ln x − y ln y − z ln z
Corrigé
1. Puisque x + y + z = 1 est l’équation d’un plan de R3 et que l’on se restreint au huitième
d’espace {x ≥ 0, y ≥ 0, z ≥ 0}, on en déduit que T est l’intérieur du triangle de sommets
I(1, 0, 0), J(0, 1, 0) et K(0, 0, 1) (bords inclus).
2. Si l’on convient de noter g la fonction continue définie par g(x, y, z) = x + y + z − 1, alors
l’ensemble
T = g−1 ({0}) ∩ R3+
est l’intersection de deux fermés de R3 , donc est fermé. De plus, puisque 0 ≤ x, y, z ≤ 1, T
est borné. Au total, T est un ensemble compact sur lequel H est continue : elle y est donc
bornée et y atteint ses bornes, en particulier son maximum.
3. Le Lagrangien associé au problème est
Le point (1/3, 1/3, 1/3) est donc un point candidat pour le maximum global de H sur T .
Montrer que c’est effectivement le cas est plus délicat (et n’était pas demandé). La façon
la plus expéditive est de constater que la fonction logarithme étant concave, l’inégalité de
convexité (encore appelée inégalité de Jensen dans un cadre probabiliste) assure que
p1 ln x1 + p2 ln x2 + p3 ln x3 ≤ ln(p1 x1 + p2 x2 + p3 x3 ),
pour tout triplet (x1 , x2 , x3 ) de réels positifs et tout triplet (p1 , p2 , p3 ) de poids pi positifs
et de somme égale à 1. Pour tout triplet (x, y, z) de T , il suffit alors d’appliquer ceci avec
1 1 1
(p1 , p2 , p3 ) = (x, y, z) et (x1 , x2 , x3 ) = 3x , 3y , 3z pour obtenir
1 1 1 1 1 1
x ln + y ln + z ln ≤ ln x × +y× +z× =0 ⇐⇒ H(x, y, z) ≤ ln 3.
3x 3y 3z 3x 3y 3z
∂U ∂U
/ (x, y)
∂x ∂y
est égal à 2.
2. (a) On considère la fonction d’utilité définie par U (x, y) = 2x+y. Montrer que cette fonction
caractérise bien le comportement du consommateur.
(b) Les prix unitaires des biens b1 et b2 sont respectivement p1 = 2 et p2 = 3. Déterminer
la composition (x0 , y0 ) du panier qui optimisera la satisfaction du consommateur.
2.0
1.6
φ(t)
1.2
0.8
0.4
t
0.0
1 2 3 4 5 6
−0.4
Corrigé
On peut passer par la méthode du lagrangien en écrivant qu’on cherche les extrema de f sous la
contrainte g(x, y) = 0, avec g(x, y) = x2 + y 2 − 1.
On peut aussi se ramener à l’étude des extrema d’une fonction d’une seule variable en paramétrant
le problème, i.e. en écrivant que sur le cercle trigonométrique : (x, y) = (cos t, sin t).
D’où à étudier (voir Figure 1.28)
[0, 2π] → R
φ=
t 7→ f (cos t, sin t) = 31 cos 2t + sin 2t + 23
On note que φ(t + π) = φ(t), donc φ est π−périodique et on se contente de l’étudier sur [0, π]. le
calcul de la dérivée donne :
2
φ′ (t) = 2 cos 2t − sin 2t.
3
Ainsi, sur [0, π], φ′ (t) = 0 si et seulement si t = θ = 12 arctan 3, ou si t = θ + π2 .
On vérifie alors sans problème que φ est croissante entre 0 et θ, décroissante entre θ et θ + π2 , à
nouveau croissante entre θ + π2 et π.
√
Le maximum de φ est√donc φ(θ) = ( 10 + 2)/3. Autrement dit, le maximum √ √de f sur le cercle
trigonométrique
√ est
√ ( 10 + 2)/3 ≈ 1.72, atteint aux deux points (1/ 10, 3/ 10) ≈ (0.32, 0.95)
et (−1/ 10, −3/ 10). √
Le minimum de φ est φ(θ + π2 ) = (− 10 + 2)/3 ≈ −0.39. Autrement dit, le minimum de f
√ √ √
sur √le cercle √trigonométrique est (− 10 + 2)/3, atteint aux deux points (−3/ 10, 1/ 10) et
(3/ 10, −1/ 10). C’est ce qu’illustre la Figure 1.29.
Corrigé
Pour l’étude des extrema locaux, on se place à l’intérieur du compact F = [0, 1] × [−π, π], c’est-à-
dire sur l’ouvert U =]0, 1[×] − π, π[. Les surfaces définies par les fonctions f et g sont représentées
2.0
1.6
1.2
Z 0.8
0.4
−0.4
−1.0 −1.0
−0.6 −0.6
−0.2 −0.2
0.2 0.2
Y 0.6 0.6 X
1.0 1.0
y2
Figure 1.29 – Représentation de f (x, y) = x2 + 2xy + 3 pour x2 + y 2 = 1.
4
1.0 3
4
2
3 1.0
1
2
Z 1 0
0 Z −1
−1
−2 Y
−2 Y
−3 −3
−1.0 −1.0
−4 −4
0 1.0 0 1.0
X X
On en déduit que f n’a aucun point critique dans U , donc pas d’extremum local. Néanmoins, f
est continue sur le compact F donc y admet minimum global et maximum global, lesquels sont
atteints en des points nécessairement situés sur le bord de F . Puisque 0 ≤ x ≤ 1 et −1 ≤ sin y ≤ 1,
il est clair que −1 ≤ f (x, y) ≤ 1. Plus précisément, f atteint son minimum absolu −1 au seul point
(1, −π/2) et son maximum absolu 1 au seul point (1, π/2).
On suit la même démarche pour la fonction g. Sur l’ouvert U , on a :
(
∂g
∂x = 0
∂g
∂y = − sin y
On en déduit que g admet une infinité de points critiques : {(x, 0), 0 < x < 1}. Le calcul des
dérivées partielles à l’ordre 2 ne renseigne en rien sur leur nature puisqu’on obtient en chacun de
ces points (avec les notations de Monge) : pr − q 2 = 0. Cependant l’étude directe montre qu’en ces
points g(x, y) = cos y atteint son maximum global 1. Plus généralement, sur le fermé F , g atteint
son minimum global −1 en tous les points des deux segments
Corrigé
La surface définie par f est représentée Figure 1.31.
1. Recherche des points singuliers :
(
∂f
∂x = y 2 (1 − 2x − 2y)
∂f
∂y = 2xy(1 − x − 3y)
La résolution du système donne les points critiques suivants : tous les points d’ordonnée nulle
(x, 0), le point A(1/4, 1/4) et le point B(0, 1/2). Le calcul des dérivées à l’ordre deux donne :
∂2f
∂x22 = −2y 2
∂ f
∂x∂y = 2y(1 − 2x − 3y)
∂2f
= 2x(1 − x − 6y)
∂y 2
Au point M (x, 0) : pr − q 2 = 0, donc on ne peut rien dire a priori (cf. question 3).
Au point A : pr − q 2 = 1/32 > 0 avec p = −1/8 < 0, donc maximum local (pas besoin de
Taylor). Voir Figure 1.32 à gauche.
Au point B : pr − q 2 = −1/4 < 0 , donc c’est un point selle (voir Figure 1.32 à droite).
Z −1
−2
−3
−4
−1.0 −1.0
−0.6 −0.6
−0.2 −0.2
0.2 0.2
0.6 0.6
Y 1.0 1.0 X
7e−4
38e−4
Z
Z
26e−4
0.20
0.20
−0.06
0.23 0.23 −23e−4 −0.03
0.45
0.26 0
0.26
Y X 0.49
0.03 X
0.29 0.29 Y 0.53 0.06
2. f (1/4, 1/4) = 1/256, or on a par exemple f (1, −1) = 2, donc ce n’est pas un maximum
global.
3. Puisque pour tout x réel, f (x, 0) = 0, il suffit d’étudier le signe de f autour de l’axe des
abscisses pour en déduire la nature de ces points critiques. f (x, y) = xy 2 (1 − x − 2y), s’ex-
primant comme un produit, l’étude de signe ne pose pas problème (voir Figure 1.33). On en
déduit que :
- si x < 0 ou x > 1, le point (x, 0) est un maximum local pour f .
- si 0 < x < 1, le point (x, 0) est un minimum local pour f .
- les points (0, 0) et (1, 0) correspondent à des points selles.
Remarque : L’étude du signe de f montre que les minima et maxima locaux obtenus sur
l’axe des abscisses ne sont pas globaux.
+ 1
− + 1 − x
− + −
Corrigé
Ceci revient à trouver les extrema de f (x, y) = x2 + y 2 (carré de la distance d’un point M (x, y) à
l’origine) sous la contrainte 5x2 − 4xy + 2y 2 = 30. On cherche les extrema d’une fonction continue
sur une ellipse du plan, c’est-à-dire un compact. On est donc certain que maximum et minimum
sont atteints. Pour les déterminer, on utilise la méthode de Lagrange.
Notons g(x, y) = 5x2 − 4xy + 2y 2 − 30 la contrainte. Le lagrangien du problème s’écrit donc :
L(x, y, λ) = f (x, y) + λg(x, y) = (x2 + y 2 ) + λ(5x2 − 4xy + 2y 2 − 30).
Ses dérivées partielles sont ∂L
∂x = 2x + λ(10x − 4y)
∂L
∂y = 2y + λ(−4x + 4y)
∂L
= 5x2 − 4xy + 2y 2 − 30
∂λ
L’élimination de λ entre les deux premières équations donne la nouvelle équation :
2x2 + 3xy − 2y 2 = 0 (+)
laquelle, combinée avec la troisième équation, permet d’obtenir y en fonction de x :
30
y = 7x − .
x
A1
A4
.
0
−4 −2 2 4
A3
−2
−4
A2
Figure 1.34 – L’ellipse, ses points les plus proches et les plus éloignés de l’origine.
x4 − 10x2 + 24 = 0,
Corrigé
La fonction f est représentée Figure 1.35.
1. Recherche des points critiques :
(
∂f
∂x = 4(x3 − x + y) = 0
∂f
∂y = 4(y 3 + x − y) = 0
170
150
130
110
90
Z
70
50
30
10
−10
−3
−2
−1
0 −3
1 −2
−1
2 0
Y 1
3 2
3 X
La somme des deux lignes montre que y 3 = −x3 , ce qui revient à dire que y = −x puisqu’on
travaille avec des nombres réels. On substitue alors −x à y dans l’une des deux équations du
système et on obtient au final trois points critiques : O, A1 et A2 .
2. Le calcul des dérivées à l’ordre deux donne :
∂2f
∂x22
= 4(3x2 − 1)
∂ f
∂x∂y = 4
∂2f
∂y 2
= 4(3y 2 − 1)
Au point O (voir Figure 1.36 à gauche) : pr − q 2 = 0, donc on ne peut rien dire a priori.
Cependant, on remarque que f (0, 0) = 0, or f n’est pas de signe constant au voisinage de
l’origine. En effet f (x, x) = 2x4 ≥ 0, alors que f (x, −x) = 2x2 (x2 − 4) ≤ 0 pour x voisin de
0. Ceci montre que O est un point selle pour f .
3. Au point A1 (voir Figure 1.36 à droite) : pr − q 2 = 384 > 0 avec p = 20 > 0, donc minimum
local.
Au point A2 : pr − q 2 = 384 > 0 avec p = 20 > 0, donc minimum local.
Ce sont bien entendu les seuls minima locaux puisqu’un minimum local correspond nécessai-
rement à un point critique de f .
4. On vérifie sans problème l’inégalité proposée, d’où l’on déduit que pour tout point (x, y) du
plan :
f (x, y) ≥ x4 + y 4 − 4(x2 + y 2 ) = (x2 − 2)2 + (y 2 − 2)2 − 8 ≥ −8.
√ √ √ √
Or f ( 2, − 2) = f (− 2, 2) = −8, ce qui prouve que A1 et A2 correspondent à des
minima globaux pour f . Par la question 3), ce sont bien sûr les seuls puisque sur un ouvert
(ici R2 ) un minimum global est a fortiori minimum local.
5. L’étude des points critiques montre que f n’admet ni maximum local ni maximum global.
B = {(x, y) : x2 + y 2 ≤ 9}.
2
0
1
0 −2
−1
Z −4
Z −2
−6
−3
−4 −8
−5 1.9
1.6 −2.0
−6
−1.0
−0.3 −1.6
0.4 1.3
X
−0.3 0.4 −1.2 Y
X −1.0 Y 1.0
1. Montrer que f n’a pas de point critique dans U = {(x, y) ∈ R2 : 0 < x2 + y 2 < 9}.
2. Etablir que l’origine est un minimum global.
3. Etudier les variations de f sur C = {(x, y) : x2 + y 2 = 9}.
4. Conclure.
Corrigé
1. Il faut remarquer que B est un fermé (disque fermé), or l’étude des points critiques via les
dérivées partielles se fait sur les ouverts uniquement, il faut donc enlever le bord du disque.
De plus, la fonction “racine carrée” n’est pas dérivable en 0, donc il faut enlever l’origine du
repère pour f . L’étude des points critiques se fait donc sur l’ouvert U .
(
∂f
p
2 y2
∂x = x/ x +
∂f
p
2 2
∂y = y(2 + 1/ x + y )
∂f
∂x = 0 implique x = 0 et ∂f ∂y = 0 implique y = 0 : on obtiendrait l’origine, qui est exclue.
f n’a donc pas de point critique dans l’ouvert U . Les extrema de f sur le compact B sont
donc à chercher en l’origine et sur le cercle C.
2. Par positivité des carrés, il est clair que pour tout point (x, y), f (x, y) ≥ −1 et l’égalité a
lieu au seul point O. Donc l’origine est bien le minimum global de f .
3. Sur C, l’étude de f se ramène à l’étude de la fonction d’une seule variable
[0, 2π[ → R
φ=
t 7→ f (3 cos t, 3 sin t) = 9 sin2 t + 2
Le minimum de f sur C vaut 2 et est atteint aux deux points (3, 0) et (−3, 0).
Le maximum de f sur C vaut 11 et est atteint aux deux points A(0, 3) et B(0, −3).
4. f est continue sur le compact B donc y admet minimum global et maximum global. Des
questions précédentes on déduit que son minimum global est atteint au seul point O et vaut
−1, et que son maximum global est atteint aux deux points A et B et vaut 11.
Remarque. Le principe ici est le même que celui vu dans l’exercice 1.46.
Intégrales multiples
Introduction
Le but de ce chapitre est d’exposer le calcul des intégrales multiples : soit D un sous-ensemble de
Rn et f : D → R une fonction suffisamment régulière, on veut définir et pouvoir interpréter la
quantité : Z Z
I= ··· f (x1 , . . . , xn )dx1 . . . dxn .
D
D’un point de vue théorique, le cadre adapté à l’exposé des intégrales multiples est sans conteste
celui de l’intégration de Lebesgue (qui sera vue en Licence 3). Notre motivation étant plutôt
calculatoire, on se contentera ici de leur étude sous des hypothèses relativement simples, mais
souvent suffisantes en pratique.
D = (x, y) ∈ R+2 : 0 ≤ x ≤ 2, 0 ≤ x + 2y ≤ 2 ,
et la fonction
R2 → R
f:
(x, y) 7→ 3 − x − y
On veut pouvoir interpréter et calculer :
ZZ
I= f (x, y)dxdy.
D
Pour f : [a, b] → R+ continue, on sait que a f (x)dx correspond à la surface comprise entre les
Rb
x
(a) on fait varier x de 0 à 2 et, pour chaque x fixé, on fait varier y entre 0 et 1 − 2 ;
83
84 Chapitre 2. Intégrales multiples
(b) on fait varier y de 0 à 1 et, pour chaque y fixé, on fait varier x entre 0 et 2 − 2y.
2 1− x2
!
2 1− x2
!
2 1− x2
y2
Z Z Z Z Z
Ia = f (x, y)dy dx = (3 − x − y)dy dx = 3y − xy − dx
0 0 0 0 0 2 0
5 2
Z 2
3 2 5 1 3
= x − 2x + dx = x − x2 + x = 2.
0 8 2 8 2 0
C’est cette valeur commune I = Ia = Ib que l’on appellera intégrale de f sur le domaine D et que
l’on notera ZZ
I= f (x, y)dxdy.
D
11111111111111111
00000000000000000 11111111111111111
00000000000000000
1010 1010 1010 D
00000000000000000
11111111111111111 00000000000000000
11111111111111111
1 1
00000000000000000
11111111111111111 1111
0000
111111111
000000000
00000000000000000
11111111111111111
111111
000000
11111111111D
00000000000
x
telle que γ(0) = γ(1). Dire que la courbe γ est continue revient à dire que les applications t 7→ x(t)
et t 7→ y(t) sont toutes deux continues sur [0, 1]. On précise maintenant les domaines sur lesquels
on calculera les intégrales multiples.
γ γ
β
v(x)
D D
y
u(x)
α
a b
x ϕ(y) ψ(y)
Soit a = inf 0≤t≤1 x(t) et b = sup0≤t≤1 x(t). On peut alors définir deux fonctions u(x) et v(x)
continues telles que pour tout x ∈ [a, b], l’intersection du domaine D avec la droite d’équation
X = x soit exactement le segment [u(x), v(x)]. Le domaine D admet donc la description (Figure
2.3) :
D = {(x, y), a ≤ x ≤ b, u(x) ≤ y ≤ v(x)}.
De même, soit α = inf 0≤t≤1 y(t) et β = sup0≤t≤1 y(t), ϕ(y) et ψ(y) les deux fonctions continues
telles que pour tout y ∈ [α, β], l’intersection de D avec la droite d’équation Y = y soit le segment
[ϕ(y), ψ(y)]. Le domaine D admet encore la description :
1. appellation personnelle.
Le calcul d’une intégrale double se ramenant ainsi à deux calculs d’intégrales simples. Par symétrie
des rôles joués par x et y, on pourra aussi la définir comme :
Z β
h(y)dy,
α
Preuve (esquisse). On découpe les abscisses et les ordonnées suivant des subdivisions discrètes
(xj ) et (yi ), les points extrêmes étant respectivement a, b, α et β. Par définition de l’intégrale
simple, on a alors :
Z v(xj ) X
g(xj ) = f (xj , y)dy = lim f (xj , yi )(yi+1 − yi ),
u(xj ) y
i
la somme se faisant sur les indices i tels que u(xj ) ≤ yi ≤ v(xj ) et la limite sur y étant prise pour
le pas de la subdivision, i.e. sup |yi+1 − yi |, tendant vers zéro. De la même façon :
Z b X
g(x)dx = lim g(xj )(xj+1 − xj ),
a x
j
la somme se faisant cette fois sur tous les indices j et la limite sur x étant prise pour le pas de la
subdivision, i.e. sup |xj+1 − xj |, tendant vers zéro. Au total, on a donc :
Z b !
X X
g(x)dx = lim lim f (xj , yi )(xj+1 − xj )(yi+1 − yi ) .
a x y
j i
Les sommes finies sur les indices i et j ne dépendent pas de l’ordre de sommation. Par contre,
les limites sur les pas de subdivision ne sont pas prises dans le même ordre, donc rien ne prouve
a priori que les deux opérations conduisent au même résultat : ceci sera cependant assuré si les
limites sont uniformes, i.e. si la limite pour sup |xj+1 − xj | tendant vers zéro de la somme
X
f (xj , yi )(xj+1 − xj )(yi+1 − yi )
j
est uniforme par rapport aux yi , ou si la limite pour sup |yi+1 − yi | tendant vers zéro de la somme
X
f (xj , yi )(xj+1 − xj )(yi+1 − yi )
i
est uniforme par rapport aux xi (c’est un raisonnement classique pour les intégrales de Riemann :
si la convergence est uniforme, on peut passer la limite sous le signe somme).
On peut vérifier simplement que si la fonction f est uniformément continue, les limites en
question sont en effet uniformes. Dans notre cas, f est continue et le domaine D est fermé et
borné, donc compact : le Théorème de Heine vu en première année (une fonction continue sur un
compact y est uniformément continue) est encore vérifié pour une fonction de plusieurs variables
donc on est dans la situation favorable d’interversion des limites.
Remarques :
– Le Théorème de Fubini dit que, pour calculer une intégrale double, on peut procéder dans l’ordre
que l’on veut : ceci peut s’avérer très utile en pratique, cf. par exemple l’exercice 2.1 “Importance
de l’ordre d’intégration”.
– Le calcul de l’intégrale double se ramène ainsi à celui de deux intégrales simples, or on sait que
le calcul d’une intégrale simple ne change pas si on change la valeur de la fonction en un nombre
fini de points. En particulier, on voit que le fait de prendre en compte ou non la frontière Γ du
domaine D n’a pas d’importance.
– On peut généraliser simplement les domaines sur lesquels on s’autorise à intégrer en supposant
l’intégration additive, c’est-à-dire que si D1 et D2 sont des bons domaines d’intégration disjoints,
on définit l’intégrale sur D1 ∪D2 comme la somme des intégrales sur chaque domaine (voir Figure
2.4) : ZZ ZZ ZZ
f dxdy = f dxdy + f dxdy.
D1 ∪D2 D1 D2
D2
D1
On retrouve alors pour les intégrales doubles les propriétés classiques vues pour les intégrales
simples : elles en découlent directement via le Théorème de Fubini.
Propriétés 1
Soit f1 et f2 continues, D un bon domaine d’intégration, λ et µ des réels :
– Linéarité : l’intégration est une application linéaire :
ZZ ZZ ZZ
(λf1 + µf2 )dxdy = λ f1 dxdy + µ f2 dxdy.
D D D
– Positivité (ter) :
ZZ ZZ
f dxdy ≤ |f |dxdy.
D D
On peut résumer d’une phrase ces propriétés : l’intégration est une forme linéaire positive. Pour
ce qui est de la propriété de positivité, puisqu’on a supposé f continue, on peut même préciser la
chose. En effet, soit f ≥ 0, alors :
ZZ
f dxdy = 0 ⇐⇒ f = 0 sur D.
D
E
x
−a a
−b
n o
x2 y2
Figure 2.5 – Domaine E = (x, y), a2
+ b2
≤1 .
x2 y 2
E = (x, y), 2 + 2 ≤ 1
a b
est clairement un bon domaine d’intégration (Figure 2.5), que l’on peut décrire par :
( r r )
x2 x2
E= (x, y), −a ≤ x ≤ a, −b 1− 2 ≤y ≤b 1− 2 ,
a a
ou encore par :
( r r )
y2 y2
E= (x, y), −b ≤ y ≤ b, −a 1− 2 ≤x≤a 1− 2 .
b b
Quel que soit l’ordre d’intégration (Théorème de Fubini) et en utilisant par exemple un changement
de variable (soit x = a cos t, soit y = b sin t), on montre ainsi que l’ellipse a pour aire : A(E) = π ab .
y = f (x)
x
a b
Rappel. Soit f : [a, b] → R continue, alors f est bornée et atteint ses bornes m et M . f est de
plus intégrable et la positivité de l’intégration entraîne :
b
1
Z
m≤ f (x)dx ≤ M.
b−a a
Par le Théorème des Valeurs Intermédiaires, on en déduit qu’il existe c ∈ [a, b] tel que :
b
1
Z
f (c) = f (x)dx,
b−a a
c’est-à-dire que f (c) est égal à la valeur moyenne de f sur le segment [a, b] : c’est le Théorème de
la Moyenne (dans sa version la plus simple) et il se généralise aux intégrales multiples, pour peu
qu’on suppose le domaine D convexe.
Preuve. f est continue sur D compact, donc f y est bornée et atteint ses bornes m et M : il existe
(xm , ym ) et (xM , yM ) tels que :
f (xm , ym ) = m
f (xM , yM ) = M
La fonction f est continue sur le segment [(xm , ym ), (xM , yM )]. Ce segment est contenu dans D
puisque D est convexe. Donc, par le Théorème des Valeurs Intermédiaires, elle prend toutes les
valeurs entre m et M . Or
1
ZZ
∀(x, y) ∈ D, m ≤ f (x, y) ≤ M ⇒ m ≤ f (x, y)dxdy ≤ M,
A(D)
D
par positivité de l’intégration. On en déduit qu’il existe (x0 , y0 ) ∈ [(xm , ym ), (xM , yM )] ⊆ D tel
que
1
ZZ
f (x0 , y0 ) = f (x, y)dxdy.
A(D)
D
On a le même type de résultat (que l’on admettra) pour les intégrales doubles. Il faut cependant
commencer par préciser les hypothèses sur le changement de variables.
Définition 23 (C 1 -difféomorphisme)
Soit
U →V
ϕ:
(u, v) 7→ (x, y)
avec U et V ouverts de R2 . On dit que ϕ est un C 1 -difféomorphisme de U sur V si :
(i) ϕ est une bijection de U sur V ;
(ii) ϕ est de classe C 1 ;
(iii) sa réciproque ϕ−1 est de classe C 1 .
Remarques :
– Le point (iii) ne découle pas des deux premiers : penser, en dimension 1, à ϕ : x 7→ x3 . C’est
clairement une bijection de classe C 1 de R sur R, mais son application réciproque n’est pas
dérivable en 0.
ce qui prouve que Jϕ (u, v) est inversible, d’inverse Jϕ−1 (ϕ(u, v)).
Une première étape consiste en la réécriture du domaine d’intégration D pour les couples (x, y)
en un domaine ∆ pour les couples (ρ, θ). Puisqu’on sait que le jacobien de ϕ au point (ρ, θ) vaut
ρ ≥ 0 (voir Chapitre 1, Section 1.4), on a donc :
ZZ ZZ
f (x, y)dxdy = f (ρ cos θ, ρ sin θ)ρdρdθ.
D ∆
1
ZZ
Exemple. Soit à calculer I = dxdy où D = {(x, y), x > 0, y > 0, x2 + y 2 < 1}.
1 + x2 + y 2
D
On a n πo
∆ = (ρ, θ), 0 < ρ < 1, 0 < θ < ,
2
et par suite :
π
! 1
1 1
ρ ρ π ρ π 1 π
ZZ Z Z Z
2
2
I= dρdθ = dθ dρ = dρ = ln(1 + ρ ) = ln 2.
1 + ρ2 0 1 + ρ2 0 2 0 1+ρ 2 2 2 0 4
∆
y + dy dS = dx × dy dρ dS ≈ ρdρdθ
y
ρ dθ
θ
x x + dx
Interprétation géométrique
En coordonnées cartésiennes, un élément de surface élémentaire dû aux variations x x + dx et
d’où finalement la somme des f (x, y)dxdy. En coordonnées polaires, un élément de surface élémen-
taire dû aux variations ρ ρ + dρ et θ θ + dθ est une portion de couronne d’aire 2 (voir Figure
2.7 à droite) :
1 1 1
dS = (ρ + dρ)2 dθ − ρ2 dθ = ρdρdθ + (dρ)2 dθ ≈ ρdρdθ,
2 2 2
le terme 12 (dρ)2 dθ étant négligeable par rapport à ρdρdθ. D’où, pour l’intégrale, la somme des
f (ρ cos θ, ρ sin θ)ρdρdθ.
y y
D 1
f (x, y) = x2 +y 2
D
x x
1 1
On retrouve pour les intégrales doubles généralisées les deux types de situation : domaine d’in-
tégration non borné ou domaine borné avec f non définie en un point du bord du domaine. Par
exemple (Figure 2.8) :
– premier cas :
1
ZZ
dxdy,
x + y2
2
D
2. on rappelle qu’un secteur angulaire de rayon ρ et d’angle θ (en radians) a pour surface S = 21 ρ2 θ.
L’étude étant la même pour les deux types de généralisation, et par ailleurs comparable à celle
faite pour les intégrales simples, on appelle simplement domaine généralisé 3 ce type de domaine
et intégrale généralisée l’intégrale d’une fonction sur ce domaine.
D Dn D2 D1
La notion de suite croissante de domaines est illustrée Figure 2.9. On peut maintenant préciser ce
qu’on entend par intégrale généralisée convergente.
est une intégrale généralisée convergente, égale à I, si pour toute suite Dn ↑ D de bons domaines
d’intégration, on a : ZZ
lim f (x, y)dxdy = I.
n→∞
Dn
Sous cette forme, il est difficile de vérifier si une intégrale généralisée est convergente puisqu’on
peut tendre vers le domaine D d’une infinité de façons. La situation se simplifie néanmoins lorsque
la fonction f est positive : l’étude de la limite des intégrales pour une seule suite de domaines suffit
alors à conclure.
– ou bien ZZ
f (x, y)dxdy −−−→ +∞,
n→∞
Dn
Preuve. Soit (Dn′ ) une autre suite de bons domaines d’intégration, avec Dn′ ↑ D. La suite de réels
ZZ
′
In = f (x, y)dxdy
Dn
′
est croissante donc sa limite correspond à celle de toute sous-suite. Or, puisque Dn′ ↑ D, il existe
′
une sous-suite (Dϕ(n) ′
) telle que, pour tout n, on ait Dn ⊆ Dϕ(n) . Réciproquement, il existe une
sous-suite (Dψ(n) ) telle que, pour tout n, on ait Dn′ ⊆ Dψ(n) . Finalement, la sous-suite (Dϕ(n)
′ )
vérifie :
∀n ∈ N ′
Dn ⊆ Dϕ(n) ⊆ Dψ◦ϕ(n)
ce qui se traduit en terme d’intégrales par :
∀n ∈ N ′
In ≤ Iϕ(n) ≤ Iψ◦ϕ(n)
′
or lim In = lim Iψ◦ϕ(n) qui vaut I ou +∞, et il en est de même pour lim Iϕ(n) , donc pour lim In′ .
Dans le cas où f n’est pas de signe constant, on ne peut donner qu’une condition suffisante, déjà
connue pour les intégrales simples.
Il est bien sûr plus simple de vérifier l’absolue convergence puisqu’il suffit de vérifier pour une seule
suite de domaines Dn ↑ D. On retrouve alors le résultat vu en première année pour les intégrales
simples généralisées.
ZZ ZZ ZZ
|In+p − In | = f (x, y)dxdy − f (x, y)dxdy = f (x, y)dxdy .
Dn+p Dn Dn+p −Dn
La majoration précédente montre que (In ) est de Cauchy elle aussi, donc convergente.
Remarque. Cette propriété, (absolue convergence ⇒ convergence), est très classique : on la re-
trouve par exemple dans l’étude des séries numériques. Elle est vérifiée dès lors que l’on travaille
dans un espace complet (encore appelé espace de Banach), c’est-à-dire un espace vectoriel normé
où toute suite de Cauchy est convergente dans l’espace. Par ailleurs, l’intervention des suites de
Cauchy dans ce contexte n’a rien d’étonnant puisqu’on doit prouver la convergence d’une suite
sans en connaître la limite (penser de même à la démonstration du Théorème du Point Fixe pour
une fonction contractante).
où D est le disque ouvert unité moins le centre O. La fonction étant positive sur D, il suffit d’étudier
la limite pour une seule suite de domaines, par exemple la suite de couronnes 4 (voir Figure 2.10) :
1 p 2 2
Cn = (x, y), ≤ x +y <1 .
n
On a bien Cn ↑ D et le calcul sur Cn se fait sans problème via un passage en polaires :
Z 1 Z 2π
1 1
ZZ
In = 2 2
dxdy = dθdρ = 2π [ln ρ]11 = 2π ln n −−−→ +∞.
x +y 1
0 ρ n n→∞
n
Cn
1
ZZ
Par suite dxdy est divergente, égale à +∞.
x2 + y2
D
Soit la fonction
R3 → R
f:
(x, y, z) 7→ xyz
On veut calculer l’intégrale triple :
ZZZ
I= f (x, y, z)dxdydz.
D
A nouveau, on a plusieurs façons de procéder suivant l’ordre des variables, toutes donnant le même
résultat. On décide par exemple d’intégrer d’abord par rapport à x, puis par rapport à y et enfin
par rapport à z.
Il faut commencer par définir pour toute hauteur z entre 0 et 1 la section de niveau z, notée Dz ,
du plan d’équation Z = z et du domaine D (Figure 2.11). On obtient :
Ceci donne
Z 1 ZZ Z 1
I= f (x, y, z)dxdy dz =
I(z)dz.
0 0
Dz
Or I(z) est une intégrale double sur un bon domaine d’intégration, donc du type vu précédemment :
Z 1−z Z 1−z−y Z 1−z
(1 − z − y)2
z
I(z) = z y xdx dy = z y dy = (1 − z)4 .
0 0 0 2 24
4. une couronne n’est pas un bon domaine d’intégration au sens donné en début de chapitre : c’est cependant
l’union disjointe de quatre bons domaines d’intégration, et tout se passe bien grâce à l’additivité de l’intégration.
z y
1−z
K
Dz Dz
z x
1−z
D J y
x I
1
Il reste à intégrer ce polynôme de degré 5 entre 0 et 1, ce qui donne I = 6! .
N.B. Plus encore que pour l’intégrale double, cet exemple montre qu’une étape essentielle du
calcul d’intégrale multiple est le découpage du domaine d’intégration, c’est pourquoi il ne faut pas
hésiter à faire des dessins.
2.2.2 Propriétés
La notion de bon domaine d’intégration étant supposée définie, on retrouve le Théorème de Fubini,
qui permet de ramener un calcul d’intégrale triple au calcul itéré de trois intégrales simples, et ce
dans un ordre loisible. Les propriétés de linéarité et de positivité sont bien sûr conservées.
Ceci permet en particulier de revenir à l’interprétation de l’intégrale double : soit f une fonction
de deux variables continue, positive, définie sur un bon domaine d’intégration Df . Le domaine :
est alors la portion de cylindre vertical de directrice Df comprise entre le plan (Oxy) et la surface
(Σ) définie par f . Son volume est :
ZZZ Z Z Z f (x,y) ! ZZ
V(D) = dxdydz = dz dxdy = f (x, y)dxdy,
0
D Df Df
Ce volume intervient également dans le Théorème de la Moyenne pour les intégrales triples, qui
s’écrit cette fois (en supposant D convexe) :
1
ZZZ
∃(x0 , y0 , z0 ) ∈ D, f (x0 , y0 , z0 ) = f (x, y, z)dxdydz.
V(D)
D
1.5
0.5
0
2
1 2
1
0
0
−1
−1
−2 −2
Règle de Sarrus. Elle permet de calculer le déterminant d’une matrice (3, 3). On a en effet
a1 a2 a3
det M = b1 b2 b3 = a1 b2 c3 + b1 c2 a3 + c1 a2 b3 − (a3 b2 c1 + b3 c2 a1 + c3 a2 b1 ).
c1 c2 c3
0.5
−0.5
−1
1
0.5 1
0.5
0
0
−0.5
−0.5
−1 −1
2.0
1.8
1.6
1.4
1.2
1.0
0.8
0.6
0.4
0.2
0
y
0
1
x 2
0 3
1
2 4
3
4
5
On vérifie que ceci définit bien une densité de probabilité sur R2 . En effet, f est positive et le
calcul de l’intégrale double s’écrit :
ZZ Z +∞ Z y Z +∞ Z +∞
−(x+y) −(x+y)
f (x, y) dx dy = 2e dx dy = 2e dy dx.
R2
0 0 0 x
2.0 0.5
1.8
1.6 0.4
1.4
1.2 0.3
1.0
0.8 0.2
fX (x) fY (y)
0.6
0.4 0.1
0.2
0.0 0.0
0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0 x 0 1 2 3 4 5 6 y
Exemple. Pour l’exemple précédent, on obtient après calculs (voir Figure 2.15) :
Une fois connues les lois marginales, on peut effectuer les calculs usuels sur les variables aléatoires
absolument continues. Par exemple, sous réserve d’intégrabilité, les espérances de X et Y sont
alors simplement :
Z Z
E[X] = xfX (x)dx & E[Y ] = yfY (y)dy.
R R
Rappel. On dit que T suit une loi exponentielle de paramètre λ > 0, noté T ∼ E(λ), si T admet
pour densité
fT (t) = λe−λt 1[0,+∞[ (t).
Les moments d’une loi exponentielle se calculent sans problème par des intégrations par parties
(exercice), ce qui donne pour tout entier naturel n
Z +∞
n!
Z
n n
E[T ] = t f (t)dt = tn × λe−λt dt = n .
R 0 λ
Exemple. Pour l’exemple ci-dessus, on voit que X ∼ E(2), d’où son espérance E[X] = 1/2.
Le calcul de la moyenne de Y utilise lui aussi le rappel précédent puisqu’on reconnaît des lois
exponentielles de paramètres 1 et 2 :
+∞ +∞
1 3
Z Z
−y
E[Y ] = 2 ye dy − y × 2e−2y dy = 2 − = .
0 0 2 2
On constate au passage que E[Y ] > E[X], ce qui n’a rien d’étonnant puisque la densité jointe
f (x, y) = 2e−(x+y) 1{0≤x≤y} montre que pour toute réalisation (x, y) du couple (X, Y ), on doit
avoir x ≤ y.
Dans le cas général, par définition, les variables aléatoires X et Y sont indépendantes si pour tout
couple de sous-ensembles A1 et A2 de R, on a :
Définition 28 (Indépendance)
Avec les notations précédentes, les variables aléatoires X et Y sont indépendantes si pour tout
couple (x, y) ∈ R2 :
f (x, y) = fX (x)fY (y).
Remarque. Le raisonnement sur les supports permet parfois de conclure rapidement à la non-
indépendance. Le support de la loi de X est l’adhérence de l’endroit où X a des chances de tomber :
Supp(X, Y ) = {(x, y) ∈ R2 : 0 ≤ x ≤ y} =
6 R+ × R+ ,
y y
Supp(X, Y )
Supp(X)×Supp(Y )
x x
Figure 2.16 – Support du couple (X, Y ) (à gauche) et produit cartésien des supports de X et de
Y (à droite).
Plus précisément, il existe alors une constante c telle que fX (x) = cg(x) et fY (y) = h(y)/c, de
sorte qu’on a bien f (x, y) = fX (x)fY (y).
deviennent fX (x) = cg(x) et fY (y) = h(y)/c. Au total, on a donc f (x, y) = fX (x)fY (y), ce qui
montre bien l’indépendance de X et Y .
Remarque. L’intérêt de ce résultat est de permettre de calculer la moyenne de Z sans pour autant
avoir à déterminer sa loi.
que l’on décompose de façon à faire apparaître des moments de variables exponentielles :
Z +∞ Z +∞ Z +∞
−y −2y 1 2!
E[XY ] = 2 ye dy − y × 2e dy − y 2 × 2e−2y dy = 2 − − 2 = 1.
0 0 0 2 2
On dit que les variables X et Y sont décorrélées si leur covariance est nulle, ce qui revient à dire
que E[XY ] = E[X]E[Y ].
Exemple. Soit X qui suit une loi uniforme sur [−1, +1] et Y définie par Y = X 2 . Alors par le
théorème de transfert, Z 1
3 dx
E[XY ] = E[X ] = x3 × = 0.
−1 2
De même E[X] = 0, donc sans même calculer E[Y ], on a aussi E[X]E[Y ] = 0. Il s’ensuit que :
Preuve. Les deux premiers points sont évidents. Le troisième s’obtient en appliquant la définition
de la covariance et en utilisant la linéarité de l’espérance. Détaillons uniquement le dernier :
Var(X +Y ) = E[(X +Y )2 ]−(E[X +Y ])2 = E[X 2 ]+2E[XY ]+E[Y 2 ]−(E[X]2 +2E[X]E[Y ]+E[Y ]2 ),
Cette démonstration montre que la dernière formule est bien sûr liée à l’identité remarquable vue
dans les petites classes : (x + y)2 = x2 + 2xy + y 2 . Elle souligne en particulier que, dans le cas gé-
néral, la variance n’est pas linéaire puisqu’on n’a pas Var(X + Y ) = Var(X) + Var(Y ). Nous allons
maintenant préciser ce point. On note σ(X) et σ(Y ) les écarts-types respectifs des variables X et Y .
Le coefficient de corrélation est aussi appelé coefficient de corrélation linéaire, car il mesure en
fait la linéarité entre les deux variables X et Y . C’est ce qu’explique le résultat suivant.
−1 ≤ ρ(X, Y ) ≤ +1,
Preuve. La démonstration la plus expéditive de ce résultat est basée sur une ruse de sioux. Comme
toute variable aléatoire, la variable (tX + Y ) est de variance positive, et ce quel que soit le réel t,
ce qui s’écrit encore :
que l’on peut voir comme un trinôme en t. Or un trinôme n’est de signe constant que si son
discriminant est inférieur ou égal à 0, c’est-à-dire :
Supposons ρ(X, Y ) = +1, alors en remontant les équations ceci implique qu’il existe un réel t0 tel
que Var(t0 X + Y ) = 0, donc il existe un réel b tel que t0 X + Y = b, c’est-à-dire Y = −t0 X + b.
Dans ce cas
Cov(X, −t0 X + b) −t0
ρ(X, Y ) = = ,
σ(X)σ(−t0 X + b) |t0 |
qui vaut 1 si et seulement si t0 est négatif. Le même raisonnement permet de conclure lorsque
ρ(X, Y ) = −1.
Remarque. L’inégalité |Cov(X, Y )| ≤ σ(X)σ(Y ) n’est rien de plus que l’inégalité de Cauchy-
Schwarz adaptée au cadre des variables aléatoires. Le coefficient de corrélation de deux variables
aléatoires est donc équivalent au cosinus de l’angle entre deux vecteurs.
Face à ce constat, on aimerait définir le fait qu’il n’existe aucune sorte de relation entre X et Y :
c’est précisément la notion d’indépendance, laquelle implique donc la décorrélation.
Remarques :
1. La réciproque est fausse en général. Pour s’en assurer il suffit de reprendre l’exemple où X
est uniforme sur [−1, +1] et Y = X 2 . On a vu que Cov(X, Y ) = 0, c’est-à-dire que X et Y
sont décorrélées. Mais elles ne sont clairement pas indépendantes : le support est le morceau
de la parabole y = x2 pour −1 ≤ x ≤ 1, et non un produit d’intervalles. Ou encore :
1 1
fX,Y (0, 0) = fX (0) = 6= = fX (0)2 = fX (0)fY (0).
2 4
2. La preuve précédente montre que de façon générale, si X et Y sont indépendantes, la relation
suivante est vérifiée pour toutes “bonnes” fonctions ϕ et ψ :
On rencontre souvent ce résultat sous la forme équivalente suivante : si (U, V ) = ψ(X, Y ), alors le
couple (U, V ) admet pour densité
Achtung ! Beaucoup de densités font intervenir des fonctions indicatrices. Celles-ci jouent un rôle
crucial lors du calcul de la densité d’une somme. La vigilance est donc de mise...
Exemple. Une simple loi uniforme permet d’illustrer ce qui vient d’être dit. Soit donc X et Y
deux variables indépendantes et uniformes sur [0, 1]. Montrer que leur somme S a pour densité
fS (s) = s1[0,1] (s) + (2 − s)1[1,2] (s).
Le résultat suivant assure que les lois gaussiennes sont stables par convolution. La preuve est dé-
taillée en exercice 2.39.
2.4 Exercices
Exercice 2.1 (Importance de l’ordre d’intégration)
Soit le domaine
T = {(x, y) ∈ R2 , 0 ≤ y ≤ x ≤ 1}
2
et la fonction f définie par f (x, y) = ex .
1. Calculer l’intégrale de f sur T comme suit :
ZZ Z 1 Z x
f (x, y)dxdy = f (x, y)dy dx.
0 0
T
Corrigé
1. Dans ce sens tout se passe paisiblement puisque
1 Z x 1 Z x 1h 1 1
1 x2
Z Z Z ix Z
x2 x2 x2
f (x, y)dy dx = e dy dx = e y dx = xe dx = e ,
0 0 0 0 0 0 0 2 0
d’où
e−1
ZZ
f (x, y)dxdy = .
2
T
1. Calculer Z 1 Z 1 Z 1 Z 1
f (x, y)dx dy & f (x, y)dy dx.
0 0 0 0
2. Conclusion ?
Corrigé
1. On a d’une part
1 Z 1 1 Z y 1 Z 1 y 1 !
1 1 x 1
Z Z Z
f (x, y)dx dy = dx − dx dy = + dy,
0 0 0 0 y2 y x2 0 y2 0 x y
2. Ainsi les deux ordres d’intégration possibles donnent deux résultats différents. Le problème
vient de ce que la fonction f n’est pas continue sur le domaine C puisqu’elle explose en l’ori-
gine. On a ici affaire à une intégrale généralisée divergente.
(x + y)2
ZZ
I= p dxdy.
1 + x2 + y 2
D
Corrigé
1. D est le demi-disque fermé unité situé au-dessus de l’axe des abscisses.
2. En coordonnées polaires : ∆ = {(ρ, θ), 0 ≤ ρ ≤ 1, 0 ≤ θ ≤ π}.
√
2− 2
3. Via le changement de variable, on obtient sans problème J = 3 .
4. Un changement en polaires donne alors (via la relation sin 2θ = 2 cos θ sin θ) :
ZZ 2 Z π √
ρ (1 + sin 2θ) 2− 2
I= p ρdρdθ = J (1 + sin 2θ)dθ = π.
1 + ρ2 0 3
∆
2. On considère le C 1 -difféomorphisme
R2 → R2
ϕ:
(u, v) 7→ (x, y) = ( 12 (u + v), 12 (u − v))
Corrigé
1. Le domaine D est représenté Figure 2.17.
1
D
1
2
1
2
1
2. Les conditions (x > 0) et (y > 0) se traduisent respectivement par (−u < v) et (v < u). La
condition (1/2 < x + y < 1), se traduit, elle, par (1/2 < u < 1). Au total, on a bien :
1
ϕ−1 (D) = ∆ = {(u, v) ∈ R2 , < u < 1, −u < v < u}.
2
Soit encore 2 1
Z 1
1 1 1 1 u 3 1
I= e− udu = e− = e− .
2 e 1 2 e 2 1 16 e
2 2
x
ZZ
J= dxdy.
x+y
R
π
2
A
π
2
− π2
B
Corrigé
Le premier terme ne pose pas problème, le second se calcule via une intégration par parties :
2 π2 π Z π
x 1 2 1 2 π2 1 π
I= − x sin 2x + sin 2xdx = − [cos 2x]02
2 0 2 0 2 0 8 4
π2
D’où finalement : I = 8 + 21 .
2. On obtient :
Z 2 Z 1 Z 2 Z 2
x 1
I= dy dx = [x ln(x + y)]0 dx = (x ln(1 + x) − x ln x)dx,
1 0 x+y 1 1
calcul d’intégrale simple qu’on peut traiter grâce à une intégration par parties (histoire de
se débarrasser des logarithmes) :
2
1 2 1 2
2
x2
Z 2 Z
x x 5 1
I= ln(1 + x) − ln x − − x dx = 2 ln 3− ln 2+ 1− dx
2 2 1 2 1 1+x 2 2 1 1+x
ce qui donne
5 1 1 3
I = 2 ln 3 − ln 2 + [x − ln(1 + x)]21 = + ln 3 − 2 ln 2.
2 2 2 2
Corrigé
√
1. On peut encore écrire D1 = {(x, y), 0 ≤ x ≤ 4, 0 ≤ y ≤ x}, c’est-à-dire que D1 correspond
√
au domaine délimité par l’axe x = 0, l’axe x = 4, l’axe y = 0 et la courbe y = x (Figure
2.19 à gauche). La fonction f est continue sur le domaine D1 , donc il n’y a pas de problème
de définition de l’intégrale. Le calcul donne :
Z 4 Z √x ! Z 4 3
√x Z 4 !
2 2 2 y 5/2 x3/2
I1 = (x + y )dy dx = x y+ dx = x + dx,
0 0 0 3 0 0 3
d’où finalement : 4
2 7/2 2 4288
I1 = x + x5/2 = .
7 15 0 105
2 1 1
1 0.5 0
0 0 −1
0 0.5 1 1.5 2 2.5 3 3.5 4 0 0.2 0.4 0.6 0.8 1 0 0.5 1 1.5 2 2.5 3 3.5
D2 = {(x, y) ∈ R2 , 0 ≤ x ≤ 1, x2 ≤ y ≤ x},
d’où :
1 Z x 1 2 x 1
x2 x4
y
Z Z Z
3
I2 = (y − x)dy dx = − xy dx = − − + x dx,
0 x2 0 2 x2 0 2 2
ce qui aboutit à :
1
x3 x5 x4
1
I2 = − − + =− .
6 10 4 0 60
3. On a cette fois le domaine représenté Figure 2.19 à droite et le calcul est élémentaire :
Z π Z sin x
2 π 3
1 4 π
Z
I3 = cos x y 2 dy dx = sin x cos xdx = sin x 0 = 0.
0 − sin x 3 0 6
Remarque : on peut voir le résultat directement en notant que le domaine d’intégration est
symétrique par rapport à x = π2 et que y 2 cos(π − x) = −y 2 cos x.
x2 y2
D = (x, y), 1 ≤ ≤ 4, 1 ≤ ≤2 .
y x
(a) Représenter D.
x2 y2
(b) Montrer que l’aire de D vaut 1 grâce au changement de variable u = y et v = x.
2. Si D est un domaine du plan d’aire A > 0, on appelle centre de gravité de D le point G de
coordonnées :
1 1
ZZ ZZ
xG = xdxdy et yG = ydxdy.
A A
D D
12
10
D
4
n o
x2 y2
Figure 2.20 – Domaine D = (x, y) : 1 ≤ y ≤ 4, 1 ≤ x ≤2 .
Corrigé
1. (a) Le domaine D est représenté Figure 2.20.
x2 y2
(b) Le changement de variable u = y et v = x correspond au C 1 -difféomorphisme
∆ →D
ϕ:
(u, v) 7→ (x = u2/3 v 1/3 , y = u1/3 v 2/3 )
1 2(v/u)1/3 (u/v)2/3
Jϕ (u, v) = ,
3 (v/u)2/3 2(u/v)1/3
dont le déterminant vaut : det Jϕ (u, v) = 1/3. L’aire du domaine D est donc :
1
ZZ ZZ
A(D) = dxdy = dudv,
3
D ∆
d’où :
4 Z 2
1
Z
A(D) = dv du = 1.
3 1 1
2. (a) Le domaine D est un quart de disque unité, il a donc pour surface π/4. Le changement
en polaires donne alors :
Z π ! 1
4 1 4 r3 4
Z π
2
2
xG = r cos θ dr = [sin θ]02 = .
π 0 0 π 3 0 3π
4
Par symétrie des rôles joués par x et y, on trouve aussi yG = 3π .
(b) Le domaine D est √ la moitié de couronne comprise entre deux moitiés de disques de
rayons respectifs 1/ 2 et 1, donc de surface A = π/4. On a donc :
Z π !
4 1
8 1
Z
2
2
xG = r cos θdθ dr = 1− √ .
π √1 −π 3π 2 2
2 2
√
On montre aussi que yG = 0. En prenant les estimations grossières π ≈ 3 et 2 ≈ 1.5,
on voit que xG ≈ 16 √1
27 ≤ 2 , c’est-à-dire que G n’est pas dans le domaine D.
Corrigé
1. T est l’intérieur du triangle de sommets O(0, 0), A(1, 1) et B(1, −1).
2. On veut calculer : ZZ y
I= exp dxdy.
x
T
Cette intégrale double est généralisée car la fonction à intégrer n’est pas définie au point
O(0, 0).
3. Pour n > 1, soit :
1
Tn = {(x, y) ∈ R2 , ≤ x ≤ 1, −x ≤ y ≤ x}.
n
Tn est un trapèze ne contenant pas O : il a pour sommets An (1/n, 1/n), A(1, 1), B(1, −1) et
Bn (1/n, −1/n). On peut donc calculer sans problème :
ZZ y
In = exp dxdy
x
Tn
par le théorème de Fubini : on commence par intégrer par rapport à y, puis par rapport à x.
On obtient :
1 1 1
In = e− 1− 2 .
2 e n
4. On intègre une fonction positive et la suite de domaines (Tn ) tend vers le domaine T . Puisque
la suite d’intégrales (In ) est convergente, I est elle-même convergente de valeur :
1 1
I = lim In = e− .
n→∞ 2 e
D
1 1 Dn
1
n
1
1 n
1
Corrigé
1. Le domaine D est représenté Figure 2.21 à gauche.
2. L’intégrale est généralisée car la fonction n’est définie ni sur l’axe des abscisses ni sur l’axe
des ordonnées. De plus, le domaine d’intégration est infini.
3. Le domaine Dn est représenté Figure 2.21 à droite.
4. Le calcul est ne pose pas problème :
Z 1 Z 1 !
−1/4
x
−1/2 − 14 1 −1 1 −5
In = x y dy dx = · · · = 8 1 − n − n 2 + n 4 .
1 1 3 3
n n
La fonction intégrée étant positive et la suite de domaines (Dn ) tendant vers D, on a donc
I = limn→∞ In = 8, intégrale convergente.
5
ZZ
J= dxdy où B = {(x, y), x2 + y 2 ≤ 9}.
(x2 + y 2 )2/3
B
3
1 T
Corrigé
Pour la première intégrale, la fonction (x, y) 7→ e−x est continue et positive sur le domaine infini T
(représenté Figure 2.22 à gauche), donc pour montrer qu’elle est convergente, il suffit de le vérifier
pour une suite croissante de domaines de limite T , par exemple la suite de trapèzes rectangles :
Tn = {(x, y), 1 ≤ x ≤ n, 0 ≤ y ≤ x}.
On a alors : ZZ Z n Z x Z n
−x −x
In = e dxdy = e dy dx = xe−x dx,
1 0 1
Tn
Corrigé
1. La fonction f n’est pas définie au point (0, 0) de C.
2. Cn est le carré de sommets A(1/n, 1/n), B(1/n, 1), C(1, 1) et D(1, 1/n). Le point (0, 0) n’est
pas dans le carré Cn donc on est ramené à un calcul d’intégrale classique :
Z 1 Z 1 ! Z 1 1 Z 1 !
1 1 1 1
In = dy dx = − dx = − dx,
n
1 1 (x + y)2
n
1 x+y 1
n
1 x + n1 x+1
n
n
d’où finalement 1
(n + 1)2
1
In = ln x + − ln(x + 1) = ln .
n 1 4n
n
(n + 1)2
lim = +∞,
n→∞ 4n
donc limn→∞ In = +∞ et I est divergente, de valeur +∞.
y
1
x
1 2 3
4. Le domaine T est donné Figure 2.23. L’intégrale I est généralisée puisque le domaine T est
non borné. En posant
Tn = {(x, y), 1 ≤ x ≤ n, 0 ≤ y ≤ x2 },
on obtient
n x2
! Z n x 2
1 1 1
ZZ Z Z
In = dxdy = dy dx = − dx,
(x + y)2 1 0 (x + y)2 1 x+y 0
Tn
ce qui donne :
n
1
Z
In = dx = [ln(x + 1)]n1 = ln(n + 1) − ln 2,
1 x+1
donc limn→+∞ In = +∞. La fonction intégrée est positive sur le domaine T et (Tn ) est une
suite croissante de domaines de limite T . On en déduit que I = +∞, l’intégrale est divergente.
Corrigé
√
1. Soit (Dn ) la suite croissante de disques centrés en l’origine et de rayons ( 2nπ), alors un
changement en polaires donne
√2nπ
1
ZZ ZZ
2 2 2 2
In = sin(x + y )dxdy = sin(ρ )ρdρdθ = 2π − cos(ρ ) = 0.
2 0
Dn ∆n
On voit donc que pour deux suites croissantes de domaines de limite R2 , les limites des
intégrales ne sont pas les mêmes : c’est exactement dire que l’intégrale généralisée n’est pas
convergente.
(c) Calculer :
x
ZZ
In = √ dxdy.
y
An
1
ZZ
K= dxdy.
(x2 + y 2 )α
C
1
ZZ
Kn = dxdy.
(x + y 2 )α
2
Cn
Corrigé
1. (a) Notons qu’on peut écrire A = {(x, y) ∈ R2 : 0 ≤ x ≤ 1, 0 ≤ y ≤ x} qui est
l’intérieur du triangle de sommets O(0, 0), A(1, 0) et B(1, 1). De même, pour n > 1,
An = {(x, y) ∈ R2 : n1 ≤ x ≤ 1, n1 ≤ y ≤ x} qui est l’intérieur du triangle de sommets
On ( n1 , n1 ), An (1, n1 ) et B(1, 1).
(b) Cette intégrale double est généralisée car f (x, y) = √xy n’est pas définie sur l’axe des
abscisses, plus précisément sur le segment [OA] où y = 0.
(c) La suite de domaines (An )n est croissante et tend vers le domaine A. Les points (x, 0),
x ∈ [0, 1], n’appartiennent pas à An donc on est ramené à un calcul d’intégrale classique.
Par le théorème de Fubini, on obtient :
1 Z x 1 √ x 1
1 4 1 1
Z Z Z
3 1
In = x √ dy dx = x 2 y 1 dx = 2 (x 2 −n− 2 x) = − √ + 2√
1 1 y 1 n 1 5 n 5n n
n n n n
4
(d) L’intégrale I est convergente car In → 5 quand n → +∞ et on intègre une fonction
positive, donc I = 45 .
2. (a) On peut réécrire B = {(x, y) ∈ R2 : y ≥ 0, 0 ≤ x ≤ 2y}, B correspond aux points situés
dans le demi-plan x ≥ 0 au-dessus de la droite y = x2 .
(b) Cette intégrale double est généralisée car le domaine B est non borné.
d’où
n n
1 1 1 −5y2 1 −5n2 1 −n2 1
Z
−y 2 −5y 2 −y 2
Jn = ( ye − ye )dy = e −e = e − e + .
2 0 4 5 0 20 4 5
(d) Pour les mêmes raisons que ci-dessus, J est convergente, avec J = limn→+∞ Jn = 15 .
3. Soit C = {(x, y) ∈ R2 , x2 + y 2 ≥ 1}.
(a) C est égal à R2 privé du disque fermé unité.
(b) L’intégrale K est généralisée puisque le domaine C est non borné.
(c) Pour n > 1, soit Cn = {(x, y) ∈ R2 , 1 ≤ x2 + y 2 ≤ n2 }. Cn est la couronne intérieure
au disque de centre 0 et de rayon n et extérieure au disque unité. La suite de domaines
(Cn ) est donc croissante et tend vers le domaine C .
(d) Par passage en coordonnées polaires, on obtient :
Z n
1
Kn = 2π 2α−1
dρ,
1 ρ
(e) On en déduit que l’intégrale K est convergente ssi 2 − 2α < 0 c’est-à-dire ssi α > 1.
π
Dans ce cas, K = α−1 .
Z +∞ Z +∞ x2
3. Déterminer alors J = exp(−x2 )dx à l’aide de I. En déduire √1
2π
e− 2 dx.
−∞ −∞
Corrigé
√
1. Dn est le disque fermé de centre O et de rayon n. Pour calculer In , on passe en polaires,
ce qui donne
Z √n Z 2π Z √n h i√ n
−r 2 −r 2 −r 2
= π 1 − e−n .
In = dθ re dr = 2π re dr = π −e
0 0 0 0
La fonction f étant positive et (Dn ) est une suite croissante de domaines de limite R2 , on a
I = lim In = π.
n→∞
2. Le domaine Cn est le carré de côté 2n centré en l’origine. La suite (Cn ) est elle aussi de limite
R2 , donc on peut appliquer le résultat précédent
ZZ
lim f (x, y)dxdy = I = π.
n→∞
Cn
3. L’intégrale définie par J est doublement généralisée, mais clairement convergente tant il est
clair que exp(−x2 ) = o(1/x2 ) aussi bien en +∞ qu’en −∞. En particulier, on a
Z n
J = lim exp(−x2 )dx = lim Jn .
n→∞ −n n→∞
Corrigé
Le domaine T est infini, l’intégrale est donc généralisée. Mais la fonction intégrée est positive sur
T donc il suffit de vérifier la convergence pour une suite croissante de domaines, par exemple pour
Tn = {(x, y) : 1 ≤ x ≤ n, 0 ≤ y ≤ x} (voir Figure 2.24). Ceci donne
Z n Z x Z n
1 1 1 h y ix
In = 2 2
dy dx = 2
arctan dx,
1 x 0 x +y 1 x x 0
Tn
1
1 n
d’où finalement : n
1 n π
π 1 π 1
Z
In = dx = − = 1− .
4 1 x2 4 x 1 4 n
On a donc une intégrale généralisée convergente de valeur :
π
I = lim In = .
n→∞ 4
Corrigé
Le domaine d’intégration est représenté Figure 2.25. Par additivité de l’intégration, le calcul se
∆′ → D ′
ϕ:
(ρ, θ) 7→ (x = ρ cos θ, y = 1 + ρ sin θ)
x2 − y 2
f (x, y) = .
(x2 + y 2 )2
1. Vérifier que :
∞
1
Z
I= f (x, y)dx = pour tout y,
1 1 + y2
∞ Z ∞ ∞ Z ∞
π π
Z Z
J1 = f (x, y)dy dx = et J2 = f (x, y)dx dy = − .
1 1 4 1 1 4
2. Soit Tn = {(x, y), 1 ≤ y ≤ x ≤ n}. Calculer l’intégrale de f sur Tn . Que dire lorsque n tend
vers l’infini ?
3. Soit An = [1, n]×[1, n]. Calculer l’intégrale de f sur An . Que dire lorsque n tend vers l’infini ?
4. Soit Bn = {(x, y), 1 ≤ y ≤ x + n ≤ 2n}. Calculer l’intégrale de f sur Bn . Que dire lorsque
n tend vers l’infini ?
5. L’intégrale de f sur [1, ∞[×[1, ∞[ est-elle convergente ? Pourquoi ?
Corrigé
Remarques préliminaires :
– La surface définie par la fonction f est donnée Figure 2.26.
– La fonction 1/(1 + x2 ) admet pour primitive la fonction arctan x, réciproque de la fonction tan,
définie sur R et à valeurs dans ] − π/2, π/2[.
– La fonction (x2 − a2 )/(x2 + a2 )2 admet pour primitive −x/(x2 + a2 ).
0.15
0.08
Z 0.01
−0.06
−0.13
1.0 1.0
1.4 1.4
1.8 1.8
2.2 2.2
2.6 2.6
3.0 3.0
Y 3.4 3.4 X
3.8 3.8
d’où finalement :
1 π
ln n − arctan n − , In =
2 4
et par conséquent : limn→∞ In = +∞.
3. On a cette fois :
n n n
y n 1
ZZ Z Z
In = f (x, y)dxdy = dx = − dx,
1 x + y2
2
1 1
2
n +x 2 1 + x2
An
d’où : h x in π 1
In = arctan − arctan x = − arctan n − arctan = 0,
n 1 2 n
car arctan x + arctan x1 = π/2 pour tout x, et par suite limn→∞ In = 0.
4. Même calcul :
n x+n n
y x+n 1
ZZ Z Z
In = f (x, y)dxdy = dx = − dx.
1 x + y2
2
1 1
2
x + (x + n)2 1 + x2
Bn
x n
Z n
x+n 1 2 2 1
2 2
dx = ln(2x + 2nx + n ) + arctan(1 + 2 ) = . . .
1 x + (x + n) 4 2 n 1
5n2
1 1 2
· · · = ln 2 + arctan 3 − arctan 1 + .
4 n + 2n + 2 2 n
On a donc :
1 1 π
lim In = ln 5 + arctan 3 − .
n→∞ 4 2 4
5. Si l’intégrale de f était convergente sur [1, +∞[×[1, +∞[, on aurait la même limite dans les
questions 3 et 4, ce qui n’est pas le cas.
Corrigé
Puisque y est strictement positif, il est clair qu’on peut prolonger la fonction f (x, y) = ey ln x par la
valeur 0 en tout point (0, y), ce qui donne une fonction continue sur le domaine D = [0, 1] × [a, b],
donc intégrable. Le théorème de Fubini donne d’une part :
1 Z b 1 y ln x b 1
xb − xa
e
ZZ Z Z Z
y ln x
I= f (x, y)dxdy = e dy dx = dx = dx.
0 a 0 ln x a 0 ln x
D
Cette intégrale est donc finie par intégrabilité de f sur D. D’autre part, en appliquant Fubini dans
l’autre sens :
Z b Z 1 Z b y+1 1 Z b
x 1 1+b
I= y
x dx dy = dy = dy = [ln(y + 1)]ba = ln .
a 0 a y + 1 0 a y + 1 1 +a
1. Calculer l’intégrale :
dxdy
ZZ
I= .
D (1 + x2 )(1 + y 2 )
2. En effectuant un changement de variables en coordonnées polaires, montrer que l’on a :
π
ln(2 cos2 θ)
Z
4
I= dθ.
0 cos(2θ)
3. Posons π
ln(2 sin2 θ)
Z
4
J= dθ.
0 cos(2θ)
Montrer que cette intégrale est bien définie.
4. Montrer que I + J et I − J s’expriment en fonction de
1
ln t
Z
K= dt.
0 1 − t2
2
En déduire que K = − π8 .
5. Montrer que les intégrales A et B convergent :
1 1
ln t ln t
Z Z
A= dt et B = dt.
0 1−t 0 1+t
Corrigé
Rappel : la fonction 1/(1 + x2 ) admet pour primitive la fonction arctan x, réciproque de la fonction
tan, définie sur R et à valeurs dans ] − π/2, π/2[.
1. On en déduit sans problème le calcul de l’intégrale double :
1 1
π2
Z Z
dxdy dx dy
ZZ
I= = × = [arctan x]10 × [arctan y]10 = .
(1 + x2 )(1 + y 2 ) 0 1 + x2 0 1 + y2 16
D
Cette valeur correspond au volume compris entre le plan domaine D et la surface définie par
1
(x, y) 7→ (1+x2 )(1+y 2 ) (voir Figure 2.27).
∆ = {(ρ, θ), 0 ≤ θ ≤ π/4, 0 ≤ ρ ≤ 1/ cos θ} ∪ {(ρ, θ), π/4 ≤ θ ≤ π/2, 0 ≤ ρ ≤ 1/ sin θ}.
On a alors :
π 1
R 4
R cos θ ρ
I= 0 0 (1+ρ2 cos2 θ)(1+ρ2 sin2 θ)
dρ dθ
R π
2
R sin1 θ ρ
+ π 0 (1+ρ2 cos2 θ)(1+ρ2 sin2 θ)
dρ dθ
4
ρ cos2 θ ρ sin2 θ
ρ 1
= − ,
(1 + ρ2 cos2 θ)(1 + ρ2 sin2 θ) cos 2θ (1 + ρ2 cos2 θ) (1 + ρ2 sin2 θ)
1.0
0.9
0.8
0.7
Z
0.6
0.5
0.4
0.3
0.2
0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 1.0
Y 0.8 0.9 1.0 X
1
Figure 2.27 – Surface définie par (x, y) 7→ (1+x2 )(1+y 2 )
pour (x, y) ∈ [0, 1] × [0, 1].
Au total, on obtient :
π
1 ln(2 cos2 θ)
Z
4
I1 = dθ,
2 0 cos 2θ
et même valeur pour I2 via le changement de variable θ ′ = π/2 − θ, d’où le résultat voulu
pour I.
3. L’intégrale J est doublement généralisée : en 0 et en π/4.
- en 0 : sin θ ∼ θ donc l’intérieur de l’intégrale est équivalent à ln 2 + 2 ln θ, or 0 ln θdθ est
R
A − B = A/2.
2
Des deux équations on déduit la valeur de A : − π6 .
Remarque. Une fois de plus, le principe ici est le même que celui vu en exercice 2.14 pour
le calcul de l’intégrale gaussienne : on trouve la valeur d’une intégrale simple en passant par
le calcul d’une intégrale double.
2. Prouver que :
1 π
ZZ
I= dxdy où ∆ = [0, ] × [0, a].
∆ 1 + y cos x 2
3. En effectuant les changements t = tan(x/2) et y = cos(2θ), établir que :
π2 1
I= − (arccos a)2 .
8 2
Corrigé
1. L’intégrale est généralisée en π/2, mais par l’équivalent classique ln(1 + u) ∼ u en 0, la
fonction admet pour limite a en π/2 donc il n’y a pas de problème de convergence.
2. Pas de difficulté :
Z π Z a Z π Z π
2 1 2 ln(1 + y cos x)
a 2 ln(1 + a cos x)
dy dx = [ ]0 dx = dx = I.
0 0 1 + y cos x 0 cos x 0 cos x
1
Et il “suffit” de se souvenir que la primitive de 1/(a2 + b2 t2 ) est ab arctan( ab t), ce qui donne :
a r 1 Z a r
2 1−y 2 1−y
Z
I= p arctan t dy = p arctan dy.
0 1 − y2 1+y 0 0 1 − y2 1+y
où D est le domaine limité par la courbe d’équation : (x2 + y 2 )2 = a2 (x2 − y 2 ), avec a > 0 fixé.
Mθ
r(θ)
Corrigé
La première difficulté est de représenter le domaine d’intégration D. Pour le faire, on passe en
coordonnées polaires. On écrit donc :
x = r cos θ
y = r sin θ
(C) r 2 = a2 cos(2θ).
On en déduit que l’angle θ doit être tel que cos(2θ) ≥ 0. Puisque θ est a priori entre 0 et 2π, ceci
signifie qu’on doit en fait avoir :
h π i 3π 5π 7π
θ ∈ 0, ∪ , ∪ , 2π .
4 4 4 4
L’angle θ étant défini modulo 2π, ceci est équivalent à dire que :
h
3π π πi 3π
θ ∈ A = −π, − ∪ − , ∪ ,π ,
4 4 4 4
y y
(C)
a x a x
ce qui implique que (C) est symétrique par rapport à l’axe des ordonnées et qu’on peut donc res-
treindre l’étude au seul intervalle [0, π/4].
0.8
Z 0.4
−1.0 −1.0
−0.6 −0.6
−0.2 −0.2
0.2 0.2
Y 0.6 0.6 X
1.0 1.0
RR p
Figure 2.30 – Volume correspondant à I = a2 − x2 − y 2 dxdy, avec a = 1.
D
√
Puisque la quantité r a2 − r 2 ne dépend que de la distance au centre, et pas de l’angle θ, les symé-
tries précédentes assurent que l’intégrale sur l’ensemble du domaine D vaut quatre fois l’intégrale
ce qui donne :
π a√cos(2θ) π
4a3
1
Z Z
4 4
I =4 − (a2 − r 2 )3/2 dθ = 1 − (1 − cos(2θ))3/2 dθ.
0 3 0 3 0
I= θ + 2 2 cos θ − cos3 θ ,
3 3
0
et finalement :
π 4 √
3
I =a − 4 2−5 .
3 9
Ouf !
Remarque. Il n’est pas étonnant de trouver un résultat en a3 , puisqu’on vient en fait de calculer
le volume situé entre la sphère de rayon a et le domaine D du plan (voir Figure 2.30). En effet :
p
z = f (x, y) = a2 − x2 − y 2 ⇐⇒ x2 + y 2 + z 2 = a2 .
Corrigé
1. En coordonnées sphériques, le domaine s’écrit :
1. Représenter T .
2. Quel est le volume de T ?
3. Soit a un nombre réel fixé. Donner une primitive de (x + a)−3 .
4. Calculer
1
ZZZ
I= dxdydz.
(x + y + z + 1)3
T
z y
1−z
K
Dz Dz
z x
1−z
D J y
x I
Corrigé
1. Le volume de T est :
ZZZ Z 1 ZZ Z 1
V(T ) = dxdydz = dxdy dz = I(z)dz,
0 0
V Dz
où I(z) correspond tout simplement à l’aire du demi-carré de côté (1 − z), c’est-à-dire (voir
Figure 2.31) :
(1 − z)2
I(z) = .
2
D’où :
1 1 1 1 1
Z
V(T ) = (1 − z)2 dz = (z − 1)3 0 = .
2 0 6 6
1
On retrouve la formule vue dans les petites classes : volume = 3 base × hauteur.
1
− .
(n − 1)(t + a)n−1
Ce qui donne :
Z 1 Z 1−z Z 1−z−y
1 1 5
I= 3
dx dy dz = · · · = ln 2 − .
0 0 0 (1 + x + y + z) 2 16
C = {(x, y, z) ∈ R3 , 0 ≤ z ≤ 1, x2 + y 2 ≤ z 2 }.
1. Représenter C.
2. Donner le domaine ∆ correspondant à C en coordonnées cylindriques.
3. En déduire le volume de ce cône.
4. Calculer ZZZ
xyz dxdydz.
C
1.0
0.8
0.6
Z
0.4
0.2
0
−1.0
−0.5 −1.0
−0.6
0 −0.2
0.5 0.2
Y 0.6
X
1.0 1.0
Corrigé
1. Le domaine C est l’intérieur d’un cône de révolution autour de l’axe (Oz), voir Figure 2.27.
C’est un domaine fini sur lequel la fonction f : (x, y, z) 7→ xyz est continue. Il n’y a donc pas
de problème de convergence pour l’intégrale considérée.
2. L’idée naturelle est de passer en coordonnées cylindriques. Il faut commencer par définir le
domaine ∆ correspondant à C :
et l’intégrale triple vaut 0. Ceci pouvait se voir sans calculs : pour tout point (x, y, z) du
cône, le point (−x, y, z) appartient lui aussi au cône, et f (−x, y, z) = −f (x, y, z).
5. En déduire
x2 + y 2
ZZZ
dxdydz.
x2 + y 2 + z 2
D
Corrigé
1. Le quart du domaine d’intégration (on s’est restreint à la partie où x et y sont positifs) est
représenté Figure 2.33.
2. L’idée naturelle est de passer en coordonnées sphériques, où le domaine considéré s’écrit :
n π o
∆ = (r, φ, θ) : 0 ≤ r < 1, ≤ φ ≤ π, 0 ≤ θ < 2π .
3
ce qui donne
1
r3
V(D) = [− cos φ]ππ [θ]2π
0 = π.
3 0
3
1
2
π
3
1 y
4. Il suffit d’écrire :
Remarque. En toute rigueur, puisque la fonction à intégrer n’est pas définie à l’origine,
il faut appliquer la méthode habituelle (la fonction est positive) : considérer la suite de
domaines
1 π
∆n = (r, φ, θ) : ≤ r < 1, ≤ φ ≤ π, 0 ≤ θ < 2π ,
n 3
3π
pour montrer que l’intégrale est convergente de valeur 4 .
1. Représenter D.
2. Calculer : √ √
3
!
Z
2
Z 1−u2
I= vdv du.
1
0 2
√
π 3
3. Grâce à un passage en coordonnées cylindriques, en déduire que D a pour volume 16 .
√
3
2
1
2 1 y
1
2
1
x
Corrigé
1. Dans les coordonnées positives, le domaine D correspond à l’ensemble des points qui sont à
la fois à l’extérieur du cylindre de révolution d’axe (Oz) et de rayon 1/2 et à l’intérieur de
la sphère unité (voir Figure 2.34).
2. On a :
Z √3 Z √1−u2 ! Z √3 2 √1−u2
2 2 v
I= vdv du = du,
0 1
0 2 1
2 2
c’est-à-dire : √
√
3 3 √
u3 2
1 3 1 3 3
Z
2
2
I= − u du = u− = .
2 0 4 2 4 3 0 8
3. En coordonnées cylindriques, le domaine D correspond à .
( √ )
π 3
∆ = (r, θ, z) : 0 ≤ r ≤ 1, 0 ≤ θ ≤ , 0 ≤ z ≤ .
2 2
Par définition, le volume de D est :
ZZZ
Vol(D) = dxdydz,
D
D = {(x, y, z) ∈ R3 , y = 0, (x − a)2 + z 2 ≤ r 2 }.
0.4
Z
−0.3
−1.0
4
−4
3
−3
2
−2
1
−1
0
0
1 −1
2 −2
X Y
3 −3
4 −4
Corrigé
1. L’application
K →D
ϕ:
(ρ, u, v) 7→ (x, y, z)
Soit encore : Z r
2
V(T ) = 4π a( ρdρ) = 2π 2 ar 2 .
0
Ce résultat est logique : surface du disque × distance parcourue par son centre.
2. Puisque 0 < r < a, f est positive et le calcul de la surface du tore se fait sans difficulté :
Z 2π
A = 2π (a + r cos u)rdu = 4π 2 ra.
0
Là encore résultat logique : circonférence du cercle × distance parcourue par son centre.
Corrigé.
L’application
]0, 1[3 →]0, 1[3
ϕ:
(u, v, w) 7→ (x, y, z)
est bijective d’application réciproque
]0, 1[3 →]0, 1[3
−1
ϕ : y+z z
(x, y, z) 7→ (u = x + y + z, v = x+y+z , w = y+z )
C’est donc un C 1 -difféomorphisme de l’ouvert ]0, 1[×]0, 1[×]0, 1[ sur lui-même. La matrice jaco-
bienne de ϕ au point (u, v, w) est :
∂x ∂x ∂x
∂u ∂v ∂w 1−v −u 0
∂y ∂y ∂y
Jϕ (u, v, w) = ∂u ∂v ∂w
(u, v, w) = v(1 − w) u(1 − w) −uv
∂z ∂z ∂z vw uw uv
∂u ∂v ∂w
Le jacobien vaut donc det Jϕ (u, v, w) = u2 v > 0. Le calcul de l’intégrale se ramène alors à :
6 1 4 1 2 1
u u7 v v5 w w3
ZZZ
5 3
I= u v w(1 − u)(1 − v)(1 − w)dudvdw = − × − × − ,
6 7 0 4 5 0 2 3 0
]0,1[3
Corrigé
Rappel : si X ∼ E(λ), alors pour tout entier naturel n, on a E[X n ] = n!/λn .
1. Il est clair que f est une fonction positive. Par ailleurs, le calcul de son intégrale double sur
R2 se fait sans problème. Il suffit de remarquer que l’intégrale de exp(−x) sur [0, +∞[ vaut
1 (intégrale de la densité d’une loi exponentielle de paramètre 1) :
ZZ Z +∞ Z +∞ Z +∞
−x −y
f (x, y)dxdy = e e dy dx = e−x dx = 1,
R 2 0 0 0
On voit donc que X suit une loi exponentielle de paramètre 1, noté X ∼ E(1). Vu les rôles
symétriques joués par X et Y , la variable aléatoire Y a la même loi : Y ∼ E(1).
3. On remarque que :
∀(x, y) ∈ R2 f (x, y) = fX (x)fY (y),
donc X et Y sont indépendantes, donc leur covariance est nulle (rappelons que la réciproque
est fausse en général, sauf dans le cas des vecteurs gaussiens).
si 0 ≤ x ≤ y ≤ 1
c
f (x, y) =
0 sinon
1. Déterminer c pour que f soit une densité. Les variables X et Y sont-elles indépendantes ?
2. Déterminer les lois marginales de X et Y et les représenter.
3. Calculer E[X], E[Y ], E[XY ] et en déduire la covariance du couple.
4. Pour U et V deux variables uniformes indépendantes sur [0, 1], on note X = min(U, V ) et
Y = max(U, V ). Raisonnons “à la physicienne” : on considère deux nombres x et y et deux
intervalles [x, x + dx] et [y, y + dy] “infiniment petits”. Donner les conditions sur x et y pour
que (X, Y ) puisse tomber dans le rectangle [x, x + dx] × [y, y + dy] ? Que vaut alors cette
probabilité ?
Corrigé
f (x, y)
2
y
1
Supp(X, Y )
x
1 1 y
1 Supp(X, Y )
x
ce qui, après calculs, montre que c = 2. Le support et la densité du couple (X, Y ) sont
représentés Figure 2.36. Noter qu’on retrouve bien que le volume sous la densité vaut 1 par
la formule : Volume = Base × Hauteur.
2. Les variables X et Y ne sont pas indépendantes. En effet, le support de (X, Y ) est triangulaire
alors que le produit cartésien des supports de X et Y est [0, 1]2 .
3. Puisque X prend ses valeurs entre 0 et 1, il s’ensuit que fX (x) = 0 lorsque x ∈ / [0, 1]. Soit
maintenant 0 ≤ x ≤ 1, alors :
Z Z 1
fX (x) = f (x, y)dy = 2dy = 2(1 − x).
R x
La densité fX (x) = 2(1 − x)1[0,1] (x) est représentée Figure 2.37 à gauche. De la même façon,
la densité fY est nulle en dehors de [0, 1], et pour 0 ≤ y ≤ 1, on a :
Z Z y
fY (y) = f (x, y)dx = 2dx = 2y.
R 0
2 2
fX (x) fY (y)
1 1
x y
1 1
Corrigé
1. La fonction f est positive et on vérifie sans problème que son intégrale sur R2 vaut 1 :
ZZ Z +∞ Z x Z +∞
−x
f (x, y)dxdy = e dy dx = xe−x dx = 1,
R2 0 0 0
puisqu’on reconnaît la moyenne d’une loi exponentielle de paramètre 1. Bref, f définit bien
une densité de probabilité sur R2 .
2. Pour les densités marginales, on obtient
c’est-à-dire que X suit une loi Gamma de paramètres (2, 1). De même, pour la variable Y ,
on trouve
fY (y) = e−y 1]0,+∞[(y).
Ainsi Y une loi exponentielle E(1). Les variables X et Y ne sont pas indépendantes puisque
On pouvait l’affirmer dès le début puisque le support de la loi jointe n’est pas un produit
d’intervalles, mais plutôt un triangle (infini).
3. Rappelons que si V ∼ E(1), alors E[V n ] = n!, d’où il découle immédiatement que E[X] =
E[V 2 ] = 2! = 2 et E[Y ] = E[V ] = 1. Pour la covariance :
Or
+∞ Z x +∞
1 1
ZZ Z Z
−x
E[XY ] = xyf (x, y)dxdy = xe ydy dx = x3 e−x dx = E[V 3 ] = 3
R2 0 0 2 0 2
d’où Cov(X, Y ) = 1.
4. L’inversion du système d’équations donne le difféomorphisme
∆ →D
ϕ:
(s, t) 7→ (x, y) = s+t s−t
2 , 2
et
fT (t) = e−t 1{t>0} ,
c’est-à-dire que T ∼ E(1).
1. La densité du couple (X, Y ) est donc de la forme f (x, y) = c × 1D (x, y). Déterminer c.
2. Déterminer les lois marginales de X et Y . En déduire E[X] et E[Y ].
3. Les variables X et Y sont-elles indépendantes ?
4. Calculer la covariance du couple (X, Y ).
5. Déduire de sa fonction de répartition G(u) que U = X 2 + Y 2 suit une loi uniforme sur [0, 1].
6. Calculer l’espérance de U . En déduire E[X 2 ], E[Y 2 ], la variance de X et celle de Y .
7. Un lanceur de fléchettes tire sur la cible D : la loi du point d’impact √(X, Y ) sur la cible est
uniforme. Au point d’impact est associée la distance au centre L = X 2 + Y 2 . Supposons
qu’il tire n fois de façons indépendantes : ceci donne un n-uplet (L1 , . . . , Ln ) de variables
aléatoires. Soit 0 < a ≤ 1 : calculer la probabilité que l’une au moins des fléchettes soit à
distance inférieure à a du centre de la cible.
Corrigé
1. Puisque le point (X, Y ) est tiré uniformément dans le disque D, la densité f (x, y) du couple
(X, Y ) est tout simplement l’indicatrice du disque divisé par la surface de ce disque. C’est
la généralisation d’une loi uniforme sur un segment de R (indicatrice du segment divisé par
sa longueur). Ainsi :
1 1
f (x, y) = 1D (x, y) = 1{x2 +y2 ≤1} (x, y).
π π
√ √
2. Si x est fixé entre −1 et 1, y ne peut varier qu’entre − 1 − x2 et + 1 − x2 (faire un dessin !).
On a alors : Z +√1−x2
1 2p
fX (x) = √ dy = 1 − x2 1[−1,1] (x).
− 1−x 2 π π
Puisque l’abscisse X et l’ordonnée Y jouent des rôles symétriques, on a aussi :
2p
fY (y) = 1 − y 2 1[−1,1] (y).
π
On en déduit :
2 1 p
Z
E[X] = x 1 − x2 dx,
π −1
et il y a deux façons de voir les choses : ou bien on y va brutalement et on reconnaît à peu
de choses près la dérivée de (1 − x2 )3/2 . Ou bien on voit que c’est l’intégrale d’une fonction
impaire sur un domaine symétrique par rapport à 0, donc elle vaut 0 (faire un dessin). Ainsi
E[X] = 0, ce qui n’est pas étonnant : on lance les fléchettes aussi bien dans les abscisses
négatives que positives. Puisque Y a même loi que X, on a aussi E[Y ] = 0.
3. Les variables X et Y ne sont pas indépendantes, puisque le support de la loi du couple (X, Y )
n’est pas un pavé, mais un disque. On peut aussi le voir en vérifiant que la loi jointe f (x, y)
n’est pas égale au produit des marginales.
4. Par définition la covariance du couple (X, Y ) est :
ZZ
cov(X, Y ) = E[XY ] − E[X]E[Y ] = E[XY ] = xyf (x, y) dx dy,
D
et par le théorème de Fubini :
√ !
+1 + 1−x2
1
Z Z
cov(X, Y ) = x √ y dy dx = 0,
π −1 − 1−x2
√ √
puisque pour tout x entre −1 et 1, le segment [− 1 − x2 , + 1 − x2 ] est symétrique par
rapport à 0 et la fonction y 7→ y est impaire. On en déduit que cov(X, Y ) = 0 alors que X
et Y ne sont clairement pas indépendantes.
0 si u ≤ 0
G(u) = u si 0 ≤ u ≤ 1
1 si u ≥ 1
Autrement dit, U suit une loi uniforme sur [0, 1], ce qu’on note U ∼ U[0,1] .
6. L’espérance de U vaut donc 1/2. Puisque X et Y ont même loi, on a E[X 2 ] = E[Y 2 ], et
puisque U = (X 2 + Y 2 ), on a :
1 1
E[U ] = E[X 2 ] + E[Y 2 ] = 2E[X 2 ] ⇒ E[X 2 ] = E[U ] = .
2 4
Les variances de X et Y sont identiques et :
1
Var(X) = E[X 2 ] − E[X]2 = E[X 2 ] = .
4
7. La probabilité que l’une au moins des fléchettes soit à distance inférieure à a du centre de la
cible est :
P(L1 > a, . . . , Ln > a) = P(L1 > a) × · · · × P(Ln > a) = P(L1 > a)n .
Mais on a alors :
3. En déduire la densité de V .
Corrigé
1. Les variables X et Y étant indépendantes, la densité du couple (X, Y ) n’est rien d’autre que
le produit des densités de X et Y :
2. Le changement de variables proposé est linéaire et bijectif avec comme bijection réciproque :
X = W
Y = V −W
On introduit le C 1 -difféomorphisme :
∆ −→ D
ϕ: x = w
(v, w) 7−→
y = v−w
3. La variable V est à valeurs dans R+ . Pour v > 0 fixé, on obtient par marginalisation de la
loi jointe précédente :
Z Z v
fV (v) = fV,W (v, w)dw = e−v dw = ve−v .
R 0
Ainsi la somme de deux variables exponentielles indépendantes de paramètre 1 suit une loi
Gamma de paramètres (2, 1). Ce résultat se généralise : la somme de n variables exponentielles
indépendantes de même paramètre λ suit une loi Gamma de paramètres (n, λ). Rappelons
que
(λx)n−1
X ∼ Γ(n, λ) ⇐⇒ f (x) = × λe−λx 1{x≥0} .
(n − 1)!
Ceci permet de retrouver facilement les premiers moments d’une loi Gamma à partir de ceux
de la loi exponentielle.
7. En moyenne, combien de temps faut-il pour que les deux soient sortis ? Indication : le max
de deux nombres, c’est la somme moins le min.
Corrigé
1. Notons FY la fonction de répartition de Y . La variable Y est à valeurs positives donc FY (y) =
0 pour y ≤ 0. Pour y ≥ 0, on utilise le classique passage au complémentaire :
FY (y) = P(Y ≤ y) = P(min(X1 , X2 ) ≤ y) = 1 − P(min(X1 , X2 ) > y),
ce qui s’écrit encore :
FY (y) = 1 − P ({X1 > y} ∩ {X2 > y}) .
Or X1 et X2 sont indépendantes et P(X1 > y) = 1 − FX1 (y) = e−λ1 y , d’où :
FY (y) = 1 − P(X1 > y)P(X2 > y) = 1 − e−λ1 y e−λ2 y = 1 − e−(λ1 +λ2 )y .
2. On reconnaît la fonction de répartition d’une loi exponentielle : Y ∼ E(λ1 +λ2 ). Le même rai-
sonnement s’applique de façon générale : le minimum de n variables exponentielles indépen-
dantes de paramètres respectifs λ1 , . . . , λn suit une loi exponentielle de paramètre λ1 +· · ·+λn .
Dit rapidement, la loi expontielle est stable par minimisation.
3. Puisque X1 et X2 sont indépendantes, leur loi jointe est le produit des marginales :
f (x1 , x2 ) = fX1 (x1 ) × fX2 (x2 ) = λ1 e−λ1 x1 1{x1 ≥0} × λ2 e−λ2 x2 1{x2 ≥0} .
4. Par définition de la loi jointe
ZZ
P((X1 , X2 ) ∈ D) = f (x1 , x2 )dx1 dx2 ,
D
et par suite
+∞ +∞
λ2 λ1
Z Z
P((X1 , X2 ) ∈ D) = λ2 e−λ2 x2 dx2 − λ2 e−(λ1 +λ2 )x2 dx2 = 1 − = .
0 0 λ1 + λ2 λ1 + λ2
5. Cette question est alors immédiate :
λ1
P(Y = X1 ) = P(X1 < X2 ) = P((X1 , X2 ) ∈ D) = .
λ1 + λ2
6. Rappelons qu’une exponentielle de moyenne 20 a pour paramètre 1/20. La probabilité que
Alice sorte la première est donc tout simplement :
1/20 3
p= = .
1/20 + 1/30 5
7. Soit Xa , respectivement Xb , le temps nécessaire pour que Alice, respectivement Bob, sorte
de la banque. On cherche donc à calculer E[max(Xa , Xb )]. Il suffit de remarquer que :
max(Xa , Xb ) = Xa + Xb − min(Xa , Xb ),
d’où par linéarité de l’espérance :
1
E[max(Xa , Xb )] = E[Xa ] + E[Xb ] − E[min(Xa , Xb )] = 20 + 30 − = 38 min.
1/20 + 1/30
3. Soit D = {(x, y) ∈ [0, 1] × [0, 1], |y − x| ≤ 1/4}. Représenter D et calculer P((X, Y ) ∈ D).
4. Deux personnes décident de se retrouver après le travail pour écluser un gorgeon, mais elles
sont toutes deux impatientes et chacune n’attendra l’autre qu’un quart d’heure avant de par-
tir. Supposons qu’elles arrivent à des horaires distribués indépendamment et uniformément
entre 19h et 20h. Quelle est la probabilité qu’elles se retrouvent effectivement ?
y y
1 1
3
4
Supp(X, Y ) D
1
4
x x
1 3 1
1 4 4
Corrigé
1. La densité jointe du couple (X, Y ) est le produit des densités marginales, soit
D = {(x, y) ∈ [0, 1] × [0, 1], |y − x| ≤ 1/4} = {(x, y) ∈ [0, 1] × [0, 1], x − 1/4 < y < x + 1/4}
est représenté Figure 2.38. D’après la question précédente, calculer P((X, Y ) ∈ D) revient à
calculer la surface de D, ce qui donne
3 3 7
P((X, Y ) ∈ D) = 1 − × = .
4 4 16
4. D’après ce qu’on vient de voir, la probabilité qu’elles se retrouvent effectivement est donc
7/16.
Corrigé
1. On obtient 1 1 !
1 Z 1
x2 y2
Z
c (x + y)dy dx = c + = c,
0 0 2 0 2 0
donc c = 1. Pour calculer P(X > 1/2), ou bien on calcule la densité de X et on l’intègre de
1/2 à 1, ou bien on envoie directement
Z 1 Z 1
5
P(X > 1/2) = P(X > 1/2, 0 ≤ Y ≤ 1) = (x + y)dy dx = · · · = .
1
0 8
2
2. Soit D = {(x, y) ∈ [0, 1] × [0, 1], x + y < 1}. Le domaine D correspond donc à l’intérieur du
triangle OIJ. Ainsi
Z 1 Z 1−x
1
ZZ
P(X + Y < 1) = f (x, y)dxdy = 6x 2
ydy dx = · · · = .
0 0 10
D
Corrigé
1. La densité de X s’écrit fX (x) = e−x 1{x≥0} , sa moyenne vaut 1, sa variance de même.
2. Puisque les variables sont indépendantes, la densité jointe du couple (X, Y ) est le produit
des densités marginales, c’est-à-dire
3. La variable S = X + Y est clairement positive en tant que somme de variables positives donc
fS (s) = 0 si s < 0. Si s ≥ 0, alors le produit de convolution donne
Z +∞ Z s
fS (s) = e 1{x≥0} e
−x −(s−x)
1{s−x≥0} dx = e−x e−(s−x) dx = se−s .
−∞ 0
Ainsi fZ (z) = z 2 −z
2 e 1{z≥0} .
6. On peut généraliser le raisonnement précédent pour montrer que de façon générale, si Sn =
X1 + · · · + Xn , où les Xi sont i.i.d. de loi ∼ E(λ), alors
(λs)n−1
fSn (s) = × λe−λs 1{s≥0} ,
(n − 1)!
densité d’une loi appellée loi Gamma de paramètres n et λ, noté Sn ∼ Γ(n, λ). En particulier,
on en déduit sans peine moyennes et variance d’une telle loi : E[Sn ] = n/λ et Var(Sn ) = n/λ2 .
Corrigé
1. Si X suit une loi normale centrée réduite, densité, moyenne et variance sont respectivement
1 x2
fX (x) = √ e− 2 & E[X] = 0 & Var(X) = 1.
2π
c’est-à-dire
2 ∞
1 1
fΘ (θ) = 1{0≤θ<2π} e− r2
= 1 ,
2π 0 2π {0≤θ<2π}
et Θ suit une loi uniforme sur [0, 2π[. On pouvait s’en douter sans aucun calcul : lorsque
l’abscisse X et l’ordonnée Y sont tirées indépendamment selon une loi normale centrée ré-
duite, aucune direction pour l’angle aléatoire Θ n’est privilégiée, d’où la loi uniforme pour
celui-ci.
5. La densité de R est encore plus simple à calculer :
Z 2π Z 2π
1 − r2
fR (r) = fR,Θ (r, θ)dθ = re 2 1{r≥0} dθ
0 2π 0
donc
r2
fR (r) = re− 2 1{r≥0} ,
appelée loi de Rayleigh de paramètre 1. Sa fonction de répartition FR (r) = P(R ≤ r) coule
alors de source : elle vaut 0 pour r < 0 puisque R ne prend que des valeurs positives, et pour
r ≥ 0, Z r r
t2 r2
FR (r) = fR (t)dt = e− 2 = 1 − e− 2 .
0 0
Au final,
2
FR (r) = 1−e− r2
1{r≥0} .
La moyenne de R vaut
Z Z +∞ r2
E[R] = rfR (r)dr = r 2 e− 2 dr.
R 0
Pour s’en sortir, de deux choses l’une : ou bien on effectue une intégration par parties avec
u = r et v ′ = r exp(−r 2 /2) et on se ramène à la densité d’une gaussienne, ou bien on reconnaît
(à une vache près) le moment d’ordre 2 d’une loi normale centrée réduite. On rappelle que
si X ∼ N (0, 1), alors
Z +∞
1 x2
x2 × √ e− 2 dx = E[X 2 ] = Var(X) + E[X]2 = 1.
−∞ 2π
qui est la fonction de répartition d’une loi exponentielle de paramètre 1/2. En d’autres termes,
la loi du khi-deux à deux degrés de liberté et la loi exponentielle de paramètre 1/2 sont les
mêmes.
σ1 X − m1 σ2 Y − m2
T =p × +p 2 × .
σ12 + σ22 σ1 2
σ1 + σ2 σ2
Corrigé
1. La relation x2 + (s − x)2 = s2 /2 + 2(x − s/2)2 est triviale.
√ √
2. Posons u = x/ 2 pour obtenir du = dx/ 2 et par suite
+∞ +∞
√ Z +∞
1 2π 1 √
Z Z 2 x2
−u2 − x2
e du = √ e dx = √ √ e− 2 dx = π.
−∞ 2 −∞ 2 −∞ 2π
1 − s2 +∞ −u2 1
Z
s2
fS (s) = e 4 e du = √ e− 4 ,
2π −∞ 4π
la dernière relation découlant du résultat de la question 2. On a bien montré que S ∼ N (0, 2).
5. Les variables X cos θ et Y sin θ sont indépendantes et suivent des lois normales centrées de
variances respectives cos2 θ et sin2 θ. Par convolution, on a cette fois
Z +∞ Z +∞
1 2 (s−x)2 1 s2 (x−s cos2 θ)2
− x2 −
fS (s) = e 2 cos θ e 2 sin θ dx =
2 −
e 2 e− 2 cos2 θ sin2 θ dx.
2π cos θ sin θ −∞ 2π cos θ sin θ −∞
1 − s2 +∞ − t2 1
Z
s2
fS (s) = e 2 e 2 dt = √ e− 2 ,
2π −∞ 2π
Equations différentielles
Introduction
Ce chapitre est une introduction à la théorie des équations différentielles ordinaires : pour une
fonction f donnée, on cherche les fonctions y de la variable x dont la dérivée vérifie l’équation
y ′ = f (x, y)
Dans la plupart des cas, on ne saura pas résoudre explicitement une telle équation. Pour une
condition initiale (x0 , y0 ) fixée, on peut néanmoins s’interroger sur l’existence et l’unicité de la
solution : moyennant une hypothèse de régularité sur f , on peut y répondre grâce au Théorème
de Cauchy-Lipschitz.
Quelques cas particuliers où l’on sait résoudre analytiquement l’équation différentielle sont ensuite
étudiés plus en détail : équations linéaires d’ordre 1 (y ′ = a(x)y + b(x)), équations linéaires d’ordre
2 à coefficients constants (ay ′′ + by ′ + cy = f (x)), équations à variables séparées (y ′ = f (x)g(y)).
y ′ = f (x, y),
Remarques :
– L’équation est dite du premier ordre car elle ne fait intervenir que la dérivée première y ′ de la
fonction.
– Si l’équation s’écrit simplement y ′ = f (y), on dit qu’elle est autonome.
155
156 Chapitre 3. Equations différentielles
y0
y y= y0 (x0 −x)+1
y0
x
1
x0 x0 + y0
La question de la durée de vie des solutions est donc essentielle lors de l’étude d’une équation
différentielle. On s’y intéressera sur les exemples rencontrés, mais on ne donnera pas de résultats
généraux sur ce thème.
Remarque. Résoudre (ou intégrer) une équation différentielle, c’est en trouver toutes les solutions
maximales (J, ϕ), c’est-à-dire celles définies sur les plus grands intervalles possibles.
Exemple. Soit l’équation y ′ = 2 xy . L’équation n’est pas définie pour x = 0. Les plus grands
intervalles ne contenant pas 0 sont ] − ∞, 0[ et ]0, +∞[. On cherchera donc des solutions sur ces
deux intervalles.
En mécanique, si t est le temps et X(t) = (x(t), y(t), z(t)) les coordonnées d’un point mobile, alors
la dérivée X ′ (t) = (x′ (t), y ′ (t), z ′ (t)) correspond au vecteur vitesse de ce point mobile à l’instant
X ′ (t) = f (X, t)
X(0) = (x0 , y0 , z0 )
revient donc à trouver la position du point à tout instant sachant qu’il est parti de la position
(x0 , y0 , z0 ) (ce qu’on appelle la condition initiale du problème) et qu’il est astreint à la vitesse
f (X, t) s’il passe au point X à l’instant t.
On verra que les solutions d’une équation du premier ordre sont en général définies à une constante
près. La prise en compte de la condition initiale revient alors simplement à déterminer cette
constante.
Pour être assuré de l’existence d’au moins une solution au problème de Cauchy, Peano a montré
qu’il suffit de supposer f continue. Cependant, si on veut être assuré de l’unicité de cette solution,
il faut une condition supplémentaire sur f : l’aspect localement lipschitzien par rapport à y.
Cas particulier important. Un cas très simple et qui suffira quasiment toujours en pratique est
celui où la fonction f est de classe C 1 sur I × U : elle admet alors une dérivée partielle par rapport
à y et celle-ci est continue donc bornée sur un voisinage de (x0 , y0 ) ; l’Inégalité des Accroissements
Finis montre alors que f est localement lipschitzienne en y.
y ′ = f (x, y)
y(x0 ) = y0
Preuve. On commence par montrer l’existence et l’unicité d’une solution locale, puis que cette
unicité locale se traduit par une unicité globale.
Lemme 1
Il existe α > 0 et une unique solution ϕ :]x0 − α; x0 + α[→ U de y ′ = f (x, y) vérifiant ϕ(x0 ) = y0 .
Lemme 2
Si ϕ1 et ϕ2 sont deux solutions du problème de Cauchy définies sur le même intervalle J, alors
elles coïncident.
Soit alors (Ir , φr )r l’ensemble des solutions au problème de Cauchy. Le Lemme 1 assure qu’il n’est
pas vide. Notons J = ∪r Ir et φ la fonction définie sur J par φ|Ir = φr : φ est bien définie par
le Lemme 2 d’unicité et J est par définition le plus grand intervalle possible de définition d’une
solution au problème de Cauchy : (J, φ) est donc la solution maximale.
Preuve du Lemme 1.
Puisque la solution est locale, on peut remplacer I par Iα =]x0 − α, x0 + α[⊆ I et U par Iβ =
]y0 − β, y0 + β[⊆ U . Puisque f est continue, elle est bornée sur Iα × Iβ , disons par M . On s’arrange
de plus pour que αM < β, ce qui ne pose pas problème.
Soit alors
Λ = {ψ : Iα → R : ψ est continue, ψ(x0 ) = 0, |ψ(x)| ≤ β ∀x ∈ Iα }
Pour la distance d∞ définie par :
km |x − x0 |m
|T m ψ1 (x) − T m ψ2 (x)| ≤ · kψ1 − ψ2 k∞ ,
m!
et puisque |x − x0 | < α, on obtient :
km αm
kT m ψ1 − T m ψ2 k∞ ≤ · kψ1 − ψ2 k∞
m!
Donc pour m assez grand, T m est une contraction.
Preuve du Lemme 2.
Si on regarde les x supérieurs à x0 , définissons :
Si x+ < sup J, alors par continuité ϕ1 (x+ ) = ϕ2 (x+ ). Mais alors, si on applique le résultat
d’unicité locale du Lemme 1 au même problème de Cauchy avec la nouvelle condition initiale
(x+ , ϕ1 (x+ )), on obtient une contradiction, puisque celui-ci assure que les deux solutions devraient
encore coïncider à droite de x+ .
Lemme 3
L’espace métrique (Λ, d∞ ) est complet.
Preuve du Lemme 3.
Soit (ψn ) une suite de Cauchy de Λ pour d∞ ,c’est-à-dire :
Pour chaque x, la suite (ψn (x)) est de Cauchy dans R qui est complet donc admet une limite que
l’on note ψ∞ (x). Par passage à la limite, il est clair que ψ∞ (x0 ) = 0 et que |ψ∞ (x)| ≤ β pour tout
x de Iα . Il reste à vérifier que ψ∞ est continue sur Iα . Or, d’après ce qui précède, pour tous x et
x′ de Iα , on a via l’inégalité triangulaire :
avec n ≥ n0 . Mais ψn est continue donc pour x fixé, il existe δ > 0 tel que :
Preuve du Lemme 4.
La preuve est rigoureusement la même que celle du point fixe pour une fonction numérique. Tout
d’abord, le fait que T est une contraction assure qu’on ne peut avoir deux points fixes distincts. On
va alors montrer que, quel que soit le point de départ ψ, la suite des itérés (T n ψ) est de Cauchy.
Sa limite ψ∞ est alors un point fixe de T puisque :
Remarque. Dans la situation usuelle où f est de classe C 1 , le Théorème avait été prouvé par
Cauchy. Lipschitz a ensuite affiné les hypothèses sous lesquelles le résultat reste vrai, d’où l’asso-
ciation des deux noms.
y ′ = 2 xy
y(1) = α
La fonction f : (x, y) 7→ 2y/x est C 1 sur ]0, +∞[×R donc le Théorème de Cauchy-Lipschitz s’ap-
plique. On remarque que la fonction constante ϕ = 0 est solution de y ′ = 2y/x sur l’intervalle
]0, +∞[, donc est une solution maximale. Ceci implique deux choses :
y ′ = 2 xy
y(x0 ) = 0
on voit que la solution maximale ne peut être (par le même raisonnement) que la fonction
nulle, ce qui contredit α 6= 0.
or y(1) = α, donc la solution maximale au problème de Cauchy est (voir Figure 3.2)
]0, +∞[ → R
ϕ:
x 7→ αx2
Remarques :
– Ainsi le Théorème de Cauchy-Lipschitz nous assure non seulement de l’unicité de la solution
trouvée, mais permet également de “séparer les variables” x et y pour pouvoir résoudre explici-
tement l’équation.
– Quand on ne dispose pas de ce Théorème, tout se complique... On doit considérer précisément
les recollements possibles de solutions et l’étude est nettement plus fastidieuse. Voir par exemple
l’équation a priori équivalente :
xy ′ − 2y = 0.
y y = αx2
x
1
y ′ = a(x)y + b(x),
où a et b : I → R, I intervalle ouvert de R.
R →R
ϕ:
x 7→ αeax
Elles sont définies à une constante multiplicative près, α. Si on considère le problème de Cauchy
y ′ = ay
y(0) = y0
Pour que f soit localement lipschitzienne en y au point (x0 , y0 ), il suffit donc que a soit bornée
au voisinage de x0 . Moyennant une hypothèse (plus forte) de continuité sur a et b, on va même
pouvoir obtenir la forme explicite des solutions.
I →R
ϕ:
x 7→ αeA(x)
Preuve.
– Soit ϕ : I → R une solution de l’équation et considérons sur I la fonction auxiliaire c définie par
c(x) = ϕ(x)e−A(x) . Alors on vérifie sans problème que c′ (x) = 0 sur I, donc c = α est constante
sur I, c’est-à-dire : ϕ(x) = αeA(x) .
– Réciproquement, si ϕ(x) = αeA(x) sur I, alors ϕ′ (x) = a(x)ϕ(x) et ϕ est bien solution de
l’équation homogène.
Remarques :
– Pour retrouver le résultat, il suffit d’écrire :
h i′
y ′ − a(x)y = 0 ⇔ e−A(x) (y ′ − a(x)y) = 0 ⇔ ye−A(x) = 0 ⇔ ye−A(x) = α ⇔ y = αeA(x)
– L’ensemble des solutions forme donc un espace vectoriel réel de dimension 1, d’où le terme
d’équation linéaire.
Exemple. On cherche les solutions maximales de l’équation linéaire homogène y ′ = xy. On obtient
x2
les fonctions définies sur R (donc solutions maximales) ϕ(x) = αe 2 .
y ′ − a(x)y = b(x).
Proposition 17 (Résolution de l’équation avec second membre)
Si s : J → R est une solution de l’équation y ′ − a(x)y = b(x), avec a continue et J intervalle
ouvert contenu dans I, alors les solutions sur J de cette équation sont les fonctions
J →R
ϕ:
x 7→ s(x) + αeA(x)
Preuve.
– Soit ϕ : J → R une solution de l’équation et considérons sur J la fonction auxiliaire c définie
par c(x) = ϕ(x) − s(x). Alors on vérifie sans problème que c′ (x) − a(x)c(x) = 0 sur J, donc c
est de la forme c(x) = αeA(x) , ce qui donne bien ϕ(x) = s(x) + αeA(x) .
– Réciproquement, on vérifie que ϕ, définie sur J par ϕ(x) = s(x) + αeA(x) , est bien solution de
l’équation avec second membre.
Remarque. L’ensemble des solutions forme donc un espace affine réel de dimension 1.
Méthode de résolution. Pour résoudre une équation différentielle linéaire y ′ − a(x)y = b(x), la
recette est donc la suivante :
Le point délicat est souvent de trouver une solution particulière de l’équation avec second membre.
Quand b est elle aussi continue sur I (ce qui sera généralement le cas), on peut appliquer la mé-
thode de variation de la constante (due à Lagrange).
s(x) = α(x)eA(x) ,
c’est-à-dire qu’on fait “varier” la constante α. On détermine alors α(x) en écrivant que s(x) doit
vérifier l’équation avec second membre, soit :
et si b est continue, le membre de droite est continu et admet une primitive b(x)e−A(x) dx. On a
R
I → RR
s: x
x 7→ ( x0 b(t)e−A(t) dt) · eA(x)
est une solution particulière de l’équation différentielle y ′ − a(x)y = b(x), avec s(x0 ) = 0.
Ceci nous permet en particulier de résoudre le problème de Cauchy pour les équations différen-
tielles linéaires du premier ordre.
y(x0 ) = y0
est la fonction ϕ : I → R définie par :
Z x
A(x)−A(x0 ) −A(t)
ϕ(x) = y0 · e + b(t)e dt · eA(x)
x0
Remarque. Il n’est pas utile de retenir cette formule alambiquée : il faut par contre retenir la
méthode de variation de la constante et savoir la réécrire dans les cas particuliers.
Une solution particulière, obtenue pour λ = 0, est donc s(x) = xe−x . La solution générale de
l’équation initiale est donc
R →R
ϕ:
x 7→ (x + α)e−x
ay ′′ + by ′ + cy = 0.
Supposons, en faisant le parallèle avec les équations du premier ordre, que l’on cherche les solutions
de l’équation sous la forme :
ϕ(x) = erx .
La fonction ϕ devra donc vérifier aϕ′′ (x) + bϕ′ (x) + cϕ(x) = 0, c’est-à-dire :
∀x ∈ I (ar 2 + br + c)erx = 0.
Remarque. On voit que l’ensemble des solutions d’une équation homogène du deuxième ordre
est un espace vectoriel de dimension deux. Les deux constantes α1 et α2 seront fixées si on impose
deux conditions supplémentaires, par exemple en fixant les valeurs de la fonction et de sa dérivée
en x0 , ou encore les valeurs de la fonction en deux points x0 et x1 distincts...
on peut montrer que l’ensemble des solutions est un espace vectoriel de dimension n. Comme
précédemment, on obtient une base de l’espace des solutions à partir des racines du polynôme
caractéristique :
P (X) = X n − an−1 X n−1 − · · · − a1 X − a0 .
et le polynôme caractéristique de A, i.e. det(XIn − A), est tout simplement P (X). Supposons pour
simplifier que P admette n racines réelles distinctes λ1 , . . . , λn (c’est-à-dire que toutes les valeurs
propres de A sont réelles distinctes), alors on montre via une diagonalisation de A que les solutions
de l’équation différentielle sont les fonctions de la forme :
Ceci n’a rien d’étonnant puisqu’on peut voir ce type de suite comme la discrétisation d’une équation
différentielle linéaire homogène de degré p.
Remarque. Il n’est cependant pas simple en général de trouver une solution particulière de l’équa-
tion avec second membre. Dans le cas particulier où celui-ci est de la forme Q(x)eµx , on trouve
une telle solution sous la forme
R →R
s:
x 7→ R(x)eµx
où R est un polynôme dont on détermine les coefficients par identification et tel que :
1. degré de R = degré de Q, si µ n’est pas racine du polynôme caractéristique P ;
2. degré de R = degré de Q +1, si µ est racine simple du polynôme caractéristique P ;
3. degré de R = degré de Q +2, si µ est racine double du polynôme caractéristique P .
Notons que le second membre de la forme Q(x)eµx couvre en particulier les fonctions de type :
polynôme, exponentielle, fonction sinus ou cosinus, produit de ces fonctions... Notons enfin qu’il
existe une méthode de variation des constantes à l’ordre 2, mais de type usine à gaz, c’est pourquoi
nous n’en parlerons pas.
y ′ = f (x)g(y),
où f : I → R et g : J → R, I et J intervalles ouverts de R.
Exemple. L’équation y ′ = 2y/x étudiée précédemment est à variables séparées. Plus générale-
ment, toute équation linéaire homogène du premier ordre y ′ − a(x)y = 0 peut être vue comme une
équation à variables séparées. Ce n’est plus le cas dès que le second membre est non nul.
Formellement, le principe de résolution de ces équations est de “séparer les variables x et y”, ce qui
donne : y ′ /g(y) = f (x). En notant H une primitive de 1/g et F une primitive de f , on en déduit :
H(y) = F (x) + α. D’où, si H est inversible :
y = H −1 (F (x) + α).
Il suffit donc de s’assurer que, d’une, on peut diviser par g(y) et, de deux, que H admet une
fonction réciproque.
Preuve. ϕ est constante égale à c donc ϕ′ (x) = 0 ∀x ∈ I. Par ailleurs : f (x)g(ϕ(x)) = f (x)g(c) =
0 ∀x ∈ I.
On a ainsi plié le cas où g s’annule : la solution est alors une fonction constante. On peut mainte-
nant s’intéresser au cas où g ne s’annule pas.
On peut maintenant résoudre le problème de Cauchy associé à une équation à variables séparées.
3.5 Exercices
Exercice 3.1 (Trajectoire d’un projectile)
Un projectile est lancé du point 0 avec une vitesse V0 et un angle ϕ par rapport au sol (Figure
3.3). On note M (t) = (x(t), y(t)) ses coordonnées à l’instant t. Le Théorème Fondamental de la
Mécanique (somme des forces = masse par accélération) implique, si l’on néglige le frottement de
l’air et en notant g l’accélération de la pesanteur (g ≈ 9.8 m.s−2 ) :
′′
x (t) = 0
y ′′ (t) = −g
1. Intégrer les deux équations différentielles ci-dessus. On obtient ainsi une courbe paramétrée
t 7→ M (t) = (x(t), y(t)) pour la trajectoire.
2. Préciser l’intervalle de définition du temps.
3. On veut connaître la nature de la courbe obtenue : pour cela, éliminer t entre les équations
de x(t) et y(t) et exprimer y en fonction de x.
4. Quelle est la portée du lancer ? A vitesse initiale V0 fixée, pour quel angle initial ϕ cette
portée est-elle maximale ?
V0
(E) y′ = 1 + y2.
1. Pour quel(s) intervalle(s) I le couple (I, f ) est-il solution de (E) ? Solution(s) maximale(s) ?
2. À partir de fa (x) = f (x − a), montrer l’existence pour tout (x0 , y0 ) de R × R, d’une solution
passant par (x0 , y0 ).
(E) xy ′ − y = x2 .
2. L’analyse des restes d’un arbre mort lors d’une éruption volcanique fait apparaître qu’il ne
contient plus que 40% du Carbone 14 qu’il contenait avant l’éruption. De quand date l’érup-
tion si l’analyse a été effectuée en 2000 ? Une seconde analyse donne 42% : quelle différence
d’estimation cela donne-t-il ?
avec a > 0, b > 0, N (0) = N0 ∈]0, a/b[ sont des constantes supposées connues.
0 x
Qd = a1 + b1 P + c1 P ′ + d1 P ′′ , a1 > 0, b1 < 0, c1 ∈ R, d1 ∈ R,
Qo = a2 + b2 P + c2 P ′ + d2 P ′′ , a2 < 0, b2 > 0, c2 ∈ R, d2 ∈ R.
R →R
g:
t 7→ g(t) = f (et )
vérifie, pour tout réel t, l’équation différentielle (E2 ) : g′′ (t) − g′ (t) − 2g(t) = 0.
(b) Réciproquement, montrer que si g, de R dans R, vérifie l’équation (E2 ), alors la fonction
f , définie sur ]0, +∞[ par f (x) = g(ln x), vérifie (E1 ).
2. Donner l’ensemble des solutions de (E2 ).
3. En déduire l’ensemble des solutions de (E1 ).
4. Déterminer les solutions de (E1 ) admettant un prolongement continu en 0.
5. Résoudre (E1 ) pour x < 0 (on pourra utiliser cette fois la fonction auxiliaire g(t) = f (−et )).
6. En déduire les solutions de (E1 ) définies et deux fois dérivables sur tout R.
Corrigé
On considère, pour x > 0, l’équation différentielle :
(E1 ) x2 y ′′ − 2y = 0.
en posant x = et , ce qui est légitime car et > 0 pour tout t. Donc si f vérifie (E1 ) sur
]0, +∞[, alors g vérifie (E2 ) sur R.
(b) La réciproque est immédiate par ce même calcul. Ainsi la résolution de (E1 ) se ramène
exactement à celle de (E2 ).
2. (E2 ) est une équation différentielle linéaire homogène du deuxième ordre à coefficients constants.
Son intégration se fait simplement par l’intermédiaire du polynôme caractéristique associé,
dont les racines, réelles et distinctes, sont −1 et 2. On en déduit que les solutions maximales
de (E2 ) sont les fonctions, définies sur R, de la forme :
3. Pour obtenir l’ensemble des solutions de (E1 ), il suffit donc de remplacer la variable t par
ln x, ce qui donne pour x > 0 :
λ1
f (x) = + λ2 x 2 .
x
4. Pour qu’une solution de (E1 ) admette un prolongement continu en 0, il faut et il suffit que
λ1 = 0 dans la formule obtenue en 3). Les solutions continues sur le fermé [0, +∞[ sont donc
les fonctions de la forme f (x) = λx2 avec λ constante réelle.
5. Pour x < 0, en utilisant la fonction auxiliaire g(t) = f (−et ), on se ramène à la même
équation (E2 ) pour g, donc les solutions sont de la même forme que celles obtenus en 2). On
en déduit les solutions de (E1 ) sur ] − ∞, 0[ en remplaçant cette fois t par ln(−x), ce qui
donne néanmoins les mêmes solutions
α1
f (x) = − + α2 x2 ,
x
avec α1 et α2 constantes réelles.
6. Comme en 4), les solutions de (E1 ) continues sur le fermé ] − ∞, 0] sont les fonctions de
la forme f (x) = αx2 . Au total, on voit que pour obtenir une solution de (E1 ) deux fois
dérivable en recollant les solutions obtenues sur [0, +∞[ d’une part et ] − ∞, 0] d’autre part,
il faut que les dérivées secondes à droite et à gauche en 0 coïncident, soit avec les notations
précédentes : λ = α. Les solutions sur R de (E1 ) sont donc les fonctions définies par
f (x) = λx2 .
(E) y ′ = f (y/x).
Cette équation est dite homogène résolue. On pose z = y/x. Déterminer l’équation différen-
tielle vérifiée par z.
2. À l’aide de la question précédente, déterminer la forme générale des solutions de l’équation :
y y
y′ = 1 + ln .
x x
y(x0 ) = 0
D’après la question précédente, la fonction nulle est également solution de ce problème.
Or on est dans le cadre d’application du Théorème de Cauchy-Lipschitz (puisque la
fonction (x, y) 7→ f (x)g(y) est de classe C 1 sur R2 ) donc il ne peut y avoir qu’une
solution au problème : y est donc la fonction nulle. Au total, toute solution de l’équation
différente de la fonction nulle ne peut s’annuler : puisque ces solutions sont continues,
on en déduit en particulier qu’elle sont de signe constant sur leur domaine de définition.
2 0
1.8 −1
1.6 −2
1.4 −3
1.2 −4
1 −5
0.8 −6
0.6 −7
0.4 −8
0.2 −9
0 −10
−10 −5 0 5 10 −1.5 −1 −0.5 0 0.5 1 1.5
2x
Figure 3.5 – Solutions de y ′ = − 1+x 2
2 y pour les conditions initiales y(0) = 1 et y(0) = −1.
(c) On suppose donc y de signe constant et on résout l’équation en séparant les variables :
2x 2 y′ 2x 1
y′ = − 2
y ⇔ − 2
= 2
⇔ = ln(1 + x2 ) + λ,
1+x y 1+x y
Dλ → R
(
φ: 1
x 7→ ln(1+x 2 )+λ
y ′′ − 4y = 4e−2x .
Corrigé
1. On considère l’équation différentielle :
y ′′ − 4y = 4e−2x .
(a) C’est une équation différentielle linéaire du deuxième ordre à coefficients constants avec
second membre. La résolution de l’équation homogène via le polynôme caractéristique
donne :
y(x) = αe2x + βe−2x .
Recherche d’une solution particulière : le second membre est du type eµx , avec µ racine
du polynôme caractéristique, donc il convient de la chercher sous la forme :
s(x) = −xe−2x .
(b) Pour que limx→+∞ f (x) = 0, il faut que α = 0. La dérivée de f est alors :
(c) On a
f ′ (x) = e−2x (2x + 1),
donc f est décroissante pour x < 1/2, puis croissante. Ainsi, le minimum global vaut
f (−1/2) = −e/2. Par ailleurs :
lim = +∞
x→−∞
et :
lim = 0.
x→+∞
(a) Pour x > 0, |x| = x et on obtient une équation différentielle linéaire du premier ordre
avec second membre :
1
y′ + 1 − y = x.
x
La résolution de l’équation homogène donne :
y(x) = λxe−x .
12
10
−2
−1.5 −1 −0.5 0 0.5 1 1.5
10
−2
−4
−6
−8
−10
−10 −8 −6 −4 −2 0 2 4 6 8 10
Une solution particulière évidente de l’équation avec second membre est : s(x) = x.
La solution générale pour x > 0 est donc :
φ(x) = λxe−x + x.
ce qui se fait sans problème par deux intégrations par parties successives, et donne par
exemple :
µ(x) = (x2 + 2x + 2)e−x ,
x2 + 2x + 2
s(x) = .
x
La solution générale pour x < 0 est donc :
µ x x2 + 2x + 2
ψ(x) = e + .
x x
En 0, on a :
µ x µ
e ∼
x x
et :
x2 + 2x + 2 2
∼ ,
x x
donc pour que ψ admette une limite à gauche en 0, il faut que µ = −2, donc :
2 x2 + 2x + 2
ψ(x) = − ex + ,
x x
lim ψ ′ (x) = 0.
x→0−
φ(x) = λxe−x + x,
Corrigé
On voit qu’en x = 0, on a nécessairement y 2 = 0, c’est-à-dire que y = 0 pour toute solution
définie en 0. Pour pouvoir effectuer le changement de fonction, on suppose alors x > 0 ou x < 0.
On étudiera ensuite les éventuels recollements de solutions en 0. On note que, dans ce cas, une
solution y ne peut s’annuler (on obtiendrait x2 = 0, i.e. x = 0, ce qui est exclu).
Ainsi, la fonction u de la variable x, définie par u(x) = y(x)/x, ne peut s’annuler. On a respec-
tivement y = xu et y ′ = xu′ + u, ce qui transposé dans l’équation différentielle initiale donne la
nouvelle équation :
xuu′ + 2u2 + 1 = 0.
1. "A census taker once tried to test me. I ate his liver with some fava beans and a nice chianti.”
80 0
70 −2
−4
60
−6
50
−8
40
−10
30
−12
20
−14
10 −16
0 −18
−1 −0.8 −0.6 −0.4 −0.2 0 0 0.1 0.2 0.3 0.4 0.5
Il est naturel de changer à nouveau de fonction et de considérer Y = u2 (Y est encore une fonction
de x). L’équation précédente se traduit alors par :
1 ′
xY + 2Y + 1 = 0,
2
et puisque x est différent de 0, on se ramène à une équation linéaire d’ordre 1 :
4 2
Y′+ Y =− .
x x
La résolution de l’équation homogène donne : ϕ(x) = λx−4 .
Une solution particulière triviale de l’équation complète est la fonction constante : s(x) = −1/2.
D’où la solution générale de l’équation complète : Y (x) = λx−4 − 1/2.
Or par définition Y = u2 , donc Y > 0, donc nécessairement λ est strictement positif et en posant
α = (2λ)1/4 > 0, on a deux intervalles de définition possibles pour x : Dα+ =]0, α[ ou Dα− =] − α, 0[.
Intervalles sur lesquels :
1 α 4
Y (x) = −1 .
2 x
D’où l’on déduit : r
1 α 4
u(x) = ± √ − 1.
2 x
Et finalement, pour le problème initial, les solutions sont :
r
x α 4
y(x) = ± √ − 1,
2 x
[1] Rick Durrett. Elementary Probability for Applications. Cambridge University Press, 2009.
[2] Dominique Foata et Aimé Fuchs. Calcul des probabilités. Dunod, 1998.
[3] Pierre-André Cornillon et Eric Matzner-Lober. Régression avec R. Springer, Paris, 2010.
[4] Dominique Liret et François Martinais. Analyse 1ère année. Dunod, 2003.
[5] Dominique Liret et François Martinais. Analyse 2ème année. Dunod, 2004.
[6] Ernst Hairer et Gerhard Wanner. L’analyse au fil de l’histoire. Springer, 2000.
[7] Jean Jacod et Philip Protter. L’essentiel en théorie des probabilités. Cassini, 2003.
[8] Jean-Pierre Lecoutre et Philippe Pilibossian. Analyse II - Mathématiques pour les sciences
économiques. Dunod, 1998.
[9] Bernard Gostiaux. Cours de mathématiques spéciales. Tome 2 : topologie, analyse réelle. PUF,
1993.
[10] Bernard Gostiaux. Cours de mathématiques spéciales. Tome 3 : analyse fonctionnelle et calcul
différentiel. PUF, 1993.
[11] Geoffrey R. Grimmett and David R. Stirzaker. One Thousand Exercises in Probability. Oxford
University Press, New York, 2001.
[12] Geoffrey R. Grimmett and David R. Stirzaker. Probability and Random Processes. Oxford
University Press, New York, 2001.
[13] Jacques Harthong. Cours d’analyse mathématique. Format électronique, 2001.
[14] Jacques Harthong. Calcul des probabilités. Format électronique, 2001.
[15] François Laudenbach. Calcul différentiel et intégral. Editions de l’Ecole Polytechnique, 2000.
[16] Jim Pitman. Probability. Springer, 1999.
[17] Sheldon M. Ross. Initiation aux probabilités. Presses polytechniques et universitaires ro-
mandes, 1987.
181