Variables Multiples

Université Rennes 2
Licence MASS 2
Année 2013/2014
Second Semestre
Variables multiples
Arnaud Guyader
Table des matières
1 Fonctions de plusieurs variables 1

1.1 Exemples et définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Exemples d’applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2 Ensemble de définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.3 Changements de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Topologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.1 Rappels sur la norme euclidienne . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.2 Normes et distances associées dans Rn . . . . . . . . . . . . . . . . . . . . . 7
1.2.3 Ouvert, fermé, voisinage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.4 Limite, adhérence et ouverture . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3 Limite et continuité d’une fonction . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3.1 Limite d’une fonction en un point . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3.2 Continuité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.4 Dérivées partielles et fonctions de classe C 1 . . . . . . . . . . . . . . . . . . . . . . 18
1.5 Notion de différentielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.6 Accroissements Finis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.6.1 Cas des fonctions numériques . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.6.2 Cas général . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.7 Dérivées partielles d’ordre supérieur . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.8 Extrema libres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.8.1 Extrema locaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.8.2 Extrema globaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.9 Extrema liés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.9.1 Théorème des Fonctions Implicites . . . . . . . . . . . . . . . . . . . . . . . 34
1.9.2 Extrema liés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.10 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2 Intégrales multiples 83
2.1 Intégrales doubles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.1.1 Exemple introductif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.1.2 Théorème de Fubini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
2.1.3 Changement de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
2.1.4 Intégrales doubles généralisées . . . . . . . . . . . . . . . . . . . . . . . . . . 92
2.2 Intégrales triples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
2.2.1 Exemple introductif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
2.2.2 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
2.2.3 Changement de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
2.3 Couples aléatoires à densité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
2.3.1 Loi jointe, lois marginales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
i
ii Table des matières
2.3.2 Transfert, corrélation, indépendance . . . . . . . . . . . . . . . . . . . . . . 103

2.3.3 Changement de variables, convolution . . . . . . . . . . . . . . . . . . . . . 107
2.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
3 Equations différentielles 155

3.1 Le problème de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
3.1.1 Equations différentielles du premier ordre . . . . . . . . . . . . . . . . . . . 155
3.1.2 Solution maximale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
3.1.3 Le problème de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
3.2 Equations différentielles linéaires du premier ordre . . . . . . . . . . . . . . . . . . 161
3.2.1 Equation homogène . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
3.2.2 Equation avec second membre . . . . . . . . . . . . . . . . . . . . . . . . . . 162
3.3 Equations différentielles linéaires du deuxième ordre . . . . . . . . . . . . . . . . . 164
3.3.1 Equation homogène . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
3.3.2 Equation avec second membre . . . . . . . . . . . . . . . . . . . . . . . . . . 166
3.4 Equations différentielles à variables séparées . . . . . . . . . . . . . . . . . . . . . . 167
3.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
Arnaud Guyader - Rennes 2 Variables multiples

Chapitre 1
Fonctions de plusieurs variables
Introduction
On s’intéresse dans ce chapitre aux fonctions de plusieurs variables réelles de la forme
Rn → Rp

f:
x = (x1 , ..., xn ) 7→ y = (y1 , ..., yp )
où les yi = fi (x1 , ..., xn ) sont les p fonctions composantes de f .
On veut généraliser pour ce type de fonctions les notions et résultats étudiés pour les fonctions
réelles de la variable réelle vues en première année, à savoir : régularité (continuité, dérivabilité...),
existence d’extrema locaux ou globaux pour les fonctions à valeurs dans R, intégrabilité...
Pour cela, il sera nécessaire de préciser certains outils topologiques déjà plus ou moins abordés pour
l’étude des fonctions de R dans R : norme, distances associée, ouvert, fermé, notion de limite...
1.1 Exemples et définitions

1.1.1 Exemples d’applications
Applications constantes
Les applications les plus simples sont bien sûr les applications constantes qui à tout x associent la
même image c.
Rn → Rp

f:
x = (x1 , ..., xn ) 7→ c = (c1 , ..., cp )
Si n = 2 et p = 1, par exemple f (x, y) = 1 ∀(x, y) ∈ R2 , le graphique de la fonction, c’est-à-dire

l’ensemble
G = {(x, y, z = f (x, y)) : (x, y) ∈ R2 }
est le plan d’équation z = 1, parallèle au plan de base (Oxy) (Figure 1.1).
Applications linéaires
Soit une matrice A à p lignes et n colonnes et à coefficients réels (on note Mp,n (R) l’ensemble de
ces matrices). On peut lui associer l’application dite linéaire, ou endomorphisme, définie dans les
1
2 Chapitre 1. Fonctions de plusieurs variables
Figure 1.1 – Plan d’équation z = 1.
bases canoniques de Rn et Rp , qui à un vecteur 1 x = [x1 , ..., xn ]′ associe un vecteur y par

R → Rp
n
f:
x 7→ y = Ax
On étudie en général A à partir de ses propriétés spectrales (valeurs et sous-espaces propres). Les
applications linéaires sont essentielles en calcul différentiel puisque l’idée sous-jacente à la plupart
des grands théorèmes est de remplacer localement une fonction par la somme d’une constante (la
valeur de la fonction au point étudié) et d’une application linéaire (la différentielle de la fonction
en ce point).
Lorsque p = 1, i.e. A est un vecteur ligne, on parle de forme linéaire. Si par exemple n = 2 et
f (x, y) = 2x + y,
le graphe G, défini par l’équation z = 2x + y, est un plan passant par O et dont un vecteur normal
est (2, 1, −1) (Figure 1.2).
z
Figure 1.2 – Plan d’équation z = 2x + y.
Formes quadratiques
Soit A ∈ Sn (R) une matrice carrée symétrique. On appelle forme quadratique associée à A la
fonction numérique (c’est-à-dire à valeurs dans R) définie par
R →R
n
f:
x 7→ y = x′ Ax = 1≤i,j≤n ai,j xi xj
P
1. on note en général les vecteurs en colonnes, le signe ′ signifiant la transposition.

1.1. Exemples et définitions 3
0
2
1 2
1
0
0
−1
−1
−2 −2
Figure 1.3 – Paraboloïde de révolution.
A est diagonalisable, en tant que matrice symétrique réelle, et on classe en général les formes
quadratiques suivant le signe des valeurs propres de A : si elles sont toutes strictement positives
(respectivement négatives), on dit que f est une forme quadratique définie positive (respectivement
négative). On rencontre par exemple ces applications dans l’étude des extrema d’une fonction ou
dans la classification des coniques et des quadriques.
Si n = 2, l’exemple le plus simple est obtenu pour A égale à la matrice identité, d’où :
f (x, y) = x2 + y 2 ,
Le graphe G, défini par l’équation z = x2 + y 2 , est un paraboloïde de révolution de sommet O et

d’axe (Oz). Voir Figure 1.3 : ce sont les fameuses antennes paraboliques.
1.1.2 Ensemble de définition

Tout comme pour une fonction de R dans R, il faut commencer l’étude d’une fonction de plusieurs
variables par la spécification de son ensemble de définition. Le fait que f soit définie par plusieurs
composantes fi ne pose aucune difficulté conceptuelle : il suffit de regarder pour quelles valeurs de
x toutes les fonctions fi sont définies, ce qui donne :
p
\
Df = Dfi ,
i=1
où les Dfi sont les ensembles de définition des fi .
1.1.3 Changements de variables

Comme pour l’étude des fonctions de R dans R, les changements de variables sont utiles pour le
calcul de limite d’une fonction en un point, les calculs d’intégrales multiples (formule de changement
de variable) ainsi que pour la résolution d’équations aux dérivées partielles. Ils sont basés sur une
application bijective et dérivable. On ne mentionne ici que les plus classiques.
Variables multiples Arnaud Guyader - Rennes 2

Coordonnées polaires
Ce changement correspond à celui déjà rencontré au lycée pour les nombres complexes (Figure
1.4) : passage de la décomposition (module/argument) à la décomposition (partie réelle/partie
imaginaire).
{(0, 0)} ∪ R∗+ × [0, 2π[→ R2

ϕ:
(ρ, θ) 7→ (x, y) = (ρ cos θ, ρ sin θ)
Ceci définit exactement une bijection de l’ensemble de départ sur R2 tout entier. Pour le calcul
d’intégrales doubles, on se restreint généralement à des ensembles plus petits mais ouverts sur
lesquels ϕ définit exactement un C 1 -difféomorphisme (cf. chapitre 2).
M
y
Figure 1.4 – Coordonnées polaires (ρ, θ).
→ −
− →
Si M a pour coordonnées (x, y) dans un repère orthonormé (O, i , j ), ρ et θ correspondent respec-
p → −−→
−
tivement à la distance au centre (c’est-à-dire ρ = x2 + y 2 ) et à une mesure de l’angle ( i , OM ).
Notons enfin que ce changement intervient souvent lorsque f (x, y) p ne dépend que de la distance
au centre, c’est-à-dire qu’elle peut s’écrire comme une fonction de x2 + y 2 . On dit dans ce cas
que f est radiale et son expression en polaire ne fera intervenir que la variable ρ. Graphiquement,
si f : R2 → R est radiale, le graphe de f est la surface
(Σ) = {(x, y, z = f (x, y)), (x, y) ∈ R2 }
et celle-ci est invariante par toute rotation d’axe (Oz) (cf. par exemple le paraboloïde vu précé-
demment).
Coordonnées cylindriques
−
→ − → − →
Soit M = (x, y, z) dans un repère orthonormé (O, i , j , k ) et PM = (x, y, 0) son projeté ortho-
gonal sur le plan de base (Oxy). Les coordonnées cylindriques de M sont définies à partir des
coordonnées polaires de PM dans le plan (Oxy) (Figure 1.5) :
{(0, 0, 0)} ∪ R∗+ × [0, 2π[×R → R3

ϕ:
(ρ, θ, z) 7→ (x, y, z) = (ρ cos θ, ρ sin θ, z)

1.2. Topologie 5
y
θ ρ
x
PM
Figure 1.5 – Coordonnées cylindriques (ρ, θ, z).
Coordonnées sphériques
Soit M = (x, y, z) dans un repère orthonormé. Les coordonnées sphériques de M sont définies à
partir de la distance r de M à l’origine O, de l’angle θ comme en cylindriques et de l’angle φ entre
→ −−→
−
les vecteurs k et OM (Figure 1.6) :
R+ × {π} × {0} ∪ R∗+ × [0, π[×[0, 2π[→ R3

ϕ:
(r, φ, θ) 7→ (x, y, z) = (r cos θ sin φ, r sin θ sin φ, r cos φ)
M
φ
r
y
θ
x
Figure 1.6 – Coordonnées sphériques (r, φ, θ).
1.2 Topologie
1.2.1 Rappels sur la norme euclidienne
La distance usuelle entre 2 points de R2 ou R3 vue dans les petites classes est ce qu’on appelle
la distance euclidienne. On définit également ainsi la longueur d’un vecteur u, encore appelée la
norme euclidienne de ce vecteur et notée kuk : si u a pour composantes u1 et u2 dans un repère
−
→ −→
orthonormé (O, i , j ), alors le Théorème de Pythagore donne (Figure 1.7) :
q
kuk = u21 + u22 .
Cette norme est associée au produit scalaire défini pour 2 vecteurs u = [u1 , u2 ]′ et v = [v1 , v2 ]′
par :
u · v = u ′ v = u 1 v1 + u 2 v2 ,

et on a la relation : √
kuk = u · u.
M
u2
O
u1
p
Figure 1.7 – Norme euclidienne kuk = u21 + u22 .
De même, en dimension 3, le produit scalaire et la norme euclidienne sont définis dans un repère
orthonormé par :
′

u·v =u √v = u1p v1 + u2 v2 + u3 v3
kuk = u u = u21 + u22 + u23
′
On généralise ceci sans problème en dimension n :

u · v = u′ v = u1 v1 + ... + un vn = ni=1 ui vi
P
√ 1
kuk = u′ u = u21 + ... + u2n = ( ni=1 u2i ) 2
p P
L’inégalité classique en dimension 2 et 3 entre produit scalaire et produit des normes (à savoir que
le produit scalaire entre deux vecteurs est inférieur ou égal au produit des normes) se généralise
en dimension n :
Théorème 1 (Inégalité de Cauchy-Schwarz)

Pour tous vecteurs u = [u1 , ..., un ] et v = [v1 , ..., vn ]′ , on a :
n n
!1 n
!1
X X 2 X 2
u i vi ≤ u2i × vi2 ,
i=1 i=1 i=1
c’est-à-dire que |u′ v| ≤ kuk × kvk, avec égalité si et seulement si u et v sont colinéaires.
Preuve. Pour tout réel t, le vecteur (tu + v) est de norme positive (comme somme de carrés), et
même strictement positive sauf si toutes ses composantes sont nulles, c’est-à-dire s’il existe t0 tel
que t0 u + v = 0, auquel cas les deux vecteurs sont colinéaires.
Sinon, on a donc pour tout réel t :
0 <Pktu + vk2
0 < Pni=1 (tui + vi )2 P
< ( ni=1 u2i )t2 + 2( ni=1 ui vi )t + ( ni=1 vi2 )
P
0
0 < at2 + 2bt + c
et le trinôme at2 + 2bt + c ne peut être strictement positif pour tout réel t que si son discriminant
est strictement négatif, i.e. si b2 < ac, ce qui est exactement l’inégalité de Cauchy-Schwarz.

1.2. Topologie 7
Remarque. On retrouve cette inégalité (très utile) sous diverses formes en analyse, en fait dès
qu’on définit une norme à partir d’un produit scalaire. Par exemple, sous des hypothèses implicites :
– Intégrales :
Z Z 1 Z 1
2 2
2 2
f (t)g(t)dt ≤ f (t)dt g (t)dt .
– Séries :
+∞ +∞
! 12 +∞
! 21
X X X
ui vi ≤ u2i vi2 .
i=1 i=1 i=1
On peut remarquer que la norme euclidienne ainsi définie possède trois propriétés caractéristiques :
(i) Positivité et Séparation : la norme d’un vecteur est toujours positive (au sens large) et ne
vaut 0 que pour le vecteur nul.
(ii) Homogénéité : la norme d’un vecteur multiplié par un scalaire est égale à la valeur absolue
du scalaire par la norme de ce vecteur.
(iii) : la norme de la somme de deux vecteurs est inférieure ou égale à la somme des normes des
deux vecteurs.
La dernière découle de l’Inégalité de Cauchy-Schwarz et signifie simplement que la somme des
longueurs de 2 côtés d’un triangle est supérieure à la longueur du troisième (cf. Figure 1.8), ce qui
est encore dire que le plus court chemin d’un point à un autre est la ligne droite.
1.2.2 Normes et distances associées dans Rn

De façon générale, on part des trois propriétés ci-dessus pour définir une norme dans Rn , c’est-à-
dire grosso modo une façon de mesurer la taille d’un vecteur.
Définition 1 (Norme)
On appelle norme dans Rn toute application k.k : Rn → R+ vérifiant les 3 propriétés :
(i) Positivité et Séparation : ∀u ∈ Rn , kuk ≥ 0 et kuk = 0 ⇔ u = 0.
(ii) Homogénéité : ∀u ∈ Rn , ∀λ ∈ R, kλuk = |λ| × kuk.
(iii) Inégalité triangulaire : ∀u, v ∈ Rn , ku + vk ≤ kuk + kvk.
u+v v
Figure 1.8 – Inégalité triangulaire : ku + vk ≤ kuk + kvk.
Exemples :
(a) La norme de la somme ou norme 1 : kuk1 = ni=1 |ui | (norme du taxi new-yorkais).
P
(b) La norme du sup ou norme infinie : kuk∞ = supni=1 |ui | (norme du roi aux échecs).
1
(c) Plus généralement, on définit la norme p, pour p ≥ 1, comme suit : kukp = ( ni=1 |ui |p ) p .
P
On retrouve la norme de la somme pour p = 1, la norme infinie quand p → +∞, et la norme

euclidienne pour p = 2.
On a ainsi défini plusieurs façons de “mesurer” un vecteur dans Rn . Néanmoins, ces différentes
mesures ne sont pas en contradiction les unes envers les autres, puisqu’on vérifie aisément que :
∀u ∈ Rn kuk∞ ≤ kuk2 ≤ kuk1 ≤ nkuk∞ .
On dit que ces normes sont équivalentes. Plus précisément :
Définition 2 (Normes équivalentes)

Deux normes k.k et k.k′ sur Rn sont dites équivalentes s’il existe des constantes α et β strictement
positives telles que :
∀u ∈ Rn αkuk ≤ kuk′ ≤ βkuk.
De façon générale, on peut montrer que, sur Rn , toutes les normes sont équivalentes. Ceci est dû
au fait que c’est un espace vectoriel de dimension finie sur R. L’exercice intitulé “Normes non
équivalentes sur C([0, 1], R)” montre que ça n’est plus vrai en dimension infinie.
Théorème 2 (Equivalence des normes en dimension finie)

Sur Rn , toutes les normes sont équivalentes.
Preuve. Il suffit de montrer que toute norme k.k est équivalente à la norme infinie k.k∞ , c’est-à-dire
prouver qu’il existe deux constantes α et β strictement positives telles que :
∀u ∈ Rn αkuk∞ ≤ kuk ≤ βkuk∞ .
L’inégalité de droite est facile : notons (ei )1≤i≤n les vecteurs de la base canonique et β = 1≤i≤n kei k.
P
Alors pour tout u, on a :
 
X X X
kuk = ui · ei ≤ |ui | · kei k ≤  kei k sup |ui | = βkuk∞ .
1≤i≤n 1≤i≤n 1≤i≤n 1≤i≤n
L’inégalité de gauche est plus subtile, elle utilise en particulier le Théorème de Bolzano-Weierstrass
vu en première année (hum hum...) : de toute suite réelle bornée (xN ) on peut extraire une sous-
suite (xϕ(N ) ) convergente dans R (où ϕ : N → N est une application strictement croissante).
Supposons qu’il n’existe pas de constante α > 0 telle que pour tout vecteur u de Rn , on ait
αkuk∞ ≤ kuk.
Ceci implique en particulier qu’on peut trouver une suite de vecteurs (uN ) telle que :
1
∀N ≥ 0 kuN k∞ = 1 et kuN k ≤ .
N
Considérons les suites composantes de uN = (u1N , . . . , unN ) : elles sont toutes bornées, comprises
entre −1 et 1. En particulier, il existe une sous-suite (u1ϕ1 (N ) ) de (u1N ) qui converge vers l1 . La
suite (u2ϕ1 (N ) ) est elle-même bornée donc admet une sous-suite (u2ϕ1 ◦ϕ2 (N ) ) convergente vers l2 .
De proche en proche on construit une sous-suite (uϕ(N ) ) = (u1ϕ(N ) , . . . , unϕ(N ) ) de la suite initiale,
avec :
ϕ = ϕ1 ◦ ϕ2 ◦ · · · ◦ ϕn ,

1.2. Topologie 9
et de limite l = (l1 , . . . , ln ), c’est-à-dire que pour tout i ∈ {1, . . . , n} :
uiϕ(N ) −−−−−→ li
N →+∞
On a alors par l’inégalité triangulaire :
1
klk ≤ kuϕ(N ) − lk + kuϕ(N ) k ≤ βkuϕ(N ) − lk∞ + ,
ϕ(N )
pour tout N . Mais par hypothèse :
lim kuϕ(N ) − lk∞ = lim max 1 ≤ i ≤ n|uiϕ(N ) − li | = 0,

N →∞ N →∞
et puisque
1
−−−−−→ 0,
ϕ(N ) N →+∞
on a l = (0, . . . , 0). Par ailleurs, pour tout N :
kuϕ(N ) k∞ = sup |uiϕ(N ) | = 1,

1≤i≤n
d’où en passant à la limite :

sup |li | = 1,
1≤i≤n
ce qui contredit l = 0 et montre que l’hypothèse de départ était absurde.

L’implication pratique de ce résultat est la suivante : si une suite de vecteurs (un ) est telle que
kun k → 0 pour une norme donnée k.k, elle tend vers zéro pour toute autre norme k.k′ . On dit alors
que (un ) tend vers le vecteur nul (cf. infra).
On généralise ici le lien entre norme sur un espace vectoriel et distance sur l’espace affine associé.
Définition 3 (Distance associée à une norme)

Soit k.k une norme sur Rn . On appelle distance d associée à la norme k.k l’application
R2 × R2 → R+

d:
(u, v) 7→ d(u, v) = kv − uk
−→
Rappelons le cas classique vu au collège (Figure 1.9) : soit A(xA , yA ) défini par OA = u et
−−→
B(xB , yB ) défini par OB = v. Alors par définition de la distance associée à la norme euclidienne,
on a :
−−→ −→ −−→ p
d2 (u, v) = kv − uk2 = kOB − OAk2 = kABk2 = (xb − xa )2 + (yb − ya )2 .
On retrouve la distance euclidienne (i.e. usuelle) entre les points A et B.
Remarque. Une distance récupère donc naturellement les propriétés de la norme associée : posi-
tivité/séparation, homogénéité et inégalité triangulaire.

yb B
v
v−u
ya A
O u
xa xb
Figure 1.9 – Norme euclidienne et distance associée : d2 (A, B) = kv − uk2 .
1.2.3 Ouvert, fermé, voisinage

On généralise ici en dimension n les notions d’intervalles ouvert et fermé centrés en un point.
Définition 4 (Boule ouverte, boule fermée, voisinage)

Soit k.k une norme sur Rn , d la distance associée, A ∈ Rn et r > 0. On appelle (voir Figure
1.10) :
(i) Boule ouverte de centre A et de rayon r l’ensemble B̊(A, r) = {M ∈ Rn |d(A, M ) < r}.
(ii) Boule fermée de centre A et de rayon r l’ensemble B(A, r) = {M ∈ Rn |d(A, M ) ≤ r}.
(iii) Voisinage de A tout ensemble V de Rn tel qu’il existe r > 0 : B̊(A, r) ⊆ V.
A A A
r r V
Figure 1.10 – Boule ouverte, boule fermée, voisinage.
Exemples.
(a) Pour n = 2, on a représenté Figure 1.11 les boules ouvertes de centre O et de rayon 1 pour les
normes de la somme, euclidienne et infinie. Ainsi, en dimension 2, obtient-on respectivement des
carrés remplis, des disques et des carrés remplis pour les boules associées à ces trois normes. En
dimension 3, on obtiendrait respectivement des octaèdres réguliers remplis, des sphères remplies
(ou boules, d’où le nom générique) et des cubes remplis.
(b) L’équivalence mentionnée précédemment entre ces trois normes est traduite par la suite d’in-
clusions des boules Figure 1.12.
Remarques :
– On dira qu’une fonction f : Df ⊆ Rn → R est définie au voisinage d’un point A si Df est
un voisinage de A. De façon générale, on dira qu’une propriété est locale si elle est définie au
voisinage d’un point (extremum local...).
– L’équivalence des normes sur Rn assure que si un ensemble V est un voisinage de A pour une
certaine norme, il le sera pour toute autre norme.

1.2. Topologie 11
1 1 1
Figure 1.11 – Boules unités pour les normes k.k1 , k.k2 et k.k∞ .
1/2
Figure 1.12 – Equivalence des normes : B̊∞ (0, 21 ) ⊆ B̊1 (0, 1) ⊆ B̊2 (0, 1) ⊆ B̊∞ (0, 1).

Définition 5 (Ouvert, fermé)

(i) Un ensemble O de Rn est dit ouvert s’il est voisinage de chacun de ses points.
(ii) Un ensemble F de Rn est dit fermé si son complémentaire Rn − F est ouvert.
On peut donner quelques résultats simples sur les ouverts et les fermés.
Propriétés 1
– Rn et ∅ sont à la fois ouverts et fermés.
– Une boule ouverte est un ouvert, une boule fermée est un fermé.
– Une union quelconque d’ouverts est un ouvert, une intersection finie d’ouverts est un ouvert.
– Une union finie de fermés est un fermé, une intersection quelconque de fermés est un fermé.
Preuve.
– Rn est clairement ouvert par définition d’un ouvert donc ∅ est fermé. D’autre part, ∅ est ouvert
puisqu’on ne peut trouver d’élément x dans ∅ contredisant la définition d’un ensemble ouvert
(et pour cause, il n’y a pas d’élément), donc Rn est fermé.
– Soit M0 ∈ B̊(A, r) et
r − d(A, M0 )
ρ= ,
2
alors on montre que la boule ouverte B̊(M0 , ρ) est contenue B̊(A, r). Soit en effet M ∈ B̊(M0 , ρ),
alors par l’inégalité triangulaire :
d(A, M ) ≤ d(A, M0 ) + d(M0 , M ) = r − 2ρ + d(M0 , M ) < r − 2ρ + ρ = r − ρ < r,
donc M ∈ B̊(A, r). Ainsi B̊(A, r) est voisinage de chacun de ses points, donc ouverte.
Pour B(A, r), on raisonne de façon comparable pour montrer que son complémentaire, c’est-à-
dire l’ensemble Rn \ B(A, r), est ouvert : soit M0 dans ce complémentaire, alors, en notant
d(A, M0 ) − r
ρ= > 0,
2
on montre que B̊(M0 , ρ) est contenue dans ce complémentaire.
– Soit (Ui )i∈I une famille d’ouverts et [
A∈ Ui .
i∈I
Il existe donc i0 ∈ I tel que A ∈ Ui0 . Or Ui0 est ouvert donc il existe r > 0 tel que
[
B̊(A, r) ⊆ Ui0 ⊆ Ui ,
i∈I
et par suite ∪i∈I Ui est ouvert.

Soit maintenant (Ui )1≤i≤m une famille finie d’ouverts et
\
A∈ Ui .
1≤i≤m
Pour tout i ∈ {1, . . . , m}, il existe ri > 0 tel que

B̊(A, ri ) ⊆ Ui ,
donc en notant r = min1≤i≤m ri > 0, on a :
\
B̊(A, r) ⊆ Ui ,
1≤i≤m
et ∩1≤i≤m Ui est ouvert.

1.2. Topologie 13
– Les résultats pour les fermés s’obtiennent en passant aux complémentaires.

Remarque. Un ensemble peut être ni ouvert, ni fermé. Penser par exemple, dans R, à l’intervalle
[0, 1[.
N.B. Considérons par exemple R2 muni de la norme euclidienne : l’intersection infinie des disques
ouverts centrés en O est :
+∞
\ 1
B̊(O, ) = {O} = B(O, 0),
n
k=1
c’est-à-dire un fermé (voir aussi l’exercice “Adhérence, ouverture”).
1.2.4 Limite, adhérence et ouverture

L’intérêt de définir une norme sur un espace vectoriel est de ramener l’étude de la convergence
d’une suite de vecteurs à l’étude, plus familière, de la limite d’une suite dans R. Dans ce qui suit,
Rn est muni d’une norme quelconque.
Définition 6 (Limite d’une suite)

Soit (uN ) une suite de Rn . On dit que (uN ) tend vers L si limN →+∞ kuN − Lk = 0.
u0
L
u1
uN
Figure 1.13 – Suite convergente.
Si on se ramène à la définition de la convergence d’une suite réelle vue en première année, ceci
signifie :
∀ε > 0, ∃N0 > 0, ∀N ≥ N0 kuN − Lk < ε.
Via l’équivalence des normes, l’existence et la limite éventuelle d’une suite sont indépendantes de
la norme choisie.
Propriétés 2 (Limite d’une suite)

– On a l’équivalence suivante :
uN = (u1N , ..., unN ) −−−−→ L = (L1 , ..., Ln ) ⇐⇒ ∀i ∈ {1, . . . , n}, uiN −−−−→ Li .
N →∞ N →∞
– Si (uN ) admet une limite, elle est unique.
Preuve. Le premier point est clair en considérant la norme du sup. Pour le second, cette propriété
est connue dans R : puisque le premier point a permis de ramener l’étude d’une suite en dimension
n à l’étude de n suites réelles, elle passe à Rn .


N
Exemple. La suite (uN ) définie par uN = (ln NN+1 , 53N +2
+1
) tend vers (0, 0) puisque ses deux suites
composantes tendent vers 0.
Définition 7 (Intérieur, adhérence, frontière)

Soit A un ensemble de Rn .
(i) L’intérieur, ou l’ouverture, de A, noté Å, est le plus grand ouvert contenu dans A.
(ii) L’adhérence, ou la fermeture, de A, notée A, est le plus petit fermé contenant A.
(iii) La frontière de A, notée ∂A, est ∂A = A − Å.
Ces notions sont importantes lorsqu’on veut étudier le comportement d’une fonction “au bord” de
son domaine de définition, pour des problèmes de prolongement, d’étude d’extrema...
Exemple. Dans R2 , soit A le triangle rempli de sommets O, I et J, avec les deux côtés [OI] et
[OJ], mais sans [IJ]. Alors l’intérieur de A est le triangle rempli sans les 3 côtés, l’adhérence de
A est le triangle rempli avec les 3 côtés et la frontière de A correspond aux 3 côtés du triangle (cf.
Figure 1.14).
J J J J
∂A
A Å A
I I I I
Figure 1.14 – L’ensemble A, son ouverture Å, son adhérence A et sa frontière ∂A.
Proposition 1
Soit A un ensemble de Rn et M un point de Rn .
(i) M est dans l’ouverture de A ssi A est un voisinage de M .
(ii) M est adhérent à A ssi il existe une suite (MN ) de points de A qui converge vers M .
(iii) M est dans la frontière de A ssi il existe une suite (MN ) de points de A qui converge vers M
et une suite (MN′ ) de points de Rn − A qui converge vers M .
Preuve.
(i) si M est dans l’ouverture de A, alors Å, ouvert, est un voisinage de M , et a fortiori A qui le
contient.
Réciproquement, si A est un voisinage de M , alors il existe r > 0 tel que B̊(M, r) ⊆ A, i.e. M est
dans un ouvert contenu dans A : Å étant le plus grand d’entre eux, M appartient bien à Å.
(ii) si M est adhérent à A, supposons qu’il n’existe pas de suite (MN ) ⊆ A telle que lim MN = M .
Ceci signifie qu’il existe r > 0 tel que B̊(M, r) ∩ A = ∅. Mais alors A ∩ (Rn \ B̊(M, r)) est un
fermé contenant A et strictement contenu dans A, ce qui contredit la définition de A.
Réciproquement, supposons qu’il existe (MN ) ⊆ A de limite M . Supposons qu’il existe un fermé
F contenant A et ne contenant pas M : alors M ∈ Rn \ F, qui est ouvert, donc il existe r > 0 tel
que B̊(M, r) ⊆ Rn \ F, ce qui contredit lim Mn = M avec (MN ) ⊆ A ⊆ F.
(iii) découle de (i) et (ii).


1.3. Limite et continuité d’une fonction 15
On retiendra donc la caractérisation suivante des fermés :

Corollaire 1 (Caractérisation d’un fermé)
Un ensemble A est fermé si et seulement si tout suite convergente de points de A converge dans
l’ensemble A.
1.3 Limite et continuité d’une fonction

1.3.1 Limite d’une fonction en un point
On suppose Rn et Rp munis chacun d’une norme que l’on note indifféremment k.k.
Définition 8 (Limite d’une fonction en un point)

Soit f : A ⊆ Rn → Rp et a ∈ A. On dit que f tend vers L lorsque x tend vers a si :
lim kf (x) − Lk = 0,
x→a
c’est-à-dire si :
∀ε > 0, ∃δ > 0, kx − ak < δ ⇒ kf (x) − Lk < ε.
Il n’y a donc aucune différence par rapport à la situation connue pour une fonction de R dans R,
si ce n’est qu’on a remplacé les valeurs absolues 2 par des normes dans l’espace de départ Rn et
dans l’espace d’arrivée Rp .
Remarques :
– Comme pour l’étude des suites, si f a plusieurs composantes (i.e. p > 1), on peut se ramener à
p études de limites de fonctions à valeurs réelles (mais dépendant de n variables).
– On rappelle que a ∈ A signifie qu’on peut s’approcher du point a en restant dans l’ensemble A
(où f est bien définie). L’existence d’une limite assure que, quelle que soit la façon dont x se
rapproche de a, f (x) se rapproche de L.
On retrouve alors les mêmes propriétés que pour les limites des fonctions réelles de la variable réelle.
Propriétés 3 (Propriétés opératoires classiques)

– Unicité : Si elle existe, la limite est unique.
– Bornitude : Si f admet une limite en a, alors f est bornée au voisinage de a.
– Somme : Si f et g tendent respectivement vers L et L′ , alors f + g tend vers L + L′ .
– Produit : Si α et f tendent respectivement vers α0 ∈ R et L ∈ Rp , alors αf tend vers α0 L.
– Composition : Si f (x) tend vers L quand x tend vers a et si g(y) tend vers L′ quand y tend vers
L, alors (g ◦ f )(x) tend vers L′ quand x tend vers a.
Remarque. Dire que f est bornée au voisinage de a signifie que :
∃M > 0, ∃r > 0, kx − ak < r ⇒ kf (x)k ≤ M.
C’est encore dire que toutes ses applications composantes sont bornées au voisinage de a.
Preuve. Ce sont exactement les mêmes que dans le cas des fonctions numériques d’une seule
variable en remplaçant les valeurs absolues par des normes.
2. la valeur absolue est la norme naturelle sur R.
– Supposons deux limites distinctes L et L′ . Soit alors
kL − L′ k
ε= .
2
Il existe δ > 0 et δ′ > 0 tels que :
kx − ak < δ ⇒ kf (x) − Lk < ε et kx − ak < δ′ ⇒ kf (x) − L′ k < ε.
Donc en supposant kx − ak < min(δ, δ′ ), on aboutit à :
kL − L′ k ≤ kf (x) − Lk + kf (x) − L′ k < 2ε = kL − L′ k,
ce qui est absurde. Donc L = L′ .

– Une conséquence de l’inégalité triangulaire est que :
∀(x, y) ∈ Rn × Rn − kx − yk ≤ kxk − kyk ≤ kx − yk.
La seconde propriété découle alors directement de la définition de la limite en un point, avec

r = δ et M = L + ε.
– On utilise à nouveau l’inégalité triangulaire :
k(f + g)(x) − (L + L′ )k ≤ kf (x) − Lk + kg(x) − L′ k < 2ε.
– On utilise le fait que f est bornée par M au voisinage de a, donc :
k(αf )(x) − (α0 L)k ≤ k(α(x) − α0 )f (x)k + kα0 (f (x) − L)k ≤ M |α(x) − α0 | + |α0 | · kf (x) − Lk.
D’où, en posant ε′ = (M + |α0 |), on tire :
k(αf )(x) − (α0 L)k < (M + |α0 |)ε = ε′ .
– Soit ε > 0, alors il existe δ > 0 tel que :
ky − Lk < δ ⇒ kg(y) − L′ k < ε.
Pour ce δ > 0, il existe δ′ > 0 tel que :
kx − ak < δ′ ⇒ kf (x) − Lk < δ ⇒ k(g ◦ f )(x) − L′ k < ε.

Exercice. En utilisant par exemple un changement en coordonnées polaires, montrer que f (x, y) =
x ln(x2 + y 2 ) admet une limite au point O (voir Figure 3.5).
Proposition 2 (Caractérisation de la limite par les suites)

Soit f : A ⊆ Rn → Rp , a ∈ A avec limx→a f (x) = L. Alors pour toute suite (xN ) de points de A
convergeant vers a, la suite (f (xN )) converge vers L.
Preuve. Soit (xN ) suite de A convergeant vers a, alors :
∀δ > 0, ∃N0 > 0, ∀N ≥ N0 kxN − ak < δ.
D’où l’on déduit par existence de la limite L de f en a :
∀δ > 0, ∃N0 > 0, ∀N ≥ N0 kf (xN ) − Lk < ε.

1.3. Limite et continuité d’une fonction 17
−1
−2
−3
−4
−5
2
1 2
1
0
0
−1 −1
−2 −2
Figure 1.15 – Fonction f (x, y) = x ln(x2 + y 2 ).
Remarque. Comme dans le cas d’une seule variable 3 , cette caractérisation de la limite par les
suites sert souvent en pratique à montrer qu’une fonction n’admet pas de limite en un point : il
suffit d’exhiber deux suites tendant vers ce point dont la limite est différente par f . C’est-à-dire
qu’on utilise cette proposition sous sa forme contraposée.
Exemple. On définit f en dehors de l’origine par f (x, y) = x2xy +y 2

. En comparant lim f (xN , yN )
1 1 1
respectivement pour (xN , yN ) = ( N , 0) et (xN , yN ) = ( N , N ), montrer que f n’admet pas de limite
en O.
1.3.2 Continuité
Définition 9 (Continuité en un point, continuité sur un ensemble)
Soit f : A ⊆ Rn → Rp et a ∈ A. On dit que f est continue en a si limx→a f (x) = f (a). On dit
que f est continue sur A si f est continue en tout point de A.
Toutes les fonctions usuelles (polynômes, fonctions trigonométriques...) sont continues sur leur
domaine de définition. Puisque la plupart des fonctions que l’on rencontrera seront construites à
partir de ces fonctions usuelles, il suffira d’invoquer les “propriétés opératoires classiques” ci-dessous
pour justifier la continuité de la fonction étudiée.
Propriétés 4 (Propriétés opératoires classiques)

– La somme de fonctions continues est continue.
– Le produit d’une fonction continue par une fonction numérique continue est continu.
– La composée de fonctions continues est continue.
On définit maintenant une notion propre aux fonctions de plusieurs variables : les applications
partielles. Leur intérêt n’est pas tant dans l’étude de la continuité que dans celui de la dérivabilité
1
3. penser par exemple à x 7→ sin x
qui n’admet pas de limite en 0.

(cf. section suivante).
Soit U un ouvert de Rn , f : U → Rp , et a = (a1 , ..., an ) ∈ U . Puisque U est ouvert, il existe r > 0

tel que f soit définie sur
Yn
B̊∞ (M0 , r) = ]aj − r; aj + r[.
j=1
Définition 10 (Applications partielles)

On appelle applications partielles de f en a les n applications d’une seule variable fxj définies
respectivement au voisinage de ai par :
]aj − r, aj + r[ → Rp

f xj :
xj 7→ f (a1 , ..., aj−1 , xj , aj+1 , ..., an )
Proposition 3
Si f est continue en a = (a1 , ..., an ), alors ses n applications partielles sont continues respectivement
en aj .
Preuve. On écrit la définition de la continuité en a pour la norme k.k∞ :
∀ε > 0, ∃δ > 0, kx − ak∞ < δ ⇒ kf (x) − f (a)k < ε.
Quitte à remplacer δ par min(δ, r), et en notant que fxj (aj ) = f (a), on en déduit
∀ε > 0, ∃δ > 0, |xj − aj | < δ ⇒ kfxj (xj ) − fxj (aj )k < ε.

N.B. La réciproque est fausse. Pour s’en convaincre, il suffit de reprendre la fonction f (x, y) =
xy
x2 +y 2 du paragraphe précédent en posant f (0, 0) = 0 ; au point O, les applications partielles fx (x)
et fy (y) sont toutes deux identiquement nulles, donc continues, or f ne l’est pas.
1.4 Dérivées partielles et fonctions de classe C 1

On reprend les notations introduites pour définir les applications partielles.
Définition 11 (Dérivées partielles)

∂f
On appelle dérivées partielles de f en a et on note ∂xj (a) les dérivées, si elles existent, des appli-
cations partielles fxj en aj , soit :
∂f f (a1 , ..., aj−1 , aj + h, aj+1 , ..., an ) − f (a1 , ..., an )

(a) = lim
∂xj h→0 h
Principe calculatoire : En pratique, pour calculer la dérivée partielle de f (x, y) par rapport à
x, on considère y comme une constante et on dérive par rapport à x, et vice versa pour la dérivée
partielle par rapport à y. Il n’y a donc en général aucune difficulté supplémentaire par rapport
au calcul de dérivée classique vu au lycée. Et, comme d’habitude, les seuls cas où l’on devra re-
venir à la définition de la dérivée partielle comme une limite de taux de variation seront ceux où

1.4. Dérivées partielles et fonctions de classe C 1 19
f n’est pas définie partout par une même formule : cf. l’exercice “Application différentiable non C 1 ”.
Exemple. Soit f définie de R2 dans R par f (x, y) = x3 y 2 . Ses dérivées partielles au point (x, y)
sont ∂f 2 2 ∂f 3
∂x (x, y) = 3x y et ∂y (x, y) = 2x y. Ces dérivées partielles sont donc elles-mêmes des fonc-
tions de deux variables.
N.B. La fonction f peut admettre des dérivées partielles en un point sans être continue en ce point.
Reprendre le sempiternel contre-exemple f (x, y) = x2xy
+y 2
: au point O, on a fx (x) = 0 et fy (y) = 0.
Ces deux applications partielles sont constantes donc dérivables et les dérivées partielles ∂f
∂x (0, 0)
∂f
et ∂y (0, 0) au point O sont égales à 0. Pourtant f n’est pas continue en O. Pour obtenir un lien
entre régularité de f et de ses applications partielles, on a besoin d’une hypothèse supplémentaire.
Définition 12 (Fonctions de classe C 1 )

Soit f : U → Rp . On dit que f est de classe C 1 , ou continûment différentiable, sur U si ses dérivées
partielles sont définies et continues sur U .
Exemple. La fonction f , définie par f (x, y) = x3 y 2 , est clairement de classe C 1 sur R2 .
Si f est C 1 , on peut en particulier introduire la matrice jacobienne de cette application en un point,

équivalent en dimensions (p, n) du nombre dérivé 4 en dimensions (1, 1).
Définition 13 (Matrice jacobienne)

Soit f : U → Rp de classe C 1 et a ∈ U , U ouvert de Rn . On appelle matrice jacobienne de f en
∂fi
a la matrice Jf (a) de taille (p, n) définie par Jf (a)(i, j) = ∂x j
(a). Si p = n, le jacobien de f en a
est le déterminant de cette matrice jacobienne.
 ∂f1 ∂f1 
∂x1 (a) ... ∂xn (a)
.. .. ..
Jf (a) =  . . .
 

∂fp ∂fp
∂x1 (a) . . . ∂xn (a)
On verra l’importance de ce déterminant jacobien pour la formule de changement de variables dans

les intégrales multiples. En dimension 2 par exemple, pour les fonctions radiales, un changement
en polaires permettra souvent de simplifier le calcul : on peut dès à présent calculer le jacobien de
cette application.
Exemple : Changement en polaires

Soit ϕ la fonction associée au changement en coordonnées polaires
R+ × [0, 2π[ → R2
∗
ϕ:
(ρ, θ) 7→ (x = ρ cos θ, y = ρ sin θ)
La matrice jacobienne de ϕ est :

" #
∂x ∂x
∂ρ ∂θ cos θ −ρ sin θ
Jϕ (ρ, θ) = ∂y ∂y =
∂ρ ∂θ
sin θ ρ cos θ
et son jacobien vaut det Jϕ (ρ, θ) = ρ > 0 et indépendant de l’angle θ.
4. ou coefficient directeur de la tangente en un point.

Cas particulier : Le gradient

Lorsque f : Rn → R est numérique et de classe C 1 , on parle plutôt de vecteur gradient que de
matrice jacobienne pour le vecteur ligne

∂f ∂f
∇f (a) = Jf (a) = (a) . . . (a) .
∂x1 ∂xn
Ce vecteur intervient souvent dans les problèmes d’optimisation (algorithme du gradient) pour
la raison suivante : soit par exemple f : R2 → R, on appelle ligne de niveau k de f l’ensemble
des points du plan (Oxy) tels que f (x, y) = k (cf. par exemple exercice “Fonctions d’utilité et de
production”). On peut alors montrer que le gradient de f au point (x0 , y0 ) est orthogonal à la
courbe de niveau f (x0 , y0 ) de f et orienté vers les valeurs croissantes de f . Voir Figure 1.16.
∇f (a) a
f (x, y) = k1
f (x, y) = k
f (x, y) = k0
Figure 1.16 – Gradient de f au point a et courbes de niveau k0 < k < k1 .
Tout comme dans le cas des fonctions d’une seule variable de classe C 1 , on est alors assuré de l’exis-
tence d’un développement limité de la fonction au voisinage d’un point (ou formule de Taylor-Young
à l’ordre 1).
Théorème 3 (Développement limité à l’ordre 1)

Soit f : U ⊆ Rn → Rp de classe C 1 sur l’ouvert U et a ∈ U . Alors il existe un voisinage V de 0 et
une fonction ε : V → Rp continue et avec ε(0) = 0 tels que pour tout h ∈ V :
f (a + h) = f (a) + Jf (a)h + khkε(h).
Preuve. On montre le résultat pour n = 2. Par continuité de la dérivée partielle par rapport à y
en a, on peut écrire :
∂f ∂f
∀ε > 0, ∃δ > 0, khk < δ ⇒ k (a + h) − (a)k < ε
∂y ∂y
On applique l’Inégalité des Accroissements Finis à la fonction
[0, 1] → Rp
(
ϕ:
t 7→ f (a1 + h1 , a2 + th2 ) − f (a1 + h1 , a2 ) − th2 ∂f
∂y (a1 + h1 , a2 )

1.4. Dérivées partielles et fonctions de classe C 1 21
d’où il vient :
∂f
kf (a1 + h1 , a2 + h2 ) − f (a1 + h1 , a2 ) − h2 (a1 + h1 , a2 )k ≤ 2εh2 ,
∂y
donc le membre de gauche est un o(|h1 | + |h2 |). D’autre part :
∂f
kf (a1 + h1 , a2 ) − f (a1 , a2 ) − h1 (a)k = o(|h1 |),
∂x
par définition de la dérivée partielle. Enfin :
∂f ∂f
kh2 (a1 + h1 , a2 ) − h2 (a)k = o(|h1 | + |h2 |)
∂y ∂y
En sommant les trois termes, on en déduit que :
∂f ∂f
kf (a + h) − f (a) − h1 (a) − h2 (a)k = o(khk) = khkε(h).
∂x ∂y

Remarques :
– Cette écriture est bien la généralisation du développement limité vu en première année pour
f : R → R de classe C 1 :
f (a + h) = f (a) + f ′ (a)h + hε(h),
avec Jf (a) et khk à la place de f ′ (a) et h.
– Ce développement limité permet de remplacer localement toute fonction suffisamment régulière
par la somme d’une constante et d’une application linéaire, c’est-à-dire par une fonction bien
plus simple à étudier. C’est en fait l’idée force du calcul différentiel.
Interprétation géométrique : Le plan tangent

Soit f : R2 → R de classe C 1 . f définit une surface (Σ) dans l’espace de dimension 3. Soit
M0 (x0 , y0 , z0 = f (x0 , y0 )) un point de cette surface. M0 et les deux vecteurs de dérivées direction-
nelles
0
   
1
u0 =  0  v0 =  1 
∂f ∂f
∂x (x0 , y0 ) ∂y (x0 , y0 )
définissent le plan tangent à la surface (Σ) au point M0 , c’est-à-dire intuitivement le plan le plus
proche de la surface (Σ) au voisinage de M0 . Par exemple, pour
p
f (x, y) = 1 − x2 − y 2 ,
on obtient la demi-sphère unité supérieure, à laquelle appartient le point M0 = (0, 0, 1). Le calcul
de dérivées partielles donne ∂f ∂f ′ ′
∂x (0, 0) = ∂y (0, 0) = 0, donc u0 = [1, 0, 0] et v0 = [0, 1, 0] : le plan
tangent à la demi-sphère en M0 est le plan d’équation z = 1.
Application : Calcul de valeur approchée

On considère la fonction f (x, y) = xy = exp(y ln x) au voisinage du point (1, 2). Elle a pour dérivées
partielles : (
∂f y y
∂x = x x
∂f y
∂y = x ln x
donc sa matrice jacobienne en ce point, ou encore son gradient puisque f est à valeurs dans R, est

∂f ∂f
Jf (1, 2) = ∇f (1, 2) = (1, 2), (1, 2) = [2, 0],
∂x ∂y

1.2
0.8
0.6
0.4
0.2
0
1
0.5 1
0.5
0
0
−0.5
−0.5
−1 −1
Figure 1.17 – Plan tangent à la demi-sphère au point M0 = (0, 0, 1).
et l’approximation au premier ordre de f est donnée par :
f (1 + h, 2 + k) ≈ f (1, 2) + Jf (1, 2)[h, k]′ = 1 + 2h.
On obtient par exemple pour (h, k) = (0.02, −0.01) la valeur 1.04, proche de 1.021.99 = 1.04019....
Une autre application courante en sciences expérimentales est le calcul d’erreur sur un résultat
lorsque les données utilisées sont soumises à des incertitudes.
Corollaire 2
Si f : U ⊆ Rn → Rp est de classe C 1 sur U , alors f est continue sur U .
Preuve. Il suffit d’écrire le développement à l’ordre 1 :
f (a + h) − f (a) = Jf (a)h + khkε(h),
or le membre de droite tend vers zéro quand h tend vers zéro, donc f (a + h) tend vers f (a).

On a ainsi établi que si les dérivées partielles de f sont définies ET continues au voisinage d’un
point, alors la continuité de f est assurée en ce point.
Proposition 4 (Dérivation en chaîne)

Soit f : U ⊆ Rn → Rm et g : V ⊆ Rm → Rp toutes deux de classe C 1 , avec f (U ) ⊆ V, alors g ◦ f
est de classe C 1 sur U et ses dérivées partielles sont données par la règle de dérivation en chaîne :
m
∂(g ◦ f )i X ∂gi ∂fl
(a) = (f (a)) · (a),
∂xj ∂yl ∂xj
l=1
c’est-à-dire matriciellement :
Jg◦f (a) = Jg (f (a)) Jf (a).

1.5. Notion de différentielle 23
Preuve. Notons k(h) = f (a + h) − f (a). Il suffit alors d’écrire les deux développements limités et
de les composer :
g(f (a) + k(h)) = (g ◦ f )(a) + Jg (f (a))k(h) + o(kk(h)k)

k(h) = Jf (a)h + o(khk)
La seconde formule montre que le rapport kk(h)k/khk reste borné au voisinage de h = 0. D’où
l’on déduit que o(kk(h)k)/khk tend vers zéro quand h tend vers zéro. Donc le reste du premier
développement est un o(khk). Enfin le terme Jg (f (a))o(khk) est encore un o(khk). On a donc :
(g ◦ f )(a + h) = (g ◦ f )(a) + Jg (f (a)) Jf (a)h + o(khk),
ce qui prouve que g ◦ f admet des dérivées partielles en tout point a et admet pour matrice
jacobienne :
Jg◦f (a) = Jg (f (a)) Jf (a).
Dire que f et g sont C 1 est encore dire les coefficients de leurs matrices jacobiennes sont des
fonctions continues, mais alors il en va de même pour la matrice produit et g ◦ f est C 1 .

Remarques :
– Cette formule sur les matrices jacobiennes n’est rien d’autre que la généralisation de celle bien
connue en dimension 1 : (g ◦ f )′ (a) = g′ (f (a)) f ′ (a).
– La dérivation en chaîne s’écrit encore de façon condensée, en notant (xj ), (yl ) et (zi ) les va-
riables/composantes :
m
∂zi X ∂zi ∂yl
= ·
∂xj ∂yl ∂xj
l=1
1.5 Notion de différentielle

On voudrait généraliser en dimensions supérieures la notion de fonction dérivable en un point
connue pour les fonctions d’une seule variable. On a vu que l’existence des dérivées partielles en
un point n’est pas suffisante puisqu’elle n’assure même pas la continuité en ce point. Par ailleurs,
la condition C 1 pour f : R → R est plus forte que la simple dérivabilité en un point.
Une façon de définir la dérivabilité de f : R → R en un point a se fait par l’existence d’un

développement limité à l’ordre 1 : on dit que f est dérivable en a s’il existe une constante f ′ (a) et
une fonction ε définie sur un voisinage de a et de limite 0 en 0 telles que :
f (a + h) = f (a) + f ′ (a)h + hε(h).
f ′ (a) est alors appelé nombre dérivé de f en a et l’application h 7→ f ′ (a)h est une application
linéaire, appelée application linéaire tangente en a. On va définir de la même manière la différen-
tiabilité d’une fonction de plusieurs variables.
Définition 14 (Différentiabilité en un point)

Soit f : U ⊆ Rn → Rp et a ∈ U . On dit que f est différentiable en a s’il existe une matrice J et
une fonction ε définie sur un voisinage de O, de limite 0 en O telles que :
f (a + h) = f (a) + Jh + khkε(h).
L’application linéaire h 7→ Jh est appelée différentielle de f en a.

On peut alors établir un lien entre cette matrice J et la matrice jacobienne Jf (a) précédemment
définie.
Théorème 4
Soit f : U ⊆ Rn → Rp et a ∈ U . Si f est différentiable en a, alors f est continue en a. De plus,
elle admet des dérivées partielles en ce point et la différentielle de f en a est donnée par la matrice
jacobienne de f , i.e. J = Jf (a).
Réciproquement, la différentiabilité de f en un point peut se voir à partir de l’étude des dérivées

partielles autour de ce point.
Proposition 5
Soit f : U ⊆ Rn → Rp et a ∈ U . Si les dérivées partielles ∂x ∂fi
j
sont définies au voisinage de a
et continues en a, alors f est différentiable en a et la différentielle de f en a est donnée par la
matrice jacobienne de f .
Remarques :
– En particulier, une fonction de classe C 1 sur U est différentiable en tout point de U . De plus, la
différentielle
U → Mp,n (R)

Jf :
a 7→ Jf (a)
est continue. C’est pourquoi on dit aussi d’une fonction de classe C 1 qu’elle est continûment
différentiable.
– En pratique, on vérifiera directement sur les fonctions étudiées que les dérivées partielles sont
définies et continues sur tout leur domaine de définition pour conclure à la continue différentia-
bilité (sans passer par le développement limité).
L’intérêt de la différentielle en un point comme application linéaire dans le développement limité

à l’ordre 1 apparaît dès que la notion de dérivées partielles n’est plus naturelle, voire lorsqu’on
ne peut plus les définir. Supposons f : E → F où (E, k.k) et (F, k.k) sont deux espaces vectoriels
normés sur R (de dimensions quelconques). On dit que f est différentiable en a s’il existe une
application linéaire continue 5

E →F
Df (a) :
h 7→ Df (a)h
et une application ε définie au voisinage de O, de limite 0 en O telles que
f (a + h) = f (a) + Df (a)h + khkε(h).
L’application linéaire continue Df (a) est appelée différentielle de f en a.
Remarque. Dans la suite, on supposera souvent les fonctions de classe C 1 même si la différentia-
bilité suffit. L’exercice “Application différentiable non C 1 ” montre que les deux notions ne sont pas
équivalentes.
5. en dimension finie, toute application linéaire est continue, c’est pourquoi cette condition n’apparaît pas dans
la définition vue précédemment.

1.6. Accroissements Finis 25
1.6 Accroissements Finis

1.6.1 Cas des fonctions numériques
Rappelons le résultat vu en première année : soit f : [a, b] → R continue sur [a, b], dérivable sur
]a, b[, alors il existe c ∈]a, b[ tel que :
f (b) − f (a) = f ′ (c)(b − a).
Ce résultat, appelé Théorème des Accroissements Finis, se montre en général par le Théorème de
Rolle et admet l’interprétation géométrique suivante (voir Figure 1.18) : il existe un point entre
A et B où la tangente à la courbe a même pente que la droite (AB). On va montrer que ce résul-
tat se généralise sans problème aux fonctions numériques de plusieurs variables, i.e. f : Rn → Rp .
f (b)
f (a)
a c b
Figure 1.18 – Théorème des accroissements finis.
Théorème 5 (Théorème des Accroissements Finis)

Soit U un ouvert de Rn et f : U → R de classe C 1 sur U . Soit a et b dans U tels que le segment
[a, b] soit contenu dans U . Alors il existe un point c du segment ouvert ]a, b[ tel que :
n
X ∂f
f (b) − f (a) = ∇f (c)(b − a) = (c)(bj − aj ).
∂xj
j=1
Preuve. Il suffit de se ramener au cas connu. Soit la fonction
[0, 1] → R

ϕ:
t 7→ f (a + t(b − a))
ϕ est continue et dérivable sur [0, 1], donc il existe t0 ∈]0, 1[ tel que
ϕ(1) − ϕ(0) = (1 − 0)ϕ′ (t0 ).
Or ϕ(1) = b, ϕ(0) = a, et par la règle de dérivation en chaîne :

n
′
X ∂f
ϕ (t) = (a + t(b − a))(bj − aj ).
∂xj
j=1
Le résultat suit en posant c = a + to (b − a).


L’une des conséquences de ce Théorème était : si la fonction f : I → R, où I est un intervalle de

R, est de dérivée identiquement nulle, alors f est constante sur I. La nécessité de se placer sur un
intervalle, et non par exemple sur une union d’intervalles, vient de ce que : si a et b appartiennent
à I, alors tout le segment [a, b] est contenu dans I. La généralisation de ceci à Rn est la notion de
convexité.
Définition 15 (Ensemble convexe)

On dit qu’un ensemble U de Rn est convexe si :
∀a, b ∈ U [a, b] ⊆ U .
a a
b
b
Figure 1.19 – Un ensemble convexe et un ensemble non convexe.
Corollaire 3 (Fonctions constantes)

Soit U un ouvert convexe de Rn et f : U → R de classe C 1 sur U . Si la matrice jacobienne de f
est nulle en tout point de U , alors f est constante sur U .
Preuve. Soit deux points a et b dans U : il existe c ∈]a, b[ tel que
f (b) − f (a) = Jf (c)(b − a).
Or Jf (c) = 0 par hypothèse, donc f (b) = f (a).

Remarques.
– La réciproque est claire : si f est constante, alors f est différentiable, de dérivées partielles nulles
en tout point.
– Au vu de la preuve, ce résultat est encore vrai sous des hypothèses moins restrictives que la
convexité de U , par exemple si l’on suppose simplement que 2 points quelconques de U peuvent
toujours être joints par une ligne brisée (i.e. si U est connexe par arcs).
1.6.2 Cas général

Si on s’intéresse aux fonctions f : Rn → Rp à valeurs vectorielles, le Théorème des Accroissements
Finis ne passera pas tel quel : penser à
[0, 1] → R2

ϕ:
t 7→ (cos(2πt), sin(2πt))
clairement de classe C 1 , avec ϕ(0) = ϕ(1), mais telle que :
∀t ∈ [0, 1] ϕ′ (t) 6= 0.

1.7. Dérivées partielles d’ordre supérieur 27
Néanmoins, l’Inégalité des Accroissements Finis, qui avait été vue comme une conséquence du
Théorème, va elle passer en dimension supérieure. On peut la rappeler brièvement : soit f : [a, b] →
R continue sur [a, b], dérivable sur ]a, b[, telle que ∀c ∈]a, b[, |f ′ (c)| ≤ M , alors :
|f (b) − f (a)| ≤ M (b − a).
Une interprétation très simple : si un automobiliste roule pendant une demi-heure en ne dépassant
jamais la vitesse de 50 km/h, alors au total il ne se sera pas éloigné de plus de 25 kilomètres de son
point de départ. On donne ici une version de ce résultat pour les fonctions de plusieurs variables.
Théorème 6 (Inégalité des Accroissements Finis)

Soit U un ouvert convexe de Rn et f : U → Rp différentiable sur U telle que ∀c ∈ U , | ∂x
∂fi
j
(c)| ≤ M ,
alors :
∀(a, b) ∈ U 2 kf (b) − f (a)k∞ ≤ M kb − ak1 .
Preuve. Il suffit de considérer les p fonctions numériques fi et d’appliquer à chacune le Théorème

des Accroissements Finis ci-dessus. On en déduit p points (ci )1≤i≤p tels que :
n
X ∂fi
fi (b) − fi (a) = (ci )(bj − aj ),
∂xj
j=1
d’où l’on déduit que pour tout i :

n
X
|fi (b) − fi (a)| ≤ M |bj − aj | = M kb − ak1 .
j=1
Ce qui donne bien :
kf (b) − f (a)k∞ = sup |fi (b) − fi (a)| ≤ M kb − ak1 .

1≤i≤p

1.7 Dérivées partielles d’ordre supérieur

Soit U un ouvert de Rn et f : U → R une fonction numérique de classe C 1 (on suppose f numérique
∂f
uniquement afin d’alléger les notations). Chaque dérivée partielle ∂x j
est elle-même une fonction
des n variables x1 ,...,xn , donc susceptible d’avoir à son tour des dérivées partielles.
Définition 16 (Dérivées partielles secondes)

Soit U un ouvert de Rn et f : U → R de classe C 1 . Si toutes les dérivées partielles ∂f
∂xj sont de
classe C 1 , on dit que f est de classe C 2 .
On retrouve naturellement pour les fonctions de classe C 2 les propriétés opératoires classiques :
stabilité par la somme, le produit et la composition.
∂2f ∂f ∂2f
Notation et exemple. On note ∂xi ∂xj la dérivée partielle par rapport à xi de ∂xj , et ∂x2j
la
∂f
dérivée partielle par rapport à xj de ∂x j
. Soit par exemple f (x, y) = x3 y 2 . Ses deux dérivées
partielles d’ordre 1 sont (
∂f
∂x = 3x2 y 2
∂f
∂y = 2x3 y

Ses quatre dérivées partielles d’ordre deux sont :

∂2f
( 2 (
∂ f
∂x 2 = 6xy 2 ∂x∂y = 6x2 y
2
∂ f 2 ∂2f
∂y∂x = 6x y ∂y 2
= 2x3
∂2f ∂2f
On note sur cet exemple que ∂y∂x = ∂x∂y . Ceci est en fait une propriété générale.
Théorème 7 (Théorème de Schwarz)

Soit U un ouvert de Rn et f : U → R de classe C 2 , alors
∂2f ∂2f
∀(i, j) ∈ {1, ..., n} = .
∂xi ∂xj ∂xj ∂xi
Preuve. On suppose n = 2 et on se place au point O : puisque U est ouvert, il existe r > 0 tel
que B̊∞ (O, r) ⊆ U . On définit alors la fonction φ sur B̊∞ (O, r) par :
1
φ(h, k) = (f (h, k) − f (h, 0) − f (0, k) + f (0, 0)).
hk
On va montrer que φ admet une limite en (0, 0) et que celle-ci peut s’exprimer de deux façons. On
applique le Théorème des Accroissements Finis entre 0 et h ; il existe θ ∈]0, 1[ tel que :
1 ∂f ∂f
φ(h, k) = ( (θh, k) − (θh, 0)).
k ∂x ∂x
On réapplique le Théorème des Accroissements Finis, cette fois entre 0 et k ; il existe θ ′ ∈]0, 1[ tel
que :
∂2f
φ(h, k) = (θh, θ ′ k).
∂y∂x
2
∂ f ∂ f 2
Puisque ∂y∂x est continue, on en déduit que φ admet une limite en (0, 0), égale à ∂y∂x (0, 0).
Si on reprend ce raisonnement en intervertissant l’ordre des variables, on montre de la même façon
que :
∂2f
lim φ(h, k) = (0, 0),
(h,k)→(0,0) ∂x∂y
d’où l’égalité des dérivées secondes croisées.

Remarque. Ceci signifie qu’on n’a pas à se soucier de l’ordre dans lequel on opère pour le calcul
des dérivées partielles secondes croisées. On dit qu’il y a commutativité des opérateurs de dériva-
tion partielle.
Soit f : (x, y) 7→ f (x, y) de classe C 2 . Si les trois dérivées partielles secondes de f sont elles-mêmes
de classe C 1 , on dit que f est de classe C 3 ; il y a alors, par le Théorème de Schwarz, quatre dérivées
partielles d’ordre 3. De proche en proche, on définit ainsi les fonctions de classe C k . Une fonction
sera alors de classe C ∞ si elle est de classe C k pour tout k.
Application : Formules de Taylor

L’un des intérêts des fonctions f : R → R de classe C k est d’admettre en tout point un dévelop-
pement limité à l’ordre k, soit par exemple en 0 :
f ′′ (0) 2 f (k) (0) k

f (h) = f (0) + f ′ (0)h + h + ... + h + hk ε(h),
2! k!

1.8. Extrema libres 29
c’est-à-dire qu’on peut approcher f par un polynôme de degré k au voisinage de 0. L’exemple le

plus classique est celui de la fonction exponentielle dont le développement limité en 0 est tout
simplement :
h2 hk
eh = 1 + h + + ... + + hk ε(h).
2! k!
Ce développement limité est aussi appelé formule de Taylor-Young à l’ordre k. On a déjà vu le
développement à l’ordre 1 pour les fonctions de classe C 1 . Afin de ne pas alourdir les énoncés, on
ne donne ici que le développement à l’ordre 2 pour une fonction de 2 variables (la généralisation à
n variables et à l’ordre k pose uniquement des problèmes de notations).
Théorème 8 (Développement limité à l’ordre 2)

Soit U un ouvert de R2 , f : U → R de classe C 2 et a dans U . Alors il existe un voisinage V de 0
et une fonction ε : V → R continue et avec ε(0) = 0 tels que pour tout h ∈ V :
∂f ∂f 1 ∂2f ∂2f ∂2f

f (a + h) = f (a) + (a)h1 + (a)h2 + ( 2 (a)h21 + 2 (a)h1 h2 + 2 (a)h22 ) + khk2 ε(h).
∂x ∂y 2! ∂x ∂x∂y ∂y
Exemple. Soit f (x, y) = ex+y , de classe C 2 sur R2 . On obtient le développement à l’ordre 2 en

(0, 0) :
1 2
eh1 +h2 ≈ 1 + h1 + h2 + (h + 2h1 h2 + h22 ).
2! 1
Application : Calcul de valeur approchée
On reprend l’exemple de la fonction f (x, y) = xy = exp(y ln x) au voisinage du point (1, 2).
L’approximation au deuxième ordre de f est donnée par :
f (1 + h, 2 + k) ≈ 1 + 2h + h2 + hk.
On obtient, à nouveau pour (h, k) = (0.02, −0.01), la valeur 1.0402, très proche de 1.021.99 =
1.04019....
1.8 Extrema libres

On considère une fonction numérique f : U ⊆ Rn → R. On s’intéresse aux extrema de f . Il
importe de différencier extremum local, qui fait intervenir l’étude des dérivées de f en un point,
d’extremum global, qui fait intervenir le comportement global de f sur U . Dans un cas comme
dans l’autre, les résultats obtenus sont tout à fait comparables à ceux connus pour les fonctions
d’une seule variable.
Rn est muni d’une norme quelconque notée k.k.
Définition 17
Soit U un ouvert de Rn , f : U → R et a ∈ U . On dit que f admet un minimum local en a s’il
existe r > 0 tel que :
∀x ∈ U , kx − ak < r ⇒ f (a) ≤ f (x).
Soit U ⊆ Rn , f : U → R et a ∈ U . On dit que f admet un minimum global en a si :
∀x ∈ U : f (a) ≤ f (x).

1.8.1 Extrema locaux

Rappel. Soit f : U ⊆ R → R de classe C 1 . f admet en tout point a un développement d’ordre 1 :
f (a + h) = f (a) + f ′ (a)h + hε(h).
Puisque limh→0 ε(h) = 0, on voit que pour h voisin de 0, si f ′ (a) 6= 0 :
f (a + h) − f (a) ∼ f ′ (a)h,
or f ′ (a)h change de signe quand h change de signe : f (a + h) − f (a) ne pourra pas être de signe
constant au voisinage de 0. On en déduit une condition nécessaire pour que f admette un extre-
mum local en a : il faut f ′ (a) = 0. On retrouve une condition équivalente pour le gradient d’une
fonction de plusieurs variables.
Définition 18 (Point critique)

Soit U un ouvert de Rn , f : U → R de classe C 1 et a ∈ U . On dit que a est un point critique, ou
singulier, ou stationnaire, de f si toutes les dérivées partielles de f sont nulles en a, c’est-à-dire
si son gradient de f est nul en a.
Proposition 6 (Condition nécessaire d’extrémalité locale)

Soit U un ouvert de Rn , f : U → R de classe C 1 . Si f admet un extremum local en a ∈ U , alors a
est un point critique de f .
Preuve. Soit r > 0 tel que B̊(a, r) ⊆ U . Pour tout h de norme euclidienne égale à r, on définit la
fonction ϕ de classe C 1 sur ] − 1, 1[ par ϕ(t) = f (a + th). Si f admet un extremum en a, alors ϕ
admet un extremum de même nature en 0 et en particulier sa dérivée s’annule en ce point, or :
ϕ′ (t) = ∇f (a + th)h,
donc :
ϕ′ (0) = ∇f (a)h = 0 ∀h ∈ B̊(0, r).
Si on suppose ∇f (a) 6= 0, alors en choisissant :
∇f (a)
h = ±r ,
k∇f (a)k
on obtient ϕ′ (0) = ±r : contradiction.

Remarques.
– Notons que dans tout ce qui précède, on n’est pas obligé de supposer f de classe C 1 pour une
telle définition : la différentiabilité suffit.
– Tout comme la dérivée de f : x 7→ x3 s’annule en 0 sans que f admette un extremum en ce
point, la fonction f : (x, y) 7→ x3 + y 3 admet (0, 0) pour point critique sans que f n’admette
d’extremum local en ce point : il suffit pour s’en convaincre d’étudier le signe de f autour de ce
point suivant les signes de x et y. Ceci montre en particulier que la condition énoncée ci-avant
n’est pas suffisante : comme pour les fonctions de R dans R, il suffit en général de pousser le
développement à l’ordre 2 pour pouvoir conclure.

1.5
0.5
−0.5
−1
−1.5
−2
1
0.5 1
0.5
0
0
−0.5
−0.5
−1 −1
Figure 1.20 – Graphe de la fonction f (x, y) = x3 + y 3 .
Rappel. Soit f : U ⊆ R → R de classe C 2 . f admet en tout a un développement à l’ordre 2 :
f ′′ (a) 2
f (a + h) = f (a) + f ′ (a)h + h + h2 ε(h).
2
Pour que f admette en a un extremum local, il faut f ′ (a) = 0, ce qui donne :
f ′′ (a) 2
f (a + h) = f (a) + h + h2 ε(h).
2
On voit que, pour h voisin de 0, f (a + h) − f (a) a le signe de f ′′ (a). On en déduit une condition
suffisante d’extrémalité locale : il suffit que f ′′ (a) 6= 0. Plus précisément :
– Si f ′′ (a) > 0, f admet en a un minimum local ;
– Si f ′′ (a) < 0, f admet en a un maximum local ;
– Si f ′′ (a) = 0, on ne peut rien dire a priori.
On montre le même type de résultat pour les fonctions de plusieurs variables ; on se restreint dans
la suite aux fonctions de deux variables.
Théorème 9 (Notations de Monge et Condition suffisante d’extrémalité locale)

Soit U un ouvert de R2 , f : U → R de classe C 2 et a ∈ U un point critique de f , ∂f ∂f
∂x (a) = ∂y (a) = 0,
alors, avec les notations de Monge
∂2f ∂2f ∂2f

p= (a), q = (a), r = (a),
∂x2 ∂x∂y ∂y 2
on a :
– si pr − q 2 >0 et p > 0 : f admet en a un minimum local ;
– si pr − q 2 >0 et p < 0 : f admet en a un maximum local ;
– si pr − q 2 <0 : f n’admet en a ni maximum ni minimum local, mais un point selle ;
– si pr − q 2 =0 : on ne peut conclure a priori.
Preuve. Soit r > 0 tel que B̊(a, r) ⊆ U . on définit sur B̊(0, r) la fonction Q par :
Q(h, k) = ph2 + 2qhk + rk 2 .

2 0 1
1.5 −0.5 0.5
1 −1 0
0.5 −1.5 −0.5
0 −2 −1
1 1 1
0.5 1 0.5 1 0.5 1
0 0 0
0 0 0
−0.5 −0.5 −0.5
−1 −1 −1 −1 −1 −1
Figure 1.21 – Minimum local, maximum local et point selle.
Pour tout vecteur (h, k) de norme r, pour tout t ∈] − 1, 1[, on a le développement limité :
f (a + t(h, k)) − f (a) = t2 (Q(h, k) + k(h, k)k2 ε(th, tk)).
En faisant tendre t vers zéro, on voit que f (a + t(h, k)) − f (a) a le signe de Q(h, k). Il faut donc
étudier le signe de cette forme quadratique : pour k 6= 0, on a :
2 !
h h
Q(h, k) = k2 p + 2q + r .
k k
La parenthèse est un trinôme en hk , cette fraction pouvant prendre toutes les valeurs réelles, dont
le discriminant réduit vaut δ = q 2 − pr. Si ce discriminant est négatif, i.e. si pr − q 2 > 0, alors
Q(h, k) est de signe constant : positif si p > 0, négatif si p < 0. La conclusion subsiste si k = 0
puisqu’alors Q(h, k) = Q(h, 0) = ph2 , du signe de p. Donc si pr − q 2 > 0, f admet un extremum
local en a.
Si le discriminant est positif, alors p( hk )2 + 2qh + rk prend des valeurs positives et négatives en
fonction de hk , donc il en est de même de f (a + t(h, k)) − f (a) pour t voisin de 0 et f n’admet en
a ni maximum ni minimum local, mais un point selle.

Généralisation
Soit U un ouvert de Rn , f : U → R de classe C 2 et a ∈ U un point critique de f , i.e. ∇f (a) = 0.
De façon générale, le développement limité à l’ordre 2 de f en a est :
1
f (a + h) = f (a) + ∇f (a)h + h′ Hf (a)h + khk2 ε(h).
2
où Hf (a) est la matrice Hessienne de f en a : c’est l’équivalent de f ′′ (a) pour une fonction de R
dans R. Elle est de taille (n, n) et de terme générique :
∂2f
Hf (a)(i, j) = (a).
∂xi ∂xj
Puisqu’on est en un point critique, ce développement se simplifie un peu :
1 ′
f (a + h) − f (a) = h Hf (a)h + khk2 ε(h),
2
et au voisinage de O, le signe de f (a + h) − f (a) est en général celui de
Q(h) = h′ Hf (a)h.

−1
1.5
1 1.5
1
0.5
0.5
0
0
−0.5 −0.5
Figure 1.22 – Graphe de la fonction f (x, y) = x3 + y 3 − 3xy.
Par le Théorème de Schwarz, cette matrice est symétrique et, comme toute matrice symétrique à
valeurs réelles, elle est diagonalisable en base orthonormée : il existe une matrice orthogonale P
et une matrice diagonale ∆ = diag(λ1 , ..., λn ), telles que Hf (a) = P ′ ∆P . On a donc, en posant
u = Ph :
Xn
Q(h) = h′ P ′ ∆P h = u′ ∆u = λi u2i ,
i=1
et le comportement local de f dépend du signe des valeurs propres λi de Hf (a) :

– si λi > 0 ∀i : f admet en a un minimum local (Q est une forme quadratique définie positive).
– si λi < 0 ∀i : f admet en a un maximum local (Q est une forme quadratique définie négative).
– si ∃(i, j) tels que λi λj < 0 : f n’admet en a ni maximum ni minimum local, mais un point selle.
– si l’un au moins des λi est nul et tous les autres de même signe : on ne peut conclure a priori.
Retour à la dimension 2
Si on revient à une fonction f de deux variables en un point critique a, la matrice hessienne s’écrit,
avec les notations de Monge :

p q λ1 0
Hf (a) = = P′ P.
q r 0 λ2
On a le lien classique en dimension 2 entre trace, déterminant et valeurs propres :

Tr(Hf (a)) = p + r = λ1 + λ2
det(Hf (a)) = pr − q 2 = λ1 λ2
Et on déduit les signes de λ1 et λ2 des signes de pr − q 2 et de p.
Exercice. Montrer que la fonction f de la Figure 1.22 définie sur R2 par :

f (x, y) = x3 + y 3 − 3xy,
admet deux points critiques (0, 0) et (1, 1). Montrer que le premier correspond à un point selle et
le second à un minimum local pour f . Vérifier que ce minimum local n’est pas un minimum global.

1.8.2 Extrema globaux

Rappel. Pour une fonction f : D ⊆ R → R, on veut savoir si f admet un minimum et un maxi-
mum globaux. Ceci est assuré quand f est continue et que D est un compact (typiquement pour
f : [a, b] → R). Le même résultat passe aux fonctions de plusieurs variables.
Définition 19 (Ensemble compact)

Soit K ⊆ Rn . On dit que K est compact s’il est fermé et borné.
Soit k.k une norme quelconque sur Rn . Rappelons qu’un ensemble K est borné s’il existe M > 0
tel que : ∀x ∈ K, kxk < M . Si k.k = k.k∞ , ceci signifie que les coordonnées de tout point de K
sont comprises entre −M et M .
Exemple. Toute boule fermée B(a, r) est compacte.
Remarque. Ceci n’est pas la définition usuelle d’un ensemble compact ; c’est néanmoins la plus
pratique en dimension finie. Dans le cas plus général d’un espace vectoriel normé, on dit qu’un
ensemble est compact si de toute suite de points de cet ensemble, on peut extraire une sous-suite
convergente dans l’ensemble 6 . On montre alors, via le Théorème de Bolzano-Weierstrass (“De toute
suite bornée de réels on peut extraire une sous-suite convergente.”), que les compacts de Rn ainsi
définis sont exactement les fermés bornés.
Théorème 10 (Image d’un compact par une application continue)

Soit f : K ⊆ Rn → R continue avec K compact, alors f (K) est compact. En particulier f atteint
ses bornes sur K.
Preuve. On utilise la caractérisation des compacts par la convergence d’une sous-suite. Soit (yN ) =
(f (xN )) une suite de f (K) : on doit montrer que (yN ) admet une sous-suite convergente dans f (K).
Or (xN ) est une suite de K compact, donc admet une sous-suite (xϕ(N ) ) convergente vers x ∈ K.
f est continue sur K donc en particulier en x donc f (xϕ(N ) ) = yϕ(N ) converge vers f (x) ∈ f (K).

Remarques :
– Ceci est un résultat d’existence : on est assuré qu’il existe un point x0 où f atteint son maximum,
mais on ne sait ni le situer ni s’il est unique 7 . Lorsque le compact K est spécifié par une équation,
par exemple K = {(x, y) ∈ R2 : ϕ(x, y) = 0}, on peut préciser les choses : c’est l’objet de la
section suivante, appelée étude d’extrema liés, ou optimisation sous contraintes.
– De façon plus générale, si f : K ⊆ Rn → Rp avec K compact, alors f (K) est un compact de Rp
(i.e. fermé et borné).
1.9 Extrema liés

1.9.1 Théorème des Fonctions Implicites
Soit une courbe C du plan définie par l’équation f (x, y) = 0, avec f de classe C 1 . On dit que ceci
définit implicitement y en fonction de x. On voudrait en déduire une description explicite de y
en fonction de x, c’est-à-dire trouver ϕ : R → R telle que la courbe C soit décrite par l’équation
y = ϕ(x). Ce n’est bien sûr pas toujours possible globalement : penser au cercle trigonométrique
N N
6. si (xN ) est une suite et si ϕ : → est une application strictement croissante, on dit que (xϕ(N) ) est une
suite extraite, ou une sous-suite, de (xN ).
7. il est néanmoins utile : cf. exercices 1.46, 1.48 et 1.49 pour des exemples d’applications.

1.9. Extrema liés 35
x2 + y 2 − 1 = 0. Si on se restreint à une description locale, on peut cependant donner une condition

sur f telle qu’autour du point (x0 , y0 ) de C :
(x, y) ∈ C ⇔ y = ϕ(x),
et obtenir l’expression de la dérivée de ϕ en fonction des dérivées partielles de f . C’est l’objet du

Théorème des Fonctions Implicites.
Théorème 11 (Théorème des Fonctions Implicites)

Soit f : U ⊆ R2 → R de classe C 1 , U ouvert et a = (a1 , a2 ) ∈ U . Si f (a) = 0 et ∂f
∂y (a) 6= 0, alors
il existe un intervalle ouvert I1 contenant a1 , un intervalle ouvert I2 contenant a2 et une fonction
ϕ : I1 → I2 de classe C 1 tels qu’on ait l’équivalence :

(x, y) ∈ I1 × I2 x ∈ I1
⇔
f (x, y) = 0 y = ϕ(x)
De plus, on a pour tout x de I1 :
∂f
(x, ϕ(x))
ϕ′ (x) = − ∂x
∂f
.
∂y (x, ϕ(x))
∂f
Preuve. Sans perte de généralité, on se ramène au point (0, 0) et on suppose ∂y (0, 0) > 0. Alors
∂f
par continuité de ∂y , il existe α > 0 et δ > 0 tels que :
∂f
max(|x|, |y|) ≤ δ ⇒ (x, y) > α.
∂y
En particulier f (0, .) est croissante sur [−δ, δ], donc :
f (0, −δ) < 0 < f (0, δ).
D’où, par continuité de f , il existe δ′ > 0 tel que :
|x| < δ′ ⇒ f (x, −δ) < 0 < f (x, δ),
mais on sait aussi que pour |x| ≤ δ, f (x, .) est croissante donc établit une bijection. En notant
δ′ = min(δ, δ′ ), posons I1 =] − δ′ , +δ′ [ et I2 =] − δ, +δ[ : pour tout x ∈ I1 , il existe donc un unique
ϕ(x) ∈ I2 tel que f (x, ϕ(x)) = 0. On a donc :
∀x ∈ I1 , f (x, ϕ(x)) = 0.
Il reste à prouver que ϕ est dérivable sur I1 : le Théorème des Accroissements Finis appliqué à f
entre les points (x, ϕ(x)) et (x + h, ϕ(x + h)) assure l’existence de c entre ces points tel que :
∂f ∂f
f (x + h, ϕ(x + h)) = f (x, ϕ(x)) + (c)h + (c)(ϕ(x + h) − ϕ(x)),
∂x ∂y
c’est-à-dire :
∂f
∂x (c)
ϕ(x + h) − ϕ(x) = −h ∂f .
∂y (c)
Or par continuité de ∂f ∂f
∂x sur le compact I1 × I2 , il existe M > 0 tel que | ∂x (c)| ≤ M . On sait aussi
que sur ce compact ∂f
∂y (c) > α. On en déduit que :
M
ϕ(x + h) − ϕ(x) ≤ h,
α

donc ϕ est continue (et même lipschitzienne), ce qui implique que lorsque h tend vers zéro, le point
c tend vers (x, ϕ(x)), or :
∂f
ϕ(x + h) − ϕ(x) ∂x (c)
= − ∂f ,
h (c) ∂y
donc ϕ est bien dérivable en x avec :
∂f
(x, ϕ(x))
ϕ′ (x) = − ∂x
∂f
.
∂y (x, ϕ(x))

f (x, y) = x2 + y 2 − 1 = 0
∂f
∂y
(a) 6= 0
a
∂f
∂y
(1, 0) =0
Figure 1.23 – Cercle unité et tangente verticale.
Remarques :
– Graphiquement, on sait que le vecteur gradient

∂f ∂f
∇f (a) = (a), (a)
∂x ∂y
est orthogonal à la courbe de niveau 0 de f . Dire que ∂f ∂y (a) 6= 0 signifie donc simplement que
la tangente en a à la courbe n’est pas verticale, ce qui semble raisonnable si on veut pouvoir
exprimer y en fonction de x (cf. Figure 1.23).
– La dérivée ϕ′ (x) se retrouve simplement en écrivant que, autour de a1 , la fonction d’une seule
variable f (x, ϕ(x)) est identiquement nulle, donc sa dérivée est nulle, ce qui donne par la règle
de dérivation en chaîne :
∂f ∂f
(x, ϕ(x)) + ϕ′ (x) (x, ϕ(x)) = 0.
∂x ∂y
– La formule donnant ϕ′ (x) montre en particulier que ϕ a la même régularité que f (par exemple,
si f est C ∞ , ϕ l’est aussi).
– Le résultat reste mutatis mutandis le même si l’on veut exprimer x en fonction de y : la condition
sera cette fois ∂f
∂x (a) 6= 0.
– Le Théorème des Fonctions Implicites, dont la version la plus simple a été donnée ici, est d’une
grande importance théorique : il est équivalent au Théorème d’Inversion Locale et on le retrouve
par exemple dans l’étude locale des courbes, des surfaces... L’optimisation sous contraintes en
est une autre application.

1.9. Extrema liés 37
1.9.2 Extrema liés

On veut cette fois connaître le maximum ou le minimum d’une fonction f de deux variables sachant
que x et y sont liés par une condition que l’on peut généralement exprimer sous la forme g(x, y) = 0.
Définition 20 (Lagrangien)
On cherche les extrema de la fonction f : R2 → R de classe C 1 sous la contrainte g(x, y) = 0, avec
g : R2 → R de classe C 1 . Le Lagrangien associé au problème est la fonction de 3 variables et de
classe C 1
R3 → R

L:
(x, y, λ) 7→ f (x, y) + λg(x, y)
La variable λ est appelée multiplicateur de Lagrange.
Remarques :
– On voit que pour tout couple (x, y) respectant la contrainte, on a L(x, y, λ) = f (x, y), donc
maximiser f sur cet ensemble est équivalent à maximiser L.
– Dans le cas général, on a à optimiser
Rn → R

f:
(x1 , ..., xn ) 7→ f (x1 , ..., xn )
sous p contraintes :
gi (x1 , ..., xn ) = 0 ∀i ∈ {1, ..., p}.
Il y a alors p multiplicateurs de Lagrange λ1 , ..., λp et le Lagrangien associé est la fonction de
(n + p) variables :
p
X
L(x1 , ..., xn , λ1 , ..., λp ) = f (x1 , ..., xn ) + λi gi (x1 , ..., xn ).
i=1
Théorème 12 (Condition nécessaire d’extrémalité sous contraintes)

Pour que f admette en (x0 , y0 ) un extremum local sous la contrainte g(x, y) = 0, (x0 , y0 ) n’étant pas
un point critique de g, il faut qu’il existe λ0 tel que (x0 , y0 , λ0 ) soit un point critique du Lagrangien
L.
∂g
Preuve. Sans restriction de généralité, on suppose que (x0 , y0 ) = (0, 0) et que ∂y (0, 0) 6= 0. On
peut alors appliquer le Théorème des Fonctions Implicites à g : il existe un intervalle ouvert I
contenant 0 et une fonction ϕ de classe C 1 sur I, avec ϕ(0) = 0, tels que localement : g(x, y) = 0
équivaut à y = ϕ(x). On a de plus :
∂g
(0, 0)
ϕ′ (0) = − ∂x
∂g
.
∂y (0, 0)
Dire que f admet un extremum local en (0, 0) sous la contrainte g revient alors à dire que la
fonction d’une seule variable x 7→ f (x, ϕ(x)), définie sur I, admet un extremum local en 0, ce qui
implique en particulier que sa dérivée est nulle en 0, soit via la règle de dérivation en chaîne :
∂f ∂f
(0, 0) + ϕ′ (0) (0, 0) = 0.
∂x ∂y
Soit, en revenant à g :
∂f ∂g ∂g ∂f
(0, 0) (0, 0) − (0, 0) (0, 0) = 0,
∂x ∂y ∂x ∂y
c’est-à-dire que les vecteurs gradient de f et g en (0, 0) sont colinéaires : il existe λ ∈ R tel que
∇f (0, 0) + λ∇g(0, 0) = 0, et puisqu’on a aussi g(0, 0) = 0, c’est encore dire que ∇L(0, 0, λ) = 0.


Remarque. Si on exprime les dérivées partielles du Lagrangien en fonction de celles de f et g, on
doit donc résoudre le système (généralement non-linéaire) de 3 équations à 3 inconnues :

∂f ∂g
 ∂x (x0 , y0 ) + λ0 ∂x (x0 , y0 ) = 0

∂f ∂g
 ∂y (x0 , y0 ) + λ0 ∂y (x0 , y0 ) = 0
 g(x0 , y0 ) = 0
La dernière équation exprime simplement que le point (x0 , y0 ) doit vérifier la contrainte. Les deux
premières signifient qu’en ce point la courbe de niveau f (x, y) = f (x0 , y0 ) de f et la courbe
g(x, y) = 0 doivent être tangentes. Ceci se comprend bien sur la Figure 1.24 faisant apparaître les
lignes de niveaux de f ainsi que la contrainte g : on suppose k0 < k1 < k2 , les points (xm , ym )
et (xM , yM ) représentent les points où f atteint son minimum et son maximum sous la contrainte
g(x, y) = 0.
(xm , ym ) g(x, y) = 0
(xM , yM )
x
f (x, y) = k2
f (x, y) = k1
f (x, y) = k0
Figure 1.24 – Courbes de niveau de f , contrainte g et tangence aux points d’extrémalité.
Une fois obtenus les points critiques du Lagrangien, il reste à préciser leur nature. Le problème est
plus délicat que pour l’optimisation sans contrainte. On peut donner une condition suffisante (un
peu technique) d’extrémalité locale de ces points critiques. Cependant, en général, une fois trouvés
les points critiques du Lagrangien, on raisonnera plutôt en fonction du problème (c’est-à-dire au
cas par cas) pour trouver la nature de ces points singuliers.
Si l’on cherche plus précisément les extrema globaux sous contrainte, alors un argument de com-
pacité assure à nouveau leur existence. Puisque l’ensemble sur lequel on cherche les extrema de f
est
D = {(x, y) : g(x, y) = 0} = g −1 ({0}),
on peut préciser les choses. On commence par donner une propriété des fonctions continues connue
pour f : R → R.
Proposition 7 (Images réciproques)

Si f : Rn → Rp est continue, alors l’image réciproque d’un ouvert (respectivement d’un fermé) de
Rp par f est un ouvert (respectivement un fermé) de Rn .

1.10. Exercices 39
Preuve. Soit V un ouvert de Rp et f −1 (V) son image réciproque par f . Ou bien celle-ci est vide,
auquel cas c’est bien un ouvert, ou bien non : soit alors a ∈ f −1 (V). f (a) ∈ V qui est ouvert
donc il existe ε > 0 tel que B̊(f (a), ε) ⊆ V. Or f est continue en a donc il existe δ > 0 tel que
x ∈ B̊(a, δ) ⇒ f (x) ∈ B̊(f (a), ε) donc en particulier x ∈ f −1 (V) : c’est exactement dire que f −1 (V)
est un voisinage de a pour tout a ∈ f −1 (V) donc que f −1 (V) est ouvert. Enfin si F est un fermé
de Rp , Rp − F est un ouvert, donc f −1 (Rp − F ) = Rn − f −1 (F ) aussi, donc F est un fermé.

{0} étant un fermé de R, son image réciproque par g (supposée continue) est un fermé de R2 . Les
compacts de R2 étant exactement les fermés bornés, il suffit de vérifier que cet ensemble est borné
pour pouvoir appliquer un résultat de compacité :
Proposition 8
Si f et g sont continues et si l’ensemble g−1 ({0}) est borné, alors f admet un maximum global et
un minimum global sous la contrainte g(x, y) = 0.
Exemple. On veut déterminer les extrema de f (x, y) = x + y sous la contrainte x2 + y 2 = 1.

Faire un dessin comme en 1.24 pour trouver les points graphiquement. Retrouver ces points via le
Lagrangien du problème. Montrer qu’on peut √ aussi résoudre le problème de façon élémentaire en
remarquant que la contrainte se réécrit y = ± 1 − x2 et en substituant à y cette expression dans
la fonction f .
Remarques :
– Dans les applications concrètes (économie, traitement du signal...), on est presque toujours
confronté à des problèmes d’optimisation sous contraintes et non à des problèmes d’optimisation
libre.
– Il existe des algorithmes classiques pour résoudre rapidement ces problèmes dans les cas les plus
simples : algorithme du simplexe (ou programmation linéaire) pour optimiser une forme linéaire
sous une contrainte linéaire, programmation quadratique pour optimiser une forme quadratique
sous une contrainte linéaire... Ce sujet fait l’objet d’un cours à lui tout seul.
– Notons enfin qu’un cas typique pour lequel les problèmes d’optimisation s’étudient bien est celui
où la fonction à optimiser est convexe (ou concave) sur un ensemble convexe.
1.10 Exercices
Exercice 1.1 (Domaine de définition)
Représenter les domaines de définition des fonctions suivantes :
√
x2 y−2
1. f (x, y, z) = z−3 .
2. f (x, y) = ln(cos2 x − y 2 ).
3. f (x, y) = ln xy.
√
4. f (x, y) = xy − 2.
Exercice 1.2 (Paraboloïde de révolution)

Soit
R2 → R

f:
(x, y) 7→ z = 4 − x2 − y 2
1. Représenter cette surface à l’aide des sections par les différents plans z = 0, z = 2, z = 4.

2. Quelle est son équation en coordonnées cylindriques ? En quoi voit-on que c’est une surface
de révolution ?
Exercice 1.3 (Représentations de surfaces)

Représenter les surfaces données par les fonctions suivantes :
1. f (x, y) = sin y.
2 2
2. g(x, y) = e−(x +y ) .
p
3. g(x, y) = x2 + y 2 .
Exercice 1.4 (Equations de plan)

On s’intéresse au plan (ABC) avec A(2, 0, 0), B(0, 1, 0) et C(0, 0, 3).
1. Représenter ce plan.
2. On rappelle qu’un vecteur orthogonal à la fois à u = [u1 , u2 , u3 ]′ et v = [v1 , v2 , v3 ]′ est donné
par leur produit vectoriel w = u ∧ v = [u2 v3 − u3 v2 , u3 v1 − u1 v3 , u1 v2 − u2 v1 ]′ . En déduire
un vecteur w normal au plan (ABC).
−−→
3. Un point M (x, y, z) appartient au plan (ABC) si et seulement si les vecteurs AM et v sont
orthogonaux. En déduire une équation cartésienne du plan (ABC).
−−→
4. Un point M (x, y, z) appartient au plan (ABC) si et seulement si le vecteur AM est com-
−−→ −→
binaison linéaire des vecteurs AB et AC. En déduire une équation paramétrique du plan
(ABC).
Exercice 1.5 (Fonctions d’utilité et de production)

1. On admet pouvoir modéliser la satisfaction d’un consommateur de 2 biens A et B en quantités
x et y (positives) par la fonction d’utilité U (x, y) = 2x + y. Les courbes de niveau de U
sont appelées courbes d’iso-utilité ou d’indifférence : dans un repère (O,~i, ~j), représenter les
courbes de niveau 2, 4, 8 de U .
1 3
2. Supposons que la fonction de production d’une entreprise Q(K, L) = 2K 4 L 4 dépende du
capital investi K et de la quantité de travail L. Dessiner de même les courbes de niveau 2, 4, 8
de Q (ou isoquantes).
Exercice 1.6 (Cercle, ellipse, sphère et ellipsoïde)

1. Soit A(2, 0), A′ (−2, 0), B(0, 1) et B ′ (0, −1) dans le plan R2 .
(a) Donner une condition nécessaire et suffisante pour qu’un point M appartienne au cercle
de centre O et de rayon r. En notant x et y les coordonnées de M , en déduire une
équation cartésienne du cercle de centre A et de rayon égal à 3.
(b) On rappelle que l’équation cartésienne d’une ellipse de centre O et d’axes parallèles
aux axes de coordonnées est de la forme x2 /a2 + y 2 /b2 = 1. En déduire une équation
cartésienne de l’ellipse de centre O, de grand axe [AA′ ], et de petit axe [BB ′ ].
2. Soit A(2, 0, 0), A′ (−2, 0, 0), B(0, 1, 0), B ′ (0, −1, 0), C(0, 0, 3) et C ′ (0, 0, −3) dans l’espace R3 .
(a) Donner une équation cartésienne de la sphère de centre A et de rayon 3.
(b) Donner une équation cartésienne de l’ellipsoïde de centre O, d’axes [AA′ ], [BB ′ ] et [CC ′ ].
Exercice 1.7 (Une norme matricielle)

Soit A ∈ Mp (R), on note kAk = sup1≤i,j≤p |ai,j |.

1.10. Exercices 41
1. Vérifier que k.k est une norme sur l’espace vectoriel Mp (R) via les trois axiomes vus en cours
(Positivité & Séparation, Homogénéité, Inégalité triangulaire).
2. Soit la matrice
1

2 1
A= 1
0 2
(a) Calculer A2 , A3 , A4 , ... jusqu’à trouver la formule générale de An .

(b) En déduire limn→+∞ An . Déterminer kAn k et limn→+∞ kAn k.
3. Montrer que pour toutes matrices A et B de Mp (R) :
kABk ≤ p × kAk × kBk.
4. Soit la matrice
1/3 1/4
A=
1/5 1/6
Déduire de la question précédente que (An ) tend vers la matrice nulle.
Exercice 1.8 (Normes non équivalentes)

On considère l’espace vectoriel (de dimension infinie) C([0, 1], R) des fonctions continues sur [0, 1]
et à valeurs dans R. Pour f ∈ C([0, 1], R), on définit :
Z 1
kf k1 = |f (x)|dx,
0
ainsi que :
kf k∞ = sup |f (x)|.
x∈[0,1]
1. Vérifier que k.k1 et k.k∞ sont des normes sur C([0, 1], R).
2. Soit la suite de fonctions (fn ) définies par
[0, 1] → R

fn :
x 7→ xn
(a) Calculer kfn k1 et kfn k∞ .

(b) Que vaut limn→∞ kfn k1 ? Et limn→∞ kfn k∞ ? En déduire que k.k1 et k.k∞ ne sont pas
des normes équivalentes.
Exercice 1.9 (Intérieur, adhérence)

1. On se place dans R muni de la topologie usuelle. On considère les ensembles A = [1, 3[∪[4, 9[
\ ˚
et B = [3, 4[. Déterminer A, B, A ∩ B, A ∩ B, A ∩ B, A ∩ B, Å, B̊, Å ∪ B̊ et A ∪ B.
2. Vérifier que l’ensemble Q des rationnels n’est ni ouvert ni fermé. Déterminer Q̊ et Q.
3. On se place dans R muni de la topologie usuelle. On considère la suite d’ensembles :
2

1 1
In = ,1 × ,1 .
n n
(a) Représenter I1 , I2 , I3 , ... Les In sont-ils ouverts, fermés, ni l’un ni l’autre ?

S+∞
(b) Déterminer C = n=1 In . Nature topologique de C ? Déterminer C.
Exercice 1.10 (Boules unités)

Dans R3 , représenter B 1 (O, 1), B 2 (O, 1) et B ∞ (O, 1), boules fermées centrées en l’origine et de
rayon 1 pour la norme de la somme, la norme euclidienne et la norme du sup.
Exercice 1.11 (Limite en un point)

1. Rappeler les développements limités à l’ordre 1 en 0 des fonctions sinus et exponentielle.
2. Pour chacune des fonctions suivantes, déterminer son domaine de définition et si elle admet
une limite en (0, 0) :
1+x2 +y 2
(a) f (x, y) = y sin y.
√
sin x2 +y 2
(b) g(x, y) = x2 +y 2
.
y
(c) h(x, y) = x cos x .
xy −1
(d) ϕ(x, y) = xe 2 +y 2 . (trouver deux suites de points telles que ϕ n’a pas la même limite)
Exercice 1.12 (Limites directionnelles)

Soit la fonction
R2 → R


 4
f: (x, y) 7→ x2y+y4 si (x, y) 6= (0, 0)

 (0, 0) 7→ 0
1. Montrer que pour tout réel α, on a limx→0 f (x, αx) = f (0, 0).
1
2. On considère la suite (xn , yn ), avec xn = n2
et yn = n1 .
(a) Représenter dans R2 les premiers termes de cette suite.
(b) Montrer que f n’est pas continue en (0, 0).
3. Interpréter graphiquement les résultats des questions précédentes.
Corrigé
1. Soit α réel fixé, alors pour tout x non nul on a :
α4 x4 α4 x2
f (x, αx) = = .
x2 + α4 x4 1 + α4 x2
Or, quand x tend 0, le numérateur tend vers 0 et le dénominateur vers 1, donc le rapport
tend vers 0. On a donc bien :
lim f (x, αx) = f (0, 0).

x→0,x6=0
√
2. (a) Les points sont tous sur la courbe d’équation y = x et tendent vers l’origine lorsque n
tend vers l’infini. Les premiers points sont A1 (1, 1), A2 (1/4, 1/2), A3 (1/9, 1/3), A4 (1/16, 1/4),
etc.
(b) Soit (xn , yn ) = ( n12 , n1 ), alors :
1/n4 1
f (xn , yn ) = 4 4
= .
1/n + 1/n 2

1.10. Exercices 43
Donc (f (xn , yn ))n≥1 est une suite constante ; en particulier sa limite quand n tend vers
l’infini vaut 1/2. Or :
lim (xn , yn ) = (0, 0),
n→+∞
donc si f était continue en (0, 0), on aurait :
lim f (xn , yn ) = f (0, 0) = 0,

n→+∞
ce qui n’est pas le cas. f n’est donc pas continue en (0, 0).
(c) Ceci signifie que si (x, y) tend vers (0, 0) en restant sur la droite passant par O et de
coefficient directeur α, la limite de f est bien f (0, 0). On vient cependant de montrer
que f n’est pas continue en (0, 0), puisque ce n’est plus le cas si on s’approche de l’ori-
√
gine en restant sur la courbe d’équation y = x.
Exercice 1.13 (Prolongement par continuité)

On définit la fonction f de R2 \ {(0, 0)} dans R par :
x3 y 3
f (x, y) =
(x2 + y 2 )2
Montrer qu’on peut prolonger f par continuité en (0, 0).
Corrigé
On veut montrer que f admet une limite en (0, 0), et plus précisément que cette limite vaut 0. On
effectue pour cela le changement de variables en polaires, i.e. on étudie plutôt f (ρ cos θ, ρ sin θ) :
on sait que l’étude de la limite de f (x, y) quand (x, y) tend vers (0, 0) est équivalente à l’étude de
la limite de f (ρ cos θ, ρ sin θ) quand ρ tend vers zéro (en restant non nul), θ étant quelconque. Or
on obtient :
ρ6 cos3 θ sin3 θ
f (ρ cos θ, ρ sin θ) = = ρ2 cos3 θ sin3 θ,
ρ4
d’où l’on déduit que :
|f (ρ cos θ, ρ sin θ)| ≤ ρ2 −−−→ 0.
ρ→0
Il s’ensuit que :
lim f (x, y) = lim f (ρ cos θ, ρ sin θ) = 0,
(x,y)→(0,0) ρ→0
et f est prolongeable par continuité en (0, 0) par la valeur 0.
Exercice 1.14 (Continuité de fonctions)

Etudier la continuité des fonctions de R2 dans R définies pour tout (x, y) de R2 par :
x3 +y 3
1. f (x, y) = x2 +y 2
si (x, y) 6= (0, 0) et f (0, 0) = 0.
1
2. g(x, y) = (x2 + y 2 ) sin x2 +y 2 si (x, y) 6= (0, 0) et g(0, 0) = 0.
Corrigé
1. Un changement en polaires donne :
ρ3 cos3 θ + ρ3 sin3 θ
f (ρ cos θ, ρ sin θ) = = ρ(cos3 θ + sin3 θ),
ρ2
d’où
|f (ρ cos θ, ρ sin θ)| ≤ 2ρ −−−→ 0.
ρ→0

Ainsi
lim f (x, y) = lim f (ρ cos θ, ρ sin θ) = 0,
(x,y)→(0,0) ρ→0
et f est prolongeable par continuité en (0, 0) par la valeur 0.

2. On a :
|h(x, y)| ≤ x2 + y 2 −−−−−−−→ 0 = h(0, 0),
(x,y)→(0,0)
d’où la continuité de h en (0, 0).
Exercice 1.15 (Développement limité et prolongement par continuité)

Soit la fonction f définie par :
√
1 − cos xy
f (x, y) = .
y
1. Déterminer et représenter le domaine de définition Df de f .
2. Rappeler le développement limité de la fonction cosinus au voisinage de 0.
3. En déduire qu’on peut prolonger f par continuité en (0, 0).
4. Quelle est la frontière de Df ?
5. Montrer qu’on peut prolonger f par continuité en tout point de sa frontière.
Exercice 1.16 (Fonction non prolongeable par continuité)

Montrer que la fonction f définie par :
R2 \ {(0, 0)} → R
(
f (x, y) = 2 2
(x, y) 7→ xx2 −y
+y 2
n’admet pas de limite en (0, 0).
Corrigé
Il suffit de trouver deux suites (xn , yn ) et (un , vn ) tendant toutes deux vers (0, 0) et telles que
lim f (xn , yn ) 6= lim f (un , vn ). En prenant (xn , yn ) = (1/n, 0) et (un , vn ) = (0, 1/n), on obtient
lim f (xn , yn ) = 1 6= −1 = lim f (un , vn ).

n→∞ n→∞
Donc f n’admet pas de limite en (0, 0).
Exercice 1.17 (Applications partielles)

1. En utilisant par exemple une réduction de Gauss, déterminer pour quelle(s) valeur(s) du
couple (x, y) la quantité x2 − xy + y 2 est nulle.
2. Soit la fonction
xy
(x, y) 7→ x2 −xy+y si (x, y) 6= (0, 0)

2
f:
(0, 0) 7→ 0
(a) Montrer que les fonctions x 7→ f (x, 0) et y 7→ f (0, y) sont continues sur R.
(b) La fonction f est-elle continue en (0, 0) ?
Exercice 1.18 (Fonction distance)

Soit A une partie non vide de Rn muni d’un norme k.k. On appelle distance de x ∈ Rn à A le réel
positif
d(x, A) = inf{kx − yk, y ∈ A}.

1.10. Exercices 45
1. Montrer que la fonction

Rn → R+

dA :
x 7→ d(x, A)
est continue.
2. Déterminer {x ∈ Rn : d(x, A) = 0}.
Exercice 1.19 (Application différentiable non C 1 )

On considère la fonction
 R →R
 2
1
f: (x, y) 7→ xy sin x2 +y 2 si (x, y) 6= (0, 0)
(0, 0) 7→ 0

1. Justifier la continuité de f en (0, 0).

2. Calculer les dérivées partielles de f sur R2 \ {(0, 0)}.
3. Montrer, en revenant à la définition, que f admet des dérivées partielles au point (0, 0).
Exercice 1.20 (Une autre fonction différentiable non C 1 )

Soit f : R2 → R définie par f (x, y) = y 2 sin( xy ) si y 6= 0 et f (x, 0) = 0. On pose
U = (x, y) ∈ R2 , y 6= 0 .

1. L’ensemble U est-il ouvert, fermé, ni l’un ni l’autre ?

2. Justifier le fait que f est de classe C 1 sur U et donner ses dérivées partielles.
3. Montrer que f est continue en tout point (x, 0). En déduire la continuité de f sur R2 .
4. En revenant à la définition des dérivées partielles, montrer que f admet des dérivées partielles
en tout point (x, 0).
5. Etablir la continuité de la fonction ∂f ∂x en tout point (x, 0). En déduire que cette dérivée
partielle est continue sur R .2
6. En étudiant par exemple la continuité de la fonction ∂f ∂y au point (1, 0), montrer que f n’est
1
pas de classe C sur R . 2
Corrigé
1. Soit M0 (x0 , y0 ) un point de U , c’est-à-dire tel que y0 6= 0. Considérons par exemple la norme
euclidienne sur R2 . Il est clair que le disque ouvert de centre M0 et de rayon |y0 |/2 est inclus
dans U , ce qui assure que U est ouvert.
2. La fonction f est de classe C 1 sur U par les théorèmes opératoires classiques (composée et
produit de fonctions C 1 ). Ses dérivées partielles en tout point (x, y) de U sont
(
∂f
∂x = y cos(x/y)
∂f
∂y = 2y sin(x/y) − x cos(x/y)
3. Soit M0 (x0 , 0) un point de l’axe des abscisses. On a par définition de la fonction f (x0 , 0) = 0,
et par ailleurs en tout point M (x, y) : |f (x, y)| ≤ y 2 , donc :
lim f (x, y) = 0 = f (x0 , 0),
(x,y)→(x0 ,0)
et f est continue au point M0 (x0 , 0). Puisque x0 est arbitraire, f est continue en tout point
de l’axe des abscisses. D’autre part, étant de classe C 1 sur U , f est a fortiori continue sur U .
Au total, f est continue sur R2 .

4. Fixons à nouveau M0 (x0 , 0) sur l’axe des abscisses. Pour calculer les dérivées partielles de f
en M0 , on se ramène à la définition par les taux de variations, ce qui donne :
(
∂f f (x0 +h,0)−f (x0 ,0)
∂x (x0 , 0) = limh→0 h =0
∂f f (x0 ,h)−f (x0 ,0)
∂y (x0 , 0) = limh→0 h = limh→0 h sin(x0 /h) = 0
le dernier résultat venant de ce que |h sin(x0 /h)| ≤ |h|.

5. Toujours en M0 (x0 , 0), on peut écrire que pour tout couple (x, y) avec y 6= 0,
∂f ∂f
(x, y) − (x0 , 0) = |y cos(x/y)|,
∂x ∂x
la différence valant tout simplement 0 lorsque y = 0. Ainsi, que y soit nul ou non, on a :
∂f ∂f
(x, y) − (x0 , 0) ≤ |y| −−−−−−−−→ 0,
∂x ∂x (x,y)→(x0 ,0)
de sorte que ∂f
∂x est continue en tout point de l’axe des abscisses. Puisque f est par ailleurs
de classe C sur U , cette première dérivée partielle est continue sur R2 tout entier.
1
∂f
6. La fonction ∂y est aussi continue sur U . Par contre, elle n’est pas continue en (1, 0) par
∂f
exemple. En effet, on a vu que ∂y (1, 0) = 0, mais :
∂f 1 ∂f
(1, ) = −2nπ −−−−−→ −∞ =
6 (1, 0).
∂y 2nπ n→+∞ ∂y
En fait cette seconde dérivée partielle n’est continue en aucun point de l’axe des abscisses,
sauf en l’origine. Au total, f admet des dérivées partielles en tout point de R2 , mais l’une
d’entre elles n’est pas continue sur R2 , donc f n’est pas C 1 sur R2 .
Exercice 1.21 (Un clone)

Posons f (x, y) = xy sin( y1 ) si y 6= 0 et f (x, 0) = 0 pour tout x de R.
1. Etablir que la fonction f est continue en tout point de R2 .
2. Montrer qu’elle admet des dérivées partielles premières par rapport à x et par rapport à y
en tout point (x, y) de R2 tel que y 6= 0, et en (0, 0).
∂f ∂f
3. Etudier la continuité des fonctions dérivées partielles ∂x et ∂y .
Corrigé
1. la fonction f est clairement C ∞ en dehors de l’axe des abscisses (voir aussi Figure 1.25). Soit
M0 (x0 , 0) un point de cet axe : on a par définition de la fonction f (x0 , 0) = 0 et par ailleurs,
en tout point M (x, y) : |f (x, y)| ≤ |xy|, donc :
lim f (x, y) = 0 = f (x0 , 0),

(x,y)→(x0 ,0)
et f est continue en tout point M0 (x0 , 0), donc sur R2 .

2. Si y 6= 0, il existe un voisinage ouvert du point M (x, y) ne contenant aucun point de l’axe
des abscisses. On peut donc calculer les dérivées partielles directement :
(
∂f
∂x = y sin(1/y)
∂f x
∂y = x sin(1/y) − y cos(1/y)

1.10. Exercices 47
Z 0
−1
−2
−3
3 −3
2 −2
1 −1
0 0
−1 1
−2 2
X Y
−3 3
Figure 1.25 – Lucy in the Sky with Diamonds.
Pour les calculer au point O(0, 0), on se ramène à la définition par les taux de variations :
(
∂f f (x,0)−f (0,0)
∂x (0, 0) = limx→0 x =0
∂f f (0,y)−f (0,0)
∂y (0, 0) = lim y→0 y = 0
Donc f admet bien des dérivées partielles à l’origine.

3. Si la dérivée partielle de f par rapport à y était continue en (0, 0), on devrait avoir : pour
toute suite de points (xn , yn ) tendant vers l’origine :
∂f ∂f
lim (xn , yn ) = (0, 0) = 0.
n→∞ ∂y ∂y
1 1
Or pour (xn , yn ) = ( 2nπ , 2nπ ), on obtient :
∂f ∂f
(xn , yn ) = −1 6= (0, 0) = 0,
∂y ∂y
ce qui prouve que f n’est pas de classe C 1 .
Exercice 1.22 (Dérivées partielles et composition)

1. Soit f : R → R une fonction de classe C 1 . Exprimer au moyen de f ′ les dérivées partielles
des fonctions suivantes :
(a)
R∗+ × R → R

g:
(x, y) 7→ g(x, y) = f (y/x)
(b)
R3 → R

h:
(x, y, z) 7→ h(x, y, z) = f (z sin x)

2. Soit f : R → R de classe C 1 et soit g : R2 → R définie par : g(x, y) = f ( x2 + y 2 ). Calculer

p
les dérivées partielles de g via la dérivée de f .

3. Soit f : R2 → R de classe C 1 et soit g : R2 → R définie par : g(x, y) = sin(x + f (y 2 , x)).
Calculer les dérivées partielles de g au moyen de celles de f .
Exercice 1.23 (Matrice Jacobienne)

Soit f et g les fonctions de R2 dans R2 définies par :
f (x, y) = (sin(x2 − y 2 ), cos(x2 − y 2 ))
et :
g(x, y) = (x + y, x − y).
Calculer la matrice jacobienne de la fonction h = f ◦ g en (x, y) ∈ R2 .
Corrigé
On a tout simplement :
h(x, y) = (f ◦ g)(x, y) = (sin(4xy), cos(4xy)) = (h1 (x, y), h2 (x, y)),
donc : " #
∂h1 ∂h1
∂x ∂y 4y cos(4xy) 4x cos(4xy)
Jh (x, y) = ∂h2 ∂h2 (x, y) = .
∂x ∂y
−4y sin(4xy) −4x sin(4xy)
Exercice 1.24 (Fonctions homogènes)

Une fonction f : Rn → R est dite homogène de degré α si :
∀t > 0 f (tx1 , ..., txn ) = tα f (x1 , ..., xn ).
1. Préciser si les fonctions suivantes sont homogènes et, si oui, de quel degré :
(a) f (x, y) = 2x2 + 3xy + y 2 .
x−y
(b) f (x, y) = x2 +y 2
.
(c) f (x, y) = u( xy ) où
u est une fonction de R dans R.
Qn 1
(d) f (x1 , ..., xn ) = ( i=1 xi ) n .
Dans la suite, on se restreint (sans perte de généralité) aux fonctions de 2 variables.
2. Montrer que si f est C 1 et homogène de degré α, alors ses dérivées partielles sont homogènes
de degré (α − 1).
3. Soit f une fonction C 1 de R2 dans R et M0 (x0 , y0 ) fixé. Soit encore
R∗+ → R

g:
t 7→ f (tx0 , ty0 )
Exprimer g ′ (t) en fonction des dérivées partielles de f .

4. On suppose toujours f de classe C 1 . On veut établir la relation d’Euler :
∂f ∂f
f homogène de degré α ⇔ x +y = αf.
∂x ∂y
(a) En utilisant 3), montrer ⇒.

1.10. Exercices 49
(b) Réciproque : avec g définie comme en 3), supposons qu’on ait la relation d’Euler. Mon-
trer que :
∀t > 0 t · g′ (t) = α · g(t).
Intégrer cette équation différentielle, montrer que la constante d’intégration vaut g(1)
et en déduire que f est homogène de degré α. Indication : on rappelle que la solution
générale de l’équation différentielle φ′ (t) = a(t)φ(t) est de la forme φ(t) = c× exp(A(t)),
où c est une constante et A(t) une primitive de a(t).
Corrigé
1. Les fonctions proposées sont toutes homogènes, de degrés respectifs 2, -1, 0 et 1.
2. Dire que f est homogène de degré α est exactement dire qu’on a égalité entre les fonctions
g et h définies par g(x, y) = f (tx, ty) et h(x, y) = tα f (x, y). Puisque f est C 1 , ces deux
fonctions le sont aussi et leur dérivées partielles doivent donc coïncider. Ainsi, pour tout
couple (x, y) et tout t > 0, on a
∂g ∂f ∂h ∂f ∂f ∂f
(x, y) = t (tx, ty) et (x, y) = tα (x, y) ⇒ (tx, ty) = tα−1 (x, y).
∂x ∂x ∂x ∂x ∂x ∂x
Ceci prouve que la première dérivée partielle de f est bien homogène de degré (α − 1). Il en
va clairement de même pour la seconde.
3. La fonction g est C 1 puisque f l’est et la règle de dérivation en chaîne donne
∂f ∂f
g′ (t) = x0 (tx0 , ty0 ) + y0 (tx0 , ty0 ).
∂x ∂y
4. On suppose toujours f de classe C 1 . On veut établir la relation d’Euler :

∂f ∂f
f homogène de degré α ⇔ x +y = αf.
∂x ∂y
(a) Notons de façon générale g(t) = f (tx, ty) et supposons f homogène de degré α. Alors
g(t) = tα f (x, y) ⇒ g′ (t) = αtα−1 f (x, y).
En comparant avec la dérivée obtenue en question précédente, on en déduit que pour

tout couple (x, y) et tout t > 0
∂f ∂f
αtα−1 f (x, y) = x (tx, ty) + y (tx, ty).
∂x ∂y
Il reste à prendre t = 1 pour obtenir la relation d’Euler.
(b) On a vu dans la question 3 que, pour tout t > 0,
∂f ∂f
g′ (t) = x (tx, ty) + y (tx, ty).
∂x ∂y
Si la relation d’Euler est vérifiée, on en déduit que

′ 1 ∂f ∂f 1 1
g (t) = tx (tx, ty) + ty (tx, ty) = × αf (tx, ty) = × αg(t),
t ∂x ∂y t t
ce qui donne bien l’équation différentielle attendue. Une primitive sur ]0, +∞[ de a(t) =
α/t étant A(t) = α ln t, on en déduit qu’il existe une contante c telle que
g(t) = c × exp(A(t)) = ctα .

On a de plus c = g(1) = f (x, y) et on a donc montré que pour tout couple (x, y) et tout
t > 0,
g(t) = tα g(1) ⇔ f (tx, ty) = tα f (x, y),
qui montre que f est homogène de degré α.
Exercice 1.25 (Equation aux dérivées partielles)

Soit U un ouvert de R∗+ × R. On cherche l’ensemble des fonctions f différentiables sur U vérifiant :
∂f ∂f
x −y = 0.
∂x ∂y
On considère le changement de variables défini par u = x et v = xy, et on note g la fonction définie
par :
g(u, v) = g(x, xy) = f (x, y).
1. Relations entre les dérivées partielles de f et celles de g ?
2. En déduire que :
∂f ∂f ∂g
x −y = 0 ⇐⇒ u · = 0.
∂x ∂y ∂u
3. Trouver les fonctions g(u, v) vérifiant :
∂g
u· = 0.
∂u
4. En déduire les fonctions f vérifiant :
∂f ∂f
x −y = 0.
∂x ∂y
Exercice 1.26 (Une autre équation aux dérivées partielles)

Soit f : R2 → R de classe C 1 . a, b et c étant trois nombres réels fixés, on définit la fonction
R3 → R

φ:
(x, y, z) 7→ f (ax2 + y, bx3 + cxy + z)
Trouver un triplet (a, b, c) tel que φ vérifie l’équation aux dérivées partielles suivante :
∂φ ∂φ ∂φ
+x +y = 0.
∂x ∂y ∂z
Corrigé
∂f ∂f
La fonction φ est de classe C 1 comme composée de fonctions de classe C 1 . Si on note ∂u et ∂v les
dérivées partielles de f , on a par la règle de dérivation en chaîne 8 :

∂φ ∂f 2 ∂f
 ∂x (x, y, z) = 2ax ∂u (. . . ) + (3bx + cy) ∂v (. . . )

∂φ ∂f ∂f
∂y (x, y, z) = ∂u (. . . ) + cx ∂v (. . . )
 ∂φ (x, y, z) = ∂f (. . . )

∂z ∂v
d’où l’on déduit :
∂φ ∂φ ∂φ ∂f ∂f
+x +y = (2a + 1)x + ((3b + c)x2 + (c + 1)y) .
∂x ∂y ∂z ∂u ∂v
Par identification, φ vérifie l’équation aux dérivées partielles données si et seulement si a = − 21 ,
b = 13 et c = −1.
8. l’abréviation “(. . . )” correspond à (ax2 + y, bx3 + cxy + z).

1.10. Exercices 51
Exercice 1.27 (Accroissements finis)

Pour tous nombres réels strictement positifs x1 , ..., xn , on définit leur moyenne harmonique :
1
H(x1 , ..., xn ) = (x1 ...xn ) n .
∂H 1 H
1. Montrer que pour tout i ∈ {1, . . . , n} on a : ∂xi = n · xi .
2. Soient a > 0 et δ > 0. On suppose que pour tout i, a ≤ xi ≤ a + δ.
(a) Ecrire l’Inégalité des Accroissements Finis pour la fonction H entre les points A(a, ..., a)
et M (x1 , ..., xn ).
(b) En déduire que :

1 a+δ x1 + ... + xn
(x1 ...xn ) − a ≤
n −a .
a n
3. Montrer de même que :

1 a x1 + ... + xn
(x1 ...xn ) − a ≥
n −a .
a+δ n
4. En déduire que l’erreur commise en remplaçant la moyenne harmonique par la moyenne

2
arithmétique 9 est inférieure à δa .
Exercice 1.28 (Contre-exemple au Théorème de Schwarz)

R2 →R


 3
f: (x, y) 7→ x2xy+y2 si (x, y) 6= (0, 0)

 (0, 0) 7→ 0
1. Montrer que f est continue en (0, 0).

∂f ∂f
2. Calculer, pour (x, y) 6= (0, 0), la dérivée partielle ∂x (x, y) et en déduire lim(x,y)→(0,0) ∂x (x, y).
3. Calculer, pour x différent de 0, f (x,0)−f
x
(0,0)
et en déduire la limite quand x tend vers 0.
Comment note-t-on cette limite ?
∂f ∂f
4. Calculer, pour (x, y) 6= (0, 0), la dérivée partielle ∂y (x, y) et en déduire lim(x,y)→(0,0) ∂y (x, y).
5. Calculer, pour y différent de 0, f (0,y)−f

y
(0,0)
et en déduire la limite quand y tend vers 0.
Comment note-t-on cette limite ?
6. Déduire des questions précédentes que f est de classe C 1 sur R2 .
∂2f
7. Calculer, pour (x, y) 6= (0, 0), la dérivée seconde croisée ∂x∂y (x, y).
8. Cette dérivée seconde croisée admet-elle une limite en (0, 0) ?
9. Calculer, pour x différent de 0,
∂f ∂f
∂y (x, 0) − ∂y (0, 0)
x
et en déduire sa limite quand x tend vers 0. Comment note-t-on cette limite ?
10. Calculer, pour y différent de 0,
∂f
− ∂f
∂x (0, y)
∂x (0, 0)
y
et en déduire sa limite quand y tend vers 0. Comment note-t-on cette limite ?
x1 +...+xn
9. la moyenne arithmétique de x1 , ..., xn est la moyenne “usuelle”, c’est-à-dire n
.

11. Rappeler le théorème de Schwarz. Pourquoi ne s’applique-t-il pas ici ?
Corrigé
1. On passe en coordonnées polaires pour obtenir
|f (r cos θ, r sin θ)| = |r 2 cos θ sin3 θ| = r 2 × | cos θ| × | sin3 θ| ≤ r 2 −−−→ 0 = f (0, 0),
r→0
ce qui assure que f est bien continue en (0, 0).

2. La fonction f est de classe C ∞ sur l’ouvert U = R2 \ {(0, 0)}. En particulier, pour (x, y) 6=
(0, 0), sa première dérivée partielle vaut
∂f y 3 (y 2 − x2 )
(x, y) = .
∂x (x2 + y 2 )2
On passe à nouveau en polaires
∂f
(r cos θ, r sin θ) = |r sin3 θ(cos2 θ − sin2 θ)| ≤ r −−−→ 0,
∂x r→0
∂f
ce qui prouve que lim(x,y)→(0,0) ∂x (x, y) = 0.
3. Pour x différent de 0,
f (x, 0) − f (0, 0)
= 0 −−−→ 0.
x x→0
Par définition, cette limite est la dérivée partielle de f par rapport à x au point (0, 0). Ainsi
nous venons de montrer que
∂f
(0, 0) = 0.
∂x
4. Pour (x, y) 6= (0, 0), la seconde dérivée partielle de f est

∂f xy 2 (3x2 + y 2 )
(x, y) = .
∂y (x2 + y 2 )2
La limite s’obtient comme d’habitude
∂f
(r cos θ, r sin θ) = |r cos θ sin2 θ(3 cos2 θ + sin2 θ)| ≤ 4r −−−→ 0,
∂y r→0
∂f
ce qui prouve que lim(x,y)→(0,0) ∂y (x, y) = 0.
5. Pour y différent de 0,
f (0, y) − f (0, 0)
= 0 −−−→ 0.
y y→0
Par définition, cette limite est la dérivée partielle de f par rapport à y au point (0, 0). Ainsi
∂f
(0, 0) = 0.
∂y
6. Comme précisé ci-dessus, la fonction f est de classe C 1 sur l’ouvert U . De plus, les questions
précédentes montrent que non seulement f admet des dérivées partielles en l’origine mais
plus précisément que
∂f ∂f ∂f ∂f
(0, 0) = 0 = lim (x, y) et (0, 0) = 0 = lim (x, y).
∂x (x,y)→(0,0) ∂x ∂y (x,y)→(0,0) ∂y
C’est exactement dire que les dérivées partielles de f sont aussi continues en l’origine, ce qui
assure que f est C 1 sur R2 tout entier.

1.10. Exercices 53
7. Pour (x, y) 6= (0, 0), la dérivée seconde croisée vaut
∂2f y 4 + 6x2 y 2 − 3x4

(x, y) = y 2 × .
∂x∂y (x2 + y 2 )3
8. La suite (xn , yn ) = (1/n, 0) tend vers l’origine et
∂2f
(1/n, 0) = 0 −−−→ 0.
∂x∂y n→∞
Par ailleurs, la suite (xn , yn ) = (0, 1/n) tend elle aussi vers l’origine, mais cette fois
∂2f
(0, 1/n) = 1 −−−→ 1.
∂x∂y n→∞
Ceci prouve que la dérivée seconde croisée n’admet pas de limite en (0, 0).
9. Pour x différent de 0, les questions 4 et 5 donnent
∂f ∂f
(x, 0) − (0, 0)
∂y ∂y
= 0 −−−→ 0.
x x→0
Par définition, cette limite est la dérivée partielle par rapport à x de la dérivée partielle de
f par rapport à y au point (0, 0). Ainsi nous venons de montrer que
∂2f

∂ ∂f
(0, 0) = (0, 0) = 0.
∂x ∂y ∂x∂y
10. Pour y différent de 0, les questions 2 et 3 donnent
∂f ∂f
(0, y) − (0, 0) y−0
∂x ∂x = = 1 −−−→ 1.
y y y→0
En d’autres termes,
∂2f

∂ ∂f
(0, 0) = (0, 0) = 1.
∂y ∂x ∂y∂x
11. Le théorème de Schwarz dit que si f est C 2 sur un ouvert U (autrement dit si elle admet des
dérivées partielles secondes et que celles-ci sont continues) alors en tout point (x, y) de U ,
les dérivées secondes croisées coïncident, c’est-à-dire
∂2f ∂2f
(x, y) = (x, y).
∂x∂y ∂y∂x
Dans le présent contexte, le problème vient de ce qui se passe en l’origine. La fonction f y
admet bien des dérivées secondes croisées mais celles-ci ne sont pas égales puisque, comme
on vient de le voir,
∂2f ∂2f
(0, 0) = 0 6= 1 = (0, 0).
∂x∂y ∂y∂x
Ceci n’est pas étonnant au vu du résultat de la question 8, qui montrait que la dérivée se-
conde croisée en dehors de l’origine (prise dans n’importe quel ordre de dérivation) n’admet
pas de limite en l’origine.

Exercice 1.29 (Exponentielle complexe)

On peut définir l’exponentielle complexe par
C →C

exp :
z = x + iy 7→ exp z = ex+iy = ex cos y + iex sin y
On peut aussi la voir comme une fonction de 2 variables
R2 → R2

exp :
(x, y) 7→ (u = ex cos y, v = ex sin y)
1. Calculer les dérivées partielles de u et v par rapport à x et y.
2. Montrer que le jacobien de l’exponentielle ainsi définie ne s’annule jamais. La fonction exp
est-elle pour autant injective ?
3. Vérifier les relations de Cauchy-Riemann dans ce cas particulier :
(
∂u ∂v
∂x = ∂y
∂u ∂v
∂y = − ∂x
∂2f ∂2f
En déduire que u et v sont harmoniques, i.e. ∆u = ∆v = 0, où ∆f = ∂x2
+ ∂y 2
est le
Laplacien de f .
Exercice 1.30 (Fonctions harmoniques)

On définit la fonction f de R3 \ {(0, 0, 0)} dans R par :
1
f (x, y) = p .
x2 + y 2 + z 2
Montrer que f est harmonique, c’est-à-dire que :
2
∂2f ∂2f

∂ f
∀(x, y, z) 6= (0, 0, 0) + 2 + 2 (x, y, z) = 0.
∂x2 ∂y ∂z
Corrigé
Par les propriétés opératoires classiques, f est de classe C 2 sur R3 \ {(0, 0, 0)} (et même de classe
C ∞ ). Le calcul de ∂f ∂f ∂f
∂x permet de déduire ∂y et ∂z par symétrie des rôles :
 ∂f x
 ∂x = − 2 2 2 32
(x +y +z )


 ∂f y
∂y = − 3
 (x2 +y 2 +z 2 ) 2
∂f z
=−


 ∂z 3
(x2 +y 2 +z 2 ) 2
puis de même : 
∂2f 2x2 −y 2 −z 2

 ∂x2 = 5

 (x2 +y 2 +z 2 ) 2
∂2f −x2 +2y 2 −z 2

∂y 2 = 5
 (x2 +y 2 +z 2 ) 2
∂2f −x2 −y 2 +2z 2

=


 ∂z 2 5
(x2 +y 2 +z 2 ) 2
ce qui donne bien

∂2f ∂2f ∂2f

+ + (x, y, z) = 0 ∀(x, y, z) 6= (0, 0, 0).
∂x2 ∂y 2 ∂z 2

1.10. Exercices 55
Exercice 1.31 (Fonctions harmoniques (bis))

Soit f : (x, y) 7→ f (x, y) une fonction de classe C 2 de R2 dans R. Soit ϕ : (r, θ) 7→ ϕ(r, θ) de
R+ × [0, 2π[ dans R la fonction associée en coordonnées polaires, c’est-à-dire définie pour tout
couple (r, θ) tel que (x, y) = (r cos θ, r sin θ) par :
ϕ(r, θ) = f (r cos θ, r sin θ) = f (x, y).

∂ϕ ∂ϕ ∂f ∂f
1. Exprimer ∂r et ∂θ en fonction de ∂x , ∂y , r et θ.
2. Montrer que le Laplacien de f , défini par :
∂2f ∂2f
∆f = + ,
∂x2 ∂y 2
est donné en coordonnées polaires par :
∂ 2 ϕ 1 ∂ϕ 1 ∂2ϕ
∆f = + · + · .
∂r 2 r ∂r r 2 ∂θ 2
3. On s’intéresse aux fonctions harmoniques radiales, c’est-à-dire de Laplacien partout nul et
telles que l’image d’un point (x, y) par f ne dépende que de sa distance au centre :
f (x, y) = ϕ(r, θ) = ϕ(r).
Déduire de la question précédente la forme générale de ces fonctions.
Exercice 1.32 (Fonctions harmoniques (ter))

On dit que la fonction f : R2 → R de classe C 2 est harmonique sur R2 si :
∂2f ∂2f
∀(x, y) ∈ R2 (x, y) + (x, y) = 0.
∂x2 ∂y 2
1. Montrer que la fonction f définie par f (x, y) = ex (x cos y − y sin y) est harmonique sur R2 .
2. On suppose que la fonction f est harmonique et de classe C 3 sur R2 . Montrer qu’alors la
fonction g = ∂f
∂x est elle aussi harmonique.
3. De la même façon, on dit que la fonction f : U → R est harmonique sur l’ouvert U de R3
si :
∂2f ∂2f ∂2f
∀(x, y, z) ∈ U (x, y, z) + (x, y, z) + (x, y, z) = 0.
∂x2 ∂y 2 ∂z 2
Montrer que la fonction f : (x, y, z) 7→ arctan xy + arctan yz + arctan xz est harmonique sur
R∗ × R∗ × R∗ .
Corrigé
1. La fonction f admet pour dérivées premières :
(
∂f x
∂x = e (x cos y − y sin y + cos y)
∂f x
∂y = −e (x sin y + y cos y + sin y)
et pour les dérivées secondes qui nous intéressent :

( 2
∂ f
∂x 2 = ex (x cos y − y sin y + 2 cos y)
2
∂ f x
∂y 2 = −e (x cos y − y sin y + 2 cos y)
On en déduit que f est harmonique sur R2 .

2. On suppose que la fonction f est harmonique et de classe C 3 sur R2 . On a alors :

∂2g ∂2g ∂3f ∂ 2 ∂f

+ = + 2 .
∂x2 ∂y 2 ∂x3 ∂y ∂x
Or par le Théorème de Schwarz on a :
∂ 2 ∂f ∂3f ∂ ∂2f

= = ,
∂y 2 ∂x ∂x∂y 2 ∂x ∂y 2
ce qui donne :
∂2g ∂2g ∂2f ∂2f

∂ ∂
2
+ 2 = 2
+ 2 = (0) = 0,
∂x ∂y ∂x ∂x ∂y ∂x
et la fonction g est bien harmonique.
3. La dérivée partielle de f par rapport à x est :
∂f y z
=− 2 + .
∂x x + y 2 z 2 + x2
Les deux autres s’en déduisent, vue la symétrie des rôles joués par x, y et z. On a alors la
dérivée seconde de f par rapport à x :
∂2f 2xy 2xz

2
= 2 2 2
− 2 .
∂x (y + x ) (z + x2 )2
Les deux autres s’en déduisent à nouveau et on vérifie alors sans problème que f est harmo-
nique sur (R∗ )3 .
Exercice 1.33 (Février 2014)

R2 → R2

ϕ:
(x, y) 7→ (ϕ1 (x, y), ϕ2 (x, y)) = (ex cos y, ex sin y)
1. Calculer les dérivées partielles de la fonction ϕ1 par rapport à x et y. Idem pour ϕ2 . En

déduire la matrice jacobienne Jϕ (x, y) de ϕ au point (x, y).
2. Calculer le déterminant de celle-ci, montrer que ce déterminant ne s’annule jamais. La fonc-
tion ϕ est-elle pour autant injective ?
3. On appelle Laplacien d’une fonction f : R2 → R de classe C 2 la quantité ∆f = ∂∂xf2 + ∂∂yf2
2 2
et on dit que f est harmonique si son Laplacien est nul en tout point (x, y). Montrer que les
fonctions ϕ1 et ϕ2 sont harmoniques.
4. Soit f : R2 → R de classe C 2 et ϕ : (r, θ) 7→ ϕ(r, θ) de R+ × [0, 2π[ dans R la fonction
associée en coordonnées polaires, c’est-à-dire définie pour tout couple (r, θ) tel que (x, y) =
(r cos θ, r sin θ) par ϕ(r, θ) = f (r cos θ, r sin θ). Exprimer ∂ϕ ∂ϕ
∂r (r, θ) et ∂θ (r, θ) en fonction de
∂f ∂f
∂x , ∂y , r et θ.
5. Montrer que le Laplacien de f admet l’expression suivante en coordonnées polaires :
∂ 2 ϕ 1 ∂ϕ 1 ∂2ϕ
∆f = + · + · .
∂r 2 r ∂r r 2 ∂θ 2
Corrigé

1.10. Exercices 57
1. Les fonctions ϕ1 et ϕ2 sont clairement C ∞ sur R2 . Pour ϕ1 , on obtient

∂ϕ1 ∂ϕ1
(x, y) = ex cos y et (x, y) = −ex sin y.
∂x ∂y
Pour ϕ2 , de la même façon,
∂ϕ2 ∂ϕ2
(x, y) = ex sin y et (x, y) = ex cos y.
∂x ∂y
La matrice jacobienne de ϕ en découle :
∂ϕ1 ∂ϕ1
 
(x, y) (x, y) x
e cos y −ex sin y

 ∂x ∂y
Jϕ (x, y) =  ∂ϕ = .

2 ∂ϕ2 ex sin y ex cos y
(x, y) (x, y)
∂x ∂y
2. On en déduit que det Jϕ (x, y) = e2x > 0. Néanmoins, la fonction ϕ n’est pas injective
puisqu’on voit par exemple que ϕ(0, 0) = ϕ(0, 2π) = (1, 0). Notons que ceci ne pourrait
arriver avec une fonction ϕ : R → R de classe C 1 . En effet, si sa dérivée ne s’annulait pas sur
R, celle-ci serait de signe constant (par continuité) et ϕ serait donc strictement monotone,
donc injective.
3. Des calculs élementaires donnent
∂ 2 ϕ1 ∂ 2 ϕ1
∆ϕ1 (x, y) = (x, y) + (x, y) = ex cos y − ex cos y = 0,
∂x2 ∂y 2
et
∂ 2 ϕ2 ∂ 2 ϕ2
∆ϕ2 (x, y) = (x, y) + (x, y) = ex sin y − ex sin y = 0,
∂x2 ∂y 2
ce qui montre que les fonctions ϕ1 et ϕ2 sont bien harmoniques.
4. Puisque ϕ(r, θ) = f (r cos θ, r sin θ), la règle de dérivation en chaîne donne d’une part
∂ϕ ∂f ∂f
(r, θ) = cos θ (r cos θ, r sin θ) + sin θ (r cos θ, r sin θ),
∂r ∂x ∂y
et d’autre part
∂ϕ ∂f ∂f
(r, θ) = −r sin θ (r cos θ, r sin θ) + r cos θ (r cos θ, r sin θ).
∂θ ∂x ∂y
5. Partant de la question précédente, on obtient
∂2ϕ
(r, θ)
∂r 2
∂2f ∂2f ∂2f
= cos2 θ 2 (r cos θ, r sin θ) + 2 cos θ sin θ (r cos θ, r sin θ) + sin2 θ 2 (r cos θ, r sin θ)
∂x ∂x∂y ∂y
et, en convenant de noter “() = (r cos θ, r sin θ)” afin d’alléger les écritures,
∂2ϕ
(r, θ)
∂θ 2
∂f ∂f ∂2f ∂2f ∂2f
= −r cos θ () − r sin θ () + r 2 sin2 θ 2 () − 2r 2 cos θ sin θ () + r 2 cos2 θ 2 ().
∂x ∂y ∂x ∂x∂y ∂y

On en déduit que
∂2ϕ 1 ∂ϕ 1 ∂2ϕ
2
(r, θ) + · (r, θ) + 2 · (r, θ)
∂r r ∂r r ∂θ 2
∂2f ∂2f
= (r cos θ, r sin θ) + (r cos θ, r sin θ) = ∆f (r cos θ, r sin θ),
∂x2 ∂y 2
ce qui était le résultat voulu.
Exercice 1.34 (Recherche d’extrema et méthode de Gauss)

Soit f (x, y) = x2 + xy + y 2 − 3x − 6y.
1. Trouver les points critiques de f et déterminer leur nature.
2. On veut montrer que le minimum obtenu ci-dessus est un minimum global sur R2 . On utilise
pour cela la méthode de réduction de Gauss : elle consiste à écrire f (x, y) comme somme
et/ou différence de carrés.
(a) Mettre f (x, y) + 9 sous la forme d’une somme de deux carrés.
(b) Conclure avec f sous cette forme.
Exercice 1.35 (Minimum local non global)

On veut étudier les extrema de la fonction f de R2 dans R définie par :
f (x, y) = x2 + 2xy + y − y 3 .
1. Déterminer les points critiques de f .

2. Donner leur nature (extremum local, point selle ...).
3. Montrer que le minimum local obtenu n’est pas un minimum global pour f .
Corrigé
1. f est de classe C 2 (et même de classe C ∞ ) par les théorèmes opératoires classiques : on
peut donc appliquer la méthode des dérivées premières et secondes pour l’étude des extrema
locaux. On commence par calculer ses dérivées partielles premières, soit :
(
∂f
∂x (x, y) = 2(x + y)
∂f 2
∂y (x, y) = 2x + 1 − 3y
La résolution du système d’équations :

∂f ∂f
(x, y) = (x, y) = 0
∂x ∂y
donne les deux points critiques A(1, −1) et B(−1/3, 1/3).
2. Les dérivées partielles secondes de f sont :
 ∂2f
 ∂x22 (x, y) = 2

∂ f
∂x∂y (x, y) = 2
 ∂2f

∂y 2
(x, y) = −6y
Avec les notations de Monge, on obtient donc, au point A, pr − q 2 = 8 > 0 avec p = 2 > 0,
donc A correspond à un minimum local pour f .
Au point B, pr − q 2 = −8 < 0 donc B correspond à un point selle (ni minimum local ni
maximum local).

1.10. Exercices 59
3. La valeur de f au point A est f (1, −1) = −1, or on a par exemple f (0, 2) = −6 < f (1, −1),
donc A n’est pas un minimum global.
Remarque. Notons que, sans même chercher les minima locaux, il était clair dès le début
que f ne pouvait admettre de minimum global sur R2 puisque :
lim f (0, y) = lim (y − y 3 ) = −∞

y→+∞ y→+∞
Cette absence de minimum global alors que f est continue vient bien entendu du fait que
R2 n’est pas compact.
Exercice 1.36 (Extrema et passage en polaires)

On définit la fonction f de R2 dans R par :
2 +y 2 )
f (x, y) = (x2 − y 2 )e−(x .
1. Trouver les points critiques de f et donner leur nature.

2. (a) Montrer que ∀(ρ, θ) ∈ R+ × [0, 2π[, on a l’inégalité :
2
|f (ρ cos θ, ρ sin θ)| ≤ ρ2 e−ρ .
(b) Soit g de R+ dans R définie par :

2
g(ρ) = ρ2 e−ρ .
Etudier les variations de g. En déduire que ∀(x, y) ∈ R2 :

1 1
− ≤ f (x, y) ≤ .
e e
(c) En déduire que les extrema trouvés en 1. sur le cercle unité sont des extrema globaux.
Corrigé
1. f est clairement C ∞ . La résolution du système d’équations
∂f ∂f
(x, y) = (x, y) = 0
∂x ∂y
donne cinq points critiques : l’origine du repère O(0, 0) ainsi que 4 points sur le cercle unité
A1 (1, 0), A2 (−1, 0), A3 (0, 1) et A4 (0, −1). Par la méthode classique de Monge, on montre
que O est un point selle, que A3 et A4 sont des minima locaux alors que A1 et A2 sont des
maxima locaux.
2. (a) On a :
2 2
|f (ρ cos θ, ρ sin θ)| = | cos 2θ|ρ2 e−ρ ≤ ρ2 e−ρ .
(b) Soit g de R+ dans R définie par :

2
g(ρ) = ρ2 e−ρ .
Via l’étude de ses variations, on vérifie que g est majorée par 1e .La question précédente
implique donc que
1 1
∀(x, y) ∈ R2 − ≤ f (x, y) ≤ .
e e

(c) Puisque
1
f (1, 0) = f (−1, 0) = ,
e
avec 1
e majorant de f sur R2 , et comme
1
f (0, 1) = f (0, −1) = − ,
e
avec − 1e minorant de f sur R2 , on en déduit que A1 et A2 sont les maxima globaux de
f tandis que A3 et A4 sont ses minima globaux.
Exercice 1.37 (Monge mis à mal)

Soit f la fonction réelle définie sur R2 par :
f (x, y) = x exp(−x − y 4 ).
1. Montrer que f admet un unique point critique et le déterminer.

2. Montrer qu’on ne peut pas déterminer a priori la nature de ce point critique en utilisant
uniquement les notations de Monge.
3. Soit ϕ la fonction de R dans R définie par :
ϕ(t) = te−t .
Etudier les variations de ϕ et montrer que pour tout t ∈ R :

1
ϕ(t) ≤ ϕ(1) = .
e
4. En déduire que pour tout (x, y) ∈ R2 :
1
f (x, y) ≤ .
e
5. Conclure.
Corrigé
f est clairement de classe C ∞ sur R2 .
1. Les points critiques de f s’obtiennent à partir du système
(
∂f −x−y 4 = 0
∂x (x, y) = (1 − x)e
∂f 3 −x−y 4 = 0
∂y (x, y) = −4xy e
qui possède l’unique solution (x, y) = (1, 0). Donc si f admet un extremum, il est forcément
situé en A = (1, 0).
2. Le calcul des dérivées secondes de f donne :
 2
∂ f −x−y 4
 ∂x2 = (x − 2)e





 2
∂ f 4
∂x∂y = 4y 3 (x − 1)e−x−y




 ∂ 2 f2 = 4xy 2 (4y 4 − 3)e−x−y4


∂y
Avec les notations de Monge, on obtient au point A : pr − q 2 = 0, on ne peut donc pas

conclure sur la nature du point critique en utilisant la méthode de Monge.

1.10. Exercices 61
3. En examinant les variations de ϕ : t → t e−t , on constate que pour tout t ∈ R, on a
t e−t ≤ ϕ(1) = e−1 .
4. On peut déduire de la question précédente que

4 4
f (x, y) = xe−x e−y ≤ e−1 e−y ≤ e−1 = f (1, 0)
5. On conclut que l’on a un maximum global de f en A.
Exercice 1.38 (Une bizarrerie de Peano)

On considère la fonction f de R2 dans R définie par :
f (x, y) = (y − x2 )(y − 2x2 ).

−
→ − →
1. Tracer, dans un repère (O, i , j ), les courbes C1 et C2 d’équations y − x2 = 0 et y − 2x2 = 0.
2. Sur ce même graphique, indiquer le signe de f en fonction de la position par rapport aux
courbes C1 et C2 .
3. Déterminer le(s) point(s) critique(s) de f et en préciser la nature (minimum local...).
C2 C1
− −
+ +
Figure 1.26 – Courbes C1 et C2 .
Corrigé
1. Les courbes C1 et C2 sont deux paraboles de sommet O, C2 étant au-dessus de C1 .
2. Soit M (x, y) ∈ R2 . Il faut distinguer trois cas :
– Si y > 2x2 (d’où y > x2 ), i.e. si M est au-dessus de C2 , alors f (x, y) > 0.
– Si y > x2 et y < 2x2 , i.e. si M est au-dessus de C1 et au-dessous de C2 , alors f (x, y) < 0.
– Si y − x2 < 0 (d’où y < 2x2 ), i.e. si M est au-dessous de C1 , alors f (x, y) > 0.
3. f (x, y) = 2x4 − 3x2 y + y 2 est de classe C ∞ en tant que fonction polynôme et ses dérivées
partielles sont : (
∂f 3
∂x = 8x − 6xy
∂f 2
∂y = −3x + 2y
Donc M (x, y) est un point critique si :
2x(4x2 − 3y) = 0

3x2 − 2y =0

x = 0 implique y = 0 donc le point O est un point critique. Pour x différent de 0, le système

se ramène à :
y = 43 x2

y = 32 x2
qui n’a pas de solution non nulle. Donc O est le seul point critique.
Puisque f (0, 0) = 0, l’étude du signe de f montre clairement que f ne peut admettre en ce
point ni maximum ni minimum local : tout voisinage de O comporte en effet à la fois des
points d’image positive et des points d’image négative par f . On peut également montrer
que ce n’est pas un point selle pour f via le calcul des dérivées secondes :
 ∂2f
= 24x2 − 6y

 ∂x22
  p =0
∂ f
∂x∂y = −6x ⇒ q =0
 ∂2f
 
r =2
∂y 2 =2
d’où pr − q 2 = 0 (qui n’est pas négatif).

Remarque. La particularité de cette fonction (notée par le mathématicien italien Peano à
la fin du XIXe siècle) est la suivante : si l’on s’approche du point O en restant sur une droite
(n’importe laquelle), alors O est un minimum. En effet, soit M (x, αx) sur la droite Dα et
ϕα (x) = f (x, αx) la fonction associée : on obtient
ϕα (x) = 2x4 − 3αx3 + α2 x2 ,
donc, quel que soit α, ϕ′α (0) = 0 et ϕ′′α (0) = 2α2 > 0, ce qui prouve bien que O est un
minimum local. Pourtant, on vient de voir que O n’est pas un minimum pour f .
Exercice 1.39 (Etude d’extrema)

Soit f : (x, y) 7→ x((ln x)2 + y 2 ).
1. Préciser le domaine de définition de f .
2. (a) Trouver les points critiques de f .
(b) Déterminer leur nature.
3. (a) Montrer que le minimum local obtenu est en fait un minimum global.
(b) f admet-elle un maximum global ?
Corrigé
1. Df =]0, +∞[×R.
2. (a) f est de classe C ∞ sur son domaine et admet pour dérivées partielles
(
∂f 2 2
∂x = (ln x) + 2 ln x + y
∂f
∂y = 2xy
Pour que M (x, y) soit un point critique de f , il faut donc, d’après la deuxième équation
et puisque x > 0, que y = 0. En reportant dans la première équation, ceci implique
(ln x)2 + 2 ln x = 0, i.e. x = 1 ou x = e−2 . On a donc deux points critiques : A(1, 0) et
B(e−2 , 0).
(b) Le calcul des dérivées secondes de f donne
 ∂2f
 ∂x22
 = 2 · 1+ln
x
x
∂ f
∂x∂y = 2y
 ∂2f

∂y 2
= 2x

1.10. Exercices 63
Avec les notations de Monge, on obtient :

- Au point A, pr − q 2 = 4 avec p = 2 > 0, donc A est un minimum local pour f .
- Au point B, pr − q 2 = −4, donc B est un point col pour f .
3. (a) On a f (1, 0) = 0, or f est le produit de deux termes positifs donc est toujours positive,
ne s’annulant qu’au point A. On en déduit que A est le minimum global de f .
(b) Df est ouvert donc un maximum global sur Df serait a fortiori un maximum local :
puisque l’étude des points critiques n’en a pas donné, f n’admet pas de maximum global.
On arrive à la même conclusion en notant tout simplement que limx→+∞ f (x, 0) = +∞.
Exercice 1.40 (Polynôme)

On définit la fonction f de R2 dans R par f (x, y) = x2 − 2xy + y4 .
4
1. Montrer que f admet trois points critiques.

2. Déterminer leur nature.
3. Vérifier que l’on peut aussi écrire :
2
y2

2
f (x, y) = (x − y) + − 1 − 1.
2
4. En déduire que les extrema locaux obtenus sont des extrema globaux.
Corrigé
La fonction f est clairement de classe C ∞ , ce qui légitime les calculs qui suivent.
1. Calcul des dérivées partielles : (
∂f
∂x = 2x − 2y
∂f
∂y = −2x + y 3
Recherche des points critiques : la première équation équivaut à y = x, ce qui donne par
substitution dans la seconde :
x3 − 2x = 0 ⇔ x(x2 − 2) = 0,
√ √
√ x√= 2 ou x = − 2.√Au total
c’est-à-dire que x = 0 ou √ on a donc trois points critiques :
l’origine O, le point A( 2, 2) et le point B(− 2, − 2).
2. Le calcul des dérivées à l’ordre deux donne :
 ∂2f
 ∂x22
 =2
∂ f
∂x∂y = −2
∂2f

= 3y 2

∂y 2
Au point O : pr − q 2 = −4, donc c’est un point selle.

Au point A : pr − q 2 = 8 > 0 avec p = 2 > 0, donc c’est un minimum local.
Au point B : pr − q 2 = 8 > 0 avec p = 2 > 0, donc c’est aussi un minimum local.
3. On vérifie sans problème que :
2
y2

2
f (x, y) = (x − y) + − 1 − 1.
2

4. Par positivité des carrés, on en déduit que pour tout couple (x, y) :
f (x, y) ≥ −1.
√ √ √ √
Or f ( 2, 2) = f (− 2, − 2) = −1 donc A et B correspondent bien à des minima globaux
sur R2 .
Exercice 1.41 (Densité d’un vecteur gaussien)

On considère la fonction f définie sur R2 par :
1 − x2 +y2
f (x, y) = e 2 .
2π
Cette fonction f correspond à la densité de probabilité d’un vecteur gaussien centré 10 et de matrice
de covariance égale à l’identité.
1. Trouver les points critiques de f et déterminer leur nature.
2. Montrer que le maximum local de f est un maximum global.
3. Représenter la surface définie par f .
(x−1)2 +(y−2)2
1 −
4. Représenter celle définie par g(x, y) = 8π e
8 .
Exercice 1.42 (Optimisation et Inégalité de Cauchy-Schwarz)

R2 → R
(
f: (x, y) 7→ √1+x−y
2 2 1+x +y
1. Montrer que f admet un unique point critique.

2. Montrer que c’est un maximum local.
3. On considère deux vecteurs u = [x1 , y1 , z1 ]′ et v = [x2 , y2 , z2 ]′ de R3 muni du produit scalaire
usuel. Rappeler l’inégalité de Cauchy-Schwarz. Quand a-t-on égalité ?
4. Appliquer cette inégalité aux deux vecteurs u = [1, x, −y]′ et v = [1, 1, 1]′ .
5. En déduire que le maximum local trouvé plus haut est le maximum global de f sur R2 .
Corrigé
1. La fonction f est de classe C ∞ . Ses dérivées partielles premières sont :
(
∂f 2 2 2 −3/2
∂x = (1 + y + xy − x)(1 + x + y )
∂f 2 2 2 −3/2
∂y = (−1 − x − xy − y)(1 + x + y )
Puisque 1 + x2 + y 2 > 0, tout point critique vérifie :
1 + y 2 + xy − x = 0

−1 − x2 − xy − y = 0
La somme des deux équations donne
y 2 − x2 − x − y = 0 ⇔ (y + x)(y − x) − (y + x) = 0 ⇔ (y + x)(y − x − 1) = 0,
10. i.e. de moyenne nulle.

1.10. Exercices 65
donc nécessairement tout point critique vérifie y = x + 1 ou y = −x. Si y = x + 1, on obtient

en reportant dans la première équation ci-dessus :
1 + (x + 1)2 + x(x + 1) − x = 0 ⇔ x2 + x + 1 = 0,
ce qui est impossible, ce trinôme étant toujours strictement positif.

Si y = −x, alors en reportant dans la première équation on a :
1 + x2 − x2 − x = 0 ⇔ x = 1,
d’où l’on déduit que l’unique point critique est A(1, −1).
2. Pour montrer que c’est un maximum local, on calcule les dérivées partielles secondes :
 ∂2f
 ∂x
 2 = (y − 1)(1 + x2 + y 2 )−3/2 − 3x(1 + y 2 + xy − x)(1 + x2 + y 2 )−5/2
2
∂ f 2 2 −3/2 − 3y(1 + y 2 + xy − x)(1 + x2 + y 2 )−5/2
∂x∂y = (2y + x)(1 + x + y )
 ∂2f

∂y 2
= (−x − 1)(1 + x2 + y 2 )−3/2 − 3y(−1 − x2 − xy − y)(1 + x2 + y 2 )−5/2
Avec les notations de Monge, on en déduit qu’au point A :
 p = −2 · 3−3/2

q = −3−3/2
r = −2 · 3−3/2

ce qui donne pr − q 2 = 1/9 > 0, avec p < 0, donc f admet bien un maximum local en A.
3. L’inégalité de Cauchy-Schwarz dit que la valeur absolue du produit scalaire est inférieure ou
égale au produit des normes :
q q
|x1 x2 + y1 y2 + z1 z2 | ≤ x21 + y12 + z12 · x22 + y22 + z22 ,
avec égalité si et seulement si les vecteurs sont colinéaires.

4. Cette inégalité donne ici :
√ p
|1 + x − y| ≤ 3 1 + x2 + y 2 .
5. On en déduit en particulier que :

√ p √
∀(x, y) ∈ R2 1 + x − y ≤ 3 1 + x2 + y 2 ⇒ f (x, y) ≤ 3,
√
or f (1, −1) = 3, donc f admet en A un maximum global. Il est unique, car pour avoir
égalité dans l’inégalité de Cauchy-Schwarz, il faut avoir des vecteurs colinéaires, c’est-à-dire
que [1, x, −y]′ doit être colinéaire à [1, 1, 1]′ . Vu que la première coordonnée vaut 1 pour les
deux vecteurs, c’est encore dire que x = 1 et y = −1.
Exercice 1.43 (Extrema libres)

Soit la fonction f : (x, y) 7→ x4 + y 4 − 4xy, définie sur R2 .
1. Montrer que f admet trois points critiques.
2. Etudier la nature des points critiques en utilisant les notations de Monge.
3. Vérifier que f (x, y) = (x2 − y 2 )2 + 2(xy − 1)2 − 2.
4. En déduire que les extrema locaux obtenus précédemment sont en fait des extrema globaux.
Corrigé

1. f est de classe C 2 (et même de classe C ∞ ) par les théorèmes opératoires classiques : on
peut donc appliquer la méthode des dérivées premières et secondes pour l’étude des extrema
locaux. On commence par calculer ses dérivées partielles premières, soit :
(
∂f 3
∂x (x, y) = 4(x − y)
∂f 3
∂y (x, y) = 4(y − x)
La résolution du système d’équations :
∂f ∂f
(x, y) = (x, y) = 0
∂x ∂y
donne les trois points critiques O(0, 0), A(1, 1) et B(−1, −1).
2. Les dérivées partielles secondes de f sont :
∂2f


 ∂x22 (x, y) = 12x2
∂ f
∂x∂y (x, y) = −4
∂2f

(x, y) = 12y 2

∂y 2
Avec les notations de Monge, on obtient donc au point O, p = 0, r = 0 et q = −4, on en

déduit que pr −q 2 = −16 < 0 donc O correspond à un point selle pour f . Au point A, p = 12,
r = 12 et q = −4 d’où pr − q 2 = 128 > 0 avec p > 0, donc A correspond à un minimum
local. De même, au point B, pr − q 2 = 128 > 0 avec p > 0, donc B correspond aussi à un
minimum local.
3. On vérifie sans problème que :
f (x, y) = (x2 − y 2 )2 + 2(xy − 1)2 − 2.
4. Par positivité des carrés, on en déduit que pour tout couple (x, y) :
f (x, y) ≥ −2.
Or f (1, 1) = f (−1, −1) = −2, donc A et B correspondent bien aux minima globaux sur R2 .
Exercice 1.44 (Optimisation sous contraintes)

Les coordonnées x, y et z sont supposées positives ou nulles. On cherche le maximum de la fonction
f (x, y, z) = x + y + z sous la contrainte x2 + y 2 + z 2 = 1.
1. Expliquer pourquoi ce maximum existe.
2. Ecrire le Lagrangien associé au problème.
3. Déterminer alors le point où le maximum est atteint et la valeur de ce maximum.
4. Vous vous déplacez sur toute la sphère unité et vous vous demandez dans quelle(s) situation(s)
la somme des distances aux trois plans de coordonnées (c’est-à-dire x = 0, y = 0 et z = 0)
est maximale. Qu’en dire ?
Corrigé
Les coordonnées x, y et z sont supposées positives. On cherche le maximum de la fonction
f (x, y, z) = x + y + z sous la contrainte x2 + y 2 + z 2 = 1.

1.10. Exercices 67
1. La surface
S = {(x, y, z) : x ≥ 0, y ≥ 0, z ≥ 0, x2 + y 2 + z 2 = 1}
est un huitième de sphère, avec ses bords : c’est clairement un compact, puisque fermé et
borné. La fonction f est continue sur ce domaine, donc bornée et atteint ses bornes, en
particulier son maximum.
2. Le lagrangien associé au problème est la fonction de 4 variables :
L(x, y, z, λ) = x + y + z + λ(x2 + y 2 + z 2 − 1).
3. On cherche les points critiques du lagrangien, ce qui donne :



 1 + 2λx = 0
1 + 2λy = 0


 1 + 2λz = 0
 2
x + y2 + z2 = 1
Le multiplicateur de Lagrange λ est strictement négatif au vu des trois premières équations et
1
du fait que x, y et z sont supposés positifs. On en déduit que x = y = z = − 2λ . En reportant
√ √ √
dans la dernière équation, il s’ensuit que l’unique point critique est A(1/ 3, 1/ 3, 1/ 3).
C’est un maximum ou un minimum : ça ne peut être un minimum, puisqu’on a par exemple
√ √ √ √
f (1, 0, 0) = 1 < f (1/ 3, 1/ 3, 1/ 3) = 3,
donc c’est le maximum.

4. La somme des distances aux trois plans de coordonnées est |x| + |y| + |z|. Dans S, on vient
de voir que cette quantité est maximale en l’unique point A. Pour des raisons de symétrie,
si on se promène sur toute la sphère,
√ il y√aura donc
√ 8 points où la quantité est maximale :
tous les points de la forme (±1/ 3, ±1/ 3, ±1/ 3).
Exercice 1.45 (Extrema libres et extrema liés)

1. Soit f : (x, y) 7→ (x − y)2 + (x + y)3 , définie sur R2 .
(a) Montrer que f admet un seul point critique.
(b) Trouver la nature de ce point (on pourra étudier f (x, x) au voisinage de 0).
(c) f est-elle bornée ?
2. On veut mettre le nombre 1728 sous la forme d’un produit de 3 nombres positifs de sorte
que leur somme soit minimale.
(a) Écrire ceci sous la forme d’un problème d’optimisation sous contrainte. Donner le La-
grangien associé au problème.
(b) Déterminer alors l’unique solution du problème.
Corrigé
1. On étudie la fonction f : (x, y) 7→ (x − y)2 + (x + y)3 .
(a) Calcul des dérivées partielles :
(
∂f 2
∂x = 2(x − y) + 3(x + y)
∂f 2
∂y = −2(x − y) + 3(x + y)
Recherche des points critiques : la somme et la différence des deux équations implique
(x + y) = 0 et (x − y) = 0, c’est-à-dire que x = y = 0 : l’origine O est le seul point
critique.

(b) La méthode de Monge ne donne rien puisqu’après calculs on obtient pr − q 2 = 0. Par

contre, on remarque que f (0, 0) = 0, donc si f admettait un extremum local en ce point,
elle serait de signe constant en son voisinage. Or f (x, x) = 8x3 , qui n’est pas de signe
constant autour de 0.
(c) f n’est bornée ni inférieurement, ni supérieurement. En effet, on voit par exemple que
lim f (x, x) = −∞ et lim f (x, x) = +∞.

x→∞ x→+∞
2. On veut mettre le nombre 1728 sous la forme d’un produit de 3 nombres positifs de sorte
que leur somme soit minimale.
(a) Ceci revient à minimiser :
f (x, y, z) = x + y + z,
sous la contrainte :
g(x, y, z) = xyz − 1728 = 0,
avec x, y et z positifs. Le lagrangien associé au problème s’écrit donc :
L(x, y, z, λ) = f (x, y, z) + λg(x, y, z) = (x + y + z) + λ(xyz − 1728).
(b) L’ensemble
F = {(x, y, z) ∈ R3+ , xyz = 1728}
est fermé comme intersection du fermé R3+ et de l’image réciproque du fermé 1728 par
la fonction continue (x, y, z) 7→ xyz. Par ailleurs, on peut clairement se contenter de
chercher la solution dans le pavé fermé borné P = [0, 2000]3 puisqu’on veut minimiser
la somme des 3 nombres. Au total, on cherche donc à minimiser f sur l’ensemble
K = F ∩ P,
compact puisque fermé et borné. Cette fonction étant continue, il existe au moins un
point où ce minimum est atteint.
Par ailleurs, ce point correspond nécessairement à un point critique du lagrangien, c’est-
à-dire :  ∂L
 ∂x = 1 + λyz =0
 ∂L

= 1 + λxz =0
∂y
∂L

 ∂z = 1 + λxy =0
 ∂L
∂λ = xyz − 1728 = 0
Des trois premières équations on déduit aisément que :
p
x = y = z = −1/λ.
La dernière donne alors x3 = 1728, soit x = y = z = 12.
Exercice 1.46 (Extrema sur le bord d’un compact)

Soit la fonction
R2 → R

f:
(x, y) 7→ x3 + y 3
1. f admet-elle un extremum local ?
2. Soit D = {(x, y) ∈ R2 : x2 + y 2 ≤ 1} le disque fermé unité. Justifier le fait que f a un
maximum M et un minimum m dans le disque D.

1.10. Exercices 69
3. Soit A(x0 , y0 ) un point de D où le maximum M est atteint.

(a) Montrer que A est nécessairement au bord de D, c’est-à-dire sur le cercle unité.
(b) Même question pour le minimum m.
4. Déterminer m et M via l’étude de la fonction
[0, 2π] → R

φ:
t 7→ f (cos t, sin t)
Exercice 1.47 (Extrema liés et substitution)

Soit la fonction f définie sur R2 par :
x2 y 2
f (x, y) = + ,
9 4
où les variables x et y sont liées par la contrainte :
x2 + y = 1.
1. Déterminer les points critiques du Lagrangien L(x, y, λ) associé au problème.

2. En utilisant l’équation de la contrainte, exprimer f en fonction de la variable x seulement.
3. Etudier la fonction obtenue et en déduire les natures des points critiques.
4. La fonction f admet-elle un maximum global sous la contrainte ?
Corrigé
1. Notons g(x, y) = x2 + y − 1 la contrainte. Le Lagrangien du problème s’écrit donc :
x2 y 2
L(x, y, λ) = f (x, y) + λg(x, y) = + + λ(x2 + y − 1).
9 4
Ses dérivées partielles sont
∂L
= 2x

 ∂x 9 + 2λx
∂L
∂y = y2 + λ
∂L
= x2 + y − 1

∂λ
La deuxième équation donne λ = − y2 , d’où l’élimination de λ dans la première équation

donne x( 92 − y) = 0. Les solutions de cette dernière équation sont x = 0 ou y = 29 . Par
substitution de x = 0 dans la troisième équation, on obtient la première valeur critique
A1 (0, 1). De même, en remplaçant y = 92 dans la troisième√équation, on a√x2 = 91 et donc les
7 2 7 2
deux autres valeurs critiques pour le Lagrangien sont A2 ( 3 , 9) et A3 (− 3 , 9 ). Au final, on
√
7 2
obtient trois couples (x, y) de valeurs critiques pour le Lagrangien : A1 (0, 1), A2 ( 3 , 9) et
√
7 2
A3 (− 3 , 9 ).
2. D’après l’équation de la contrainte, on a y = 1 − x2 donc y ∈] − ∞, 1]. Par substitution dans
2 2 )2
f , on obtient la nouvelle fonction d’une seule variable F (x) = x9 + (1−x
4 qui s’écrit encore
sous forme bicarrée :
x4 7x2 1
F (x) = − + .
4 18 4

√
3. On en déduit F ′ (x) = x3 − 79 x et les solutions de l’équation F ′ (x) = 0 sont x = 0, x = 3
7
√ √ √
et x = − 37 ,
d’où les trois points critiques du Lagrangien A1 (0, 1), A2 ( 37 , 29 ) et A3 (−7 2
3 , 9)
obtenus par substitution des valeurs de x dans l’équation de la contrainte. Il √ est clair d’après
√
l’étude de F que le minimum de cette fonction est atteint aux points x = 37 et x = − 37 et
le maximum en x = 0. On voit facilement que A1 est un maximum local pour f , A2 et A3
étant des minimums globaux.
4. Si f admet un maximum global, il est forcément atteint en son unique maximum local A1 ,
or on remarque que :
lim f (x, 1 − x2 ) = lim F (x) = +∞,
x→+∞ x→+∞
donc f n’admet pas de maximum global sous la contrainte g.
Exercice 1.48 (Droite des moindres carrés)

On considère le tableau de résultats d’une expérience obtenus pour des couples (xi , yi ) :
xi 1 2 3 4
yi 3 4 3 0
On veut modéliser la dépendance entre x et y par une fonction affine, c’est-à-dire qu’on cherche la
droite ∆a,b : y = ax + b qui modélise “au mieux” les points Mi (xi , yi ) obtenus par l’expérience.
1. Représenter les quatre points Mi (xi , yi ) dans un repère (O,~i, ~j).
2. On note S(a, b) = ((axi + b) − yi )2 , somme des carrés des distances des points Mi aux
P
points Ni de même abscisse et appartenant à la droite ∆a,b . Montrer que S(a, b) peut se
mettre sous la forme
S(a, b) = 30a2 + 20ab + 4b2 − 40a − 20b + constante,
où l’on précisera la valeur de la constante.

3. Etudier le(s) point(s) critique(s) de S(a, b) : montrer l’existence et l’unicité d’un minimum
local (a0 , b0 ). Tracer la droite ∆a0 ,b0 sur le graphique de la première question.
4. On veut montrer que ce minimum est global : appliquer pour cela la méthode de réduction
de Gauss, c’est-à-dire écrire S(a, b) sous la forme
S(a, b) = (2b + 5a − 5)2 + 5(a + 1)2 + constante,
où l’on précisera la valeur de la constante (qui n’est pas la même qu’en question 2). En
déduire que le minimum local est bien global. Interpréter la valeur de la constante sur le
graphique.
Corrigé
1. Les quatre points Mi (xi , yi ) sont représentés Figure 1.27.
2. Par définition, on a
S(a, b) = ((a + b) − 3)2 + ((2a + b) − 4)2 + ((3a + b) − 3)2 + ((4a + b) − 0)2 ,
ce qui donne après calculs
S(a, b) = 30a2 + 20ab + 4b2 − 40a − 20b + 34.

1.10. Exercices 71
∆a0 ,b0
N1 M2
N2 M3
M1
N3
N4
M4
Figure 1.27 – Droite des moindres carrés.
3. Le calcul des dérivées partielles donne


∂S
 ∂a (a, b) = 60a + 20b − 40



 ∂S (a, b) = 20a + 8b − 20



∂b
Rechercher les points critiques revient donc à résoudre le système

60a + 20b − 40 = 0 3a + b = 2 a = −1
⇐⇒ ⇐⇒
20a + 8b − 20 = 0 5a + 2b = 5 b = 5
On obtient donc l’unique point critique (ao , b0 ) = (−1, 5). Sa nature est précisée via la calcul
des dérivées partielles d’ordre 2 :
∂2S

(a, b) = 60 

∂a2







2
∂ S

2 2
(a, b) = 20  =⇒ pr − q = 60 × 8 − 20 = 80 > 0.
∂a∂b 



2

∂ S 

(a, b) = 8


∂b 2
Puisque p = 60 > 0, on obtient bien un minimum local en ce point. La droite ∆ao ,b0 est
représentée Figure 1.27. On l’appelle droite des moindres carrés ou droite de régression.
4. La méthode de réduction de Gauss donne
S(a, b) = (2b + 5a − 5)2 + 5(a + 1)2 + 4.
Une somme de carrés ne pouvant être que positive, on en déduit que S est toujours supérieure
ou égale à 4, le seul cas d’égalité se produisant lorsque les deux carrés sont nuls, i.e. pour
a = −1 et b = 5. Il en découle qu’on a bien un minimum global en (−1, 5). La valeur de la
constante, à savoir 4, est la somme des carrés des écarts verticaux des points Mi à la droite
de régression ∆ao ,b0 : on l’appelle somme des carrés résiduelle.
Remarque. La régression est un thème à part entière des statistiques. Pour en savoir plus,

d’un point de vue théorique comme pratique, on pourra par exemple consulter le livre de
Cornillon et Matzner-Lober [3].
Exercice 1.49 (Entropie)

R3+ → R

H:
(x, y, z) 7→ −x ln x − y ln y − z ln z
avec la convention “0 ln 0 = 0”, ce qui

fait de H une fonction continue sur R3+ . On cherche le
maximum de H sur l’ensemble T = (x, y, z) ∈ R3+ , x + y + z = 1 .
1. Représenter T .
2. Justifier l’existence de ce maximum.
3. Déterminer ce maximum grâce à la méthode des multiplicateurs de Lagrange.
4. Que dire du minimum de H sur T ?
Corrigé
1. Puisque x + y + z = 1 est l’équation d’un plan de R3 et que l’on se restreint au huitième
d’espace {x ≥ 0, y ≥ 0, z ≥ 0}, on en déduit que T est l’intérieur du triangle de sommets
I(1, 0, 0), J(0, 1, 0) et K(0, 0, 1) (bords inclus).
2. Si l’on convient de noter g la fonction continue définie par g(x, y, z) = x + y + z − 1, alors
l’ensemble
T = g−1 ({0}) ∩ R3+
est l’intersection de deux fermés de R3 , donc est fermé. De plus, puisque 0 ≤ x, y, z ≤ 1, T
est borné. Au total, T est un ensemble compact sur lequel H est continue : elle y est donc
bornée et y atteint ses bornes, en particulier son maximum.
3. Le Lagrangien associé au problème est
L(x, y, z, λ) = −x ln x − y ln y − z ln z + λ(x + y + z − 1).
La recherche de ses points critiques conduit au système



 − ln x − 1 + λ = 0
− ln y − 1 + λ = 0 x = y = z = 1/3

⇐⇒

 − ln z − 1 + λ = 0 λ = 1 − ln 3
x+y+z−1 = 0

Le point (1/3, 1/3, 1/3) est donc un point candidat pour le maximum global de H sur T .
Montrer que c’est effectivement le cas est plus délicat (et n’était pas demandé). La façon
la plus expéditive est de constater que la fonction logarithme étant concave, l’inégalité de
convexité (encore appelée inégalité de Jensen dans un cadre probabiliste) assure que
p1 ln x1 + p2 ln x2 + p3 ln x3 ≤ ln(p1 x1 + p2 x2 + p3 x3 ),
pour tout triplet (x1 , x2 , x3 ) de réels positifs et tout triplet (p1 , p2 , p3 ) de poids pi positifs
et de somme égale à 1. Pour tout triplet (x, y, z) de T , il suffit alors d’appliquer ceci avec
1 1 1
(p1 , p2 , p3 ) = (x, y, z) et (x1 , x2 , x3 ) = 3x , 3y , 3z pour obtenir

1 1 1 1 1 1
x ln + y ln + z ln ≤ ln x × +y× +z× =0 ⇐⇒ H(x, y, z) ≤ ln 3.
3x 3y 3z 3x 3y 3z

1.10. Exercices 73
4. Tout point (x, y, z) de T a ses trois coordonnées entre 0 et 1. La fonction u 7→ −u ln u étant

positive sur [0, 1] (et nulle uniquement pour u = 0 et u = 1), il s’ensuit que H est positive
sur T et nulle uniquement aux sommets du triangle, à savoir
H(1, 0, 0) = H(0, 1, 0) = H(0, 0, 1) = 0,
lesquels représentent donc les minima globaux de H.
Exercice 1.50 (Maximum de vraisemblance)

Soit X1 , . . . , Xn des variables aléatoires indépendantes et qui suivent la même loi normale de
moyenne m et de variance v. On appelle vraisemblance de l’échantillon x = (x1 , . . . , xn ) la fonction
définie sur R×]0, +∞[ par :
Pn 2
1 i=1 (xi −m)
fx (m, v) = e− 2v ,
(2πv)n/2
et log-vraisemblance de l’échantillon la fonction ℓx définie par ℓx (m, v) = ln fx (m, v). On veut

estimer les paramètres m et v au maximum de vraisemblance, c’est-à-dire déterminer le couple
(m̂, v̂) tel que ℓx soit maximale en ce point.
1. Donner l’expression de ℓx (m, v).
2. Déterminer les coordonnées (m̂, v̂) du point critique de ℓx en fonction de x1 , . . . , xn .
3. Grâce aux notations de Monge, montrer que ce point correspond bien à un maximum local
de ℓx . On pourrait montrer, par exemple par un argument de convexité, que ce maximum
est en fait global.
Exercice 1.51 (Fonction d’utilité d’un consommateur)

Un consommateur dispose d’une somme R pour constituer un panier composé de x biens b1 et
y biens b2 . Les biens b1 et b2 sont substituables et les quantités x et y sont fractionnables. Pour
sa satisfaction, le consommateur considère comme équivalentes une quantité q de biens b1 et une
quantité 2q de biens b2 et cela pour tout q > 0. En d’autres termes, si U est la fonction d’utilité
du consommateur, alors :
∀(x, y), ∀q > 0 U (x + q, y) = U (x, y + 2q).
1. Montrer que le taux marginal de substitution de b2 en b1 défini par :
∂U ∂U
/ (x, y)
∂x ∂y
est égal à 2.
2. (a) On considère la fonction d’utilité définie par U (x, y) = 2x+y. Montrer que cette fonction
caractérise bien le comportement du consommateur.
(b) Les prix unitaires des biens b1 et b2 sont respectivement p1 = 2 et p2 = 3. Déterminer
la composition (x0 , y0 ) du panier qui optimisera la satisfaction du consommateur.
Exercice 1.52 (Optimisation sous contrainte)

y2
Déterminer les extrema de la fonction f (x, y) = x2 + 2xy + 3 sur le cercle de centre (0, 0) et de
rayon 1.

2.0
1.6
φ(t)
1.2
0.8
0.4
t
0.0
1 2 3 4 5 6
−0.4
Figure 1.28 – La fonction φ sur [0, 2π].
Corrigé
On peut passer par la méthode du lagrangien en écrivant qu’on cherche les extrema de f sous la
contrainte g(x, y) = 0, avec g(x, y) = x2 + y 2 − 1.
On peut aussi se ramener à l’étude des extrema d’une fonction d’une seule variable en paramétrant
le problème, i.e. en écrivant que sur le cercle trigonométrique : (x, y) = (cos t, sin t).
D’où à étudier (voir Figure 1.28)
[0, 2π] → R

φ=
t 7→ f (cos t, sin t) = 31 cos 2t + sin 2t + 23
On note que φ(t + π) = φ(t), donc φ est π−périodique et on se contente de l’étudier sur [0, π]. le
calcul de la dérivée donne :
2
φ′ (t) = 2 cos 2t − sin 2t.
3
Ainsi, sur [0, π], φ′ (t) = 0 si et seulement si t = θ = 12 arctan 3, ou si t = θ + π2 .
On vérifie alors sans problème que φ est croissante entre 0 et θ, décroissante entre θ et θ + π2 , à
nouveau croissante entre θ + π2 et π.
√
Le maximum de φ est√donc φ(θ) = ( 10 + 2)/3. Autrement dit, le maximum √ √de f sur le cercle
trigonométrique
√ est
√ ( 10 + 2)/3 ≈ 1.72, atteint aux deux points (1/ 10, 3/ 10) ≈ (0.32, 0.95)
et (−1/ 10, −3/ 10). √
Le minimum de φ est φ(θ + π2 ) = (− 10 + 2)/3 ≈ −0.39. Autrement dit, le minimum de f
√ √ √
sur √le cercle √trigonométrique est (− 10 + 2)/3, atteint aux deux points (−3/ 10, 1/ 10) et
(3/ 10, −1/ 10). C’est ce qu’illustre la Figure 1.29.
Exercice 1.53 (Extrema sur un pavé)

Déterminer les extrema des fonctions f et g :[0, 1] × [−π, π] → R définies par f (x, y) = x sin y et
g(x, y) = cos y.
Corrigé
Pour l’étude des extrema locaux, on se place à l’intérieur du compact F = [0, 1] × [−π, π], c’est-à-
dire sur l’ouvert U =]0, 1[×] − π, π[. Les surfaces définies par les fonctions f et g sont représentées

1.10. Exercices 75
2.0
1.6
1.2
Z 0.8
0.4
−0.4
−1.0 −1.0
−0.6 −0.6
−0.2 −0.2
0.2 0.2
Y 0.6 0.6 X
1.0 1.0
y2
Figure 1.29 – Représentation de f (x, y) = x2 + 2xy + 3 pour x2 + y 2 = 1.
4
1.0 3
4
2
3 1.0
1
2
Z 1 0
0 Z −1
−1
−2 Y
−2 Y
−3 −3
−1.0 −1.0
−4 −4
0 1.0 0 1.0
X X
Figure 1.30 – Surfaces définies par les fonctions f (à gauche) et g (à droite).

Figure 1.30. Le calcul des dérivées partielles de f sur U donne :

(
∂f
∂x = sin y
∂f
∂y = x cos y
On en déduit que f n’a aucun point critique dans U , donc pas d’extremum local. Néanmoins, f
est continue sur le compact F donc y admet minimum global et maximum global, lesquels sont
atteints en des points nécessairement situés sur le bord de F . Puisque 0 ≤ x ≤ 1 et −1 ≤ sin y ≤ 1,
il est clair que −1 ≤ f (x, y) ≤ 1. Plus précisément, f atteint son minimum absolu −1 au seul point
(1, −π/2) et son maximum absolu 1 au seul point (1, π/2).
On suit la même démarche pour la fonction g. Sur l’ouvert U , on a :
(
∂g
∂x = 0
∂g
∂y = − sin y
On en déduit que g admet une infinité de points critiques : {(x, 0), 0 < x < 1}. Le calcul des
dérivées partielles à l’ordre 2 ne renseigne en rien sur leur nature puisqu’on obtient en chacun de
ces points (avec les notations de Monge) : pr − q 2 = 0. Cependant l’étude directe montre qu’en ces
points g(x, y) = cos y atteint son maximum global 1. Plus généralement, sur le fermé F , g atteint
son minimum global −1 en tous les points des deux segments
{(x, −π), 0 ≤ x ≤ 1} ∪ {(x, π), 0 ≤ x ≤ 1}
et son maximum global 1 sur le segment {(x, 0), 0 ≤ x ≤ 1}.
Exercice 1.54 (Extrema et développement de Taylor)

1. Déterminer les points critiques, et leur nature, de la fonction f (x, y) = xy 2 (1 − x − 2y).
2. Vérifier que le point (1/4, 1/4) est un maximum local via le développement de Taylor de f
à l’ordre 2 en ce point. Est-ce un maximum global ?
3. Que dire des points d’ordonnée nulle ?
Corrigé
La surface définie par f est représentée Figure 1.31.
1. Recherche des points singuliers :
(
∂f
∂x = y 2 (1 − 2x − 2y)
∂f
∂y = 2xy(1 − x − 3y)
La résolution du système donne les points critiques suivants : tous les points d’ordonnée nulle
(x, 0), le point A(1/4, 1/4) et le point B(0, 1/2). Le calcul des dérivées à l’ordre deux donne :
∂2f


 ∂x22 = −2y 2
∂ f
∂x∂y = 2y(1 − 2x − 3y)
∂2f

= 2x(1 − x − 6y)

∂y 2
Au point M (x, 0) : pr − q 2 = 0, donc on ne peut rien dire a priori (cf. question 3).
Au point A : pr − q 2 = 1/32 > 0 avec p = −1/8 < 0, donc maximum local (pas besoin de
Taylor). Voir Figure 1.32 à gauche.
Au point B : pr − q 2 = −1/4 < 0 , donc c’est un point selle (voir Figure 1.32 à droite).

1.10. Exercices 77
Z −1
−2
−3
−4
−1.0 −1.0
−0.6 −0.6
−0.2 −0.2
0.2 0.2
0.6 0.6
Y 1.0 1.0 X
Figure 1.31 – Surface définie par la fonctions f .
7e−4
38e−4
Z
Z
26e−4
0.20
0.20
−0.06
0.23 0.23 −23e−4 −0.03
0.45
0.26 0
0.26
Y X 0.49
0.03 X
0.29 0.29 Y 0.53 0.06
Figure 1.32 – Maximum local en A (à gauche) et point selle en B (à droite).

2. f (1/4, 1/4) = 1/256, or on a par exemple f (1, −1) = 2, donc ce n’est pas un maximum
global.
3. Puisque pour tout x réel, f (x, 0) = 0, il suffit d’étudier le signe de f autour de l’axe des
abscisses pour en déduire la nature de ces points critiques. f (x, y) = xy 2 (1 − x − 2y), s’ex-
primant comme un produit, l’étude de signe ne pose pas problème (voir Figure 1.33). On en
déduit que :
- si x < 0 ou x > 1, le point (x, 0) est un maximum local pour f .
- si 0 < x < 1, le point (x, 0) est un minimum local pour f .
- les points (0, 0) et (1, 0) correspondent à des points selles.
Remarque : L’étude du signe de f montre que les minima et maxima locaux obtenus sur
l’axe des abscisses ne sont pas globaux.
+ 1
− + 1 − x
− + −
Figure 1.33 – Signe de f (x, y) = xy 2 (1 − x − 2y).
Exercice 1.55 (Points extrêmes d’une ellipse)

Soit dans R2 la courbe d’équation 5x2 − 4xy + 2y 2 = 30. Trouver ses points les plus proches et les
plus éloignés de l’origine.
Corrigé
Ceci revient à trouver les extrema de f (x, y) = x2 + y 2 (carré de la distance d’un point M (x, y) à
l’origine) sous la contrainte 5x2 − 4xy + 2y 2 = 30. On cherche les extrema d’une fonction continue
sur une ellipse du plan, c’est-à-dire un compact. On est donc certain que maximum et minimum
sont atteints. Pour les déterminer, on utilise la méthode de Lagrange.
Notons g(x, y) = 5x2 − 4xy + 2y 2 − 30 la contrainte. Le lagrangien du problème s’écrit donc :
L(x, y, λ) = f (x, y) + λg(x, y) = (x2 + y 2 ) + λ(5x2 − 4xy + 2y 2 − 30).
Ses dérivées partielles sont  ∂L
 ∂x = 2x + λ(10x − 4y)
∂L
∂y = 2y + λ(−4x + 4y)
∂L
= 5x2 − 4xy + 2y 2 − 30

∂λ
L’élimination de λ entre les deux premières équations donne la nouvelle équation :
2x2 + 3xy − 2y 2 = 0 (+)
laquelle, combinée avec la troisième équation, permet d’obtenir y en fonction de x :
30
y = 7x − .
x

1.10. Exercices 79
A1
A4
.
0
−4 −2 2 4
A3
−2
−4
A2
Figure 1.34 – L’ellipse, ses points les plus proches et les plus éloignés de l’origine.
On substitue dans (+) pour obtenir l’équation bicarrée :
x4 − 10x2 + 24 = 0,
ce qui se résout sans problème via le changement d’inconnue √ X√ = x2 . Au final,

√ on√obtient quatre
couples (x, y) de valeurs critiques pour le lagrangien : A1 ( 6, 2 6), A2 (− 6, −2 6), A3 (2, −1),
A4√(−2, √1). Il suffit √
alors de
√ calculer la valeur de f en ces points pour en déduire leur nature :
f ( 6, 2 6) = f (− 6, −2 6) = 30 et f (2, −1) = f (−2, 1) = 5. Donc A1 et A2 sont les points
de l’ellipse les plus loins de l’origine, alors que A3 et A4 en sont les plus proches, comme illustré
Figure 1.34.
Exercice 1.56 (Polynôme de degré 4)

Soit f : R2 → R définie par f (x, y) = x4 + y 4 − 2(x − y)2 .
1. Déterminer les points critiques de f .
2. Montrer que l’origine est un point selle.
√ √ √ √
3. Montrer que les points A1 ( 2, − 2) et A2 (− 2, 2) sont des minima locaux. Sont-ils les
seuls ?
4. En utilisant l’inégalité (x − y)2 ≤ 2(x2 + y 2 ), établir que A1 et A2 sont des minima globaux.
Sont-ils les seuls ?
5. La fonction f admet-elle un maximum local ? un maximum global ?
Corrigé
La fonction f est représentée Figure 1.35.
1. Recherche des points critiques :
(
∂f
∂x = 4(x3 − x + y) = 0
∂f
∂y = 4(y 3 + x − y) = 0

170
150
130
110
90
Z
70
50
30
10
−10
−3
−2
−1
0 −3
1 −2
−1
2 0
Y 1
3 2
3 X
Figure 1.35 – Représentation de f (x, y) = x4 + y 4 − 2(x − y)2 .
La somme des deux lignes montre que y 3 = −x3 , ce qui revient à dire que y = −x puisqu’on
travaille avec des nombres réels. On substitue alors −x à y dans l’une des deux équations du
système et on obtient au final trois points critiques : O, A1 et A2 .
2. Le calcul des dérivées à l’ordre deux donne :
 ∂2f
 ∂x22
 = 4(3x2 − 1)
∂ f
∂x∂y = 4
 ∂2f

∂y 2
= 4(3y 2 − 1)
Au point O (voir Figure 1.36 à gauche) : pr − q 2 = 0, donc on ne peut rien dire a priori.
Cependant, on remarque que f (0, 0) = 0, or f n’est pas de signe constant au voisinage de
l’origine. En effet f (x, x) = 2x4 ≥ 0, alors que f (x, −x) = 2x2 (x2 − 4) ≤ 0 pour x voisin de
0. Ceci montre que O est un point selle pour f .
3. Au point A1 (voir Figure 1.36 à droite) : pr − q 2 = 384 > 0 avec p = 20 > 0, donc minimum
local.
Au point A2 : pr − q 2 = 384 > 0 avec p = 20 > 0, donc minimum local.
Ce sont bien entendu les seuls minima locaux puisqu’un minimum local correspond nécessai-
rement à un point critique de f .
4. On vérifie sans problème l’inégalité proposée, d’où l’on déduit que pour tout point (x, y) du
plan :
f (x, y) ≥ x4 + y 4 − 4(x2 + y 2 ) = (x2 − 2)2 + (y 2 − 2)2 − 8 ≥ −8.
√ √ √ √
Or f ( 2, − 2) = f (− 2, 2) = −8, ce qui prouve que A1 et A2 correspondent à des
minima globaux pour f . Par la question 3), ce sont bien sûr les seuls puisque sur un ouvert
(ici R2 ) un minimum global est a fortiori minimum local.
5. L’étude des points critiques montre que f n’admet ni maximum local ni maximum global.
Exercice 1.57 (Extrema sur un disque)

Etude des extrema de f : B → R définie par f (x, y) = x2 + y 2 + y 2 − 1 où
p
B = {(x, y) : x2 + y 2 ≤ 9}.

1.10. Exercices 81
2
0
1
0 −2
−1
Z −4
Z −2
−6
−3
−4 −8
−5 1.9
1.6 −2.0
−6
−1.0
−0.3 −1.6
0.4 1.3
X
−0.3 0.4 −1.2 Y
X −1.0 Y 1.0
Figure 1.36 – Point selle en O (à gauche) et minimum local en A1 (à droite).
1. Montrer que f n’a pas de point critique dans U = {(x, y) ∈ R2 : 0 < x2 + y 2 < 9}.
2. Etablir que l’origine est un minimum global.
3. Etudier les variations de f sur C = {(x, y) : x2 + y 2 = 9}.
4. Conclure.
Corrigé
1. Il faut remarquer que B est un fermé (disque fermé), or l’étude des points critiques via les
dérivées partielles se fait sur les ouverts uniquement, il faut donc enlever le bord du disque.
De plus, la fonction “racine carrée” n’est pas dérivable en 0, donc il faut enlever l’origine du
repère pour f . L’étude des points critiques se fait donc sur l’ouvert U .
(
∂f
p
2 y2
∂x = x/ x +
∂f
p
2 2
∂y = y(2 + 1/ x + y )
∂f
∂x = 0 implique x = 0 et ∂f ∂y = 0 implique y = 0 : on obtiendrait l’origine, qui est exclue.
f n’a donc pas de point critique dans l’ouvert U . Les extrema de f sur le compact B sont
donc à chercher en l’origine et sur le cercle C.
2. Par positivité des carrés, il est clair que pour tout point (x, y), f (x, y) ≥ −1 et l’égalité a
lieu au seul point O. Donc l’origine est bien le minimum global de f .
3. Sur C, l’étude de f se ramène à l’étude de la fonction d’une seule variable
[0, 2π[ → R

φ=
t 7→ f (3 cos t, 3 sin t) = 9 sin2 t + 2
Le minimum de f sur C vaut 2 et est atteint aux deux points (3, 0) et (−3, 0).
Le maximum de f sur C vaut 11 et est atteint aux deux points A(0, 3) et B(0, −3).
4. f est continue sur le compact B donc y admet minimum global et maximum global. Des
questions précédentes on déduit que son minimum global est atteint au seul point O et vaut
−1, et que son maximum global est atteint aux deux points A et B et vaut 11.
Remarque. Le principe ici est le même que celui vu dans l’exercice 1.46.

Chapitre 2
Intégrales multiples
Introduction
Le but de ce chapitre est d’exposer le calcul des intégrales multiples : soit D un sous-ensemble de
Rn et f : D → R une fonction suffisamment régulière, on veut définir et pouvoir interpréter la
quantité : Z Z
I= ··· f (x1 , . . . , xn )dx1 . . . dxn .
D
D’un point de vue théorique, le cadre adapté à l’exposé des intégrales multiples est sans conteste
celui de l’intégration de Lebesgue (qui sera vue en Licence 3). Notre motivation étant plutôt
calculatoire, on se contentera ici de leur étude sous des hypothèses relativement simples, mais
souvent suffisantes en pratique.
2.1 Intégrales doubles

2.1.1 Exemple introductif
On considère le domaine :
D = (x, y) ∈ R+2 : 0 ≤ x ≤ 2, 0 ≤ x + 2y ≤ 2 ,

et la fonction
R2 → R

f:
(x, y) 7→ 3 − x − y
On veut pouvoir interpréter et calculer :
ZZ
I= f (x, y)dxdy.
D
Pour f : [a, b] → R+ continue, on sait que a f (x)dx correspond à la surface comprise entre les
Rb
droites d’équations x = a, x = b, l’axe des abscisses et le graphe de f . De même, l’intégrale de

f sur D va correspondre ici au volume compris entre le cylindre vertical de directrice D, le plan
(Oxy) et la surface (Σ) définie par f (Figure 2.1).
On a principalement deux façons de calculer I suivant la manière dont on parcourt le domaine D

(voir aussi la Figure 2.2) :
x
(a) on fait varier x de 0 à 2 et, pour chaque x fixé, on fait varier y entre 0 et 1 − 2 ;
83
84 Chapitre 2. Intégrales multiples
Figure 2.1 – Intégrale de f (x, y) = 3 − x − y sur le domaine D.
(b) on fait varier y de 0 à 1 et, pour chaque y fixé, on fait varier x entre 0 et 2 − 2y.
Dans le premier cas, on obtient :
2 1− x2
!
2 1− x2
!
2 1− x2
y2
Z Z Z Z Z
Ia = f (x, y)dy dx = (3 − x − y)dy dx = 3y − xy − dx
0 0 0 0 0 2 0
5 2
Z 2
3 2 5 1 3
= x − 2x + dx = x − x2 + x = 2.
0 8 2 8 2 0
Dans le second, on trouve de même :
1 Z 2−2y 1 Z 2−2y 1 2−2y

x2
Z Z Z
Ib = f (x, y)dx dy = (3 − x − y)dx dy = 3x − − yx dy
Z0 1 0 0 0 0 2 0
1
(4 − 4y)dy = 4y − 2y 2 0 = 2.

=
0
C’est cette valeur commune I = Ia = Ib que l’on appellera intégrale de f sur le domaine D et que
l’on notera ZZ
I= f (x, y)dxdy.
D
11111111111111111
00000000000000000 11111111111111111
00000000000000000
1010 1010 1010 D
00000000000000000
11111111111111111 00000000000000000
11111111111111111
1 1
00000000000000000
11111111111111111 1111
0000
111111111
000000000
00000000000000000
11111111111111111
111111
000000
11111111111D
00000000000
x
1010 1010 10101010 1010 1010 01

y =1− 2
00000000000000000
11111111111111111 y
00000000000000000
11111111111111111
00000000000000000
11111111111111111
x 2
00000000000000000
11111111111111111
111111111111111
000000000000000
x = 2 − 2y
Figure 2.2 – Deux façons de décrire le domaine D.

2.1. Intégrales doubles 85
2.1.2 Théorème de Fubini

On appelle courbe fermée γ dans R2 toute application
[0, 1] → R2

γ:
t 7→ (x(t), y(t))
telle que γ(0) = γ(1). Dire que la courbe γ est continue revient à dire que les applications t 7→ x(t)
et t 7→ y(t) sont toutes deux continues sur [0, 1]. On précise maintenant les domaines sur lesquels
on calculera les intégrales multiples.
Définition 21 (Bon domaine d’intégration)

Soit D un sous-ensemble de R2 . On dira que D est un bon domaine d’intégration 1 s’il est délimité
par une courbe fermée et continue γ telle que toute droite parallèle à l’un des axes de coordonnées
coupe la courbe γ en au plus deux points.
γ γ
β
v(x)
D D
y
u(x)
α
a b
x ϕ(y) ψ(y)
Figure 2.3 – Bon domaine d’intégration.
Soit a = inf 0≤t≤1 x(t) et b = sup0≤t≤1 x(t). On peut alors définir deux fonctions u(x) et v(x)
continues telles que pour tout x ∈ [a, b], l’intersection du domaine D avec la droite d’équation
X = x soit exactement le segment [u(x), v(x)]. Le domaine D admet donc la description (Figure
2.3) :
D = {(x, y), a ≤ x ≤ b, u(x) ≤ y ≤ v(x)}.
De même, soit α = inf 0≤t≤1 y(t) et β = sup0≤t≤1 y(t), ϕ(y) et ψ(y) les deux fonctions continues
telles que pour tout y ∈ [α, β], l’intersection de D avec la droite d’équation Y = y soit le segment
[ϕ(y), ψ(y)]. Le domaine D admet encore la description :
D = {(x, y), α ≤ y ≤ β, ϕ(y) ≤ x ≤ ψ(y)} .
Soit f : R2 → R continue sur D. On va définir l’intégrale double :

ZZ
f (x, y)dxdy,
D
comme étant égale à l’intégrale simple :

Z b
g(x)dx,
a
1. appellation personnelle.

où g(x) est elle-même définie par :

Z v(x)
g(x) = f (x, y)dy.
u(x)
Le calcul d’une intégrale double se ramenant ainsi à deux calculs d’intégrales simples. Par symétrie
des rôles joués par x et y, on pourra aussi la définir comme :
Z β
h(y)dy,
α
avec h définie par :

Z ψ(y)
h(y) = f (x, y)dx.
ϕ(y)
C’est l’objet du Théorème de Fubini.
Théorème 13 (Théorème de Fubini)

Soit D un bon domaine d’intégration et f : R2 → R continue sur D. Alors, avec les notations
précédentes, on a :
Z b Z β
g(x)dx = h(y)dy.
a α
Cette valeur commune est appelée intégrale de f sur le domaine D et notée :
ZZ ZZ
I= f (x, y)dxdy = f dxdy.
D D
Preuve (esquisse). On découpe les abscisses et les ordonnées suivant des subdivisions discrètes
(xj ) et (yi ), les points extrêmes étant respectivement a, b, α et β. Par définition de l’intégrale
simple, on a alors :
Z v(xj ) X
g(xj ) = f (xj , y)dy = lim f (xj , yi )(yi+1 − yi ),
u(xj ) y
i
la somme se faisant sur les indices i tels que u(xj ) ≤ yi ≤ v(xj ) et la limite sur y étant prise pour
le pas de la subdivision, i.e. sup |yi+1 − yi |, tendant vers zéro. De la même façon :
Z b X
g(x)dx = lim g(xj )(xj+1 − xj ),
a x
j
la somme se faisant cette fois sur tous les indices j et la limite sur x étant prise pour le pas de la
subdivision, i.e. sup |xj+1 − xj |, tendant vers zéro. Au total, on a donc :
Z b !
X X
g(x)dx = lim lim f (xj , yi )(xj+1 − xj )(yi+1 − yi ) .
a x y
j i
De façon analogue, on voit que :

 
Z β X X
h(y)dy = lim lim f (xj , yi )(xj+1 − xj )(yi+1 − yi ) .
α y x
i j

Les sommes finies sur les indices i et j ne dépendent pas de l’ordre de sommation. Par contre,
les limites sur les pas de subdivision ne sont pas prises dans le même ordre, donc rien ne prouve
a priori que les deux opérations conduisent au même résultat : ceci sera cependant assuré si les
limites sont uniformes, i.e. si la limite pour sup |xj+1 − xj | tendant vers zéro de la somme
X
f (xj , yi )(xj+1 − xj )(yi+1 − yi )
j
est uniforme par rapport aux yi , ou si la limite pour sup |yi+1 − yi | tendant vers zéro de la somme
X
f (xj , yi )(xj+1 − xj )(yi+1 − yi )
i
est uniforme par rapport aux xi (c’est un raisonnement classique pour les intégrales de Riemann :
si la convergence est uniforme, on peut passer la limite sous le signe somme).
On peut vérifier simplement que si la fonction f est uniformément continue, les limites en
question sont en effet uniformes. Dans notre cas, f est continue et le domaine D est fermé et
borné, donc compact : le Théorème de Heine vu en première année (une fonction continue sur un
compact y est uniformément continue) est encore vérifié pour une fonction de plusieurs variables
donc on est dans la situation favorable d’interversion des limites.

Remarques :
– Le Théorème de Fubini dit que, pour calculer une intégrale double, on peut procéder dans l’ordre
que l’on veut : ceci peut s’avérer très utile en pratique, cf. par exemple l’exercice 2.1 “Importance
de l’ordre d’intégration”.
– Le calcul de l’intégrale double se ramène ainsi à celui de deux intégrales simples, or on sait que
le calcul d’une intégrale simple ne change pas si on change la valeur de la fonction en un nombre
fini de points. En particulier, on voit que le fait de prendre en compte ou non la frontière Γ du
domaine D n’a pas d’importance.
– On peut généraliser simplement les domaines sur lesquels on s’autorise à intégrer en supposant
l’intégration additive, c’est-à-dire que si D1 et D2 sont des bons domaines d’intégration disjoints,
on définit l’intégrale sur D1 ∪D2 comme la somme des intégrales sur chaque domaine (voir Figure
2.4) : ZZ ZZ ZZ
f dxdy = f dxdy + f dxdy.
D1 ∪D2 D1 D2
D2
D1
Figure 2.4 – Additivité de l’intégration.
On retrouve alors pour les intégrales doubles les propriétés classiques vues pour les intégrales
simples : elles en découlent directement via le Théorème de Fubini.

Propriétés 1
Soit f1 et f2 continues, D un bon domaine d’intégration, λ et µ des réels :
– Linéarité : l’intégration est une application linéaire :
ZZ ZZ ZZ
(λf1 + µf2 )dxdy = λ f1 dxdy + µ f2 dxdy.
D D D
– Positivité : Si f ≥ 0 sur D, alors : ZZ

f dxdy ≥ 0.
D
– Positivité (bis) : Si f1 ≤ f2 sur D, alors :
ZZ ZZ
f1 dxdy ≤ f2 dxdy.
D D
– Positivité (ter) :
ZZ ZZ
f dxdy ≤ |f |dxdy.
D D
On peut résumer d’une phrase ces propriétés : l’intégration est une forme linéaire positive. Pour
ce qui est de la propriété de positivité, puisqu’on a supposé f continue, on peut même préciser la
chose. En effet, soit f ≥ 0, alors :
ZZ
f dxdy = 0 ⇐⇒ f = 0 sur D.
D
Définition 22 (Aire d’un domaine)

Soit D un bon domaine d’intégration. On appelle aire, ou surface, de D le réel :
ZZ
A(D) = dxdy.
D
E
x
−a a
−b
n o
x2 y2
Figure 2.5 – Domaine E = (x, y), a2
+ b2
≤1 .
Exemple : Aire d’une ellipse

2 2
On considère une ellipse centrée en O d’équation xa2 + yb2 = 1. Le domaine
x2 y 2

E = (x, y), 2 + 2 ≤ 1
a b

est clairement un bon domaine d’intégration (Figure 2.5), que l’on peut décrire par :
( r r )
x2 x2
E= (x, y), −a ≤ x ≤ a, −b 1− 2 ≤y ≤b 1− 2 ,
a a
ou encore par :
( r r )
y2 y2
E= (x, y), −b ≤ y ≤ b, −a 1− 2 ≤x≤a 1− 2 .
b b
Quel que soit l’ordre d’intégration (Théorème de Fubini) et en utilisant par exemple un changement
de variable (soit x = a cos t, soit y = b sin t), on montre ainsi que l’ellipse a pour aire : A(E) = π ab .
Remarque. Si le domaine est de la forme D = {(x, y), a ≤ x ≤ b, 0 ≤ y ≤ f (x)}, avec

f : [a, b] → R+ continue, on obtient :
!
Z b Z f (x) Z b
A(D) = dy dx = f (x)dx,
a 0 a
et on retrouve l’interprétation bien connue de l’intégrale simple (Figure 2.6).
y = f (x)
x
a b
Figure 2.6 – L’intégrale simple comme aire d’un domaine.
Rappel. Soit f : [a, b] → R continue, alors f est bornée et atteint ses bornes m et M . f est de
plus intégrable et la positivité de l’intégration entraîne :
b
1
Z
m≤ f (x)dx ≤ M.
b−a a
Par le Théorème des Valeurs Intermédiaires, on en déduit qu’il existe c ∈ [a, b] tel que :
b
1
Z
f (c) = f (x)dx,
b−a a
c’est-à-dire que f (c) est égal à la valeur moyenne de f sur le segment [a, b] : c’est le Théorème de
la Moyenne (dans sa version la plus simple) et il se généralise aux intégrales multiples, pour peu
qu’on suppose le domaine D convexe.

Théorème 14 (Théorème de la Moyenne)

Soit D un bon domaine d’intégration convexe, f : R2 → R continue sur D, m = inf D f et
M = supD f , alors il existe (x0 , y0 ) ∈ D tel que f (x0 , y0 ) soit égal à la valeur moyenne de f sur
D:
1
ZZ
m ≤ f (x0 , y0 ) = f (x, y)dxdy ≤ M.
A(D)
D
Preuve. f est continue sur D compact, donc f y est bornée et atteint ses bornes m et M : il existe
(xm , ym ) et (xM , yM ) tels que :
f (xm , ym ) = m
f (xM , yM ) = M
La fonction f est continue sur le segment [(xm , ym ), (xM , yM )]. Ce segment est contenu dans D
puisque D est convexe. Donc, par le Théorème des Valeurs Intermédiaires, elle prend toutes les
valeurs entre m et M . Or
1
ZZ
∀(x, y) ∈ D, m ≤ f (x, y) ≤ M ⇒ m ≤ f (x, y)dxdy ≤ M,
A(D)
D
par positivité de l’intégration. On en déduit qu’il existe (x0 , y0 ) ∈ [(xm , ym ), (xM , yM )] ⊆ D tel
que
1
ZZ
f (x0 , y0 ) = f (x, y)dxdy.
A(D)
D

Exercice. Représenter un bon domaine d’intégration D qui ne soit pas convexe.
2.1.3 Changement de variables

Rappel. Soit f : [a, b] → R continue et ϕ : [c, d] → [a, b] bijective et de classe C 1 (typiquement ϕ
strictement croissante ou strictement décroissante), alors on a :
Z b Z d
f (x)dx = (f ◦ ϕ)(t) · ϕ′ (t)dt.
a c
On a le même type de résultat (que l’on admettra) pour les intégrales doubles. Il faut cependant
commencer par préciser les hypothèses sur le changement de variables.
Définition 23 (C 1 -difféomorphisme)
Soit

U →V
ϕ:
(u, v) 7→ (x, y)
avec U et V ouverts de R2 . On dit que ϕ est un C 1 -difféomorphisme de U sur V si :
(i) ϕ est une bijection de U sur V ;
(ii) ϕ est de classe C 1 ;
(iii) sa réciproque ϕ−1 est de classe C 1 .
Remarques :
– Le point (iii) ne découle pas des deux premiers : penser, en dimension 1, à ϕ : x 7→ x3 . C’est
clairement une bijection de classe C 1 de R sur R, mais son application réciproque n’est pas
dérivable en 0.

– Si ϕ est un C 1 -difféomorphisme de U sur V, alors sa matrice jacobienne est inversible en tout

point de U , puisque l’égalité (ϕ−1 ◦ ϕ)(u, v) = (u, v) implique pour les matrices jacobiennes :
Jϕ−1 (ϕ(u, v))Jϕ (u, v) = I2 ,
ce qui prouve que Jϕ (u, v) est inversible, d’inverse Jϕ−1 (ϕ(u, v)).
Théorème 15 (Formule de changement de variables)

Soit ∆ et D des bons domaines d’intégration, ϕ un C 1 -difféomorphisme de ∆ sur D et f : D → R
continue. Alors ZZ ZZ
f (x, y)dxdy = (f ◦ ϕ)(u, v) · | det Jϕ (u, v)|dudv.
D ∆
Application : Changement en polaires

Si le domaine et/ou la fonction est à symétrie radiale, le calcul d’intégrale est souvent plus facile
en passant en coordonnées polaires, via :
ϕ : (ρ, θ) 7→ (x, y) = (ρ cos θ, ρ sin θ).
Une première étape consiste en la réécriture du domaine d’intégration D pour les couples (x, y)
en un domaine ∆ pour les couples (ρ, θ). Puisqu’on sait que le jacobien de ϕ au point (ρ, θ) vaut
ρ ≥ 0 (voir Chapitre 1, Section 1.4), on a donc :
ZZ ZZ
f (x, y)dxdy = f (ρ cos θ, ρ sin θ)ρdρdθ.
D ∆
1
ZZ
Exemple. Soit à calculer I = dxdy où D = {(x, y), x > 0, y > 0, x2 + y 2 < 1}.
1 + x2 + y 2
D
On a n πo
∆ = (ρ, θ), 0 < ρ < 1, 0 < θ < ,
2
et par suite :
π
! 1
1 1
ρ ρ π ρ π 1 π
ZZ Z Z Z
2
2
I= dρdθ = dθ dρ = dρ = ln(1 + ρ ) = ln 2.
1 + ρ2 0 1 + ρ2 0 2 0 1+ρ 2 2 2 0 4
∆
y + dy dS = dx × dy dρ dS ≈ ρdρdθ
y
ρ dθ
θ
x x + dx
Figure 2.7 – Interprétation du changement en polaires.
Interprétation géométrique
En coordonnées cartésiennes, un élément de surface élémentaire dû aux variations x x + dx et

y y + dy est un rectangle d’aire dS = dx × dy. Pour calculer le volume total correspondant à

l’intégrale double, on partitionne le domaine D par ces éléments de surface sur chacun desquels le
volume élémentaire vaut “hauteur fois base”, soit (voir Figure 2.7 à gauche) :
f (x, y)dS = f (x, y)dxdy,
d’où finalement la somme des f (x, y)dxdy. En coordonnées polaires, un élément de surface élémen-
taire dû aux variations ρ ρ + dρ et θ θ + dθ est une portion de couronne d’aire 2 (voir Figure
2.7 à droite) :
1 1 1
dS = (ρ + dρ)2 dθ − ρ2 dθ = ρdρdθ + (dρ)2 dθ ≈ ρdρdθ,
2 2 2
le terme 12 (dρ)2 dθ étant négligeable par rapport à ρdρdθ. D’où, pour l’intégrale, la somme des
f (ρ cos θ, ρ sin θ)ρdρdθ.
2.1.4 Intégrales doubles généralisées

Rappel. PourZune fonction continue f :]0, +∞[→ R de la variable réelle, on parle d’intégrale gé-
néralisée pour f (x)dx dans deux cas : si le domaine U est non borné, par exemple U = [1, +∞[ ;
U
si f n’est pas définie en l’une des extrémités de U , par exemple U =]0, 1]. Si U =]0, +∞[, on dit
que l’intégrale est doublement généralisée et il convient d’étudier séparément les deux problèmes.
y y
D 1
f (x, y) = x2 +y 2
D
x x
1 1
Figure 2.8 – Domaines généralisés.
On retrouve pour les intégrales doubles généralisées les deux types de situation : domaine d’in-
tégration non borné ou domaine borné avec f non définie en un point du bord du domaine. Par
exemple (Figure 2.8) :
– premier cas :
1
ZZ
dxdy,
x + y2
2
D
où D = [1, +∞[×[1, +∞[.

– second cas :
1
ZZ
dxdy,
x2 + y2
D
où D =]0, 1]×]0, 1].
2. on rappelle qu’un secteur angulaire de rayon ρ et d’angle θ (en radians) a pour surface S = 21 ρ2 θ.

L’étude étant la même pour les deux types de généralisation, et par ailleurs comparable à celle
faite pour les intégrales simples, on appelle simplement domaine généralisé 3 ce type de domaine
et intégrale généralisée l’intégrale d’une fonction sur ce domaine.
Définition 24 (Convergence d’une suite croissante de domaines)

Soit D un sous-ensemble de R2 . On dit que la suite croissante (Dn )n≥1 de sous-ensembles de D
tend vers D, et on note Dn ↑ D, si :
∀(x, y) ∈ D, ∃n0 ∈ N, ∀n ≥ n0 , (x, y) ∈ Dn .
D Dn D2 D1
Figure 2.9 – Suite croissante de domaines de limite D.
La notion de suite croissante de domaines est illustrée Figure 2.9. On peut maintenant préciser ce
qu’on entend par intégrale généralisée convergente.
Définition 25 (Intégrale généralisée convergente)

Soit f : D → R continue sur le domaine généralisé D. On dit que
ZZ
f (x, y)dxdy
D
est une intégrale généralisée convergente, égale à I, si pour toute suite Dn ↑ D de bons domaines
d’intégration, on a : ZZ
lim f (x, y)dxdy = I.
n→∞
Dn
L’intégrale est dite divergente dans le cas contraire.
Sous cette forme, il est difficile de vérifier si une intégrale généralisée est convergente puisqu’on
peut tendre vers le domaine D d’une infinité de façons. La situation se simplifie néanmoins lorsque
la fonction f est positive : l’étude de la limite des intégrales pour une seule suite de domaines suffit
alors à conclure.
Proposition 9 (Intégrale généralisée d’une fonction positive)

Soit f : D → R+ continue sur le domaine généralisé D, et (Dn ) une suite de bons domaines
d’intégration, avec Dn ↑ D, alors :
3. appellation personnelle.

– ou bien ZZ
f (x, y)dxdy −−−→ +∞,
n→∞
Dn
auquel cas l’intégrale de f sur D est divergente et vaut +∞ ;

– ou bien ZZ
f (x, y)dxdy −−−→ I < +∞,
n→∞
Dn
auquel cas l’intégrale de f sur D est convergente et vaut I.
Preuve. Soit (Dn′ ) une autre suite de bons domaines d’intégration, avec Dn′ ↑ D. La suite de réels
ZZ
′
In = f (x, y)dxdy
Dn
′
est croissante donc sa limite correspond à celle de toute sous-suite. Or, puisque Dn′ ↑ D, il existe
′
une sous-suite (Dϕ(n) ′
) telle que, pour tout n, on ait Dn ⊆ Dϕ(n) . Réciproquement, il existe une
sous-suite (Dψ(n) ) telle que, pour tout n, on ait Dn′ ⊆ Dψ(n) . Finalement, la sous-suite (Dϕ(n)
′ )
vérifie :
∀n ∈ N ′
Dn ⊆ Dϕ(n) ⊆ Dψ◦ϕ(n)
ce qui se traduit en terme d’intégrales par :
∀n ∈ N ′
In ≤ Iϕ(n) ≤ Iψ◦ϕ(n)
′
or lim In = lim Iψ◦ϕ(n) qui vaut I ou +∞, et il en est de même pour lim Iϕ(n) , donc pour lim In′ .

Dans le cas où f n’est pas de signe constant, on ne peut donner qu’une condition suffisante, déjà
connue pour les intégrales simples.
Définition 26 (Intégrale généralisée absolument convergente)

Soit f : D → R continue sur le domaine généralisé D. On dit que l’intégrale généralisée
ZZ
f (x, y)dxdy
D
est absolument convergente si ZZ

|f (x, y)|dxdy < +∞.
D
Il est bien sûr plus simple de vérifier l’absolue convergence puisqu’il suffit de vérifier pour une seule
suite de domaines Dn ↑ D. On retrouve alors le résultat vu en première année pour les intégrales
simples généralisées.
Proposition 10 (Absolue convergence ⇒ convergence)

Soit f : D → R+ continue sur le domaine généralisé D. Si l’intégrale généralisée
ZZ
f (x, y)dxdy
D
est absolument convergente, alors elle est convergente.

Preuve. Soit Dn ↑ D. Notons respectivement In et Jn les intégrales de f et de |f | sur Dn . On

veut montrer que (In ) est convergente : puisque R est complet, il suffit de montrer que c’est une
suite de Cauchy.
ZZ ZZ ZZ
|In+p − In | = f (x, y)dxdy − f (x, y)dxdy = f (x, y)dxdy .
Dn+p Dn Dn+p −Dn
La positivité de l’intégration donne alors :

ZZ ZZ ZZ
|In+p − In | ≤ |f (x, y)|dxdy = |f (x, y)|dxdy − |f (x, y)|dxdy,
Dn+p −Dn Dn+p Dn
la dernière égalité venant de l’additivité de l’intégration. Finalement on a obtenu :
|In+p − In | ≤ Jn+p − Jn = |Jn+p − Jn |.
Or (Jn ) est une suite convergente, donc de Cauchy :
∀ε > 0, ∃n0 , n ≥ n0 ⇒ |Jn+p − Jn | < ε.
La majoration précédente montre que (In ) est de Cauchy elle aussi, donc convergente.

Remarque. Cette propriété, (absolue convergence ⇒ convergence), est très classique : on la re-
trouve par exemple dans l’étude des séries numériques. Elle est vérifiée dès lors que l’on travaille
dans un espace complet (encore appelé espace de Banach), c’est-à-dire un espace vectoriel normé
où toute suite de Cauchy est convergente dans l’espace. Par ailleurs, l’intervention des suites de
Cauchy dans ce contexte n’a rien d’étonnant puisqu’on doit prouver la convergence d’une suite
sans en connaître la limite (penser de même à la démonstration du Théorème du Point Fixe pour
une fonction contractante).
Figure 2.10 – Disque unité D et suite croissante des couronnes Cn .
Exemple. On veut étudier la convergence de l’intégrale généralisée

1
ZZ
dxdy,
x + y2
2
D

où D est le disque ouvert unité moins le centre O. La fonction étant positive sur D, il suffit d’étudier
la limite pour une seule suite de domaines, par exemple la suite de couronnes 4 (voir Figure 2.10) :

1 p 2 2
Cn = (x, y), ≤ x +y <1 .
n
On a bien Cn ↑ D et le calcul sur Cn se fait sans problème via un passage en polaires :
Z 1 Z 2π
1 1
ZZ
In = 2 2
dxdy = dθdρ = 2π [ln ρ]11 = 2π ln n −−−→ +∞.
x +y 1
0 ρ n n→∞
n
Cn
1
ZZ
Par suite dxdy est divergente, égale à +∞.
x2 + y2
D
2.2 Intégrales triples

Le principe est le même que pour les intégrales doubles, c’est pourquoi on se contente de reprendre
l’ossature de la section précédente.
2.2.1 Exemple introductif

On considère dans R3 l’intérieur du tétraèdre OIJK de la Figure 2.11 (à gauche) :
D = {(x, y, z), x ≥ 0, y ≥ 0, z ≥ 0, x + y + z ≤ 1}.
Soit la fonction
R3 → R

f:
(x, y, z) 7→ xyz
On veut calculer l’intégrale triple :
ZZZ
I= f (x, y, z)dxdydz.
D
A nouveau, on a plusieurs façons de procéder suivant l’ordre des variables, toutes donnant le même
résultat. On décide par exemple d’intégrer d’abord par rapport à x, puis par rapport à y et enfin
par rapport à z.
Il faut commencer par définir pour toute hauteur z entre 0 et 1 la section de niveau z, notée Dz ,
du plan d’équation Z = z et du domaine D (Figure 2.11). On obtient :
Dz = {(x, y), x ≥ 0, y ≥ 0, x + y ≤ 1 − z}.
Ceci donne  
Z 1 ZZ Z 1
I=  f (x, y, z)dxdy dz =
 I(z)dz.
0 0
Dz
Or I(z) est une intégrale double sur un bon domaine d’intégration, donc du type vu précédemment :
Z 1−z Z 1−z−y Z 1−z
(1 − z − y)2

z
I(z) = z y xdx dy = z y dy = (1 − z)4 .
0 0 0 2 24
4. une couronne n’est pas un bon domaine d’intégration au sens donné en début de chapitre : c’est cependant
l’union disjointe de quatre bons domaines d’intégration, et tout se passe bien grâce à l’additivité de l’intégration.

2.2. Intégrales triples 97
z y
1−z
K
Dz Dz
z x
1−z
D J y
x I
Figure 2.11 – Domaine D = {(x, y, z) ∈ R3+ , x + y + z ≤ 1} et, pour z fixé, domaine Dz .
1
Il reste à intégrer ce polynôme de degré 5 entre 0 et 1, ce qui donne I = 6! .
N.B. Plus encore que pour l’intégrale double, cet exemple montre qu’une étape essentielle du
calcul d’intégrale multiple est le découpage du domaine d’intégration, c’est pourquoi il ne faut pas
hésiter à faire des dessins.
2.2.2 Propriétés
La notion de bon domaine d’intégration étant supposée définie, on retrouve le Théorème de Fubini,
qui permet de ramener un calcul d’intégrale triple au calcul itéré de trois intégrales simples, et ce
dans un ordre loisible. Les propriétés de linéarité et de positivité sont bien sûr conservées.
Si D est un bon domaine d’intégration, on définira de même son volume par

ZZZ
V(D) = dxdydz.
D
Ceci permet en particulier de revenir à l’interprétation de l’intégrale double : soit f une fonction
de deux variables continue, positive, définie sur un bon domaine d’intégration Df . Le domaine :
D = {(x, y, z), (x, y) ∈ Df , 0 < z < f (x, y)}
est alors la portion de cylindre vertical de directrice Df comprise entre le plan (Oxy) et la surface
(Σ) définie par f . Son volume est :
ZZZ Z Z Z f (x,y) ! ZZ
V(D) = dxdydz = dz dxdy = f (x, y)dxdy,
0
D Df Df
c’est-à-dire l’intégrale double de la section précédente.
Ce volume intervient également dans le Théorème de la Moyenne pour les intégrales triples, qui
s’écrit cette fois (en supposant D convexe) :
1
ZZZ
∃(x0 , y0 , z0 ) ∈ D, f (x0 , y0 , z0 ) = f (x, y, z)dxdydz.
V(D)
D

1.5
0.5
0
2
1 2
1
0
0
−1
−1
−2 −2
Figure 2.12 – Cylindre circulaire d’axe (Oz), de hauteur et rayon égaux à 1.
2.2.3 Changement de variables

Soit ∆ et D ouverts de R3 et
∆ →D
ϕ:
(u, v, w) 7→ (x, y, z)
un C 1 -difféomorphisme de ∆ sur D. La matrice jacobienne de ϕ au point (u, v, w) est donc :
 ∂x ∂x ∂x 
∂u ∂v ∂w
∂y ∂y ∂y
Jϕ (u, v, w) =  ∂u ∂v ∂w
 (u, v, w)
∂z ∂z ∂z
∂u ∂v ∂w
Soit ∆ et D des bons domaines d’intégration, f : D → R continue. Alors :

ZZZ ZZZ
f (x, y, z)dxdydz = (f ◦ ϕ)(u, v, w) · | det Jϕ (u, v, w)|dudvdw.
D ∆
Règle de Sarrus. Elle permet de calculer le déterminant d’une matrice (3, 3). On a en effet
a1 a2 a3
det M = b1 b2 b3 = a1 b2 c3 + b1 c2 a3 + c1 a2 b3 − (a3 b2 c1 + b3 c2 a1 + c3 a2 b1 ).
c1 c2 c3
Changement en coordonnées cylindriques

On vérifie que le déterminant jacobien au point (ρ, θ, z) vaut simplement ρ, qui est positif. Donc
la formule de changement de variables donne :
ZZZ ZZZ
f (x, y, z)dxdydz = f (ρ cos θ, ρ sin θ, z)ρdρdθdz.
D ∆
Considérons par exemple le cylindre de rayon R et de hauteur H (Figure 2.12) :
D = (x, y, z), x2 + y 2 < R2 , 0 < z < H ,

dont la description en coordonnées cylindriques est :
∆ = {(ρ, θ, z), 0 ≤ ρ < R, 0 ≤ θ < 2π, 0 < z < H} .

2.3. Couples aléatoires à densité 99
0.5
−0.5
−1
1
0.5 1
0.5
0
0
−0.5
−0.5
−1 −1
Figure 2.13 – Sphère unité.
Son volume est donc :

ZZZ ZZZ Z R
V(D) = dxdydz = ρdρdθdz = 2πH ρdρ = πR2 H,
0
D ∆
c’est-à-dire le produit bien connu de sa base par sa hauteur.
Changement en coordonnées sphériques

Le déterminant jacobien au point (r, φ, θ) vaut r 2 sin φ ≥ 0, car 0 ≤ φ ≤ π, donc le changement de
variable s’écrit :
ZZZ ZZZ
f (x, y, z)dxdydz = f (r cos θ sin φ, r sin θ sin φ, r cos φ)r 2 sin φdrdφdθ.
D ∆
Considérons par exemple l’intérieur de la sphère de centre O et de rayon R (Figure 2.13) :
D = {(x, y, z), x2 + y 2 + z 2 < R2 },
dont la description en coordonnées sphériques est :
∆ = {(r, φ, θ)|0 ≤ r < R, 0 ≤ φ ≤ π, 0 ≤ θ < 2π}.
Son volume est donc :

4
ZZZ ZZZ
V(D) = dxdydz = r 2 sin φdrdφdθ = πR3 .
3
D ∆
On retrouve là aussi le résultat classique sur le volume de la sphère.
2.3 Couples aléatoires à densité

Pour une variable aléatoire réelle X, les deux situations classiques sont les suivantes : X est discrète
ou X admet une densité. Nous étudions ici l’analogue d’une loi à densité pour un couple aléatoire
(X, Y ) à valeurs dans R2 . A nouveau, précisons d’emblée que le cadre d’étude rigoureux étant celui
de la mesure et de l’intégrale de Lebesgue, nous resterons volontairement évasifs sur les hypothèses
idoines tant pour les ensembles d’intégration que pour la régularité des fonctions intégrées ou les
conditions d’intégrabilité.

2.3.1 Loi jointe, lois marginales

Par définition, la loi jointe du couple (X, Y ) est caractérisée pour tout sous-ensemble B ⊆ R2 par
P((X, Y ) ∈ B), que l’on peut voir comme la probabilité que le point M de coordonnées aléatoires
(X, Y ) “tombe” dans l’ensemble B.
Définition 27 (Couple à densité)

On dit que le couple aléatoire (X, Y ) admet la densité jointe f = fX,Y si
ZZ
∀B ⊆ R ,2
P ((X, Y ) ∈ B) = f (x, y) dx dy,
B
où f est positive et telle que ZZ

f (x, y)dxdy = 1.
R2
2.0
1.8
1.6
1.4
1.2
1.0
0.8
0.6
0.4
0.2
0
y
0
1
x 2
0 3
1
2 4
3
4
5
Figure 2.14 – Représentation de la densité jointe f (x, y) = 2e−(x+y) 1{0≤x≤y} .
Exemple. On considère un couple (X, Y ) de densité jointe (cf. Figure 2.14)
f (x, y) = 2e−(x+y) 1{0≤x≤y} .
On vérifie que ceci définit bien une densité de probabilité sur R2 . En effet, f est positive et le
calcul de l’intégrale double s’écrit :
ZZ Z +∞ Z y Z +∞ Z +∞
−(x+y) −(x+y)
f (x, y) dx dy = 2e dx dy = 2e dy dx.
R2
0 0 0 x
Prenons par exemple la première expression :

Z Z +∞ Z +∞
−y
−x y
f (x, y) dx dy = 2e −e dy = (2e−y − 2e−2y ) dy,
R 2 0
0
0

ce qui donne finalement :

Z
+∞
f (x, y) dx dy = −2e−y + e−2y 0 = 1.

R2
La densité jointe permet de retrouver les densités des variables X et Y , encore appelées lois mar-
ginales.
Proposition 11 (Lois marginales)

Si le couple (X, Y ) est à densité, les variables marginales X et Y admettent elles-mêmes des
densités et la densité jointe f (x, y) détermine les densités marginales fX (x) et fY (y) :
Z Z
fX (x) = f (x, y) dy & fY (y) = f (x, y) dx
R R
2.0 0.5
1.8
1.6 0.4
1.4
1.2 0.3
1.0
0.8 0.2
fX (x) fY (y)
0.6
0.4 0.1
0.2
0.0 0.0
0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0 x 0 1 2 3 4 5 6 y
Figure 2.15 – Représentation des densités marginales f (x) et f (y).
Exemple. Pour l’exemple précédent, on obtient après calculs (voir Figure 2.15) :
fX (x) = 2e−2x 1[0,+∞[(x)

fY (y) = 2e−y (1 − e−y )1[0,+∞[ (y)
Une fois connues les lois marginales, on peut effectuer les calculs usuels sur les variables aléatoires
absolument continues. Par exemple, sous réserve d’intégrabilité, les espérances de X et Y sont
alors simplement :
Z Z
E[X] = xfX (x)dx & E[Y ] = yfY (y)dy.
R R
Rappel. On dit que T suit une loi exponentielle de paramètre λ > 0, noté T ∼ E(λ), si T admet
pour densité
fT (t) = λe−λt 1[0,+∞[ (t).
Les moments d’une loi exponentielle se calculent sans problème par des intégrations par parties
(exercice), ce qui donne pour tout entier naturel n
Z +∞
n!
Z
n n
E[T ] = t f (t)dt = tn × λe−λt dt = n .
R 0 λ

Exemple. Pour l’exemple ci-dessus, on voit que X ∼ E(2), d’où son espérance E[X] = 1/2.
Le calcul de la moyenne de Y utilise lui aussi le rappel précédent puisqu’on reconnaît des lois
exponentielles de paramètres 1 et 2 :
+∞ +∞
1 3
Z Z
−y
E[Y ] = 2 ye dy − y × 2e−2y dy = 2 − = .
0 0 2 2
On constate au passage que E[Y ] > E[X], ce qui n’a rien d’étonnant puisque la densité jointe
f (x, y) = 2e−(x+y) 1{0≤x≤y} montre que pour toute réalisation (x, y) du couple (X, Y ), on doit
avoir x ≤ y.
Dans le cas général, par définition, les variables aléatoires X et Y sont indépendantes si pour tout
couple de sous-ensembles A1 et A2 de R, on a :
P((X, Y ) ∈ A1 × A2 ) = P(X ∈ A1 , Y ∈ A2 ) = P(X ∈ A1 ) × P(Y ∈ A2 ).

Dit simplement, les variables X et Y sont indépendantes si la valeur prise par l’une n’a aucune
espèce de répercussion sur celle prise par l’autre (penser par exemple au lancer simultané de deux
dés). Si le couple (X, Y ) admet une densité jointe, l’indépendance se vérifie facilement.
Définition 28 (Indépendance)
Avec les notations précédentes, les variables aléatoires X et Y sont indépendantes si pour tout
couple (x, y) ∈ R2 :
f (x, y) = fX (x)fY (y).
Exemple. Pour l’exemple précédent, X et Y ne sont pas indépendantes puisque :
f (0, 0) = 2 6= fX (0)fY (0) = 0.
Remarque. Le raisonnement sur les supports permet parfois de conclure rapidement à la non-
indépendance. Le support de la loi de X est l’adhérence de l’endroit où X a des chances de tomber :
Supp(X) = Adh{x ∈ R : f (x) 6= 0}.
C’est généralement un intervalle fermé IX . On définit de même le support IY de la loi de Y . Mais

alors, si X et Y sont indépendantes, le support du couple (X, Y ) est IX × IY , produit cartésien de
IX par IY . C’est-à-dire, en général, un pavé (fermé) de R2 . Donc si le support du couple (X, Y )
n’est pas un pavé, X et Y ne sont pas indépendantes.
Exemple. Pour l’exemple précédent, le support de X est égal au support de Y , à savoir R+ =

[0, +∞[. Donc si X et Y étaient indépendantes, le support du couple (X, Y ) serait le pavé R+ × R+ .
Or le support de (X, Y ) est :
Supp(X, Y ) = {(x, y) ∈ R2 : 0 ≤ x ≤ y} =
6 R+ × R+ ,
donc X et Y ne sont pas indépendantes (voir Figure 2.16).
Proposition 12 (Critère d’indépendance)

Si la densité jointe f (x, y) peut se décomposer sous la forme g(x)h(y), alors X et Y sont indépen-
dantes.

y y
Supp(X, Y )
Supp(X)×Supp(Y )
x x
Figure 2.16 – Support du couple (X, Y ) (à gauche) et produit cartésien des supports de X et de
Y (à droite).
Plus précisément, il existe alors une constante c telle que fX (x) = cg(x) et fY (y) = h(y)/c, de
sorte qu’on a bien f (x, y) = fX (x)fY (y).
Preuve. On a par définition

Z Z
fX (x) = f (x, y)dy = g(x) h(y)dy,
R R
et Z Z
fY (y) = f (x, y)dx = h(y) g(x)dx.
R R
Puisque f est une densité, on a également
ZZ Z Z
1= f (x, y)dxdy = g(x)dx × h(y)dy ,
R R
R2
de sorte que si on pose c = R h(y)dy, alors R g(x)dx = 1/c, et les deux équations initiales
R R
deviennent fX (x) = cg(x) et fY (y) = h(y)/c. Au total, on a donc f (x, y) = fX (x)fY (y), ce qui
montre bien l’indépendance de X et Y .

2.3.2 Transfert, corrélation, indépendance

Etant donné un couple aléatoire (X, Y ), on peut s’intéresser à une fonction de ces deux variables,
par exemple leur somme, leur produit, leur maximum, etc. De façon générale, ceci correspond à
étudier une variable aléatoire Z = ϕ(X, Y ). Le résultat suivant donne une façon souvent efficace
de calculer sa moyenne.
Théorème 16 (Théorème de transfert)
La variable aléatoire Z = ϕ(X, Y ) a pour moyenne
ZZ
E[Z] = E[ϕ(X, Y )] = ϕ(x, y)f (x, y)dxdy,
R 2
sous réserve d’absolue convergence de l’intégrale.

Remarque. L’intérêt de ce résultat est de permettre de calculer la moyenne de Z sans pour autant
avoir à déterminer sa loi.
Exemple. Pour l’exemple précédent, où f (x, y) = 2e−(x+y) 1{0≤x≤y} , l’espérance de XY se calcule

ainsi sans problème :
ZZ Z +∞ Z x
E[XY ] = 2 xye−(x+y)
1{0≤x≤y} dxdy = 2 ye−y −x
xe dx dy,
R2
0 0
d’où, après une intégration par parties,

Z +∞
ye−y 1 − e−y − ye−y dy,

E[XY ] = 2
0
que l’on décompose de façon à faire apparaître des moments de variables exponentielles :
Z +∞ Z +∞ Z +∞
−y −2y 1 2!
E[XY ] = 2 ye dy − y × 2e dy − y 2 × 2e−2y dy = 2 − − 2 = 1.
0 0 0 2 2
Corollaire 4 (Linéarité de l’espérance)

Si X et Y admettent une espérance, alors il en va de même pour la variable aléatoire X + Y , avec
E[X + Y ] = E[X] + E[Y ],
et plus généralement, pour tous réels α et β,
E[αX + βY ] = αE[X] + βE[Y ].
Preuve. Il suffit de considérer la fonction ϕ(x, y) = x + y dans le théorème de transfert. En effet,

ceci donne
ZZ Z Z Z Z
E[X + Y ] = (x + y)f (x, y)dxdy = x f (x, y)dy dx + y f (x, y)dx dy,
R R R R
R2
et on voit apparaître les densités respectives de X et Y , d’où
Z Z
E[X + Y ] = xfX (x)dx + yfY (y)dy = E[X] + E[Y ].
R R

Le théorème de transfert permet en particulier de calculer la covariance de deux variables.
Définition 29 (Covariance, décorrélation)

Sous réserve d’existence, la covariance du couple (X, Y ) est définie par
Cov(X, Y ) = E[(X − E[X])(Y − E[Y ])] = E[XY ] − E[X]E[Y ].
On dit que les variables X et Y sont décorrélées si leur covariance est nulle, ce qui revient à dire
que E[XY ] = E[X]E[Y ].
Exemple. Soit X qui suit une loi uniforme sur [−1, +1] et Y définie par Y = X 2 . Alors par le
théorème de transfert, Z 1
3 dx
E[XY ] = E[X ] = x3 × = 0.
−1 2

De même E[X] = 0, donc sans même calculer E[Y ], on a aussi E[X]E[Y ] = 0. Il s’ensuit que :
Cov(X, Y ) = E[XY ] − E[X]E[Y ] = 0,
c’est-à-dire que X et Y sont décorrélées.
On peut alors donner plusieurs propriétés de la covariance.
Propriétés 2 (Quelques formules sur la covariance)

Soit X et Y variables aléatoires admettant des moments d’ordre 2. Alors :
1. Cov(X, Y ) = Cov(Y, X).
2. Cov(X, X) = Var(X).
3. pour tous réels a, b, c, d : Cov(aX + b, cY + d) = ac Cov(XY ).
4. Var(X + Y ) = Var(X) + 2Cov(X, Y ) + Var(Y ).
Preuve. Les deux premiers points sont évidents. Le troisième s’obtient en appliquant la définition
de la covariance et en utilisant la linéarité de l’espérance. Détaillons uniquement le dernier :
Var(X +Y ) = E[(X +Y )2 ]−(E[X +Y ])2 = E[X 2 ]+2E[XY ]+E[Y 2 ]−(E[X]2 +2E[X]E[Y ]+E[Y ]2 ),
et il suffit de bien regrouper les termes :
Var(X + Y ) = (E[X 2 ] − E[X]2 ) + 2(E[XY ] − E[X]E[Y ]) + (E[Y 2 ] − E[Y ]2 )
pour arriver à la formule voulue.

Cette démonstration montre que la dernière formule est bien sûr liée à l’identité remarquable vue
dans les petites classes : (x + y)2 = x2 + 2xy + y 2 . Elle souligne en particulier que, dans le cas gé-
néral, la variance n’est pas linéaire puisqu’on n’a pas Var(X + Y ) = Var(X) + Var(Y ). Nous allons
maintenant préciser ce point. On note σ(X) et σ(Y ) les écarts-types respectifs des variables X et Y .
Définition 30 (Coefficient de corrélation)

Soit X et Y variables aléatoires admettant des variances non nulles. Le coefficient de corrélation
entre X et Y est défini par :
Cov(X, Y )
ρ(X, Y ) = .
σ(X)σ(Y )
Si ρ(X, Y ) = Cov(X, Y ) = 0, X et Y sont décorrélées, ce qui est équivalent à dire que :
Var(X + Y ) = Var(X) + Var(Y ).
Le coefficient de corrélation est aussi appelé coefficient de corrélation linéaire, car il mesure en
fait la linéarité entre les deux variables X et Y . C’est ce qu’explique le résultat suivant.
Proposition 13 (Inégalité de Cauchy-Schwarz)

Soit X et Y variables aléatoires admettant des moments d’ordre 2, alors :
−1 ≤ ρ(X, Y ) ≤ +1,
avec plus précisément :

1. ρ(X, Y ) = −1 ssi ∃(a, b) ∈ R∗− × R tels que Y = aX + b ;

2. ρ(X, Y ) = +1 ssi ∃(a, b) ∈ R∗+ × R tels que Y = aX + b.
Preuve. La démonstration la plus expéditive de ce résultat est basée sur une ruse de sioux. Comme
toute variable aléatoire, la variable (tX + Y ) est de variance positive, et ce quel que soit le réel t,
ce qui s’écrit encore :
0 ≤ Var(tX + Y ) = Var(tX) + 2Cov(tX, Y ) + Var(Y ) = t2 Var(X) + 2Cov(X, Y )t + Var(Y ),
que l’on peut voir comme un trinôme en t. Or un trinôme n’est de signe constant que si son
discriminant est inférieur ou égal à 0, c’est-à-dire :
Cov(X, Y )2 − Var(X)Var(Y ) ≤ 0 ⇐⇒ |ρ(X, Y )| ≤ 1.
Supposons ρ(X, Y ) = +1, alors en remontant les équations ceci implique qu’il existe un réel t0 tel
que Var(t0 X + Y ) = 0, donc il existe un réel b tel que t0 X + Y = b, c’est-à-dire Y = −t0 X + b.
Dans ce cas
Cov(X, −t0 X + b) −t0
ρ(X, Y ) = = ,
σ(X)σ(−t0 X + b) |t0 |
qui vaut 1 si et seulement si t0 est négatif. Le même raisonnement permet de conclure lorsque
ρ(X, Y ) = −1.

Remarque. L’inégalité |Cov(X, Y )| ≤ σ(X)σ(Y ) n’est rien de plus que l’inégalité de Cauchy-
Schwarz adaptée au cadre des variables aléatoires. Le coefficient de corrélation de deux variables
aléatoires est donc équivalent au cosinus de l’angle entre deux vecteurs.
Interprétation. De façon générale, plus le coefficient de corrélation est proche de 1 en valeur

absolue, plus les variables X et Y sont linéairement liées. Un coefficient de corrélation nul signifie
donc que les deux variables ne sont pas linéairement liées. Il n’empêche qu’elle peuvent être liées
par un autre type de relation : c’est ce qui apparaît clairement sur l’exemple ci-dessus où Y = X 2 ,
puisqu’une fois X connue, il n’existe plus aucune incertitude sur Y .
Face à ce constat, on aimerait définir le fait qu’il n’existe aucune sorte de relation entre X et Y :
c’est précisément la notion d’indépendance, laquelle implique donc la décorrélation.
Proposition 14 (Indépendance ⇒ Décorrélation)

Soit X et Y variables aléatoires admettant des moments d’ordre 2. Si X et Y sont indépendantes,
alors elles sont décorrélées. En particulier, on a alors :
Var(X + Y ) = Var(X) + Var(Y ).
Preuve. Le théorème de transfert permet d’écrire l’espérance de XY de la façon suivante :

ZZ ZZ
E[XY ] = xyf (x, y)dxdy = xyfX (x)fY (y)dxdy,
R2 R2
que l’on peut alors paisiblement séparer en produit de deux intégrales :
Z Z
E[XY ] = xfX (x)dx × yfY (y)dy = E[X]E[Y ],
R R
d’où Cov(X, Y ) = 0, c’est-à-dire que X et Y sont décorrélées.


Remarques :
1. La réciproque est fausse en général. Pour s’en assurer il suffit de reprendre l’exemple où X
est uniforme sur [−1, +1] et Y = X 2 . On a vu que Cov(X, Y ) = 0, c’est-à-dire que X et Y
sont décorrélées. Mais elles ne sont clairement pas indépendantes : le support est le morceau
de la parabole y = x2 pour −1 ≤ x ≤ 1, et non un produit d’intervalles. Ou encore :
1 1
fX,Y (0, 0) = fX (0) = 6= = fX (0)2 = fX (0)fY (0).
2 4
2. La preuve précédente montre que de façon générale, si X et Y sont indépendantes, la relation
suivante est vérifiée pour toutes “bonnes” fonctions ϕ et ψ :
E[ϕ(X)ψ(Y )] = E[ϕ(X)] × E[ψ(Y )].
Cette égalité correspond en fait à la caractérisation de l’indépendance pour un couple de

variables quelconques (i.e. non nécessairement à densité).
2.3.3 Changement de variables, convolution

La formule de changement de variables dans les intégrales doubles permet de déterminer la densité
d’un couple aléatoire (U, V ) à partir de celle d’un couple aléatoire (X, Y ) lorsque ceux-ci sont en
bijection.
Théorème 17 (Changement de variables)

Soit (X, Y ) un couple aléatoire de densité fX,Y . Soit ϕ : R2 → R2 un C 1 -difféomorphisme tel que
(x, y) = ϕ(u, v). Alors le couple aléatoire (U, V ) admet pour densité
fU,V (u, v) = fX,Y (ϕ(u, v))| det Jϕ (u, v)|
si le point (u, v) est dans l’image réciproque de ϕ, 0 sinon.
On rencontre souvent ce résultat sous la forme équivalente suivante : si (U, V ) = ψ(X, Y ), alors le
couple (U, V ) admet pour densité
fU,V (u, v) = fX,Y (ψ −1 (u, v))| det Jψ−1 (u, v)|
si le point (u, v) est dans l’image de ψ, 0 sinon.
Etant donné un couple (X, Y ), on s’intéresse à la loi de la somme S = X + Y de ces variables.

C’est en fait un cas particulier d’application du résultat précédent.
Proposition 15 (Densité de la somme)

Soit (X, Y ) un couple de densité jointe fX,Y , alors leur somme S = X + Y admet pour densité
Z +∞ Z +∞
fS (s) = fX,Y (x, s − x)dx = fX,Y (s − y, y)dy.
−∞ −∞
Si X et Y sont indépendantes, de densités respectives fX et fY , l’expression précédente devient

Z +∞ Z +∞
fS (s) = fX (x)fY (s − x)dx = fX (s − y)fY (y)dy,
−∞ −∞
et on dit que fS est le produit de convolution de fX et fY .

Preuve. L’idée consiste à considérer le couple (S, T ) = (X + Y, Y ) et à appliquer le théorème de

changement de variables. En effet, puisque de façon équivalente on a (X, Y ) = (S −T, T ) = ϕ(S, T ),
un calcul immédiat donne | det Jϕ (s, t)| = 1 et la densité du couple (S, T ) est donc tout bonnement
fS,T (s, t) = fX,Y (s − t, t). Dès lors, pour en déduire la loi marginale de S, il suffit d’intégrer par
rapport à la seconde variable, c’est-à-dire t. La densité de la somme S est donc
Z +∞ Z +∞ Z +∞
fS (s) = fX,Y (s − t, t)dt = fX,Y (s − y, y)dy = fX,Y (x, s − x)dx,
−∞ −∞ −∞
la dernière expression découlant du changement de variable x = s − y.

Achtung ! Beaucoup de densités font intervenir des fonctions indicatrices. Celles-ci jouent un rôle
crucial lors du calcul de la densité d’une somme. La vigilance est donc de mise...
Exemple. Une simple loi uniforme permet d’illustrer ce qui vient d’être dit. Soit donc X et Y
deux variables indépendantes et uniformes sur [0, 1]. Montrer que leur somme S a pour densité
fS (s) = s1[0,1] (s) + (2 − s)1[1,2] (s).
Le résultat suivant assure que les lois gaussiennes sont stables par convolution. La preuve est dé-
taillée en exercice 2.39.
Corollaire 5 (Somme de gaussiennes)

Soit X1 ∼ N (m1 , σ12 ) et X2 ∼ N (m2 , σ22 ) deux variables gaussiennes indépendantes, alors leur
somme est elle aussi une variable gaussienne : X1 + X2 ∼ N (m1 + m2 , σ12 + σ22 ).
2.4 Exercices
Exercice 2.1 (Importance de l’ordre d’intégration)
Soit le domaine
T = {(x, y) ∈ R2 , 0 ≤ y ≤ x ≤ 1}
2
et la fonction f définie par f (x, y) = ex .
1. Calculer l’intégrale de f sur T comme suit :
ZZ Z 1 Z x
f (x, y)dxdy = f (x, y)dy dx.
0 0
T
2. Essayer de calculer l’intégrale de f sur T en intégrant dans l’autre sens.
Corrigé
1. Dans ce sens tout se passe paisiblement puisque
1 Z x 1 Z x 1h 1 1
1 x2
Z Z Z ix Z
x2 x2 x2
f (x, y)dy dx = e dy dx = e y dx = xe dx = e ,
0 0 0 0 0 0 0 2 0
d’où
e−1
ZZ
f (x, y)dxdy = .
2
T

2.4. Exercices 109
2. Dans l’autre sens, rien ne va plus puisque

Z 1 Z 1 Z 1 Z 1
x2
f (x, y)dx dy = e dx dy,
0 x 0 x
Z
2 2
or la primitive de x 7→ ex n’admet pas d’expression plus simple que ex dx. Il suffit pour
s’en persuader de penser à la fonction de répartition d’une loi normale et à la nécessité de se
reporter à une table de quantiles ou à un logiciel pour les valeurs de celle-ci. Bref, en essayant
d’intégrer dans cet ordre, tout est bloqué !
Exercice 2.2 (Problème d’interversion)

Soit f la fonction numérique définie sur C = [0, 1] × [0, 1] par
1
si 0 < x < y < 1

 y2
f (x, y) = − x12 si 0 < y < x < 1
0 sinon

1. Calculer Z 1 Z 1 Z 1 Z 1
f (x, y)dx dy & f (x, y)dy dx.
0 0 0 0
2. Conclusion ?
Corrigé
1. On a d’une part
1 Z 1 1 Z y 1 Z 1 y 1 !
1 1 x 1
Z Z Z
f (x, y)dx dy = dx − dx dy = + dy,
0 0 0 0 y2 y x2 0 y2 0 x y
ce qui donne tout simplement

Z 1 Z 1 Z 1
f (x, y)dx dy = dy = 1.
0 0 0
Par ailleurs, un calcul comparable montre que

Z 1 Z 1
f (x, y)dy dx = −1.
0 0
2. Ainsi les deux ordres d’intégration possibles donnent deux résultats différents. Le problème
vient de ce que la fonction f n’est pas continue sur le domaine C puisqu’elle explose en l’ori-
gine. On a ici affaire à une intégrale généralisée divergente.
Exercice 2.3 (Deux changements de variables)

Soit D = {(x, y) ∈ R2 , y ≥ 0, x2 + y 2 ≤ 1}.
1. Représenter D.
2. Donner l’ensemble correspondant ∆ en coordonnées polaires.
Z 1
r3
3. Calculer l’intégrale simple J = √ dr (on pourra par exemple utiliser le changement
√ 0 1 + r2
de variable u = 1 + r 2 ).

4. Calculer l’intégrale double :
(x + y)2
ZZ
I= p dxdy.
1 + x2 + y 2
D
Corrigé
1. D est le demi-disque fermé unité situé au-dessus de l’axe des abscisses.
2. En coordonnées polaires : ∆ = {(ρ, θ), 0 ≤ ρ ≤ 1, 0 ≤ θ ≤ π}.
√
2− 2
3. Via le changement de variable, on obtient sans problème J = 3 .
4. Un changement en polaires donne alors (via la relation sin 2θ = 2 cos θ sin θ) :
ZZ 2 Z π √
ρ (1 + sin 2θ) 2− 2
I= p ρdρdθ = J (1 + sin 2θ)dθ = π.
1 + ρ2 0 3
∆
Exercice 2.4 (Changement linéaire de variables)

1. Représenter D = (x, y) ∈ R2 , x > 0, y > 0, 21 < x + y < 1 .

2. On considère le C 1 -difféomorphisme
R2 → R2

ϕ:
(u, v) 7→ (x, y) = ( 12 (u + v), 12 (u − v))
Montrer que le domaine correspondant à D pour les coordonnées (u, v) est

2 1
∆ = (u, v) ∈ R , < u < 1, −u < v < u .
2
3. Quelle est la matrice jacobienne Jϕ (u, v) de ϕ au point (u, v) ?

4. Calculer ZZ
x−y
I= e x+y dxdy.
D
Corrigé
1. Le domaine D est représenté Figure 2.17.
1
D
1
2
1
2
1
Figure 2.17 – Domaine d’intégration D.

2.4. Exercices 111
2. Les conditions (x > 0) et (y > 0) se traduisent respectivement par (−u < v) et (v < u). La
condition (1/2 < x + y < 1), se traduit, elle, par (1/2 < u < 1). Au total, on a bien :
1
ϕ−1 (D) = ∆ = {(u, v) ∈ R2 , < u < 1, −u < v < u}.
2
3. La matrice jacobienne de ϕ au point (u, v) est :

1 1 1
Jϕ (u, v) = .
2 1 −1
La valeur absolue du déterminant jacobien est donc constante et vaut 1/2.

4. On peut maintenant appliquer la formule de changement de variables :
1 Z u 1h
1 1 1 iu
ZZ ZZ Z Z
x−y v v v
I= e x+y dxdy = e dudv =
u e dv du =
u ue u du.
2 2 1
−u 2 1 −u
2 2
D ∆
Soit encore 2 1
Z 1
1 1 1 1 u 3 1
I= e− udu = e− = e− .
2 e 1 2 e 2 1 16 e
2 2
Exercice 2.5 (Intégrations par parties)

1. Représenter D = {(x, y) ∈ R2 , 0 ≤ x ≤ π2 , −x ≤ y ≤ x} et calculer
ZZ
I= x sin(x + y)dxdy.
D
2. Soit R = [1, 2] × [0, 1]. Calculer
x
ZZ
J= dxdy.
x+y
R
π
2
A
π
2
− π2
B
Figure 2.18 – Domaine d’intégration D.
Corrigé

1. Soit A( π2 , π2 ) et B( π2 , − π2 ). D est l’intérieur du triangle OAB. Pour le calcul de I, on applique

le théorème de Fubini :
ZZ Z π Z x
2
I= x sin(x + y)dxdy = x sin(x + y)dy dx.
0 −x
D
On s’est ainsi ramené à un calcul d’intégrale simple :

Z π Z π
2 2
x
I= x [− cos(x + y)]−x dx = (x − x cos 2x)dx.
0 0
Le premier terme ne pose pas problème, le second se calcule via une intégration par parties :
2 π2 π Z π
x 1 2 1 2 π2 1 π
I= − x sin 2x + sin 2xdx = − [cos 2x]02
2 0 2 0 2 0 8 4
π2
D’où finalement : I = 8 + 21 .
2. On obtient :
Z 2 Z 1 Z 2 Z 2
x 1
I= dy dx = [x ln(x + y)]0 dx = (x ln(1 + x) − x ln x)dx,
1 0 x+y 1 1
calcul d’intégrale simple qu’on peut traiter grâce à une intégration par parties (histoire de
se débarrasser des logarithmes) :
2
1 2 1 2
2
x2
Z 2 Z
x x 5 1
I= ln(1 + x) − ln x − − x dx = 2 ln 3− ln 2+ 1− dx
2 2 1 2 1 1+x 2 2 1 1+x
ce qui donne
5 1 1 3
I = 2 ln 3 − ln 2 + [x − ln(1 + x)]21 = + ln 3 − 2 ln 2.
2 2 2 2
Exercice 2.6 (Fonctions puissances)

1. Représenter D1 = {(x, y) ∈ R2 , y 2 ≤ x ≤ 4, 0 ≤ y ≤ 2} et calculer l’intégrale de f (x, y) =
x2 + y 2 sur cet ensemble.
2. Représenter D2 = {(x, y) ∈ R2 , x2 ≤ y ≤ x} et calculer l’intégrale de f (x, y) = y − x sur cet
ensemble.
3. Représenter D3 = {(x, y) ∈ R2 , 0 ≤ x ≤ π, |y| ≤ sin x} et calculer l’intégrale de f (x, y) =
y 2 cos x sur cet ensemble.
Corrigé
√
1. On peut encore écrire D1 = {(x, y), 0 ≤ x ≤ 4, 0 ≤ y ≤ x}, c’est-à-dire que D1 correspond
√
au domaine délimité par l’axe x = 0, l’axe x = 4, l’axe y = 0 et la courbe y = x (Figure
2.19 à gauche). La fonction f est continue sur le domaine D1 , donc il n’y a pas de problème
de définition de l’intégrale. Le calcul donne :
Z 4 Z √x ! Z 4 3
√x Z 4 !
2 2 2 y 5/2 x3/2
I1 = (x + y )dy dx = x y+ dx = x + dx,
0 0 0 3 0 0 3
d’où finalement : 4
2 7/2 2 4288
I1 = x + x5/2 = .
7 15 0 105

2.4. Exercices 113
2 1 1
1.8 0.9 0.8
1.6 0.8 0.6
1.4 0.7 0.4
1.2 0.6 0.2
1 0.5 0
0.8 0.4 −0.2
0.6 0.3 −0.4
0.4 0.2 −0.6
0.2 0.1 −0.8
0 0 −1
0 0.5 1 1.5 2 2.5 3 3.5 4 0 0.2 0.4 0.6 0.8 1 0 0.5 1 1.5 2 2.5 3 3.5
Figure 2.19 – Domaines d’intégration D1 , D2 et D3 .
2. Le domaine s’écrit encore (Figure 2.19 au centre) :
D2 = {(x, y) ∈ R2 , 0 ≤ x ≤ 1, x2 ≤ y ≤ x},
d’où :
1 Z x 1 2 x 1
x2 x4

y
Z Z Z
3
I2 = (y − x)dy dx = − xy dx = − − + x dx,
0 x2 0 2 x2 0 2 2
ce qui aboutit à :
1
x3 x5 x4

1
I2 = − − + =− .
6 10 4 0 60
3. On a cette fois le domaine représenté Figure 2.19 à droite et le calcul est élémentaire :
Z π Z sin x
2 π 3

1 4 π
Z
I3 = cos x y 2 dy dx = sin x cos xdx = sin x 0 = 0.
0 − sin x 3 0 6
Remarque : on peut voir le résultat directement en notant que le domaine d’intégration est
symétrique par rapport à x = π2 et que y 2 cos(π − x) = −y 2 cos x.
Exercice 2.7 (Aire et centre de gravité)

1. On considère le domaine
x2 y2

D = (x, y), 1 ≤ ≤ 4, 1 ≤ ≤2 .
y x
(a) Représenter D.
x2 y2
(b) Montrer que l’aire de D vaut 1 grâce au changement de variable u = y et v = x.
2. Si D est un domaine du plan d’aire A > 0, on appelle centre de gravité de D le point G de
coordonnées :
1 1
ZZ ZZ
xG = xdxdy et yG = ydxdy.
A A
D D
(a) Déterminer le centre de gravité de D = {(x, y), x ≥ 0, y ≥ 0, x2 + y 2 ≤ 1}.

(b) Déterminer le centre de gravité de D = {(x, y), x ≥ 0, 21 ≤ x2 + y 2 ≤ 1}. Que
remarquez-vous quant à la position de G par rapport au domaine D ?

12
10
D
4
0.4 0.8 1.2 1.6 2.0 2.4 2.8 3.2
n o
x2 y2
Figure 2.20 – Domaine D = (x, y) : 1 ≤ y ≤ 4, 1 ≤ x ≤2 .
Corrigé
1. (a) Le domaine D est représenté Figure 2.20.
x2 y2
(b) Le changement de variable u = y et v = x correspond au C 1 -difféomorphisme

∆ →D
ϕ:
(u, v) 7→ (x = u2/3 v 1/3 , y = u1/3 v 2/3 )
avec ∆ = {(u, v) : 1 ≤ u ≤ 4, 1 ≤ v ≤ 2}. La matrice jacobienne de ϕ est :
1 2(v/u)1/3 (u/v)2/3

Jϕ (u, v) = ,
3 (v/u)2/3 2(u/v)1/3
dont le déterminant vaut : det Jϕ (u, v) = 1/3. L’aire du domaine D est donc :
1
ZZ ZZ
A(D) = dxdy = dudv,
3
D ∆
d’où :
4 Z 2
1
Z
A(D) = dv du = 1.
3 1 1
2. (a) Le domaine D est un quart de disque unité, il a donc pour surface π/4. Le changement
en polaires donne alors :
Z π ! 1
4 1 4 r3 4
Z π
2
2
xG = r cos θ dr = [sin θ]02 = .
π 0 0 π 3 0 3π
4
Par symétrie des rôles joués par x et y, on trouve aussi yG = 3π .

2.4. Exercices 115
(b) Le domaine D est √ la moitié de couronne comprise entre deux moitiés de disques de
rayons respectifs 1/ 2 et 1, donc de surface A = π/4. On a donc :
Z π !
4 1

8 1
Z
2
2
xG = r cos θdθ dr = 1− √ .
π √1 −π 3π 2 2
2 2
√
On montre aussi que yG = 0. En prenant les estimations grossières π ≈ 3 et 2 ≈ 1.5,
on voit que xG ≈ 16 √1
27 ≤ 2 , c’est-à-dire que G n’est pas dans le domaine D.
Exercice 2.8 (Intégrale généralisée)

Soit T = {(x, y) ∈ R2 , 0 ≤ x ≤ 1, −x ≤ y ≤ x}.
1. Représenter T .
2. On veut calculer : ZZ y
I= exp dxdy.
x
T
Expliquer pourquoi cette intégrale double est généralisée.
3. Pour n > 1, soit Tn = {(x, y) ∈ R2 , n1 ≤ x ≤ 1, −x ≤ y ≤ x}. Représenter Tn et calculer :
ZZ y
In = exp dxdy.
x
Tn
4. I est-elle convergente ? Si oui, donner sa valeur.
Corrigé
1. T est l’intérieur du triangle de sommets O(0, 0), A(1, 1) et B(1, −1).
2. On veut calculer : ZZ y
I= exp dxdy.
x
T
Cette intégrale double est généralisée car la fonction à intégrer n’est pas définie au point
O(0, 0).
3. Pour n > 1, soit :
1
Tn = {(x, y) ∈ R2 , ≤ x ≤ 1, −x ≤ y ≤ x}.
n
Tn est un trapèze ne contenant pas O : il a pour sommets An (1/n, 1/n), A(1, 1), B(1, −1) et
Bn (1/n, −1/n). On peut donc calculer sans problème :
ZZ y
In = exp dxdy
x
Tn
par le théorème de Fubini : on commence par intégrer par rapport à y, puis par rapport à x.
On obtient :
1 1 1
In = e− 1− 2 .
2 e n
4. On intègre une fonction positive et la suite de domaines (Tn ) tend vers le domaine T . Puisque
la suite d’intégrales (In ) est convergente, I est elle-même convergente de valeur :

1 1
I = lim In = e− .
n→∞ 2 e

Exercice 2.9 (Variables

séparables)
1. Représenter D = (x, y) ∈ R2 , 0 < x ≤ 1, 0 < y ≤ x1 .
2. Expliquer pourquoi l’intégrale suivante est généralisée :
ZZ
1 1
I= x− 4 y − 2 dxdy.
D
3. Pour n > 1, représenter Dn = (x, y) ∈ R2 , n1 ≤ x ≤ 1, n1 ≤ y ≤ 1

x et calculer :
ZZ
1 1
In = x− 4 y − 2 dxdy.
Dn
4. I est-elle convergente ? Si oui, donner sa valeur.
D
1 1 Dn
1
n
1
1 n
1
Figure 2.21 – Domaines d’intégration D et Dn .
Corrigé
1. Le domaine D est représenté Figure 2.21 à gauche.
2. L’intégrale est généralisée car la fonction n’est définie ni sur l’axe des abscisses ni sur l’axe
des ordonnées. De plus, le domaine d’intégration est infini.
3. Le domaine Dn est représenté Figure 2.21 à droite.
4. Le calcul est ne pose pas problème :
Z 1 Z 1 !
−1/4
x
−1/2 − 14 1 −1 1 −5
In = x y dy dx = · · · = 8 1 − n − n 2 + n 4 .
1 1 3 3
n n
La fonction intégrée étant positive et la suite de domaines (Dn ) tendant vers D, on a donc
I = limn→∞ In = 8, intégrale convergente.
Exercice 2.10 (Deux études complètes)

Dans chacune des situations suivantes, représenter le domaine d’intégration, trouver une suite
adéquate de domaines et conclure sur la convergence de l’intégrale :
ZZ
I= e−x dxdy où T = {(x, y), x ≥ 1, 0 ≤ y ≤ x}
T

2.4. Exercices 117
5
ZZ
J= dxdy où B = {(x, y), x2 + y 2 ≤ 9}.
(x2 + y 2 )2/3
B
3
1 T
Figure 2.22 – Domaines d’intégration T et B.
Corrigé
Pour la première intégrale, la fonction (x, y) 7→ e−x est continue et positive sur le domaine infini T
(représenté Figure 2.22 à gauche), donc pour montrer qu’elle est convergente, il suffit de le vérifier
pour une suite croissante de domaines de limite T , par exemple la suite de trapèzes rectangles :
Tn = {(x, y), 1 ≤ x ≤ n, 0 ≤ y ≤ x}.
On a alors : ZZ Z n Z x Z n
−x −x
In = e dxdy = e dy dx = xe−x dx,
1 0 1
Tn
et une intégration par parties (via u(x) = x et v ′ (x) = e−x ) mène à

In = 2e−1 − e−n − ne−n .
Ainsi I est convergente et égale à I = limn→∞ In = 2e−1 .
Pour la seconde intégrale, la fonction (x, y) 7→ 5(x2 +y 2 )−2/3 est positive sur la boule B (représentée
Figure 2.22 à droite) mais non définie en (0, 0). On considère cette fois la suite de couronnes :

1 2 2
Bn = (x, y), 2 ≤ x + y ≤ 9 .
n
Et le calcul de Jn se fait comme d’habitude par un passage en polaires :
Z 3
5
ZZ h i3
−1/3 2/3 2/3 −2/3
Jn = ρdρdθ = 10π ρ dρ = 15π ρ = 15π 3 − n .
ρ4/3 1
n
1
n
∆n
On en déduit la convergence de l’intégrale : J = limn→∞ Jn = 15π32/3 .
Exercice 2.11 (Des carrés)

Soit C = {(x, y) ∈ R2 , 0 ≤ x ≤ 1, 0 ≤ y ≤ 1} et f : (x, y) 7→ 1
(x+y)2 . On veut étudier l’intégrale
double : ZZ
I= f (x, y)dxdy.
C

1. En quoi cette intégrale est-elle généralisée ?

2. Soit Cn = {(x, y) ∈ R2 , 1
n ≤ x ≤ 1, 1
≤ y ≤ 1}. Représenter Cn et calculer :
n
ZZ
In = f (x, y)dxdy.
Cn
3. Conclure sur la convergence de l’intégrale I.

4. Que dire de l’intégrale de f sur le domaine T = {(x, y) ∈ R2 , x ≥ 1, 0 ≤ y ≤ x2 } ?
Corrigé
1. La fonction f n’est pas définie au point (0, 0) de C.
2. Cn est le carré de sommets A(1/n, 1/n), B(1/n, 1), C(1, 1) et D(1, 1/n). Le point (0, 0) n’est
pas dans le carré Cn donc on est ramené à un calcul d’intégrale classique :
Z 1 Z 1 ! Z 1 1 Z 1 !
1 1 1 1
In = dy dx = − dx = − dx,
n
1 1 (x + y)2
n
1 x+y 1
n
1 x + n1 x+1
n
n
d’où finalement 1
(n + 1)2

1
In = ln x + − ln(x + 1) = ln .
n 1 4n
n
3. f est positive sur C et la suite de carrés (Cn ) tend vers le carré C. On a
(n + 1)2
lim = +∞,
n→∞ 4n
donc limn→∞ In = +∞ et I est divergente, de valeur +∞.
y
1
x
1 2 3
Figure 2.23 – Domaine T = {(x, y), x ≥ 1, 0 ≤ y ≤ x2 }.
4. Le domaine T est donné Figure 2.23. L’intégrale I est généralisée puisque le domaine T est
non borné. En posant
Tn = {(x, y), 1 ≤ x ≤ n, 0 ≤ y ≤ x2 },
on obtient
n x2
! Z n x 2
1 1 1
ZZ Z Z
In = dxdy = dy dx = − dx,
(x + y)2 1 0 (x + y)2 1 x+y 0
Tn

2.4. Exercices 119
ce qui donne :
n
1
Z
In = dx = [ln(x + 1)]n1 = ln(n + 1) − ln 2,
1 x+1
donc limn→+∞ In = +∞. La fonction intégrée est positive sur le domaine T et (Tn ) est une
suite croissante de domaines de limite T . On en déduit que I = +∞, l’intégrale est divergente.
Exercice 2.12 (Intégrale divergente)

On s’intéresse à l’intégrale suivante :
ZZ
sin(x2 + y 2 )dxdy.
R2
√
1. Considérer les intégrales sur les disques de centre O et de rayons respectifs 2nπ.
p
2. Idem avec les disques de rayons respectifs (2n + 1)π. Conclure.
Corrigé
√
1. Soit (Dn ) la suite croissante de disques centrés en l’origine et de rayons ( 2nπ), alors un
changement en polaires donne
√2nπ
1
ZZ ZZ
2 2 2 2
In = sin(x + y )dxdy = sin(ρ )ρdρdθ = 2π − cos(ρ ) = 0.
2 0
Dn ∆n
2. Sipmaintenant (Dn′ ) est la suite croissante de disques centrés en l’origine et de rayons

( (2n + 1)π), alors par le même calcul
√(2n+1)π
1
ZZ ZZ
Jn = sin(x2 + y 2 )dxdy = sin(ρ2 )ρdρdθ = 2π − cos(ρ2 ) = 2π.
2 0
Dn
′ ∆′n
On voit donc que pour deux suites croissantes de domaines de limite R2 , les limites des
intégrales ne sont pas les mêmes : c’est exactement dire que l’intégrale généralisée n’est pas
convergente.
Exercice 2.13 (Puissances et exponentielles)

1. Soit A = {(x, y) ∈ R2 : 0 ≤ y ≤ x ≤ 1} et, pour n > 1, An = {(x, y) ∈ R2 : 1
n ≤ y ≤ x ≤ 1}.
(a) Représenter A et An .
(b) Expliquer pourquoi l’intégrale double suivante est généralisée :
x
ZZ
I= √ dxdy.
y
A
(c) Calculer :
x
ZZ
In = √ dxdy.
y
An
(d) Conclure sur la convergence de l’intégrale I.

2. Soit B = {(x, y) ∈ R2 : 0 ≤ x ≤ 2y}.
(a) Représenter B.

(b) Expliquer pourquoi l’intégrale double suivante est généralisée :

ZZ
2 2
J= xye−(x +y ) dxdy.
B
(c) Soit n ≥ 1 et Bn = {(x, y) ∈ R2 : 0 ≤ x ≤ 2y, 0 ≤ y ≤ n}. Représenter Bn et calculer :

ZZ
2 2
Jn = xye−(x +y ) dxdy.
Bn
(d) Conclure sur la convergence de l’intégrale J.

3. Soit C = {(x, y) ∈ R2 : x2 + y 2 ≥ 1}.
(a) Représenter C.
(b) Pour α ∈ R, on veut calculer :
1
ZZ
K= dxdy.
(x2 + y 2 )α
C
(c) Expliquer pourquoi cette intégrale double est généralisée.

(d) Pour n > 1, soit Cn = {(x, y) ∈ R2 , 1 ≤ x2 + y 2 ≤ n2 }. Représenter Cn et calculer :
1
ZZ
Kn = dxdy.
(x + y 2 )α
2
Cn
(e) En déduire les valeurs de α pour lesquelles l’intégrale K est convergente.
Corrigé
1. (a) Notons qu’on peut écrire A = {(x, y) ∈ R2 : 0 ≤ x ≤ 1, 0 ≤ y ≤ x} qui est
l’intérieur du triangle de sommets O(0, 0), A(1, 0) et B(1, 1). De même, pour n > 1,
An = {(x, y) ∈ R2 : n1 ≤ x ≤ 1, n1 ≤ y ≤ x} qui est l’intérieur du triangle de sommets
On ( n1 , n1 ), An (1, n1 ) et B(1, 1).
(b) Cette intégrale double est généralisée car f (x, y) = √xy n’est pas définie sur l’axe des
abscisses, plus précisément sur le segment [OA] où y = 0.
(c) La suite de domaines (An )n est croissante et tend vers le domaine A. Les points (x, 0),
x ∈ [0, 1], n’appartiennent pas à An donc on est ramené à un calcul d’intégrale classique.
Par le théorème de Fubini, on obtient :
1 Z x 1 √ x 1
1 4 1 1
Z Z Z
3 1
In = x √ dy dx = x 2 y 1 dx = 2 (x 2 −n− 2 x) = − √ + 2√
1 1 y 1 n 1 5 n 5n n
n n n n
4
(d) L’intégrale I est convergente car In → 5 quand n → +∞ et on intègre une fonction
positive, donc I = 45 .
2. (a) On peut réécrire B = {(x, y) ∈ R2 : y ≥ 0, 0 ≤ x ≤ 2y}, B correspond aux points situés
dans le demi-plan x ≥ 0 au-dessus de la droite y = x2 .
(b) Cette intégrale double est généralisée car le domaine B est non borné.

2.4. Exercices 121
(c) Soit n ≥ 1 et Bn = {(x, y) ∈ R2 : 0 ≤ x ≤ 2y, 0 ≤ y ≤ n}, le domaine Bn est l’intérieur

du triangle de sommets O(0, 0), An (2n, n) et Bn (0, n). Notons que la suite de domaines
bornés (Bn )n est croissante et tend vers le domaine B. Puisque (Bn )n est borné pour
tout n, on est ramené à un calcul d’intégrale classique. Spécifiquement, on obtient :
Z n Z 2y Z n
−y 2 −x2 2 1 2 2y
Jn = ye xe dx dy = ye−y − e−x 0 dy
0 0 0 2
d’où
n n
1 1 1 −5y2 1 −5n2 1 −n2 1
Z
−y 2 −5y 2 −y 2
Jn = ( ye − ye )dy = e −e = e − e + .
2 0 4 5 0 20 4 5
(d) Pour les mêmes raisons que ci-dessus, J est convergente, avec J = limn→+∞ Jn = 15 .
3. Soit C = {(x, y) ∈ R2 , x2 + y 2 ≥ 1}.
(a) C est égal à R2 privé du disque fermé unité.
(b) L’intégrale K est généralisée puisque le domaine C est non borné.
(c) Pour n > 1, soit Cn = {(x, y) ∈ R2 , 1 ≤ x2 + y 2 ≤ n2 }. Cn est la couronne intérieure
au disque de centre 0 et de rayon n et extérieure au disque unité. La suite de domaines
(Cn ) est donc croissante et tend vers le domaine C .
(d) Par passage en coordonnées polaires, on obtient :
Z n
1
Kn = 2π 2α−1
dρ,
1 ρ
et il faut distinguer deux situations. Ou bien α est différent de 1, auquel cas :

n
2π −2α+2 π
Kn = ρ = (1 − n2−2α ).
−2α + 2 1 α−1
Ou bien α = 1, dans ce cas l’intégrale vaut :

Z n
1
Kn = 2π dρ = 2π ln n.
1 ρ
(e) On en déduit que l’intégrale K est convergente ssi 2 − 2α < 0 c’est-à-dire ssi α > 1.
π
Dans ce cas, K = α−1 .
Exercice 2.14 (Intégrale gaussienne)

Soit f (x, y) = exp(−x2 − y 2 ). On veut calculer la valeur I de l’intégrale double de f sur R2 .
1. Représenter Dn = {(x, y), x2 + y 2 ≤ n}, calculer In (intégrale de f sur Dn ) et en déduire I.
2. Représenter Cn = {(x, y), −n ≤ x ≤ n, −n ≤ y ≤ n} et déterminer sans calculs
ZZ
lim f (x, y)dxdy.
n→∞
Cn
Z +∞ Z +∞ x2
3. Déterminer alors J = exp(−x2 )dx à l’aide de I. En déduire √1
2π
e− 2 dx.
−∞ −∞
Corrigé

√
1. Dn est le disque fermé de centre O et de rayon n. Pour calculer In , on passe en polaires,
ce qui donne
Z √n Z 2π Z √n h i√ n
−r 2 −r 2 −r 2
= π 1 − e−n .

In = dθ re dr = 2π re dr = π −e
0 0 0 0
La fonction f étant positive et (Dn ) est une suite croissante de domaines de limite R2 , on a
I = lim In = π.
n→∞
2. Le domaine Cn est le carré de côté 2n centré en l’origine. La suite (Cn ) est elle aussi de limite
R2 , donc on peut appliquer le résultat précédent
ZZ
lim f (x, y)dxdy = I = π.
n→∞
Cn
3. L’intégrale définie par J est doublement généralisée, mais clairement convergente tant il est
clair que exp(−x2 ) = o(1/x2 ) aussi bien en +∞ qu’en −∞. En particulier, on a
Z n
J = lim exp(−x2 )dx = lim Jn .
n→∞ −n n→∞
Notons alors que

Z n Z n ZZ
−x2 −y 2 2 +y 2 )
Jn2 = Jn × Jn = e dx × e dy = e−(x dxdy.
−n −n
Cn
Par la question précédente, il vient

√
J 2 = lim Jn2 = I = π ⇒ J = π.
n→∞
√
Le dernier calcul se fait par le changement de variable u = x/ 2, ce qui donne
Z +∞ Z +∞
1 2
− x2 1 2
√ e dx = √ e−u du = 1,
2π −∞ π −∞
ce qui est le résultat attendu puisque ce n’est rien d’autre que l’intégrale de la densité de la
loi normale centrée réduite (aire sous la courbe en cloche).
Remarque. La ruse de sioux consiste à passer par une intégrale double pour réussir à cal-
culer une intégrale simple.
Exercice 2.15 (Arc tangente)

Soit T = {(x, y) ∈ R2 , 1 ≤ x, 0 ≤ y ≤ x}. Justifier la convergence et calculer
1
ZZ
I= dxdy.
x3 + xy 2
T
Corrigé
Le domaine T est infini, l’intégrale est donc généralisée. Mais la fonction intégrée est positive sur
T donc il suffit de vérifier la convergence pour une suite croissante de domaines, par exemple pour
Tn = {(x, y) : 1 ≤ x ≤ n, 0 ≤ y ≤ x} (voir Figure 2.24). Ceci donne
Z n Z x Z n
1 1 1 h y ix
In = 2 2
dy dx = 2
arctan dx,
1 x 0 x +y 1 x x 0

2.4. Exercices 123
Tn
1
1 n
Figure 2.24 – Domaine Tn .
d’où finalement : n
1 n π

π 1 π 1
Z
In = dx = − = 1− .
4 1 x2 4 x 1 4 n
On a donc une intégrale généralisée convergente de valeur :
π
I = lim In = .
n→∞ 4
Exercice 2.16 (Un cercle percé)

Calculer l’intégrale de la fonction (x + y)2 dans le domaine intérieur au cercle de centre (0, 0) et
de rayon 3 mais extérieur au cercle de centre (0, 1) et de rayon 1.
Figure 2.25 – Domaines d’intégration.
Corrigé
Le domaine d’intégration est représenté Figure 2.25. Par additivité de l’intégration, le calcul se

ramène à celui de deux intégrales :

ZZ ZZ
I = ID − ID ′ = (x + y)2 dxdy − (x + y)2 dxdy,
D D′
où D = {(x, y) : 0 ≤ x2 + y 2 ≤ 9} et D ′ = {(x, y)| 0 ≤ x2 + (y − 1)2 ≤ 1}. La première intégrale se

traite facilement par un passage en polaires et on obtient ID = 81π/2. Pour la seconde, on effectue
un passage en polaires ainsi qu’un changement d’origine
∆′ → D ′

ϕ:
(ρ, θ) 7→ (x = ρ cos θ, y = 1 + ρ sin θ)
où δ = {(ρ, θ) : 0 ≤ ρ ≤ 1, 0 ≤ θ ≤ 2π}. Le jacobien est comme d’habitude det Jϕ (ρ, θ) = ρ et le

calcul donne :
3π
ZZ
ID = (1 + ρ cos θ + ρ sin θ)2 ρdρdθ = · · · = .
2
δ
Au total, on aboutit à I = 39π.
Exercice 2.17 (Problème de convergence)

Considérons l’application f : [1, ∞[×[1, ∞[→ R , définie par :
x2 − y 2
f (x, y) = .
(x2 + y 2 )2
1. Vérifier que :
∞
1
Z
I= f (x, y)dx = pour tout y,
1 1 + y2
∞ Z ∞ ∞ Z ∞
π π
Z Z
J1 = f (x, y)dy dx = et J2 = f (x, y)dx dy = − .
1 1 4 1 1 4
2. Soit Tn = {(x, y), 1 ≤ y ≤ x ≤ n}. Calculer l’intégrale de f sur Tn . Que dire lorsque n tend
vers l’infini ?
3. Soit An = [1, n]×[1, n]. Calculer l’intégrale de f sur An . Que dire lorsque n tend vers l’infini ?
4. Soit Bn = {(x, y), 1 ≤ y ≤ x + n ≤ 2n}. Calculer l’intégrale de f sur Bn . Que dire lorsque
n tend vers l’infini ?
5. L’intégrale de f sur [1, ∞[×[1, ∞[ est-elle convergente ? Pourquoi ?
Corrigé
Remarques préliminaires :
– La surface définie par la fonction f est donnée Figure 2.26.
– La fonction 1/(1 + x2 ) admet pour primitive la fonction arctan x, réciproque de la fonction tan,
définie sur R et à valeurs dans ] − π/2, π/2[.
– La fonction (x2 − a2 )/(x2 + a2 )2 admet pour primitive −x/(x2 + a2 ).
1. L’intégrale I est généralisée en +∞, mais puisque pour tout y fixé, on a :
(x2 − y 2 )/(x2 + y 2 )2 ∼x→+∞ 1/x2 ,

2.4. Exercices 125
0.15
0.08
Z 0.01
−0.06
−0.13
1.0 1.0
1.4 1.4
1.8 1.8
2.2 2.2
2.6 2.6
3.0 3.0
Y 3.4 3.4 X
3.8 3.8
Figure 2.26 – Surface définie par la fonctions f .
on a convergence par le critère de Riemann. Le calcul donne, pour tout y :

Z +∞ +∞
−x 1
I= f (x, y)dx = 2 2
= .
1 x +y 1 1 + y2
Toujours grâce au critère de Riemann, la fonction y 7→ 1/(1 + y 2 ) est intégrable entre 1 et

+∞, d’où l’on déduit :
Z +∞ Z +∞ Z +∞
1 π π π
J2 = f (x, y)dx dy = 2
dy = [arctan y]+∞
1 = − = .
1 1 1 1 + y 2 4 4
Le calcul de J1 se fait de la même façon :

Z +∞ Z +∞ Z +∞
−1 π π π
J1 = f (x, y)dy dx = dx = [− arctan x]+∞
1 =− + =− .
1 1 1 1 + x2 2 4 4
2. Avec Tn = {(x, y), 1 ≤ y ≤ x ≤ n}, on obtient :

Z n x Z n n
y 1 1 1
ZZ
In = f (x, y)dxdy = dx = − dx = ln x − arctan x ,
1 x2 + y 2 1 1 2x 1 + x2 2 1
Tn
d’où finalement :
1 π
ln n − arctan n − , In =
2 4
et par conséquent : limn→∞ In = +∞.
3. On a cette fois :
n n n
y n 1
ZZ Z Z
In = f (x, y)dxdy = dx = − dx,
1 x + y2
2
1 1
2
n +x 2 1 + x2
An

d’où : h x in π 1
In = arctan − arctan x = − arctan n − arctan = 0,
n 1 2 n
car arctan x + arctan x1 = π/2 pour tout x, et par suite limn→∞ In = 0.
4. Même calcul :
n x+n n
y x+n 1
ZZ Z Z
In = f (x, y)dxdy = dx = − dx.
1 x + y2
2
1 1
2
x + (x + n)2 1 + x2
Bn
On trouve pour le premier terme :
x n
Z n
x+n 1 2 2 1
2 2
dx = ln(2x + 2nx + n ) + arctan(1 + 2 ) = . . .
1 x + (x + n) 4 2 n 1
5n2

1 1 2
· · · = ln 2 + arctan 3 − arctan 1 + .
4 n + 2n + 2 2 n
On a donc :
1 1 π
lim In = ln 5 + arctan 3 − .
n→∞ 4 2 4
5. Si l’intégrale de f était convergente sur [1, +∞[×[1, +∞[, on aurait la même limite dans les
questions 3 et 4, ce qui n’est pas le cas.
Exercice 2.18 (Intégrale simple via une intégrale double)

Soient a et b deux nombres réels tels que 0 < a < b. Montrer que la fonction f : (x, y) → xy a une
intégrale convergente sur ]0; 1] × [a, b]. En déduire que l’intégrale
1
xa − xb
Z
dx
0 ln(x)
est convergente. Quelle est sa valeur ?
Corrigé
Puisque y est strictement positif, il est clair qu’on peut prolonger la fonction f (x, y) = ey ln x par la
valeur 0 en tout point (0, y), ce qui donne une fonction continue sur le domaine D = [0, 1] × [a, b],
donc intégrable. Le théorème de Fubini donne d’une part :
1 Z b 1 y ln x b 1
xb − xa

e
ZZ Z Z Z
y ln x
I= f (x, y)dxdy = e dy dx = dx = dx.
0 a 0 ln x a 0 ln x
D
Cette intégrale est donc finie par intégrabilité de f sur D. D’autre part, en appliquant Fubini dans
l’autre sens :
Z b Z 1 Z b y+1 1 Z b
x 1 1+b
I= y
x dx dy = dy = dy = [ln(y + 1)]ba = ln .
a 0 a y + 1 0 a y + 1 1 +a
Exercice 2.19 (Bis repetita placent)

Considérons l’ensemble D = [0, 1] × [0, 1].

2.4. Exercices 127
1. Calculer l’intégrale :
dxdy
ZZ
I= .
D (1 + x2 )(1 + y 2 )
2. En effectuant un changement de variables en coordonnées polaires, montrer que l’on a :
π
ln(2 cos2 θ)
Z
4
I= dθ.
0 cos(2θ)
3. Posons π
ln(2 sin2 θ)
Z
4
J= dθ.
0 cos(2θ)
Montrer que cette intégrale est bien définie.
4. Montrer que I + J et I − J s’expriment en fonction de
1
ln t
Z
K= dt.
0 1 − t2
2
En déduire que K = − π8 .
5. Montrer que les intégrales A et B convergent :
1 1
ln t ln t
Z Z
A= dt et B = dt.
0 1−t 0 1+t
Calculer A + B et A − B, en déduire la valeur de A.
Corrigé
Rappel : la fonction 1/(1 + x2 ) admet pour primitive la fonction arctan x, réciproque de la fonction
tan, définie sur R et à valeurs dans ] − π/2, π/2[.
1. On en déduit sans problème le calcul de l’intégrale double :
1 1
π2
Z Z
dxdy dx dy
ZZ
I= = × = [arctan x]10 × [arctan y]10 = .
(1 + x2 )(1 + y 2 ) 0 1 + x2 0 1 + y2 16
D
Cette valeur correspond au volume compris entre le plan domaine D et la surface définie par
1
(x, y) 7→ (1+x2 )(1+y 2 ) (voir Figure 2.27).
2. Le point délicat est la description de l’ensemble ∆ décrivant D en coordonnées polaires. On

le décrit comme l’union de deux ensembles :
∆ = {(ρ, θ), 0 ≤ θ ≤ π/4, 0 ≤ ρ ≤ 1/ cos θ} ∪ {(ρ, θ), π/4 ≤ θ ≤ π/2, 0 ≤ ρ ≤ 1/ sin θ}.
On a alors :
π 1
R 4
R cos θ ρ
I= 0 0 (1+ρ2 cos2 θ)(1+ρ2 sin2 θ)
dρ dθ

R π
2
R sin1 θ ρ
+ π 0 (1+ρ2 cos2 θ)(1+ρ2 sin2 θ)
dρ dθ
4
Notons I = I1 + I2 . Par décomposition en éléments simples en ρ, on obtient :
ρ cos2 θ ρ sin2 θ

ρ 1
= − ,
(1 + ρ2 cos2 θ)(1 + ρ2 sin2 θ) cos 2θ (1 + ρ2 cos2 θ) (1 + ρ2 sin2 θ)

1.0
0.9
0.8
0.7
Z
0.6
0.5
0.4
0.3
0.2
0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 1.0
Y 0.8 0.9 1.0 X
1
Figure 2.27 – Surface définie par (x, y) 7→ (1+x2 )(1+y 2 )
pour (x, y) ∈ [0, 1] × [0, 1].
termes qui s’intègrent sans problème par rapport à ρ :

1 1
ρ cos2 θ ρ sin2 θ 1 + ρ2 cos2 θ) cos θ

1 1
Z
cos θ
− dρ = · · · = ln .
0 cos 2θ (1 + ρ2 cos2 θ) (1 + ρ2 sin2 θ) 2 cos 2θ 1 + ρ2 sin2 θ 0
Au total, on obtient :
π
1 ln(2 cos2 θ)
Z
4
I1 = dθ,
2 0 cos 2θ
et même valeur pour I2 via le changement de variable θ ′ = π/2 − θ, d’où le résultat voulu
pour I.
3. L’intégrale J est doublement généralisée : en 0 et en π/4.
- en 0 : sin θ ∼ θ donc l’intérieur de l’intégrale est équivalent à ln 2 + 2 ln θ, or 0 ln θdθ est
R
convergente (intégration par parties), donc l’intégrale est convergente en 0.

- en π/4 : on peut réécrire
ln(2 sin2 θ) = ln(1 − cos 2θ) ∼ − cos 2θ,
puisque cos 2θ tend vers 0 et que ln(1 − x) ∼ −x en 0. Donc le rapport à l’intérieur de

l’intégrale tend vers −1 et il n’y a pas de problème d’intégrabilité.
4. Rappelons que sin 2θ = 2 sin θ cos θ, d’où l’on déduit que :
π
ln sin 2θ
Z
4
I +J =2 dθ.
0 cos 2θ
Il suffit alors d’effectuer le changement de variable t = sin 2θ pour obtenir I + J = K.

La différence donne : Z π
4 ln tan θ
I − J = −2 dθ.
0 cos 2θ
On effectue le changement de variable t = tan θ, ce qui donne I − J = −2K.
La somme des deux équations obtenues donne K = −2I, d’où avec la première question
2
K = − π8 .

2.4. Exercices 129
5. On se sert à nouveau des équivalents.

- pour A : en 0, ln t/(1 − t) ∼ ln t et on a vu en question 3) que ln t est intégrable en 0 ; en 1,
ln t/(1 − t) ∼ (t − 1)/(1 − t) = −1 donc existence d’une limite et pas de problème non plus ;
au total, A est une intégrale convergente.
- pour B : en 0, même raisonnement que pour A ; pas de problème en 1 ; B est une intégrale
convergente également.
On trouve sans problème : A + B = 2K = −π 2 /4. Par ailleurs :
Z 1
t ln t2
A−B = 2
dt.
0 1−t
Le changement de variable u = t2 donne
A − B = A/2.
2
Des deux équations on déduit la valeur de A : − π6 .
Remarque. Une fois de plus, le principe ici est le même que celui vu en exercice 2.14 pour
le calcul de l’intégrale gaussienne : on trouve la valeur d’une intégrale simple en passant par
le calcul d’une intégrale double.
Exercice 2.20 (Changements trigonométriques de variables)

Soit a ∈]0, 1[ fixé.
1. Justifier la convergence de l’intégrale :
π
ln(1 + a cos x)
Z
2
I= dx.
0 cos x
2. Prouver que :
1 π
ZZ
I= dxdy où ∆ = [0, ] × [0, a].
∆ 1 + y cos x 2
3. En effectuant les changements t = tan(x/2) et y = cos(2θ), établir que :
π2 1
I= − (arccos a)2 .
8 2
Corrigé
1. L’intégrale est généralisée en π/2, mais par l’équivalent classique ln(1 + u) ∼ u en 0, la
fonction admet pour limite a en π/2 donc il n’y a pas de problème de convergence.
2. Pas de difficulté :
Z π Z a Z π Z π
2 1 2 ln(1 + y cos x)
a 2 ln(1 + a cos x)
dy dx = [ ]0 dx = dx = I.
0 0 1 + y cos x 0 cos x 0 cos x
3. On a par le Théorème de Fubini :

π
!
a
1
Z Z
2
I= dx dy.
0 0 1 + y cos x
Par les formules trigonométriques classiques, le changement de variable t = tan(x/2) donne :

dx = 2dt/(1 + t2 ) et cos x = (1 − t2 )/(1 + t2 ), d’où :
Z a Z 1
2
I= 2
dt dy.
0 0 (1 + y) + (1 − y)t

1
Et il “suffit” de se souvenir que la primitive de 1/(a2 + b2 t2 ) est ab arctan( ab t), ce qui donne :
a r 1 Z a r
2 1−y 2 1−y
Z
I= p arctan t dy = p arctan dy.
0 1 − y2 1+y 0 0 1 − y2 1+y
On applique alors le second changement de variable : y = cos 2θ, i.e θ = 12 arccos y, et

√
dy = −2 1 − cos2 2θdθ, ce qui donne :
Z 1 arccos a r Z 1 arccos a
2 1 − cos 2θ 2 π2 1
I = −4 arctan dθ = −4 θdθ = − (arccos a)2 .
π 1 + cos 2θ π 8 2
4 4
Exercice 2.21 (Lemniscate de Bernoulli)

Grâce à un changement en polaires, calculer l’intégrale :
ZZ p
I= a2 − x2 − y 2 dxdy,
D
où D est le domaine limité par la courbe d’équation : (x2 + y 2 )2 = a2 (x2 − y 2 ), avec a > 0 fixé.
Mθ
r(θ)
Figure 2.28 – Domaine de définition de l’angle θ, point Mθ associé.
Corrigé
La première difficulté est de représenter le domaine d’intégration D. Pour le faire, on passe en
coordonnées polaires. On écrit donc :

x = r cos θ
y = r sin θ
avec r ≥ 0 et θ ∈ [0, 2π].

2.4. Exercices 131
La courbe (C) limitant le domaine D a alors pour équation :
(C) r 2 = a2 cos(2θ).
On en déduit que l’angle θ doit être tel que cos(2θ) ≥ 0. Puisque θ est a priori entre 0 et 2π, ceci
signifie qu’on doit en fait avoir :
h π i 3π 5π 7π
θ ∈ 0, ∪ , ∪ , 2π .
4 4 4 4
L’angle θ étant défini modulo 2π, ceci est équivalent à dire que :
h
3π π πi 3π
θ ∈ A = −π, − ∪ − , ∪ ,π ,
4 4 4 4
domaine qui présente l’avantage d’être symétrique par rapport à 0.
On peut alors exprimer le module r en fonction de l’argument θ :

p
∀θ ∈ A r = r(θ) = a cos(2θ) (C)
p
Noter qu’on n’a pas r = ±a cos(2θ), puisque r et a sont positifs. Ainsi, à chaque angle θ ∈ A est
associée la distance r(θ) du point Mθ de la courbe à l’origine du repère, ce qui définit complètement
la courbe (C). On dit que (C) est représentée par une équation polaire (cf. Figure 2.28).
y y
(C)
a x a x
Figure 2.29 – Construction du nœud papillon spécial Croisette.
On peut remarquer que :

∀θ ∈ A r(−θ) = r(θ),
ce qui signifie que (C) est symétrique par rapport à l’axe des abscisses et qu’on peut se contenter
de l’étudier sur :
h π i 3π
0, ∪ ,π .
4 4
On note aussi que : h πi
∀θ ∈ 0, r(π − θ) = r(θ),
4

ce qui implique que (C) est symétrique par rapport à l’axe des ordonnées et qu’on peut donc res-
treindre l’étude au seul intervalle [0, π/4].
Pour avoir une idée de (C), il suffit de voir que :

h πi
∀θ ∈ 0, r(π/4) = 0 ≤ r(θ) ≤ r(0) = 1.
4
Plus précisément, lorsque θ varie de 0 à π/4, la distance de Mθ à l’origine décroît de a à 0. La

représentation graphique de (C) pour θ ∈ [0, π/4] est donnée Figure 2.29 à gauche. On déduit sa
représentation complète des deux symétries évoquées ci-dessus, et par suite le domaine D qui lui
est intérieur (voir Figure 2.29 à droite).
0.8
Z 0.4
−1.0 −1.0
−0.6 −0.6
−0.2 −0.2
0.2 0.2
Y 0.6 0.6 X
1.0 1.0
RR p
Figure 2.30 – Volume correspondant à I = a2 − x2 − y 2 dxdy, avec a = 1.
D
On peut maintenant passer au calcul de l’intégrale I. Le changement en coordonnées polaires

donne : ZZ p
I= a2 − r 2 rdrdθ,
∆
où le domaine ∆ est défini par :

n p o
∆ = (r, θ) : θ ∈ A, 0 ≤ r ≤ a cos(2θ) .
√
Puisque la quantité r a2 − r 2 ne dépend que de la distance au centre, et pas de l’angle θ, les symé-
tries précédentes assurent que l’intégrale sur l’ensemble du domaine D vaut quatre fois l’intégrale

2.4. Exercices 133
sur le quart de domaine du premier quadrant :

Z π Z √ a cos(2θ) p
!
4
I =4 a2 − r 2 rdr dθ,
0 0
ce qui donne :
π a√cos(2θ) π
4a3

1
Z Z
4 4

I =4 − (a2 − r 2 )3/2 dθ = 1 − (1 − cos(2θ))3/2 dθ.
0 3 0 3 0
La formule de duplication “cos(2θ) = 1 − 2 sin2 θ” donne :

π
4a3
Z
4
√
I= 1 − 2 2 sin3 θ dθ,
3 0
et il reste à intégrer sin3 θ, ce qui peut se faire comme suit :

Z Z Z
sin3 θdθ = sin θ(1 − cos2 θ)dθ = (sin θ − cos2 θ sin θ)dθ,
car on reconnaît dans le second terme la forme u2 (θ)u′ (θ), d’où :

1
Z
sin3 θdθ = cos3 θ − cos θ.
3
Au total, on obtient :
" √ #π
4a3 √ 2 2
4
I= θ + 2 2 cos θ − cos3 θ ,
3 3
0
et finalement :
π 4 √

3
I =a − 4 2−5 .
3 9
Ouf !
Remarque. Il n’est pas étonnant de trouver un résultat en a3 , puisqu’on vient en fait de calculer
le volume situé entre la sphère de rayon a et le domaine D du plan (voir Figure 2.30). En effet :
p
z = f (x, y) = a2 − x2 − y 2 ⇐⇒ x2 + y 2 + z 2 = a2 .
Exercice 2.22 (Une pêche sans noyau)

On considère dans R3 le domaine D intérieur à la sphère de centre O et de rayon 2, mais extérieur
à la sphère de centre O et de rayon 1.
1. Donner le domaine correspondant ∆ en coordonnées sphériques (r, φ, θ).
2. En déduire :
1
ZZZ
I= p dxdydz.
x2 + y 2 + z 2
D
Corrigé
1. En coordonnées sphériques, le domaine s’écrit :
∆ = {(r, φ, θ), 1 ≤ r ≤ 2, 0 ≤ φ ≤ π, 0 ≤ θ ≤ 2π}.

2. Le changement de variables en sphériques donne :

2 2
1 1 2 r
ZZZ ZZZ
I= p dxdydz = r sin φdrdφdθ = 2π [− cos φ]π0 = 6π.
2 2
x +y +z 2 r 2 1
D ∆
Exercice 2.23 (Autour du trièdre)

Considérons le domaine suivant de l’espace :
T = {(x, y, z), x ≥ 0, y ≥ 0, z ≥ 0, x + y + z ≤ 1}.
1. Représenter T .
2. Quel est le volume de T ?
3. Soit a un nombre réel fixé. Donner une primitive de (x + a)−3 .
4. Calculer
1
ZZZ
I= dxdydz.
(x + y + z + 1)3
T
z y
1−z
K
Dz Dz
z x
1−z
D J y
x I
Figure 2.31 – Représentation du trièdre défini par V .
Corrigé
1. Le volume de T est :
 
ZZZ Z 1 ZZ Z 1
V(T ) = dxdydz =  dxdy  dz = I(z)dz,
0 0
V Dz
où I(z) correspond tout simplement à l’aire du demi-carré de côté (1 − z), c’est-à-dire (voir
Figure 2.31) :
(1 − z)2
I(z) = .
2
D’où :
1 1 1 1 1
Z
V(T ) = (1 − z)2 dz = (z − 1)3 0 = .
2 0 6 6
1
On retrouve la formule vue dans les petites classes : volume = 3 base × hauteur.

2.4. Exercices 135
2. Une primitive de (x + a)−3 est −(x + a)−2 /2.

3. I est une intégrale convergente car la fonction est continue sur le domaine fini T . Le calcul
n’est pas difficile : à l’instar de la question précédente, on applique à répétition le fait que la
1
primitive en t de (t+a) n est :
1
− .
(n − 1)(t + a)n−1
Ce qui donne :
Z 1 Z 1−z Z 1−z−y
1 1 5
I= 3
dx dy dz = · · · = ln 2 − .
0 0 0 (1 + x + y + z) 2 16
Exercice 2.24 (Cône de révolution)

On considère le cône de révolution
C = {(x, y, z) ∈ R3 , 0 ≤ z ≤ 1, x2 + y 2 ≤ z 2 }.
1. Représenter C.
2. Donner le domaine ∆ correspondant à C en coordonnées cylindriques.
3. En déduire le volume de ce cône.
4. Calculer ZZZ
xyz dxdydz.
C
1.0
0.8
0.6
Z
0.4
0.2
0
−1.0
−0.5 −1.0
−0.6
0 −0.2
0.5 0.2
Y 0.6
X
1.0 1.0
Figure 2.32 – Le domaine K est l’intérieur d’un cône de révolution.
Corrigé
1. Le domaine C est l’intérieur d’un cône de révolution autour de l’axe (Oz), voir Figure 2.27.
C’est un domaine fini sur lequel la fonction f : (x, y, z) 7→ xyz est continue. Il n’y a donc pas
de problème de convergence pour l’intégrale considérée.

2. L’idée naturelle est de passer en coordonnées cylindriques. Il faut commencer par définir le
domaine ∆ correspondant à C :
∆ = {(ρ, θ, z), 0 ≤ z ≤ 1, 0 ≤ ρ ≤ z, 0 ≤ θ ≤ 2π}.
Le calcul ne pose pas problème :

ZZZ ZZZ Z 1 Z z Z 2π
3 3
xyzdxdydz = zρ cos θ sin θdρdθdz = z ρ cos θ sin θdθ dρ dz
0 0 0
C ∆
or sin 2θ = 2 cos θ sin θ donc :

Z 2π 2π
1
cos θ sin θdθ = − cos 2θ = 0,
0 4 0
et l’intégrale triple vaut 0. Ceci pouvait se voir sans calculs : pour tout point (x, y, z) du
cône, le point (−x, y, z) appartient lui aussi au cône, et f (−x, y, z) = −f (x, y, z).
Exercice 2.25 (La sphère privée d’un cône)

On considère dans R3 le domaine D intérieur à la sphère de centre O et de rayon 1, et extérieur
au cône de révolution de sommet le point O, d’axe de révolution (z ′ z) et de demi-angle π/3.
1. Représenter D.
2. Donner le domaine ∆ correspondant à D en coordonnées sphériques.
3. En déduire le volume de D.
4. Après avoir justifié l’égalité sin3 φ = sin φ − cos2 φ sin φ, calculer
Z π
I= sin3 φ dφ.
π
3
5. En déduire
x2 + y 2
ZZZ
dxdydz.
x2 + y 2 + z 2
D
Corrigé
1. Le quart du domaine d’intégration (on s’est restreint à la partie où x et y sont positifs) est
représenté Figure 2.33.
2. L’idée naturelle est de passer en coordonnées sphériques, où le domaine considéré s’écrit :
n π o
∆ = (r, φ, θ) : 0 ≤ r < 1, ≤ φ ≤ π, 0 ≤ θ < 2π .
3
3. Le volume de D est donc

ZZZ ZZZ
V(D) = dxdydz = r 2 sin φdrdφdθ,
D ∆
ce qui donne
1
r3

V(D) = [− cos φ]ππ [θ]2π
0 = π.
3 0
3

2.4. Exercices 137
1
2
π
3
1 y
Figure 2.33 – La sphère privée du cône.
4. Il suffit d’écrire :
sin3 φ = sin φ × sin2 φ = sin φ(1 − cos2 φ) = sin φ − cos2 φ sin φ.
La primitive cherchée est alors immédiate :

Z π π
cos3 φ

3 9
I= sin φ dφ = − cos φ + = .
π 3 π 8
3 3
5. Puisque x2 + y 2 = r 2 sin2 φ et x2 + y 2 + z 2 = r 2 , le changement en coordonnées sphériques

donne
3 1
x2 + y 2 r 3π
ZZZ ZZZ
2 3
dxdydz = r sin φdrdφdθ = 2π ×I = .
x2 + y 2 + z 2 3 0 4
D ∆
Remarque. En toute rigueur, puisque la fonction à intégrer n’est pas définie à l’origine,
il faut appliquer la méthode habituelle (la fonction est positive) : considérer la suite de
domaines
1 π
∆n = (r, φ, θ) : ≤ r < 1, ≤ φ ≤ π, 0 ≤ θ < 2π ,
n 3
3π
pour montrer que l’intégrale est convergente de valeur 4 .
Exercice 2.26 (La sphère privée d’un cylindre)

Soit le domaine :

1 2
D = (x, y, z) ∈ R+ , x + y ≥ , x + y + z ≤ 1 .
3 2 2 2 2
4
1. Représenter D.

2. Calculer : √ √
3
!
Z
2
Z 1−u2
I= vdv du.
1
0 2
√
π 3
3. Grâce à un passage en coordonnées cylindriques, en déduire que D a pour volume 16 .
√
3
2
1
2 1 y
1
2
1
x
Figure 2.34 – Domaine D = {(x, y, z) ∈ R3+ , x2 + y 2 ≥ 41 , x2 + y 2 + z 2 ≤ 1}.
Corrigé
1. Dans les coordonnées positives, le domaine D correspond à l’ensemble des points qui sont à
la fois à l’extérieur du cylindre de révolution d’axe (Oz) et de rayon 1/2 et à l’intérieur de
la sphère unité (voir Figure 2.34).
2. On a :
Z √3 Z √1−u2 ! Z √3 2 √1−u2
2 2 v
I= vdv du = du,
0 1
0 2 1
2 2
c’est-à-dire : √
√
3 3 √
u3 2

1 3 1 3 3
Z
2
2
I= − u du = u− = .
2 0 4 2 4 3 0 8
3. En coordonnées cylindriques, le domaine D correspond à .
( √ )
π 3
∆ = (r, θ, z) : 0 ≤ r ≤ 1, 0 ≤ θ ≤ , 0 ≤ z ≤ .
2 2
Par définition, le volume de D est :
ZZZ
Vol(D) = dxdydz,
D
et en passant en coordonnées cylindriques ceci donne :

ZZZ
Vol(D) = rdrdθdz.
∆

2.4. Exercices 139
Vu le domaine ∆, ceci donne tout simplement :

√
π π 3
Vol(D) = I = .
2 16
Exercice 2.27 (Surface et volume du tore)

Soit a et r des nombres réels tels que 0 < r < a. On appelle tore plein T la partie de R3 engendrée
par la rotation autour de l’axe (Oz) du disque D défini par :
D = {(x, y, z) ∈ R3 , y = 0, (x − a)2 + z 2 ≤ r 2 }.
1. Déterminer le volume V (T ) de T lorsque r = 1 et a = 3 (voir Figure 2.35), en utilisant et

justifiant le changement de variables :
ϕ : (ρ, u, v) 7→ (x, y, z) = ((a + ρ cos(u)) cos(v), (a + ρ cos(u)) sin(v), ρ sin(u)),
défini sur K = [0, r] × [0, 2π] × [0, 2π].

2. Considérer les fonctions f (u) = a + r cos(u) et g(u) = r sin(u) définies sur [0, 2π], et calculer
l’aire du tore : Z 2π p
A = 2π |f (u)| f ′ (u)|2 + |g′ (u)|2 du.
0
0.4
Z
−0.3
−1.0
4
−4
3
−3
2
−2
1
−1
0
0
1 −1
2 −2
X Y
3 −3
4 −4
Figure 2.35 – Le tore T .
Corrigé
1. L’application
K →D
ϕ:
(ρ, u, v) 7→ (x, y, z)

est un C 1 -difféomorphisme de K sur D. La matrice jacobienne de ϕ au point (u, v, w) est :

 ∂x ∂x ∂x 
∂u ∂v ∂w
∂y ∂y ∂y
Jϕ (u, v, w) =  ∂u ∂v ∂w
 (u, v, w)
∂z ∂z ∂z
∂u ∂v ∂w
Après calculs, on trouve que le jacobien vaut :

det Jϕ (u, v, w) = −ρ(a + ρ cos u).
Puisque 0 ≤ ρ ≤ r < a, on en déduit que | det Jϕ (u, v, w)| = ρ(a + ρ cos u).
Le calcul du volume du tore ne pose alors plus de problème :
ZZZ ZZZ
V(D) = dxdydz = ρ(a + ρ cos u)dρdudv.
D K
Soit encore : Z r
2
V(T ) = 4π a( ρdρ) = 2π 2 ar 2 .
0
Ce résultat est logique : surface du disque × distance parcourue par son centre.
2. Puisque 0 < r < a, f est positive et le calcul de la surface du tore se fait sans difficulté :
Z 2π
A = 2π (a + r cos u)rdu = 4π 2 ra.
0
Là encore résultat logique : circonférence du cercle × distance parcourue par son centre.
Exercice 2.28 (Changement de variables)

Calculer l’intégrale de la fonction xyz(1 − x − y − z) dans le domaine de R3 limité par les plans
d’équation x = 0 , y = 0 , z = 0 , x + y + z = 1 (changement de variables possible : x = u(1 − v) ,
y = uv(1 − w) , z = uvw).
Corrigé.
L’application
]0, 1[3 →]0, 1[3

ϕ:
(u, v, w) 7→ (x, y, z)
est bijective d’application réciproque
]0, 1[3 →]0, 1[3

−1
ϕ : y+z z
(x, y, z) 7→ (u = x + y + z, v = x+y+z , w = y+z )
C’est donc un C 1 -difféomorphisme de l’ouvert ]0, 1[×]0, 1[×]0, 1[ sur lui-même. La matrice jaco-
bienne de ϕ au point (u, v, w) est :
 ∂x ∂x ∂x   
∂u ∂v ∂w 1−v −u 0
∂y ∂y ∂y 
Jϕ (u, v, w) =  ∂u ∂v ∂w
(u, v, w) =  v(1 − w) u(1 − w) −uv 
∂z ∂z ∂z vw uw uv
∂u ∂v ∂w
Le jacobien vaut donc det Jϕ (u, v, w) = u2 v > 0. Le calcul de l’intégrale se ramène alors à :
6 1 4 1 2 1
u u7 v v5 w w3
ZZZ
5 3
I= u v w(1 − u)(1 − v)(1 − w)dudvdw = − × − × − ,
6 7 0 4 5 0 2 3 0
]0,1[3
ce qui donne finalement : I = 1/7!

2.4. Exercices 141
Exercice 2.29 (Echauffement)

On considère la fonction f définie sur R2 par :
f (x, y) = e−(x+y) 1{x≥0,y≥0}
1. Vérifier que f est une densité sur R2 .

2. Soit (X, Y ) un couple de densité f . Déterminer les marginales fX (x) et fY (y).
3. Calculer la covariance du couple (X, Y ).
Corrigé
Rappel : si X ∼ E(λ), alors pour tout entier naturel n, on a E[X n ] = n!/λn .
1. Il est clair que f est une fonction positive. Par ailleurs, le calcul de son intégrale double sur
R2 se fait sans problème. Il suffit de remarquer que l’intégrale de exp(−x) sur [0, +∞[ vaut
1 (intégrale de la densité d’une loi exponentielle de paramètre 1) :
ZZ Z +∞ Z +∞ Z +∞
−x −y
f (x, y)dxdy = e e dy dx = e−x dx = 1,
R 2 0 0 0
et f est bien une densité sur R2 .

2. La variable aléatoire X prend ses valeurs dans [0, +∞[ donc fX (x) = 0 si x < 0. Pour x ≥ 0,
la densité fX (x) s’obtient en intégrant par rapport à y :
Z Z +∞
−x −y
fX (x) = f (x, y) dy = e e dy = e−x .
R 0
On voit donc que X suit une loi exponentielle de paramètre 1, noté X ∼ E(1). Vu les rôles
symétriques joués par X et Y , la variable aléatoire Y a la même loi : Y ∼ E(1).
3. On remarque que :
∀(x, y) ∈ R2 f (x, y) = fX (x)fY (y),
donc X et Y sont indépendantes, donc leur covariance est nulle (rappelons que la réciproque
est fausse en général, sauf dans le cas des vecteurs gaussiens).
Exercice 2.30 (Minimum et maximum d’uniformes)

On considère le couple aléatoire (X, Y ) de densité f définie par :
si 0 ≤ x ≤ y ≤ 1

c
f (x, y) =
0 sinon
1. Déterminer c pour que f soit une densité. Les variables X et Y sont-elles indépendantes ?
2. Déterminer les lois marginales de X et Y et les représenter.
3. Calculer E[X], E[Y ], E[XY ] et en déduire la covariance du couple.
4. Pour U et V deux variables uniformes indépendantes sur [0, 1], on note X = min(U, V ) et
Y = max(U, V ). Raisonnons “à la physicienne” : on considère deux nombres x et y et deux
intervalles [x, x + dx] et [y, y + dy] “infiniment petits”. Donner les conditions sur x et y pour
que (X, Y ) puisse tomber dans le rectangle [x, x + dx] × [y, y + dy] ? Que vaut alors cette
probabilité ?
Corrigé

f (x, y)
2
y
1
Supp(X, Y )
x
1 1 y
1 Supp(X, Y )
x
Figure 2.36 – Support et densité du couple (X, Y ).
1. La fonction f est une densité si c est positif et telle que :

ZZ Z 1 Z y
f (x, y)dxdy = 1 ⇐⇒ c dy dx = 1,
R2
0 0
ce qui, après calculs, montre que c = 2. Le support et la densité du couple (X, Y ) sont
représentés Figure 2.36. Noter qu’on retrouve bien que le volume sous la densité vaut 1 par
la formule : Volume = Base × Hauteur.
2. Les variables X et Y ne sont pas indépendantes. En effet, le support de (X, Y ) est triangulaire
alors que le produit cartésien des supports de X et Y est [0, 1]2 .
3. Puisque X prend ses valeurs entre 0 et 1, il s’ensuit que fX (x) = 0 lorsque x ∈ / [0, 1]. Soit
maintenant 0 ≤ x ≤ 1, alors :
Z Z 1
fX (x) = f (x, y)dy = 2dy = 2(1 − x).
R x
La densité fX (x) = 2(1 − x)1[0,1] (x) est représentée Figure 2.37 à gauche. De la même façon,
la densité fY est nulle en dehors de [0, 1], et pour 0 ≤ y ≤ 1, on a :
Z Z y
fY (y) = f (x, y)dx = 2dx = 2y.
R 0
La densité fY (y) = 2y 1[0,1] (y) est représentée Figure 2.37 à droite.

4. On calcule ainsi : Z 1
1
Z
E[X] = xfX (x)dx = 2x(1 − x)dx = ,
R 0 3
et Z 1
2
Z
E[Y ] = yfX (y)dx = 2y 2 dy = .
R 0 3
Puisque pour toute réalisation du couple aléatoire (X, Y ), on a x ≤ y, il est logique de
constater que la moyenne de X est inférieure à celle de Y . On poursuit les calculs grâce au
théorème de transfert :
Z 1 Z y
1
ZZ
E[XY ] = xyf (x, y)dxdy = y 2xdx dy = · · · = .
4
R2
0 0
Par conséquent Cov(X, Y ) = E[XY ] − E[X]E[Y ] = 1/36.

2.4. Exercices 143
2 2
fX (x) fY (y)
1 1
x y
1 1
Figure 2.37 – Densités marginales fX et fY .
5. Puisque X = min(U, V ) et Y = max(U, V ), on a automatiquement 0 ≤ X < Y ≤ 1 (le cas

d’égalité est exclu, cet événement arrivant avec probabilité nulle), et des réalisations possibles
(x, y) du couple aléatoire (X, Y ) doivent elles-mêmes vérifier ces conditions. Ceci supposé,
pour que X tombe dans l’intervalle [x, x + dx] et Y dans l’intervalle [y, y + dy], il y a deux
possibilités : ou bien U tombe dans [x, x + dx] et V dans [y, y + dy], ou le contraire. Ceci
s’écrit :
P(X ∈ [x, x + dx] ∩ Y ∈ [y, y + dy])

= P((U ∈ [x, x + dx] ∩ V ∈ [y, y + dy]) ∪ (V ∈ [x, x + dx] ∩ U ∈ [y, y + dy])).
Il reste à appliquer la formule de l’union, à savoir P(A ∪ B) = P(A) + P(B) − P(A ∩ B)

en notant qu’on est dans le cas particulier où A ∩ B = ∅. En effet, puisque x < y, on
peut supposer dx et dy assez petits pour que les intervalles [x, x + dx] et [y, y + dy] soient
d’intersection vide. Dès lors, la probabilité cherchée devient :
P(X ∈ [x, x + dx] ∩ Y ∈ [y, y + dy])

= P(U ∈ [x, x + dx] ∩ V ∈ [y, y + dy]) + P(V ∈ [x, x + dx] ∩ U ∈ [y, y + dy])
= P(U ∈ [x, x + dx])P(V ∈ [y, y + dy]) + P(V ∈ [x, x + dx])P(U ∈ [y, y + dy]),
la dernière égalité découlant de l’indépendance de U et V . Puisque la probabilité pour une

loi uniforme de tomber dans un intervalle de longueur ℓ inclus dans [0, 1] est tout simplement
ℓ, on en déduit
P(X ∈ [x, x + dx] ∩ Y ∈ [y, y + dy]) = 2dxdy,
et on retrouve la densité jointe f étudiée précédemment.
Exercice 2.31 (Changement de couple)

On considère la fonction f (x, y) = e−x 1{0<y<x} .
1. Vérifier que f (x, y) définit une densité de probabilité sur R2 .
2. Calculer les densités marginales de X et Y . Les variables X et Y sont-elles indépendantes ?
3. Calculer E[X], E[Y ], Cov(X, Y ).
4. Déterminer la loi jointe fS,T du couple (S, T ) = (X + Y, X − Y ).
5. En déduire les densités marginales de S et T .

Corrigé
1. La fonction f est positive et on vérifie sans problème que son intégrale sur R2 vaut 1 :
ZZ Z +∞ Z x Z +∞
−x
f (x, y)dxdy = e dy dx = xe−x dx = 1,
R2 0 0 0
puisqu’on reconnaît la moyenne d’une loi exponentielle de paramètre 1. Bref, f définit bien
une densité de probabilité sur R2 .
2. Pour les densités marginales, on obtient
fX (x) = xe−x 1]0,+∞[ (x),
c’est-à-dire que X suit une loi Gamma de paramètres (2, 1). De même, pour la variable Y ,
on trouve
fY (y) = e−y 1]0,+∞[(y).
Ainsi Y une loi exponentielle E(1). Les variables X et Y ne sont pas indépendantes puisque
f (x, y) 6= fX (x)fY (y).
On pouvait l’affirmer dès le début puisque le support de la loi jointe n’est pas un produit
d’intervalles, mais plutôt un triangle (infini).
3. Rappelons que si V ∼ E(1), alors E[V n ] = n!, d’où il découle immédiatement que E[X] =
E[V 2 ] = 2! = 2 et E[Y ] = E[V ] = 1. Pour la covariance :
Cov(X, Y ) = E[XY ] − E[X]E[Y ] = E[XY ] − 2.
Or
+∞ Z x +∞
1 1
ZZ Z Z
−x
E[XY ] = xyf (x, y)dxdy = xe ydy dx = x3 e−x dx = E[V 3 ] = 3
R2 0 0 2 0 2
d’où Cov(X, Y ) = 1.
4. L’inversion du système d’équations donne le difféomorphisme

∆ →D
ϕ:
(s, t) 7→ (x, y) = s+t s−t

2 , 2
avec D = {(x, y) ∈ R2 , 0 < x < y} et le domaine correspondant ∆ = {(s, t) ∈ R2 , 0 < t <

s}. Le théorème de changement de variables donne alors pour la densité du couple aléatoire
(S, T ) :
1 1
fS,T (s, t) = fX,Y (ϕ(s, t)) · |Jϕ (s, t)| = · · · = e− 2 (s+t) 1{0<t<s} .
2
5. Les densités marginales sont
s
fS (s) = e− 2 − e−s 1{s>0} .
et
fT (t) = e−t 1{t>0} ,
c’est-à-dire que T ∼ E(1).
Exercice 2.32 (Jeu de fléchettes)

Soit D le disque de centre (0, 0) et de rayon 1, (X, Y ) un point tiré uniformément dans D.

2.4. Exercices 145
1. La densité du couple (X, Y ) est donc de la forme f (x, y) = c × 1D (x, y). Déterminer c.
2. Déterminer les lois marginales de X et Y . En déduire E[X] et E[Y ].
3. Les variables X et Y sont-elles indépendantes ?
4. Calculer la covariance du couple (X, Y ).
5. Déduire de sa fonction de répartition G(u) que U = X 2 + Y 2 suit une loi uniforme sur [0, 1].
6. Calculer l’espérance de U . En déduire E[X 2 ], E[Y 2 ], la variance de X et celle de Y .
7. Un lanceur de fléchettes tire sur la cible D : la loi du point d’impact √(X, Y ) sur la cible est
uniforme. Au point d’impact est associée la distance au centre L = X 2 + Y 2 . Supposons
qu’il tire n fois de façons indépendantes : ceci donne un n-uplet (L1 , . . . , Ln ) de variables
aléatoires. Soit 0 < a ≤ 1 : calculer la probabilité que l’une au moins des fléchettes soit à
distance inférieure à a du centre de la cible.
Corrigé
1. Puisque le point (X, Y ) est tiré uniformément dans le disque D, la densité f (x, y) du couple
(X, Y ) est tout simplement l’indicatrice du disque divisé par la surface de ce disque. C’est
la généralisation d’une loi uniforme sur un segment de R (indicatrice du segment divisé par
sa longueur). Ainsi :
1 1
f (x, y) = 1D (x, y) = 1{x2 +y2 ≤1} (x, y).
π π
√ √
2. Si x est fixé entre −1 et 1, y ne peut varier qu’entre − 1 − x2 et + 1 − x2 (faire un dessin !).
On a alors : Z +√1−x2
1 2p
fX (x) = √ dy = 1 − x2 1[−1,1] (x).
− 1−x 2 π π
Puisque l’abscisse X et l’ordonnée Y jouent des rôles symétriques, on a aussi :
2p
fY (y) = 1 − y 2 1[−1,1] (y).
π
On en déduit :
2 1 p
Z
E[X] = x 1 − x2 dx,
π −1
et il y a deux façons de voir les choses : ou bien on y va brutalement et on reconnaît à peu
de choses près la dérivée de (1 − x2 )3/2 . Ou bien on voit que c’est l’intégrale d’une fonction
impaire sur un domaine symétrique par rapport à 0, donc elle vaut 0 (faire un dessin). Ainsi
E[X] = 0, ce qui n’est pas étonnant : on lance les fléchettes aussi bien dans les abscisses
négatives que positives. Puisque Y a même loi que X, on a aussi E[Y ] = 0.
3. Les variables X et Y ne sont pas indépendantes, puisque le support de la loi du couple (X, Y )
n’est pas un pavé, mais un disque. On peut aussi le voir en vérifiant que la loi jointe f (x, y)
n’est pas égale au produit des marginales.
4. Par définition la covariance du couple (X, Y ) est :
ZZ
cov(X, Y ) = E[XY ] − E[X]E[Y ] = E[XY ] = xyf (x, y) dx dy,
D
et par le théorème de Fubini :
√ !
+1 + 1−x2
1
Z Z
cov(X, Y ) = x √ y dy dx = 0,
π −1 − 1−x2
√ √
puisque pour tout x entre −1 et 1, le segment [− 1 − x2 , + 1 − x2 ] est symétrique par
rapport à 0 et la fonction y 7→ y est impaire. On en déduit que cov(X, Y ) = 0 alors que X
et Y ne sont clairement pas indépendantes.

5. La variable aléatoire (X 2 + Y 2 ) est à valeurs entre 0 et 1 et pour tout u ∈ [0, 1], on a :

p √
G(u) = P(X 2 + Y 2 ≤ u) = P X2 + Y 2 ≤ u ,
√
or X 2 + Y 2 est la distance au centre d’un point M tiré uniformément dans le disque. La
√
probabilité que celle-ci soit plus petite que u correspond donc au rapport des surfaces entre
√
le disque de centre O et de rayon u et le disque D, c’est-à-dire que :
 0 si u ≤ 0

G(u) = u si 0 ≤ u ≤ 1
1 si u ≥ 1

Autrement dit, U suit une loi uniforme sur [0, 1], ce qu’on note U ∼ U[0,1] .
6. L’espérance de U vaut donc 1/2. Puisque X et Y ont même loi, on a E[X 2 ] = E[Y 2 ], et
puisque U = (X 2 + Y 2 ), on a :
1 1
E[U ] = E[X 2 ] + E[Y 2 ] = 2E[X 2 ] ⇒ E[X 2 ] = E[U ] = .
2 4
Les variances de X et Y sont identiques et :
1
Var(X) = E[X 2 ] − E[X]2 = E[X 2 ] = .
4
7. La probabilité que l’une au moins des fléchettes soit à distance inférieure à a du centre de la
cible est :
pa = P(min(L1 , . . . , Ln ) ≤ a) = 1 − P(min(L1 , . . . , Ln ) > a) = 1 − P(L1 > a, . . . , Ln > a),
or les variables aléatoires L1 , . . . , Ln sont indépendantes et identiquement distribuées, donc :
P(L1 > a, . . . , Ln > a) = P(L1 > a) × · · · × P(Ln > a) = P(L1 > a)n .
Mais on a alors :
P(L1 > a) = 1 − P(L1 ≤ a) = 1 − P(L21 ≤ a2 ) = 1 − P(X 2 + Y 2 ≤ a2 ) = 1 − G(a2 ) = 1 − a2 .

Ainsi :
pa = 1 − (1 − a2 )n .
Exercice 2.33 (Somme d’exponentielles)

Soit X et Y deux variables aléatoires indépendantes suivant une loi exponentielle de paramètre 1.
1. Quelle est la loi jointe fX,Y du couple (X, Y ) ?
2. Déterminer la loi jointe fV,W du couple (V, W ) défini par :

V = X +Y
W = X
3. En déduire la densité de V .
Corrigé

2.4. Exercices 147
1. Les variables X et Y étant indépendantes, la densité du couple (X, Y ) n’est rien d’autre que
le produit des densités de X et Y :
fX,Y (x, y) = e−x 1[0,+∞[ (x) × e−y 1[0,+∞[(y) = e−(x+y) 1{x≥0,y≥0} .
2. Le changement de variables proposé est linéaire et bijectif avec comme bijection réciproque :

X = W
Y = V −W
Le support de (X, Y ) est D = R2+ , ce qui s’écrit pour (V, W ) : ∆ = (v, w) ∈ R2 : 0 ≤ w ≤ v .

On introduit le C 1 -difféomorphisme :

 ∆ −→ D
ϕ: x = w
 (v, w) 7−→
y = v−w
et la formule de changement de variables donne
fV,W (v, w) = fX,Y (ϕ(v, w))|detJϕ (v, w)| = e−v 1{0≤w≤v} .
3. La variable V est à valeurs dans R+ . Pour v > 0 fixé, on obtient par marginalisation de la
loi jointe précédente :
Z Z v
fV (v) = fV,W (v, w)dw = e−v dw = ve−v .
R 0
Ainsi la somme de deux variables exponentielles indépendantes de paramètre 1 suit une loi
Gamma de paramètres (2, 1). Ce résultat se généralise : la somme de n variables exponentielles
indépendantes de même paramètre λ suit une loi Gamma de paramètres (n, λ). Rappelons
que
(λx)n−1
X ∼ Γ(n, λ) ⇐⇒ f (x) = × λe−λx 1{x≥0} .
(n − 1)!
Ceci permet de retrouver facilement les premiers moments d’une loi Gamma à partir de ceux
de la loi exponentielle.
Exercice 2.34 (Minimum d’exponentielles)

1. On considère deux variables aléatoires indépendantes X1 et X2 exponentielles de paramètres
respectifs λ1 et λ2 . Soit Y = min(X1 , X2 ) le minimum de ces deux variables. Déterminer la
fonction de répartition de Y .
2. En déduire que Y suit une loi exponentielle de paramètre (λ1 + λ2 ).
3. Donner la densité du couple (X1 , X2 ).
4. Soit D = {(x1 , x2 ) ∈ R2 , 0 ≤ x1 ≤ x2 }. Calculer P((X1 , X2 ) ∈ D).
5. En déduire que
λ1
P(Y = X1 ) = P(X1 < X2 ) = .
λ1 + λ2
6. Deux guichets sont ouverts à une banque : le temps de service au premier (respectivement
second) guichet suit une loi exponentielle de moyenne 20 (respectivement 30) minutes. Alice
et Bob sont convoqués à la banque pour s’expliquer sur leurs découverts respectifs : Alice
choisit le guichet 1, Bob le 2. Quelle est la probabilité qu’Alice sorte la première ?

7. En moyenne, combien de temps faut-il pour que les deux soient sortis ? Indication : le max
de deux nombres, c’est la somme moins le min.
Corrigé
1. Notons FY la fonction de répartition de Y . La variable Y est à valeurs positives donc FY (y) =
0 pour y ≤ 0. Pour y ≥ 0, on utilise le classique passage au complémentaire :
FY (y) = P(Y ≤ y) = P(min(X1 , X2 ) ≤ y) = 1 − P(min(X1 , X2 ) > y),
ce qui s’écrit encore :
FY (y) = 1 − P ({X1 > y} ∩ {X2 > y}) .
Or X1 et X2 sont indépendantes et P(X1 > y) = 1 − FX1 (y) = e−λ1 y , d’où :
FY (y) = 1 − P(X1 > y)P(X2 > y) = 1 − e−λ1 y e−λ2 y = 1 − e−(λ1 +λ2 )y .
2. On reconnaît la fonction de répartition d’une loi exponentielle : Y ∼ E(λ1 +λ2 ). Le même rai-
sonnement s’applique de façon générale : le minimum de n variables exponentielles indépen-
dantes de paramètres respectifs λ1 , . . . , λn suit une loi exponentielle de paramètre λ1 +· · ·+λn .
Dit rapidement, la loi expontielle est stable par minimisation.
3. Puisque X1 et X2 sont indépendantes, leur loi jointe est le produit des marginales :
f (x1 , x2 ) = fX1 (x1 ) × fX2 (x2 ) = λ1 e−λ1 x1 1{x1 ≥0} × λ2 e−λ2 x2 1{x2 ≥0} .
4. Par définition de la loi jointe
ZZ
P((X1 , X2 ) ∈ D) = f (x1 , x2 )dx1 dx2 ,
D
ce qui donne dans notre cas particulier

Z +∞ Z x 2 Z +∞ h i0
P((X1 , X2 ) ∈ D) = λ2 e−λ2 x2
λ1 e−λ1 x1
dx1 dx2 = λ2 e−λ2 x2 e−λ1 x1 dx2
0 0 0 x2
et par suite
+∞ +∞
λ2 λ1
Z Z
P((X1 , X2 ) ∈ D) = λ2 e−λ2 x2 dx2 − λ2 e−(λ1 +λ2 )x2 dx2 = 1 − = .
0 0 λ1 + λ2 λ1 + λ2
5. Cette question est alors immédiate :
λ1
P(Y = X1 ) = P(X1 < X2 ) = P((X1 , X2 ) ∈ D) = .
λ1 + λ2
6. Rappelons qu’une exponentielle de moyenne 20 a pour paramètre 1/20. La probabilité que
Alice sorte la première est donc tout simplement :
1/20 3
p= = .
1/20 + 1/30 5
7. Soit Xa , respectivement Xb , le temps nécessaire pour que Alice, respectivement Bob, sorte
de la banque. On cherche donc à calculer E[max(Xa , Xb )]. Il suffit de remarquer que :
max(Xa , Xb ) = Xa + Xb − min(Xa , Xb ),
d’où par linéarité de l’espérance :
1
E[max(Xa , Xb )] = E[Xa ] + E[Xb ] − E[min(Xa , Xb )] = 20 + 30 − = 38 min.
1/20 + 1/30

2.4. Exercices 149
Exercice 2.35 (Rencontre)

Soit X et Y deux variables indépendantes et uniformes sur [0, 1].
1. Donner la densité jointe f du couple (X, Y ).
2. Soit D un sous-ensemble du carré [0, 1] × [0, 1]. Préciser à quoi correspond géométriquement
ZZ
P((X, Y ) ∈ D) = f (x, y)dxdy.
D
3. Soit D = {(x, y) ∈ [0, 1] × [0, 1], |y − x| ≤ 1/4}. Représenter D et calculer P((X, Y ) ∈ D).
4. Deux personnes décident de se retrouver après le travail pour écluser un gorgeon, mais elles
sont toutes deux impatientes et chacune n’attendra l’autre qu’un quart d’heure avant de par-
tir. Supposons qu’elles arrivent à des horaires distribués indépendamment et uniformément
entre 19h et 20h. Quelle est la probabilité qu’elles se retrouvent effectivement ?
y y
1 1
3
4
Supp(X, Y ) D
1
4
x x
1 3 1
1 4 4
Figure 2.38 – Support du couple (X, Y ) et domaine D.
Corrigé
1. La densité jointe du couple (X, Y ) est le produit des densités marginales, soit
f (x, y) = 1[0,1] (x) × 1[0,1] (y) = 10≤x,y≤1 .
2. Soit D un sous-ensemble du carré [0, 1] × [0, 1], alors

ZZ
P((X, Y ) ∈ D) = dxdy = A(D),
D
c’est-à-dire la surface du domaine D.

3. Le domaine
D = {(x, y) ∈ [0, 1] × [0, 1], |y − x| ≤ 1/4} = {(x, y) ∈ [0, 1] × [0, 1], x − 1/4 < y < x + 1/4}
est représenté Figure 2.38. D’après la question précédente, calculer P((X, Y ) ∈ D) revient à
calculer la surface de D, ce qui donne
3 3 7
P((X, Y ) ∈ D) = 1 − × = .
4 4 16

4. D’après ce qu’on vient de voir, la probabilité qu’elles se retrouvent effectivement est donc
7/16.
Exercice 2.36 (Calculs de manipulation)

1. Soit (X, Y ) de densité jointe f (x, y) = c(x + y)1{0≤x,y≤1} . Que vaut la constante c ? Que
vaut P(X > 1/2) ?
2. Soit (X, Y ) de densité jointe f (x, y) = 6xy 2 1{0≤x,y≤1} . Que vaut P(X +Y < 1) ? (Indication :
faire un dessin.)
Corrigé
1. On obtient 1 1 !
1 Z 1
x2 y2
Z
c (x + y)dy dx = c + = c,
0 0 2 0 2 0
donc c = 1. Pour calculer P(X > 1/2), ou bien on calcule la densité de X et on l’intègre de
1/2 à 1, ou bien on envoie directement
Z 1 Z 1
5
P(X > 1/2) = P(X > 1/2, 0 ≤ Y ≤ 1) = (x + y)dy dx = · · · = .
1
0 8
2
2. Soit D = {(x, y) ∈ [0, 1] × [0, 1], x + y < 1}. Le domaine D correspond donc à l’intérieur du
triangle OIJ. Ainsi
Z 1 Z 1−x
1
ZZ
P(X + Y < 1) = f (x, y)dxdy = 6x 2
ydy dx = · · · = .
0 0 10
D
Exercice 2.37 (Loi Gamma)

1. Considérons X suivant une loi exponentielle de paramètre 1. Rappeler sa densité, sa moyenne
et sa variance.
2. En déduire la densité jointe du couple (X, Y ), couple de variables indépendantes suivant
chacune une loi exponentielle de paramètre 1.
3. Grâce au produit de convolution, en déduire la densité de S = X + Y . On dit que S suit une
loi Gamma de paramètres (2, 1), noté S ∼ Γ(2, 1).
4. Déterminer l’espérance et la variance de S.
5. Soit Z, indépendante de S ci-dessus, et suivant une loi exponentielle de paramètre 1. Toujours
grâce au produit de convolution, déterminer la loi de T = S + Z. On dit que T suit une loi
Gamma de paramètres (3, 1).
6. De façon générale, donner la densité de Sn = X1 +· · ·+Xn , où les Xi sont i.i.d. (indépendantes
et identiquement distribuées) de loi exponentielle de paramètre λ > 0. On note alors Sn ∼
Γ(n, λ).
Corrigé
1. La densité de X s’écrit fX (x) = e−x 1{x≥0} , sa moyenne vaut 1, sa variance de même.
2. Puisque les variables sont indépendantes, la densité jointe du couple (X, Y ) est le produit
des densités marginales, c’est-à-dire
fX,Y (x, y) = fX (x)fY (y) = e−x 1{x≥0} e−y 1{y≥0}

2.4. Exercices 151
3. La variable S = X + Y est clairement positive en tant que somme de variables positives donc
fS (s) = 0 si s < 0. Si s ≥ 0, alors le produit de convolution donne
Z +∞ Z s
fS (s) = e 1{x≥0} e
−x −(s−x)
1{s−x≥0} dx = e−x e−(s−x) dx = se−s .
−∞ 0
Ainsi fS (s) = se−s 1{s≥0} .

4. L’espérance étant linéaire, il en découle que
E[S] = E[X + Y ] = E[X] + E[Y ] = 2.
Par ailleurs, l’indépendance de X et Y assure que la variance de la somme coïncide avec la

somme des variances, soit
Var(S) = Var(X + Y ) = Var(X) + Var(Y ) = 2.
5. À nouveau, la variable Z est positive donc fZ (z) = 0 si z < 0. Si z ≥ 0, puisque S et T sont

indépendantes, le produit de convolution donne cette fois
Z +∞ Z z
z2
fZ (z) = se−s 1{s≥0} e−(z−s) 1{z−s≥0} ds = se−s e−(z−s) ds = e−z .
−∞ 0 2
Ainsi fZ (z) = z 2 −z
2 e 1{z≥0} .
6. On peut généraliser le raisonnement précédent pour montrer que de façon générale, si Sn =
X1 + · · · + Xn , où les Xi sont i.i.d. de loi ∼ E(λ), alors
(λs)n−1
fSn (s) = × λe−λs 1{s≥0} ,
(n − 1)!
densité d’une loi appellée loi Gamma de paramètres n et λ, noté Sn ∼ Γ(n, λ). En particulier,
on en déduit sans peine moyennes et variance d’une telle loi : E[Sn ] = n/λ et Var(Sn ) = n/λ2 .
Exercice 2.38 (Coordonnées polaires)

1. Considérons X suivant une loi normale centrée réduite. Rappeler sa densité, sa moyenne et
sa variance.
2. En déduire la densité jointe du couple (X, Y ), couple de variables indépendantes suivant
chacune une loi normale centrée réduite.
3. On considère le couple correspondant à (X, Y ) en coordonnées polaires, c’est-à-dire le couple
aléatoire (R, Θ) avec (X, Y ) = (R cos Θ, R sin Θ). Donner la densité du couple (R, Θ).
4. Déterminer la densité de Θ. Quelle loi reconnaissez-vous ?
5. Déterminer la densité de R, appelée loi de Rayleigh de paramètre 1, et sa fonction de répar-
tition. Calculer la moyenne de R (penser au moment d’ordre 2 d’une loi normale).
6. Soit S = X 2 + Y 2 . Exprimer la fonction de répartition de S à partir de celle de R. En déduire
que S suit une loi exponentielle de paramètre 1/2.
Corrigé
1. Si X suit une loi normale centrée réduite, densité, moyenne et variance sont respectivement
1 x2
fX (x) = √ e− 2 & E[X] = 0 & Var(X) = 1.
2π

2. La densité jointe du couple (X, Y ), avec X et Y indépendantes, est donc

1 − x2 +y2
fX,Y (x, y) = fX (x)fY (y) = e 2 .
2π
3. Ecrivons (X, Y ) = ϕ(R, Θ) = (R cos Θ, R sin Θ). Puisque X et Y prennent toutes deux
leurs valeurs dans R tout entier, il est clair que les valeurs possibles des variables R et Θ
sont respectivement les intervalles [0, +∞[ et [0, 2π[. Dès lors, la formule de changement de
variables donne
1 − r2
fR,Θ (r, θ) = fX,Y (r cos θ, r sin θ)| det Jϕ (r, θ)|1{r≥0} 1{0≤θ<2π} = re 2 1{r≥0} 1{0≤θ<2π} ,
2π
puisqu’on a bien sûr | det Jϕ (r, θ)| = r, grand classique du changement en polaires des inté-
grales doubles.
4. La variable Θ a donc pour densité
Z ∞ Z ∞
1 r2
fΘ (θ) = fR,Θ (r, θ)dr = 1{0≤θ<2π} re− 2 dr,
0 2π 0
c’est-à-dire
2 ∞

1 1
fΘ (θ) = 1{0≤θ<2π} e− r2
= 1 ,
2π 0 2π {0≤θ<2π}
et Θ suit une loi uniforme sur [0, 2π[. On pouvait s’en douter sans aucun calcul : lorsque
l’abscisse X et l’ordonnée Y sont tirées indépendamment selon une loi normale centrée ré-
duite, aucune direction pour l’angle aléatoire Θ n’est privilégiée, d’où la loi uniforme pour
celui-ci.
5. La densité de R est encore plus simple à calculer :
Z 2π Z 2π
1 − r2
fR (r) = fR,Θ (r, θ)dθ = re 2 1{r≥0} dθ
0 2π 0
donc
r2
fR (r) = re− 2 1{r≥0} ,
appelée loi de Rayleigh de paramètre 1. Sa fonction de répartition FR (r) = P(R ≤ r) coule
alors de source : elle vaut 0 pour r < 0 puisque R ne prend que des valeurs positives, et pour
r ≥ 0, Z r r
t2 r2
FR (r) = fR (t)dt = e− 2 = 1 − e− 2 .
0 0
Au final,
2
FR (r) = 1−e− r2
1{r≥0} .
La moyenne de R vaut
Z Z +∞ r2
E[R] = rfR (r)dr = r 2 e− 2 dr.
R 0
Pour s’en sortir, de deux choses l’une : ou bien on effectue une intégration par parties avec
u = r et v ′ = r exp(−r 2 /2) et on se ramène à la densité d’une gaussienne, ou bien on reconnaît
(à une vache près) le moment d’ordre 2 d’une loi normale centrée réduite. On rappelle que
si X ∼ N (0, 1), alors
Z +∞
1 x2
x2 × √ e− 2 dx = E[X 2 ] = Var(X) + E[X]2 = 1.
−∞ 2π

2.4. Exercices 153
Ainsi, par parité de r 7→ r 2 exp(−r 2 /2), il vient

+∞
√ +∞
√ r
1 2π 1 2π π
Z 2
Z
r2
2 − r2
E[R] = r e dr = r × √ e− 2 dr =
2
= .
2 −∞ 2 −∞ 2π 2 2
√
6. Tout comme R = X 2 + Y 2 , la variable S = X 2 + Y 2 est positive donc FS (s) = 0 si s < 0.
Si s ≥ 0, alors
√ √
FS (s) = P(S ≤ s) = P(X 2 + Y 2 ≤ s) = P(R2 ≤ s) = P(R ≤ s) = FR ( s),
ce qui donne immédiatement

FS (s) = 1 − e− 2 1{s≥0} ,
s
qui est la fonction de répartition d’une loi exponentielle de paramètre 1/2. En d’autres termes,
la loi du khi-deux à deux degrés de liberté et la loi exponentielle de paramètre 1/2 sont les
mêmes.
Exercice 2.39 (Somme de gaussiennes)

1. Vérifier la relation x2 + (s − x)2 = s2 /2 + 2(x − s/2)2 .
2. Par un changement de variable permettant de se ramener à la densité d’une gaussienne,
déterminer Z +∞
2
e−u du.
−∞
3. Soit S = X + Y , où X et Y sont indépendantes et de même loi normale centrée réduite.

Exprimer la densité de S comme une intégrale via le produit de convolution.
4. Grâce aux relations ci-dessus, montrer que S ∼ N (0, 2).
5. Soit θ ∈]0, π/2[ fixé et S = X cos θ + Y sin θ, où X et Y sont indépendantes et de même loi
normale centrée réduite. Par la même méthode, montrer que S ∼ N (0, 1).
6. Généralisation : montrer que si X ∼ N (m1 , σ12 ) et Y ∼ N (m2 , σ22 ) sont indépendantes, alors
X + Y ∼ N (m1 + m2 , σ12 + σ22 ). Indication : on pourra considérer la variable
σ1 X − m1 σ2 Y − m2
T =p × +p 2 × .
σ12 + σ22 σ1 2
σ1 + σ2 σ2
Corrigé
1. La relation x2 + (s − x)2 = s2 /2 + 2(x − s/2)2 est triviale.
√ √
2. Posons u = x/ 2 pour obtenir du = dx/ 2 et par suite
+∞ +∞
√ Z +∞
1 2π 1 √
Z Z 2 x2
−u2 − x2
e du = √ e dx = √ √ e− 2 dx = π.
−∞ 2 −∞ 2 −∞ 2π
3. Puisque X et Y sont indépendantes, la densité de S est le produit de convolution de leur

densité, soit
+∞ +∞
1 (s−x)2 1 x2 +(s−x)2
Z 2
Z
− x2 −
fS (s) = e e 2 dx = e− 2 dx.
2π −∞ 2π −∞

4. La relation de la question 1 donne alors

+∞
1 − s2
Z
2
fS (s) = e 4 e−(x−s/2) ,
2π −∞
et le changement de variable u = (x − s/2) aboutit à
1 − s2 +∞ −u2 1
Z
s2
fS (s) = e 4 e du = √ e− 4 ,
2π −∞ 4π
la dernière relation découlant du résultat de la question 2. On a bien montré que S ∼ N (0, 2).
5. Les variables X cos θ et Y sin θ sont indépendantes et suivent des lois normales centrées de
variances respectives cos2 θ et sin2 θ. Par convolution, on a cette fois
Z +∞ Z +∞
1 2 (s−x)2 1 s2 (x−s cos2 θ)2
− x2 −
fS (s) = e 2 cos θ e 2 sin θ dx =
2 −
e 2 e− 2 cos2 θ sin2 θ dx.
2π cos θ sin θ −∞ 2π cos θ sin θ −∞
Le changement de variable t = (x − s cos2 θ)/(cos θ sin θ) donne donc
1 − s2 +∞ − t2 1
Z
s2
fS (s) = e 2 e 2 dt = √ e− 2 ,
2π −∞ 2π
ce qui prouve bien que S ∼ N (0, 1).

6. D’une part, il est clair que les variables (X −m1 )/σ1 et (Y −m
p 2 )/σ2 sont indépendantes
p et de
même loi N (0, 1). D’autre part, on peut pose cos θ = σ1 / σ12 + σ22 et sin θ = σ2 / σ12 + σ22
pour appliquer le résultat précédent, à savoir que T ∼ N (0, 1). Il en ressort que
q
(X − m1 ) + (Y − m2 ) = σ12 + σ22 × T ∼ N (0, σ12 + σ22 ),
donc X + Y ∼ N (m1 + m2 , σ12 + σ22 ), ce qui était le résultat voulu.

Chapitre 3
Equations différentielles
Introduction
Ce chapitre est une introduction à la théorie des équations différentielles ordinaires : pour une
fonction f donnée, on cherche les fonctions y de la variable x dont la dérivée vérifie l’équation
y ′ = f (x, y)
Dans la plupart des cas, on ne saura pas résoudre explicitement une telle équation. Pour une
condition initiale (x0 , y0 ) fixée, on peut néanmoins s’interroger sur l’existence et l’unicité de la
solution : moyennant une hypothèse de régularité sur f , on peut y répondre grâce au Théorème
de Cauchy-Lipschitz.
Quelques cas particuliers où l’on sait résoudre analytiquement l’équation différentielle sont ensuite
étudiés plus en détail : équations linéaires d’ordre 1 (y ′ = a(x)y + b(x)), équations linéaires d’ordre
2 à coefficients constants (ay ′′ + by ′ + cy = f (x)), équations à variables séparées (y ′ = f (x)g(y)).
3.1 Le problème de Cauchy

3.1.1 Equations différentielles du premier ordre
Définition 31 (Equation différentielle du premier ordre)
On appelle équation différentielle du premier ordre toute équation du type :
y ′ = f (x, y),
où f : I × U → R, I intervalle ouvert de R, U ouvert de R, f une fonction continue sur l’ouvert

I × U de R2 , y est une fonction réelle de la variable réelle x, et y ′ est sa dérivée. Le couple (J, ϕ),
avec J sous-intervalle de I et ϕ : J → R dérivable, est une solution de l’équation si pour tout x
de J, (x, ϕ(x)) ∈ I × U , avec :
ϕ′ (x) = f (x, ϕ(x)).
Remarques :
– L’équation est dite du premier ordre car elle ne fait intervenir que la dérivée première y ′ de la
fonction.
– Si l’équation s’écrit simplement y ′ = f (y), on dit qu’elle est autonome.
L’intervalle J, domaine de définition de la solution ϕ, n’est pas nécessairement égal à I. L’exemple

suivant montre le phénomène typique d’explosion en temps fini des solutions.
155
156 Chapitre 3. Equations différentielles
Exemple. On considère l’équation différentielle autonome y ′ = y 2 , où on a donc I × U = R × R.

On montre aisément que l’unique solution de cette équation vérifiant de plus y(x0 ) = y0 est la fonc-
tion ϕ : x 7→ y0 (x0y−x)+1
0
. Si par exemple y0 > 0, cette solution n’est définie que pour x < x0 + y10 .
Quand x tend vers x0 + y10 , la solution “explose” (Figure 3.1).
y0
y y= y0 (x0 −x)+1
y0
x
1
x0 x0 + y0
Figure 3.1 – Solution de y ′ = y 2 avec y(x0 ) = y0 .
La question de la durée de vie des solutions est donc essentielle lors de l’étude d’une équation
différentielle. On s’y intéressera sur les exemples rencontrés, mais on ne donnera pas de résultats
généraux sur ce thème.
3.1.2 Solution maximale

Si (J, ϕ) est une solution de l’équation y ′ = f (x, y), et si J ′ est un sous-intervalle de J, alors il est
clair que (J ′ , ϕ) est encore une solution de cette équation. Inversement, il se peut qu’il existe une
autre solution (J, ˜ ϕ̃), avec J˜ intervalle contenant J et ϕ̃ telle que ϕ̃|J = ϕ. On dit alors que (J,˜ ϕ̃)
est une solution de l’équation prolongeant la solution (J, ϕ).
Définition 32 (Solution maximale)

On dit que (J, ϕ) est une solution maximale s’il n’existe pas d’autre solution la prolongeant.
Remarque. Résoudre (ou intégrer) une équation différentielle, c’est en trouver toutes les solutions
maximales (J, ϕ), c’est-à-dire celles définies sur les plus grands intervalles possibles.
Exemple. Soit l’équation y ′ = 2 xy . L’équation n’est pas définie pour x = 0. Les plus grands
intervalles ne contenant pas 0 sont ] − ∞, 0[ et ]0, +∞[. On cherchera donc des solutions sur ces
deux intervalles.
3.1.3 Le problème de Cauchy

Définition 33 (Le problème de Cauchy)
Etant donnés une équation différentielle du premier ordre y ′ = f (x, y), avec f définie sur l’ouvert
I × U , et (x0 , y0 ) un point de I × U , existe-t-il une unique solution maximale de l’équation vérifiant
de plus y(x0 ) = y0 ?
En mécanique, si t est le temps et X(t) = (x(t), y(t), z(t)) les coordonnées d’un point mobile, alors
la dérivée X ′ (t) = (x′ (t), y ′ (t), z ′ (t)) correspond au vecteur vitesse de ce point mobile à l’instant

3.1. Le problème de Cauchy 157
t. Résoudre le problème de Cauchy :
X ′ (t) = f (X, t)

X(0) = (x0 , y0 , z0 )
revient donc à trouver la position du point à tout instant sachant qu’il est parti de la position
(x0 , y0 , z0 ) (ce qu’on appelle la condition initiale du problème) et qu’il est astreint à la vitesse
f (X, t) s’il passe au point X à l’instant t.
On verra que les solutions d’une équation du premier ordre sont en général définies à une constante
près. La prise en compte de la condition initiale revient alors simplement à déterminer cette
constante.
Pour être assuré de l’existence d’au moins une solution au problème de Cauchy, Peano a montré
qu’il suffit de supposer f continue. Cependant, si on veut être assuré de l’unicité de cette solution,
il faut une condition supplémentaire sur f : l’aspect localement lipschitzien par rapport à y.
Définition 34 (Lipschitzianité locale)

La fonction f : I × U → R est dite localement lipschitzienne en y au point (x0 , y0 ) de I × U s’il
existe un voisinage I1 × I2 de (x0 , y0 ) et une constante k > 0 tels que :
∀(x, y1 , y2 ) ∈ I1 × I2 × I2 |f (x, y1 ) − f (x, y2 )| < k|y1 − y2 |.
Cas particulier important. Un cas très simple et qui suffira quasiment toujours en pratique est
celui où la fonction f est de classe C 1 sur I × U : elle admet alors une dérivée partielle par rapport
à y et celle-ci est continue donc bornée sur un voisinage de (x0 , y0 ) ; l’Inégalité des Accroissements
Finis montre alors que f est localement lipschitzienne en y.
Théorème 18 (Théorème de Cauchy-Lipschitz)

Soit f : I × U → R continue et soit (x0 , y0 ) un point de I × U avec f localement lipschitzienne en
y au point (x0 , y0 ). Alors il existe une unique solution maximale (J, ϕ) au problème de Cauchy :
y ′ = f (x, y)

y(x0 ) = y0
Preuve. On commence par montrer l’existence et l’unicité d’une solution locale, puis que cette
unicité locale se traduit par une unicité globale.
Lemme 1
Il existe α > 0 et une unique solution ϕ :]x0 − α; x0 + α[→ U de y ′ = f (x, y) vérifiant ϕ(x0 ) = y0 .
Lemme 2
Si ϕ1 et ϕ2 sont deux solutions du problème de Cauchy définies sur le même intervalle J, alors
elles coïncident.
Soit alors (Ir , φr )r l’ensemble des solutions au problème de Cauchy. Le Lemme 1 assure qu’il n’est
pas vide. Notons J = ∪r Ir et φ la fonction définie sur J par φ|Ir = φr : φ est bien définie par
le Lemme 2 d’unicité et J est par définition le plus grand intervalle possible de définition d’une
solution au problème de Cauchy : (J, φ) est donc la solution maximale.

Preuve du Lemme 1.
Puisque la solution est locale, on peut remplacer I par Iα =]x0 − α, x0 + α[⊆ I et U par Iβ =
]y0 − β, y0 + β[⊆ U . Puisque f est continue, elle est bornée sur Iα × Iβ , disons par M . On s’arrange
de plus pour que αM < β, ce qui ne pose pas problème.
Soit alors
Λ = {ψ : Iα → R : ψ est continue, ψ(x0 ) = 0, |ψ(x)| ≤ β ∀x ∈ Iα }
Pour la distance d∞ définie par :
d∞ (ψ1 , ψ2 ) = sup |ψ1 (x) − ψ2 (x)|,

x∈Iα
on montrera que l’ensemble Λ est complet (Lemme 3).

On note tout d’abord que ψ est de classe C 1 avec y0 + ψ(x) solution du problème si et seulement
si ψ est continue et : Z x
∀x ∈ Iα ψ(x) = f (u, y0 + ψ(u))du
x0
On définit donc l’opérateur

Λ →Λ
T Rx
ψ 7→ T ψ : x 7→ (T ψ)(x) = x0 f (u, y0 + ψ(u))du
L’inégalité αM < β assure bien que T ψ appartient à Λ et on a de plus :
|T ψ1 (x) − T ψ2 (x)| ≤ k|x − x0 | · kψ1 − ψ2 k∞ ,
d’où par récurrence sur m :
km |x − x0 |m
|T m ψ1 (x) − T m ψ2 (x)| ≤ · kψ1 − ψ2 k∞ ,
m!
et puisque |x − x0 | < α, on obtient :
km αm
kT m ψ1 − T m ψ2 k∞ ≤ · kψ1 − ψ2 k∞
m!
Donc pour m assez grand, T m est une contraction.
On a donc décrit la solution du problème comme un point fixe de l’opérateur T . Or on vient de

prouver que T : Λ → Λ, avec Λ complet, admet une itérée T m contractante : il s’ensuit que T
admet un unique point fixe dans Λ (Lemme 4), c’est-à-dire que le problème de Cauchy admet une
unique solution.

Preuve du Lemme 2.
Si on regarde les x supérieurs à x0 , définissons :
x+ = sup{x ∈ J : x > x0 et ϕ1 (u) = ϕ2 (u) ∀u ∈ [x0 , x]}.
Si x+ < sup J, alors par continuité ϕ1 (x+ ) = ϕ2 (x+ ). Mais alors, si on applique le résultat
d’unicité locale du Lemme 1 au même problème de Cauchy avec la nouvelle condition initiale
(x+ , ϕ1 (x+ )), on obtient une contradiction, puisque celui-ci assure que les deux solutions devraient
encore coïncider à droite de x+ .


3.1. Le problème de Cauchy 159
Il nous reste à prouver les deux résultats topologiques (généraux) utilisés.
Lemme 3
L’espace métrique (Λ, d∞ ) est complet.
Preuve du Lemme 3.
Soit (ψn ) une suite de Cauchy de Λ pour d∞ ,c’est-à-dire :
∀ε > 0, ∃n0 ∈ N, ∀n ≥ n0 , ∀p ∈ N, x ∈ Iα ⇒ |ψn+p (x) − ψn (x)| < ε.
Pour chaque x, la suite (ψn (x)) est de Cauchy dans R qui est complet donc admet une limite que
l’on note ψ∞ (x). Par passage à la limite, il est clair que ψ∞ (x0 ) = 0 et que |ψ∞ (x)| ≤ β pour tout
x de Iα . Il reste à vérifier que ψ∞ est continue sur Iα . Or, d’après ce qui précède, pour tous x et
x′ de Iα , on a via l’inégalité triangulaire :
|ψ∞ (x′ ) − ψ∞ (x)| ≤ |ψn (x′ ) − ψn (x)| + 2ε,
avec n ≥ n0 . Mais ψn est continue donc pour x fixé, il existe δ > 0 tel que :
|x′ − x| < δ ⇒ |ψn (x′ ) − ψn (x)| < ε.
Ainsi, pour tout x ∈ Iα , on a montré que :
|x′ − x| < δ ⇒ |ψ∞ (x′ ) − ψ∞ (x)| < ε,
ce qui est exactement dire que ψ∞ est continue.

Lemme 4
Si T : (Λ, d∞ ) → (Λ, d∞ ) est une contraction, i.e. T est k-lipschitzienne avec k < 1, alors T admet
un unique point fixe, c’est-à-dire qu’il existe une unique application ψ ∈ Λ telle que T ψ = ψ. Ceci
est encore vrai si T admet une itérée qui est une contraction.
Preuve du Lemme 4.
La preuve est rigoureusement la même que celle du point fixe pour une fonction numérique. Tout
d’abord, le fait que T est une contraction assure qu’on ne peut avoir deux points fixes distincts. On
va alors montrer que, quel que soit le point de départ ψ, la suite des itérés (T n ψ) est de Cauchy.
Sa limite ψ∞ est alors un point fixe de T puisque :
T ψ∞ = T (lim T n ψ) = lim T n+1 ψ = ψ∞ ,
par continuité de T . Montrons que c’est une suite de Cauchy :

1
kψ−T p ψk∞ ≤ kψ−T ψk∞ +· · ·+kT p−1 ψ−T p ψk∞ ≤ (1+· · ·+kp−1 )kψ−T ψk∞ ≤ kψ−T ψk∞
1−k
On applique T n , qui est kn -lipschitzienne :
kn
kT n ψ − T n+p ψk∞ ≤ kψ − T ψk∞ ,
1−k
ce qui montre que (T n ψ) est une suite de Cauchy.
Supposons maintenant que T m , et non nécessairement T , est une contraction. On vient de montrer
que T m admet un unique point fixe ψ, d’où T m (T ψ) = T (T m ψ) = T ψ, i.e. T ψ est point fixe de
T m , donc par unicité T ψ = ψ et T admet un point fixe. Par ailleurs celui-ci est unique puisque
tout point fixe de T est clairement un point fixe de T m .

Remarque. Dans la situation usuelle où f est de classe C 1 , le Théorème avait été prouvé par
Cauchy. Lipschitz a ensuite affiné les hypothèses sous lesquelles le résultat reste vrai, d’où l’asso-
ciation des deux noms.
Exemple. On reprend l’équation précédente en se restreignant à l’intervalle I =]0, +∞[, c’est-à-

dire qu’on considère le problème de Cauchy (avec α réel donné) :
y ′ = 2 xy

y(1) = α
La fonction f : (x, y) 7→ 2y/x est C 1 sur ]0, +∞[×R donc le Théorème de Cauchy-Lipschitz s’ap-
plique. On remarque que la fonction constante ϕ = 0 est solution de y ′ = 2y/x sur l’intervalle
]0, +∞[, donc est une solution maximale. Ceci implique deux choses :
1. Si α = 0, la solution maximale au problème de Cauchy est la fonction identiquement nulle

sur l’intervalle ]0, +∞[.
2. Si α 6= 0, la solution ϕ au problème de Cauchy ne pourra s’annuler en aucun autre point x0 .
Sinon, en considérant le nouveau problème de Cauchy dont cette fonction serait solution
y ′ = 2 xy

y(x0 ) = 0
on voit que la solution maximale ne peut être (par le même raisonnement) que la fonction
nulle, ce qui contredit α 6= 0.
Ainsi, si α 6= 0, la solution y au problème de Cauchy est de signe strictement constant. L’équation

est alors équivalente à :
y′ 2
= .
y x
Or deux fonctions continues ne peuvent être égales que si leur primitives le sont à une constante
près, donc il existe c ∈ R telle que :
ln |y| = 2 ln x + c ⇔ |y| = ec · x2 ⇔ y(x) = ±ec · x2 ,
or y(1) = α, donc la solution maximale au problème de Cauchy est (voir Figure 3.2)
]0, +∞[ → R

ϕ:
x 7→ αx2
Remarques :
– Ainsi le Théorème de Cauchy-Lipschitz nous assure non seulement de l’unicité de la solution
trouvée, mais permet également de “séparer les variables” x et y pour pouvoir résoudre explici-
tement l’équation.
– Quand on ne dispose pas de ce Théorème, tout se complique... On doit considérer précisément
les recollements possibles de solutions et l’étude est nettement plus fastidieuse. Voir par exemple
l’équation a priori équivalente :
xy ′ − 2y = 0.

3.2. Equations différentielles linéaires du premier ordre 161
y y = αx2
x
1
Figure 3.2 – Solutions de y ′ = 2 xy avec y(1) = α 6= 0.
3.2 Equations différentielles linéaires du premier ordre

Définition 35 (Equation différentielle linéaire du premier ordre)
On appelle équation différentielle linéaire du premier ordre toute équation du type :
y ′ = a(x)y + b(x),
où a et b : I → R, I intervalle ouvert de R.
Exemple. Supposons a(x) = a constante et b(x) = 0 sur I = R. Alors on a simplement y ′ = ay

et les solutions maximales sont les fonctions
R →R

ϕ:
x 7→ αeax
Elles sont définies à une constante multiplicative près, α. Si on considère le problème de Cauchy
y ′ = ay

y(0) = y0
l’unique solution maximale est obtenue pour α = y0 .
Remarque. On a ici y ′ = f (x, y) = a(x)y + b(x). La condition de lipschitzianité locale s’écrit

donc :
|f (x, y1 ) − f (x, y2 )| = |a(x)| · |y1 − y2 | < k|y1 − y2 |
Pour que f soit localement lipschitzienne en y au point (x0 , y0 ), il suffit donc que a soit bornée
au voisinage de x0 . Moyennant une hypothèse (plus forte) de continuité sur a et b, on va même
pouvoir obtenir la forme explicite des solutions.
3.2.1 Equation homogène

Définition 36 (Equation homogène associée)
On appelle équation homogène (ou sans second membre) associée à l’équation différentielle linéaire
du premier ordre y ′ − a(x)y = b(x) l’équation y ′ − a(x)y = 0.

Proposition 16 (Résolution de l’équation homogène)

Si a : I → R est continue, soit A : I → R une primitive de a. Alors les solutions de l’équation
différentielle y ′ − a(x)y = 0 sont les fonctions
I →R

ϕ:
x 7→ αeA(x)
où α est une constante réelle.
Preuve.
– Soit ϕ : I → R une solution de l’équation et considérons sur I la fonction auxiliaire c définie par
c(x) = ϕ(x)e−A(x) . Alors on vérifie sans problème que c′ (x) = 0 sur I, donc c = α est constante
sur I, c’est-à-dire : ϕ(x) = αeA(x) .
– Réciproquement, si ϕ(x) = αeA(x) sur I, alors ϕ′ (x) = a(x)ϕ(x) et ϕ est bien solution de
l’équation homogène.

Remarques :
– Pour retrouver le résultat, il suffit d’écrire :
h i′
y ′ − a(x)y = 0 ⇔ e−A(x) (y ′ − a(x)y) = 0 ⇔ ye−A(x) = 0 ⇔ ye−A(x) = α ⇔ y = αeA(x)
– L’ensemble des solutions forme donc un espace vectoriel réel de dimension 1, d’où le terme
d’équation linéaire.
Exemple. On cherche les solutions maximales de l’équation linéaire homogène y ′ = xy. On obtient
x2
les fonctions définies sur R (donc solutions maximales) ϕ(x) = αe 2 .
3.2.2 Equation avec second membre

On revient à l’équation d’origine (i.e. avec second membre) :
y ′ − a(x)y = b(x).
Proposition 17 (Résolution de l’équation avec second membre)
Si s : J → R est une solution de l’équation y ′ − a(x)y = b(x), avec a continue et J intervalle
ouvert contenu dans I, alors les solutions sur J de cette équation sont les fonctions
J →R

ϕ:
x 7→ s(x) + αeA(x)
Preuve.
– Soit ϕ : J → R une solution de l’équation et considérons sur J la fonction auxiliaire c définie
par c(x) = ϕ(x) − s(x). Alors on vérifie sans problème que c′ (x) − a(x)c(x) = 0 sur J, donc c
est de la forme c(x) = αeA(x) , ce qui donne bien ϕ(x) = s(x) + αeA(x) .
– Réciproquement, on vérifie que ϕ, définie sur J par ϕ(x) = s(x) + αeA(x) , est bien solution de
l’équation avec second membre.

Remarque. L’ensemble des solutions forme donc un espace affine réel de dimension 1.
Méthode de résolution. Pour résoudre une équation différentielle linéaire y ′ − a(x)y = b(x), la
recette est donc la suivante :

3.2. Equations différentielles linéaires du premier ordre 163
1. Résoudre l’équation homogène associée (calcul de primitive) ;

2. Trouver une solution particulière de l’équation avec second membre ;
3. Ajouter la solution particulière du 2. à la solution générale du 1.
Exemple. On cherche les solutions maximales de l’équation y ′ + y = x. On obtient :

1. Solution générale de y ′ + y = 0 : y(x) = αe−x ;
2. Solution particulière de y ′ + y = x : s(x) = x − 1 ;
3. Solution générale : ϕ(x) = x − 1 + αe−x .
Le point délicat est souvent de trouver une solution particulière de l’équation avec second membre.
Quand b est elle aussi continue sur I (ce qui sera généralement le cas), on peut appliquer la mé-
thode de variation de la constante (due à Lagrange).
Méthode de variation de la constante

On a vu que les solutions de l’équation homogène sont de la forme ϕ(x) = αeA(x) . L’idée (diabo-
lique) est de chercher une solution particulière sous la forme :
s(x) = α(x)eA(x) ,
c’est-à-dire qu’on fait “varier” la constante α. On détermine alors α(x) en écrivant que s(x) doit
vérifier l’équation avec second membre, soit :
s′ (x) = a(x)s(x) + b(x)

α′ (x)eA(x) + α(x)a(x)eA(x) = a(x)α(x)eA(x) + b(x)
α′ (x) = b(x)e−A(x)
et si b est continue, le membre de droite est continu et admet une primitive b(x)e−A(x) dx. On a
R
donc établi le résultat suivant :
Proposition 18 (Solution particulière)

Supposons a et b continues sur I. Pour tout x0 de I, la fonction
I → RR

s: x
x 7→ ( x0 b(t)e−A(t) dt) · eA(x)
est une solution particulière de l’équation différentielle y ′ − a(x)y = b(x), avec s(x0 ) = 0.
Ceci nous permet en particulier de résoudre le problème de Cauchy pour les équations différen-
tielles linéaires du premier ordre.
Corollaire 6 (Solution du problème de Cauchy)

Soit (x0 , y0 ) ∈ I × R. Si a et b sont continues sur I, l’unique solution maximale au problème de
Cauchy
y ′ = a(x)y + b(x)

y(x0 ) = y0
est la fonction ϕ : I → R définie par :
Z x
A(x)−A(x0 ) −A(t)
ϕ(x) = y0 · e + b(t)e dt · eA(x)
x0

Remarque. Il n’est pas utile de retenir cette formule alambiquée : il faut par contre retenir la
méthode de variation de la constante et savoir la réécrire dans les cas particuliers.
Exemple. On cherche les solutions maximales de l’équation linéaire y ′ + y = e−x . La résolution

de l’équation sans second membre donne : y(x) = αe−x . On cherche donc une solution particulière
sous la forme s(x) = α(x)e−x , soit :
s′ (x) = −s(x) + e−x

α′ (x)e−x − α(x)e−x = −α(x)e−x + e−x
α′ (x) =1
α(x) =x+λ
Une solution particulière, obtenue pour λ = 0, est donc s(x) = xe−x . La solution générale de
l’équation initiale est donc
R →R

ϕ:
x 7→ (x + α)e−x
3.3 Equations différentielles linéaires du deuxième ordre

On se contente ici d’étudier les équations différentielles linéaires du deuxième ordre à coefficients
constants.
Définition 37 (Equation linéaire du deuxième ordre à coefficients constants)

On appelle équation différentielle linéaire du deuxième ordre à coefficients constants toute équation
du type :
ay ′′ + by ′ + cy = f (x),
où a, b et c sont réels et f : I → R, I intervalle ouvert de R.
Remarque. On voit que si a ou c est nul, on se ramène à une équation linéaire du premier ordre
à coefficients constants.
3.3.1 Equation homogène

La méthode de résolution est la même que pour les équations du premier ordre. On commence
donc par intégrer l’équation homogène associée, soit :
ay ′′ + by ′ + cy = 0.
Supposons, en faisant le parallèle avec les équations du premier ordre, que l’on cherche les solutions
de l’équation sous la forme :
ϕ(x) = erx .
La fonction ϕ devra donc vérifier aϕ′′ (x) + bϕ′ (x) + cϕ(x) = 0, c’est-à-dire :
∀x ∈ I (ar 2 + br + c)erx = 0.
L’exponentielle ne pouvant s’annuler, on en déduit que r doit être racine de aX 2 + bX + c.
Définition 38 (Polynôme caractéristique associé)

On appelle polynôme caractéristique associé à l’équation différentielle ay ′′ + by ′ + cy = 0 le poly-
nôme aX 2 + bX + c.

3.3. Equations différentielles linéaires du deuxième ordre 165
Théorème 19 (Résolution de l’équation homogène)

Soit l’équation différentielle ay ′′ + by ′ + cy = 0 et P (X) = aX 2 + bX + c le polynôme caractéristique
associé, alors :
1. Si P admet deux racines réelles distinctes r1 et r2 , les solutions de l’équation sont de la forme
ϕ(x) = α1 er1 x + α2 er2 x (α1 , α2 ) ∈ R2
2. Si P admet une racine réelle double r, les solutions de l’équation sont de la forme
ϕ(x) = (α1 x + α2 )erx (α1 , α2 ) ∈ R2
3. Si P admet deux racines complexes conjuguées r + iω et r − iω, les solutions de l’équation
sont de la forme
ϕ(x) = (α1 cos ωx + α2 sin ωx)erx (α1 , α2 ) ∈ R2
Preuve. En vertu de la remarque ci-dessus, on suppose dans ce qui suit a et c différents de 0.
Soit ∆ = b2 − 4ac le discriminant du polynôme caractéristique. Supposons tout d’abord ∆ ≥ 0 et
notons r l’une de ses racines. Soit ϕ une solution de l’équation et considérons la fonction auxiliaire
ψ définie par ψ(x) = ϕ(x)e−rx . On vérifie alors sans problème que ϕ est solution de l’équation
aϕ′′ + bϕ′ + cϕ = 0 si et seulement si ψ est solution de l’équation différentielle :
(2ar + b)ψ ′ + aψ ′′ = 0.
On s’est donc ramené à une équation différentielle du premier ordre de solution générale :
b
ψ ′ (x) = λe−(2r+ a )x ,
d’où deux cas :
1. si 2r + ab 6= 0, alors la solution est de la forme :
λ b
ψ(x) = − b
e−(2r+ a )x + µ,
2r + a
λ b
d’où, en notant r1 = r, α2 = − 2r+ b , α1 = µ et en remarquant que r2 = −(r + a ) est l’autre
a
racine du polynôme caractéristique, on obtient bien :
ϕ(x) = α1 er1 x + α2 er2 x .
2. si 2r + ab = 0 (i.e. si le polynôme caractéristique admet r = − 2a
b
pour racine double), alors
la solution est tout simplement de la forme :
ψ(x) = λx + µ,
d’où, avec des notations évidentes :
ϕ(x) = (α1 x + α2 )erx .
Si le polynôme caractéristique n’admet pas de racine réelle, on applique la même méthode pour
trouver les fonctions de la variable réelle x à valeurs complexes solutions de l’équation différentielle,
puis, parmi l’ensemble des solutions, on ne conserve que celles qui sont à valeurs réelles. Pour la
solution générale à valeurs complexes, on aboutit à :
ϕ(x) = λ1 er1 x + λ2 er2 x (λ1 , λ2 ) ∈ C2 ,
où r1 = r + iω et r2 = r − iω sont les deux racines complexes conjuguées du polynôme caracté-
ristique. Une telle fonction est à valeurs réelles si et seulement si λ1 et λ2 sont conjugués, d’où en
notant α1 la partie réelle de λ1 et α2 sa partie imaginaire :
ϕ(x) = (α1 cos ωx + α2 sin ωx)erx (α1 , α2 ) ∈ R2 .

Remarque. On voit que l’ensemble des solutions d’une équation homogène du deuxième ordre
est un espace vectoriel de dimension deux. Les deux constantes α1 et α2 seront fixées si on impose
deux conditions supplémentaires, par exemple en fixant les valeurs de la fonction et de sa dérivée
en x0 , ou encore les valeurs de la fonction en deux points x0 et x1 distincts...
Généralisation. Si on considère l’équation différentielle linéaire homogène d’ordre n à coefficients

constants :
y (n) = an−1 y (n−1) + · · · + a1 y ′ + a0 y,
on peut montrer que l’ensemble des solutions est un espace vectoriel de dimension n. Comme
précédemment, on obtient une base de l’espace des solutions à partir des racines du polynôme
caractéristique :
P (X) = X n − an−1 X n−1 − · · · − a1 X − a0 .
Notons en effet Y = [y, y ′ , . . . , y (n−1) ]′ , alors sa dérivée est Y ′ = [y ′ , y ′′ , . . . , y (n) ]′ et en notant A

la matrice compagnon :
 
0 1 0 ... 0 0
 0 0 1 0 ... 0 
A =  ... .. .. .. .. ..
 
. . . . . ,
 
 
 0 0 ... ... 0 1 
a0 a1 . . . . . . an−2 an−1
on a la relation :
Y ′ = AY,
et le polynôme caractéristique de A, i.e. det(XIn − A), est tout simplement P (X). Supposons pour
simplifier que P admette n racines réelles distinctes λ1 , . . . , λn (c’est-à-dire que toutes les valeurs
propres de A sont réelles distinctes), alors on montre via une diagonalisation de A que les solutions
de l’équation différentielle sont les fonctions de la forme :
ϕ(x) = α1 eλ1 x + · · · + αn eλn x (α1 , . . . , αn ) ∈ Rn .
Remarque. La méthode ci-dessus, qui permet de ramener un problème de degré n à un problème

de degré 1 via une vectorialisation, est très classique : on la retrouve par exemple tel quel pour
l’étude des suites récurrentes de degré p, du type :
Un+p = an+p−1 Un+p−1 + · · · + a1 Un+1 + a0 Un .
Ceci n’a rien d’étonnant puisqu’on peut voir ce type de suite comme la discrétisation d’une équation
différentielle linéaire homogène de degré p.
3.3.2 Equation avec second membre

Une fois résolue l’équation homogène, il “suffit” de trouver une solution particulière de l’équation
avec second membre pour en déduire la solution générale de l’équation complète. Le raisonnement
est exactement le même que celui tenu pour les équations du premier ordre.

3.4. Equations différentielles à variables séparées 167
Proposition 19 (Résolution de l’équation avec second membre)

Si s : J → R est une solution de l’équation ay ′′ + by ′ + cy = f (x), avec J intervalle ouvert contenu
dans I, alors les solutions sur J de cette équation sont les fonctions
J →R

ψ:
x 7→ s(x) + ϕ(x)
où ϕ est une solution de l’équation homogène associée.
Remarque. Il n’est cependant pas simple en général de trouver une solution particulière de l’équa-
tion avec second membre. Dans le cas particulier où celui-ci est de la forme Q(x)eµx , on trouve
une telle solution sous la forme
R →R

s:
x 7→ R(x)eµx
où R est un polynôme dont on détermine les coefficients par identification et tel que :
1. degré de R = degré de Q, si µ n’est pas racine du polynôme caractéristique P ;
2. degré de R = degré de Q +1, si µ est racine simple du polynôme caractéristique P ;
3. degré de R = degré de Q +2, si µ est racine double du polynôme caractéristique P .
Notons que le second membre de la forme Q(x)eµx couvre en particulier les fonctions de type :
polynôme, exponentielle, fonction sinus ou cosinus, produit de ces fonctions... Notons enfin qu’il
existe une méthode de variation des constantes à l’ordre 2, mais de type usine à gaz, c’est pourquoi
nous n’en parlerons pas.
3.4 Equations différentielles à variables séparées

Définition 39 (Equation différentielle à variables séparées)
On appelle équation différentielle à variables séparées toute équation du type :
y ′ = f (x)g(y),
où f : I → R et g : J → R, I et J intervalles ouverts de R.
Exemple. L’équation y ′ = 2y/x étudiée précédemment est à variables séparées. Plus générale-
ment, toute équation linéaire homogène du premier ordre y ′ − a(x)y = 0 peut être vue comme une
équation à variables séparées. Ce n’est plus le cas dès que le second membre est non nul.
Formellement, le principe de résolution de ces équations est de “séparer les variables x et y”, ce qui
donne : y ′ /g(y) = f (x). En notant H une primitive de 1/g et F une primitive de f , on en déduit :
H(y) = F (x) + α. D’où, si H est inversible :
y = H −1 (F (x) + α).
Il suffit donc de s’assurer que, d’une, on peut diviser par g(y) et, de deux, que H admet une
fonction réciproque.
Proposition 20 (Cas où g s’annule)

Si f et g sont continues sur I et J respectivement, et s’il existe c ∈ J tel que g(c) = 0, alors la
fonction constante
I →R

ϕ:
x 7→ c
est une solution maximale de l’équation y ′ = f (x)g(y).

Preuve. ϕ est constante égale à c donc ϕ′ (x) = 0 ∀x ∈ I. Par ailleurs : f (x)g(ϕ(x)) = f (x)g(c) =
0 ∀x ∈ I.

On a ainsi plié le cas où g s’annule : la solution est alors une fonction constante. On peut mainte-
nant s’intéresser au cas où g ne s’annule pas.
Proposition 21 (Cas où g ne s’annule pas)

Supposons que f et g sont continues sur I et J, g ne s’annulant pas sur J. Soit F et H primitives
de f et 1/g sur I et J. Alors H établit une bijection de J sur H(J) et les solutions de l’équation
y ′ = f (x)g(y) sont les fonctions :
ϕ : x 7→ H −1 (F (x) + α).
Preuve. Si g, continue, ne s’annule pas sur J, par exemple g > 0, alors une primitive H de g1 est
une bijection strictement croissante de J sur H(J). Soit alors I ′ sous-intervalle de I et ϕ : I ′ → J
dérivable. On a donc :
ϕ′ (x)
(H ◦ ϕ)′ (x) = .
g(ϕ(x))
On en déduit que ϕ est solution de l’équation différentielle si et seulement si (H ◦ ϕ)′ (x) = f (x),
i.e. si et seulement si H(ϕ)(x) = F (x)α, ce qui est bien dire que ϕ(x) = H −1 (F (x) + α).

Remarque. La fonction ϕ est définie sur l’intervalle I ′ ⊆ I tel que x ∈ I ′ ⇒ F (x) + α ∈ J. Cette
question se posera naturellement au cours de l’étude du problème.
On peut maintenant résoudre le problème de Cauchy associé à une équation à variables séparées.
Corollaire 7 (Problème de Cauchy pour les variables séparées)

Supposons f et g continues sur I et J respectivement, g ne s’annulant pas sur J. Soit x0 ∈ I et
Rx R y du
y0 ∈ J, F (x) = x0 f (t)dt et H(y) = y0 g(u) . Alors la solution au problème de Cauchy :
′
y = f (x)g(y)
y0 = y(x0 )
est la fonction
F −1 (H(J)) ∩ I → R

ϕ:
x 7→ H −1 (F (x))
Exemple. On considère l’équation y ′ = ex−y . On a donc f (x) = ex définie sur R et g(y) = e−y
également définie sur R et ne s’annulant pas. L’équation est donc équivalente à :
Z Z
y ′ x
e y =e ⇔ e dy = ex dx,
y
d’où les solutions maximales :

Dα → R

ϕ:
x 7→ ln(ex + α)
avec Dα = R si α ≥ 0 et Dα =] ln(−α), +∞[ si α < 0.
Bilan : Méthode de résolution de y ′ = f (x)g(y).

1. Chercher le(s) nombre(s) c tel(s) que g(c) = 0. La (ou les) fonction(s) constante(s) égale(s)
à c est (sont) solution(s).
2. Partager J, intervalle de définition de g, en intervalles ]a, b[ sur lesquels g est de signe constant.
3. Résoudre l’équation différentielle sur chacun des domaines en séparant les variables.
4. Etudier les raccords possibles entre les solutions ainsi trouvées.

3.5. Exercices 169
3.5 Exercices
Exercice 3.1 (Trajectoire d’un projectile)
Un projectile est lancé du point 0 avec une vitesse V0 et un angle ϕ par rapport au sol (Figure
3.3). On note M (t) = (x(t), y(t)) ses coordonnées à l’instant t. Le Théorème Fondamental de la
Mécanique (somme des forces = masse par accélération) implique, si l’on néglige le frottement de
l’air et en notant g l’accélération de la pesanteur (g ≈ 9.8 m.s−2 ) :
′′
x (t) = 0
y ′′ (t) = −g
1. Intégrer les deux équations différentielles ci-dessus. On obtient ainsi une courbe paramétrée
t 7→ M (t) = (x(t), y(t)) pour la trajectoire.
2. Préciser l’intervalle de définition du temps.
3. On veut connaître la nature de la courbe obtenue : pour cela, éliminer t entre les équations
de x(t) et y(t) et exprimer y en fonction de x.
4. Quelle est la portée du lancer ? A vitesse initiale V0 fixée, pour quel angle initial ϕ cette
portée est-elle maximale ?
V0
Figure 3.3 – Vitesse et direction initiales
Exercice 3.2 (Solutions maximales)

Soit f (x) = tan(x), et l’équation :
(E) y′ = 1 + y2.
1. Pour quel(s) intervalle(s) I le couple (I, f ) est-il solution de (E) ? Solution(s) maximale(s) ?
2. À partir de fa (x) = f (x − a), montrer l’existence pour tout (x0 , y0 ) de R × R, d’une solution
passant par (x0 , y0 ).
Exercice 3.3 (Equations linéaires du premier ordre à coefficients constants)

Résoudre les équations différentielles suivantes :
1. y ′ − 2y = 2x3 + x, y(0) = 1 ;
2. y ′ + y = 2ex , y(0) = 0 ;
3. y ′ − 3y = 2e3x , y(1) = 4e3 ;
4. 3y ′ − 2y = 3 cos 2x, y(0) = 17/20 ;
5. y ′ − y = x + ex , y(0) = −1.
Exercice 3.4 (Equations linéaires du premier ordre)


1. y ′ − 2xy = (1 − 2x)ex , y(0) = 5 ;

2. (1 − x2 )y ′ − 2xy = x2 , x ∈] − 1, 1[ ;
3. (1 + x2 )y ′ + xy − 2x = 0, y(1) = 3 ;
4. x(x − 1)y ′ − (2x − 1)y + x2 = 0, x ∈]0, 1[.
Exercice 3.5 (Recollement de solutions)

On considère l’équation différentielle :
(E) xy ′ − y = x2 .
1. En appliquant la méthode de variation de la constante, déterminer la solution générale de

l’équation (E) pour x ∈]0, +∞[. Cette solution générale dépend d’une constante réelle arbi-
traire λ1 .
2. Déterminer de la même façon la solution générale de l’équation pour x ∈] − ∞, 0[, solution
qui dépend d’une seconde constante réelle arbitraire λ2 .
3. Montrer qu’il existe une famille de solutions de l’équation (E), définies, continues et déri-
vables sur R tout entier, dépendant d’une seule constante réelle λ.
Exercice 3.6 (Chute d’une pomme)

−
→
Une pomme tombe d’un arbre à l’instant t = 0, d’une hauteur H = 1m. Le vecteur i étant un
vecteur unité vertical orienté vers le haut, les forces à prendre en compte sont :
→
−
1. la force de pesanteur −mg i ;
→
−
2. la force de frottement de l’air kv(t) i , avec v(t) vitesse à l’instant t.
On rappelle la formule fondamentale de la mécanique établie par Newton : somme des forces =
masse fois accélération, où l’accélération est la dérivée du vecteur vitesse par rapport au temps.
1. Donner l’équation différentielle vérifiée par la vitesse v(t).
2. Intégrer cette équation.
3. Comment déterminer l’intervalle de temps durant lequel cette équation est valable ?
Exercice 3.7 (Concentration de glucose)

Lorsque du glucose est introduit par intraveineuse dans un corps humain à débit constant, la
variation de concentration c(t) de glucose dans le sang est donnée par l’équation différentielle :
G
c′ (t) = − kc(t),
100V
où G est la valeur du débit du glucose (en milligrammes par minute), V est le volume de sang
dans le corps (approximativement 5 litres pour un adulte) et k est une constante positive.
1. Trouver l’évolution de c(t) en fonction du temps.
2. La concentration de glucose dans le sang tend-elle vers une valeur limite ?
Exercice 3.8 (Datation au Carbone 14)

En l’absence d’apport extérieur, la quantité Q(t) de Carbone 14 présent dans un organisme à la
date t décroît à une vitesse proportionelle à Q(t).
1. Sachant qu’il faut attendre 5700 ans pour que Q(t) diminue de moitié, proposer un modèle
qui décrit l’évolution de Q(t) avec le temps.

3.5. Exercices 171
2. L’analyse des restes d’un arbre mort lors d’une éruption volcanique fait apparaître qu’il ne
contient plus que 40% du Carbone 14 qu’il contenait avant l’éruption. De quand date l’érup-
tion si l’analyse a été effectuée en 2000 ? Une seconde analyse donne 42% : quelle différence
d’estimation cela donne-t-il ?
Exercice 3.9 (Modèle de population auto-freiné)

On note N (t) l’effectif d’une certaine population à l’instant t (t ≥ 0). Étudier l’évolution de cette
population lorsque N (t) vérifie l’équation différentielle :
N ′ (t) = aN (t) − bN 2 (t),
avec a > 0, b > 0, N (0) = N0 ∈]0, a/b[ sont des constantes supposées connues.
Exercice 3.10 (Equations linéaires du second ordre à coefficients constants)

1. y ′′ − 8y ′ + 15y = 15x2 − 16x + 17, y(0) = 3, y(1) = 2(1 + e3 ) ;
√ √ √
2. y ′′ − 2y ′ + y = x + 1, y(0) = 1 + 2, y ′ (0) = 1 + 2/2 ;
3. y ′′ − 4y ′ + 4y = −6e2x , y(0) = 1, y ′ (0) = 4.
Exercice 3.11 (Phénomène de résonance)

Un système est soumis à une force d’attraction proportionnelle à sa distance x à un point fixe O
(par exemple par un ressort, voir Figure 3.4), sans amortissement. L’équation du mouvement est
donc :
x′′ (t) + ω02 x(t) = 0,
où ω02 est appelée pulsation propre du système.

1. Donner la solution générale de l’équation.
2. On fixe ω02 = 1. On suppose de plus le système soumis à une cause extérieure sinusoïdale de
pulsation ω :
x′′ (t) + x(t) = sin ωt.
Donner la solution générale, montrer qu’elle est bornée.

3. On suppose maintenant ω0 = ω = 1. Donner la solution générale, montrer qu’elle n’est pas
bornée : c’est le phénomène de résonance.
0 x
Figure 3.4 – Le ressort.

Exercice 3.12 (Equilibre sur un marché)

Les quantités de demande Qd et d’offre Qo varient avec le prix P , qui est une fonction du temps
t, selon le modèle :
Qd = a1 + b1 P + c1 P ′ + d1 P ′′ , a1 > 0, b1 < 0, c1 ∈ R, d1 ∈ R,

Qo = a2 + b2 P + c2 P ′ + d2 P ′′ , a2 < 0, b2 > 0, c2 ∈ R, d2 ∈ R.
Déterminer le prix d’équilibre de ce marché et étudier son évolution au cours du temps.
Exercice 3.13 (Equation linéaire du second ordre à coefficients non constants)

On considère, pour x > 0, l’équation différentielle (E1 ) : x2 y ′′ − 2y = 0.
1. (a) Montrer que si
]0, +∞[ → R

f:
x 7→ f (x)
vérifie (E1 ) pour tout x > 0, alors la fonction g définie par
R →R

g:
t 7→ g(t) = f (et )
vérifie, pour tout réel t, l’équation différentielle (E2 ) : g′′ (t) − g′ (t) − 2g(t) = 0.
(b) Réciproquement, montrer que si g, de R dans R, vérifie l’équation (E2 ), alors la fonction
f , définie sur ]0, +∞[ par f (x) = g(ln x), vérifie (E1 ).
2. Donner l’ensemble des solutions de (E2 ).
3. En déduire l’ensemble des solutions de (E1 ).
4. Déterminer les solutions de (E1 ) admettant un prolongement continu en 0.
5. Résoudre (E1 ) pour x < 0 (on pourra utiliser cette fois la fonction auxiliaire g(t) = f (−et )).
6. En déduire les solutions de (E1 ) définies et deux fois dérivables sur tout R.
Corrigé
On considère, pour x > 0, l’équation différentielle :
(E1 ) x2 y ′′ − 2y = 0.
1. (a) On obtient pour tout réel t :
g′′ (t) − g′ (t) − 2g(t) = (et )2 f (et ) − 2f (et ) = x2 f ′′ (x) − 2f (x) = 0,
en posant x = et , ce qui est légitime car et > 0 pour tout t. Donc si f vérifie (E1 ) sur
]0, +∞[, alors g vérifie (E2 ) sur R.
(b) La réciproque est immédiate par ce même calcul. Ainsi la résolution de (E1 ) se ramène
exactement à celle de (E2 ).
2. (E2 ) est une équation différentielle linéaire homogène du deuxième ordre à coefficients constants.
Son intégration se fait simplement par l’intermédiaire du polynôme caractéristique associé,
dont les racines, réelles et distinctes, sont −1 et 2. On en déduit que les solutions maximales
de (E2 ) sont les fonctions, définies sur R, de la forme :
g(t) = λ1 e−t + λ2 e2t ,
avec λ1 et λ2 constantes réelles.

3.5. Exercices 173
3. Pour obtenir l’ensemble des solutions de (E1 ), il suffit donc de remplacer la variable t par
ln x, ce qui donne pour x > 0 :
λ1
f (x) = + λ2 x 2 .
x
4. Pour qu’une solution de (E1 ) admette un prolongement continu en 0, il faut et il suffit que
λ1 = 0 dans la formule obtenue en 3). Les solutions continues sur le fermé [0, +∞[ sont donc
les fonctions de la forme f (x) = λx2 avec λ constante réelle.
5. Pour x < 0, en utilisant la fonction auxiliaire g(t) = f (−et ), on se ramène à la même
équation (E2 ) pour g, donc les solutions sont de la même forme que celles obtenus en 2). On
en déduit les solutions de (E1 ) sur ] − ∞, 0[ en remplaçant cette fois t par ln(−x), ce qui
donne néanmoins les mêmes solutions
α1
f (x) = − + α2 x2 ,
x
avec α1 et α2 constantes réelles.
6. Comme en 4), les solutions de (E1 ) continues sur le fermé ] − ∞, 0] sont les fonctions de
la forme f (x) = αx2 . Au total, on voit que pour obtenir une solution de (E1 ) deux fois
dérivable en recollant les solutions obtenues sur [0, +∞[ d’une part et ] − ∞, 0] d’autre part,
il faut que les dérivées secondes à droite et à gauche en 0 coïncident, soit avec les notations
précédentes : λ = α. Les solutions sur R de (E1 ) sont donc les fonctions définies par
f (x) = λx2 .
Exercice 3.14 (Equations différentielles à variables séparées)

1. y ′ = ey ;
2. y ′ = ex y 2 .
Exercice 3.15 (Equations différentielles homogènes résolues)

1. On considère l’équation différentielle :
(E) y ′ = f (y/x).
Cette équation est dite homogène résolue. On pose z = y/x. Déterminer l’équation différen-
tielle vérifiée par z.
2. À l’aide de la question précédente, déterminer la forme générale des solutions de l’équation :
y y
y′ = 1 + ln .
x x
Exercice 3.16 (Quelques équations différentielles)

1. Pour x ∈]0, π[, on considère l’équation différentielle :
cos x
y ′ = cos x − y.
sin x
(a) Donner la solution générale de cette équation.

(b) Déterminer la seule solution bornée sur ]0, π[.

2. Trouver la solution de l’équation y ′′ − y = ex dont la limite est nulle en −∞ et dont la dérivée
vaut 1 en 0.
3. On considère l’équation différentielle : (1 + x2 )y ′ = −2xy 2 .
(a) Montrer que la fonction nulle est solution.
(b) Justifier le fait que toute autre solution ne peut s’annuler, et est donc de signe constant.
(c) Déterminer l’ensemble des solutions ne s’annulant pas.
(d) Déterminer la solution valant 1 en 0 et en donner l’allure.
(e) Sur le même graphique, représenter la solution valant −1 en 0.
Corrigé
1. L’équation y ′ + cos x
sin x y = cos x est une équation linéaire du premier ordre avec second membre.
La solution générale de l’équation homogène est y(x) = sinλ x . Une solution particulière de
l’équation avec second membre est tout simplement s(x) = 21 sin x (on peut le retrouver par
variation de la constante). La solution générale de l’équation complète est donc
]0, π[ → R

φ:
x 7→ sinλ x + 21 sin x
Si λ 6= 0, on voit que sinλ x diverge en 0 (et en π). La seule solution bornée de l’équation est
donc φ(x) = 21 sin x.
2. L’équation y ′′ − y = ex est une équation linéaire du deuxième ordre à coefficients constants
et avec second membre. La solution générale de l’équation homogène est :
y(x) = αex + βe−x ,
les racines du polynôme caractéristique étant 1 et −1. Une solution particulière de l’équation
avec second membre est :
1
s(x) = xex ,
2
puisqu’on est dans la situation ay +by +cy = Q(x)eµx , avec µ racine simple de aX 2 +bX +c.
′′ ′
La solution générale de l’équation complète est donc :

R →R

φ:
x 7→ αex + βe−x + 12 xex
Si β 6= 0, on voit que βe−x diverge en −∞, donc il faut β = 0, auquel cas on a bien
limx→−∞ φ(x) = 0. La dérivée s’écrit alors φ′ (x) = ( 21 x + α + 21 )ex et vaut 1 en 0 si et
seulement si α = 12 .
2x
3. L’équation différentielle (1 + x2 )y ′ = −2xy 2 s’écrit encore y ′ = − 1+x 2 ′
2 y , du type y =
f (x)g(y), i.e. c’est une équation à variables séparées.
(a) La fonction nulle est clairement solution sur R.
(b) Soit y une solution de l’équation s’annulant en un point x0 . y est donc solution du
problème de Cauchy
2x
y ′ = − 1+x 2

2y
y(x0 ) = 0
D’après la question précédente, la fonction nulle est également solution de ce problème.
Or on est dans le cadre d’application du Théorème de Cauchy-Lipschitz (puisque la
fonction (x, y) 7→ f (x)g(y) est de classe C 1 sur R2 ) donc il ne peut y avoir qu’une
solution au problème : y est donc la fonction nulle. Au total, toute solution de l’équation
différente de la fonction nulle ne peut s’annuler : puisque ces solutions sont continues,
on en déduit en particulier qu’elle sont de signe constant sur leur domaine de définition.

3.5. Exercices 175
2 0
1.8 −1
1.6 −2
1.4 −3
1.2 −4
1 −5
0.8 −6
0.6 −7
0.4 −8
0.2 −9
0 −10
−10 −5 0 5 10 −1.5 −1 −0.5 0 0.5 1 1.5
2x
Figure 3.5 – Solutions de y ′ = − 1+x 2
2 y pour les conditions initiales y(0) = 1 et y(0) = −1.
(c) On suppose donc y de signe constant et on résout l’équation en séparant les variables :
2x 2 y′ 2x 1
y′ = − 2
y ⇔ − 2
= 2
⇔ = ln(1 + x2 ) + λ,
1+x y 1+x y
donc, outre la fonction nulle, la solution générale de l’équation s’écrit
Dλ → R
(
φ: 1
x 7→ ln(1+x 2 )+λ
Si λ > 0, Dλ = R et φ est strictement positive.

Si λ < 0, plusieurs
√ possibilités :
– Dλ =] − √ ∞, − e−λ −√1[ et φ est strictement positive.
– Dλ =] − √e−λ − 1, + e−λ − 1[ et φ est strictement négative.
– Dλ =] + e−λ − 1, +∞[ et φ est strictement positive.
(d) On a φ(0) = 1 ⇔ λ = 1, donc φ(x) = 1
1+ln(1+x2 )
et φ est définie sur R.
1
√ √
(e) La solution valant −1 en 0 est ψ(x) = −1+ln(1+x2 )
, qui est définie sur ]− e − 1, + e − 1[
(explosion en temps fini).
Exercice 3.17 (Février 2004)

y ′′ − 4y = 4e−2x .
(a) Donner la solution générale de cette équation.

(b) Déterminer la solution f telle que limx→+∞ f (x) = 0 et f ′ (0) = 1.
(c) Représenter f .
2. On cherche les solutions sur R de l’équation différentielle suivante :
|x|y ′ + (x − 1)y = x2 .
(a) Pour x > 0, donner la solution générale de cette équation.

(b) Faire de même pour x < 0. Préciser la seule solution prolongeable par continuité en 0.
Que vaut alors la dérivée à gauche en 0 ?

(c) En déduire la seule fonction de classe C 1 solution sur R de l’équation différentielle

initiale.
Corrigé
y ′′ − 4y = 4e−2x .
(a) C’est une équation différentielle linéaire du deuxième ordre à coefficients constants avec
second membre. La résolution de l’équation homogène via le polynôme caractéristique
donne :
y(x) = αe2x + βe−2x .
Recherche d’une solution particulière : le second membre est du type eµx , avec µ racine
du polynôme caractéristique, donc il convient de la chercher sous la forme :
s(x) = (ax + b)e−2x .
Après identification, on obtient :
s(x) = −xe−2x .
Finalement, la solution générale de l’équation différentielle est :
φ(x) = αe2x + βe−2x − xe−2x .
(b) Pour que limx→+∞ f (x) = 0, il faut que α = 0. La dérivée de f est alors :
f ′ (x) = e−2x (2x − 2β − 1).
Pour que f ′ (0) = 1, il faut donc que β = −1. Finalement :
f (x) = −(1 + x)e−2x .
(c) On a
f ′ (x) = e−2x (2x + 1),
donc f est décroissante pour x < 1/2, puis croissante. Ainsi, le minimum global vaut
f (−1/2) = −e/2. Par ailleurs :
lim = +∞
x→−∞
et :
lim = 0.
x→+∞
On peut alors donner une idée du graphe de f (voir Figure 3.6).

2. On cherche les solutions sur R de l’équation différentielle suivante :
|x|y ′ + (x − 1)y = x2 .
(a) Pour x > 0, |x| = x et on obtient une équation différentielle linéaire du premier ordre
avec second membre :
1
y′ + 1 − y = x.
x
La résolution de l’équation homogène donne :
y(x) = λxe−x .

3.5. Exercices 177
12
10
−2
−1.5 −1 −0.5 0 0.5 1 1.5
Figure 3.6 – Représentation de f (x) = −(1 + x)e−2x .
10
−2
−4
−6
−8
−10
−10 −8 −6 −4 −2 0 2 4 6 8 10
Figure 3.7 – L’unique solution sur R de |x|y ′ + (x − 1)y = x2 .

Une solution particulière évidente de l’équation avec second membre est : s(x) = x.
La solution générale pour x > 0 est donc :
φ(x) = λxe−x + x.
(b) Pour x < 0, |x| = −x et on obtient :

′ 1
y − 1− y = −x.
x
La résolution de l’équation homogène donne :

µ x
y(x) = e .
x
Une solution particulière s’obtient par la méthode de variation de la constante, i.e. on
la cherche sous la forme :
µ(x) x
s(x) = e .
x
Après simplifications, on est amené à résoudre :
µ′ (x) = −x2 e−x ,
ce qui se fait sans problème par deux intégrations par parties successives, et donne par
exemple :
µ(x) = (x2 + 2x + 2)e−x ,
d’où la solution particulière :
x2 + 2x + 2
s(x) = .
x
La solution générale pour x < 0 est donc :
µ x x2 + 2x + 2
ψ(x) = e + .
x x
En 0, on a :
µ x µ
e ∼
x x
et :
x2 + 2x + 2 2
∼ ,
x x
donc pour que ψ admette une limite à gauche en 0, il faut que µ = −2, donc :
2 x2 + 2x + 2
ψ(x) = − ex + ,
x x
auquel cas limx→0− ψ(x) = 0. Un développement limité en 0 montre alors que :
lim ψ ′ (x) = 0.
x→0−

3.5. Exercices 179
(c) Pour “recoller” les solutions en 0, il suffit maintenant de chercher la fonction
φ(x) = λxe−x + x,
définie sur ]0, +∞[ et telle que :
lim φ(x) = lim φ′ (x) = 0.

x→0+ x→0+
La première condition n’est pas restrictive, la seconde impose λ = −1.

Au total, on obtient une unique solution f définie sur R pour l’équation différentielle
initiale, à savoir :
2
f (x) = − x2 ex + x +2x+2

x x<0
f (x) = x(1 − e ) −x x≥0
La représentation de f est donnée Figure 3.7.
Exercice 3.18 (The Silence of the Lambs)

Les variations de température à la surface d’un corps sont, en première approximation, propor-
tionnelles à sa température relative, c’est-à-dire à l’écart entre sa propre température et celle de
l’environnement :
y ′ = −λ(y − T ),
où y(t) est la température à la surface du corps à la date t, T désigne la température de l’environ-
nement (supposée constante) et λ > 0 est la constante de refroidissement.
1. On considère que la température initiale est x0 . Intégrer cette équation différentielle.
2. En déduire l’équation :
y(t2 ) − T
λ(t2 − t1 ) = − log .
y(t1 ) − T
3. Un cadavre est retrouvé à minuit dans une chambre d’hôtel louée au nom de Hannibal Lec-
ter 1 . Sa température est de 24o C. La température ambiante est supposée constante, égale
à 20o C. Deux heures plus tard, la température du corps est descendue à 21o C. Déterminer
l’heure du décès.
Exercice 3.19 (Juin 1998)

Résoudre l’équation différentielle :
xyy ′ + x2 + y 2 = 0.
Pour cela, effectuer le changement de fonction u = y/x. Ne pas oublier de préciser les intervalles
de définition des solutions.
Corrigé
On voit qu’en x = 0, on a nécessairement y 2 = 0, c’est-à-dire que y = 0 pour toute solution
définie en 0. Pour pouvoir effectuer le changement de fonction, on suppose alors x > 0 ou x < 0.
On étudiera ensuite les éventuels recollements de solutions en 0. On note que, dans ce cas, une
solution y ne peut s’annuler (on obtiendrait x2 = 0, i.e. x = 0, ce qui est exclu).
Ainsi, la fonction u de la variable x, définie par u(x) = y(x)/x, ne peut s’annuler. On a respec-
tivement y = xu et y ′ = xu′ + u, ce qui transposé dans l’équation différentielle initiale donne la
nouvelle équation :
xuu′ + 2u2 + 1 = 0.
1. "A census taker once tried to test me. I ate his liver with some fava beans and a nice chianti.”

80 0
70 −2
−4
60
−6
50
−8
40
−10
30
−12
20
−14
10 −16
0 −18
−1 −0.8 −0.6 −0.4 −0.2 0 0 0.1 0.2 0.3 0.4 0.5
Figure 3.8 – Exemples de solutions de xyy ′ + x2 + y 2 = 0.
Il est naturel de changer à nouveau de fonction et de considérer Y = u2 (Y est encore une fonction
de x). L’équation précédente se traduit alors par :
1 ′
xY + 2Y + 1 = 0,
2
et puisque x est différent de 0, on se ramène à une équation linéaire d’ordre 1 :
4 2
Y′+ Y =− .
x x
La résolution de l’équation homogène donne : ϕ(x) = λx−4 .
Une solution particulière triviale de l’équation complète est la fonction constante : s(x) = −1/2.
D’où la solution générale de l’équation complète : Y (x) = λx−4 − 1/2.
Or par définition Y = u2 , donc Y > 0, donc nécessairement λ est strictement positif et en posant
α = (2λ)1/4 > 0, on a deux intervalles de définition possibles pour x : Dα+ =]0, α[ ou Dα− =] − α, 0[.
Intervalles sur lesquels :
1 α 4
Y (x) = −1 .
2 x
D’où l’on déduit : r
1 α 4
u(x) = ± √ − 1.
2 x
Et finalement, pour le problème initial, les solutions sont :
r
x α 4
y(x) = ± √ − 1,
2 x
définies sur Dα+ ou Dα− .

2
On voit qu’au voisinage de zéro, y(x) ∼ √α2x , donc limx→0 y(x) = ±∞ et il n’y a aucun recollement
possible en ce point.
Exemple : la Figure 3.8 q représente deux solutions :
x −1 4
- à gauche, y(x) = − √2

x − 1 sur ] − 1, 0[.
q
0.5 4
- à droite, y(x) = − √x2 − 1 sur ]0, 0.5[.

x

Bibliographie
[1] Rick Durrett. Elementary Probability for Applications. Cambridge University Press, 2009.
[2] Dominique Foata et Aimé Fuchs. Calcul des probabilités. Dunod, 1998.
[3] Pierre-André Cornillon et Eric Matzner-Lober. Régression avec R. Springer, Paris, 2010.
[4] Dominique Liret et François Martinais. Analyse 1ère année. Dunod, 2003.
[5] Dominique Liret et François Martinais. Analyse 2ème année. Dunod, 2004.
[6] Ernst Hairer et Gerhard Wanner. L’analyse au fil de l’histoire. Springer, 2000.
[7] Jean Jacod et Philip Protter. L’essentiel en théorie des probabilités. Cassini, 2003.
[8] Jean-Pierre Lecoutre et Philippe Pilibossian. Analyse II - Mathématiques pour les sciences
économiques. Dunod, 1998.
[9] Bernard Gostiaux. Cours de mathématiques spéciales. Tome 2 : topologie, analyse réelle. PUF,
1993.
[10] Bernard Gostiaux. Cours de mathématiques spéciales. Tome 3 : analyse fonctionnelle et calcul
différentiel. PUF, 1993.
[11] Geoffrey R. Grimmett and David R. Stirzaker. One Thousand Exercises in Probability. Oxford
University Press, New York, 2001.
[12] Geoffrey R. Grimmett and David R. Stirzaker. Probability and Random Processes. Oxford
University Press, New York, 2001.
[13] Jacques Harthong. Cours d’analyse mathématique. Format électronique, 2001.
[14] Jacques Harthong. Calcul des probabilités. Format électronique, 2001.
[15] François Laudenbach. Calcul différentiel et intégral. Editions de l’Ecole Polytechnique, 2000.
[16] Jim Pitman. Probability. Springer, 1999.
[17] Sheldon M. Ross. Initiation aux probabilités. Presses polytechniques et universitaires ro-
mandes, 1987.
181

Variables Multiples

Transféré par

Droits d'auteur :

Formats disponibles

Variables Multiples

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Variables Multiples

Transféré par

Droits d'auteur :

Formats disponibles

Université Rennes 2

1 Fonctions de plusieurs variables 1

2.3.2 Transfert, corrélation, indépendance . . . . . . . . . . . . . . . . . . . . . . 103

3 Equations différentielles 155

Arnaud Guyader - Rennes 2 Variables multiples

Fonctions de plusieurs variables

où les yi = fi (x1 , ..., xn ) sont les p fonctions composantes de f .

1.1 Exemples et définitions

Si n = 2 et p = 1, par exemple f (x, y) = 1 ∀(x, y) ∈ R2 , le graphique de la fonction, c’est-à-dire

est le plan d’équation z = 1, parallèle au plan de base (Oxy) (Figure 1.1).

Figure 1.1 – Plan d’équation z = 1.

bases canoniques de Rn et Rp , qui à un vecteur 1 x = [x1 , ..., xn ]′ associe un vecteur y par

Figure 1.2 – Plan d’équation z = 2x + y.

1. on note en général les vecteurs en colonnes, le signe ′ signifiant la transposition.

Arnaud Guyader - Rennes 2 Variables multiples

Figure 1.3 – Paraboloïde de révolution.

Le graphe G, défini par l’équation z = x2 + y 2 , est un paraboloïde de révolution de sommet O et

1.1.2 Ensemble de définition

où les Dfi sont les ensembles de définition des fi .

1.1.3 Changements de variables