Calcul Diff 1
Calcul Diff 1
Calcul Diff 1
Dans ce chapitre on étend aux fonctions de Rm dans Rn des définitions et des résultats clas-
siques pour les fonctions de R dans R.
2 Fonctions de R dans Rn 2
2.1 Continuité et dérivabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.2 Théorème des accroissements finis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3 Fonctions de Rm dans Rn 3
3.1 Continuité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.2 Dérivées partielles et dérivée directionnelle . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.3 Différentielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.3.1 Rappels sur les applications linéaires. . . . . . . . . . . . . . . . . . . . . . . . . 5
3.3.2 Définition de la différentielle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.3.3 Lien avec les dérivées (partielles). . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.3.4 Opérations sur les différentielles. . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.3.5 Inégalité des accroissements finis. . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.3.6 Fonctions de classe C1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
4 Interprétations géométriques 8
4.1 Courbes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
4.2 Surfaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.3 Variétés et hypersurfaces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1 Rappels
1.1 Norme
Une norme sur un R-espace vectoriel E est une application || · || : E → R+ vérifiant
1. ∀x ∈ E, si ||x|| = 0 alors x = 0 ;
2. ∀λ ∈ R, ∀x ∈ E, ||λ x|| = |λ |||x|| ;
3. ∀x, y ∈ E, ||x + y|| ≤ ||x|| + ||y|| (inégalité triangulaire).
Si E est un R-espace vectoriel de dimension finie, toutes les normes sur E sont équivalentes. Les
notions de continuité et de dérivabilité définies ci-dessous seront donc indépendantes de la norme
choisie.
1
1.2 Fonctions de R dans R
Soit f : I → R une fonction définie sur un intervalle I ⊂ R.
1. La fonction f est continue en a ∈ I si limx→a f (x) = f (a). Autrement dit si :
f (x) − f (a)
2. La fonction f est dérivable en a ∈ I si lim existe et est finie. On note alors
x→a x−a
cette limite f 0 (a).
3. La fonction f est dérivable sur I si elle est dérivable en chaque point a ∈ I. On note alors
f 0 : a 7→ f 0 (a) la fonction dérivée de f sur I.
Théorème 1.1 (Théorème des valeurs intermédiaires). L’image d’un intervalle par une fonction
continue est un intervalle. Autrement dit, si f : I → R est continue sur l’intervalle I ⊂ R, et si a ≤ b
sont deux points queconques de I,
Théorème 1.2 (Théorème des accroissements finis). Soit f : I → R une fonction dérivable sur un
intervalle I ⊂ R. Pour tous a ≤ b ∈ I, il existe c ∈]a, b[ tel que :
∀x ∈ I, | f 0 (x)| ≤ k,
alors
| f (b) − f (a)| ≤ k|b − a|.
Dans ce cas on dit que la fonction f est lipschitzienne de rapport k.
2 Fonctions de R dans Rn
Une fonction f : R → Rn est de la forme :
c’est-à-dire si :
2
Proposition 2.2. La fonction f est continue en a (resp. sur I) si et seulement si chacune des
fonctions coordonnées fi est continue en a (resp. sur I).
Proposition 2.4. La fonction f est dérivable en a (resp. sur I) si et seulement si chacune des
fonctions coordonnées fi est dérivable en a (resp. sur I). On a alors :
Théorème 2.5. Soit f : I → Rn une fonction dérivable sur l’intervalle I ⊂ R. On suppose qu’il
existe une fonction dérivable g : I → R telle que pour tout t ∈ I :
∀x ∈ I, ||f 0 (x)|| ≤ k,
alors
||f(b) − f(a)|| ≤ k|b − a|.
Dans ce cas on dit que la fonction f est lipschitzienne de rapport k.
3 Fonctions de Rm dans Rn
Une fonction f : Rm → Rn est de la forme :
3
3.1 Continuité
Définition 3.1. La fonction f définie sur l’ouvert U ⊂ Rm est continue en a ∈ U si :
c’est-à-dire si :
Proposition 3.2. La fonction f est continue en a (resp. sur U) si et seulement si chacune des
fonctions coordonnées fi est continue en a (resp. sur U).
Théorème 3.3 (Théorème du point fixe de Banach). Soit f une application de Rn dans Rn . On
suppose qu’il existe k ∈ [0, 1[ tel que pour tous x, y ∈ Rn :
(on dit que f est lipschitzienne de rapport k < 1). Alors f admet un point fixe, c’est-à-dire qu’il
existe z ∈ Rn tel que f(z) = z. De plus ce point fixe z est unique.
Définition 3.4 (Dérivées partielles). 1. Soit f : Rm → R une fonction définie sur l’ouvert U ⊂
m
R . Soient a = (a1 , . . . , am ) ∈ U, et j ∈ {1, . . . , m}. On dit que f admet une dérivée partielle
en a dans la direction j si la j-ème fonction partielle en a
est dérivable au point a j ∈ R. Autrement dit, f admet une dérivée partielle en a dans la
direction j si la limite
f (a1 , . . . , a j−1 ,t, a j+1 , . . . , am ) − f (a1 , . . . , a j , . . . , am )
lim
t→a j t −aj
2. Plus généralement, si f : Rm → Rn est définie sur l’ouvert U ⊂ Rm , on dit que f admet une
dérivée partielle en a dans la direction j si la j-ème fonction partielle en a
qui est une fonction de R dans Rn , est dérivable au point a j ∈ R. Dans ce cas on note cette
dérivée :
∂f
(a) ∈ Rn .
∂xj
4
Proposition 3.5. La fonction f : Rm → Rn admet une dérivée partielle en a dans la direction j si
et seulement si toutes les fonctions coordonnées fi : Rm → R admettent une dérivée partielle en a
dans la direction j. Dans ce cas on a :
∂ f1
∂ x j (a)
∂f
(a) = ...
∂xj
∂ fn
(a)
∂xj
∂f
On peut voir les dérivées partielles (a) (1 ≤ j ≤ m) comme les dérivées de f lorsque la
∂xj
variable se déplace au voisinage de a dans les directions données par les vecteurs e j (1 ≤ j ≤ m)
de la base canonique de Rm . Plus généralement, on définit :
Définition 3.6 (Dérivée directionnelle). Soit f : Rm → Rn définie sur l’ouvert U ⊂ Rm , et a ∈ U.
On fixe v ∈ Rm \ {0}. La dérivée directionnelle de f en a dans la direction de v est la dérivée au
point t = 0 de la fonction de R dans Rn donnée par
t 7→ f(a + tv),
3.3 Différentielle
3.3.1 Rappels sur les applications linéaires. On note L(Rm , Rn ) l’espace vectoriel des appli-
cations linéaires de Rm dans Rn . On rappelle que toute application linéaire de Rm dans Rn est
continue.
Plus précisément, fixons des normes quelconques sur Rm et Rn , notées toutes les deux || · ||.
On munit L(Rm , Rn ) de la norme d’opérateur, notée ||| · |||, définie de la manière suivante. Pour
ϕ ∈ L(Rm , Rn ), on pose
||ϕ(x)||
|||ϕ||| := sup | x ∈ Rm , x 6= (0, . . . , 0) = sup {||ϕ(x)|| | x ∈ Rm , ||x|| = 1} ∈ R+ .
||x||
On a alors pour tous ϕ ∈ L(Rm , Rn ) et x ∈ Rn :
5
2. On dit que f est différentiable sur U si elle est différentiable en tout point a ∈ U. L’appli-
cation df : U → L(Rm , Rn ) qui à a ∈ U associe dfa ∈ L(Rm , Rn ) s’appelle la différentielle
de f sur U.
Exemple 3.9. 1. Soit c ∈ Rn . La fonction constante f : x 7→ c est différentiable sur Rm , et on
a pour tout a ∈ Rm :
dfa = 0.
Donc df = 0.
2. Une application linéaire ψ ∈ L(Rm , Rn ) est différentiable sur Rm , et on a pour tout a ∈ Rm :
dψa = ψ.
La différentielle dψ est donc la fonction constante dψ : a 7→ ψ.
3. On considère une forme bilinéaire symétrique φ : Rm × Rm → R. On note q la forme
quadratique associée, définie par :
Rm → R
q:
x 7→ φ (x, x)
L’application q est différentiable sur Rm , et on a pour tout a ∈ Rm :
Rm → R
dqa :
x 7→ 2 φ (x, a)
3.3.3 Lien avec les dérivées (partielles). Considérons d’abord le cas d’une fonction d’une
seule variable.
Proposition 3.10. Soit f : R → Rn une fonction définie au voisinage de a ∈ R. La fonction f est
différentiable en a si et seulement si elle est dérivable en a, et dans ce cas on a :
dfa (x) = x f 0 (a), (x ∈ R).
Passons maintenant aux fonctions de plusieurs variables.
Proposition 3.11. Soit f : Rm → Rn une fonction définie au voisinage de a ∈ Rm . Si f est différen-
tiable en a, alors f admet en a des dérivées dans toutes les directions v ∈ Rm , et on a :
∂v f(a) = dfa (v).
En particulier, en notant e j = (0, . . . , 0, 1, 0, . . . , 0) le j-ième vecteur de la base canonique de Rm ,
on a :
∂f
(a) = dfa (e j ).
∂xj
On appelle matrice jacobienne de f en a la matrice de l’application linéaire dfa ∈ L(Rm , Rn )
relativement aux bases canoniques de Rm et de Rn , et on la note Jfa . En notant comme précédem-
ment f1 , . . . , fn les fonctions coordonnées de f, on déduit immédiatement des Proposition 3.5 et
3.11 que :
∂ f1 ∂ f1 ∂ f1
∂ x1 (a) ∂ x2 (a) · · · ∂ xm (a)
∂f ∂ f2 ∂ f2
2
(a) (a) · · · (a)
Jfa = ∂ x1 .
∂ x2 ∂ xm
.
.. .
.. .
..
∂ fn ∂ fn ∂ fn
(a) (a) · · · (a)
∂ x1 ∂ x2 ∂ xm
6
3.3.4 Opérations sur les différentielles. Les propositions suivantes généralisent des formules
classiques pour calculer les dérivées des fonctions de R dans R.
Proposition 3.12 (Combinaison linéaire). Soient f : Rm → Rn et g : Rm → Rn deux fonctions
définies au voisinage de a ∈ Rm , et soient λ , µ ∈ R. Si f et g sont différentiables en a, alors la
fonction λ f + µg est différentiable en a, et on a :
d(λ f + µg)a = λ df a + µdg a .
Proposition 3.13 (Produit). Soient f : Rm → R et g : Rm → R deux fonctions à valeurs numériques
définies au voisinage de a ∈ Rm . Si f et g sont différentiables en a, alors la fonction f · g est
différentiable en a, et on a :
d( f · g)a = f (a)dg a + g(a)d f a .
Théorème 3.14 (Composition). 1. Soient f : Rm → Rn une fonction définie au voisinage de
a ∈ R , et g : R → R une fonction définie au voisinage de f(a) ∈ Rn . Si f est différentiable
m n p
3.3.5 Inégalité des accroissements finis. Le théorème suivant généralise la deuxième partie
du Théorème 2.5.
Théorème 3.15. Soit f : Rm → Rn une fonction différentiable sur l’ouvert U ⊆ Rm . On fixe a, b
dans U, et on suppose que le segment
[a, b] := {a + t(b − a) | t ∈ [0, 1]}
est contenu dans U. Si il existe k ∈ R+ tel que pour tout x ∈ [a, b] on ait |||dfx ||| ≤ k, alors
||f(b) − f(a)|| ≤ k||b − a||.
Corollaire 3.16. Soit U ⊂ Rm un ouvert connexe (c’est à dire, un ouvert qui n’est pas réunion de
deux ouverts disjoints). Soit f : U → Rn une fonction différentiable sur U telle que :
∀x ∈ U, dfx = 0.
Alors f est constante sur U.
3.3.6 Fonctions de classe C1 . Pour montrer qu’une fonction f est différentiable, la Défini-
tion 3.8 suppose que l’on a déjà “deviné” quelle est sa différentielle ϕa = df a , ce qui n’est pas
toujours bien pratique. On va donner maintenant un critère plus commode à appliquer.
Définition 3.17. Soit f : Rm → Rn une fonction définie sur l’ouvert U ⊆ Rm . On dit que f est une
fonction de classe C1 sur U si f est différentiable sur U, et si l’application df : U → L(Rm , Rn ) est
continue sur U.
Théorème 3.18. Soit f : Rm → Rn une fonction définie sur l’ouvert U ⊆ Rm . La fonction f est une
∂f
fonction de classe C1 sur U si et seulement si, toutes les dérivées partielles existent et sont
∂ xk
continues sur U.
7
4 Interprétations géométriques
A une fonction f : R → R, on associe son graphe
Γ f := {(x, y) ∈ R2 | y = f (x)}.
qui est une courbe plane. Il est bien connu que les propriétés de f (continuité, dérivabilité, ...) se
traduisent par des propriétés géométriques de cette courbe (continuité de la courbe, existence de
tangentes, ...).
Comment ceci se généralise-t-il aux fonctions de Rm dans Rn ? Dans ce qui suit on va essayer
de donner quelques idées intuitives. Pour plus de détails et des définitions rigoureuses, on pourra
se reporter à un cours d’introduction à la géométrie différentielle.
4.1 Courbes
Soit n > 1. Une fonction f de R dans Rn définit une courbe paramétrée C f dans l’espace Rn .
En effet, on peut voir f(t) comme un point de l’espace Rn qui varie en fonction du paramètre t ∈ R.
Si f est suffisamment régulière, l’ensemble des positions décrites par f(t) lorsque t varie ressemble
à ce que l’on appelle intuitivement une “ligne courbe” tracée dans Rn . On interprète souvent t
comme le temps. La courbe paramétrée C f est donc une courbe de Rn sur laquelle se déplace un
point. La dérivée f 0 (a), si elle existe et est non nulle, est un vecteur tangent à la courbe au point
f(a). Si on interprète t comme le temps, f 0 (a) est le vecteur vitesse instantanée à l’instant a. La
norme ||f 0 (a)|| est la vitesse numérique instantanée à l’instant a.
Exemple 4.1. Soit f : R → R2 donnée par f(t) = (cost, sint). La courbe paramétrée Cf est le cercle
de centre (0, 0) ∈ R2 , de rayon 1. On a
ce qui entraîne ||f 0 (t)|| = 1 pour tout t ∈ R. La courbe paramétrée Cf est donc plus précisément le
cercle de centre (0, 0) ∈ R2 , de rayon 1, parcouru à vitesse numérique constante égale à 1.
Soit g : R → R2 donnée par g(t) = (cos(t 2 ), sin(t 2 )). La courbe paramétrée Cg est encore le
cercle de centre (0, 0) ∈ R2 , de rayon 1. Mais
ce qui entraîne ||g0 (t)|| = 2|t|. La courbe Cg représente donc le cercle parcouru à une vitesse
uniformément accélérée (proportionnelle à |t|).
Exemple 4.2. Soit f : R → R. Définissons f : R → R2 par
Alors la courbe
p paramétrée Cf n’est autre que le graphe Γ f de la fonction f , parcouru à la vitesse
numérique 1 + f 0 (t)2 . On retrouve le fait que la tangente à Γ f au point (a, f (a)) a pour vecteur
directeur f0 (a) = (1, f 0 (a)).
Exemple 4.3. Soit f : R → R3 donnée par f(t) = (cost, sint,t). La courbe paramétrée Cf est une
hélice tracée sur le cylindre d’axe vertical passant par l’origine, de rayon 1 (escalier en colimaçon).
Elle est parcourue à vitesse constante :
p √
||f 0 (t)|| = sin2 t + cos2 t + 1 = 2.
8
On peut aussi définir une courbe plane par une équation à deux inconnues, de la forme
f (x) = 0,
où f est une fonction de R2 dans R. Dans ce cas il n’y a plus d’interprétation cinématique. L’équa-
tion représente seulement un ensemble de points C de R2 , qui, si la fonction f est suffisamment
régulière, ressemble à ce que l’on appelle intuitivement une “ligne courbe”.
Soit a ∈ C. Si f est différentiable en a, il est naturel de considérer le vecteur
∂f ∂f
∇ fa := (a), (a) ,
∂ x1 ∂ x2
que l’on appelle gradient de f en a. Intuitivement, ce vecteur indique la direction dans laquelle
il faut déplacer le point x à partir de a pour faire croître le plus vite possible la valeur numérique
f (x). C’est donc un vecteur orthogonal à la tangente à la courbe C au point a (car C est la courbe
de niveau sur laquelle f garde constamment la valeur 0). On en déduit que la tangente à C en a a
pour équation :
∂f ∂f
hx − a, ∇ fa i = (x1 − a1 ) (a) + (x2 − a2 ) (a) = 0.
∂ x1 ∂ x2
Exemple 4.4. Soit f : R2 → R donnée par f (x1 , x2 ) = x12 + x22 − 1. L’équation f (x) = 0 a pour
solutions l’ensemble C des points du cercle de centre (0, 0) ∈ R2 et de rayon 1. Soit a un point de
ce cercle C. On a :
∇ fa = (2a1 , 2a2 ).
C’est bien un vecteur orthogonal au cercle C en a (faire un dessin). De plus, la tangente à C au
point a a pour équation
4.2 Surfaces
Passons maintenant à la dimension 2. Comme pour les courbes on a deux manières de repré-
senter une surface.
Tout d’abord, une fonction f : R2 → Rn , avec n > 2, peut être vue comme une surface paramé-
trée dans l’espace Rn . En effet f(t1 ,t2 ) est un point de Rn qui varie en fonctions de deux paramètres
t1 et t2 . Si f est suffisamment régulière, l’ensemble des positions décrites par f(t1 ,t2 ) lorsque (t1 ,t2 )
varie dans R2 ressemble à ce que l’on appelle intuitivement une “surface courbe” tracée dans Rn .
On peut penser à (t1 ,t2 ) comme à deux coordonnées du point f(t1 ,t2 ) sur la surface.
Si l’on fixe la coordonnée t1 = a et qu’on fait varier seulement la coordonnée t2 , on trace une
courbe sur cette surface, et de même si on fixe t2 = b et qu’on fait varier seulement t1 on trace une
autre courbe sur cette surface. Les vecteurs
∂f ∂f
(a, b), (a, b),
∂t2 ∂t1
sont les vecteurs tangents à ces deux courbes au point f(a, b) de la surface. S’ils sont linéairement
indépendants, ils engendrent le plan tangent à la surface en ce point.
9
Exemple 4.5. Soit f : R2 → R3 définie par f (t1 ,t2 ) = (cost1 cost2 , sint1 cost2 , sint2 ). Comme
l’image de f est contenue dans la sphère de rayon 1 de R3 centrée à l’origine. Il est facile de vérifier
que lorsque t1 décrit [0, 2π] et t2 décrit [−π/2, π/2], le point f(t1 ,t2 ) décrit la sphère toute entière.
(faire un dessin !)
Fixons (a, b) ∈ R2 . La courbe paramétrée donnée par t2 7→ f(a,t2 ) est un cercle méridien de
cette sphère (c’est-à-dire un cercle passant par le pôle Nord (0, 0, 1) et le pôle Sud (0, 0, −1))
parcouru à vitesse constante. La courbe paramétrée donnée par t1 7→ f(t1 , b) est un cercle paral-
lèle de la sphère (c’est-à-dire un cercle parallèle à l’équateur) parcouru à vitesse constante. Les
coordonnées (a, b) s’interprètent comme la longitude et la lattitude du point f(a, b) de la sphère.
On a :
− cos a sin b − sin a cos b
∂f ∂ f
(a, b) = − sin a sin b , (a, b) = cos a cos b .
∂t2 ∂t1
cos b 0
Ce sont les vecteurs tangents respectifs au cercle méridien et au cercle parallèle passant par le
point f(a, b).
On peut aussi représenter une surface dans R3 par une équation à trois inconnues de la forme
f (x) = 0,
Exemple 4.6. Soit f : R3 → R donnée par f (x1 , x2 , x3 ) = x12 + x22 + x32 − 1. L’équation f(x) = 0 a
pour solutions l’ensemble S des points de la sphère de centre (0, 0, 0) ∈ R3 et de rayon 1. Soit a
un point de cette sphère S. On a :
C’est bien un vecteur orthogonal à la sphère S en a (faire un dessin). De plus, le plan tangent à S
au point a a pour équation
10
4.3 Variétés et hypersurfaces
On peut maintenant généraliser à des dimensions quelconques les idées précédentes.
(i) Soit f : Rm → Rn , où l’on suppose m < n. Si f est suffisamment régulière, l’image de f est un
sous-ensemble de Rn qui, localement, ressemble à une boule de Rm . On l’appelle une sous-variété
différentiable V de dimension m de Rn . Par exemple, si f est linéaire et injective, f(Rm ) est un
sous-espace vectoriel de dimension m de Rn .
Soit a ∈ Rm . Les fonctions partielles
donnent m courbes paramétrées tracées sur V passant par le point f(a). Les dérivées partielles
∂f
(a) ∈ Rn ,
∂xj
si elles sont non nulles, sont des vecteurs tangents à ces courbes au point f(a), et elles engendrent
un sous-espace de dimension m qu’on appelle l’espace tangent à V en f(a).
(ii) On peut aussi considérer une fonction f : Rm → R et le sous-ensemble H de Rm définie
par l’équation
f (x) = 0.
Les m coordonnées des points de H étant liées par cette unique équation, intuitivement, si f est
suffisamment régulière, on voit que H est un objet géométrique de dimension m − 1. Par exemple,
si f est linéaire, H est le noyau d’une forme linéaire, c’est-à-dire un hyperplan. En général on dit
que H est une hypersurface de Rm .
Soit a ∈ H. Si f est différentiable en a, il est naturel de considérer le vecteur
∂f ∂f
∇ fa := (a), · · · , (a) ,
∂ x1 ∂ xm
que l’on appelle gradient de f en a. Intuitivement, ce vecteur indique la direction dans laquelle
il faut déplacer le point x à partir de a pour faire croître le plus vite possible la valeur numérique
f (x). C’est donc un vecteur orthogonal à l’hyperplan tangent à H au point a. On en déduit que cet
hyperplan tangent a pour équation :
∂f ∂f
hx − a, ∇ fa i = (x1 − a1 ) (a) + · · · + (xm − am ) (a) = 0.
∂ x1 ∂ xm
11