Econometrie Intro

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 10

2010

Econométrie
Résumé de cours
Niveau L3, Economie Appliquée
2 Econométrie

Corrélation linéaire
Coefficient de corrélation linéaire simple

Si ρ est :

- Proche de 1, les variables sont corrélées positivement ;


- Proche de -1, les variables sont corrélées négativement ;
- Proche de 0, les variables ne sont pas corrélées.

Attention ! Corrélation ne signifie pas causalité !

Dans la pratique, on utilise un test statistique :

(H0)

Sous l’hypothèse (H0), on démontre que suit une loi de Student à degrés de liberté

( étant le nombre d’observations dans l’échantillon). On calcule donc :

au seuil à degrés de liberté (H0) rejetée


 coefficient de corrélation significativement différent de 0
Erreur ! Il n'y a pas de texte répondant à ce style dans ce document. 3

Régression simple
Soit la variable à expliquer (variable endogène), et la variable explicative (variable exogène) sur
observations, et les paramètres du modèle (ou les coefficients de régression), le modèle
spécifiant une relation du type :

Le modèle ne traduit pas nécessairement la réalité : il existe une multitude d’autres facteurs que
qui explique . On ajoute un terme qui synthèse l’ensemble des informations non explicitées dans le
modèle :

mesure la différence entre les valeurs réellement observées de et les valeurs qui auraient été
observées si la relation avait été rigoureusement exacte. Il regroupe donc trois erreurs :

- Erreur de spécification (imprécision du modèle) ;


- Erreur de mesure ;
- Erreur de fluctuation d’échantillonnage (variation d’un échantillon à l’autre).

Les valeurs vraies et sont rarement connues, car on n’y accède qu’à travers l’observation : on
obtient donc des estimateurs (ie des VA) et .

Hypothèses :
(H1) Le modèle est linéaire en (éventuellement après transformation)

(H2) Les valeurs sont observées sans erreur (ie n’est pas une VA)

(H3) : l’espérance mathématique de l’erreur est nulle, le modèle est en moyenne


bien spécifiée

(H4) : la variance de l’erreur est constante quelque soit la période ou la coupe.


Hypothèse dite d’homoscédasticité.

(H5) : les erreurs sont non corrélées ou indépendantes

(H6) : l’erreur est indépendante de la variable explicative

Obtention des estimateurs :


Les estimateurs sont obtenues en minimisant la distance au carré entre chaque observation et la
droite obtenue par régression (estimateur des moindres carrés ordinateurs : MCO).

Pour l’obtenir, on cherche et qui minimisent . Par


dérivation par rapport à et , on obtient :

Erreur et résidu
On ne confondra par la suite :

[Tapez un texte]
4 Econométrie

- Lorsqu’on parle du modèle spécifié par l’économiste, on utilise qui est l’erreur
inconnue :

Rappelons que l’on ne connaît pas et .


- Lorsqu’on s’intéresse à notre modèle estimé, on ne parle plus d’erreur mais de résidu
du à notre méthode de résolution :

Propriétés des estimateurs


Reprenons le modèle spécifié par l’économiste et intéressons nous aux valeurs moyennes :

Comme , il vient :

Hypothèse (H3) :

Il vient donc directement :

Par suite, comme , on montre également

Les estimateurs sont sans biais.

Comme les estimateurs sont sans biais, il suffit pour qu’ils soient convergents que leur variance
tendent vers zéro pour tendant vers .

Hypothèse (H4) et (H5) : et , soit :


Erreur ! Il n'y a pas de texte répondant à ce style dans ce document. 5

Lorsque car le nombre d’observations augmente, donc :

D’autre part, comme ,

Attention ! , puisque

Et on a donc :

Donc :

Les estimateurs sont convergents !

Hypothèse de normalité des erreurs


Ajoutons une nouvelle hypothèse :

(H7) : les erreurs suivent une loi normale

Cherchons d’abord un estimateur de la variance de l’erreur (que nous noterons ).

On rappelle que le résidu est donné par : , que nous pouvons modifier sous la
forme . Or comme ,
on a : . On remplace et , et on
obtient :

Sommons les carrés des résidus sur l’ensemble des observations :

Selon une expression rencontrée plus haut : , soit :

[Tapez un texte]
6 Econométrie

On prend l’espérance mathématique de cette dernière expression :

On s’intéresse au premier membre de l’égalité :

Suivant un calcul que nous avons déjà effectué, on reconnait que :

D’où l’on tire :

L’estimateur de la variance de l’erreur est donc :

D’où l’on peut en déduire les estimateurs empiriques de la variance des coefficients :

L’hypothèse de normalité des erreurs implique que

- et suivent une loi normale centrée réduite.

- suit une loi du à degrés de liberté (somme au carré de


variables aléatoires indépendantes normales centrées réduites).

Par une démonstration un peu compliquée mais accessible p.29, on peut démontrer au final que :

et suivent une loi de Student à degrés de liberté.

Ce qui va nous permettre de mettre en place des tests statistiques afin d’apporter des réponses à des
problèmes tels que :
Erreur ! Il n'y a pas de texte répondant à ce style dans ce document. 7

- Comparaison d’un coefficient de régression par rapport à une valeur fixée ;


- Comparaison de deux coefficients de régression provenant de deux échantillons
différents ;
- Détermination d’un intervalle de confiance pour un coefficient.

Aspects pratiques de résolution de problème


 Pour tester une hypothèse (H0) : , sachant que suit une loi de Student à
degrés de libertés.

On calcule appelé le ratio de Student et on le compare en valeur absolu à :

o Si : on est en dehors de l’intervalle de confiance, (H0) est rejeté


o Sinon, (H0) est accepté.
 Pour déterminer un intervalle de confiance pour le coefficient.
De la même manière, sachant la loi suivie par , tous les tests (H0) : seront

validés pour , d’où l’intervalle de confiance :

Analyse de la variance
Démontrons d’abord deux relations :

 : la somme des résidus est nulle.


En effet de par la
définition de .
 : la somme des résidus pondérés est nulle.
En effet

Or , donc la somme ci-dessus est nulle.


 : égalité entre la moyenne de la série à expliquer et la moyenne de la série
ajustée.
En effet . On écrira donc aussi .

Dès lors :

[Tapez un texte]
8 Econométrie

Or :

Par conséquent :

La variabilité totale (SCT) est égale à la variabilité expliquée (SCE) plus la variabilité résiduelle
(SCR).

Cette équation nous permet de juger de la qualité de l’ajustement d’un modèle : plus la variance
expliquée est proche de la variance totale, meilleur est l’ajustement du nuage de points par rapport à
la droite des moindres carrés. Pour ne pas s’embêter avec les unités, on calcule le rapport :

est appelé coefficient de détermination et coefficient de corrélation multiple. Dans le cas


particulier du modèle de régression à une seule variable explicative, il est égal au coefficient de
corrélation linéaire simple entre et .

Reformulation des tests à l’aide du tableau d’analyse de la variance


Le tableau suivant présente l’analyse de la variance pour le modèle de régression simple :

Source de variation Somme des carrés Degré de liberté Carrés moyens

Résidu

Total

Les degrés de liberté correspondent au nombre de valeurs que l’on peut choisir arbitrairement.

On peut démontrer que le test (H0) : peut se ramener à un test par analyse de la variance
(uniquement dans le cas de la régression simple) où le empirique est donnée par :

Où :

 avec = Student empirique ;


 suit une loi de Fisher à et degrés de liberté.
Erreur ! Il n'y a pas de texte répondant à ce style dans ce document. 9

La statistique est le rapport de la somme des carrés expliqués par sur la somme des carrés des
résidus, chacune de ces sommes étant divisées par son degré de liberté relatif. Ainsi, si la variance
expliquée est significativement supérieure à la variance résiduelle, la variable est considérée
comme étant une variable réellement explicative.

Si , nous rejetons l’hypothèse d’égalité des variances et le test (H0) : la variable est
significative.

Prévision dans le modèle de régression simple


Lorsque les coefficients du modèle ont été estimés, il est possible de calculer une prévision à
l’horizon .

Si la valeur de la variable explicative est connue en , la prévision est donnée par


. L’erreur de prévision est .

Par conséquent :

La prévision est donc sans biais.

On essaye maintenant de déterminer quel degré de confiance nous pouvons accorder à la prévision.
Pour cela, nous calculons la variance du résidu qui nous permettra de déterminer un intervalle de
confiance bornant la prévision.

Or

Donc

L’hypothèse de normalité de permet alors d’affirmer que :

[Tapez un texte]
10 Econométrie

Soit donc un intervalle de confiance au risque :