Analyse des tests d’autocorrélation spatiale en économétrie

Pour citer ce mémoire et accéder à toutes ses pages

Les tests d’autocorrélation spatiale sont essentiels pour éviter des estimateurs biaisés dans les modèles de régression spatiale. Cet article explore les développements récents en économétrie spatiale et leur application empirique aux déterminants du chômage en Tunisie.


Les tests de spécification :

Dans les travaux appliqués, les tests d’autocorrélation spatiale sont généralement plus suivis que l’estimation elle-même. Et pour cause, une autocorrélation spatiale peut conduire à des estimateurs biaisés et non convergents dans le cas du modèle de déca- lage spatial, ou à des estimateurs inefficaces et biaisés dans le cas du modèle d’auto- corrélation des erreurs.

Etant donné la complexité associée à des modèles d’estimation qui incluent l’interaction spatiale, il est important d’être en mesure d’évaluer si cela est effectivement nécessaire. Il est donc raisonnable qu’un diagnostic de autocorrélation s’impose dans les travaux de régression transversale comme le sont les tests d’autocorré- lation dans la dimension temporelle.

L’hypothèse nulle de ces tests représente l’absence d’autocorrélation spatiale donc un modèle de régression standard estimé par les MCO. Dans cette section, les principales caractéristiques des tests les plus utilisés sont décrites, allant des tests contre l’autocorrélation spatiale en passant par les tests fondés sur le principe du maximum de vraisemblance jusqu’aux tests sur des sources multiples d’erreur de spécification.

Les tests d’autocorrélation spatiale :

Cette batterie de tests permet de relever s’il existe une forme d’autocorrélation spatiale entre les résidus. Il s’agit des tests de diffusion (diffuse tests), comme souligné dans le travail de Florax [2004], offrant d’excellents outils de diagnostic des erreurs de spécification.

Le test I de Moran :

Le test I, développé par Moran [1950], apparaît comme une extension à deux dimen- sions du test de corrélation temporelle dans les séries temporelles univariées. Il a été adapté aux résidus d’une régression par Cliff et Ord [1973] et se présente formellement de la façon suivante en notation matricielle :

I = N ( e𝘫W e ) (1.86)

S0 e𝘫e

e = y ˆ est le vecteur des résidus estimés des MCO et S0 est un facteur de standardisation égal à la somme de tous les éléments de W.

Dans Anselin [2006] il est annoncé que « … Le test I possède certaines propriétés d’optimalité comme similaires à celles du test Durbin-Watson dans les séries tempo- relles. Par exemple, King [1981] a montré qu’il s’agit d’un test localement meilleur invariant. De plus, il est asymptotiquement équivalent à un test du ratio de vraisem- blance et au score Rao ou au test du multiplicateur de Lagrange partageant ainsi les mêmes propriétés asymptotiques que ces statistiques… » .

Sous l’hypothèse nulle, Cliff et Ord [1973] dérivent les deux premiers moments de I :

E(I) = Tr(MW )

N K

(1.87)

et

V (I) = Tr(MWMW 𝘫) + Tr(MW )2 + [Tr(MW )]2 2

(N K)(N K + 2) − E I

[ ( )]

(1.88)

avec M la matrice symétrique et idempotente M = I X(X𝘫X)−1X𝘫

Le test se base alors sur la statistique de Moran centrée et réduite : Z(I) = [I E(I)]/V (I) . Pour des résidus normalement distribués et une matrice de poids « qui se comporte bien », Z(I) suit asymptotiquement une loi normale centrée et réduite. Kelejian et Prucha [2001] donnent ainsi des conditions formelles pour la normalité asymptotique du test de Moran dans plusieurs types de modèles. L’inférence statistique peut également être basée sur la distribution exacte de I en échantillon fini.

Le test I de Moran est souvent interprété comme un test d’autocorrélation sérielle des erreurs, mais ceci est parfois incorrect. Le test se montre puissant contre toute alternative à l’autocorrélation spatiale, y compris l’intraction spatiale décalée, comme démontré dans des expériences de simulation Monte Carlo (Anselin et Florax [1995b], Florax et de Graaff [2004]).

Par ailleurs, cette statistique est très générale et peut être appliquée dans de nom- breux cadres autres que les modèles de régression classique. Par exemple, dans Anselin et Kelejian [1997], le test est appliqué à des résidus d’un modèle avec des variables en- dogènes estimés par les doubles moindres carrés (2SLS). Il faut donc différencier le cas où les variables endogènes comprennent un décalage spatial du cas standard a-spatial.

Le test Kelejian-Robinson :

Un second test contre une forme quelconque d’autocorrélation spatiale a été suggéré par Kelejian et Robinson [1992]. Le principe du test est intuitif : si la covariance entre des couples de termes d’erreur « voisins » indique une variation systématique, alors l’hy- pothèse nulle d’absence d’autocorrélation spatiale devrait être rejetée. Formellement, la covariance spatiale est spécifié comme suit :

Cov[εiεj] = σij = νijγ (1.89)

νij un vecteur de covariables de taille 1 × q relatif aux paires de localisations i,j. Par exemple, on peut désigner h un élément de νij par νijh = xihxjh, le produit des variables explicatives relatives aux localisations i et j.

Sous l’hypothèse nulle, la covariance est absente d’où H0 : γ = 0 . Le test est rendu opérationnel en procédant à une régression du produit des résidus, Cˆij = εiεj et du produit des variables explicatives rassemblés dans νij. En notation matricielle, on obtient :

Cˆ = V γ + u (1.90)

La statistique de test est une mesure de la qualité de l’ajustement dans cette régres- sion auxiliaire :

KR = γˆ𝘫V 𝘫V γˆ (1.91)

σˆ4

γˆ et uˆ sont les estimateurs du vecteur des coefficients et du vecteur des résidus de la régression auxiliaire dont chaque observation correspond à un couple de zones contiguës (le coefficient correspondant de W est non nul). Sous l’hypothèse nulle, la statistique suit asymptotiquement un χ2(q), avec q le nombre des variables explicatives de la régression auxiliaire (le nombre de colonnes de V ). Le terme du dénominateur σˆ4 correspond à n’importe quel estimateur convergent de σ4, de telle manière que σˆ4 = (Cˆ − V γˆ)𝘫(Cˆ − V γˆ)/hn.

Le test KR est un test adéquat aux échantillons de grande taille car ses propriétés ne sont pas relevables d’autres situations. Cette caractéristique est mise en évidence dans des expériences de simulation de Monte Carlo (Anselin et Florax [1995b], Florax et de Graaff [2004]).

Les tests basés sur le ML :

Contrairement aux tests de « diffusion », les tests « ciblés » sont construits avec une alternative spécifique potentielle à l’esprit du practicien. En général, ils se résument à un test de restrictions sur les paramètres d’un modèle qui contient l’interaction spatiale (modèle d’erreur spatiale ou modèle du décalage spatial). L’approche la plus couram- ment utilisée est celle basée sur les trois statistiques de test classiques obtenus à travers l’estimation du maximum de vraisemblance : la statistique de Wald, du rapport de vrai- semblance et du multiplicateur de Lagrange ML (ou, le score Rao).

D’une part, les test de Wald et le test du rapport de vraisemblance sont standards et exigent l’estimation d’un modèle sans restriction ou d’un modèle spatial (Anselin [1988b]). D’autre part, les tests du multiplicateur de Lagrange sont basées sur une estimation sous l’hypothèse nulle, ou d’un modèle restreint, à savoir la régression linéaire classique et ses résidus MCO.

L’autocorrélation spatiale des erreurs :

Le point de départ pour un test ML d’autocorrélation spatiale des erreurs est la log-vraisemblance [1.60] d’un processus générateur de données spécifique aux termes d’erreur de la régression similaire à un processus SAR ou un SMA. Habituellement, la statistique de test ML est obtenue comme suit :

ML = [d(θ)]𝘫[I(θ)]−1[d(θ)] (1.92)

d(θ) = ∂L(θ)/∂θ et I(θ) = −E[2L(θ)/∂θ∂θ𝘫] est la matrice d’information. Le score et la matrice d’information proviennent du modèle (spatial) non-restreint évalué sous l’hypothèse nulle, c’est à dire, avec des paramètres restreints. Pour les alternatives SAR et SMA, il s’agirait plutôt de λ = 0 dans [1.12] et de γ = 0 dans [1.22] respectivement. Les deux restrictions conduisent à la même statistique de test (Anselin [1988a]) :

[e𝘫W e/(e𝘫e/n)]2

MLλ =

Tr[W 𝘫W + WW ]

(1.93)

e est un vecteur n×1 des résidus MCO. Hormis le dénominateur, cette statistique est essentiellement le carré de la statistique I de Moran asymptotiquement distribuée suivant un χ2(1).

La statistique du test est la même si on spécifiait comme hypothèse alternative le processus moyenne mobile SMA et comme test H0 : γ = 0. LMλ est donc localement optimal pour les deux alternatives (autorégressive et moyenne mobile) et lorsque l’hypo- thèse nulle est rejetée, le test ne donne pas d’indications quant à la forme du processus des erreurs.

Toutefois, le principe des tests ML peut également être appliqué à d’autres formes d’erreur spatiale, telles que le modèle à erreurs composées [1.27] ou la représentation directe [1.26]. Selon Anselin[2001a], la statistique du test correspondant à [1.27] est :

T1 2

ML = [ e𝘫WW 𝘫e T ]2/2[T

MEC

e𝘫e/n

1

2

− ] (1.94)

avec T1 = Tr(WW 𝘫) et T2 = Tr(WW 𝘫WW 𝘫). Sous H0 : MLMEC χ2(1).

n

Par ailleurs, la statistiques de test relative au modèle de représentation directe basée sur le maximum de vraissemblance est plus complexe à mettre en place. La cause est, que sous l’hypothèse nulle, la valeur du paramètre est à la limite de l’espace des paramètres. De plus, les paramètres de nuisance ne sont identifiables que sous l’hypothèse alternative. Ces conditions non standard invalideront l’utilisation du ratio de vraissemblance ou des statistiques de Wald.

Le décalage spatial :

Comme indiqué dans Anselin[1988a], la statistique de test ML relative au modèle avec décalage spatial peut être obtenue en utilisant le même principe de [1.92] appliqué à la log-vraisemblance du modèle [1.49] sous l’hypothèse H0 : ρ = 0 :

[e𝘫W y/(e𝘫e/n)]2

MLρ =

D

(1.95)

avec e un vecteur des résidus MCO. L’expression du dénominateur est :

D = [(WXβˆ)𝘫[I X(X𝘫X)−1X𝘫](WXβˆ)σ2] + Tr(W 𝘫W + WW ) (1.96)

βˆ et σˆ sont des estimations MCO. La statisque du test suit asymptotiquement un χ2(1) .

Les tests des sources multiples de problèmes de spécification :

Dans les sections 1.4.1 et 1.4.2, les erreurs de spécification traitées s’articulent es- sentiellement autour de l’autocorrélation. Toutefois, dans la pratique, les données en coupe transversale sont également susceptibles d’être affectés par d’autres sources de problèmes de spécification comme l’hétéroscédasticité et la non-linéarité.

Comme démontré dans Anselin[1988b], la détection de l’hétéroscédasticité en pré- sence d’autocorrélation spatiale est simple. En effet, une statistique de test ML de type Breusch-Pagan (BP ) s’étend facilement aux résidus issus d’une estimation par le MV dans le cadre d’un modèle de décalage spatial ou aux résidus avec filtrage spatial d’un modèle d’erreur spatiale également estimé par le MV. Ce test joint de l’hétéroscédasti- cité et de l’autocorrélation spatiale des erreurs est la somme d’une statistique de BP et de la MLλ en [1.93].

Une alternative est l’extension de la statistique Kelejian-Robinson décrite dans Ke- lejian et Robinson [1998], ne nécessitant pas d’hypothèse de normalité et s’appliquant également à des régressions linéaires et non linéaires. Par commodité, le cas scalaire seulement est considéré, dans lequel l’hétéroscédasticité est modélisée par σ2 = g(zi) , où z est l’une des variables explicatives de la régression (z peut être un sous-ensemble des variables explicatives). La statistique de test est obtenue sous forme d’un test joint de la significativé des paramètres de la régression auxiliaire suivante :

i

eiej = a0δij + a1(δijzi) + a2(ziwji + zjwij) + u (1.97)

avec eiej incluant tous les carrés des résidus et tout les produits pour j > i et (wji + wij) 0, δii = 1, et δij = 0 pour i j. Le test joint de significativité de aˆ1 = aˆ2 = 0 utilise un estimateur convergent de type White. L’extension du cas scalaire à une situation avec de multiples variables z requiert des moindres carrés non-linéaires (Kelejian et Robinson[1998]).

Un test conditionnel de présence d’autocorrélation spatiale des erreurs sur un modèle de regression avec hétéroscédasticité peut être dérivé des principes de tests basés sur le MV. La statistique de ce test est :

MV = (e𝘫Ωˆ−1W e)2

Tr(WW + W 𝘫Ωˆ−1W Ωˆ)

(1.98)

avec Ωˆla matrice de variance-covariance estimée (diagonale) avec pour éléments σˆi = g(αˆ, zi), les αˆdes estimateurs convergents obtenus par le MV et e des résidus de l’estimation de la regression. La statistique du test MVest asymptotiquement distribuée suivant un χ2 à un degré de liberté.

Conclusion

L’objectif de ce chapitre était d’examiner pourquoi l’interaction spatiale doit être modélisée et comment elle est introduite dans les modèles économétriques. Cette inter- action se modélise grâce aux matrices de poids. En sa présence, l’utilisation des moindres carrés ordinaires produit des estimateurs inefficients et l’inférence statistique n’est pas fiable. Lorsqu’elle est détectée, différents modèles économétriques permettent d’en te- nir compte : introduction d’une variable endogène décalée et/ou d’une autocorrélation spatiale des erreurs.

La caractéristique principale de ces modèles, qui détermine l’ensemble des dévelop- pements suivants, est la corrélation des erreurs et des variables explicatives, et ce, quelles que soient la forme et la distribution des erreurs. Par conséquent, les moindres carrés ordinaires et les moindres carrés quasi-généralisés ne sont pas des méthodes adaptées et il faut se tourner vers d’autres méthodes d’estimation telle la méthode du maximum de vraisemblance, celle des variables instrumentales ou des moments généralisés. A travers les règles de décision, les tests de spécification permettent de déterminer la forme prise par l’autocorrélation spatiale et son interprétation.

Rechercher
Télécharger ce mémoire en ligne PDF (gratuit)

Laisser un commentaire

Votre adresse courriel ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Scroll to Top