Spécification des modèles spatiaux en économétrie

Pour citer ce mémoire et accéder à toutes ses pages

Les modèles spatiaux en économétrie sont essentiels pour analyser les interactions et structures spatiales dans les régressions. Cet article présente les avancées récentes de la littérature et une application empirique sur les déterminants du chômage en Tunisie, mettant en lumière l’autocorrélation des erreurs.


La spécification des modèles spatiaux

Les modèles d’autocorrélation des erreurs :

Une première façon d’incorporer l’autocorrélation spatiale dans un modèle de ré- gression est de spécifier un processus spatial pour les erreurs. Différentes possibilités existent qui mènent à différentes covariances des erreurs, avec des implications variables pour la nature et l’ampleur de l’autocorrélation spatiale dans le modèle [Anselin, 2001c]. Pour modéliser les interactions spatiales, il est nécessaire d’imposer une structure sur l’étendue de ces interactions.

En effet, on ne peut pas estimer n × (n − 1)/2 termes d’interaction avec n observations. Il s’agit du problème d’identification fondamental en économétrie spatiale : imposer des restrictions ou une struture sur les éléments de la matrice de variance-covariance E[ee𝘫] = S pour que l’estimation soit possible.

C’est à cet effet que plusieurs approches ont été suggérées et peuvent être classées comme suit : les modèles de processus stochastique spatial, la représentation directe et les modèles à erreur composée.

Les processus stochastiques spatiaux :

Un processus stochastique spatial ou champs aléatoire, est une collection de vra- riables aléatoire indexées par la localisation. En utilisant les termes d’erreur d’une regression spatiale, il peut être exprimé par :

{εiD} (1.9)

Avec D un ensemble spatial, une surface continue ou un ensemble fini de localisa- tions discrêtes. La spécification du processus spatial induit une structure d’interaction (covariance) particulière. L’élément crucial dans la spécification est la détermination de la structure des localisations voisines, ou formellement, les localisations qui seront représentées dans le terme de décalage spatial à droite de l’équation. La structure de connexité est exprimée au moyen d’une matrice de poids spatiale, qui est sera considéré en premier, suivra un bref examen des spécifications de processus couramment utilisés.

La matrice de poids spatiale : Pour capter l’interdépendance entre régions, il faut considérer leurs positions relatives. Pour cela, on doit spécifier de manière exogène la topologie du système spatial en construisant une matrice de poids. Cette matrice est une matrice carrée, ayant autant de lignes et de colonnes qu’il y a de zones géographiques (on note n le nombre de régions), où chaque terme wij représente la façon dont la région i et la région j sont connectées spatialement.

La matrice de contiguïté : Les matrices les plus utilisées sont les matrices dites de contiguïté. La contiguïté entre deux régions se définit par le fait qu’elles ont une frontière commune et chaque terme de cette matrice est égal à 1 si les régions sont contiguës à l’ordre 1 et 0 sinon (par convention, une région n’est pas contiguë avec elle-même : wii = 0,∀i). Cette notion de contiguïté peut être généralisée : deux régions i et j sont contiguës à l’ordre k si k est le nombre minimal de frontières à traverser pour aller de i à j.

Ces matrices de contiguïté sont souvent utilisées en raison de leur simplicité mais apparaissent restrictives pour ce qui est de leur définition de la connexion spatiale entre régions. Une autre possibilité consiste à utiliser des matrices de distance. On suppose dans ce cas que l’intensité de l’interaction entre deux régions i et j dépend de la distance entre les centroïdes de ces régions. Plusieurs indicateurs peuvent être utilisés selon la définition de la distance : distance à vol d’oiseau, distance par routes ou généralisation aux temps de transport ou à des indices d’accessibilité.

La matrice exponentielle et la matrice de distance : Diverses spécifications sont également disponibles, les plus utilisées étant la fonction exponentielle négative dans LeSage et Pace [2007] ou une fonction de l’inverse de la distance. Si dij désigne la distance entre la région i et la région j, les éléments de la matrice de distance pour ces deux cas sont définis par :

  • wij = exp−αdij
  • wij = dβsi dij < d¯ 0 sinon ¯

α et β sont des paramètres déterminés a priori, d est la valeur seuil au-delà de laquelle on suppose que les régions i et j ne sont pas connectées.

La standardisation des matrice de poids : Les matrices de poids sont souvent standardisées et rendues telles que la somme des lignes est égale à 1. Chaque élément wij de la matrice est divisé par la somme totale de la ligne :

wijs = wij / Σ wij

Les poids sont alors compris entre 0 et 1 et cette opération rend les paramètres spatiaux comparables entre les modèles économétriques. L’interprétation des poids est également modifiée. Par exemple, dans le cas d’une matrice de distance, standardiser la matrice de poids signifie qu’on suppose que la connexion entre deux régions dépend de la distance relative (facilitant l’interprétation dans les modèles de décalage spatial) entre elles et non plus de la distance absolue.

Problème d’endogénéité : Selon Kelejian et Prusha [1999], l’utilisation de telles matrices de poids peut poser problème. En effet, les procédures d’estimation et de tests dans les modèles spatiaux nécessitent des matrices de poids exogènes. En conséquence, les indicateurs socioéconomiques doivent être choisis de telle sorte que leur exogénéité par rapport aux variables explicatives du modèle soit assurée, sinon, l’endogénéité des poids doit être considérée explicitement dans la spécification du modèle.

Les processus autoregressifs spatiaux – SAR : Il s’agit de la spécification la plus antérieure considérée pour un processus spatial proposée par Whittle [1954] et reprise par Anselin [2006]. Selon ce dernier, il s’agit d’une spécification uniquement applicable dans le cas où les données seraient dans un espace réticulé rectangulaire (regular rectangular lattice). La partie droite de l’équation contient une somme des poids des voisins du Nord, Sud, Est et Ouset du treillis, avec chacun un paramétre assigné séparemment.

En notant le terme d’erreurε, l et c pour les lignes et les colonnes de l’espace réticulé, le modèle s’écrit de la manière suivante :

εr,c = ξ1εr−1,c + ξ2εr+1,c + ξ3εr,c−1 + ξ4εr,c+1 + ur,c (1.10) avec ξk,k = 1, . . . , 4, un paramétre autoregressif spatial et u un terme d’erreur idiosyncratique.

Généralement ce type de spécification n’est pas applicable en raison de sa configu- ration spéciale, les treillis sont souvent irréguliers (cas d’une coupe transversale de pays ou de villes agglomérées). En effet, le nombre de voisins varie pour chaque observation ce qui enlève le sens du concept de déplacement spatial (spatial shift). Une matrice de poids est donc utilisée :

εi = λ Σ wijεj (1.11)

avec λ un paramètre autoregressif. Si on considère le vecteur de termes d’erreur de taille n × 1, on aura :

et si :

ε = λWε + u (1.12)

ε = (IλW)−1u (1.13)

la matrice de variance-covariance des erreurs s’écrit :

E[εε𝘫] = (IλW)−1 × E[uu𝘫] × (IλW𝘫)−1 (1.14)

Sous l’hypothèse standard selon laquelle les erreurs u sont iid,

E[uu𝘫] = σ2I (1.15)

en combinant [1.14] et [1.15], on obtient :

E[εε𝘫] = σ2(IλW)−1(IλW𝘫)−1 (1.16)

Dans un cas général, si les erreurs sont hétéroscédastiques :

E[uu𝘫] = σ2Ω (1.17)

Alors, [1.14] et [1.17] donnent :

E[εε𝘫] = σ2(IλW)−1Ω(IλW𝘫)−1 (1.18)

En pratique, la matrice W n’est pas généralement symétrique après standardisation d’où (IλW)−1 (IλW𝘫)−1. Afin d’obtenir une meilleure compréhension de la structure de la matrice de covariance induite par ce processus, considérons le cas où W correspond à la une matrice standardisée d’ordre de contiguïté 1. Dès lors, pour |λ| < 1on a :

(IλW)−1 = I + λW + λ2W2 + λ3W3 + . . . , (1.19)

la même expression peut être obtenue pour W𝘫. Le produit des deux inverses donne une somme des produits croisés :

I + λ(W + W𝘫) + λ2(WW + WW𝘫 + W𝘫W𝘫) + λ3(WWW + WWW𝘫 + WW𝘫W𝘫) + . . . (1.20)

Comparativement, la covariance qui en résulte est très différente de ce qu’on obtient en présence d’un processus autoregressif temporel de premier ordre. Par ailleurs, une similarité est à souligner : la covariance diminue quand l’ordre de contiguïté augmente. Aussi, il est important de noter que même si W dans un processus SAR ne peut por- ter que pour les voisins du premier ordre, le résultant de covariance spatiale va bien au-delà de ces dernier et on parlera alors d’une autocorrélation spatiale globale.

Plus important encore, lorsque le nombre de voisins (les éléments non nuls de W ) à travers les localisations n’est pas constant (le cas typique dans la pratique), les éléments de la diagonale de [1.20] ne sont plus constants, induisant un problème d’hétéroscédasticité. Cette hétéroscédasticité est présente même quand les termes u sont iid, ce qui complique considérablement l’estimation et tests de spécification.

Les processus moyenne mobile spatiale – SMA : Couramment utilisé pour mo- déliser la structure d’une autocorrélation spatiale, un second type de processus sto- chastique spatial est basé sur l’introduction d’une moyenne mobile. Formellement, le processus moyenne mobile est spécifié de la façon suivante :

εi = γ Σ uj + ui, (1.21)

avec γ le paramètre de la moyenne mobile et avec u est un terme d’erreur homoscé- dastique. L’expression correspondante du terme d’erreur aléatoire en écriture matricielle est telle que :

ε = γWu + u. (1.22)

Contrairement au modèle précédent, le modèle réduit ne contient pas de matrices inverses puisque [1.22] correspond déjà au modèle réduit. Ainsi, la matrice des variances- covariances qui résulte de ce processus est la suivante :

E(εε𝘫) = σ2(I + γW)(I + γW𝘫) = σ2[I + γ(W + W𝘫) + γ2WW𝘫] (1.23)

Contrairement à la matrice des variances-covariances associée au processus autoré- gressif, [1.23] n’est pas une matrice pleine. Les covariances non nulles n’existent que pour les voisins de premier ordre (W + W𝘫) et les voisins de second ordre (WW𝘫). Ce processus implique donc une interaction moins forte par rapport au processus autoré- gressif. Contrairement au modèle précédent, la structure spatiale de covariance induite par le modèle [1.22] n’est alors que locale, puisqu’elle ne relie pas toutes les localisations du système à toutes les autres [Anselin, 2001c].

Enfin, sauf cas particulier, les éléments de la diagonale de [1.23] ne sont pas constants, ce qui provoque, comme dans le modèle précédent, une hétéroscédasticité induite dans ε, quelle que soit la nature de u.

La représentation directe:

Dans le cadre de la représentation directe, la covariance entre chaque paire d’obser- vation ou de terme d’erreur est spécifiée à travers une fonction inverse de la distance qui les sépare. La forme générale est la suivante :

E(εiεj) = σ2f (dij, φ) (1.24)

avec ε les termes d’erruer, σ2 la variance des termes d’erreur, dij la distance séparant i de j et f une fonction de la distance (decay distance function). Pour une matrice de variance-covariance définie positive, il faut que ∂f/∂d < 0 et |f (dij, f)| ≤ 1 avec f ∈ φ un vecteur de paramètres d’un sous-ensemble de φ de Rp de taille p × 1. Selon Anselin[1999], cette approche s’inspire essentiellement de la géostatistique et exige un ensemble d’hypothèses de stationnarité.

La matrice de variance-covariance s’écrit de la manière suivante :

E(εiεj) = σ2Ω(dij, φ) (1.25)

Il est à noter que, contrairement aux spécifications SAR et SMA, l’autocorréla- tion spatiale dans ce modèle n’induit pas d’hétéroscédasticité, puisque les termes de la diagonale de W sont constants.

Le choix de la fonction f de distance n’est pas arbitraire et la nécéssité d’obtenir une matrice de variance-covariance définie positive impose des contraintes sur la forme fonctionnelle et le paramètre de l’espace, ainsi que sur l’ampleur et l’échelle utilisé pour la mesure de distance. La modélisation de l’autocorrélation globale (ou locale) dépend de la pente de la fonction de distance.

Une spécification, couramment utilisé notamment dans Anselin[2001a], est basée sur une distance exponentielle négative :

E[εε𝘫] = σ2[I + γΨ] (1.26)

avec comme conditions sur les éléments de Ψ : Ψij = exp−φdij si ij et 0 sinon. γ est un paramètre d’étalonnage non-nul. Les restrictions permettent de simplifier les interprétations et les tests de spécification car la variance est capturée par le terme σ2I.

Les modèles à erreurs composées:

Dans les modèles de données de panel, il est coutumier de considérer qu’il existe un terme d’erreur caché, partagé par toutes les observations transversales à des périodes différentes.

Dans les modèles en coupe transversale, cette approche pourrait être inadéquate. Cependant, des concepts alternatifs sont applicables dont selui proposé par Kelejian et Ronbinson [1995]. Une décomposition erreur est proposée combinant une composante de localisation spécifique (ou locale) avec une composante régionale (ou débordement). Formellement, le terme d’erreur est le suivant :

ε = Wu + v (1.27)

u et v sont supposées être des erreurs homoscédastiques et indépendantes, u un vecteur de taille n × 1 capturant les effets de la localisation régionale défini à travers une matrice de poids W, v captuant les nuisances locales. u et v sont supposées être des erreurs homoscédastiques et indépendantes de telle sorte que pour ∀i, j, on a :

E(u) = E(v) = 0

E(uu𝘫) = σ2I E(vv𝘫) = σ2I

u

v

E(uivi) = 0

Dans ces conditions, la matrice de variances-covariances de ε est alors :

E(εε𝘫) = σ2I + σ2WW𝘫 = σ2(I + ϕWW𝘫) (1.28)

v u

σ2 et σ2 sont les variances respectivement associées à u et v, σ2 = σ2 > 0 et

v u v

ϕ = σ22 .

u v

Cette spécification particulière est un modèle d’intéraction spatial locale comme l’at- teste une comparaison entre [1.28] et les termes de la moyenne mobile dans [1.23]. L’interaction spatiale qu’inplique [1.28] est plus limitée que dans [1.27] car elle ne concerne que les voisins de premier et de second ordre contenus dans les éléments non nuls de WW𝘫 et ceci sans qu’il y ait de décroissance par rapport à l’ordre de proximité [Anselin et Bera, 1998].

Rechercher
Télécharger ce mémoire en ligne PDF (gratuit)

Laisser un commentaire

Votre adresse courriel ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Scroll to Top