Les modèles de décalage spatial :
Le modèle de décalage spatial est utilisé lorsqu’on suppose que le phénomène à analyser est influencé directement par le voisinage immédiat. Les modèles de décalage spatial contiennent au moins l’un des termes Wy ou WX dans la partie droite de l’équation conduisant ainsi aux effets de multiplicateur spatial.
Le modèle autoregressif spatial : variable endogène décalée
La première façon de prendre en compte l’autocorrélation spatiale peut se faire grâce au modèle autorégressif spatial au moyen d’une « variable endogène décalée » comme dans l’équation [1.2] :
y = ρWy + Xβ + ε (1.29)
Wy est la variable endogène décalée pour la matrice de poids W, ρ est le paramètre spatial autorégressif indiquant l’intensité de l’interaction existant entre les observations de y.
Dans ce modèle, l’observation yi est partiellement expliquée à travers les valeurs prises par y dans les régions voisines (Wy)i = Σi=/ j wijyj. En effet, (Wy)i s’interprète comme la moyenne des valeurs de y sur les observations voisines à i lorsque W est standardisée. Cette standardisation facilite aussi la comparaison de l’ampleur de ρ lorsque [1.29] est estimé pour plusieurs matrices de poids. L’introduction de Wy est un moyen d’apprécier le degré de dépendance spatiale alors que les autres variables sont contrôlées. Symétriquement, il permet de contrôler la dépendance spatiale pour évaluer l’impact des autres variables explicatives.
Filtrage spatial de la variable dépendante : Le modèle [1.29] peut être réécrit de la façon suivante :
(I − ρW)y = Xβ + ε (1.30)
Dans ce modèle : y∗ = (I − ρW)y s’interprète comme la variable dépendante « filtrée », dans laquelle les effets de l’autocorrélation spatiale ont été éliminés.
Effets de multiplicateur et de diffusion : Supposons la matrice (I − ρW) non-singulière. Ceci est vrai lorsque ρ est différent de 0 et lorsque l’inverse de r n’est pas une valeur propre de W. En effet, (I − ρW)−1 existe si et seulement si |I − ρW| = 0. Cette condition est équivalente à |ρ| × |W − (1/ρ)I| = 0 ou |ρ| = 0 et |W − (1/ρ)I| = 0.
Dans ce cas [1.30] devient :
y = (I − ρW)−1Xβ + (I − ρW)−1ε (1.31)
La matrice inverse (I − ρW)−1 est une matrice pleine qui, lorsque wij < 1 et |ρ| < 1, implique une série infinie pour les variables explicatives et pour le terme d’erreur associé à toutes les localisations :
y = (I + ρW + ρ2W2 + ρ3W3 + . . .)Xβ + (I + ρW + ρ2W2 + ρ3W3 + . . .)ε (1.32)
L’expression [1.32] permet de dégager deux types d’effets : un effet de multiplicateur spatial affectant les variables explicatives et un effet de diffusion spatiale affectant les erreurs.
Concernant les variables explicatives, cette expression signifie qu’en moyenne la valeur de y dans une région i n’est pas seulement expliquée par les valeurs des variables explicatives associées à cette région, mais aussi par celles associées à toutes les régions (voisines de i ou non) à travers la transformation spatiale inverse (I − ρW)−1. Cet effet de multiplicateur spatial décline avec l’éloignement de i par rapport à j.
Concernant le processus des erreurs, cette expression peut être traduite comme étant un choc aléatoire dans une région i qui affecte non seulement la valeur de y de cette région, mais a également un impact sur les valeurs de y dans les autres régions à travers la même transformation spatiale inverse. C’est l’effet de diffusion, effet qui décline aussi avec l’éloignement.
Comparaison : Le modèle [1.31] est non-linéaire en ρ et β avec un terme d’erreur suivant un processus SAR. Il en résulte que la matrice de variance-covariance est la même que [1.16]. Il est serait intéressant d’examiner la similitude entre le modèle de décalage spatial et le modèle de régression linéaire avec une erreur SAR. Après insertion de l’équation d’erreur [1.15] dans la spécification de régression linéaire usuelle
y = Xβ + ε (1.33)
on obtient :
y = Xβ + (I − λW)−1u (1.34)
en multipliant par (I − λW), on a :
y = λWy + Xβ − λWXβ + u (1.35)
Cette spécification est désignée dans Anselin [1988b] comme étant un modèle Durbin spatial, par analogie aux séries temporelles, ou un modèle à facteur commun spatial (respectivement Spatial Durbin model et spatial common factor model).
En comparant [1.29] et [1.34], on peut remarquer que le modèle d’autocorrélation des erreurs est un cas particulier du modèle de décalage spatial avec des contraintes nonlinéaires additionnelles sur les paramètres qui peuvent s’illustrer par les contraintes de facteur commun. Parallèlement, une comparaison entre [1.31] et [1.33] montre que le modèle de décalage spatial est un cas particulier du modèle de autocorrélation des erreurs.
Il est à noter que les deux spécifications ne sont pas imbriquées. Supposer que λ ou ρ sont nuls ramène à une équation de regression linéaire ordinaire et ne renvoie pas à une équation de modèle spatial. Il en résulte que, malgré les similitudes entre les deux spécifications, des problèmes d’identification, d’estimation et de validation peuvent émerger (Kelejian et Prucha [1997]).
Le modèle régressif croisé : variable exogène décalée
Une autre façon de traiter l’interdépendance des observations est d’inclure une ou plusieurs « variables exogènes décalées» dans [1.32] :
y = Xβ + WZδ + ε (1.36)
Z est une matrice de dimension (n, l) contenant les l variables correspondant ou non aux variables incluses dans X, WZ est l’ensemble des variables exogènes décalées pour la matrice de poids W et δ est le vecteur (l, 1) de paramètres spatiaux indiquant l’intensité de la corrélation spatiale existant entre les observations de y et celles de Z. Ainsi, dans ce modèle, l’observation yi est expliquée par les valeurs prises par les variables de X dans la région i et par les variables de Z dans les régions voisines. Par exemple, cette spécification permet d’estimer les effets de débordement géographique liés aux migrations et aux infrastructures publiques : la production d’une région peut être influencée par la disponibilité du travail ou le montant du capital public dans les régions voisines.
Généralisation :
Jusqu’à présent, les modèles présentés n’incluent qu’un seul type de dépendance spatiale et qu’un seul ordre de dépendance : soit à travers une variable endogène décalée ou via l’autocorrélation des erreurs. Différents auteurs suggèrent des processus beaucoup plus généraux, comportant à la fois une variable autorégressive et une autocorrélation des erreurs.
Les Modèles d’ordres élevés : L’approche présentée dans Anselin [2006] caractérise ces processus comme étant des modèles d’ordre élevé « Higher Order Models » dont la forme générale est la suivante :
y = ρpW1y + ρpW2y + ··· + ρpWpy + Xβ + ε (1.37)
avec Wi,i = 1…p des poids spatiaux associés. En général, les différentes matrices de poids sont associées au ie`me ordre de contiguïté.
Contrairement aux modèles de série temporelle, une attention particulière est de mise afin d’éviter des problèmes de duplication et de simultanéité dans les modèles d’ordre élevés. Ainsi, il est admis que les poids spatiaux ne se chevauchent pas pour garantir l’identification et l’estimation correcte des paramètres. Cette condition se traduit par :
(wr) × (ws) = 0 (1.38)
i∗
i∗
avec wi∗ la iie`me ligne de la matrice de poids, r et s deux ordres de contiguïté quelconques.
Afin d’illustrer ces problèmes, on considère une spécification biparamétrique simple :
y = ρ1W1y + ρ2W2y + Xβ + ε (1.39)
avec W1 = W11 + W0,W2 = W22 + W0 et W0 une matrice de poids renfermant les éléments communs à W1 et W2. En prenant en compte le chevauchement, il s’en suit que :
y = ρ1W11y + ρ2W22y + (ρ1 + ρ2)W0y + Xβ + ε (1.40)
L’équation [1.40] montre que des problèmes d’identification et d’interprétation potentiels lorsque les contraintes induites par les paramètres ne sont pas satisfaites.
La forme SARMA(p, q) : La forme la plus générale est celle proposée par Huang[1984] comprenant à la fois des variables spatiales endogènes décalées d’ordres élevés et des moyennes mobiles spatiales baptisée forme autorégressive moyenne mobile (Spatial AutoRegressive Moving Average). Ce modèle noté SARMA(p,q) prend la forme de l’équation [1.37] pour la partie autoregressive spatiale et le terme d’erreur suit le processus suivant :
ε = λ1W1u + λ2W2u + . . . + λqWqu + u (1.41)
Selon Anselin[2001a], le plein ordre p et q n’a pas d’application et indroduit une spécification SARMA(1, 1) sollicitée communément comme alternative dans des tests de spécification.
La forme SARMA(1, 1) : Formellement, le modèle s’exprime comme une combinaison de [1.29] et de [1.12], avec des poids différents :
ce qui donne :
y = ρW1y + Xβ + ε
ε = λW2ε + u
(1.42)
y = (I − ρW1)−1Xβ + (I − ρW1)−1(I − λW2)−1u (1.43)
L’expression [1.41] représente la forme structurelle alors que [1.42] la forme réduite.
Le premier terme multiplié par λW2 donne :
λW2y = ρλW2W1y + λW2Xβ + λW2ε (1.44) En retranchant [1.44] de [1.42], on obtient le résultat suivant :
y = ρW1y + λW2y − ρλW2W1y + Xβ − λW2Xβ + u (1.45) En sachant que les poids ne se chevauchent pas W2W1 = 0, on a :
y = ρW1y + λW2y + Xβ − λW2Xβ + u (1.46)
Néanmoins, en pratique les mêmes matrices sont utilisées à la fois dans la partie décalée et la partie moyenne mobile W1 = W2, [1.44] se réécrit de la manière suivante :
y = (ρ + λ)Wy − ρλW2y + Xβ − λWXβ + u (1.47)
Dans le modèle [1.37], le paramètre ρ est suridentifié. Toutefois, le modèle SARMA (1,1) ne souffre pas de ce problème. Pratiquement, ce problème d’identification n’est pas d’une très grande portée car, en général, on retient rarement un modèle avec les deux types d’effets spatiaux. On cherche plutôt à modéliser la dépendance spatiale, soit par l’autocorrélation des erreurs, soit par une variable spatiale autorégressive, et non les deux. Anselin et Bera [1998] considèrent d’ailleurs ces processus d’ordre supérieur comme le résultat d’une matrice de poids mal spécifiée et non de processus générateurs des données réalistes. Par exemple, si la matrice de poids du modèle autorégressif sous- estime la vraie interaction spatiale dans les données, il y aura une autocorrélation spatiale résiduelle des erreurs. Cela peut mener à estimer un processus d’ordre supérieur alors que seule une matrice de poids bien spécifiée serait nécessaire.
Les modèles présentés dans cette section intègrent l’autocorrélation spatiale et permettent ainsi de modéliser les effets de débordement géographiques. Cependant, sur le plan économétrique, cette introduction a pour conséquence de rendre la méthode des MCO inadaptée. D’autres méthodes d’estimation ont été élaborées et seront présentées dans la section suivante.