Les développements récents de l’économétrie spatiale

Pour citer ce mémoire et accéder à toutes ses pages

Les développements récents en économétrie spatiale sont analysés à travers une revue de la littérature, mettant en lumière les caractéristiques clés du domaine. L’article illustre ces concepts par une application empirique sur les déterminants du chômage en Tunisie, enrichissant ainsi la compréhension des interactions spatiales.


Chapitre 1 : Les Développements Récents De La Littérature

8

Introduction

En 1979, une vue d’ensemble a été présentée dans le livre « Spatial Econometrics » par Paelinck et Klassen. Ils y ont souligné cinq caractéristiques importantes du domaine : le rôle de la dépendance spatiale, l’asymétrie dans les relations spatiales, l’importance des facteurs explicatifs dans les autres espaces, la différenciation entre interaction ex post et ex ante ainsi que la modélisation explicite de l’espace.

Dans Anselin [1988b], les intuitions de Paelink et Klassen ont été élaborées et situées afin d’épouser l’estimation économétrique et les tests de spécification. Néanmoins, il faut noter qu’initialement, les développements et l’application de l’économétrie spatiale étaient largement confinés aux domaines appliqués de l’économie (l’économie urbaine et régionale, l’économie de l’environnement, les marchés de l’immobilier), les sciences régionales et la géographie quantitative (Cliff et Ord ,1973 ; Anselin ,1988b).

L’intérêt pour la modélisation spatiale en économie a considérablement augmenté sous l’impulsion des développements théoriques (l’interaction spatiale et sociale) et ceux de la technologie (systèmes d’information géographique). Cette attention s’illustre par le nombre important de travaux théoriques et empiriques parus au cours de la dernière décennie englobant la spécification, l’estimation et les tests de spécification.

En effet, la spécification proposée par Kelejian et Prucha [2004] est une extension du modèle largement utilisé de Cliff et Ord [1973] pour élaborer un système d’équations simultanées spatialement corrélées incorporant des lags spatiaux au niveau des variables endogènes et exogènes. Dans Andrews [2005], les propriétés des estimateurs des moindres carrés sont analysées dans le cadre d’une spécification en coupe transversale avec chocs communs de nature locale.

LeSage et Pace [2007] introduit la matrice exponentielle comme manière de modéliser des données spatialement dépendantes simplifiant ainsi l’analyse, l’interprétation et l’implémentation. D’autre part, Anselin et Garcia [2008] examine un éventail de spécifications du modèle hédonique spatial du marché de l’immobilier afin d’évaluer l’effet de la pollution sur les prix. Cette comparaison a permis de souligner que les modèles prenant en compte à la fois l’autocorrélation spatiale et l’hétérogénéité présentent les meilleures estimations.

Kelejian et Prucha [2010] vont dans ce sens, en développant une méthodologie d’inférence pour la spécification et l’estimation d’un modèle spatial autorégressif avec autocorrélation et hétéroscédasticité des termes d’erreur. Précédemment, le travail de Kelejian et Prucha [1999] s’est articulé autour de la méthode des moments généralisés dans l’estimation du paramètre autorégressif d’un modèle spatial autorégressif au lieu de la méthode du maximum de vraisemblance pour des motifs d’implémentation et de violation d’hypothèse sur la distribution des erreurs. Dans Kelejian et Prucha [2004 ; 2010], la méthode des moments généralisés est respectivement employée, dans le cadre d’un système d’équations simultanées, et utilisée conjointement avec des estimateurs des variables instrumentales, reprenant ainsi les travaux effectués dans Lee [2007] sur la méthode des moments généralisés et la méthode des doubles moindres carrés.

Parallèlement, une panoplie de test a été élaborée afin de détecter l’autocorrélation spatiale des erreurs (Baltagi & al. ,2003), l’autocorrélation sérielle et les effets aléatoires dans le cadre des données de panel (Baltagi & al. ,2007) et l’indépendance des variables en se basant sur le test de Moran (Kelejian et Prucha ,2001). Des solution d’implémentation informatique tels que SpaceStat (Anselin, 1999), le module S+SpatialStat pour SPlus (Mathsoft, 1996) ou la librairie pour Matlab (LeSage, 1999a ; LeSage et Pace, 2007), proposent l’estimation des principaux modèles spatiaux.

L’objectif de ce chapitre est de présenter les outils nécessaires à une démarche économétrique visant à prendre en compte les effets d’autocorrélation spatiale. Notre présentation est organisée de la façon suivante : une section première fournit les motivations théoriques derrière l’appel à l’économétrie spatiale, une deuxième section traitant les deux principales manières de spécifier les modèles spatiaux et une troisième section vouée à l’estimation suivie d’une quatrième réservée aux tests de validation.

1.1 Les motivations théoriques de la dimension spatiale

L’évolution du prix d’un bien immobilier en fonction des prix des biens voisins, l’impact du taux de chômage dans un pays sur celui des pays à proximité ou encore la décision d’un chef d’entreprise vis à vis des décisions de ses concurrents sont des applications potentielles des méthodes de l’économétrie spatiale. Face à cette éventualité, une revue des fondements théoriques permet de justifier le recourt aux modèles économétriques spatiaux s’ils s’avèrent appropriés dans la question de recherche.

Historiquement, Hordijk and Paelinck [1976] sont entrés en contact avec des problèmes spatiaux à l’occasion d’une étude sur le développement régional d’une région belge. A cette époque, très peu de matériel statistique était disponible, ce qui impliquait qu’il fallait surtout raisonner théoriquement, la base étant la théorie du développement polarisé dont le modèle était inadéquat pour représenter proprement le fonctionnement spatial de l’économie.

A partir des travaux de L.Anselin, on rencontre deux catégories de spécifications des regressions spatiales : une catégorie permettant de capter l’effet d’hétérogénéité spatiale et une catégorie permettant la prise en compte de l’autocorrélation spatiale.

Comme point de départ, considérons le modèle de régression suivant :

yi = g (yJ, θ) + x𝘫+ ui (1.1) Où yi désigne une observation de la variable endogène dans la localisation i, i = 1, . . . , n, g = (Yj, θ) une fonction des valeurs de la variable endogène observée dans les localisations voisines j J et j i avec J l’ensemble des localisations voisines, xi un vecteur (k, 1) d’observations des variables exogènes, εi un terme d’erreur, θ et β sont des vecteurs de paramètres. La fonction g des observations de la variable endogène dans d’autres localisations est assimilée à un décalage spatial de celle-ci « spatially lagged dependent variable » ou à un terme de décalage spatial « spatial lag term » [Anselin, 1988b]. Ce terme est souvent une moyenne pondérée des valeurs voisines et les localisations spécifiées à travers une matrice de poids spatiale qui capture les relations de contiguïté.

Généralement, un modèle mixte regressif-spatial autoregressif [Anselin 1988b] prend cette forme :

y = ρWy + + ε (1.2)

avec y un vecteur des observations de la variable dépendante de taille n × 1, W une matrice des poids spatiale de taille n × n et détermine les unités voisines de la pondération, ρ un paramétre autorégressif spatial autorégressif indiquant l’intensité de l’interaction existant entre les observations de y, X une matrice des observations des variables explicatives de taille n×k , β un paramètre et ε un vecteur des termes d’erreur de taille n × 1.

Le terme g (yJ ,θ) ou Wy est placé à droite de l’équation, ceci est désigné comme étant le résultat d’équilibre des processus d’interaction spatiale et sociale. Autrement dit, l’introduction de Wy dans le modèle est un moyen d’apprécier le degré de dépendance spatiale alors que les autres variables sont contrôlées.

Le cas d’une autocorrélation spatiale des erreurs se traduit par une matrice de variance-covariance non symétrique. En effet, pour i /= j on a ;

E[eiej] = sij 0 (1.3)

et une matrice de variance-covariance E [εε𝘫] = Σ. Les éléments non-nuls de part et d’autre de la diagonale correspondent à une notion de covariance spatiale quand ils suivent un structure spatiale donnée ou une dispostion spatiale. Par conséquent, la covariance entre chaque paire d’erreurs (i /= j) est non nulle et décroissante. La dispostion spatiale est basée sur des concepts comme la contiguïté ou l’utilisation de la distance métrique. L’autocorrélation des erreurs est justifiée par les effets de voisinage ou par la présence de chocs communs étudiés dans la section 1.1.2. Un aperçu des problèmes d’identification sera présenté dans la section 1.1.3.

1.1.1 L’interaction spatiale et sociale :

Les activités économiques génèrent et attirent des mouvements qui se déploient dans l’espace. L’interaction spatiale prend en compte les mouvements dans l’espace pour constituer un cadre théorique permettant d’expliquer les flux entre entités spatiales. Les modèles économiques d’interaction spatiale et sociale ont évolué d’une conception individuelle des agents (l’atomicité) vers une conception collective. Récemment, ces modèles ont reçu une attention considérable afin d’expliquer des phénomènes sociaux comme les effets de pairs, les effets de voisinage, les retombées spatiales [Anselin et Garcia, 2008] et les effets de réseau.

Selon l’optique de Manski [2000], on pourrait distinguer trois canaux d’interaction : l’interaction de contrainte, d’anticipation et de préférence. Cette perspective implique une spécification dans laquelle les décisions des autres agents sont introduites dans la partie droite d’un modèle de décision individuelle. Brock et Durlauf [2001a] proposent une optique d’amplitude : l’interaction globale définie par le comportement général de la population et l’interaction local définie par le comportement d’un groupe de référence (voisinage).

Dans la littérature de l’économétrie spatiale, le modèle de décalage spatial est généralement séléctionné pour représenter empiriquement la solution d’équilibre d’une interaction stratégique ou d’une fonction de réaction spatiale [Brueckner 1998, 2003].

La fonction de réaction de Brueckner prend la forme suivante :

yi = D(yi, xi) (1.4)

yi est la valeur de la variable de décision pour le preneur de décision i , yi reflète une fonction des variables de décision pour les autres décideurs, xi est un vecteur de caractères exogènes de i. Si D prend une forme linéaire, la spécification de [1.4] serait comparable à [1.1] ou [1.2]. Dans Brueckner [2003], il est démontré que la fonction de réaction [1.4] peut être obtenue via deux processus d’interaction stratégiques :

  • Le débordement (spillover ) : les décisions des autres agents rentrent directement dans la décision de chaque agent individuel. En effet, s’il s’agit d’un raisonnement en terme d’utilité, on aura :

U (yi, yi; xi) (1.5)

Ce modèle peut être étendu à un agent représentatif pour une unité spatiale agrégée en l’occurence un Etat. Dans la littérature économique, ce cadre justifie le recourt à la spécification en décalage spatial dans les études de la demande de biens publics, de la concurrence par comparaison (yardstick competition) ou de l’économie de l’environnement ;

  • Le flux de ressource (ressource flow) : la décision de l’agent est indirectement influencée par celles des autres agents. La fonction d’utilité correspondante devient :

U (yi, si; xi) (1.6)

avec si la contribution de la ressource consommée dans l’utilité de l’agent. L’interaction est introduite à travers l’effet des autres agents sur la ressource. En effet, la ressource disponible de chaque agent est contrainte par les décisions des autres agents, ainsi :

si = f (yi, yi; xi) (1.7)

Selon Brueckner [2003], si on substitue [1.7] dans [1.6] on obtient la même fonction de réaction que dans [1.4], suggérant de fait une spécification en décalage spatial. Dans ces travaux, ce modèle est utilisé dans le cadre de la compétition fiscale dans le sens d’une interaction stratégique.

Le recourt à la spécification du modèle de décalage spatial découle d’un raisonnement économique. Néanmoins, le modèle en soit ne peut pas identifier le mécanisme menant vers l’état d’équilibre considéré. Les deux processus sont équivalent à l’observation et ne sont pas identifiables empiriquement. Il s’agit de l’un des problèmes d’identification associés à la spécification des modèles économétriques spatiaux.

1.1.2 Les erreurs de mesure et les chocs communs :

Contrairement aux modèles de décalage spatial inspirés des modèles économiques théoriques, les spécifications en modèle d’erreur spatiale sont formulés pour s’adapter aux problèmes des données. En d’autres termes, ce n’est pas nécessairement la nature spatiale du modèle qui cause les problèmes d’absence d’indépendence mais bien la nature transversale des données.

Dans de nombreux cas en économétrie appliquée, lors de la manipulation des données transversales, il y a une inéadéquation entre l’échelle spatiale du processus étudié (par exemple, le marché de logement ou le marché du travail) et l’unité spatiale observée (un secteur de recensement ou une délégation territoriale). En conséquence, les erreurs de mesure sont susceptibles de varier systématiquement à travers l’espace [Anselin, 1988b]. En outre, l’intégration des données (combinaison d’observations à partir de différentes échelles spatiales) et l’interpolationtion spatiale qui est facilitée par les systèmes modernes d’information géographique auront tendance à entraîner une autocorrélation spatiale [Anselin, 2001c].

Un cadre théorique pour les erreurs spatialement corrélées est fournie dans l’approche générale fondée sur les « chocs communs » définis par Andrews [2005]. Ce travail porte sur les propriétés des estimateurs dans une régression d’une variable dépendante Y (g) sur des variables explicatives X(g), où g est un échantillon spatial pris d’un espace topologique quelconque G.

Y et X font partie d’un vecteur aléatoire W (g) = (Y (g), X(g), S(g)) qui contient les conditions observées et latentes S(g) communes aux unités de la population. Les chocs communs sont définis comme des variables aléatoires C(g) mesurable sur une champ σ de telle sorte que, conditionnellement à ce champs, un échantillon spatial Wi : i = 1, … est i.i.d. Ce cadre général comprend un large éventail de formes de corrélation spatiale, ainsi que des effets de groupe et des facteurs de structure. Ces derniers sont de plus en plus utilisés dans les modèles récemment formulés pour faire face aux formes générales de corrélation transversale dues aux chocs communs.

1.1.3 Les problèmes d’identification :

Le degré de simultanéité et d’endogénéité inhérent à l’autocorrélation spatiale crée un certain nombre de problèmes d’indentification. Selon Anselin et Bera [1998], la présence d’autocorrélation spatiale est largement liée à la nature bidimensionnelle des données spatiales ou à référence géographique, et au caractère multidirectionnel des relations dans l’espace (par opposition à l’axe unidirectionnel du temps). Ainsi, deux unités différentes peuvent être corrélées en raison de leur position géographique, et ce phénomène peut intervenir dans toutes les directions.

D’un point de vue formel, la présence d’autocorrélation spatiale entre deux localisations i et j quelconques s’exprime par une covariance non nulle des valeurs prises par la variable d’intérêt en ces deux localisations. On a ainsi pour i /= j :

Cov(yiyj) = E(yiyj) − E(yi)E(yj) 0 (1.8)

où yi et yj représentent les valeurs de la variable d’intérêt, respectivement en i et j. La non nullité de la covariance remet en question une hypothèse centrale du principe des moindres carrés ordinaires, à savoir la sphéricité des erreurs. Il s’ensuit qu’en présence d’autocorrélation spatiale des erreurs, les estimateurs des MCO se révèlent inefficients selon la structure des interactions spatiale existantes entre les différentes localisations.

Cependant, du point de vue de l’estimation, il se pose un problème d’identification dans la mesure où les n observations disponibles de l’échantillon ne permettent pas d’estimer les n variances individuelles et les n(n − 1)/2 covariances inter–individuelles. Dès lors, l’économétrie spatiale offre des outils tels que les matrices de poids spatiaux et les variables spatiales décalées qui permettent de prendre en compte ce type de problèmes.

De fait, dans l’approche retenue par l’économétrie spatiale, cette structure repose sur la définition en amont d’un processus rendant compte de la distribution des unités spatiales, et qui conditionne subséquemment la forme fonctionnelle des covariances inter–individuelles. Il en est autrement dans le cadre de la géostatistique où la structure des covariances est imposée a priori.

1.1.4 La dépendance au temps :

Par opposition aux séries temporelles, où le practicien est contraint d’attendre que les données soient « nées » [Lauridsen(2006] l’une après l’autre pendant un certain nombre de périodes, la disponibilité des données spatiales, relativement facilitée avec les progrès en systèmes d’information géographique, oriente de plus en plus à une large application des méthodes de l’économétrie spatiale.

Rechercher
Télécharger ce mémoire en ligne PDF (gratuit)

Laisser un commentaire

Votre adresse courriel ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Scroll to Top