Analyse des déterminants du chômage en Tunisie par économétrie

Pour citer ce mémoire et accéder à toutes ses pages

L’analyse des déterminants du chômage est réalisée à travers une approche économétrique spatiale, intégrant des variables socio-économiques et d’infrastructure en Tunisie. Cet article présente des développements récents de la littérature et une application empirique utilisant diverses méthodes d’estimation.


Analyse Multivariée :

Traitement économétrique standard :

A la lumière des résultats discutés précédemment, notre démarche est d’appliquer un examen économétrique du lien entre le chômage et les variables socio-écnomiques et d’infrastructure pour l’échantillon envisagé.

Différentes méthodes d’estimation sont appliquées. Pour vérifier l’existence et la nature de ce lien, nous envisageons d’utiliser une estimation en coupe transversale. En premier lieu nous mettons en application la méthode MCO au modèle sous forme d’une seule équation dans le but de vérifier l’existence d’une causalité directe. Etant

donné les biais possibles liés à l’effet taille, cette estimation n’est pas la seule à retenir. Ainsi, nous envisageons d’appliquer la méthode des moindres carrés pondérés dans un deuxième temps.

Moindres Carrés Ordinaires :

Tél qu’indiqué, nous avons estimé le modèle a-spatial (2.1) à l’aide des données portant sur la totalité de la population (262 délégations) moyennant la méthode des moindres carrés ordinaires. Nous avons utilisé les données sur le nombre d’entreprises par délégation, le taux de raccordement au réseau d’assainissement et la distance du centre d’activité.

Le modèle estimé est le suivant :

chi = α(ets)i + β(D)i + γ(tASS)i + εi (2.6)

Les résultats obtenus avec cette régression présentés dans le tableau (2.4) indiquent des liens positifs fortement significatifs entre le taux de chômage d’une part, la distance séparant du centre administratif et le taux de raccordement au réseau d’assainissement d’autre part. Par ailleurs, il est à remarquer que le coefficient estimé relatif est fortement significatif et négatif conformément au signe prédit. Ce modèle a-spatial capte 21% de la variabilité du taux de chômage.

Tableau 2.4: Estimation par MCO
ParamètreValeur
ch
ets−0.137 ∗∗∗ (0.0233)
D0.0454∗ (0.0209)
tASS0.0649 ∗∗∗ (0.0190)
const2.886 ∗∗∗ (0.154)
N262
R²0.201
R2 ajusté0.192
F21.61
Ecarts-type entre parenthèses
+p < 0.1 ∗p < 0.05 ∗∗ p < 0.01 ∗∗∗p < 0.001

Moindres Carrés Pondérés :

Afin d’éliminer l’effet taille qui pourrait se manifester éventuellement par une hétéroscédasticité des termes d’erreur, nous procédons dans ce qui suit à une régression moyennant les moindres carrés pondérés. Les résultats présentés dans le tableau (2.5) montrent que le recours à cette méthode a permis de diminuer l’influence du nombre d’entreprises et du taux de raccordement au réseau d’assainissement de même que l’impact de la distance sur le taux de chômage. Les signes des coefficients estimés sont restés inchangés. Toutefois, les coefficients relatifs aux variables D et tASS ne sont pas significatifs. Le pouvoir explicatif du modèle est de 24%. Ceci s’explique par la valeur désormais prise par la constance du modèle passant de 2.886 à 3.089.

Tableau 2.5: Estimation MCP
ParamètreValeur
ch
ets−0.138 ∗∗∗ (0.0210)
D0.00254 (0.0164)
tASS0.0424 (0.0286)
const3.089 ∗∗∗ (0.182)
N262
R²0.240
R2 ajusté0.231
F27.15
Ecarts-type entre parenthèses
+p < 0.1 ∗p < 0.05 ∗∗ p < 0.01 ∗∗∗p < 0.001

Traitement économétrique spatial :

L’estimation traditionnelle des modèles en coupe transversale par la méthode des Moindres Carrés Ordinaires (MCO) ne tient pas compte de la dimension spatiale des données et donc de la présence éventuelle d’autocorrélation spatiale dans la distribution du taux de chômage. L’autocorrélation spatiale se définit par l’absence d’indépendance entre les observations géographiques : la valeur constatée d’une variable aléatoire en un point donné de l’espace dépend de la valeur observée de cette variable aléatoire en d’autres points de cet espace. Elle indique par exemple que le nombre de chômeurs d’une délégation peut dépendre du nombre d’entreprise observé de son voisinage. Si l’autocorrélation spatiale n’est pas prise en compte, elle peut à la fois générer une mauvaise estimation des coefficients et de leur significativité, mais aussi des erreurs d’interprétation dans les diagnostics standards de régression (Anselin, 1988). Deux grandes méthodes existent pour incorporer l’autocorrélation spatiale : intégrer un processus autorégressif sur les erreurs (spatial error model, SEM) ou une variable endogène autorégressive dans le modèle (spatial lag model, LAG).

Régressions spatiales :

Avec nos données, nous choisissons de définir la structure spatiale avec la méthode de l’inverse des distances et en identifiant les délégations situées dans un périmètre à moins de 250 kilomètres de la délégation de référence. Au delà de cette distance, les délégations seront considérées comme étant indépendantes. Les résultats du test I de Moran à partir des résidus du modèle (2.1) estimé par les MCO sont présentés dans le tableau (2.6) ci-dessous :

Tableau 2.6: Test de Moran
ParamètreValeur
I de Moran0.195
Espérance-0.004
Variance0.018
z11.328
P-value0.000

L’indice de Moran obtenu est une mesure de l’autocorrélation spatiale caractérisée par une corrélation entre les mesures géographiquement voisines du taux de chômage dans les délégations tunisiennes. La valeur positive (0.195) de l’indice indique une autocorrélation spatiale globale positive ainsi l’hypothèse nulle d’absence d’autocorrélation spatiale est rejetée sans ambiguité. Il apparaît donc que le modèle considéré jusqu’à présent est spatialement corrélé. Il faut maintenant estimer le modèle en tenant compte de ce problème.

Afin de pouvoir éventuellement choisir entre un modèle SEM et LAG, nous calculons les statistiques de tests ML, dont les valeurs sont présentées dans le tableau suivant :

Tableau 2.7: Choix de la spécification
TestStatistiqueP-value
MLλ72.6950.000
MLρ17.9820.00
RMLλ67.3690.000
RMLρ12.6560.000

Sur la base des tests MLλ et MLρ, l’absence d’autocorrélation spatiale est rejetée, mais il n’est pas évident de sélectionner un modèle plutôt qu’un autre. L’emploi des tests robustes RMLλ et RMLρ permet d’en dire plus. La statistique de test RMLλ conduit à rejeter l’hypothèse nulle : en présence ou non de retard de la variable endogène, la présence d’autocorrélation spatiale dans le terme d’erreur est significative. D’un autre côté, la statistique RMLλ conduit à rejeter l’hypothèse nulle : en présence ou non d’un terme d’erreur spatialement dépendant, la présence d’un retard de la variable endogène est significative également. Ces résultats nous conduisent à sélectionner le modèle SEM dans la suite.

La sélection du modèle SEM dans notre contexte n’est pas surprenante. Le modèle SEM est en effet beaucoup plus vraisemblable que le modèle LAG car le fait que des variables explicatives ayant une structure spatiale soient non disponibles et donc, incorporées dans le terme d’erreur, est quasiment une évidence. En revanche, le modèle LAG suppose que le taux de chômage est influencé directement par les taux des délégations voisines.

Néanmoins, nous présenterons dans ce qui suit des estimations par la méthode du maximum de vraissemblance des deux modèles SEM et LAG afin de pouvoir comparer les résultats avec l’estimation par les MCO.

Estimation par le maximum de vraisemblance :

Initialement, nous avons eu recours au service Refine© de Google afin de déterminer les latitudes et les longitudes en utilisant des requêtes formulées en language Json. Ces coordonnées auront permis par la suite de construire la matrice des poids basée sur l’inverse des distances séparant les centroides des délégation. Nous modélisions la matrice des poids de la manière suivante :

wij = d−β si dij < d¯

0 sinon

avec α et β sont des paramètres déterminés automatiquement par la commande spatwmat, d = 250 est la valeur seuil au-delà de laquelle on suppose que les régions i et j ne sont pas connectées.

Les résultats de l’estimation du modèle LAG :

chi = ρWchi + αets + βD + γtASS + εi (2.7)

et SEM,

chi = αets + βD + γtASS + εi (2.8)

εi = λWεi + ui

avec la fonction spatreg de la librairie sg162 du logiciel Stata12®, sont présentés dans le tableau (2.8) :

Tableau 2.8: Estimation du modèle SEM par MV
ParamètreValeur
ch
ets−0.126 ∗∗∗ (0.0226)
D0.115 ∗∗∗ (0.0266)
tASS0.0481∗ (0.0188)
const2.462 ∗∗∗ (0.182)
λ0.000285 ∗∗∗ (0.0000711)
σ0.364 ∗∗∗ (0.0159)
N262
squared corr.0.247
Ecarts-type entre parenthèses
+p < 0.1 ∗p < 0.05 ∗∗ p < 0.01 ∗∗∗p < 0.001

Le coefficient qui évalue l’influence du nombre d’entreprises sur le taux de chômage sont sensiblement différents dans le modèle linéaire a-spatial avec des erreurs i.i.d. (MCO : -0.137, MCP : -0.138) et dans le modèle spatial (-0.126). Si l’on suspecte que des variables économiques et institutionnelles sont omises dans le modèle initial, un tel résultat n’est pas surprenant. En effet, l’omission de certaines variables dans le modèle a notamment pour conséquences de :

  • générer un biais sur les coefficients des variables corrélées avec les variables omises,
  • ne pas générer de biais pour les variables indépendantes avec les variables omises.

Les variables économqiues et d’institutions sont susceptibles d’être fortement corrélées aux coordonnées géographiques. Ce qui suggère que le coefficient de la variable ets du modèle log-linéaire, estimé par MCO, est biaisé : il capture des effets économques autres que ceux de l’influence des entreprises sur le chômage. Dans notre cas, l’effet du nombre d’entreprises sur le taux de chômage est sur-estimé dans le modèle initial. La prise en compte de l’autocorrélation spatiale permet de mettre en évidence et de corriger une telle sur-évaluation. Le coefficient estimé de la variable D a été réévalué, rendu significatif et permet de constater que la diminution de la distance de 1% a pour effet de baisser le taux de chômage de l’ordre de 0.1 %.

Par ailleurs, l’introduction de l’autocorrélation spatiale via un processus autorégressif a permis d’accroître le pouvoir explicatif du modèle. La mesure Squared Correlation se substituant au coefficient de détermination fait passer la qualité d’ajustement de 0.192 à 0.247.

Rechercher
Télécharger ce mémoire en ligne PDF (gratuit)

Laisser un commentaire

Votre adresse courriel ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Scroll to Top