Evolution des régimes providentiels, les 20 dernières années

Chapitre 5 – Données et méthodes d’analyse

«On obtient un idéaltype en accentuant unilatéralement un ou plusieurs points de vue et en enchaînant une multitude de phénomènes donnés isolément, diffus et discrets, que l’on trouve tantôt en grand nombre, tantôt en petit nombre et par endroits pas du tout, qu’on ordonne selon les précédents points de vue choisis unilatéralement, pour former un tableau de pensée homogène (einheitlich) On ne trouvera nulle part empiriquement un pareil tableau dans sa pureté conceptuelle : il est une utopie.»

M. Weber (1965) «L’objectivité de la connaissance dans les sciences et la politique sociales». Essais sur la théorie de la science, Paris, Plon p.181

L’objet du présent mémoire est de mettre en relief l’évolution des régimes providentiels depuis les vingt dernières années et d’examiner la réarticulation possible des piliers de bien-être (l’État, le marché et la famille) qui sont au fondement de ces régimes.

Comme nous l’avons déjà évoqué, l’appréhension de la reconfiguration des régimes providentiels dans les démocraties post-industrielles pose d’emblée une double question analytique : si ces régimes connaissent une reconfiguration, d’une part, dans quel sens va-t-elle et quels sont ses principes directeurs et, d’autre part, comment les piliers de bien-être adaptent-ils et accommodent-ils leur logique historiquement construite pour faire face à cette reconfiguration ? Dans le présent chapitre, nous prendrons en compte une série de considérations méthodologiques qui s’avèrent essentielles à la conjugaison de ces deux perspectives analytiques et nous exposerons les choix et les décisions méthodologiques qui structureront notre modèle d’analyse.

Mais avant d’entrer dans le détail de notre méthodologie, nous voudrions d’abord exposer son orientation générale et présenter sommairement les méthodes d’analyse qui lui donneront corps, à savoir l’analyse factorielle de correspondance et l’analyse de classification hiérarchique.

Notre démarche méthodologique est construite sur la base d’une matrice de données croisant des pays (rangées) et des variables de dépenses publiques et socio-économiques (colonnes). Le traitement de cette matrice par l’analyse factorielle des correspondances nous permettra d’identifier les grands axes qui définissent et distinguent des regroupements de pays, de même que les modalités de variables qui structurent ces axes.

Pour évaluer plus en détail les affinités électives entre les pays qui forment des ensembles, nous soumettrons notre matrice de données à l’analyse de classification hiérarchique. Cette méthode nous permettra d’amalgamer des pays présentant des profils similaires pour constituer des regroupements qui se veulent le plus homogènes possible.

Comme pour l’AFC, nos analyses de classification hiérarchique nous permettront d’évaluer si les regroupements de pays et les ensembles de variables qui leur donnent corps présentent une structure stable ou évolutive dans le temps. Nous reviendrons subséquemment sur le détail des méthodes à partir desquelles sera construit notre modèle d’analyse.

Le présent chapitre a comme point de focalisation les choix et les avenues méthodologiques que nous avons retenus pour construire notre modèle analytique des régimes providentiels de 1985 à aujourd’hui.

Dans un premier temps, nous discuterons de la période de temps et des points d’observation que nous avons choisis pour analyser l’évolution récente des régimes providentiels. Nous présenterons ensuite les pays qui seront l’objet de notre examen et les variables sur la base desquelles sera construit notre modèle.

Nous ferons ensuite état des difficultés méthodologiques que nous avons rencontrées dans la construction de notre base de données et des solutions que nous apportées à ces difficultés, qui renvoient essentiellement à un problème conjoint de données manquantes pour certains pays et de variables non disponibles à certains points dans le temps. Finalement, nous présenterons plus en détail les méthodes d’analyse qui donneront corps à notre démarche empirique, à savoir l’analyse factorielle de correspondances et l’analyse de classification hiérarchique.

Table des matières

5.1 Le choix de la période et des points d’observation

Le temps est une dimension centrale de notre analyse, ce qui commande une série de considérations méthodologiques. L’examen de l’évolution des régimes providentiels que nous proposons exige d’une part que nous définissions et délimitions une période de temps qui est susceptible de révéler des changements potentiels dans l’architecture de ces régimes et, d’autre part, que nous choisissions des points d’observation appropriés à l’intérieur de cette période.

Notre analyse a comme point de focalisation l’évolution des régimes providentiels depuis vingt ans, c’est-à-dire de 1985 à aujourd’hui. Nous avons retenu cette période puisqu’elle semble correspondre à un remaniement dans les rapports qu’entretiennent les trois piliers de bien-être que sont l’État, le marché et la famille.

Comme nous l’avons évoqué précédemment, la fin de l’Âge d’or de l’État-providence a certes modifié les lignes directrices de l’intervention étatique, mais elle s’est aussi accompagnée de changements notables dans la capacité du marché et de la famille à absorber bon nombre de risques sociaux.

La littérature suggère que l’Âge d’or de l’État-providence a pris fin vers le milieu des années 1970, mais nous avons plutôt choisi de nous consacrer aux vingt dernières années. D’une part, il nous était difficile de recueillir un ensemble suffisamment riche de variables pour les années précédant 1985 : la majorité de nos variables ne sont disponibles qu’à partir du début des années 1980 et sont plutôt fragmentaires avant 1985.

D’autre part, certains des pays que nous avons retenus (comme l’Espagne, le Portugal et la Grèce) ont connu un développement économique et social plus tardif et présentaient un système de protection sociale beaucoup plus développé en 1985 qu’en 1975, notamment en raison de leur intégration à l’Union européenne.

Nous estimons qu’en nous concentrant sur la période 1985-2000, nous sommes en mesure de mettre en relief plusieurs changements que connaissent les régimes providentiels à l’ère post-industrielle et que le fait de ne pas retenir la période allant de 1975 à 1985 ne vient pas affaiblir la légitimité et le bien-fondé de nos analyses dans le temps.

La période que nous avons retenue est marquée par une récession économique en 1992-1993. Certes, une mauvaise conjoncture économique pèse sur l’agenda politique, ne serait-ce qu’en raison des besoins sociaux qui se déplacent avec une hausse du chômage, mais en ce qui concerne la récession de 1992-1993, la conjoncture n’était pas dramatique au point d’imposer des coupures importantes dans les programmes sociaux et d’ébranler l’architecture de la protection sociale. Nous avons tout de même cherché à établir des points d’observation qui ne soient pas trop marqués par les effets de conjoncture économique de cette récession.

Nos analyses comparatives dans le temps porteront sur quatre points d’observation: en 1985, en 1990, en 1995 et en 2000 (notre ensemble de variables pour les années 2000 est en fait constitué des données les plus récentes qui sont à notre disposition, la plupart se ramenant à l’année 2002 ou 2003) Les variables que nous intégrerons à notre modèle d’analyse ne sont pas toutes disponibles aux années précises correspondant à nos points d’observation. Le cas échéant, nous nous assurerons que l’année de référence de ces variables se situe à l’intérieur d’un intervalle de deux ans par rapport aux points d’observation définis.

Nous avons choisi de mesurer la configuration des régimes providentiels aux cinq ans de 1985 à aujourd’hui. Bien qu’une période de cinq ans est souvent trop courte pour révéler des changements profonds dans l’architecture de la protection sociale, elle peut néanmoins mettre en exergue des processus de changements qui tendent à prendre forme. En découpant la période que nous avons retenue en lustres plutôt qu’en décennies, nous estimons que nous produirons un portrait plus détaillé et plus fin de l’évolution des régimes providentiels.

5.2 Le choix des pays

Le choix des pays à intégrer dans notre analyse est décisif d’un point de vue méthodologique. L’appréhension de la reconfiguration des régimes providentiels que nous nous proposons de faire n’est pertinente que si elle concerne des pays dont les fondations de la protection sociale étaient historiquement établies au début de la période que nous souhaitons étudier.

Dans ces pays, il faut que les frontières de la protection sociale aient passé l’épreuve du temps à l’ère industrielle, qu’elles soient institutionnalisées pour que l’on puisse juger adéquatement de l’ampleur de leur déplacement à l’ère post-industrielle.

En ce sens, notre choix s’est principalement arrêté sur des pays dont les assises providentielles se sont développées et consolidées après la Seconde Guerre mondiale. Nous avons sélectionné des pays membres de l’OCDE (Organisation de coopération et de développement économique), organisation internationale qui regroupe les pays affichant de hauts niveaux de développement économique et qui recueille périodiquement des statistiques diverses et variées sur ces pays (croissance économique, dépenses publiques, éducation, santé, marché du travail, politiques sociales, etc.)

La similarité des conditions de vie et des performances économiques dans les pays de l’OCDE rend ces derniers comparables sur le plan analytique. Cette similarité s’accompagne néanmoins d’approches différentes quant à la production et la distribution du bien-être, ce que nous tenterons de mettre en relief dans notre examen.

Nous n’intégrons cependant pas tous les pays de l’OCDE à notre analyse : certains pays produisent des séries statistiques assez limitées et/ou sont en queue de peloton à l’OCDE quant au niveau de développement économique et social qu’ils affichent (Hongrie, Mexique, Pologne, République Tchèque, Slovaquie, Turquie). Nous écartons donc ces pays de notre analyse, pour nous assurer que les pays retenus, si différents soient-ils dans leur logique providentielle, présentent des conditions sociales et économiques qui les rendent comparables empiriquement.

Nous avons aussi laissé de côté le Japon, essentiellement pour des raisons théoriques : sans entrer dans les détails, l’architecture de la protection sociale est très particulière et est assez peu documentée. On présente souvent le système de protection sociale japonais comme un modèle hybride, difficile à rattacher aux arrangements institutionnels caractéristiques des pays occidentaux. En somme, l’intégration du Japon à notre modèle d’analyse pourrait être problématique dans la mesure où nous n’aurions pas tous les outils théoriques nécessaires pour analyser adéquatement sa situation.

Les pays que nous avons retenus sont au nombre de vingt : l’Allemagne, l’Australie, l’Autriche, la Belgique, le Canada, le Danemark, l’Espagne, les Etats-Unis, la Finlande, la France, la Grèce, l’Irlande, l’Italie, la Norvège, la Nouvelle-Zélande, les Pays-Bas, le Portugal, le Royaume-Uni, la Suède et la Suisse. La protection sociale est très bien documentée dans ces pays et a fait l’objet de plusieurs travaux comparatifs.

Ces pays correspondent d’ailleurs à ceux qu’ont retenus Esping-Andersen, Castles, Ferrera, Bonoli, Leibfried pour leurs analyses. Comme nous l’avons vu précédemment, ces auteurs alimentent l’inspiration théorique et empirique à la base de notre examen et le choix de ces pays nous permettra de faire plus facilement le pont entre les bases théoriques des régimes providentiels et leur réalité empirique.

De plus, nous pensons améliorer nos perspectives comparatives en intégrant un plus grand nombre de cas dans notre modèle. La grande majorité des analyses comparatives sur les régimes providentiels portent sur une douzaine de pays tout au plus et, à cet effet, la taille de notre échantillon de pays nous permet d’élargir notre horizon interprétatif de l’articulation des régimes providentiels dans les démocraties occidentales.

5.3 Le choix des variables

Comme nous l’avons évoqué précédemment, notre approche analytique cherche à mettre en relief la contribution de la dimension politique/institutionnelle et de la dimension socio-économique à la configuration et la reconfiguration des régimes providentiels. Nous croyons que ces deux dimensions sont en interaction et s’inscrivent dans une relation d’interdépendance. Comme le notent Saint-Arnaud et Bernard, les situations sociales et économiques

«sont déterminées, dans une mesure significative, par les dépenses publiques (que celles-ci, d’ailleurs, soient minimalistes ou plus interventionnistes). Et ces politiques elles-mêmes (la place de l’État, ses politiques éducatives, de santé, de travail, de bien-être) sont à leur tour déterminées (…) par ces situations (…) les politiques publiques s’ajustent plus ou moins efficacement aux besoins de la population.»

Prenons par exemple le chômage. La dimension politique et institutionnelle du chômage (c’est-à-dire les prestations octroyées aux chômeurs, les services de réinsertion en emploi qui sont mis à leur disposition et, plus largement, l’approche globale de lutte contre le chômage) a des répercussions sur le taux de chômage et est, en principe, à la mesure des caractéristiques du marché du travail (les exigences fonctionnelles des emplois, les qualifications des travailleurs, etc.).

D’autre part, l’évolution du taux de chômage et des caractéristiques du marché du travail amène un réajustement dans la gestion politique des risques associés au chômage, et ce, pour au moins deux raisons : d’une part pour permettre aux travailleurs d’arrimer leurs qualifications en regard des exigences fonctionnelles des emplois et, d’autre part, parce que l’agenda politique est soumis à des pressions politiques de divers groupes d’intérêts (les centrales syndicales par exemple) dont les revendications trouvent souvent un écho dans les décisions politiques.

En somme, les situations socio-économiques reflètent dans une certaine mesure les politiques publiques en même temps que leur configuration infléchit, jusqu’à un certain point, les politiques publiques et les amène à rectifier le tir au besoin.

Pour conférer aux variables de dépenses publiques et socio-économiques le même poids dans nos analyses, nous avons retenu un nombre équivalent de variables pour chacune des deux dimensions. Ainsi, nous nous assurons que notre modèle analytique ne soit pas surdéterminé par un type donné de variables et que nos analyses rendent compte du jeu d’interactions entre les dimensions politique/institutionnelle et socio-économique des régimes providentiels.

Nos variables ont été principalement tirées de séries statistiques compilées par l’OCDE et la plupart d’entre elles sont disponibles à plusieurs points dans le temps. Nos variables de dépenses publiques peuvent se décomposer en plusieurs dimensions : les dépenses sociales, les dépenses en éducation, les dépenses en santé et les dépenses publiques des programmes sur le marché du travail.

La plupart des variables de dépenses publiques que nous avons retenues sont exprimées en pourcentage du PIB (Produit intérieur brut) ou en pourcentage des dépenses publiques totales. Nos variables socio-économiques renvoient quant à elles à des situations démographiques, des situations sur le marché du travail, des situations d’inégalités sociales et aux performances de litéracie des élèves de quinze ans. Les tableaux suivants présentent l’ensemble des variables que nous avons retenues pour nos analyses.

Tableau 1 – Variables utilisées pour les analyses

Dépenses sociales
Les dépenses publiques totales en pourcentage du PIB (DEPPUB)
Les dépenses sociales totales en pourcentage du PIB (DEPSOC)
Les prestations aux personnes âgées en pourcentage du PIB, ajustées par la proportion de 65 ans et plus dans la population (PRESTVIEILAJ)
Les services publics aux personnes âgées en pourcentage du PIB, ajustés par la proportion de 65 ans et plus dans la population (SERVVIEILAJ)
Les prestations aux familles en pourcentage du PIB, ajustées par la proportion des 0-14 ans dans la population (PRESTFAMAJ)
Les prestations d’allocations familiales en pourcentage du PIB, ajustées par la proportion des 0-14 ans dans la population (ALLFAMAJ)
Les prestations de congé parental en pourcentage du PIB, ajustées par la proportion des 0-4 ans dans la population (CONGEPARAJ)
Les services publics offerts aux familles en pourcentage du PIB, ajustés par la proportion des 0-14 ans dans la population (SERVFAMAJ)
Les services publics de garderie (petite enfance) en pourcentage du PIB, ajustés par la proportion des 0-4 ans dans la population (GARDERIESAJ)
Dépenses en éducation
Les dépenses publiques totales en éducation en pourcentage du PIB (DEPPUBEDU)
Les dépenses publiques en éducation aux niveaux primaire et secondaire, en pourcentage du PIB (DEPPUBEDUPS)
Les dépenses publiques en éducation au niveau tertiaire, en pourcentage du PIB (DEPPUBEDUTER)
Le pourcentage des dépenses de nature privée dans le financement des institutions scolaires (FINPRIVEDU)
Dépenses en santé
Les dépenses publiques en santé en pourcentage du PIB, ajustées par la proportion de 65 ans et plus dans la population (DEPPUBSANAJ)
Les dépenses publiques en santé en pourcentage des dépenses totales en santé (SANPUB)
Le pourcentage de la population bénéficiant d’une couverture publique pour des soins hospitaliers (COUVHOS)
Le pourcentage de la population bénéficiant d’une couverture publique pour des soins ambulatoires (COUVAMB)
Le pourcentage de la population bénéficiant d’une couverture publique pour des produits pharmaceutiques (COUVPHA)
Dépenses engagées dans programmes sur le marché du travail
Les dépenses d’administration et de services publics de l’emploi en pourcentage du PIB (SERVEMP)
Les mesures de formation sur le marché du travail en pourcentage du PIB (FORMPRO)
Les mesures en faveur des jeunes en pourcentage du PIB (JEUNES)
Les mesures d’aide à l’embauche en pourcentage du PIB (AIDEEMB)
Les mesures en faveur des personnes handicapées en pourcentage du PIB (HAND)
Les prestations d’assurance-chômage en pourcentage du PIB, ajustées par le taux global de chômage (PRESTCHOAJ)
Les mesures actives totales en pourcentage du PIB (TOTACT)
Les mesures passives totales (les prestations d’assurance-chômage et les mesures de retraite anticipée) en pourcentage du PIB (TOTPASS)
Situations démographiques
L’espérance de vie (en années) à la naissance (ESPVIE)
Le taux de mortalité infantile pour 1000 naissances (MORTINF)
L’indice synthétique de fécondité (FECON)
Performances de litéracie chez les élèves de 15 ans
Le score moyen de litéracie mathématique* chez les élèves de 15 ans (LITMATH)
Le score moyen de litéracie scientifique** chez les élèves de 15 ans (LITSCIEN)
Le pourcentage d’élèves de 15 ans ayant une litéracie de lecture*** très faible (égale ou inférieure au niveau 1) (LITLECTF)
Le pourcentage d’élèves de 15 ans ayant une litéracie de lecture faible (niveau 2) (LITLECF)
Le pourcentage d’élèves de 15 ans ayant une litéracie de lecture moyenne (niveau 3) (LITLECM)
Le pourcentage d’élèves de 15 ans ayant une litéracie de lecture élevée (niveau 4 ou 5) (LITLECE)
Situations sur le marché du travail
Le taux de chômage global (CHOMAGE)
La différence relative entre le taux de chômage des hommes et des femmes (H-F/H) (DRELCHO)
Le taux de chômage de longue durée (12 mois et plus) (CHOLONG)
La différence relative entre le taux de chômage de longue durée des hommes et des femmes (H-F/H) (DRELCHOLONG)
Le taux d’activité sur le marché du travail (ACTIVITE)
La différence relative entre le taux d’activité des hommes et des femmes (H-F/H) (DRELACT)
Le taux d’activité des femmes sans enfant (ACTFEMSENF)
Le taux d’activité des femmes ayant un enfant (ACTFEM1ENF)
Le taux d’activité des femmes avec deux enfants ou plus (ACTFEM2ENF)
Le taux d’activité des personnes âgées de 55 à 64 ans (55-64ACT)
Situations d’inégalités sociales
Le taux de pauvreté (%) dans l’ensemble des familles avec enfant(s) (PAUVENF)
Le taux de pauvreté (%) dans les familles biparentales (PAUVBIPAR)
Le taux de pauvreté (%) dans les familles monoparentales (PAUVMONO)
Le taux de pauvreté (%) chez les personnes âgées (65 ans et plus) (PAUVVIEIL)
Le ratio des gains du dernier décile (10% les plus riches) par rapport au premier décile (10% les plus pauvres) (RATIOGAINS)

* La litéracie mathématique est une notion tirée de l’enquête PISA et renvoie à plusieurs capacités mathématiques chez les étudiants:

« students’ ability to recognise and interpret mathematical problems encountered in their world, to translate these problems into a mathematical context, to use mathematical knowledge and procedures to solve the problems within their mathematical context, to interpret the results in terms of the original problem, to reflect upon the methods applied, and to formulate and communicate the outcomes.»

** La litéracie scientifique est une notion tirée de l’enquête PISA et reflète les dimensions suivantes : « (…) students’ ability to use scientific knowledge, to recognise scientific questions and to identify what is involved in scientific investigations, to relate scientific data to claims and conclusions, and to communicate these aspects of science.»

*** La litéracie de lecture est une notion tirée de l’enquête PISA et est construite sur la base de trois échelles :

« A “retrieving information” scale is based on students’ ability to locate information in a text. An “interpreting” scale is based on the ability to construct meaning and draw inferences from written information. A “reflection and evaluation” scale is based on students’ ability to relate a text to their knowledge, ideas and experiences.» L’enquête PISA identifie cinq niveaux de literacie de lecture.

Nous avons apporté quelques modifications à certaines variables de dépenses publiques, en les calibrant pour une population cible. Nous estimons que les dépenses publiques gagnent à être représentées en relation avec la taille de la population qu’elles desservent.

Les dépenses publiques reflètent à la fois la générosité des programmes et l’étendue de leur clientèle. Nous estimons qu’il faut contrer cette dernière influence pour mesurer la première, afin de rendre compte plus adéquatement des choix politiques desquels sont tributaires les dépenses publiques.

Par exemple, si les prestations de vieillesse représentent 10% du PIB dans deux pays, mais que le poids démographique des 65 ans et plus est nettement plus important dans l’un de ces derniers, il serait imprudent d’affirmer que la générosité des prestations de vieillesse s’équivaut dans les deux pays et d’amalgamer leurs choix politiques en regard de l’assistance aux personnes âgées.

Les variables que nous avons retenues pour ajuster certaines variables de dépenses ne couvrent pas nécessairement l’ensemble de leurs clientèles cibles, mais une très large partie. Nous avons ajusté les prestations aux personnes âgées et les services aux personnes âgées par la proportion de personnes âgées de 65 ans et plus dans chaque pays.

Nous avons aussi choisi d’ajuster les dépenses de santé par la proportion de 65 ans et plus, pour mettre en relief la générosité des dépenses de santé et le poids démographique des personnes âgées, qui constituent un groupe qui pèse lourd sur le financement de la santé dans des sociétés vieillissantes.

Nous avons retenu la proportion des 0-4 ans pour ajuster les prestations de congé parental et les services de garde pour la petite enfance, et la proportion des 0-14 ans pour calibrer les prestations à la famille, les allocations familiales et les services à la famille. Finalement, nous avons choisi de représenter les prestations d’assurance-chômage sur la base du taux global de chômage.

L’ensemble des variables que nous avons retenues est de type métrique et, comme nous le verrons subséquemment, nos méthodes d’analyse ne peuvent traiter que des variables de type nominal. Pour les besoins de notre analyse, il nous a donc fallu décomposer nos variables en catégories hiérarchiques, en établissant des points de coupure dans leur distribution. Nous avons tenté le plus souvent possible de construire quatre catégories par variable (très faible, assez faible, assez élevé, très élevé), mais nous avons parfois été contraint d’en établir seulement trois (faible, moyen, élevé), soit en raison de faibles écarts dans la distribution des variables ou de données manquantes.

Comme nos analyses remontent jusqu’au milieu des années 1980, certaines de nos variables ne sont pas disponibles au début de la période que nous comptons étudier. Pour surmonter ce problème méthodologique sans compromettre notre démarche, nos analyses comparatives dans le temps ne seront construites que sur la base des variables disponibles en 1985.

Si nous omettions de considérer ce problème, nos analyses seraient difficiles à justifier et à soutenir d’un point de vue méthodologique : nos comparaisons dans le temps seraient faussées si des variables s’ajoutent à notre analyse d’un point d’observation à un autre. En conduisant nos analyses dans le temps sur la base des variables disponibles en 1985, nous renonçons certes à un ensemble de variables plus riche, mais nous assurons l’uniformité de notre démarche comparative.

L’ensemble de variables dont nous disposons pour les années 2000 est le plus riche parmi les quatre points d’observation que nous avons retenus. En plus de nos analyses comparatives dans le temps, nous tenterons de brosser un portrait plus détaillé des régimes providentiels dans les années 2000 à partir de cet ensemble de données.

Cet examen plus détaillé des régimes providentiels dans les années 2000 devrait certes produire des résultats similaires à la situation des régimes en 2000 sur la base des variables de 1985, mais il aura l’avantage de fournir un contexte interprétatif plus riche à notre analyse de la configuration actuelle de la protection sociale dans les pays avancés.

5.4 Les difficultés rencontrées dans la construction de la base de données

Nous avons dû surmonter quelques embûches dans la cueillette de données pour construire notre modèle. Il nous a fallu répondre à problèmes de données manquantes posés par la jonction entre les points d’observation, les pays et les variables de nos analyses dans le temps. Nous avons dû composer avec le fait que l’ensemble de variables disponibles à certains points dans le temps était limité et que certains pays affichaient plusieurs données manquantes à certaines périodes.

Nous avons déjà mentionné que nos analyses dans le temps allaient être construites uniquement sur la base des variables disponibles en 1985, pour assurer l’uniformité de notre démarche comparative, mais nous voudrions maintenant discuter des difficultés posées par les pays affichant des données manquantes.

Comme nous l’avons déjà mentionné, des pays affichant trop de données manquantes à certaines périodes dans le temps ne peuvent être considérés dans notre analyse puisque leur classement dépendraient d’un nombre trop restreint de variables qui ne représenterait que partiellement leur réalité empirique.

Les pays affichant un nombre limité de données manquantes (sur cinq ou six variables par exemple) seront partie prenante de notre analyse, mais nous nous assurerons d’être prudents dans l’interprétation des résultats qu’ils affichent. Le cas échéant, nous effectuerons des analyses complémentaires sans incorporer ces pays pour consolider la robustesse de notre modèle, pour s’assurer que leur intégration au modèle n’altère pas le positionnement ou le classement des autres pays.

En ce qui a trait au traitement des données manquantes à proprement parler, plusieurs avenues méthodologiques s’offraient à nous. L’imputation d’une valeur aux pays affichant une donnée manquante sur une variable est un choix méthodologique plutôt discutable.

En imputant par exemple la catégorie médiane de la distribution d’une variable à des pays présentant une donnée manquante sur cette variable, nous rapprochons arbitrairement ces pays du centre de la distribution et nous conférons un poids plus important à la catégorie médiane dans le positionnement et le classement des pays.

Toute donnée manquante n’est pas égale et l’imputation d’une même valeur pour tous les pays affichant des données manquantes sur une variable donne l’impression que ces pays ont un profil relativement similaire sur ladite variable et concourre ainsi à rapprocher des cas qui peuvent être hétérogènes. Nous avons donc choisi de ne pas apporter de modification majeure aux données manquantes pour mener à terme nos analyses.

5.5 L’analyse factorielle des correspondances

Nous aurons recours à l’analyse factorielle des correspondances (AFC) pour rapprocher et différencier des cas (pays) sur la base de variables de dépenses publiques et socio-économiques et pour mettre en relief les éléments de structuration et de différentiation de ces cas.

L’objet de l’AFC consiste à réduire une matrice de données à quelques grandes dimensions (facteurs) qui rendent compte des associations entre les cas et les modalités des variables constituant cette matrice. La matrice de données traitée par l’AFC est constituée de «0» et de «1» : un cas (pays) affiche un «1» lorsqu’il affiche une caractéristique donnée dans une colonne et un «0» s’il ne possède pas cette caractéristique.

L’AFC procède à un reclassement des lignes et des colonnes de la matrice de données en attribuant à chacune d’entre elles un profil spécifique, ce qui

« (…) permet de maximiser l’association entre les deux ensembles (lignes et colonnes), association dont l’intensité est indiquée par un coefficient de corrélation (la valeur propre d’une dimension est interprétée comme un r de Pearson, le r² (ou «lambda»).»

Les profils spécifiques attribués aux lignes et aux colonnes orientent leur positionnement graphique sur les facteurs : «The more similar the profiles of two rows (or two columns) are, the closer to each other will the points be placed in space. Correspondingly, two very different profiles will produce points lying away from each other.»

Le premier facteur dégagé par l’AFC est obtenu par le produit croisé des profils des lignes et des colonnes de la matrice de données et constitue une première approximation des écarts à l’indépendance dans la matrice de données. Il a une valeur propre qui est à la mesure de l’intensité de l’association entre les lignes et les colonnes et qui rend compte d’un pourcentage donné de la variance (ou inertie) totale du modèle.

Le second axe factoriel est dégagé selon la même procédure, mais sur la base des résidus du premier facteur, de l’inertie dont ce dernier ne rend pas compte. Cet axe factoriel représente une seconde approximation des écarts à l’indépendance entre les lignes et les colonnes de la matrice, indépendante de celle dégagée par le premier facteur. Et il en est ainsi pour les facteurs subséquents, qui sont construits sur la base des résidus des facteurs qui les précèdent.

Nous avons aussi choisi l’AFC parce qu’elle constitue une méthode factorielle qui ne suit pas l’hypothèse de linéarité voulant que «chaque mesure (donnée ou corrélation) est exprimable comme somme des valeurs en facteurs, pondérées par des coefficients appelés « saturations» (les saturations des indicateurs dans les facteurs sont simplement les corrélations de ces indicateurs avec les facteurs.)» La non-linéarité de l’AFC permet de limiter les effets des valeurs extrêmes contrairement à l’analyse factorielle classique qui, elle, suit une hypothèse de linéarité.

Dans l’AFC, les valeurs extrêmes sont regroupées au sein de catégories et ont un poids moins déterminant dans la construction des axes factoriels. La différence entre les valeurs des variables est moins grande lorsque ces valeurs sont exprimées en catégories.

L’exploitation de la non-linéarité est certes un atout majeur de l’AFC, d’autant plus qu’elle constitue une méthode qui ne requiert pas le respect de certains postulats relatifs aux caractéristiques des distributions (normales, multi-normales, homoscédasticité, etc.) (Van Meter et al., 1994 ; Durand, 1998)

L’AFC a aussi la particularité de permettre la projection simultanée du positionnement des cas et des modalités de variables sur un même plan graphique. C’est aussi pour cette raison que nous avons choisi d’utiliser l’AFC : cette projection simultanée nous facilitera la tâche pour mettre en relief les dimensions structurantes des regroupements des pays et la contribution de différentes modalités à la construction de ces regroupements.

Comme nous l’avons évoqué précédemment, toutes nos variables sont de type métrique et il nous a fallu les mettre en catégories pour qu’elles puissent être traitées par l’AFC. À cet effet, nous avons mis en oeuvre une série de règles pour établir les points de coupure dans la distribution des variables : l’étendue des catégories doit représenter environ 25% de l’intervalle minimum-maximum de la distribution pour les variables à quatre catégories et 33% dans le cas des variables à trois catégories ; les écarts entre deux valeurs qui déterminent un point de coupure doivent représenter au moins 5% de l’intervalle minimum-maximum de la distribution.

Certaines variables commandaient une flexibilité au niveau des règles que nous venons d’énoncer, en raison de valeurs manquantes, des valeurs extrêmes qu’elles affichaient ou de leur distribution plutôt uniforme. Par exemple, les Etats-Unis affichent en 2000 une valeur extrême au niveau de la couverture pour les soins hospitaliers (seulement 25,3% de personnes couvertes comparativement à 90% ou plus dans la très grande majorité des pays) : il nous a donc fallu constituer une catégorie propre au cas américain. Nous présentons en annexe le détail des points de coupure dans la distribution des variables qui nous ont permis de mettre nos variables en catégories.

Même si nous avons regroupé nos données pour le besoin de nos analyses, nous avons tout de même effectué des analyses factorielles classiques (AF) à partir de nos données brutes, pour exploiter pleinement l’information contenue dans notre matrice de données et mettre en relief le positionnement de nos cas (pays) sur la base de variables à caractère numérique. La mise en catégories de nos variables sous-tend une perte d’information brute que nous tenterons de contrer en réalisant des analyses factorielles.

Ces analyses que nous avons menées à titre illustratif ont en quelque sorte attesté nos résultats d’AFC, puisque la structure d’association entre les cellules de notre matrice de données et les regroupements de pays dégagés par l’AF et l’AFC présentent de grandes similitudes.

Finalement, nous tenons à préciser que la description et l’interprétation de nos résultats d’AFC ne porteront que sur les modalités de variables qui s’avèrent significatives sur les axes que nous aurons retenus et qui affichent une valeur-test d’au moins 1,96 en valeur absolue.

5.6 L’analyse de classification hiérarchique

L’objet de l’analyse de classification hiérarchique consiste à amalgamer en groupes (ou clusters) des cas présentant des affinités électives sur la base d’une série de variables et ce, sur la base de deux critères : «Criteria to establish optimal assignment of cases include maximizing within-cluster homogeneity and achieving the greatest possible separation of clusters.»

La dimension hiérarchique de cette méthode renvoie au fait que l’analyse procède en scindant les cas en deux groupes, desquels seront dégagés successivement d’autres paires de sous-groupes jusqu’à ce que tous les cas constituent un cluster en eux-mêmes.

Les analyses de classification hiérarchique que nous mènerons s’inscrivent dans une optique de complémentarité par rapport à nos analyses factorielles de correspondances. Dans un premier temps, nous fonderons nos analyses de classification hiérarchique sur la base des principaux axes dégagés par l’AFC, délaissant ainsi une partie de l’information contenue dans notre matrice de données pour nous concentrer sur les dimensions essentielles de sa structuration.

Cette perte d’information s’avère en fait bénéfique puisqu’elle élimine « (…) les fluctuations aléatoires pouvant masquer les phénomènes importants. L’analyse factorielle agit alors comme un filtre préservant l’information utile.» Qui plus est, la présélection d’un nombre restreint d’axes factoriels pour mener des analyses de classification hiérarchique confère à ces dernières une certaine stabilité, dans la mesure où

« (…) les axes de l’analyse factorielle sont très stables relativement à l’échantillonnage, ce qui n’est pas le cas des classifications (la suppression ou l’adjonction d’individus peuvent changer notoirement l’aspect d’une hiérarchie ou d’une partition).»

En deuxième lieu, nous mènerons des analyses de classification sur l’ensemble des facteurs de notre modèle pour mettre à l’épreuve la robustesse de nos premiers résultats. Nos analyses sur l’ensemble des facteurs nous permettront d’évaluer si la solution factorielle que nous avons retenue pour nos premières analyses de classification est adéquate. Si les regroupements de pays dégagés sont similaires lorsqu’ils s’appuient sur l’ensemble des facteurs ou sur une solution factorielle à deux ou trois facteurs, on peut alors juger que la solution factorielle retenue est suffisante pour rendre compte des grandes lignes de l’inertie de notre modèle.

À l’opposé, si les regroupements de pays affichent une hétérogénéité lorsqu’ils sont construits sur l’ensemble des facteurs ou sur quelques facteurs présélectionnés, la solution factorielle retenue est alors à revoir puisque certaines dimensions significatives de l’inertie totale du modèle lui échappent. En somme, nos analyses de classification hiérarchique sur l’ensemble des facteurs seront menées dans l’optique de consolider la robustesse de notre modèle d’analyse et d’évaluer la validité de la solution factorielle que nous aurons retenue.

5.7 Les types-idéaux

Les méthodes d’analyse que nous avons choisies s’inscrivent dans une démarche typologique dont la finalité est de mettre en exergue des regroupements de cas sur la base de caractéristiques communes. En regard de notre objet d’analyse, nous chercherons à caractériser et à différencier des ensembles de pays sur la base des dépenses publiques et des situations socio-économiques qu’ils présentent, de sorte à faire ressortir des types-idéaux de régimes providentiels. C’est par le croisement des axes factoriels que dégageront nos analyses que nous pourrons établir les patrons généraux d’une typologie des régimes providentiels.

L’analyse typologique commande certaines mises en garde quant à l’interprétation des résultats qu’elle peut produire. Comme l’indique la citation mise en exergue au début de ce chapitre, les types-idéaux ne sont qu’une construction théorique et ne peuvent se substituer à la réalité empirique qu’ils cherchent à rendre compte. Il faut donc se garder de voir dans des types-idéaux des miroirs d’une réalité empirique. Leur fonction est essentiellement instrumentale : ils permettent de brosser un tableau synthétique, mais non exhaustif, d’une réalité donnée.

En ce qui a trait à notre analyse, nous devons reconnaître que les pays que nous étudions sont tous, d’une certaine façon, des cas hybrides quant à leur architecture sociale et leur logique providentielle, de par la spécificité de leur parcours historique, politique et institutionnel.

L’appartenance d’un pays à un régime providentiel donné n’est pas univoque ; la construction d’une typologie des régimes providentiels est toutefois utile pour mettre en relief les affinités électives que partagent certains pays, si on n’entretient pas d’illusion quant à la transposition empirique de cette typologie. À cet effet, l’analogie des arbres et de la forêt résume assez bien la perspective analytique posée par une démarche typologique : « (..) it is fruitful to construct ideal-types for the sake of economy : to be able to see the forest rather than the myriad of unique trees. However, (…) the resulting forest may bear little resemblance to reality.»

L’OCDE compte 30 pays membres: Allemagne, Australie, Autriche, Belgique, Canada, Corée du Sud, Danemark, Espagne, États-Unis, Finlande, France, Grèce, Hongrie, Irlande, Islande, Italie, Japon, Luxembourg, Mexique, Norvège, Nouvelle-Zélande, Pays-Bas, Pologne, Portugal, République tchèque, Royaume-Uni, Slovaquie, Suède, Suisse, Turquie

S. Saint-Arnaud et P. Bernard (2003) «Convergence ou résilience? Une analyse de classification hiérarchique des régimes providentiels des pays avancés», dans Sociologie et sociétés, vol. 35, no.1, p.74

OCDE (2004) Education at a Glance: OECD Indicators, p.111

Ibid., p.111

Ibid., p.98

W. Doise, A. Clement et F. Lorenzi-Cioldi (1992) Représentation sociales et analyses de données, Grenoble, PUG, chapitre 3, p.72

S.-E. Clausen (1988) Applied Correspondance Analysis: An Introduction, Thousand Oaks, Sage Publications, Sage University Papers Series on Quantitative Applications in the Social Sciences (series no. 07-121), p.10-11

P. Heraux et M. Novi (1974) «Une étude factorielle de l’idéologie : problèmes méthodologiques», Revue française de sociologie, 15 (2, Avril-Juin), p.221

B. Rapkin et D. Luke (1993) «Cluster Analysis in Community Research : Epistemology and Practice», dans American Journal of Community Psychology, vol.21, no.2, p.254

M. Roux (1994) Classification des données d’enquête dans Grangé, D. et L. Lebart (ed.) Traitement statistique des enquêtes, Paris, Dunod, p.104

Ibid., p.104

Si nous cherchons à dégager l’homogénéité de différents regroupements de pays, nous nous gardons cependant de laisser pour compte l’hétérogénéité de certains pays en regard des caractéristiques globales de leur regroupement. Nos analyses dans le temps auront nous seulement l’avantage de nous permettre de juger de l’homogénéité des regroupements de pays, mais aussi de mettre en relief d’éventuels écarts dans le classement de certains pays.