L’analyse comparative des facteurs de déscolarisation révèle que, contrairement aux idées reçues, l’âge et la situation matrimoniale n’influencent pas significativement l’abandon scolaire au Bénin. Cette étude met en lumière l’impact crucial du niveau d’instruction parental et de la pauvreté, avec des implications essentielles pour le système éducatif.
Paragraphe 2 : Technique d’estimation
Notre méthodologie d’estimation se présente en plusieurs points.
La méthode du maximum de vraisemblance
Pour faire notre estimation, on fera appel à la méthode du maximum de vraisemblance. C’est une méthode qui consiste à trouver les valeurs des paramètres qui maximisent la vraisemblance des données (définie comme la probabilité jointe d’observer un échantillon, étant donné les paramètres du processus ayant généré les données).
Si nous disposons d’un échantillon de n observations aléatoires, soit f(Y) la probabilité que Y=1 ou 0. La probabilité jointe d’observer les n variables de Y est donnée par la fonction de vraisemblance :
𝑛
𝑓(𝑦𝑖,…,𝑦𝑖,….,𝑦𝑛) = 𝖦 𝑓( 𝑦𝑖)
𝑖=1
Ainsi, les traits qui influencent réellement le phénomène seront ceux représentés par les variables dont les paramètres estimés sont significativement non nuls.
Dans le cas d’un modèle logit, pour tester la significativité d’un paramètre, on utilise le test du rapport de vraisemblance LR sous l’hypothèse
𝐻𝑂 : 𝛽0 = ⋯ = 𝛽𝑖 … = 𝛽𝑘 = 0
La statistique de test du rapport de vraisemblance est 𝑆 = 2[ln 𝐿1 − ln 𝐿0] ; qui s’écrit aussi :
𝑆 = −2 ln(𝐿0 /𝐿1), oû 𝐿0 représente la vraisemblance du modèle sous 𝐻𝑂 et 𝐿1 la vraisemblance sous 𝐻1. Cette statistique suit une loi 𝒳2(𝑘).
Technique d’interprétation et test de validité
- Interprétation
L’hypothèse nulle 𝐻𝑂 ne sera acceptée que si la probabilité de la valeur statistique calculée dépasse un seuil critique de 5% au plus.
Interprétation des paramètres estimés
Les variables numériques des paramètres n’ayant aucun sens en réalité, il convient simplement de trouver dans quel sens la variable explicative X considérée influe-t-elle sur notre Y. Pour ce faire, on a, dans ce cas précis, recouru à l’Odd ratio ainsi qu’aux effets marginaux.
L’Odd ratio
Comme défini précédemment sous une forme mathématique, le Odd ratio ou encore ratio de chance est pour l’individu i, le rapport entre la probabilité de réalisation de l’évènement 𝑌𝑖 = 1 et la probabilité de sa non survenance.
𝑂𝑑𝑑 𝑟𝑎𝑡𝑖𝑜 =
𝑃(𝑌 = 1)
1 − 𝑃(𝑌 = 1)
Si l’odd ratio = 1, on a une absence d’effet Si l’odd ratio < 1, on a un effet bénéfique Si l’odd ratio > 1, on a un effet délétère
Plus l’odd ratio est éloigné de 1, plus l’effet est considérable
Les effets marginaux
Il est souvent utile de connaitre l’effet marginal d’une variable explicative sur la probabilité de succès d’un évènement. C’est l’élasticité de la probabilité estimée par rapport à 𝑋𝑖, la plus grande valeur de l’effet marginal correspond à la variable explicative qui influence le mieux la variable expliquée.
Effet marginal= 𝛛𝑃(𝑌=1)
𝛛𝑋𝑖
× 𝑋𝑖
𝑃(𝑌=1)
La constante s’interprète comme le log ratio moyen.
Qualité de la régression
Il n’existe pas de mesure comparable au 𝑅2 de la régression linéaire. Mais on peut utiliser :
Le test du rapport de vraisemblance (LR test) compte une spécification contrainte à une autre non contrainte. Ainsi, on teste sous l’hypothèse nulle 𝐻𝑂 : le modèle contient la seule constante, le rapport : 𝐿𝑅 = 2⟦ln 𝐿𝑛𝑐 − ln 𝐿𝑐⟧. Où 𝐿𝑛𝑐 = logit (non contrainte) et 𝐿𝑐 = 𝑙𝑜𝑔𝑖𝑡 (contrainte). Le LR suit une loi de Khi2.
Une grande valeur indique que le modèle non contraint apporte une information significative à l’évènement que le modèle veut expliquer. On utilise aussi le ROC de l’estimation pour vérifier si le modèle est acceptable. La valeur ROC est comparée à une valeur seuil de 0,70. Un modèle sera bon lorsque sa valeur ROC sera supérieure ou égale à 0,70.
Le pourcentage des individus bien classifiés renseigne aussi sur l’état bon ou mauvais de notre modèle. Plus il est proche de 100%, plus notre modèle est bon.
Questions Fréquemment Posées
Quels sont les principaux facteurs de déscolarisation identifiés au Bénin ?
L’étude identifie le niveau de pauvreté des parents et les facteurs géographiques comme principaux éléments explicatifs de la déscolarisation.
Comment la méthode du maximum de vraisemblance est-elle utilisée dans l’analyse ?
La méthode du maximum de vraisemblance consiste à trouver les valeurs des paramètres qui maximisent la vraisemblance des données, définie comme la probabilité jointe d’observer un échantillon.
Quelle est l’importance de l’odd ratio dans l’analyse des facteurs de déscolarisation ?
L’odd ratio est le rapport entre la probabilité de réalisation de l’évènement et la probabilité de sa non survenance, permettant d’évaluer l’effet d’une variable explicative sur la déscolarisation.