Modèles de traduction: Les alignements et l’idée initiale
2.3 Les modèles de traduction
Nous nous intéressons ici au problème de calcul de P(fJ|eI), la probabilité d’une phrase fJ étant donnée une phrase anglaise eI. On appelle la méthode qui permet de calculer cette distribution « un modèle de traduction ».
Les cinq différents modèles de traduction d’IBM sont décrits dans le papier de [Brown et al 1993] mais c’est un papier compliqué à lire. Le lecteur pourrait cependant commencer par lire [Knight, 1999] qui propose un tutoriel très accessible à ces modèles.
2.3.1 Les alignements
Dans [Brown et al. 1993], un modèle de traduction est vu comme un modèle d’alignement de mots. On introduit l’idée d’alignement entre une paire de phrases (eI,fJ) de façon que chaque mot de la phrase française soit associé au mot anglais qui le génère.
Les figures 3, 4, 5 et 6 nous montrent plusieurs alignements qui sont tous acceptables avec des probabilités différentes (l’alignement de la figure 4 est moins probables que celui de la figure 3).
Figure 3: Un alignement dont chaque mot français est aligné à un seul mot anglais.
Figure 4: Un autre alignement possible de ces phrases mais moins probable.
Figure 5: Un alignement dont chaque mot anglais est associé à un seul mot français.
Figure 6: Un alignement dont un ensemble de mots français est connecté à un ensemble de mots anglais.
Nous montrons en figure 3 et 5 et 6 trois types d’alignements. Dans celui de la figure 3, chaque mot français est connecté à un et un seul mot anglais; Cependant un mot anglais peut-être associé à un ou plusieurs mots français. La figure 5 montre un alignement où un mot anglais n’est connecté qu’à un seul mot français.
Enfin, la figure 6 présente un alignement général où plusieurs mots français peuvent se connecter à plusieurs mots anglais. Dans cet exemple, les quatre derniers mots anglais ensemble (don’t have any money) sont alignés aux deux mots français (sont démunis).
Les modèles que nous utilisons ne connaissent que les alignements pour lesquels un mot français est aligné à au plus un mot anglais. Un alignement peut donc être représenté comme un vecteur affectant, à chacune des positions françaises, une position anglaise.
Par exemple, (Le programme a été mis en application | the (1) program (2) has (3) been (4) implemented (5,6,7)) représente l’alignement de la figure 3.
L’ensemble des mots français associés à un mot anglais est dénommé par « cept », et si un mot anglais n’est connecté à aucun mot français on dit que le « cept » est vide. Ce cept vide qui n’a pas de position, est connecté par convention à la position 0 et on le note e0.
Exemple: (J’applaudis à la décision| e0(3) I(1) applaud(2) the(4) decision(5)), on voit que « à » est connecté au mot NULL qui est par convention à la position zéro de la phrase anglaise.
On note l’ensemble des alignements considérés par les modèles de traduction d’IBM entre les deux phrases fJ et eI par A(e,f).
2.3.2 Idée initiale
Pour mieux comprendre les modèles de traduction, prenons une paire de phrases anglaise et française telles qu’elles aient le même nombre de mots et que le mot français en position i soit aligné au mot anglais à cette même position (voir la figure 7) : on assume que les phrases sont reliées mot à mot (la relation (eI,fI) est une bijection).
Étant donnée la phrase anglaise eI de I mots (e1,e2,…eI) et sa traduction française fI (f1,f2,…fI), la probabilité P(fI|eI) s’exprime par:
(2.5)
Exemple: (Jean aime Marie| John loves Mary), il est raisonnable d’assumer que John produit Jean, loves produit aime, et Mary produit Marie.
Figure 7: Un exemple simple d’alignement, chaque mot est aligné avec sa traduction dans la même position.
En pratique, une telle relation entre les phrases françaises et anglaises n’est bien sûr pas observée. Les phrases françaises traductions de phrases anglaises sont habituellement plus longues (par exemple la moyenne de longueur de la traduction française d’une phrase anglaise de 20 mots est de 21.3).
Exemples pris de [Brown et al., 1993].