2. Sortir du dilemme
La sous-optimalité de la « solution » fatalement issue de la prise de décision rationnelle de nos joueurs est flagrante, les décideurs en sont conscients (puisque rationnels), pourtant, elle est inéluctable. On pourrait alors se poser la question de savoir ce que l’on entend réellement par « rationalité ».
Plus clairement, dans le second jeu, opposant DL et DV, force est de constater qu’il serait sinon plus rationnel, en tout cas plus « intelligent » de la part des décideurs, d’avoir un comportement à première vue « irrationnel » qui consisterait à choisir la combinaison de stratégies correspondant à un gain optimal pour chacun d’eux.
Il suffirait qu’il y ait une forme d’accord tacite, une négociation préalable, une entente entre les joueurs qui les conduirait à retenir l’issue leur procurant à chacun un gain supérieur à celui de l’équilibre (dit rationnel). Seulement voilà, comment être sûr que l’accord sera respecté au moment du choix alors que la tentation est grande, pour chacun, de « dévier » afin de gagner plus ?
On propose en théorie des jeux de favoriser le choix de coopérer par un système de sanctions, imposé de l’extérieur et venant donc modifier les données initiales du jeux. Nous verrons dans un premier temps plus en détail cette forme « d’obligation » à coopérer sous peine de sanction, nous en soulignerons les limites avant de présenter d’autres méthodes plus douces « d’incitation » à la spécialisation.
2.1. Imposer une stratégie
On pourrait effectivement imaginer qu’une instance hiérarchiquement supérieure à la commune rende obligatoire la spécialisation en ordonnant purement et simplement un style de développement précis à chaque décideur (selon la zone qu’il « gère »). Toutefois, cela transformerait totalement le jeu puisque les décideurs, se voyant imposer une stratégie, ne seraient plus réellement les joueurs.
Cette procédure irait donc totalement à l’encontre de tout ce qui s’est dit dans cette recherche puisque nous expliquions dès le premier chapitre la volonté de la part des instances aussi bien nationales qu’internationales de décentraliser au maximum le pouvoir concernant ce genre de décisions liées à l’aménagement du territoire. C’est d’ailleurs la prise en considération de ce phénomène qui nous a poussés à créer un modèle faisant intervenir les professionnels et/ou politiques à un niveau le plus local possible (dans nos exemples, ce sont les maires qui gèrent).
D’autre part, on constate que toute forme d’obligation est souvent accueillie avec plus de réticence par les individus concernés même si la décision leur est pourtant favorable ; cela risquerait donc de remettre en cause notre désir de faire participer la population et surtout d’en obtenir l’adhésion vis à vis du projet mis en place.
Soulignons également que l’une des particularités liées à l’insularité est de provoquer au sein de la population un certain besoin sinon d’une « dose » d’autonomie, en tout cas « d’autodétermination » et ce essentiellement quand il s’agit du devenir de l’île aussi bien sur le plan économique qu’organisationnel.
2.2. La crainte de représailles
Heureusement, les nombreuses recherches effectuées dans le cadre de la théorie des jeux montrent que souvent les formes d’obligation de coopérer peuvent provenir des joueurs eux-mêmes, le cas est très répandu dès qu’il s’agit d’un jeu « répété ».
La vie économique et sociale ayant indéniablement un caractère répétitif, échanges, production et plus généralement interactions, se reproduisant dans des conditions semblables, ou presque, pendant de longues périodes, on voit régulièrement apparaître des phénomènes particuliers liés tantôt à la réputation, aux menaces de représailles ou encore à diverses formes de normes ou de conventions.
Pour le cas qui nous préoccupe, on peut bien évidemment admettre que la situation, menant le Maire à prendre une décision quant à l’utilisation des subventions obtenues pour l’année en cour, se reproduira l’année suivante et ceci indéfiniment ; ce qui fait de notre jeu, un jeu répété auquel s’appliqueront les phénomènes en question.
La principale conséquence issue de cette précision, tient du fait qu’alors le joueur devra intégrer dans son raisonnement l’idée que sa façon de jouer aura des conséquences sur le « coup suivant », puisqu’elle aura donné une indication à son adversaire, et inversement, au coup suivant il devra tenir compte du choix qu’a effectué l’autre joueur la fois précédente.
Tout ceci devant bien sûr être pris en compte dès le premier coup puisqu’il aura une influence sur les coups suivant et donc sur le gain total final. « Le superjeu étant forcément à plusieurs coups, les stratégies des joueurs y sont formées par des successions d’actions (une par coup) ; ces actions sont, à chaque coup, conditionnelles puisqu’elles doivent tenir compte des choix effectifs ou éventuels des autres joueurs aux coups précédents » (Guerrien 1995).
Sachant cela, les joueurs pourront alors adopter différents comportements visant toujours à tenter de maximiser leurs gains sans pour autant prendre trop de risques. Selon Axelrod (1984), la méthode du « donnant-donnant » est l’une des manière de jouer des plus efficiente, elle permet de se sortir d’un équilibre sous-optimal du type dilemme du prisonnier. Elle consiste pour un joueur à débuter le jeu en coopérant (donc au premier coup), puis à imiter à chaque coup suivant la stratégie employée par l’adversaire. Ainsi, si l’autre n’a pas coopéré, on ne coopérera pas au coup suivant en guise de représailles.
Si dans le cadre du dilemme du prisonnier les « promesses » de représailles n’ont pas de prise sur l’adversaire qui sait très bien que le jeu sera de toute manière terminé à l’issue de son choix, quand le jeu se répète, elles deviennent crédibles et font donc réfléchir le second joueur. Evidemment si nos deux décideurs choisissent cette tactique, la spécialisation se fera sans problème puisque n’ayant pas de raison de dévier tant que l’autre ne le fait pas, aucun d’eux n’aura jamais à choisir de ne pas coopérer.
Cette méthode de jeu est rationnellement réalisable puisque la répétition du jeu rend, sinon le risque encouru au premier coup moins important, en tous cas les éventuelles pertes encourues moins lourdes. En effet, dans le cadre de notre second jeu (on aboutit au tableau suivant) :
(DV ; DL) | Coopère | Ne coopère pas |
Coopère | (6 ; 10) | (4,5 ; 12) |
Ne coopère pas | (7 ; 5) | (5 ; 9) |
Si le décideur DL choisit (de manière irrationnelle) de coopérer, il risque de n’obtenir qu’un gain de (5) (si l’autre ne fait pas de même) alors qu’il pouvait, en faisant l’autre choix, s’assurer un gain de (9) (quoi que joue DV) ; il encourt donc une perte de 400 Unités Monétaires soit (4/9)*100 = 44% de ce qu’il pourrait obtenir à coup sûr.
Maintenant, si le jeu doit se répéter ne serait-ce que cinq fois, et si l’autre ne choisit jamais de se spécialiser, DL obtiendra en coopérant au premier coup puis plus jamais : (5+9+9+9+9) = (41) au lieu des (5*9) = 45 réalisables à coup sûr.
Soit une perte de (4/45)*100 = 8,8% de ce qu’il pouvait obtenir sans risque. Bien sûr, la perte est toujours de 400 U.M. mais risquer 44% de perte pour obtenir 10 plutôt que 9 (ce qui revient à tenter une augmentation de 11,1% de ses gains) n’est pas la même chose que de risquer 8,8% de perte toujours pour tenter l’augmentation de 11,1% (50 au lieu 45). Le risque, s’il est mathématiquement le même puisque ne reposant que sur le premier coup, n’a pas la même portée, pour les mêmes effets possibles.
Toutefois, cette méthode du donnant-donnant n’est « rationnellement applicable » que si le jeu se répète un nombre infini de fois. En effet, même s’il est répété un très grand nombre de fois, le dilemme du prisonnier n’admet qu’une seule issue d’équilibre : les deux joueurs ne coopèrent jamais. Alors que tous deux gagneraient bien plus s’ils le faisaient.
Dans notre exemple, les décideurs sont des maires, or, ceux-ci ne sont pas élus définitivement. Comme chacun le sait un maire n’est élu que pour six ans et cela risque fort de fausser (dans un premier temps) l’issue du sixième jeu.
La dernière année, dans l’espoir d’être réélu, le joueur ne sera-t-il pas tenté de duper l’adversaire pour obtenir de meilleurs résultats dans sa commune ? (aucune menace ne peut plus l’en empêcher à ce moment là).
La question est grande car ce doute va avoir des conséquences (néfastes) sur les coups précédents ; le joueur craignant d’être dupé sur le dernier coup va tenter d’être le premier opportuniste en refusant la coopération dès l’avant dernier coup, mais l’autre, prévoyant une telle anticipation choisira de ne pas coopérer au quatrième coup (pour un jeu établit sur six ans) et on remontera ainsi jusqu’au tout premier jeu où l’un et l’autre choisiront de faire cavalier seul en représailles anticipées sur ce que fera vraisemblablement l’autre l’année suivante.
Cette méthode de raisonnement est appelée récurrence à rebours et ce phénomène bien particulier est connu en théorie des jeux sous le nom du « centipède » ou « paradoxe du mille pattes de Rosenthal » :
Gain A | 1 | 0 | – – – – – – – | 998 | 997 | 999 | 998 | 1000 |
Gain B | 1 | 3 | – – – – – – – | 998 | 1000 | 999 | 1001 | 1000 |
A et B peuvent stopper le jeu quand ils le désirent. Il est évident que B souhaitera arrêter à l’avant dernier coup, A le sait et préférera donc stopper à 999, d’où l’intérêt pour B d’en rester à quatre coups de la fin du jeu avec 1000, etc.
La solution selon le principe de récurrence à rebours consiste à ce que A décide d’arrêter au premier coup, de sorte que les deux joueurs obtiennent un gain de 1, alors qu’ils auraient pu avoir 1000 chacun s’ils avaient décidé de continuer à chaque coup.
Les solutions fondées sur des notions de réputation, menaces ou représailles, qui peuvent apparaître quand on répète une situation du type « dilemme du prisonnier » ne sont donc effectives qu’à la condition que le jeu soit répété à l’infini. Bien sûr, on pourrait admettre que le Maire, même s’il risque de ne pas être réélu, est assez sensé pour comprendre que la commune, elle, vivra toujours et qu’il fera donc tout son possible jusqu’au bout pour favoriser l’intérêt de la région. Cherchons tout de même d’autres solutions.