will-bridge


Les Echecs, le Go et le Bridge



En avant-propos de l'article :
"L'Intelligence Artificielle et le Bridge"
voici ce qui différencie fondamentalement
le Bridge des Echecs et du Go
et qui lui vaut un traitement spécifique.


       
Le traitement informatique des jeux de stratégie a toujours passionné les foules et dans le foisonnement d’articles souvent trop enthousiastes traitant de cette question, il est très difficile de savoir ce qu’il en est exactement.

En ce qui concerne les Echecs par exemple tout le monde a sans doute encore à l’esprit le « fameux » match qui avait opposé en 1997 Deep Blue à Kasparov, le champion du monde en titre.
A lire la Presse de l’époque, il s’agissait ni plus ni moins que du « match qui a changé le cours de l’Histoire ».
Créant un événement sans précédent dans l’Histoire de l’humanité, pouvait-on lire, Deep Blue avait été déclarée vainqueur à la suite d’un match revanche en 6 parties (3 nuls, 1 victoire de Kasparov, 2 victoires de Deep Blue).
La Presse s’était enthousiasmée et bien sûr en avait fait ses gros titres.

Seulement voilà :
la supercherie n'a pu être dissimulée très longtemps car le match avait eu lieu en public et tous, experts et journalistes spécialisés, en avaient été témoins…

En fait, d’après les experts unanimes, dans 3 parties le nul avait été concédé par Kasparov alors qu’il s’y trouvait en position avantageuse, dans la 2ème partie Kasparov avait abandonné alors qu’il tenait une position qui conduisait à un match nul et dans la 6ème partie Kasparov avait prématurément abandonné au 19ème coup à la suite d’un mouvement pour le moins bizarre…

Lors de la conférence de presse qui suivit ce match, tout le monde ayant bien compris ce qui s'était tramé, Kasparov n’a pu échapper à la question :
« Maitre, pourquoi ce comportement aussi étrange ? »
Réponse du champion du monde :
« Je jouais contre un ordinateur, j’ai été déstabilisé… ».

Dans les quelques mois qui ont suivi ce match, le cours de l'action d'IBM a quadruplé... et puis tout a été oublié, on a cessé très vite de parler de ce grand pas de l’humanité.
Toujours est-il que par la suite, sa réputation ayant souffert de ce match, Kasparov demanda une revanche.

La réponse d’IBM mit un terme définitif à ce "grand exploit technologique" qui s'était révélé n'être qu'une supercherie :
« Nous sommes vraiment désolés, cher Monsieur, mais nous avons démonté la machine et perdu le programme... »

Beau joueur, Kasparov qui fréquente assidûment les conférences très à la mode sur l’Intelligence Artificielle, avait déclaré « Ma défaite contre Deep Blue était une victoire pour l’humanité ».
... Vraiment ? Mais de quelle humanité ?


En ce qui concerne le Go il semblerait que ce soit très différent d’après les performances de l’AlphaGo de DeepMind, filiale de Google, qui aurait battu récemment bon nombre des meilleurs joueurs humains.

La grande nouveauté serait l’ « apprentissage par renforcement profond » de l’AlphaGo Zéro qui sait travailler sur des millions de parties (obtenues en jouant contre elle-même) avec, si l’on en croit ses auteurs, des capacités d’auto-apprentissage lui permettant d’apprendre à jouer à partir de zéro, sans aucune connaissance, sans rien savoir du Go.

Un parfait autodidacte, semblerait-il.

Malheureusement DeepMind a annoncé qu’elle ne participera plus à des compétitions homme-machine.

A-t-elle démonté sa machine ? A-t-elle perdu son programme ?

Le sujet étant très confidentiel pour des raisons économiques évidentes, il est bien difficile de savoir ce qu’il en est exactement.
En plus de la supercherie "Fake Blue", tout le monde se souvient de la bien triste histoire des "avions renifleurs" des années 70.

Mystère et prudence donc...

En tout cas la tentation est grande d’essayer de s’en inspirer et actuellement il est de bon ton d’utiliser les techniques inductives des « réseaux de neurones », surtout si l'on cherche à lever facilement des capitaux.

L'IA possède en effet un
"je ne sais quoi" de magique et avec sa promesse de gains miraculeux, il est à craindre d'assister à une inévitable ère de "projets renifleurs", encouragés par l'appétit des banques qui, aveuglées par cette perspective alléchante, ont du mal à faire la différence entre les vrais et les faux projets...

Le Bridge se prête-t-il aux réseaux de neurones ?

Il faudrait déjà pour cela disposer de millions de donnes jouées par des champions pour que le système puisse s’entraîner et apprendre efficacement par l’exemple.

Contrairement au Go et aux Echecs, ces donnes ne peuvent pas être générées par la machine elle-même sans intervention humaine car au Bridge il y a une différence entre le « gagner » et le « bien jouer » :
on peut gagner en jouant mal et perdre en jouant bien !

Prenons par exemple une donne qui possède deux lignes de jeu, une qui gagne à 80 % et une seconde qui ne gagne qu’à 60 % :
le « bien jouer » consiste à prendre la ligne à 80 % mais il se peut que cette ligne perde alors que la ligne à 60% gagne.

Le simple fait de gagner ou de perdre ne peut donc pas être utilisé pour caractériser la "récompense" et il faut faire intervenir d'autres paramètres, le score obtenu en tournoi par exemple, mais alors ce procédé ne peut plus être automatisé.

Le Bridge est un jeu de comparaison qui ne trouve en effet sa véritable vocation qu'en tournoi où tous les joueurs jouent avec les mêmes jeux. C'est d'ailleurs ce qui en fait l'attrait essentiel, la chance étant ainsi éliminée.
Au Bridge le but du jeu est finalement, pour paraphraser Colette :
"Avec les cartes de tout le monde, jouer comme personne".

Pour les enchères, le problème est encore plus complexe car il faudrait faire intervenir un autre paramètre très difficile à déterminer ici avec cette méthode, l'espérance mathématique de gain.
Prenons par exemple la situation où 4P est un bon pari à l'enchère mais infaisable à la carte. Le top ira au mauvais joueur qui n'aura demandé que 3P !

Remarquons à ce propos que savoir si 4P est un bon pari ou non dépend typiquement du jugement d'un Système Expert (voir plus loin) qui pourra très facilement apprécier l'incidence les enchères adverses (notamment celles d'Est) et les plues-values éventuelles de sa main (cartes intermédiaires, honneurs bien placés, etc...).

Les donnes d’entraînement doivent donc obligatoirement être supervisées par des experts (ou alors il faudrait trouver une méthode de supervision automatique, ce qui ne simplifie pas le problème).

Mais le plus important d’après Philippe Pionchon, est qu’il existe une caractéristique essentielle qui distingue le Bridge du Go et des Echecs, sans même parler de l’existence ou non d’éléments cachés.

- Le Go et les Echecs sont des jeux qui dépassent complètement les possibilités humaines : la machine peut donc en effet y apporter des « idées » nouvelles.

- En revanche le Bridge est un jeu beaucoup plus simple sur le plan combinatoire :
les hommes le maîtrisent parfaitement et il a été totalement théorisé.

Au Bridge on ne joue pas contre des adversaires mais contre des configurations de cartes adverses que la théorie est parfaitement capable de déterminer :
que viendraient apporter des statistiques ?

Il ne s’agit donc pas de traitement statistique d’un domaine mal connu dont personne n’a la solution, comme au Go ou aux Echecs, mais de mise en œuvre de l’expertise d’un domaine parfaitement maîtrisé.

DeepMind ne s'y est pas trompé qui a préféré travailler sur un autre jeu de cartes, Hanabi, plutôt que sur le Bridge pourtant infiniment plus célèbre mais qui ne se prête pas à cette technique et où il n'y a plus rien à trouver depuis plus de 30 ans.

Comme nous le verrons plus loin, c'est cette maîtrise humaine qui fait toute la difficulté d’un traitement informatique du Bridge…

(voir « 12 - Le paradoxe de la difficulté » et « 14 - Au Bridge, il y a obligation de résultat »)



will-bridge