En 1997, l’ordinateur Deep Blue d’IBM bat le champion du monde d’échecs Garry Kasparov. Ce n’est toutefois pas parce que cet algorithme est créatif qu’il l’a battu. Serait-il possible de créer un robot capable de créativité dans l’élaboration de nouvelles stratégies ? Pourrait-il dépasser la créativité humaine dans le jeu ? C’est ce que nous allons tenter d’explorer dans cet article.
Est-ce que la stratégie de DeepBlue était réellement plus innovante que celle de Kasparov ?
Lorsque Deep Blue joue aux échecs, il essaye en réalité chaque coup possible sur le plateau. Pour chaque coup testé, il analyse les gains et les pertes afin de choisir la meilleure possibilité. Ce qui a rendu Deep Blue imbattable devant Kasparov, ce n’était pas sa capacité à trouver une solution originale à laquelle personne n’aurait pensé. C’est plutôt grâce à sa faculté d’analyser et de comparer un grand nombre de données et donc de possibilités, soit environ 200 millions de coups/secondes. Cela lui permettait d’avoir une douzaine de coups d’avance.
Deep Blue était donc "simplement" une grosse machine à calculer dont les critères de calculs avaient été définis à l’avance par les humains. Mais elle n’avait pas vraiment la capacité de jouer aussi finement que Kasparov.
Donner la capacité d’apprendre aux robots, est-ce source de créativité ?
En 2016, l'intelligence artificielle AlphaGo réussit à battre le meilleur joueur de Go, Lee Sedol. Au jeu de go, deux adversaires s’affrontent en plaçant à tour de rôle des pierres noires et blanches sur les intersections d’une grille de 19x19. Les joueurs gagnent en capturant les pierres adverses et en dominant des territoires. On pourrait imaginer que cette IA calcule les meilleures possibilités à l’image de DeepBlue. C’est néanmoins impossible au jeu de Go, en raison du nombre immense de possibilités ainsi que de la difficulté à objectiver les gains et les pertes d’une position en cours de partie.
C’est là que le machine learning entre en jeu. Il ne s’agit plus de donner des instructions de calcul aux robots mais de leur donner la capacité d’apprendre. On va demander à un robot de choisir la meilleure stratégie de jeu. Au début, le robot perd tout le temps et ne sait pas comment s’y prendre. Pour l’aider, on va lui fournir une base de données, ici les meilleures stratégies des joueurs de Go. Le robot va alors corriger son erreur en modifiant sa façon de calculer jusqu’à pouvoir, à terme, prévoir le meilleur coup.
On pourrait croire qu’il n’y a rien de créatif puisque le programme consiste à imiter les joueurs humains. Seulement, au cours de la partie avec Lee Sedol, AlphaGo va réaliser un coup très surprenant, qu’un joueur débutant aurait pu faire de façon complètement aléatoire mais que les meilleurs joueurs n’intègrent jamais à leurs stratégies. C’est ce coup qui mènera finalement le robot à la victoire. On peut en revanche difficilement parler de créativité pure car l’apprentissage est limité à la base de données. Mais qu’en serait-il d’un apprentissage autonome ?
L’apprentissage par renforcement peut-il permettre aux robots de dépasser la créativité humaine dans la capacité à trouver de nouvelles stratégies ?
Le deep learning fonctionne comme un réseau de neurones où des informations aléatoires sont traitées en tant que données d’entrée pour permettre au robot de prendre des décisions. La précision d’analyse et le volume des données calculées sont bien plus grands qu’avec le machine-learning.
C’est de cette manière qu’a été créé AlphaZero, un programme ayant la capacité de se former lui-même aux échecs ou au Go, sans supervision humaine. AlphaZero a battu AlphaGo sur la centaine de parties jouées, preuve de son efficacité. En réalité, au lieu de partir sur la totalité d’options possibles, il va seulement se concentrer sur les meilleures, jusqu’à imaginer plusieurs stratégies novatrices. De plus, il ne va pas seulement choisir la position qui lui apporte le plus de gains pour les coups suivants. Il choisit aussi d’effectuer des stratégies telles que le recours aux sacrifices, totalement irrationnels au premier abord et qui vont pourtant se révéler cruciaux pour la suite du jeu. AlphaZero a inventé sa propre stratégie de jeu, largement différente de celle des humains, ce qui démontre une vraie créativité.
Pour autant, il n’est pas certain qu’on puisse dire que les robots peuvent dépasser la créativité humaine, qui n’est pas limitée à une application précise.
Conclusion
La robotisation intelligente pourrait ainsi nous aider à élaborer de nouvelles stratégies et nous permettre d’innover plus rapidement afin de maximiser les résultats de certaines tâches. En revanche, les robots ne peuvent pas encore imiter ni dépasser la créativité humaine. Le cerveau humain croise une multitude de données provenant de domaines différents et dispose de ressentis émotionnels. Un humain qui joue aux échecs prendra toujours en compte des paramètres externes au jeu et s’en servira pour gagner. Dans le Jeu de la Dame par exemple, Beth perd contre Watts après que celui-ci l’a déstabilisée en lui annonçant avoir trouvé une faille dans son jeu lors du tournoi contre Beltik. Un robot serait incapable de déstabiliser son adversaire tant qu’on ne lui donne pas des facteurs émotionnels sur lesquels il peut jouer. En conséquence, la robotisation de la créativité humaine dans le jeu nécessiterait d’entrer pléthore de paramètres qui ne sont apparemment pas directement liés à la tâche demandée au robot.
A propos de StoryShaper :
StoryShaper est une start-up innovante qui accompagne ses clients dans la définition de leur stratégie digitale et le développement de solutions d’automatisation sur-mesure.
Sources : StoryShaper, IBM, DeepMind, Wikipedia