d

12 juil. 2019 - Perco StarCraft 2

Rage against the machine

Rage against the machine

AlphaStar, l’armada d’IA spécialisées StarCraft II de DeepMind – qui ont déjà officiellement botté les fesses de l'Allemand TLO et du Polonais MaNa – va désormais jouer anonymement quelques parties sur le ladder européen.

On avait déjà vu les premiers résultats concrets de la collaboration entre Blizzard et Alphabet – maison-mère de Google et propriétaire de DeepMind – lors de la diffusion surprise de matchs enregistrés opposant les agents AlphaStar à des joueurs professionnels, en janvier dernier.

Dans des conditions certes contestables (TLO ne jouant pas sa race de prédilection et ignorant affronter des « versions différentes » de l’IA à chaque partie ; des matchs se jouant tous sur une seule et unique carte), une sélection des meilleurs agents de l'IA avait alors tranquillement écrasé TLO et MaNa (10 victoires à une seule), tout en gardant une main dans le slip virtuel.

On parle souvent d’une IA, mais il s’agirait bien, en réalité, d’une série d’agents, comme autant d’IA passées par un processus d’entrainement condensé.

Florian Richoux, maître de conférences au Laboratoire des Sciences du Numérique de l'Université de Nantes, étudie les problèmes en Game AI (sic), en particulier les problèmes de prise de décision dans les jeux de stratégie en temps réel. Il n’est pas très fan de la manière dont DeepMind présente son bébé et ses résultats : « AlphaStar est un ensemble d'IA. Elles partagent le même réseau de neurones, donc la même structure », nous dit le chercheur. « On peut appeler cette structure « AlphaStar », mais les valeurs affectées aux liaisons entre ces neurones sont totalement différentes d'une IA d'AlphaStar à l'autre », précise t-il. On y reviendra.

Battre des pros c’est bien, mais aller taquiner le tout-venant en multijoueur, c’est mieux. Si vous acceptez l’option lors du lancement de Battle.net, des versions d’AlphaStar  peuvent donc, dès maintenant, venir plomber votre MMR, vous rendre paranoïaque et préparer l’invasion de la Terre, toujours prévue pour 2042 (en juin).

Tout le monde va donc désormais pouvoir se faire humilier. C’est chouette, non ?

Princess bride

Après avoir compilé les retours de joueurs professionnels (qui pouvaient sans doute se résumer à « Ben oui mais si vous laissez la machine jouer à 7000 actions par minutes en voyant toute la carte, franchement c’est tricher »), les chercheurs ont décidé de limiter un peu les capacités mécaniques des IA.

Première évolution par rapport aux matchs d'exhibition de janvier : les agents d’AlphaStar ne pourront compter que sur une vision limitée à la caméra du jeu. Pas d'omniprésence donc, que ce soit pour la vision ou le contrôle des unités. On a déjà pu voir l'IA jouer avec cette limitation, une seule fois, lors d'un des matchs contre MaNa. Ce fut sa seule défaite, même si Florian Richoux doute que ce soit cette limitation de vue-caméra pour AlphaStar qui l'ait fait perdre.
 


Seconde limitation, les fameuses « actions par minute » (APM) ne seront pas surhumaines. Si vous avez en tête l’image d’un adulte qui se retient en jouant avec un enfant, histoire que ça n’aille pas trop vite, trop haut et trop fort, c’est exactement ça. On n’attend plus que la technologie qui permettra à AlphaStar de nous tapoter la tête en disant « C’est pas gave mon grand, t’as bien joué quand même. Tu veux une glace ? ».

Bref, l’IA va jouer avec le frein à main. Et vous battre quand même… si si.

Lucy in the Skynet with Diamonds

Des versions « limitées » donc, mais, comme dans tout bon Shônen, les IA se sont tout de même enfermées quelques mois dans une salle secrète pour apprendre de nouveaux coups. Elles ont donc deux cordes de plus à leur arc.

D’abord, ces saletés jouent désormais les trois races, et sont donc capables de gérer quatre match up. Des sources non-officielles nous indiquent que les ingénieurs auraient envisagé un temps de les autoriser à jouer en aléatoire, mais auraient renoncé après qu’AlphaStar ait déclaré « OK, mais je préviens, je dis pas ma race ».
 


Dessin d'origine : Light roast comics
Détourné par StarcraftShitposter

 

Ensuite, ladder oblige, elles savent maintenant jouer sur toutes les cartes de la saison compétitive… ce qui est une grosse nouveauté pour elles. L’importance de la topologie dans le jeu est énorme, connaître et utiliser les spécificités de chaque carte est souvent un facteur clé dans les parties entre humains. C’est ce que l’on appelle techniquement, entre spécialistes, « abuser des petits coins bien pétés », ce qui est – bien plus que le rire – le propre de l’Homme. Pour Florian Richoux, il est peu probable que la machine soit capable d’utiliser le terrain à son plein potentiel, à moins que DeepMind n’ait totalement changé la manière d’entraîner ses différents agents depuis janvier, ce qui reste assez improbable.

Au moins, cela permettra à tout le monde d’avoir la même excuse après une défaite (« Cette fois, j’en suis sûr, ce mystérieux MichelZergos32 est en fait AlphaStar ! »).

Incognito ergo seum

Car, on y vient, la question de l’anonymat est au cœur du sujet. Elle va créer une petite paranoïa qui risque d’être absolument délicieuse à observer, chacun cherchant déjà inutilement à savoir si son dernier adversaire n’était pas un bot. Mais – surtout – elle empêche toute possibilité d’adaptation pour les joueurs humains (contrairement à l’expérience menée par OpenAI sur DOTA2, même si cette dernière s’est soldée par un lourd ratio de victoire de 99,4 % en faveur de l’IA).  

Selon l’annonce de Blizzard, le fait de ne pas révéler aux joueurs qu’ils affrontent une IA permet de s’approcher d’une expérience « aussi proche que possible du un-contre-un classique » et « aide à s’assurer que toutes les parties se jouent dans les mêmes conditions, de match en match ». 
 


Crédits : Blizzard


Encore une fois, Florian Richoux n’est pas tout à fait du même avis. Le scientifique y voit même une certaine forme de malhonnêteté intellectuelle : « L'anonymat d'AlphaStar empêche les joueurs de savoir qu'ils ou elles jouent contre AlphaStar et ne chercheront donc pas à trouver la faille de la machine », résume t-il, « on se retrouve dans la même situation qu'en janvier, où les joueurs, quel que soit leur niveau, ne pourront pas exploiter la répétitivité et la rigidité des stratégies des IA d'AlphaStar ».

On évoquait plus haut les valeurs affectées aux liaisons entre les neurones du réseau neuronal partagé par tous les agents AlphaStar. Pour le chercheur nantais, c’est là que se trouve la plus grande limite de la solution de DeepMind : « Ce sont ces valeurs qui déterminent le comportement d'une IA. On a donc ici des IA avec un pouvoir d'adaptation absolument nul : quoi qu'il se passe, elles appliqueront la stratégie qu'elles ont apprise, sans chercher à s'adapter ni à l'adversaire, ni à la situation, qu'elles soient en train de gagner ou de perdre ».

Pouvoir d’adaptation nul ? Stratégie figée ? Certains joueurs chez O’Gaming sont clairement des IA.

Des IA un peu trop mécaniques qui viennent nous affronter anonymement, en limitant leurs capacités (pour un temps ?) ; le tout dans un jeu dans lequel on contrôle des unités militaires ?

Ah ahah… pardonnez-moi, c’est nerveux, je file terminer de creuser mon bunker caché en Ardèche.

1 commentaire

Inariuss
Inariuss - 21/07/2019 15h55

Je me suis créé un compte juste pour exprimer mon approbation quant à ce billet !
C'est informatif, rigolo et bien écrit, et le "Ingognito ergo seum" est particulièrement inspiré ; je pense que je vais vous le voler...

Bref, c'est beau.

Poster un commentaire

Vous devez être connecté pour pouvoir poster un commentaire.