Shutterstock
Stratego

Tekoäly hämäsi itsensä voittoon lautapelissä

Ensin tekoäly voitti ihmisen šakissa, sitten go-lautapelissä ja nyt Strategossa. Viimeisimmän aluevaltauksen se teki pääosin hämäämällä ihmispelaajia.

Googlen tekoälyohjelmisto DeepMind on tehnyt taas yhden aluevaltauksen voittamalla ihmisasiantuntijat Stratego-lautapelissä. Aikaisemmin se on lyönyt ihmiset laudalta šakissa ja go-lautapelissä.

Googlen DeepNash-tekoäly on nyt kolmen parhaan Stratego-pelaajan joukossa Gravon-pelialustalla. DeepNash on nimetty Nobelin palkinnon saaneen yhdysvaltalaisen matemaatikon ja peliteoriatutkijan John Nashin mukaan. John Nashista on myös tehty elokuva Kaunis mieli.

Ohjelmisto pääsi sieppaamaan vastustajan 40 pelinappulan joukkoon piilotetun lipun ennen muuta omista virheistään oppimisen, todennäköisyyslaskennan ja peliteorian avulla. Googlen tekoälystä tehty tutkimus on julkaistussa Science-tiedelehdessä.

Miljardeja harjoituspelejä

DeepNash on päässyt Stratego-maailman huipuille pelaamalla 5,5 miljardia kertaa itseään vastaan. Joka kerralla se on oppinut uutta pelistä, pelistrategiasta ja tavoista voittaa siinä.

Tekoälyyn on ohjelmoitu palkitsemisjärjestelmä, joka ohjaa sitä koko ajan optimoimaan pelaamistaan. Ihmisohjelmoijat puolestaan jatkuvasta hiovat tekoälyn pelialgoritmia paremmaksi.

Tekoälyn strategia perustuu peliteoreettiseen ratkaisuperiaatteeseen nimeltä Nashin tasapaino. Sen ydin on se, että kukaan pelaajista ei muuta strategiaansa, ellei muuttamisesta ole hänelle välitöntä hyötyä.

Tästä lähtökohdasta DeepNash haastaa vastustajansa juonikkailla tempuilla.

Tekoäly muun muassa uhrasi useita arvokkaita pelinappuloitaan, niin sanottuja upseereita, houkutellaan vastustansa siirtämään tärkeimmät nappulansa paikkaan, jossa se saattoi käydä niiden kimppuun. Näin se lopulta löysi vastustajan lipun ja voitti.

Sen sijaan, että tekoäly oli optimoinut yksittäiset siirtonsa, se oppi tarkastelemaan peliä ja sen eri tekijöitä kokonaisuutena. Näin se onnistui hämäämään vastustajan haavoittuvaan asemaan ja iski sitten.

Lautapelistä oppia robottiautoille

DeepNashin oppimia kykyjä voidaan käyttää myös pelilaudan ulkopuolella.

Strategossa opittuja taktiikoita voidaan soveltaa muun muassa itseohjautuvien autojen ajotietokoneissa. Oman ja muiden tielläliikkujen ajotavan ja ratkaisujen ennakoinnissa ja nopeaa päätöksentekoa vaativissa tilanteissa selviää samoilla taidoilla kuin lautapelissä.

Magnus Carlsen

Yhdysvaltalainen šakin pelaaja Hans Niemann on haastanut norjalaisen šakin maailmanmestarin Magnus Carlsenin (kuvassa) ja kaksi muuta pelaajaa kunnianloukkauksesta oikeuteen heidän syytettyään häntä huijaamisesta pelissä. Twitterissä julkaisemassaan asiakirjassa Niemann vaatii 100 miljoonan dollarin korvausta.

© Shutterstock

Lue myös:

”Itseohjautuvaa autoa suunniteltaessa ei pidä olettaa, että kaikki muut autoilijat toimivat aina rationaalisesti ja käyttäytyvät optimaalisesti”, sanoo Googlen kilpailijan Meta AI:n tutkija Noam Brown Singularity Hub -verkkojulkaisussa.