Arvutid on aastakümnete vältel üksikmängudes, näiteks males, inimesi domineerinud, kuid tehisintellekti (AI) saamine meeskonnakaaslastega koostööks on pisut keerulisem. Nüüd on Google'i DeepMind projekti teadlased õpetanud AI mängijaid tegema koostööd meeskondade vahel nii inimeste kui ka teiste arvutitega, et konkureerida 1999. aasta videomängus Quake III Arenal .
Edd Gent ajakirjas Science teatab, et kui AI-l on ainult üks vastane, läheb see tavaliselt üsna hästi, kuna see näeb ette ainult ühe mõistuse võimalikke käike. Meeskonnatöö on aga hoopis teine asi, kuna see hõlmab toiminguid, milles arvutid tavaliselt pole head, näiteks rühma meeskonnakaaslaste käitumise ennustamine. AI-st tõeliselt kasulikuks saamiseks peab see õppima, kuidas teha koostööd teiste intelligentsidega.
Google'i DeepMindi meeskond selgitab ajaveebi postituses:
„Miljardid inimesed elavad planeedil, igaühel on oma individuaalsed eesmärgid ja tegevused, kuid siiski suudavad nad meeskondade, organisatsioonide ja ühiskondade kaudu kokku tulla kollektiivse intelligentsuse muljetavaldavates väljapanekutes. See on seade, mida me kutsume multiagendi õppimiseks: paljud üksikud agendid peavad tegutsema iseseisvalt, õppima siiski teiste agentidega suhtlemist ja koostööd. See on tohutult keeruline probleem - kuna koos kohanduvate ainetega muutub maailm pidevalt. ”
Mitmikmängu esimese inimese videomängud, milles mängijate meeskonnad jooksevad ringi virtuaalsetes maailmades, tavaliselt tulistades üksteise järel relvi või granaadiheitjaid, on AI jaoks ideaalne koht meeskonnatöö keerukuste õppimiseks. Iga mängija peab tegutsema individuaalselt ja tegema valikuid, millest on kasu kogu meeskonnale.
Uuringu jaoks koolitas meeskond AI-d mängima lippu Quake III Arena platvormil. Reeglid on üsna lihtsad: kaks meeskonda astuvad silmitsi labürindilaadsel lahinguväljal. Eesmärk on hõivata võimalikult palju teisi võistkondi virtuaalseid lippe, kaitstes samal ajal omaenese, ja see, kumb meeskond võidab viie minuti jooksul kõige rohkem lippe. Praktikas võivad asjad aga väga kiiresti keeruliseks minna.
DeepMindi meeskond lõi 30 närvivõrgu algoritmi ja laskis neil üksteisega võidelda rea juhuslikult loodud mängukaartide alusel. Botid kogusid punkte lipu hõivamise ja teiste mängijate pukseerimise teel, saates nad uuesti resupteeritud alale, kus nende tegelased taaskäivitatakse. Algul tundusid robotite tegevused juhuslikud. Kuid mida rohkem nad mängisid, seda paremaks nad said. Kõik närvivõrgud, mis järjekindlalt kaotasid, kaotati ja asendati AI võitmise modifitseeritud versioonidega. 450 000 mängu lõpus krooniti võistkonnaks meistriks üks närvivõrgustik - nimega For Win (FTW).
DeepMindi grupp mängis FTW algoritmi nn peegelbottide vastu, millel puuduvad AI õppimisoskused, ja siis ka inimmeeskondade vastu. FTW purustas kõik väljakutsujad.
Seejärel korraldas grupp turniiri, kus 40 inimmängijat sobitati juhuslikult nii meeskonnakaaslasteks kui ka robotite vastasteks. Blogipostituse kohaselt leidsid inimmängijad, et robotid tegid rohkem koostööd kui nende reaalse elu meeskonnakaaslased. Inimmängijad, kes olid seotud FTW agentidega, suutsid kübersõdalasi võita umbes 5 protsendil mängudest.
Nagu nad teada said, avastasid robotid mõned mängijad juba pikka aega omaks võetud strateegiaid, näiteks rippusid lipu taasalustatava punkti läheduses, et seda uuesti ilmumisel haarata. FTW meeskonnad leidsid ka vea, mida nad võisid ära kasutada: kui nad tulistasid oma meeskonnakaaslase selja taha, andis see neile kiirustõmbe - midagi, mida nad kasutasid oma eeliseks.
"Selle projekti väljatöötamise ajal oli hämmastav näha mõnda sellist kõrgetasemelist käitumist, " räägib DeepMindi uurija ja juhtiv autor Max Jaderberg Gentile. "Need on asjad, millega saame inimmängijatena suhestuda."
Üks peamisi põhjuseid, miks robotid olid inimmängijatest paremad, on see, et nad olid kiired ja täpsed laskurid, muutes nad viigil kiiremaks kui nende vastased. Kuid see polnud nende edu ainus tegur. Blogi andmetel võisid parimad inimesed veerand sekundiga viivitatud reaktsiooniajaga robo-shooteritesse sisse ehitada teadlaste peksmise ajal vaid umbes 21 protsenti ajast.
Alates sellest algsest uuringust on FTW ja tema järeltulijad Quake III Arena lahinguväljal täielikult lahti lastud ja on näidanud, et nad suudavad kapteniseerida veelgi keerukama maailma, millel on rohkem võimalusi ja nüansse. Nad on loonud ka boti, mis paistab silma ülikompleksse kosmosemängu Starcraft II abil.
Kuid uurimistöö ei seisne ainult videomängude paremate algoritmide loomises. Meeskonnatöö tundmaõppimine võib lõpuks aidata AI-l töötada isesõitvate autode pargis või saada neist ehk robot-assistentideks, kes aitavad kirurgide vajadusi ette näha, vahendab Science 's Gent.
Mitte kõigi arvates pole arkaaditähtede robotid aga tõelist meeskonnatööd. AI teadur Mark Riedl (Georgia Tech) ütleb ajalehele The New York Times, et robotid on mängus nii head, sest igaüks mõistab strateegiaid põhjalikult. Kuid see pole tingimata koostöö, kuna AI meeskondadel puudub inimmeeskonna töö üks oluline element: suhtlus ja tahtlik koostöö.
Ja muidugi puudub neil ka ühistu videomängude kogemuse teine tunnus: prügikast teise meeskonnaga rääkimine.