https://frosthead.com

See pokkerimängitav AI teab, millal neid hoida ja millal neid panna

Pluribus-nimeline arvutiprogramm on võitnud pokkeri plusse kuue mängijaga Texas Hold'emi piiramatute mängude sarjas, saavutades verstapostini tehisintellekti uuringutes. See on esimene robot, mis lööb inimesi keerulises mitmevõistluses.

Nagu Facebooki AI labori ja Carnegie Melloni ülikooli teadlased teatavad ajakirjas Science, osutus Pluribus võiduks nii inimestes kui ka algoritmides domineerivates mängudes. Algselt kirjutab Merrit Kennedy NPR-i jaoks viis versiooni botist, mis seisid silmitsi ühe professionaalse pokkerimängijaga; järgmises katsetsüklis mängis üks robot viis inimest. Facebooki ajaveebi postituse kohta võitis AI viie inimese vastasega mängides keskmiselt umbes 5 dollarit käe kohta ehk 1000 dollarit tunnis. Seda määra peetakse pokkeriprofessionaalide seas „otsustavaks võidumarginaaliks“.

Neljakordne maailma pokkeriturnee meister Darren Elias rääkis Kennedyga, et ta aitas Pluribussi treenida, konkureerides nelja roboti konkurendi lauaga ja teatades teadlastele, kui AI tegi vea. Varsti paranes bot väga kiiresti, minnes päevade ja nädalate jooksul keskpärasest mängijast põhimõtteliselt maailmatasemel pokkerimängijaks. "Elias ütles, et kogemus oli" päris hirmutav ".

Verge James Vincenti sõnul õppis Pluribus - üllatavalt odava AI-ga treenitud vähem kui 150-dollarise väärtusega pilvandmetöötlusressurssidega - meisterdama veelgi pokkeristrateegiat, mängides iseenda koopiate vastu ja õppides katse-eksituse meetodil. Nagu Jennifer Ouellette Ars Technica jaoks märgib, mõistis robot kiiresti, et tema parim viis oli mäng ja ettearvamatud käigud.

Enamik inimlikke profisid väldib „donki kihlvedude tegemist“, mis leiab mängija, kes lõpetab ühe ringi kõnega ja alustab järgmist panusega, kuid Pluribus võttis hõlpsalt omaks ebapopulaarse strateegia. Samal ajal, nagu teatas Ouellette, pakkus AI ka ebatavalisi panuse suurusi ja pakkus paremat juhuslikkust kui vastased.

"Selle peamine tugevus on võime kasutada segastrateegiaid, " ütles Elias CMU avalduse kohaselt. “See on sama asi, mida inimesed proovivad teha. Inimeste jaoks on see hukkamine - teha seda täiesti juhuslikult ja järjepidevalt. Enamik inimesi lihtsalt ei saa. ”

Pluribus pole esimene pokkerimängiv AI, mis alistab inimprofessionaale. 2017. aastal töötasid boti loojad Noam Brown ja Tuomas Sandholm välja programmi Libratus varasema iteratsiooni. See AI alistas otsustavalt neli pokkeriprofot kahe mängijaga Texas Hold'emi 120 000 käe läbi, kuid nagu Facebooki ajaveebi postitus selgitab, piiras see asjaolu, et ta asus korraga silmitsi ainult ühe vastasega.

MIT Technology Review loo Will Knight sõnul on pokker AI-le väljakutse, kuna see hõlmab mitut mängijat ja hulgaliselt varjatud andmeid. Võrdluses on sellised mängud nagu male ja Go ainult kaks osalejat ja mängijate positsioonid on kõigile nähtavad.

Nende takistuste ületamiseks lõid Brown ja Sandholm algoritmi, mille eesmärk oli ennustada vastaste järgmiseid kahte või kolme käiku, selle asemel et mõõta nende samme mängu lõpus. Ehkki see strateegia võib eelistada lühiajalist kasu pikaajaliste võitude ees, on Verge ’s Vincent kirjutab, et „lühiajaline tegutsemine on tõesti kõik, mida vajate”.

Edasi liikudes saaks multiplayer-programme nagu Pluribus kasutada ravimite väljatöötamiseks, mis on võimelised võitlema antibiootikumiresistentsete bakteritega, samuti parandama küberturvalisust ja sõjalisi robotsüsteeme. Nagu Ars Technica Ouellette märgib, et muud potentsiaalsed rakendused hõlmavad mitme osapoole läbirääkimiste järelevalvet, toodete hinnakujundust ja ajurünnakuid oksjonil pakkumisstrateegiaid.

Praegu ütleb Brown Knightile, et algoritm jääb suures osas katki - peamiselt selleks, et kaitsta veebipokkeritööstust laastavate rahaliste kahjude tekitamise eest.

Teadlane järeldab: "See võib olla pokkeriringkondadele väga ohtlik."

See pokkerimängitav AI teab, millal neid hoida ja millal neid panna